Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 MINERAÇÃO DE DADOS APLICADA AOS ALERTAS TRANSMITIDOS POR AERONAVES EXECUTIVAS PRISCILA B. SOARES*, JORGE H. BIDINOTTO*, FÁBBIO A. S. BORGES¥, RICARDO A. S. FERNANDES† * Departamento de Engenharia Mecânica, CCET - Universidade Federal de São Carlos † Departamento de Engenharia Elétrica, CCET - Universidade Federal de São Carlos Rodovia Washington Luís, km 235 - SP-310, CEP 13565-905, São Carlos - SP ¥ Departamento de Engenharia Elétrica, EESC - Universidade de São Paulo Av. Trabalhador São-carlense, 400, CEP 13566-590, São Carlos - SP E-mails: [email protected], [email protected], [email protected], [email protected] Abstract Over the years, a large number of alert messages have been storage by aircraft manufacturers, which characterize the aircraft behavior and performance. Therefore, some aspects such as component failures and aircraft healthy can be obtained by means of these messages in order to make decisions aimed to better manage the aircraft. However, these messages are storage faster than can be processed by the reliability engineering team. Thus, this paper propose the use of data mining techniques to determine sequential patterns of messages. In this context, it can be observed that the use of data mining may contribute to prevent aircraft accidents and reduce the aircraft maintenance time. Thereby, this paper presents a methodology based on Apriori algorithm to extract association rules from a database of messages generated by executive aircrafts. It is important to highlight that the proposed method was validated using a database provided by a Brazilian manufacturer. Keywords Data mining, sequential patterns, apriori algorithm, aircraft reliability, aircraft messages, executive aircrafts. Resumo Com o passar dos anos, uma grande quantidade de mensagens de alertas têm sido armazenadas pelos fabricantes de aeronaves. Portanto, alguns aspectos como as falhas de componentes e o tempo de vida útil das aeronaves podem ser obtidos por meio destas mensagens com o intuito de tomar decisões que visem o melhor gerenciamento das aeronaves. Entretanto, tais mensagens acumulam-se em uma velocidade muito maior do que podem ser processadas pelos engenheiros responsáveis pela análise de confiabilidade das aeronaves. Assim, este artigo propõe o emprego de mineração de dados para determinar padrões sequenciais de mensagens, onde é possível notar que o uso de mineração de dados pode contribuir para a prevenção de acidentes aéreos e também para a redução do tempo de manutenção das aeronaves. Desta forma, empregou-se o algoritmo Apriori para a extração e definição de regras de associação por meio de uma base de dados que contém mensagens geradas por aeronaves executivas. É importante destacar que o método proposto foi validado por meio de uma base de dados fornecida por um fabricante de aeronaves brasileiro. Palavras-chave Mineração de dados, padrões sequenciais, algoritmo apriori, confiabilidade de aeronaves, mensagens de aeronaves, aeronaves executivas. 1 Contudo, torna-se difícil monitorar todos os sistemas e subsistemas das aeronaves, uma vez que cada um possui comportamentos distintos, singulares e que podem sofrer alterações ao longo dos anos de atividade. Devido a este complexo cenário, com o passar dos anos, a indústria aeronáutica desenvolveu métodos e ferramentas a fim de acompanhar o tempo de vida útil dos componentes das aeronaves, visando aumentar a segurança e tornar os processos de manutenção mais robustos. Assim, no trabalho de Letourneau, Famili e Matwin (1999), os autores propõem a implementação de um sistema de monitoramento de voo, o qual recebe os dados da aeronave em tempo real. Estes dados são analisados e o sistema gera uma mensagem de alerta quando algum componente precisa ser substituído. Deste modo, foram empregadas Redes Bayesianas para a determinação de falhas nos motores de 16 aeronaves. Em Roemer et al. (2001), empregou-se um classificador Neuro-Fuzzy para realizar o prognóstico de aeronaves. Por meio deste método, os autores puderam determinar o desgaste de válvulas. Introdução Aeronaves são compostas pela integração de diversos sistemas complexos e isolados que compõem um único produto ao final de seu processo de fabricação. Dentre os componentes que fazem parte de uma aeronave, pode-se destacar: fuselagem, ar condicionado, sistemas hidráulicos, sistemas de bordo, sistemas elétricos, sistemas pneumáticos, dentre outros. Devido a esta grande quantidade e diversidade de componentes, nota-se que muitos fabricantes também poderão estar envolvidos. De acordo com o contexto supracitado, em Air Transport Association of America (1998) podem ser obtidas informações que dizem respeito à norma A.T.A. Specification 100, a qual divide os sistemas e subsistemas das aeronaves em 100 capítulos. É importante frisar que a A.T.A. Specification 100 visa tanto facilitar a obtenção de informações como agilizar o processo de manutenção e/ou reparo de aeronaves comerciais. 2931 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 Shot and Recovery Log) para realização das análises e processamento dos dados. Os autores aplicaram o algoritmo Apriori a fim de se encontrar um padrão de ocorrência das falhas. Além disso, foi feita uma análise de tendência aos dados da ASRL. Os resultados obtidos nas análises de ambas as bases de dados foram confrontados, onde verificou-se que os voos realizados durante a noite apresentam componentes com tempo de vida útil menor. Desta forma, mais tarefas de manutenção são necessárias para que estas aeronaves continuem operando de forma adequada. Recentemente, Kamsu-Foguem (2012) buscou o aprimoramento de métodos de ensaios não destrutivos para a detecção de falhas em sistemas aeronáuticos. Assim, o autor desenvolveu uma metodologia que fornece regras destinadas a auxiliar na tomada de decisão sobre qual método deve ser utilizado em cada situação de falha. Para atingir o objetivo proposto, técnicas de mineração de dados foram empregadas para extração de classes semânticas recorrentes em textos relativos ao histórico de ensaios. Como resultado, o estudo mostrou uma rápida identificação do método mais apropriado para a análise das falhas. Seguindo o contexto supracitado, este artigo visa a definição de uma metodologia baseada em Mineração de Dados que possibilite a análise de mensagens enviadas por aeronaves executivas de um fabricante brasileiro. Por meio da metodologia proposta, buscase estabelecer regras que associem estas mensagens e, por consequência, permita a identificação de um padrão de ocorrência de alguns alertas. Desta forma, será possível a obtenção de informações que auxiliem nas tomadas de decisão do fabricante em relação tanto às operações de voo como também à manutenção das aeronaves. Destaca-se que esta pesquisa justificase no fato de que, na literatura, não são obtidos padrões sequenciais para as mensagens de alerta emitidos por aeronaves executivas. Além disso, a Mineração de Dados torna-se atrativa para a grande quantidade de dados que encontram-se armazenados pelo fabricante e que não são analisados de forma automatizada. Este artigo encontra-se organizado de forma que a Seção 2 destina-se aos fundamentos de diagnóstico e manutenção de aeronaves. Na Seção 3 são apresentados os fundamentos sobre Mineração de Dados. A Seção 4 fornece breves conceitos sobre regras de associação e uma explanação mais detalhada em torno do Algoritmo Apriori. A Seção 5 é designada a apresentar a metodologia proposta neste artigo e que fora supramencionada. Por fim, as Seções 6 e 7 apresentam, as análises dos resultados obtidos e as conclusões da pesquisa desenvolvida. Na proposta de Skormin, Gorodetski e Popyack (2002), emprega-se um classificador baseado em árvore de decisão e distribuição probabilística para indicar possíveis falhas em sistemas aviônicos, o qual é feito por meio de dados de vibração, temperatura, carga e pressão do ar. Em Keller et al. (2006), os autores caracterizam falhas provenientes de atuadores elétricos ligados ao sistema de combustível das aeronaves (bombas e válvulas). Os dados foram obtidos por meio de ensaios laboratoriais, onde eram simuladas as condições de voo e carregamentos reais de uma aeronave. A metodologia proposta também empregou Redes Bayesianas e mostrou-se viável para estabelecer tendências de degradação dos atuadores elétricos. Outros autores como Ahmadi e Söderholm (2008) utilizam o modelo FMEA (Failure Mode and Effect Analysis) em combinação com árvores de decisão para auxiliar a manutenção preditiva e antecipar a identificação de falhas em aeronaves. Neste caso, o FMEA é utilizado para selecionar as falhas e as árvores de decisão verificam a ocorrência ou não ocorrência de uma determinada falha. Cabe comentar que esta metodologia foi aplicada ao sistema de ventilação de aeronaves. Han, Kim e Sohn (2009) utilizaram regras de associação para extração de padrões sequenciais relacionados às falhas da frota de aeronaves da Força Área da República Coreana. Para tanto, foram utilizados dados históricos de falhas de quatro modelos de aeronaves, as quais foram divididas de acordo com os seus sistemas (instrumentação, equipamento de ataque, ar condicionado, etc.). Considerou-se nesta pesquisa 24 cenários distintos em termos de tipo de missão e estação do ano. As sequências foram limitadas a no máximo 3 falhas e após o processamento foram escolhidas as duas regras de associação com maior suporte e confiança para cada cenário. Os resultados obtidos extraíram regras que até então seriam desconhecidas aos especialistas, entretanto, eram regras relevantes para a manutenção da frota. Na proposta de Clements et al. (2010), os autores separam os dados em clusters que representam tarefas de manutenção. Após esta etapa são aplicadas ferramentas inteligentes (sistemas fuzzy, redes neurais e regras de associação), as quais foram treinadas e validadas a fim de identificar falhas estruturais nas aeronaves. Destaca-se ainda que muitas pesquisas na área de previsão de falhas em aeronaves fazem uso de ferramentas estatísticas. Deste modo, Jianguo et al. (2010) propõem o uso do modelo ARMA (Autoregressive Moving Average Models) e de uma SVM (Support Vector Machine) para analisar ondas sonoras provenientes dos estabilizadores das aeronaves e, por fim, determinar o estado de degradação destes estabilizadores. Young et al. (2010) utilizaram o histórico das tarefas de manutenção já realizadas em uma frota de aeronaves, bem como os dados da ASRL (Aircraft 2 Diagnóstico e Manutenção de Aeronaves O diagnóstico de aeronaves pode ser dividido em dois grandes grupos: diagnóstico on-line e diagnóstico off-line. 2932 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 Ferramentas destinadas aos diagnósticos on-line recebem o histórico dos parâmetros da aeronave e, desta forma, os dados são adquiridos e processados. Na sequência, se for o caso, o piloto recebe as mensagens de alerta. Neste processo, são empregadas tecnologias sofisticadas, as quais permitem o diagnóstico em tempo real e boa precisão na identificação de possíveis falhas. O diagnóstico on-line pode ser integrado com a Master Minimum Equipment List (MMEL), que representa um documento criado pelo fabricante da aeronave e estabelece que a aeronave, mesmo com algum componente inoperante, pode continuar em operação desde que obedeça a uma determinada condição. Consequentemente, antes de chegar em solo, tanto o piloto como a equipe de manutenção já sabem quais são os procedimentos a serem realizados para que a aeronave continue disponível para uso (Zhang et al., 2011). Já as ferramentas que apresentam diagnósticos off-line são baseadas na análise das informações gravadas pela aeronave (durante o voo e/ou em solo). Com base neste histórico de dados, os operadores das aeronaves e os responsáveis pela manutenção conseguem identificar as principais atividades que ocorreram no sistema e nos componentes. Por consequência, torna-se possível rastrear a origem das falhas para que sejam tratadas de modo assertivo com o objetivo de garantir maior tempo de vida útil à aeronave (Hurdle, Bartlett e Andrews, 2009; DeCastro et al., 2011). Visto que os alertas podem acontecer, seja em voo ou em solo, Zhang et al. (2011) discutem os aspectos das ferramentas de diagnóstico. Entretanto, após o diagnóstico da aeronave, faz-se necessária a manutenção da mesma para que retorne às suas condições normais, visto a manutenção tem um papel vital na indústria aeronáutica devido ao risco de acidentes. Por este motivo, inúmeras normas regulamentam a operação de aeronaves a fim de garantir a condição plena para que o produto opere de forma segura. Conforme já abordado, aeronaves são sistemas complexos que resultam da integração de muitos sistemas e componentes. Portanto, a confiabilidade do sistema resulta da interação de muitos fatores, que devem ser considerados desde o projeto da aeronave até a produção e seus ajustes finais. Em decorrência da degradação dos componentes do sistema da aeronave, fazem-se necessárias intervenções de manutenção com a finalidade de restaurar a funcionalidade completa do sistema. Dentre essas atividades, pode-se encontrar tarefas de reparo, remoção/substituição, inspeção e calibração (Duek, 2005). Com base nas tarefas de manutenção supracitadas, há diversas formas de empregá-las visando diminuir o tempo de indisponibilidade das aeronaves. Cabe ainda informar que as tarefas de manutenção podem ser corretivas e/ou preventivas. 3 Fundamentos de Mineração de Dados A Mineração de Dados representa um conceito que utiliza algoritmos, automáticos ou semiautomáticos, que sejam capazes de extrair características e informações úteis de grandes bancos de dados. Devido às suas inúmeras possibilidades de aplicação e à sua interdisciplinaridade, existem diversas definições para o termo Mineração de Dados. Neste artigo, a Mineração de Dados segue as definições fornecidas por Fayyad, Piatetsky-Shapiro e Smyth (1996), onde a mesma representa uma etapa no processo de descoberta de conhecimento que, consequentemente, consiste na análise dos dados e aplicação de algoritmos que determinam um conjunto de padrões para os dados. É importante destacar que Fayyad, PiatetskyShapiro e Smyth (1996), dividem a Mineração de Dados em duas classes de ferramentas: Baseadas em aprendizado supervisionado, onde os dados são utilizados para construir um modelo que descreva o comportamento de uma variável de interesse, ou seja, a variável de saída deve ser conhecida para que seja possível o treinamento da ferramenta; Baseadas em aprendizado não supervisionado, onde não se conhece o comportamento das saídas e deseja-se fazer um estudo que encontre relações possíveis entre as entradas e saídas. Dentre os algoritmos que empregam o aprendizado não supervisionado, destacam-se algumas técnicas para clusterização de dados e também os algoritmos que geram regras de associação. Ressalta-se que neste trabalho, serão utilizadas as regras de associação para se determinar relações entre as mensagens transmitidas pelas aeronaves durante o voo, as quais são apresentadas em maiores detalhes na sequência. 4 Regras de Associação - Algoritmo Apriori Uma regra de associação representa a análise probabilística realizada sobre a ocorrência simultânea de determinados eventos em uma base de dados (Hand, Mannila e Smyth, 2001). Esta categoria de algoritmos gera regras do tipo SE...ENTÃO, conforme mostrado no exemplo a seguir: SE Falha01 = X ENTÃO Falha02 = Y Geralmente, os algoritmos destinados à obtenção de regras de associação, ao gerar um resultado, também determinam o suporte e a confiança da regra. De acordo com Hand, Mannila e Smyth (2001), esses valores são definidos como: Suporte - representa a proporção de instâncias de uma base de dados que contenham um determinado conjunto; 2933 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 um contador deve ser incrementado ao passo que encontra um item que satisfaz o suporte mínimo prédefinido na parametrização do algoritmo, onde para este artigo S = 0,001 (valor este que será justificado na subseção 5.5). Cabe comentar que o algoritmo Apriori foi executado a partir do software de Mineração de Dados conhecido como WEKA (Waikato Environment Knowledge Analysis) desenvolvido pela Universidade de Waikato - Nova Zelândia (Hall et al., 2009). É importante frisar também que a metodologia proposta, apesar de empregar o algoritmo Apriori, ainda necessita de uma preparação dos dados e de uma etapa de transformação. Todas estas etapas serão tratadas em maiores detalhes na Seção 5. Confiança - representa a probabilidade de encontrar Y quando há a ocorrência de X na base de dado; Conforme descrito por Hand, Mannila e Smyth (2001), o objetivo de um algoritmo destinado a obter regras de associação é encontrar todas as regras que satisfaçam uma confiança p maior que um limiar pl e um suporte s maior que um limiar sl. Dentre os algoritmos que geram regras de associação, destaca-se o Apriori que possui a capacidade de extrair conjuntos de itens que ocorrerão com frequência em um banco de dados. O Apriori é um algoritmo de busca baseado na anti-monotonicidade, ou seja, um conjunto de itens somente pode ser frequente se todos os seus subconjuntos forem frequentes. Por convenção, este algoritmo assume que os itens pertencentes a um conjunto são ordenados de forma lexicográfica. Desta forma, os dados das mensagens das aeronaves foram organizados de modo que o algoritmo fosse capaz de fornecer uma análise em torno da relação entre as mensagens que ocorrem com maior frequência na base de dados. Com o intuito de melhor apresentar o algoritmo Apriori que foi empregado neste trabalho, na sequência, um pseudo-código do mesmo pode ser analisado: 5 Metodologia Proposta A metodologia proposta para a Mineração de Dados das mensagens das aeronaves executivas foi dividida em 6 etapas, as quais comportam desde a obtenção dos dados, seleção de dados das aeronaves, preparação dos dados para que pudessem ser tratados pelo software WEKA, transformação dos dados, construção do modelo baseado em regras de associação e análise dos resultados. Seguindo estas 6 etapas, a Figura 1 apresenta um diagrama de blocos que representa a visão geral da metodologia proposta e que foi previamente mencionada. Algoritmo 1: Apriori 01: dado um banco de dados de mensagens T 02: dado um suporte mínimo S 03: L conjunto de itens do banco de dados 04: k 5 05: while Lk 1 0 06: Ck a b a Lk 1 b 07: for mensagem t T 08: Ct c c Ck c t 09: for candidados c Ct Lk 1 b a contador[c] contador[c] 1 10: Aquisição dos Dados CAS (Crew Alerting System) Seleção dos Dados Dados da América Latina Preparação dos Dados Organização do Arquivo de Entrada do WEKA Transformação dos Dados Conversão de Dados (numérico para nominal) 11: 12: end for end for 13: Lk c c Ck contador[c] S Obtenção de Regras de Associação Algoritmo Apriori k k 1 Lk Análise dos Resultados Especialista 14: 15: return k Figura 1. Visão geral da metodologia para mineração de dados das mensagens das aeronaves executivas. Ressalta-se que o algoritmo Apriori é iterativo, no entanto, antes de inicializar as iterações deve-se definir um banco de dados T contendo as mensagens dos alertas transmitidos pelas aeronaves, um conjunto de itens frequentes (de tamanho k) como L e seus candidatos como Ck, onde para este artigo considerou-se k máximo igual a 5. Além disso, é importante que seja definido um suporte mínimo S. Assim, o Apriori faz uma busca no banco de dados com o intuito de definir conjuntos de itens. Para cada iteração, Na sequência, cada bloco da Figura 1 será devidamente explanado por meio das Subseções de 5.1 a 5.5. 5.1 Aquisição dos Dados Os dados utilizados neste trabalho foram extraídos de uma ferramenta de suporte à gerência da vida 2934 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 útil de aeronaves executivas. Esta ferramenta transmite, em tempo real, mensagens tanto ao piloto por meio do Crew Alerting System (CAS) como à equipe de manutenção pelo Computador Central de Manutenção. Destaca-se que nesta pesquisa foram considerados dados que abrangem um período que se inicia em Março de 2009 e termina em Agosto de 2013. grama da Figura 2, com o intuito de auxiliar a compreensão das mensagens que foram analisadas. Tabela 1. Especificação das A.T.A.. 5.2 Seleção dos dados As mensagens coletadas pela ferramenta supracitada foram selecionadas a fim de que fosse definido um banco de dados homogêneo, de forma a garantir um resultado consistente quando da aplicação do algoritmo Apriori. Portanto, a princípio, selecionou-se um modelo de aeronave, visto que distintos modelos de aeronaves possuem também comportamentos distintos, os quais seriam refletidos nas mensagens. Assim, foram coletadas somente as mensagens transmitidas em voo, pois, durante a decolagem ou o pouso muitos dos sistemas da aeronave estão desligados e, por consequência, grande parte das mensagens transmitidas em solo são consideradas inconsistentes para o fabricante. Por fim, destaca-se que as aeronaves selecionadas pertencem a uma mesma região de operação, neste caso, a região escolhida foi a América Latina. Não foram utilizadas aeronaves de outras regiões de operação, pois, os sistemas das aeronaves são influenciados tanto pela distância entre as localidades como pelo clima da região. Durante a etapa de seleção de dados, foi gerado um histograma que contém o número de mensagens separados pela A.T.A. em que elas ocorreram. Este histograma pode ser visualizado por meio da Figura 2. A.T.A. Especificação 21 22 23 24 26 27 28 29 30 31 32 34 35 36 52 73 76 77 79 80 Sistema de Pressurização e Ar-condicionado Sistema Automático de Voo Sistema de Comunicação Sistema de Energia Elétrica Sistema de Proteção contra Fogo Controles de Voo Sistema de Combustível Sistema Hidráulico Proteção contra gelo e chuva Indicação e Gravação de Dados de Voo Trem de Pouso Sistema de Navegação Oxigênio Sistema Pneumático Portas Sistemas de Combustível Sistema de Controle do Motor Monitoramento de Dados do Motor Óleo Partida de Motor 5.3 Preparação dos dados Nº dede Mensagens Número Mensagens A etapa de preparação dos dados consiste em organizar o banco de dados, de forma que o mesmo esteja adequado ao software WEKA, onde os dados serão analisados. Visto que o objetivo é encontrar padrões entre as mensagens que ocorreram em um mesmo voo, tais mensagens foram ordenadas em primeiro nível pelo número do voo e em segundo nível pela estampa de data/horário de sua ocorrência. Posteriormente, o banco de dados foi processado para que os códigos das mensagens de um mesmo voo ficassem organizados em um mesmo registro (tupla). Após esta organização do banco de dados, os arquivos gerados foram submetidos ao WEKA, onde a Mineração de Dados é iniciada pelo processo de transformação dos dados. 5.4 Transformação dos dados Esta etapa consiste na transformação dos dados em uma classe compatível com a que o algoritmo é capaz de processar, como: numérico, nominal ou binário. O software WEKA, ao receber os arquivos de entrada, automaticamente interpreta os códigos das A.T.A. de cada mensagem como variáveis quantitativas (numéricas). Entretanto, apesar de serem expressos por números, estes códigos deveriam ser variáveis nominais, visto que apenas identificam a A.T.A.. Portanto, houve a necessidade de se aplicar um conversor que transformou os dados numéricos em nominais. A.T. A. A.T.A. Figura 2. Histograma da distribuição das mensagens para aeronaves da América Latina. Destaca-se que este histograma representa somente os dados das mensagens de um mesmo modelo de aeronave executiva que opera na América Latina. Analisando a Figura 2, é possível notar que as A.T.A. 30 e 24 possuem mais do que 10.000 mensagens para a região da América Latina, sendo este número bastante significativo em relação às demais A.T.A.. Deste modo, a Tabela 1 apresenta a especificação de cada uma das A.T.A. encontradas no histo2935 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 As principais regras encontradas, ou seja, aquelas que possuem uma confiança de 0,9 (90%) podem ser verificadas por meio da Tabela 3. 5.5 Obtenção de Regras de Associação e Análise de Resultados Esta etapa consistiu na aplicação do algoritmo Apriori, o qual fora previamente mencionado e explanado. Desta forma, torna-se importante mencionar apenas que o algoritmo foi parametrizado de modo que atingisse um suporte mínimo de 0,001 ou uma confiança mínima de 0,1. Os valores de suporte mínimo foram variados entre 0,001 e 0,1 com passo de 0,001, ou seja, 100 possíveis combinações de valores para suporte mínimo. Já a confiança mínima, sempre foi mantida como 0,1 para que mais resultados pudessem ser analisados. Entretanto, após a obtenção dos resultados, somente as regras com confianças maiores ou iguais a 0,9 foram avaliadas por especialistas, pois, regras com confiança menores do que 90% de precisão normalmente não são consideradas na indústria aeronáutica. Os resultados obtidos por meio do algoritmo Apriori serão relatados em maiores detalhes na Seção 6. Além disso, cabe comentar que devido a este trabalho gerar como resultados as regras que associam as mensagens de alertas das aeronaves, foi necessário que um especialista realizasse uma averiguação da coerência das regras de associação geradas. Sendo assim, foi possível verificar a compatibilidade destas regras. Tabela 3. Principais regras de associação determinadas pelo algoritmo Apriori. Regras com Confiança > 0,9 A.T.A. 30 → A.T.A. 27 A.T.A. 24 → A.T.A. 24 A.T.A. 24 → A.T.A. 24 A.T.A. 27 → A.T.A. 34 Com relação à primeira regra obtida, apesar de estarem em A.T.A. diferentes, estes sistemas são muito próximos, visto que a A.T.A. 30 se refere à Proteção contra gelo e chuva (conforme Tabela 1) e a A.T.A. 27 se refere aos Controles de voo. Neste caso, os controles de voo estão relacionados aos acionamentos necessários para garantir o degelo dos estabilizadores da aeronave. Esta regra evidência a relação existente entre as regras encontradas pelo algoritmo e indica ao piloto uma situação de alerta e aviso durante o voo, podendo atuar como uma antecipação à tomada de decisão do mesmo, ou seja, neste caso o alerta é mais útil ao piloto do que à equipe de manutenção. Na segunda e terceira regras, as mensagens pertencem a uma mesma A.T.A., porém, após uma análise mais aprofundada das regras, notou-se que os alertas se referem a componentes distintos, neste caso, a contatores conectados em diferentes pontos da aeronave. Particularmente, neste caso, as regras podem ser empregadas para auxiliar a antecipar tarefas de manutenção, ou seja, pode ser realizada a compra e troca conjunta destes contatores. Assim, mesmo em casos onde uma das mensagens de alerta não tenha ocorrido, pode-se realizar a troca dos componentes com o intuito de prevenir possíveis falhas da aeronave, visto que esta regra é 90% confiável. Além disso, também é possível realizar a otimização do estoque de peças, de forma que as peças sejam solicitadas em conjunto. Deste modo, o tempo de espera pelos componentes poderia ser minimizado. Por fim, a quarta regra extraída faz a conexão entre dois sistemas distintos da aeronave, a A.T.A. 27 responsável pelos sistemas de controle de voo e a A.T.A. 34 que é responsável pelos instrumentos que utilizam dados que auxiliam na navegação da aeronave, conforme pode ser observado por meio da Tabela 1. Neste caso específico, há uma associação entre um sistema que alerta a perda de sustentação da aeronave com outro sistema que alerta sobre possíveis condições inseguras de tráfego. Destaca-se que mais uma vez, as regras extraídas visam garantir maior segurança da aeronave. Ressalta-se que outras regras de associação foram geradas, porém, apresentaram valores de confiança inferiores a 0,9 (onde o máximo é 1). Além disso, as regras apresentadas por meio da Tabela 3 são de extrema importância para garantir a segurança da 6 Resultados O software WEKA foi utilizado para processar a base de dados de aeronaves executivas (para um mesmo modelo) da América Latina. Deste modo, o algoritmo Apriori foi empregado a fim de encontrar as melhores regras de associação, ou seja, aquelas mais frequentes no banco de dados de mensagens. A parametrização do algoritmo Apriori foi realizada por meio dos testes supracitados (Seção 5). Portanto, a Tabela 2 apresenta os valores pré-definidos para suporte e confiança, bem como os valores obtidos. É importante destacar que estes valores correspondem à melhor configuração obtida para o algoritmo. Tabela 2. Comparação entre os valores obtidos e os valores parametrizados para o algoritmo Apriori. Parâmetros Valores Confiança Mínima Parametrizada Confiança Mínima Obtida Suporte Mínimo Parametrizado Suporte Mínimo Obtido Tempo de Processamento Número de Regras Obtidas 0,1 0,1 0,001 0,03 ± 20 horas 100 Nota-se que a Tabela 2 também apresenta o tempo de processamento consumido pelo algoritmo Apriori e a quantidade de regras de associação obtidas. 2936 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 aeronave e também para aprimorar os procedimentos de manutenção e compra de componentes, tarefas estas que devem ser realizadas pelo fabricante da aeronave. Aviação. Dissertação de Mestrado, Engenharia de Produção, Universidade Federal de Santa Maria. Fayyad, U.; Piatetsky-Shapiro, G. and Smyth, P (1996). From Data Mining to Knowledge Discovery in Databases. AI Magazine, vol. 17, no 3, pp. 37-54. Hall, M.; Frank, E.; Holmes, G.; Pfahringer, B.; Reutemann, P. and Witten, I. H (2009). The WEKA Data Mining Software: An Update. SIGKDD Explorations, vol. 11, no. 1, pp. 10-18. Han, H. K.; Kim, H. S. and Sohn, S. Y (2009). Sequential Association Rules for Forecasting Failure Patterns of Aircrafts in Korean Airforce. Expert Systems with Applications, vol. 36, no. 2, 1129-1133. Hand, D.; Mannila, H. and Smyth, P (2001). Principles of Data Mining. Massachusetts: The MIT Press. Hurdle, E. E.; Bartlett, L. M. and Andrews, J. D (2009). Fault Diagnostics of Dynamic System Operation Using a Fault Tree Based Method. Reliability Engineering and System Safety, vol. 94, no. 9, pp. 1371-1380. Jianguo, C.; Jie, Z.; Liqiu, L.; Yun, Z.; Keli, Z. and Guoqiang, Z (2010). Health Diagnosis for Aircraft Based on the ARMA Model. International Conference on Intelligent Computing and Integrated Systems, pp. 277-280. Kamsu-Foguem, B (2012). Knowledge-Based Support in Non-Destructive Testing for Health Monitoring of Aircraft Structures. Advanced Engineering Informatics, vol. 26, no. 4, 859-869. Keller, K.; Swearingen, K.; Sheahan, J.; Bailey, M.; Dunsdon, J. and Przytula, K (2006). Aircraft Electrical Power Systems Prognostics and Health Management. IEEE Aerospace Conference, pp. 1-12. Letourneau, S.; Famili, F. and Matwin, S (1999). Data Mining to Predict Aircraft Component Replacement. IEEE Intelligence Systems and Their Applications, vol. 14, no. 6, pp. 59-66. Roemer, M. J.; Kacprzynski, G. J.; Nwadiogbu, E. O. and Bloor, G (2001). Development of Diagnostic and Prognostic Technologies for Aerospace Health Management Applications. IEEE Aerospace Conference, vol. 6, pp. 3139-3147. Skormin, V.; Gorodetski, V. and Popyack, L (2002). Data Mining Technology for Failure Prognostic of Avionics. Aerospace and Electronic Systems, vol. 38, no. 2, pp. 388-403. Wu, X.; Kumar, V.; Ross, Q. J.; Ghosh, J.; Yang, Q.; Motoda, H.; McLachlan, G. J.; Ng, A.; Liu, B.; Yu, P. S.; Zhou, Z.-H.; Steinbach, M.; Hand, D. J. and Steinberg, D (2008). Top 10 Algorithms in Data Mining. Knowledge and Information Systems, vol. 14, no. 1, pp. 1-37. Young, T.; Fehskens, M.; Pujara, P.; Burger, M. and Edwards, G (2010). Utilizing Data Mining to Influence Maintenance Actions. IEEE Autotest Conference, pp. 1-5. 7 Conclusão A Mineração de Dados mostrou-se eficiente no auxílio às tomadas de decisão que visam a manutenção de aeronaves executivas, pois, o algoritmo Apriori encontrou relações entre distintos sistemas das aeronaves. As principais regras encontradas destacam a A.T.A. 30 (Proteção contra gelo e chuva), a A.T.A. 27 (controles de voo), a A.T.A. 24 (sistema elétrico) e a A.T.A. 34 (sistema de navegação). A relação entre tais A.T.A. evidenciam a complexidade e a interligação entre os distintos sistemas das aeronaves, bem como fornecem relações não triviais entre os sistemas. Assim sendo, as regras de associação são úteis para encontrar causas raízes de alertas recorrentes em uma determinada frota de aeronaves. Em trabalhos futuros, pretende-se tanto verificar a eficiência de outros algoritmos como também analisar a metodologia proposta frente a aeronaves executivas que operem em outras regiões e, desta forma, estabelecer um padrão de mensagens recorrentes em distintas regiões. Agradecimentos Os autores gostariam de agradecer à FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo), à CAPES (Coordenação de Aperfeiçoamento de Pessoal de Nível Superior) e ao CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico) pelos apoios financeiros concedidos para a realização desta pesquisa. Referências Bibliográficas Ahmadi, A. and Söderholm, P (2008). Assessment of Operational Consequences of Aircraft Failures: Using Event Tree Analysis. IEEE Aerospace Conference, pp. 1-14. Air Transport Association of America (1998). A.T.A. Spec. 100: Specification for Manufacturers Technical Data. Clements, R.; Morse, J.; Darr, D. and Laskowski, B (2010). Meta-Data Mining for Optimized Aircraft Repair and Overhaul. 2nd International Symposium on NDT in Aerospace, pp. 1-8. DeCastro, J. A.; Tang, L.; Zhang, B. and Vachtsevanos, G (2011). A Safety Verification Approach to Fault-Tolerant Aircraft Supervisory Control. AIAA Guidance, Navigation, and Control Conference. Duek, C (2005). Análise de Confiabilidade na Manutenção de Componente Mecânico de 2937 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 Zhang, P.; Zhao, S.-W.; Tan, B.; Yu, L.-M. and Hua, K.-Q (2011). Applications of Decision Support System in Aviation Maintenance. Efficient Decision Support Systems - Practice and Challenges in Multidisciplinary Domains, InTech. 2938