Mineração de Dados Aplicada aos Alertas Transmitidos por

Propaganda
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
MINERAÇÃO DE DADOS APLICADA AOS ALERTAS TRANSMITIDOS POR AERONAVES
EXECUTIVAS
PRISCILA B. SOARES*, JORGE H. BIDINOTTO*, FÁBBIO A. S. BORGES¥, RICARDO A. S. FERNANDES†
*
Departamento de Engenharia Mecânica, CCET - Universidade Federal de São Carlos
†
Departamento de Engenharia Elétrica, CCET - Universidade Federal de São Carlos
Rodovia Washington Luís, km 235 - SP-310, CEP 13565-905, São Carlos - SP
¥
Departamento de Engenharia Elétrica, EESC - Universidade de São Paulo
Av. Trabalhador São-carlense, 400, CEP 13566-590, São Carlos - SP
E-mails: [email protected], [email protected],
[email protected], [email protected]
Abstract Over the years, a large number of alert messages have been storage by aircraft manufacturers, which characterize the
aircraft behavior and performance. Therefore, some aspects such as component failures and aircraft healthy can be obtained by
means of these messages in order to make decisions aimed to better manage the aircraft. However, these messages are storage
faster than can be processed by the reliability engineering team. Thus, this paper propose the use of data mining techniques to
determine sequential patterns of messages. In this context, it can be observed that the use of data mining may contribute to prevent aircraft accidents and reduce the aircraft maintenance time. Thereby, this paper presents a methodology based on Apriori
algorithm to extract association rules from a database of messages generated by executive aircrafts. It is important to highlight
that the proposed method was validated using a database provided by a Brazilian manufacturer.
Keywords Data mining, sequential patterns, apriori algorithm, aircraft reliability, aircraft messages, executive aircrafts.
Resumo Com o passar dos anos, uma grande quantidade de mensagens de alertas têm sido armazenadas pelos fabricantes de
aeronaves. Portanto, alguns aspectos como as falhas de componentes e o tempo de vida útil das aeronaves podem ser obtidos por
meio destas mensagens com o intuito de tomar decisões que visem o melhor gerenciamento das aeronaves. Entretanto, tais mensagens acumulam-se em uma velocidade muito maior do que podem ser processadas pelos engenheiros responsáveis pela análise
de confiabilidade das aeronaves. Assim, este artigo propõe o emprego de mineração de dados para determinar padrões sequenciais de mensagens, onde é possível notar que o uso de mineração de dados pode contribuir para a prevenção de acidentes aéreos
e também para a redução do tempo de manutenção das aeronaves. Desta forma, empregou-se o algoritmo Apriori para a extração
e definição de regras de associação por meio de uma base de dados que contém mensagens geradas por aeronaves executivas. É
importante destacar que o método proposto foi validado por meio de uma base de dados fornecida por um fabricante de aeronaves brasileiro.
Palavras-chave Mineração de dados, padrões sequenciais, algoritmo apriori, confiabilidade de aeronaves, mensagens de aeronaves, aeronaves executivas.
1
Contudo, torna-se difícil monitorar todos os sistemas e subsistemas das aeronaves, uma vez que cada
um possui comportamentos distintos, singulares e que
podem sofrer alterações ao longo dos anos de atividade. Devido a este complexo cenário, com o passar
dos anos, a indústria aeronáutica desenvolveu métodos e ferramentas a fim de acompanhar o tempo de
vida útil dos componentes das aeronaves, visando
aumentar a segurança e tornar os processos de manutenção mais robustos.
Assim, no trabalho de Letourneau, Famili e
Matwin (1999), os autores propõem a implementação
de um sistema de monitoramento de voo, o qual recebe os dados da aeronave em tempo real. Estes dados são analisados e o sistema gera uma mensagem
de alerta quando algum componente precisa ser substituído. Deste modo, foram empregadas Redes Bayesianas para a determinação de falhas nos motores de
16 aeronaves.
Em Roemer et al. (2001), empregou-se um classificador Neuro-Fuzzy para realizar o prognóstico de
aeronaves. Por meio deste método, os autores puderam determinar o desgaste de válvulas.
Introdução
Aeronaves são compostas pela integração de diversos
sistemas complexos e isolados que compõem um
único produto ao final de seu processo de fabricação.
Dentre os componentes que fazem parte de uma aeronave, pode-se destacar: fuselagem, ar condicionado, sistemas hidráulicos, sistemas de bordo, sistemas
elétricos, sistemas pneumáticos, dentre outros. Devido a esta grande quantidade e diversidade de componentes, nota-se que muitos fabricantes também poderão estar envolvidos.
De acordo com o contexto supracitado, em Air
Transport Association of America (1998) podem ser
obtidas informações que dizem respeito à norma
A.T.A. Specification 100, a qual divide os sistemas e
subsistemas das aeronaves em 100 capítulos. É importante frisar que a A.T.A. Specification 100 visa
tanto facilitar a obtenção de informações como agilizar o processo de manutenção e/ou reparo de aeronaves comerciais.
2931
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
Shot and Recovery Log) para realização das análises
e processamento dos dados. Os autores aplicaram o
algoritmo Apriori a fim de se encontrar um padrão de
ocorrência das falhas. Além disso, foi feita uma análise de tendência aos dados da ASRL. Os resultados
obtidos nas análises de ambas as bases de dados foram confrontados, onde verificou-se que os voos realizados durante a noite apresentam componentes com
tempo de vida útil menor. Desta forma, mais tarefas
de manutenção são necessárias para que estas aeronaves continuem operando de forma adequada.
Recentemente, Kamsu-Foguem (2012) buscou o
aprimoramento de métodos de ensaios não destrutivos para a detecção de falhas em sistemas aeronáuticos. Assim, o autor desenvolveu uma metodologia
que fornece regras destinadas a auxiliar na tomada de
decisão sobre qual método deve ser utilizado em cada
situação de falha. Para atingir o objetivo proposto,
técnicas de mineração de dados foram empregadas
para extração de classes semânticas recorrentes em
textos relativos ao histórico de ensaios. Como resultado, o estudo mostrou uma rápida identificação do
método mais apropriado para a análise das falhas.
Seguindo o contexto supracitado, este artigo visa
a definição de uma metodologia baseada em Mineração de Dados que possibilite a análise de mensagens
enviadas por aeronaves executivas de um fabricante
brasileiro. Por meio da metodologia proposta, buscase estabelecer regras que associem estas mensagens
e, por consequência, permita a identificação de um
padrão de ocorrência de alguns alertas. Desta forma,
será possível a obtenção de informações que auxiliem
nas tomadas de decisão do fabricante em relação tanto às operações de voo como também à manutenção
das aeronaves. Destaca-se que esta pesquisa justificase no fato de que, na literatura, não são obtidos padrões sequenciais para as mensagens de alerta emitidos por aeronaves executivas. Além disso, a Mineração de Dados torna-se atrativa para a grande quantidade de dados que encontram-se armazenados pelo
fabricante e que não são analisados de forma automatizada.
Este artigo encontra-se organizado de forma que
a Seção 2 destina-se aos fundamentos de diagnóstico
e manutenção de aeronaves. Na Seção 3 são
apresentados os fundamentos sobre Mineração de
Dados. A Seção 4 fornece breves conceitos sobre
regras de associação e uma explanação mais
detalhada em torno do Algoritmo Apriori. A Seção 5
é designada a apresentar a metodologia proposta
neste artigo e que fora supramencionada. Por fim, as
Seções 6 e 7 apresentam, as análises dos resultados
obtidos e as conclusões da pesquisa desenvolvida.
Na proposta de Skormin, Gorodetski e Popyack
(2002), emprega-se um classificador baseado em
árvore de decisão e distribuição probabilística para
indicar possíveis falhas em sistemas aviônicos, o qual
é feito por meio de dados de vibração, temperatura,
carga e pressão do ar.
Em Keller et al. (2006), os autores caracterizam
falhas provenientes de atuadores elétricos ligados ao
sistema de combustível das aeronaves (bombas e
válvulas). Os dados foram obtidos por meio de ensaios laboratoriais, onde eram simuladas as condições
de voo e carregamentos reais de uma aeronave. A
metodologia proposta também empregou Redes Bayesianas e mostrou-se viável para estabelecer tendências de degradação dos atuadores elétricos.
Outros autores como Ahmadi e Söderholm
(2008) utilizam o modelo FMEA (Failure Mode and
Effect Analysis) em combinação com árvores de decisão para auxiliar a manutenção preditiva e antecipar a
identificação de falhas em aeronaves. Neste caso, o
FMEA é utilizado para selecionar as falhas e as árvores de decisão verificam a ocorrência ou não ocorrência de uma determinada falha. Cabe comentar que
esta metodologia foi aplicada ao sistema de ventilação de aeronaves.
Han, Kim e Sohn (2009) utilizaram regras de associação para extração de padrões sequenciais relacionados às falhas da frota de aeronaves da Força Área
da República Coreana. Para tanto, foram utilizados
dados históricos de falhas de quatro modelos de aeronaves, as quais foram divididas de acordo com os
seus sistemas (instrumentação, equipamento de ataque, ar condicionado, etc.). Considerou-se nesta pesquisa 24 cenários distintos em termos de tipo de missão e estação do ano. As sequências foram limitadas
a no máximo 3 falhas e após o processamento foram
escolhidas as duas regras de associação com maior
suporte e confiança para cada cenário. Os resultados
obtidos extraíram regras que até então seriam desconhecidas aos especialistas, entretanto, eram regras
relevantes para a manutenção da frota.
Na proposta de Clements et al. (2010), os
autores separam os dados em clusters que representam tarefas de manutenção. Após esta etapa são aplicadas ferramentas inteligentes (sistemas fuzzy, redes
neurais e regras de associação), as quais foram treinadas e validadas a fim de identificar falhas estruturais nas aeronaves.
Destaca-se ainda que muitas pesquisas na área de
previsão de falhas em aeronaves fazem uso de ferramentas estatísticas. Deste modo, Jianguo et al. (2010)
propõem o uso do modelo ARMA (Autoregressive
Moving Average Models) e de uma SVM (Support
Vector Machine) para analisar ondas sonoras provenientes dos estabilizadores das aeronaves e, por fim,
determinar o estado de degradação destes estabilizadores.
Young et al. (2010) utilizaram o histórico das tarefas de manutenção já realizadas em uma frota de
aeronaves, bem como os dados da ASRL (Aircraft
2 Diagnóstico e Manutenção de Aeronaves
O diagnóstico de aeronaves pode ser dividido em
dois grandes grupos: diagnóstico on-line e diagnóstico off-line.
2932
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
Ferramentas destinadas aos diagnósticos on-line
recebem o histórico dos parâmetros da aeronave e,
desta forma, os dados são adquiridos e processados.
Na sequência, se for o caso, o piloto recebe as mensagens de alerta. Neste processo, são empregadas
tecnologias sofisticadas, as quais permitem o diagnóstico em tempo real e boa precisão na identificação
de possíveis falhas. O diagnóstico on-line pode ser
integrado com a Master Minimum Equipment List
(MMEL), que representa um documento criado pelo
fabricante da aeronave e estabelece que a aeronave,
mesmo com algum componente inoperante, pode
continuar em operação desde que obedeça a uma
determinada condição. Consequentemente, antes de
chegar em solo, tanto o piloto como a equipe de manutenção já sabem quais são os procedimentos a serem realizados para que a aeronave continue disponível para uso (Zhang et al., 2011).
Já as ferramentas que apresentam diagnósticos
off-line são baseadas na análise das informações gravadas pela aeronave (durante o voo e/ou em solo).
Com base neste histórico de dados, os operadores das
aeronaves e os responsáveis pela manutenção conseguem identificar as principais atividades que ocorreram no sistema e nos componentes. Por consequência, torna-se possível rastrear a origem das falhas
para que sejam tratadas de modo assertivo com o
objetivo de garantir maior tempo de vida útil à aeronave (Hurdle, Bartlett e Andrews, 2009; DeCastro et
al., 2011).
Visto que os alertas podem acontecer, seja em
voo ou em solo, Zhang et al. (2011) discutem os aspectos das ferramentas de diagnóstico. Entretanto,
após o diagnóstico da aeronave, faz-se necessária a
manutenção da mesma para que retorne às suas condições normais, visto a manutenção tem um papel
vital na indústria aeronáutica devido ao risco de acidentes. Por este motivo, inúmeras normas regulamentam a operação de aeronaves a fim de garantir a condição plena para que o produto opere de forma segura.
Conforme já abordado, aeronaves são sistemas
complexos que resultam da integração de muitos sistemas e componentes. Portanto, a confiabilidade do
sistema resulta da interação de muitos fatores, que
devem ser considerados desde o projeto da aeronave
até a produção e seus ajustes finais.
Em decorrência da degradação dos componentes
do sistema da aeronave, fazem-se necessárias intervenções de manutenção com a finalidade de restaurar
a funcionalidade completa do sistema. Dentre essas
atividades, pode-se encontrar tarefas de reparo, remoção/substituição, inspeção e calibração (Duek,
2005).
Com base nas tarefas de manutenção supracitadas, há diversas formas de empregá-las visando diminuir o tempo de indisponibilidade das aeronaves.
Cabe ainda informar que as tarefas de manutenção
podem ser corretivas e/ou preventivas.
3 Fundamentos de Mineração de Dados
A Mineração de Dados representa um conceito que
utiliza algoritmos, automáticos ou semiautomáticos,
que sejam capazes de extrair características e informações úteis de grandes bancos de dados. Devido às
suas inúmeras possibilidades de aplicação e à sua
interdisciplinaridade, existem diversas definições
para o termo Mineração de Dados.
Neste artigo, a Mineração de Dados segue as definições fornecidas por Fayyad, Piatetsky-Shapiro e
Smyth (1996), onde a mesma representa uma etapa
no processo de descoberta de conhecimento que,
consequentemente, consiste na análise dos dados e
aplicação de algoritmos que determinam um conjunto
de padrões para os dados.
É importante destacar que Fayyad, PiatetskyShapiro e Smyth (1996), dividem a Mineração de
Dados em duas classes de ferramentas:
 Baseadas em aprendizado supervisionado,
onde os dados são utilizados para construir
um modelo que descreva o comportamento
de uma variável de interesse, ou seja, a variável de saída deve ser conhecida para que
seja possível o treinamento da ferramenta;
 Baseadas em aprendizado não supervisionado, onde não se conhece o comportamento
das saídas e deseja-se fazer um estudo que
encontre relações possíveis entre as entradas
e saídas.
Dentre os algoritmos que empregam o aprendizado não supervisionado, destacam-se algumas técnicas para clusterização de dados e também os algoritmos que geram regras de associação. Ressalta-se que
neste trabalho, serão utilizadas as regras de associação para se determinar relações entre as mensagens
transmitidas pelas aeronaves durante o voo, as quais
são apresentadas em maiores detalhes na sequência.
4 Regras de Associação - Algoritmo Apriori
Uma regra de associação representa a análise probabilística realizada sobre a ocorrência simultânea de
determinados eventos em uma base de dados (Hand,
Mannila e Smyth, 2001). Esta categoria de algoritmos gera regras do tipo SE...ENTÃO, conforme mostrado no exemplo a seguir:
SE Falha01 = X ENTÃO Falha02 = Y
Geralmente, os algoritmos destinados à obtenção
de regras de associação, ao gerar um resultado, também determinam o suporte e a confiança da regra. De
acordo com Hand, Mannila e Smyth (2001), esses
valores são definidos como:
 Suporte - representa a proporção de instâncias de uma base de dados que contenham
um determinado conjunto;
2933
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014

um contador deve ser incrementado ao passo que
encontra um item que satisfaz o suporte mínimo prédefinido na parametrização do algoritmo, onde para
este artigo S = 0,001 (valor este que será justificado
na subseção 5.5).
Cabe comentar que o algoritmo Apriori foi executado a partir do software de Mineração de Dados
conhecido como WEKA (Waikato Environment
Knowledge Analysis) desenvolvido pela Universidade de Waikato - Nova Zelândia (Hall et al., 2009).
É importante frisar também que a metodologia
proposta, apesar de empregar o algoritmo Apriori,
ainda necessita de uma preparação dos dados e de
uma etapa de transformação. Todas estas etapas serão
tratadas em maiores detalhes na Seção 5.
Confiança - representa a probabilidade de
encontrar Y quando há a ocorrência de X na
base de dado;
Conforme descrito por Hand, Mannila e Smyth
(2001), o objetivo de um algoritmo destinado a obter
regras de associação é encontrar todas as regras que
satisfaçam uma confiança p maior que um limiar pl e
um suporte s maior que um limiar sl.
Dentre os algoritmos que geram regras de associação, destaca-se o Apriori que possui a capacidade
de extrair conjuntos de itens que ocorrerão com frequência em um banco de dados. O Apriori é um algoritmo de busca baseado na anti-monotonicidade, ou
seja, um conjunto de itens somente pode ser frequente se todos os seus subconjuntos forem frequentes.
Por convenção, este algoritmo assume que os
itens pertencentes a um conjunto são ordenados de
forma lexicográfica. Desta forma, os dados das mensagens das aeronaves foram organizados de modo
que o algoritmo fosse capaz de fornecer uma análise
em torno da relação entre as mensagens que ocorrem
com maior frequência na base de dados.
Com o intuito de melhor apresentar o algoritmo
Apriori que foi empregado neste trabalho, na sequência, um pseudo-código do mesmo pode ser analisado:
5 Metodologia Proposta
A metodologia proposta para a Mineração de Dados
das mensagens das aeronaves executivas foi dividida
em 6 etapas, as quais comportam desde a obtenção
dos dados, seleção de dados das aeronaves, preparação dos dados para que pudessem ser tratados pelo
software WEKA, transformação dos dados, construção do modelo baseado em regras de associação e
análise dos resultados.
Seguindo estas 6 etapas, a Figura 1 apresenta um
diagrama de blocos que representa a visão geral da
metodologia proposta e que foi previamente mencionada.
Algoritmo 1: Apriori
01: dado um banco de dados de mensagens T
02: dado um suporte mínimo S
03: L  conjunto de itens do banco de dados
04:
k 5
05: while  Lk 1  0 

06:
Ck  a  b a  Lk 1  b 
07:
for  mensagem t  T 
08:
Ct  c c  Ck  c  t
09:
for  candidados c  Ct 
Lk 1  b  a

contador[c]  contador[c]  1
10:
Aquisição dos Dados
CAS
(Crew Alerting System)
Seleção dos Dados
Dados da América Latina
Preparação dos Dados
Organização do Arquivo
de Entrada do WEKA
Transformação dos Dados
Conversão de Dados
(numérico para nominal)
11:
12:
end for
end for
13:
Lk  c c  Ck  contador[c]  S 
Obtenção de Regras de
Associação
Algoritmo Apriori
k  k 1
Lk
Análise dos Resultados
Especialista
14:
15: return
k
Figura 1. Visão geral da metodologia para mineração de dados das
mensagens das aeronaves executivas.
Ressalta-se que o algoritmo Apriori é iterativo,
no entanto, antes de inicializar as iterações deve-se
definir um banco de dados T contendo as mensagens
dos alertas transmitidos pelas aeronaves, um conjunto
de itens frequentes (de tamanho k) como L e seus
candidatos como Ck, onde para este artigo considerou-se k máximo igual a 5. Além disso, é importante
que seja definido um suporte mínimo S. Assim, o
Apriori faz uma busca no banco de dados com o intuito de definir conjuntos de itens. Para cada iteração,
Na sequência, cada bloco da Figura 1 será devidamente explanado por meio das Subseções de 5.1 a
5.5.
5.1 Aquisição dos Dados
Os dados utilizados neste trabalho foram extraídos de uma ferramenta de suporte à gerência da vida
2934
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
útil de aeronaves executivas. Esta ferramenta transmite, em tempo real, mensagens tanto ao piloto por
meio do Crew Alerting System (CAS) como à equipe
de manutenção pelo Computador Central de Manutenção. Destaca-se que nesta pesquisa foram considerados dados que abrangem um período que se inicia
em Março de 2009 e termina em Agosto de 2013.
grama da Figura 2, com o intuito de auxiliar a compreensão das mensagens que foram analisadas.
Tabela 1. Especificação das A.T.A..
5.2 Seleção dos dados
As mensagens coletadas pela ferramenta supracitada foram selecionadas a fim de que fosse definido
um banco de dados homogêneo, de forma a garantir
um resultado consistente quando da aplicação do
algoritmo Apriori.
Portanto, a princípio, selecionou-se um modelo
de aeronave, visto que distintos modelos de aeronaves possuem também comportamentos distintos, os
quais seriam refletidos nas mensagens. Assim, foram
coletadas somente as mensagens transmitidas em voo,
pois, durante a decolagem ou o pouso muitos dos
sistemas da aeronave estão desligados e, por consequência, grande parte das mensagens transmitidas em
solo são consideradas inconsistentes para o fabricante.
Por fim, destaca-se que as aeronaves selecionadas pertencem a uma mesma região de operação,
neste caso, a região escolhida foi a América Latina.
Não foram utilizadas aeronaves de outras regiões de
operação, pois, os sistemas das aeronaves são influenciados tanto pela distância entre as localidades
como pelo clima da região.
Durante a etapa de seleção de dados, foi gerado
um histograma que contém o número de mensagens
separados pela A.T.A. em que elas ocorreram. Este
histograma pode ser visualizado por meio da Figura
2.
A.T.A.
Especificação
21
22
23
24
26
27
28
29
30
31
32
34
35
36
52
73
76
77
79
80
Sistema de Pressurização e Ar-condicionado
Sistema Automático de Voo
Sistema de Comunicação
Sistema de Energia Elétrica
Sistema de Proteção contra Fogo
Controles de Voo
Sistema de Combustível
Sistema Hidráulico
Proteção contra gelo e chuva
Indicação e Gravação de Dados de Voo
Trem de Pouso
Sistema de Navegação
Oxigênio
Sistema Pneumático
Portas
Sistemas de Combustível
Sistema de Controle do Motor
Monitoramento de Dados do Motor
Óleo
Partida de Motor
5.3 Preparação dos dados
Nº dede
Mensagens
Número
Mensagens
A etapa de preparação dos dados consiste em organizar o banco de dados, de forma que o mesmo
esteja adequado ao software WEKA, onde os dados
serão analisados. Visto que o objetivo é encontrar
padrões entre as mensagens que ocorreram em um
mesmo voo, tais mensagens foram ordenadas em
primeiro nível pelo número do voo e em segundo
nível pela estampa de data/horário de sua ocorrência.
Posteriormente, o banco de dados foi processado
para que os códigos das mensagens de um mesmo
voo ficassem organizados em um mesmo registro
(tupla).
Após esta organização do banco de dados, os arquivos gerados foram submetidos ao WEKA, onde a
Mineração de Dados é iniciada pelo processo de
transformação dos dados.
5.4 Transformação dos dados
Esta etapa consiste na transformação dos dados
em uma classe compatível com a que o algoritmo é
capaz de processar, como: numérico, nominal ou
binário.
O software WEKA, ao receber os arquivos de
entrada, automaticamente interpreta os códigos das
A.T.A. de cada mensagem como variáveis quantitativas (numéricas). Entretanto, apesar de serem expressos por números, estes códigos deveriam ser variáveis nominais, visto que apenas identificam a A.T.A..
Portanto, houve a necessidade de se aplicar um conversor que transformou os dados numéricos em nominais.
A.T. A.
A.T.A.
Figura 2. Histograma da distribuição das mensagens para aeronaves da América Latina.
Destaca-se que este histograma representa somente os dados das mensagens de um mesmo modelo
de aeronave executiva que opera na América Latina.
Analisando a Figura 2, é possível notar que as
A.T.A. 30 e 24 possuem mais do que 10.000 mensagens para a região da América Latina, sendo este
número bastante significativo em relação às demais
A.T.A.. Deste modo, a Tabela 1 apresenta a especificação de cada uma das A.T.A. encontradas no histo2935
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
As principais regras encontradas, ou seja, aquelas que possuem uma confiança de 0,9 (90%) podem
ser verificadas por meio da Tabela 3.
5.5 Obtenção de Regras de Associação e Análise de
Resultados
Esta etapa consistiu na aplicação do algoritmo
Apriori, o qual fora previamente mencionado e explanado. Desta forma, torna-se importante mencionar
apenas que o algoritmo foi parametrizado de modo
que atingisse um suporte mínimo de 0,001 ou uma
confiança mínima de 0,1. Os valores de suporte mínimo foram variados entre 0,001 e 0,1 com passo de
0,001, ou seja, 100 possíveis combinações de valores
para suporte mínimo. Já a confiança mínima, sempre
foi mantida como 0,1 para que mais resultados pudessem ser analisados. Entretanto, após a obtenção
dos resultados, somente as regras com confianças
maiores ou iguais a 0,9 foram avaliadas por especialistas, pois, regras com confiança menores do que
90% de precisão normalmente não são consideradas
na indústria aeronáutica. Os resultados obtidos por
meio do algoritmo Apriori serão relatados em maiores detalhes na Seção 6. Além disso, cabe comentar
que devido a este trabalho gerar como resultados as
regras que associam as mensagens de alertas das aeronaves, foi necessário que um especialista realizasse
uma averiguação da coerência das regras de associação geradas. Sendo assim, foi possível verificar a
compatibilidade destas regras.
Tabela 3. Principais regras de associação determinadas pelo algoritmo Apriori.
Regras com Confiança > 0,9
A.T.A. 30 → A.T.A. 27
A.T.A. 24 → A.T.A. 24
A.T.A. 24 → A.T.A. 24
A.T.A. 27 → A.T.A. 34
Com relação à primeira regra obtida, apesar de
estarem em A.T.A. diferentes, estes sistemas são muito próximos, visto que a A.T.A. 30 se refere à Proteção contra gelo e chuva (conforme Tabela 1) e a
A.T.A. 27 se refere aos Controles de voo. Neste caso,
os controles de voo estão relacionados aos acionamentos necessários para garantir o degelo dos estabilizadores da aeronave. Esta regra evidência a relação
existente entre as regras encontradas pelo algoritmo e
indica ao piloto uma situação de alerta e aviso durante o voo, podendo atuar como uma antecipação à
tomada de decisão do mesmo, ou seja, neste caso o
alerta é mais útil ao piloto do que à equipe de manutenção.
Na segunda e terceira regras, as mensagens pertencem a uma mesma A.T.A., porém, após uma análise mais aprofundada das regras, notou-se que os alertas se referem a componentes distintos, neste caso, a
contatores conectados em diferentes pontos da aeronave. Particularmente, neste caso, as regras podem
ser empregadas para auxiliar a antecipar tarefas de
manutenção, ou seja, pode ser realizada a compra e
troca conjunta destes contatores. Assim, mesmo em
casos onde uma das mensagens de alerta não tenha
ocorrido, pode-se realizar a troca dos componentes
com o intuito de prevenir possíveis falhas da aeronave, visto que esta regra é 90% confiável. Além disso,
também é possível realizar a otimização do estoque
de peças, de forma que as peças sejam solicitadas em
conjunto. Deste modo, o tempo de espera pelos componentes poderia ser minimizado.
Por fim, a quarta regra extraída faz a conexão
entre dois sistemas distintos da aeronave, a A.T.A. 27
responsável pelos sistemas de controle de voo e a
A.T.A. 34 que é responsável pelos instrumentos que
utilizam dados que auxiliam na navegação da aeronave, conforme pode ser observado por meio da Tabela
1. Neste caso específico, há uma associação entre um
sistema que alerta a perda de sustentação da aeronave
com outro sistema que alerta sobre possíveis condições inseguras de tráfego. Destaca-se que mais uma
vez, as regras extraídas visam garantir maior segurança da aeronave.
Ressalta-se que outras regras de associação foram geradas, porém, apresentaram valores de confiança inferiores a 0,9 (onde o máximo é 1). Além disso, as regras apresentadas por meio da Tabela 3 são
de extrema importância para garantir a segurança da
6 Resultados
O software WEKA foi utilizado para processar a base
de dados de aeronaves executivas (para um mesmo
modelo) da América Latina. Deste modo, o algoritmo
Apriori foi empregado a fim de encontrar as melhores
regras de associação, ou seja, aquelas mais frequentes
no banco de dados de mensagens.
A parametrização do algoritmo Apriori foi realizada por meio dos testes supracitados (Seção 5). Portanto, a Tabela 2 apresenta os valores pré-definidos
para suporte e confiança, bem como os valores obtidos. É importante destacar que estes valores correspondem à melhor configuração obtida para o algoritmo.
Tabela 2. Comparação entre os valores obtidos e os valores parametrizados para o algoritmo Apriori.
Parâmetros
Valores
Confiança Mínima Parametrizada
Confiança Mínima Obtida
Suporte Mínimo Parametrizado
Suporte Mínimo Obtido
Tempo de Processamento
Número de Regras Obtidas
0,1
0,1
0,001
0,03
± 20 horas
100
Nota-se que a Tabela 2 também apresenta o tempo de processamento consumido pelo algoritmo
Apriori e a quantidade de regras de associação obtidas.
2936
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
aeronave e também para aprimorar os procedimentos
de manutenção e compra de componentes, tarefas
estas que devem ser realizadas pelo fabricante da
aeronave.
Aviação. Dissertação de Mestrado, Engenharia
de Produção, Universidade Federal de Santa
Maria.
Fayyad, U.; Piatetsky-Shapiro, G. and Smyth, P
(1996). From Data Mining to Knowledge
Discovery in Databases. AI Magazine, vol. 17,
no 3, pp. 37-54.
Hall, M.; Frank, E.; Holmes, G.; Pfahringer, B.;
Reutemann, P. and Witten, I. H (2009). The
WEKA Data Mining Software: An Update.
SIGKDD Explorations, vol. 11, no. 1, pp. 10-18.
Han, H. K.; Kim, H. S. and Sohn, S. Y (2009).
Sequential Association Rules for Forecasting
Failure Patterns of Aircrafts in Korean Airforce.
Expert Systems with Applications, vol. 36, no. 2,
1129-1133.
Hand, D.; Mannila, H. and Smyth, P (2001).
Principles of Data Mining. Massachusetts: The
MIT Press.
Hurdle, E. E.; Bartlett, L. M. and Andrews, J. D
(2009). Fault Diagnostics of Dynamic System
Operation Using a Fault Tree Based Method.
Reliability Engineering and System Safety, vol.
94, no. 9, pp. 1371-1380.
Jianguo, C.; Jie, Z.; Liqiu, L.; Yun, Z.; Keli, Z. and
Guoqiang, Z (2010). Health Diagnosis for
Aircraft Based on the ARMA Model.
International
Conference
on
Intelligent
Computing and Integrated Systems, pp. 277-280.
Kamsu-Foguem, B (2012). Knowledge-Based
Support in Non-Destructive Testing for Health
Monitoring of Aircraft Structures. Advanced
Engineering Informatics, vol. 26, no. 4, 859-869.
Keller, K.; Swearingen, K.; Sheahan, J.; Bailey, M.;
Dunsdon, J. and Przytula, K (2006). Aircraft
Electrical Power Systems Prognostics and Health
Management. IEEE Aerospace Conference, pp.
1-12.
Letourneau, S.; Famili, F. and Matwin, S (1999).
Data Mining to Predict Aircraft Component
Replacement. IEEE Intelligence Systems and
Their Applications, vol. 14, no. 6, pp. 59-66.
Roemer, M. J.; Kacprzynski, G. J.; Nwadiogbu, E. O.
and Bloor, G (2001). Development of Diagnostic
and Prognostic Technologies for Aerospace
Health Management Applications. IEEE
Aerospace Conference, vol. 6, pp. 3139-3147.
Skormin, V.; Gorodetski, V. and Popyack, L (2002).
Data Mining Technology for Failure Prognostic
of Avionics. Aerospace and Electronic Systems,
vol. 38, no. 2, pp. 388-403.
Wu, X.; Kumar, V.; Ross, Q. J.; Ghosh, J.; Yang, Q.;
Motoda, H.; McLachlan, G. J.; Ng, A.; Liu, B.;
Yu, P. S.; Zhou, Z.-H.; Steinbach, M.; Hand, D.
J. and Steinberg, D (2008). Top 10 Algorithms
in Data Mining. Knowledge and Information
Systems, vol. 14, no. 1, pp. 1-37.
Young, T.; Fehskens, M.; Pujara, P.; Burger, M. and
Edwards, G (2010). Utilizing Data Mining to
Influence Maintenance Actions. IEEE Autotest
Conference, pp. 1-5.
7 Conclusão
A Mineração de Dados mostrou-se eficiente no auxílio às tomadas de decisão que visam a manutenção de
aeronaves executivas, pois, o algoritmo Apriori encontrou relações entre distintos sistemas das aeronaves. As principais regras encontradas destacam a
A.T.A. 30 (Proteção contra gelo e chuva), a A.T.A.
27 (controles de voo), a A.T.A. 24 (sistema elétrico)
e a A.T.A. 34 (sistema de navegação). A relação entre tais A.T.A. evidenciam a complexidade e a interligação entre os distintos sistemas das aeronaves,
bem como fornecem relações não triviais entre os
sistemas. Assim sendo, as regras de associação são
úteis para encontrar causas raízes de alertas recorrentes em uma determinada frota de aeronaves. Em trabalhos futuros, pretende-se tanto verificar a eficiência
de outros algoritmos como também analisar a metodologia proposta frente a aeronaves executivas que
operem em outras regiões e, desta forma, estabelecer
um padrão de mensagens recorrentes em distintas
regiões.
Agradecimentos
Os autores gostariam de agradecer à FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo), à CAPES (Coordenação de Aperfeiçoamento de
Pessoal de Nível Superior) e ao CNPq (Conselho
Nacional de Desenvolvimento Científico e Tecnológico) pelos apoios financeiros concedidos para a realização desta pesquisa.
Referências Bibliográficas
Ahmadi, A. and Söderholm, P (2008). Assessment of
Operational Consequences of Aircraft Failures:
Using Event Tree Analysis. IEEE Aerospace
Conference, pp. 1-14.
Air Transport Association of America (1998). A.T.A.
Spec. 100: Specification for Manufacturers
Technical Data.
Clements, R.; Morse, J.; Darr, D. and Laskowski, B
(2010). Meta-Data Mining for Optimized
Aircraft Repair and Overhaul. 2nd International
Symposium on NDT in Aerospace, pp. 1-8.
DeCastro, J. A.; Tang, L.; Zhang, B. and
Vachtsevanos, G (2011). A Safety Verification
Approach to Fault-Tolerant Aircraft Supervisory
Control. AIAA Guidance, Navigation, and
Control Conference.
Duek, C (2005). Análise de Confiabilidade na
Manutenção de Componente Mecânico de
2937
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
Zhang, P.; Zhao, S.-W.; Tan, B.; Yu, L.-M. and Hua,
K.-Q (2011). Applications of Decision Support
System in Aviation Maintenance. Efficient
Decision Support Systems - Practice and
Challenges in Multidisciplinary Domains,
InTech.
2938
Download