Análise de Confiabilidade em Circuitos Elétricos Industriais da Rhodia utilizando a Metodologia de Árvore de Falhas (FTA) Jeferson Fleury Haach (*) Resumo O objetivo deste trabalho é apresentar um exemplo real de aplicação da metodologia FTA, como uma das ferramentas capazes de atender as novas exigências em relação à Confiabilidade e Disponibilidade dos sistemas industriais. Definiremos alguns conceitos básicos de confiabilidade e algumas terminologias usadas na FTA, descrevendo as principais etapas do processo, os resultados, a interpretação e a análise dos mesmos. Por fim, apresentaremos uma comparação entre os resultados esperados (calculados) e valores reais obtidos no período de 1993 à 1996. À partir de 1997 o sistema foi modificado, incorporando as melhorias identificadas neste estudo. (*) Engenheiro Eletricista formado pelo Universidade de São Paulo, com especialização em Qualidade Industrial e Gestão de Empresas pela Unicamp. Trabalha na Rhodia – Conjunto Químico de Paulínia (SP) desde 1989. Foi responsável pelo Departamento de Manutenção Elétrica ( 94 à 97 ), onde participou como multiplicador dos seguintes programas: • Qualidade Total – Processo Rhodia de Excelência ( PRHOEX ), • I.F.P - Polivalência Operacional ( Manutenção-Produção ) • RCM - Manutenção Centrada em Confiabilidade. Desde 1997, atua como Coordenador de Engenharia da Rhodia – Atividade Orgânica Fina América Latina, responsável pelas áreas de manutenção e projetos nos sites de Paulínia e Santo André. É membro do Comitê Técnico ( SP ) e do Conselho Deliberativo da Abraman. e-mail: [email protected] ou [email protected] Trabalho apresentado no 5o. Congresso de Gestão e Técnicas na Manutenção, 11 e 12 de junho de 2001, Belo Horizonte, realização TECÉM-Tecnologia Empresarial Ltda 1 1 - Introdução Temos observado nas últimas duas décadas uma evolução bastante significativa nos conceitos de manutenção. Isto se deve ao fato de que as instalações e os equipamentos estão se tornando cada vez mais complexos. Além disso, há uma busca constante para que os mesmos tenham uma performance elevada, principalmente com relação à Confiabilidade e a Disponibilidade. Outro fator importante, é a maior conscientização do setor industrial com as consequências adversas que uma falha de equipamento ou instalação pode trazer com relação à Segurança, o Meio Ambiente e a Qualidade do Produto, além dos Custos envolvidos direta ou indiretamente. Todas essas mudanças tem impulsionado uma série de alterações no modo de pensar e agir dos gerentes de manutenção, no sentido de desenvolver novos métodos de trabalho, que permitam construir equipamentos e instalações mais confiáveis e performantes. É neste contexto que tem se desenvolvido a utilização de várias metodologias para o cálculo da Confiabilidade e da Disponibilidade. Entre elas, a Análise por Árvore de Falhas (FTA - Fault Tree Analysis). 2 - Metodologia - Árvore das Falhas É um processo lógico dedutivo utilizado para analisar eventos indesejados, de forma qualitativa e quantitativa, buscando-se as causas possíveis que levem à ocorrência do evento em questão. Esta técnica pode ser aplicada à equipamentos ou sistemas, tanto na fase de projeto como de operação, identificando de maneira estruturada os pontos frágeis dos mesmos. Além disso, pode-se analisar diversos tipos de falhas, tais como: erros humanos, falhas intrínsecas e de modo comum. 2.1 - Terminologias e Conceitos Para que esta técnica possa ser aplicada com eficiência, algumas terminologias e conceitos devem estar perfeitamente entendidos. 2 No exemplo que descrevemos à seguir foram adotadas as seguintes definições: 2.1.1 - Conceitos de Confiabilidade a) Confiabilidade Probabilidade de um sistema, equipamento ou componente cumprir sua missão com sucesso, por um período e condições especificas. b) Indisponibilidade Probabilidade de um sistema, equipamento ou componente falhar no momento em que for solicitado. c) Falha Condição em que determinado equipamento ou sistema não consegue cumprir a missão para o qual foi designado. d) Taxa de Falha Quantidade de falhas num período de tempo ou ciclos determinados. e) Tempo Médio de Reparo Tempo necessário para reestabelecer a função de determinado equipamento. 2.1.2 - Terminologia na Árvore das Falhas Evento Topo Evento de falha indesejável, objeto de estudo. Evento Básico Evento de falha que possui uma taxa de falha ou uma probabilidade. Corte Conjunto de eventos básicos que provocam o evento topo. Corte Mínimo Quantidade mínima de eventos básicos que provocam o evento topo. Corte Primeira Ordem Quando apenas um único evento básico provoca a ocorrência do evento topo. 3 2.1.3 - Classificação dos Eventos Monitorados Testados Modo Comum Erros Humanos Probabilidade 3 - Desenvolvimento do Estudo: Análise de um Sistema Elétrico da Rhodia Os principais objetivos da realização deste estudo foram: Análise qualitativa e quantitativa dos eventos de falha. Determinação da indisponibilidade média esperada do sistema no período de um ano. Análise e determinação de políticas de manutenção mais eficientes, no sentido de tornar o sistema mais confiável. 3.1. - Etapas do Estudo 3.1.1. - Formação de Equipe de Trabalho A equipe foi composta por técnicos da área de operação, projetos e de manutenção e um especialista em confiabilidade. Todos os membros do grupo passaram por uma formação básica em confiabilidade e da técnica FTA. 3.1.2. - Definição do Sistema Esta é uma etapa fundamental para o sucesso do trabalho, pois os limites e as fronteiras tem que estar perfeitamente definidas e em conformidade com o objetivo do estudo. Sendo assim, em função de nosso objetivo e da complexidade do sistema elétrico em questão foi decidido calcular a indisponibilidade de um circuito elétrico que fornece energia para quatro unidades de fabricação. 4 A análise considerou as falhas provenientes desde à concessionária de energia (CPFL) até os disjuntores primários que alimentam cada uma das quatro unidades, além da interface entre outros ramos do sistema elétrico que se fizeram necessário. O esquema unifilar da figura 1 mostra o ramal analisado e sua interface com o restante do sistema. CH1010 o o CPFL o o CH1014 DJ1010 CH1012 DJ1012 o o o o SUBESTAÇÃO SUL CH1016 SEG 1010 138 KV - 60 Hz o o o o CH1018 o o CH1020 TR1010 DJ1014 CH1022 12.5/15 MVA 138/69 KV TR1012 DJ2012 DJ2014 12.5/15 MVA 138/69 KV TR1014 15/18.75 MVA 138 - 3.8 KV Cabo BZ0149 o SEG 4010 3.8 KV oCH2014 DJ2010 o oCH2020 o o CH2010 o CH2022 oo o CH2012 o o SUBESTAÇÃO NORTE SEG 2011 SEG 4210 SEG 4214 o Cabo BZ0148 CTS SEG 4216 C A S A M FENOL Á Q APOA BISFENOL INEQ/SALAL / PTBF o CH2011 o DJ2011 66 KV o o CH2015 SEG 2010 o CH2017 o o CH2013 o DJ2015 DJ2013 TR2011 TR2015 TR2013 5/0.25 MVA 66/3.8 KV 5/0.25 MVA 66/3.8 KV 5/0.25 MVA 66/3.8 KV Figura 1 - Diagrama Unifilar do Estudo 5 3.1.3. - Construção da Árvore das Falhas Com o sistema e suas interfaces definidas, determinamos o evento indesejável à ser estudado, chamado de Evento Topo. Através da utilização do software FTW, que permite um desenvolvimento gráfico da árvore de falhas, construímos a mesma analisando à partir do evento topo todas as possibilidades de falha que levam à sua ocorrência. Cada um desses eventos possui uma descrição e um código que permite fazer uma classificação dos mesmos de acordo com o tipo de falha em questão. (erro humano, monitorados, testados, probabilidade e falha modo comum). A figura 2 à seguir mostra uma parte da árvore com os seus respectivos eventos de falha. EVENTO TOPO Indisponibilidade de Energia na Barrra B4216 + IndBa14A Não Chega Energia na Barra B4216 Curto Circuito na Barra B4216 com Sucesso da Proteção + FEnB14A + PORT055 Não Chega Energia no Cabo Bz0148 + FEnB14A Disjuntor DJ4016 esta Aberto DJ4012Abrt Curto Circuito Cabo / Conexões BZ-0148 e Falha da Proteção + CCCaBZ148 Curto Circuito na Barra B4216 com Falha Sistema de Proteção CuB14AFPr Curto Circuito Monofásico na Barra B4216 Curto Circuito Bifásico na Barra B4216 Curto Circuito Trifásico na Barra B4216 C1__B4216E C2__B4216E C3__B4216E Não Chega Energia no Disjuntor DJ4016 FEnDDJ4012 Curto Circuito Bifásico no Cabo BZ-0148 e Falha da Proteção PORT 050 Curto Circuito Monofásico no Cabo BZ-0148 e Falha da Proteção PORT 042 Curto Circuito Trifásico no Cabo BZ-0148 e Falha da Proteção PORT 051 6 Curto Circuito Monofásico no Cabo BZ-0150 e Falha da Proteção + PORT183 Curto Circuito Monofásico no Cabo BZ0150 Falha do Sistema de Proteção de Terra do Disjuntor DJ4014 + PORT184 B1__Z0150E Falta de Tensão de Comando para Proteção Falha do Disjuntor DJ4014 em Abrir Falha no Circuito de Corrente (TC) Falha do Rele de Proteção de Terra F 50/51 N + FV52D4014P + PORT185 + FJTCD4014E + PORT186 Falha Mecânica na Trava do Disjuntor DJ-4014 (Não Abre) Falha Elétrica no Circuito de Desligamento DJ4014 FI52D4014R FD52D4014R Falha Intriseca do Rele 50/51 N em Não Atuar FI5ND4014R Erro Humano na Calibração HC5ND4014H Falha do Rele de Bloqueio em Não Atuar (F-86) + PORT187 Falha Intriseca do Rele de Bloqueio FI86D4014D Falta de Tensão de Comando do Rele Bloqueio FV86D4014P Figura 2 - Desenho da Árvore com Eventos 7 3.1.4. - Equações Matemáticas e Dados de Entrada Uma vez concluída a construção da Árvore de Falhas, é possível agrupar todos os eventos de falha conforme a sua classificação previamente determinada. Para cada tipo de evento são associadas equações matemáticas que permitirão uma análise quantitativa da Árvore. À partir desta fase, passamos a atribuir valores às variáveis das equações relativos à cada evento de falha. É exatamente nesta etapa do trabalho que fica evidenciado a importância e as dificuldades na obtenção de dados de confiabilidade tais como: taxa de falha, tempo de reparo, probabilidade de falha, que sejam representativos para o sistema que está sendo analisado. Na maioria das vezes, temos dificuldade em saber qual a taxa de falha de determinado equipamento, simplesmente devido a inexistência dos dados. Diante disso, passamos à adotar valores constantes em Bancos de Dados Internacionais, que podem ou não refletir a nossa realidade. Desta forma, passa a ser fundamental que o grupo de trabalho faça uma análise crítica desses valores, tornando-os mais representativos. Além disso, existem alguns dados que não constam de bancos internacionais, como por exemplo, o Tempo de Reparo. Neste caso o grupo de estudo deve ter condições de estimar esse valor com base na experiência e na realidade da instalação. Fica evidente portanto, a necessidade de um Banco de Dados de Confiabilidade mais específico e que represente da melhor maneira possível a realidade do seu próprio sistema. A qualidade do resultado final do estudo será função da qualidade dos dados adotados para cada um dos eventos. Na figura 3 temos um exemplo de equações adotadas para cada tipo de evento e na figura 4, os dados adotados para os eventos em questão. 8 Probabilidade: Valor = “prob” Monitorado: Valor = ‘(lambda * tau) / (1 + lambda * tau)’ Erro Humano: Valor = “prob” Testado: Valor = 1 - (1/(lambda * teta)) * (1 - exp. (-lambda * teta)) + (t - teste/teta) + lambda * tau λ = Lambda θ = Teta σ = Tau Figura 3 - Equações Matemáticas Nome Evento B1-Z0150 E FV 52D4014 P FJ TC D4014 E FI 52 D4014 R FD 52 D4014 R FI 5N D4014 R HC 5N D4014 H FI 86 D4014 D FV 86 D4014 P λ 1.75 e-4 --1.8 e-7 7.7 e-8 3.4 e-8 7.3 e-7 --1 e-7 --- σ 1.0 --1.0 2.0 2.0 1.0 --1.0 --- Valores t - teste ------0.5 0.5 0 --0 --- θ --- Prob --- Referência (2) ----26280 26280 4380 --4380 --- 1 e-2 --------1 e-2 --1 e-2 (3) (2) (2) (2) (2) (3) (2) (3) Tabela de Referência Ref 1 = IEEE std 500, 1977 Ref 4 = Rejmond, 1982 Ref 2 = IEEE std 500, 1984 Ref 5 = Eneida, Vol 1, 1991 Ref 3 = Estimativa Rhodia Ref 6 = Histórico Rhodia Figura 4 - Tabela de Dados e Referências 9 3.1.5. - Resultados dos Cálculos Após inclusão de todos os dados de entrada, o software calcula a probabilidade do Eventos Topo, bem como a dos demais eventos. Desta forma é possível saber a contribuição de cada falha para a ocorrência do evento topo e determinar os cortes mínimos de 1ª ordem, ou seja, aqueles eventos que sozinhos, levam a ocorrência do evento topo. Do mesmo modo, pode-se determinar a ordem de todos os cortes da árvore. A figura 5, mostra a probabilidade dos evento e a figura 6 a dos cortes mínimos. FTW - Min Cut Set Upper Bound Eventos Ind Ba 14 A (Topo) B1-Z0150E FV52D4014P FJTCD4014E FI52D4014R FD52D4014R FI5ND4014R HC5ND4014H FI86D4014D FV86D4014P Probabilidade 6,399 e-4 1,75 e-5 1,01 e-2 3,60 e-7 1,03 e-3 4,66 e-4 1,59 e-3 1,0 e-2 2,18 e-4 1,0 e-2 Figura 5 - Tabela Resultado Probabilidade dos Eventos Topo e Outros Probabilidade 3.039E-04 5.700E-05 5.262E-05 5.262E-05 1.900E-05 1.754E-05 1.754E-05 1.710E-05 1.754E-06 1.754E-06 1.754E-06 Import. 47.49% 8.91% 8.22% 8.22% 2.97% 2.74% 2.74% 2.67% 0.27% 0.27% 0.27 Ord 1 1 1 1 1 1 1 1 2 2 Corte I2__T1014M FGL12CPFLE C1__Z0149E CC__Z0148E IE52D4016M C2__Z0149E C3__Z0149E NEL1__CPFLE B1__Z0148E FV52D4016P B1__Z0148E FV86D4016P B2__Z0148E FV52D4016P Figura 6 - Tabela Resultado Probabilidade dos Cortes Mínimos 10 4 - Análise dos Resultados No estudo em questão foram identificados e quantificados 284 eventos de falha distribuídos conforme mostra na figura 7. Cl assif i cação Even t os T o t al dos Even t os = 2 8 4 120 100 80 60 40 20 0 Monit or ados T est ados Er r o Hum ano Pr obabilidade Modo Com um Eventos Figura 7 -Classificação dos Eventos A indisponibilidade calculada para o seguimento de barra SEG 4216 foi de 5.6 horas / ano, distribuídas conforme mostrado na figura 8 (a, b, c). 11 I n di sp o n i bi l i da de SEG-4 2 1 6 Curto Circuito 25,8% M anutenção 50,4% Falha CPFL 13,4% Outros 7,3% Erro Humano 3,0% Figura 8 a - Indisponibilidade SEG 4216 Fr equ ên ci a Ev en t o s SEG-4 2 1 6 Manutenção 0,33% Curto Circuito 0,46% Erro Humano 0,63% Falha CPFL 0,3% Outros 0,18% Figura 8 b - Frequência Evento Indisponibilidade SEG 4216 Co r t es M í n i m o s Pr i m ei r a O r dem Outros 50,6% Erro Humano 49,4% Outro s 0,6% Operaç ã o 42,1% M anute nç ão 57,3% 12 Figura 8 c - Cortes Mínimos - Primeira Ordem Para cada um dos fatores que contribuem para a indisponibilidade total, é possível separar e analisar quais são os tipos de eventos que o compõem. As figuras 9 a e b mostram a decomposição do fator Erro Humano e Curto-Circuito respectivamente. I n di sp o n i bi l i da de - Er r o H u m a n o SEG-4 2 1 6 Falha CPFL 13,4% Curto-Circuito 25,8% Out ros 7,3% Erro Humano 3,0% Outros 0,6% Operação 42,1% Manutenção 57,3% Manutenção 50,4% Figura 9 a - Indisponibilidade devido Erro Humano Manutenção 50,4% I n di sp o n i bi l i da de - Cu r t o Ci r cu i t o SEG-4 2 1 6 Curt o-Circuit o 25,8% Linha 66 KV 9,0% Outros 6,3% Cabo B Z-0149 52,8% Cabo B z-0148 31,9% Out ros 7,3% Falha CPFL 13,4% Erro Humano 3,0% Figura 9 b- Indisponibilidade devido Curto Circuito 13 Este mesmo detalhamento pode ser feito para todos os demais fatores que contribuem para a indisponibilidade, sendo possível detalhar por exemplo, quais são os eventos de operação e manutenção que mais contribuem. 4.1 - Produto do Estudo A análise detalhada deste estudo permitiu ganhos importantes tais como: Equalização dos conhecimentos técnicos à respeito do sistema elétrico analisado para a equipe de manutenção, operação e projeto. Implantação de melhorias nos Procedimentos de Operação e Manutenção. Modificação no lay-out de vários equipamentos, desde chaves de comando em painéis de controle até alterações em equipamentos e instalações à nível de subestação (Projeto Paralelismo). Alteração nas políticas de manutenção Preditiva, Preventiva e Corretiva do sistema, envolvendo política de testes e procedimentos nas intervenções de manutenção. Valorização do trabalho em grupo e utilização de técnicas estruturadas para identificação, análise e solução de problemas. 4.2 - Comparação entre Valores de Indisponibilidade Esperados e Reais de 1993 à 1996 Após a realização deste estudo em 1993, foi elaborado um plano de melhoria para reduzir o valor de indisponibilidade calculada. Essas melhorias foram realizadas em etapas, pois muitas delas exigiam investimentos financeiros que por uma decisão da empresa foram escalonados em alguns anos. Apesar disso, uma série de ações foram realizadas à curto prazo, principalmente aquelas relativas à procedimentos de manutenção e de operação do sistema. Como resultado dessas ações a indisponibilidade desse sistema, tem sido menor que a esperada, conforme mostrado na figura 10. 14 I n di spon i bi li dade H or as SEG-4 2 1 6 20 15 10 5 0 93 94 95 96 Nº Horas Figura 10 - Indisponibilidade Horas - SEG-4216 5 - Conclusão A aplicação da metodologia FTA nos permitiu analisar em detalhes o sistema elétrico estudado, identificando e quantificando as falhas possíveis e para cada uma delas, definindo ações que pudessem diminuir o probabilidade de ocorrência e minimizar as suas conseqüências. Foi possível perceber a importância e a dificuldade na obtenção de dados de falha que fossem representativos para o sistema em questão, apesar da existência de bancos de dados internacionais e específicos da empresa. Um fato que chamou a atenção durante os trabalhos foi a quantidade de erros humanos identificados, tanto em relação à operação quanto à manutenção (Figura 8b). Isso foi importante pois, apesar da indisponibilidade gerada em cada evento ser relativamente pequena (normalmente o tempo de reparo é rápido), a frequência com que estes eventos podem ocorrer é muito elevada. Em contra partida, a maioria destas falhas podem ser facilmente reduzidas ou eliminadas com a utilização de procedimentos, treinamentos mais adequados e interfaces homem-máquinas mais eficientes. Verificamos também a importância do trabalho em grupo e do uso de metodologias estruturadas para identificação e solução de problemas. É surpreendente como o grupo consegue encontrar soluções quando o mesmo passa a se utilizar destas ferramentas. 15 Finalmente podemos concluir que o FTA é realmente uma ferramenta de grande utilidade no sentido de permitir com que as equipes de manutenção, projeto e operação estejam mais preparadas para atingir os desafios atuais em relação à confiabilidade e a disponibilidade de sistemas e equipamentos. 6 - Referência Bibliografica Manual FTW IEEE Std 500 - 1977 IEEE Std 500- 1984 Rijmond, 1982 Eireida, Vol 1, October 1991 Apostila Curso de Confiabilidade Dados Históricos de Falhas e Tempo de Reparo de Equipamentos da UQP 16