U NIVERSIDADE F EDERAL DO R IO G RANDE DO N ORTE C ENTRO DE T ECNOLOGIA P ROGRAMA DE P ÓS -G RADUAÇÃO EM E NGENHARIA E LÉTRICA E UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE DE C OMPUTAÇÃO Probabilidades Imprecisas: Intervalar, Fuzzy e Fuzzy Intuicionista Claudilene Gomes da Costa Natal, RN, Agosto de 2012 Divisão de Serviços Técnicos Catalogação da publicação na fonte. UFRN / Biblioteca Central Zila Mamede Costa, Claudilene Gomes da. Probabilidades imprecisas: intervalar, fuzzy e fuzzy intuicionista / Claudilene Gomes da Costa. - Natal, RN, 2012. 144 f. Orientador: Bejamín René Callejas Bedregal Co-orientador: Adrião Duarte Dória Neto Tese (Doutorado) – Universidade Federal do Rio Grande do Norte. Centro de Tecnologia. Programa de Pós-Graduação em Engenharia Elétrica e de Computação. 1. Probabilidade intervalar - Tese. 2. Número fuzzy - Tese. 3. Probabilidade fuzzy - Tese. 4. Número fuzzy intuicionista - Tese. 5. Probabilidade fuzzy intuicionista. 6. Cadeias de Markov - Tese. I. Bedregal, Bejamín René Callejas. II. Dória Neto, Adrião Duarte. III. Universidade Federal do Rio Grande do Norte. IV. Título RN/UF/BCZM CDU 510.6 Probabilidades Imprecisas: Intervalar, Fuzzy e Fuzzy Intuicionista Claudilene Gomes da Costa Tese de Doutorado aprovada em 20 de agosto de 2012 pela banca examinadora composta pelos seguintes membros: Prof. Dr. Benjamín René Callejas Bedregal (orientador) . . . . . . DIMAP/UFRN Prof. Dr. Adrião Duarte Dória Neto (co-orientador) . . . . . . . . . . . . . DCA/UFRN Prof. Dr. Ronei Marcos de Morais (examinador) . . . . . . . . . . . . . . . . . . . . . UFPB Prof. Dra. Graçaliz Pereira Dimuro (examinador) . . . . . . . . . . . . . . . . . . . . FURG O trabalho não é tanto ver aquilo que ninguém viu, mas sim pensar o que ninguém ainda pensou sobre aquilo que todo mundo vê. Agradecimentos A Deus, pelo dom da vida. Ao professor Benjamín, pela orientação, amizade, dedicação, companheirismo, acolhimento e atenção constante desde antes do ínicio do doutorado até o término, sempre muito prestativo e cheio de grandes idéias e com certeza esse trabalho não seria o mesmo sem suas contribuições. Ao professor Adrião, pela orientação, acessibilidade e principalmente por ter sido a inspiração do tema desse trabalho. A Roberto, por toda a sua dedicação, companheirismo, apoio nos momentos difícies e pela contribuição com sua vasta experiência matemática no desenvolvimento desta tese. A meu amigo João Agnaldo, por sua grande ajuda que me incentivou e colaborou com sua experiência estatística na disciplina de Processos Estocásticos. A Fabiana, que me ajudou desde do primeiro dia de aula até o último dia, com a sua ternura, paciência e amizade em assistir minhas apresentações nas defesas de qualificação e da tese. Aos meus pais, por cuidarem e amarem meus filhos enquanto estudava, viajava e trabalhava. As minhas irmãs, a Ivanosca e a Edilane (assistente) pela força, apoio e cumplicidade. Aos meus amigos, Péricles e Náthalee que tornaram minha vida durante esta jornada muito mais leve e feliz, estando sempre ao meu lado. Aos meus amigos do Laboratório de Sistemas Inteligentes, Fabiana, Náthalee, Anthony, Heliana, Carlos Alberto, João Paulo, Keyle, André, Nayan, Robinson, Mademerson, pela ajuda e amizade. Resumo A idéia de considerar imprecisão em probabilidades é antiga, remontando aos trabalhos de George Booles, que em 1854 pretendia conciliar a lógica clássica, que permite modelar ignorância completa, com probabilidades. Em 1921, John Maynard Keynes em seu livro fez uso explícito de intervalos para representar a imprecisão nas probabilidades. Porém, apenas a partir dos trabalhos de Walley em 1991 que foram estabelecidos princípios que deveriam ser respeitados por uma teoria de probabilidades que lide com imprecisões. Com o surgimento da teoria dos conjuntos fuzzy em 1965 por Lotfi Zadeh, surge uma outra forma de lidar com incertezas e imprecisões de conceitos. Rapidamente, começaram a se propor diversas formas de considerar as idéias de Zadeh em probabilidades, para lidar com imprecisões, seja nos eventos associados às probabilidades como aos valores das probabilidades. Em particular, James Buckley, a partir de 2003 começa a desenvolver uma teoria de probabilidade fuzzy em que os valores das probabilidades sejam números fuzzy. Esta probabilidade fuzzy segue princípios análogos ao das probabilidades imprecisas de Walley. Por outro lado, usar como graus de verdade números reais entre 0 e 1, como proposto originalmente por Zadeh, tem o inconveniente de usar valores muito precisos para lidar com incertezas (como alguém pode diferenciar de forma justa que um elemento satisfaz uma propriedade com um grau 0.423 de algo que satisfaz com grau 0.424?). Isto motivou o surgimento de diversas extensões da teoria dos conjuntos fuzzy pelo fato de incorporar algum tipo de imprecisão. Neste trabalho é considerada a extensão proposta por Krassimir Atanassov em 1983, que adicionou um grau extra de incerteza para modelar a hesitação ao momento de se atribuir o grau de pertinência, e portanto, um valor indicaria o grau com o qual o objeto pertence ao conjunto, enquanto o outro, o grau com o qual não pertence. Na teoria dos conjuntos fuzzy de Zadeh, esse grau de não-pertinência por defeito é o complemento do grau de pertinência. Assim, nessa abordagem o grau de não-pertinência é de alguma forma independente do grau de pertinência, e nessa diferencia entre essa não-pertinência e o complemento do grau de pertinência revela a hesitação presente ao momento de se atribuir o grau de pertinência. Esta nova extensão hoje em dia é chamada de teoria dos conjuntos fuzzy intuicionistas de Atanassov. Vale salientar, que o termo intuicionista aqui não tem relação com o termo intuicionista como conhecido no contexto de lógica intuicionista. Neste trabalho será desenvolvida duas propostas de probabilidade intervalar: a probabilidade intervalar restrita e a probabilidade intervalar irrestrita; também serão introduzidas duas noções de probabilidade fuzzy: a probabilidade fuzzy restrita e a probabilidade fuzzy irrestrita e por fim serão introduzidas duas noções de probabilidade fuzzy intuicionista: a probabilidade fuzzy intuicionista restrita e a probabilidade fuzzy intuicionista irrestrita. Palavras-chave: Probabilidade intervalar, número fuzzy, probabilidade fuzzy, número fuzzy intuicionista, probabilidade fuzzy intuicionista, cadeias de Markov. Abstract The idea of considering imprecision in probabilities is old, beginning with the Booles George work, who in 1854 wanted to reconcile the classical logic, which allows the modeling of complete ignorance, with probabilities. In 1921, John Maynard Keynes in his book made explicit use of intervals to represent the imprecision in probabilities. But only from the work of Walley in 1991 that were established principles that should be respected by a probability theory that deals with inaccuracies. With the emergence of the theory of fuzzy sets by Lotfi Zadeh in 1965, there is another way of dealing with uncertainty and imprecision of concepts. Quickly, they began to propose several ways to consider the ideas of Zadeh in probabilities, to deal with inaccuracies, either in the events associated with the probabilities or in the values of probabilities. In particular, James Buckley, from 2003 begins to develop a probability theory in which the fuzzy values of the probabilities are fuzzy numbers. This fuzzy probability, follows analogous principles to Walley imprecise probabilities. On the other hand, the uses of real numbers between 0 and 1 as truth degrees, as originally proposed by Zadeh, has the drawback to use very precise values for dealing with uncertainties (as one can distinguish a fairly element satisfies a property with a 0.423 level of something that meets with grade 0.424?). This motivated the development of several extensions of fuzzy set theory which includes some kind of inaccuracy. This work consider the Krassimir Atanassov extension proposed in 1983, which add an extra degree of uncertainty to model the moment of hesitation to assign the membership degree, and therefore a value indicate the degree to which the object belongs to the set while the other, the degree to which it not belongs to the set. In the Zadeh fuzzy set theory, this non membership degree is, by default, the complement of the membership degree. Thus, in this approach the non-membership degree is somehow independent of the membership degree, and this difference between the non-membership degree and the complement of the membership degree reveals the hesitation at the moment to assign a membership degree. This new extension today is called of Atanassov’s intuitionistic fuzzy sets theory. It is worth noting that the term intuitionistic here has no relation to the term intuitionistic as known in the context of intuitionistic logic. In this work, will be developed two proposals for interval probability: the restricted interval probability and the unrestricted interval probability, are also introduced two notions of fuzzy probability: the constrained fuzzy probability and the unconstrained fuzzy probability and will eventually be introduced two notions of intuitionistic fuzzy probability: the restricted intuitionistic fuzzy probability and the unrestricted intuitionistic fuzzy probability Index terms: Interval probability, fuzzy number, fuzzy probability, intuitionistic fuzzy logic, intuitionistic fuzzy number, Intuitionistic fuzzy probability, Markov chains. Sumário Sumário i Lista de Figuras iv Lista de Símbolos e Abreviaturas v 1 2 3 Introdução 1.1 Motivação . . . . . . 1.2 Justificativa . . . . . 1.3 Objetivos . . . . . . 1.4 Estado da Arte . . . . 1.5 Organização do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teoria Intervalar 2.1 Considerações Iniciais . . . . . . . 2.2 Aritmética Intervalar . . . . . . . . 2.3 Métrica sobre IR . . . . . . . . . . 2.4 Sequências e Limites de Intervalos . 2.5 Relações de Ordem sobre Intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 4 5 5 16 . . . . . 18 18 19 21 22 23 Teoria de Probabilidade Intervalar 3.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Axiomática da Probabilidade Intervalar . . . . . . . . . . . . . . . . . . 3.3 Probabilidade Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Probabilidade Intervalar Restrita . . . . . . . . . . . . . . . . . . 3.3.2 Probabilidade Intervalar . . . . . . . . . . . . . . . . . . . . . . 3.4 Caso de Estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Um modelo para calcular a probabilidade imprecisa para previsão em um jogo de futebol . . . . . . . . . . . . . . . . . . . . . . . i 25 25 25 27 27 32 36 38 3.4.2 3.5 3.6 4 5 6 Um exemplo considerando a atual classificação sul-americana para copa do mundo de 2014-FIFA . . . . . . . . . . . . . . . . . . . Probabilidade Condicional Intervalar . . . . . . . . . . . . . . . . . . . . Cadeias de Markov Intervalares . . . . . . . . . . . . . . . . . . . . . . . 3.6.1 Cadeias de Markov Intervalares finitas com tempo discreto . . . . Teoria Fuzzy 4.1 Considerações Iniciais . . . . . . . . . . . . . . . . . 4.2 Conjuntos Fuzzy . . . . . . . . . . . . . . . . . . . . 4.2.1 Operações Conjuntistas sobre conjuntos Fuzzy 4.3 Números Fuzzy . . . . . . . . . . . . . . . . . . . . . 4.3.1 Números Fuzzy Triangulares e Trapezoidais . . 4.3.2 Operações Aritméticas de Números Fuzzy . . . 4.3.3 Métrica sobre N . . . . . . . . . . . . . . . . 4.3.4 Sequências e Limites de Números Fuzzy . . . 4.3.5 Relações de Ordem entre Números Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teoria de Probabilidade Fuzzy 5.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . 5.2 Axiomática da Probabilidade Fuzzy . . . . . . . . . . . . . 5.3 Probabilidade Fuzzy . . . . . . . . . . . . . . . . . . . . . 5.3.1 Probabilidade Fuzzy Restrita . . . . . . . . . . . . . 5.3.2 Probabilidade Fuzzy . . . . . . . . . . . . . . . . . 5.4 Probabilidade Condicional Fuzzy . . . . . . . . . . . . . . . 5.5 Cadeias de Markov Fuzzy . . . . . . . . . . . . . . . . . . . 5.5.1 Cadeias de Markov Fuzzy finitas com tempo discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teoria Fuzzy Intuicionista 6.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . . . 6.2 Conjuntos Fuzzy Intuicionistas . . . . . . . . . . . . . . . . . . 6.3 Operações sobre Conjuntos Fuzzy Intuicionistas . . . . . . . . . 6.4 Números Fuzzy Intuicionistas . . . . . . . . . . . . . . . . . . 6.4.1 Operações Aritméticas de Números Fuzzy Intuicionistas 6.4.2 Métrica sobre N I . . . . . . . . . . . . . . . . . . . . 6.4.3 Sequências e Limites de Números Fuzzy Intuicionistas . 6.4.4 Relações de Ordem entre Números Fuzzy Intuicionistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 43 48 49 . . . . . . . . . 57 57 59 62 67 68 69 72 72 73 . . . . . . . . 76 76 77 78 78 81 85 89 89 . . . . . . . . 96 96 97 101 104 105 106 106 108 7 Teoria de Probabilidade Fuzzy Intuicionista 110 7.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 7.2 Axiomática da Probabilidade Fuzzy Intuicionista . . . . . . . . . . . . . 110 7.3 Probabilidade Fuzzy Intuicionista . . . . . . . . . . . . . . . . . . . . . 112 7.3.1 Probabilidade Fuzzy Intuicionista Restrita . . . . . . . . . . . . . 112 7.3.2 Probabilidade Fuzzy Intuicionista . . . . . . . . . . . . . . . . . 115 7.4 Probabilidade Condicional Fuzzy Intuicionista . . . . . . . . . . . . . . . 118 7.5 Cadeias de Markov Fuzzy Intuicionistas . . . . . . . . . . . . . . . . . . 122 7.5.1 Cadeias de Markov Fuzzy Intuicionistas finitas com tempo discreto 122 8 Conclusão 129 8.1 Artigos Publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 8.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 Referências bibliográficas 133 Lista de Figuras 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 Exemplo de Conjunto Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . Conjunto Fuzzy Convexo . . . . . . . . . . . . . . . . . . . . . . . . . . Conjunto Fuzzy Convexo µA (t) ≥ µA (r) . . . . . . . . . . . . . . . . . . Conjunto Fuzzy Não-Convexo . . . . . . . . . . . . . . . . . . . . . . . Função de Pertinência que representam os conceitos de um jovem, meiaidade e idosos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Função de Pertinência que representa o complemento do conjunto fuzzy A1 Função de Pertinência que representa o complemento do conjunto fuzzy A3 A2 = A1 ∩ A3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Número Fuzzy Trapezoidal . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Número Fuzzy Intuicionista Triangular . . . . . . . . . . . . . . . . . . . 100 iv 60 61 62 62 64 64 65 65 69 Lista de Símbolos e Abreviaturas IR: Conjunto dos intervalos de números reais IR+ : Conjunto dos intervalos de números reais positivos R: Conjunto dos números reais. N: Conjunto dos números naturais. Z: Conjunto dos números inteiros. µA (x): Função de pertinência de um elemento x. A : subconjunto fuzzy de universo µA . ≤K : Ordem de Kulisch-Miranker. ≤M : Ordem de Moore. Aα : α-nível de um conjunto fuzzy A . NF: Número fuzzy S(A ): Suporte de um conjunto fuzzy A . N(A ): Núcleo de um conjunto fuzzy A . Rn : Espaço Euclideano n-dimensional. zT : Conjunto dos números fuzzy trapezoidais. XAα (x): Função característica do conjunto crisp Aα . CFVI: Conjunto fuzzy com valor intervalar. P(A): Probabilidade intervalar. CFI: Conjunto fuzzy intuicionista. FI(X): Conjunto de todos os conjuntos fuzzy intuicionistas de universo X. N : Conjunto de todos os NFI estritamente positivos. NFI: Número fuzzy intuicionista. νA : Função de hesitação de um elemento x. 0L∗ : Topo. 1L∗ : Bottom. ≤L∗ : Ordem de L∗ -valorados. P: Função de Probabilidade Fuzzy. pi, j : Probabilidades de transição fuzzy. PFR: Probabilidade fuzzy restrita. v PI: Probabilidade intervalar. PIR: Probabilidade intervalar restrita. PF: Probabilidade fuzzy. PFI: Probabilidade fuzzy intuicionista. PFIR: Probabilidade fuzzy intuicionista restrita. FPFI: Função de probabilidade fuzzy intuicionista. PTFI: Probabilidade de transição fuzzy intuicionista. CMFI: Cadeias de Markov fuzzy intuicionista. NFITA: Número fuzzy intuicionsta triangular de Atanassov. Capítulo 1 Introdução 1.1 Motivação A teoria da probabilidade clássica fornece um modelo matemático para o estudo de incertezas de natureza aleatória, também chamados de conhecimentos incertos que, mesmo que produzidos de forma idêntica, apresentam a cada experiência, resultados que variam imprevisivelmente. No entanto, a probabilidade clássica não é capaz de modelar incertezas devidas à incompletude do conhecimento ou incertezas produzidas pelo conhecimento vago ou impreciso. Na probabilidade clássica todos os eventos aleatórios devem ser definidos com precisão, o que infelizmente não acontece em geral, pelo fato que essa hipótese parece ser bastante rigída em muitas situações práticas da nossa vida cotidiana. Como por exemplo, muitas vezes pode ocorrer situações em que é preciso lidar com a imprecisão, tais como: "a temperatura de amanhã", "ceú nublado", "dia bonito", "salário alto", etc. Para a teoria da probabilidade clássica estas expressões estão mal definidas e elas necessitam de uma outra teoria. Assim, para lidar com esses tipos de situações Loft Zadeh em 1965 [158] introduziu o conceito de conjunto fuzzy, cuja principal característica era a de considerar um grau de crença para indicar o quanto um especialista acredita que um elemento pertence a um determinado conjunto. Para tal fim, usa como possíveis graus de crenças números reais no intervalo [0, 1]. Desta forma, a lógica fuzzy, a sua lógica subjacente, torna-se uma ferramenta importante para lidar com a incerteza do conhecimento e para representar a incerteza do raciocínio humano. É através do reconhecimento da existência destes diferentes tipos de incertezas que têm-se desenvolvido diversos modelos matemáticos capazes de lidar com mais de um tipo de incerteza ao mesmo tempo e que de forma geral denominam-se probabilidades imprecisas. Para Walley [149] a probabilidade imprecisa é usada mais como um termo 1 Capítulo 1. Introdução genérico que cobre todos os modelos matemáticos que medem a possibilidade ou a incerteza sem probabilidades numéricas refinadas. Os julgamentos, na maior parte das vezes, são qualitativos e é comum utilizar expressões como: "eu acho que", "é provável que", etc.. A imprecisão ocorre quando o especialista está para armar uma probabilidade superior e inferior sobre algum evento. Para Smithson [138] os estudos do julgamento humano sobre a incerteza têm uma história que é quase contemporânea com as teorias das probabilidades. Ainda de acordo com Smithson [138] o uso da probabilidade para descrever estados cognitivos ou julgamentos subjetivos tem provocado muitos debates, além do desenvolvimento de teorias e da realização de pesquisas empíricas. Exemplos de probabilidades imprecisas são: a probabilidade intervalar como Yager [154], Zhang, Jia e Jiang [162], Tanaka e Sugihara [144], Weichelberger [152], Sarveswaran, Smith e Blockey [133], Campos, Dimuro, Costa e Araújo [29], Intan [71] entre outros; e a probabilidade fuzzy como Zadeh [161], Buckley [20, 21], Dunyak, Saad e Wunsch [50], Rentería [126], entre outros. A probabilidade intervalar tem diversas aplicações como tomada de decisão [155], corrosão de estruturas metálicas [133], e a probablidade fuzzy tem aplicações nas áreas de estimação de futuras mudanças climáticas [87], avaliação de risco da água potável [33], sistema de reabilitação [50], classificação de grupo sanguíneo, teste de HIV, daltonismo, modelo de decisão, pesquisas políticas [20]. Neste trabalho, serão introduzidas duas novas noções de probabilidades intervalares e fuzzy, que satisfazem os princípios da probabilidade imprecisa. Uma das probabilidades intervalares introduzidas é ótima no sentido de [65, 132], porém tem como desvantagem que além de ser um pouco mais complexa de se calcular que a outra, ela impõe uma restrição às probabilidades intervalares associada a cada elemento do espaço de amostras e por isso foi denominada de probabilidade intervalar restrita. A segunda probabilidade intervalar, embora seja correta no sentido de [65, 132], não é ótima, porém tem como vantagem que as probabilidades intervalares associadas a cada amostra podem ser independentes entre si, ou seja, não impõe qualquer restrição. A abordagem aqui utilizada para as duas probabilidades fuzzy é a mesma utilizada por Buckley em [20], ou seja, elas são obtidas a partir de seus α-níveis, que no caso são intervalos. Assim, uma das probabilidades fuzzy introduzidas nesta tese é determinada pela probabilidade intervalar irrestrita enquanto a outra é determinada pela outra probabilidade intervalar. Vale salientar que, a probabilidade fuzzy baseada na probabilidade intervalar irrestrita é sutilmente diferente a do Buckley, pois no caso dele, devido à ordem considerada entre números fuzzy, admite probabilidades fuzzy que tenha como α-nível um intervalo cujo extremo inferior seja um número negativo enquanto em ambas probabilidades fuzzy introduzidas 2 Capítulo 1. Introdução aqui, sempre os α-níveis serão intervalos não-negativos, ou seja, onde o extremo inferior é um número maior que zero. Outro aspecto que diferencia a probabilidade fuzzy restrita da do Buckley, é a ordem considerada. Por exemplo, em [20, página 32] fica evidente que a probabilidade de Buckley não atende os axiomas de probabilidade intervalar do Walley [148]. Após diversas pesquisas realizadas sobre possíveis extensões da noção de conjunto fuzzy, surgiu uma extensão que tem chamado a atenção de muitas pesquisas nas últimas décadas é a teoria dos conjuntos fuzzy intuicionistas (CFI) introduzida por Krassimir Atanassov em 1983 [5]. Este fato ocorre, principalmente, devido ao fato de CFI serem coerentes com o comportamento humano. Os CFI consideram um grau extra para os conjuntos fuzzy no intuito de modelar a hesitação e incerteza ao momento de se atribuir o grau de pertinência ao conjunto. Este segundo grau representa o quanto o especialista acredita que o elemento não pertence ao conjunto. Na teoria dos conjuntos fuzzy o grau de não-pertinência de um elemento do universo é implicitamente definido como o complemento do grau de pertinência, ou seja, um menos o grau de pertinência e, portanto, é fixo. Em teoria dos CFI o grau de não-pertinência é de alguma forma independente do grau de pertinência e sua distância ao complemento deste expressa a hesitação no grau de pertinência. Também será introduzido nesta tese um novo tipo de imprecisão nas probabilidades imprecisas, a saber, a probabilidade fuzzy intuicionista, a qual considera números fuzzy intuicionistas para representar ao mesmo tempo imprecisão, incerteza e hesitação que pode-se ter ao momento de determinar a probabilidade de algum evento. As duas probabilidades fuzzy intuicionistas introduzidas nesta tese, são derivadas das probabilidades intervalares introduzidas também nesta tese. Uma outra forma de ver esta probabilidade fuzzy intuicionista, é quando precisa-se lidar com eventos que tem uma certa probabilidade de acontecer e outra de não acontecer, onde a soma de ambas probabilidades não necessariamente é 1, e onde há uma incerteza e imprecisão em cada uma dessas duas probabilidades associadas ao evento a qual pode ser modelada através de números fuzzy. O uso da teoria dos conjuntos fuzzy intuicionistas em probabilidades não é novo, porém todos os trabalhos anteriores a utilizam para tratar com eventos que são inerentemente fuzzy e onde ocorra hesitação na hora de definir o grau de incerteza da ocorrência do evento (veja por exemplo [138, 59, 53]). Estes tipos de eventos são chamados de eventos fuzzy intuicionistas. Portanto, a abordagem utilizada nesta tese é substancialmente diferente, pois considera eventos crisp e números fuzzy intuicionistas para modelar a probabilidade e não probabilidade de um evento acontecer, ou a hesitação ao momento de se determinar o número fuzzy que representa a probabilidade do evento. 3 Capítulo 1. Introdução 1.2 Justificativa A teoria da probabilidade clássica tem se mostrado uma ferramenta poderosa para modelar conhecimentos de natureza aleatória. Por exemplo, tem sido capaz de lidar com eventos incertos tais como "a temperatura do ar amanhã". Assumindo que, pela disponibilidade de alguns dados do passado, pode-se tornar possível calcular a probabilidade de, por exemplo, a temperatura do ar estar entre 20oC e 25oC. Note que, na teoria de probabilidade clássica, os eventos tiveram de ser definidos com precisão. Porém, em muitas situações práticas existem imprecisões no valor probabilístico de um evento, especialmente quando há pouca informação a disposição para evaluar a probabilidade; ou quando a informação disponível não é suficientemente específica; ou quando existem situações de conflito devido à existência de várias fontes de informação. A probabilidade clássica não consegue lidar de forma adequada nestas situações. Este fato motivou alguns pesquisadores a considerar valores de probabilidades diferentes ao usual (valores entre 0 e 1), como por exemplo: valores intervalares [28], intervalos generalizados [150] e números fuzzy [20]. Em 1991, Peter Walley [148] introduz o conceito de probabilidades imprecisas, como uma tentativa de estabelecer critérios que unifiquem essas diversas teorias de probabilidades que incorporam incertezas nos valores das probabilidades. Estes critérios, por serem gerais, admitem diversas teorias específicas e não equivalentes de probabilidades imprecisas para as mesmas classes de valores, por exemplo, a definição de probabilidade intervalar em [71] e [144] satisfazem os critérios de probabilidades imprecisas do Walley e mais especificamente os axiomas de probabilidade intervalar do Walley [148], mas são diferentes. A comunidade de probabilidades imprecisas (http:www.sipta.org) não só admite esta pluralidade de propostas como a incentiva. Isto justifica que se introduzam novas probabilidades imprecisas, que possam trazer a tona, novos aspectos, propriedades e abrangência das probabilidades imprecisas. Aqui não apenas serão introduzidas novas teorias de probabilidades imprecisas valoradas em espaços já considerados pela comunidade (no caso intervalar e fuzzy) como também será apresentado um novo tipo de imprecisão para as probabilidades (probabilidades fuzzy intuicionista) e portanto um novo espaço de valoração, além de duas teorias específicas para as probabilidades fuzzy intuicionistas. 4 Capítulo 1. Introdução 1.3 Objetivos • Apresentar duas propostas para cada tipo de probabilidade imprecisa: a intervalar, a intervalar restrita, a fuzzy, a fuzzy restrita, a fuzzy intuicionista e a fuzzy intuicionista restrita. Como também definir a probabilidade condicional e provar a versão do Teorema de Bayes em cada uma dessas teorias. • Desenvolver a teoria de cadeias de Markov baseada em cada uma destas probabilidades aqui introduzidas, dando ênfase à classificação dos estados e ao estudo do comportamento a longo prazo destas cadeias de Markov. Em outras palavras, será provado o importante Teorema da Convergência dos Estados Estacionários em cada uma dessas probabilidades imprecisas. 1.4 Estado da Arte A teoria dos conjuntos introduzida por Georg Cantor em torno de 1870, baseada na noção de pertinência de elementos a conjuntos provou ser uma das mais poderosas ferramentas da Matemática Moderna que permitiu estudar e modelar o desenvolvimento de outras Ciências. No entanto, esta teoria clássica de conjuntos é muito rigorosa, pois admite duas possibilidades: que um objeto pertença ou que não pertença ao conjunto, ou seja, esta teoria só permite valores "exatos", 0 (não há pertinência) e 1 (há pertinência) e não permite outras possibilidades que, no entanto, têm sido estudados na área de modelos lógicos. Veja o seguinte enigma: Um simples grão de areia pode ser considerado como um monte de areia? Não. Dois grãos de areia podem ser considerados como um monte de areia? Não, etc. A questão é que, se forem acrescentando grãos de areia, em algum momento deve-se admitir a presença do monte de areia, mas o problema é: onde colocar o limite de demarcação?. Esse enigma é conhecido como o "Paradoxo de Sorites"é um dos enigmas (e não propriamente um paradoxo) atribuído ao lógico megárico Eubulides de Mileto. O termo "Sorites"deriva do grego soros e significa "pilha"ou "monte". Pode-se usar este tipo de argumento de forma inversa (chamando-o de "decrescente") e perguntar, por exemplo: se for tirado um grão de um monte de areia, ainda temos um monte? Sim. E se for tirado mais um grão? Igualmente, sim, etc. Assim, poderia tirar todos os grãos de areia, um a um, até que não se tenha mais areia e, mesmo assim, teria um monte de areia. O Paradoxo de Sorites mostra claramente que quando utilizado termos vagos, tais como: "monte", "caro", "bastante pequeno", "careca", etc, juntamente com a lógica clás- 5 Capítulo 1. Introdução sica formal, fatalmente chegam-se a conclusões que vão contra o senso comum. Isto mostra que algo está errado quando manipulados termos vagos a partir do raciocínio lógico formal, a primeira atitude deve ser a de identificar onde realmente encontra-se o problema. Talvez ele esteja na forma de como é usada a lógica clássica nos termos vagos. Contudo, muitos resultados já mostraram que a lógica clássica realmente funciona de forma satisfatória quando aplicada a termos com fronteiras bem definidas, isto é, termos não-vagos. Em 1965, Loft A. Zadeh [158], devido à necessidade de ferramentas mais flexíveis a certos termos linguísticos subjetivos, como "aproximadamante", "em torno de", dentre outros, sugeriu uma teoria para modelar a imprecisão, propondo uma teoria alternativa de conjuntos, onde a passagem da pertinência para a não-pertinência fosse gradual e não abrupta, assim publicou o seu primeiro trabalho sobre conjuntos fuzzy, baseado na lógica multinível. Com este trabalho foi possível obter uma formalização matemática de um conjunto fuzzy, generalizando a teoria convencional dos conjuntos. Mais precisamente, um conjunto fuzzy A de um universo X é o conjunto A = {(x, µA (x)) : x ∈ X} onde µA : X → [0, 1] é a função de pertinência de A e µA (x) é o grau de pertinência que indica o "quanto"um elemento x ∈ X pertence ao conjunto fuzzy A . Após a introdução de Zadeh da teoria dos conjuntos fuzzy, ficou claro desde o início que esta teoria era uma ferramenta extraordinária para representar o conhecimento humano. No entanto, Zadeh estabeleceu em [159] que, por vezes, em processos de tomadas de decisão, o conhecimento é melhor representado por meio de algumas generalizações ou extensões da teoria de conjuntos fuzzy. Existem várias extensões fuzzy na literatura, como por exemplo: teoria dos conjuntos fuzzy intervalarmente valorados (CFIV) ou conjuntos fuzzy do tipo-2, que foi introduzida de forma independente e no mesmo ano por Zadeh [160], Grattan-Guinness [58], Jahn [73] e Sambuc [131]. Isto é, os conjuntos fuzzy tais que o grau de pertinência de cada elemento do conjunto é dado por um subintervalo fechado do intervalo [0, 1]. Assim, não só imprecisão (falta de fronteiras nítidas), mas também, uma característica da incerteza (falta de informação) podem ser tratadas de forma intuitiva. Mais precisamente, um conjunto fuzzy intervalar A de um universo X é o conjunto A = {(x, MA (x)) : x ∈ X} onde MA : X → Int([0, 1]) é a função de pertinência de A dada por MA (x) = [MA (x), MA (x)], onde Int([0, 1]) denota o conjunto de todos os subintervalos fechados do intervalo [0, 1], e 6 Capítulo 1. Introdução onde MA (x) e MA (x) são os extremos inferior e superior do intervalo MA (x), respectivamente. Esta teoria tem sido amplamente estudada e utilizada. Por exemplo, vale a pena destacar os trabalhos de Gorzalczany sobre raciocínio aproximado [56, 57], Sambuc, e Roy e Biswas sobre diagnósticos médicos [131, 128], Turksen sobre lógica multivaloradas [145], Bedregal, Dimuro e Costa sobre Intervalo fuzzy baseado em regras de reconhecimento de gestos de mão [15], Bustince sobre processamento digital de imagem [24], Yager sobre tomada de decisão [156]. Uma outra extensão da teoria de conjuntos fuzzy foi introduzida por Atanassov [5]. Em conjuntos fuzzy, o grau de não-pertinência é dado a priori pelo seu complemento, isto é, como sendo "um menos o grau de pertinência". Entretanto, um ser humano que expressa o grau de pertinência de um elemento num conjunto fuzzy muitas vezes, fruto de sua insegurança ou hesitação, não manifesta o grau de não-pertinência como o seu complemento, isso reflete um fato bem conhecido que a negação lingüística psicológica nem sempre se identifica com a negação lógica. Por esse motivo, Atanassov [5] introduziu o conceito de conjunto fuzzy intuicionista que se caratcteriza por duas funções, uma expressando o grau de pertinência e outra o grau de não-pertinência, respectivamente. Assim, os conjuntos fuzzy intuicionistas são uma generalização natural dos conjuntos fuzzy, e estes são úteis na modelagem de muitas situações da vida real, como por exemplo: processos de negociações [5, 7], tomada de decisões [140, 141, 142], processamento digital de imagens [76], visão computacional [70], reconhecimentos de padrões [163], imagens de células humanas [31], etc. Um conjunto fuzzy intuicionista (CFI) atribui a cada elemento do universo um grau de pertinência, e um grau de não-pertinência que reflete o seu grau de hesitação. Mais precisamente, um conjunto fuzzy intuicionista A de um universo X é o conjunto A = {(x, µA (x), νA (x)) : x ∈ X} onde µA , ν( A ) : X → [0, 1] são as funções de pertinência e não-pertinência de A e são tais que 0 ≤ µA (x) + νA (x) ≤ 1. A função πA (x) = 1 − µA (x) − νA (x) é chamada de índice intuicionista de x em A , e mede o grau de hesitação de quanto x pertence a A , que foi introduzida por Bustince e Burillo [25]. Note que, πA (x) é a distância usual entre νA (x) e o complemento de µA (x). A vantagem de utilizar a teoria dos conjuntos fuzzy intuicionistas em vez da teoria dos conjuntos fuzzy é a habilidade para lidar com diferentes tipos de incertezas que podem surgir dentro do mesmo problema. Às vezes parece ser mais natural descrever impreci7 Capítulo 1. Introdução são e incerteza de opiniões não só pela função de pertinência. Isto é devido ao fato de que em algumas situações é mais fácil descrever sentimentos negativos que as atitudes positivas. Ainda mais, muitas vezes é mais fácil especificar os objetos ou as alternativas daquilo que não se gosta, mas simultaneamente não é possível especificar claramente o que se prefere. Considere uma situação observada numa imobiliária. Muitas vezes, um cliente que procura um apartamento para alugar ou comprar, porém não está totalmente convencido sobre a localização e considera várias opções. É óbvio que alguns bairros tem mais preferência do que outros, assim como também existem bairros que não é do gosto do cliente. Os CFI são muito úteis para a modelagem de situações da vida cotidiana como esta. Por exemplo, pode acontecer que uma pessoa indagada sobre o seu bairro favorito em Natal não pode escolher definitivamente se é Ponta Negra, Petrópolis ou Tirol, mas ele tem certeza de que definitivamente não quer morar no Alecrim. Assim, pode-se empregar um conjunto fuzzy intuicionista para a modelagem das preferências do cliente, onde a função de pertinência mostra o grau que um determinado bairro tenha mais preferência, enquanto a função de não-pertinência indica o grau que uma determinada região não deve ser tomada em consideração. Tem-se uma situação semelhante quando se comparam as preferências expressas por meio de ordenações que admitem a incerteza devido à indefinição, imprecisão e hesitação, ou seja, onde pode-se indicar os objetos que certamente são melhores que outros, que certamente são piores que outros, mas tem-se também objetos que são indiferentes e incomparáveis. Neste caso, os conjuntos fuzzy intuicionistas fornece também ferramentas perfeitas e naturais para a modelagem de tais ordenações. É por esta versatilidade em suas aplicações que a teoria de CFI de Atanassov tem despertado um crescente interesse mundial o que pode ser percebido pelo fato que após quase 30 anos de existência já existem mais de 1000 trabalhos publicados sobre os conjuntos fuzzy intuicionista (uma visão geral pode ser encontrada em [115]). Além disso, há uma revista internacional (Notes on Intuitionistic Fuzzy Sets, ISSN 1310-4926) exclusivamente devotada para esta extensão de lógica fuzzy, desde 1997 uma conferência dedicada à conjuntos fuzzy intuicionistas é anualmente organizada, bem como várias sessões especiais em conferências internacionais, as quais são úteis para verificar a situação da teoria dos conjuntos fuzzy intuicionistas no âmbito das diferentes teorias de modelagem de imprecisão. É importante salientar que Atanassov e Gargov em [6] provam que, desde o ponto de vista matemático, a teoria dos CFIV e a teoria dos CFI são equivalentes. De fato, eles mostram que a função f , que associa a cada CFIV A o CFI B = f (A ) dado por µB (x) = MA (x) e νB (x) = 1 − MA (x), e a função g que associa a cada CFI B o CFIV A = g(B ) 8 Capítulo 1. Introdução dado por MA (x) = [µB (x), 1 − νB (x)], são inversas uma da outra, e portanto as teorias de CFIV e CFI são generalizações equivalentes da noção de conjuntos fuzzy. Este fato não vem desmerecer nenhuma destas teorias e nem os resultados obtidos baseados em alguma destas teorias. De fato, desde o ponto de vista semântico (imprecisão de pertinência versus ponderando/modelando preferências) elas são muito diferentes. Uma coisa é que elas sejam equivalentes do ponto de vista matemático e outra são os conceitos e propriedades matemáticas que elas modelam (suas semânticas) e este último é o que mais importa nas aplicações. O mais importante é que estas duas teorias tem se desenvolvido com diferentes fundamentos e são baseadas em semânticas diferentes e ambas são necessárias para lidar com incertezas em diferentes contextos. As considerações apresentadas são cruciais em eventos onde a imperfeição da informação é uma regra, tais como, tomada de decisões, por exemplo. Existem vários aspectos de imperfeição da informação, dentre eles a incerteza e imprecisão são as mais importantes. A imprecisão pode ser modelada por conjuntos fuzzy intuicionistas e a incerteza é modelada pela teoria de probabilidades. Em 1968, Zadeh [161] também foi o primeiro a definir um evento fuzzy e a estender o conceito de probabilidade clássica para tais eventos, preservando as propriedades básicas da teoria da probabilidade clássica. Em teoria clássica de probabilidades, um evento A é um elemento de uma σ-álgebra F formada por subconjuntos de um espaço amostral X e uma medida de probabilidade P é uma medida normalizada sobre um espaço mensurável (X, F ); ou seja, P é uma função real-valorada que associa a cada evento A em F uma probabilidade, P(A), tal que (a) P(A) ≥ 0 para todo A ∈ F ; (b) P(X) = 1; e (c) P é contavelmente aditiva, ou seja, se {Ai } é uma coleção de eventos disjuntos, então P ∞ [ ! Ai ∞ = ∑ P(Ai ). i=1 i=1 No entanto, um evento fuzzy, no sentido de Zadeh [161], é entendido como um conjunto fuzzy A de universo X, que por simplicidade será suposto como sendo um subconjunto de Rn , cuja função de pertinência µA é uma função mensurável à Borel e cuja probabilidade é dada por Z P(A ) = µA (x)dP. X A existência da integral de Lebesgue-Stieltjes é garantida pela mensurabilidade à Borel de µA . No caso discreto, ou seja, quando o espaço amostral X é um conjunto discreto, 9 Capítulo 1. Introdução seja X = {x1 , . . . , xn }, a probabilidade de um evento fuzzy A ⊆ X é dada por n P(A ) = ∑ P(xi )µA (xi ), i=1 onde P(xi ) é a probabilidade clássica de ocorrência do evento {xi }. Em virtude desta abordagem de Zadeh sobre eventos fuzzy e probabilidade fuzzy, Eulalia Szmidt e Janusz Kacprzyk em [140, 141, 142], no caso em que o universo é discreto, propuseram uma definição de evento fuzzy intuicionista e sua probabilidade. Para Szmidt e Kacprzyk um evento fuzzy intuicionista é entendido como um conjunto fuzzy intuicionista A de um espaço amostral discreto X = {x1 , . . . , xn }, cuja função de pertinência µA e de não-pertinência νA são funções mensuráveis à Borel. Neste caso, o índice de hesitação πA tambem é mensuráveis à Borel. Assim, Szmidt e Kacprzyk definiram a probabilidade de um evento fuzzy intuicionista A como um número P(A ) no intervalo [Pmin (A), Pmax (A)], onde n Pmin (A ) = ∑ P(xi )µA (xi ), i=1 a qual é chamada de probabilidade mínima de A , e onde n Pmax (A ) = Pmin (A ) + ∑ P(xi )πA (xi ), i=1 a qual é chamada de probabilidade máxima de A . A probabilidade mínima Pmin (A ) dá a probabilidade garantida que um evento A ocorrerá. A probabilidade máxima Pmax (A ) dá a maior probabilidade possível que um evento A ocorrerá. Assim, a diferença Pmax (A ) − Pmin (A ) mede a incerteza de ocorrência de um evento A . Note que, quando o evento fuzzy intuicionista considerado se remete a um evento fuzzy ordinário, ou seja, quando a margem de hesitação é nula (πA (x) = 0 para todo x ∈ A ) então a probabilidade deste evento fuzzy intuicionista coincide com a probabilidade dele visto como evento fuzzy. Em outras palavras, a definição proposta por Szmidt e Kacprzyk estende a noção de probabilidadde de eventos fuzzy dada por Zadeh no caso discreto. É importante destacar que, quando P(A ) é considerado como sendo o ponto médio do intervalo [Pmin (A), Pmax (A)], ou seja, quando n P(xi ) 1 [µA (xi ) + 1 − νA (xi )], P(A ) = [Pmin (A) + Pmax (A)] = ∑ 2 i=1 2 10 Capítulo 1. Introdução esta expressão foi proposta por Gerstenkorn e Manko em [53] como uma definição de probabilidade de eventos fuzzy intuicionistas. Estas noções de evento fuzzy intuicionista e sua probabilidade foi estendida para o caso contínuo por Grzegorzewski em [59]. Para Grzegorzewski, um evento fuzzy intuicionista é entendido como um conjunto fuzzy intuicionista A de universo X ⊆ Rn , cuja função de pertinência µA e de não-pertinência νA (e portanto o índice de hesitação) são funções mensuráveis à Borel e cuja probabilidade é um número P(A ) no intervalo Z X Z µA (x)dP, X (1 − νA (x))dP . A probabilidade proposta nos eventos fuzzy intuicionistas encontra-se em um intervalo e quando o evento fuzzy intuitionista torna-se um evento fuzzy (i.e., νA (x) = 1 − µA (x)) o intervalo proposto é degenerado e se reduz a probabilidade de um evento fuzzy definido por Zadeh. Note também que, quando P(A ) é considerado como sendo o ponto médio do R R intervalo [ X µA (x)dP, X (1 − νA (x))dP] , ou seja, quando 1 P(A ) = 2 Z X Z µA (x)dP + X 1 µA (x) + πA (x))dP, 2 X Z (1 − νA (x))dP = ( esta expressão foi proposta por Gerstenkorn e Manko em [53] como uma definição de probabilidade de eventos fuzzy intuicionistas. Até o momento tratou-se de teorias de probabilidades em que os eventos são fuzzy ou fuzzy intuicionistas, porém sua probabilidade é exata, pois é um número no intervalo [0, 1]. Porém, em muitas situações práticas existem imprecisões no valor probabilístico de um evento, especialmente quando há pouca informação a disposição para evaluar a probabilidade; ou quando a informação disponível não é suficientemente específica; ou quando existem situações de conflito devido à existência de várias fontes de informação. É nestas situações, por exemplo, que se faz necessário atribuir a um evento clássico um valor probabilístico impreciso, como por exemplo um valor intervalar (Probabilidade Intervalar); ou um número fuzzy (Probabilidade Fuzzy) ou fuzzy intuicionista (Probabilidade Fuzzy Intuicionista). Estes tipos de probabilidade são chamadas de probabilidades imprecisas por modelarem a incerteza sem probabilidades numéricas exatas. Uma proposta de axiomática para a Probabilidade Intervalar foi apresentada por Walley e Fine em [149, 148], a qual é descrita da seguinte maneira: Seja (Ω, F ) um espaço de probabilidade. Uma probabilidade intervalar é uma função P : F → I([0, 1]), dada por P(A) = [P(A), P(A)], que satisfaz as seguintes propriedades: 11 Capítulo 1. Introdução / = 0 e P(Ω) = 1; Axioma IV: P(0) Axioma V: P(A) = 1 − P(Ac ), para todo A ∈ F , onde Ac = Ω \ A é o complementar de A; Axioma VI: (Super aditividade) Se A ∩ B = 0/ então P(A ∪ B) ≥ P(A) + P(B); Axioma VII: (Sub aditividade) Se A ∩ B = 0/ então P(A ∪ B) ≤ P(A) + P(B). As funções P e P são chamadas de probabilidade inferior e probabilidade superior respectivamente. P é coerente se existir um conjunto não-vazio M de funções de probabilidades clássicas sobre F tal que P(A) = inf{π(A) : π ∈ M }, para todo A ∈ F . Neste caso, pelo Axioma V, necessariamente temos que P(A) = sup{π(A) : π ∈ M }, para todo A ∈ F . / = 0 e P(Ω) = 1. Portanto, se P é coerente, Note que se P é coerente então P(0) / = [0] e P(Ω) = [1], onde [0] e [1] são intervalos degenerados, ou seja, da forma P(0) [a, a], que serão escritos na forma simplificada [a]. P é 2-monótona se satisfaz P(A) + P(B) ≤ P(A ∪ B) + P(A ∩ B). Neste caso, pelo Axioma V, necessariamente temos que P(A) + P(B) ≥ P(A ∪ B) + P(A ∩ B). É possível provar que todas probabilidades inferiores que são 2-monótonas são também coerentes (veja por exemplo [68]Lemma 2.5) Com respeito da probabilidade fuzzy, ou seja, aquela que atribui um número fuzzy como valor de probabilidade a um evento clássico, pode-se dizer que o primeiro trabalho nesta direção foi feito por Buckley em [20]. Buckley considera como espaço amostral um conjunto discreto Ω = {x1 , . . . , xn }, e um conjunto de números fuzzy Fi , i = 1, . . . , n com n a propriedade 0 < Fi < 1 que existam pi ∈ N(Fi ) tais que ∑ pi = 1, onde N(Fi ) é o núcleo i=1 de Fi . 12 Capítulo 1. Introdução Nestas condições, Buckley define a probabilidade fuzzy PFB(A) de um subconjunto A de Ω como sendo o conjunto fuzzy cujos α-níveis PFB(A)α são dados por ( PFB(A)α = ) n ∑ pi : pi ∈ Fi,α ∀i = 1, . . . , n e i∈IA ∑ pi = 1 . i=1 Além disso, Buckley prova que estas probabilidades são semi-aditivas, no sentido que para todo A, B ⊂ Ω PFB(A ∪ B) ≤ PFB(A) + PFB(B) − PFB(A ∩ B). Se A e B são disjuntos, temos que PFB(A ∪ B) ≤ PFB(A) + PFB(B). O problema é que a ordem usada por Buckley permite que PFB(A)α seja um intervalo contendo números negativos. A proposta deste trabalho é o de desenvolver uma teoria de probabilidades imprecisas: probabilidade intervalar (PI), probabilidade fuzzy (PF) e probabilidade fuzzy intuicionista (PFI), ou seja, aquela que atribui um intervalo, um número fuzzy e um número fuzzy intuicionistas, respectivamente, como valor de probabilidade a um evento clássico. A necessidade de se desenvolver uma teoria de probabilidades imprecisas é justificada pelo fato que em muitas situações práticas existe hesitação sobre o valor atribuído à probabilidade de um evento. Nesta teoria de probabilidade intervalar aqui apresentada, números intervalares são usados para representar a medida de probabilidade com o intuito de capturar de forma simples a imprecisão e incompletude da probabilidade. Mais precisamente, será apresentada duas propostas de probabilidade intervalar, uma é denominada de probabilidade intervalar restrita e a outra simplesmente de probabilidade intervalar, as quais são assim definidas: suponha que o espaço amostral Ω é um conjunto discreto, por exemplo, Ω = {x1 , . . . , xn }, assim considere um conjunto de intervalos Li = [ai , bi ], i = 1, . . . , n. Dado um subconjunto A de Ω, defina o conjunto de índices de A por IA = {i ∈ {1, . . . , n} : xi ∈ A}. A probabilidade intervalar de A, denotada por PI(A), é definida por PI(A) = PI(A), PI(A) , onde PI(A) = min ∑ pi i∈IA n : pi ∈ Li , ∀i = 1, . . . , n ∑ pi i=1 13 Capítulo 1. Introdução e PI(A) = max ∑ pi i∈IA n ∑ pi : pi ∈ Li , ∀i = 1, . . . , n i=1 n Se Li = [ai , bi ], i = 1, . . . , n são tais que, para todo i = 1, . . . , n, existam pi ∈ Li tais que ∑ pi = 1. A probabilidade intervalar restrita PB(A) de A é definida por i=1 PB(A) = PIB(A), PIB(A) , onde ( n ∑ pi; pi ∈ Li∀i = 1, . . . , n e ∑ pi = 1 PB(A) = min i∈IA e i=1 ( PB(A) = max ) n ∑ pi; pi ∈ Li∀i = 1, . . . , n e ∑ pi = 1 i∈IA ) . i=1 Além disso, estas probabilidades são super-aditivas e sub-aditivas respectivamente, no sentido que para todo A, B ⊂ Ω PI(A) + PI(B) ≤ PI(A ∪ B) + PI(A ∩ B); PI(A) + PI(B) ≥ PI(A ∪ B) + PI(A ∩ B) e PB(A) + PB(B) ≤ PB(A ∪ B) + PB(A ∩ B); PB(A) + PB(B) ≥ PB(A ∪ B) + PB(A ∩ B). Inicialmente será proposto como definição de probabilidade fuzzy uma extensão natural da proposta restrita, acima mencionada, sobre probabilidade fuzzy. Neste trabalho será proposto a seguinte definição de PF para eventos discretos. Considere como espaço amostral um conjunto discreto Ω = {x1 , . . . , xn }, e um conjunto de números fuzzy Fi , i = 1, . . . , n. Nestas condições, será definida a probabilidade fuzzy PF(A) de um subconjunto A de Ω como sendo o conjunto fuzzy cujos α-níveis PF(A)α são dados por: 14 Capítulo 1. Introdução PF(A)α = ∑ pi i∈IA n ∑ pi i=1 : pi ∈ Fi,α , ∀i = 1, . . . , n . Neste trabalho será provado que tanto PF(A) como PFB(A) são de fato um números fuzzy e que estas probabilidades são semi-aditivas, no sentido que para todo A, B ⊂ Ω PF(A ∪ B) ≤ PF(A) + PF(B) − PF(A ∩ B) e PFB(A ∪ B) ≤ PFB(A) + PFB(B) − PFB(A ∩ B). Será apresentada duas propostas de probabilidade fuzzy intuicionista, uma é a denominada de probabilidade fuzzy intuicionista restrita e a outra simplesmente de probabilidade fuzzy intuicionista, as quais serão definidas como segue: Considere como espaço amostral um conjunto discreto Ω = {x1 , . . . , xn }, e um conjunto de números fuzzy intuicionistas Fi , i = 1, . . . , n. Nestas condições, defina a probabilidade fuzzy intuicionista PFI(A) de um subconjunto A de Ω como sendo o conjunto fuzzy intuicionista cujos (α, β)-níveis PFI(A)(α,β) são dados por PFI(A)(α,β) = ∑ pi i∈IA n ∑ pi i=1 n : pi ∈ Fi,(α,β) , ∀i = 1, . . . , n . Se Fi , i = 1, . . . , n são tais que, para todo i = 1, . . . , n, existam pi ∈ N(Fi ) tais que ∑ pi = 1, onde N(Fi) é o núcleo de Fi, a probabilidade fuzzy intuicionista restrita PFIB(A) i=1 de um subconjunto A de Ω é definida como sendo o conjunto fuzzy intuicionista cujos (α, β)-níveis PFIB(A)(α,β) são dados por ( PFIB(A)(α,β) = n ∑ pi : pi ∈ Fi,(α,β), ∀i = 1, . . . , n, i∈IA e ∑ pi = 1 ) . i=1 Neste trabalho será provado que tanto PFI(A) como PFIB(A) são de fato um números fuzzy intuicionistas e que estas probabilidades são semi-aditivas, no sentido que para todo A, B ⊂ Ω PFI(A ∪ B) ≤ PFI(A) + PFI(B) − PFI(A ∩ B) 15 Capítulo 1. Introdução e PFIB(A ∪ B) ≤ PFIB(A) + PFIB(B) − PFIB(A ∩ B). Claramente, quando todos os Fi , i = 1, . . . , n são números fuzzy, a definição de PFI aqui apresentada coincide com a probabilidade fuzzy acima definida. Neste trabalho também serão definidas as noções de probabilidade condicional: a intervalar, a intervalar restrita, a fuzzy, a fuzzy restrita, a fuzzy intuicionista e a fuzzy intuicionista restrita. Será provada uma versão intervalar, fuzzy e fuzzy intuicionista do Teorema de Bayes, o qual é um dos resultados mais importantes em qualquer teoria de probabilidades que se preze. Além disso, será desenvolvida a teoria de cadeias de Markov: a intervalar, a fuzzy e a fuzzy intuicionista. Dessa forma, foram obtidos resultados importantes nesta direção tais como a classificação dos estados baseados nestas noções de probabilidades. Será provado o importante Teorema da Convergência dos Estados Estacionários em cada uma destas teorias. 1.5 Organização do Texto Este texto está dividido em 6 capítulos: • Capítulo 2, Teoria Intervalar, serão abordados em primeiro lugar as noções básicas da aritmética intervalar, a qual é considerada a métrica de Moore sobre o conjunto IR para estudar a noção de limites de sequências de intervalos. • Capítulo 3, Probabilidade Intervalar, será abordado um estudo sobre a teoria da probabilidade intervalar onde será apresentada uma proposta para a axiomática da probabilidade intervalar devida a Walley em [149]. Serão introduzidas também duas noções de probabilidade intervalar, denominadas de probabilidade intervalar restrita e de probabilidade intervalar, as quais satisfazem os axiomas propostos por Walley para uma teoria de probabilidade intervalar. Considerando estas duas noções de probabilidade intervalar, serão provados neste contexto os principais teoremas vindos da teoria da probabilidade clássica, tais como: O Teorema da Probabilidade Total Intervalar, O Teorema da Probabilidade Condicional Total Intervalar e o Teorema de Bayes Intervalar. Neste capítulo também será introduzido um estudo sobre as cadeias de Markov intervalares e a classificação de seus estados baseados nas duas noções de probabilidade intervalar propostos neste trabalho. • Capítulo 4, Teoria Fuzzy, serão abordados em primeiro lugar as noções básicas da teoria fuzzy, onde será introduzida a métrica de Moore sobre o conjunto de todos 16 Capítulo 1. Introdução os números fuzzy para estudar a noção de limites de sequências de números fuzzy. • Capítulo 5 - Teoria de Probabilidade Fuzzy, será abordado um estudo sobre a teoria da probabilidade fuzzy, onde será apresentado uma proposta para uma axiomática da probabilidade fuzzy inspirada pelo trabalho de Walley em [149]. Serão introduzidas também duas noções de probabilidade fuzzy, denominadas de probabilidade fuzzy restrita e de probabilidade fuzzy, as quais satisfazem os axiomas propostos para uma teoria de probabilidade fuzzy. Considerando estas duas noções de probabilidade fuzzy, serão provados neste contexto os principais teoremas vindos da teoria da probabilidade clássica, tais como: O Teorema da Probabilidade Total Fuzzy, O Teorema da Probabilidade Condicional Total Fuzzy e o Teorema de Bayes Fuzzy. Neste capítulo também será introduzido um estudo sobre as cadeias de Markov fuzzy e a classificação de seus estados baseados nas duas noções de probabilidade fuzzy propostos neste trabalho. • Capítulo 6 - Teoria Fuzzy Intuicionista, serão abordados em primeiro lugar as noções básicas da teoria fuzzy intuicionista, onde será introduzida a métrica de Moore sobre o conjunto de todos os números fuzzy intuicionistas para estudar a noção de limites de sequências de números fuzzy intuicionistas. • Capítulo 7 - Teoria da Probabilidade Fuzzy Intuicionista, será abordado um estudo sobre a teoria da probabilidade fuzzy intuicionista onde será apresentado uma proposta para uma axiomática da probabilidade fuzzy intuicionista inspirada pelo trabalho de Walley em [149]. Serão introduzidas também duas noções de probabilidade fuzzy intuicionista, denominadas de probabilidade fuzzy intuicionista restrita e de probabilidade fuzzy intuicionista, as quais satisfazem os axiomas propostos para uma teoria de probabilidade fuzzy intuicionista. Considerando estas duas noções de probabilidade fuzzy intuicionista, serão provados neste contexto os principais teoremas vindos da teoria da probabilidade clássica, tais como: O Teorema da Probabilidade Total Fuzzy Intuicionista, O Teorema da Probabilidade Condicional Total Fuzzy Intuicionista e o Teorema de Bayes Fuzzy Intuicionista. Neste capítulo também será introduzido um estudo sobre as cadeias de Markov fuzzy intuicionistas e a classificação de seus estados baseados nas duas noções de probabilidade fuzzy intuicionista propostos neste trabalho. • Capítulo 8 - Conclusão, Artigos Publicados e Trabalhos Futuros. 17 Capítulo 2 Teoria Intervalar 2.1 Considerações Iniciais A Computação Intervalar é uma área relativamente nova das ciências da computação, surgiu da necessidade em que os pesquisadores da programação científica precisavam para obter resultados mais precisos, e com o menor erro possível. Alguns registros mostram que a partir de 1914 pesquisadores começaram a utilizar intervalos numéricos para representar medidas de distância e tempo. Mas, foi na década de 50, através dos trabalhos de Moore [107], que essa teoria se consolidou. Moore contribuiu significativamente para fundamentação da Teoria Intervalar, propondo uma aritmética e uma topologia para intervalos, dando origem a uma alternativa à computação pontual. Existem três tipos de fontes de erros na computação númerica clássica, são eles: a propagação do erro nos dados iniciais, os erros que ocorrem por arredondamentos e os erros por truncamentos. A matemática intervalar vem buscando resolver esse problema que fundamenta-se em dois aspectos: Na criação de um modelo computacional que exprima o controle e a análise de erros ocorridos no processo computacional e na escolha de técnicas de programação adequadas para desenvolvimentos de softwares científicos buscando minimizar os erros nos resultados. Dessa forma, a qualidade do resultado na computação torna-se mais confiável, uma vez a qualidade dos resultados na computação científica depende do conhecimento e do controle desses erros. O usuário não pode afirmar a exatidão da resposta estimada sem auxílio de uma análise de erro, e esta é exaustiva e nem sempre é viável. Assim, a obtenção de uma solução numérica para um problema real, aplicando os métodos tradicionais, geralmente conduz a resultados aproximados. Por outro lado, técnicas intervalares podem ser programadas em computadores de tal modo que a computação possua uma rigorosa e completa análise do erro durante a evolução dos cálculos numéricos, tornando necessá- 18 Capítulo 2. Teoria Intervalar rio identificar sua origem. Com isso, o uso da matemática intervalar torna-se uma forte alternativa na resolução de problemas caracterizados pela falta de exatidão. A aritmética intervalar é uma aritmética bem elaborada matematicamente, onde são definidas as principais operações aritméticas para intervalos, baseadas nas respectivas operações reais sobre os extremos dos intervalos como Moore em [107], Campos, Dimuro, Costa e Araújo em [29], Kulish em [91], Jaulin, Kieffer, Didrit e Walter em [75]. Atualmente, a matemática intervalar ultrapassou as fronteiras das aplicações numéricas desenvolvidas em diversas áreas das ciências, tais como: teoria fuzzy [58, 57], processamento de sinais [27], inteligência artificial [15], teoria de controle [158], economia [136], sistemas de informações geográficas [134], controle robustos e robótica [75], computação gráfica [34], e em outras diversas aplicações que lidam com dados imprecisos. 2.2 Aritmética Intervalar Nesta seção será apresentada as definições básicas da aritmética intervalar que serão utilizadas no desenvolvimento deste trabalho. Seja IR o conjunto de todos os intervalos fechados de números reais, definido por: IR = {[a, b] : a, b ∈ R, a ≤ b} Os intervalos degenerados, ou seja, da forma [a, a], serão escritos na forma simplificada [a]. A seguir será apresentada as definições das operações aritméticas sobre IR em termos de respectivas operações aritméticas no conjunto da reta real. Definição 2.2.1 (Adição) Sejam X, Y ∈ IR, então a soma de X com Y é dada por: X +Y = {x + y : x ∈ X, y ∈ Y }. Definição 2.2.2 (Pseudo Inverso Aditivo) Seja X ∈ IR, o pseudo inverso aditivo de X é dado por: −X = {−x : x ∈ X}. O nome de pseudo inverso aditivo é devido ao fato que, nem sempre a igualdade X − X = [0] é verdadeira. De fato, tome um intervalo X = [0, 1], assim −X = [−1, 0], logo X − X = [−1, 1] 6= [0], mas [0] está contido como conjunto no intervalo X − X = [1, −1]. 19 Capítulo 2. Teoria Intervalar Definição 2.2.3 (Subtração) Sejam X e Y ∈ IR, então a diferença entre X e Y é dada por: X −Y = {x − y : x ∈ X, y ∈ Y }. Definição 2.2.4 (Multiplicação) Sejam X e Y ∈ IR, então a multiplicação entre X e Y é dada por: X ·Y = {x · y : x ∈ X, y ∈ Y }. Definição 2.2.5 (Divisão) Sejam X e Y ∈ IR tal que 0 6∈ Y , então a divisão X/Y é dada por: X = Y x : x ∈ X, y ∈ Y y Definição 2.2.6 (Pseudo Inverso Multiplicativo) Seja X ∈ IR tal que 0 6∈ X, então o pseudo inverso Multiplicativo de X é dado por: X −1 = 1 :x∈X x Os elementos de IR algumas vezes serão denotados por: X = [l(X), r(X)]. Neste caso, l(X) é o extremo esquerdo do intervalo X e r(X) é o extremo direito de X. Teruo Sunaga [137] provou que • X +Y = [l(X) + l(Y ), r(X) + r(Y )]; • X −Y = [l(X) − l(Y ), r(X) + r(Y )]; • −X = [−r(X), −l(X)]; • X ·Y = [min S, max S] onde S = {l(X) · l(Y ), l(X) · r(Y ), r(X) · l(Y ), r(X) · r(Y )}; • X/Y = [min T, max T ] onde T = {l(X)/l(Y ), l(X)/r(Y ), r(X)/l(Y ), r(X)/r(Y )}. Definição 2.2.7 Seja X = [l(X), r(X)] um intervalo, diz-se que X é positivo, e será denotado por X > 0, se l(X) for positivo, isto é se l(X) > 0. Será denotado por IR+ o conjunto dos intervalos positivos. Observação 2.2.8 Se X = [l(X), r(X)] e Y = [l(Y ), r(Y )] são dois intervalos positivos, então o produto e a divisão de X e Y podem ser descritos da seguinte maneira: • (i) X ·Y = [l(X) · l(Y ), r(X) · r(Y )]; 20 Capítulo 2. Teoria Intervalar • (ii) X/Y = [l(X)/r(Y ), r(Y )/l(Y )]. Proposição 2.2.9 Para todo X,Y, Z ∈ IR têm-se: • Associatividade na adição: (X +Y ) + Z = X + (Y + Z) • Comutatividade na adição: X +Y = Y + X • Identidade na adição: X + [0] = [0] + X = X [0] é o único elemento ∈ IR tal que • Associatividade na multiplicação: (X ·Y ) · Z = X · (Y · Z) • Comutatividade na multiplicação: X ·Y = Y · X • Identidade na multiplicação: X · [1] = [1] · X = X [1] é o único elemento ∈ IR tal que • Subdistributividade: X · (Y + Z) ⊆ X ·Y + X · Z Prova: Ver [108] Note que, em IR+ é satisfeita a lei de distributividade no seguinte sentido: X · (Y + Z) = X ·Y + X · Z 2.3 Métrica sobre IR Definição 2.3.1 Dados dois intervalos fechados [a, b] e [c, d], define-se a distância de Moore, dM ([a, b], [c, d]), por dM ([a, b], [c, d]) = max{|a − c|, |b − d|}. É fácil provar que, esta noção de distância entre intervalos fechados define uma métrica sobre IR, ou seja, dM : IR × IR → R satisfaz as seguintes propriedades: Se A, B,C ∈ IR então (i) dM (A, B) ≥ 0; (ii) dM (A, B) = 0 se , e somente se, A = B; (iii) dM (A, B) = dM (B, A); (iv) dM (A,C) ≤ dM (A, B) + dM (B,C). Essa métrica permite estudar a noção de sequências convergentes de intervalos. 21 Capítulo 2. Teoria Intervalar 2.4 Sequências e Limites de Intervalos Nesta seção será estudada a noção de sequências convergentes em IR, que será útil no estudo do comportamento a longo prazo de cadeias de Markov intervalares. Definição 2.4.1 Uma sequência de intervalos fechados é uma função f : N → IR. Se f , g : N → IR são duas sequências de intervalos fechados, define-se a soma f + g e o produto f · g como sendo as funções definidas por ( f + g)(n) = f (n) + g(n) e ( f · g)(n) = f (n) · g(n), para todo n ∈ N. Se f : N → IR é uma sequência de intervalos fechados, então para cada n ∈ N existem únicos an , bn ∈ R tais que, f (n) = [an , bn ]. Por este motivo, a sequência f : N → IR será identificada como o conjunto formado pelas suas imagens {[an , bn ] ∈ IR : n ∈ N}. De agora em diante, diz-se que {[an , bn ]}n∈N é uma sequência de intervalos fechados, ou uma sequência em IR, para representar a sequência f : N → IR dada por f (n) = [an , bn ]. Note que, com esta identificação têm-se que a soma e produto de sequências de intervalos fechados pode ser descrita assim: {[an , bn ]}n∈N + {[cn , dn ]}n∈N = {[an , bn ] + [cn , dn ]}n∈N = {[an + cn , bn + dn ]}n∈N e {[an , bn ]}n∈N · {[cn , dn ]}n∈N = {[an , bn ] · [cn , dn ]}n∈N = {[xn , yn ]}n∈N , onde xn = inf{an cn , an dn , bn cn , bn dn } e yn = sup{an cn , an dn , bn cn , bn dn }. Definição 2.4.2 Diz-se que a sequência {[an , bn ]}n∈N converge para [a, b] ∈ IR, e será escrita [an , bn ] → [a, b] ou lim [an , bn ] = [a, b] n→∞ se dado ε > 0, existe n0 ∈ N tal que dM ([an , bn ], [a, b]) < ε para todo n ≥ n0 . Proposição 2.4.3 A sequência {[an , bn ]}n∈N converge se, e somente se, as sequências de números reais {an }n∈N e {bn }n∈N convergem. Neste caso, têm-se que h i lim [an , bn ] = lim an , lim bn = n→∞ n→∞ n→∞ n o lim cn : an ≤ cn ≤ bn , para todo n ∈ N . n→∞ 22 Capítulo 2. Teoria Intervalar Prova: Se lim [an , bn ] = [a, b], então dado ε > 0, existe n0 ∈ N tal que dM ([an , bn ], [a, b]) < n→∞ ε para todo n ≥ n0 . Mas, dM ([an , bn ], [a, b]) = max{|an − a|, |bn − b|}. Logo, |an − a| < ε e |bn − b| < ε para todo n ≥ n0 . Portanto, lim an = a e lim bn = b. n→∞ n→∞ Reciprocamente, se lim an = a e lim bn = b, então dado ε > 0, existe n1 , n2 ∈ N tais n→∞ n→∞ que |an − a| < ε para todo n ≥ n1 e |bn − b| < ε para todo n ≥ n2 . Seja n0 = max{n1 , n2 }. Então, dM ([an , bn ], [a, b]) = max{|an − a|, |bn − b|} < ε para todo n ≥ n0 , ou seja, lim [an , bn ] = [a, b], o que prova a afirmação e a primeira igualn→∞ dade. A segunda igualdade segue das propriedades dos limites de sequências de números reais. De fato, se {cn }n∈N é uma sequência de números reais tais que an ≤ cn ≤ bn para todo n ∈ N então, lim an ≤ lim cn ≤ lim bn , n→∞ h n→∞ n→∞ i ou seja, lim cn ∈ lim an , lim bn . Por outro lado, se lim an = a e lim bn = b e c ∈ [a, b] n→∞ n→∞ n→∞ n→∞ n→∞ então, existe t ∈ [0, 1] tal que c = a + t(b − a). Defina cn = an + t(bn − an ), n ∈ N. É fácil verificar que lim cn = c e que an ≤ cn ≤ bn . n→∞ 2.5 Relações de Ordem sobre Intervalos Na aritmética intervalar existem várias ordens que podem ser definidas para intervalos, tais como: a ordem da inclusão, a ordem de Moore [107], a ordem de Kulisch-Miranker [91], a ordem dos conjuntos. Definição 2.5.1 (Ordem da Inclusão) [a, b] ⊆ [c, d] ⇔ c ≤ a e b ≤ d Definição 2.5.2 (Ordem de Kulisch-Miranker) [a, b] ≤K [c, d] ⇔ a ≤ c e b ≤ d. 23 Capítulo 2. Teoria Intervalar Definição 2.5.3 (Ordem de Moore) [a, b] <M [c, d] ⇔ b < c. Note que, <M não é de fato uma ordem, pois não é reflexiva, porém seu fecho reflexivo, denotado por ≤M , é uma ordem parcial sobre IR. Uma caracterização de ≤M é dada por: X ≤M Y ⇔ X <M Y ou X = Y. Definição 2.5.4 Define-se a seguinte relação de ordem sobre IR : [a, b] E [c, d] ⇔ b < d ou (b = d e c ≤ a) É fácil provar que esta ordem é uma ordem total sobre IR, a qual está sendo introduzida neste trabalho e desenvolverá um papel importante nos capítulos subsequentes. Observação 2.5.5 Note que, a ordem E é mais fina que a ordem de inclusão entre intervalos, no sentido que se A, B ∈ IR e A ⊆ B então, A E B. Lema 2.5.6 Sejam A, B,C intervalos positivos tais que B ⊆ C. Então, A B ⊆ CA . Prova: Escreva A = [a1 , a2 ], B = [b1 , b2 ] e C = [c1 , c2 ]. Como B ⊆ C tem-se que c1 ≤ b1 ≤ b2 ≤ c2 . Por outro lado, pela Observação 2.2.8, tem-se que AB = [ ab12 , ab21 ] e CA = [ ac21 , ac12 ]. Como os intervalos A, B,C são positivos, o resultado então segue do fato que a1 a1 a2 a2 ≤ ≤ ≤ . c2 b2 b1 c1 24 Capítulo 3 Teoria de Probabilidade Intervalar 3.1 Considerações Iniciais É muito comum uma má interpretação das expressões probabilísticas cotidianas para distinguir entre incerteza e a ignorância, e entre a certeza e a confiança. As pessoas fazem uma distinção entre julgamentos probabilísticos seguro e inseguro. Este fato tem motivado diversos pesquisadores a buscar alternativas para esse formalismo. Às vezes é mais confortável atribuir um intervalo ao invés de uma estimativa pontual de incerteza, expressando assim a nossa ignorância, dúvida ou falta de confiança no julgamento necessário. As probabilidades intervalares, são probabilidades representadas através de números intervalares, cuja soma dessas probabilidades, ao contrário da teoria de probabilidade clássica, pode ser diferente de [1]. Dessa forma, para trabalhar com as probabilidades intervalares de forma correta, tem-se que fazer uma restrição na aritmética intervalar clássica (seção 3.3). A noção de probabilidade intervalar será utilizada no cálculo das probabilidades de transição de uma cadeia de Markov. Cabe destacar que o estudo sobre as cadeias de Markov clássicas tem sido de grande importância em diversas aplicações nas áreas de tomada de decisão [3], teoria de jogos [147], automação [93], reconhecimento de voz [124], teoria das filas [103], previsão da idade de uma população [96], entre outras. 3.2 Axiomática da Probabilidade Intervalar Nesta seção será apresentada uma das vertentes da teoria de probabilidade intervalar, a qual tem como objetivo generalizar a teoria de probabilidade clássica com o intuito de descrever a incerteza de um modo geral. A teoria de probabilidade clássica é fundamentada sobre um sistema de três axiomas, conhecidos como os axiomas de Kolmogorov, e sobre a noção de probabilidade condi25 Capítulo 3. Teoria de Probabilidade Intervalar cional. Mais precisamente, em teoria de probabilidades clássica, um espaço de probabilidade é um par (Ω, F ), consistente de um espaço amostral Ω e uma σ-álgebra F de subconjuntos de Ω, cujos elementos são chamados de eventos. Uma probabilidade é uma função P : F → [0, 1] que satisfaz os seguintes axiomas de Kolmogorov: Axioma I: P(A) ∈ R e P(A) ≥ 0 para todo A ∈ F ; Axioma II: P(Ω) = 1; Axioma III: Dada qualquer sequência enumerável, mutuamente disjunta, {An }n∈N de elementos de F tem-se que P [ A n∈N n = ∑ P(An). n∈N A seguir serão apresentados os axiomas que regem a teoria de probabilidade intervalar na ótica de Walley em [149]. Definição 3.2.1 Seja (Ω, F ) um espaço de probabilidade. Uma probabilidade intervalar é uma função P : F → I([0, 1]), dada por P(A) = [P(A), P(A)], que satisfaz as seguintes propriedades: / = 0 e P(Ω) = 1; Axioma IV: P(0) Axioma V: P(A) = 1 − P(Ac ), para todo A ∈ F , onde Ac = Ω \ A é o complementar de A; / então P(A ∪ B) ≥ P(A) + P(B); Axioma VI: (Super aditividade) Se A ∩ B = 0, / então P(A ∪ B) ≤ P(A) + P(B). Axioma VII: (Sub aditividade) Se A ∩ B = 0, As funções P e P são chamadas de probabilidade inferior e probabilidade superior, respectivamente. Note que, o axioma V é equivalente à propriedade P(A) = [1] − P(Ac ), pois pelo axioma V, P(Ac ) = 1 − P(Acc ) = 1 − P(A). P é coerente se existir um conjunto não-vazio M de funções de probabilidades clássicas sobre F tal que P(A) = inf{π(A) : π ∈ M }, para todo A ∈ F . 26 Capítulo 3. Teoria de Probabilidade Intervalar Neste caso, pelo Axioma V, necessariamente tem-se que P(A) = sup{π(A) : π ∈ M }, para todo A ∈ F . / = 0 e P(Ω) = 1. Portanto, se P é coerente, Note que, se P é coerente então, P(0) / = [0] e P(Ω) = [1]. P(0) P é 2-monótona se satisfaz P(A) + P(B) ≤ P(A ∪ B) + P(A ∩ B). Neste caso, pelo Axioma V, necessariamente tem-se que P(A) + P(B) ≥ P(A ∪ B) + P(A ∩ B). É possível provar que todas probabilidades inferiores que são 2-monótonas são também coerentes (veja por exemplo [68], Lemma 2.5). 3.3 Probabilidade Intervalar Nesta seção serão estudadas duas noções de Probabilidade Intervalar: uma essencialmente dada por Buckley e outra de natureza original. A definição de probabilidade intervalar foi dada essencialmente por Buckley em [20]. Diz "essencialmente"pois de fato Buckley trabalha somente com probabilidade fuzzy e nessa definição está embutida uma noção de probabilidade intervalar. Uma outra diferença com as noções de probabilidade intervalar que será apresentada é a noção de ordem em IR utilizada, pois aqui foi usada a ordem E entre intervalos em vez da ordem usada por Buckley (veja a Observação 4.3.15). O motivo pelo qual prefere-se a ordem E entre intervalos deve-se ao fato que é fácil de ser verificada em exemplos concretos, é mais fina que a ordem de inclusão entre intervalos, no sentido que, se A ⊆ B são intervalos então A E B, e além disso é útil para provar propriedades importantes sobre probabilidadde intervalar. 3.3.1 Probabilidade Intervalar Restrita Primeiro será definida a noção de probabilidade intervalar que será atribuída a Buckley: 27 Capítulo 3. Teoria de Probabilidade Intervalar Seja I = (I1 , . . . , Ir ) uma r-tupla de intervalos positivos com a propriedade que r Ii ⊆ [0, 1] e existam ai ∈ Ii , i = 1, . . . , r tais que ∑ ai = 1. (3.1) i=1 Neste caso, diz-se que I satisfaz a restrição aritmética intervalar (3.1). Observe que, esta n condição garante que 1 ∈ ∑ Ii . i=1 Diz-se que a = (a1 , . . . , ar ) pertence a I, e será escrito a ∈ I, se ai ∈ Ii para todo i = 1, . . . , r. Definição 3.3.1 Seja Ω = {x1 , . . . , xr }. Dado qualquer subconjunto A de Ω, defina a probabilidade intervalar restrita de A, denotada por PIR(A), como sendo o conjunto ( PIR(A) = r ) ∑ ai : a = (a1, . . . , ar ) ∈ I e ∑ ai = 1 i∈IA . (3.2) i=1 onde IA = { j ∈ {1, . . . , r} : x j ∈ A}. Esta função PIR algumas vezes será denotada por PIRI para enfatizar a dependência desta função de probabilidade com o conjunto I. Intuitivamente na definição acima, Ω representa um conjunto finito de amostras e cada Ii é um intervalo que aproxima a probabilidade de xi ocorrer. A equação (3.1) define uma restrição à aritmética intervalar para este modelo de probabilidade intervalar. Teorema 3.3.2 Para cada A ⊆ Ω, PIR(A) é um intervalo fechado contido em [0, 1]. Em particular, tem-se uma função PIR : ℘(Ω) → I([0, 1]), onde I([0, 1]) é o subconjunto de IR consistindo dos intervalos fechados contidos em [0, 1]. r r Prova: Seja S = {(y1 , . . . , yr ) ∈ [0, 1]r : ∑ yi = 1}. Defina D = S ∩ ∏ Ii e f : D → [0, 1] i=1 i=1 por f (a1 , . . . , ar ) = ∑ ai . (3.3) i∈IA Têm-se que f é contínua e D é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (3.2), é claro que PIR(A) = f (D) A função PIR é chamada de probabilidade intervalar restrita. Tem-se a seguinte caracterização mais precisa da probabilidade intervalar restrita: 28 Capítulo 3. Teoria de Probabilidade Intervalar Corolário 3.3.3 As funções PIR, PIR : ℘(Ω) → [0, 1], definidas para todo A ⊆ Ω por: PIR(A) = PIR(A) = 1 − ∑ r(Ii ), se ∑ l(Ii ) + ∑ r(Ii ) ≤ 1 ∑ l(Ii ), i∈I A ∑ r(Ii ), caso contrário 1 − ∑ l(Ii ), caso contrário i6∈IA i6∈IA i∈IA (3.4) se ∑ r(Ii ) + ∑ l(Ii ) ≤ 1 i∈IA i6∈IA i∈IA (3.5) i6∈IA são tais que PIR(A) = [PIR(A), PIR(A)]. Prova: Suponha que ∑ l(Ii ) + ∑ r(Ii ) ≤ 1. Como, pela restrição aritmética intervalar, i6∈IA i∈IA r r i=1 i=1 existem pi ∈ Ii , i = 1, . . . , r, tais que ∑ pi = 1 tem-se que ∑ r(Ii ) ≥ 1. Mas, a função f : ∏ Ii → R dada por f ((ai )i∈IA ) = ∑ ai + ∑ r(Ii ) é contínua e ∏ Ii é um subconjunto i∈IA i∈IA i6∈IA i∈IA R]A , conexo de portanto pelo Teorema do Valor Intermediário ([98] p.56), existem ai ∈ Ii , i ∈ IA , tais que ∑ ai + ∑ r(Ii ) = 1. i6∈IA i∈IA Portanto, PIR(A) = ∑ ai = 1 − ∑ r(Ii). i6∈IA i∈IA Suponha agora que ∑ l(Ii ) + ∑ r(Ii ) ≥ 1. Como, pela restrição aritmética intervalar, i6∈IA i∈IA r r i=1 i=1 existem pi ∈ Ii , i = 1, . . . , r, tais que ∑ pi = 1 tem-se que ∑ l(Ii ) ≤ 1. Mas, a função f : ∏ Ii → R dada por f ((ai )i6∈IA ) = ∑ l(Ii ) + ∑ ai é contínua e ∏ Ii i∈IA i6∈IA i6∈IA i∈IA c R]A , é um subconjunto conexo de portanto pelo Teorema do Valor Intermediário ([98] p.56), existem ai ∈ Ii , i 6∈ IA , tais que ∑ l(Ii ) + ∑ ai = 1. Logo, i6∈IA i∈IA PIR(A) = ∑ l(Ii). i∈IA Portanto, PIR(A) = 1 − ∑ r(Ii ), se ∑ l(Ii ) + ∑ r(Ii ) ≤ 1 ∑ l(Ii ), caso contrário i6∈IA i∈IA i6∈IA . i∈IA A outra igualdade prova-se de maneira análoga. Observação 3.3.4 Suponha que P : ℘(Ω) → [0, 1] é uma função de probabilidade no 29 Capítulo 3. Teoria de Probabilidade Intervalar sentido clássico, onde Ω = {x1 , . . . , xr }. Por exemplo, P({xk }) = ak , ∀k = 1, . . . , r. Então, a1 + a2 + . . . + ar = 1 Seja I = ([a1 ], . . . , [ar ]). Então, PIRI = P, ou seja, esta definição de probabilidade intervalar estende a noção de probabilidade clássica. Teorema 3.3.5 Seja Ω = {x1 , . . . , xr } e seja PIR : ℘(Ω) → I([0, 1]) a função de probabilidade intervalar restrita. Então, para cada A, B ⊆ Ω têm-se as seguintes propriedades: / então PIR(A ∪ B) ⊆ PIR(A) + PIR(B). Em particular, tem-se que (i) Se A ∩ B = 0, PIR(A ∪ B) E PIR(A) + PIR(B). (ii) Se A ⊆ B, então PIR(A) ≤K PIR(B) e PIR(A) E PIR(B) onde ≤K é a ordem de Kulisch-Miranker sobre IR. / = [0] E PIR(A) E [1] = PIR(Ω). (iii) PIR(0) (iv) [1] ⊆ PIR(A) + PIR(Ac ). Em particular, [1] PIR(A) + PIR(Ac ). / então PIR(A ∪ B) ⊆ PIR(A) + PIR(B) − PIR(A ∩ B). Em particular, (v) Se A ∩ B 6= 0, tem-se que então PIR(A ∪ B) E PIR(A) + PIR(B) − PIR(A ∩ B). Prova: Itens (ii) e (iii) são triviais e (iv) segue do item (i). Portanto, será provado apenas os itens (i) e (v). / Note que, A ∩ B = 0/ se e somente se, IA ∩ IB = 0. Para provar a relação PIR(A ∪ B) ⊆ PIR(A) + PIR(B) de (i) é suficiente provar que ( r ) ∑ ai + ∑ a j : a ∈ I e ∑ al = 1 i∈IA j∈IB l=1 está contido em ( r ) ∑ ai : a ∈ I e ∑ al = 1 i∈IA ( + r ∑ a j : a ∈ I e ∑ al = 1 j∈IB l=1 ) , l=1 o que é óbvio. Em particular, pela Observação 2.5.5 tem-se que PIR(A ∪ B) E PIR(A) + PIR(B), o que prova (i). Para provar a relação PIR(A ∪ B) ⊆ PIR(A) + PIR(B) − PIR(A ∩ B) de (v), é suficiente mostrar que ( ) r ∑ ai : a ∈ I e i∈IA ∪IB ∑ al = 1 l=1 30 Capítulo 3. Teoria de Probabilidade Intervalar está contido em ) ( r ∑ ai : a ∈ I e ∑ al = 1 + ∑ a j : a ∈ I e ∑ al = 1 r i∈IA − j∈IB l=1 l=1 ∑ ai : a ∈ I e ∑ al = 1 r i∈IA ∩IB l=1 o que é obvio. Em particular, pela Observação 2.5.5, tem-se que PIR(A ∪ B) E PIR(A) + PIR(B) − PIR(A ∩ B), o que prova (v). Corolário 3.3.6 A probabilidade intervalar restrita PIR é uma probabilidade intervalar no sentido da Definição 3.2.1. Além disso, PIR é 2-monótona, e portanto coerente. Prova: O axiomas IV segue da propriedade (iii) do Teorema 3.3.5, enquanto os axiomas VI e VII seguem da propriedade (i) do Teorema 3.3.5. Para provar o axioma V, ou seja que PIR(A) = 1 − PIR(Ac ), pela Equação (3.5), tem-se que considerar dois casos: 1) Caso ∑ r(Ii ) + ∑ l(Ii ) > 1, então PIR(A) = 1 − ∑ l(Ii ) e trivialmente ∑ r(Ii ) + i∈IA ∑ l(Ii ) > 1. i6∈IA i6∈IA i6∈IAc Deste último, pela Equação (3.4), tem-se que PIR(Ac ) = i∈IAc ∑ l(Ii ) = ∑ l(Ii ). i∈IAc i6∈IA 2) Caso ∑ r(Ii ) + ∑ l(Ii ) ≤ 1, então PIR(A) = ∑ r(Ii ) e trivialmente, ∑ r(Ii ) + i∈IA i6∈IA i∈IA PIR(Ac ) ∑ l(Ii ) ≤ 1. Deste último, pela Equação (3.4), tem-se que i6∈IAc = 1 − ∑ r(Ii ) = i6∈IAc i∈IAc 1 − ∑ r(Ii ). i∈IA Portanto, em ambos os casos, PIR(A) = 1 − PIR(Ac ). Além disso, PIR é 2-monótona pelo item (v) do Teorema 3.3.5. A seguinte observação é crucial para entender melhor as cadeias de Markov intervalares. r Observação 3.3.7 Note que, para cada a = (a1 , . . . , ar ) ∈ I com ∑ ai = 1 pode-se definir i=1 a seguinte função de probabilidade no sentido clássico Pa (A) = ∑ ai, Pa : ℘(Ω) −→ [0, 1] dada por para todo A ⊆ X. i∈IA Em outras palavras, a probabilidade intervalar restrita pode ser entendida como uma famír lia de probabilidades clássicas, parametrizadas por todos os a = (a1 , . . . , ar ) ∈ I com ∑ ai = i=1 1, ou seja, ( PIR(A) = r Pa (A) : a ∈ I e ∑ ai = 1 i=1 31 ) . Capítulo 3. Teoria de Probabilidade Intervalar Além disso, ( ) r PIR(A) = inf Pa (A) : a ∈ I e ∑ ai = 1 i=1 e ( r a PIR(A) = sup P (A) : a ∈ I e ) ∑ ai = 1 , i=1 o que confirma o fato de PIR ser coerente. 3.3.2 Probabilidade Intervalar Agora será definida a noção de probabilidade intervalar proposta neste trabalho. Definição 3.3.8 Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Seja Ω = {x1 , . . . , xr }. Dado qualquer subconjunto A de Ω, defina a probabilidade intervalar de A, denotada por PI(A), como sendo o conjunto i∈IA : a = (a , . . . , a ) ∈ I . PI(A) = r 1 r ∑ ai ∑ ai (3.6) i=1 onde IA = { j ∈ {1, . . . , r} : x j ∈ A}. Esta função PI algumas vezes será denotada por PII para enfatizar a dependência desta função de probabilidade com o conjunto I. Teorema 3.3.9 Para cada A ⊆ X, PI(A) é um intervalo fechado contido em [0, 1]. Em particular, tem-se uma função PI : ℘(Ω) → I([0, 1]), onde I([0, 1]) é o subconjunto de IR consistindo dos intervalos fechados contidos em [0, 1]. r Prova: Defina D = ∏ Ii e f : D → [0, 1] por i=1 ∑ ai f (a1 , . . . , ar ) = i∈IA r . (3.7) ∑ ai i=1 Tem-se que f é contínua e D é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (3.6), é claro que PI(A) = f (D). Em particular, tem-se que as funções PI, PI : ℘(Ω) → [0, 1], definidas para todo A ⊆ Ω por: 32 Capítulo 3. Teoria de Probabilidade Intervalar ∑ l(Ii ) PI(A) = i∈IA (3.8) ∑ l(Ii ) + ∑ r(I j ) j6∈IA i∈IA ∑ r(Ii ) PI(A) = i∈IA (3.9) ∑ r(Ii ) + ∑ l(I j ) j6∈IA i∈IA são tais que PI(A) = [PI(A), PI(A)]. A função PI é chamada de Probabilidade Intervalar. Observação 3.3.10 A probabilidade intervalar proposta neste trabalho é mais flexível que a probabilidade intervalar restrita, pois não foi assumido que os intervalos positivos I1 , . . . , Ir estejam contidos em [0, 1] e nem que satisfazem a restrição aritmética intervalar dada pela condição (3.2). Por esta razão, a probabilidade intervalar PI(A) é mais fácil de ser calculada que a probabilidade PIR(A). No entanto, existe uma forte relação entre as duas abordagens que a seguir serão discutidas. Suponha que I = (I1 , . . . , Ir ) é um conjunto ordenado de intervalos positivos, contidos em [0, 1], que satisfazem a condição (3.2). Neste caso as duas funções de probabilidade intervalar estão bem definidas. Além disso, tem-se que para todo subconjunto A de Ω, PIR(A) ⊆ PI(A) pois, ( ) r ∑ ai : a ∈ I e ∑al = 1 i∈IA l=1 ⊆ ∑ ai i∈IA r ∑ ai i=1 :a∈I . Isto mostra que PIR(A) resulta num intervalo mais estreito e portanto com menos incertezas que PI(A). De fato, pode-se afirmar que PIR(A) resulta no intervalo ótimo, no sentido de [132], enquanto PI(A) apesar de satisfazer a propriedade de corretude, não necessariamente é ótimo. Uma vantagem de PI(A) sobre PIR(A) é ser um pouco mais simples de se calcular (compare equações (3.8) e (3.9) com as equações (3.4) e (3.5)), ou seja, de determinar seus extremos. No entanto, sua maior vantagem reside no fato de não impor restrições no I, isto permite lidar com situações onde as probabilidades intervalares atribuídas a cada elemento de Ω sejam absolutamente independentes entre si. 33 Capítulo 3. Teoria de Probabilidade Intervalar Pode-se pensar que isso não é um forte obstáculo, uma vez que sempre é possível normalizar essas probabilidades a fim de se obter uma tupla de probabilidades que satisfaça a condição (3.1), porém existem diversas formas de normalizar resultando portanto, em valores diferentes para PIR(A). Por exemplo, considere Ω = {x1 , x2 , x3 }, I = ([0.1, 0.2], [0.2, 0.3], [0.3, 0.4]) e A = {x1 , x2 }. Claramente I não satisfaz a condição (3.1) o que parece não natural, pois considerando cada intervalo Ii em I como uma aproximação da probabilidade de xi , seria natural que a probabilidade real de cada xi esteja dentro de Ii , e portanto a soma dessas probabilidades (reais) deveria somar 1, ou seja, I deveria satisfazer a condição (3.1). No entanto, estas probabilidades intervalares não necessariamente encapsulam a probabilidade real, pois podem trazer a incerteza do próprio processo do cálculo da probabilidade que está sujeita a diversas imprecisões. Logo, essa imprecisão pode levar a desrespeitar esta condição. Na seção será apresentado um estudo de caso onde esta probabilidade intervalar respeita, caso considere certos parâmetros, e outra em que desrespeita esta condição. 1 2 2 1 1 4 Então, se I for normalizado pelo fator 10 9 , isto é, I = ([ 9 , 9 ], [ 9 , 3 ], [ 3 , 9 ]), então PIR(A) = [ 59 , 59 ]. Porém, se for normalizado pelo fator 16 , então PIR(A) = [0.5, 0.5]. Observação 3.3.11 Suponha que P : ℘(Ω) → [0, 1] é uma função de probabilidade no sentido clássico, onde Ω = {x1 , . . . , xr }. Por exemplo, que P({xk }) = ak , ∀k = 1, . . . , r. Então, a1 + a2 + . . . + ar = 1 Seja I = ([a1 ], . . . , [ar ]). Então, PII = P, ou seja, esta definição de probabilidade intervalar estende a noção de probabilidade clássica. Teorema 3.3.12 Seja Ω = {x1 , . . . , xr } e seja PI : ℘(Ω) → I([0, 1]) a função de probabilidade intervalar. Então, para cada A, B ⊆ Ω têm-se as seguintes propriedades: / então PI(A ∪ B) ⊆ PI(A) + PI(B). Em particular, tem-se que (i) Se A ∩ B = 0, PI(A ∪ B) E PI(A) + PI(B). (ii) Se A ⊆ B, então PI(A) ≤K PI(B) e PI(A) E PI(B) onde ≤K é a ordem de KulischMiranker sobre IR. / = [0] E PI(A) E [1] = PI(Ω). (iii) PI(0) (iv) [1] ⊆ PI(A) + PI(Ac ). Em particular, [1] PI(A) + PI(Ac ). / então PI(A ∪ B) ⊆ PI(A) + PI(B) − PI(A ∩ B). Em particular, tem-se (v) Se A ∩ B 6= 0, que PI(A ∪ B) E PI(A) + PI(B) − PI(A ∩ B). 34 Capítulo 3. Teoria de Probabilidade Intervalar Prova: Itens (ii) e (iii) são triviais e item (iv) segue do item (i). Portanto, serão provados apenas os itens (i) e (v). / Note que, A ∩ B = 0/ se e somente se, IA ∩ IB = 0. Para provar a relação PI(A ∪ B) ⊆ PI(A) + PI(B) de (i) é suficiente provar que ∑ ai i∈IA ∪IB r ∑ ai i=1 :a∈I está contido em ∑ aj j∈IB i∈IA : a ∈ I + : a ∈ I , r r ∑ ai ∑ ai ∑ ai i=1 i=1 o que é óbvio. Em particular, pela Observação 2.5.5, tem-se que PI(A ∪ B) E PI(A) + PI(B), o que prova (i). Para provar a relação PI(A ∪ B) ⊆ PI(A) + PI(B) − PI(A ∩ B) de (v), é suficiente mostrar que a ∑ i i∈IA ∪IB : a ∈ I r ∑ ai i=1 está contido em ∑ ai ∑ ai j∈IB i∈IA ∩IB i∈IA + − : a ∈ I : a ∈ I : a ∈ I r r r ∑ ai ∑ ai ∑ ai i=1 ∑ aj i=1 i=1 o que é obvio. Em particular, pela Observação 2.5.5, tem-se que PI(A ∪ B) E PI(A) + PI(B) − PI(A ∩ B), o que prova (v). Corolário 3.3.13 A probabilidade intervalar PI é uma probabilidade intervalar no sentido da Definição 3.2.1. Além disso, PI é 2-monótona, e portanto coerente. Prova: Os axiomas VI e VII seguem da propriedade (i) do Teorema 3.3.12. O axioma IV segue da propriedade (iii) do Teorema 3.3.12. Por outro lado, da Equação (3.9), tem-se que 35 Capítulo 3. Teoria de Probabilidade Intervalar ∑ l(I j ) j∈IAc PI(Ac ) = ∑ l(I j ) + ∑ r(Ii ) j∈IAc . i∈IA Logo, da Equação (3.8) segue-se facilmente que PI(A) + PI(Ac ) = 1, o que prova que PI satisfaz o axioma V. Além disso, PI é 2-monótona pelo item (v) do Teorema 3.3.12. A seguinte observação é crucial para entender melhor as cadeias de Markov intervalares. Observação 3.3.14 Note que, para cada a = (a1 , . . . , ar ) ∈ I pode-se definir a seguinte função de probabilidade no sentido clássico Pa : ℘(Ω) −→ [0, 1] dada por ∑ ai a P (A) = i∈IA r , para todo A ⊆ X. ∑ ai i=1 Em outras palavras, a probabilidade intervalar pode ser entendida como uma família de probabilidades clássicas, parametrizadas por todos os a = (a1 , . . . , ar ) ∈ I, ou seja, PI(A) = {Pa (A) : a ∈ I} . Além disso, ( r PI(A) = inf Pa (A) : a ∈ I e ) ∑ ai = 1 i=1 e ( r a PI(A) = sup P (A) : a ∈ I e ∑ ai = 1 ) , i=1 o que confirma o fato de PI ser coerente. 3.4 Caso de Estudo Uma aplicação concreta das probabilidades intervalares pode ser dada em previsões de resultados de jogoss de futebol. Uma abordagem para este assunto é usando a probabilidade clássica (veja por exemplo, [19, 63, 66, 94, 116, 129]). No entanto, no resultado do jogo, podem acontecer vários eventos não mensuráveis e casuísticos, como a motivação da equipe (por exemplo, quando tem que jogar com o seu arqui-rival, ou quando o técnico de seleção nacional está no estádio e uma convocação para a seleção nacional está 36 Capítulo 3. Teoria de Probabilidade Intervalar próxima), condições geográficas e climáticas (clima tropical, altura, previsão de chuva no momento do jogo, etc), decisões arbitrárias do árbitro (por exemplo, expulsão injusta de um jogador), doenças do jogador principal da equipe, etc. Este tipo de eventos imprecisos fazem com que uma probabilidade exata ou tradicional de um resultado em uma partida de futebol seja irrealista. Os sistemas de classificação fornecem uma medida que descreve a superioridade de um time de futebol em detrimento de outro time de futebol em uma competição. Esta medida usa alguns eventos passados de cada equipe na competição atual e determina um valor numérico para o desempenho de cada equipe e, em seguida, calcula a distância entre os dois valores. A fim de fazer previsões de apostas de classificação de jogos devem-se de alguma forma ser traduzidos em uma distribuição de probabilidades para os resultados possíveis no contexto de futebol. Por exemplo, a diferença de gols pode fornecer uma medida da dominância de um time de futebol sobre o outro time em uma partida, os resultados nas últimas rodadas na competição podem ser outro item a ser considerado a fim de determinar essas medidas. Existem vários sistemas computacionais disponíveis na internet (ver por exemplo, http://betting.football-data.co.uk/ratings.php, e http://www.mat.ufmg.br/futebol/index.html) que, com base neste princípio calcula a probabilidade de um time ganhar de outro time no próximo jogo em algumas ligas de futebol específicos. No caso de http://www.mat.ufmg.br/futebol/index.html, o desenvolvimento determina a probabilidade da equipe de casa ganhar, perder ou empatar, e, analogamente, para a equipe visitante, ambos de forma independente do time rival. Eles supõem que tais probabilidades dependem apenas da história das equipes na atual competição; que ser o time local ou a equipe visitante é um fator importante, mas equipes diferentes reagem de forma diferente a esse fator; ganhar o jogo anterior aumentar a sua probabilidade de ganhar o próximo jogo e, analogamente, para o caso de perder ou empatar o último jogo. Estes sítios consideram apenas um pequeno conjunto de variáveis que são fáceis de mensurar e realizar algumas escolhas, por exemplo, na escolha dos pesos de cada uma das variáveis consideradas. Assim, a probabilidade que eles calculam são fortemente dependentes das escolhas e, portanto, não são precisas. Assim, parece mais natural o uso de algum tipo de probabilidade imprecisa. Aqui, será seguido o mesmo princípio considerado em http://www.mat.ufmg.br/futebol/index.html, porém será definido um modelo adequado e, dada a imprecisão no ato de definir os pesos, serão considerados números intervalares ao invés de valores reais. 37 Capítulo 3. Teoria de Probabilidade Intervalar 3.4.1 Um modelo para calcular a probabilidade imprecisa para previsão em um jogo de futebol Considere as seguintes variáveis para calcular a probabilidade de ganhar de um time A (casa) para um time B (visitante): 1. Sejam h1 , . . . , hn as últimas n partidas do time A em casa, ordenada pelo tempo, i.e. h1 foi a última partida jogada por A em casa, h2 foi a última partida jogada por A em casa, etc. 2. Sejam v1 , . . . , vn as últimas n partidas do time B como visitante, ordenada pelo tempo, i.e. v1 foi a última partida jogada por B como visitante, v2 foi a penúltima partida jogada por B como visitante, etc. 3. Sejam a1 , . . . , an as últimas n partidas do time A, ordenada pelo tempo, i.e. a1 foi a última partida jogada por A, a2 foi a penúltma partida jogada por A, etc. 4. Sejam b1 , . . . , bn as últimas n partidas do time B, ordenada pelo tempo, i.e. b1 foi a última partida jogada por B, b2 foi a penúltma partida jogada por B, etc. n 5. Os pesos w1 , . . . , wn das n últimas partidas são intervalos tais que ∑ wi é um interi=1 n valo contendo 1, i.e. 1 ∈ ∑ wi . i=1 6. Um fator de ajuste α e β em (0, 1] o qual mede a qualidade do adversários (α para A e β para B) de tal modo que enquanto é melhor é o time, mais próxima de 0 é a sua medida de qualidade. O valor de n pode ser calculado como uma função do número de ciclos na competição atual e seu respectivo peso deve ser maior para os jogos mais recentes. α e β podem ser dados de forma ad-hoc pelo perito que considera alguns aspectos subjetivos, tais como: o nível da equipe na competição atual, se para o jogo de todos os jogadores da equipe estão em boas condições para atuar, se houver um jogador de volta de uma lesão, o juiz, se o artilheiro da equipe está em uma boa ou uma má fase, etc. Mas também pode ser determinada através da utilização de um modelo matemático com base no presente índice na tabela de resultados da competição. Neste trabalho, será considerada esta última abordagem: Seja p> e p⊥ a máxima e mínima pontuação de todos os times de competição, respectivamente, pA é a pontuação A e pB a pontuação de B. Em seguida, o fator de ajuste de A e B são pA − p⊥ pB − p⊥ α = 1− and β = 1 − . (3.10) 2(p> − p⊥ ) 2(p> − p⊥ ) 38 Capítulo 3. Teoria de Probabilidade Intervalar A probabilidade do time A ganhar ao time B: n β ∑ wi (φ(hi ) + φ(ai )) Pganhar (A, B) = i=1 (3.11) 8 onde 4, 3, φ(m) = 2, 1, 0, se A vence a partida m por mais de 1 gol se A vence a partida m por um gol 1 gol se A empata a partida m se A perde a partida m por 1 gol se A perde a partida m por mais que um 1 gol A probabilidade do time A perder para o time B: n α ∑ wi (ψ(vi ) + ψ(bi )) Pperder (A, B) = i=1 (3.12) 8 onde 4, 3, ψ(m) = 2, 1, 0, se B venve a partida m por mais de 1 gol se B vence a partida m por 1 gol se B empata a partida m se B perde a partida m por 1 gol if B perde a partida m por mais que 1 gol Probabilidade do time A e o time B empatar a partida: n n β ∑ wi (θ(A, hi ) + θ(A, ai )) + α ∑ wi (θ(B, vi ) + θ(B, bi )) Pempate (A, B) = i=1 i=1 8 onde 2, 1, θ(X, m) = 0, 1, 0, se X se X se X se X se X empata a partida m ganha ou perde a partida m por 1 gol ganha ou perde a partida m por mais que 1 gol perde a partida m por 1 gol perde a partida m por mais que 1 gol 39 (3.13) Capítulo 3. Teoria de Probabilidade Intervalar Posição 1 2 3 4 5 6 7 8 9 País Argentina Equador Colômbia Venezuela Uruguai Chile Bolívia Peru Paraguai Jogos 9 9 8 9 9 9 9 9 9 Vitórias 6 5 5 3 3 4 2 2 2 Empates 2 2 1 3 3 0 2 2 1 Perdas 1 2 2 3 3 5 5 5 6 Pontos 20 17 16 12 12 12 8 8 7 Tabela 3.1: Atual tabela de Clasificação Sul-Americana para Copa do Mundo de 2014FIFA 3.4.2 Um exemplo considerando a atual classificação sul-americana para copa do mundo de 2014-FIFA Após 10 rodadas (em cada rodada uma seleção não joga), a tabela de resultados da Clasificação Sul-Americana para Copa do Mundo de 2014-FIFA no Brasil é ilustrada na tabela 3.1. Será tomado n = 4 e os seguintes números intervalares com pesos: w1 = [0.3, 0.5], w2 = [0.2, 0.4], w3 = [0.1, 0.3] e w4 = [0, 0.2]. Os valores de α e β, são calculados usando 25 5 1 = 26 e β = 1 − 26 = 21 Eq. (3.10), são α = 1 − 26 26 . O resultado do Peru nos últimos quatro jogos em casa foram: • Peru 1 e Argentina 1 (φ(h1 ) = 2 e θ(Peru, h1 ) = 2); • Peru 2 e Venezuela 1 (φ(h2 ) = 3 e θ(Peru, h2 ) = 1 ); • Peru 0 e Colômbia 1 (φ(h3 ) = 1 e θ(Peru, h3 ) = 1); e • Peru 2 e Paraguai 0 (φ(h4 ) = 4 e θ(Peru, h4 ) = 0). Os últimos quatro jogos do Peru foram: • Paraguai 1 e Peru 0 (φ(a1 ) = 1 e θ(Peru, a1 ) = 1); • Bolívia 1 e Peru 1 (φ(a2 ) = 2 e θ(Peru, a2 ) = 2); • Peru 1 e Argentina 1 (φ(a3 ) = 2 e θ(Peru, a3 ) = 2); e 40 Capítulo 3. Teoria de Probabilidade Intervalar • Peru 2 e Venezuela 1 (φ(a4 ) = 3 e θ(Peru, a4 ) = 1). Portanto, considerando Eq. (3.11), Pganhar (Peru,Chile) = 21 26 ([0.3,0.5](2+1)+[0.2,0.4](3+2)+[0.1,0.3](1+2)+[0,0.2](4+3)) 8 = 21 208 ([0.3, 0.5]3 + [0.2, 0.4]5 + [0.1, 0.3]3 + [0, 0.2]7) = 21 208 ([0.9, 1.5] + [1, 2] + [0.3, 0.9] + [0, 1.4]) = 21 208 [2.2, 5.8] = 231 609 1040 , 1040 ≈ [0.22, 0.58] Analogamente, a fim de calcular a probabilidade intervalar do Peru perder para o Chile no próximo jogo, serão mostrados os últimos quatro resultados de Chile como visitante e suas últimas quatro partidas. O resultado dos últimos quatro jogos para o Chile como visitante foram: • Equador 3 e Chile 1 (ψ(v1 ) = 0 e θ(Chile, v1 ) = 0); • Venezuela 0 e Chile 2 (ψ(v2 ) = 4 e θ(Chile, v2 ) = 0); • Bolívia 0 e Chile 2 (ψ(v3 ) = 4 e θ(Chile, v3 ) = 0); e • Uruguai 4 e Chile 0 (ψ(v4 ) = 0 e θ(Chile, v4 ) = 0). Os últimos quatro jogos do Chile foram: • Chile 1 e Argentina 2 (ψ(b1 ) = 1 e θ(Chile, b1 ) = 1); • Equador 3 e Chile 1 (ψ(b2 ) = 0 e θ(Chile, b2 ) = 0); • Chile 1 e Colômbia 3 (ψ(b3 ) = 0 e θ(Chile, b3 ) = 0); e • Venezuela 0 e Chile 2 (ψ(a4 ) = 4 e θ(Chile, b4 ) = 0). Portanto, considerando Eq. (3.12), 41 Capítulo 3. Teoria de Probabilidade Intervalar Pperder (Peru,Chile) = 25 26 ([0.3,0.5](0+1)+[0.2,0.4](4+0)+[0.1,0.3](4+0)+[0,0.2](0+4)) 8 = 25 208 ([0.3, 0.5] + [0.2, 0.4]4 + [0.1, 0.3]4 + [0, 0.2]4) = 25 208 ([0.3, 0.5] + [0.8, 1.6] + [0.4, 1.2] + [0, 0.8]) = 25 208 [1.5, 4.1] 75 205 = [ 416 , 416 ] ≈ [0.18, 0.49] Agora, a fim de calcular a probabilidade intervalar de empate do Peru com o Chile no próximo jogo, será usada a Eq. (3.13), Pempate (Peru,Chile) = 21 26 ([0.3,0.5](2+1)+[0.2,0.4](1+2)+[0.1,0.3](1+2)+[0,0.2](0+1)) 8 + 25 26 ([0.3,0.5](0+1)+[0.2,0.4](0+0)+[0.1,0.3](0+0)+[0,0.2](0+0)) 8 = 21 208 ([0.3, 0.5]3 + [0.2, 0.4]3 + [0.1, 0.3]3 + [0, 0.2]1)+ 25 208 ([0.3, 0.5]1 + [0.2, 0.4]0 + [0.1, 0.3]0 + [0, 0.2]0) = 21 208 ([0.9, 1.5] + [0.6, 1.2] + [0.3, 0.9] + [0, 0.2])+ 25 208 [0.3, 0.5)] = 21 25 208 [1.8, 3.8] + 208 [0.3, 0.5] ≈ [0.18, 0.38] + [0.03, 0.06] = [0.21, 0.44] Observe que, ao somar as probabilidade de Peru ganhar, empatar e perder tem-se que Pganhar (Peru,Chile) + Pperder (Peru,Chile) + Pempate (Peru,Chile) ≈ [0.22, 0.58] + [0.18, 0.49] + [0.21, 0.44] = [0.61, 1.51] e portanto contém 1, ou seja, satisfaz a Eq. (3.1). 42 Capítulo 3. Teoria de Probabilidade Intervalar Por outro lado, considere os seguintes pesos: w1 = [0.4, 0.5], w2 = [0.3, 0.4], w3 = [0.2, 0.3] e w4 = [0.1, 0.2]. Então, Pganhar (Peru,Chile) ≈ [0.4, 0.58], Pperder (Peru,Chile) ≈ [0.33, 0.49] e Pempate (Peru,Chile) ≈ [0.31, 0.44] e portanto Pganhar (Peru,Chile) + Pperder (Peru,Chile) + Pempate (Peru,Chile) ≈ [1.04, 1.51] Assim, para esses pesos a probabilidade intervalar usando este método não satisfaz a condição da Eq. (3.1). 3.5 Probabilidade Condicional Intervalar Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Seja Ω = {x1 , . . . , xr } e sejam A, B ⊆ Ω com IA e IB os seus respectivos conjuntos de índices. Se I satisfaz a restrição aritmética intervalar dada pela condição (3.1), Buckley essencialmente definiu a probabilidade condicional intervalar restrita de A com respeito de B, denotada por PIR(A | B), como sendo o conjunto PIR(A | B) = ∑ ai i∈IA ∩IB ∑ aj r :a∈Ie ∑ ai = 1 . i=1 j∈IB (3.14) Neste trabalho define-se a probabilidade condicional intervalar de A com respeito de B, denotada por PI(A | B), como sendo o conjunto PI(A | B) = ∑ ai i∈IA ∩IB ∑ aj j∈IB :a∈I . (3.15) Proposição 3.5.1 Dados A, B ⊆ Ω tem-se que PIR(A | B), PI(A | B) ∈ I([0, 1]). r Prova: Defina D = ∏ Ii e f : D → [0, 1] por i=1 ∑ ai f (a1 , . . . , ar ) = i∈IA ∩IB ∑ aj . (3.16) i∈IB Tem-se que f é contínua e D é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (3.15), é claro que 43 Capítulo 3. Teoria de Probabilidade Intervalar PI(A | B) = f (D), o que prova que PI(A | B) ∈ I([0, 1]). A condição PIR(A | B) ∈ I([0, 1]) prova-se analogamente. Seja PIR(A | B) = PIR(A ∩ B) PIR(A ∩ B) e PIR(A | B) = c PIR(A ∩ B) + PIR(A ∩ B) PIR(A ∩ B) + PIR(Ac ∩ B) e PI(A | B) = PI(A ∩ B) PI(A ∩ B) e PI(A | B) = c PI(A ∩ B) + PI(A ∩ B) PI(A ∩ B) + PI(Ac ∩ B) Então, pelas Observações 3.3.7 e 3.3.14, têm-se que PIR(A | B) = [PIR(A | B), PIR(A | B)] e PI(A | B) = [PI(A | B), PI(A | B)]. Observação 3.5.2 Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Dados A, B ⊆ Ω tem-se que PI(A | B) = {Pa (A|B) : a ∈ I} e se I satisfaz a condição (3.1) tem-se que ( PIR(A | B) = r a P (A|B) : a ∈ I e ) ∑ ai = 1 , i=1 onde ∑ ai Pa (A|B) = i∈IA ∩IB ∑ ai , para todo A ⊆ Ω, i∈IB ou seja, estas duas probabilidades condicionais intervalares podem ser vista como famílias de probabilidades condicionais clássicas. Proposição 3.5.3 Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Dados A, B ⊆ Ω tem-se que (i) PI(A | B) ⊆ PI(A ∩ B) ; PI(B) (ii) Se I satisfaz a condição (3.1) então PIR(A | B) ⊆ 44 PIR(A ∩ B) . PIR(B) Capítulo 3. Teoria de Probabilidade Intervalar Prova: Note que, ( ∑ i∈IA ∩IB PI(A | B) = ) ai :a∈I ∑ aj j∈IB ⊆ ai ∑ i∈IA ∩IB : a∈I r ∑ ai i=1 ∑ aj j∈IB : a∈I ∑r ai i=1 = PI(A ∩ B) . PI(B) O que prova o item (i). A prova do item (ii) segue analogamente. Teorema 3.5.4 Seja Ω = {x1 , . . . , xr }. Então, para cada A, B ⊆ Ω têm-se as seguintes propriedades: / Então, PI(A1 ∪ A2 | B) ⊆ PI(A1 | B) + PI(A2 | B). (i) Se A1 ∩ A2 = 0. (ii) [0] E PI(A | B) E [1]. (iii) PI(A | A) = [1]. (iv) Se B ⊆ A. Então, PI(A | B) = [1]. / Então, PI(A | B) = [0]. (v) Se A ∩ B = 0. Além disso, se I satisfaz a restrição aritmética intervalar dada pela condição (3.1) têm-se que (i) − (v) também são verdadeiros se substituir PI(· | ·) por PIR(· | ·). Prova: A prova dos itens ii, iii, iv e v são triviais. / então IA1 ∩ IA2 = 0. / Para provar o item i, é suficiente notar que Note que, se A1 ∩ A2 = 0, PI(A1 ∪ A2 | B) = i∈IA∑∩IBai + i∈IA∑∩IB ai 2 1 ∑ aj está contido em i∈IA∑∩IB ai 1 ∑ aj :a∈I j∈IB j∈IB :a∈I + i∈IA∑∩IB ai 2 ∑ aj :a∈I j∈IB o que é óbvio. Note que, o último termo da igualdade acima PI(A1 | B) + PI(A2 | B). É claro que a última afirmação do teorema é facilmente verificada. 45 coincide com Capítulo 3. Teoria de Probabilidade Intervalar O próximo objetivo é provar a versão intervalar do importante teorema da probabilidade total, mas para isto é preciso alguns resultados prévios. Lema 3.5.5 Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Dados A, B ⊆ Ω tem-se que (i) PI(A ∩ B) ⊆ PI(A | B) · PI(B); (ii) Se I satisfaz a restrição aritmética intervalar dada pela condição (3.1) tem-se que PIR(A ∩ B) ⊆ PIR(A | B) · PIR(B). Prova: Note que PI(A ∩ B) = ∑ i∈IA ∩IB r ∑ ai i=1 ai ( ∑ ai i∈IA ∩IB ⊆ ∑ aj j∈IB :a∈I ) ∑ aj j∈IB :a∈I :a∈I · r ∑ ai i=1 = PI(A | B) · PI(B). O que prova o item (i). A prova de (ii) é análoga. Lema 3.5.6 Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Dados A, B,C ⊆ Ω tem-se que (i) PI(A ∩ B | C) ⊆ PI(A | C) · PI(B | A ∩C); (ii) Se I satisfaz a restrição aritmética intervalar dada pela condição (3.1) tem-se que PIR(A ∩ B | C) ⊆ PIR(A | C) · PIR(B | A ∩C). Prova: Note que ( ∑ i∈IA ∩IB ∩IC PI(A ∩ B|C) = ) ai :a∈I ∑ ai i∈IC ( ⊆ ∑ i∈IA ∩IB ∩IC ∑ i∈IA ∩IC ) ( ai ai :a∈I · ∑ i∈IA ∩IC ∑ ai i∈IC = PI(B|A ∩C) · PI(A|C). O que prova o item (i). A prova do item (ii) segue analogamente. 46 ai ) :a∈I Capítulo 3. Teoria de Probabilidade Intervalar Teorema 3.5.7 (Teorema da Probabilidade Total Intervalar) Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que k S Ai ∩ A j = 0/ se i 6= j e X = Ai . Seja D um evento qualquer. Então, i=1 k (i) PI(D) ⊆ ∑ PI(Ai ) · PI(D | Ai ); i=1 (ii) Se I satisfaz a restrição aritmética intervalar dada pela condição (3.1) tem-se que k PIR(D) ⊆ ∑ PIR(Ai ) · PIR(D | Ai ). i=1 Prova: Desde que, D = k S (Ai ∩ D), então pelo Teorema 3.3.12, i=1 PI(D) ⊆ PI(A1 ∩ D) + . . . + PI(Ak ∩ D). Portanto, pelo Lema 3.5.5, PI(D) ⊆ PI(A1 ) · PI(D | A1 ) + . . . + PI(Ak ) · PI(D | Ak ). O que prova o item (i). A demonstração do item (ii) segue analogamente utilizando o Teorema 3.3.5 e o Lema 3.5.5. Teorema 3.5.8 (Teorema da Probabilidade Condicional Total Intervalar) Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que Ai ∩ A j = 0/ se i 6= j e X = k S Ai . Sejam B,C ⊆ Ω. Então, i=1 k (i) PI(B|C) ⊆ ∑ PI(Ai |C) · PI(B | Ai ∩C); i=1 (ii) Se I satisfaz a restrição aritmética intervalar dada pela condição (3.1) tem-se que k PIR(B|C) ⊆ ∑ PIR(Ai |C) · PIR(B | Ai ∩C). i=1 Prova: Como B = k S B ∩ A j , pelo Teorema 3.5.4 tem-se que j=1 k PI(B|C) ⊆ ∑ PI(B ∩ A j |C). j=1 Mas, pelo Lema 3.5.6 PI(B ∩ A j |C) ⊆ PI(A j |C) · PI(B|A j ∩C), 47 Capítulo 3. Teoria de Probabilidade Intervalar o que prova o item (i). O item (ii) segue analogamente. O próximo objetivo é provar a versão intervalar do Teorema de Bayes em teoria clássica de probabilidades, o qual é de grande importância em diagnósticos médicos, avaliações, tomada de elaboração e implementação de inferência estatística. Teorema 3.5.9 Teorema de Bayes Intervalar Seja I = (I1 , . . . , Ir ) um conjunto ordenado de intervalos positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que Ai ∩ A j = 0/ se i 6= j eX= k S Ai . Seja D um evento qualquer, então, i=1 (i) PI(Ai | D) ⊆ PI(Ai ∩ D) k ; ∑ PI(A j ) · PI(D | A j ) j=1 (ii) Se I satisfaz a restrição aritmética intervalar dada pela condição (3.1) tem-se que PIR(Ai | D) ⊆ PIR(Ai ∩ D) k ; ∑ PIR(A j ) · PIR(D | A j ) j=1 Prova: Direto da Proposição 3.5.3 e do Teorema 3.5.7 tem-se que PI(Ai | D) ⊆ PI(Ai ∩ D) ⊆ PI(D) PI(Ai ∩ D) k , ∑ PI(A j ) · PI(D | A j ) j=1 o que prova o item (i). A Prova do item (ii) é análoga. 3.6 Cadeias de Markov Intervalares A teoria de probabilidade moderna estuda processos de predições no qual o conhecimento dos resultados anteriores influencia previsões para futuros experimentos. Em princípio, quando observa-se uma seqüência de experimentos aleatórios, todos os resultados anteriores podem influenciar as previsões para o próximo experimento. Por exemplo, este deveria ser o caso na previsão de notas de um aluno em uma seqüência de exames em um curso. Mas, permitir essa maior generalidade tornaria a prova de resultados gerais muito mais complexas. Em 1907, A.A. Markov introduziu o estudo de um novo e importante tipo de processo aleatório, hoje em dia chamado de cadeias de Markov. Estes processos constituem um tipo especial de processo estocástico que possui a propriedade de que as probabilidades associadas com o processo num dado instante do futuro dependem apenas do estado presente, sendo, portanto, independentes dos eventos no passado. Desse modo, os processos markovianos são caracterizados pelo que se designa como "perda de memória", isto é, se o seu comportamento futuro apenas for condicionado pelo estado presente, independentemente do seu histórico ou dos estados visitados no passado. 48 Capítulo 3. Teoria de Probabilidade Intervalar As Cadeias de Markov são um caso particular de processos estocásticos, onde os estados são discretos (o parâmetro, em geral o tempo, pode ser discreto ou contínuo), que satisfazem a propriedade Markoviana, chamada assim em homenagem ao matemático Andrei Andreyevich Markov1 , As cadeias de Markov possui uma vasta área de aplicações, tais como: diagnóstico médicos [165], reconhecimento de genes humanos em DNA [92], aquisição de habilidades de manifestação humana [67], teoria de jogos [147], reconhecimento de voz [124], tomada de decisão [16, 52, 3], reconhecimento automático de expressões faciais [97], reconhecimento da escrita cursiva [35, 146], análise econômica [9], entre outras. Surgiram diversas formas de estender a noção de cadeias de Markov, para lidar com este tipo de situações. Entre elas destacamos as cadeias de Markov intervalares [29], fuzzy [20]. As cadeias de Markov intervalares se caracterizam pelo fato de permitir a análise e o tratamento da incerteza em processos markovianos, assim como o controle automático e rigoroso em cálculos computacionais envolvendo esses tipos de modelos. 3.6.1 Cadeias de Markov Intervalares finitas com tempo discreto Nesta seção, com o intuito de unificar as teorias de cadeias de Markov intervalar, P será denotada como qualquer uma das funções de probabilidade intervalar PIR ou PI. Nesta seção considera somente cadeias de Markov intervalares finitas com tempo discreto, ou seja, aquelas nas quais os estados mudam em certos instantes de tempo discreto, indexados por uma variável inteira n. A cada passo de tempo n, a cadeia de Markov tem um estado, denotado por Xn , que pertence a um conjunto finito S de possíveis estados. Sem perda de generalidade, suponha que o conjunto de estados é S = {1, . . . , m}, onde m é um inteiro positivo. A cadeia de Markov é descrita em termos de suas probabilidades intervalares de transição Pi j : sempre que o estado passa a ser i, existe uma probabilidade intervalar Pi j que o próximo estado seja j. Matematicamente, se i, j ∈ S, Pi j = P(Xn+1 = j | Xn = i). A suposição principal que norteia os processos de Markov é que as probabilidades intervalares de transição Pi j estão definidas sempre que o estado i seja visitado, independente do que aconteceu no passado e de como o estado i foi atingido. Matematicamente, suponha a seguinte propriedade de Markov, que demanda: P(Xn+1 = j | Xn = i, Xn−1 = in−1 , . . . , X0 = i0 ) = P(Xn+1 = j | Xn = i) = Pi j 1 Andrey Markov obteve os primeiros resultados para estes processos em 1906. Uma generalização para espaços de estados infinitos contáveis foi dada por Kolmogorov em 1936. Cadeias de Markov estão relacionadas ao movimento Browniano e à hipótese ergódica, dois importantes tópicos da física nos primeiros anos do século XX, mas a motivação de Markov para o desenvolvimento da teoria parece ter sido estender a teoria dos números grandes para eventos dependentes. 49 Capítulo 3. Teoria de Probabilidade Intervalar para todos os tempos n, todos os estados i, j ∈ S e todas as sequências possíveis i0 , . . . , in−1 de estados passados. Em outras palavras, a lei de probabilidade intervalar do estado seguinte Xn+1 depende do passado apenas através do valor do estado presente Xn . Defina a probabilidade intervalar de transição de n-passos Pi j (n) como a probabilidade intervalar de Xn estar no estado j dado que X0 está no estado i. Matematicamente, Pi j (n) = P(Xn = j | X0 = i). Note que, pelo Teorema da probabilidade total intervalar tem-se que m m P(Xn = j) ⊆ ∑ P(X0 = i) · P(Xn = j | X0 = i) = ∑ P(X0 = i) · Pi j (n). i=1 i=1 Observação 3.6.1 Note que, pela Observação 3.5.2 os processos Markovianos intervalares podem ser olhados como famílias de processos Markovianos clássicos. Mais precisamente, pode-se olhar as probabilidades de transição intervalares Pi j como uma família de probabilidades de transição clássica da seguinte forma n o a Pi j = {Pa (X1 = j | X0 = i) : a ∈ I} = Pi j : a ∈ I , se P = PI ou ( r Pa (X1 = j | X0 = i) : a ∈ I e Pi j = ) ∑ ai = 1 ( = a Pi j ) r :a∈Ie i=1 ∑ ai = 1 , i=1 se P = PIR. De forma análoga pode-se caracterizar a probabilidade intervalar de transição de n-passos Pi j (n) como uma família de probabilidades de transição de n-passos clássica, da seguinte forma n o a Pi j (n) = {Pa (Xn = j | X0 = i) : a ∈ I} = Pi j (n) : a ∈ I , se P = PI ou ( Pi j (n) = r a P (Xn = j | X0 = i) : a ∈ I e ) ∑ ai = 1 i=1 ( = a Pi j (n) r :a∈Ie ∑ ai = 1 ) , i=1 se P = PIR. A seguir será provado a versão intervalar da importante equação de Chapman-Kolmogorov, pois ela fornece um método eficaz para computar as probabilidades intervalares de transição de n-passos Pi j (n). 50 Capítulo 3. Teoria de Probabilidade Intervalar Teorema 3.6.2 Sejam s,t ∈ N. Então, m Pi j (s + t) ⊆ ∑ Pik (s) · Pk j (t). k=1 Prova: Note que, os eventos {Xs = k}, com k = 1, . . . , m, formam uma partição do conjunto Ω no sentido que são mutuamente disjuntos e cobrem Ω. Logo, pelo Teorema 3.5.8, tem-se que Pi j (s + t) = P(Xs+t = j|X0 = i) ⊆ m ∑ P(Xs = k|X0 = i) · P(Xs+t = j|Xs = k, X0 = i). k=1 Mas, pela propriedade de Markov, tem-se que P(Xs+t = j|Xs = k, X0 = i) = P(Xs+t = j|Xs = k) = P(Xt = j|X0 = k), ou seja, m Pi j (s + t) ⊆ m ∑ P(Xs = k|X0 = i) · P(Xt = j|X0 = k) = ∑ Pik (s) · Pk j (t). k=1 k=1 Um estado j é dito ser acessível intervalarmente a partir do estado i, e será escrito i → j, se existir n ∈ N tal que Pi j (n) > 0. Isto significa que se iniciar com o estado i, existe uma probabilidade intervalar positiva (mas não necessariamente igual a [1]) que a cadeia estará no estado j após n passos. Como a Pi j (n) = {Pi j (n) : a ∈ I} se P = PI, e a r Pi j (n) = {Pi j (n) : a ∈ I e ∑ ai = 1}, se P = PIR, i=1 tem-se que j é acessível intervalarmente a partir do estado i se, e somente se, j é acessível a partir do estado i com respeito da probabilidade Pa para todo a ∈ I (respectivamente, a ∈ I com r ∑ ai = 1) se P = PI (respectivamente, se P = PIR.) i=1 Se um estado j é acessível intervalarmente a partir de i e i é acessível intervalarmente a partir de j, diz-se que i e j se comunicam intervalarmente, e será escrito i ↔ j. Esta relação de comunicação intervalar é uma relação de equivalência, ou seja, satisfaz as seguintes propriedades: Proposição 3.6.3 (1) (Reflexividade) i ↔ i, para todo estado i. (2) (Simetria) Se i ↔ j então j ↔ i. (3) (Transitividade) Se i ↔ k e k ↔ j então, i ↔ j. Prova: Como Pii (0) = P(X0 = i|X0 = i) = [1] > 0, tem-se a propriedade (1). A propriedade (2) segue trivialmente da definição. Resta provar a propriedade (3). Como i ↔ k e k ↔ j então, 51 Capítulo 3. Teoria de Probabilidade Intervalar m existem inteiros s,t ∈ N tais que Pik (s) > 0 e Pk j (t) > 0. Em particular, ∑ Pik (s) · Pk j (t) > 0. k=1 Portanto, pelo Teorema 3.6.2 tem-se que Pi j (s + t) > 0. Assim, i ↔ j. Como esta relação de comunicação intervalar é uma relação de equivalência, tem-se que o espaço de estados S pode ser decomposto em uma união finita disjunta de classes de equivalência módulo a relação "↔", ou seja, existem subconjuntos C1 , . . . ,Cs de S, dois a dois disjuntos, tais que S= s S Ci e tais que todos os estados em Ci se comunicam intervalarmente entre si. Os conjuntos i=1 C1 , . . . ,Cs são chamados de classes de comunicação intervalar da cadeia de Markov. Seja i um estado e AI(i) o conjunto de todos os estados que são acessíveis intervalarmente a partir de i. Diz-se que i é recorrente intervalarmente se para todo j que é acessível intervalarmente a partir de i tem-se que i é acessível intervalarmente a partir de j; ou seja, i satisfaz a propriedade que se j ∈ AI(i) então i ∈ AI( j). Em particular, tem-se que i é recorrente intervalarmente se, e somente se, i é recorrente com respeito das probabilidades crisp Pa para todo a ∈ I, se P = PI, ou r para todo a ∈ I com ∑ ai = 1, se P = PIR. i=1 Quando a cadeia de Markov começa no estado recorrente intervalarmente i, somente podem ser visitados os estados j ∈ AI(i) a partir dos quais i é acessível intervalarmente, ou seja, dado qualquer estado futuro, existe sempre alguma probabilidade intervalar de retornar ao estado i e, após um certo tempo, tem-se a certeza que isto de fato vai acontecer. Assim, repetindo este argumento indefinidamente, pode-se concluir que, se um estado recorrente intervalarmente i é visitado alguma vez, ele será revisitado uma infinidade de vezes. Um estado i que não é recorrente intervalarmente é dito transiente intervalarmente. Assim, o estado i é transiente intervalarmente se existirem estados j ∈ AI(i) tais que i não é acessível a partir de j. Em particular, tem-se que i é transiente intervalarmente se, e somente se, i é transiente com respeito da probabilidade crisp Pa para algum a ∈ I, se P = PI, ou para algum a ∈ I com r ∑ ai = 1, se P = PIR. i=1 Após a cadeia ter visitado o estado transiente intervalarmente i, há uma probabilidade intervalar positiva de visitar o estado j e, após algum tempo, isto de fato vai acontecer, e quando aconteça, o estado i nunca mais será visitado. Pode-se concluir, que um estado transiente intervalarmente será visitado somente um número finito de vezes. Note que, uma cadeia de Markov intervalar finita sempre possui pelo menos um estado recorrente intervalarmente pois, se todos os estados forem transiente intervalarmente então, pelo comentado acima, após um número finito de passos (tempo) a cadeia deixará todos os estados e nunca mais os visitarão. Para onde irá? Pode-se dividir os estados transientes intervalarmente em dois tipos: os fortemente transientes intervalarmente, ou seja, aqueles que são transientes com respeito da probabilidade crisp Pa para r todo a ∈ I, se P = PI, ou para todo a ∈ I com ∑ ai = 1, se P = PIR; e os fracamente transientes i=1 intervalarmente, ou seja, aqueles que são transientes com respeito da probabilidade crisp Pa e recorrentes com respeito da probabilidade crisp Pb para algum a, b ∈ I, se P = PI, ou para algum 52 Capítulo 3. Teoria de Probabilidade Intervalar r r i=1 i=1 a, b ∈ I com ∑ ai = ∑ bi = 1, se P = PIR. As propriedades de recorrência e transiência intervalar são propriedades solidárias, no seguinte sentido: Proposição 3.6.4 Se i ↔ j então (1) i é recorrente intervalarmente se, e somente se, j também é. (2) i é fortemente transiente intervalarmente se, e somente se, j também é. (3) i é fracamente transiente intervalarmente se, e somente se, j também é. Prova: O item (3) é uma consequência imediata dos itens anteriores, assim será provado apenas os itens (1) e (2). Foi visto que i é recorrente (resp. fortemente transiente) intervalarmente se, e somente se, i é recorrente (resp. transiente) com respeito da probabilidade crisp Pa para todo a ∈ I, se P = PI, ou r para todo a ∈ I com ∑ ai = 1, se P = PIR. Logo, o resultado segue de [127] [Proposition 2.8.1]. i=1 Segue desta proposição que se i é um estado recorrente intervalarmente, então o conjunto de estados AI(i) que são acessíveis intervalarmente de i formam uma classe de comunicação intervalar, a qual é recorrente intervalarmente, no sentido que todos os estados em AI(i) são recorrentes intervalarmente. Além disso, segue também que um estado transiente intervalarmente não pode ser acessível intervalarmente de um estado recorrente intervalarmente, ou seja, se i é recorrente intervalarmente e i → j então, j é recorrentes intervalarmente. Com o intuito de entender o comportamento a longo prazo das cadeias de Markov intervalares é importante entender o que acontece com cadeias que consistem somente de uma classe recorrente de comunicação intervalar. Por este motivo, é importante caracterizar as classes recorrentes de comunicação intervalar de acordo com a presença ou ausência de padrões de periodicidade nos tempos que um estado é visitado. Por isto, diz-se que uma classe recorrente de comunicação intervalar é periódica intervalarmente se seus estados podem ser agrupados em d > 1 subconjuntos disjuntos S1 , . . . , Sd de tal forma que todas as transições intervalares de um subconjunto levam ao seguinte subconjunto. Matematicamente, ( Se i ∈ Sk e Pi j > 0 então j ∈ Sk+1 , se k = 1, . . . , d − 1, j ∈ S1 , se k = d. Uma classe recorrente de comunicação intervalar que não é periódica é chamada de aperiódica intervalarmente, ou seja, em uma classe recorrente de comunicação intervalar periódica os estados se visitam intervalarmente seguindo a sequência de subconjuntos e, depois de d passos, termina no mesmo subconjunto. 53 Capítulo 3. Teoria de Probabilidade Intervalar É interesse desse trabalho o estudo dos estados estacionários de uma cadeia de Markov intervalar. Os estados estacionários representam uma característica crucial das cadeias de Markov pois, como será visto, elas controlam em vários aspectos o comportamento a longo prazo da cadeia. Mais precisamente, é interesse desse trabalho estudar as probabilidades intervalares de transição de n-passos Pi j (n) quando n é suficientemente grande. Se a cadeia de Markov intervalar possue duas ou mais classes de estados recorrentes é claro que o valor intervalar limite de Pi j (n) dependerá do estado inicial i, pois visitar j a longo prazo vai depender se j está ou não na mesma classe recorrente de comunicação intervalar que i. Por esta razão, será restringido nesse trabalho o estudo a cadeias de Markov que consistem somente de uma classe recorrente de comunicação intervalar e possivelmente alguns estados transientes intervalarmente. Note que, a sequência intervalar Pi j (n) pode não convergir, mesmo que a cadeia de markov intervalar possua uma única classe recorrente de comunicação intervalar. Por exemplo, considere a classe recorrente com dois estados, 1 e 2, tais que P12 = P21 = [1], ou seja a partir do estado 1 somente pode-se ir para o estado 2, e vice-versa. Portanto, se começar em um desses estados, estará no mesmo estado após um número par de transições e no outro estado após um número ímpar de transições. O que está por trás deste fenômeno é que a classe de comunicação intervalar é periódica e, para esta classe, Pi j (n) oscila. Será provado a seguir que para qualquer estado j, as probabilidades intervalares de transição de n-passos Pi j (n) aproximam-se de um valor intervalar limite, o qual é independente do estado inicial i, desde que exclua-se as duas situações descritas acima: classes recorrentes múltiplas e/ou classes periódicas. Teorema 3.6.5 (Teorema da Convergência Estacionária Intervalar) Considere uma cadeia de Markov intervalar com uma única classe recorrente de comunicação intervalar, a qual é aperiódica. Então, dado qualquer estado j existe um único intervalo π j = [π j , π j ] que satisfaz as seguintes propriedades: (1) lim Pi j (n) = π j , para todo i, j ∈ S. n→∞ m (2) π j ⊆ ∑ πk Pk j para todo j ∈ S. k=1 m m k=1 k=1 (3) ∑ πk ≤ 1 ≤ ∑ πk . (4) Têm-se que (a) π j = [0], se j é fortemente transiente intervalarmente. (b) π j = [0, π j ], com π j > 0, se j é fracamente transiente intervalarmente. (c) π j > 0, se j é recorrente intervalarmente. 54 Capítulo 3. Teoria de Probabilidade Intervalar Prova: Com o intuito de colocar os argumentos de forma mais claros, a demonstração será feita apenas no caso em que P = PI. O caso em que P = PIR é totalmente análogo. Como a Pi j (n) = {Pi j (n) : a ∈ I} e esta é uma igualdade entre intervalos fechados de números reais, tem-se que lim Pi j (n) = n o a lim Pi j (n) : a ∈ I . (3.17) n→∞ n→∞ Por outro lado, como a cadeia de Markov intervalar possui uma única classe recorrente de comunicação intervalar, têm-se que todas as cadeias de Markov crisp, com respeito das probabilidades crisp Pa , induzidas por esta cadeia de Markov intervalar também possuem uma única classe recorrente, a qual também é aperiódica. Portanto, pelo Teorema da Convergência de estados estaa cionários crisp ([127] Theorem 2.13.2 and Corollary 2.13.4), tem-se que para cada a ∈ I existe π j tal que a a (i) lim Pi j (n) = π j para todo i, j ∈ S; n→∞ m a a a (ii) π j = ∑ πk Pk j para todo j ∈ S; k=1 m a (iii) ∑ πk = 1; k=1 (iv) tem-se que a π j = 0, se j é transiente; a π j > 0, se j é recorrente. Defina π j = [π j , π j ], onde a π j = inf{π j : a ∈ I} e a π j = sup{π j : a ∈ I}. Os itens (1) e (4) seguem diretamente da igualdade (3.17) e da discussão acima. Pelo Teorema 3.6.2 sabe-se que m Pi j (n + 1) ⊆ ∑ Pik (n) · Pk j . k=1 Aplicando o limite quando n tende a infinito em ambos os membros, tem-se que a π j = lim Pi j (n + 1) ⊆ n→∞ m m lim Pik (n) · Pk j = ∑ n→∞ k=1 55 ∑ πk · Pk j , k=1 Capítulo 3. Teoria de Probabilidade Intervalar o que prova (2). a a Resta provar o item (3). Como π j = inf{π j : a ∈ I} e π j = sup{π j : a ∈ I} têm-se, pela a( j) compacidade de I, que existem a( j), b( j) ∈ I tais que π j = π j b( j) πj a( j) a ≥ π j para todo a ∈ I. Em particular, π j m m a(1) ≤ πj a( j) ∑ πj = ∑ πj e j=1 j=1 m m j=1 m ≤ a(1) ∑ πj a(1) ≥ πj =1 j=1 b( j) ∑ πj = ∑ πj b( j) e πj b( j) m ≥ j=1 j=1 Estas últimas igualdades seguem do item (iii) acima. 56 a(1) ∑ πj a( j) e π j = π j . Assim, π j = 1. a ≤ πj e para todo j = 1, . . . , m. Logo, Capítulo 4 Teoria Fuzzy 4.1 Considerações Iniciais A teoria dos conjuntos introduzida por Georg Cantor em torno de 1870, baseada na noção de pertinência de elementos a conjuntos provou ser uma das mais poderosas ferramentas da Matemática Moderna que permitiu estudar e modelar o desenvolvimento de outras ciências. No entanto, esta teoria clássica de conjuntos é muito rigorosa pois admite duas possibilidades: que um objeto pertença ou que não pertença ao conjunto, ou seja, esta teoria só permite valores "exatos", 0 (não há pertinência) e 1 (há pertinência) e não permite outras possibilidades que, no entanto, têm sido estudados nas áreas de modelos lógicos. Embora a teoria dos conjuntos clássicos seja a base de toda a matemática moderna, ela apresenta problemas para modelar uma enorme classe de problemas reais. Como por exemplo, o paradoxo de sorites (que em grego significa feixe ou monte), é atribuído a Eubulides de Mileto, um dialético adversário de Aristóteles. O paradoxo foi enunciado originalmente como segue: "Quando um monte de areia deixa de ser um monte de areia, caso seja retirado um grão de areia de cada vez?"A tradução da palavra inglesa fuzzy em português admite diversas possibilidades, entre elas: Incerto, difuso, nebuloso, vago, impreciso, felpudo, indistinto, entre outras. Porém, segundo Barros e Bassanezi [12] nenhuma dessas traduções é completamente fiel ao sentido amplo dado à palavra fuzzy em inglês. Isto tem dificultado um consenso sobre qual a tradução usa no contexto de lógica fuzzy, o que tem motivado que a grande maioria dos trabalhos sobre lógica fuzzy em português incorporem o anglicismo "fuzzy"em detrimento de suas traduções (as traduções de fuzzy mais usadas são difusa e nebulosa). Observe que um fenômeno similar ocorre com outras linguagens como Francês e Espanhol (castelhano). Em 1965, Loft A. Zadeh, devido à necessidade de ferramentas mais flexíveis a certos termos linguísticos subjetivos, como "aproximadamente", "em torno de", dentre outros, sugeriu uma teoria alternativa de conjuntos, onde a passagem da pertinência para a não pertinência fosse gradual e não abrupta, assim Zadeh publicou o seu 1◦ trabalho sobre conjuntos fuzzy, baseado na lógica multinível. Com este trabalho foi possível obter uma formalização matemática de um conjunto fuzzy, generalizando a teoria convencional dos conjuntos. 57 Capítulo 4. Teoria Fuzzy Desta forma, dados numéricos fuzzy podem ser representados por meio de subconjuntos reais fuzzy, chamados de números fuzzy com o tratamento dos aspectos imprecisos e ambíguos apresentados na lei da contradição. E a partir deste trabalho surge a expressão lógica fuzzy. Com a incorporação do conceito "grau de verdade", a teoria dos conjuntos fuzzy estende a teoria de conjuntos clássicos. Os grupos são rotulados qualitativamente (usando termos linguísticos, tais como: alto, morno, ativo, pequeno, perto, etc.) e os elementos deste conjuntos são caracterizados variando o seu grau de pertinência (valor que indica o grau em que um elemento pertence a um conjunto). Por exemplo, um homem de 1,80 metro e um homem de 1,75 metro pertencem ao conjunto dos "alto", embora o homem de 1,80 metro tenha um grau de pertinência maior neste conjunto. Os números fuzzy foram introduzidos em 1978 com os trabalhos de Steven Nahmias [112] e Didier Dubois e Henry Prade [48], porém o primeiro texto a abordar de forma profunda e rigorosa a aritmética fuzzy foi o livro de Arnald Kaufmann e Madan M. Gupta [77]. Desde então, esta área tem sido alvo de intensas pesquisas com aplicações nas mais diversas áreas, tais como: em Geologia [14], em eletricidade [47], em engenharia [64], administração financeira [41], etc. Existem diversas noções, sutilmente diferentes, para o conceito de números fuzzy (veja por exemplo [13, 64, 79, 95, 114]). Já para as operações aritméticas entre números fuzzy, há dois métodos equivalentes de se definir, uma via α-níveis e outra via princípio da extensão de Zadeh [79, 13]. No primeiro caso como os α-níveis de um número fuzzy são intervalos, as operações aritméticas se reduzem a operações da aritmética intervalar. No caso do princípio da extensão de Zadeh o grau de pertinência do número fuzzy resultante de uma operação aritmética ⊕ sobre números fuzzy A e B , tem como graus de pertinência µA ⊕B (x) = sup min(µA (y), B (z)) y⊕z=x Considerando que podem existir infinitos y e z tais que y + z = x, esta forma de calcular não é um método prático de ser implementado [64, p.53]. Por esta razão, em geral é mais usada a abordagem de α-níveis. Operações aritméticas sobre números fuzzy, além de ser uma estrutura algébrica pobre [37], não são simples de determinar. Porém, existem algumas subclasses de números fuzzy que são mais simples de manipular, tais como: números fuzzy triangulares, trapezoidais, L-R, quadráticos, etc. [64]. Mas, essas classes de números fuzzy não são fechadas sobre a multiplicação definida em termos de α-níveis, ou equivalente em termos do princípio da extensão de Zadeh [64]. Porém, essas definições de operações aritméticas, embora bem embasadas e justificadas, são muito específicas para uma teoria tão aberta e vaga como a teoria fuzzy. Há inúmeras aplicações da lógica fuzzy, dentre elas: O funcionamento de ar-condicionado onde o sistema fuzzy controla o aparelho de acordo com a temperatura e as preferências do usuário; as indústrias automobilísticas os sistemas fuzzy controlam a força com que os freios são acionados para evitar derrapagens. os elevadores que reduzem o tempo de espera baseado no tráfego; em 58 Capítulo 4. Teoria Fuzzy jogos de golfe na escolhas de tacos; etc. 4.2 Conjuntos Fuzzy Definição 4.2.1 Um conjunto fuzzy [158] A de um universo X (conjunto clássico) é uma função µA : X → [0, 1]. Esta função é chamada de função de pertinência por indicar "quanto"um elemento pertence ao conjunto fuzzy. Quando o universo estiver implícito o for irrelevante, A será chamado simplesmente conjunto fuzzy. O conjunto de todos os conjuntos fuzzy de universo X será denotado por F (X). Definição 4.2.2 Um conjunto fuzzy A é normal, se existe ao menos um elemento x ∈ X tal que µA (x) = 1. Definição 4.2.3 O suporte de um conjunto fuzzy A é o conjunto: S(A ) = {x ∈ X : µA (x) 6= 0}. Definição 4.2.4 O núcleo de um conjunto fuzzy A é o conjunto: N(A ) = {x ∈ X : µA (x) = 1}. Mais geralmente, define-se o seguinte conjunto: Definição 4.2.5 Dado qualquer α ∈ (0, 1], o α-nível de um conjunto fuzzy A , é o conjunto clássico: Aα = {x ∈ X : µA (x) ≥ α}. O α-nível para α = 0 é definido como o fecho do suporte de A , ou seja, A0 = fecho(S(A )). Observe que, para α = 1, o Aα corresponde aos elementos de N(A ). Será provado que qualquer conjunto fuzzy é completamente determinado pelos seus α-níveis. Teorema 4.2.6 Seja A um conjunto fuzzy em X com a função de pertinência µA (x). Seja Aα o α-nível do conjunto fuzzy A e χAα (x) a função característica do conjunto crisp Aα para α ∈ (0, 1]. Então, µA (x) = sup (α ∧ χAα (x)), x ∈ X. α∈(0,1] 59 Capítulo 4. Teoria Fuzzy Prova: Seja χAα a função característica do conjunto crisp Aα , ou seja ( χAα (x) = 1, se x ∈ Aα 0, se x 6∈ Aα Portanto, pela definição de α-nível tem-se que x ∈ Aα ⇒ χAα (x) = 1 ( e µA (x) ≥ α). e x 6∈ Aα ⇒ χAα (x) = 0 ( e µA (x) < α). Assim, sup (α ∧ χAα (x)) = ( (α ∧ χAα (x))) ∨ ( sup α∈(0,µA (x)] α∈(0,1] = ( (α ∧ 1)) ∨ ( sup α∈(0,µA (x)] = sup sup (α ∧ χAα (x))) α∈(µA (x),1] sup (α ∧ 0)) α∈(µA (x),1] α α∈(0,µA (x)] = µA (x). Note que, o resultado acima diz, em particular, que todo conjunto fuzzy é completamente determinado pelos seus α-níveis. Uma outra maneira de recuperar um conjunto fuzzy A a partir de seus α-níveis é pelo primeiro teorema da decomposição [79], onde A = supα∈[0,1] α · Aα . A figura 4.1 abaixo ilustra as componentes de um conjunto fuzzy em [158, 122, 164]. Figura 4.1: Exemplo de Conjunto Fuzzy 60 Capítulo 4. Teoria Fuzzy Definição 4.2.7 Um conjunto fuzzy A de Rn é convexo se todos seus α-níveis são conjuntos convexos (clássicos), ou seja, se a relação µA (t) ≥ Min[µA (r), µA (s)] onde t = λr + (1 − λ)s; r, s ∈ Rn , λ ∈ [0, 1] é verdadeira. As figuras 4.2 e 4.3 são exemplos de conjuntos fuzzy convexos. E a figura 4.4 é um exemplo de um conjunto fuzzy não-convexo. Figura 4.2: Conjunto Fuzzy Convexo 61 Capítulo 4. Teoria Fuzzy Figura 4.3: Conjunto Fuzzy Convexo µA (t) ≥ µA (r) Figura 4.4: Conjunto Fuzzy Não-Convexo 4.2.1 Operações Conjuntistas sobre conjuntos Fuzzy Nesta seção serão vistas algumas operações básicas de conjuntos clássicos, tais como: o complemento, a união e a interseção. Estas operações podem ser generalizadas para conjuntos fuzzy em mais de uma maneira. No entanto, uma generalização particular, tem um significado especial na teoria dos conjuntos fuzzy. • Seja A ∈ F (X). O Complementar de A , denotado por A , é o conjunto fuzzy cuja função de pertinência é dada por: µA (x) = 1 − µA (x) • Sejam A e B ∈ F (X). A União de A com B , denotado por A ∪ B , é o conjunto fuzzy cuja 62 Capítulo 4. Teoria Fuzzy função de pertinência é dada por: µA ∪B (x) = max[µA (x), µB (x)] • Sejam A e B ∈ F (X). A Interseção de A com B , é denotado por A ∩ B , é o conjunto fuzzy cuja função de pertinência é dada por: µA ∩B (x) = min[µA (x), µB (x)] • Sejam A e B ∈ F (X). A Inclusão de A em B , denotado por A ⊆ B , ocorre se: A ⊆ B ⇔ µA (x) ≤ µB (x) para todo x ∈ X • Sejam A ∈ F (X) e B ∈ F (Y ). O Produto Cartesiano de A com B , denotado por A × B , é o conjunto fuzzy cuja função de pertinência é dada por: µA ×B (x, y) = min[µA (x), µB (y)]. Proposição 4.2.8 Sejam A e B conjuntos fuzzy com o mesmo universo. Então, A ⊆ B se, e somente se, para todo α ∈ (0, 1], Aα ⊆ Bα . Em particular, A = B ⇔ Aα = Bα para todo α ∈ (0, 1]. Prova: suponha que A ⊆ B . Seja α ∈ (0, 1]. Se x ∈ Aα , então µA (x) ≥ α. Como µA (x) ≤ µB (x), tem-se que µB (x) ≥ α. Logo, x ∈ Bα e portanto, Aα ⊆ Bα . Reciprocamente, suponha que Aα ⊆ Bα , ∀α ∈ (0, 1]. Então, pelo Teorema 4.2.6, tem-se que µA (x) = sup (α ∧ χAα ) α∈(0,1] = ≤ sup (α ∧ χBα ) α∈(0,1] = µB (x). Logo, A ⊆ B . Note que, como mostrado nas figuras 4.6, 4.7 e 4.8, aplicando estas operações padrão para os conjuntos fuzzy na figura 4.5, podemos obter por exemplo, que A2 = A1 ∩ A3 . 63 Capítulo 4. Teoria Fuzzy Figura 4.5: Função de Pertinência que representam os conceitos de um jovem, meia-idade e idosos Figura 4.6: Função de Pertinência que representa o complemento do conjunto fuzzy A1 64 Capítulo 4. Teoria Fuzzy Figura 4.7: Função de Pertinência que representa o complemento do conjunto fuzzy A3 Figura 4.8: A2 = A1 ∩ A3 65 Capítulo 4. Teoria Fuzzy Teorema 4.2.9 Sejam A , B e Ai ∈ F (X), ∀i ∈ I, onde I é um conjunto de índices. Então, para todo α, β ∈ (0, 1], as seguintes propriedades são satisfeitas [79]: (i) α ≤ β ⇒ Aα ⊇ Aβ (ii) (A ∩ B )α = Aα ∩ Bα (iii) (A ∪ B )α = Aα ∪ Bα [ [ i∈I \ i∈I \ i∈I i∈I (iv) (v) (Ai )α ⊆ ( (Ai )α = ( (vi) Aα = \ Ai )α Ai )α Aβ . β<α Prova: (i) Por definição, tem-se que: Aβ = {x ∈ X : µA (x) ≥ β}. ∀x ∈ Aβ , tem-se que µA (x) ≥ β, mas β ≥ α. Logo, µA (x) ≥ α, ou seja, x ∈ Aα . Portanto, Aβ ⊆ Aα . (ii) x ∈ (A ∩ B )α ⇔ µ(A ∩B ) (x) ≥ α ⇔ min[µA (x), µB (x)] ≥ α ⇔ µA (x)) ≥ α e µB (x) ≥ α ⇔ x ∈ Aα ∩ Bβ . Logo, (A ∩ B )α = Aα ∩ Bβ . (iii) x ∈ (A ∪ B )α ⇔ µ(A ∪B ) (x) ≥ α ⇔ max[µA (x), µB (x)] ≥ α ⇔ µA (x)) ≥ α ou µB (x) ≥ α ⇔ x ∈ Aα ∪ Bβ . Logo, (A ∪ B )α = Aα ∪ Bβ . (iv) x∈ [ (Ai )α ⇒ x ∈ (Ai )α , para algum i i∈I ⇒ µAi (x) ≥ α, para algum i ⇒ sup[µAi (x)] ≥ α i∈I ⇒ µ∪ A (x) ≥ α i∈I i [ ⇒ x ∈ ( Ai )α . i∈I 66 Capítulo 4. Teoria Fuzzy Logo, [ [ i∈I i∈I (Ai )α ⊆ ( Ai )α . (v) x∈ \ (Ai )α ⇔ x ∈ (Ai )α , ∀i i∈I ⇔ µAi (x) ≥ α, ∀i ⇔ inf[µAi (x)] ≥ α i∈I ⇔ µ∩ A (x) ≥ α i∈I i \ ⇔ x ∈ ( Ai )α . i∈I Logo, \ \ i∈I i∈I (Ai )α = ( Ai )α . (vi) ∀β < α, tem-se que por (i) que Aα ⊆ Aβ . Então, Aα ⊆ \ Aβ . β<α Seja x ∈ \ Aβ e ∀ε > 0, tem-se que x ∈ Aα−ε , ( onde α − ε < α), ou seja, β<α µA (x) ≥ α − ε, (ε → 0). Logo, µA (x) ≥ α. Portanto, x ∈ Aα . 4.3 Números Fuzzy Definição 4.3.1 Um número fuzzy [13] é um subconjunto fuzzy A de R tal que 1. A é normal; 2. A é convexo; 3. µA é semi-contínua superiormente1 4. S(A ) é limitado. De agora em diante, o conjunto de todos os números fuzzy será denotado por N . Observe que, para qualquer conjunto fuzzy A sobre R, µA é semi-contínua superiormente se, e somente se, Aα é fechado para todo α ∈ (0, 1]. Assim, para cada α, o α-nível de um número fuzzy A é um intervalo fechado, ou seja tem-se que Aα ∈ IR. Note que, todo conjunto clássico pode ser visto como um conjunto fuzzy, chamado de “crisp”. tem-se que cada número real, pode ser visto como um número “crisp”, da seguinte maneira. Seja r ∈ R, então o conjunto fuzzy (crisp) r tem a seguinte função de pertinência: ( µr (x) = 1, se x = r 0, se x 6= r 1 Uma função f : R → R é semi-contínua superiormente, se para todo α ∈ R, o conjunto {x ∈ R/ f (x) ≥ α} é fechado [114]. 67 Capítulo 4. Teoria Fuzzy Assim, r é um número fuzzy. Para um conjunto fuzzy A , um α-nível pode ser representado por um par de valores Aα1 e Aα2 que representam o domínio de um Aα . Teorema 4.3.2 Seja A ∈ F (R). Então, A é um número fuzzy se, e somente se, existir um intervalo fechado [a, b] 6= 0/ tal que µA (x) = 1, se x ∈ [a, b] u(x), se x ∈ (−∞, a) v(x), se x ∈ (b, ∞) onde u é uma função de (−∞, a) até (b, ∞) que é monotônica crescente, contínua pela direita, onde u(x) = 0 para x ∈ (∞, ω1 ); v é uma função de (b, ∞) até [0, 1] que é monotônica decrescente, contínua pela esquerda, onde v(x) = 0 para x ∈ (ω2 , ∞). Prova: Ver [79] 4.3.1 Números Fuzzy Triangulares e Trapezoidais Para facilitar o processamento computacional sobre números fuzzy, usualmente se usam tipos simples de números fuzzy. Entre os mais conhecidos estão os números fuzzy triangulares e os números fuzzy trapezoidais, ou seja, números fuzzy onde a forma no plano cartesiano da função de pertinência tem essas formas. Considere os números fuzzy trapezoidais, por serem mais gerais que os triangulares (todo número fuzzy triangular é um número fuzzy trapezoidal). Um número fuzzy trapezoidal A , é completamente determinado ou especificado por 4 valores (a, b, c, d): a indica o limite inferior do suporte de A , b indica o limite inferior do núcleo de A , c indica o limite superior do núcleo de A e d indica o limite superior do suporte de A . Note que, a função de pertinência de um número fuzzy trapezoidal A = (a, b, c, d) tem o seguinte comportamento: 0 1 µA (x) = x−a b−a d−x d−c se x ≤ a ou x ≥ d se b ≤ x ≤ c se a < x < b (4.1) se c < x < d Note que, o α-nível de um número fuzzy trapezoidal é dado por: Aα = [a + α(b − a), d − α(d − c)]. (4.2) Proposição 4.3.3 Sejam A = (a1 , b1 , c1 , d1 ) e B = (a2 , b2 , c2 , d2 ) dois números fuzzy trapezoidais. Então, A ⊆ B se, e somente se, a2 ≤ a1 ≤ d1 ≤ d2 e b2 ≤ b1 ≤ c1 ≤ c2 . 68 Capítulo 4. Teoria Fuzzy Figura 4.9: Número Fuzzy Trapezoidal Prova: Pela Proposição 4.2.8 , sabemos que A ⊆ B ⇔ Aα ⊆ Bα , ∀α ∈ (0, 1]. Mas, Aα = [(b1 − a1 )α + a1 , −(d1 − c1 )α + d1 ] e Bα = [(b2 − a2 )α + a2 , −(d2 − c2 )α + d2 ]. Logo, Aα ⊆ Bα se, e somente se, ∀α ∈ (0, 1], tem-se (b2 − a2 )α + a2 ≤ (b1 − a1 )α + a1 e −(d1 − c1 )α + d1 ≤ −(d2 − c2 )α + d2 . De onde segue o resultado. A seguir serão dadas algumas definições básicas para os números fuzzy trapezoidais. Seja A = (a, b, c, d) um número fuzzy trapezoidal. então • A é simétrico se a = −d e b = −c. • A é degenerado ou crisp se a = b = c = d. • A é um número fuzzy triangular se b = c e é denotado por A = (a, b, d). 4.3.2 Operações Aritméticas de Números Fuzzy Nesta seção, será apresentada a aritmética fuzzy através da aritmética intervalar e não pelo princípio de extensão de Zadeh, através do qual as operações dos números reais são estendidas às operações em números fuzzy. Na verdade, o cálculo da aritmética fuzzy através dos α-níveis 69 Capítulo 4. Teoria Fuzzy usando aritmética intervalar baseia-se no princípio de extensão de Zadeh. Não será apresentado neste trabalho este princípio de extensão. Assuma nesta seção que os números fuzzy são representados por funções de pertinência contínuas. Obtêm-se as operações de soma, subtração, multiplicação e divisão entre números fuzzy A e B como sendo os conjuntos fuzzy tais que seus α-níveis são determinados por: (A + B )α = Aα + Bα (4.3) (A − B )α = Aα − Bα (4.4) (A · B )α = Aα · Bα (4.5) (A /B )α = Aα /Bα (4.6) onde supõe-se que 0 não pertence ao suporte de A . Exemplo 4.3.4 Sejam A e B dois números fuzzy triangulares, dados por: µA (x) = 0, se x ≤ −1 e x > 3 (x + 1)/2, se −1 < x ≤ 1 (3 − x)/2, se 1<x≤1 e µB (x) = 0, se x≤1ex>5 (x − 1)/2, se 1<x≤3 (5 − x)/2, se 3<x≤5 Pela equação 4.2, tem-se que Aα = [2α − 1, 3 − 2α] e Bα = [2α + 1, 5 − 2α] Pelas equações 6.5 - 6.8, obtêm-se (A + B )α = [4α, 8 − 4α]∀α ∈ [0, 1] 70 Capítulo 4. Teoria Fuzzy (A − B )α = [4α − 6, 2 − 4α]∀α ∈ [0, 1] ( −4α2 + 12α − 5, 4α2 − 16α + 15 (A · B )α = 2 4α − 1, 4α2 − 16α + 15 ( (A /B )α = para α ∈ [0, 5] para α ∈ [5, 1] [(2α − 1) / (2α + 1) , (3 − 2α) / (2α + 1)] para α ∈ [0, 5] [(2α − 1) / (5 − 2α) , (3 − 2α) / (2α + 1)] para α ∈ [5, 1] Logo, (µA + µB )(x) = (µA − µB )(x) = se x≤0ex>8 x/4, se 0<x≤4 (8 − x)/4, se 4<x≤8 0, se x≤6ex>2 (x + 6)/4, se −6 < x ≤ −2 (2 − x)/4, se −2 < x ≤ 2 (µA · µB )(x) = 0, 0, h i 1/2 3 − (4 − x) /2 se x < −5 e x ≥ 15 (1 + x)1/2 /2 i h 4 − (1 + x)1/2 /2 para 0 ≤ x < 3 0, (x + 1) / (2 − 2x) (µA /µB )(x) = (5x + 1) / (2x + 2) (3 − x) / (2x + 2) para − 5 ≤ x < 0 para 3 ≤ x < 15 se x < −1 e x ≥ 3 para − 1 ≤ x < 0 para 0 ≤ x < 1/3 para 1/3 ≤ x < 3 Observação 4.3.5 As operações de soma e subtração de números fuzzy trapezoidais têm uma expressão bem simples: Sejam A = (a1 , b1 , c1 , d1 ) e B = (a2 , b2 , c2 , d2 ) dois números fuzzy trapezoidais. É fácil provar que, A + B = (a1 + a2 , b1 + b2 , c1 + c2 , d1 + d2 ) e A − B = (a1 − d2 , b1 − c2 , c1 − b2 , d1 − a2 ) No entanto, a multiplicação e a divisão de dois números fuzzy trapezoidais não necessariamente resulta num número fuzzy trapezoidal. 71 Capítulo 4. Teoria Fuzzy 4.3.3 Métrica sobre N Definição 4.3.6 Dados dois números fuzzy A e B , define-se a distância de Moore, dM (A , B ), por dM (A , B ) = sup dM (Aα , Bα ), α∈[0,1] onde dM (Aα , Bα ) é a distância de Moore entre os intervalos fechados Aα e Bα que são os α-níveis de A e B . Ou seja dM (A , B ) = sup max{|l(Aα ) − l(Bα )|, |r(Aα ) − r(Bα )|}. α∈[0,1] É fácil provar que esta noção de distância entre números fuzzy define uma métrica sobre N . Ou seja dM : N × N → R satisfaz as seguintes propriedades: Se A , B , C ∈ N então (i) dM (A , B ) ≥ 0; (ii) dM (A , B ) = 0 se , e somente se, A = B ; (iii) dM (A , B ) = dM (B , A ); (iv) dM (A , C ) ≤ dM (A , B ) + dM (B , C ). Essa métrica permite estudar a noção de sequências convergentes de números fuzzy. Observação 4.3.7 Se A e B forem números triangulares simétricos, então dM (A , B ) = dM (S(A ), S(B )). 4.3.4 Sequências e Limites de Números Fuzzy Nesta seção será estudada a noção de sequências convergentes em N , que será útil no estudo do comportamento a longo prazo de cadeias de Markov fuzzy. Definição 4.3.8 Uma sequência de números fuzzy é uma função f : N → N . Se f , g : N → N são duas sequências de números fuzzy, defina a soma f + g e o produto f · g como sendo as funções ( f + g)(n) = f (n) + g(n) e ( f · g)(n) = f (n) · g(n), para todo n ∈ N. Se f : N → N é uma sequência de números fuzzy, então para cada n ∈ N existem únicos An ∈ N tais que f (n) = An . Por este motivo, a sequência f : N → N será identificada como o conjunto formado pelas suas imagens {An ∈ N : n ∈ N}. 72 Capítulo 4. Teoria Fuzzy De agora em diante, {An }n∈N serão ditas uma sequência de números fuzzy, ou uma sequência em N , para representar a sequência f : N → N dada por f (n) = An . Note que, com esta identificação têm-se que a soma e o produto de sequências de números fuzzy podem ser descritas assim: {An }n∈N + {Bn }n∈N = {An + Bn }n∈N e {An }n∈N · {Bn }n∈N = {An · Bn }n∈N . Definição 4.3.9 Diz-se que a sequência {An }n∈N converge para A ∈ N , e escreve-se An → A ou lim An = A , n→∞ se dado ε > 0, existe n0 ∈ N tal que dM (An , A ) < ε para todo n ≥ n0 . Proposição 4.3.10 Se a sequência {An }n∈N em N converge então, as sequências {(An )α }n∈N em IR convergem, para todo α ∈ [0, 1]. Neste caso, tem-se que lim An = A ⇒ lim (An )α = Aα para todo α ∈ [0, 1]. n→∞ n→∞ Prova: Se lim An = A , então dado ε > 0, existe n0 ∈ N tal que dM (An , A ) < ε para todo n ≥ n0 . n→∞ Mas, dM (An , A ) = sup dM ((An )α , (A )α ). α∈[0,1] Logo, dM ((An )α , (A )α ) < ε para todo α ∈ [0, 1] e para todo n ≥ n0 . Portanto, lim (An )α = Aα para n→∞ todo α ∈ [0, 1]. 4.3.5 Relações de Ordem entre Números Fuzzy É possível estabelecer diversas (há mais de 40 apresentadas na literatura) ordens sobre números fuzzy [20]. Aqui serão usadas as seguintes ordens sobre números fuzzy: Definição 4.3.11 (Ordem da Inclusão) A ⊆ B ⇔ Aα ⊆ Bα para todo α ∈ (0, 1]. Definição 4.3.12 (Ordem de Kulisch-Miranker) A ≤K B ⇔ Aα ≤K Bα para todo α ∈ (0, 1]. Definição 4.3.13 (Ordem de Moore) A ≤M B ⇔ Aα ≤M Bα para todo α ∈ (0, 1]. 73 Capítulo 4. Teoria Fuzzy Definição 4.3.14 A B ⇔ Aα E Bα , para todo α ∈ (0, 1] onde, Aα E Bα ⇔ r(Aα ) < r(Bα ) ou (r(Aα ) = r(Bα ) e l(Bα ) ≤ l(Aα ) como na Definição 2.5.4. É fácil verificar que esta ordem sobre números fuzzy não é uma ordem total, ao contrário do que acontece com a ordem E sobre IR. A ordem está sendo introduzida neste trabalho e desenvolverá um papel importante nos capítulos subsequentes. Observação 4.3.15 Em [20], James Buckley define uma nova ordem sobre os números fuzzy, que a seguir será descrita: Sejam A e B dois números fuzzy. Buckley define primeiramente a noção de A <B B da seguinte forma. Defina γ(A , B ) = max{min(µA (x), µB (y))| x ≤ y}, Defina A <B B se, e somente se, γ(A , B ) = 1, mas γ(B , A ) < η, onde η é um número racional fixado em (0, 1], o qual ele geralmente considera como sendo 0.8. Defina agora A ≈ B se A <B B e B <B A são ambos falsos. Por último, defina A ≤B B se, e somente se, A <B B ou A ≈ B . Observação 4.3.16 Note que, a ordem é mais fina que a ordem de inclusão entre números fuzzy, no sentido que se A ⊆ B , então A B . Definição 4.3.17 Diz-se que um número fuzzy A é positivo, se todos seus α-níveis são intervalos positivos. Note que, se A é um número fuzzy positivo, então 0 A , porém a recíproca não é verdadeira, ou seja, existem números fuzzy B tais que 0 B mas para os quais existe um α-nível tal que l(Bα ) < 0 (por exemplo, B = (−1, 0.5/1/1.5, 2)). Lema 4.3.18 Sejam A , B e C números fuzzy. Então, B 1. Se A ⊆ B e C é positivo, então A C ⊆C 2. Se B ⊆ C são números fuzzy positivos, então A ⊆ A B C 3. Se A é um número fuzzy positivo, então B ⊆ A · B A 74 Capítulo 4. Teoria Fuzzy Prova: Será provada somente a primeira propriedade, pois as outras seguem de forma análoga. Como um número fuzzy positivo C tem a propriedade que l(Cα ) > 0 para cada α ∈ (0, 1]. Se Aα ⊆ Bα então l(Bα ) ≤ l(Aα ) ≤ r(Aα ) ≤ r(Bα ). Assim, l(Bα ) l(Aα ) r(Aα ) r(Bα ) ≤ ≤ ≤ . r(Cα ) r(Cα ) l(Cα ) l(Cα ) Portanto, ACαα ⊆ BCαα , i.e. AC ⊆ BC . 75 Capítulo 5 Teoria de Probabilidade Fuzzy 5.1 Considerações Iniciais A teoria da probabilidade tem sido uma ferramenta poderosa para lidar com a incerteza. Por exemplo, ela é capaz de lidar com eventos incertos, a previsão da temperatura do ar amanhã. Assumindo que a disponibilidade de alguns dados do passado, tornou possível calcular a probabilidade de, por exemplo, da temperatura do ar estar entre 20◦ C e 25◦ C. No entanto, os eventos tiveram de ser definidos com precisão. Na prática, porém, as pessoas costumam se deparar com eventos imprecisos, e perguntas como "qual é a probabilidade de um bom tempo amanhã ?"são consideradas válidas, embora estejam fora do alcance da teoria da probabilidade clássica. Além disso, atividades como a comunicação de informações, reconhecimento de voz, representação do conhecimento, diagnóstico médico, avaliação de eventos raros, sugerem que o cérebro humano, muitas vezes lide com afirmações vagas, fato que é preciso aceitar e adaptar-se. Os computadores permeiam a vida cotidiana, porém não raciocinam como os cérebros fazem, dessa forma, a principal distinção entre a inteligência do ser humano e a inteligência da máquina reside na capacidade dos seres humanos manipular conceitos e instruções imprecisas. Em 1968, Zadeh [159] foi o primeiro a introduzir o conceito de um evento fuzzy assim como definiu sua probabilidade como uma extensão natural da probabilidade de um evento não fuzzy. Esta probabilidade era descrita como um número do intervalo [0, 1]. A probabilidade fuzzy estende a noção da probabilidade clássica quando existem resultados que pertencem a várias classes de eventos ao mesmo tempo, porém em graus diferentes. A imprecisão e probabilidade são conceitos ortogonais que caracterizam diferentes aspectos da experiência humana. Por isso, é importante notar que nem a imprecisão nem probabilidade regem os processos de natureza física. Eles são introduzidos pelos humanos para compensar as suas próprias limitações. As probabilidades fuzzy, no entanto, são probabilidades representadas através de números fuzzy que estão definidos no intervalo [0,1], cuja soma dessas probabilidades, ao contrário da teoria de probabilidade clássica, pode ser diferente de 1. Dessa forma, para trabalhar com as probabilidades fuzzy de forma correta, tem-se que fazer uma restrição na aritmética fuzzy clássica 76 Capítulo 5. Teoria de Probabilidade Fuzzy (seção 5.3). Será utilizada esta noção de probabilidade fuzzy no cálculo das probabilidades de transição de uma cadeia de Markov. 5.2 Axiomática da Probabilidade Fuzzy Nesta seção será proposta um novo sistema axiomático para a teoria de probabilidades fuzzy, o qual é baseado na axiomática da probabilidade intervalar descrita na seção 3.2 e tem como objetivo generalizar a teoria da probabilidade clássica com o intuito de descrever a incerteza de um modo geral. De agora em diante, será denotada por N ([0, 1]) o conjunto de todos os números fuzzy cujo suporte está contido em (0, 1]. Dado α ∈ [0, 1] defina a função Nα : N ([0, 1]) → I([0, 1]) por Nα (A ) = Aα . Assim, todo número fuzzy em N ([0, 1]) é positivo. Seja (Ω, F ) um espaço de probabilidade. Uma probabilidade fuzzy P : F → N ([0, 1]),, que satisfaz a seguinte propriedade: a função composta1 Pα = Nα ◦ P : F → I([0, 1]), dada por Pα (A) = (P(A))α ∈ I([0, 1]), é uma probabilidade intervalar, para todo α ∈ [0, 1], no sentido que existem duas funções Pα , Pα : F → [0, 1] tais que Pα (A) = [Pα (A), Pα (A)] para todo A ∈ F e que satisfazem os axiomas IV-VII da seção 3.2, ou seja, para todo α ∈ [0, 1], tem-se que / = 0 e Pα (Ω) = 1; (1) Pα (0) (2) Pα (A) = 1 − Pα (Ac ), para todo A ∈ F , onde Ac = Ω \ A é o complementar de A; (3) (Super aditividade) Se A ∩ B = 0/ então Pα (A ∪ B) ≥ Pα (A) + Pα (B); (4) (Sub aditividade) Se A ∩ B = 0/ então Pα (A ∪ B) ≤ Pα (A) + Pα (B). A função de probabilidade intervalar Pα é chamada de função induzida por P no α-nível, ou simplesmente o α-nível de P. As funções Pα e Pα são chamadas de probabilidade inferior e superior, respectivamente, induzidas por P no α-nível. Uma probabilidade fuzzy P : F → N ([0, 1]) é coerente se a probabilidade inferior Pα : F → [0, 1] induzida por P no α-nível é coerente para todo α ∈ [0, 1], ou seja, se para todo α ∈ [0, 1] existir um conjunto não-vazio Mα de funções de probabilidades clássicas sobre F tal que Pα (A) = inf{π(A) : π ∈ Mα }, para todo A ∈ F . Neste caso, pela propriedade (2) acima, necessariamente tem-se que Pα (A) = sup{π(A) : π ∈ Mα }, para todo A ∈ F . 1 Note que, a função composta P é bem definida pelo fato que os α-níveis de números fuzzy são interα valos. 77 Capítulo 5. Teoria de Probabilidade Fuzzy / = 0 e Pα (Ω) = 1. Portanto, se P é coerente, P(0) / =0e Note que, se P é coerente então Pα (0) P(Ω) = 1. Uma probabilidade fuzzy P : F → N ([0, 1]) é 2-monótona se a probabilidade inferior Pα : F → [0, 1] induzida por P no α-nível é 2-monótona para todo α ∈ [0, 1], ou seja, se para todo α ∈ [0, 1] e para todo A, B ∈ F tem-se que Pα (A) + Pα (B) ≤ Pα (A ∪ B) + Pα (A ∩ B). Neste caso, pelo item (2) acima, necessariamente tem-se que Pα (A) + Pα (B) ≥ Pα (A ∪ B) + Pα (A ∩ B). É possível provar que todas probabilidades fuzzy que são 2-monótonas são também coerentes (veja por exemplo [68] Lemma2.5). 5.3 Probabilidade Fuzzy Nesta seção, serão estudadas duas noções de Probabilidade Fuzzy: uma essencialmente dada por Buckley e outra de natureza original. Uma noção de probabilidade fuzzy que desenvolveremos neste trabalho foi dada essencialmente por Buckley em [20]. Diz "essencialmente"pois de fato Buckley trabalha com uma ordem diferente da ordem adotada neste trabalho (veja a Observação 4.3.15). O motivo pelo qual prefere-se a ordem entre números fuzzy deve-se ao fato que é fácil de ser verificada em exemplos concretos, é mais fina que a ordem de inclusão entre números fuzzy, no sentido que se A ⊆ B são números fuzzy então A B , e além disso é útil para provar propriedades importantes sobre probabilidade fuzzy. 5.3.1 Probabilidade Fuzzy Restrita Primeiro será definida a noção de probabilidade fuzzy introduzida por Buckley: Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos com a propriedade que r S(Fi ) ⊆ [0, 1] e existam ai ∈ N(Fi ), i = 1, . . . , r tais que ∑ ai = 1, (5.1) i=1 onde S(Fi ) e N(Fi ) denotam o suporte e núcleo de Fi , respectivamente. Neste caso, diz-se que F satisfaz a restrição aritmética fuzzy (5.1). Se F = (F1 , . . . , Fr ) é um conjunto ordenado de números fuzzy, será denotado por Fα o conjunto ordenado dos α-níveis de F1 , . . . , Fr , ou seja, Fα = (F1,α , . . . , Fr,α ) para todo α ∈ [0, 1]. 78 Capítulo 5. Teoria de Probabilidade Fuzzy Definição 5.3.1 Seja Ω = {x1 , . . . , xr } e seja seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos que satisfaz a restrição aritmética fuzzy (5.1). Dado qualquer subconjunto A de Ω, defina a probabilidade fuzzy restrita de A como sendo o conjunto fuzzy PFR(A) cujos α-níveis são dados por ( (PFR(A))α = r ) ∑ ai : a = (a1 , . . . , ar ) ∈ Fα e ∑ ai = 1 i∈IA . (5.2) i=1 onde IA = { j ∈ {1, . . . , r} : x j ∈ A}. Esta função PFR algumas vezes será denotada por PFRF para enfatizar a dependência desta função de probabilidade com o conjunto F. A equação (5.1) define uma restrição à aritmética fuzzy para este modelo de probabilidade fuzzy. Note que, existe uma íntima relação entre a probabilidade fuzzy restrita e a probabilidade intervalar restrita, dada por: (PFR(A))α = PIRFα (A) (5.3) para todo α ∈ [0, 1] e para todo A ⊆ Ω. O seguinte resultado foi provado por Buckley em [20, p.32]. Teorema 5.3.2 Para cada A ⊆ Ω, PFR(A) é um número fuzzy cujo suporte está contido em [0, 1]. Em particular, tem-se uma função PFR : ℘(Ω) → N ([0, 1]). Prova: Será provado que, (PFR(A))α são os α-níveis de um número fuzzy PFR(A). r r i=1 i=1 Seja S = {(y1 , . . . , yr ) ∈ [0, 1]r : ∑ yi = 1}. Defina D[α] = S ∩ ∏ Fi,α e f : D[α] → [0, 1] por f (a1 , . . . , ar ) = ∑ ai . (5.4) i∈IA tem-se que f é contínua e D[α] é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (5.2), é claro que PFR(A) = f (D[α]). / Além disso, PFR(A) é normal, pois (PFR(A))1 6= 0. A função PFR é chamada de Probabilidade Fuzzy Restrita. Observação 5.3.3 Suponha que P : ℘(Ω) → [0, 1] é uma função de probabilidade no sentido clássico, onde Ω = {x1 , . . . , xr }. Por exemplo, P({xk }) = ak , ∀k = 1, . . . , r. Então, a1 + a2 + . . . + ar = 1 Seja F = (a1 , . . . , ar ). Então, PFRF = P, ou seja, esta definição de probabilidade fuzzy estende a noção de probabilidade clássica. 79 Capítulo 5. Teoria de Probabilidade Fuzzy Teorema 5.3.4 Seja Ω = {x1 , . . . , xr } e seja PFR : ℘(Ω) → N ([0, 1]) a função de probabilidade fuzzy restrita. Então, para cada A, B ⊆ Ω têm-se as seguintes propriedades: / então PFR(A ∪ B) ⊆ PFR(A) + PFR(B). Em particular, tem-se que PFR(A ∪ (i) Se A ∩ B = 0, B) PFR(A) + PFR(B). (ii) Se A ⊆ B, então PFR(A) ≤K PFR(B) e PFR(A) PFR(B) onde ≤K é a ordem de KulischMiranker sobre IR. / = 0 PFR(A) 1 = PFR(Ω). (iii) PFR(0) (iv) 1 ⊆ PFR(A) + PFR(Ac ). Em particular, 1 PFR(A) + PFR(Ac ). / então PFR(A∪B) ⊆ PFR(A)+PFR(B)−PFR(A∩B). Em particular PFR(A∪ (v) Se A∩B 6= 0, B) PFR(A) + PFR(B) − PFR(A ∩ B). Prova: Itens (ii) e (iii) são triviais e item (iv) segue do item (i). Portanto, será provado apenas os itens (i) e (v). / se e somente se, IA ∩ IB = 0. / Note que, A ∩ B = 0, Para provar (i) é suficiente provar que, dado α ∈ [0, 1], tem-se que (PFR(A ∪ B))α ⊆ (PFR(A))α + (PFR(B))α e que (PFR(A ∪ B))α (PFR(A))α + (PFR(B))α . Mas, isto segue do Teorema 3.3.5 e da equação (5.3). Para provar (v), é suficiente mostrar que dado α ∈ [0, 1], tem-se que (PFR(A ∪ B))α ⊆ (PFR(A))α + (PFR(B))α − (PFR(A ∩ B))α e que (PFR(A ∪ B))α (PFR(A))α + (PFR(B))α − (PFR(A ∩ B))α . Mas, isto segue do Teorema 3.3.5 e da equação (5.3). Proposição 5.3.5 A Probabilidade fuzzy restrita PFR é uma probabilidade fuzzy no sentido axiomático, ou seja, satisfaz as propriedades (1) − (4) da seção 5.2 da teoria de probabilidade fuzzy. Além disso, PFR é 2-monótona, e portanto coerente. Prova: Seja α ∈ [0, 1]. Será provado que estas relações (1)−(4) são verdadeiras quando restringir aos seus α-níveis. Mas, isto segue diretamente do Corolário 3.3.6 e da equação (5.3). A seguinte observação é crucial para entender melhor as cadeias de Markov fuzzy. 80 Capítulo 5. Teoria de Probabilidade Fuzzy r Observação 5.3.6 Note que, para cada α ∈ [0, 1] e para cada a = (a1 , . . . , ar ) ∈ Fα com ∑ ai = 1. i=1 Define-se a função de probabilidade no sentido clássico P(a,α) : ℘(Ω) −→ [0, 1], dada por: P(a,α) (A) = para todo A ⊆ X. ∑ ai , i∈IA Em outras palavras, a probabilidade fuzzy restrita pode ser entendida como uma família de probabilidades intervalares, parametrizadas por α ∈ [0, 1], que são os α-níveis PFRα de PFR, as quais r são parametrizadas por todos os a = (a1 , . . . , ar ) ∈ Fα com ∑ ai = 1. Mais precisamente, i=1 ( PFRα (A) = (PFR(A))α = ) r (a,α) P (A) : a ∈ Fα e ∑ ai = 1 . i=1 Além disso, ( ) r (a,α) PFRα (A) = inf P (A) : a ∈ Fα e ∑ ai = 1 i=1 e ( PFRα (A) = sup P ) r (a,α) (A) : a ∈ Fα e ∑ ai = 1 , i=1 o que confirma o fato de PFR ser coerente. 5.3.2 Probabilidade Fuzzy Agora será definida a noção de probabilidade fuzzy proposta neste trabalho. Definição 5.3.7 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Seja Ω = {x1 , . . . , xr }. Dado qualquer subconjunto A de Ω, defina a probabilidade fuzzy de A como sendo o conjunto fuzzy PF(A) cujos α-níveis são dados por: (PF(A))α = ∑ ai i∈IA r : a = (a1 , . . . , ar ) ∈ Fα ∑ ai . (5.5) i=1 onde IA = { j ∈ {1, . . . , r} : x j ∈ A}. Esta função PF algumas vezes será denotada por PFF para enfatizar a dependência desta função de probabilidade com o conjunto F. Note que, há uma íntima relação entre a probabilidade fuzzy e a probabilidade intervalar, dada por: (PF(A))α = PIFα (A) para todo α ∈ [0, 1] e para todo A ⊆ Ω. 81 (5.6) Capítulo 5. Teoria de Probabilidade Fuzzy Teorema 5.3.8 Para cada A ⊆ Ω, PF(A) é um número fuzzy cujo suporte está contido em [0, 1]. Em particular, tem-se uma função: PF : ℘(Ω) → N ([0, 1]). Prova: Será provado que (PF(A))α são os α-níveis de um número fuzzy PF(A). r Defina D[α] = ∏ Fi,α e f : D[α] → [0, 1] por: i=1 ∑ ai f (a1 , . . . , ar ) = i∈IA r . (5.7) ∑ ai i=1 Tem-se que f é contínua e D[α] é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (5.5), é claro que PF(A) = f (D[α]). A função PF é chamada de Probabilidade Fuzzy. Observação 5.3.9 A probabilidade fuzzy proposta neste trabalho é menos restrita que a probabilidade fuzzy restrita, pois não foi assumida que os números fuzzy positivos F1 , . . . , Fr tenham seus suportes contidos em [0, 1], nem que satisfazem a restrição aritmética fuzzy dada pela condição (5.1). Por esta razão, a probabilidade fuzzy PF(A) é mais fácil de ser calculada que a probabilidade PFR(A). No entanto, existe uma forte relação entre as duas abordagens que a seguir serão discutidas. Suponha que F = (F1 , . . . , Fr ) é um conjunto ordenado de números fuzzy positivos, cujos suportes estejam contidos em [0, 1], que satisfazem a condição (5.1). Neste caso, as duas funções de probabilidade fuzzy estão bem definidas. Além disso, tem-se que, para todo subconjunto A de Ω: PFR(A) ⊆ PF(A) pois, das equações (5.3) e (5.6) tem-se que para todo α ∈ [0, 1] (PFR(A))α ⊆ (PF(A))α . Observação 5.3.10 Suponha que P : ℘(Ω) → [0, 1] é uma função de probabilidade no sentido clássico, onde Ω = {x1 , . . . , xr }. Por exemplo, que P({xk }) = ak , ∀k = 1, . . . , r. Então, a1 + a2 + . . . + ar = 1 Seja F = (a1 , . . . , ar ). Então, PFF = P, ou seja, esta definição de probabilidade fuzzy estende a noção de probabilidade clássica. 82 Capítulo 5. Teoria de Probabilidade Fuzzy Teorema 5.3.11 Seja Ω = {x1 , . . . , xr } e seja PF : ℘(Ω) → N ([0, 1]) a função de probabilidade fuzzy. Então, para cada A, B ⊆ Ω têm-se as seguintes propriedades: / então PF(A ∪ B) ⊆ PF(A) + PF(B). Em particular, tem-se que PF(A ∪ B) (i) Se A ∩ B = 0, PF(A) + PF(B). (ii) Se A ⊆ B, então PF(A) ≤K PF(B) e PF(A) PF(B) onde ≤K é a ordem de KulischMiranker sobre IR. / = 0 PF(A) 1 = PF(Ω). (iii) PF(0) (iv) 1 ⊆ PF(A) + PF(Ac ). Em particular, 1 PF(A) + PF(Ac ). / então PF(A ∪ B) ⊆ PF(A) + PF(B) − PF(A ∩ B). (v) Se A ∩ B 6= 0, Prova: Itens (ii) e (iii) são triviais e item (iv) segue do item (i). Portanto, será provado apenas os itens (i) e (v). / Note que, A ∩ B = 0/ se e somente se, IA ∩ IB = 0. Para provar (i) é suficiente provar que dado α ∈ [0, 1], tem-se que (PF(A ∪ B))α ⊆ (PF(A))α + (PF(B))α e que (PF(A ∪ B))α (PF(A))α + (PF(B))α . Mas, isto segue do Teorema 3.3.12 e da equação (5.6). Para provar (v), é suficiente mostrar que dado α ∈ [0, 1], tem-se que (PF(A ∪ B))α ⊆ (PF(A))α + (PF(B))α − (PF(A ∩ B))α e que (PF(A ∪ B))α (PF(A))α + (PF(B))α − (PF(A ∩ B))α . Mas, isto segue do Teorema 3.3.12 e da equação (5.6). Proposição 5.3.12 A probabilidade fuzzy PF é uma probabilidade fuzzy no sentido axiomático, ou seja, satisfaz as propriedades (1) − (4) da seção 5.2 da teoria de probabilidade fuzzy. Além disso, PF é 2-monótona, e portanto coerente. Prova: Seja α ∈ [0, 1]. Será provado que estas relações (1) − (4) são verdadeiras quando restringir aos seus α-níveis. Mas, isto segue diretamente do Corolário 3.3.13 e da equação (5.6). A seguinte observação é crucial para entender melhor as cadeias de Markov fuzzy. 83 Capítulo 5. Teoria de Probabilidade Fuzzy Observação 5.3.13 Note que, para cada α ∈ [0, 1] e para cada a = (a1 , . . . , ar ) ∈ Fα , define-se a seguinte função de probabilidade no sentido clássico P(a,α) : ℘(Ω) −→ [0, 1] dada por: P(a,α) (A) = ∑ ai , para todo A ⊆ Ω. i∈IA Em outras palavras, a probabilidade fuzzy pode ser entendida como uma família de probabilidades intervalares, parametrizadas por α ∈ [0, 1], que são os α-níveis PFα de PF, as quais são parametrizadas por todos os a = (a1 , . . . , ar ) ∈ Fα . Mais, precisamente n o PFα (A) = (PF(A))α = P(a,α) (A) : a ∈ Fα . Além disso, n o PFα (A) = inf P(a,α) (A) : a ∈ Fα e n o PFα (A) = sup P(a,α) (A) : a ∈ Fα , o que confirma o fato de PF ser coerente. Observação 5.3.14 Observe que, o método utilizado para o cálculo das probabilidades intervalares no estudo de caso visto na seção 3.4 pode ser adaptado para obter as probabilidades fuzzy, para isto será suficiente considerar como peso números fuzzy ao invés de intervalos, por exemplo: considerando como peso os números fuzzy triangulares: w1 = (0.3, 0.4, 0.5), w2 = (0.2, 0.3, 0.4), w3 = (0.1, 0.2, 0.3) e w4 = (0, 0.1, 0.2), tem-se as probabilidades fuzzy: Pperder (Peru,Chile) ≈ (0.18, 0.33, 0.49), Pempatar (Peru,Chile) ≈ (0.21, 0.33, 0.44) e Pganhar (Peru,Chile) ≈ (0.22, 0.4, 0.58) Portanto, a probabilidade fuzzy de Peru não ganhar do Chile é por um lado Pnão-ganhar (Peru,Chile) = Pperder (Peru,Chile) + Pempatar (Peru,Chile) ≈ (0.18, 0.33, 0.49) + (0.21, 0.33, 0.44) = (0.39, 0.66, 0.93) e por outro lado ¬Pganhar (Peru,Chile) = 1−Pganhar (Peru,Chile)≈1−(0.22, 0.4, 0.58) = (0.42, 0.6, 0.78). Ou seja, há uma hesitação na probabilidade fuzzy de Peru não ganhar do Chile. Mensurada essa hesitação considerando a função do índice de hesitação H(¬Pganhar (Peru,Chile), Pnão-ganhar (Peru,Chile)), o qual é definido como a máxima diferença entre os graus de pertinência dos números fuzzy (0.39, 0.66, 0.93) e (0.42, 0.6, 0.78), o qual acontece quando x = 0.78, i.e. quando µ¬P (0.78) = ganhar (Peru,Chile) 84 Capítulo 5. Teoria de Probabilidade Fuzzy 0 e µP (0.78) = 21 . Logo, não-ganhar (Peru,Chile) H(¬Pganhar (Peru,Chile), Pnão-ganhar (Peru,Chile)) = 0.5. O próximo passo é utilizar este índice de hesitação para incluir uma hesitação na probabilidade fuzzy Pganhar (Peru,Chile), para isto obtêm-se a probabilidade fuzzy de Peru ganhar do Chile modificada por H(¬Pganhar (Peru,Chile), Pnão-ganhar (Peru,Chile)) como segue: 0 (Peru,Chile) = (K(0.4 − 0.22) + 0.22, 0.4, 0.58 − K(0.58 − 0.4)) ≈ (0.5(0.4 − 0.22) + 0.22, 0.4, 0.58 Pganhar = (0.33, 0.4, 0.49) onde K = H(¬Pganhar (Peru,Chile), Pnão-ganhar (Peru,Chile)) = 0.5. 5.4 Probabilidade Condicional Fuzzy Seja Fα = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Seja Ω = {x1 , . . . , xr } e sejam A, B ⊆ Ω com IA e IB os seus respectivos conjuntos de índices. Se Fα satisfaz a restrição aritmética fuzzy dada pela condição (5.1), Buckley essencialmente definiu a probabilidade condicional fuzzy restrita de A com respeito de B como sendo o conjunto fuzzy PFR(A | B) cujos α-níveis são dados por (PFR(A | B))α = ∑ ai i∈IA ∩IB ∑ aj j∈IB : a ∈ Fα e ∑ ai = 1 . i=1 r (5.8) Neste trabalho define-se a probabilidade condicional fuzzy de A com respeito de B como sendo o conjunto fuzzy PF(A | B) cujos α-níveis são dados por: (PF(A | B))α = ∑ ai i∈IA ∩IB ∑ aj : a ∈ Fα j∈IB . (5.9) Note que, existe uma estreita relação entre a probabilidade condicional fuzzy restrita e a probabilidade condicional intervalar restrita dada por (PFR(A | B))α = PBFα (A | B) (5.10) para todo α ∈ [0, 1] e para todo A, B ⊆ Ω. Analogamente, tem-se uma relação estreita entre a 85 Capítulo 5. Teoria de Probabilidade Fuzzy probabilidade condicional fuzzy e a probabilidade condicional intervalar, dada por: (PF(A | B))α = PIFα (A | B) (5.11) para todo α ∈ [0, 1] e para todo A, B ⊆ Ω. Proposição 5.4.1 Dados A, B ⊆ Ω tem-se que PFR(A | B), PF(A | B) ∈ N ([0, 1]). r Prova: Dado α ∈ [0, 1], defina D[α] = ∏ Ii e f : D[α] → [0, 1] por i=1 ∑ ai f (a1 , . . . , ar ) = i∈IA ∩IB ∑ aj . (5.12) i∈IB tem-se que f é contínua e D[α] é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (5.9), é claro que (PF(A | B))α = f (D[α]), o que prova que PF(A | B) ∈ N ([0, 1]). A condição PFR(A | B) ∈ N ([0, 1]) prova-se analogamente. Observação 5.4.2 Seja α ∈ [0, 1] e seja Fα = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Para cada a ∈ Fα e para cada A, B ⊆ Ω defina ∑ ai (a,α) P i∈IA ∩IB (A|B) = ∑ ai , para todo A ⊆ Ω. i∈IB tem-se que n o (PF(A | B))α = P(a,α) (A|B) : a ∈ Fα e se F satisfaz a condição (5.1) tem-se que ( (PFR(A | B))α = r P(a,α) (A|B) : a ∈ Fα e ) ∑ ai = 1 , i=1 ou seja, estas duas probabilidades condicionais fuzzy podem ser entendidas como uma família de probabilidades condicionais intervalares, parametrizadas por α ∈ [0, 1], que são os α-níveis PFα e PFRα de PF e de PFR, respectivamente, as quais são parametrizadas por todos os a = (a1 , . . . , ar ) ∈ Fα . Proposição 5.4.3 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Dados A, B ⊆ Ω tem-se que (i) PF(A | B) ⊆ PF(A ∩ B) ; PF(B) 86 Capítulo 5. Teoria de Probabilidade Fuzzy (ii) Se F satisfaz a condição (5.1) então PFR(A | B) ⊆ PFR(A ∩ B) . PFR(B) Prova: Seja α ∈ [0, 1]. Será provado que (PF(A | B))α ⊆ (PF(A ∩ B))α ; (PF(B))α e se F satisfaz a condição (5.1) então (PFR(A | B))α ⊆ (PFR(A ∩ B))α . (PFR(B))α Mas, isto segue das equações (5.11) e (5.10) e da Proposição 3.5.3 Teorema 5.4.4 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Seja Ω = {x1 , . . . , xr }. Então, para cada A, B ⊆ Ω tem-se as seguintes propriedades: / Então, PF(A1 ∪ A2 | B) ⊆ PF(A1 | B) + PF(A2 | B). (i) Se A1 ∩ A2 = 0. (ii) 0 PF(A | B) 1. (iii) PF(A | A) = 1. (iv) Se B ⊆ A. Então, PF(A | B) = 1. / Então, PF(A | B) = 0. (v) Se A ∩ B = 0. Além disso, se F satisfaz a restrição aritmética fuzzy dada pela condição (5.1) tem-se que (i) − (v) também são verdadeiros se substituidos PF(· | ·) por PFR(· | ·). Prova: Seja α ∈ [0, 1]. Será provado que estas relações (i) − (v) são verdadeiras quando restringir aos seus α-níveis. Mas, isto segue do Teorema 3.5.4 e das equações (5.11) e (5.10). O próximo objetivo é provar a versão fuzzy do importante teorema da probabilidade total, mas para isto é necessário alguns resultados prévios. Lema 5.4.5 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Dados A, B ⊆ Ω tem-se que (i) PF(A ∩ B) ⊆ PF(A | B) · PF(B); (ii) Se F satisfaz a restrição aritmética fuzzy dada pela condição (5.1) tem-se que PFR(A ∩ B) ⊆ PFR(A | B) · PFR(B). Prova: Seja α ∈ [0, 1]. Será provado que estas relações são verdadeiras quando restringir aos seus α-níveis. Mas, isto segue do Lema 3.5.5 e das equações (5.11) e (5.10). 87 Capítulo 5. Teoria de Probabilidade Fuzzy Lema 5.4.6 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Dados A, B,C ⊆ Ω tem-se que (i) PF(A ∩ B | C) ⊆ PF(A | C) · PF(B | A ∩C); (ii) Se F satisfaz a restrição aritmética fuzzy dada pela condição (5.1) tem-se que PFR(A ∩ B | C) ⊆ PFR(A | C) · PF(B | A ∩C). Prova: Seja α ∈ [0, 1]. Será provado que estas relações são verdadeiras quando restringir aos seus α-níveis. Mas, isto segue do Lema 3.5.6 e das equações (5.11) e (5.10). Teorema 5.4.7 (Teorema da Probabilidade Total Fuzzy) Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que Ai ∩ A j = 0/ se i 6= j e Ω = k S Ai . Seja D um evento qualquer. Então, i=1 k (i) PF(D) ⊆ ∑ PF(Ai ) · PF(D | Ai ); i=1 (ii) Se F satisfaz a restrição aritmética fuzzy dada pela condição (5.1) tem-se que k PFR(D) ⊆ ∑ PFR(Ai ) · PFR(D | Ai ). i=1 Prova: Seja α ∈ [0, 1]. Será provado que estas relações são verdadeiras quando restringir aos seus α-níveis. Mas, isto segue do Teorema da Probabilidade Total Intervalar, Teorema 3.5.7, e das equações (5.11) e (5.10). Teorema 5.4.8 (Teorema da Probabilidade Condicional Total Fuzzy) Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que Ai ∩ A j = 0/ se i 6= j e Ω = k S Ai . Sejam B,C ⊆ Ω. Então, i=1 k (i) PF(B|C) ⊆ ∑ PF(Ai |C) · PF(B | Ai ∩C); i=1 (ii) Se F satisfaz a restrição aritmética fuzzy dada pela condição (5.1) tem-se que k PFR(B|C) ⊆ ∑ PFR(Ai |C) · PFR(B | Ai ∩C). i=1 Prova: Seja α ∈ [0, 1]. Estas relações são verdadeiras quando são restringidas aos seus α-níveis. Mas, isto segue do Teorema da Probabilidade Condicional Total Intervalar, Teorema 3.5.8, e das equações (5.11) e (5.10). 88 Capítulo 5. Teoria de Probabilidade Fuzzy O próximo objetivo é provar a versão fuzzy do importante Teorema de Bayes em teoria clássica de probabilidades. Teorema 5.4.9 Teorema de Bayes Fuzzy Seja F = (F1 , . . . , Fr ) um conjunto ordenado de intervalos positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que Ai ∩ A j = 0/ se i 6= j e Ω= k S Ai . Seja D um evento qualquer, então, i=1 (i) PF(Ai | D) ⊆ PF(Ai ∩ D) k ; ∑ PF(A j ) · PF(D | A j ) j=1 (ii) Se F satisfaz a restrição aritmética fuzzy dada pela condição (5.1) tem-se que PFR(Ai | D) ⊆ PFR(Ai ∩ D) k ; ∑ PFR(A j ) · PFR(D | A j ) j=1 Prova: Seja α ∈ [0, 1]. Será provado que estas relações são verdadeiras quando restringir aos seus α-níveis. Mas, isto segue do Teorema de Bayes Intervalar, Teorema 3.5.9 e das equações (5.11) e (5.10). 5.5 5.5.1 Cadeias de Markov Fuzzy Cadeias de Markov Fuzzy finitas com tempo discreto Nesta seção, com o intuito de unificar as teorias de cadeias de Markov fuzzy, PF denotará qualquer uma das funções de probabilidade fuzzy PFR ou PF. Nesta seção é considerada apenas cadeias de Markov fuzzy finitas com tempo discreto, ou seja, aquelas nas quais os estados mudam em certos instantes de tempo discreto, indexados por uma variável inteira n. A cada passo de tempo n, a cadeia de Markov tem um estado, denotado por Xn , que pertence a um conjunto finito S de possíveis estados. Sem perda de generalidade, suponha que o conjunto de estados é S = {1, . . . , m}, onde m é um inteiro positivo. A cadeia de Markov é descrita em termos de suas probabilidades fuzzy de transição PFi j ; sempre que o estado passa a ser i, existe uma probabilidade fuzzy PFi j que o próximo estado seja j. Matematicamente, se i, j ∈ S, PFi j = PF(Xn+1 = j | Xn = i). A suposição principal que norteia os processos de Markov é que as probabilidades fuzzy de transição PFi j estão definidas sempre que o estado i seja visitado, independente do que aconteceu no passado e de como o estado i foi atingido. 89 Capítulo 5. Teoria de Probabilidade Fuzzy Matematicamente, suponha a seguinte propriedade de Markov: PF(Xn+1 = j | Xn = i, Xn−1 = in−1 , . . . , X0 = i0 ) = PF(Xn+1 = j | Xn = i) = PFi j para todos os tempos n, todos os estados i, j ∈ S e todas as sequências possíveis i0 , . . . , in−1 de estados passados. Em outras palavras, a lei de probabilidade fuzzy do estado seguinte Xn+1 depende do passado apenas através do valor do estado presente Xn . Defina a probabilidade fuzzy de transição de n-passos PFi j (n) como a probabilidade fuzzy de um processo no estado i estar no estado j após n transições adicionais. Matematicamente, PFi j (n) = PF(Xn = j | X0 = i). Note que, pelo Teorema da probabilidade total fuzzy tem-se que m m PF(Xn = j) ⊆ ∑ PF(X0 = i) · PF(Xn = j | X0 = i) = ∑ PF(X0 = i) · PFi j (n). i=1 i=1 Além disso, das equações (5.10) e (5.11) tem-se que (PFi j (n))α = (PFα )i j (n) para todo n ∈ N, (5.13) onde a probabilidade intervalar do lado direito é considerada com respeito da família de intervalos Fα . Observação 5.5.1 Note que, pela Observação 5.4.2 os processos Markovianos fuzzy podem ser olhados como famílias de processos Markovianos clássicos. Mais precisamente, pode-se olhar os α-níveis das probabilidades de transição fuzzy PFi j como uma família de probabilidades de transição clássica da seguinte forma: n o n o (a,α) (PFi j )α = P(a,α) (X1 = j | X0 = i) : a ∈ Fα = Pi j : a ∈ Fα , se PF = PF ou (PFi j )α = P(a,α) (X1 r = j | X0 = i) : a ∈ Fα e ∑ ai = 1 i=1 = (a,α) Pi j r : a ∈ Fα e ∑ ai = 1 , i=1 se PF = PFR, onde P(a,α) (A | B) é definido como na Observação 5.4.2 Da mesma forma pode-se caracterizar os α-níveis da probabilidade fuzzy de transição de npassos PFi j (n) como uma família de probabilidades de transição de n-passos clássica da seguinte forma: n o n o (a,α) (PFi j (n))α = P(a,α) (Xn = j | X0 = i) : a ∈ Fα = Pi j (n) : a ∈ Fα 90 Capítulo 5. Teoria de Probabilidade Fuzzy se PF = PF ou r P(a,α) (Xn = j | X0 = i) : a ∈ Fα e ∑ ai = 1 r (a,α) Pi j (n) : a ∈ Fα e ∑ ai = 1 , (PFi j (n))α = i=1 = i=1 se PF = PFR. A seguir será provado a versão fuzzy da importante equação de Chapman-Kolmogorov, pois ela fornece um método eficaz de computar as probabilidades fuzzy de transição de n-passos PFi j (n). Teorema 5.5.2 Sejam s,t ∈ N. Então, m PFi j (s + t) ⊆ ∑ PFik (s) · PFk j (t). k=1 Prova: Seja α ∈ [0, 1]. Será provado que m (PFi j (s + t))α ⊆ ∑ (PFik (s))α · (PFk j (t))α . k=1 Mas, isto segue do Teorema 3.6.2 e da equação (5.13). Um estado j é dito fuzzy acessível a partir do estado i, e escreve-se i → j, se existir n ∈ N tal que PFi j (n) > 0. Isto significa que se iniciar com o estado i, existe uma probabilidade fuzzy positiva (mas não necessariamente igual a 1) que a cadeia estará no estado j após n passos. Como, pela equação (5.13) (PFi j (n))α = (PFα )i j (n) para todo n ∈ N, então, j é fuzzy acessível a partir do estado i se, e somente se, j é acessível intervalarmente a partir do estado i com respeito da probabilidade intervalar PFα para todo α ∈ [0, 1]. Se um estado j é fuzzy acessível a partir de i e i é fuzzy acessível a partir de j, diz-se que i e j se comunicam no sentido fuzzy, e escreve-se i ↔ j. Esta relação de comunicação fuzzy é uma relação de equivalência, ou seja, satisfaz as seguintes propriedades: Proposição 5.5.3 (1) (Reflexividade) i ↔ i, para todo estado i. (2) (Simetria) Se i ↔ j, então j ↔ i. (3) (Transitividade) Se i ↔ k e k ↔ j, então i ↔ j. Prova: Como PFii (0) = PF(X0 = i|X0 = i) = 1 > 0, tem-se a propriedade (1). A propriedade (2) segue trivialmente da definição. Resta provar a propriedade (3). Como i ↔ k e k ↔ j então, 91 Capítulo 5. Teoria de Probabilidade Fuzzy m existem inteiros s,t ∈ N tais que PFik (s) > 0 e PFk j (t) > 0. Em particular, ∑ PFik (s)·PFk j (t) > 0. k=1 Portanto, pelo Teorema 5.5.2 tem-se que PFi j (s + t) > 0. Assim, i ↔ j. Como esta relação de comunicação fuzzy é uma relação de equivalência, tem-se que o espaço de estados S pode ser decomposto em uma união finita disjunta de classes de equivalência módulo a s S relação "↔", ou seja, existem subconjuntos C1 , . . . ,Cs de S, dois a dois disjuntos, tais que S = Ci i=1 e tais que todos os estados em Ci se comunicam entre si no sentido fuzzy. Os conjuntos C1 , . . . ,Cs são chamados de classes de comunicação fuzzy da cadeia de Markov. Seja i um estado e AF(i) o conjunto de todos os estados que são acessíveis no sentido fuzzy a partir de i. Diz-se que i é recorrente no sentido fuzzy se para todo j que é fuzzy acessível a partir de i tem-se que i é fuzzy acessível a partir de j; ou seja, i satisfaz a propriedade que se j ∈ AF(i) então, i ∈ AF( j). Em particular, tem-se que i é recorrente no sentido fuzzy se, e somente se, i é recorrente intervalarmente com respeito da probabilidade intervalar PFα para todo α ∈ [0, 1]. Quando a cadeia de Markov começa no estado recorrente no sentido fuzzy i, somente podem ser visitados os estados j ∈ AF(i) a partir dos quais i é fuzzy acessível, ou seja, dado qualquer estado futuro, existe sempre alguma probabilidade fuzzy de retornar ao estado i e, após um certo tempo, tem a certeza que isto de fato vai acontecer. Assim, repetindo este argumento indefinidamente, conclui-se que, se um estado recorrente no sentido fuzzy i é visitado alguma vez, ele será revisitado uma infinidade de vezes. Um estado i que não é recorrente no sentido fuzzy é dito transiente no sentido fuzzy. Assim, o estado i é transiente no sentido fuzzy se existirem estados j ∈ AF(i) tais que i não é acessível a partir de j. Em particular, tem-se que i é transiente no sentido fuzzy se, e somente se, i é transiente intervalarmente com respeito da probabilidade intervalar PFα para algum α ∈ [0, 1]. Após a cadeia ter visitado o estado transiente no sentido fuzzy i, há uma probabilidade fuzzy positiva de visitar o estado j e, após algum tempo, isto de fato vai acontecer, e quando aconteça, o estado i nunca mais será visitado. Assim, pode-se concluir, que um estado transiente no sentido fuzzy será visitado somente um número finito de vezes. Note que, uma cadeia de Markov fuzzy finita sempre possue pelo menos um estado recorrente no sentido fuzzy pois, se todos os estados forem transiente no sentido fuzzy então, pelo comentado acima, após um número finito de passos (tempo) a cadeia deixará todos os estados e nunca mais os visitará. Para onde irá? Pode-se dividir os estados transientes no sentido fuzzy em dois tipos: os fortemente transientes no sentido fuzzy, ou seja, aqueles que são fortemente transientes intervalarmente com respeito da probabilidade intervalar PFα para todo α ∈ [0, 1], e os fracamente transientes no sentido fuzzy, ou seja, aqueles que são fracamente transientes intervalarmente com respeito da probabilidade intervalar PFα para algum α ∈ [0, 1]. As propriedades de recorrência e transiência fuzzy são propriedades solidárias, no seguinte sentido: 92 Capítulo 5. Teoria de Probabilidade Fuzzy Proposição 5.5.4 Se i ↔ j, então (1) i é recorrente no sentido fuzzy se, e somente se, j também é. (2) i é fortemente transiente no sentido fuzzy se, e somente se, j também é. (3) i é fracamente transiente no sentido fuzzy se, e somente se, j também é. Prova: O item (3) é uma consequência imediata dos itens anteriores, portanto será provado apenas os itens (1) e (2). Foi visto que, i é recorrente (resp. fortemente transiente) no sentido fuzzy se, e somente se, i é recorrente (resp. transiente) intervalarmente com respeito da probabilidade intervalar PFα para todo α ∈ [0, 1]. Portanto, o resultado segue da Proposição 3.6.4 Segue desta proposição que se i é um estado recorrente no sentido fuzzy, então o conjunto de estados AF(i) que são acessíveis no sentido fuzzy de i formam uma classe de comunicação fuzzy, a qual é recorrente no sentido fuzzy, no sentido que todos os estados em AF(i) são recorrentes no sentido fuzzy. Além disso, segue também que um estado transiente no sentido fuzzy não pode ser fuzzy acessível de um estado recorrente no sentido fuzzy, ou seja, se i é recorrente no sentido fuzzy e i → j então j é recorrentes no sentido fuzzy. Com o intuito de entender o comportamento a longo prazo das cadeias de Markov fuzzy é importante entender o que acontece com cadeias que consistem somente de uma classe recorrente de comunicação fuzzy. Por este motivo, é importante caracterizar as classes recorrentes de comunicação fuzzy de acordo com a presença ou ausência de padrões de periodicidade nos tempos que um estado é visitado. Por isto, diz-se que uma classe recorrente de comunicação fuzzy é periódica no sentido fuzzy se seus estados podem ser agrupados em d > 1 subconjuntos disjuntos S1 , . . . , Sd de tal forma que todas as transições fuzzy de um subconjunto levam ao seguinte subconjunto. Matematicamente, ( Se i ∈ Sk e PFi j > 0 então, j ∈ Sk+1 , se k = 1, . . . , d − 1, j ∈ S1 , se k = d. Uma classe recorrente de comunicação fuzzy que não é periódica é chamada de aperiódica no sentido fuzzy, ou seja, em uma classe recorrente de comunicação fuzzy periódica os estados se visitam no sentido fuzzy seguindo a sequência de subconjuntos e, depois de d passos, termina no mesmo subconjunto. É interesse deste trabalho o estudo dos estados estacionários de uma cadeia de Markov fuzzy. Os estados estacionários representam uma característica crucial das cadeias de Markov pois, como será visto, elas controlam em vários aspectos o comportamento a longo prazo da cadeia. Mais precisamente, é interesse deste trabalho em estudar as probabilidades fuzzy de transição de npassos PFi j (n) quando n é suficientemente grande. 93 Capítulo 5. Teoria de Probabilidade Fuzzy Se a cadeia de Markov fuzzy possui duas ou mais classes de estados recorrentes é claro que o valor fuzzy limite de PFi j (n) dependerá do estado inicial i pois, visitar j a longo prazo vai depender se j está ou não na mesma classe recorrente de comunicação fuzzy que i. Por esta razão, será restringido o estudo a cadeias de Markov que consistem somente de uma classe recorrente de comunicação fuzzy e possivelmente alguns estados transientes no sentido fuzzy. Esta suposição não é restritiva como possa em principio parecer pois sabe-se que se um estado entra numa classe recorrente de comunicação fuzzy particular, ele permanecerá nessa classe para sempre. Observe que, a sequência fuzzy PFi j (n) pode não convergir, mesmo que a cadeia de markov fuzzy possua uma única classe recorrente de comunicação fuzzy. Isto decorre da equação (5.13) e do fato que foi visto que Pi j (n) pode não convergir. Por exemplo, considere a classe recorrente com dois estados, 1 e 2, tais que PF12 = PF21 = 1, ou seja, a partir do estado 1 somente pode-se ir para o estado 2, e vice-versa. Portanto, ao começar em um desses estados, estará no mesmo estado após um número par de transições e no outro estado após um número ímpar de transições. O que está por trás deste fenômeno é que a classe de comunicação fuzzy é periódica e, para esta classe, PFi j (n) oscila. Será provado a seguir que para qualquer estado j, as probabilidades fuzzy de transição de n-passos PFi j (n) se aproxima de um valor fuzzy limite, o qual é independente do estado inicial i, desde que seja excluído as duas situações descritas acima: classes recorrentes múltiplas e/ou classes periódicas. Teorema 5.5.5 (Teorema da Convergência Estacionária Fuzzy) Considere uma cadeia de Markov fuzzy com uma única classe recorrente de comunicação fuzzy, a qual é aperiódica. Então, dado qualquer estado j existe um único número fuzzy A j que satisfaz as seguintes propriedades: (1) lim (PFi j (n))α = (A j )α , para todo i, j ∈ S e para todo α ∈ [0, 1]. n→∞ m (2) A j ⊆ ∑ Ak · PFk j para todo j ∈ S. k=1 m (3) 1 ⊆ ∑ Ak . k=1 (4) tem-se que (a) A j = 0, se j é fortemente transiente no sentido fuzzy. (b) 0 ∈ S(A j ), se j é fracamente transiente no sentido fuzzy. (c) A j > 0, se j é recorrente no sentido fuzzy. Prova: Sabe-se pelo Teorema 3.6.5 que dado qualquer α ∈ [0, 1] e qualquer estado j existe um único intervalo παj = [παj , παj ] que satisfaz as seguintes propriedades: (1) lim (PFα )i j (n) = παj , para todo i, j ∈ S. n→∞ m (2) παj ⊆ ∑ παk · (PFα )k j para todo j ∈ S. k=1 94 Capítulo 5. Teoria de Probabilidade Fuzzy m m k=1 k=1 (3) ∑ παk ≤ 1 ≤ ∑ παk . (4) tem-se que (a) παj = [0], se j é fortemente transiente intervalarmente. (b) παj = [0, παj ], com παj > 0, se j é fracamente transiente intervalarmente. (c) παj > 0, se j é recorrente intervalarmente. Portanto, o resultado segue se considerado A j como o número fuzzy cujos α-níveis são dados por παj . 95 Capítulo 6 Teoria Fuzzy Intuicionista 6.1 Considerações Iniciais A teoria de conjuntos fuzzy tem se mostrado uma ferramenta útil para descrever as situações em que os dados são imprecisos ou vagos. Os conjuntos fuzzy lidam com tais situações, atribuindo um grau para que um determinado objeto pertence ou não a um conjunto. Na vida real, no entanto, existem várias situações em que um objeto pertence a um conjunto para um certo grau, mas é possível que ele não é tão certo sobre isso. Em outras palavras, pode haver uma hesitação ou incerteza sobre o grau de pertinência. Na teoria dos conjuntos fuzzy, não há meios para incorporar essa hesitação na adesão dos graus. Dessa forma, em 1983 Krassimir Atanassov [5] introduziu o conceito de conjunto fuzzy intuicionista que se caracteriza por considerar duas funções expressando o grau de pertinência e o grau de não-pertinência, respectivamente, de um elemento ao conjunto. A vantagem de utilizar a teoria dos conjuntos fuzzy intuicionistas em vez da teoria dos conjuntos fuzzy é a habilidade para lidar com diferentes tipos de incertezas que podem surgir dentro do mesmo problema. Assim, os conjuntos fuzzy intuicionistas, que abreviaremos por CFI, são uma generalização natural dos conjuntos fuzzy. O grau de não-pertinência, determina o grau de hesitação que se tem ao momento de aferir um grau de pertinência. Em conjuntos fuzzy não há essa hesitação e por isso o grau de não pertinência é, por defeito, o complemento do grau de pertinência. Como a teoria dos CFI é uma generalização da teoria dos conjuntos fuzzy, é natural esperar que a maioria dos conceitos e propriedades intrínsecas da teoria dos conjuntos fuzzy sejam generalizadas para o CFI, como por exemplo, as noções de t-normas e t-conormas [43, 44, 38]. Diferentemente dos conjuntos fuzzy convencionais em que a imprecisão é apenas modelada pelo grau de pertinência, os conjuntos fuzzy intuicionistas de Atanassov consideram dois valores no intervalo [0, 1] para representar os graus de pertinência e de não-pertinência, com a restrição de que a soma seja no máximo 1. O grau de não-pertinência reflete uma possível hesitação do especialista ao momento de ser atribuído o grau de pertinência, quando este grau de não-pertinência for o complemento do grau de pertinência significa que não há hesitação. Assim, um conjunto fuzzy convencional pode ser visto como um conjunto fuzzy intuicionista sem hesitação. Portanto, a te- 96 Capítulo 6. Teoria Fuzzy Intuicionista oria dos conjuntos fuzzy intuicionistas é uma generalização da teoria dos conjuntos fuzzy. Neste sentido, diversos conceitos da teoria dos conjuntos fuzzy tem sido estendidos para esta teoria dos conjuntos fuzzy intuicionistas. Em particular, números fuzzy foram estendidos para números fuzzy intuicionistas como Grzegorzewski em [60], Wei e Tang em [153]. Desde então, esta área tem sido alvo de intensas pesquisas com aplicações nas mais diversas áreas, tais como: em segmentação de imagens médicas [30], tomada de decisão [101], reconhecimento de padrões [69]. 6.2 Conjuntos Fuzzy Intuicionistas Definição 6.2.1 Um conjunto fuzzy intuicionista (CFI) A de universo X é o conjunto A = {(x, µA (x), νA (x)) : x ∈ X} onde µA , νA : X → [0, 1] satisfazendo a condição µA (x) + νA (x) ≤ 1. A função µA é chamada de função de pertinência, a função νA é chamada de função de nãopertinência. A função πA (x) = 1 − µA (x) − νA (x) foi introduzida por Bustince e Burillo [25] e é chamada de índice intuicionista de x em A , e mede o grau de hesitação de quanto x pertence a A . Note que, πA (x) é a distância usual entre νA (x) e o complemento de µA (x). O conjunto de todos os conjuntos fuzzy intuicionistas de universo X será denotado por F I (X). A seguir serão apresentados e discutidos alguns exemplos para comparar a teoria dos conjuntos fuzzy de Zadeh e a teoria dos conjuntos fuzzy intuicionistas de Atanassov. Exemplo 6.2.2 (Atanassov [7]) Seja X o conjunto de todos os países cujos governos são escolhidos por eleição. Assuma que, para cada país x ∈ X, a porcentagem do eleitorado que votou para o governo será denotada por M(x) e seja µ(x) = M(x) 100 . Seja ν(x) = 1 − µ(x), este número corresponde aos eleitores que não votaram pelo governo. Do ponto de vista da teoria dos conjuntos fuzzy, não poderia estudar este valor ν(x) em mais detalhes. No entanto, se definir ν(x) como N(x) 100 , onde N(x) é a porcentagem dos eleitores que votaram em partidos ou pessoas de fora do governo, então o número 1 − (µ(x) + ν(x)) corresponde à parte do eleitorado que não votaram ou seus votos não foram válidos. Assim, contruiu-se seguinte conjunto {(x, µ(x), ν(x)) : x ∈ X} (6.1) onde, 0 ≤ µ(x) + ν(x) ≤ 1. Exemplo 6.2.3 Suponha que esteja interessado em classificar o i-ésimo aluno de um grupo X de n pessoas para a categoria dos "alunos superdotados". Seja µ(xi ) o grau de pertinência do aluno xi do”aluno superdotado“ (i.e, o grau da nossa convicção sobre isso), seja ν(xi ) o grau de nãopertinência e π(xi ) o grau de hesitação sobre a univocidade da classificação, assim tem-se que µ(xi ) + ν(xi ) + π(xi ) = 1. 97 Capítulo 6. Teoria Fuzzy Intuicionista Suponha que, µ(xi ) = 0.2, ν(xi ) = 0.5, então π(xi ) = 0.3. Sob circunstâncias favoráveis para o aluno (como testes, exames orais ou escritas, feitos adicionais), o maior grau para classificá-lo ao conjunto dos "alunos superdotados"é µmax (xi ) = µ(xi ) + π(xi ) = 0.5 (uma vez que ν(xi ) = 0.5, o grau das circunstâncias desfavoráveis, permanece inalterado). Por outro lado, as circunstâncias podem revelar-se desfavorável e, então, µ(xi ) = 0.2 permanece inalterada, considerando que νmax (xi ) = ν(xi ) + π(xi ) = 0.8. Com esses dados, o aluno tem poucas chances para ser classificado entre os "talentosos". Suponha agora, que µ(xi ) = ν(xi ) = 0.5 (então, π(xi ) = 0 uma completa falta de hesitação para classificá-lo). Tal situação deve ser interpretada da seguinte forma: o aluno é uma pessoa de capacidade média e nada mudará nossa opinião sobre ele. Agora, vá aos extremos e suponha que µ(xi ) = ν(xi ) = 0 e π(xi ) = 1. Tal situação significa que, sob o influxo de informação, tudo pode acontecer e pode alterar livremente sua decisão sobre os números µ(xi ) e ν(xi ), respectivamente. Finalmente, suponha que tem-se µ(xi ) = 0.5, ν(xi ) = 0.2 e π(xi ) = 0.3. Então, µmax (xi ) = µ(xi ) + π(xi ) = 0.8 e νmax (xi ) = ν(xi ) + π(xi ) = 0.5. Estes valores significam que este aluno tem chances muito considerável a ser contada como uma pessoa "talentosa". Note que, este exemplo mostra a essência do valor π(xi ) na interpretação de um conjunto fuzzy intuicionista e, ao mesmo tempo, dá uma liberdade e uma possibilidade de manobrar os valores de µ(xi ) e ν(xi ) de acordo com o fluxo de informações e a evolução do conhecimento da pessoa em análise de um problema concreto. Glad Deschrijver e Etiene Kerre em [42] dão uma abordagem alternativa para CFI, eles provaram que CFI podem também ser vistos como um conjunto fuzzy L∗ -valorados no sentido de Joseph Goguen [55] por considerar o reticulado completo hL∗ , ≤L∗ i onde L∗ = {(x, y) ∈ [0, 1] × [0, 1] : x + y ≤ 1} e (x1 , x2 ) ≤L∗ (y1 , y2 ) se e somente se x1 ≤ y1 e x2 ≥ y2 . Note que, 0L∗ = (0, 1) e 1L∗ = (1, 0). Assim, CFI são nada mais que conjuntos fuzzy L∗ valorados. Definição 6.2.4 O supremo de um subconjunto A ⊆ L∗ , com respeito a ≤L∗ , pode ser obtido como segue: sup A = (sup{π1 (x) : x ∈ A}, inf{π2 (x) : x ∈ A}) onde π1 (x1 , x2 ) = x1 e π2 (x1 , x2 ) = x2 . Definição 6.2.5 O ínfimo de um subconjunto A ⊆ L∗ , com respeito a ≤L∗ , pode ser obtido como segue: inf A = (inf{π1 (x) : x ∈ A}, sup{π2 (x) : x ∈ A}) 98 Capítulo 6. Teoria Fuzzy Intuicionista onde π1 (x1 , x2 ) = x1 e π2 (x1 , x2 ) = x2 . Definição 6.2.6 Dado um (α, β) ∈ L∗ − {0L∗ } e um CFI A de universo X, o (α, β)-nível de A é o conjunto A(α,β) = {x ∈ X : µA (x) ≥ α e νA (x) ≤ β}. (6.2) Observação 6.2.7 Os (α, β)-níveis para (α, β) = (0, 1) são definidos como o fecho do suporte de A , ou seja, A(0,1) = fecho(S(A )). Observe que, qualquer conjunto fuzzy intuicionista é completamente determinado pelos seus (α, β)-níveis. De fato, (µA (x), νA (x)) = sup{(α, β) ∈ L∗ : x ∈ A(α,β) } onde o supremo é com respeito a ≤L∗ . Mais precisamente, tem-se o seguinte resultado que é uma generalização do Teorema 4.2.6 Exemplo 6.2.8 Seja α = 0.3 e β = 0.4, o (α, β)-nível do número NFIT da (figura 6.1) pode ser determinado da seguinte maneira: (a, b/c/d, e)(α,β) = [max(a + (c − a)α, b + (c − b)β), min(e + (e − c)α, d + (d − c)β)]. (6.3) Porttanto, (1, 2/4/6, 7)(0.3,0.4) = [1.9, 1]. 99 (6.4) Capítulo 6. Teoria Fuzzy Intuicionista Figura 6.1: Número Fuzzy Intuicionista Triangular Teorema 6.2.9 Seja A um conjunto fuzzy intuicionista em X com a função de pertinência e nãopertinência µA e νA , respectivamente. Seja χA(α,β) a função característica do conjunto crisp A(α,β) para (α, β) ∈ L∗ . Então, para todo x ∈ X (µA (x), νA (x)) = sup (α,β)∈L∗ c (α, β) ∧ (χA(α,β) (x), χA(α,β) (x)) , c onde A(α,β) é o complementar de A(α,β) . Em particular, todo conjunto fuzzy intuicionista é completamente determinado pelos seus (α, β)-níveis. Prova: Seja χA(α,β) a função característica do conjunto crisp A(α,β) , ou seja ( χA(α,β) (x) = 1, se x ∈ A(α,β) 0, se x 6∈ A(α,β) 100 Capítulo 6. Teoria Fuzzy Intuicionista Assim, sup (α,β)∈L∗ = c (α, β) ∧ (χA(α,β) (x), χA(α,β) (x)) sup (α,β)≤L∗ (µA (x),νA (x)) ! c (α, β) ∧ (χA(α,β) (x), χA(α,β) (x)) ∨ sup (α,β)6≤L∗ (µA (x),νA (x)) ! c (α, β) ∧ (χA(α,β) (x), χA(α,β) (x)) ! = (α, β) ∧ (1, 0) ∨ sup (α,β)≤L∗ (µA (x),νA (x)) ! (α, β) ∧ (0, 1) sup (α,β)6≤L∗ (µA (x),νA (x)) = (α, β) sup (α,β)≤L∗ (µA (x),νA (x)) = (µA (x), νA (x)). 6.3 Operações sobre Conjuntos Fuzzy Intuicionistas Nesta seção serão vistas operações básicas de conjuntos clássicos, tais como: o complemento, a união e a interseção no contexto da teoria dos conjuntos fuzzy intuicionistas. • Seja A um CFI de universo X. O Complementar de A , denotado por A , é o conjunto fuzzy intuicionista cujas funções de pertinência e não-pertinência são definidas por: µA (x) = νA (x) e νA (x) = µA (x) • Sejam A e B CFI de universo X. A União de A com B , denotado por A ∪ B , é o conjunto fuzzy intuicionista cuja função de pertinência e não-pertinência é dada por µA ∪B (x) = max[µA (x), µB (x)] e νA ∪B (x) = min[νA (x), νB (x)] • Sejam A e B CFI de universo X. A Interseção de A com B , denotado por A ∩ B , é o conjunto fuzzy intuicionista cuja função de pertinência e não-pertinência é dada por µA ∩B (x) = min[µA (x), µB (x)] e νA ∩B (x) = max[νA (x), νB (x)] 101 Capítulo 6. Teoria Fuzzy Intuicionista • Sejam A e B CFI de universo X. A Inclusão de A em B , denotado por A ⊆ B , é definido por A ⊆ B ⇔ (µA (x), νA (x)) ≤L∗ (µB (x), νB (x)), para todo x ∈ X • Sejam A e B CFI de universo X e Y , respectivamente. O Produto Cartesiano de A com B , denotado por A × B , é o conjunto fuzzy intuicionista cuja função de pertinência e nãopertinência é dada por µA ×B (x, y) = min[µA (x), µB (y)] e νA ×B (x, y) = max[νA (x), νB (y)]. Proposição 6.3.1 Sejam A e B conjuntos fuzzy intuicionistas. Então, A ⊆ B se, e somente se, para todo (α, β) ∈ L∗ , A(α,β) ⊆ B(α,β) . Em particular, A = B ⇔ A(α,β) = B(α,β) . Prova: Suponha que A ⊆ B . Seja (α, β) ∈ L∗ . Se x ∈ A(α,β) , então (α, β) ≤L∗ (µA (x), νA (x)). Como (µA (x), νA (x)) ≤L∗ (µB (x), νB (x)), tem-se que (α, β) ≤L∗ (µB (x), νB (x)). Logo, x ∈ B(α,β) . Portanto, A(α,β) ⊆ B(α,β) . Reciprocamente, suponha que A(α,β) ⊆ B(α,β) , ∀(α, β) ∈ L∗ . Então, pelo Teorema 6.2.9, tem-se (µA (x), νA (x)) = = sup (α,β)∈L∗ sup (α,β)∈L∗ c (x)) (α, β) ∧ (χA(α,β) (x), χA(α,β) c (α, β) ∧ (χB(α,β) (x), χB(α,β) (x)) = (µB (x), νB (x)). Logo, A ⊆ B . Teorema 6.3.2 Sejam A , B e Ai ∈ FI(X), ∀i ∈ J, onde J é um conjunto de índices. Então, para todo (α, β), (α0 , β0 ) ∈ L∗ , as seguintes propriedades são satisfeitas: (i) (α, β) ≤L∗ (α0 , β0 ) ⇒ A(α,β) ⊇ A(α0 ,β0 ) (ii) (A ∩ B )(α,β) = A(α,β) ∩ B(α,β) (iii) (A ∪ B )(α,β) = A(α,β) ∪ B(α,β) [ [ i∈I \ i∈I \ (iv) (v) (Ai )(α,β) ⊆ ( (Ai )(α,β) = ( i∈I (vi) A(α,β) = Ai )(α,β) Ai )(α,β) \i∈I A(α0 ,β0 ) . (α0 ,β0 )<(α,β) 102 Capítulo 6. Teoria Fuzzy Intuicionista Prova: (i) Por definição, tem-se que: A(α0 ,β0 ) = {x ∈ X : (α0 , β0 ) ≤L∗ (µA (x), νA (x))}. ∀x ∈ A(α0 ,β0 ) , tem-se que (α0 , β0 ) ≤L∗ (µA (x), νA (x)). Mas (α, β) ≤L∗ (α0 , β0 ). Logo, (α, β) ≤L∗ (µA (x), νA (x)), ou seja, x ∈ A(α,β) . Portanto, A(α0 ,β0 ) ⊆ A(α,β) . (ii) x ∈ (A ∩ B )(α,β) ⇔ (α, β) ≤L∗ (µ(A ∩B ) (x), ν(A ∩B ) (x)) ⇔ (α, β) ≤L∗ min[(µA (x), νA (x)), (µB (x), νB (x))] ⇔ (α, β) ≤L∗ (µA (x), νA (x)) e (α, β) ≤L∗ (µB (x), νB (x)) ⇔ x ∈ A(α,β) ∩ B(α,β) . Logo, (A ∩ B )(α,β) = A(α,β) ∩ Bβ . (iii) x ∈ (A ∪ B )(α,β) ⇔ (α, β) ≤L∗ (µ(A ∪B ) (x), ν(A ∩B ) (x)) ⇔ (α, β) ≤L∗ max[(µA (x), νA (x)), (µB (x), νB (x))] ⇔ (α, β) ≤L∗ (µA (x), νA (x)) ou (α, β) ≤L∗ (µB (x), νB (x)) ⇔ x ∈ A(α,β) ∪ B(α,β) . Logo, (A ∪ B )(α,β) = A(α,β) ∪ Bβ . (iv) x∈ [ (Ai )(α,β) ⇒ x ∈ (Ai )(α,β) , para algum i i∈J ⇒ (α, β) ≤L∗ (µAi (x), νAi (x)), para algum i ⇒ (α, β) ≤L∗ sup[(µAi (x), νAi (x))] i∈J ⇒ (α, β) ≤L∗ (µ[ Ai i∈J ⇒ x∈( [ Ai )(α,β) . i∈J Logo, [ i∈J (Ai )(α,β) ⊆ ( [ Ai )(α,β) . i∈J 103 (x), ν[ i∈J Ai (x)) Capítulo 6. Teoria Fuzzy Intuicionista (v) x∈ \ (Ai )(α,β) ⇒ x ∈ (Ai )(α,β) , para todo i i∈J ⇒ (α, β) ≤L∗ (µAi (x), νAi (x)), para todo i ⇒ (α, β) ≤L∗ inf[(µAi (x), νAi (x))] i∈J ⇒ (α, β) ≤L∗ (µ\ Ai (x), ν\ i∈J ⇒ x∈( \ Ai (x)) i∈J Ai )(α,β) . i∈J Logo, (vi) \ (Ai )(α,β) ⊆ ( i∈J ∀(α0 , β0 ) \ Ai )(α,β) . i∈J <L∗ (α, β), tem-se por (i) que A(α,β) ⊆ A(α0 ,β0 ) . Então, A(α,β) ⊆ \ A(α0 ,β0 ) . (α0 ,β0 )<L∗ (α,β) Seja x ∈ \ A(α0 ,β0 ) então ∀ε > 0, tem-se que x ∈ A(α−ε,β+ε) , ( onde (α − ε, β + ε) <L∗ (α0 ,β0 )<L∗ (α,β) (α, β)), ou seja, (α − ε, β + ε) ≤L∗ (µA (x), νA (x)). Fazendo ε → 0 tem-se que (α, β) ≤L∗ (µA (x), νA (x)). Portanto, x ∈ A(α,β) . Definição 6.3.3 Um conjunto fuzzy intuicionista A é normal, se existe ao menos um elemento x ∈ X tal que µA (x) = 1 e νA (x) = 0. Definição 6.3.4 O suporte de um conjunto fuzzy intuicionista A é o conjunto: S(A ) = {x ∈ X : µA (x) 6= 0}. Definição 6.3.5 O núcleo de um conjunto fuzzy intuicionista A é o conjunto: N(A ) = {x ∈ X : µA (x) = 1}. Observe que, para (α, β) = (1, 0), o A(α,β) corresponde aos elementos de N(A ). Definição 6.3.6 Um conjunto fuzzy intuicionista A de Rn é convexo se todos seus (α, β)-níveis são conjuntos conexos (clássicos), ou seja, cada (α, β)-nível é um intervalo fechado. 6.4 Números Fuzzy Intuicionistas Existem na literatura diferentes definições de números fuzzy intuicionistas, dentre elas: Atanassov [8], Guha e Chakraborthy [61], Ban [11] e Grzegorzewski [60]. Aqui será considerada esta 104 Capítulo 6. Teoria Fuzzy Intuicionista última. Definição 6.4.1 Um número fuzzy intuicionista um subconjunto fuzzy intuicionista A de R tal que 1. A é normal; 2. A é convexo; 3. µA e νA são semi-contínua superiormente e inferiormente, respectivamente. 1 4. S(A ) é limitado. De agora em diante, o conjunto de todos os números fuzzy intuicionistas será denotado por N I. Observe que, para qualquer conjunto fuzzy intuicionista A sobre R, µA e νA são semi-contínua superiormente e inferiormente respectivamente se, e somente se, A(α,β) é fechado para todo (α, β) ∈ L∗ . Assim, para cada (α, β), os (α, β)-níveis de um número fuzzy intuicionista A são um intervalo fechado, ou seja, tem-se que A(α,β) ∈ IR. Note que, todo conjunto fuzzy pode ser visto como um conjunto fuzzy intuicionista, definindo a função de não-pertinência νA por νA = 1 − µA . Em particular, todo número real r, pode ser visto como um número fuzzy intuicionista, chamado de “crisp”, e será denotado por r. 6.4.1 Operações Aritméticas de Números Fuzzy Intuicionistas Nesta seção, será apresentada a aritmética fuzzy intuicionista através da aritmética intervalar e não pelo princípio de extensão de Zadeh intuicionista, através do qual as operações dos números reais são estendidas às operações em números fuzzy intuicionistas. Na verdade, o cálculo da aritmética fuzzy intuicionista através dos (α, β)-níveis usando aritmética intervalar baseia-se no princípio de extensão de Zadeh. Neste trabalho não será apresentado este princípio de extensão. Assuma nesta seção que os números fuzzy intuicionistas são representados por funções de pertinência e não-pertinência contínuas. Foram obtidas as operações de soma, subtração, multiplicação e divisão entre números fuzzy intuicionistas A e B como sendo os conjuntos fuzzy intuicionistas tais que seus (α, β)-níveis são determinados por 1 Uma função (A + B )(α,β) = A(α,β) + B(α,β) (6.5) (A − B )(α,β) = A(α,β) − B(α,β) (6.6) f : R → R é semi-contínua inferiormente, se para todo β ∈ R, o conjunto {x ∈ R/ f (x) ≤ β} é fechado [114]. 105 Capítulo 6. Teoria Fuzzy Intuicionista (A · B )(α,β) = A(α,β) · B(α,β) (6.7) (A /B )(α,β) = A(α,β) /B(α,β) (6.8) onde supõe-se que 0 não pertence ao suporte de A . A seguir será definido uma métrica sobre os números fuzzy intuicionistas que permite dotar o conjunto de todos os números fuzzy intuicionistas de uma topologia pois permite definir bolas abertas de números fuzzy intuicionistas. Por outro lado, esta métrica também permite estudar a noção de sequências convergentes de números fuzzy intuicionistas (ou, equivalentemente, a nõção de limites de sequências de números fuzzy intuicionistas) 6.4.2 Métrica sobre N I Definição 6.4.2 Dados dois números fuzzy intuicionistas A e B , define-se a distância de Moore, dM (A , B ), por: dM (A , B ) = sup dM (A(α,β) , B(α,β) ), (α,β)∈L∗ onde dM (A(α,β) , B(α,β) ) é a distância de Moore entre os intervalos fechados A(α,β) e B(α,β) que são os (α, β)-níveis de A e B , ou seja, dM (A , B ) = sup max{|l(A(α,β) ) − l(B(α,β) )|, |r(A(α,β) ) − r(B(α,β) )|}. (α,β)∈L∗ É fácil provar que, esta noção de distância entre números fuzzy intuicionistas define uma métrica sobre N I , ou seja, dM : N I × N I → R satisfaz as seguintes propriedades: Se A , B , C ∈ N I , têm-se que: (i) dM (A , B ) ≥ 0; (ii) dM (A , B ) = 0 se , e somente se, A = B ; (iii) dM (A , B ) = dM (B , A ); (iv) dM (A , C ) ≤ dM (A , B ) + dM (B , C ). 6.4.3 Sequências e Limites de Números Fuzzy Intuicionistas Nesta seção serão estudadas a noção de sequências convergentes em N I , que será útil no estudo do comportamento a longo prazo de cadeias de Markov fuzzy intuicionistas. 106 Capítulo 6. Teoria Fuzzy Intuicionista Definição 6.4.3 Uma sequência de números fuzzy intuicionistas é uma função f : N → N I . Se f , g : N → N I são duas sequências de números fuzzy intuicionistas, define-se a soma f + g e o produto f · g como sendo as funções: ( f + g)(n) = f (n) + g(n) e ( f · g)(n) = f (n) · g(n), para todo n ∈ N. Se f : N → N I é uma sequência de números fuzzy intuicionistas, então para cada n ∈ N existem únicos An ∈ N I tais que f (n) = An . Por este motivo, a sequência f : N → N I será identificada como o conjunto formado pelas suas imagens {An ∈ N I : n ∈ N}. De agora em diante, {An }n∈N será dita uma sequência de números fuzzy intuicionistas, ou uma sequência em N I , para representar a sequência f : N → N I dada por f (n) = An . Note que, com esta identificação tem-se que a soma e produto de sequências de números fuzzy intuicionistas pode ser descrita assim: {An }n∈N + {Bn }n∈N = {An + Bn }n∈N e {An }n∈N · {Bn }n∈N = {An · Bn }n∈N . Definição 6.4.4 Diz-se que a sequência {An }n∈N converge para A ∈ N I , e escreve-se An → A ou lim An = A , n→∞ se dado ε > 0, existe n0 ∈ N tal que dM (An , A ) < ε para todo n ≥ n0 . Proposição 6.4.5 Se a sequência {An }n∈N em N I converge, então as sequências {(An )(α,β) }n∈N em IR convergem, para todo (α, β) ∈ L∗ . Neste caso, tem-se que lim An = A ⇒ lim (An )(α,β) = A(α,β) para todo (α, β) ∈ [0, 1]. n→∞ n→∞ Prova: Se lim An = A , então dado ε > 0, existe n0 ∈ N tal que dM (An , A ) < ε para todo n ≥ n0 . n→∞ Mas, dM (An , A ) = sup dM ((An )(α,β) , (A )(α,β) ). (α,β)∈L∗ Logo, dM ((An )(α,β) , (A )(α,β) ) < ε para todo (α, β) ∈ L∗ e para todo n ≥ n0 . Portanto, lim (An )(α,β) = n→∞ A(α,β) para todo (α, β) ∈ L∗ . 107 Capítulo 6. Teoria Fuzzy Intuicionista 6.4.4 Relações de Ordem entre Números Fuzzy Intuicionistas É possível estabelecer diversas (há mais de 40 apresentadas na literatura) ordens sobre números fuzzy intuicionistas [20]. Aqui serão usadas as seguintes ordens sobre números fuzzy intuicionistas. Definição 6.4.6 (Ordem da Inclusão) A ⊆ B ⇔ A(α,β) ⊆ B(α,β) para todo (α, β) ∈ L∗ . Definição 6.4.7 (Ordem de Kulisch-Miranker) A ≤K B ⇔ A(α,β) ≤K B(α,β) para todo (α, β) ∈ L∗ . Definição 6.4.8 (Ordem de Moore) A ≤M B ⇔ A(α,β) ≤M B(α,β) para todo (α, β) ∈ L∗ . Definição 6.4.9 A B ⇔ A(α,β) E B(α,β) para todo (α, β) ∈ L∗ onde, como foi vista, A(α,β) E B(α,β) ⇔ r(A(α,β) ) < r(B(α,β) ) ou (r(A(α,β) ) = r(B(α,β) ) e l(B(α,β) ) ≤ l(A(α,β) ) como na Definição 2.5.4. É fácil verificar que esta ordem sobre números fuzzy intuicionistas não é uma ordem total, ao contrário do que acontece com a ordem E sobre IR. A ordem está sendo introduzida neste trabalho e desenvolverá um papel importante nos capítulos subsequentes. Observação 6.4.10 Note que, a ordem é mais fina que a ordem de inclusão entre números fuzzy intuicionistas, no sentido que se A ⊆ B então A B . Definição 6.4.11 Diz-se que um número fuzzy intuicionista A é positivo se todos seus (α, β)-níveis são intervalos positivos. Note que, se A é um número fuzzy intuicionista positivo, então 0 A , mas a recíproca não é verdadeira, ou seja, existem números fuzzy intuicionistas B tais que 0 B mas para os quais existe um (α, β)-nível tal que l(B(α,β) ) < 0. Lema 6.4.12 Sejam A , B e C números fuzzy intuicionistas. Então, B 1. Se A ⊆ B e C é positivo, então A C ⊆C 108 Capítulo 6. Teoria Fuzzy Intuicionista 2. Se B ⊆ C são números fuzzy intuicionistas positivos, então A ⊆ A B C 3. Se A é um número fuzzy intuicionista positivo, então B ⊆ A · B A Prova: Será provado apenas a primeira propriedade, pois as outras seguem de forma análoga. Como um número fuzzy intuicionista positivo C tem a propriedade que l(C(α,β) ) > 0 para cada (α, β) ∈ L∗ . Se A(α,β) ⊆ B(α,β) então l(B(α,β) ) ≤ l(A(α,β) ) ≤ r(A(α,β) ) ≤ r(B(α,β) ). Assim, l(B(α,β) ) l(A(α,β) ) r(A(α,β) ) r(B(α,β) ) ≤ ≤ ≤ . r(C(α,β) ) r(C(α,β) ) l(C(α,β) ) l(C(α,β) ) A(α,β) B(α,β) Portanto, C(α,β) ⊆ C(α,β) , i.e. AC ⊆ BC . 109 Capítulo 7 Teoria de Probabilidade Fuzzy Intuicionista 7.1 Considerações Iniciais A incerteza relacionada com a ocorrência de um evento é representada pela teoria da probabilidade que lida principalmente com aspecto quantitativo de um evento ou situação. O desenvolvimento dessas teorias é basicamente interpretar os acontecimentos no mundo real em que a co-existência de probabilidade e possibilidade é quase universalmente inerente. As probabilidades fuzzy intuicionistas, são probabilidades representadas através de números fuzzy intuicionistas. Na teoria das probabilidades clássicas a soma das probabilidades tem que dar 1. Neste trabalho foram feitas duas abordagens de probabilidade fuzzy intuicionista: uma em que 1 pertence à soma dos núcleos das probabilidades fuzzy intuicionistas e a outra em que essa restrição da equação 7.2. Esta noção de probabilidade fuzzy intuicionista será utilizada no cálculo das probabilidades de transição de uma cadeia de Markov fuzzy intuicionista. 7.2 Axiomática da Probabilidade Fuzzy Intuicionista Nesta seção será proposta um novo sistema axiomático para a teoria de probabilidade fuzzy intuicionista, o qual é baseado na axiomática da probabilidade intervalar descrita na seção 3.2 e tem como objetivo generalizar a teoria de probabilidade clássica com o intuito de descrever a incerteza de um modo geral. De agora em diante, será denotada por N I ([0, 1]) o conjunto de todos os números fuzzy intuicionistas cujo suporte esta contido em [0, 1]. Dado (α, β) ∈ L∗ defina a função N(α,β) : N I ([0, 1]) → I([0, 1]) por N(α,β) (A ) = A(α,β) . Seja (Ω, F ) um espaço de probabilidade. Uma probabilidade fuzzy intuicionista é uma função P : F → N I ([0, 1]), que satisfaz a seguinte propriedade: a função composta P(α,β) = 110 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista N(α,β) ◦ P : F → I([0, 1]), dada por P(α,β) (A) = (P(A))(α,β) ∈ I([0, 1]), é uma probabilidade intervalar, para todo (α, β) ∈ L∗ , no sentido que existem duas funções P(α,β) , P(α,β) : F → [0, 1] tais que P(α,β) (A) = [P(α,β) (A), P(α,β) (A)] para todo A ∈ F e que satisfazem os axiomas IV-VII da seção 3.2, ou seja, para todo (α, β) ∈ L∗ , tem-se que / = 0 e P(α,β) (Ω) = 1; (1) P(α,β) (0) (2) P(α,β) (A) = 1 − P(α,β) (Ac ), para todo A ∈ F , onde Ac = Ω \ A é o complementar de A; / então P(α,β) (A ∪ B) ≥ P(α,β) (A) + P(α,β) (B); (3) (Super aditividade) Se A ∩ B = 0, / então P(α,β) (A ∪ B) ≤ P(α,β) (A) + P(α,β) (B). (4) (Sub aditividade) Se A ∩ B = 0, A função de probabilidade intervalar P(α,β) é chamada de função induzida por P nos (α, β)níveis, ou simplesmente os (α, β)-níveis de P. As funções P(α,β) e P(α,β) são chamadas de probabilidades inferior e superior, respectivamente, induzidas por P no (α, β)-níveis. Uma probabilidade fuzzy intuicionista P : F → N I ([0, 1]) é coerente se a probabilidade inferior P(α,β) : F → [0, 1] induzida por P nos (α, β)-níveis é coerente para todo (α, β) ∈ L∗ , ou seja, se para todo (α, β) ∈ L∗ existir um conjunto não-vazio M(α,β) de funções de probabilidades clássicas sobre F tal que P(α,β) (A) = inf{π(A) : π ∈ M(α,β) }, para todo A ∈ F . Neste caso, pela propriedade (2) acima, necessariamente tem-se que P(α,β) (A) = sup{π(A) : π ∈ M(α,β) }, para todo A ∈ F . / = 0 e P(α,β) (Ω) = 1. Portanto, se P é coerente, P(0) / = Note que, se P é coerente então P(α,β) (0) 0 e P(Ω) = 1. Uma probabilidade fuzzy intuicionista P : F → N I ([0, 1]) é 2-monótona se a probabilidade inferior P(α,β) : F → [0, 1] induzida por P nos (α, β)-níveis é 2-monótona para todo (α, β) ∈ L∗ , ou seja, se para todo (α, β) ∈ L∗ e para todo A, B ∈ F tem-se que P(α,β) (A) + P(α,β) (B) ≤ P(α,β) (A ∪ B) + P(α,β) (A ∩ B). Neste caso, pelo item (2) acima, necessariamente tem-se que P(α,β) (A) + P(α,β) (B) ≥ P(α,β) (A ∪ B) + P(α,β) (A ∩ B). É possível provar que todas probabilidades fuzzy intuicionistas que são 2-monótonas são também coerentes (veja por exemplo [68] Lemma 2.5). 111 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista 7.3 Probabilidade Fuzzy Intuicionista Nesta seção serão estudadas duas noções de Probabilidade Fuzzy Intuicionista: uma essencialmente dada por Buckley e outra de natureza original. Uma noção de probabilidade fuzzy intuicionista desenvolvida neste trabalho foi dada essencialmente por Buckley em [20]. Diz-se "essencialmente"pelo fato que Buckley trabalha apenas com probabilidade fuzzy. Uma outra diferença é que Buckley trabalha com uma ordem diferente da ordem adotada neste trabalho (veja a Observação 4.3.15). O motivo pelo qual prefere-se a ordem entre números fuzzy intuicionistas deve-se ao fato que é fácil de ser verificada em exemplos concretos, é mais fina que a ordem de inclusão entre números fuzzy intuicionistas, no sentido que se A ⊆ B são números fuzzy intuicionistas então A B , e além disso é útil para provar propriedades importantes sobre probabilidade fuzzy intuicionista. 7.3.1 Probabilidade Fuzzy Intuicionista Restrita Primeiramente define-se a noção de probabilidade fuzzy intuicionista proposta neste trabalho, a qual baseia-se na noção de probabilidade fuzzy restrita: Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos com a propriedade que r S(Fi ) ⊆ [0, 1] e existam ai ∈ N(Fi ), i = 1, . . . , r tais que ∑ ai = 1, (7.1) i=1 onde S(Fi ) e N(Fi ) denotam o suporte e núcleo de Fi respectivamente. Neste caso, diz-se que F satisfaz a restrição aritmética fuzzy intuicionista (7.1). Se F = (F1 , . . . , Fr ) é um conjunto ordenado de números fuzzy intuicionistas, denotado por F(α,β) o conjunto ordenado dos (α, β)-níveis de F1 , . . . , Fr , ou seja, F(α,β) = (F1,(α,β) , . . . , Fr,(α,β) ) para todo (α, β) ∈ L∗ . Definição 7.3.1 Seja Ω = {x1 , . . . , xr } e seja seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos que satisfazem a restrição aritmética fuzzy intuicionista (7.1). Dado qualquer subconjunto A de Ω, defina a probabilidade fuzzy intuicionista restrita de A como sendo o conjunto fuzzy intuicionista PFIR(A) cujos (α, β)-níveis são dados por: ( (PFIR(A))(α,β) = r ) ∑ ai : a = (a1 , . . . , ar ) ∈ F(α,β) e ∑ ai = 1 i∈IA . (7.2) i=1 onde IA = { j ∈ {1, . . . , r} : x j ∈ A}. Esta função PFIR algumas vezes será denotada por PFIRF para enfatizar a dependência desta função de probabilidade com o conjunto F. A equação (7.1) define uma restrição à aritmética para este modelo de probabilidade fuzzy intuicionista. 112 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista Note que, existe uma íntima relação entre a probabilidade fuzzy intuicionista restrita e a probabilidade intervalar restrita, dada por: (PFIR(A))(α,β) = PIRF(α,β) (A) (7.3) para todo (α, β) ∈ L∗ e para todo A ⊆ Ω. O resultado seguinte generaliza um resultado provado por Buckley em [20, p.32] Teorema 7.3.2 Para cada A ⊆ Ω, PFIR(A) é um número fuzzy intuicionista cujo suporte está contido em [0, 1]. Em particular, tem-se uma função PFIR : ℘(Ω) → N I ([0, 1]). Prova: Será provado que, (PFIR(A))(α,β) são os (α, β)-níveis de um número fuzzy intuicionista PFIR(A). r r i=1 i=1 Seja S = {(y1 , . . . , yr ) ∈ [0, 1]r : ∑ yi = 1}. Defina D[(α, β)] = S ∩ ∏ Fi,(α,β) e f : D[(α, β)] → [0, 1] por f (a1 , . . . , ar ) = ∑ ai . (7.4) i∈IA Tem-se que f é contínua e D[(α, β)] é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (7.2), é claro que PFIR(A) = / f (D[(α, β)]). Além disso, PFIR(A) é normal pois (PFIR(A))(1,0) 6= 0. A função PFIR é chamada de Probabilidade Fuzzy Intuicionista Restrita. Observação 7.3.3 Suponha que P : ℘(Ω) → [0, 1] é uma função de probabilidade no sentido clássico, onde Ω = {x1 , . . . , xr }. Por exemplo, P({xk }) = ak , ∀k = 1, . . . , r. Então, a1 + a2 + . . . + ar = 1 Seja F = (a1 , . . . , ar ). Então, PFIRF = P, ou seja, esta definição de probabilidade fuzzy intuicionista estende a noção de probabilidade clássica. Teorema 7.3.4 Seja Ω = {x1 , . . . , xr } e seja PFIR : ℘(Ω) → N I ([0, 1]) a função de probabilidade fuzzy intuicionista restrita. Então, para cada A, B ⊆ Ω têm-se as seguintes propriedades: / então PFIR(A∪B) ⊆ PFIR(A)+PFIR(B). Em particular, tem-se que PFIR(A∪ (i) Se A∩B = 0, B) PFIR(A) + PFIR(B). (ii) Se A ⊆ B, então PFIR(A) ≤K PFIR(B) e PFIR(A) PFIR(B) onde ≤K é a ordem de Kulisch-Miranker sobre IR. / = 0 PFIR(A) 1 = PFIR(Ω). (iii) PFIR(0) 113 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista (iv) 1 ⊆ PFIR(A) + PFIR(Ac ). Em particular, 1 PFIR(A) + PFIR(Ac ). / então PFIR(A ∪ B) ⊆ PFIR(A) + PFIR(B) − PFIR(A ∩ B). Em particular (v) Se A ∩ B 6= 0, PFIR(A ∪ B) PFIR(A) + PFIR(B) − PFIR(A ∩ B). Prova: Itens (ii) e (iii) são triviais e item (iv) segue do item (i). Portanto, será provado apenas os itens (i) e (v). / Note que, A ∩ B = 0/ se e somente se, IA ∩ IB = 0. Para provar (i) é suficiente provar que dado (α, β) ∈ L∗ , tem-se que (PFIR(A ∪ B))(α,β) ⊆ (PFIR(A))(α,β) + (PFIR(B))(α,β) e que (PFIR(A ∪ B))(α,β) (PFIR(A))(α,β) + (PFIR(B))(α,β) . Mas, isto segue do Teorema 3.3.5 e da equação (7.3). Para provar (v), é suficiente mostrar que dado (α, β) ∈ L∗ , têm-se que (PFIR(A ∪ B))(α,β) ⊆ (PFIR(A))(α,β) + (PFIR(B))(α,β) − (PFIR(A ∩ B))(α,β) e que (PFIR(A ∪ B))(α,β) (PFIR(A))(α,β) + (PFIR(B))(α,β) − (PFIR(A ∩ B))(α,β) . Mas, isto segue do Teorema 3.3.5 e da equação (7.3). Proposição 7.3.5 A Probabilidade fuzzy intuicionista restrita PFIR é uma probabilidade fuzzy intuicionista no sentido axiomático, ou seja, satisfaz as propriedades (1) − (4) da seção 7.2 da teoria de probabilidade fuzzy intuicionista. Além disso, PFIR é 2-monótona, e portanto coerente. Prova: Seja (α, β) ∈ L∗ . Será provado que estas relações (1) − (4) são verdadeiras quando restringidos aos seus (α, β)-níveis. Mas, isto segue diretamente do Corolário 3.3.6 e da equação (7.3). A seguinte observação é útil para entender melhor as cadeias de Markov fuzzy intuicionista. r Observação 7.3.6 Note que, para cada (α, β) ∈ L∗ e para cada a = (a1 , . . . , ar ) ∈ F(α,β) com ∑ ai = i=1 1 será definida a seguinte função de probabilidade no sentido clássico P(a,α,β) : ℘(Ω) −→ [0, 1], dada por: P(a,α,β) (A) = ∑ ai , para todo A ⊆ X. i∈IA Em outras palavras, a probabilidade fuzzy intuicionista restrita pode ser entendida como uma família de probabilidades intervalares, parametrizadas por (α, β) ∈ L∗ , que são os (α, β)-níveis 114 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista r PFIR(α,β) de PFIR, as quais são parametrizadas por todos os a = (a1 , . . . , ar ) ∈ F(α,β) com ∑ ai = i=1 1. Mais precisamente, ( PFIR(α,β) (A) = (PFIR(A))(α,β) = P ) r (a,α,β) (A) : a ∈ F(α,β) e ∑ ai = 1 . i=1 Além disso, ( ) r (a,α,β) PFIR(α,β) (A) = inf P (A) : a ∈ F(α,β) e ∑ ai = 1 i=1 e ( ) r (a,α,β) PFIR(α,β) (A) = sup P (A) : a ∈ F(α,β) e ∑ ai = 1 , i=1 o que confirma o fato de PFIR ser coerente. 7.3.2 Probabilidade Fuzzy Intuicionista Agora será definida a noção de probabilidade fuzzy intuicionista proposta neste trabalho. Definição 7.3.7 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionista positivos. Seja Ω = {x1 , . . . , xr }. Dado qualquer subconjunto A de Ω, defina a probabilidade fuzzy intuicionista de A como sendo o conjunto fuzzy intuicionista PFI(A) cujos (α, β)-níveis são dados por: (PFI(A))(α,β) = ∑ ai i∈IA r ∑ ai : a = (a1 , . . . , ar ) ∈ F(α,β) . (7.5) i=1 onde IA = { j ∈ {1, . . . , r} : x j ∈ A}. Esta função PFI algumas vezes será denotada por PFIF para enfatizar a dependência desta função de probabilidade com o conjunto F. Note que, existe uma íntima relação entre a probabilidade fuzzy intuicionista e a probabilidade intervalar dada por: (PFI(A))(α,β) = PIF(α,β) (A) (7.6) para todo (α, β) ∈ L∗ e para todo A ⊆ Ω. Teorema 7.3.8 Para cada A ⊆ Ω, PFI(A) é um número fuzzy intuicionista cujo suporte está contido em [0, 1]. Em particular, tem-se a função PFI : ℘(Ω) → N I ([0, 1]). 115 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista Prova: Será provado que (PFI(A))(α,β) são os (α, β)-níveis de um número fuzzy intuicionista PFI(A). r Defina D[(α, β)] = ∏ Fi,(α,β) e f : D[(α, β)] → [0, 1] por i=1 ∑ ai f (a1 , . . . , ar ) = i∈IA r . (7.7) ∑ ai i=1 Tem-se que f é contínua e D[(α, β)] é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (7.5), é claro que PFI(A) = f (D[(α, β)]). A função PFI é chamada de Probabilidade Fuzzy Intuicionista. Observação 7.3.9 A probabilidade fuzzy intuicionista proposta neste trabalho é menos restrita que a probabilidade fuzzy intuicionista restrita pois não foi assumida que os números fuzzy intuicionista positivos F1 , . . . , Fr tenham seus suportes contidos em [0, 1] e nem que satisfaça a restrição aritmética fuzzy intuicionista dada pela condição (7.1). Por esta razão, a probabilidade fuzzy intuicionista PFI(A) é mais fácil de ser calculada que a probabilidade PFIR(A). No entanto, existe uma forte relação entre as duas abordagens que a seguir serão discutidas. Suponha que F = (F1 , . . . , Fr ) é um conjunto ordenado de números fuzzy intuicionistas positivos, cujos suportes estejam contidos em [0, 1], que satisfazem a condição (7.1). Neste caso, as duas funções de probabilidade fuzzy intuicionista estão bem definidas. Além disso, analogamente ao que ocorre com probabilidade intervalar e fuzzy, tem-se que para todo subconjunto A de Ω, PFIR(A) ⊆ PFI(A) pois, das equações (7.3) e (7.6) têm-se que para todo (α, β) ∈ L∗ , (PFIR(A))(α,β) ⊆ (PFI(A))(α,β) . Observação 7.3.10 Suponha que P : ℘(Ω) → [0, 1] é uma função de probabilidade no sentido clássico, onde Ω = {x1 , . . . , xr }. Por exemplo, P({xk }) = ak , ∀k = 1, . . . , r. Então, a1 + a2 + . . . + ar = 1 Seja F = (a1 , . . . , ar ). Então, PFIF = P, ou seja, esta definição de probabilidade fuzzy intuicionista estende a noção de probabilidade clássica. Teorema 7.3.11 Seja Ω = {x1 , . . . , xr } e seja PFI : ℘(Ω) → N I ([0, 1]) a função de probabilidade fuzzy intuicionista. Então, para cada A, B ⊆ Ω têm-se as seguintes propriedades: / então PFI(A ∪ B) ⊆ PFI(A) + PFI(B). Em particular, tem-se que PFI(A ∪ (i) Se A ∩ B = 0, B) PFI(A) + PFI(B). 116 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista (ii) Se A ⊆ B, então PFI(A) ≤K PFI(B) e PFI(A) PFI(B) onde ≤K é a ordem de KulischMiranker sobre IR. / = 0 PFI(A) 1 = PFI(Ω). (iii) PFI(0) (iv) 1 ⊆ PFI(A) + PFI(Ac ). Em particular, 1 PFI(A) + PFI(Ac ). / então PFI(A ∪ B) ⊆ PFI(A) + PFI(B) − PFI(A ∩ B). (v) Se A ∩ B 6= 0, Prova: Itens (ii) e (iii) são triviais e item (iv) segue do item (i). Portanto, será provado apenas os itens (i) e (v). / Note que, A ∩ B = 0/ se e somente se, IA ∩ IB = 0. Para provar (i) é suficiente provar que dado (α, β) ∈ L∗ , tem-se que (PFI(A ∪ B))(α,β) ⊆ (PFI(A))(α,β) + (PFI(B))(α,β) e que (PFI(A ∪ B))(α,β) (PFI(A))(α,β) + (PFI(B))(α,β) . Mas, isto segue do Teorema 3.3.12 e da equação (7.6). Para provar (v), é suficiente mostrar que dado (α, β) ∈ L∗ , têm-se que (PFI(A ∪ B))(α,β) ⊆ (PFI(A))(α,β) + (PFI(B))(α,β) − (PFI(A ∩ B))(α,β) e (PFI(A ∪ B))(α,β) (PFI(A))(α,β) + (PFI(B))(α,β) − (PFI(A ∩ B))(α,β) . Mas, isto segue do Teorema 3.3.12 e da equação (7.6). Proposição 7.3.12 A probabilidade fuzzy intuicionista PFI é uma probabilidade fuzzy intuicionista no sentido axiomático, ou seja, satisfaz as propriedades (1) − (4) da seção 7.2 da teoria de probabilidade fuzzy intuicionista. Além disso, PFI é 2-monótona, e portanto coerente. Prova: É suficiente provar que estas relações são verdadeiras quando restritas aos seus (α, β)níveis. Mas, isto segue diretamente do Corolário 3.3.13 e da equação (7.6). A seguinte observação é útil para entender melhor as cadeias de Markov fuzzy intuicionista. Observação 7.3.13 Note que, para cada (α, β) ∈ L∗ e para cada a = (a1 , . . . , ar ) ∈ F(α,β) defina a seguinte função de probabilidade no sentido clássico P(a,α,β) : ℘(Ω) −→ [0, 1] dada por P(a,α,β) (A) = ∑ ai , para todo A ⊆ Ω. i∈IA 117 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista Em outras palavras, a probabilidade fuzzy intuicionista pode ser entendida como uma família de probabilidades intervalares, parametrizadas por (α, β) ∈ L∗ , que são os (α, β)-níveis PFI(α,β) de PFI, as quais são parametrizadas por todos os a = (a1 , . . . , ar ) ∈ F(α,β) . Mais precisamente, o n PFI(α,β) (A) = (PFI(A))(α,β) = P(a,α,β) (A) : a ∈ F(α,β) . Além disso, n o PFI(α,β) (A) = inf P(a,α,β) (A) : a ∈ F(α,β) e n o PFI(α,β) (A) = sup P(a,α,β) (A) : a ∈ F(α,β) , o que confirma o fato de PFI ser coerente. Observação 7.3.14 Retomando o exemplo da observação 5.3.14, tem-se que o número fuzzy intuicionista triangular de Atanassov (NFITA) que representa a probabilidade fuzzy intuicionista de Atanassov do Peru ganhar o Chile no próximo jogo é (0.22, 0.33/0.4/0.49, 0.58). 7.4 Probabilidade Condicional Fuzzy Intuicionista Seja F(α,β) = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos. Seja Ω = {x1 , . . . , xr } e sejam A, B ⊆ Ω com IA e IB os seus respectivos conjuntos de índices. Se F(α,β) satisfaz a restrição aritmética fuzzy intuicionista dada pela condição (7.1), Buckley essencialmente definiu a probabilidade condicional fuzzy intuicionista restrita de A com respeito de B como sendo o conjunto fuzzy intuicionista PFIR(A | B) cujos (α, β)-níveis são dados por (PFIR(A | B))(α,β) = ∑ ai i∈IA ∩IB ∑ aj r : a ∈ F(α,β) e ∑ ai = 1 . i=1 j∈IB (7.8) Neste trabalho é definida a probabilidade condicional fuzzy intuicionista de A com respeito de B como sendo o conjunto fuzzy intuicionista PFI(A | B) cujos (α, β)-níveis são dados por (PFI(A | B))(α,β) = ∑ ai i∈IA ∩IB ∑ aj : a ∈ F(α,β) j∈IB . (7.9) Note que, existe uma estreita relação entre a probabilidade condicional fuzzy intuicionista restrita e a probabilidade condicional intervalar restrita dada por: (PFIR(A | B))(α,β) = PBF(α,β) (A | B) 118 (7.10) Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista para todo (α, β) ∈ L∗ e para todo A, B ⊆ Ω. Analogamente, tem-se uma relação estreita entre a probabilidade condicional fuzzy intuicionista e a probabilidade condicional intervalar, dada por: (PFI(A | B))(α,β) = PIF(α,β) (A | B) (7.11) para todo (α, β) ∈ L∗ e para todo A, B ⊆ Ω. Proposição 7.4.1 Dados A, B ⊆ Ω tem-se que PFIR(A | B), PFI(A | B) ∈ N I ([0, 1]). r Prova: Dado (α, β) ∈ L∗ , defina D[(α, β)] = ∏ Ii e f : D[(α, β)] → [0, 1] por i=1 ∑ ai f (a1 , . . . , ar ) = i∈IA ∩IB ∑ aj . (7.12) i∈IB Tem-se que f é contínua e D[(α, β)] é conexo, fechado e limitado. Assim, a imagem de f é um subintervalo limitado e fechado de [0, 1]. Mas, pela equação (7.9), é claro que (PFI(A | B))(α,β) = f (D[(α, β)]), o que prova que PFI(A | B) ∈ N I ([0, 1]). A condição PFIR(A | B) ∈ N I ([0, 1]) prova-se analogamente. Observação 7.4.2 Seja (α, β) ∈ L∗ e seja F(α,β) = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos. Para cada a ∈ F(α,β) e para cada A, B ⊆ Ω defina ∑ ai P (a,α,β) (A|B) = i∈IA ∩IB ∑ ai , para todo A ⊆ Ω. i∈IB tem-se que n o (PFI(A | B))(α,β) = P(a,α,β) (A|B) : a ∈ F(α,β) e se F satisfaz a condição (7.1) tem-se que ( (PFIR(A | B))(α,β) = P r (a,α,β) (A|B) : a ∈ F(α,β) e ) ∑ ai = 1 , i=1 ou seja, estas duas probabilidades condicionais fuzzy intuicionistas podem ser entendidas como uma família de probabilidades condicionais intervalares, parametrizadas por (α, β) ∈ L∗ , que são os (α, β)-níveis PFI(α,β) e PFIR(α,β) de PFI e de PFIR, respectivamente, as quais são parametrizadas por todos os a = (a1 , . . . , ar ) ∈ F(α,β) . Proposição 7.4.3 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos. Dados A, B ⊆ Ω, têm-se que: (i) PFI(A | B) ⊆ PFI(A ∩ B) ; PFI(B) 119 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista (ii) Se F satisfaz a condição (7.1) então PFIR(A | B) ⊆ PFIR(A ∩ B) . PFIR(B) Prova: Seja (α, β) ∈ L∗ . Será provado que (PFI(A | B))(α,β) ⊆ (PFI(A ∩ B))(α,β) ; (PFI(B))(α,β) e se F satisfaz a condição (7.1) então (PFIR(A | B))(α,β) ⊆ (PFIR(A ∩ B))(α,β) . (PFIR(B))(α,β) Mas, isto segue das equações (7.11) e (7.10) e da Proposição 3.5.3 Teorema 7.4.4 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos. Seja Ω = {x1 , . . . , xr }. Então, para cada A, B ⊆ Ω têm-se as seguintes propriedades: / Então, PFI(A1 ∪ A2 | B) ⊆ PFI(A1 | B) + PFI(A2 | B). (i) Se A1 ∩ A2 = 0. (ii) 0 PFI(A | B) 1. (iii) PFI(A | A) = 1. (iv) Se B ⊆ A. Então, PFI(A | B) = 1. / Então, PFI(A | B) = 0. (v) Se A ∩ B = 0. Além disso, se F satisfaz a restrição aritmética fuzzy intuicionista dada pela condição (7.1) tem-se que (i) − (v) também são verdadeiros se substituir PFI(· | ·) por PFIR(· | ·). Prova: Seja (α, β) ∈ L∗ . É suficiente provar que estas relações são verdadeiras quando restritas aos seus (α, β)-níveis. Mas, isto segue do Teorema 3.5.4 e das equações (7.11) e (7.10). O próximo objetivo será provar a versão fuzzy intuicionista do importante teorema da probabilidade total, mas para isto é necessário alguns resultados prévios. Lema 7.4.5 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos. Dados A, B ⊆ Ω, têm-se que: (i) PFI(A ∩ B) ⊆ PFI(A | B) · PFI(B); (ii) Se F satisfaz a restrição aritmética fuzzy intuicionista dada pela condição (7.1) tem-se que PFIR(A ∩ B) ⊆ PFIR(A | B) · PFIR(B). Prova: É suficiente provar que estas relações são verdadeiras quando restritas aos seus (α, β)níveis. Mas, isto segue do Lema 3.5.5 e das equações (7.11) e (7.10). 120 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista Lema 7.4.6 Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos. Dados A, B,C ⊆ Ω tem-se que (i) PFI(A ∩ B | C) ⊆ PFI(A | C) · PFI(B | A ∩C); (ii) Se F satisfaz a restrição aritmética fuzzy intuicionista dada pela condição (7.1) tem-se que PFIR(A ∩ B | C) ⊆ PFIR(A | C) · PFI(B | A ∩C). Prova: É suficiente provar que estas relações são verdadeiras quando restritas aos seus (α, β)níveis. Mas, isto segue do Lema 3.5.6 e das equações (7.11) e (7.10). Teorema 7.4.7 (Teorema da Probabilidade Total Fuzzy intuicionista) Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionista positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que Ai ∩ A j = 0/ se i 6= j e Ω = k S Ai . Seja D um evento qualquer. Então, i=1 k (i) PFI(D) ⊆ ∑ PFI(Ai ) · PFI(D | Ai ); i=1 (ii) Se F satisfaz a restrição aritmética fuzzy intuicionista dada pela condição (7.1) tem-se que k PFIR(D) ⊆ ∑ PFIR(Ai ) · PFIR(D | Ai ). i=1 Prova: É suficiente provar que estas relações são verdadeiras quando restritas aos seus (α, β)níveis. Mas, isto segue do Teorema da Probabilidade Total Intervalar, Teorema 3.5.7, e das equações (7.11) e (7.10). Teorema 7.4.8 (Teorema da Probabilidade Condicional Total Fuzzy Intuicionista) Seja F = (F1 , . . . , Fr ) um conjunto ordenado de números fuzzy intuicionistas positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que Ai ∩ A j = 0/ se i 6= j e Ω = k S Ai . Sejam i=1 B,C ⊆ Ω. Então, k (i) PFI(B|C) ⊆ ∑ PFI(Ai |C) · PFI(B | Ai ∩C); i=1 (ii) Se F satisfaz a restrição aritmética fuzzy intuicionista dada pela condição (7.1) tem-se que k PFIR(B|C) ⊆ ∑ PFIR(Ai |C) · PFIR(B | Ai ∩C). i=1 Prova: É suficiente provar que estas relações são verdadeiras quando restritas aos seus (α, β)níveis. Mas, isto segue do Teorema da Probabilidade Condicional Total Intervalar, Teorema 3.5.8, e das equações (7.11) e (7.10). 121 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista O próximo objetivo é provar a versão fuzzy intuicionista do importante Teorema de Bayes em teoria clássica de probabilidades. Teorema 7.4.9 Teorema de Bayes Fuzzy intuicionista Seja F = (F1 , . . . , Fr ) um conjunto ordenado de intervalos positivos. Sejam A1 , . . . , Ak subconjuntos de Ω = {x1 , . . . , xr } tais que Ai ∩ A j = k S 0/ se i 6= j e Ω = Ai . Seja D um evento qualquer, então, i=1 (i) PFI(Ai | D) ⊆ PFI(Ai ∩ D) ; k ∑ PFI(A j ) · PFI(D | A j ) j=1 (ii) Se F satisfaz a restrição aritmética fuzzy intuicionista dada pela condição (7.1) tem-se que PFIR(Ai | D) ⊆ PFIR(Ai ∩ D) k ; ∑ PFIR(A j ) · PFIR(D | A j ) j=1 Prova: É suficiente provar que estas relações são verdadeiras quando restritas aos seus (α, β)níveis. Mas isto segue do Teorema de Bayes Intervalar, Teorema 3.5.9 e das equações (7.11) e (7.10). 7.5 7.5.1 Cadeias de Markov Fuzzy Intuicionistas Cadeias de Markov Fuzzy Intuicionistas finitas com tempo discreto Nesta seção, com o intuito de unificar as teorias de cadeias de Markov fuzzy intuicionista, PFI denotará qualquer uma das funções de probabilidade fuzzy intuicionista PFIR ou PFI. Nesta seção serão consideradas apenas cadeias de Markov fuzzy intuicionistas finitas com tempo discreto, ou seja aquelas nas quais os estados mudam em certos instantes de tempo discreto, indexados por uma variável inteira n. A cada passo de tempo n, a cadeia de Markov tem um estado, denotado por Xn , que pertence a um conjunto finito S de possíveis estados. Sem perda de generalidade, suponha que o conjunto de estados é S = {1, . . . , m}, onde m é um inteiro positivo. A cadeia de Markov é descrita em termos de suas probabilidades fuzzy intuicionistas de transição PFIi j : sempre que o estado passa a ser i, existe uma probabilidade fuzzy intuicionista PFIi j que o próximo estado seja j. Matematicamente, se i, j ∈ S, PFIi j = PFI(Xn+1 = j | Xn = i). A principal suposição que norteia os processos de Markov é que as probabilidades fuzzy intuicionista de transição PFIi j estão definidas sempre que o estado i seja visitado, independente do 122 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista que aconteceu no passado e de como o estado i foi atingido. Matematicamente, suponha a seguinte propriedade de Markov, que demanda: PFI(Xn+1 = j | Xn = i, Xn−1 = in−1 , . . . , X0 = i0 ) = PFI(Xn+1 = j | Xn = i) = PFIi j para todos os tempos n, todos os estados i, j ∈ S e todas as sequências possíveis i0 , . . . , in−1 de estados passados. Em outras palavras, a lei de probabilidade fuzzy intuicionista do estado seguinte Xn+1 depende do passado apenas através do valor do estado presente Xn . Defina a probabilidade fuzzy intuicionista de transição de n-passos PFIi j (n) como a probabilidade fuzzy intuicionista de um processo no estado i estar no estado j após n transições adicionais. Matematicamente, PFIi j (n) = PFI(Xn = j | X0 = i). Note que, pelo Teorema da probabilidade total fuzzy intuicionista tem-se que m m PFI(Xn = j) ⊆ ∑ PFI(X0 = i) · PFI(Xn = j | X0 = i) = ∑ PFI(X0 = i) · PFIi j (n). i=1 i=1 Além disso, das equações (7.10) e (7.11) tem-se que (PFIi j (n))(α,β) = (PF(α,β) )i j (n) para todo n ∈ N, (7.13) onde a probabilidade intervalar do lado direito é considerada com respeito da família de intervalos F(α,β) . Observação 7.5.1 Note que, pela Observação 7.4.2 os processos Markovianos fuzzy intuicionistas podem ser vistos como famílias de processos Markovianos clássicos. Mais precisamente, pode-se olhar os (α, β)-níveis das probabilidades de transição fuzzy intuicionistas PFIi j como uma família de probabilidades de transição clássica da seguinte forma o n o n (a,α,β) : a ∈ F(α,β) (PFIi j )(α,β) = P(a,α,β) (X1 = j | X0 = i) : a ∈ F(α,β) = Pi j se PFI = PFI ou (PFIi j )(α,β) = P(a,α,β) (X1 = j | X0 = i) : a ∈ F(α,β) e ∑ ai = 1 r i=1 = (a,α,β) Pi j r : a ∈ F(α,β) e ∑ ai = 1 , i=1 se PFI = PFIR, onde P(a,α,β) (A | B) é definido como na Observação 7.4.2 Da mesma forma, pode-se caracterizar os (α, β)-níveis da probabilidade fuzzy intuicionista de transição de n-passos PFIi j (n) como uma família de probabilidades de transição de n-passos 123 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista clássica, da seguinte forma (a,α,β) P (Xn = j | X0 = i) : a ∈ F(α,β) o n (a,α,β) (n) : a ∈ F(α,β) , se PFI = PFI = Pi j (PFIi j (n))(α,β) = ou (PFIi j (n))(α,β) r (a,α,β) = P (Xn = j | X0 = i) : a ∈ F(α,β) e ∑ ai = 1 i=1 r (a,α,β) (n) : a ∈ F(α,β) e ∑ ai = 1 , = Pi j i=1 se PFI = PFIR. A seguir será provado a versão fuzzy intuicionista da importante equação de Chapman-Kolmogorov, pois ela fornece um método eficaz para computar as probabilidades fuzzy intuicionistas de transição de n-passos PFIi j (n). Teorema 7.5.2 Sejam s,t ∈ N. Então m PFIi j (s + t) ⊆ ∑ PFIik (s) · PFIk j (t). k=1 Prova: Seja (α, β) ∈ L∗ . Será provado que m (PFIi j (s + t))(α,β) ⊆ ∑ (PFIik (s))(α,β) · (PFIk j (t))(α,β) . k=1 Mas, isto segue do Teorema 3.6.2 e da equação (7.13). Um estado j é dito fuzzy intuicionista acessível a partir do estado i, e é escrito i → j, se existir n ∈ N tal que PFIi j (n) > 0. Isto significa que ao iniciar-se com o estado i, existe uma probabilidade fuzzy intuicionista positiva (mas não necessariamente igual a 1) que a cadeia estará no estado j após n passos. Como, pela equação (7.13) tem-se que (PFIi j (n))(α,β) = (PF(α,β) )i j (n) para todo n ∈ N, então, j é fuzzy intuicionista acessível a partir do estado i se, e somente se, j é acessível intervalarmente a partir do estado i com respeito da probabilidade intervalar PF(α,β) para todo (α, β) ∈ L∗ . Se um estado j é fuzzy intuicionista acessível a partir de i e i é fuzzy intuicionista acessível a partir de j, diz-se que i e j se comunicam no sentido fuzzy intuicionista, e é escrito i ↔ j. Esta relação de comunicação fuzzy intuicionista é uma relação de equivalência, ou seja satisfaz as seguintes propriedades: Proposição 7.5.3 (1) (Reflexividade) i ↔ i, para todo estado i. 124 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista (2) (Simetria) Se i ↔ j então j ↔ i. (3) (Transitividade) Se i ↔ k e k ↔ j então, i ↔ j. Prova: Como PFIii (0) = PFI(X0 = i|X0 = i) = 1 > 0, tem-se a propriedade (1). A propriedade (2) segue trivialmente da definição. Resta provar a propriedade (3). Como i ↔ k e k ↔ j então, exism tem inteiros s,t ∈ N tais que PFIik (s) > 0 e PFIk j (t) > 0. Em particular, ∑ PFIik (s)·PFIk j (t) > 0. k=1 Portanto, pelo Teorema 7.5.2 tem-se que PFIi j (s + t) > 0. Assim, i ↔ j. Como esta relação de comunicação fuzzy intuicionista é uma relação de equivalência, tem-se que o espaço de estados S pode ser decomposto em uma união finita disjunta de classes de equivalência módulo a relação "↔", ou seja, existem subconjuntos C1 , . . . ,Cs de S, dois a dois disjuntos, tais que S = s S Ci e tais que todos os estados em Ci se comunicam entre si no sentido fuzzy intui- i=1 cionista. Os conjuntos C1 , . . . ,Cs são chamados de classes de comunicação fuzzy intuicionista da cadeia de Markov. Seja i um estado e AFI(i) o conjunto de todos os estados que são acessíveis no sentido fuzzy intuicionista a partir de i. Diz-se que i é recorrente no sentido fuzzy intuicionista se para todo j que é fuzzy intuicionista acessível a partir de i tem-se que i é fuzzy intuicionista acessível a partir de j, ou seja, i satisfaz a propriedade que se j ∈ AFI(i) então i ∈ AFI( j). Em particular, tem-se que i é recorrente no sentido fuzzy intuicionista se, e somente se, i é recorrente intervalarmente com respeito da probabilidade intervalar PF(α,β) para todo (α, β) ∈ L∗ . Quando a cadeia de Markov começa no estado recorrente no sentido fuzzy intuicionista i, somente podem ser visitados os estados j ∈ AFI(i) a partir dos quais i é fuzzy intuicionista acessível, ou seja, dado qualquer estado futuro, existe sempre alguma probabilidade fuzzy intuicionista de retornar ao estado i e após um certo tempo, tem-se a certeza que isto de fato vai acontecer. Assim, repetindo este argumento indefinidamente, pode-se concluir que, se um estado recorrente no sentido fuzzy intuicionista i é visitado alguma vez, ele será revisitado uma infinidade de vezes. Um estado i que não é recorrente no sentido fuzzy intuicionista é dito transiente no sentido fuzzy intuicionista. Assim, o estado i é transiente no sentido fuzzy intuicionista se existirem estados j ∈ AFI(i) tais que i não é acessível a partir de j. Em particular, tem-se que i é transiente no sentido fuzzy intuicionista se, e somente se, i é transiente intervalarmente com respeito da probabilidade intervalar PF(α,β) para algum (α, β) ∈ L∗ . Após a cadeia ter visitado o estado transiente no sentido fuzzy intuicionista i, há uma probabilidade fuzzy intuicionista positiva de visitar o estado j e, após algum tempo, isto de fato vai acontecer, e quando aconteça, o estado i nunca mais vai ser visitado. Pode-se concluir, que um estado transiente no sentido fuzzy intuicionista será visitado somente um número finito de vezes. Note que, uma cadeia de Markov fuzzy intuicionista finita sempre possue pelo menos um estado recorrente no sentido fuzzy intuicionista pois, se todos os estados forem transiente no sentido fuzzy intuicionista então, pelo comentado acima, após um numero finito de passos (tempo) a cadeia deixará todos os estados e nunca mais os visitará. Para onde irá? 125 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista Pode-se dividir os estados transientes no sentido fuzzy intuicionista em dois tipos: os fortemente transientes no sentido fuzzy intuicionista, ou seja aqueles que são fortemente transientes intervalarmente com respeito da probabilidade intervalar PF(α,β) para todo (α, β) ∈ L∗ , e os fracamente transientes no sentido fuzzy intuicionista, ou seja aqueles que são fracamente transientes intervalarmente com respeito da probabilidade intervalar PF(α,β) para algum (α, β) ∈ L∗ . As propriedades de recorrência e transiência fuzzy intuicionista são propriedades solidárias, no seguinte sentido: Proposição 7.5.4 Se i ↔ j então (1) i é recorrente no sentido fuzzy intuicionista se, e somente se, j também é. (2) i é fortemente transiente no sentido fuzzy intuicionista se, e somente se, j também é. (3) i é fracamente transiente no sentido fuzzy intuicionista se, e somente se, j também é. Prova: O item (3) é uma consequência imediata dos itens anteriores, portanto será provado somente os itens (1) e (2). Foi visto que, i é recorrente (resp. fortemente transiente) no sentido fuzzy intuicionista se, e somente se, i é recorrente (resp. transiente) intervalarmente com respeito da probabilidade intervalar PF(α,β) para todo (α, β) ∈ L∗ . Portanto, o resultado segue da Proposição 3.6.4 Segue desta proposição que se i é um estado recorrente no sentido fuzzy intuicionista, então o conjunto de estados AFI(i) que são acessíveis no sentido fuzzy intuicionista de i formam uma classe de comunicação fuzzy intuicionista, a qual é recorrente no sentido fuzzy intuicionista, no sentido que todos os estados em AFI(i) são recorrentes no sentido fuzzy intuicionista. Além disso, segue também que um estado transiente no sentido fuzzy intuicionista não pode ser fuzzy intuicionista acessível de um estado recorrente no sentido fuzzy intuicionista, ou seja, se i é recorrente no sentido fuzzy intuicionista e i → j então j é recorrentes no sentido fuzzy intuicionista. Com o intuito de entender o comportamento a longo prazo das cadeias de Markov fuzzy intuicionistas é importante entender o que acontece com cadeias que consistem somente de uma classe recorrente de comunicação fuzzy intuicionista. Por este motivo, é importante caracterizar as classes recorrentes de comunicação fuzzy intuicionista de acordo com a presença ou ausência de padrões de periodicidade nos tempos que um estado é visitado. Por isto, diz-se que uma classe recorrente de comunicação fuzzy intuicionista é periódica no sentido fuzzy intuicionista se seus estados podem ser agrupados em d > 1 subconjuntos disjuntos S1 , . . . , Sd de tal forma que todas as transições fuzzy intuicionistas de um subconjunto levam ao seguinte subconjunto. Matematicamente, ( Se i ∈ Sk e PFIi j > 0 então j ∈ Sk+1 , se k = 1, . . . , d − 1, j ∈ S1 , se k = d. Uma classe recorrente de comunicação fuzzy intuicionista que não é periódica é denominada de aperiódica no sentido fuzzy intuicionista, ou seja, em uma classe recorrente de comunicação fuzzy 126 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista intuicionista periódica os estados são visitados no sentido fuzzy intuicionista seguindo a sequência de subconjuntos e, depois de d passos, termina no mesmo subconjunto. Um aspecto importante em cadeias de Markov fuzzy intuicionistas é o estudo dos seus estados estacionários, pois eles representam uma característica crucial das cadeias de Markov fuzzy intuicionistas uma vez que elas controlam em vários aspectos o comportamento a longo prazo da cadeia. Mais precisamente, o interesse em estudar as probabilidades fuzzy intuicionista de transição de n-passos PFIi j (n) quando n é suficientemente grande. Se a cadeia de Markov fuzzy intuicionista possui duas ou mais classes de estados recorrentes é claro que o valor fuzzy intuicionista limite de PFIi j (n) dependerá do estado inicial i pois, visitar j a longo prazo vai depender se j está ou não na mesma classe recorrente de comunicação fuzzy intuicionista que i. Por esta razão, este estudo será restringido a cadeias de Markov que consistem somente de uma classe recorrente de comunicação fuzzy intuicionista e possivelmente alguns estados transientes no sentido fuzzy intuicionista. Esta suposição não é restritiva como em princípio possa parecer, pois sabe-se que se um estado entra numa classe recorrente de comunicação fuzzy intuicionista particular, ele permanecerá nessa classe para sempre. Observe que, a sequência fuzzy intuicionista PFIi j (n) pode não convergir, mesmo que a cadeia de markov fuzzy intuicionista possua uma única classe recorrente de comunicação fuzzy intuicionista. Isto decorre da equação (7.13) e do fato que Pi j (n) pode não convergir. Por exemplo, considere a classe recorrente com dois estados, 1 e 2, tais que PFI12 = PFI21 = 1, ou seja a partir do estado 1 somente pode-se ir para o estado 2, e vice-versa. Portanto, começando em um desses estados, se permanecerá nesse mesmo estado após um número par de transições e em um outro estado após um número ímpar de transições. O que está por trás deste fenômeno é que a classe de comunicação fuzzy intuicionista é periódica e, para esta classe, PFIi j (n) oscila. A seguir será provado que para qualquer estado j, as probabilidades fuzzy intuicionistas de transição de n-passos PFIi j (n) se aproximan de um valor fuzzy intuicionista limite, o qual é independente do estado inicial i, desde que exclua as duas situações descritas acima: classes recorrentes multiplas e/ou classes periódicas. Teorema 7.5.5 (Teorema da Convergência Estacionária Fuzzy Intuicionista) Considere uma cadeia de Markov fuzzy intuicionista com uma única classe recorrente de comunicação fuzzy intuicionista, a qual é aperiódica. Então, dado qualquer estado j existe um único número fuzzy intuicionista A j que satisfaz as seguintes propriedades: (1) lim (PFIi j (n))(α,β) = (A j )(α,β) para todo i, j ∈ S e para todo (α, β) ∈ L∗ . n→∞ m (2) A j ⊆ ∑ Ak · PFIk j para todo j ∈ S. k=1 m (3) 1 ⊆ ∑ Ak . k=1 (4) têm-se que 127 Capítulo 7. Teoria de Probabilidade Fuzzy Intuicionista (a) A j = 0, se j é fortemente transiente no sentido fuzzy intuicionista. (b) 0 ∈ S(A j ), se j é fracamente transiente no sentido fuzzy intuicionista. (c) A j > 0, se j é recorrente no sentido fuzzy intuicionista. Prova: Sabe-se pelo Teorema 3.6.5 que dado qualquer (α, β) ∈ L∗ e qualquer estado j existe um (α,β) único intervalo π j (α,β) = [π j (α,β) (1) lim (PF(α,β) )i j (n) = π j n→∞ (α,β) (2) π j m m (α,β) ⊆ ∑ πk k=1 (α,β) (3) ∑ πk k=1 (α,β) ,πj ] que satisfaz as seguintes propriedades: , para todo i, j ∈ S. · (PF(α,β) )k j para todo j ∈ S. m (α,β) ≤ 1 ≤ ∑ πk . k=1 (4) têm-se que (α,β) = [0], se j é fortemente transiente intervalarmente. (α,β) = [0, π j (α,β) > 0 se j é recorrente intervalarmente. (a) π j (b) π j (c) π j (α,β) (α,β) ] com π j > 0, se j é fracamente transiente intervalarmente . Portanto, o resultado segue se considerado A j como o número fuzzy intuicionista cujos (α, β)(α,β) níveis são dados por π j . 128 Capítulo 8 Conclusão Segundo George Klir [83] ‘‘An important new concept (and mathematical theories formalizing its various facets) that emerged from this cognitive tension was a broad concept of uncertainty, liberated from its narrow confines of probability theory.’’ Essas incertezas, nesse sentido amplo que se refere Klir [83], estão presentes no dia a dia, e podem emergir de diversas formas e fontes [110]. A teoria da probabilidade clássica considera eventos bem definidos e valores exatos (um número real entre zero e um) para as probabilidades desses eventos, isto permitiu lidar com probabilidades com um rigor matemático, erguindo-la como uma das teorias matemáticas sobre algum tipo de incerteza (neste caso a probabilística), porém bem consolidadas. No entanto, assim, como se tem a incerteza probabilística num determinado problema real, outros tipos de incertezas também podem co-existir nesse problema, o que torna-se inviável usar esta teoria. Isto tem motivado diversos pesquisadores a considerar incertezas seja nos eventos como nos próprios valores das probabilidades, considerando diversos tipos de incertezas de forma rigorosa. Isto motivou Peter Walley em [148] a propor uma teoria unficada de probabilidades com incertezas que denominou de probabilidades imprecisas. À luz das probabilidades imprecisas, nesta tese foram formuladas novas teorias de probabilidade intervalar, fuzzy e fuzzy intuicionistas. As duas probabilidades intervalares propostas visam contribuir com probabilidades intervalares ao apresentar conceitos e propriedades próximas dos respectivos conceitos e propriedades da teoria das probabilidades convencionais, como por exemplo, probabilidade condicional e cadeias de Markov. Assim, como em matemática intervalar algumas propriedades álgebricas do corpo dos reais (distributividade e inverso aditivo) são relaxados substituindo a igualdade pela inclusão, aqui as propriedades da teoria de probabilidade convencional, como teorema de Bayes, são relaxadas nessas teorias de probabilidades intervalares por considerarem inclusão em vez da igualdade. A probabilidade intervalar (irrestrita) permite considerar atribuição de probabilidades para cada evento que sejam independentes entre si, ou seja, sem restrição, que é algo inédito nas teorias de 129 Capítulo 8. Conclusão probabilidades intervalares que podem ser encontradas na literatura (veja por exemplo [62]). Um outro aspecto que é importante destacar, é que aqui fica explicíto que a noção de probabilidade intervalar fundamental que antecede a probabilidade fuzzy no espírito de Buckley [20], o qual fica escondido (não há qualquer referência a probabilidade intervalar) nesse livro. Os parâmetros dos modelos de cadeias de Markov muitas vezes não são conhecidos com precisão. Em vez de ignorar este problema, a melhor maneira de lidar com isso é incorporar a imprecisão nos modelos. A idéia básica é que, precisamente conhecidas distribuições iniciais e matrizes de transição são substituídas por outras imprecisas, o que efetivamente significa que conjuntos de possíveis candidatos são considerados. Algumas aplicações das cadeias de Markov intervalares são: problemas relacionados a Genética [29], problemas de tomada de decisão [40]. As duas probabilidades fuzzy introduzidas aqui, que são inspiradas na probabilidade fuzzy do Buckley [20], também contribuem para um melhor entendimento das probabilidades fuzzy que consideram números fuzzy como valores de probabilidades. A diferença do Buckley é a ordem usada nesta tese para números fuzzy não permite que o suporte do número fuzzy contenha valores negativos. Além disso, ao analisar as propriedades de probabilidade condicional e total fuzzy, considerou-se a inclusão entre números fuzzy para relaxar a relação de igualdade presente nas respectivas propriedades da probabilidade convencional e total usual, enquanto que Buckley usa sua ordem que além de ser pouco intuitiva, nos seus α-níveis não garante a corretude no sentido de [65] e [132]. Uma outra contribuição aqui foi adaptar a axiomática de Walley para as probabilidades intervalares e para as probabilidades fuzzy. Existem várias aplicações das cadeias de Markov fuzzy, tais como: interpretação de imagens [1], tomada de decisão [3], sistemas dinâmicos complexos [2], imagens de ressonância magnética [130], potência de processadores [89], predição de erros de redes neurais [100]. A probabilidade fuzzy intuicionista, é a mais importante contribuição desta tese, pois incorpora no seio das probabilidades imprecisas um novo tipo de imprecisão (híbrida) o qual não apenas abre espaço para o aprofundamento desta nova classe de probabilidade imprecisa, mas também motiva o estudo de outras classes de probabilidades imprecisas como fuzzy intervalar, fuzzy intuicionista intervalar, conjuntos rough, conjuntos rough fuzzy, conjuntos soft, etc. Também nesta classe de probabilidades imprecisas contribui-se com duas probabilidades fuzzy intuicionistas e estudou-se os conceitos de probabilidades condicionias e totais, entre outras coisas e suas propriedades. Aqui também foram considerados axiomas análogos aos axiomas de probabilidade intervalar de Walley. Como dito na secão 1.4 existem poucas contribuições em probabilidade fuzzy intuicionista e a maioria delas só trabalham com eventos fuzzy intuicionistas, mas para o caso de cadeia de markov não há precedente, nem de trabalhos que considerem eventos fuzzy intuitcionistas nem de trabalhos que usem probalidades fuzzy intuicionistas. Assim, a proposta de cadeias de Markov fuzzy intuicionistas propostas na seção 7.5.1 pode-se considerar o primeiro trabalho que integra 130 Capítulo 8. Conclusão cadeias de Markov com conjuntos fuzzy intuicionistas. Outras contribuições secundárias são alguns novos elementos que foram introduzidos em números fuzzy e números fuzzy intuicionistas, como por exemplo uma nova noção de ordem. 8.1 Artigos Publicados No caminho percorrido para se concluir esta tese, foi necessária aprofundar alguns conceitos de teoria dos conjuntos fuzzy e fuzzy intuicionistas, que permitiram ganhar maturidade no tema e que levaram à publicação dos seguintes artigos que não façam parte direta do escopo desta tese: 1. DA COSTA, C. G., BEDREGAL, B.R.C. O Corpo Local dos Números Fuzzy com Operações Baseadas em α-Cortes. VIII ERMAC, Natal-RN, Novembro de 2008. 2. DA COSTA, C. G., BEDREGAL, B.R.C. Uma Aritmética Contínua para Números Fuzzy Trapezoidais. VIII ERMAC, Natal, Novembro de 2008. 3. DA COSTA, C. G., BEDREGAL, B.R.C. Relacionando t-normas com t-normas intuicionistas. VIX ERMAC, João Pessoa, Outubro de 2009. 4. DA COSTA, C. G., BEDREGAL, B.R.C.; DORIA NETO, A. D. Automorphisms, PseudoUninorms and their Atanassov‘s Intuitionistic Extensions. Congresso Brasileiro de Sistemas Fuzzy. Sorocaba, Novembro de 2010. 5. DA COSTA, C. G., BEDREGAL, B.R.C.; DORIA NETO, A. D. Relating De Morgan Triples with Atanassov’s Intuitionistic De Morgan triples via automorphisms. International Journal of Approximate Reasoning. Novembro de 2010. Os artigos publicados com versões preliminares de parte desta tese estão descritos abixo: 1. DA COSTA, C. G., BEDREGAL, B.R.C.; DORIA NETO, A. D. Intuitionistic Fuzzy Probability. XX Simpósio Brasileiro de Inteligência Artificial. São Bernardo dos Campos, Outubro de 2010. 2. DA COSTA, C. G., BEDREGAL, B.R.C.; DORIA NETO, A. D. Atanassov´s Intuitionistic Fuzzy Probability and Markov Chains. Knowledge-Based Systems. (Aceito em janeiro de 2013). Mas ainda pretende-se publicar pelo menos outros dois artigos que apresentem as contribuições desta tese em probabilidade intervalar, probabilidade fuzzy e probabilidade fuzzy intuicionista. 131 Capítulo 8. Conclusão 8.2 Trabalhos Futuros Esta tese abre o caminho para uma série de novas pesquisas no assunto, que por exemplo aprofundem e apliquem os conceitos estudados aqui em situações onde há incertezas de diversos tipos. Num curto prazo, pretende-se desenvolver um estudo da probabilidade intervalar, fuzzy e fuzzy intuicionista para o caso de variáveis contínuas e, no caso da probabilidade fuzzy e fuzzy intuicionista, considerar o caso dos eventos serem fuzzy ou fuzzy intuicionistas, respectivamente. Também pretende-se estender as cadeias de Markov imprecisas propostas nesta tese para modelos ocultos de Markov e comparar com os modelos ocultos de Markov intervalar em [46] e modelos ocultos de Markov fuzzy em [109]. No prazo meio, pretende-se desenvolver uma teoria formal de probabilidades imprecisas que leve em consideração uma generalização das axiomáticas para probabilidades intervalares, fuzzy e fuzzy intuicionistas apresentadas nesta tese. Também pretende-se desenvolver novas classes de probabilidades imprecisas que considerem outros tipos de imprecisão, como por exemplo conjuntos soft [105], conjuntos vagos [32], conjuntos rough [121], etc. e hibridizações destas teorias com fuzzy (conjuntos soft-fuzzy [157], rough fuzzy [49], etc.). O presente trabalho de tese possui potenciais aplicações em diferentes campos científicos e tecnológicos onde as cadeias de Markov se apresentam como uma adequada técnica matemática para modelar problemas em que as probabilidades envolvidas são imprecisas. Um campo importante de estudo a ser analisada futuramente é estudo de problemas envolvendo cadeias de Markov mistas, isto é, cadeias com probabilidades imprecisas e probabilidades exatas. 132 Referências Bibliográficas [1] Alves, A. O.; Mota, G. L. A.; Costa, G. A. O. P.; Feitosa, R. Q. Interpretação de imagens multitemporais de sensoriamento remoto com base na combinação de cadeias de Markov fuzzy. Anais XV Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Curitiba, PR, Brasil (2011), 7309. [2] Arkov, V.; Kulikov, G.G. Fuzzy Markov modeling in automatic control of complex dynamic systems. International Conference on Accelerator and Large Experimental Physics Control Systems, Trieste, Italy (1999). [3] Avrachenkov, K.E.; Sanchez, E. Fuzzy Markov chains and decision-making. Fuzzy Optimization and Decision Making, 1 (2002), 143–159. [4] Arnold, K.; Gupta, M. Introduction to fuzzy arithmetic: theory and applications. Van Nostrand Reinhold, New York (1985). [5] Atanassov, K.T. Intuitionistic fuzzy sets. Central Tech. Library, Bulgarian Academy Science, Sofia, Bulgaria, (1983), Rep. No. 1697/84. [6] Atanassov, K.T.; Gargov, G. Interval valued intuitionistic fuzzy sets. Fuzzy Sets and Systems, 31 (1989), 343–349. [7] Atanassov, K.T. Intuitionistic fuzzy sets: theory and applications, Springer Verlag, (1999). [8] Atanassov, K. T. Intuitionistic fuzzy sets, Fuzzy Sets and Systems 20 (1986) 87–96. [9] Bai, J.; Wang, P. Conditional Markov chain and its application in economic time series analysis. Journal of Applied Econometrics, 26(5) (2011), 715–891. [10] Ban, A.I. Nearest interval approximation of an intuitionistic fuzzy number. In: Computational Intelligence, Theory and Applications, Springer-Verlag, Berlin-Heildelberg (2006), 229– 240. [11] Ban, A.I. Trapezoidal approximations of intuitionistic fuzzy numbers expressed by value. NIFS, 14 (2008), 38–47. [12] Barros, L. C.; Bassanezi, R.C. Tópicos de lógica fuzzy e biomatemática. Campinas: IMECCUNICAMP 2 (2010). 133 REFERÊNCIAS BIBLIOGRÁFICAS [13] Bector, C.R.; Chandra, S. Fuzzy mathematical programming and fuzzy matrix games, Springer-Verlag, Berlin-Heildelberg, (2005). [14] Bede, B.; Fodor, J. Product type operations between fuzzy numbers and their applications in geology. Acta Polytechnica Hungarica, 3 (2006), 123–139. [15] Bedregal, B.R.C.; Dimuro, G.P.; Costa, A.C.R., Fuzzy rule-based hand gesture recognition. IFIP-International Federation for Information Processing, Artificial Intelligence in Theory and Practice, 217 (2006), 285–294. [16] Bertuccelli, L. F. Robust decision-making with model uncertainty in aerospace systems. PhD thesis Massachusetts Institute of Technology, September (2008). [17] Bishop, C. M. Pattern recoginition and machine learning. Springer, (2006). [18] Biswas, R. On fuzzy sets and intuitionistic fuzzy sets. NIFS, 3 (1997). [19] Buchdahl, J. Fixed odds sports betting: statistical - Forecasting and Risk Management. High Stakes Publishing, (2003). [20] Buckley, J.J. Fuzzy Probabilities: A New Approach and Applications. Springer, Berlin, (2005). [21] Buckley, J.J. Fuzzy Probabilities and Statistics. Springer, Berlin, (2006). [22] Burillo, P.; Bustince, H.; Mohedano, V. Some definitions of intuitionistic fuzzy number. First properties. In: Proceedings of the 1st Workshop on Fuzzy Based Expert Systems, D. Lakov, Sofia, Bulgaria, (1994) 53–55. [23] Bustince, H.; Montero, J.; Orduna, R.; Barrenechea, E.; Pagola, M. A survey of Atanassov’s intuitionistic fuzzy relations. In: Intuitionistic Fuzzy Sets: Recent Advances, Studies in Fuzziness and Soft Computing. Springer (2008). [24] Bustince, H.; Pagola, M.; Barrenechea, E. Construction of fuzzy indices from fuzzy subsethood measures: Application to the global comparison of images. Information Sciences, 177 (2007), 906–929. [25] Bustince, H.; Burillo, P. Vague sets are intuitionistic fuzzy sets. Fuzzy Sets and Systems 79 (1996), 403–405. [26] Cabrelli, C. A.; Forte, B.; Molter, U. M.; Vrscay, E. R. Iterated fuzzy set systems: A new approach to the inverse problem for fractals and other sets. Journal of Mathematics, 171 (1992), 79–100. 134 REFERÊNCIAS BIBLIOGRÁFICAS [27] Callander, C. P; Cowan, C. F. N. Implementation of numerically robust fast recursive least squares adaptive filters using interval arithmetic. Electronics Letters, 28(7) (1992), 692–693. [28] Campos, M. A. Uma extensão intervalar para a probabilidade real. Tese de Doutorado, Centro de Informática/UFPE,(1997). [29] Campos, M.A.; Dimuro, G.P.; Costa, A.C.R.; Araújo, J.F.; Dias A.M. Probabilidade intervalar e cadeias de Markov intervalares no Maple. TEMA - Tendências em Matemática Aplicada e Computacional, 3(2) (2002), 53–62. [30] Chaira, T. Intuitionistic fuzzy segmentation of medical images. IEEE-Transactions on Biomedical Engineering, 57(6) (2010), 1430–1436. [31] Chaira, T. A novel intuitionistic fuzzy means color clustering on human cell images. IEEE Nature and Biologically Inspired Computing, (2009), 736–741. [32] Chen, S.; Tan, J. Handling multicriteria fuzzy decision-making problems based on vague set theory. Fuzzy Sets and Systems, 67(2) (1994), 163–172. [33] Chowdhury, S.; Champgne, P.; Mclellan, J. Uncertainty characterization approaches for risk assessment of DBPs in drinking water: A review. Journal of Environmental Management, 90(5) (2009), 1680–1691. [34] Comba, J.L.D.; Stolfi J. Affine arithmetic and its applications to computer graphics. Anais do VII SIBGRAPI, (1993), 1–10. [35] Connell, S.D. A comparison of hidden Markov model features for the recognition of cursive handwriting. Master‘s Thesis, Dept. of Computer Science - Michigan State University (1996). [36] Cruz, M. M. C. Equivalência e consistência entre funções intervalares. Dissertação de Mestrado em Informática - DIMAp/UFRN, (2000). [37] DA Costa, C. G.; Bedregal, B.R.C. O Corpo Local dos Números Fuzzy com Operações Baseadas em α-Cortes. VIII ERMAC, Natal-RN, Novembro de 2008. [38] Da Costa, C. G.; Bedregal, B.R.C.; Doria Neto, A. D. Relating De Morgan triples with Atanassov’s Intuitionistic De Morgan Triples via Automorphisms. Approximate Reasoning, 52(4) (2011), 473–487. [39] da Cruz, A. T.; Dimuro, G.P. On fuzzy probabilities in Bayesian games. IEEE - WorkshopSchool on Theoretical Computer Science, (2011), 25–31. [40] Delahaye, B.; Larsen, K. G.; Legay, A.; Pedersen, M. L.; Wasowski, A. Decision problems for interval Markov chains. In Language and Automata Theory and Applications (LATA), 2011. 135 REFERÊNCIAS BIBLIOGRÁFICAS [41] De Pinho A.F.; Montevechi, J. A. B.; Pamplona, E. de O. Aplicação de números fuzzy triangulares em análise de investimentos em situações de incerteza: Método baseado na teoria dos jogos. Pesquisa e Desenvolvimento Tecnológico, 21 (1997), 102–107. [42] Deschrijver, G.; Kerre, E. On the relationship between some extensions of fuzzy set theory. Fuzzy Sets and Systems, 133(2) (2003), 227–235. [43] Deschrijver, G.; Cornelis, C.; Kerre, E. Intuitionistic fuzzy connectives revised. In Proc. 9th Int. Conf. Information Processing Management Uncertainty Knowledge-based Systems, (2002), 1839–1844. [44] Deschrijver, G.; Cornelis, C.; Kerre, E. On the representation of intuitionistic fuzzy t-norms and t-conorms. IEEE- Transactions on Fuzzy Systems, 12(1) (2004), 45–61. [45] Deschrijver, G.; Cornelis, C.; Kerre, E. Implication in intuitionistic fuzzy and interval-valued fuzzy set theory: construction, classification, application. International Journal of Approximate Reasoning, 35 (2004), 55–95. [46] Dimuro, G.P.; Costa, A.C.R.; Gonçalves, L.V.; Hübner, A. Interval-valued hidden Markov models for recognizing personality traits in social exchanges in open multiagent systems. Tema - Tendências em Matemática Aplicada e Computacional, 9 (2008), 83–93. [47] De Vargas, R. R. Técnicas matemático-computacionais para o tratamento de incertezas aplicadas ao problema do fluxo de potência em sistemas de transmissão de energia elétrica. Dissertação de Mestrado,PPgInf-UCPel, DM-2008-1-002, Pelotas-RS, (2008). [48] Dubois, D.; Prade, H. Operations on fuzzy numbers. International Journal of Systems Sciences, 9 (1978), 613–626. [49] Dubois, D.; Prade, H. Rough fuzzy sets and fuzzy rough sets. International Journal of General Systems, 7 (1990), 2–3. [50] Dunyak, J.; Saad, L.W.; Wunsch, D. A theory of independent fuzzy probability for system reliability. IEEE Transactions Fuzzy Systems, 7 (1999), 286–294. [51] Dutra, J. E. M. JAVA-XSC: Uma biblioteca Java para computações intervalares. Dissertação de Mestrado em Informática - DIMAp/UFRN„ (2000). [52] Delgado, K. V.; Barros, L. C.; Cozman, F. G.; Filho, R.S. Representing and solving factored Markov decision processes with Imprecise Probabilities. In: Sixth International Symposium on Imprecise Probability: Theories and Applications, (2009). [53] Gerstenkorn, T.; Manko, J. Probability of fuzzy intuitionistic sets. BUSEFAL, 45 (1990/91), 128–136. 136 REFERÊNCIAS BIBLIOGRÁFICAS [54] Gerstenkorn, T.; Manko, J. On hesitancy margin and a probability of intuitionistic fuzzy events. IFS 7(1) (2001), 4–9. [55] Goguen, J.A. L-fuzzy sets. Journal of Mathematical Analysis and Applications. 18(1) (1967), 623–668. [56] Gorzalczany, M. A method of inference in approximate reasoning based on interval-valued fuzzy sets. Fuzzy Sets and Systems, 21 (1987), 1–17. [57] Gorzalczany, M. An interval-valued fuzzy inference method some basic properties. Fuzzy Sets and Systems, 31 (1989), 243–251. [58] Grattan-Guinness, I. Fuzzy membership mapped into intervalar and many-valued quantities. Z. Math. Logik. Grundladen Matn, 22 (1975), 149–160. [59] Grzegorzewski, P. Conditional probability and independence of intuitionistic fuzzy events. NIFS, 6 (2000), 7–14. [60] Grzegorzewski, P. Distances and orderings in a family of intuitionistic fuzzy numbers. In Proc. of EUSFLAT Conf., (2003), 223–227. [61] Guha, D.; Chakraborty, D. A theoretical development of distance measure for intuitionistic fuzzy numbers. International Journal of Mathematics and Mathematical Sciences, 2010, 25 pages. [62] Guo, P.; Tanaka, H. Decision-making with interval probabilities. European Journal of Operational Research, 203(2) (2010), 444–454. [63] Haigh, J. Taking chances: winning with probability. Oxford University Press, Oxford (2003). [64] Hanss, M. Applied fuzzy arithmetic an introduction with engineering applications. SpringerVerlag, Berlin-Heildelberg, (2005). [65] Hickey, T.; Ju, Q.; Emden, M. Interval arithmetic: from principles to implementation. Journal of the ACM, 48(5) (2001), 1038–1068. [66] Hirotsu, N.; Wright, M. Using a Markov process model of an association football match to determine the optimal timing of substitution and tactical decisions. Journal of the Operational Research Society 53: 88–96, (2002). [67] Hovland, G.E. Skill acquisition from human demonstration using a hidden Markov model, Proc. IEEE International Conference Robotics Automatic, (1996), 2706–2711. [68] Huber, J. P; Strassen V. Minimax tests and the Neyman-Pearson lemma for capacities. The Annais of Statistics,1 (1973), 251–263. 137 REFERÊNCIAS BIBLIOGRÁFICAS [69] Hung, W.; Yang, M. On the J-divergence of intuitionisticfuzzy sets with its application to pattern recognition. Information Sciences, 178(6) (2008), 1641–1650. [70] Iakovidis, D. K.; Pelekis N.; Kotsifakos E.; Kopanakis, I. Intuitionistic fuzzy clustering with applications in computer vision. In Advanced Concepts for Intelligent Vision Systems. Springer Berlin/ Heidelberg, (2008), 764–774. [71] Intan, R. Interval probability of data querying based on fuzzy conditional probability relation. IAENG - International Journal of Computer Science, 34(1) (2007). [72] Jafelice, R.S.M.; Barros, L. C.; Bassanezi, R.C. Sobre sistemas dinâmicos fuzzy com retardo: Uma aplicação na dinâmica do HIV com tratamento. Revista de Biomatemática, Campinas, 18(4) (2008), 131–148. [73] Jahn, K. U. Intervall-wertige Mengen, Math. Nach. 68 (1975), 115-132. [74] Jotsov, V.S.; Sgurev, V.S. Human-centered methods for applications of fuzzy probabilities in intelligent systems. Proceedings 2nd International IEEE Conference Intelligent Systems, 1 (2004), 122–129. [75] Jaulin, L.; Kieffer, M.; Didrit, O.; Walter E. Applied interval analysis: with examples in parameter and state estimation, robust control and robotic. Springer-Verlag, London, (2001). [76] Jurio, A.; Paternain D.; Bustince H. A construction method of Atanassov’s intuitionistic fuzzy sets for image processing. In 5th IEEE International Conference Intelligent Systems, London (2010). [77] Kaufmann A.; Gupta, M. M. Introduction to Fuzzy Arithmetic: Theory and Applications, Van Nostrand Reinhold, New York, (1985). [78] Klement, E.P.; Mesiar, R.; Pap, E. Triangular norms. Position paper I: Basic analytical and algebraic properties. Fuzzy Sets and Systems, 143(1) (2004), 5–26. [79] Klir, G. J.; Yuan B. Fuzzy Sets and Fuzzy Logic, Prentice-Hall, Upper Saddle River, New Jersey, (1995). [80] Klir, G.J. Fuzzy arithmetic with requisite constraints. Fuzzy Sets and Systems, 91 (1997), 165–175. [81] Klir, G.J.; Pan, Y. Constrained fuzzy arithmetics: Basic questions and some answers. Soft Computing, 2 (1998), 100–108. [82] Klir, G. J.; Wiernman, M.J. Uncertainty-based information. Physica-Verlag, (1998). 138 REFERÊNCIAS BIBLIOGRÁFICAS [83] Klir, G.J. Uncertainty and Information: Foundations of Generalized Information Theory. Willey & Sons, (2006). [84] Kolev, B.; Chountas, Petrounias P. I.; Kodogiannis, V. An application of intuitionistic fuzzy relational databases in football match result predictions. In: Computational Intelligence, Theory and Applications, Bernd Reusch (Ed.), Springer-Verlag, Berlin-Heildelberg, (2005), 281– 289. [85] Kosko, B.; Isaka, S. Fuzzy Logic. Scientific American, 269 (1993), 76–81. [86] Kratschmer, V. A unified approach to fuzzy random variables. Fuzzy Sets and Systems, 123(1) (2001), 1–9. [87] Kriegler, E.; Held, H. Utilizing belief functions for the estimation of future climate change. International Journal of Approximate Reasoning, 39 (2005) 185–209. [88] Kruse, R.; Meyer, K.D. Statistics with Vague Data. Reidel, Dordrecht, (1987). [89] Kruse R.; Buck-Emden R.; Cordes R. Processor power considerations - An application of fuzzy Markov chains. Fuzzy Sets and Systems, 21(3), (1987) 289–299. [90] Kulisch, U.; Takano W.; Nakamura, Y. Incremental learning, clustering and hierarchy formation of whole body motion patterns using adaptive hidden Markov chains. The International Journal of Robotics Research, 27 (2008), 761–784. [91] Kulisch, U.; Miranker, W. Computer arithmetic, Academic Press, New York (1982). [92] Kulp, D., Haussler, D., Reese, M.G.; Eeckman, F.H. A generalized hidden Markov model for the recognition of human genes in DNA, Proceedings of the Fourth International Conference on Intelligent Systems for Molecular BiologyAAAI Press, Menlo Park (1996). [93] Leizarowitz, A.; Shwartz, A. Exact finite approximations of average-cost countable Markov decision processes. Automatica, 44 (2008), 1480–1487. [94] Lee, A.J. Modeling scores in Premier League: is Manchester United really the best. Chance, 10 (1997) 15–19. [95] Lee, K. H. First course on fuzzy theory and applications, Springer-Verlag, BerlinHeildelberg, (2005). [96] Li, H.; Wu, Z. The application of Markov chain into the forecast for population age structure in Shanghai. International Conference on Computational Intelligence and Software Engineering, (2009) 1–3. 139 REFERÊNCIAS BIBLIOGRÁFICAS [97] Lien, J.J. Subtly different facial expression recognition and expression intensity estimation. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (1998) 853– 859. [98] Lima, E.L. Curso de análise vol.2. Coleção: Coleção Projeto Euclides (2011). [99] Liu, H.; Shi, K. Intuitionistic fuzzy numbers and intuitionistic distribution numbers. Journal of Fuzzy Mathematics, 8(4) (2000), 909–918. [100] Liu, J.; Li, S.; Jia, S. A prediction model based on neural network and fuzzy Markov chain. IEEE - Intelligent Control and Automation, (2008), 790–793. [101] Liu, Y.; Xie N. Amelioration operators of fuzzy number intuitionistic fuzzy geometric and their application to multi-criteria decision-making. IEEE-Control and Decision Conference, (2009), 6172–6176. [102] Lyra, A. Computabilidade no espaço dos intervalos reais: Um Modelo BSS Intervalar. Dissertação de Mestrado em Informática - DIMAp/UFRN, (1999). [103] Marsudi, M.; Bin, A. N. Queuing theory application to analyze production capacity, In: Proceedings of IEEE- International Conference on Fuzzy Systems (2010). [104] Melo, G. J. A. Lógica fuzzy aplicada ao problema de propagação de um vírus. In: Simpósio de Aplicações de Lógica Fuzzy, Sorocaba - SP (2008). [105] Molodtsov, D. Soft set theory first results. Computers and Mathematics with Applications, 37 (1999) 19–31. [106] Moore, R. Automatic error analysis in digital computation. Tech. Rep. LMSD - 48421, Lockheed Aircraft Corporation - Missiles and Space Division, Sunnyvale - California, 1 (1959). Work Carried Out Under Lockheed General Research Program. [107] Moore, R. Methods and applications for interval analysis. SIAM, Philadelphia, (1979). [108] Moore, R.; Yang, C. Interval analysis i. Tech. Rep. LMSD - 285875, Lockheed Aircraft Corporation - Missiles and Space Division, Sunnyvale - California, Work Carried Out Under Lockheed General Research Program, 9 (1959). [109] Moraes, R. M. ; Machado, L. S. Using fuzzy hidden Markov models for online training evaluation and classification in virtual reality simulators. International Journal of General Systems, 33(2-3) (2004), 281–288. [110] Mukaidono, M. Fuzzy logic for beginners. World Scientific, (2001). 140 REFERÊNCIAS BIBLIOGRÁFICAS [111] Munos, R.; Moore A. Influence and variance of a Markov chain: application to adaptive discretization in optimal control. IEEE Conference on Decision and Control, (1999), 1464 – 1469. [112] Nahmias, S. Fuzzy variables. Fuzzy sets and systems, 1 (1978), 97–110. [113] Nayagam, V.L.G.; Venkateshwari, G.; Sivaraman, G. Ranking of intuitionistic fuzzy numbers. In: Proceedings of IEEE- International Conference on Fuzzy Systems, Hong Kong, June (2008), 1971–1974. [114] Nguyen, H.T.; Walker, E. A. A first course in fuzzy logic, Chapman & Hall/CRC, Boca Raton, 2 (2000). [115] Nikolova, M.; Nikolov N.; Cornelis C.; Deschrijver, G. Survey of the research on the intuitionistic fuzzy sets, Advanced Studies in Contemporary Mathemathics, 4 (2) (2002), 127–157. [116] Nissim, B.D. A model for estimating the probabilities of soccer game results. The Journal Gambling Business and Economics, 4(3) (2010), 13–19. [117] Olej, V.; Hájek P. Air pollution assessment using intuitionistic hierarchical fuzzy inference systems. Institute of System Engineering and Informatics, Faculty of Economics and Administration, University of Pardubice. [118] Oliveira, M. A. (2000b). Concepção multi-agentes para a implementação do raciocínio aproximado. Dissertação de Mestrado em Informática - DIMAp/UFRN, (2000). [119] Pearl, J. On probability intervals. International Journal of Approximate Reasoning, 2(3) (1988), 211–216. [120] Pankowska, A.; Wygralak, M. Intuitionistic fuzzy sets – An alternative approach. In: EUSFLAT (2003), 135–140. [121] Pawlak, Z. Rough sets. International Journal of Parallel Programming, 11(5) (1982), 341– 356. [122] Pedrycz, W.; Gomide, F. An Introduction to Fuzzy Sets: Analysis and Design. MIT Press, (1998). [123] Puri, M.L., Ralescu, D. Fuzzy random variables. Journal of Mathematical Analysis and Applications, (1986). [124] Rabiner, L., A tutorial on hidden Markov models and selected applications in speech recognition, Proceedings of the IEEE, 77 (2) (1989), 257–286. 141 REFERÊNCIAS BIBLIOGRÁFICAS [125] Reconvá, M.; Riecan, B. Observables on intuitionistic fuzzy sets: an elementary approach. Cybernetics and Information Technologes, 9(2) (2009), 38–42. [126] Renteria, A, R. Estimação de probabilidade fuzzy a partir de dados imprecisos. Tese de Doutorado em Engenharia Elétrica Pontífica Universidade Católica do Rio de Janeiro, (2006). [127] Resnick, S. I. Adventures in stochastic processes. Birkhäuser, Boston, 1992. [128] Roy, M. K.; Biswas, R. I-v fuzzy relations and Sanchez‘s approach for medical diagnosis, Fuzzy Sets and Systems, 47 (1992) 35–38. [129] Rue, H.; ∅. Salvesen. Prediction and retrospective analysis of soccer matches in a league. The Statistician, 49(3) (2000), 399–418. [130] Ruana, S.; Morettib, B.; Fadilib, J.; Bloyetb, D. Fuzzy Markovian segmentation in application of magnetic resonance images. Computer Vision and image understanding, 85(1) (2002), 54–69. [131] Sambuc, R. Fonctions Φ-floues. Application à l‘aide au diagnostic en pathologie thyroidienne, Ph.D. Thesis, Université de Marseille, France, (1975). [132] Santiago, R.H. N.; Bedregal, B. R. C.; Acióly, B. M. Formal aspects of correctness and optimality of interval computations. Formal Aspects of Computing, 18(2) (2006), 231–243. [133] Sarveswaran, V.; Smith J.W.; Blockey, D.I. Reliability of corrosion-damaged steel structures using interval probability theory. Structural Safety, 20(3) (1998) 237–255. [134] Scott, A. S.; Kreinovich. Aerospace applications of soft computations (with an emphasis on Multi-spectral satellite imaging). In: Proceedings of the Would Automatics Congress, Hawaii (2000). [135] Silva, I. A., et al. Uma abordagem intervalar para o tratamento de custos imprecisos. Encontro Regional de Matemática Aplicada e Computacional, Anais UFPB. 6 (2006). [136] Silveira, G. P. Aplicação da teoria de conjuntos fuzzy na predição do estadiamento do câncer de próstata, Dissertação de Mestrado, IMECC-UNICAMP, Campinas (2007). [137] Sunaga, T. Theory of an interval algebra and its applications to numerical analysis. RAAG Memoirs, 2 (1958), 29–46. [138] Smithson, M. J. Human judgment and imprecise probabilities. Web site of The Imprecise Probabilities Project: http:ippserv.rug.ac.be (1997 - 2000). [139] Szmidt, E.; Kacprzyk, J. A concept of a probability of an intuitionistic fuzzy event. Proceedings of IEEE- International Conference onFuzzy , (1999), 22–25. 142 REFERÊNCIAS BIBLIOGRÁFICAS [140] Szmidt, E.; Kacprzyk, J. Intuitionistic fuzzy sets in decision making. NIFS, 2,(1996) 15–32. [141] Szmidt, E.; Kacprzyk, J. Group decision making via intuitionistic fuzzy sets in decision making. Proceeding of FUBEST’96, (1996), 107–112. [142] Szmidt, E.; Kacprzyk, J. Remarks on some applications on intuitionistic fuzzy Sets in decision making. NIFS. 2 (1996), 22–31. [143] Tanaka, H.; Sugihara, K.; Maeda, Y. Non-additive measures by interval probability functions. Journal Information Sciences Informatics and Computer Science: An International Journal, 164 (2004), 1–4. [144] Tanaka, H.; Sugihara, K. Interval probability and its application to decision problems. The 10th IEEE International Conference, 3 (2001), 952 – 955. [145] Turksen, I. B. Interval valued fuzzy sets based on normal forms, Fuzzy Sets and Systems, 20 (1986), 338–353. [146] Xiong, Y., Huo, Q. and Chan, C. A discrete contextual stochastic model for the offline recognition of handwritten Chinese characters. IEEE Trans. Pattern Anal. Machine Intelligence, 23(7) (2001), 774–782. [147] Waghabi, E.R.; Benevides, M.R.F. Aplicação de modelos ocultos de Markov na teoria dos jogos.In: ENIA - VII Encontro Nacional de Inteligência Artificial, 29a Congresso da Sociedade Brasileira de Computação, 1 (2009), 1–10. [148] Walley, P. Statistical reasoning with imprecise probabilities, Chapman and Hall, London (1991). [149] Walley, P.; Fine, T.L. Towards a frequentist theory of upper and lower probability. The Annals of Statistics, 10(3) (1982), 741–761. [150] Wang, Y. Imprecise probabilities based on generalized intervals for system reliability assessment. International Journal of Reliability & Safety, 4(4) (2010), 319–342. [151] Wei, C. P.; Tang, X. Possibility degree Method for ranking intuitionistic fuzzy numbers. IEEE-International Conference on Web Intelligence and Intelligent Agent Technology, 3 (2010), 142–145. [152] Weichselberger, K. The theory of interval-probability as a unifying concept for uncertainty. International Journal of Approximate Reasoning, 24 (2000), 149–170. 143 REFERÊNCIAS BIBLIOGRÁFICAS [153] Wei, C. P.; Tang, X. Possibility degree method for ranking intuitionistic fuzzy numbers. IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, (2010), 142–145. [154] Yager, R.R. Probabilities from fuzzy observations. Information Science, 32 (1984), 1–31. [155] Yager, R.R.; Kreinovich, V. Decision making under interval probabilities. International Journal of Approximate Reasoning, 22(3) (1999), 195–215. [156] Yager, R.R. Decision making with fuzzy probability assessments. IEEE Transactions on Fuzzy Systems, 7 (1999), 462–467. [157] Yao, B.; Liu, J.; Yan, R. Fuzzy soft set and soft fuzzy set. IEEE - Fourth International Conference on Natural Computation, 6 (2008), 252–255. [158] Zadeh L.A. Fuzzy sets. Information and Control, 8 (1965), 338–353. [159] Zadeh, L.A. Probability measures of fuzzy events. J. Math. Anal. Appl.,23 (1968), 421–427. [160] Zadeh, L.A. The concept of a linguistic variable and its application to approximate reasoning-I. Information Science, 8 (1975), 199–249. [161] Zadeh, L.A. Fuzzy Probabilities. Information Processing and Management, 20 (1984), 363–372. [162] Zhang, Q.; Jia, B.; Jiang, S. Interval-valued intuitionistic fuzzy probabilistic set and some of its important properties. The 1st International Conference on Information Science and Engineering, (2009). [163] Zhang,Z.; Yang, J.; Ye, Y.; Zhang, Q. Intuitionistic fuzzy sets with double parameters and its application to pattern recognition. Information Technology Journal, 11 (2012), 313–318. [164] Zimmerman, H-J. Fuzzy set theory and its applications. Kluwer Academic Publishers, 2 (1991). [165] Zolnierek, A. Pattern recognition algorithms for controlled Markov chains and their application to medical diagnosis. Pattern Recognition Letters, 1 (1983), 299–303. 144