Fagner Lemos de Santana Generalizações do Conceito de Distância, i-Distâncias, Distâncias Intervalares e Topologia Orientador: Prof. Dr. Regivan Hugo Nunes Santiago Natal, 2012 Fagner Lemos de Santana Generalizações do Conceito de Distância, i-Distâncias, Distâncias Intervalares e Topologia Orientador: Prof. Dr. Regivan Hugo Nunes Santiago Tese de Doutorado apresentada ao Programa de Pós-Graduação em Sistemas e Computação da UFRN (área de concentração: Teoria da Computação) como parte dos requisitos para obtenção do título de Doutor em Ciências. Natal, RN, novembro de 2012 Tese de Doutorado sob o título “Generalizações do Conceito de Distância, i-Distâncias, Distâncias Intervalares e Topologia”, defendida por Fagner Lemos de Santana e aprovada no dia 30 de novembro de 2012, em Natal-RN, pela banca examinadora constituída pelos professores: Prof. Dr. Regivan Hugo Nunes Santiago Orientador Prof. Dr. Benjamín René Callejas Bedregal Universidade Federal do Rio Grande do Norte UFRN Prof. Dr. Marcelo Ferreira Siquera Universidade Federal do Rio Grande do Norte UFRN Prof. Dr. Wilson Rosa de Oliveira Junior Universidade Federal Rural de Pernambuco UFRPE Prof. Dr. Weldon Lodwick Universidade do Colorado Agradecimentos Abaixo deixo meus agradecimentos as pessoas que me apoiaram. Primeiramente as pessoas mais próximas a mim: minha esposa Dra. Fabiana, companheira de doutorado e de vida, meus pais Guilherme e Iranilda que me ensinaram, dentre muitas outras coisas, o quanto estudar é importante e meu irmão Dr. Flávio, grande amigo e primeira inspiração para entrar no mundo das ciências exatas. Agradeço também aos familiares: cunhados: Cláudia, Fernanda e Alex; sogro: Artur; sogra: Ângela. Meu orientador Prof. Regivan por ter topado me orientar, pelas orientações e por não ter deixado que eu desanimasse durante o curso. Prof. Benjamin pelas orientações e ajudas em momentos cruciais do doutorado. Prof. João Marcos pelas excelentes aulas de lógica que se tornaram referência para meu trabalho como professor. Oos membros da banca pelas sugestões e correções que melhoraram significativamente esta tese. Os colegas do PPgSC Flaules, Cláudio e Eduardo. Os meus colegas/amigos do DM pela força: Viviane, Débora, Jaques, Gabriela, Bernadete, Márcia, Roberto Hugo, Marconio, Marcelo, Ronaldo, Roosewelt, Querginaldo, Juan, Liliane, Claudemir, Sidarta, Jonas, Iesus, Carlos Gomes, David, Nir, Odirlei, Rubens Leão, Albimar, Nísia, Luis, Hélio e Josenildo. Finalmente, os 3 professores (também amigos) que são os maiores responsáveis pela minha formação matemática: André e Benedito da UFRN e Cátia da UNB. Espero ter esquecido poucas pessoas. Lista de símbolos ≤km : Ordem de Kulisch-Miranker dM : Métrica de Moore Aα : α-corte do conjunto difuso A dE : Distância (métrica) euclidiana na reta B(a, r): Bola aberta de centro a e raio r D+ : Conjunto das funções de distribuição de probabilidade de variáveis aleatórias não-negativas ⊥: Menor elemento ⊥A : Conjunto dos menores elementos do conjunto pré-ordenado A ℑKM : Topologia em M gerada por uma i-distância Rk : Operação de remoção do k-ésimo caractér de uma cadeia de caracteres Iak : Operação de inserção do caractér a como k-ésimo caractér de uma cadeia de caracteres ∗ : Relação essencialmente abaixo estrita µs : i-quasi-métrica para cadeias de caracteres fb: Representção canônica intervalar da função real f ωKM : VID de Kulisch-Miranker dKM : Métrica KM ΩA : Topologia de Scott no conjunto A 2 Resumo Neste trabalho são apresentadas algumas generalizações do conceito de distância utilizandose espaços de valoração mais gerais, como as métricas difusas, métricas probabilísticas e métricas generalizadas. É mostrado de que maneiras essas generalizações podem ser úteis, tendo em vista a possibilidade de que a distância entre dois objetos possa carregar uma quantidade maior de informação sobre os mesmos do que no caso em que a distância é representada por um número real. Também é feita a proposta de uma outra generalização de distância, a qual é feita com o intuito de englobar uma noção de métrica intervalar que gere uma topologia de maneira natural. Várias propriedades desta generalização são investigadas, além de suas ligações com as outras generalizações já existentes. Palavras-chave: Distância Intervalar, Distância Generalizada, Topologia, i-Distância. Abstract In this dissertation we present some generalizations for the concept of distance by using more general value spaces, such as: fuzzy metrics, probabilistic metrics and generalized metrics. We show how such generalizations may be useful due to the possibility that the distance between two objects could carry more information about the objects than in the case where the distance is represented just by a real number. Also in this thesis we propose another generalization of distance which encompasses the notion of interval metric and generates a topology in a natural way. Several properties of this generalization are investigated, and its links with other existing generalizations. Keywords: Interval Distance, Generalized Distance, Topology, i-Distance. Sumário Sumário i 1 Introdução 1 2 Preliminares 2.1 Ordens, Pré-ordens, Reticulados e Reticulóides 2.2 Matemática Intervalar . . . . . . . . . . . . . . 2.3 Lógica Difusa . . . . . . . . . . . . . . . . . . 2.4 Espaços Métricos e Topologia . . . . . . . . . 3 4 Estado da Arte 3.1 Métricas Estatísticas . . 3.2 Espaço Métrico Difuso . 3.3 Métrica Generalizada . . 3.4 Conjunto Distância . . . 3.5 Espaços de Continuidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i-Distâncias 4.1 Valoração de i-Distâncias . . . . . . . . . . . . . . . . 4.2 i-Distâncias: Definições e Primeiros Exemplos . . . . 4.2.1 Outras i-Distâncias . . . . . . . . . . . . . . . 4.3 i-Métricas e Topologia . . . . . . . . . . . . . . . . . 4.3.1 Pré-ordem . . . . . . . . . . . . . . . . . . . . 4.4 i-Métricas e a Propriedade de Hausdorff . . . . . . . . 4.5 Generalizações como Casos Particulares de i-Distâncias 4.5.1 Espaço Métrico Estatístico . . . . . . . . . . . 4.5.2 Métrica Difusa . . . . . . . . . . . . . . . . . 4.5.3 Espaços de Continuidade . . . . . . . . . . . . 4.6 Toda Topologia é i-Quasi-Pseudometrizável . . . . . . 4.7 Um Exemplo Prático: Cadeias de Caracteres . . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 7 9 11 . . . . . 17 17 18 20 21 22 . . . . . . . . . . . . 25 25 27 31 32 34 35 37 37 39 46 49 55 5 6 Métricas Intervalares 5.1 Definição de Métricas Intervalares . . . . . . . . . . . . . 5.2 Representação e Métricas Intervalares . . . . . . . . . . . 5.3 Métrica KM . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Sobre a Aplicabilidade da Métrica KM . . . . . . 5.4 Topologia Gerada por dKM . . . . . . . . . . . . . . . . . 5.5 KM-Continuidade . . . . . . . . . . . . . . . . . . . . . . 5.6 KM-Continuidade e Representação . . . . . . . . . . . . . 5.7 Comparando KM, Scott e Moore-continuidades . . . . . . 5.7.1 Topologia de Scott . . . . . . . . . . . . . . . . . 5.7.2 Independência entre as 3 Noções de Continuidade . 5.8 i-Métricas Deslocadas . . . . . . . . . . . . . . . . . . . . Considerações Finais Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 65 67 68 71 72 75 76 77 78 79 81 83 85 Capítulo 1 Introdução A representação matemática do conceito de distância é feita por funções d : M × M −→ R que satisfazem algumas condições. Abixo, estão listadas as condições mais encontradas na literatura sobre o assunto. a) d(a, b) ≥ 0, quaisquer que sejam a, b ∈ M; b) d(a, b) = 0 se, e somente se, a = b; c) d(a, b) = d(b, a), quaisquer que sejam a, b ∈ M; d) d(a, c) ≤ d(a, b) + d(b, c), quaisquer que sejam a, b, c ∈ M. e) d(a, c) ≤ max{d(a, b), d(b, c)}, quaisquer que sejam a, b, c ∈ M. f) Se d(a, b) = d(b, a) = 0, então a = b. g) d(a, a) = 0, para todo a ∈ M O tipo mais natural de funções distância é a chamada métrica, a qual deve satisfazer as condições a), b), c) e d). Estas quatro condições são bastante intuitivas quando se pensa no que significa a distância entre dois objetos. Existem outras funções distância que basicamente são definidas pondo como condições algumas das mencionadas acima. Dentre elas, destacam-se as quasi-métricas (condições a), d), f) e g)), as pseudo-métricas (condições a), c), d) e g)), as quasi-pseudo métricas (condições a), d) e g)) e as ultra-métricas (condições a), b), c) e e)). Cada um desses conceitos tem suas motivações intuitivas, por exemplo, as quasi-métricas podem modelar situações nas quais o caminho para ir do ponto A para o B não está disponível para ir do B para o A. Além disso, existem as motivações teóricas, por exemplo, as quasi-métricas são compatíveis com topologias que não são compatíveis com métricas (e.g. Topologia de Scott, como pode ser visto em [Acióly e Bedregal 1997]), as pseudo-métricas podem ser usadas para definir os chamados espaços uniformes (veja [Nagata 1986]) e as ultra-métricas, por exemplo, são usadas na teoria dos números (veja [Priess-Crampe e Ribenboim 2000]). 1 Capítulo 1. Introdução Uma forma de generalizar a noção matemática de distância é através da modificação do espaço de valoração da função d, ou seja, a distância entre dois objetos é representada por algo mais geral do que um número real. Este tipo de generalização é o principal tema a ser abordado nesta tese. Uma das primeiras generalizações nesse sentido foi chamada de métrica estatística e foi proposta por Menger em 1942. Depois, em 1960, Schweiser e Sklar propuseram uma outra noção de métrica estatística um pouco mais simples do que a de Menger. Nestas duas propostas, o valor de d(a, b) era uma função de distribuição de probabilidade. Mais tarde, em 1975, Kramosil e Michálek adaptaram o conceito de métrica estatística de Menger para o contexto de conjuntos difusos e definiram os chamados espaços métricos difusos. Tal conceito ainda foi sutilmente modificado por George e Veeramani em 1994 e continuou sendo chamada de espaço métrico difuso. Ainda no que diz respeito ao universo dos conjuntos difusos, um terceiro conceito de métrica difusa foi proposto em 1984 por Kaleva e Seikkala. Este último conceito de métrica difusa difere dos anteriores por não ter ligação ou não ser simplesmente uma adaptação das métricas estatísticas. Uma outra generalização encontrada na literatura é a noção de métrica generalizada que foi proposta por Khamsi et al em 1993 para tratar de programas lógicos disjuntivo. Nesta noção o conjunto no qual a função d é valorada é um monoide comutativo ordenado e as condições são idênticas as de métrica. Outra generalização que será abordada adiante é chamada espaços de continuidade, cuja primeira versão foi proposta por Kopperman em 1988 e a segunda por Kopperman e Flagg em 1997. Há ainda conceitos de distâncias generalizadas feitos a partir da teoria de categorias, cujo trabalho mais citado é [Lawvere 1973]. Esta abordagem categórica não faz parte dos objetivos desta tese. Porém, em [Heitzig 2002], o autor propõe uma noção de distância generalizada usual e a partir da mesma é criada uma categoria e suas propriedades são estudadas. O objetivo inicial deste trabalho era o de encontrar/propor uma noção de distância que capturasse a idéia de métrica intervalar, ou seja, uma noção na qual a distância entre dois objetos seja um intervalo fechado e também a noção de representação intervalar para distância euclidiana na reta. A Matemática Intervalar é uma teoria surgida nos anos 1950’s através dos trabalhos de Warmus, T. Sunaga e R. Moore (ver [Warmus 1956], [Sunaga 1958] e [Moore 1959]) com o intuito de lidar com erros numéricos. A abordagem intervalar baseia-se na chamada aritmética WSM (também conhecida como aritmética de Moore), que consiste em operações de adição, subtração, multiplicação e divisão entre intervalos fechados definidas de modo que o resultado da operação usual entre um elemento do intervalo I1 e um elemento de I2 pertence ao intervalo I, que é o resultado da operação correspondente entre I1 e I2 . Esta abordagem se mostra útil quando se pensa em algoritmos, pois as informações sobre os objetos podem ter incertezas provindas de erros 2 Capítulo 1. Introdução de medição, (falta de) precisão dos instrumentos e até mesmo limitações na representação em máquina dos dados e os intervalos podem ser usados para carregar as informações de incerteza durante o processo. A noção de métrica generalizada mencionada acima consegue capturar a idéia de métrica intervalar mas, como será visto no decorrer do trabalho, não consegue capturar a idéia de representação que é bastante importante no contexto de matemática intervalar. Devido a isso, será proposta neste trabalho uma nova noção generalizada de distância, a qual será chamada i-Distância que captura a idéia de representação intervalar e, além disso, gera uma topologia de maneira muito similar àquela gerada por uma métrica no sentido usual. Esta generalização foi feita tomando como base a estrutura onde a função distância assume valores, a qual recebe o nome de Valoração de i-Distância ou, simplesmente, VID. Uma proposta de métrica intervalar foi pode ser encontrada em [Trindade et al 2010], a qual foi feita a partir de uma abordagem voltada para aplicações sem abordá-la do ponto vista topológico. Este trabalho está dividido em 6 capítulos. No segundo, são apresentados conceitos e resultados preliminares sobre teoria da ordem, matemática intervalar, lógica difusa, espaços métricos e topologia. No terceiro é apresentado o estado da arte sobre generalizações de distâncias que seguem a linha da proposta feita aqui. No quarto capítulo é introduzido o conceito de i-distâncias, com alguns exemplos iniciais, a topologia construída a partir delas e sua ligação com as outras generalizações. No quinto são apresentados exemplos de i-métricas cuja valoração é intervalar e é introduzida uma i-métrica intervalar no conjunto IR dos intervalos que captura (parcialmente) a idéia de representação intervalar, a qual é estudada sob o ponto de vista topológico, comparando-a com outras topologias conhecidas em IR e, no final do capítulo, é apresentada uma noção que captura totalmente a idéia de representação. O sexto capítulo apresenta algumas considerações finais sobre o trabalho realizado e indica possíveis trabalhos que resultam desta tese. 3 Capítulo 2 Preliminares Neste capítulo são apresentados os conceitos e resultados básicos que serão abordados no decorrer do trabalho. Tais conceitos e resultados estão separados em 4 seções: uma sobre teoria da ordem, uma sobre matemática intervalar, uma sobre lógica difusa e uma sobre espaços métricos. 2.1 Ordens, Pré-ordens, Reticulados e Reticulóides Definição 2.1. Seja A um conjunto não-vazio. Uma relação binária ≤ em A é chamada pré-ordem, se satisfaz: 1. a ≤ a, para todo a ∈ A — Reflexividade; 2. Se a ≤ b e b ≤ c, então a ≤ c — Transitividade. O par hA ≤i, onde ≤ é uma pré-ordem em A, é chamado conjunto pré-ordenado. Uma pré-ordem em A é uma ordem parcial, se satisfaz: 3. Se a ≤ b e b ≤ a, então a = b — Anti-simetria Uma pré-ordem A é chamada cadeia ou pré-ordem total, se para quaisquer a, b ∈ A tivermos a ≤ b ou b ≤ a. Exemplo 2.1. No conjunto dos números reais, a relação definida por a b ⇔ |a| ≤ |b| é uma pré-ordem total. Note que esta relação não é anti-simétrica. Exemplo 2.2. No conjunto dos números inteiros, a relação definida por a b ⇔ a|b, onde a|b significa que existe c ∈ Z tal que b = ac é uma pré-ordem em Z, a qual não é total e nem anti-simétrica. Esta mesma relação restrita aos inteiros não-negativos é uma ordem parcial. 4 Capítulo 2. Preliminares Definição 2.2 (Conjunto dirigido e conjunto d-dirigido). Seja hA, ≤i um conjunto préordenado. Dado C ⊆ A, um elemento u ∈ A é uma cota superior de C se c ≤ u, ∀c ∈ C. Dualmente, define-se cota inferior. Um conjunto D ⊆ A é chamado conjunto dirigido se para cada par de elementos a, b ∈ D, o conjunto {a, b} possui cota superior em D. Dualmente, define-se conjunto d-dirigido. Exemplo 2.3. Se hA, i é um conjunto pré-ordenado e é uma pré-ordem total então todo subconjunto não vazio de A é dirigido e d-dirigido. De fato, se a ≤ b, então a é uma cota inferior e b uma superior para {a, b}. A definição abaixo apresenta uma generalização para conjuntos pré-ordenados dos conceitos de ínfimo e supremo. Esta definição foi retirada de [Morgado 1962]. Definição 2.3. Considere hA, i um conjunto pré-ordenado, C ⊂ A e defina os conjuntos UC = {u ∈ A; c u, ∀c ∈ C} e LC = {l ∈ A; l c, ∀c ∈ C}, ou seja, estes são os conjuntos das cotas superiores e inferiores de C. É possível que algum desses conjuntos (ou ambos) seja vazio. Se existir um elemento s ∈ UC tal que s u, ∀u ∈ UC , então diz-se que s é um supremóide de C. De modo dual define-se infimóide de C. No caso em que a préordem é uma relação de ordem, o supremóide de uma conjunto, quando existe, é único e é chamado de supremo do conjunto. O mesmo ocorre com o infimóide que no caso recebe o nome de ínfimo. Os conjuntos dos supremóides e dos infimóides de um conjunto C ⊂ A serão denotados por SC e IC . No caso de conjuntos ordenados, o supremo e o ínfimo de um conjunto serão denotados por supC e infC. Definição 2.4. Seja hA, i um conjunto pré-ordenado. Denota-se por ⊥A o conjunto dos elementos ⊥ ∈ A tais que ⊥ a, ∀a ∈ A. Se a pré-ordem for também anti-simétrica (ou seja, se for uma relação de ordem), então existe no máximo um elemento ⊥ com esta / diz-se propriedade e este é chamado menor elemento, ou mínimo de hA, i. Se ⊥A 6= 0, que hA, i é um conjunto pré-ordenado com menores elementos. A definição abaixo apresenta uma generalização para conjuntos pré-ordenados de um importante conceito de teoria dos domínios, a saber a relação essencialmente abaixo (a definição para conjuntos ordenados é idêntica a dada abaixo e pode ser encontrada em [Gierz et al 2003]). Definição 2.5. Considere um conjunto pré-ordenado hA, ≤i. Diz-se que x está essencialmente abaixo de y, o que é denotado por x y, se para todo conjunto dirigido D ⊆ A com ao menos um supremóide s tal que y ≤ s, existe d ∈ D tal que x ≤ d. 5 Capítulo 2. Preliminares Exemplo 2.4. No conjunto R, a relação essencialmente abaixo associada à ordem usual ≤ coincide com a relação menor estrito <. De fato, denote por a relação essencialmente abaixo associada a ≤. Primeiro, suponha a < b. Seja D ⊆ R um conjunto com supremo (todo subconjunto de R é dirigido, já a ordem de R é total) s tal que b ≤ s. Pela definição de supremo, como a < b, então a não pode ser cota superior de D, portanto existe d ∈ D tal que a ≤ d assim a b. Agora, suponha a b. Considere o intervalo I = (−∞, b). Temos que b é o supremo deste conjunto (todo subconjunto de R é dirigido) logo b ≤ sup I e, pela definição de , existe d ∈ I tal que a ≤ d. Como d ∈ I, então d < b logo a < b. Observação 2.1. Uma importante propriedade da relação essencialmente abaixo é a seguinte: se a c e b c, então s c, para todo s ∈ U{a,b} . (2.1) A verificação desta propriedade é inteiramente análoga àquela para conjuntos ordenados e relações auxiliares (ver [Gierz et al 2003]). Teorema 2.1. Se hA, ≤i é um conjunto pré-ordenado, então a relação satisfaz: i) Se a b, então a ≤ b; ii) Se a ≤ b, b c e c ≤ d, então a d. Demonstração. A demonstração também segue os mesmos passos da demonstração deste fato quando nos restringimos a conjuntos ordenados e relações auxiliares (ver [Gierz et al 2003]). Abaixo, é apresentada uma importante classe de conjuntos pré-ordenados, os quais foram introduzidos em [Morgado 1962]. Definição 2.6. Um conjunto pré-ordenado hA, ≤i é chamado semireticulóide inferior se existe pelo menos um infimóide para cada a, b ∈ A. Dualmente, define-se um semireticulóide superior. Se um conjunto pré-ordenado é, ao mesmo tempo, um semireticulóide inferior e superior, dizemos que ele é um reticulóide. No caso em que ≤ é uma ordem parcial, as definições de semireticulóide e reticulóide coincidem com as de semireticulado e reticulado (veja [Blyth 2005]). Nesse caso, denota-se por a ∧ b e a ∨ b o ínfimo e o supremo do conjunto {a, b}. Um reticulóide (reticulado) no qual todo subconjunto possui supremóide (supremo) é chamado completo. 6 Capítulo 2. Preliminares A teoria dos reticulados (como conjuntos ordenados) já se tornou um tópico fundamental em teoria de conjuntos ou de ordens. Pode-se enriquecer a estrutura de um reticulado hA, ≤i acrescentando-se a mesma uma operação entre seus elementos. Um exemplo de uma estrutura como esta são os chamados Reticulados residuados, cuja definição pode ser encontrada em [Galatos et al 2007]. Um outro exemplo são os chamados Quantales e os co-Quantales, os quais serão abordados no capítulo do estado da arte. 2.2 Matemática Intervalar Definição 2.7. O conjunto dos intervalos compactos da reta é definido por IR = {[a, b]; a ≤ b} e o conjunto dos intervalos compactos com extremos não-negativos por IR+ = {[a, b] ∈ IR; 0 ≤ a ≤ b}. Dado X ∈ IR, a notação [x, x] é usada para representar X. O conjunto de operações entre intervalos definidas abaixo ficou conhecido como aritmética WSM. Definição 2.8. Sejam A = [a, a] , B = b, b ∈ IR. As operações de adição, multiplicação, subtração e divisão de intervalos são de finidas como segue: (a) A + B = a + b; a + b ; (b) A − B = a − b; a − b ; (c) A × B = [min{a.b, a.b, a.b, a.b}, max{a.b, a.b, a.b, a.b}]; a a a a A a a a a (d) = [min{ , , , }, max{ , , , }], onde 0 ∈ / B. B b b b b b b b b A principal propriedade que essas operações possuem é apresentada no seguinte: Teorema 2.2. Sejam A, B ∈ IR e O = {+, ×, −, /} o conjunto das operações intervalares definidas acima. Denote por ∗0 a operação entre números reais relativa à operação ∗ ∈ O. Dessa forma, se ∗ ∈ O, então a ∗0 b ∈ A ∗ B, para quaisquer a ∈ A e b ∈ B. Essa propriedade traduz a idéia de que as operações definidas por Moore para intervalos são corretas em relação as operações usuais entre números. De fato, como intervalos são usados para representar valores com incertezas é desejável que ao operar esses intervalos, o intervalo resultante contenha todos os possíveis valores da operação usual entre os elementos dos intervalos, o que garante que o valor real da operação pertence ao intervalo resultante. Além de correta, estas operações também têm uma propriedade de optimalidade, a qual é descrita no teorema abaixo. 7 Capítulo 2. Preliminares Teorema 2.3. Sejam A, B ∈ IR e O = {+, ×, −, /} o conjunto das operações intervalares definidas acima. Denotando por ∗0 a operação entre números reais relativa à operação ∗ ∈ O, temos que A ∗ B = {a ∗0 b; a ∈ A e b ∈ B}. Isso significa que nas operações intervalares não há “sobra"de valores, ou seja, se um número z está em A ∗ B, então existem x ∈ A e y ∈ B tais que x ∗0 y = z. As demonstrações destes dois últimos teoremas seguem diretamente da teoria de funções contínuas de R2 em R, do fato de que a imagem de um conjunto conexo e compacto por uma função contínua é um conjunto conexo e compacto e do fato de que os únicos subconjuntos conexos da reta são os intervalos. Estes resultados podem ser vistos em [Lima 1977]. Abaixo, estão listadas algumas propriedades algébricas da aritmética WSM: (a) A + (B +C) = (A + B) +C; (b) A(BC) = (AB)C; (c) A + B = B + A; (d) AB = BA; (e) A(B +C) ⊆ AB + AC. Acima foram apresentadas as operações intervalares que constituem um conceito fundamental para se trabalhar com matemática intervalar, assim como as operações usuais são fundamentais para se trabalhar com números reais. Do mesmo modo, é também fundamental uma noção de ordem em IR, assim como em R. É possível definir uma enorme quantidade de ordens parciais em IR, mas aqui terá destaque àquela definida em [Kulisch e Miranker 1981], a qual é exibida abaixo: Definição 2.9. A ordem de Kulisch-Miranker em IR, ≤km , é definida por [a, b] ≤km [c, d] se, e somente se, a ≤ c e b ≤ d. Esta ordem parcial recebe destaque dentre as demais por sua naturalidade já que com esta ordem tem-se a idéia de que se X ≤km Y , então “X está à esquerda de Y na reta real”. Um fato importante sobre ≤km é que a estrutura hIR+ , ≤km , [0, 0]i é um reticulado com menor elemento [0, 0]. De fato, dados [a, b] e [c, d], temos que inf{[a, b], [c, d]} = [min(a, c), min(b, d)] e sup{[a, b], [c, d]} = [max(a, c), max(b, d)]. Outro ponto importante sobre IR é a definição de uma distância entre seus intervalos, a qual foi proposta por Moore e ficou conhecida como métrica de Moore: dM (X,Y ) = max{|x − y|, |x − y|}. 8 Capítulo 2. Preliminares Identificando o conjunto IR com o subconjunto de R2 formado pelos pares (a, b) com a ≤ b, nota-se que dM é uma simples adaptação da chamada métrica do máximo em R2 (ver [Lima 1977]). Também através desta identificação, nota-se que a ordem ≤KM é uma adaptação da ordem produto em R2 = R × R. Uma crítica que alguns pesquisadores fazem sobre a métrica dM está no fato de que ela não capta as incertezas presentes nos intervalos, já que o valor da distância entre intervalos é um número real. Em sua tese de doutorado ([Acióly 1991]) Acióly alertou para a necessidade de uma noção de métrica em IR que incorporasse as imprecisões expressas pelos intervalos. Uma maneira interessante de fazer isso é dar uma noção de métrica na qual a distância entre os intervalos seja também um intervalo (uma noção de distância como esta pode ser encontrada em [Trindade et al 2010]). 2.3 Lógica Difusa A teoria dos conjuntos difusos foi iniciada nos anos 1960’s com o trabalho de Lofti Zadeh (veja [Zadeh 1965]). Na teoria clássica de conjuntos, dado um conjunto universo U (às vezes chamado universo de discurso) pode-se caracterizar um conjunto qualquer X ⊆ U pela sua chamada função ( característica ξX , a qual é definida da seguinte maneira: ξX : 1 , se a ∈ X U −→ {0, 1}, onde ξX (a) = . Com isso, dado um elemento a ∈ U, temos 0 , se a ∈ /X que ou a ∈ X ou a ∈ / X. Isso advém da chamada lógica clássica, onde uma proposição é verdadeira ou falsa, não havendo uma terceira possibilidade e, portanto, não havendo um terceiro valor para a função de pertinência. Os conjuntos difusos surgiram com o intuito de lidar com expressões que podem ser consideradas vagas, como por exemplo, alto. Se pensarmos no conjunto das pessoas altas, na lógica clássica, dada uma pessoa teremos que dizer se ela está ou não neste conjunto. Dessa forma, se este conjunto for composto pelas pessoas com pelo menos 1,85 mts de altura, uma pessoa com 2,15 será classificada de maneira igual a outra com exatamente 1,85 mts. Neste caso, parece adequado dizer que a primeira pessoa “pertence mais” ao conjunto do que a segunda. Essa noção, no entanto, não é capturada pela teoria clássica dos conjuntos. Assim como no caso clássico, um conjunto difuso é caracterizado por sua função de pertinência, neste caso, uma função µ : U −→ [0, 1], onde o valor µ(t) significa o grau de pertinência do elemento t ao conjunto em questão. Com isso, por exemplo, poderíamos definir o conjunto alto através de uma função de pertinência que seja crescente com a altura da pessoa. Um tipo de conjunto difuso que será abordado neste trabalho são os chamados números difusos, cuja definição é dada abaixo: 9 Capítulo 2. Preliminares Definição 2.10. Um número difuso é um conjunto difuso A : R −→ [0, 1] que satisfaz: 1. A é normal (existe t ∈ R tal que A(t) = 1); 2. O suporte de A — i.e. o conjunto suppA = {t ∈ R; A(t) > 0} — é limitado; 3. Para cada α ∈ (0, 1], o α-corte Aα = {t ∈ R; A(t) ≥ α} é um intervalo compacto da reta. Cada número real r pode ser visto como um número difuso, considerando-se a seguinte função de pertinência: ( µr (t) = 1, se t = r . 0, se t 6= r Este número difuso será denotado por r̃. Para outros exemplos de números difusos, como os números difusos triangulares ou trapezoidais, veja [Klir e Yuan 1995]. O seguinte teorema dá a caracterização dos números difusos. Teorema 2.4. Seja A : R −→ [0, 1] um conjunto difuso. Temos que A é um número difuso se, e somente se, existem um intervalo [a, b] e duas funções l : (−∞, a) −→ [0, 1] e r : (b, ∞) −→ [0, 1], onde l é não-decrescente, contínua à direita e existe ω1 tal que l(t) = 0, para todo t < ω1 ∈ R e r é não-crescente, contínua à esquerda e existe ω2 ∈ R tal que r(t) = 0 para todo t > ω2 satisfazendo: 1, se t ∈ [a, b] A(t) = l(t), se t < a . r(t), se t > b Demonstração. Veja [Klir e Yuan 1995]. Um número difuso A é dito ser não-negativo quando A(t) = 0 para todo t < 0. Se r ≥ 0, então r̃ é um número difuso não-negativo. O conjunto de todos os números difusos não-negativos será denotado por G. Se A ∈ G e α ∈ (0, 1], então os α-cortes de A serão denotados por Aα = [aα , aα ]. Como os números difusos são determinados por seus α-cortes, pode-se definir uma aritmética e uma ordem parcial em G, baseadas na aritmética WSM e na ordem de Kulisch-Miranker para intervalos. Aqui, serão consideradas apenas as operações de adição e multiplicação da aritmética WSM. Quando restrita a IR+ a operação de multiplicação de intervalos tem a seguinte forma (mais simples): [a, b] · [c, d] = [ac, bd]. Neste caso, a multiplicação tem algumas proprie10 Capítulo 2. Preliminares dades além das já vistas na seção anterior. Estas outras propriedades, além de propriedades envolvendo a ordem de Kulisch-Miranker estão na proposição abaixo (cuja demonstração é imediata). Proposição 2.1. Sejam A, B,C, D ∈ IR+ , onde A = [a, a], B = [b, b], C = [c, c] e D = [d, d]. Dessa forma, tem-se: 1. 2. 3. 4. [0, 0] ≤km A, para todo A ∈ IR+ ; An = [an , an ]; Se A ≤km B e C ≤km D, então A +C ≤km B + D e A ·C ≤km B · D; Se b < 1, então A · B <km A, ou seja, A · B ≤km A e A · B 6= A. A partir das operações intervalares acima e da ordem de Kulisch-Miranker, define-se as operações entre os elementos de G e uma ordem parcial em G. Definição 2.11. Para A, B ∈ G as operações de adição ⊕ e multiplicação são definidas como segue: 1. A soma entre A e B é o número difuso A ⊕ B ∈ G definido por (A ⊕ B)α = Aα + Bα , para todo α ∈ (0, 1]; 2. O produto entre A e B é o número difuso A B ∈ G definido por (A B)α = Aα · Bα , para todo α ∈ (0, 1]; A ordem parcial é definida por A B ⇔ Aα ≤km Bα , para todo α ∈ (0, 1]. Das propriedades das operações intervalares e da ordem de Kulisch-Miranker, segue que as operações e a ordem em G possuem as seguintes propriedades. Proposição 2.2. Para A, B,C, D ∈ G segue que: 1. 2. 3. 4. 5. 2.4 0̃ A, para todo A ∈ G; A ⊕ (B ⊕C) = (A ⊕ B) ⊕C e A (B C) = (A B) C; (An )α = (A ... A)α = [aα n , aα n ], para todo α ∈ (0, 1]; Se A B e C D, então A ⊕C B ⊕ D e A C B D; Se bα < 1, para todo α ∈ (0, 1], então A B ≺ A, ou seja, A B A e A B 6= A. Espaços Métricos e Topologia A Topologia é a área da Matemática que estuda os chamados Espaços Topológicos. A primeira formalização de topologia é devida a Felix Hausdorff que em 1914 definiu o 11 Capítulo 2. Preliminares que hoje é conhecido como espaço de Hausdorff (veja [Hausdorff 1914]). A definição de espaço topológico definitiva foi dada por Kazimierz Kuratowski em 1920 (veja [Kuratowski 1920]). Nesta seção, é apresentada uma breve introdução à topologia e aos espaços métricos, abordando apenas os conceitos e resultados que serão usados em algum ponto no decorrer do trabalho. As demonstrações dos resultados, assim como mais detalhes, podem ser encontradas em [Smyth 1992], [Lima 1977], [Dugundji 1966], [Munkres 1975] ou [Nagata 1986] Definição 2.12. Uma topologia em um conjunto não vazio M é uma classe τ de subconjuntos de M que satisfaz as seguintes condições: / M ∈ τ; 1. 0, [ 2. Se {Aλ }λ∈L ⊆ τ, então Aλ ∈ τ; λ∈L 3. Se A, B ∈ τ, então A ∩ B ∈ τ. O par (M, τ), onde τ é uma topologia em M, é chamado espaço topológico. Os conjuntos que pertencem a uma topologia são chamados abertos desta topologia. Dado um ponto a de M, dizemos que V é uma vizinhança de a se a ∈ V e V contém um aberto O tal que a ∈ O. Em um espaço topológico, o complementar de um conjunto aberto é chamado conjunto fechado. Se (M, τ) é um espaço topológico e C ⊂ M, então o fecho de C (denotado por C) é definido como sendo o menor conjunto fechado que contém C. É possível mostrar que C é a interseção de todos os conjuntos fechados que contém C. Uma caracterização dos conjuntos fechados é apresentada abaixo. Proposição 2.3. Sejam (M, τ) um espaço topológico e C ⊂ M. Temos que C é fechado se, e somente se, C = C. Dois exemplos triviais de topologias em um conjunto M qualquer são os seguintes: / M} e o conjunto P (M ) das partes de M. A primeira é chamada topologia indiscreta {0, e a segunda discreta. Um outro exemplo é a chamada topologia cofinita, onde os abertos da topologia são o conjunto vazio e os subconjuntos de M cujo complementar é finito (no caso em que M é infinito). Definição 2.13. Seja (M, τ) um espaço topológico. Uma classe B de abertos de τ é uma base para τ se todo aberto pode ser escrito como união de elementos de B Ou seja, uma base de uma topologia gera, através de uniões, todos os abertos da topologia. A seguir, é apresentado o conceito de espaço métrico, o qual foi estabelecido em [Fréchet 1906]. Apesar de ser anterior ao conceito de topologia, os espaços métricos dão origem às mais importantes topologias em um conjunto, como será visto a seguir. 12 Capítulo 2. Preliminares Definição 2.14. Uma métrica em um conjunto não vazio M é uma função d : M × M −→ R que satisfaz: 1. 2. 3. 4. d(x, y) ≥ 0; d(x, y) = d(y, x); d(x, y) = 0 se, e somente se, x = y; d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular). O par (M, d), onde d é uma métrica em M, é chamado espaço métrico. No conjunto Rn dos vetores com n coordenadas reais as seguintes funções são métricas (se x ∈ Rn , denotaremos suas coordenadas por x1 , x2 , ..., xn ): p i) dE (x, y) = (x1 − y1 )2 + ... + (xn − yn )2 (distância euclidiana); ii) dS (x, y) = |x1 − y1 | + ... + |xn − yn | (distância da soma); iii) dM (x, y) = max{|x1 − y1 |, .., |xn − yn |} (distância do máximo). Definição 2.15. Seja (M, d) um espaço métrico. Fixados um ponto a ∈ M e um número real positivo r, o conjunto {y ∈ M; d(a, y) < r} é chamado bola aberta de centro a e raio r. A notação usada é B(a, r). Em um espaço métrico (M, d), diz-se que um conjunto O ⊆ M é aberto quando para todo a ∈ O existe r > 0 tal que B(a, r) ⊆ O. Teorema 2.5. Seja (M, d) um espaço métrico. A classe τ dos conjuntos abertos é uma topologia em M. Além disso, a classe das bolas abertas constitui uma base desta topologia. As 3 métricas em Rn descritas acima geram a mesma topologia neste conjunto. Quando métricas definidas em um mesmo conjunto geram a mesma topologia neste, dizemos que estas métricas são equivalentes. O fecho de uma bola aberta B(a, r) em um espaço topológico é a bola fechada B[a, r] = {y ∈ M; d(a, y) ≤ r}. Uma topologia que pode ser construída a partir de uma métrica da maneira descrita acima é chamada metrizável. A primeira formulação de topologia dada por Hausdorff incluia uma condição a mais além das apresentadas na definição 2.12. Esta condição indica que o espaço em questão tem uma propriedade de separabilidade entre seus pontos, a qual ficou conhecida como propriedade de Hausdorff. Definição 2.16. Um espaço topológico (M, τ) (ou a topologia τ) é dito ser de Hausdorff (ou ter a propriedade de Hausdorff) quando dados x, y ∈ M com x 6= y, existem abertos disjuntos A e B tais que x ∈ A e y ∈ B. 13 Capítulo 2. Preliminares Um resultado bastante conhecido sobre espaços de Hausdorff é apresentado abaixo: Proposição 2.4. Toda topologia metrizável é de Hausdorff. Um exemplo de um espaço topológico que não é de Hausdorff é o seguinte: seja M um conjunto infinito qualquer e τ a topologia cofinita em M. Dados A, B ∈ τ, com A e B não-vazios, temos que M − (A ∩ B) = (M − A) ∪ (M − B). Como A e B são abertos desta topologia, então M − A e M − B são conjuntos finitos, logo (M − A) ∪ (M − B) 6= M, já / para qualquer par de abertos não vazios. Sendo que M é infinito. Portanto A ∩ B 6= 0, assim, dados x, y ∈ M com x 6= y, é impossível encontrar os abertos disjuntos da definição de espaço de Hausdorff. Um outro exemplo de espaço que não é de Hausdorff é o espaço (M, τ) onde M é / M}. De fato, dados x, y ∈ M com um conjunto com pelo menos dois elementos e τ = {0, x 6= y, o único aberto que contém x e y é o próprio M. Devido a proposição 2.4, estes dois espaços acima não são metrizáveis. Um resultado trivial sobre espaços de Hausdorff assegura que todo conjunto unitário é fechado neste tipo de espaço. Definição 2.17. Sejam (M1 , τ1 ) e (M2 , τ2 ) dois espaços topológicos. Uma função f : M −→ N é contínua quando para cada O ∈ τ2 tem-se f −1 (O) ∈ τ1 . Abaixo, define-se a noção de continuidade relativa a espaços métricos. Definição 2.18. Dados dois espaços métricos (M, dA ) e (N, dB ), uma função f : M −→ N é dita ser contínua em a ∈ M, se para todo ε > 0, existe δ > 0 tal que dA (a, b) < δ ⇒ dB ( f (a), f (b)) < ε, ou equivalentemente, se b ∈ B(a, δ), então f (b) ∈ B( f (a), ε). Quando f é contínua em cada a ∈ M diz-se simplesmente que f é contínua. Teorema 2.6. Sejam (M, dA ) e (N, dB ) dois espaços métricos. Uma função f : M −→ N é contínua com respeito às topologias geradas por dA e dB se, e somente se, f é contínua com respeito às métricas. O teorema acima garante que a definição de continuidade topológica coincide com a de continuidade relacionada a espaços métricos. Assim, para avaliar a continuidade topológica de uma função entre espaços topológicos metrizáveis pode-se usar o conceito relativo a espaços métricos o qual, muitas vezes, é mais fácil de ser averiguado. A seguir, são apresentadas outras noções de distância que têm pequenas diferenças em relação às métricas. Definição 2.19. Uma quasi-métrica em um conjunto não vazio M é uma função d : M × M −→ R que satisfaz: 14 Capítulo 2. Preliminares 1. d(x, y) ≥ 0 e d(x, x) = 0; 2. Se d(x, y) = d(y, x) = 0, então x = y; 3. d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular). O par (M, d), onde d é uma quasi-métrica em M, é chamado espaço quasi-métrico. Uma diferença entre métrica e quasi-métrica é que a segunda não é, necessariamente, simétrica. Outra diferença é que se d é uma quasi-métrica, então pode ocorrer d(x, y) = 0, com x 6= y. Exemplo 2.5. Um exemplo simples de quasi-métrica que não é métrica em R é o da função d1 : R × R −→ R definida por d1 (a, b) = max{a − b, 0}. Note que d(2, 3) = 0 e d(3, 2) = 1. Dada uma quasi-métrica d em M, é possível obter uma outra quasi-métrica d, chamada quasi-métrica conjugada, em M definida por d(x, y) = d(y, x). Também é possível obter uma métrica q em M definida por q(x, y) = max{d(x, y), d(x, y)}. Definição 2.20. Uma pseudo-métrica em um conjunto não vazio M é uma função d : M × M −→ R que satisfaz: 1. d(x, y) ≥ 0 e d(x, x) = 0; 2. d(x, y) = d(y, x); 3. d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular). O par (M, d), onde d é uma pseudo-métrica em M, é chamado espaço pseudo-métrico. É possível d(x, y) = 0, com x 6= y. Exemplo 2.6. Um exemplo simples de uma pseudo-métrica que não é métrica em R2 é a função definida por d2 ((x, y), (z,t)) = |x − z|. Note que d2 ((1, 2), (1, 3)) = 0. Combinando as definições de quasi e pseudo-métrica, tem-se a definição de quasipseudométrica (pode-se ter d(x, y) = 0, com x 6= y, e a função não ser, necessariamente, simétrica). Qualquer uma destas funções que generalizam o conceito de métrica gera uma topologia de maneira inteiramente análoga a topologia gerada por uma métrica, partindo da definição de bola aberta. Neste caso, uma topologia que pode ser gerada por uma quasi-métrica é chamada quasi-metrizável e do mesmo modo define-se as topologias pseudo-metrizáveis e quasi-pseudometrizáveis. Já foi mencionado que nem toda topologia é metrizável. Em [Kopperman 1993] e [Hung 1998] são apresentadas condições necessárias e suficientes para que uma topologia seja quasi-pseudometrizável e exemplos 15 Capítulo 2. Preliminares de topologias que não são. Como toda quasi-pseudométrica é, em particular, uma quasi e uma pseudo-métrica, então estas topologias que não são quasi-pseudometrizáveis não são quasi-metrizáveis e nem pseudo-metrizáveis. Observação 2.2. É imediato que toda métrica é uma quasi-métrica, uma pseudo-métrica e uma quasi-pseudométrica. A função d1 do exemplo 2.5 é um exemplo de quasi-métrica que não é pseudo-métrica, já que não é simétrica. A função d2 do exemplo 2.6 é uma pseudo-métrica que não é quasi-métrica, já que d2 ((1, 2), (1, 3)) = d2 ((1, 3), (1, 2)) = 0, mas (1, 2) 6= (1, 3). 16 Capítulo 3 Estado da Arte Neste capítulo, são apresentadas algumas generalizações do conceito de distância feitas através da modificação do conjunto de valoração das funções distância. Serão abordadas generalizações ligadas a teoria das probabilidades, lógica difusa e teoria da ordem. 3.1 Métricas Estatísticas Como já foi dito, uma das primeiras generalizações do conceito de métrica surgiu em 1942 (veja [Menger 1942]), quando Menger introduziu as chamadas métricas estatísticas. Para apresentar tal conceito, é necessária a noção de função de distribuição de probabilidade. Definição 3.1. Uma função F : R −→ [0, 1] é chamada função de distribuição de probabilidade quando é não-decrescente, contínua pela esquerda e satisfaz lim F(t) = 1. O t−→+∞ valor de F em t é entendido como a probabilidade de que a variável aleatória X, que tem F como função de distribuição, seja menor do que t. Será denotado por D+ o conjunto das funções de distribuição de probabilidade não negativas, ou seja, daquelas tais que F(0) = 0. Exemplo 3.1. A função F(x) = 1 − e−x (distribuição exponencial) é um clássico exemplo de função de distribuição de probabilidade. Visto isso, a definição de métrica estatística é apresentada abaixo. Definição 3.2. Uma função d : M × M −→ D+ é chamada métrica estatística se satisfaz as seguintes condições: i) d(x, y)(t) = 1, para todo t > 0 se, e somente se, x = y, onde x, y ∈ M; ii) d(x, y)(0) = 0, quaisquer que sejam x, y ∈ M; iii) d(x, y) = d(y, x); 17 Capítulo 3. Estado da Arte iv) T (d(x, y)(λ), d(y, z)(µ)) ≤ d(x, z)(λ + µ), para alguma função T : [0, 1] × [0, 1] −→ [0, 1] satisfazendo: a) T (a, b) ≤ T (c, d), para a ≤ c e b ≤ d; b) T (a, b) = T (b, a); c) T (1, 1) = 1; d) Se a > 0, então T (a, 1) > 0; A tripla (M, d, T ) é chamada espaço métrico estatístico ou espaço de Menger. A função T que aparece na definição acima, com a exigência de associatividade (T (a, T (b, c)) = T (T (a, b), c)) e do 1 ser o elemento neutro (T (a, 1) = a), ficou conhecida como Norma Triangular ou simplesmente t-norma. Esta função tornou-se muito importante com o surgimento da chamada lógica difusa, onde as t-normas desempenham o papel de conectivo de conjunção nesta lógica (veja [Klir e Yuan 1995]) . Na noção proposta em [Schweiser e Sklar 1960], uma função d : M × M −→ D+ é chamada métrica estatística quando satisfaz as 3 primeiras condições que aparecem na definição de Menger e a condição abaixo, a qual decorre da desigualdade triangular dos espaços e Menger (condição iv) da definição 3.2: Se d(x, y)(t) = 1 e d(y, z)(s) = 1, então d(x, z)(t + s) = 1. Em ambos os casos, o número d(x, y)(t) significa a probabilidade de que a distância entre x e y seja menor do que t. Com base nisso, as 3 primeiras condições são facilmente reconhecíveis enquanto generalizações das condições usuais de métrica. Na segunda definição, embora seja intuitiva, a quarta condição, a qual é uma generalização da desigualdade triangular, tem um problema: como muitas das funções de distribuição não atingem o valor 1 esta condição acaba sendo válida por vacuidade e, devido a isso, não é possível fazer grandes avanços teóricos com este conceito. 3.2 Espaço Métrico Difuso Em [Kramosil e Michálek 1975] foi introduzido o primeiro conceito de espaço métrico difuso. Definição 3.3. Um espaço métrico difuso (no sentido de Kramosil e Michalék é uma tripla (M, T, R), onde M é um conjunto não vazio, T é uma t-norma contínua e R é um subconjunto difuso de M × M × R cuja função de pertinência µR satisfaz: 18 Capítulo 3. Estado da Arte i) µR (x, y, 0) = 0; ii) µR (x, y,t) = 1, ∀ t > 0 se, e somente se, x = y; iii) µR (x, y,t) = µR (y, x,t); iv) T (µR (x, y,t), µR (y, z, s)) ≤ µR (x, z,t + s); v) Para cada par (x, y) ∈ M × M, temos que a função µR (x, y, ·) : [0, +∞) −→ [0, 1] é contínua à esquerda, não-decrescente e lim µR (x, y,t) = 1. t−→+∞ Não é difícil ver que um espaço métrico difuso neste sentido é apenas uma adaptação para o contexto de conjuntos difusos dos espaços de Menger. Basta definir para cada (x, y) ∈ M × M e para cada λ ∈ R, d(x, y)(λ) = µR (x, y, λ). Em [George e Veeramani 1994], foi definido um outro conceito de espaço métrico difuo, o qual apresentava pequenas modificações em relação à noção de Kramosil e Michálek. Definição 3.4. Um espaço métrico difuso (no sentido de George e Veeramani) é uma tripla (M, T, R), onde M é um conjunto não vazio, T é uma t-norma contínua e R é um subconjunto difuso de M × M × R cuja função de pertinência µR satisfaz: i)µR (x, y,t) > 0; ii) µR (x, y,t) = 1 se, e somente se, x = y; iii)µR (x, y,t) = µR (y, x,t); iv) T (µR (x, y,t), µR (y, z, s)) ≤ µR (x, z,t + s); v) Para cada par (x, y) ∈ M × M, temos que a função µR (x, y, ·) : (0, +∞) −→ [0, 1] é contínua. Esta noção de espaço métrico difuso tem a vantagem de não ser uma adaptação direta do conceito de espaço de Menger. Em [Kaleva e Seikkala 1984] foi introduzido um outro conceito de espaço métrico difuso no qual o valor da distância entre dois objetos é um número difuso não-negativo. Esta definição pode ser encontrada abaixo: Definição 3.5. Uma quádrupla (M, d, L, R) onde M é um conjunto não vazio, d : M × M −→ G (G é o conjunto dos números difusos não-negativos) é uma função e L, R : [0, 1] × [0, 1] −→ [0, 1] são duas funções simétricas, não-decrescentes nos dois argumentos e satisfazendo L(0, 0) = 0 e R(1, 1) = 1 é chamado espaço métrico difuso (no sentido de Kaleva e Seikkala) quando satisfaz: i) d(x, y) = 0̃ se, e somente se, x = y; ii) d(x, y) = d(y, x); 19 Capítulo 3. Estado da Arte iii) Adotando a notação [d(x, y)]α = [λα (x, y), ρα (x, y)] para os α-cortes de d(x, y) temos, para quaisquer x, y, z ∈ M, 1. d(x, y)(s + t) ≥ L(d(x, z)(s), d(y, z)(t)), sempre que s ≤ λ1 (x, z), t ≤ λ1 (z, y) e s + t ≤ λ1 (x, y); 2. d(x, y)(s + t) ≤ R(d(x, z)(s), d(y, z)(t)), sempre que s ≥ λ1 (x, z), t ≥ λ1 (z, y) e s + t ≥ λ1 (x, y); Já foram feitos vários estudos sobre estes espaços métricos difusos, abordando problemas como completude, compacidade, teoremas de ponto fixo, etc. (veja [Lee et al 1999], [Singh e Jain 2005] e [Ciric 2010]). 3.3 Métrica Generalizada Uma outra generalização do conceito de métrica foi proposta em 1993 , a qual foi chamada de métrica generalizada (ver [Khamsi et al 1993]). Neste trabalho os autores estavam interessados no problema da existência do chamado conjunto de resposta para um programa lógico disjuntivo. Para um tipo de programa, a existência desse conjunto é garantida por um teorema do ponto fixo para aplicações multi-valoradas relativo a espaços métricos usuais, o qual pode ser encontrado no próprio artigo. A métrica usada neste caso é a chamada métrica de Fitting (ver [Fitting 1993]). Para um outro tipo de programa, a definição da métrica de Fitting não faz sentido, pois ela poderia “assumir valores infinitos”. Com isso, apareceu a necessidade de uma noção de métrica na qual os valores da distância pudessem não ser números reais, mas que a função distância tivesse características muito parecidas com as de métricas usuais, de modo que um teorema de ponto fixo para aplicações multivaloradas, semelhante ao usual, neste caso também fosse válido. O modo como os autores resolveram isso está descrito nas definições abaixo. Definição 3.6. Um conjunto A no qual estão definidas uma operação binária ⊕ associativa, comutativa e com elemento neutro 0 ∈ A é chamado monoide abeliano. Se em A existir uma relação de ordem parcial tal que ⊕ e são compatíveis, ou seja, 0 u, ∀ u ∈ A e u1 ⊕ v1 u2 ⊕ v2 sempre que u1 v1 e u2 v2 , então diremos que A é um monoide abeliano ordenado. Definição 3.7. Seja (A, ≤, +, 0) um monoide abeliano ordenado. Uma métrica generalizada em um conjunto não vazio M é uma função d : M × M −→ A que satisfaz: 1. d(x, y) = 0 se, e somente se, x = y; 20 Capítulo 3. Estado da Arte 2. d(x, y) = d(y, x), quaisquer que sejam x, y ∈ M; 3. d(x, y) ≤ d(x, z) ⊕ d(z, y), quaisquer que sejam x, y, z ∈ M. A tripla (M, d, A) é chamado espaço métrico generalizado. O modo como foi construído o espaço onde seria valorada a métrica teve por objetivo comportar condições bastante semelhantes às de métricas usuais. Os espaços métricos generalizados possuem um teorema de ponto fixo para aplicações multivaloradas muito semelhante ao usual e, com isso, os autores resolveram o problema de existência de conjuntos de resposta para programas lógicos disjuntivos. Esta noção não se prende a nenhum contexto, como o estatístico ou o difuso, porém em [Santana e Santiago 2011] foi provado que no caso em que as funções L e M da definição de espaço métrico difuso, no sentido de Kaleva e Seikkala, são as funções min e max, aqueles espaços são espaços métricos generalizados. Como ficará claro no decorrer do trabalho, esta noção de métrica generalizada é capaz de capturar a idéia de métrica intervalar, mas não a de representação intervalar segundo [Santiago et al 2006]. 3.4 Conjunto Distância Em [Heitzig 2002] foi introduzido o conceito abaixo, o qual é mais uma generalização de distância. Definição 3.8. Um conjunto A no qual estão definidas uma operação binária ⊕ associativa e com elemento neutro 0 ∈ A é chamado monoide. Se em A existir uma pré-ordem tal que ⊕ e são compatíveis, ou seja, 0 u, ∀ u ∈ A e u1 ⊕ v1 u2 ⊕ v2 sempre que u1 v1 e u2 v2 , então diremos que A é um monoide pré-ordenado. Uma tripla (X, d, M), na qual X é um conjunto não-vazio, M é um monoide pré-ordenado e d : X × X −→ M é uma função é chamada conjunto distância quando: i) d(x, x) = 0, para todo x ∈ X; ii) d(x, y) ≤ d(x, z) ⊕ d(z, y), quaisquer que sejam x, y, z ∈ X Desde que toda ordem parcial é uma pré-ordem e todo monoide abeliano ordenado é um monoide pré-ordenado, é fácil perceber que todo espaço métrico generalizado definido na seção anterior, é um conjunto distância. No artigo mencionado acima, foi definida a noção de homometria, as quais são fun- 21 Capítulo 3. Estado da Arte ções entre conjuntos distância f : (X1 , d1 , A1 ) −→ (X2 , d2 , A2 ) que satisfazem: Se d1 (x1 , y1 ) + ... + d1 (xn , yn ) ≤1 d1 (z1 , w1 ) + ... + d1 (zn , wn ), então d2 ( f (x1 ), f (y1 )) + ... + d2 ( f (xn ), f (yn )) ≤2 d2 ( f (z1 ), f (w1 )) + ... + d2 ( f (zn ), f (wn )) Partindo dessa noção, foi criada uma categoria, denotada por DISTo , na qual os objetos são os conjuntos distância e os morfismos são as homometrias. Vários aspectos desta categoria foram estudados, entre eles, foi mostrado que algumas categorias, como a dos espaços métricos (contrações como morfismos), são subcategorias de DISTo . 3.5 Espaços de Continuidade Existem duas versões do conceito de espaços de continuidade. A primeira foi proposta em [Kopperman 1988] e a segunda em [Flagg e Kopperman 1997]. A primeira versão é apresentada nas definições abaixos: Definição 3.9. Um monoide abeliano (V, +, 0) que possui um elemento de absorção ∞ 6= 0 (x + ∞ = ∞) é chamado semigrupo de valoração quando satisfaz: i) Se x + a = b e b + y = a, então a = b (com isso, define-se uma ordem parcial em V pondo a ≤ b se, e somente se, b = a + x, para algum x ∈ V ); ii) Para cada a, existe um único b (denotado por a/2) tal que b + b = a; iii) V é um semireticulado inferior quando considerada a ordem ≤; iv) (a ∧ b) + c = (a + c) ∧ (b + c). Definição 3.10. Um subconjunto P de um semigrupo de valoração V é chamado conjunto de positivos quando satisfaz: i) Se r, s ∈ P, então r ∧ s ∈ P; ii) Se r ∈ P e r ≤ a, então a ∈ P; iii) Se r ∈ P, então r/2 ∈ P; iv) Se a ≤ b + r, para todo r ∈ P, então a ≤ b. Um semigrupo de valoração generaliza o conjunto R dos números reais em vários aspectos relevantes do ponto de vista da teoria dos espaços métricos usuais. A partir destas duas definições, segue a definição dos espaços de continuidade. Definição 3.11. Um espaço de continuidade é uma quádrupla (X, d,V, P), na qual X é um conjunto não-vazio, V é um semigrupo de valoração, P é um conjunto de positivos em V e d : X × X −→ V é uma função satisfazendo: 22 Capítulo 3. Estado da Arte i) d(x, x) = 0; ii) d(x, z) ≤ d(x, y) + d(y, z). Esta função d recebe o nome de função de continuidade. No artigo [Kopperman 1988] foi mostrado que dado um espaço de continuidade (X, d,V, P), pode-se obter uma topologia em X de modo semelhante a topologia gerada por uma métrica, com aúnica diferença sendo que, neste caso, são usadas bolas fechadas no lugar das bolas abertas. Neste mesmo artigo, foi mostrado que toda topologia é gerada por uma função de continuidade. A segunda versão do conceito de espaço de continuidade se baseia nas seguintes definições. Definição 3.12. Um reticulado completo (V, ≤) é dito ser completamente distributivo se para qualquer família {xi, j ; i ∈ I, j ∈ Ji } de elementos de V satisfaz: inf sup xi, j = sup inf xi, f (i) , i∈I j∈Ji f ∈F i∈I onde F é o conjunto das funções escolha que associam a cada índice i ∈ I um índice f (i) ∈ Ji . Definição 3.13. Um reticulado completo (V, ≤) no qual está definida uma operação binária + que é comutativa e associativa é chamado co-Quantale quando satisfaz: i) p + 0 = p, para todo p ∈ V ; ii) Se {qi }i∈I é uma familía qualquer de elementos de V , então p + infi∈I qi = infi∈I (p + q), para todo p ∈ I. Em [Flagg e Kopperman 1997] a estrutura definida acima recebeu o nome de quantale, e foi mencionado que esta denominação nao era padrão, pois na definição encontrada em [Abramsky e Vickers 1993] a distributividade de + era em relação ao sup e não ao inf. O termo co-quantale foi usado em [Heitzig 2003]. Em um reticulado completo (V, ≤) é definida a relação “bem acima” dizendo que y está bem acima de x, o que é denotado por x y, quando em cada subconjunto A de V com inf A ≤ x, tem-se r ≤ y para algum r ∈ A. Definição 3.14. Um reticulado distributivo de valoração é um reticulado completamente distributivo (V, ≤) satisfazendo: i) 0 ∞, onde ∞ é o maior elemento de V ; 23 Capítulo 3. Estado da Arte ii) Se 0 p e 0 q, então 0 p ∧ q. Definição 3.15. Um co-quantale de valoração é um co-quantale (V, ≤, +) tal que (V, ≤) é um reticulado distributivo de valoração. Usando a notação V para um co-quantale de valoração (V, ≤, +), a segunda versão de espaço de continuidade é apresentada abaixo: Definição 3.16. Um V -espaço de continuidade é um par (X, d) onde X é um conjunto não-vazio e d : X × X −→ V é uma função satisfazendo: i) d(x, x) = 0 ii) d(x, z) ≤ d(x, y) + d(y, z). Com base em um V -espaço de continuidade (X, d) é possível obter uma topologia em X também de maneira muito similar ao que é feito no caso de espaços métricos, sendo que aqui as bolas abertas são definidas com base na relação da seguinte forma: se ε ∈ V é tal que 0 ε e x ∈ X, então a bola aberta de centro x e raio ε é o conjunto B(x, ε) = {y ∈ X; d(x, y) ε}. Nas duas versões de espaços de continuidade as funções distância d poderiam ser chamadas de quasi-pseudométricas generalizadas devido às suas condições serem idênticas as condições de quasi-pseudométricas. Dessa forma, também tem-se a noção de V -espaço de continuidade conjugados (como no caso usual), bastando definir a função d por d(a, b) = d(b, a) e também a função q(a, b) = d(a, b) ∨ d(a, b) que seria algo como uma pseudo-métrica generalizada. Em [Flagg e Kopperman 1997], foi mostrado que em um caso particular de v-espaço de continuidade (X, d), a topologia gerada pelo espaço conjugado (X, d) é a topologia de Scott e a topologia gerada por q é a de Lawson, as quais são topologias muito usadas pelos teóricos da computação (para maiores detalhes sobre topologia e computação, veja [Scott 1970] e [Gierz et al 2003]). 24 Capítulo 4 i-Distâncias Neste capítulo será introduzida uma nova proposta de generalização do conceito de distância, a qual é feita com base em uma modificação do conjunto de valoração das funções distÂncia. Tais generalizações serão chamadsa de i-distâncias (i-métrica, i-quasimétrica, i-pseudo-métrica e i-quasi-pseudométrica) já que a motivação inicial para esta proposta vem da idéia de distância intervalar. Para formular esta noção, são necessários alguns novos conceitos em teoria da ordem, os quais serão introduzidos nesta tese, tais como relação semi-auxiliar, conjunto ordenado com menor elemento separável e Valoração de i-Distância (VID). Depois, será apresentada tal proposta com alguns exemplos e será mostrado como tal noção de distância gera uma topologia de maneira bastante natural. 4.1 Valoração de i-Distâncias Nesta seção será feita a construção do espaço que será usado como contra-domínio das funções distância propostas neste trabalho. Para isso, serão necessários alguns conceitos novos em teoria da ordem. O primeiro deles é apresentado abaixo. Definição 4.1. Seja ≤ uma ordem em A. Uma relação binária R em A é uma relação semi-auxiliar para ≤ quando: 1. Se aRb, então a ≤ b; 2. Se a ≤ b, bRc e c ≤ d, então aRd. Esta definição é muito semelhante à definição de relação auxiliar (veja [Gierz et al 2003]), a qual requer adcionalmente que, no caso de conjuntos com menor elemento, se tenha ⊥R⊥. Os motivos para uma modificação tão sutíl (apenas uma das condições de relação auxiliar foi retirada) é o seguinte: a relação “menor estrito” não é uma relação 25 Capítulo 4. i-Distâncias auxiliar quando o conjunto ordenado possui menor elemento, pois para isso deveríamos ter ⊥ < ⊥, o que não ocorre. Proposição 4.1. Se ≤ é uma ordem parcial em A, então a relação menor estrito definida por a < b ⇔ (a ≤ b) ∧ (a 6= b) é uma relação semi-auxiliar para ≤. Demonstração. A primeira condição segue diretamente da definição da relação menor estrito. Para provar a segunda, suponha a ≤ b, b < c e c ≤ d. Como b < c, então temos b ≤ c e pela transitividade de ≤, temos a ≤ d. Falta apenas verificar que a 6= d. Suponha a = d, assim segue da transitividade de ≤ que b = c o que contradiz a hipótese b < c. Logo, deve-se ter a 6= d e, portanto, a < d. Proposição 4.2. Se hA, ≤i é um conjunto ordenado, então a relação essencialmente abaixo é uma relação semi-auxiliar para ≤. Demonstração. Segue diretamente do Teorema 2.1. Observação 4.1. Se hA, ≤, ⊥i é um conjunto ordenado com menor elemento e é a relação essencialmente abaixo, então ⊥ x, para todo x ∈ A (veja [Gierz et al 2003]). Dessa forma, tem-se ⊥ ⊥. Como ficará claro adiante, isto pode não ser muito interessante para a topologia gerada pela proposta de generalização de distância a ser intoduzida aqui. Assim, defina a relação essencialmente abaixo estrita ∗ , pondo a ∗ b se, e somente se, a b e b ∈ / ⊥A . Dessa forma, não pode ocorrer x ∗ ⊥, logo se ⊥ ∗ x, então x 6= ⊥. Proposição 4.3. Se hA, ≤i é um conjunto ordenado, então ∗ é uma relação semiauxiliar para ≤. Demonstração. Segue da definição que se a ∗ b, então a ≤ b. Agora, suponha a ≤ b, b ∗ c e c ≤ d. Como b ∗ c, então c 6= ⊥, logo d 6= ⊥. Como é uma relação semi-auxiliar, temos a d e como d ∈ / ⊥A , então a ∗ d. Proposição 4.4. Se hA, ≤i é um conjunto ordenado, então toda relação semi-auxiliar para ≤ é transitiva. Demonstração. Seja R uma relação semi-auxiliar para ≤ e suponha aRb e bRc. Dessa forma, tem-se a ≤ b, bRc e c ≤ c, logo da segunda condição de relação semi-auxiliar segue que aRc. Abaixo, é introduzido um outro conceito que será importante na definição das VID’s. 26 Capítulo 4. i-Distâncias Definição 4.2. Um conjunto ordenado com uma relação semi-auxiliar R, hA, ≤, R, ⊥i, é dito ter menor elemento separável, quando A é d-dirigido e para cada par de elementos a, b ∈ A, com ⊥Ra e ⊥Rb, existe c ∈ L{a,b} tal que ⊥Rc. Exemplo 4.1. Nem todo conjunto ordenado com uma relação semi-auxiliar hA, ≤, R, ⊥i tem menor elemento separável. Por exemplo, considere em N∗ = {1, 2, ...} a ordem parcial a ≤d b ⇔ a|b e sua relação <. O menor elemento de hN∗ , ≤d i é 1 e para a, b ∈ N∗ , é fácil ver que mdc(a, b) ∈ L{a,b} e s ≤ mdc(a, b), para todo s ∈ L{a,b} . Mas, mdc(2, 3) = 1, então a única cota inferior para {2, 3} é 1. Por outro lado, se hA, ≤, <, ⊥A i é um conjunto ordenado com menor elemento tal que ≤ é uma ordem total, então esta estrutura possui menor elemento separável. Abaixo, é definida a estrutura que servirá de valoração para as i-distâncias. Definição 4.3 (Valoração de i-Distâncias). Uma Valoração de i-Distâncias (VID) é uma estrutura hA, ≤, R, ⊥i, tal que R é uma relação semi-auxiliar para ≤ e hA, ≤, R, ⊥i é um conjunto ordenado d-dirigido com menor elemento separável. Exemplo 4.2. Se hA, ≤, ⊥i é um conjunto totalmente ordenado, então a estrutura hA, ≤ , <, ⊥i é uma VID, onde < é a relação de ordem estrita. uma VID bastante natural é h[0, +∞), ≤, <, 0i. Esta estrutura é usada para valorar as métricas usuais (falta aí apenas a operação de adição). 4.2 i-Distâncias: Definições e Primeiros Exemplos Nesta seção serão definidas as i-distâncias. Em geral, dado um conjunto não-vazio M e uma VID V = hA, ≤, R, ⊥i, uma i-distância V -valorada (ou em relação à VID V ) em M é uma função d : M × M −→ A que satisfaz algumas condições semelhantes as condições de distâncias usuais. A seguir, é dada a definição de i-métrica que é o tipo mais natural de i-distância, assim como métrica é o tipo mais natural de distância. Definição 4.4. [i-Métrica] Seja M um conjunto não-vazio e V = hA, ≤, R, ⊥i uma VID. Uma função d : M × M −→ A é chamada i-métrica V -valorada (ou em relação à VID V ) quando satisfaz: 1. d(a, b) = ⊥ se, e somente se, a = b; 2. d(a, b) = d(b, a), para quaisquer a, b ∈ M; 3. Se d(a, b)Rε, para algum ε ∈ A com ⊥Rε, então existe δ ∈ A, com ⊥Rδ, tal que d(b, c)Rδ ⇒ d(a, c)Rε. 27 Capítulo 4. i-Distâncias Neste caso, a tripla (M, d, V ) é chamada espaço i-métrico. As duas primeiras condições são facilmente reconhecíveis como generalizações das condições de métrica. A terceira, que é a “desigualdade triangular", parece não ser muito natural, mas no decorrer desta seção e da próxima (quando serão vistas as ligações com topologia) esta condição será justificada. Um ponto importante a ser observado sobre a definição do espaço de valoração das i-métricas é que este espaço não exige uma operação de adição. Em [Heitzig 2003], onde também são apresentadas noções generalizadas de métrica (muito semelhantes aos espaços de continuidade), o autor foi taxativo ao afirmar que para uma estrutura servir de valoração para uma métrica generalizada, a mesma deve comportar a desigualdade triangular d(x, z) ≤ d(x, y) + d(y, z), ou seja, é necessária a existência de uma operação de adição. As razões para a desigualdade triangular de i-distância não depender de uma operação de soma são duas. A primeira pode ser explicada agora. Um determinado conjunto que pode ser interessante para valorar distância pode não ter uma operação de adição adequada. Por exemplo, em um conjunto de cadeias de caracteres a operação que mais se aproxima de adição é a chamada operação de concatenação (∗), que consiste em juntar duas cadeias formando uma terceira cadeia, por exemplo, abcde ∗ f ghi = abcde f ghi. Em todas as generalizações de distância vistas aqui (exceto aquela proposta em [Heitzig 2003]) a operação de adição deve ser comutativa, o que não é o caso para ∗. A segunda ficará clara no capítulo sobre distância intervalar, mas resumindo, pode-se ter uma adição e uma ordem bastante naturais e compatíveis em um conjunto mas uma função que dá uma noção perfeita de distância valorada neste conjunto pode não satisfazer a desigualdade triangular usual e satisfazer a de i-métrica (é exatamente este o caso da métrica intervalar a ser definida no capítulo 5). Além disso, toda a construção de uma topologia a partir de uma i-métrica pode ser feita sem a necessidade de uma operação de adição no espaço de valoração. Exemplo 4.3. Seja hA, ≤, ⊥i um reticulado com menor elemento, tal que V = hA, ≤, ∗ , ⊥i é uma VID. Defina a função ds : A × A −→ A por ( ds (a, b) = a ∨ b , se a 6= b . ⊥ , se a = b Esta função é uma i-métrica V -valorada. De fato, é imediato ver que ds satisfaz as condições 1. e 2. da definição 4.4. Suponha que ds (a, b) ∗ ε, onde ⊥ ∗ ε. Se a = b, o resultado segue imediatamente. Se a 6= b, 28 Capítulo 4. i-Distâncias então a ∨ b ε. Tome δ = ε e suponha ds (b, c) δ = ε. Se b = c, o resultado segue imediatamente. Se b 6= c, então b ∨ c ε. Assim, a ε, b ε e c ε, o que implica em a ∨ c ε. O próximo teorema mostra que a classe das i-métricas engloba a classe das métricas usuais. Teorema 4.1. Seja d uma métrica (usual) em M. A função di : M × M −→ [0, +∞), definida por di (a, b) = d(a, b), é uma i-métrica V -valorada, onde V = h[0, +∞), ≤, <, 0i. Demonstração. Seja hM, di um espaço métrico no sentido usual. Como já foi visto, a estrutura V = hR+ , ≤, <, 0i é uma VID. É imediato que a função di satisfaz as condições 1. e 2. de i-métricas. Para a condição 3., suponha di (a, b) < ε, com ε > 0. Tome δ = ε−d(a, b) > 0, então di (b, c) < δ ⇒ d(b, c) < ε−d(a, b) ⇒ d(a, b)+d(b, c) < ε, portanto, segue da desigualdade triangular usual de d que d(a, c) < ε, ou seja, di (a, c) < ε. Uma generalização de métrica muito parecida com a feita neste trabalho foi a de métrica generalizada, mencionada na seção 3.3. Existe métrica generalizada que é i-métrica, mas nem toda métrica generalizada é uma i-métrica e existe i-métrica que não é generalizada (a metrica KM que será definida no capítulo 5 é um exemplo). No restante desta seção serão verificadas as ligações entre estas duas generalizações de distância. Na próxima proposição, são apresentadas condições suficientes para que uma métrica generalizada seja uma i-métrica com respeto a uma VID bastante natural. Proposição 4.5. Seja V um monoide abeliano ordenado que satisfaz as seguintes condições i) se x < y, então existe e 6= 0 tal que x + e ≤ y; ii) se x < y, então x + a < y + a para todo a ∈ V ; iii) hV, ≤, 0i é d-dirigido e hV, ≤, <, 0i tem menor elemento separável. Sendo assim, se d : M × M −→ V é uma métrica generalizada em M, então d é uma i-métrica V -valorada em M, onde V = hV, ≤, <, 0i. Demonstração. As duas primeiras condições são iguais as de métricas generalizadas. Suponha d(a, b) < ε, com ε 6= 0. Assim, existe δ 6= 0 tal que d(a, b) + δ ≤ ε. Suponha d(b, c) < δ, então: d(a, b) + d(b, c) < d(a, b) + δ ≤ ε ⇒ d(a, b) + d(b, c) < ε ⇒ d(a, b) < ε. 29 Capítulo 4. i-Distâncias Observação 4.2. As condições i) e ii) da proposição acima podem ser trocadas pela seguinte: se x < y, então existe e 6= 0 tal que x + e < y. A verificação, neste caso, é análoga à anterior. Agora, será construida uma métrica generalizada que não é uma i-métrica V -valorada para V = hV, ≤, <, 0i. Considere o conjunto V = [0, 1] ∪ {2} com a ordem usual da reta ≤ e a operação binária ⊕ definida por: ( x⊕y = x + y , se 0 ≤ x + y ≤ 1 2 , caso contrário Proposição 4.6. O conjunto V acima munido da ordem ≤ e da operação ⊕ é um monoide abeliano e ordenado. Demonstração. A comutatividade da operação ⊕ segue imediatamente da comutatividade da adição usual em R. Para verificar que ⊕ é associativa, basta notar que: ( x + y + z , se 0 ≤ x + y + z ≤ 1 2 , caso contrário ( x + y + z , se 0 ≤ x + y + z ≤ 1 . 2 , caso contrário (x ⊕ y) ⊕ z = e x ⊕ (y ⊕ z) = O 0 é o elemento neutro da operação ⊕. Para verificar isso, basta notar que se 0 ≤ x ≤ 1, então x ⊕ 0 = x + 0 = x e se x ∈ / [0, 1], então por definição x ⊕ 0 = 2, mas neste caso, x = 2. É imediato que 0 ≤ x, para todo x ∈ V . Agora, suponha x1 ≤ y1 e x2 ≤ y2 . Se x1 + y1 ∈ [0, 1], então x1 ⊕ y1 = x1 + y1 e assim, x1 ⊕ y1 ≤ x2 ⊕ y2 , sendo x2 ⊕ y2 = x2 + y2 ou x2 ⊕ y2 = 2. Se x1 + y1 ∈ / [0, 1], então x2 + y2 ∈ / [0, 1], logo x1 ⊕ y1 = 2 e x2 ⊕ y2 = 2. Isso conclui a demonstração. Defina a seguinte função d : R × R −→ V por: ( d(x, y) = |x − y| , se |x − y| ≤ 1 2 , caso contrário Proposição 4.7. A função d definida acima é uma métrica generalizada. 30 Capítulo 4. i-Distâncias Demonstração. As duas primeiras condições são imediatas. Para a desigualdade triangular, note que se |x − y| ≤ 1, então d(x, y) = |x − y|. Como |x − y| ≤ |x − z| + |z − y|, temos d(x, y) ≤ d(x, z) ⊕ d(z, y), sendo d(x, z) ⊕ d(z, y) = |x − z| + |z − y| ou d(x, z) ⊕ d(z, y) = 2. Agora, suponha |x − y| ∈ / [0, 1], o que implica em d(x, y) = 2. Neste caso, temos que |x − z| + |z − y| ∈ / [0, 1], logo d(x, z) ⊕ d(z, y) = 2, sejam quais forem os valores de d(x, z) e d(z, y). Assim, concluimos que d(x, y) ≤ d(x, z) ⊕ d(z, y). Esta função d não é uma i-métrica V -valorada. De fato, note que d(1, 0) = |1 − 0| = 0 0 1 < 2. Dado δ > 0, com δ ∈ V , tome δ0 ≤ min{δ, 1}. Seja x = 1 + δ2 , assim |x − 1| = δ2 < 0 0 δ0 ≤ δ e |x − 1| ≤ 1, logo d(x, 1) = δ2 < δ. Porém, |x − 0| = 1 + δ2 > 1, logo d(x, 0) = 2, ou seja, não temos d(x, 0) < 2, o que conclui a verificação de que d não é uma i-métrica V -valorada. 4.2.1 Outras i-Distâncias Abaixo, são apresentadas as definições de i-quasi-métricas, i-pseudométricas e de iquasi-pseudométricas, as quais são formuladas a partir do conceito de i-métrica, como ocorre no caso usual, através de alterações nas condições sobre a função. Definição 4.5 (i-Quasi-métrica). Seja M um conjunto não-vazio e hA, ≤, R, ⊥i uma VID. Uma função d : M × M −→ A é chamada i-quasi-métrica V -valorada quando satisfaz: 1. d(a, b) = ⊥ e d(b, a) = ⊥ se, e somente se, a = b; 2. Se d(a, b)Rε, para algum ε ∈ A com ⊥Rε, então existe δ ∈ A com ⊥Rδ tal que d(b, c)Rδ ⇒ d(a, c)Rε. Neste caso, a tripla (M, d, V ) é chamada espaço i-quasi-métrico. Observação 4.3. Se d : M × M −→ A é uma i-quasi-métrica V -valorada, onde V = hA, ≤, R, ⊥i, então a função d : M × M −→ A definida por d(a, b) = d(b, a) também é um i-quasi-métrica, a qual é chamada de i-quasi-métrica conjugada de d. Definição 4.6 (i-Pseudométrica). Seja M um conjunto não-vazio e hA, ≤, R, ⊥i uma VID. Uma função d : M × M −→ A é chamada i-pseudométrica V -valorada quando satisfaz: 1. d(a, b) = ⊥ se, e somente se, a = b; 2. d(a, b) ≤ d(b, a) e d(b, a) ≤ d(a, b), para quaisquer a, b ∈ M; 3. Se d(a, b)Rε, para algum ε ∈ A com ⊥Rε, então existe δ ∈ A com ⊥Rδ tal que d(b, c)Rδ ⇒ d(a, c)Rε. 31 Capítulo 4. i-Distâncias Neste caso, a tripla (M, d, V ) é chamada espaço i-pseudométrico. Definição 4.7 (i-Quasi-pseudométrica). Seja M um conjunto não-vazio e hA, ≤, R, ⊥i uma VID. Uma função d : M × M −→ A é chamada i-quasi-pseudométrica V -valorada quando satisfaz: 1. d(a, a) = ⊥ para todo a ∈ M; 2. Se d(a, b)Rε, para algum ε ∈ A com ⊥Rε, então existe δ ∈ A com ⊥Rδ tal que d(b, c)Rδ ⇒ d(a, c)Rε. Neste caso, a tripla (M, d, V ) é chamada espaço i-quasi-pseudométrico. 4.3 i-Métricas e Topologia Nesta seção, é mostrado como as i-métricas geram uma topologia partindo-se do conceito de bolas abertas de maneira semelhante ao caso das métricas usuais. Definição 4.8. Seja (M, d, hA, ≤, R, ⊥i) um espaço i-métrico. Dados a ∈ M e ε ∈ A com ⊥Rε, a bola aberta de centro a e raio ε é o conjunto B(a, ε) = {b ∈ M; d(a, b)Rε}. Um conjunto X ⊆ M é dito ser aberto, se para cada a ∈ X existe uma bola aberta B(a, ε), tal que B(a, ε) ⊆ X. Teorema 4.2 (Topologia). Seja (M, d, hA, ≤, R, ⊥i) um espaço i-métrico. A classe ℑ(M) dos conjuntos abertos de M é uma topologia em M. / A ∈ ℑ(M), se {Aλ }λ∈L ⊆ ℑ(M), então Demonstração. Basta provar que: 0, [ Aλ ∈ λ∈L ℑ(M) e se A, B ∈ ℑ(M), então A ∩ B ∈ ℑ(M). As duas primeiras condições são imediatas. Sejam A, B ∈ ℑ(M). Tome a ∈ A ∩ B. Desde que A e B são abertos, existem bolas abertas B(a, ε1 ) e B(a, ε2 ) tais que B(a, ε1 ) ⊆ A e B(a, ε2 ) ⊆ B. Por definição, ⊥Rε1 e ⊥Rε2 , então, como A é um conjunto d-dirigido com menor elemento separável, existe uma cota inferior δ ∈ A para {ε1 , ε2 } com ⊥Rδ. Assim, considere a bola aberta B(a, δ). Tome b ∈ B(a, δ), ou seja, d(a, b)Rδ. Como δ ∈ L{ε1 ,ε2 } , então δ ≤ ε1 , logo d(a, b)Rε1 ⇒ b ∈ B(a, ε1 ) o que implica em B(a, δ) ⊆ B(a, ε1 ). Similarmente prova-se que B(a, δ) ⊆ B(a, ε2 ). Assim, B(a, δ) ⊆ A ∩ B, logo A ∩ B ∈ ℑ(M). Na demonstração de que a interseção de dois abertos é um aberto, ficou evidente a necessidade de que o espaço de valoração seja um conjunto d-dirigido com menor elemento separável e que a relação R seja uma relação semi-auxiliar. 32 Capítulo 4. i-Distâncias Teorema 4.3. Seja (M, d, hA, ≤, R, ⊥i) um espaço i-métrico. Toda bola aberta neste espaço é um conjunto aberto. Demonstração. Tome ε ∈ A, com ⊥Rε, a ∈ M e b ∈ B(a, ε). Assim, d(a, b)Rε. Pela terceira condição de i-métrica, existe δ ∈ A, com ⊥Rδ, tal que d(b, c)Rδ implica em d(a, c)Rε. Considere a bola aberta B(b, δ). Se c ∈ B(b, δ), então d(b, c)Rδ ⇒ d(a, c)Rε ⇔ c ∈ B(a, ε) ⇒ B(b, δ) ⊆ B(a, ε), o que significa que B(a, ε) é um conjunto aberto. Este teorema justifica a desigualdade triangular das i-métricas. Lembramos que no caso de métricas usuais a desigualdade triangular também é usada para provar que as bolas abertas são conjuntos abertos. Segue diretamente deste último teorema que a classe das bolas abertas é uma base para a topologia ℑ(M). Definição 4.9. Sejam (M, dA , hA, ≤A , RA , ⊥A i) e (N, dB , hB, ≤B , RB , ⊥B i) dois espaços imétricos. Uma função f : M −→ N é dita ser i-contínua em a ∈ M, se para todo ε ∈ B, com ⊥B Rε, existe δ ∈ A, com ⊥B Rδ tal que dA (a, b)Rδ ⇒ dB ( f (a), f (b))Rε, ou equivalentemente, se b ∈ B(a, δ), então f (b) ∈ B( f (a), ε). Quando f for i-contínua em cada a ∈ M diremos simplesmente que f é i-contínua. Teorema 4.4. Sejam (M, dA , hA, ≤A , RA , ⊥A i) e (N, dB , hB, ≤B , RB , ⊥B i) dois espaços imétricos. Uma função f : M −→ N é contínua com respeito as topologias ℑ(M) e ℑ(N) se, e somente se, f é i-contínua. Demonstração. Suponha que f é contínua em relação às topologias e considere a ∈ M qualquer. Pelo que já foi visto, para todo ε ∈ B, com ⊥B RB ε, a bola aberta B( f (a), ε) é um conjunto aberto de N, logo, pela definição topológica de continuidade, f −1 (B( f (a), ε) é um conjunto aberto em M. Como a ∈ f −1 (B( f (a), ε)), então existe δ ∈ A, com ⊥A RA δ tal que B(a, δ) ⊆ f −1 (B( f (a), ε)), logo f (B(a, δ)) ⊂ B( f (a), ε), ou seja, se b ∈ B(a, δ), então f (b) ∈ B( f (a), ε) o que significa que f é i-contínua em a. Agora, suponha que f é i-contínua em todo a ∈ M. Seja O ⊂ N um conjunto aberto. / então f −1 (O) é aberto em A. Considere o caso em que f −1 (O) 6= 0. / Tome Se f −1 (O) = 0, −1 a ∈ f (O), ou seja, a ∈ M e f (a) ∈ O. Como O é um conjunto aberto, existe ε ∈ B, com ⊥B RB ε, tal que B( f (a), ε) ⊆ O. Como f é i-contínua em a, existe δ ∈ A com ⊥A RA δ, tal que se b ∈ B(a, δ), então f (b) ∈ B( f (a), ε), ou seja, B(a, δ) ⊆ f −1 (B( f (a), ε)) ⇒ B(a, δ) ⊆ f −1 (O) e, portanto, f −1 (O) é um conjunto aberto. Com isso, concluí-se que f é topologicamente contínua. Observação 4.4. Considere o espaço i-métrico (M, d, hA, ≤, ≺, ⊥i). É possível que a relação semi-auxiliar ≺ seja tal que ⊥ ≺ ⊥. É o que ocorre, por exemplo, com a relação 33 Capítulo 4. i-Distâncias essencialmente abaixo. Neste caso, dado a ∈ M, ⊥ pode ser usado como raio de uma bola aberta de centro a. Com isso, segue que B(a, ⊥) = {a}. De fato, se b ∈ M − {a}, então d(a, b) 6= ⊥, logo b ∈ / B(a, ⊥). Dessa forma, todo subconjunto unitário será um aberto da topologia gerada por d, o que implica no fato desta topologia ser a topologia discreta, ou seja, ℑ(M) é o conjunto das partes de M. Devido a isso, é importante considerar relações semi-auxiliares ≺ tais que ⊥ 6≺ ⊥. É o caso, por exemplo, da relação essencialmente abaixo estrita definida na observação 4.1. Observação 4.5. A construção da topologia descrita nesta seção pode ser feita nos casos em que d é uma outra i-distância. Uma topologia gerada por uma i-métrica (ou i-quasimétrica, ou i-pseudo-métrica, ou i-quasi-pseudométrica) é chamada i-metrizável (ou iquasi-metrizável, ou i-pseudometrizável, ou i-quasi-pseudo-metrizável). No caso de uma topologia i-quasi-metrizável gerada por d, tem-se a noção de topologia conjugada, a qual é a topologia i-quasi-metrizável gerada por d. 4.3.1 Pré-ordem As VID’s são estruturas formadas por um conjunto e uma relação de ordem neste conjunto (além de outros componentes). Todas as construções feitas até aqui neste capítulo foram feitas baseando-se nisso. Um fato que deve ser observado é o seguinte: toda essa construção pode ser feita de maneira similar se considerarmos uma VID na qual é exigido apenas uma pré-ordem no conjunto. De fato, a anti-simetria (única proriedade que difere as ordens das pré-ordens) não foi usada em momento algum. Porém, algumas adaptações são necessárias. Por exemplo, a ausência da anti-simetria faz com que alguns elementos destacados em relação a conjuntos não sejam mais únicos. É o caso do supremo e do ínfimo de um conjunto que são substituídos pelos conjuntos dos supremóides e dos infimóides (seção 2.1). O menor elemento de um conjunto pré-ordenado também pode não ser único. Por exemplo, considere a pré-ordem ≤ f em [0, +∞) × [0, +∞) definida por (a, b) ≤F (c, d) ⇔ a ≤ c. Qualquer par do tipo (e, 0) é um menor elemento para este conjunto pré-ordenado. A definição de relação semi-auxiliar para pré-ordens é idêntica àquela para ordens, porém, diferente do que ocorre com ordens, se ≤ não é uma ordem (mas apenas uma pré-ordem), a relação menor estrito pode não ser uma relação semi-auxiliar para ≤, como mostra o exemplo a seguir. Exemplo 4.4. Considere o conjunto R2 com a pré-ordem (a, b) ≤F (c, d) ⇔ b ≤ d (aqui, ≤ é a ordem usual de R). Note que (0, 2) ≤F (1, 2), (1, 2) <F (0, 2) e (0, 2) ≤F (0, 2), mas não vale (0, 2) <F (0, 2). 34 Capítulo 4. i-Distâncias Observação 4.6. Se hA, ≤, ⊥A i é um conjunto pré-ordenado com menores elementos e é a relação essencialmente abaixo, então a relação essencialmente abaixo estrita, ∗ , é definida por a ∗ b se, e somente se, a b e b ∈ / ⊥A . A relação essencialmente abaixo estrita definida a partir de uma pré-ordem também é uma relação semi-auxiliar para esta pré-ordem. Além disso, toda relação semi-auxiliar para pré-ordens é transitiva. Como o menor elemento de um conjunto pré-ordenado pode não ser único, a definição abaixo se faz necessária. Definição 4.10. Seja hA, ≤i um conjunto pré-ordenado. Se este conjunto possui menor elemento (podendo ser mais de um), então será denotado por ⊥A o conjunto dos menores elementos de A. Seja hA, ≤, R, ⊥A i um conjunto pré-ordenado com menor elemento e R uma relação semi-auxiliar para ≤. Esta estrutura é chamada conjunto pré-ordenado com menores elementos separáveis, quando A é d-dirigido e dados a, b tais que ⊥Ra e ⊥Rb, para algum ⊥ ∈ ⊥A , então existe c ∈ L{a,b} tal que ⊥Rc. Definição 4.11 (Valoração de i-Distâncias (para pré-ordens)). Uma Valoração de i-Distâncias (VID) é uma estrutura hA, ≤, R, ⊥A i, tal que R é uma relação semi-auxiliar para ≤ e hA, ≤, ⊥A i é um conjunto pré-ordenado d-dirigido com menores elementos separáveis. As definições de i-distâncias considerando VID’s com pré-ordens no lugar de ordens podem ser feitas com pequenas modificações nas primeiras condições. Tais modificações são exibidas abaixo: 1. d(a, b) ∈ ⊥A se, e somente se, a = b; 2. d(a, b) ≤ d(b, a) e d(b, a) ≤ d(a, b), para quaisquer a, b ∈ M; A desigualdade triangular continua a mesma. A construção de uma topologia a partir de uma i-distância com VID baseada em pré-ordem é idêntica ao caso de ordens. Exemplos de i-distâncias com VID baseada em pré-ordem serão apresentados nas seções 4.5.1 e 5.1. 4.4 i-Métricas e a Propriedade de Hausdorff Uma das primeiras propriedades consideradas como de separação para espaços topológicos é a propriedade de Hausdorff, a qual foi apresentada na seção 2.4. A propriedade de Hausdorff tem como consequência vários fatos sobre a topologia em questão. Por exemplo, define-se em um espaço topológico (M, τ) o limite de uma 35 Capítulo 4. i-Distâncias sequência da seguinte maneira: o elemento L ∈ M é limite da sequência xn de pontos de M (notação: lim xn = L) quando para todo conjunto aberto O tal que L ∈ O, existe n−→+∞ n0 ∈ N tal que n ≥ n0 ⇒ xn ∈ O. É fácil ver que se o espaço é de Hausdorff, então uma sequência convergente possui um único limite. De fato, se lim xn = L1 e lim xn = n−→+∞ n−→+∞ L2 , com L1 6= L2 , então basta tomarmos os abertos disjuntos A e B contendo L1 e L2 respectivamente e teremos que existe n1 ∈ N tal que se n ≥ n1 , então xn ∈ A e xn ∈ B, logo xn1 ∈ A ∩ B, o que contradiz o fato de A e B serem disjuntos. Como foi mencionado na seção 2.1, todo espaço topológico cuja topologia é metrizável tem a propriedade de Hausdorff (veja [Munkres 1975]). A demonstração para este fato está bastante associada à desigualdade triangular. É natural perguntar se os espaços topológicos gerados por uma i-métrica são de Hausdorff? Também é natural imaginar que a resposta para essa pergunta seja não, uma vez que as i-métricas são muito gerais e a sua versão de desigualdade triangular é bem distinta da usual. Já que a propriedade de Hausdorff para espaços métricos está muito ligada à desigualdade triangular, vale também perguntar se uma i-métrica que também seja uma métrica generalizada, ou seja, que satisfaz uma desigualdade triangular muito semelhante à usual, gera, necessariamente, espaços de Hausdorff. Abaixo é apresentado um exemplo de i-métrica que também é uma métrica generalizada, cuja topologia subjacente não tem a propriedade de Hausdorff. Considere o conjunto Z+ = {0, 1, 2, ...} e a ordem usual ≤, além da operação usual de adição +. É um fato imediato que Z+ munido da operação + e da ordem ≤ é um monoide abeliano ordenado cujo menor elemento é o número 0. Definição 4.12. Defina a relação ≺ em Z+ por: a ≺ b se, e somente se, a < b ou a = b = 1. Proposição 4.8. ≺ é uma relação semi-auxiliar para ≤. Demonstração. Claramente, se a ≺ b, então a ≤ b. Suponha a ≤ b, b ≺ c e c ≤ d. Se a, b, c, d ∈ Z + − {1} então é imediato que a ≺ d, pois neste caso, a < d. Se a = 0, note que d 6= 0, logo a ≺ d. Agora, note que 1 ≺ x, para todo x ∈ Z+ − {0}, assim, se a = 1, então a ≺ d. Caso b = 1, c = 1 ou d = 1, então a = 0 ou a = 1 e assim, temos a ≺ d. Com essa proposição e com o fato de que ≤ é uma ordem total em Z+ , tem-se que hZ+ , ≤, , 0i é uma VID. Dessa forma, se M é um conjunto não vazio defina a função d : M × M −→ Z+ por: ( 0 , se x = y d(x, y) = 1 , se x 6= y É imediato que essa função satisfaz as duas primeiras condições de i-métrica que coincidem com as duas primeiras condições de métrica generalizada. 36 Capítulo 4. i-Distâncias Proposição 4.9. i)A função d é uma i-métrica com relação à VID hZ+ , ≤, , 0i; ii) A função d é uma métrica generalizada. Demonstração. i) Suponha d(x, y) ε, onde 0 ≺ ε, ou seja 0 < ε. Tome δ ∈ Z+ com 0 ≺ δ, ou seja, 0 < δ (este δ pode ser qualquer) e suponha d(y, z) δ. Por definição, d(x, z) = 0 ou d(x, z) = 1. Como 1 ≺ ε e 1 ≺ 1, segue que d(x, z) ≺ ε. ii) Tome x, y ∈ M. Se x = y, então d(x, y) = 0 ≤ d(x, z) + d(z, y), qualquer que seja o z ∈ M. Se x 6= y, então dado z ∈ M, segue que x 6= z ou y 6= z. Assim, d(x, y) = 1 e 1 ≤ d(x, z) + d(z, y). Proposição 4.10. Se ε ∈ Z+ é tal que 0 ≺ ε e x ∈ M, então B(x, ε) = {y ∈ M; d(x, y) ≺ ε} = M. Demonstração. Se ε 6= 0, entao 1 ≺ ε. Dessa forma, temos que se y ∈ M − {x}, então d(x, y) = 1 ≺ ε, logo y ∈ B(x, ε). Como x ∈ B(x, ε), então M ⊆ B(x, ε) ⇒ M = B(x, ε). Segue diretamente dessa proposição que um conjunto aberto não vazio na topologia gerada por d deve ser o próprio conjunto M. Dessa forma, a topologia gerada por d é a / a qual não tem a propriedade de Hausdorff, desde que M topologia indiscreta τ = {M, 0}, tenha pelo menos dois elementos. 4.5 Generalizações como Casos Particulares de i-Distâncias Nesta seção, será mostrado que alguns dos conceitos que generalizam distâncias vistos no capítulo de estado da arte são casos particulares de i-distâncias. 4.5.1 Espaço Métrico Estatístico Aqui será mostrado que o conceito de métrica estatística proposto em [Schweiser e Sklar 1960] é um caso particular de i-métrica. Seja D+ o conjunto das funções de distribuição de probabilidade não-negativas (3.1). Considere para cada F ∈ D+ o conjunto {x ∈ R; F(x) = 1}. Caso este conjunto seja nãovazio, denotaremos por Fi o seu ínfimo. Com isso, considere a seguinte relação no / conjunto D+ : F G ⇔ Fi ≤ Gi ou {x ∈ R; G(x) = 1} = 0. Proposição 4.11. é uma pré-ordem em D+ . 37 Capítulo 4. i-Distâncias Demonstração. A reflexividade de é imediata. Para provar a transitividade, considere / então F H por definição. Dessa forma, F G e G H. Se {x ∈ R; F(x) = 1} = 0, suponha que {x ∈ R; F(x) = 1} é não vazio. Isso implica em {x ∈ R; G(x) = 1} 6= 0/ o que / Segue que Fi ≤ Gi ≤ Hi , logo Fi ≤ Hi ⇒ F H. implica em {x ∈ R; F(x) = 1} 6= 0. Observação 4.7. é uma pré-ordem total em D+ . ( 1, se x ≥ 0 . É imediato 0, se x < 0 ver que I ∈ D+ e que esta função é a única em D+ com a propriedade I F, para todo F ∈ D+ . / Defina a relação ≺ em D+ por F ≺ G ⇔ Fi < Gi ou {x ∈ R; G(x) = 1} = 0. Conidere a função I : R −→ [0, 1] definida por I(x) = Proposição 4.12. ≺ é uma relação semi-auxiliar para . Demonstração. Se F ≺ G, então Fi < Gi o que implica em F G ou {x ∈ R; G(x) = 1} = 0/ o que também implica em F G. / então, por definição F ≺ P. Suponha F G ≺ H P. Se {x ∈ R; P(x) = 1} = 0, / Sendo assim, suponha {x ∈ R; G(x) = 1} 6= 0/ o que implica em {x ∈ R; F(x) = 1} 6= 0, / portanto, Fi ≤ Gi < Hi ≤ Pi ⇒ Fi < Pi ⇒ {x ∈ R; G(x) = 1} = 6 0/ e {x ∈ R; H(x) = 1} = 6 0, F ≺ P. Uma outra proriedade importante da relação ≺ é a seguinte: se F 6= I, então I ≺ F. De / então por definição I ≺ F. Se {x ∈ R; F(x) = 1} = / então fato, se {x ∈ R; F(x) = 1} = 0, 6 0, existe Fi . Suponha que Fi = 0. Neste caso, como F é não-decrescente, então F(x) = 1 para todo x > 0. Além disso, como F é contínua pela direita deve-se ter F(Fi ) = 1, ou seja, F(0) = 1 e, portanto, F = I o que contradiz a hipótese. Dessa forma, deve-se ter Fi > 0 o que significa que Fi > Ii , já que Ii = 0, logo, I ≺ F. Note que I 6≺ I. Proposição 4.13. A estrutura hD+ , , ≺, Ii é uma VID baseada em pré-ordem. Demonstração. Como a pré-ordem é total, então hD+ , , Ii é um conjunto d-dirigido com menor elemento (apesar de não ser anti-simétrica, o menor elemento é único). Para provar que este menor elemento é separável (em relação a ≺), suponha F, G ∈ D+ tais que I ≺ F e I ≺ G. Como a pré-ordem é total, tem-se F G ou G F. Suponha sem perda de generalidade que F G, assim, F G, F F e I ≺ F. Como já foi mencionado, uma métrica estatística em um conjunto não-vazio S é uma função d : S × S −→ D+ que satisfaz: 38 Capítulo 4. i-Distâncias 1. d{u, v}(x) = 1, para todo x ≥ 0 se, e somente se, u = v (ou seja, d{u, v} = I ⇔ u = v); 2. d{u, v}(x) = d{v, u}(x), para todo x ∈ R; 3. Se d{u, v}(x) = 1 e d{v, w}(y) = 1, então d{u, w}(x + y) = 1. Foi usada a notação d{u, v} para representar d(u, v). Abaixo, é apresentado o teorema que mostra que toda métrica estatística é uma imétrica baseada em pré-ordem, o que constitui um primeiro exemplo deste tipo de imétrica. Teorema 4.5. Toda métrica estatística d : S × S −→ D+ é uma i-métrica relativa à VID hD+ , , ≺, Ii. Demonstração. A primeira condição de i-métrica é uma consequência imediata da primeira condição de métrica estatística. A condição 2. diz que d{u, v} = d{v, u}, logo, da reflexividade de , segue que d{u, v} d{v, u} e d{v, u} d{u, v}. Agora, para provar que vale a terceira condição de i-métrica suponha d{u, v} ≺ E, onde I ≺ E. Se {x ∈ R; E(x) = 1} = 0/ então F ≺ E para todo F ∈ D+ e o resultado segue imediatamente. Suponha {x ∈ R; E(x) = 1} = 6 0/ o que implica em {x ∈ R; d{u, v}(x) = 1} = 6 0/ e d{u, v}i < Ei . Se d{u, v}i = 0, então d{u, v} = I e o resultado segue imediatamente. Suponha d{u, v}i > 0 e defina ∆ : R −→ [0, 1] por: ( ∆(x) = d{u, v}(x), se x < Ei − d{u, v}i . 1, se x ≥ Ei − d{u, v}i Esta função ∆ está em D+ e satisfaz ∆i = min{Ei − d{u, v}i , d{u, v}i }. Segue que ∆i > 0, logo ∆ 6= I ⇒ I ≺ ∆. Seja w ∈ S tal que d{v, w} ≺ ∆. Assim d{v, w}i < ∆i . Como ∆i ≤ Ei − d{u, v}i , segue que d{v, w}i < ∆i ≤ Ei − d{u, v}i ⇒ d{v, w}i < Ei − d{u, v}i ⇒ d{u, v}i + d{v, w}i < Ei . Como d{u, v} e d{v, w} são contínuas pela direita e não-decrescentes, tem-se d{u, v}(d{u, v}i ) = 1 e d{v, w}(d{v, w}i ) = 1, logo, da condição 3. de métrica estatística, segue que d{u, w}(d{u, v}i + d{v, w}i ) = 1, portanto {x ∈ R; d{u, w}(x) = 1} = 6 0/ e d{u, w}i ≤ d{u, v}i + d{v, w}i ⇒ d{u, w}i < Ei , portanto, d{u, w} ≺ E o que encerra a demonstração. 4.5.2 Métrica Difusa Aqui, será mostrado que os espaços métricos difusos no sentido de [Kaleva e Seikkala 1984], no caso em que as funções L e R são respectivamente min e max (L(x, y) = 39 Capítulo 4. i-Distâncias min{x, y} e R(x, y) = max{x, y}), são espaços i-métricos. Nesta seção, serão usados os conceitos e notações vistos na seção 3.2. Definição 4.13. Sejam A, B ∈ G. A relação ≺≺ é definida por: A ≺≺ B se, e somente se, existem r1 , r2 > 0 tais que bα − aα > r1 e bα − aα > r2 , para todo α ∈ (0, 1]. Exemplo 4.5. Se a, b ∈ R+ , com a < b, então ã ≺≺ b̃. Exemplo 4.6. Um número triangular difuso é um número difuso com uma “forma de triângulo". Sua função de pertinência A é definida por: A(x) = 0, se x ≤ a1 , A(x) = l(x), se a1 ≤ x ≤ a2 , onde l é função cujo gráfico é o segmento de reta conectando os pontos (a1 , 0) e (a2 , 1), A(x) = r(x), se a2 ≤ x ≤ a3 , onde r é função cujo gráfico é o segmento de reta conectando os pontos (a2 , 1) e (a3 , 0) e A(x) = 0, se x ≥ a3 . Os números a1 , a2 e a3 determinam completamente A, por isso a notação A = (a1 , a2 , a3 ) é usada. Se A = (a1 , a2 , a3 ) e B = (b1 , b2 , b3 ) são dois números triangulares difusos, então A ≺≺ B se, e somente se, a1 < b1 , a2 < b2 e a3 < b3 . Teorema 4.6. Para quaisquer A, B,C, D ∈ G, tem-se: 1. Se A ≺≺ B, então A B; 2. Se A B ≺≺ C D, então A ≺≺ D; 3. Se A C e B ≺≺ D, então A ⊕ B ≺≺ C ⊕ D. Demonstração. 1. É imediata. 2. Existem r1 , r2 > 0, tais que cα − bα > r1 e cα − bα > r2 , para todo α ∈ (0, 1]. Como bα ≥ aα , bα ≥ aα , dα ≥ cα e dα ≥ cα , para todo α ∈ (0, 1], segue que dα − aα > r1 e dα − aα > r2 , para todo α ∈ (0, 1], ou seja, A ⊕ B ≺≺ C ⊕ D 3. Existem r1 , r2 > 0 tais que dα − bα > r1 e dα − bα > r2 . Como cα − aα ≥ 0 e cα − aα ≥ 0, então dα − bα + cα − aα > r1 e dα − bα + cα − aα > r2 ⇒ A ⊕ B ≺≺ C ⊕ D. Corolário 4.1. Considere A, B,C ∈ G. 1. Se A B ≺≺ C, então A ≺≺ C; 2. Se A ≺≺ B C, então A ≺≺ C. Demonstração. É imediata. Segue dos últimos resultados que a relação ≺≺ é uma relação semi-auxiliar para . Os resultados a seguir são muito importantes para a construção da VID e também vão assegurar que a classe dos conjuntos abertos é uma topologia de Hausdorff. 40 Capítulo 4. i-Distâncias Teorema 4.7. Se A, B ∈ G, com 0̃ ≺≺ A e 0̃ ≺≺ B então existe C ∈ G, com 0̃ ≺≺ C, tal que C A e C B. Demonstração. Como 0̃ ≺≺ A e 0̃ ≺≺ B, então existe r1 , r2 > 0 tal que aα ≥ aα > r1 e bα ≥ bα > r2 . Assim, tome C ∈ G definido por C = r̃, onde r = min{r1 , r2 } > 0. Dessa forma, 0̃ ≺≺ C, C A e C B. Teorema 4.8. Se A, B ∈ G com A ≺≺ B, então existe C ∈ G, com 0̃ ≺≺ C tal que A⊕C ≺≺ B. Demonstração. Existem r1 , r2 > ( 0 tais que bα − aα > r1 e bα − aα > r2 . É suficiente 1, se t = r/2 tomar C ∈ G definido por C(t) = , onde r = min{r1 , r2 }. 0, se t 6= r/2 Teorema 4.9. Se A ∈ G, com 0̃ ≺≺ A, então existem B,C ∈ G, com 0̃ ≺≺ B e 0̃ ≺≺ C tais que B ⊕C ≺≺ A. Demonstração. Como 0̃ ≺≺ ( A, existe r > 0 tal que aα ≥ aα > r. Basta tomar B,C ∈ G 1, se t ∈ [r/8, r/4] definido por B(t) = C(t) = . 0, se t ∈ / [r/8, r/4] Exemplo 4.7 (Kaleva e Seikkala 1984). Seja E o conjunto de todos os números difusos. A função d : E × E −→ G definida por: ( d(x, y) = |x − y| , se x 6= y 0̃ , se x = y (4.1) é uma métrica difusa no sentido da definição 3.5 usando-se as aplicações L ≡ 0 e R = max Existem várias aplicações L e R satisfazendo as condições da definição 3.5 como, por exemplo, as funções L = min e R = max. Para estas funções L e R vale o seguinte: Teorema 4.10. Em um espaço métrico difuso (X, d, min, max), a condição iii) da definição 3.5 é equivalente a: d(x, z) d(x, y) ⊕ d(y, z). Demonstração. Veja [kaleva e Seikkala 1984] . Neste caso, uma função d : M × M −→ G é uma métrica difusa se, e somente se, satisfaz: i) d(x, y) = 0̃ se, e somente se, x = y; 41 Capítulo 4. i-Distâncias ii) d(x, y) = d(y, x), para todo x, y ∈ M; iii’) d(x, z) d(x, y) ⊕ d(y, z). Ou seja, neste caso, uma métrica difusa é uma métrica generalizada. A condição iii’) é uma forma muito mais natural de desigualdade triangular do que a condição iii) da definição 3.5. A partir daqui, serão considerados apenas espaços métricos difusos nos quais L = min e R = max. Tais métricas serão chamadas de gf-métricas e os espaços de espaços gf-métricos. Exemplo 4.8. Se d : M × M −→ R é um espaço métrico usual, então d f : M × M −→ G ˜ y) é uma gf-métrica. dada por d f (x, y) = d(x, Exemplo 4.9. Sejam d1 , d2 , d3 , d4 : M × M −→ R métricas no sentido usual tais que d1 ≤ d2 ≤ d3 ≤ d4 . A função d f : M × M −→ G definida por: 1/2, se d1 (x, y) ≤ t < d2 (x, y) 1, se d (x, y) ≤ t ≤ d (x, y) 2 3 d f (x, y)(t) = 1/2, se d3 (x, y) < t ≤ d4 (x, y) 0, nos outro casos é uma gf-métrica. Teorema 4.11. Seja d : M × M −→ G uma gf-métrica. Se d(a, b) ≺≺ R, onde 0̃ ≺≺ R, então existe 0̃ ≺≺ D tal que d(b, c) ≺≺ D ⇒ d(a, c) ≺≺ R. Demonstração. Como d(a, b) ≺≺ R, segue do teorema 4.8 que esxiste 0̃ ≺≺ D tal que d(a, b) ⊕ D ≺≺ R. Suponha que d(b, c) ≺≺ D. Assim, segue da proposição 4.6 que d(a, b) ⊕ d(b, c) ≺≺ d(a, b) ⊕ D ≺≺ R ⇒ d(a, b) ⊕ d(b, c) ≺≺ R. Da desigualdade triangular, segue d(a, c) d(a, b) ⊕ d(b, c) ≺≺ R ⇒ d(a, c) ≺≺ R. Este teorema garante que toda gf-métrica é uma i-métrica relativa à VID hG, , ≺≺ , 0̃i. Em [kaleva e Seikkala 1984], os autores propuseram uma topologia a partir de um espaço métrico difuso (M, d, L, R), baseada na seguinte definição de bolas abertas: B(a, ε, α) = {y ∈ M; ρα (a, y) < ε}, (4.2) onde ρα é o extremo superior do α-corte de d(a, x). Note que esta definição de bola aberta depende apenas do extremo superior dos αcortes de d(x, y). Dessa forma, essa topologia não incorpora toda a idéia de vaguidade 42 Capítulo 4. i-Distâncias pretendida pela noção de número difuso. Como as gf-métricas são i-métricas, elas geram uma topologia baseada na definição de bolas abertas usando i-métricas, devido ao uso da ordem , levam em consideração os dois extremos dos α-cortes de d(x, y). A seguir, a teoria topológica associada desenvolvida a partir das i-métricas será usada para demonstrar um teorema de ponto fixo em espaços métricos difusos muito semelhante ao teorema clássico de Banach (veja [Lima 1977]). Em espaços métricos usuais, a relação menor estrito < é usada para definir bolas abertas. Estes espaços possuem a seguinte característica:“0 < d(x, y), se x 6= y”. Este fato (junto com a desigualdade triangular e as especificidades dos números reais) garante que as topologias geradas por métricas usuais são de Hausdorff. Isso motiva a seguinte definição: Definição 4.14 (Espaço gf-métrico de Hausdorff). Um espaço gf-métrico no qual 0̃ ≺≺ d(x, y), se x 6= y é chamado espaço gf-métrico de Hausdorff. Teorema 4.12. Seja (M, d) um espaço gf-métrico. A topologia ℑ(M) gerada por d, enquanto i-métrica, em M é de Hausdorff. Demonstração. Tome a, b ∈ M, com a 6= b. Assim, tem-se 0̃ ≺≺ d(a, b). Do teorema 4.9 segue que existem B,C ∈ G, com 0̃ ≺≺ B e 0̃ ≺≺ C tais que B ⊕C ≺≺ d(a, b). Defina as bolas abertas B(a, B) e B(b,C). Suponha que existe c ∈ B(a, B) ∩ B(b,C), o que implica em d(a, c) ≺≺ B e d(c, b) ≺≺ C, então d(a, b) d(a, c)⊕d(b, c) ≺≺ B⊕C ≺≺ d(a, b) ⇒ d(a, b) ≺≺ d(a, b), logo d(a, b) ≺ d(a, b), o que é uma contradição. Daqui por diante, serão considerados apenas espaços gf-métricos de Hausdorff. Definição 4.15. Seja xn uma sequência em um espaço gf-métrico de Hausdorff (M, d). Diz-se que xn gf-converge para L ∈ M se para todo 0̃ ≺≺ R, existe n0 ∈ N, tal que se n ≥ n0 , então d(xn , L) ≺≺ R. Neste caso, xn é dita ser gf-convergente e L é o gf-limite de xn e a notação xn −→ L é usada. Uma sequência xn é dita ser gf-Cauchy, se para todo 0̃ ≺≺ R, existe n0 ∈ N, tal que se m, n ≥ n0 , então d(xm , xn ) ≺≺ R. Observação 4.8. O teorema 4.12 garante a unicidade do limite de uma sequência convergente. Definição 4.16. Um espaço gf-métrico de Hausdorff é dito ser completo quando toda sequência gf-Cauchy é convergente. Exemplo 4.10. Em um espaço gf-métrico de Hausdorff, toda sequência convergente é gf-Cauchy. 43 Capítulo 4. i-Distâncias De fato, se xn −→ L, então para todo 0̃ ≺≺ R, existe n1 ∈ N tal que n > n1 ⇒ d(xn , L) ≺≺ R1 , e existe n2 ∈ N, tal que m > n2 ⇒ d(xm , L) ≺≺ R2 , onde 0̃ ≺≺ R1 , 0̃ ≺≺ R2 e R1 ⊕ R2 ≺≺ R. Defina n0 = max{n1 , n2 }. Assim, se n > n0 , então d(xn , xm ) d(xn , L) ⊕ d(L, xm ) ≺≺ R1 ⊕ R2 R ⇒ d(xn , xm ) ≺≺ R. Uma função f : M −→ N entre dois espaços gf-métricos de Hausdorff (M, d1 ) e (N, d2 ) será chamada gf-contínua em a ∈ M quando for contínua em a com respeito as topologias geradas por d1 e d2 enquanto i-métricas e será chamada gf-contínua quando for gf-contínua em todo a ∈ M. Teorema 4.13. Sejam (M, d1 ) e (N, d2 ) dois espaços gf-métricos de Hausdorff e f : M −→ N uma função. Se f é gf-contínua em a ∈ M e xn é uma sequência em M tal que xn −→ a, então f (xn ) −→ f (a). Demonstração. Dado 0̃ ≺≺ R, existe 0̃ ≺≺ D tal que d(a, x) ≺≺ D ⇒ d( f (a), f (x)) ≺≺ R. Como xn −→ a, existe n0 ∈ N tal que n > n0 ⇒ d(xn , a) ≺≺ D, logo d( f (xn ), f (a)) ≺≺ R, ou seja, f (xn ) −→ f (a). Definição 4.17. Seja (M, d) um espaço gf-métrico de Hausdorff. Uma função T : M −→ M é dita ser uma gf-contração se existir K ∈ G, com K ≺≺ 1̃, tal que d(T (x), T (y)) K d(x, y). Observação 4.9. Note que se K ≺≺ 1̃, então existe 0 < r < 1 tal que kα < r, para todo α ∈ (0, 1]. Proposição 4.14. Seja (M, d) um espaço gf-métrico de Hausdorff e T : M −→ M uma função. Se T é uma gf-contração, então T é gf-contínua. Demonstração. Seja a ∈ M. Como T é uma gf-contração, tem-se d(T (x), T (y)) d(x, y), para todo x, y ∈ M. Assim, dado 0̃ ≺≺ R, tome D = R e suponha que d(a, x) ≺≺ D = R. Assim, d(T (a), T (x)) d(a, x) ≺≺ D = R ⇒ d(T (a), T (x)) ≺≺ R, portanto, T é gfcontínua em qualquer a ∈ M e assim, T é gf-contínua. Abaixo, um teorema de ponto fixo bastante similar ao teorema clássico de Banach é provado. A demonstração deste teorema segue passos muito similares a demonstração do teorema clássico, o que é possível graças a maneira como é obtida uma topologia partindo-se de uma gf-métrica abordada como uma i-métrica. Teorema 4.14 (Teorema do Ponto Fixo). Seja (M, d) um espaço gf-métrico de Hausdorff completo e T : M −→ M uma gf-contração. Sendo assim, T tem um único ponto fixo. 44 Capítulo 4. i-Distâncias Demonstração. Tome x0 ∈ M e defina xn por x1 = T (x0 ) e xn+1 = T (xn ). Assim, d(x2 , x1 ) = d(T (x1 ), T (x0 )) K d(x1 , x0 ), d(x3 , x2 ) = d(T (x2 ), T (x1 )) K d(x2 , x1 ) K (K d(x1 , x0 )) = K 2 d(x1 , x0 ), etc.. Em geral, tem-se d(xn+1 , xn ) K n d(x0 , x1 ). (4.3) Dados m, n ∈ N, com m > n, usando a desigualdade triangular e (4.3) obtem-se: d(xm , xn ) d(xn , xn+1 ) ⊕ d(xn+1 , xn+2 ) ⊕ . . . ⊕ d(xm−1 , xm ) (K n d(x1 , x0 )) ⊕ (K n+1 d(x1 , x0 )) ⊕ . . . ⊕ (K m−1 d(x1 , x0 )) = K n ⊕ . . . ⊕ K m−1 d(x1 , x0 ), então d(xm , xn ) K n ⊕ . . . ⊕ K m−1 d(x1 , x0 ) (4.4) Considere r > 0 como na observação 4.9. n Se Kα = [kα , kα ], para todo α ∈ (0, 1], então Kαn = [kα n , kα ], logo: " m−1 Kn ⊕ . . . ⊕ K m−1 α ∑ kαi, ∑ kα = i=n " m−1 ≤km # m−1 i=n m−1 ∑ ri , ∑ ri i=n i # . (4.5) n=1 Desde que a série ∑ rn é convergente (séries geométricas com razão menor que 1 são m−1 i i convergentes), dado ε > 0, existe n0 ∈ N tal que m > n > n0 ⇒ ∑m−1 i=n kα ≤ ∑i=n kα ≤ i ∑m−1 i=n r < ε, para todo α ∈ (0, 1], logo " m−1 m−1 ∑ kαi, ∑ kα i=n # i ≤km [ε, ε], para todo α ∈ (0, 1]. (4.6) i=n Como supp d(x1 , x0 ) é limitado, existe l > 0 tal que 0 < λα (x1 , x0 ) ≤ ρα (x1 , x0 ) < l, para todo α ∈ (0, 1], onde (d(x1 , x0 ))α = [λα (x1 , x0 ), ρα (x1 , x0 )]. Dado 0̃ ≺≺ R, existe d > 0 tal que d < rα ≤ rα , para todo α ∈ (0, 1]. Tome 0 < ε < 2ld . 45 Capítulo 4. i-Distâncias Assim, existe n0 ∈ N tal que: m > n > n0 K n ⊕ K n+1 ⊕ . . . ⊕ K m−1 ⇒ α ≤km [ε, ε] K n ⊕ K n+1 ⊕ . . . ⊕ K m−1 ⇒ · α [λα (x1 , x0 ), ρα (x1 , x0 )] ≤km [ε, ε] · [λα (x1 , x0 ), ρα (x1 , x0 )] (4.7) Assim, tem-se K n ⊕ . . . ⊕ K m−1 d(x1 , x0 ) α ≤km [ελα (x1 , x0 ), ερα (x1 , x0 )], para todo α ∈ (0, 1], ou seja, K n ⊕ . . . ⊕ K m−1 d(x1 , x0 ) [ε, ε] d(x1 , x0 ). (4.8) Note que λα (x1 , x0 ) < l ⇒ ελα (x1 , x0 ) < εl < 2ld l = d2 , assim, de rα > d segue que rα − d2 > d d d 2 ⇒ rα − ελα (x1 , x0 ) > 2 . Analogamente, mostra-se que rα − ερα (x1 , x0 ) > 2 . Assim, pode-se concluir que [ελα (x1 , x0 ), ερα (x1 , x0 )] ≺≺ R, logo, para todo m > n > n0 , tem-se d(xm , xn ) K n ⊕ K n+1 ⊕ . . . ⊕ K m−1 d(x1 , x0 ) [ε, ε] d(x1 , x0 ) ≺≺ R. Dessa forma, xn é uma sequência gf-Cauchy. Como o espaço gf-métrico de Hausdorff (M, d) é completo, então xn é convergente. Seja a ∈ M tal que xn −→ a. Como T é gfcontínua, segue que T (xn ) −→ T (a), mas, T (xn ) = xn+1 , então T (xn ) −→ a. Assim, como o limite de xn é único, tem-se T (a) = a, ou seja, a é um ponto fixo de T . Agora, suponha que x, y ∈ M e T (x) = x, T (y) = y, com x 6= y. Segue que: d(x, y) = d(T (x), T (y)) K d(x, y) ≺ d(x, y) ⇒ d(x, y) ≺ d(x, y), o que é uma contradição. Portanto, o ponto fixo deve ser único. 4.5.3 Espaços de Continuidade Nesta seção será mostrado que as duas versões de espaços de continuidade são casos particulares de i-quasi-pseudométricas. Seja (X, d,V, P) um espaço de continuidade no 46 Capítulo 4. i-Distâncias sentido de [Kopperman 1988] (ver seção 3.4). Da definição de semi-grupo de valoração, segue que hV, ≤, 0i é um semireticulado inferior. Defina a relação por a b ⇔ a + r ≤ b para algum r ∈ P. Lema 4.1. Se a ≤ b e c ≤ d, então a + b ≤ c + d. Demonstração. Da definição da ordem ≤, segue que existem x, y ∈ V tais que a + x = b e c + y = d, logo (a + x) + (c + y) = b + d ⇒ (a + c) + (x + y) = b + d ⇒ a + c ≤ b + d. Proposição 4.15. é uma relação semi-auxiliar para ≤. Demonstração. Suponha a b. Assim, existe r ∈ P tal que a + r ≤ b. Existe y ∈ V tal que (a + r) + y = b e pela associatividade de +, temos a + (y + r) = b ⇒ a ≤ b. Agora, suponha a ≤ b c ≤ d. Existe r ∈ P tal que b + r ≤ c. Basta mostrar que a + r ≤ d. De fato, a ≤ b e r ≤ r, logo, do lema anterior, tem-se a + r ≤ b + r e, como b + r ≤ c e c ≤ d, segue que a + r ≤ d. Pela definição de conjunto de positivos, tem-se que se a, b ∈ P, então a ∧ b ∈ P. Além disso, se r ∈ P e r ≤ s, então s ∈ P. Dessa forma, segue o seguinte resultado. Proposição 4.16. Se a b, então b ∈ P. Demonstração. Existe r ∈ P tal que a + r ≤ b, logo, existe x ∈ V tal que (a + r) + x = b ⇒ r + (a + x) = b ⇒ r ≤ b ⇒ b ∈ P. Note que 0 r, para todo r ∈ P (de fato, 0 + r ≤ r). Desta proposição, segue que se a, b ∈ V são tais que 0 a e 0 b, então a, b ∈ P, logo a ∧ b ∈ P ⇒ 0 a ∧ b, o que significa que a estrutura hV, ≤, , 0i possui menor elemento separável. Portanto, esta estrutura é uma VID. Teorema 4.15. Se (X, d,V, P) é um espaço de continuidade, então d : X × X −→ V é uma i-quasi-pseudométrica relativa à VID hV, ≤, , 0i. Demonstração. A primeira condição é idêntica para i-quasi-pseudométricas e funções de continuidade. Para a segunda condição, suponha d(a, b) ε, para algum ε ∈ V tal que r 0 ε. Dessa forma, existe r ∈ P tal que d(a, b) + r ≤ ε. Tome δ = . Assim, δ ∈ P ⇒ 2 r r r r 0 δ. Suponha d(b, c) δ = ⇒ d(b, c) ≤ . Como d(a, b) + + = d(a, b) + r ≤ ε, 2 2 2 2 r então d(a, b) + ε. Portanto: 2 d(a, c) ≤ d(a, b) + d(b, c) r ≤ d(a, b) + ε 2 ⇒ d(b, c) ε. 47 Capítulo 4. i-Distâncias Em [Kopperman 1988], o autor propôs uma topologia gerada a partir de um espaço de continuidade (X, d,V, P) baseada em bolas fechadas B(a, r) = {x ∈ X; d(a, x ≤ r}, com r ∈ P. A topologia gerada por d enquanto i-distância é baseada em bolas abertas do tipo B(a, r) = {x ∈ X; d(a, x) r}, onde 0 r (ou seja, r ∈ P). Sendo assim, para que a topologia proposta pelo autor gerada por d seja a mesma gerada por d enquanto i-distância, a relação semi-auxiliar deve ser tal que a b sempre que a ≤ b e b ∈ P, logo, se r ∈ P, tem-se r r. No exemplo abaixo, será mostrado que nessas condições uma função de continuidade d pode não ser uma i-quasi-pseudométrica. Exemplo 4.11. Seja d : R × R −→ [0, +∞] a métrica euclidiana em R. A estrutura ([0, +∞], ≤, +, 0), onde ≤ e + são usuais, é um semigrupo de valoração e o conjunto P = (0, +∞] é um conjunto de positivos. Considere uma relação semi-auxiliar tal que se a ∈ P, então a a e 0 a, para todo a ∈ P. A estrutura (R, d, [0, +∞], (0, +∞]) é um espaço de continuidade, mas a função d não é uma i-quasi-pseudométrica. De fato, δ δ d(1, 2) = 1 1 e 0 1. Dado δ tal que 0 δ, temos δ > 0. Assim, d(2, 2 + ) = δ, 2 2 δ δ mas d(1, 2 + ) = 1 + 6 1, logo, d não é uma i-quasi-pseudométrica relativa à VID 2 2 h[0, +∞], ≤, , 0i. Para a segunda versão ([Flagg e Kopperman 1997]), considere o co-quantale de valoração V = (V, ≤, +). No próprio artigo foi mostrado que a relação “bem acima" satisfaz: i) a b ⇒ a ≤ b; ii) Se a ≤ b c ≤ d, então a d. Ou seja, é uma relação semi-auxiliar para ≤. A definição de reticulado distributivo de valoração assegura que se 0 a e 0 b, então 0 a ∧ b. Portanto, hV, ≤, , 0i é uma VID. Teorema 4.16. Se d : X × X −→ V é uma V -função de continuidade, então d é uma i-quasi-pseudométrica relativa à VID hV, ≤, , 0i. Demonstração. A primeira condição é a mesma para os dois conceitos. Suponha d(a, b) ε para algum ε ∈ V com 0 ε. Pelo teorema 2.10 de [Flagg e Kopperman 1997], existe δ ∈ V com 0 δ tal que d(a, b) + δ ε. Suponha que d(b, c) δ ⇒ d(b, c) ≤ δ. Segue 48 Capítulo 4. i-Distâncias que: d(a, b) ≤ d(a, b) + d(b, c) ≤ d(a, b) + δ ε ⇒ d(a, c). ε Os autores também propuseram uma topologia gerada por um V -espaço de continuidade a qual é a mesma gerada por d enquanto i-quasi-pseudométrica. Com isso, tem-se que i-quasi-pseudométricas podem gerar as topologias de Scott e Lawson. 4.6 Toda Topologia é i-Quasi-Pseudometrizável O objetivo desta seção é mostrar que toda topologia é i-quasi-pseudometrizável. As idéias usadas para obtenção deste resultado são basicamente as usadas em [Kopperman 1988], com a diferença de que a topologia deste artigo era baseada em uma noção de bola fechada e a topologia gerada por uma i-distância é gerada por bolas abertas. Essa diferença traz a necessidade de algumas adaptações à contrução feito no artigo mencionado, por isso, aqui é apresentada toda a construção até que o resultado seja obtido. Seja τ uma topologia em um conjunto não-vazio X e considere o conjunto [0, +∞] dos reais não-negativos extendidos. Aqui, a ordem e a soma usuais dos reais são extendidas pondo-se a ≤ +∞ e a + ∞ = +∞, para todo a ∈ [0, +∞]. Considere, também, o conjunto (0, +∞]. Denote por V o conjunto de todas as funções do tipo f : τ −→ [0, +∞] e por V ∗ o subconjunto de V formado pelas funções tais que f (O) 6= 0, para todo O ∈ τ. No conjunto V a relação ≤ p definida por f ≤ p g ⇔ f (O) ≤ g(O), ∀ O ∈ τ é uma ordem parcial, de modo que a função nula, a qual será denotada por 0v , é o menor elemento de hV, ≤ p i. Em V defina a operação +v como sendo a soma usual de funções. Teorema 4.17. hV, ≤v i é um reticulado. Demonstração. Sejam f , g ∈ V . Claramente tem-se que as funções f ∧ g e f ∨ g definidas por f ∧g(O) = min( f (O), g(O)) e f ∨g(O) = max( f (O), g(O)) são o ínfimo e o supremo, respecivamente, de { f , g}. A seguir alguns resultados básicos sobre hV, ≤v i que serão usados adiante. Lema 4.2. Sejam f , g, h,t ∈ V . Se f ≤v h e g ≤v t, então f +v g ≤v h +v t. 49 Capítulo 4. i-Distâncias Demonstração. Dado O ∈ τ, tem-se f (O) ≤ h(O) e g(O) ≤ t(O) logo f (O) + g(O) ≤ h(O) + t(O), o que implica em f +v g ≤v h +v t. Proposição 4.17. Sejam, f , g1 , ..., gn , h1 , ..., hn ∈ V . Se f +v g1 ≤v h1 ,..., f +v gn ≤v hn , então f + ∧ni=1 gi ≤v ∧ni=1 hi . Demonstração. Suponha que existe O ∈ τ tal que f (O)+v ∧ni=1 gi (O) 6≤ ∧ni=1 hi (O). Como a ordem ≤ em [0, +∞] é total, tem-se que ∧ni=1 gi (O) = gi0 (O) para algum i0 ∈ {1, 2, ..., n} e ∧ni=1 hi (O) = hi1 (O) para algum i1 ∈ {1, 2, ..., n}. Portanto, f (O) + gi0 (O) 6≤ hi1 (O). De gi0 (O) ≤ gi1 (O), segue que f (O) + gi0 (O) ≤ f (O) + gi1 (O), portanto, da transitividade de ≤, segue que f (O)+gi1 (O) 6≤ hi1 (O), logo, f +v gi1 6≤v hi1 o que contradiz a hipótese. Considere o seguinte subconjunto de V: P = { f ∈ V ∗ ; f (O) = +∞, exceto para um número finito de elementos de τ}. Com base neste subconjunto de V , é definida a relação binária abaixo a qual é, como será visto, uma relação semi-auxiliar para ≤v . Definição 4.18. Define-se a relação binária ≺v em V por f ≺v g ⇔ ∃ h ∈ P, tal que f +v h ≤v g. Teorema 4.18. ≺v é uma relação semi-auxiliar para ≤v . Demonstração. Suponha f ≺v g e seja r ∈ P tal que f +v r ≤v g. Assim, f (O) + r(O) ≤ g(O), para todo O ∈ τ. Como r(O) ∈ (0, +∞], tem-se f (O) ≤ f (O) + r(O), logo f (O) ≤ g(O), para todo O ∈ τ, ou seja, f ≤v g. Para provar a segunda condição de relação semi-auxiliar, suponha f ≤v g ≺v h ≤ t. Assim, f (O) ≤ g(O) e h(O) ≤ t(O), para todo O ∈ τ e existe r ∈ P tal que g + r ≤v h. Dessa forma, segue que f +v r ≤v g +v r ≤v h ≤v t ⇒ f + r ≤v t, ou seja, f ≺v t. Observação 4.10. Um outro resultado imediato sobre a relação ≺v é o seguinte 0v ≺v f , para todo f ∈ P. De fato, basta tomar r = f , assim 0v +v r = 0v +v f = f ≤v f . Proposição 4.18. Se f , g ∈ V e f ≺v g, então g ∈ P. Demonstração. Seja r ∈ P tal que f +v r ≤v g. Assim, f (O) + r(O) ≤ g(O), para todo O ∈ τ. Como r(O) ∈ (0, +∞], temos que g(O) ∈ (0, +∞], para todo O ∈ τ. Além disso, se r(O) = +∞, então g(O) = +∞, logo o conjunto dos elementos O de τ tais que g(O) 6= +∞ está contido no conjunto dos elementos O de τ tais que r(O) 6= +∞, o qual é finito. Portanto g ∈ P. 50 Capítulo 4. i-Distâncias Teorema 4.19. Se f , g ∈ P, então f ∧ g ∈ P. Demonstração. Como f (O), g(O) ∈ (0+∞], para todo O ∈ τ, então f ∧g(O) = min{ f (O), g(O)} ∈ (0, +∞], para todo O ∈ τ. Considere os conjuntos finitos I f , Ig ∈ τ tais que f (O) 6= +∞, para todo O ∈ / If e S g(O) 6= +∞ para todo O ∈ / Ig . Note que f (O) = g(O) = +∞, para todo O ∈ / I f Ig , logo S S f ∧ g(O) = +∞ fora de I f Ig . Como I f Ig é um conjunto finito, pode-se concluir que f ∧ g ∈ P. Corolário 4.2. hV, ≤v , ≺v , 0v i é uma VID. Demonstração. Falta mostrar apenas que se f , g ∈ V são tais que 0v ≺v f e 0v ≺v g, então 0v ≺v f ∧ g. De fato, de 0v ≺v f e 0v ≺v g segue (da proposição 4.18) que f , g ∈ P. Assim, do teorema 4.19 segue que f ∧ g ∈ P e da observação 4.10 segue que 0v ≺v f ∧ g. Assim, fica construídoa VID que será usado na definição de uma i-quasi-pseudométrica que gera a topologia τ. Fixe um elemento q ∈ (0, +∞]. Para cada O ∈ τ defina a função dO : X ×X −→ [0, +∞] ( 0, se x ∈ / O ou y ∈ O por dO (x, y) = . É imediato que dO (x, x) = 0, para todo x ∈ X. q, se x ∈ O e y ∈ /O Esta função também satisfaz a desigualdade triangular, ou seja, dO (x, z) ≤ dO (x, y) + dO (y, z). De fato, se dO (x, z) = 0, então nada há a provar. Caso dO (x, z) = q, então x ∈ O e z∈ / O. Se y ∈ O, então dO (x, y) = 0 e dO (y, z) = q e daí decorre a desigualdade triangular. Se y ∈ / O, então dO (x, y) = q e dO (y, z) = q donde decorre a desigualdade triangular. Baseados nesta função dO , define-se a seguinte função dτ : X × X −→ V que associa a cada par (x, y) a função dτ (x, y) : τ −→ [0, +∞] de V definida por dτ (x, y)(O) = dO (x, y). Esta função dτ possui as seguintes propriedades: i) dτ (x, x) = 0v ; ii) dτ (x, z) ≤v dτ (x, y) +v dτ (y, z). De fato, já foi visto que dO (x, x) = 0 para todo O ∈ τ, logo dτ (x, x) = 0v . Também já foi visto que dO (x, z) ≤v dO (x, y) +v dO (y, z), logo dτ (x, z)(O) ≤ dτ (x, y)(O) +v dτ (y, z)(O), para cada O ∈ τ, assim dτ (x, z) ≤v dτ (x, y) +v dτ (y, z). Teorema 4.20. A função dτ é uma i-quasi-pseudométrica com relação à VID hV, ≤v , ≺v , 0v i. Demonstração. A primeira condição de i-quasi-pseudométrica já foi verificada. Para verificar a segunda, suponha dτ (x, y) ≺v ε para algum 0v ≺v ε. Pelo que já foi visto, tem-se 51 Capítulo 4. i-Distâncias ε ∈ P. Por definição, existe r ∈ P tal que dτ (x, y) +v r ≤v ε. Defina r/2 ∈ V por r/2(O) = ( r(O)/2, se r(O) 6= +∞ . Tem-se que r/2 ∈ P. De fato, r(O)/2 ∈ (0, +∞], para todo +∞, se r(O) = +∞ O ∈ τ e {O ∈ τ; r(O) 6= +∞} = {O ∈ τ; r(O)/2 6= +∞}, portanto r(O)/2 6= +∞ apenas para um número finito de elementos de τ, logo r/2 ∈ P. É imediato ver que r/2+v r/2 = r, logo r/2 ≺v r, assim dτ (x, y)+v r/2+r/2 = dτ (x, y)+r ≤v ε ⇒ dτ (x, y)+v r/2 ≺v ε. Sendo assim, tome δ = r/2 e suponha dτ (y, z) ≺v r/2. Portanto dτ (x, z) ≤v dτ (x, y) +v dτ (y, z) ≤v dτ (x, y) +v r/2 ≺v ε ⇒ dτ (x, z) ≺v ε. No teorema a seguir será mostrado que a topologia gerada pela função dτ em X é exatamente τ e como a construção da VID e da função dτ pode ser feita com qualquer topologia, então conclui-se que todo topologia é gerada por uma i-quasi-pseudométrica. Teorema 4.21. A topologia gerada por dτ é τ. Demonstração. Seja τ0 a topologia gerada por dτ . O objetivo é mostrar que τ0 = τ. 0 0 ( Seja O ∈ τ. Fixado p ∈ (0, +∞), com 2p ≤ q defina rO : τ −→ (0, +∞] por rO (A) = p, se A = O 0 (A) ∈ (0, +∞], para todo A ∈ τ e r 0 (A) 6= +∞ apenas para . Assim, rO O +∞, se A 6= O 0 ∈ P. Defina r = r 0 + r 0 . Segue que um elemento de τ, a saber o próprio O, ou seja, rO O O O 0 rO ≺v rO . Considere a bola aberta B(x, rO ) = {y ∈ X dτ (x, y) ≺v rO }. Tem-se B(x, rO ) = B, onde B = {y ∈ X; dO (x, y) < 2p}. De fato, tome y ∈ B(x, rO ), ou seja, y é tal que dτ (x, y) ≺v rO . Dessa forma, existe r ∈ P tal que dτ (x, y) +v r ≤v rO , ou seja, dτ (x, y)(A) + r(A) ≤ rO (A), para todo A ∈ τ, logo dτ (x, y)(O) + r(O) ≤ rO (O) ⇔ dO (x, y) + r(O) ≤ 2p. Como r(O) ∈ (0, +∞), então dO (x, y) < 2p o que implica em y ∈ B. Por outro lado, se / y ∈ B, é imediato verificar que y ∈ B(x, rO ) donde conclui-se que B = B(x, rO ). Se O = 0, 0 / Tome x ∈ O. Como já foi visto que então O ∈ τ . Dessa forma, podemos supor O 6= 0. B(x, rO ) = {y ∈ X; dO (x, y) < 2p}, basta mostrar que O = {y ∈ X; dO (x, y) < 2p}. Se z ∈ O, então dO (x, z) = 0 ⇒ z ∈ {y ∈ X; dO (x, y) < 2p} o que implica em O ⊆ {y ∈ X; dO (x, y) < 2p}. Por outro lado, se z ∈ / O, então dO (x, z) = q 6< 2p, logo z ∈ / B. Com c c isso, conclui-se que O ⊆ B , ou seja, B ⊆ O. Portanto B = O, o que mostra que O ∈ τ0 e encerra a verificação de que τ ⊆ τ0 . Falta provar que τ0 ⊆ τ. Para isso, tome O ∈ τ0 . Dessa forma, dado x ∈ O, existe rx ∈ P tal que B(x, rx ) ⊆ O. Por definição, o conjunto O = {A ∈ τ; rx (A) 6= +∞} é finito. Suponha C = {O1 , O2 , ..., On } e rx (Oi ) = pi ∈ (0, +∞) para cada i ∈ {1, 2, ...,(n}. Sendo assim, pi , se A = Oi rx (A) = +∞, para todo A ∈ / C. Defina ri : τ −→ (0, +∞], por ri (A) = , +∞, se A 6= Oi para cada i ∈ {1, 2, ..., n}. Segue imdeiatamente da definição dos ri ’s que rx = r1 ∧r2 ∧...∧ 52 Capítulo 4. i-Distâncias T T T rn . Outro fato que será usado é o seguinte: B(x, r1 ) = B(x, r1 ) B(x, r2 ) ... B(x, rn ). Para verificar isto, tome y ∈ B(x, rx ). Assim, dτ (x, y) ≺ rx , ou seja, existe s ∈ P tal que: dτ (x, y) +v s ≤v rx ⇒ dτ (x, y) +v s ≤v r1 ∧ ... ∧ rn ⇒ dτ (x, y) + s ≤v ri , ∀ i ∈ {1, ..., n} ⇒ dτ (x, y) ≺v ri , ∀ i ∈ {1, ..., n} ⇒ y ∈ B(x, ri ), ∀ i ∈ {1, ..., n}. Por outro lado, se y ∈ B(x, r1 ) B(x, r2 ) ... B(x, rn ), então dτ (x, y) ≺v ri , para todo i ∈ {1, 2, ..., n}, logo, existem s1 , ..., s2 ∈ P tais que dτ (x, y) +v si ≤v ri , para todo i ∈ {1, ..., n}. Do teorema 4.19 segue que s1 ∧ ... ∧ sn ∈ P e da proposição 4.17 segue que dτ (x, y) +v ∧ni=1 si ≤ ∧ni=1 ri = rx ⇒ dτ (x, y) ≺v rx ⇒ y ∈ B(x, rx ). Tem-se que B(x, ri ) ( = X se x ∈ / Oi . De fato, neste caso, dado y ∈ X, temos que 0, se x ∈ / A ou y ∈ A dτ (x, y)(A) = dA (x, y) = . Como x ∈ / Oi , tem-se dτ (x, y)(Oi ) = 0 e q, se x ∈ A e y ∈ /A como ri (A) = +∞, para todo A ∈ τ − {Oi }, segue que: T T T /A q + ∞, se A 6= Oi , x ∈ A e y ∈ dτ (x, y)(A) + ri (A) = 0 + ∞, se A 6= Oi , x ∈ / A ou y ∈ A 0 + pi , se A = Oi (neste caso, tem-se x ∈ / A) ( +∞, se A 6= Oi = pi , se A = Oi = ri (A). Portanto, dτ (x, y) +v ri ≤v ri ⇒ dτ (x, y) ≺v ri ⇒ y ∈ B(x, ri ) ⇒ B(x, ri ) = X. Agora, suponha que x ∈ Oi e pi ≤ q. Neste caso, tem-se B(x, ri ) = Oi . De fato, dado y ∈ Oi , tem-se: 0, se A = Oi 0, se A 6= O e y ∈ A i dτ (x, y)(A) = q, se A 6= Oi , ∈ /Aex∈A 0, se A 6= O , y ∈ /Aex∈ /A i 53 Capítulo 4. i-Distâncias Sendo assim, segue que: 0 + pi , se A = Oi 0 + ∞, se A 6= O e y ∈ A i dτ (x, y)(A) + ri (A) = q + ∞, se A 6= Oi , y ∈ /Aex∈A 0 + ∞, se A 6= O , y ∈ /Aex∈ /A i ( pi , se A = Oi = +∞, se A 6= Oi = ri (A) Portanto, dτ (x, y) +v ri ≤ ri ⇒ dτ (x, y) ≺v ri ⇒ y ∈ B(x, ri ) ⇒ Oi ⊆ B(x, ri ). Por outro lado, suponha que y ∈ / Oi , assim dτ (x, y)(Oi ) = q ≥ pi = ri (Oi ), logo dτ (x, y) 6≺v ri ⇒ y ∈ / B(x, ri ). Sendo assim, tem-se Oci ⊆ [B(x, ri )]c ⇔ B(x, ri ) ⊆ Oi . Assim, segue que Oi = B(x, ri ). Por fim, suponha x ∈ Oi e q < pi . Neste caso, tem-se B(x, ri ) = X. De fato, tome y ∈ X, assim: 0, se A = Oi e y ∈ A q, se A = O e y ∈ /A i dτ (x, y)(A) = q, se A 6= Oi , x ∈ A e y ∈ /A 0, se A 6= O , x ∈ / A ou y ∈ A i ( pi − q, se A = Oi Defina si : τ −→ (0, +∞] por si (A) = . Assim: +∞, se A 6= Oi 0 + pi − q, se A = Oi e y ∈ A q + p − q, se A = O e y ∈ /A i i dτ (x, y)(A) + si (A) = q + ∞, se A 6= Oi , x ∈ A e y ∈ /A 0 + ∞, se A 6= O , x ∈ / A ou y ∈ A i pi − q, se A = Oi e y ∈ A = pi , se A = Oi e y ∈ /A +∞, se A 6= Oi ≤ ri (A). Como si ∈ P, isso significa que dτ (x, y) ≺v ri ⇒ y ∈ B(x, ri ), portanto, B(x, ri ) = X. Com isso, foi mostrado que cada uma das bolas abertas B(x, ri ) é X ou Oi , logo B(x, ri ) ∈ τ, para cada i ∈ {1, ..., n}. Dessa forma, B(x, rx ) é a interseção finita de ele- 54 Capítulo 4. i-Distâncias [ mentos de τ, logo B(x, rx ) ∈ τ. Como O = B(x, rx ), pode-se concluir que O ∈ τ e, x∈O portanto, que τ0 ⊆ τ, que era o passo que faltava para provar que τ = τ0 . 4.7 Um Exemplo Prático: Cadeias de Caracteres Nesta seção, é proposta uma i-quasi-métrica µ no espaço das cadeias de caracteres sobre um alfabeto finito. Esta proposta de distância para cadeias de caracteres é influenciada pela chamada distância de edição, ou de Levenshtein (ver [Levenshtein 1965] e [Dasgupta et al, 2006]), a qual coloca como distância entre duas cadeias o número mínimo de operações de edição para transformar uma cadeia na outra. A distância de edição é usada até hoje como medida de similaridade em bancos de dados de cadeias de caracteres ([Seraphim 2005]). Por ser uma distância (métrica) no sentido usual, o valor da distância entre duas cadeias é um número real. Na proposta a ser apresentada nesta seção, a distância será um par ordenado de números, o que já possibilita uma informação maior sobre a similaridade entre as cadeias. O principal aspecto sobre esta função µ a ser abordado é o prático, já que, como será visto abaixo, a topologia gerada por esta i-quasi-métrica é trivial. Sob o ponto de vista prático, será demonstrado que está função possui algumas propriedades e a partir destas desenvolve-se um algoritmo para calculá-la. Definição 4.19. Considere ∑ = {a1 , a2 , ..., an } um alfabeto, ou seja, um conjunto finito e não vazio. Cada elemento de ∑ é chamado caractér. Uma cadeia de caracteres sobre ∑ é uma lista finita e ordenada de elementos de ∑. O conjunto de todas as cadeias sobre o alfabeto ∑ será denotado por ∑∗ . O comprimento de uma cadeia é a quantidade (contando repetições) de caracteres da cadeia e será denotado por |w|, onde w ∈ ∑∗ . O símbolo ε denotará a cadeia vazia, a qual é a única com comprimento 0. Exemplo 4.12. Se ∑ = {a1 , a2 , a3 }, então são cadeias de caracteres: a1 a2 , a2 a3 , .... Notem que a1 a2 6= a2 a1 e se w = a1 a1 a1 a1 a1 , então |w| = 5. Observação 4.11. Dado w ∈ ∑∗ , será denotado por wc o conjunto dos caracteres usados para formar a cadeia w, por exemplo, se ∑ = {a, b, c, ..., z} e w = assassino, então wc = {a, s, i, n, o}. Definição 4.20. Seja ∑ um alfabeto. Uma função f : ∑∗ −→ ∑∗ é chamada operação de edição em ∑∗ . 55 Capítulo 4. i-Distâncias Exemplo 4.13. Seja ∑ = {a1 , a2 , ..., an } um alfabeto. A concatenação de duas cadeias em ∑∗ é definida da seguinte maneira: se w = ar1 ...arm e t = as1 ..asn , então a concatenação de w com t é a cadeia wt = ar1 ...arm as1 ..asn e de t com w é a cadeia tw = as1 ..asn ar1 ...arm . Sendo assim, fixada uma cadeia w a função f : ∑∗ −→ ∑∗ definida por f (t) = wt é uma operação de edição em ∑∗ . Definição 4.21. Fixado k ∈ N, a função Rk : ∑∗ −→ ∑∗ definida, para cada w = ar1 ...arm ∈ ∑∗ , por: ar1 ...ark−1 ark+1 ...arm , se k < m k R (w) = ar1 ...arm−1 , se k = m w , se k > m é chamada operação de remoção do k-ésimo caractér. Fixados k ∈ N e a ∈ ∑, a função Iak : ∑∗ −→ ∑∗ definida, para cada w = ar1 ...arm , por: , se k ≤ m ar1 ...ark−1 aark ...arm k Ia (w) = wa , se k = m + 1 w , se k > m + 1 é chamada operação de inserção do caractér a como k-ésimo caractér. Exemplo 4.14. Se ∑ = {a, b, c, ..., z}, então R5 (casar) = casa e Iu3 (casa) = causar. Neste trabalho as únicas operações de edição consideradas serão as de remoção e inserção de caracteres. Uma observação imediata sobre estas operações é que se Rk (w) 6= w, então |Rk (w)| = |w| − 1 e se Iak (w) 6= w, então |Iak (w)| = |w| + 1. Definição 4.22. Uma sequência de operações de edição é a composição de operações (x) de remoção e inserção. Será usada a notação T(y) para indicar que a sequência de operações de edição possui x inserções e y remoções. Uma sequência será dita bem (x) formada quando T(y) = Iarxrx ◦ ... ◦ Iar1r1 ◦ Rs1 ◦ ... ◦ Rsy , com ar1 , ..., arx ∈ ∑, r1 , ...rx , s1 , ...sy ∈ N, com r1 < ... < rx e s1 < ... < sy . A função identidade em ∑∗ será considerada como uma (0) sequência de operações de edição, a qual será denotada por T(0) . Dada uma sequência (x) (x) de operações de edição T(y) = Iarxrx ◦ ... ◦ Iar1r1 ◦ Rs1 ◦ ... ◦ Rsy , será usada a notação T(y) para (x) o conjunto {Iarxrx , ..., Iar1r1 , Rs1 , ..., Rsy } de todas as operações de edição de T(y) . (3) Exemplo 4.15. Seja ∑ = {a, b, ..., z} e w = santana. Considere T(2) = Io8 ◦ Ig7 ◦ Ii5 ◦ R6 ◦ R7 , (3) então T(2) (santana) = santiago. 56 Capítulo 4. i-Distâncias (x) Definição 4.23. Seja T(y) = T1 ◦ ... ◦ Tx ◦ Tx+1 ◦ ... ◦ Tx+y uma sequência de operações de (x) edição. Considere w ∈ ∑∗ . Será dito que T(y) modifica totalmente w quando: Tk ((Tk+1 ◦ ... ◦ Tx+y )(w)) 6= (Tk+1 ◦ ... ◦ Tx+y )(w), , para cada k = 1, 2, ..., x + y − 1 e Tx+y (w) 6= w. (x) Observação 4.12. Seja T(y) uma sequência de operações de edição que modifica total(x) mente a cadeia w, então |T(y) (w)| = |t| + x − y. A seguir, será definida a i-quasi-métrica em ∑∗ . Para isso, será definidoa VID que será usado na definição desta i-distância. Definição 4.24. Seja Z+ = {0, 1, 2, ...} o conjunto dos inteiros não negativos. Considere em Z+ × Z+ a ordem lexicográfica definida por (a, b) ≤l (c, d) se, e somente se, a < b ∨ (a = b) ∧ (c ≤ d). Observação 4.13. A ordem lexicográfica é uma relação de ordem total em Z+ ×Z+ . Com isso, a estrutura hZ+ × Z+ , ≤l , <l , (0, 0)i é um reticulado com menor elemento separável sendo, portanto, uma VID. Considere duas cadeias w e t. Usando apenas remoções e inserções é possível transformar t em w. Por exemplo, a sequência de operações formada pelas operações de remoção de todos os caracteres de t e inserção de todos os caracteres de w claramente trans(x) (x) forma t em w. Sendo assim, o conjunto Twt = {(x, y) ∈ Z+ × Z+ ; ∃ T(y) tal queT(y) (t) = w} é não vazio quaisquer que sejam as cadeias w e t. Dessa forma, o conjunto {x ∈ Z+ ; existe y ∈ Z+ com (x, y) ∈ Twt } também é não vazio, logo pelo princípio da boa ordenação, este conjunto possui menor elemento. Seja a este elemento. O conjunto {y ∈ Z+ ; (a, y) ∈ Twt } também é não vazio, logo possui menor elemento, digamos b. Assim, temos que (a, b) ∈ Twt e, além disso, (a, b) ≤l (x, y), para todo (x, y) ∈ Twt , ou seja, (a, b) é o mínimo (com relação a ordem ≤l ) do conjunto Twt . A notação (a, b) = min≤l Twt será usada. Defina µs : ∑∗ × ∑∗ −→ Z+ × Z+ por: µs (w,t) = min Twt ≤l A função µs tem as seguintes propriedades imediatas: (0) 1. Dado w ∈ ∑∗ , temos que µs (w, w) = (0, 0). De fato, T(0) (w) = w. (0) (0) 2. Sejam w,t ∈ ∑∗ tais que µs (w,t) = (0, 0). Isso significa que T(0) (t) = w, mas T(0) é a função identidade, logo devemos ter w = t. 57 Capítulo 4. i-Distâncias 3. Segue das duas primeiras propriedades que se µs (w,t) = µs (t, w) = (0, 0), então w = t. Exemplo 4.16. A função µs não é simétrica. De fato, se ∑ = {a, b, c, ..., z}, então µs (ab, c) = (2, 1) e µs (c, ab) = (1, 2). Teorema 4.22. Sejam w,t ∈ ∑∗ tais que µs (w,t) <l (α, β) para algum (α, β) ∈ Z+ × Z+ − {(0, 0)}. Dessa forma, então existe (ϕ, γ) ∈ Z+ × Z+ , com (0, 0) <l (ϕ, γ) tal que se µs (t, v) <l (ϕ, γ), então µs (w, v) <l (α, β). Demonstração. Basta tomar (ϕ, γ) = (0, 1). Dessa forma, se µs (t, v) <l (0, 1), então µs (t, v) = (0, 0), logo, pela propriedade 2, t = v, o que implica em µs (w, v) = µs (w,t) <l (α, β). Observação 4.14. Segue das propriedades 1 e 3 e do teorema anterior que a função µs ∗ é uma i-quasi-métrica relativa à VID hZ+ × Z+ , ≤l , <l (0, 0)i. Note que dado w ∈ ∑, ∗ tem-se B(w, (0, 1) = {w}, ou seja, todo subconjunto unitário de ∑ é aberto na topologia ∗ gerada por µs e, portanto, esta topologia é a topologia discreta em ∑. Abaixo, são listadas mais algumas propriedades da função µs : (x) a) Se µs (w,t) = (x, y) 6= (0, 0), então toda sequência de operações de edição T(y) tal que (x) (x) T(y) (t) = w modifica totalmente t. De fato, se existisse uma sequência T(y) tal que (x) (x) T(y) (t) = w sendo que T(y) não modifica totalmente t, então ao se excluir a operação de edição que faz parte da sequência e que não modifica sua entrada, obtem-se uma (z) (z) outra sequência T(v) tal que T(v) (t) = w e (z, v) <l (x, y), o que contradiz µs (w,t) = (x, y) 6= (0, 0). ( (0, 0) , se a1 = a2 b) Se a1 , a2 ∈ ∑, então µs (a1 , a2 ) = . (1, 1) , se a1 6= a2 c) Para cada t ∈ ∑∗ , tem-se µs (ε,t) = (0, |t|). De fato, para t = ε, o resultado é imediato. (0) (0) Para t 6= ε, considere T(|t|) = R1 ◦ ... ◦ R|t| , assim T(|t|) (t) = ε. Se (x, y) <l (0, |t|), (x) então x = 0 e y < |t|, assim, se T(y) é uma sequência que modifica totalmente t, (x) (x) então |T(y) (t)| = |t| − y > 0, logo T(y) (t) 6= ε. Sendo assim, (0, |t|) = min≤l Tε,t ⇒ µs (ε,t) = (0, |t|). De modo análogo, mostra-se que µs (w, ε) = (|w|, 0). d) Se µs (w,t) = (x, y), então existe uma sequência bem formada de operações de edição (x) (x) T(y) tal que T(y) (t) = w. Teorema 4.23. Se w,t ∈ ∑∗ e a ∈ ∑, então µs (wa,ta) = µs (w,t). 58 Capítulo 4. i-Distâncias (x) (x) Demonstração. Suponha µs (w,t) = (x, y) e seja T(y) uma sequência tal que T(y) (t) = (x) w. Assim, T(y) (ta) = wa o que implica em µs (wa,ta) ≤l (x, y). Suponha µs (wa,ta) = (z) (z) (z) (z, v) <l (x, y). Seja G(v) uma sequência tal que G(v) (ta) = wa, logo G(v) (t) = w, assim µs (w,t) ≤l (z, v) ⇒ µs (w,t) <l (x, y), o que é uma contradição. ( (|w|, 1) , se a ∈ / wc Lema 4.3. Se w ∈ ∑∗ e a ∈ ∑, então µs (w, a) = . (|w| − 1, 0) , se a ∈ wc Demonstração. Suponha que a ∈ / wc e µs (w, a) = (x, y), então, existe uma sequência de (x) (x) (x) operações T(y) tal que T(y) (a) = w. Como a ∈ / wc , então y = 1, logo |T(y) (a)| = 1+x−y = (x) (x) x e de T(y) (a) = w segue que |T(y) (a)| = |w| ⇒ x = |w|. Agora, suponha que a ∈ wc e seja µs (w, a) = (x, y). Dessa forma, existe uma sequência (x) (x) de operações T(y) tal que T(y) (a) = w. Como é possível transformar a em w sem nenhuma remoção e fazendo a inserção de todos os outros caracteres de w , então µs (w, a) = (x, y) ≤l (x) (|w|−1, 0). Suponha x < |w|−1. Assim, |T(y) (a)| = 1+x−y < 1+|w|−1+y = |w|−y ≤ (x) (x) |w|, logo |T(y) (a)| < |w| ⇒ T(y) (a) 6= w, o que é uma contradição. Logo, deve-se ter x = |w| − 1 e, portanto, y = 0. Teorema 4.24. Se w ∈ ∑∗ e a, b ∈ ∑, com µs (w, b) = (x, y), então: ( µs (wa,t) = µs (w, b) − (0, 1) , se a = b e y = 1 µs (w, b) + (1, 0) , caso contrário Demonstração. Considere os seguintes casos: Primeiro, suponha a = b e y = 1. Dessa forma, b ∈ / wc , logo, do lema anterior segue que µs (w, b) = (|w|, 1). Como a = b, então b ∈ (wa)c , donde segue: µs (wa, b) = (|wa| − 1, 0) = (|w| + 1 − 1, 0) = (|w|, 0) = (|w|, 1) − (0, 1) = µs (w, b) − (0, 1). Agora, considere o caso em que a = b e y = 0. Portanto b ∈ wc , o que implica em µs (w, b) = (|w| − 1, 0) e, como b ∈ (wa)c , segue que: µs (wa, b) = (|wa| − 1, 0) = (|w| + 1 − 1, 0) = (|w|, 0) = (|w| − 1, 0) + (1, 0) = µs (w, b) + (1, 0). Considere a 6= b e y = 1. Neste caso, b ∈ / wc , logo µs (w, b) = (|w|, 1). Como a 6= b, 59 Capítulo 4. i-Distâncias então b ∈ / (wa)c , portanto: µs (wa, b) = (|wa|, 1) = (|w| + 1, 0) = (|w|, 1) + (1, 0) = µs (w, b) + (1, 0). Finalmente, considere o caso em que a 6= b e y = 0. Dessa forma, b ∈ wc , logo µs (w, b) = (|w| − 1, 0). Como b ∈ (wa)c , segue: µs (wa, b) = (|wa| − 1, 0) = (|w| + 1 − 1, 0) = (|w|, 0) = (|w| − 1, 0) + (1, 0) = µs (w, b) + (1, 0). Lema 4.4. Sejam (z, v), (x, y) ∈ Z+ × Z+ com (z, v) <l (x, y), então (z, v) + (c, d) <l (x, y) + (c, d), para todo (c, d) ∈ Z+ × Z+ . Demonstração. Caso z < x, então z+c < x+c, logo (z, v)+(c, d) <l (x, y)+(c, d). Se z = x e v < y, então z + c = x + c e v + d < y + d), portanto (z, v) + (c, d) <l (x, y) + (c, d). (x) Lema 4.5. Suponha a 6= b e µs (wa,tb) = (x, y) e seja T(y) uma sequência bem formada de (x) operações de edição tal que T(y) (tb) = wa. Sendo assim, pelo menos uma das operações |w|+1 de edição R|t| ou Ia (x) está em T(y) . (x) Demonstração. Suponha que R|t| ∈ / T(y) . Dessa forma, como a 6= b e a cadeia wa apresenta o carácter a na posição |w| + 1, então deve ser inserido o caractér a nesta posição. Teorema 4.25. Se w,t ∈ ∑∗ e a, b ∈ ∑, com a 6= b, então: µs (wa,tb) = min{µs (wa,t) + (0, 1), µs (w,tb) + (1, 0)}. ≤l (x) Demonstração. Considere µs (wa,tb) = (x, y) e seja T(y) uma sequência bem formada de (x) operações de edição tal que T(y) (tb) = wa. (x) Primeiro, suponha que a operação R|t|+1 é uma das operações de T(y) . Considere, (x) (x) então, G(y−1) a sequência bem formada obtida de T(y) excluindo-se a operação R|t|+1 , (x) (x) (x) ou seja, G(y−1) = T(y) − {R|t|+1 }. Dessa forma, G(y−1) (t) = wa. Note que µs (wa,t) = (x) (x, y − 1). De fato, G(y−1) (t) = wa, logo µs (wa,t) ≤l (x, y − 1). Suponha que µs (wa,t) = 60 Capítulo 4. i-Distâncias (z) (z, v) <l (x, y −1). Considere H(v) uma sequência bem formada de operações de edição tal (z) (z) (z) que H(v) (t) = wa e defina a sequência de operações F(v+1) obtida de H(v) acrescentando(z) se a operação R|t|+1 . Dessa forma, F(v+1) (tb) = wa, portanto µs (wa,tb) ≤l (z, v + 1) = (z, v) + (0, 1). Como (z, v) <l (x, y − 1), do lema 4.4 segue que (z, v) + (0, 1) <l (x, y − 1) + (0, 1) = (x, y) ⇒ µs (wa,tb) <l (x, y), o que contradiz o fato de µs (wa,tb) = (x, y). Portanto µs (wa,t) = (x, y − 1) ⇒ µs (wa,tb) = (x, y) = µs (wa,t) + (0, 1). (x) Agora, suponha que R|t|+1 não é uma das operações de T(y) . Dessa forma, segue do |w|+1 (x) lema 4.5 que a operação Ia (x−1) operações G(y) é uma das operações de T(y) . Considere a sequência de |w|+1 (x) obtida de T(y) excluindo-se a operação Ia (x−1) wa. Note que µs (w,tb) = (x − 1, y). De fato, G(y) (x−1) . Segue que G(y) (tb) = (tb) = w, então µs (w,tb) ≤l (x − 1, y). (z) Suponha µs (w,tb) = (z, v) <l (x − 1, y). Seja H(v) uma sequência bem formada de opera(z) (z+1) ções de edição tal que H(v) (tb) = w. Defina F(v) |w|+1 . Ia (z) H(v) como a sequência bem formada obtida (z+1) Assim, F(v) (tb) = wa, logo µs (wa,tb) ≤l de acrescentando-se a operação (v, z+1) = (z, v)+(1, 0). Como (z, v) <l (x−1, y), segue do lema 4.4 que (z, v)+(1, 0) <l (x − 1, y) + (1, 0) = (x, y), logo µs (wa,tb) <l (x, y) o que contradiz µs (wa,tb) = (x, y). Portanto, µs (w,tb) = (x − 1, y) ⇒ µs (wa,tb) = (x, y) = µs (w,tb) + (1, 0). Com isso, ficou provado que µs (wa,tb) = µs (wa,t) + (0, 1) ou µs (wa,tb) = µs (w,tb) + (z) (u) (1, 0). Considere µs (wa,t) = (z, v) e µs (w,tb) = (u, r) e sejam G(v) e H(r) sequências de (z) (u) (z) operações de edição tais que G(v) (t) = wa e H(r) (tb) = w. Defina as sequências Γ(v+1) (z) (u+1) obtida de G(v) acrescentando-se a operação R|t|+1 e Π(r) |w|+1 (u) obtida de H(r) acrescentando- (z) (u+1) . Dessa forma, segue que Γ(v+1) (tb) = wa e Π(r) (tb) = wa. Sendo se a operação Ia assim, com z inserções e v + 1 remoções ou com u + 1 inserções e r remoções é possível transformar a cadeia tb na cadeia wa. Como já vimos que µs (wa,tb) é igual a (z, v + 1) ou igual a (u + 1, r), pode-se concluir que µs (wa,tb) = min≤l {(z, v + 1), (u + 1, r)} = min≤l {µs (wa,t) + (0, 1), µs (w,tb) + (1, 0)}. Estes últimos resultados sobre µs provam que o algoritmo a seguir calcula efetivamente o valor de µs . Algoritmo µs Função: medida µs (Character: Str1[1..lenStr1], Character: Str2[1..lenStr2],vector: integer[2]) Início “Mat é uma matriz com lenStr2 linhas e lenStr1 + 1 colunas" Para i = 1..lenStr2 61 Capítulo 4. i-Distâncias Mat[i, 1] = (0, i) Para j = 2..lenStr1+1 Se Str1[ j −1] = Str2[1] e (Mat[1, j −1])2 = 1, então Mat[1, j] = Mat[1, j − 1] − (0, 1) Se não, então Mat[1, j] = Mat[1, j − 1] + (1, 0) Para i = 2..lenStr2 Para j = 2..(lenStr1 + 1) Se Str1[i] = Str2[ j], então Mat[i, j] = Mat[i − 1, j − 1] Se Str1[i] 6= Str2[ j], então Mat[i, j] = min≤l {Mat[i − 1, j] + (0, 1), Mat[i, j − 1] + (1, 0)} µs = Mat[lenStr2, lenStr1 + 1]. Fim Este algoritmo constrói uma matriz de ordem m × n cujo termo de índice mn é o valor de µs . O algoritmo que calcula a distância de Levenshtein também constrói uma matriz cujo o último termo é o valor da distância. Os dois algoritmos possuem a mesma complexidade, a saber, da ordem de O(mn), onde m e n são os comprimetos das cadeias. A seguir, tal matriz é apresentada para dois exemplos. − L E T T E R S − (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6) (0, 7) P (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) (1, 7) A (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) (2, 7) T (3, 1) (3, 2) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) Neste caso, µs (pattern, letters) = (3, 3). 62 T (4, 1) (4, 2) (3, 2) (2, 2) (2, 3) (2, 4) (2, 5) E (5, 1) (4, 1) (4, 2) (3, 2) (2, 2) (2, 3) (2, 4) R (6, 1) (5, 1) (5, 2) (4, 2) (3, 2) (2, 2) (2, 3) N (7, 1) (6, 1) (6, 2) (5, 2) (4, 2) (3, 2) (3, 3) Capítulo 4. i-Distâncias − B A A A B B B C − (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6) (0, 7) (0, 8) A (1, 1) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6) (0, 7) A (2, 1) (1, 1) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6) B (2, 0) (2, 1) (1, 1) (1, 2) (0, 2) (0, 3) (0, 4) (0, 5) B (3, 0) (3, 1) (2, 1) (2, 2) (1, 2) (0, 2) (0, 3) (0, 4) A (4, 0) (3, 0) (3, 1) (2, 1) (2, 2) (1, 2) (1, 3) (1, 4) C (5, 0) (4, 0) (4, 1) (3, 1) (3, 2) (2, 2) (2, 3) (1, 3) S (6, 0) (5, 0) (5, 1) (4, 1) (4, 2) (3, 2) (3, 3) (2, 3) Neste caso, µs (AABBACS, BAAABBBC) = (2, 3). No decorrer desta seção, serão vistas ligações entre µs e o importante conceito de subsequências de cadeias de caracteres. Definição 4.25. Sejam w,t ∈ ∑∗ . A cadeia w é uma subsequência de t quando t = w ou quando é possível transformar t em w fazendo-se apenas remoções de caracteres de t ou, equivalentemente, quando é possível transformar w em t fazendo-se apenas inserções de caracteres em w. Exemplo 4.17. abcde f é subsequência de xyabecopdine f , enquanto abcde f não é subsequência de abcde. A distância de Levenshtein mencionada no início desta seção é definida como a menor quantidade de operações de edição que transforma uma cadeia na outra. Seja dL esta distância e ∑ = {a, c,t, g} o alfabeto a ser considerado. Como exemplo, considere as cadeias acctg, cactga e cag. Tem-se dL (acctg, cactga) = 3 e dL (cag, cactga) = 3. Note que cag é subsequência de cactga mas acctg não é subsequência de cactga, o que mostra que o simples cálculo do valor de dL não é suficiente para determinar quando uma cadeia é subsequência de outra. Isso aponta uma pequena vantagem da função µs sobre dL , que é estabelecida no teorema abaixo. Teorema 4.26. Seja ∑ um alfabeto e w,t ∈ ∑∗ . A cadeia w é subsequência de t se, e somente se, µs (w,t) = (0, y) ou, equivalentemente , µs (w,t) <l (1, 0). Demonstração. Imediata. Um outro relacionado a subsequências de cadeias de caracteres é o de determinar o tamanho da maior subsequência comum a duas cadeias dadas (notação |LCS|). Este é um problema clássico de computação(algoritmos). Tal problema tem aplicações na área de bioinformática (ver [Paleo 2007]), onde se deseja saber o quão duas cadeias de DNA são similares através de |LCS|. A seguir, é feita a ligação entre |LCS| e µs . 63 Capítulo 4. i-Distâncias Definição 4.26. Dadas w,t ∈ ∑∗ , diz-se que s ∈ ∑∗ é uma maior subsequência comum para w e t se qualquer outra subsequência r comum a w e t é tal que |r| ≤ |s|. Neste caso |s| = |LCS|. Teorema 4.27. Dadas w,t ∈ ∑∗ , se µs (w,t) = (x, y), então |LCS(w,t)| = |t| − y. (x) (x) Demonstração. Seja T(y) = Iasxsx ◦ ... ◦ Ias1s1 ◦ Rr1 ◦ ... ◦ Rry tal que T(y) (t) = w. Considere (0) (0) T(y) = Rr1 ◦ ... ◦ Rry , assim T(y) (t) = s, onde s é uma subsequência comum a w e a t. Note que |s| = |t| − y, ou seja, y = |s| − |t| e que |w| = |s| + x, ou seja, x = |w| − |s|. suponha que exista uma outra subsequência s0 comum a w e a t tal que |s0 | > |s|. Dessa forma, tem-se µs (s0 ,t) = (0, |t| − |s0 k) e com |w| − |s0 | inserções de caracteres podemos transformar s0 em w, portanto µs (w,t) ≤l (|w| − |s0 |, |t| − |s0 |) <l (x, y), já que |w| − |s0 | < |w| − |s| = x. Mas isso contradiz o fato de µs (w,t) = (x, y). Dessa forma, não pode haver subsequência comum a w e a t com comprimento maior do que |s|, portanto |LCS(w,t)| = |s| = |t| − y. 64 Capítulo 5 Métricas Intervalares Neste capítulo, toda a matemática desenvolvida nos capítulos anteriores é aplicada para prover uma distância cujos valores sejam intervalos e que capture o importante conceito de representação intervalar. Para fazer isso, será construído uma VID baseada na ordem de Kulisch-Miranker. 5.1 Definição de Métricas Intervalares Definição 5.1. Uma VID hA, ≤, R, ⊥i, onde A ⊆ IR+ é chamada VID intervalar. Uma i-distância ω-valorada, onde ω é uma VID intervalar é chamada i-distância intervalar. A seguir, são exibidos dois exemplos de i-métricas intervalares. Na proposição abaixo, é construída a VID que será usada no primeiro exemplo. Esta VID é baseada em préordens. Proposição 5.1. Considere a pré-ordem ≤F em IR+ definida por [a, b] ≤F [c, d] ⇔ b ≤ d e a relação semi-auxiliar ≺ para ≤F definida por [a, b] ≺ [c, d] ⇔ b < d. A estrutura hIR+ , ≤F , ≺, [0, 0]i é uma VID. Demonstração. A demonstração é imediata. Exemplo 5.1. A função dm : IR+ × IR+ −→ IR+ definida por: dm (X,Y ) = [min{|x − y|, |x − y|}, max{|x − y|, |x − y|}] (5.1) é uma i-métrica intervalar relativa à VID hIR+ , ≤F , ≺, [0, 0]i. As primeiras duas condições são imediatas. Suponha que dm (X,Y ) ≺ [ε, ε], onde [0, 0] ≺ [ε, ε]. Isso significa que max{|x − y|, |x − y|} < ε. Tome ∆ = [0, ε − max{|x − y|, |x − y|}] e suponha dm (Y, Z) ≺ ∆. Assim, max{|y − z|, |y − z|} < ε − max{|x − y|, |x − 65 Capítulo 5. Métricas Intervalares y|} ⇒ max{|x − y|, |x − y|} + max{|y − z|, |y − z|} < ε. Da desigualdade triangular usual, segue: |x − z| ≤ |x − y| + |y − z| e |x − z| ≤ |x − y| + |y − z|, então max{|x − z|, |x − z|} ≤ max{|x − y| + |y − z|, |x − y| + |y − z|}. Como max{|x − y| + |y − z|, |x − y| + |y − z|} ≤ max{|x − y|, |x − y|} + max{|y − z|, |y − z|}, segue que: max{|x − z|, |x − z|} ≤ max{|x − y|, |x − y|} + max{|y − z|, |y − z|} < ε ⇔ dm (X, Z) ≺ [ε, ε]. Esta função dm , a qual foi verificada ser uma i-métrica intervalar, foi proposta em [Vargas 2010] onde é introduzida uma versão difuso-intervalar do algoritmo C-means. A seguir, será construído uma outra VID baseada na ordem de Kulisch-Miranker. Desta vez, considere o conjunto IR++ = {[0, 0]} ∪ {[x, x]; x > 0} e a ordem ≤KM restrita a este conjunto. Defina a relação KM pondo [a, b] KM [c, d] se, e somente se, a < c e b < d. Proposição 5.2. km é uma relação semi-auxiliar para ≤KM em IR++ . Demonstração. É imediato ver que se [a, b] KM [c, d], então [a, b] ≤KM [c, d]. Agora, suponha [a, b] ≤KM [c, d], [c, d] KM [e, f ] e [e, f ] ≤KM [g, h]. Neste caso, tem-se a ≤ c < e ≤ g e b ≤ d < f ≤ h, logo a < g e b < h, ou seja, [a, b] KM [g, h]. Proposição 5.3. A estrutura hIR++ , ≤KM , KM , [0, 0]i é uma VID intervalar. Demonstração. Falta apenas provar que esta estrutura é um conjunto d-dirigido com menor elemento separável. Dados [a, b], [c, d] ∈ IR++ , tem-se que I = [min{a, c}, max{b, d}] é uma cota inferior para {[a, b], [c, d]} e I ∈ IR++ , logo o conjunto é d-dirigido. Caso [0, 0] KM [a, b] e [0, 0] KM , [c, d], então min{a, c} > 0 e assim [0, 0] Km I o que conclui a demonstração. Exemplo 5.2. Seja (A, d) um espaço métrico usual e ε > 0 um número real fixado. A função dε : A × A −→ IR++ definida por: ( dε (a, b) = [d(a, b), d(a, b) + ε], se a 6= b . [0, 0], se a = b 66 (5.2) Capítulo 5. Métricas Intervalares é uma i-métrica intervalar relativa à VID hIR++ , ≤KM , KM , [0, 0]i. As duas primeiras condições de i-métrica intervalar são imediatas. Suponha dε (a, b) KM [ε, ε], com [ε, ε] 6= [0, 0]. Se a = b, então dε (a, b) = [0, 0]. Dessa forma, basta tomar ∆ = [ε, ε], pois assim, se dε (b, c) KM ∆, então dε (b, c) KM [ε, ε] e como a = b, segue que dε (a, c) KM [ε, ε]. Caso a 6= b, tem-se dε (a, b) = [d(a, b), d(a, b) + ε] KM [ε, ε], logo d(a, b) < ε e d(a, b) + ε < ε. Tome ∆ = [ε − d(a, b), ε − d(a, b)] e suponha dε (b, c) KM ∆. Se b = c, então o resultado segue imediatamente. Caso b 6= c, então dε (b, c) = [d(b, c), d(b, c) + ε] KM [ε − d(a, b), ε − d(a, b)], logo d(b, c) < ε − d(a, b) e d(b, c) + ε < ε − d(a, b), portanto d(a, b) + d(b, c) < ε e d(a, b) + d(b, c) + ε < ε, assim, da desigualdade triangular usual, segue que d(a, c) < ε e d(a, c) + ε < ε o que significa que dε (a, c) KM [ε, ε]. Esta métrica modela a situação em que a medição das distâncias é feita e os resultados são armazenados em uma máquina que realiza um truncamento no valor das medições, ou seja, as casas decimais a partir de uma certa ordem são desprezadas. Com isso, se ε é o menor número real positivo representado por esta máquina, então o valor real da distância entre a e b pertence ao intervalo dε (a, b), ou seja, dε (a, b) é uma aproximação deste valor real. 5.2 Representação e Métricas Intervalares Nesta seção é feita a ligação entre métricas intervalares e o importante conceito de representação intervalar (veja [Santiago et al 2006]). Definição 5.2 (Representação Intervalar). Uma função F : IRn −→ IR é uma representação intervalar de uma função f : Rn −→ R se f ([a1 , b1 ]×· · ·×[an , bn ]) ⊆ F([a1 , b1 ], . . . , [an , bn ]), para todo [ai , bi ] ∈ IR; em outras palavras, se x ∈ [a1 , b1 ] × · · · × [an , bn ], então f (x) ∈ F([a1 , b1 ], . . . , [an , bn ]). Neste caso, diz-se que F representa f . Exemplo 5.3. Considere a função f : R −→ R definida por f (x) = x + 1. As funções F, G : IR −→ IR definidas por F([a, b]) = [a, b+1] e G([a, b]) = [a+1, b+1] representam f. Exemplo 5.4. Considere a função F : IR −→ IR definida por F([a, b]) = [a − 1, b + 1]. Temos que F representa as funções reais f (x) = x − 1, g(x) = x e h(x) = x + 1. Pelo exemplo 5.3, fica evidente que uma função real pode ser representada por mais de uma função intervalar. Pode-se notar também que as funções F e G deste exemplo 67 Capítulo 5. Métricas Intervalares satisfazem G([a, b]) ⊂ F([a, b]), para todo [a, b] ∈ IR. Devido a este fato, pode-se dizer que a função G , em um certo sentido, está mais próxima de f do que F. Isso motiva a seguinte definição: Definição 5.3. Sejam F, G : IRn −→ IR duas funções intervalares as quais representam uma função real f : R −→ R. F é dita ser uma melhor representação intervalar de f do que G, o que é denotado por G v F, sempre que F([a1 , b1 ], ..., [an , bn ]) ⊆ G([a1 , b1 ], ..., [an , bn ]), para todo [ai , bi ] ∈ IR. Definição 5.4. Seja f : R −→ R uma função sem assíntotas verticais ( lim f (x) 6= ±∞, x−→a+ − para todo a ∈ R). A função fb: IR −→ IR definida por fb([a, b]) = [min f ([a, b]), max f ([a, b])] é chamada Representação Canônica Intervalar de f . A condição de f não ter assíntotas verticais garante que a função fb está bem definida. Proposição 5.4. Seja f : R −→ R uma função sem assíntotas verticais. Se F : IR −→ IR representa f , então F v fb, em outras palavras, a função fb é a melhor representação intervalar de f . A demonstração desta proposição pode ser encontrada em [Santiago et al 2006]. A próxima proposição mostra que a noção de i-métrica intervalar introduzida aqui não captura totalmente a noção de representação. Teorema 5.1. Não existe i-métrica intervalar di : IR × IR −→ IR+ V - valorada, onde V = hIR+ , ≤, R, [0, 0]i, que representa a métrica usual (euclidiana) em R. Demonstração. Como di ([a, b], [a, b]) = [0, 0], se a < b, então existem x, y ∈ [a, b] tal que d(x, y) = |x − y| > 0. Assim, x, y ∈ [a, b], mas d(x, y) ∈ / di ([a, b], [a, b]) = [0, 0]. 5.3 Métrica KM A representação canônica intervalar de uma função real é a função intervalar que melhor aproxima esta função. Por este motivo, aqui será considerado que uma noção generalizada de métrica capta satisfatoriamente as idéias de métrica intervalar e represenb b], [c, d]), se tação quando esta noção incluir a função definida por D([a, b], [c, d]) = d([a, [a, b] 6= [c, d] e D([a, b], [c, d]) = [0, 0], se [a, b] = [c, d] (aqui d é a distância euclidiana). Esta função difere da representação canônica da métrica euclidiana apenas no valor de D(X, X) quando X e não-degenerado. 68 Capítulo 5. Métricas Intervalares A seguir, será construído uma VID relativa a qual esta função D é uma i-métrica intervalar. Na proposição a seguir, é dada a caracterização da relação essencialmente abaixo estrita para ≤km . Proposição 5.5. Seja ∗ a relação essencialmente abaixo estrita para ≤km em IR+ . Assim: 1. Se a, b > 0, então [0, a] ∗ [0, b] ⇔ a < b; 2. Se a, b, c, d > 0, então [a, b] ∗ [c, d] ⇔ a < c e b < d. Demonstração. 1. Primeiro, suponha [0, a] ∗ [0, b] e considere o conjunto dirigido (cab deia) D = {[0, b − ]; n ∈ N∗ }. Note que sup D = [0, b], logo [0, b] ≤km sup D, o que n implica que existe [e, f ] ∈ D tal que [0, a] ≤km [e, f ]. Como [e, f ] ∈ D, então [e, f ] = b b [0, b − ] para algum n0 ∈ N∗ , então a ≤ b − ⇒ a < b. n0 n0 Agora, suponha a < b. Dado o conjunto D ⊆ IR+ com supremo [e, f ], tal que [0, b] ≤km [e, f ], defina A = {a ∈ R; ∃b ∈ R; [a, b] ∈ D} e B = {b ∈ R; ∃a ∈ R; [a, b] ∈ D}. Assim, estes conjuntos devem ser limitados, já que D tem supremo e, além disso, e = sup A e f = sup B. Como b ≤ f , então a < f , assim, existe s ∈ B tal que a ≤ s. Como s ∈ B, então existe i ∈ A tal que [i, s] ∈ D, logo [0, a] ≤km [i, s] o que implica em [0, a] ∗ [0, b]. c 2. Suponha [a, b] ∗ [c, d]. Considere o conjunto dirigido (cadeia) D = {[c − , d − n d ]; n ∈ N1 }. Note que sup D = [c, d], logo [c, d] ≤km sup D e existe [e, f ] ∈ D tal que n c d [a, b] ≤km [e, f ]. Como [e, f ] ∈ D, então [e, f ] = [c − , d − ], para algum n0 ∈ N∗ . n0 n0 c d Assim, temos a ≤ c − e b ≤ d − , portanto a < c e b < d. n0 n0 Por outro lado, suponha a < c e b < d. Dado um conjunto dirigido D ⊆ IR+ com supremo [e, f ], tal que [c, d] ≤km [e, f ] defina A = {a ∈ R; ∃b ∈ R; [a, b] ∈ D} e B = {b ∈ R; ∃a ∈ R; [a, b] ∈ D}. Estes conjuntos devem ser limitados, já que D possui supremo. Note que e = sup A e f = sup B. Como c ≤ e e d ≤ f ,então a < e e b < f , portanto existem i ∈ A e s ∈ B tais que a ≤ i e b ≤ s. Como i ∈ A, existe s0 ∈ B tal que [i, s0 ] ∈ D e desde que s ∈ B deve existir i0 ∈ A tal que [i0 , s] ∈ D. Como D é dirigido, existe [g, h] ∈ D tal que [i0 , s] ≤km [g, h] e [i, s0 ] ≤km [g, h], logo [a, b] ≤km [g, h]. Portanto, [a, b] ∗ [c, d]. Observação 5.1. Note que se [a, b] 6= [0, 0], então [0, 0] ∗ [a, b]. Teorema 5.2. A estrutura hIR+ , ≤km , ∗ , [0, 0]i é um reticulado com menor elemento separável. 69 Capítulo 5. Métricas Intervalares Demonstração. Suponha [a, b], [c, d] ∈ IR+ − [0, 0]. Assim, b > 0 e d > 0, portanto min{b, d} > 0. Como [a, b] ∧ [c, d] = [min{a, c}, min{b, d}], tem-se [a, b] ∧ [c, d] 6= [0, 0]. Com isso, pode-se concluir que a estrutura ωKM = hIR+ , ≤km , ∗ , [0, 0]i é uma VID, a qual será chamada de VID de Kulisch-Miranker. Teorema 5.3. Dados dois intervalos X,Y ∈ IR, considere o conjunto DXY = {d(x, y) : x ∈ X and y ∈ Y } = [min DXY , max DXY ] de todas as distâncias entre elementos de X e de Y (aqui, d é a distância euclidiana) . A função dKM : IR × IR −→ IR+ definida por: ( dKM (X,Y ) = [0, 0] , se X = Y DXY , se X 6= Y (5.3) é uma i-métrica intervalar ωKM -valorada. Demonstração. Se X = Y , então dKM (X,Y ) = [0, 0]. Suponha X 6= Y . Assim, existem x ∈ X e y ∈ Y com x 6= y, portanto d(x, y) > 0 e, consequentemente, max DXY > 0, o que significa que dKM (X,Y ) 6= [0, 0]. Logo, a primeira condição de i-métrica intervalar é válida. A segunda condição é trivial, já que d é uma métrica usual. Agora, suponha que dKM (X,Y ) ∗ Σ = [ε, ε], com [0, 0] ∗ Σ. Se X = Y , o resultado segue imediatamente. Sendo assim, considere X 6= Y . Dessa forma, max DXY < ε. Y −Y ]. Note que [0, 0] ∗ Primeiramente, considere Y < Y . Neste caso, tome ∆ = [0, 2 Y −Y Y −Y ∆. Se z ∈ R, então d(z,Y ) ≥ ou d(z,Y ) ≥ , assim para cada intervalo Z, 2 2 Y −Y tem-se max DY Z ≥ . Dessa forma, se Z 6= Y , então dKM (Y, Z) 6∗ ∆. Portanto, 2 dKM (Y, Z) ∗ ∆ ⇒ Y = Z ⇒ dKM (X, Z) = dKM (X,Y ) ∗ Σ. Agora, considere o caso Y = [y, y]. Defina ∆ = [0, ε−max DXY ]. Suponha que dKM (Y, Z) ∗ ∆. Se Y = Z o resultado segue imediatamente. Se Y 6= Z, então min DY Z = 0 ⇒ y ∈ Z ⇒ min DXZ ≤ min DXY e max DY Z < ε − max DXY ⇒ max DXY + max DY Z < ε. Defina D = {d(x, y) + d(y, z); x ∈ X, y ∈ Y, z ∈ Z}. Note que D ⊆ DXY + DY Z ⇒ max D ≤ max(DXY + DY Z ) = max DXY + max DY Z < ε. Devido a desigualdade triangular de d, segue que max DXZ ≤ max D < ε. Portanto, dKM (X, Z) ∗ Σ. A função dKM apresentada no teorema acima será chamada métrica KM. Esta função não é uma métrica generalizada quando se considera a ordem de Kulisch-Miranker e a adição usual de intervalos definida por Moore. De fato, basta tomar os seguintes intervalos X = [0, 1], Y = [1, 2] e Z = [2, 3]. Assim, dKM (X,Y ) = [0, 2], dKM (X, Z) = [1, 3] 70 Capítulo 5. Métricas Intervalares e dKM (Y, Z) = [0, 2], logo dKM (X, Z) 6≤KM dKM (X,Y ) + dKM (Y, Z). Isso significa que a noção de métrica generalizada não capta satisfatoriamente as idéias de métrica intervalar e representação. Este fato justifica a proposta do conceito de i-métrica, a qual tem como caso particular as métricas intervalares. 5.3.1 Sobre a Aplicabilidade da Métrica KM Aqui, serão feitas algumas observações sobre a aplicabilidade da métrica KM. • Classificação: Esta i-métrica não é adequada para ser aplicada em algoritmos de classificação (ou clusterização) pois, nesses algoritmos, o ponto principal é determinar se X está mais próximo de Y ou de Z, ou seja, procura-se descobrir quem é menor d(X,Y ) ou d(X, Z), segundo a ordem ≤KM . Como esta ordem é apenas parcial, nem sempre os valores de dKM (X,Y ) e dKM (X, Z) são comparáveis. Como exemplo, considere X = [0, 5], Y = [6, 7] e Z = [4, 8]. Dessa forma, dKM (X,Y ) = [1, 7] e dKM (X, Z) = [0, 8], os quais não são comparáveis. • Quantização de Sinais: Uma possível aplicação para dKM seria no processo de quantização de sinais intervalares (veja [Trindade 2009] e [Santana et al 2011]). Um sinal intervalar discreto é representado por uma função S : Z −→ IR, onde para cada n ∈ Z, S(n) é chamado pulso do sinal. Em geral, esta representção intervalar de um sinal provém da representação usual, a qual é dada por uma função do tipo s : Z −→ R. Devido às incertezas que a obtenção dos pulsos do sinal apresentam (problemas de precisão dos instrumentos, representação em máquina, etc.), cada pulso s(n) é substituído por um pulso intervalar S(n) de modo que haja garantia de que o valor correto do pulso esteja no intervalo S(n). Em [Santana et al 2011] é feito um processo de passagem de um sinal usual para um sinal intervalar, onde é usada a chamada função aproximação, a qual leva um número real no menor intervalo representável no sistema de ponto flutuante escolhido que o contém. Como o sinal s pode assumir qualquer valor em R, com o objetivo de reduzir o custo computacional do processamento do sinal, são escolhidos alguns valores entre min s e max s, digamos valores em Q = {q1 , ..., ql }, 1 e cada pulso s(n) é substituído pelo valor de Q que lhe for mais próximo. Neste caso, ao fazer a passagem de s para S, deve-se calcular dKM (S(n), [qi , qi ]) para cada i ∈ {1, ..., l} e ver qual desses valores é o menor (segundo dKM ). Para que isso seja possível esses valores devem ser comparáveis segundo ≤KM , o que é confirmado no teorema abaixo. 1 Esta escolha não é aleatória. Uma forma de fazê-la pode ser encontrada em [Oppenheim e Shafer 1989] 71 Capítulo 5. Métricas Intervalares Teorema 5.4. Dados X ∈ IR, a, b ∈ R, tem-se dKM (X, [a, a]) ≤km dKM (X, [b, b]) ou dKM (X, [b, b]) ≤km dKM (X, [a, a]). Demonstração. Seja X = [x, x. Suponha que a ∈ X e b ∈ / X e considere dKM (X, [a, a]) = [0, ε] e dKM (X, [b, b]) = [t, z]. Note que ε ≤ |x − x|, t > 0 e z = t + |x − x|, logo dKM (X, [a, a]) ≤km dKM (X, [b, b]). Agora, suponha a ∈ /X e b∈ / X. Dessa forma, dKM (X, [a, a]) = [t,t + |x − x|] e dKM (X, [b, b]) = [z, z+|x−x|], os quais são trivialmente comparáveis, segundo ≤km . Por fim, suponha a, b ∈ X. Dessa forma, dKM (X, [a, a]) = [0,t] e dKM (X, [a, a]) = [0, z], os quais também são trivialmente comparáveis. Com isso, conclui-se que um processo de quantização para sinais intervalares baseado na métrica KM é possível. Entretanto, tem-se dKM (X, [a, a]) = [min{|x − a|, |x −a|}, max{|x −a|, |x −a|}] = [min{|x −a|, |x −a|}, dM (x, [a, a])] o que implica em dKM (X, [a, a]) ≤km dKM (X, [b, b]) se, e somente se, dM (X, [a, a]) ≤ dM (X, [a, a]), ou seja, os resultados de um processo de quantização via dKM seriam os mesmos de um processo baseado na métrica de Moore dM . • Busca Simples: Contudo, dKM pode ser usada em buscas de maneira a dar mais controle sobre os resultados. Por exemplo, pode-se desejar fazer uma busca dentro de um banco de dados intervalares que retorne apenas intervalos X que representam o número real a (ou seja, tais que a ∈ X) cujos os extremos estejam a uma distância no máximo igual a r > 0 de a. Dessa forma, se D é este banco de dados, então o resultado desta busca é IR ∩ B([a, a], [0, r]), isto é, uma busca simples por abrangência dentro deste banco de dados daria o resultado, o que não ocorre se for usada a métrica de Moore. 5.4 Topologia Gerada por dKM Nesta seção, serão vistas algumas propriedades da topologia gerada pela métrica dKM . A principal é o fato de que esta topologia, a qual será denotada por ℑKM , é de Hausdorff e regular. Lema 5.1. Se X é um intervalo não-degenerado, então {X} é um aberto de ℑKM . Demonstração. Considere X ∈ IR, com X < X. Tome ∆ = [0, ∆ e se X 6= Y , então max DXY ≥ X −X ]. Note que [0, 0] ∗ 2 X −X ⇒ dKM (X,Y ) 6∗ ∆. Portanto, dKM (X,Y ) ∗ ∆ ⇒ 2 72 Capítulo 5. Métricas Intervalares X = Y , ou seja, a bola aberta, a qual já foi provada ser um aberto de ℑKM , B(X, ∆) é igual a {X}. Esse lema (o qual será usado no próximo teorema) mostra que a topologia ℑKM é “quase discreta”, pois todos os conjunto unitários {X}, com X não-degenerado é aberto. Contudo essa topologia não é trivial, pois o conjunto {[a, a]} não é aberto para qualquer a ∈ R. De fato, dado [0, 0] ∗ [ε, ε], tem-se ε > 0. Sendo assim, tome X = [a, a + 2ε ]. Note que dKM ([a, a], X) = [0, 2ε ]) ∗ [ε, ε], assim, X ∈ B([a, a], [ε, ε]). Segue que toda bola aberta com centro em [a, a] contém algum outro elemento de IR diferente de [a, a]. Um outro fato curioso sobre esta topologia é que para cada [a, a] ∈ IR, existe uma bola aberta B1 = B([a, a], ∆) tal que o único intervalo degenerado em B1 é o próprio [a, a]. De fato, basta tomar ∆ = [0, ε], com ε > 0. Assim, como d([a, a], [b, b]) = [|a − b|, |a − b|], então se a 6= b, temos |a − b| > 0 o que implica em d([a, a], [b, b]) 6∗ ∆. Ou seja, esta topologia, quando restrita ao conjunto dos intervalos degenerados é a topologia discreta. Proposição 5.6. A topologia ℑKM é de Hausdorff. Demonstração. Sejam X,Y ∈ IR. Deve-se mostrar que existem dois abertos disjuntos A e B tais que X ∈ A e Y ∈ B. Se X e Y são intervalos não-degenerados, então os conjuntos (disjuntos) {X} e {Y } são abertos (de acordo com o lema anterior). Agora, considere o caso X = [x, x] e Y = [Y ,Y ], com Y < Y . Tome 0 < r < max |x − y∈Y y| e considere a bola aberta B = B([x, x], [0, r]). Note que dKM ([x, x], [Y ,Y ]) = [min |x − y∈Y y|, max |x − y|], portanto, como max |x − y| > r, segue que [Y ,Y ] ∈ / B. Assim, B e {[Y ,Y ]} y∈Y y∈Y são os abertos disjuntos contendo X e Y . Finalmente, considere o caso X = [x, x] e Y = [y, y]. Tome r = |x −y| > 0 e considere as bolas abertas B1 = B([x, x], [0, 2r ] e B2 = B([y, y], [0, 2r ]. O único intervalo degenerado em B1 é [x, x] e em B2 é [y, y]. Tome A = [A, A], com A < A e suponha que A ∈ B1 ∩ B2 . Assim, r r max |x − a| < e max |y − a| < . Considere a1 , a2 ∈ A tais que |x − a1 | = max |x − a| a∈A a∈A 2 a∈A 2 e |y − a2 | = max |y − a|. Dessa forma, |x − a1 | < 2r e |y − a2 | < 2r , o que implica, pela a∈A desigualdade triangular usual, em |x−y| ≤ |x−a1 |+|y−a1 | ≤ |x−a1 |+|y−a2 | < 2r + 2r = / r, i.e., |x − y| < r, o que é uma contradição, portanto, B1 ∩ B2 = 0. Um outro axioma de separação em espaços topológicos é o axioma de regularidade. Diz-se que um espaço topológico de Hausdorff (M, τ) é regular (ou T3 ) quando para cada x ∈ M e para cada conjunto fechado Y , tal que x ∈ / Y , existem abertos disjuntos A e B, tais que x ∈ A e Y ⊆ B. Essa propriedade de separação é mais forte do que a propriedade de Hausdorff e de fato existem espaços topológicos que são de Hausdorff mas não são 73 Capítulo 5. Métricas Intervalares regulares (um exemplo pode ser visto na pag. 141 de [Dugundji 1966]). Para mostrar que a topologia ℑKM também é regular será usado o seguinte resultado, cuja demonstração pode ser encontrada na página 141 de [Dugundji 1966]. Lema 5.2. Um espaço topológico (M, τ) é regular se, e somente, se para cada a ∈ M e para cada vizinhança O de a, existe uma vizinhança V de a tal que a ∈ V ⊆ V ⊆ O. Também será usado o fato de que as bolas abertas B([a, a], [0, r]), com r > 0 são conjuntos fechados. De fato, deve-se mostrar que o complementar de B = B([a, a], [0, r]) é / B, então {[x, x]} é uma vizinhança de [x, x] contida no complemenaberto. Se [x, x] ∈ tar de B. Para [x, x] ∈ / B, tem-se |x − a| = r1 > 0. Assim, basta tomar a bola aberta B1 = B([x, x], [0, r1 ]). Essa bola aberta está contida no complementar de B. Note que o único intervalo degenerado de B1 é o seu centro [x, x], o qual não está em B. Agora, considere X = [x, x] ∈ B1 , com x < x. Deve-se ter x ≤ x ≤ x e max DX[X] < r1 , onde [X] = [x, x]. Note que max DX[x,x] = max{x − x, x − x}, assim, x − x < r1 e x − x < r1 . Logo, dado / [x, x] e assim [x, x] ∈ / B. z ∈ [x, x], segue que |z − x| < r1 , portanto a ∈ Teorema 5.5. A topologia ℑKM é regular. Demonstração. Se X = [x, x], com x < x, então V = {X} é um conjunto aberto e fechado, logo X ∈ V ⊆ V ⊂ U para qualquer aberto U tal que X ∈ U. Se X = [x, x] e U é um aberto tal que X ∈ U, então existe uma bola aberta B = B(X, [0, r]) contida em U. Como B é fechado, temos B = B, logo X ⊆ B ⊆ B ⊆ U. Assim, segue do lema anterior que ℑKM é regular. Um resultado já clássico da topologia diz que toda topologia metrizável é regular. A topologia ℑKM é regular e uma pergunta surge imediatamente: esta topologia é metrizável? Em muitos casos é um problema complicado descobrir se uma dada topologia é ou não metrizável. A idéia de procurar uma métrica que gera esta topologia não é uma maneira muito eficiente de responder esta pergunta. Por isso, muitos estudos foram feitos no sentido de encontrar uma caracterização das topologias metrizáveis. Um dos resultados mais celebrados nesta área foi o resultado devido a Nagata e Smirnov, o qual é enunciado abaixo e cuja demonstração pode ser encontrada em [Dugundji 1966] e [Nagata 1986]: Teorema 5.6 (Teorema de Nagata-Smirnov). Uma topologia τ é metrizável se, e somente se, é regular e existe uma base B de τ de forma que B pode ser decomposta como a união de uma quantidade enumerável de classes localmente finitas de abertos. Uma classe A de subconjuntos de um espaço topológico (M, τ) é localmente finita se para cada x ∈ M existe uma vizinhança de x que tem interseção não-vazia com no máximo um número finito de elementos da classe. 74 Capítulo 5. Métricas Intervalares Como a topologia ℑKM é regular, para decidir se ela é metrizável, deve-se investigar se ela tem uma base com as características apontadas no enunciado do teorema. Este é um problema para o qual ainda não há solução. Algumas características desta topologia indicam que ela não é metrizável. Por exemplo, existem vizinhanças de um ponto cujos elementos tem interseção não vazia com o ponto em questão, quando o consideramos como conjunto (intervalo), ou seja, os elementos de IR são tratados como pontos quando se pensa na i-métrica dKM e como conjuntos quando se trata da topologia subjacente. Também é possível existirem vizinhanças de um ponto tal que todos os elementos de cada ponto desta vizinhança estão no mínimo a uma distância a e no máximo a uma distância b de um determinado número x (basta pensar numa bola aberta B([x, x], [a, b]) ) e parece impossível fazer isso usando uma métrica, ou seja, usando apenas um número real como raio. Caso a suspeita de que esta topologia não é metrizável se confirme, ela será um exemplo construído de maneira natural de um espaço regular que não é metrizável, o que constitui um exemplo interessante dentro da área de topologia. 5.5 KM-Continuidade Nesta seção, serão vistos alguns aspectos sobre a continuidade de funções F : IR −→ IR com respeito a métrica KM. Definição 5.5 (KM-continuidade). As funções do tipo F : IR −→ IR i-contínuas em pontos X ∈ IR com respeito a métrica intervalar dKM serão chamadas de funções KMcontínuas em X. Se a função for KM-contínua em todo X ∈ IR, ela será chamada KM-contínua. Teorema 5.7. Toda função F : IR −→ IR é KM-contínua em cada intervalo não-degenerado [X, X]. Demonstração. Considere X ∈ IR, com X < X. Dado Σ tal que [0, 0] ∗ Σ, defina ∆ = X −X X −X [0, ]. Assim, se X 6= Y , então max DXY ≥ ⇒ dKM (X,Y ) 6∗ ∆. Portanto, 2 2 dKM (X,Y ) ∗ ∆ ⇒ X = Y ⇒ dKM (F(X), F(Y )) = [0, 0] ∗ Σ. Observação 5.2. Segue deste último teorema que para determinar se uma função é KMcontínua, basta determinar se ela é KM-contínua nos intervalos degenerados. A seguir, são apresentados exemplos de funções que não são KM-contínuas. 75 Capítulo 5. Métricas Intervalares Exemplo 5.5. Seja F : IR −→ IR a função definida por: ( F(X) = X , se X ≤ 1 . [X, X + 1] , se X > 1. Esta função não é KM-contínua em [1, 1]. Tome Σ = [0, 1]. Dado ∆ = [δ, δ] com [0, 0] ∗ δ δ δ ∆ defina Y = [1, 1 + ], em dKM (X,Y ) = dKM ([1, 1], [1, 1 + ]) = [0, ] ∗ ∆, mas 2 2 2 δ δ dKM (F(X), F(Y )) = dKM ([1, 1], [1, 2 + ]) = [0, 1 + ] 6∗ Σ. 2 2 Teorema 5.8. Seja F : IR −→ IR uma função e [a, a] ∈ IR tal que F([a, a]) = [z, z], com z < z. Assim, F é KM-contínua em [a, a] se, e somente se, F é constante em B([a, a], ∆) para algum ∆ ∈ IR+ − {[0, 0]}. Demonstração. Se F é constante em B([a, a], ∆) para algum ∆ ∈ IR − {[0, 0]}, então é imediato que F é KM-contínua em [a, a]. Agora, suponha que não existe ∆ ∈ IR+ −{[0, 0]} tal que F é constante em B([a, a], ∆). z−z Assim, considere [0, 0[∗ Σ = [0, 2 ]. Temos Σ ∈ IR+ − {[0, 0]}. Para cada ∆ ∈ IR+ com [0, 0] ∗ ∆, existe X ∈ IR tal que dKM ([a, a], X) ∗ ∆ e F(X) 6= F([a, a]). Portanto, z−z max DF([a,a])F(X) ≥ 2 , logo dKM (F([a, a]), F(X)) 6∗ Σ, consequentemente F não é KMcontínua em [a, a]. Exemplo 5.6. A função F : IR −→ IR definida por F(X) = [X, X + 1] não é KM-contínua em [a, a] (qualquer que seja [a, a] ∈ IR). De fato, F([a, a]) = [a, a+1]. Dado ∆ = [δ, δ] ∈ IR+ , com[0, 0] ∗ ∆, tome X = [a, a+ δ δ δ ∗ 2 ], então dKM ([a, a], X) = [0, 2 ] ∆, e F(X) = [a, a + 2 + 1] 6= [a, a + 1] = F([a, a]). Assim, não existe ∆ ∈ IR+ com [0, ] ∗ ∆ tal que F é constante em B([a, a], ∆), logo F não é KM-contínua em [a, a]. 5.6 KM-Continuidade e Representação Os próximos dois exemplos mostram que é possível que uma função real contínua seja representada por uma função intervalar que não é KM-contínua e que uma função intervalar KM-contínua represente uma função real descontínua, ou seja, o fato de a métrica KM ser a que melhor representa a métrica usual (euclidiana) da reta não implica na preservação da continuidade para uma representação intervalar de uma função real. Entretanto, no caso da representação canônica intervalar, tal preservação ocorre, como será mostrado a seguir. 76 Capítulo 5. Métricas Intervalares ( 1 , se x ≥ 0 . Esta 0 , se x < 0 função é claramente descontínua em x = 0. A função intervalar constante G(x) = [0, 1] é KM-contínua e representa f . Exemplo 5.7. Seja g : R −→ R a função definida por g(x) = Exemplo 5.8. Considere a função identidade real f (x) = x e a função F do exemplo 5.5. Desde que X ⊆ F(X), temos que F representa f mas, como já foi visto, F não é KM-contínua. Teorema 5.9 (Teorema de Representação). Uma função f : R −→ R sem assíntotas verticais é contínua (com respeito a métrica euclidiana em R) se, e somente se, fb é KMcontínua. Demonstração. Primeiramente, suponha que f é contínua. Como já foi visto, é suficiente provar que fb é KM-contínua em um intervalo degenerado arbitrário [a, a]. Dado [0, 0] ∗ Σ = [ε, ε], tem-se ε > 0. Como f é contínua em a, existe δ > 0 tal que d(x, a) < δ ⇒ d( f (x), f (a)) < ε. Tome [0, 0] ∗ ∆ = [0, δ] e suponha que dKM ([a, a], X) ∗ ∆. Se [a, a] = X, então o resultado segue imediatamente. Se [a, a] 6= X, então min D[a,a]X = 0 ⇒ a ∈ X e max D[a,a]X < δ ⇒ X ⊆ (a−δ, a+δ), logo para todo x ∈ X, tem-se d( f (a), f (x)) < ε ⇒ max d( f (a), f (x)) < ε. Note que fb([a, a]) = [ f (a), f (a)] e fb(X) = [min f (X), max f (X)], x∈X logo dKM ( fb([a, a]), fb(Y )) = [ min d( f (a), y), max d( f (a), y)]. y∈ fb(X) y∈ fb(X) Assim, a ∈ X, min d( f (a), y) = 0, e max d( f (a), y) = max{d( f (a), min f (X)), y∈ fb(X) y∈ fb(X) d( f (a), max f (X))}, então max d( f (a), y) ≤ maxx∈X d( f (a), f (x)) < ε. Dessa forma, y∈ fb(X) dKM ( fb([a, a], fb(X)) ∗ Σ, logo fb é KM-contínua. Agora, suponha que fb é KM-contínua em [a, a]. Dado ε > 0, tome [0, 0] ∗ Σ = [0, ε]. Desde que fb é KM-contínua em [a, a], existe [0, 0] ∗ ∆ = [δ, δ] tal que dKM ([a, a], X) ∗ δ ∆ ⇒ dKM ( fb([a, a]), fb(X)) ∗ Σ. Tome δ = > 0 e suponha d(a, x) < δ. Assim, se 2 d(a, x) < δ, então x ∈ X. Considere o intervalo X = [a − δ, a + δ]. Assim, dKM ([a, a], X) = [0, δ] ∗ ∆ ⇒ dKM ( fb([a, a]), fb(X)) = dKM ([ f (a), f (a)], [min f (X), max f (X)]) ∗ Σ. Portanto, max d( f (a), y) < ε. Como x ∈ X, segue que f (x) ∈ [min f (X), max f (X)] ⇒ y∈ fb(X) d( f (a), f (x)) < ε, portanto f é contínua em a. 5.7 Comparando KM, Scott e Moore-continuidades Nesta seção, é feita uma comparação entre a KM-continuidade e outras duas noções de continuidade em IR já bastante estudadas, a saber, as de Scott ([Santiago et al 2006] 77 Capítulo 5. Métricas Intervalares e [Acióly e Bedregal 1997]) e de Moore ([Moore 1962] e [Oliveira et al 1997]) dando, com isso, mais um passo nas investigações feitas em [Santiago et al 2004], [Santiago et al 2005] e [Santiago et al 2006] , sobre as relações entre topologia e representação. Estas comparações serão feitas com base na apresentação de exemplos de funções que são contínuas com respeito a uma topologia e não são em relação a outra. A topologia de Moore é aquela gerada pela métrica de Moore, a qual nada mais é do que uma métrica no sentido usual. Na próxima seção será apresentada uma breve descrição da topologia de Scott em IR. 5.7.1 Topologia de Scott Definição 5.6. Um conjunto parcialmente ordenado hA, ≤i é chamado DCPO (do inglês: directed complete partial order) se todo conjunto dirigido D ⊆ A possui supremo em A. Teorema 5.10. O conjunto hIR, vi é um DCPO, onde a ordem parcial v é definida por X v Y ⇔ Y ⊆ X. Demonstração. Veja [Santiago et al 2005]. A ordem v ficou conhecida como ordem de informação em IR e foi proposta em [Scott 1970]. Levando em conta que intervalos são usados como aproximações de um certo número real, o fato de que X v Y significa que Y é uma melhor aproximação deste número do que X, o que é interpretado como “Y informa melhor sobre o número do que X” ou “Y informa sobre X". A métrica-KM tem uma relação com esta ordem, já que, como foi visto, é possível que bolas abertas B(X, ε) contenham apenas elementos que informam sobre X, bastando para isso escolher um raio do tipo [0, ε]. Teorema 5.11. Seja hA, ≤i um DCPO. Defina a classe ΩS (A) de subconjuntos de A estabelecendo que O ∈ ΩS (A) quando satisfaz: 1. Se x ∈ O e x ≤ y, então y ∈ O; / 2. Se D ⊆ A é um conjunto dirigido e sup D ∈ O, então D ∩ O 6= 0. A classe ΩS (A) é uma topologia em A chamada Topologia de Scott. Demonstração. Veja [Gierz et al 2003]. Uma função f : D1 −→ D2 , onde D1 e D2 são DCPO´s, é dita ser Scott-contínua se f é uma função contínua com respeito as topologias de Scott ΩS (D1 ) e ΩS (D2 ). 78 Capítulo 5. Métricas Intervalares Teorema 5.12. Se f : A −→ B, onde hA, ≤A i e hB, ≤B i são DCPO´s, é uma função Scottcontínua, então f é monótona (se x ≤A y ⇒ f (x) ≤B f (y)). Demonstração. Veja [Santiago et al 2005]. Definição 5.7. Uma função f : A −→ B, onde A e B são DCPO’s, é chamada ord-contínua se para todo conjunto dirigido D ⊆ A tem-se f (sup D) = sup f (D). Teorema 5.13. Uma função f : A −→ B, onde A e B são DCPO´s, é Scott-contínua se, e somente se, é ord-contínua. Demonstração. Veja [Santiago et al 2005]. Juntando o teorema de representação 5.9 para KM-continuidade com os teoremas de representação demonstrados em [Santiago et al 2006] segue o seguinte: Teorema 5.14. Seja f : R −→ R uma função sem assíntotas verticais. As seguintes afirmações são equivalentes: i) f é contínua (no sentido usual); ii) fb é Scott-contínua; iii) fb é Moore-contínua; iv) fb é KM-contínua. 5.7.2 Independência entre as 3 Noções de Continuidade Nesta seção são apresentados os exemplos que asseguram que as noções de continuidade são independentes. Proposição 5.7. Existe função que é KM-contínua, mas que não é Moore-contínua. Demonstração. Seja F : IR −→ IR a função definida por: ( F(X) = [−1, 1] , se 0 ∈ X . [0, 0] , se 0 ∈ /X (5.4) Em [Santiago et al 2006], pg. 236, foi provado que esta função não é Moore-contínua. De acordo com o corolário 5.2, para mostrar que ela é KM-contínua basta mostrar que ela o é em cada intervalo degenerado. Primeiro, será mostrado que F é KM-contínua em [0, 0]. Tome ∆ = [0, 1] e note que se d([0, 0], X) ∗ ∆, então 0 ∈ X. Sendo assim, F(X) = F([0, 0]) = [−1, 1], para todo X ∈ B([0, 0], ∆), o que implica que F é KM-contínua em [0, 0]. 79 Capítulo 5. Métricas Intervalares Agora, tome [a, a] 6= [0, 0]. Dado [0, 0] ∗ Σ = [ε, ε], tome [0, 0] ∗ ∆ = [0, |a| 2 ] e |a| |a| ∗ suponha que dKM ([a, a], X) ∆. Assim, a ∈ X e X ⊆ [a − 2 , a + 2 ]. Note que 0 ∈ / |a| |a| / X ⇒ F(X) = F([a, a]) = [0, 0] ⇒ dKM (F([a, a]), F(X)) = [a − 2 , a + 2 ], portanto 0 ∈ ∗ [0, 0] Σ, o que prova que F é KM-contínua em [a, a]. Proposição 5.8. Existe função que é Moore-contínua mas que não é KM-contínua. Demonstração. Seja F : IR −→ IR a função definida por: 1 F(X) = m(X) + (X − m(X)) (5.5) 2 onde m(X) é o ponto médio de X. Em [Santiago et al 2005], pg. 11, foi provado que esta função é Moore-contínua e que pode ser reescrita como: X −X X −X F(X) = X + ,X − 4 4 (5.6) Esta função não é KM-contínua em [0, 0]. De fato, tome [0, 0] ∗ Σ = [0, 1]. Dado δ δ δ [0, 0] ∗ ∆ = [δ, δ], seja X = [0, ]. Assim, dKM ([0, 0], [0, ]) = [0, ] ∗ ∆. Como 2 2 2 δ δ δ δ δ δ F([0, 0]) = [0, 0] e F(X) = [ , − ], segue que dKM (F([0, 0]), F(X)) = [ , − ] 6∗ Σ, 8 2 8 8 2 8 o que prova que F não é KM-contínua em [0, 0]. Proposição 5.9. Existe função que é KM-contínua, mas que não é Scott-contínua. Demonstração. Seja F : IR −→ IR a função definida por: ( F(X) = [0, 0] , se 0 ∈ X . [−1, 1] , se 0 ∈ /X Esta função é KM-contínua e a demonstração é análoga a demonstração da proposição 4.5. Note que [0, 1] v [1, 1], mas F([0, 1]) = [0, 0] 6v [−1, 1] = F([1, 1]), então esta função não é monótona e, portanto, não é Scott-contínua. Proposição 5.10. Existe função que é Scott-contínua mas que não é KM-contínua. Demonstração. Seja F : IR −→ IR a função definida por F(X) = [X, X + 1]. No exemplo 5.6 foi visto que esta função não é KM-contínua. Agora, será mostrado que ela é Scottcontínua. 80 Capítulo 5. Métricas Intervalares Considere D ⊆ IR um conjunto dirigido, com respeito a ordem v. Seja sup D = [s, s]. Sendo assim, X v S, para todo X ∈ D. Além disso, se Y é tal que X v Y para todo X ∈ D, então sup D v Y e F(sup D) = [s, s + 1]. Basta mostrar que sup(D) = [s, s + 1]. Primeiramente, suponha que existe X ∈ D tal que F(X) 6v [s, s + 1], então [x, x + 1] 6v [s, s + 1] ⇒ [x, x] 6v [s, s], o que contradiz o fato de que sup D = [s, s]. Com isso, conclui-se que F(sup D) é uma cota superior para F(D). Agora, seja Y = [y, y] um intervalo tal que F(X) v Y , para todo X ∈ D e suponha que F(sup D) 6v Y , i.e., [s, y + 1] 6v [y, y] ⇒ s > y ou s + 1 < y. Se s > y, considere o intervalo [y, s]. Assim, temos que [y, s] é uma cota superior para D, [y, s] v [s, s] e [y, s] 6= [s, s] o que contradiz [s, s] = sup D. Se s + 1 < y, então [s, y] é uma cota superior para D, [s, y] v [s, s] e [s, y] 6= [s, s] o que contradiz [s, s] = sup D. 5.8 i-Métricas Deslocadas Segue do teorema 5.1 que nenhuma i-métrica intervalar ωkm -valorada representa a métrica euclidiana dE da reta. Em [Trintade et al 2010] foi introduzida a chamada métrica essencialmente intervalar, a qual, nada mais é, do que a representação canônica intervalar de dE . Naquele artigo, foram abordadas e demonstradas várias propriedades operacionais desta métrica, sem entrar em questões topológicas. Em [Matthews 1985] foi introduzido o conceito de métrica de domínios o qual foi estudado e renomeado para métrica deslocada em [Hitzler e Seda 2000]. Tal conceito é apresentado abaixo. Definição 5.8. Uma métrica deslocada em um conjunto não-vazio M é uma função d : M × M −→ R que satisfaz: 1. 2. 3. 4. d(x, y) ≥ 0; d(x, y) = d(y, x); Se d(x, y) = 0, então x = y; d(x, z) ≤ d(x, y) + d(y, z). Note que se d é uma métrica deslocada, então pode ocorrer d(x, x) > 0. A construção de uma topologia a partir de uma métrica também funciona para métricas deslocadas. A única diferença é que pode ocorrer de o centro de uma bola aberta não pertencer a própria bola. Na verdade, pode ocorrer de uma bola aberta ser vazia. A função d : M × M −→ R / dada por d(x, y) = 1 é uma métrica deslocada e B(0, 1/2) = 0. Definição 5.9 (i-Métrica Deslocada). Seja M um conjunto não-vazio e V = hA, ≤, R, ⊥i uma VID. Uma função d : M × M −→ A é chamada i-métrica deslocada V -valorada quando satisfaz: 81 Capítulo 5. Métricas Intervalares 1. Se d(a, b) ∈ ⊥, então a = b; 2. d(a, b) ≤ d(b, a) e d(b, a) ≤ d(a, b), para quaisquer a, b ∈ M; 3. Se d(a, b)Rε, para algum ε ∈ A com ⊥Rε, então existe δ ∈ A com ⊥Rδ tal que d(b, c)Rδ ⇒ d(a, c)Rε. Neste caso, a tripla (M, d, hA, ≤, R, ⊥i) é chamada espaço i-métrico deslocado. A representação canônica de dE (ou métrica essencialmente intervalar), a qual será b é uma i-métrica deslocada ωKM -valorada. Seja τ a topologia construída a denotada por d, partir de db do mesmo modo como é construída uma topologia a partir de uma i-métrica. Serão usadas as notações BKM (X, ε) e Bd (X, ε) para indicar as bolas abertas relatib repectivamente. Note que se X é um intervalo não-degenerado, então vasa dKM e d, x−x Bd X, [0, 2 ] = 0/ e se X = [x, x], então BKM (X, [a, b]) = Bd (X, [a, b]). Teorema 5.15. ℑKM = τ. x−x Demonstração. Seja O ∈ ℑKM . Tome X ∈ O. Se X é não-degenerado, tem-se Bd X, [0, 2 ] = 0/ ⊆ O, ou seja, existe uma bola aberta de centro X contida em O. Seja X = [x, x]. Como O ∈ ℑKM , existe [0, 0] ∗ ε tal que BKM (X, ε) = Bd (X, ε) ⊆ O. Assim, O ∈ τ, portanto, ℑKM ⊆ τ. x−x Agora, tome O ∈ τ. Seja X ∈ O. Se X é não-degenerado, então BKM X, [0, 2 ] = {X} ⊆ O e se X = [x, x], então existe [0, 0] ∗ ε tal que Bd (X, ε) ⊆ O, logo BKM (X, ε) = Bd (X, ε) ⊆ O. Assim, O ∈ ℑKM ⇒ τ ⊆ ℑKM ⇒ τ = ℑKM . A i-métrica deslocada db é a melhor representação intervalar de dE e, como τ = ℑKM , então todos os resultados sobre continuidade de funções relativos a dKM também valem b Com isso, fica mostrado que a noção de i-métrica deslocada comporta a melhor para d. representação intervalar da métrica euclidiana (ou métrica essencialmente intervalar). 82 Capítulo 6 Considerações Finais Neste trabalho foi feita uma pesquisa sobre várias generalizações do conceito de distâncias já existentes e foi proposta a noção de i-distância, a qual mostrou-se adequada para representar intervalarmente a distância euclidiana. Também foi visto que várias noções generalizadas de distãncias são casos particulares de i-distâncias. Como as i-distâncias geram topologias de maneira muito natural, vários conceitos topológicos usuais podem ser abordados partindo-se de i-distâncias. Dentre estes, neste trabalho foram abordados os conceitos de continuidade e de separabilidade (propriedade de Hausdorff e regularidade). Foi mostrado também que topologias que não provém de uma métrica podem ser geradas por i-distâncias. A seguir, são apontados alguns possíveis trabalhos futuros: • Uma das principais questões sobre a topologia ℑKM não respondida é se esta topologia é metrizável. Como já foi mencionado no texto (seção 5.4) várias evidências indicam que esta topologia não é metrizável. Para abordar este problema, além do já citado teorema de Nagata-Smirnov, é possível relacioná-lo com a teoria dos espaços uniformes, como pode ser visto em [Nagata 1986]. Esta última abordagem pode trazer progressos quanto a este problema. • Na seção 4.5.2, foi visto que o conceito de espaço métrico difuso introduzido em [Kaleva e Seikkala 1984] quando as funções L e R são, respectivamente, min e max, é um caso particular de espaço i-métrico e, a partir disso, usando a teoria topológica das i-distâncias, provou-se um teorema do ponto fixo. Uma investigação válida é averiguar se através da adequação de uma VID, um espaço métrico difuso com outras escolhas para L e R também são espaços i-métricos, ou encontrar condições sobre L e R para que isso ocorra. Fazendo isso, pode-se tentar obter um teorema de ponto fixo nestes casos, além de outros resultados que decorrem de investigações topológicas. • Na seção 4.6 foi provado que toda topologia é i-quasi-pseudometrizável. A partir 83 Capítulo 6. Considerações Finais • • • • disso, uma pergunta que surge naturalmente é: que tipo de topologias são i-quasi, i-pseudo e, principalmente, i-metrizáveis? Estas respostas não devem ser simples e a tentativa de respondê-las pode gerar resultados interessantes, até mesmo para a área de topologia. Várias questões teóricas surgem a partir das noções de i-distâncias. Por exemplo, como obter novas i-distâncias a partir de i-distâncias conhecidas, como por exemplo no espaço produto, co-produto, espaço de funções, espaço potência, etc. Uma outra questão interessante seria averiguar em um conjunto no qual estão definidas generalizações de i-distâncias que geram topologias, além de uma i-distância, comparar os conceitos topológicos, como foi feito com as funções contínuas, por exemplo, conjuntos compactos, sequências convergentes, etc.. Outra questão interessante é analisar o seguinte: seja di : M × M −→ A uma i-métrica (ou i-quasi-métrica, ou i-pseudo-métrica, etc). Que tipo função f : A −→ R é tal que f ◦ di é uma métrica (ou quasi-métrica, ou pseudo-métrica, etc) e também o contrário, dada uma distância usual d : M × M −→ R, que tipo de função f : R −→ A é tal que f ◦ d é uma i-distância. Comparar as noções propostas aqui com as idéias apresentadas em [Lawvere 1973] e realizar construções categóricas a partir de i-espaços métricos (ou quasi-métricos, etc.), por exemplo, encontrar um tipo de função entre espaços i-métricos que sirva como morfismos para uma categoria na qual os objetos são exatamente estes espaços e investigar propriedades desta categoria como, por exemplo, se a mesma é uma categoria cartesiana fechada. Além disso, pode-se tentar construir funtores e bifuntores nesta categoria e averguar se a mesma (equipada com esses funtores) é monoidal fechada. Em [Khamsi et al 1993] foi introduzido o conceito de métrica generalizada. Tal conceito surgiu da necessidade de encontrar um teorema de ponto fixo no conjunto dos programas lógicos disjuntivos usando-se uma função distância que não era uma métrica no sentido usual, embora tivesse características parecidas. A demonstração deste teorema de ponto fixo não usa conceitos topológicos. Caso a função distância usada no artigo seja uma i-métrica relativa a alguma VID, pode-se averiguar que resultados sobre programas lógicos disjuntivos podem ser obtidos via noções topológicas. No campo de aplicações, sabendo que as distâncias são usadas em problemas de busca de similaridades (ver [Zezula et al 2006]) em bancos de dados, as i-distâncias podem ser usadas para garantir maior controle sobre os resultados das buscas. Como exemplo, considere a função µs (seção 4.7). Usando a métrica de Levensh84 Capítulo 6. Considerações Finais tein (dL ) pode-se realizar uma busca em um banco de dados que retorne todas as cadeias que podem ser transformadas em uma cadeia fixada por meio de x operações de edição, não havendo como devem ser tais operações. Usando µs , pode-se especificar o número de remoções e inserções. A função µS também pode ser usada em algoritmos de classificação e agrupamento e uma análise comparativa dos resultados obtidos com µs e com dL pode ser feita por meio de implementações. • Ainda sobre µs , assim como a distância de edição foi estendida para tratar de grafos (veja [Bunke 1997]), pode-se fazer o mesmo com µs e analisar as consequências. 85 Referências Bibliográficas [Abramsky e Vickers 1993] S. Abramsky and S. Vickers, Quantales, Observational Logic and Process Semantics, Math. Struct. Comput. Sci., No. 3, pp 161 − 227, 1993. [Acióly 1991] B. M. Acióly, “Fundamentação Computacional da Matemática Intervalar", Tese de doutorado, Instituto de Informática, Universidade Federal do Rio Grande do Sul, 1991. [Acióly e Bedregal 1997] B. M. Acióly, B. R. C. Bedregal, A Quasi-metric Topology Compatible with Inclusion-monotonicity Property on Interval Space, ReliableComputing, 3(3), 1997. [Blyth 2005] T.S. Blyth, “Lattices and Ordered Algebraic Structures", Springer-Verlag London Limited, London, 2005. [Bunke 1997] H. Bunke, On a Relation Between Graph Edit Distance and Maximum Common Subgraph, Pattern Recognition Letters, Vol.18, No. 8, pp 689-694, 1997. [Ciric 2010] L. Ciric, Solving the Banach Fixed Point Principle for Nonlinear Contractions in Probabilistic Metric Spaces, Nonlinear Analysis: Theory, Methods e Applications, 72, pp 2009 − 2018, 2010. [Dasgupta et al, 2006] S. Dasgupta, C.H. Papadimitriou, U.V. Vazirani, “Algorithms", McGraw-Hill Education, 2006. [Dugundji 1966] J. Dugundji, “Topology", Allyn and Bacon Series in Advanced Mathematics, Allyn and Bacon, 9th edition, 1966. [Fitting 1993] M. Fitting, Metric methods: three examples, Technical Report, City University of New York, 1993. [Flagg and Kopperman 1997] B. Flagg, R. Kopperman, Continuity spaces: Reconciling Domains and Metric Spaces, Theoretical Computer Science, No. 177, pp 111 − 138, 1997. 86 Referências Bibliográficas [Fréchet 1906] M. R. Fréchet, “Sur quelques points du calcul fonctionnel", Rendiconti de Circolo Matematico di Palermo, no. 22, pp 1-74, 1906. [Galatos et al 2007] N. Galatos, P. Jipsen, T. Kowalski, H. Ono, “Residuated Lattices: An Algebraic Glimpse at Substructural Logics: An Algebraic Glimpse at Substructural Logics", Elsevier, UK, 2007. [George e Veeramani 1994] A. George, P.V. Veeramani, On Some Results in Fuzzy Metric Saces, Fuzzy Sets and Systems, vol. 64, 395 − 399, 1994. [Gierz et al 2003] G. Gierz;, K. H. Hoffman, K. Keimel, J. D. Lawson, M. W. Mislove, D. S. Scott, “Continuous Lattices and Domains", Cambridge University Press, Cambridge, 2003. [Hausdorff 1914] F. Hausdorff, “Grundzüge der Mengenlehre", de Gruyter, Leypizig, 1914, reprinted by Chelsea, New York, 1965. [Hayes 2003] B. Hayes, A Lucid Interval, American Scientist Vol. 91, No. 6, 484 − 488, 2003. [Heitzig 2002] J. Heitzig, Many familiar categories can be interpreted as categories of generalized metric spaces, Applied Categorical Structures, No. 10, pp 505 − 520, 2002. [Heitzig 2003] J. Heitzig, “Mappings Between Distance Sets or Spaces", Dissertation, Doktor der Naturwissenschaften, Universität Hannover, 2003. [Hitzler e Seda 2000] P. Hitzler, A. K. Seda, Dislocated Topologies, Journal of Electrical Engineering, v. 51, No. 10/s, pp 3 − 7, 2000. [Hung 1998] H. H. Hung, Quasi-Metrizability, Topology and its Applications, No 83, pp 39 − 43, 1998. [Kaleva e Seikkala 1984] O. Kaleva, S.Seikkala, On Fuzzy Metric Spaces, Fuzzy sets and Systems, vol. 12, pp. 215 − 229, 1984. [Khamsi et al 1993] M. Khamsi, V. Kreinovich, D. Misane, A New Method of Proving the Existence of Answer Sets for Disjunctive Logic Programs: a Metric Fixedpoint Theorem for Multivalued Mappings, Vancouver: Proc. Workshop on logic programming with Incomplete Information, pp. 58 − 73, 1993. 87 Referências Bibliográficas [Klir e Yuan 1995] G. Klir, B. Yuan, “Fuzzy Sets and Fuzzy Logic: Theory and Applications", Prentice Hall, New Jersey, 1995. [Kopperman 1988] R. Kopperman, All Topologies Come From Generalized Metrics, The American Mathematical Monthly, Vol. 95, No. 2, pp 89-97, 1988. [Kopperman 1993] R. Kopperman, Which Topologies are Quasimetrizable?, Topology and its Applications, No 52, pp 99 − 107, 1993. [Kramosil e Michálek 1975] I. Kramosil, J. Michelek, Fuzzy Metric and Statistical Metric Spaces, Kybernetika, vol. 11,336 − 344, 1975. [Kulisch e Miranker 1981] U. Kulisch, W. Miranker, “Computer Arithmetic in Theory and Practice", New York: Academic press, 1981. [Kuratowski 1920] K. Kuratowski, Sur la notion de l’ensemble fini, Fundamenta Mathematicae, no. 1, 1920. [Lawvere 1973] F. W. Lawvere. Metric spaces, Generalized Logic, and Closed Categories, In Rend. del Sem. Mat. e Fis. di Milano, Vol. XLIII., 1973. [Lee et al 1999] B. Lee, S. Lee, K. Park, The Completions of Fuzzy Metric Spaces and Fuzzy Normed Linear Spaces, Fuzzy Sets and Systems, 106, pp 469 − 473, 1999. [Levenshtein 1966] V. I. Levenshtein, Binary Codes Capable of Correcting Deletions, Insertions and Reversals, Cybernetics and Control Theory, vol. 10, no. 8, 1966. [Lima 1977] E. L. Lima, “Espaços Métricos", 2th ed, Instituto de Matemática Pura e Aplicada - IMPA. 1977. [Lima 2004] E. L. Lima, “Curso de Análise", Vol 1, 11a ed., Associação Instituto Nacional de Matemática Pura e Aplicada - IMPA, 2004. [Matthews 1985] S.G. Matthews, “Metric Domains for Completenees", PHD Thesis, Dept. of Computer Sciences, University of Warwick, UK, 1985. [Menger 1942] K. Menger, Statistical Metric, em “Proceedings of Nat. Acad. Sci.", vol 28,535 − 537, 1942. [Moore 1959] R. E. Moore, “Automatic Error Analysis in Digital Computation". Technical Report LMSD84821, Lockheed Missiles and Space Division Co., 1959. 88 Referências Bibliográficas [Moore 1962] R. E. Moore, “Interval Arithmetic and Automatic Error Analysis in Digital Computing", PhD thesis, Department of Mathematics, Stanford University, Stanford, California, Nov 1962. Published as Applied Mathematics and Statistics Laboratories Technical Report No. 25, 1962 [Moore 1966] R. E. Moore, “Interval Analysis", Prentice Hall, New Jersey, 1966. [Moore 1979] R. E. Moore, “Methods and Applications of Interval Analysis", Studies in Appliede Mathematics-SIAM, Philadelphia. 1979. [Morgado 1962] J. Morgado, “Introdução à Teoria dos Reticulados", Editora da UFPE, Pernambuco, 1962. [Munkres 1975] J. R. Munkres, “Topology", Second Edition, Prentice Hall, Inc. Upper Saddle River, New Jersey, 1975. [Nagata 1986] J. Nagata, “Modern General Topology", North-Holland Mathematical Library, 1986. [Oliveira et al 1997] P. W. Oliveira, T. A. Diverio, D. M. Claudio, “Fundamentos de Matemática Intervalar", Porto Alegre: Instituto de Informática da UFRGS:SAGRALuzzatto,1997. [Oppenheim e Shafer 1989] A.V. Oppenheim, R. W. Shafer. “Discrete Time Signal Processing", Prentice Hall, 1989. [Paleo 2007] B. W. Paleo, An Approximate Gazeteer for GATE Based on Levenshtein Distance, em “Proceedings of the TwelfthESSLLI Student Session", Dublin, Ireland, pp 197-207, 2007. [Priess-Crampe e Ribenboim 2000] S. Priess-Crampe, P. Ribenboim, Ultrametric Spaces and Logic Programming, The Journal of Logic Programming, vol. 42, 59 − 70, 2000. [Santana et al 2011] F. T. Santana, F. L. Santana, A. M. G. Guerreiro, A. D. Dória Neto, R. H. N. Santiago, A Framework for Interval Quantization and Application to Interval Based Algorithms in Digital Signal Processing, Fundamenta Informaticae, vol. 112(4), 337 − 363, 2011. [Santana e Santiago 2011] F. Santana, R. Santiago, Natural Topology via Fuzzy Metric, em “Proceedings of the IEEE International Conference on Fuzzy Systems 2011"’, Taipei, Taiwan, 584 − 589, 2011. 89 Referências Bibliográficas [Santiago et al 2004] R. Santiago, B. Bedregal, B. Acióly, Interval Representations, TEMA: Tendências em Matemática Aplicada e Computacional, v. 5, (No. 2), pp 315-324, 2004. [Santiago et al 2005] R. H. N. Santiago, B. R. C. Bedregal, B. M. Acióly, Comparing Continuity of Interval Function Based on Moore and Scott Topologies, Eletronic Journal on Mathematics of Computation, 2005. [Santiago et al 2006] R. H. N. Santiago, B. R. C. Bedregal, B. M. Acióly. Formal Aspects of Correctness and Optimality of Interval Computations, Formal Aspects of Computing 18(2), 231 − 243, 2006. [Schweiser e Sklar 1960] B. Schweizer, A. Sklar, Statistical Metric Spaces, Pacific Journal of Mathematics, No 10, 1960, 313-334. [Scott 1970] D. S. Scott, Outline of a mathematical theory of computation, in “4th Princeton Conference on Information Science and Systems", pp. 65-106, 1970. [Seraphim 2005] E. Seraphim, “Operadores Binários para Consulta de Similaridade em Banco de Dados Multimedia", Tese de doutorado, Instituto de Ciências Matemáticas e de Computação, USP, 2005. [Singh e Jain 2005] B. Singh, S. Jain, Semicompatibility and Fixed Point Theorems in Fuzzy Metric Space Using Implicit Relation, International Journal of Mathematics and Mathematical Sciences, 16, pp 2617 − 2629, 2005. [Smyth 1992] M. B. Smyth, “Topology. In: Handbook of Logic in Computer Science", Abramsky, S., Gabbay, D. M., Maibaum, T. S. E. (eds) , vol. 1 , Clarendon Press, Oxford, pp 641 − 762, 1992. [Sunaga 1958] Sunaga, T., Theory of an Interval Algebra and its Applications to Numerical Analysis, RAAG Memoirs, 2:29-46, 1958. [Trindade 2009] Trindade, R. M. P., “Uma Fundamentação Matemática para Processamento Digital de Sinais Intervalares", Tese de Doutorado em Engenharia Elétrica, Universidade Federal do Rio Grande do Norte, 2009. [Trindade et al 2010] R. M. P. Trindade, B. R. C. Bedregal, A. D. D. Dória Neto, B. M. Acióly, An Interval Metric, em “New Advanced Technologies", 2010. 90 Referências Bibliográficas [Vargas 2010] R. Vargas, B. Bedregal, A Comparative Study Between fuzzy c-means and ck-Means Algorithms, In: Proc. Conf. North American Fuzzy Information Processing Society (NAFIPS 2010), Toronto, Canada, 2010. [Warmus 1956] M. Warmus, Calculus of Approximations, Bulletin de l’Académié Polonaise de Sciences Cl. III, No. 4, pp. 253 − 259, 1956. [Zadeh 1965] L. A. Zadeh. Fuzzy Sets, Information and Computation, vol. 8, pp. 338 − 353, 1965. [Zezula et al 2006] P. Zezula, G Amato, V. Dohnal, M. Batko, “Similarity Search: The Metric Space Approach", Springer Science+Business Media, Inc., 2006. 91 Índice Remissivo aritmética WMS, 7 base de uma topologia, 12 co-Quantale, 23 co-quantale de valoração, 23 conjunto difuso, 9 conjunto dirigido, 5 conjunto d-dirigido, 5 conjunto de positivos, 22 conjunto pré-ordenado, 4 cota inferior, 5 cota superior, 5 DCPO, 77 distribuição de probabilidade, 17 espaço gf-métrico de Hausdorff, 43 espaços gf-métricos, 42 espaço i-métrico, 27 espaço i-métrico deslocado, 81 espaço i-pseudométrico, 32 espaço i-quasi-métrico, 31 espaço i-quasi-pseudométrico, 32 espaço métrico, 13 espaço pseudo-métrico, 15 espaço quasi-métrico, 15 espaço topológico, 12 essencialmente abaixo de, 5 Felix Hausdorff, 11 função de continuidade, 22 gf-Cauchy, 43 gf-contínua, 44 gf-contração, 44 gf-convergente, 43 gf-limite, 43 gf-métricas, 42 homometria, 21 i-distância intervalar, 64 i-Métrica, 27 i-Métrica Deslocada, 80 i-métrica intervalar, 65 i-Pseudométrica, 31 i-Quasi-métrica, 31 i-Quasi-pseudométrica, 32 ínfimo, 5 infimóide, 5 Kazimierz Kuratowski, 11 Levenshtein, 55 Lofti Zadeh, 9 maior subsequência comum, 63 menor elemento separável, 26 menores elementos separáveis, 35 métrica, 12 métrica KM, 69 métrica de Moore, 8 métrica essencialmente intervalar, 80 menor elemento, 5 menores elementos, 5 monoide abeliano, 20 monoide abeliano ordenado, 20 monoide pré-ordenado, 21 92 Índice Remissivo número difuso não-negativo, 10 números difusos, 9 operação de edição, 55 ordem de Kulisch-Miranker, 8 ordem lexicográfica, 57 ordem parcial, 4 pré-ordem, 4 propriedade de Hausdorff, 13, 35 pseudo-métrica, 15 quasi-pseudométrica, 15 quasi-métrica, 14 relação essencialmente abaixo estrita, 26 relação semi-auxiliar para ≤, 25 Representação Canônica Intervalar, 67 Representação Intervalar, 66 R. Moore, 2 reticulado completamente distributivo, 23 reticulado distributivo de valoração, 23 semigrupo de valoração, 22 semireticulóide inferior, 6 semireticulóide superior, 6 equência de operações de edição, 56 subsequência, 62 supremóide, 5 supremo, 5 Teorema de Nagata-Smirnov, 73 Teorema de Representação, 76 Teorema do Ponto Fixo, 44 t-norma, 18 topologia metrizável, 13 Topologia de Scott, 77 T. Sunaga, 2 VID de Kulisch-Miranker, 69 vizinhança, 12 93