Anais do 13O Encontro de Iniciação Científica e Pós-Graduação do ITA – XIII ENCITA / 2007 Instituto Tecnológico de Aeronáutica, São José dos Campos, SP, Brasil, Outubro, 01 a 04, 2007. MAPAS AUTO-ORGANIZÁVEIS E A TABELA PERIÓDICA Guilherme Rodrigues Salerno Instituto Tecnológico de Aeronáutica - Praça Marechal Eduardo Gomes, 50 - Vila das Acácias - CEP 12228-900 – São José dos Campos – SP – Brasil Bolsista PIBIC-CNPq [email protected] Arnaldo Dal Pino Júnior Instituto Tecnológico de Aeronáutica - Praça Marechal Eduardo Gomes, 50 - Vila das Acácias - CEP 12228-900 – São José dos Campos – SP – Brasil Pesquisador [email protected] Resumo. O objetivo deste trabalho é utilizar a técnica de inteligência artificial mapa auto-organizável para tentar reproduzir algo semelhante ao trabalho de Mendeleiev de concepção do modelo que deu origem à tabela periódica moderna. Um mapa autoorganizável busca alinhar elementos de um determinado grupo, segundo caracterísiticas determinadas, em um grid de duas dimensões, de modo que elementos semelhantes fiquem próximos. Para isso, é preciso colher dados que identifiquem esses elementos, portanto foi executada primeiramente uma pequena pesquisa histórica dos métodos e conheciomentos utilizados pelo cientista à época. Após o refinamento desses dados de entrada, buscou-se adaptar a técnica objetivando a geração de mapas que se aproximassem da tabela periódica moderna. Em um segundo momento da pesquisa buscou-se o desenvolvimento de técnicas que simulassem a previsão de elementos químicos, como fez Mendeleiev. O software utilizado para o desenvolvimento da pesquisa foi o MatLab. Palavras chave: Mapa auto-organizável, Inteligência Artificial, Tabela Periódica. 1. Introdução O objetivo deste trabalho é aplicar um dispositivo de inteligência artificial, uma rede neural do tipo mapa autoorganizável, na classificação dos elementos químicos, de maneira semelhante ao trabalho de Mendeleiev. Mapa auto-organizável é o nome dado a um conjunto de métodos de aprendizado não-supervisionado para redes neurais. Baseia-se no uso de um grid de neurônios artificiais cujos pesos são adaptados para se ajustar a um conjunto de informações de entrada. Foi introduzido pelo finlandês Teuvo Kohonen na década de 80 e tornou-se um procedimento bastante popular em computação neural. Estas técnicas mostram-se muito eficazes para produzir visualização de dados em espaços multi-dimensionais. Os objetos a serem agrupados para subseqüente segmentação (por exemplo, os clientes de uma determinada loja) são apresentados, um por vez, aos neurônios de entrada. A cada apresentação, os estímulos gerados pelo objeto (por exemplo, características dos clientes quanto à freqüência de visitas, ticket médio, linha de produto adquirido, etc.) são capturados pela camada de entrada e transmitidos igualmente a todos os neurônios da camada do mapa. No mapa, o neurônio que reagir mais fortemente aos estímulos do objeto apresentado ganha-o para si. Além disso, reforça suas ligações com os vizinhos próximos, sensibilizando-os um pouco mais às características do objeto capturado. Numa próxima oportunidade, quando um objeto parecido for apresentado ao mapa, toda a região sensibilizada reagirá um pouco mais intensamente. Por outro lado, como os neurônios vizinhos são diferentes do neurônio ganhador, cada um reagirá mais intensamente a um objeto um pouco diferente. A cada nova apresentação de um objeto ao mapa, o perfil de sensibilidade dos neurônios vai se alterando: isto é o que chamamos de treinamento da rede. Estas alterações, no entanto, são cada vez menores, de forma que a configuração do mapa converge para uma disposição estável. Quando isto acontece, dizemos que o mapa aprendeu a classificar indivíduos. O resultado do processamento de uma rede treinada é que cada neurônio torna-se dono de um certo número de objetos, parecidos com os capturados pelos neurônios vizinhos. Desta maneira, os indivíduos semelhantes vão sendo posicionados próximos entre si, formando um gradiente de características. Na primeira fase do projeto, foram testadas diversas redes visando a obtenção de um mapa que melhor se aproximasse da Tabela Periódica. Na segunda fase do projeto, buscou-se aplicar o poder de previsibilidade da rede para fazer algo semelhante a Mendeleiev, quando este supôs a existência dos elementos Gálio, Escândio e Germânio. 2.1. Algoritmo de funcionamento de um Mapa Auto-organizável Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , Todo o trabalho é baseado na elaboração e utilização de um algoritmo que execute a rede neural. Após uma investigação e pesquisa inicial foi decidido que se utilizaria o programa MatLab e seus pacotes de expansão referentes a Redes Neurais devido a sua conveniência. É pertinente colocar aqui o funcionamento básico do algoritmo: O funcionamento da rede depende principalmente do seu treinamento. O algoritmo do treinamento é o seguinte: -Uma rede de neurônios é uma disposição em duas dimensões, semelhante, por exemplo, a um tabuleiro de xadrez, onde cada casa representaria um neurônio. - A rede é inicializada, atribuindo pesos a cada um dos neurônios. Esses pesos nada mais são que vetores, que contém informações referentes aos dados estudados dos elementos. A forma de inicialização pode ser escolhida (randômica, centralizada, etc.) -A cada elemento que vai ser usado no treinamento, ou na classificação é atribuído também um vetor. -A cada época, todos os elementos a serem classificados são apresentados à rede em determinada ordem, um por vez. -A cada apresentação de um elemento, um neurônio da rede responde, como se vê na Fig.1 chamaremos esse neurônio de neurônio vencedor. Esse neurônio é o que tiver o vetor associado com menor distância euclidiana ao vetor que representa o elemento. Figura 1. Ilustração do neurônio vencedor e de sua vizinhança. -O vetor associado ao neurônio vencedor é atualizado segundo uma taxa de aprendizado. A atualização consiste em se tomar a distância entre os vetores, multiplicá-la pela taxa de aprendizado e somar o resultado ao vetor original do neurônio. Ou seja: Pi = Pi −1 + t (V − Pi −1 ) Onde (1) Pi é o vetor associado ao neurônio na época i, V é o vetor que representa o elemento de treinamento e t é a taxa de aprendizado -Além disso, os neurônios que estiverem em uma determinada vizinhança do neurônio vencedor também atualizam seus vetores de forma semelhante, mas com uma taxa igual a 50% da taxa do neurônio vencedor (existem outras maneiras de se fazer essa atualização). Tal vizinhança pode ser determinada através de algum tipo de distância dentro da rede dos neurônios (tabuleiro de xadrez), como, por exemplo, a euclidiana, que foi a utilizada durante toda a pesquisa. -Tal procedimento é repetido a cada apresentação de um elemento, e por determinado número de épocas. -Assim, cada vez que um elemento é apresentado à rede ele fica próximo de outros semelhantes e estimula a sua vizinhança a ficar mais parecida com si próprio. Dessa forma, o mapa forma um gradiente de características. Os parâmetros de treinamento (taxa de aprendizado e vizinhança) mudam durante as épocas. O algoritmo de atualização é o seguinte: -Há duas fases: ordenação e afinamento Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , -Durante a fase de ordenação a taxa de aprendizado começa alta e a vizinhança inicia-se com um valor tal que cubra toda a rede. A cada época, esses valores são diminuídos linearmente até chegarem a valores definidos para a fase de afinamento. -Durante a fase de afinamento a vizinhança permanece constante durante as épocas e a taxa de aprendizado diminui bem vagarosamente (seu valor em uma determinada época é igual ao valor inicial dessa fase multiplicado pela razão entre o número de épocas da fase de ordenação e o número da época corrente). A fase de ordenação tem como papel agrupar os elementos semelhantes em “grandes grupos”, e a fase de afinamento ajusta os elementos localmente, com o mapa já mais estável (taxa de aprendizado baixa). Após o treinamento, a rede já está pronta para ser simulada. Os elementos utilizados na simulação da rede não precisam necessariamente ser os mesmos utilizados no treinamento, mas é bom que os elementos do treinamento representem bem o campo que se quer classificar. A simulação da rede não é nada mais do que apresentar cada elemento a ser classificado à rede e verificar qual neurônio responde como neurônio vencedor. Com a simulação, obtemos um mapa que representa bidimensionalmente o espaço dos elementos, classificando-os (ver Fig.2). Figura 2. Ilustração de como o mapa organiza os elementos do conjunto 2.2.Pesquisa Histórica A motivação principal dessa pesquisa é observar como um dispositivo de Inteligência Artificial analisaria os elementos químicos e comparar com o trabalho de Mendeleiev. Para tanto, foi feita uma pesquisa histórica sobre o trabalho do cientista, a fim de entender os fatos que motivaram suas conclusões, bem como o conhecimento que ele tinha sobre os elementos à época. Uma breve explicação dos resultados da pesquisa, além da associação desses resultados à presente pesquisa é feita abaixo. Existe uma certa mitologia e mágica em torno da descoberta da Tabela periódica por Mendeleiev. Algumas lendas supõem que o cientista russo a concebeu enquanto dormia. Porém, independentemente disso, a verdade é que sua descoberta veio após muito trabalho e dedicação. Dimitri Ivanovitch Mendeleiev era filho caçula de uma família com 14 filhos. Nasceu em Tobolsk, em 1834. Apesar das dificuldades financeiras, estudou e lecionou Química em São Petesburgo (Leningrado). Começou a trabalhar na sistematização dos elementos químicos em 1860. Seu objetivo era agrupá-los segundo propriedades comuns. Mendeleiev fez uma extensa pesquisa, reunindo todas as informações possíveis, conhecidas até então, sobre os elementos e colocou-as em cartões. As características trabalhadas por Mendeleiev na elaboração da tabela periódica foram: cor, massa atômica, massa específica, ponto de fusão, volatilidade, sensibilidade ao ar, sua ação no vapor, dissolubilidade em ácidos e alcalinos, óxido formado, (características do óxido: massa específica, dissolubilidade em ácido) solubilidade do hidróxido em ácidos e alcalinos, sal formado (características do sal: tendência a formar que tipo de sais, cor do sal) e composto formado com o cloro. Tais informações foram colhidas em 20 anos de trabalho. É interessante notar como essas informações diferem das atualmente utilizadas para categorizar os elementos em suas famílias, tais como: Massa específica, Ponto de fusão, etc. A forma como foram selecionadas e trabalhadas todas essas características será explicada posteriormente (Método de Trabalho). Mendeleiev fez 63 cartões, cada um contendo um dos elementos conhecidos à época e suas informações. Primeiramente distribuiu os cartões em ordem crescente de número de massa, depois percebeu como os elementos se assemelhavam de oito em oito cartões (lei das oitavas - “John Newlands” que observou a semelhança desta escala com a musical). É curioso perceber que tal regra apenas funcionou pois ainda não haviam sido descobertos os gases nobres Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , (a primeira observação de um gás nobre foi em 1868 na fotoscopia do sol durante um eclipse, mas Mendeleiev nem sequer incluiu-o em sua pesquisa), do contrário a regra seria de nove em nove cartões. A tabela de Mendeleiev recebeu grande credibilidade a partir dos anos seguintes, à medida que foram sendo descobertos os elementos previstos pelo cientista: Escândio(chamado de Eka-Boro,descoberto em 1879), Gálio (EkaAlumínio,1875) e Germânio(Eka-Silício, 1886). Além disso a tabela organizava muito bem os elementos em grupos com características semelhantes. Esses foram os principais méritos da tabela. A primeira versão da tabela foi publicada no ano de 1869. A princípio analisou-se duas tabelas de Mendeleiev originalmente publicadas em: (1)“Principles of Chemistry” (versão em ingles, 1891), como cita (Weeks, 1960); e (2) “On the Relation of the Properties to the Atomics Weights of the Elements” (1869), como cita (Strathern, 2002). Figura 3. Tabela Periódica publicada em “Principles of Chemistry” Figura 4. Tabela Periódica publicada em “On the Relation of the Properties to the Atomics Weights of the Elements” Confrontando as duas, temos: Todas as fontes consultadas concordam que Mendeleiev conhecia 63 elementos. A tabela (1) mostra apenas 62, além de suas suposições. Já a tabela (2) apresenta 63, sendo a original, de 1869. Quanto aos elementos e valores discrepantes: -O Didímio não é um elemento, mas chegou a ser considerado como tal. Foi descoberto em 1841 por Carl Mosander, separando-o de uma amostra de Lantânio. Porém,em 1885, Carl Auer von Welsbach separou o Didímio em Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , Praseodímio e Neodímio. A tabela (1) não contém nenhum dos três, já a tabela (2) apresenta o Didímio (Di), concordando como que se supunha à época. -Térbio e Érbio são separados do Ítrio (elemento descoberto em 1794) também por Mosander, em 1843. Já o Itérbio é separado do Érbio apenas em 1878, pelo suíço Marignac. Os raros elementos terrosos sofreram diversas mudanças à época, como se pode observar, pois muitas vezes o que se acreditava ser um elemento se mostrava, anos mais tarde, uma composição de vários (ver “Discovery of the elements” capítulo 26). A tabela (1), não apresenta Ítrio, Térbio ou Érbio, mas apresenta o Itérbio, o que é realmente estranho. Já a tabela (2) apresenta o Érbio e o Ítrio. -As duas tabelas apresentam diferenças muito grandes quanto à massa atômica dos elementos Cério, Lantânio, Índio, Tório, Urânio e Ítrio. A tabela 1 está com valores de massa atômica mais próximos dos valores atuais, exceto pelo Érbio. Essas diferenças devem ocorrer devido ao fato de serem “terras raras” (exceto Tório e Urânio) e não oferecerem amostras significativas de estudo para os pesquisadores da época. O Índio, por exemplo, havia sido descoberto há muito pouco tempo (1863). Problemas experimentais semelhantes devem ter ocorrido com Tório e Urânio. 2.3. Dados de entrada da rede Com o conhecimento das informações que Mendeleiev dispunha, foi traçado o método de trabalho. Foi decidido utilizar-se propriedades modernas, com seus valores atuais. Sendo assim, foram escolhidas as propriedades: Massa atômica, Massa específica, Ponto de fusão, Ponto de Ebulição, Raio Atômico, Calor Específico, Potencial de Ionização e Eletronegatividade. Para treinamento e simulação da rede, nesse momento da pesquisa, foram selecionados os 63 elementos presentes na tabela original de Mendeleiev à exceção do Érbio, que possuía número de massa muito diferente do aceito atualmente e do Didímio, que atualmente é sabido não ser um elemento. A esse grupo foi adicionado o Itérbio, por estar presente em uma versão posterior da tabela. A lista dos elementos utilizados no treinamento e simulação da rede seguem na Tab. 1. Tabela1. Lista dos elementos utilizados na pesquisa. Hidrogênio Silício Cobalto Lítio Fósforo Níquel Berílio Enxofre Cobre Boro Cloro Zinco Carbono Potássio Arsênio Nitrogênio Cálcio Selênio Oxigênio Titânio Bromo Fluor Vanádio Rubídio Sódio Cromo Estrôncio Magnésio Manganês Ítrio Alumínio Ferro Zircônio Nióbio Molibidênio Rutênio Ródio Paládio Prata Cádmio Índio Estanho Antimônio Telúrio Iodo Césio Bário Lantânio Cério Itérbio Tantálio Tungstênio Ósmio Irídio Platina Ouro Mercúrio Tálio Chumbo Bismuto Tório Urânio Antes de ser utilizada no treinamento da rede, cada uma das propriedades é normalizada de modo que o menor valor (por exemplo, massa atômica do H) recebe o valor –1 e o maior (nesse caso, Urânio) recebe 1. Dessa forma, todos os parâmetros tem igual relevância no momento de se medir as distâncias entre os vetores, durante a execução do algoritmo. Se esse procedimento não fosse executado, os parâmetros que tem maior valor absoluto na tabela acima teriam maior relevância (como o ponto de Ebulição), podendo tornar os outros quase irrelevantes no treinamento da rede. 2.4. Critérios de avaliação dos mapas Na primeira fase da pesquisa, trabalhou-se com um mapa quadrado de dimensões 12x12, pois com esse tamanho consegue-se uma boa distribuição dos elementos, evitando coincidências (explicada abaixo), sem ter também um mapa com grandes vazios. A distância utilizada no critério de vizinhança foi a euclidiana. Para se obter um mapa considerado satisfatório é preciso fazer vários testes. Para facilitar o julgamento da qualidade do mapa, foram considerados os parâmetros: Coincidências, Raio Médio das Famílias e Distância Média entre Famílias. -Coincidência: É considerada uma coincidência quando um mesmo neurônio, durante a simulação, responde por dois ou mais elementos diferentes. Foi considerado uma mapa de melhor qualidade aquele que tiver um menor número de coincidências, pois uma coincidência acaba não trazendo muitas informações na disposição do mapa (no limite de uma coincidência entre todos os elementos, não se teria informação alguma) Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , -Raio Médio da Família: Para a obtenção desse parâmetro, são tomadas todas as distâncias entre dois elementos de uma mesma família da tabela periódica atual no mapa. A maior distância é tomada como o raio dessa família, pois pode-se traçar uma circunferência com esse raio de modo que contenha todos os elementos da família. Após tomar-se todos os raios das famílias é feita sua média, obtendo-se o Raio Médio da Família. -Distância Média entre Famílias: São tomadas as distâncias entre todos os pares de elementos possíveis em duas famílias vizinhas (um elemento de cada). A menor dessas distâncias é considerada a distância entre essas duas famílias. O procedimento é repetido com cada par de famílias vizinhas e é tomada a média que é a Distância Média entre Famílias. Uma família é vizinha de outra se está em litígio com ela na tabela periódica. 2.5. Obtenção dos parâmetros de treinamento da rede Após diversos testes com diferentes parâmetros para o treinamento da rede e utilizando os conceitos acima descritos para avaliação, se chegou aos valores que geravam melhores mapas que estão em Tab 2. Tabela 2. Parâmetros ótimos de treinamento da rede. Parâmetro Valor Taxa de aprendizado – Fase de Ordenação 0,9 Taxa de aprendizado – Fase de Afinamento 0,02 Número de passos da fase de Ordenação 5000 Número de épocas 15000 Vizinhança da Fase de Afinamento 1 Critério de distância Euclidiana 2.6.Previsão de características de elementos Para utilizar um mapa criado pela rede neural na previsão de características de elementos, seguiu-se os passos descritos abaixo: 2.6.1. Elaboração das Técnicas Uma das principais utilidades de Redes Neurais é o poder de previsão dessas ferramentas. No caso de Mapas Auto-Organizáveis, busca-se muitas vezes prever como determinado elemento desconhecido se comportaria em relação aos outros elementos de uma rede treinada. No caso de nossa pesquisa era particularmente interessante verificar o poder de previsão da rede em relação aos elementos químicos propostos por Mendeleiev e mais tarde descobertos. Para tanto, foram utilizados dois métodos: média entre os parâmetros finais dos elementos vizinhos conhecidos, e valores finais dos parâmetros do neurônio médio entre os elementos vizinhos conhecidos. Em ambas as técnicas, já supõe-se que exista algum elemento entre outros 2. A descoberta de Mendeleiev consistia em observar falhas na continuidade do número de massa e depois fazer médias entre as características dos elementos vizinhos do suposto elemento. Algo bastante semelhante é aqui proposto. As técnicas são descritas a seguir: Técnica 1: Ao final do treinamento da rede, cada neurônio que responde por um elemento não apresenta parâmetros idênticos aos valores conhecidos reais, utilizados no treinamento, pois utiliza-se sempre um peso menor que 1 para atualização de seus índices. Sendo assim, pode-se calcular a média entre cada um dos parâmetros dos elementos vizinhos envolvidos. Essa técnica leva em conta que a distribuição dos parâmetros finais tende a ser homogênea e coesa com os valores usados no treinamento, possibilitando uma gradação de valores. Técnica 2: Como a rede tende a fazer uma distribuição homogênea das características inclusive entre neurônios que não são vencedores (não recebem elemento), é possível também tomar-se um neurônio médio entre neurônios que receberam os elementos vizinhos ao suposto elemento. Tal neurônio representaria a sua posição e deveria ter características associáveis a ele. Para escolher esse neurônio, é feita a média entre entre as abcissas e entre as ordenadas das posições dos elementos no mapa. 2.6.2. Elementos a serem previstos Serão tomados aqui os seguintes elementos (previstos por Mendeleiev): Escândio, Gálio e Germânio. Temos que o Escândio aparece entre os elementos Cálcio e Titânio, portanto, para os cálculos de sua previsão será simplemente utilizada a média aritmética entre esses seus dois vizinhos. Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , Gálio e Germânio estão entre Zinco e Arsênio. Para os cálculos foram utilizadas médias ponderadas, de maneira que: Ga = Zn (2 / 3) + As (1/ 3) (2) Ge = Zn(1/ 3) + As (2 / 3) (3) Onde Ga, Zn, As e Ge, representam qualquer característica dos elementos Gálio, Zinco, Arsênio e Germânio, respectivamente. 2.6.3.Geração do mapa Foram treinados 5 mapas com os parâmetros determinados na primeira fase da pesquisa, tomando-se os 62 elementos no treinamento da rede. Os resultados dos critérios de avaliação seguem na Tab. 3. Tabela 3. Resultados dos critérios de avaliação para os mapas treinados Mapa Coincidências Raio Médio das Famílias Distância Média entre Famílias 1 4 5,02 1,15 2 2 6,32 1,34 3 3 5,08 1,30 4 4 6,99 1,40 5 4 6,44 1,24 O mapa 1 apresenta melhores parâmetros e poucas coincidências, sendo portanto o escolhido para a análise de previsibilidade. Ele segue na Fig. 5. Hg Sb Te Pb Tl I Cd In Br Cl Se As N H S Sn Zn P Cu Mn Be Mg Ni Fe C B Pd Cr Si Li Au Rh V Ti Al Ru Mo Zr Ca Na Pt U Nb Y Sr K Ir Ta La Ba Rb Ag Os W Th Ce Yb Cs Figura 5. Simulação da rede com os melhores parâmetros As coincidências apresentadas pelo mapa são: N e O, N e F, Fe e Co, Pb e Bi. 2.6.4. Resultados das técnicas Para verificar o poder de previsibilidade do mapa, tomaram-se os erros relativos de cada uma das características determinadas segundo cada técnica em relação aos valores reais. Esses dados seguem na Tab.4. Tabela 4. Erros relativos das características dos elementos. Massa Massa Ponto de Ponto de Raio Calor Potencial Eletronega Característica Atômica específica Fusão Ebulição Atômico Específico Ionização tividade Técnica 1 Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , Escândio Gálio Germânio Técnica 2 Escândio Gálio Germânio 55,7% 2,0% 1,3% 115,1% 50,8% 12,9% 172,6% 16,4% 20,8% 66,7% 56,3% 68,3% 31,6% 19,2% 8,1% 36,6% 0,0% 9,4% 46,3% 58,9% 22,4% 40,8% 1,5% 0,2% 122,5% 65,6% 55,6% 278,0% 41,4% 67,6% 149,3% 37,3% 64,5% 43,0% 46,0% 24,3% 8,1% 31,5% 31,5% 56,7% 197,3% 28,1% 10,9% 67,6% 26,7% 63,2% 17,4% 11,0% E na Tab. 5 seguem os valores médios desses erros: Tabela 5. Valores médios dos erros relativos das características. Técnica 1 (Média) Escândio 55,5% Gálio 40,4% Germânio 18,4% Técnica 2 (Neurônio) Escândio 78,0% Gálio 80,3% Germânio 34,9% Mesmo apresentando erros bastante altos nas duas técnicas, é possível observar que o mapa retorna valores bastante próximos para alguns parâmetros como a massa atômica de Gálio e Germânio com a técnica 1. 2.7. Mapas dos Lantanídeos 2.7.1.O Método Foi investigado também como uma rede neural distribui os Lantanídeos e Actinídeos. Porém, logo nos primeiros testes, optou-se por deixar os Actinídeos de lado, pois muitas de suas características não são conhecidas, não oferecendo bons parâmetros para o treinamento da rede. Os dados utilizados no treinamento da rede estão no anexo 4. Foram testados três modelos de mapas: um modelo em linha, ou seja, um mapa de dimensões 1x15, que simula a distribuição utilizada na tabela periódica clássica; um modelo com duas linhas, ou seja, de dimensões 2x15; e um mapa quadrado, semelhante ao utilizado a maior parte do tempo da pesquisa, de dimensões 5x5. Mesmo tomando-se apenas os lantanídeos, ainda existem 5 características que não são conhecidas, são elas: os pontos de ebulição e fusão do promécio e as eletronegatividades de Európio, Térbio e Hólmio. Assim, é necessário preencher artificialmente essas células. Isso foi feito de 2 maneiras: simplesmente atribuindo-se o valor zero para esses valores faltantes e fazendo-se a média entre os valores das características imediatamente vizinhas. Para cada um dos 6 tipos formatos diferentes de mapas citados foram treinadas e analisadas 5 redes. O treinamento da rede foi idêntico em cada uma das técnicas, utilizando os parâmetros citados no ítem C, exceto pelo número de passos da fase de ordenação e pelo número de épocas, respectivamente 3000 e 9000. No treinamento da rede foram utilizados todos os 15 elementos. 2.7.2.Critério de Vizinhança Para a análise dos melhores mapas, adotou-se um critério de vizinhança, que conta o número de pares de elementos que são vizinhos na tabela periódica e que: também são vizinhos no mapa, podendo-se pular casas vazias; ou coincidem no mapa. 2.7.3. Melhores mapas Seguem abaixo, os melhores mapas obtidos com cada técnica. 2.7.3.1. Atribuindo zero -Mapa 1x15 Os 5 mapas são muito semelhantes quanto a posição relativa dos elementos, assim, segue abaixo, como exemplo de mapa que aproxima-se bastante da tabela periódica, aquele que contém o menor número de coincidências, segue na Fig. 6. Lu Gd Dy Tm Yb Pm Sm Pr Ce La Eu Tb Figura 6. Mapa 1x15, atribuindo zero aos valores faltantes. Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , As coincidências desse mapa são as seguintes: Pr e Nd, Tb e Ho, Dy e Er. -Mapa 2x15 Novamente os mapas apresentaram-se muito semelhantes entre si. Escolheu-se um como exemplo, que apresenta 7 vizinhanças corretas e que segue na Fig. 7. Lu Dy Er Tm Pm Nd Ce La Eu Gd Yb Sm Pr Tb Figura 7. Mapa 2x15, atribuindo zero aos valores faltantes. A coincidência desse mapa é a seguinte: Tb e Ho. -Mapa 5x5 Segue o mesmo padrão dos anteriores, aqui se pode observar 12 vizinhanças corretas. O mapa é apresentado na Fig. 8. Ce La Pr Eu Tb Sm Pm Gd Er Dy Yb Tm Lu Figura 8. Mapa 5x5, atribuindo zero aos valores faltantes. As coincidências desse mapa são as seguintes: Pr e Nd, Tb e Ho 2.7.3.2. Adaptando-se com as médias -Mapa 1x15 Apresentando 12 vizinhanças corretas, foi escolhido o mapa que segue na Fig. 9. Eu Sm Pm Pr Ce La Yb Tm Ho Dy Lu Tb Gd Figura 9. Mapa 1x15, adaptando-se com as médias. As coincidências desse mapa são as seguintes: Pr e Nd, Ho e Er. Nota-se que, se fosse excluído o elemento Lutécio, toda a série estaria correta. -Mapa 2x15 Mesmo problema do mapa anterior, mas ainda assim, respeita bastante as vizinhanças da tabela periódica.Segue o mapa escolhido na Fig. 10. Ce Pm Eu Yb Tm Er Lu La Pr Nd Sm Gd Dy Tb Figura 10. Mapa 2x15, adaptando-se com as médias. A coincidência desse mapa é a seguinte: Dy e Ho. -Mapa 5x5 Aqui, além do problema dos mapas anteriores, a vizinhança entre Európio e Gadolínio também não ocorre. O melhor mapa é apresentado na Fig. 11. Sm Eu Yb Tm Pm Er Pr Dy Ho Ce Tb La Gd Lu Figura 11. Mapa 5x5, adaptando-se com as médias. Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , A coincidência desse mapa é a seguinte: Pr e Nd. 2.8. Conclusões 2.8.1. Comparação dos Mapas com a Tabela Periódica Ao longo da pesquisa foram obtidos diversos mapas que apresentavam bastante semelhança com a tabela periódica, indicando o poder das redes neurais em organizar os elementos. No mapa da figura 5, utilizado para a previsão das características dos elementos pode-se verificar isso: Regiões do Mapa: -Elementos das seguintes famílias dos ametais agruparam-se bem entre si: Família 1: Região inferior direita;Família 2: Acima da família 1;Família 15:Região superior do mapa;Família 16: Região superior direita;Família 17: Região superior direita. -Ferro, Cobalto e Níquel (elementos com propriedades bem semelhantes) ficam próximos (região centroesquerda). -Platina, ouro, paládio e prata ficam próximos. -Oxigênio, Nitrogênio e Fluor, gases bastante semelhantes, coincidem nesse mapa. -Elementos próximos em geral na tabela, estão próximos no mapa. 2.8.2. Poder de Previsão dos Mapas Apenas algumas características previstas tiveram valores próximos dos aceitos atualmente para os elementos Escândio, Gálio e Germânio. No geral, as duas técnicas não se mostraram muito eficientes para a previsão de caracaterísticas de elementos. Isso pode ser justificado pela diversidade de características que permite uma organização boa dos elementos conforme a tabela períodica sem que todas as suas características estejam bem estabelecidas. Um treinamento mais exaustivo da rede poderia sanar esse problema, e é deixado aqui como sugestão. Mesmo não sendo efetivas é possível avaliar a técnica da utilização da média dos neurônios vencedores mais indicada como ferramenta de previsão quando comparamos os erros relativos médios das duas técnicas. 2.8.3. Mapas dos Lantanídeos Aqui foram obtidos resultados melhores do que os esperados inicialmente. Comecemos com uma comparação do número de vizinhanças corretas dos mapas escolhidos, que segue na Tab. 6. Tabela 6. Número de vizinhanças corretas dos melhores mapas Mapa\Técnica Atribuir Zero Média dos Vizinhos 1x15 6 12 2x15 7 12 5x5 12 13 Assim, observa-se que utilizando a média dos vizinhos para preencher as lacunas de informação se obtém um melhor resultado dos mapas, já que mais vizinhanças são respeitadas. No caso do mapa 1x15 (que representaria a própria série na forma da tabela periódica), a rede neural reproduz quase perfeitamente a distribuição dos lantanídeos nesse caso, mostrando que as características trabalhadas indicam bons critérios de semelhança entre os elementos desse grupo. O mapa 5x5 traz uma distribuição alternativa do grupo. O mapa dado como exemplo não respeita apenas uma vizinhança característica do grupo (Lutécio). Em boa parte dos mapas testados, se observa que os elementos Európio e Gadolínio ficam distantes, mesmo sendo vizinhos na distribuição periódica, o que mostra uma certa diferença entre as suas características analisadas. 3. Agradecimentos CNPq ITA 4. Referências Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007 , WEEKS, Mary Elvira, 1960, “Discovery of the elements”, 6ª Edição, Journal of Chemical Education, Estados Unidos da América. STRATHERN, Paul, 2002, “O Sonho de Mendeleiev – A Verdadeira História da Química”, Jorge Zahar Ed., Rio de Janeiro.