mapas auto-organizáveis e a tabela periódica

Propaganda
Anais do 13O Encontro de Iniciação Científica e Pós-Graduação do ITA – XIII ENCITA / 2007
Instituto Tecnológico de Aeronáutica, São José dos Campos, SP, Brasil, Outubro, 01 a 04, 2007.
MAPAS AUTO-ORGANIZÁVEIS E A TABELA PERIÓDICA
Guilherme Rodrigues Salerno
Instituto Tecnológico de Aeronáutica - Praça Marechal Eduardo Gomes, 50 - Vila das Acácias - CEP 12228-900 – São José dos
Campos – SP – Brasil
Bolsista PIBIC-CNPq
[email protected]
Arnaldo Dal Pino Júnior
Instituto Tecnológico de Aeronáutica - Praça Marechal Eduardo Gomes, 50 - Vila das Acácias - CEP 12228-900 – São José dos
Campos – SP – Brasil
Pesquisador
[email protected]
Resumo. O objetivo deste trabalho é utilizar a técnica de inteligência artificial mapa auto-organizável para tentar reproduzir algo
semelhante ao trabalho de Mendeleiev de concepção do modelo que deu origem à tabela periódica moderna. Um mapa autoorganizável busca alinhar elementos de um determinado grupo, segundo caracterísiticas determinadas, em um grid de duas
dimensões, de modo que elementos semelhantes fiquem próximos. Para isso, é preciso colher dados que identifiquem esses
elementos, portanto foi executada primeiramente uma pequena pesquisa histórica dos métodos e conheciomentos utilizados pelo
cientista à época. Após o refinamento desses dados de entrada, buscou-se adaptar a técnica objetivando a geração de mapas que se
aproximassem da tabela periódica moderna. Em um segundo momento da pesquisa buscou-se o desenvolvimento de técnicas que
simulassem a previsão de elementos químicos, como fez Mendeleiev. O software utilizado para o desenvolvimento da pesquisa foi o
MatLab.
Palavras chave: Mapa auto-organizável, Inteligência Artificial, Tabela Periódica.
1. Introdução
O objetivo deste trabalho é aplicar um dispositivo de inteligência artificial, uma rede neural do tipo mapa autoorganizável, na classificação dos elementos químicos, de maneira semelhante ao trabalho de Mendeleiev.
Mapa auto-organizável é o nome dado a um conjunto de métodos de aprendizado não-supervisionado para
redes neurais. Baseia-se no uso de um grid de neurônios artificiais cujos pesos são adaptados para se ajustar a um
conjunto de informações de entrada. Foi introduzido pelo finlandês Teuvo Kohonen na década de 80 e tornou-se um
procedimento bastante popular em computação neural. Estas técnicas mostram-se muito eficazes para produzir
visualização de dados em espaços multi-dimensionais.
Os objetos a serem agrupados para subseqüente segmentação (por exemplo, os clientes de uma determinada
loja) são apresentados, um por vez, aos neurônios de entrada. A cada apresentação, os estímulos gerados pelo objeto
(por exemplo, características dos clientes quanto à freqüência de visitas, ticket médio, linha de produto adquirido, etc.)
são capturados pela camada de entrada e transmitidos igualmente a todos os neurônios da camada do mapa. No mapa, o
neurônio que reagir mais fortemente aos estímulos do objeto apresentado ganha-o para si. Além disso, reforça suas
ligações com os vizinhos próximos, sensibilizando-os um pouco mais às características do objeto capturado.
Numa próxima oportunidade, quando um objeto parecido for apresentado ao mapa, toda a região sensibilizada
reagirá um pouco mais intensamente. Por outro lado, como os neurônios vizinhos são diferentes do neurônio ganhador,
cada um reagirá mais intensamente a um objeto um pouco diferente.
A cada nova apresentação de um objeto ao mapa, o perfil de sensibilidade dos neurônios vai se alterando: isto
é o que chamamos de treinamento da rede. Estas alterações, no entanto, são cada vez menores, de forma que a
configuração do mapa converge para uma disposição estável. Quando isto acontece, dizemos que o mapa aprendeu a
classificar indivíduos.
O resultado do processamento de uma rede treinada é que cada neurônio torna-se dono de um certo número de
objetos, parecidos com os capturados pelos neurônios vizinhos. Desta maneira, os indivíduos semelhantes vão sendo
posicionados próximos entre si, formando um gradiente de características.
Na primeira fase do projeto, foram testadas diversas redes visando a obtenção de um mapa que melhor se
aproximasse da Tabela Periódica.
Na segunda fase do projeto, buscou-se aplicar o poder de previsibilidade da rede para fazer algo semelhante a
Mendeleiev, quando este supôs a existência dos elementos Gálio, Escândio e Germânio.
2.1. Algoritmo de funcionamento de um Mapa Auto-organizável
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
Todo o trabalho é baseado na elaboração e utilização de um algoritmo que execute a rede neural. Após uma
investigação e pesquisa inicial foi decidido que se utilizaria o programa MatLab e seus pacotes de expansão referentes a
Redes Neurais devido a sua conveniência. É pertinente colocar aqui o funcionamento básico do algoritmo:
O funcionamento da rede depende principalmente do seu treinamento.
O algoritmo do treinamento é o seguinte:
-Uma rede de neurônios é uma disposição em duas dimensões, semelhante, por exemplo, a um tabuleiro de
xadrez, onde cada casa representaria um neurônio.
- A rede é inicializada, atribuindo pesos a cada um dos neurônios. Esses pesos nada mais são que vetores, que
contém informações referentes aos dados estudados dos elementos. A forma de inicialização pode ser escolhida
(randômica, centralizada, etc.)
-A cada elemento que vai ser usado no treinamento, ou na classificação é atribuído também um vetor.
-A cada época, todos os elementos a serem classificados são apresentados à rede em determinada ordem, um
por vez.
-A cada apresentação de um elemento, um neurônio da rede responde, como se vê na Fig.1 chamaremos esse
neurônio de neurônio vencedor. Esse neurônio é o que tiver o vetor associado com menor distância euclidiana ao vetor
que representa o elemento.
Figura 1. Ilustração do neurônio vencedor e de sua vizinhança.
-O vetor associado ao neurônio vencedor é atualizado segundo uma taxa de aprendizado. A atualização
consiste em se tomar a distância entre os vetores, multiplicá-la pela taxa de aprendizado e somar o resultado ao vetor
original do neurônio. Ou seja:
Pi = Pi −1 + t (V − Pi −1 )
Onde
(1)
Pi é o vetor associado ao neurônio na época i, V é o vetor que representa o elemento de treinamento e
t é a taxa de aprendizado
-Além disso, os neurônios que estiverem em uma determinada vizinhança do neurônio vencedor também
atualizam seus vetores de forma semelhante, mas com uma taxa igual a 50% da taxa do neurônio vencedor (existem
outras maneiras de se fazer essa atualização). Tal vizinhança pode ser determinada através de algum tipo de distância
dentro da rede dos neurônios (tabuleiro de xadrez), como, por exemplo, a euclidiana, que foi a utilizada durante toda a
pesquisa.
-Tal procedimento é repetido a cada apresentação de um elemento, e por determinado número de épocas.
-Assim, cada vez que um elemento é apresentado à rede ele fica próximo de outros semelhantes e estimula a
sua vizinhança a ficar mais parecida com si próprio. Dessa forma, o mapa forma um gradiente de características.
Os parâmetros de treinamento (taxa de aprendizado e vizinhança) mudam durante as épocas. O algoritmo de
atualização é o seguinte:
-Há duas fases: ordenação e afinamento
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
-Durante a fase de ordenação a taxa de aprendizado começa alta e a vizinhança inicia-se com um valor tal que
cubra toda a rede. A cada época, esses valores são diminuídos linearmente até chegarem a valores definidos para a fase
de afinamento.
-Durante a fase de afinamento a vizinhança permanece constante durante as épocas e a taxa de aprendizado
diminui bem vagarosamente (seu valor em uma determinada época é igual ao valor inicial dessa fase multiplicado pela
razão entre o número de épocas da fase de ordenação e o número da época corrente).
A fase de ordenação tem como papel agrupar os elementos semelhantes em “grandes grupos”, e a fase de
afinamento ajusta os elementos localmente, com o mapa já mais estável (taxa de aprendizado baixa).
Após o treinamento, a rede já está pronta para ser simulada. Os elementos utilizados na simulação da rede não
precisam necessariamente ser os mesmos utilizados no treinamento, mas é bom que os elementos do treinamento
representem bem o campo que se quer classificar. A simulação da rede não é nada mais do que apresentar cada
elemento a ser classificado à rede e verificar qual neurônio responde como neurônio vencedor.
Com a simulação, obtemos um mapa que representa bidimensionalmente o espaço dos elementos,
classificando-os (ver Fig.2).
Figura 2. Ilustração de como o mapa organiza os elementos do conjunto
2.2.Pesquisa Histórica
A motivação principal dessa pesquisa é observar como um dispositivo de Inteligência Artificial analisaria os
elementos químicos e comparar com o trabalho de Mendeleiev. Para tanto, foi feita uma pesquisa histórica sobre o
trabalho do cientista, a fim de entender os fatos que motivaram suas conclusões, bem como o conhecimento que ele
tinha sobre os elementos à época. Uma breve explicação dos resultados da pesquisa, além da associação desses
resultados à presente pesquisa é feita abaixo.
Existe uma certa mitologia e mágica em torno da descoberta da Tabela periódica por Mendeleiev. Algumas
lendas supõem que o cientista russo a concebeu enquanto dormia. Porém, independentemente disso, a verdade é que sua
descoberta veio após muito trabalho e dedicação. Dimitri Ivanovitch Mendeleiev era filho caçula de uma família com
14 filhos. Nasceu em Tobolsk, em 1834. Apesar das dificuldades financeiras, estudou e lecionou Química em São
Petesburgo (Leningrado). Começou a trabalhar na sistematização dos elementos químicos em 1860. Seu objetivo era
agrupá-los segundo propriedades comuns.
Mendeleiev fez uma extensa pesquisa, reunindo todas as informações possíveis, conhecidas até então, sobre os
elementos e colocou-as em cartões. As características trabalhadas por Mendeleiev na elaboração da tabela periódica
foram: cor, massa atômica, massa específica, ponto de fusão, volatilidade, sensibilidade ao ar, sua ação no vapor,
dissolubilidade em ácidos e alcalinos, óxido formado, (características do óxido: massa específica, dissolubilidade em
ácido) solubilidade do hidróxido em ácidos e alcalinos, sal formado (características do sal: tendência a formar que tipo
de sais, cor do sal) e composto formado com o cloro. Tais informações foram colhidas em 20 anos de trabalho.
É interessante notar como essas informações diferem das atualmente utilizadas para categorizar os elementos
em suas famílias, tais como: Massa específica, Ponto de fusão, etc. A forma como foram selecionadas e trabalhadas
todas essas características será explicada posteriormente (Método de Trabalho).
Mendeleiev fez 63 cartões, cada um contendo um dos elementos conhecidos à época e suas informações.
Primeiramente distribuiu os cartões em ordem crescente de número de massa, depois percebeu como os elementos se
assemelhavam de oito em oito cartões (lei das oitavas - “John Newlands” que observou a semelhança desta escala com
a musical). É curioso perceber que tal regra apenas funcionou pois ainda não haviam sido descobertos os gases nobres
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
(a primeira observação de um gás nobre foi em 1868 na fotoscopia do sol durante um eclipse, mas Mendeleiev nem
sequer incluiu-o em sua pesquisa), do contrário a regra seria de nove em nove cartões.
A tabela de Mendeleiev recebeu grande credibilidade a partir dos anos seguintes, à medida que foram sendo
descobertos os elementos previstos pelo cientista: Escândio(chamado de Eka-Boro,descoberto em 1879), Gálio (EkaAlumínio,1875) e Germânio(Eka-Silício, 1886). Além disso a tabela organizava muito bem os elementos em grupos
com características semelhantes. Esses foram os principais méritos da tabela.
A primeira versão da tabela foi publicada no ano de 1869.
A princípio analisou-se duas tabelas de Mendeleiev originalmente publicadas em: (1)“Principles of Chemistry”
(versão em ingles, 1891), como cita (Weeks, 1960); e (2) “On the Relation of the Properties to the Atomics Weights of
the Elements” (1869), como cita (Strathern, 2002).
Figura 3. Tabela Periódica publicada em “Principles of Chemistry”
Figura 4. Tabela Periódica publicada em “On the Relation of the Properties to the Atomics Weights of the Elements”
Confrontando as duas, temos:
Todas as fontes consultadas concordam que Mendeleiev conhecia 63 elementos. A tabela (1) mostra apenas 62,
além de suas suposições. Já a tabela (2) apresenta 63, sendo a original, de 1869.
Quanto aos elementos e valores discrepantes:
-O Didímio não é um elemento, mas chegou a ser considerado como tal. Foi descoberto em 1841 por Carl
Mosander, separando-o de uma amostra de Lantânio. Porém,em 1885, Carl Auer von Welsbach separou o Didímio em
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
Praseodímio e Neodímio. A tabela (1) não contém nenhum dos três, já a tabela (2) apresenta o Didímio (Di),
concordando como que se supunha à época.
-Térbio e Érbio são separados do Ítrio (elemento descoberto em 1794) também por Mosander, em 1843. Já o
Itérbio é separado do Érbio apenas em 1878, pelo suíço Marignac. Os raros elementos terrosos sofreram diversas
mudanças à época, como se pode observar, pois muitas vezes o que se acreditava ser um elemento se mostrava, anos
mais tarde, uma composição de vários (ver “Discovery of the elements” capítulo 26). A tabela (1), não apresenta Ítrio,
Térbio ou Érbio, mas apresenta o Itérbio, o que é realmente estranho. Já a tabela (2) apresenta o Érbio e o Ítrio.
-As duas tabelas apresentam diferenças muito grandes quanto à massa atômica dos elementos Cério, Lantânio,
Índio, Tório, Urânio e Ítrio. A tabela 1 está com valores de massa atômica mais próximos dos valores atuais, exceto
pelo Érbio. Essas diferenças devem ocorrer devido ao fato de serem “terras raras” (exceto Tório e Urânio) e não
oferecerem amostras significativas de estudo para os pesquisadores da época. O Índio, por exemplo, havia sido
descoberto há muito pouco tempo (1863). Problemas experimentais semelhantes devem ter ocorrido com Tório e
Urânio.
2.3. Dados de entrada da rede
Com o conhecimento das informações que Mendeleiev dispunha, foi traçado o método de trabalho. Foi
decidido utilizar-se propriedades modernas, com seus valores atuais.
Sendo assim, foram escolhidas as propriedades: Massa atômica, Massa específica, Ponto de fusão, Ponto de
Ebulição, Raio Atômico, Calor Específico, Potencial de Ionização e Eletronegatividade.
Para treinamento e simulação da rede, nesse momento da pesquisa, foram selecionados os 63 elementos
presentes na tabela original de Mendeleiev à exceção do Érbio, que possuía número de massa muito diferente do aceito
atualmente e do Didímio, que atualmente é sabido não ser um elemento. A esse grupo foi adicionado o Itérbio, por estar
presente em uma versão posterior da tabela.
A lista dos elementos utilizados no treinamento e simulação da rede seguem na Tab. 1.
Tabela1. Lista dos elementos utilizados na pesquisa.
Hidrogênio Silício
Cobalto
Lítio
Fósforo
Níquel
Berílio
Enxofre
Cobre
Boro
Cloro
Zinco
Carbono
Potássio
Arsênio
Nitrogênio Cálcio
Selênio
Oxigênio
Titânio
Bromo
Fluor
Vanádio
Rubídio
Sódio
Cromo
Estrôncio
Magnésio Manganês Ítrio
Alumínio Ferro
Zircônio
Nióbio
Molibidênio
Rutênio
Ródio
Paládio
Prata
Cádmio
Índio
Estanho
Antimônio
Telúrio
Iodo
Césio
Bário
Lantânio
Cério
Itérbio
Tantálio
Tungstênio
Ósmio
Irídio
Platina
Ouro
Mercúrio
Tálio
Chumbo
Bismuto
Tório
Urânio
Antes de ser utilizada no treinamento da rede, cada uma das propriedades é normalizada de modo que o menor
valor (por exemplo, massa atômica do H) recebe o valor –1 e o maior (nesse caso, Urânio) recebe 1. Dessa forma, todos
os parâmetros tem igual relevância no momento de se medir as distâncias entre os vetores, durante a execução do
algoritmo. Se esse procedimento não fosse executado, os parâmetros que tem maior valor absoluto na tabela acima
teriam maior relevância (como o ponto de Ebulição), podendo tornar os outros quase irrelevantes no treinamento da
rede.
2.4. Critérios de avaliação dos mapas
Na primeira fase da pesquisa, trabalhou-se com um mapa quadrado de dimensões 12x12, pois com esse
tamanho consegue-se uma boa distribuição dos elementos, evitando coincidências (explicada abaixo), sem ter também
um mapa com grandes vazios. A distância utilizada no critério de vizinhança foi a euclidiana.
Para se obter um mapa considerado satisfatório é preciso fazer vários testes. Para facilitar o julgamento da
qualidade do mapa, foram considerados os parâmetros: Coincidências, Raio Médio das Famílias e Distância Média
entre Famílias.
-Coincidência: É considerada uma coincidência quando um mesmo neurônio, durante a simulação, responde
por dois ou mais elementos diferentes. Foi considerado uma mapa de melhor qualidade aquele que tiver um menor
número de coincidências, pois uma coincidência acaba não trazendo muitas informações na disposição do mapa (no
limite de uma coincidência entre todos os elementos, não se teria informação alguma)
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
-Raio Médio da Família: Para a obtenção desse parâmetro, são tomadas todas as distâncias entre dois
elementos de uma mesma família da tabela periódica atual no mapa. A maior distância é tomada como o raio dessa
família, pois pode-se traçar uma circunferência com esse raio de modo que contenha todos os elementos da família.
Após tomar-se todos os raios das famílias é feita sua média, obtendo-se o Raio Médio da Família.
-Distância Média entre Famílias: São tomadas as distâncias entre todos os pares de elementos possíveis em
duas famílias vizinhas (um elemento de cada). A menor dessas distâncias é considerada a distância entre essas duas
famílias. O procedimento é repetido com cada par de famílias vizinhas e é tomada a média que é a Distância Média
entre Famílias. Uma família é vizinha de outra se está em litígio com ela na tabela periódica.
2.5. Obtenção dos parâmetros de treinamento da rede
Após diversos testes com diferentes parâmetros para o treinamento da rede e utilizando os conceitos acima
descritos para avaliação, se chegou aos valores que geravam melhores mapas que estão em Tab 2.
Tabela 2. Parâmetros ótimos de treinamento da rede.
Parâmetro
Valor
Taxa de aprendizado – Fase de Ordenação
0,9
Taxa de aprendizado – Fase de Afinamento
0,02
Número de passos da fase de Ordenação
5000
Número de épocas
15000
Vizinhança da Fase de Afinamento
1
Critério de distância
Euclidiana
2.6.Previsão de características de elementos
Para utilizar um mapa criado pela rede neural na previsão de características de elementos, seguiu-se os passos
descritos abaixo:
2.6.1. Elaboração das Técnicas
Uma das principais utilidades de Redes Neurais é o poder de previsão dessas ferramentas. No caso de Mapas
Auto-Organizáveis, busca-se muitas vezes prever como determinado elemento desconhecido se comportaria em relação
aos outros elementos de uma rede treinada.
No caso de nossa pesquisa era particularmente interessante verificar o poder de previsão da rede em relação
aos elementos químicos propostos por Mendeleiev e mais tarde descobertos. Para tanto, foram utilizados dois métodos:
média entre os parâmetros finais dos elementos vizinhos conhecidos, e valores finais dos parâmetros do neurônio médio
entre os elementos vizinhos conhecidos. Em ambas as técnicas, já supõe-se que exista algum elemento entre outros 2. A
descoberta de Mendeleiev consistia em observar falhas na continuidade do número de massa e depois fazer médias
entre as características dos elementos vizinhos do suposto elemento. Algo bastante semelhante é aqui proposto.
As técnicas são descritas a seguir:
Técnica 1: Ao final do treinamento da rede, cada neurônio que responde por um elemento não apresenta
parâmetros idênticos aos valores conhecidos reais, utilizados no treinamento, pois utiliza-se sempre um peso menor que
1 para atualização de seus índices. Sendo assim, pode-se calcular a média entre cada um dos parâmetros dos elementos
vizinhos envolvidos. Essa técnica leva em conta que a distribuição dos parâmetros finais tende a ser homogênea e coesa
com os valores usados no treinamento, possibilitando uma gradação de valores.
Técnica 2: Como a rede tende a fazer uma distribuição homogênea das características inclusive entre neurônios
que não são vencedores (não recebem elemento), é possível também tomar-se um neurônio médio entre neurônios que
receberam os elementos vizinhos ao suposto elemento. Tal neurônio representaria a sua posição e deveria ter
características associáveis a ele.
Para escolher esse neurônio, é feita a média entre entre as abcissas e entre as ordenadas das posições dos
elementos no mapa.
2.6.2. Elementos a serem previstos
Serão tomados aqui os seguintes elementos (previstos por Mendeleiev): Escândio, Gálio e Germânio.
Temos que o Escândio aparece entre os elementos Cálcio e Titânio, portanto, para os cálculos de sua previsão
será simplemente utilizada a média aritmética entre esses seus dois vizinhos.
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
Gálio e Germânio estão entre Zinco e Arsênio. Para os cálculos foram utilizadas médias ponderadas, de
maneira que:
Ga = Zn (2 / 3) + As (1/ 3)
(2)
Ge = Zn(1/ 3) + As (2 / 3)
(3)
Onde Ga, Zn, As e Ge, representam qualquer característica dos elementos Gálio, Zinco, Arsênio e Germânio,
respectivamente.
2.6.3.Geração do mapa
Foram treinados 5 mapas com os parâmetros determinados na primeira fase da pesquisa, tomando-se os 62
elementos no treinamento da rede.
Os resultados dos critérios de avaliação seguem na Tab. 3.
Tabela 3. Resultados dos critérios de avaliação para os mapas treinados
Mapa Coincidências Raio Médio das
Famílias
Distância Média
entre Famílias
1
4
5,02
1,15
2
2
6,32
1,34
3
3
5,08
1,30
4
4
6,99
1,40
5
4
6,44
1,24
O mapa 1 apresenta melhores parâmetros e poucas coincidências, sendo portanto o escolhido para a análise de
previsibilidade. Ele segue na Fig. 5.
Hg
Sb
Te
Pb
Tl
I
Cd
In
Br Cl
Se
As
N
H
S
Sn
Zn
P
Cu
Mn
Be
Mg
Ni Fe
C
B
Pd
Cr
Si
Li
Au
Rh
V Ti
Al
Ru Mo
Zr
Ca Na
Pt U
Nb
Y
Sr
K
Ir
Ta
La
Ba
Rb
Ag
Os W
Th
Ce
Yb
Cs
Figura 5. Simulação da rede com os melhores parâmetros
As coincidências apresentadas pelo mapa são: N e O, N e F, Fe e Co, Pb e Bi.
2.6.4. Resultados das técnicas
Para verificar o poder de previsibilidade do mapa, tomaram-se os erros relativos de cada uma das
características determinadas segundo cada técnica em relação aos valores reais. Esses dados seguem na Tab.4.
Tabela 4. Erros relativos das características dos elementos.
Massa
Massa Ponto de Ponto de
Raio
Calor
Potencial Eletronega
Característica Atômica específica Fusão Ebulição Atômico Específico Ionização tividade
Técnica 1
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
Escândio
Gálio
Germânio
Técnica 2
Escândio
Gálio
Germânio
55,7%
2,0%
1,3%
115,1% 50,8%
12,9% 172,6%
16,4% 20,8%
66,7%
56,3%
68,3%
31,6%
19,2%
8,1%
36,6%
0,0%
9,4%
46,3%
58,9%
22,4%
40,8%
1,5%
0,2%
122,5%
65,6%
55,6%
278,0% 41,4%
67,6% 149,3%
37,3% 64,5%
43,0%
46,0%
24,3%
8,1%
31,5%
31,5%
56,7%
197,3%
28,1%
10,9%
67,6%
26,7%
63,2%
17,4%
11,0%
E na Tab. 5 seguem os valores médios desses erros:
Tabela 5. Valores médios dos erros relativos das características.
Técnica 1 (Média)
Escândio
55,5%
Gálio
40,4%
Germânio
18,4%
Técnica 2 (Neurônio)
Escândio
78,0%
Gálio
80,3%
Germânio
34,9%
Mesmo apresentando erros bastante altos nas duas técnicas, é possível observar que o mapa retorna valores
bastante próximos para alguns parâmetros como a massa atômica de Gálio e Germânio com a técnica 1.
2.7. Mapas dos Lantanídeos
2.7.1.O Método
Foi investigado também como uma rede neural distribui os Lantanídeos e Actinídeos. Porém, logo nos
primeiros testes, optou-se por deixar os Actinídeos de lado, pois muitas de suas características não são conhecidas, não
oferecendo bons parâmetros para o treinamento da rede. Os dados utilizados no treinamento da rede estão no anexo 4.
Foram testados três modelos de mapas: um modelo em linha, ou seja, um mapa de dimensões 1x15, que simula
a distribuição utilizada na tabela periódica clássica; um modelo com duas linhas, ou seja, de dimensões 2x15; e um
mapa quadrado, semelhante ao utilizado a maior parte do tempo da pesquisa, de dimensões 5x5.
Mesmo tomando-se apenas os lantanídeos, ainda existem 5 características que não são conhecidas, são elas: os
pontos de ebulição e fusão do promécio e as eletronegatividades de Európio, Térbio e Hólmio. Assim, é necessário
preencher artificialmente essas células. Isso foi feito de 2 maneiras: simplesmente atribuindo-se o valor zero para esses
valores faltantes e fazendo-se a média entre os valores das características imediatamente vizinhas.
Para cada um dos 6 tipos formatos diferentes de mapas citados foram treinadas e analisadas 5 redes. O
treinamento da rede foi idêntico em cada uma das técnicas, utilizando os parâmetros citados no ítem C, exceto pelo
número de passos da fase de ordenação e pelo número de épocas, respectivamente 3000 e 9000.
No treinamento da rede foram utilizados todos os 15 elementos.
2.7.2.Critério de Vizinhança
Para a análise dos melhores mapas, adotou-se um critério de vizinhança, que conta o número de pares de
elementos que são vizinhos na tabela periódica e que: também são vizinhos no mapa, podendo-se pular casas vazias; ou
coincidem no mapa.
2.7.3. Melhores mapas
Seguem abaixo, os melhores mapas obtidos com cada técnica.
2.7.3.1. Atribuindo zero
-Mapa 1x15
Os 5 mapas são muito semelhantes quanto a posição relativa dos elementos, assim, segue abaixo, como
exemplo de mapa que aproxima-se bastante da tabela periódica, aquele que contém o menor número de coincidências,
segue na Fig. 6.
Lu Gd Dy Tm Yb
Pm
Sm Pr Ce La
Eu Tb
Figura 6. Mapa 1x15, atribuindo zero aos valores faltantes.
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
As coincidências desse mapa são as seguintes: Pr e Nd, Tb e Ho, Dy e Er.
-Mapa 2x15
Novamente os mapas apresentaram-se muito semelhantes entre si. Escolheu-se um como exemplo, que
apresenta 7 vizinhanças corretas e que segue na Fig. 7.
Lu Dy Er Tm
Pm
Nd
Ce La
Eu
Gd
Yb
Sm
Pr
Tb
Figura 7. Mapa 2x15, atribuindo zero aos valores faltantes.
A coincidência desse mapa é a seguinte: Tb e Ho.
-Mapa 5x5
Segue o mesmo padrão dos anteriores, aqui se pode observar 12 vizinhanças corretas. O mapa é apresentado na
Fig. 8.
Ce La
Pr
Eu
Tb
Sm
Pm
Gd
Er Dy
Yb Tm
Lu
Figura 8. Mapa 5x5, atribuindo zero aos valores faltantes.
As coincidências desse mapa são as seguintes: Pr e Nd, Tb e Ho
2.7.3.2. Adaptando-se com as médias
-Mapa 1x15
Apresentando 12 vizinhanças corretas, foi escolhido o mapa que segue na Fig. 9.
Eu Sm Pm Pr
Ce La
Yb Tm Ho Dy Lu Tb Gd
Figura 9. Mapa 1x15, adaptando-se com as médias.
As coincidências desse mapa são as seguintes: Pr e Nd, Ho e Er.
Nota-se que, se fosse excluído o elemento Lutécio, toda a série estaria correta.
-Mapa 2x15
Mesmo problema do mapa anterior, mas ainda assim, respeita bastante as vizinhanças da tabela
periódica.Segue o mapa escolhido na Fig. 10.
Ce
Pm
Eu
Yb
Tm Er
Lu
La
Pr Nd
Sm
Gd
Dy Tb
Figura 10. Mapa 2x15, adaptando-se com as médias.
A coincidência desse mapa é a seguinte: Dy e Ho.
-Mapa 5x5
Aqui, além do problema dos mapas anteriores, a vizinhança entre Európio e Gadolínio também não ocorre. O
melhor mapa é apresentado na Fig. 11.
Sm Eu
Yb Tm
Pm
Er
Pr
Dy Ho
Ce
Tb
La
Gd
Lu
Figura 11. Mapa 5x5, adaptando-se com as médias.
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
A coincidência desse mapa é a seguinte: Pr e Nd.
2.8. Conclusões
2.8.1. Comparação dos Mapas com a Tabela Periódica
Ao longo da pesquisa foram obtidos diversos mapas que apresentavam bastante semelhança com a tabela
periódica, indicando o poder das redes neurais em organizar os elementos. No mapa da figura 5, utilizado para a
previsão das características dos elementos pode-se verificar isso:
Regiões do Mapa:
-Elementos das seguintes famílias dos ametais agruparam-se bem entre si:
Família 1: Região inferior direita;Família 2: Acima da família 1;Família 15:Região superior do mapa;Família
16: Região superior direita;Família 17: Região superior direita.
-Ferro, Cobalto e Níquel (elementos com propriedades bem semelhantes) ficam próximos (região centroesquerda).
-Platina, ouro, paládio e prata ficam próximos.
-Oxigênio, Nitrogênio e Fluor, gases bastante semelhantes, coincidem nesse mapa.
-Elementos próximos em geral na tabela, estão próximos no mapa.
2.8.2. Poder de Previsão dos Mapas
Apenas algumas características previstas tiveram valores próximos dos aceitos atualmente para os elementos
Escândio, Gálio e Germânio. No geral, as duas técnicas não se mostraram muito eficientes para a previsão de
caracaterísticas de elementos. Isso pode ser justificado pela diversidade de características que permite uma organização
boa dos elementos conforme a tabela períodica sem que todas as suas características estejam bem estabelecidas. Um
treinamento mais exaustivo da rede poderia sanar esse problema, e é deixado aqui como sugestão.
Mesmo não sendo efetivas é possível avaliar a técnica da utilização da média dos neurônios vencedores mais
indicada como ferramenta de previsão quando comparamos os erros relativos médios das duas técnicas.
2.8.3. Mapas dos Lantanídeos
Aqui foram obtidos resultados melhores do que os esperados inicialmente.
Comecemos com uma comparação do número de vizinhanças corretas dos mapas escolhidos, que segue na
Tab. 6.
Tabela 6. Número de vizinhanças corretas dos melhores mapas
Mapa\Técnica
Atribuir Zero
Média dos Vizinhos
1x15
6
12
2x15
7
12
5x5
12
13
Assim, observa-se que utilizando a média dos vizinhos para preencher as lacunas de informação se obtém um
melhor resultado dos mapas, já que mais vizinhanças são respeitadas.
No caso do mapa 1x15 (que representaria a própria série na forma da tabela periódica), a rede neural reproduz
quase perfeitamente a distribuição dos lantanídeos nesse caso, mostrando que as características trabalhadas indicam
bons critérios de semelhança entre os elementos desse grupo.
O mapa 5x5 traz uma distribuição alternativa do grupo. O mapa dado como exemplo não respeita apenas uma
vizinhança característica do grupo (Lutécio).
Em boa parte dos mapas testados, se observa que os elementos Európio e Gadolínio ficam distantes, mesmo
sendo vizinhos na distribuição periódica, o que mostra uma certa diferença entre as suas características analisadas.
3. Agradecimentos
CNPq
ITA
4. Referências
Anais do XIII ENCITA 2007, ITA, Outubro, 01-04, 2007
,
WEEKS, Mary Elvira, 1960, “Discovery of the elements”, 6ª Edição, Journal of Chemical Education, Estados Unidos
da América.
STRATHERN, Paul, 2002, “O Sonho de Mendeleiev – A Verdadeira História da Química”, Jorge Zahar Ed., Rio de
Janeiro.
Download