I SBAl - UNESP - Rio Claro/SP - Brasil Redes Neurais em Espectroscopia Mõssbauer Evandro O. T. Salles*, P. A. de Souza Júnior +, V. K. Garg++ * Departamento de Engenharia Elétrica, Centro Tecnológico, ++ Departamento de Física, Centro de Ciências Exatas, Universidade Federal do Espírito Santo, 29060-900 - Vitória, ES, Brasil. Resumo- Neste trabalho utilizou-se Redes Neurais para identificação de uma substância a partir de parâmetros Mõssbauer. Baseou-se o treinamento da rede num banco da dados contendo os parâmetros 1.5. e Q.S. de substâncias catalogadas de tal forma que a rede, através de um desenvolvimento próprio, reconheça quais substâncias possuam os parâmetros informados. Palavras-chave: Redes Neurais, Counterpropagation, Banco de Dados, Espectroscopia Mõssbauer. Neural Network in Mõssbauer Spectroscopy Evandro O. T. Salles*, P. A. de Souza Júnior +, V. K. Garg++ * Departamento de Engenharia Elétrica, Centro Tecnológico, ++ Departamento de Física, Centro de Ciências Exatas, Universidade Federal do Espírito Santo, 29060-900 - Vitória, ES, Brasil. Abstract- Mõssbauer data has been stored in the computer of ali the studied minerais reported in the literature to identify through the Neural Network a desired substance whose on/y Mõssbauer parameters are known. Keywords: Neural Networks, Counterpropagation, Data storage, Mõssbauer 5pectroscopy. * Estudo parcial para dissertação de mestrado. + Bolsista de Iniciação Científica - CNPq. - 27- I SBAI - UNESP - Rio Claro/SP - Brasil Introdução: A ressonância nuclear por emissão ou absorção de raios gama, sem recuo, é conhecida como Efeito Mõssbauer. Trata-se de uma espectroscopia descoberta em 1958 por RudolfMõssbauer e tal fato lhe conferiu o 10 Prêmio Nobel em Física em 1961 [01]. Desde então a Espectroscopia Mõssbauer tem sido intensamente utilizada nas mais diversas áreas de pesquisa científica [02] tais como química, estrutura química, mineralogia, geologia, arqueologia, biologia, biofísica, medicina, ciência dos materiais, metalurgia, física fundamental, interferência, coerência, tempo reverso, sincrotron, superfícies interfaces, filmes finos, pontos defeituosos, pequenas partículas, dinâmica de rede, difusão, transição de.fase, relaxação, supercondutividade, catálise, corrosão, magnetismo e materiais magnéticos, materiais amorfos, cristais, ligas e metais, semicondutores, eletrônica, materiais ópticos, etc. Devido à grande quantidade de ferro existente na crosta terrestre, a maior parte dos trabalhos é realizada em amostras que contém esse elemento (óxidos, silicatos, sulfetos, etc.). Além do ferro, existem cerca de 40 outros elementos onde efeito Mõssbauer foi detectado, mas não foram explorados com a mesma intensidade devido a consideráveis problemas técnicos. Até a presente data mais de 500 minerais contendo ferro foram estudados [03], resultando em tomo de 2000 publicações em todo o mundo. Teoria: a) Efeito Mõssbauer: A maioria das medidas disponíveis no estudo do Efeito Mõssbauer envolvem interações do núcleo com os campos elétrico e magnético nos quais estas medidas são feitas [04]. Essas interações são chamadas de interações hiperfinas e as principais a serem consideradas são: 1. Interações de monopolo elétrico (ou Coulomb) entre as cargas eletrônicas e nucleares, cujas mudanças se devem à diferença de tamanho do núcleo que está emitindo e o que está absorvendo. Esta mudança aparece como um deslocamento da origem (velocidade zero) da linha de absorção e é chamado Deslocamento Isomérico (I.S. - Isomer Shift), sendo representado por Õ, figura 1. Este deslocamento eletrostático da energia nuclear devido à interação de monopolo entre cargas nucleares e densidades de cargas eletrônicas no núcleo, é dado por oE1 = (521f) Ze 21 1fI(0) 2 1 R2 (1) -28- I SBAI - UNESP - Rio Claro/SP - Brasil onde R é o raio do núcleo de carga Ze e -e[ '11(0) [2 representa a densidade de carga eletrônica do núcleo. EST,\.\X) PlJNDAMflNTAL I. A B B S o R ç Á lo o .c.o .+0 VRLOCID. . m; OOI'PI.HR (til"'''' Figura 1: Deslocamento Isomérico. 2. Interações de quadrupolo elétrico entre o quadrupolo nuclear momentâneo e o tensor de gradiente do campo elétrico local no núcleo. Isto resulta em um espectro múltiplo. Esta interação hiperfina é denominada Desdobramento Quadrupolar (Q.S. - Quadrupole Splitting). Se o núcleo não é esférico e a densidade de campo elétrico no núcleo não é cúbica, então haverá desdobramento dos níveis ao invés de deslocamento; e uma linha de absorção se desdobrará em duas, figura 2. A separação entre os dois picos de absorção é chamada de desdobramento quadrupolar (Q.S.) e é representado por ~Q. 3. Interações de quadrupolo magnético entre o momento magnético e um campo magnético. O resultado é um espectro múltiplo conhecido como Desdobramento Hiperfino Magnético (ou desdobramento Zeeman). Através da observação do desdobramento hiperfino pode-se achar o campo magnético interno. Isto também proporciona uma técnica para o estudo de materiais magneticamente ordenado, magnetização de sub-redes, temperatura de Currie e Néel e momentos magnéticos atômicos. Além disto a aplicação do campo magnético externo (1) fornece a direção do campo magnético interno (Hn). - 29- I SBAl - UNESP - Rio Claro/SP - Brasil +.1. - / /" ~-_._ /" .1. / 3 ' Z 2 ..- ~. '. \ \ , + .l. - 2 +1 - E. .... .. ;~ .L 2 I Z I.., I I I B I I I ---tr.s.1-(ó)1 lo 2 ' Eo Eo A 2 Ah I I I I I I I T12 _J_ O Figura 2: Desdobramento Quadrupolar. Uma substância possui apenas um deslocamento isomérico e desdobramento quadrupolar e até hoje não se encontrou na bibliografia duas amostras que possuam os mesmo LS . e Q.S . . Esta técnica possui uma precisão rotineira de uma parte em um bilhão (resolução superior ao LASER). b) Redes Neurais: Neste trabalho escolheu-se uma rede de aprendizado híbrido [05], denominada Counterpropagation [06] que é uma combinação de uma camada de Kohonen seguida de uma camada de Grossberg. Esta rede funciona como uma tabela de consulta estatisticamente auto-programável [05] e é indicada para as seguintes aplicações: • Classificação de padrões • Aproximação de funções • Análise estatística • Compressão de dados - 30- I SBAI - UNESP - Rio Claro/SP - Brasil A figura 3 abaixo mostra a sua disposição, onde se observa que a arquitetura de rede utilizada se refere ao modelo de propagação para frente, usada quando se deseja mapear uma entrada X numa saída V'. Y2' Yl' Ym' GROSSBERG KOHONEN ENTRADA " ''1 .0' .. Figura 3: x = (XI, Xl, V' = (YI', y2', V = (YI, Y2, 000' .', ," , o" )'''' Xn) vetor de entrada. ym ') vetor de saída da rede ym) vetor de treinamento - camada de Grossberg. 000' 000' A dimensão do vetor de treinamento V é igual ao número de compostos a serem classificados. A rede Counterpropagation combina os mapas auto-organizáveis de Kohonen e a estrutura Outstar de Grossberg [09], dando origem a uma estrutura que, dentre os diversos paradigmas de redes existentes, é a que mais se aproxima da arquitetura cerebral. Kohonen [07] apresentou um novo algoritmo para simulação da ação chapéu de mexicano sem fazer uso das conexões laterais. Em seu trabalho definiu-se relações de vizinhança e é através delas que se escreve a equação de atualização dos pesos. O algoritmo proposto se refere à arquitetura abaixo figura 4. 1.S. Q.S Fi gura 4: Camada de Kohonen. - 31 - I SBAI - UNESP - Rio Claro/SP - Brasil o algoritmo de Kohonen : 1. 2. 3. 4. 5. Inicialização dos pesos da rede Sortear uma entrada Detenninar o neurônio vencedor Atualizar os pesos Aplicar algum critério de parada, caso não satisfeito retomar ao passo 2 A camada de Grossberg - Treinamento: Na camada de Grossberg dispõe-se de tantos neurônios quantas são as classes a serem identificadas . O aprendizado é supervisionado e é feito em conjunto com o algoritmo de aprendizado de Kohonen. O algoritmo de aprendizado da rede counterpropagation é, portanto, obtido pela incerção do aprendizado de Grossberg entre os passos 4 e 5 do algoritmo de Kohonen. Discussão e resultados: Criamos um banco de dados contendo os trabalhos em Espectroscopia Mõssbauer sobre substâncias terrestres e extraterestres que contém ferro publicados desde a descoberta de RudolfMõssbauer até 1992. De cada trabalho extraiu-se a fonte , temperatura e I (intensidade do campo magnético aplicado à amostra) utilizados e I.S., Q.S. e Hn (campo magnético interno) obtidos, assim como a respectiva referência do trabalho . O nosso banco conta hoje com quase 500 substâncias catalogadas em disquete ou o equivalente a aproximadamente 500 páginas de um livro padrão. Existem várias medidas de cada subtância catalogada. Obteve-se um padrão representativo destas substâncias calculando-se uma média aritmética dos r. S. (em relação ao a-ferro) e dos Q.S., apenas. Para este trabalho realizou-se testes com dois grupos de substâncias: um de sulfatos, sulfetos e sulfitos, e outro de silicatos. Desta forma cada grupo contém as respectivas substâncias com seus padrões de 1.S. e Q.S. determinados estatisticamente. Utilizou-se uma rede counterpropagation para o reconhecimento de substâncias a partir dos parâmetros de r. S. e Q.S .. Escolheu-se este tipo de rede por sua capacidade de reconhecer e categorizar padrões estatísticos de uma amostra de dados. Neste caso propriedades que são similares nos vetores de entrada produzirão saídas similares [05]. Implementou-se a rede utilizando-se o compilador Borland C. Foram utilizados 100 neurônios na camada de Kohonen dispostos numa estrutura bidimensional como se observa na fig.3. Este arranjo é especialmente útil para mapeamentos topológicos da entrada, o que facilitou a visualização da posição dos padrões em relação à norma, bem como o acompanhamento da convergência da rede [la]. Para a camada de Grossberg - 32- I SBAI - UNESP - Rio Claro/SP - Brasil rotulou-se cada neurônio como sendo representante de um composto conforme ilustrado na figura 4. F ez-se a normalização das entradas acrescentando-se uma dimensão ao espaço de entrada. Escolheu-se este procedimento pois a normalização comumente indicada na literatura pode conduzir a erros de classificação quando vetores de entrada de magnitudes distintas possuirem orientações angulares próximas, vide figura 5. z .k--+--t--X 1 y Figura 5: Normalização. Dado o vetor de entrada x = (Xl, Xl,) = (I.S., Q.S.) escolheu-se um valor N levemente maior que o maior comprimento dos vetores de entrada. Fez-se Xn = (Xo, Xl, Xl) onde Xo é a nova dimensão. Calculou-se Xo segundo a equação: Para a norma unitária fez-se: - 33 - I SBAI - UNESP - Rio Claro/SP - Brasil Para os primeiros testes (com sulfatos, sulfetos e sulfitos) foram escolhidos. 31 compostos o que implicou em 31 neurônios na última camada. Procurou-se sempre que o número de neurônios da camada de Kohonen fosse maior que o número de compostos a serem identificados. Um resultado típico do funcionamento da rede, para a classe dos sulfatos, sulfetos e sulfitos, é apresentado na tabela-I. Nosso estudo estabelece claramente que redes neurais pode ser útil na análise de dados Mõssbauer para determinar uma substância desconhecida. Um estudo mais amplo e completo, com um maior número de substâncias e classes em conjunto num único treinamento, está em andamento. Agradecimentos: Agradecemos aos professores Gutemberg Hespanha Brasil, Ailson Rosetti de Almeida e Francisco José Negreiros Gomes pelo interesse neste trabalho e ao CNPq pelo apoio financeiro para este estudo. Bibliografia: [01] G. K. Wertheim in Mõssbauer Effect: PrincipIes and Applications, Academic Press, New Y ork, USA (1968). [02] S. Mitra, Applied Mõssbauer Spectroscopy, Pergamon Press , Oxford, England (1992). [03] Mõssbauer Effect Data lndexs 1958-1976, Plenum Press, New York, USA', Mõssbauer Effect Reference and data Journal VoI. 1 -1 S, Mõssbauer Effect dta Center, University ofNorth Carolina, Asheville, USA. [04] V. K. Garg in Horizons ofPhysics, Editor A. W. Joshi, Wiley, Delhi (1989). [05] J. Hertz, A. Krogh, R. G. Palmer, Addison-Wesley Publishing Company, Redwood City, CA, USA (1991). [06] R. Hecht-Nielsen, Counterpropagation, Applied Optics, voI. 26, No. 23, (Dezembro 1987). - 34- I SBAl - UNESP - Rio Claro/SP - Brasil [07] T. Kohonen, The Neural Phonetic Typewriter, IEEE Computer Magazine (Março 1988). [08] J. E. Dayhoff, Neural Network Architectures, Van Nostrand Reinhold, New York, USA (1990). [09] P. D. Wasserman, Neural Complete Teory and Process, Van Nostrand Reinhold (1989). [10] L. P. Calôba, Introdução à computação neuronal, 9° CBA-UFES, minicurso (Setembro 1992). - 35 - I SBAI - UNESP - Rio Claro/SP - Brasil Tabela-l a): IS. Q.S. Substância 0.4200 0.2733 1.0333 0.3790 0.3250 0.3425 0.3870 0.3900 1.2800 0.3400 0.2901 0.4400 0.6151 0.2773 1.2436 0.3557 0.3156 0.6736 0.4550 1.3200 0.5551 0.6559 0.6002 0.4233 0.3777 1.2553 0.7779 0.4220 0.3533 0.2400 0.6883 2.2850 1.1050 2.6325 03080 0.5600 0.3227 0.8540 0.4600 2.7800 0.3500 0.5150 0.1500 0.0800 0.5028 3.1890 0.3875 0.6001 0.0447 0.6200 3.1700 0.3500 0.6925 2.8473 0.3500 1.5450 2.7470 0.1940 -0.2730 0.4423 0.5950 0.8000 Argentopyrite Arsenopyrite Berthierite Cattierite Chacocite Cobaltpentlandite Cubanite Djerfisherite Ferrous Sulfate Germanite Greigite Kornelite Macknawite Marcasite Melanterite Pentlandite Pyrite Pyrrhotite Romerite Rozenite Smythite Sphalerite Stanite Stannoidite Sternbergite Szolmolnokite Troilite Vaesite Villaman inite Violarite Wurtzite a) Padrões do grupo dos Sulfatos, sulfetos e sulfitos utilizados no aprendizado da rede. - 36- I SBAI - UNESP - Rio Claro/SP - Brasil Tabela-l b): 1. S. Q.S. Substância 1a classiJJ.!:ação 0.2983 1.1083 1.1300 0.3530 1.1600 2.6700 2.5700 0.3220 Arsenopy_rite Berthierite Berthierite Cobaltpentlandite Arsenopyrite ./ Berthierite ./ Berthierite ./ Cobaltpentlandite 2a classificação Ar~enopyrite Arsenopyrite Berthierite ./ Cattierite ./ 0.3330 0.3751 1.2700 1.2800 0.2751 0.2760 1.2300 1.2607 0.6915 0.7683 0.6651 0.4383 0.3500 0.6883 0.3370 0.8800 2.7200 2.7700 0.4800 0.5050 3.1800 3.2100 0.0200 -0.0700 0.6700 0.3400 0.4740 0.8000 Cobal!I!entlandite Cubanite Ferrous Sulfate Ferrous Sulfate Greigite Marcasite Melanterite Melanterite Pyrrhotite Pyrrhotite Sphalerite Stannoiditc Villamaninite Wurtizite Germanite Cubanite ./ Szolmonokite Ferrous Sulfate ./ Marcasite Marcasite ./ Melanterite ./ Rozcnite Pyrrhotite ./ Pyrrhotite ./ Sphalerite ./ Stannoidite ./ Villamaninite ./ Wurtizitc ./ Cobal!I!entlandite./ Germanite Ferrous Sulfate ./ Szolmonokite Greigite ./ Greigite Marcasite Melanterite ./ Mackinawite Mackinawite Romerite Germanite Djerfisherite Villamaninite b) I. S. e Q. S. experimentais de amostras conhecidas [03] submetidos à classificação da rede com apresentação das duas substâncias mais prováveis no reconhecimento. Os acertos foram assinalados com o símbolo (./ ). - 37-