CAPITULO 1 - Introdução 1 CAPÍTULO I INTRODUÇÃO O estado gasoso O estado gasoso é certamente o estado de agregação sob o qual menos nos debruçamos, se pensarmos na observação que fazemos daquilo que nos rodeia. Todos sabemos que existe (atmosfera, combustíveis gasosos...), mas não é fácil enumerar um conjunto de propriedades que lhes sejam características. Podemos contudo afirmar, de forma simplista, que os gases fluem com extrema facilidade, tem uma densidade baixa, são bastante compressíveis, e ocupam todo o volume que lhes seja disponível. Vamos neste capítulo rever alguns conhecimentos importantes sobre o estado gasoso, pois é frequentemente utilizado como exemplo na demonstração dos fundamentos básicos da Termodinâmica Química. O modelo do gás perfeito No estudo da Termodinâmica não necessitamos de qualquer teoria acerca da estrutura molecular, mas no entanto é bom termos em mente um modelo molecular para interpretar os seus resultados. Uma boa visão para um gás perfeito é o de um conjunto de moléculas, consideradas partículas pontuais, em movimento aleatório, com velocidades que aumentam com a temperatura, e sem interacções entre si, excepto colisões elásticas de muito curta duração. As propriedades fundamentais para estudarmos um sistema termodinâmico são o volume, V, a pressão, p, a temperatura, T, e a quantidade de matéria, ou número de moles, n. Um gás, num dado estado termodinâmico de equilíbrio, é caracterizado univocamente por aquelas propriedades. No entanto estas propriedades não são independentes umas das outras, pois existe uma equação de estado que relaciona todas estas propriedades. Essa equação para um gás perfeito é a equação dos gases perfeitos: pV = n RT CAPITULO 1 - Introdução 2 onde p é a pressão a que o gás está sujeito, T a sua temperatura absoluta, V o volume que ocupa, n o número de moles de gás presente, e R é a constante dos gases perfeitos. R = 8.314 J.mol-1.K-1 = 1.987 cal.mol-1.K-1 = 83.14 bar.cm3.mol-1 ou R = 0.082 atm.L.mol-1.K-1 Voltaremos a esta equação mais adiante. Por agora vamos recordar alguns conceitos básicos sobre pressão e temperatura que importa ter presentes ao longo do curso. Estes conceitos são do maior interesse, pois todos os fenómenos químicos dependem destas variáveis termodinâmicas. Pressão A pressão constitui com a temperatura o par de variáveis termodinâmicas consideradas como independentes, pois é relativamente simples controlá-las num laboratório ou instalação industrial. A pressão é uma força exercida por unidade de área. Mede-se em várias unidades. A unidade de pressão do Sistema Internacional (SI) é o Pascal. O Pascal é uma unidade derivada deste sistema, e representa a pressão exercida pela força de 1 N actuando numa área de 1 m2 , isto é: 1 Pa = 1 N m-2 Esta unidade é pouco prática pois representa uma quantidade muito pequena. A sua relação com unidades mais práticas é a seguinte: 1 bar = 100 kPa 1 atm = 101325 Pa Usam-se ainda unidades mais pequenas como o torr, que é muito aproximadamente igual ao milímetro de mercúrio, mmHg: 1 torr = 133.322 Pa CAPITULO 1 - Introdução 3 Da relação anterior deriva outra igualdade importante que relaciona a atmosfera com esta última unidade: 1 atm = 760 torr O método mais simples de medida da pressão para zonas entre ≈ 10 mbar e 1 bar é o manómetro de mercúrio. Um exemplo é a medida da pressão atmosférica com um barómetro. O princípio básico desta medida é o equilíbrio entre uma coluna de mercúrio e uma coluna de ar à superfície líquida do mercúrio. Considere-se a figura 1.1: Figura 1.1. Barómetro de mercúrio Se o espaço acima da coluna de mercúrio for um vácuo perfeito, a pressão atmosférica, p, pode ser relacionada com a altura da coluna de mercúrio, h, da seguinte forma: p = F/A = mg/A = ρπr2hg/πr2 = ρhg onde F é a força exercida pela coluna de mercúrio por unidade de área, A, m é a massa de mercúrio, g é a aceleração da gravidade, e ρ é a densidade do mercúrio. Os manómetros mais simples são em forma de U. O tubo em forma de U encontrase cheio de mercúrio, como mostra a figura 1.2: CAPITULO 1 - Introdução 4 Figura 1.2. Manómetro de mercúrio Um dos braços do manómetro encontra-se ligado ao sistema ao qual se pretende medir a pressão. O outro braço está fechado em vácuo, ou aberto. Se está aberto, a pressão medida no sistema é relativa , isto é: Psist = Pman + Patm Se o tubo estiver fechado, Psist = Pman. Os manómetros de mercúrio são utilizados em linhas de vácuo, para operações de controle e medida de pressões relativamente baixas. Para pressões mais reduzidas, na zona do vácuo primário temos de recorrer a manómetros do tipo Pirani. Estes manómetros utilizam um filamento aquecido de um metal com um coeficiente de variação da resistência com a temperatura elevado. A temperatura do filamento depende da condutibilidade térmica do gás residual que, a baixas pressões, varia linearmente com a pressão. Estes manómetros necessitam de calibração. Para o alto vácuo utilizam-se manómetros de ionização. Para pressões mais elevadas recorre-se frequentemente a manómetros de tubo de Bourdon como o da figura seguinte: CAPITULO 1 - Introdução 5 Figura 1.3. Manómetro de tubo de Bourdon O tubo de Bourdon é um tubo fechado na extremidade e enrolado. Quando a pressão é aplicada o tubo tende a desenrolar provocando o movimento de um mecanismo com ponteiro. Temperatura Todos sabemos intuitivamente o significado de temperatura, mas definir correctamente o termo é um pouco mais complicado. Podemos afirmar que a temperatura é a propriedade que nos indica a direcção de um fluxo de energia. Se o calor flui de um corpo A para um corpo B dizemos que A está mais quente, ou com temperatura mais elevada do que B. Se não há fluxo de energia quando os corpos A e B estão em contacto então dizemos que estão em equilíbrio térmico. Supondo agora um corpo A em equilíbrio térmico com B e B em equilíbrio térmico com C então C e A estão também em equilíbrio térmico. Isto é a base da Lei Zero da Termodinâmica: Se A está em equilíbrio térmico com B e B em equilíbrio térmico com C , então C está também em equilíbrio térmico com A A lei zero da termodinâmica é o princípio fundamental que permite construir termómetros. Estes são instrumentos que indicam uma variação de temperatura em CAPITULO 1 - Introdução 6 função de uma propriedade física qualquer (como por exemplo o comprimento de uma coluna de mercúrio). Nos primórdios da termometria as temperaturas foram relacionadas com o comprimento de uma coluna de líquido, e as diferenças de comprimento observadas em contacto com gelo e em contacto com água em ebulição foram divididas em 100 partes iguais, atribuindo-se 0 graus ao valor mais baixo. Esta é a escala em graus Celsius. Esta escala depende pois do fluido utilizado. Pelo contrário, o volume de um gás é aproximadamente independente do tipo de gás, à medida que a densidade tende para zero. Esta propriedade permite estabelecer a escala de temperaturas termodinâmicas. As temperaturas termodinâmicas são designadas por T e medem-se em kelvin, K. A relação entre a escala termodinâmica de temperatura e a escala mais vulgarmente utilizada, ou escala em graus Celsius, °C, é: T/K = t/°C + 273.15 Nesta escala 0 °C corresponde exactamente a 273.15 K. A temperatura pode ser medida utilizando um termómetro de gases. A temperatura é medida comparando a pressão do gás quando está em contacto térmico com a amostra à qual se pretende medir a temperatura, e com um padrão adequado. Um padrão adequado é a água no seu ponto triplo (ver adiante no curso), a condição única de p e T em que a água coexiste simultaneamente nos três estados de agregação, sólido, líquido e vapor. A temperatura do ponto triplo é definida exactamente como: T3 = 273.16 K Se a pressão medida quando o termómetro de gás está em contacto com a amostra é p, e a pressão quando está em contacto com T3 é p3, então a temperatura da amostra é dada por: T ≈ (p/p3)T3 CAPITULO 1 - Introdução 7 A relação anterior é exacta apenas quando o gás se comporta idealmente, isto é, na zona das baixas pressões. Na figura seguinte mostra-se um termómetro de gás a volume constante: Figura 1.4. Termómetro de gás a volume constante O termómetro anterior é evidentemente pouco prático. Os termómetros de expansão fazem uso da dilatação das substâncias como propriedade termométrica. O exemplo mais comum é o termómetro de mercúrio. Estes termómetros são previamente calibrados, pois a dilatação da coluna de mercúrio também depende do vidro utilizado. Para maior rigor das medidas de temperatura utilizam-se outros tipos de termómetros. Nos termómetros de resistência de Platina é medida a resistência da platina em contacto com a amostra, que por sua vez é função da temperatura. Outro tipo de termómetros são os termopares. Estes consistem em duas junções de condutores diferentes (existem vários tipos). Uma das junções coloca-se a uma temperatura t0 conhecida (pode ser o gelo em fusão) e a outra à temperatura t que se pretende medir. A força electromotriz gerada é função da diferença de temperaturas, podendo assim determinar-se t. Para altas temperatura pode ainda utilizar-se um pirómetro óptico, em que é medida a radiação emitida pela fonte, num dado comprimento de onda, que por sua vez é função da temperatura. CAPITULO 1 - Introdução 8 Leis dos gases A equação dos gases perfeitos é uma lei limite, pois quando p Æ 0, quase todos os gases obedecem a esta lei. A pressões próximas de 1 atm e temperatura ambiente a maioria dos gases não se desvia muito deste comportamento. A equação dos gases perfeitos pode ser facilmente deduzida das leis fundamentais dos gases. A primeira destas leis é a Lei de Boyle. Para n e T constantes Boyle verificou o seguinte: pV = constante Num gráfico p,V obtemos isotérmicas como as da figura seguinte: Figura 1.5. Isotérmicas ideais de um gás Outra lei fundamental é a Lei de Charles e Gay-Lussac. Para n e p constantes obtêm-se: V∝T e para n e V constantes obtêm-se igualmente: P∝T Verifica-se assim que V ∝ T com uma constante de proporcionalidade que depende da pressão. Cada curva representa uma isobárica e é traduzida por uma linha recta no diagrama V,T. Lord Kelvin reconheceu a importância desta lei, definindo a partir dai uma escala de temperaturas absolutas, ou escala termodinâmica. De facto Lord Kelvin verificou que extrapolando o volume de vários gases em função da temperatura, para volume nulo, obtém-se para todos uma intersecção na ordenada que correspondia a - 273.15 CAPITULO 1 - Introdução 9 °C. A este valor atribuiu o valor de 0 K, mantendo os intervalos entre graus iguais. Isto significa que os 0 °C são precisamente 273.15 K. Esta escala é a única com interesse em cálculos termodinâmicos. Isto pode ser observado na figura abaixo: Figura 1.6. Isobáricas ideais de um gás A ultima lei fundamental é a Lei de Avogadro . Para p e T constantes temos: V∝n Juntando todas estas leis obtemos: V ∝ 1/p . T . n V ∝ nT/p ou V = Constante × nT/p Esta constante é uma constante universal e é a constante dos gases perfeitos, R. A equação anterior vem então: pVm = RT onde Vm é o volume molar do gás. Um mole de gás perfeito ocupa em condições PTP precisamente 22.414 litros. CAPITULO 1 - Introdução 10 Misturas No caso de misturas de gases perfeitos podemos aplicar a Lei de Dalton. A pressão exercida por uma mistura de gases perfeitos (A + B) é a soma das pressões exercidas pelos gases individuais, ocupando o mesmo volume: p = pA + pB Como a fracção molar de um dos componentes na mistura é yA = nA/(nA + nB) então obtêm-se facilmente: pA = y A × p onde pA é a pressão parcial de A e p é a pressão total. Vamos achar esta equação muito útil mais adiante. Gases reais Os gases reais são imperfeitos pois existem interacções intermoleculares, isto é, forças repulsivas e atractivas entre os átomos ou moléculas. Os desvios à idealidade são mais importantes a altas pressões e condições extremas de temperatura. Uma das formas mais simples de visualizar estes desvios consiste em representar o factor de compressibilidade em função da pressão. O factor de compressibilidade é dado por: z = pVm/RT Na figura seguinte mostra-se a variação de z com a pressão para um gás real, comparativamente ao comportamento de um gás perfeito. CAPITULO 1 - Introdução 11 Figura 1.7. Variação do coeficiente de compressibilidade com a pressão. Quando z > 1 as forças repulsivas são dominantes e os gases são mais difíceis de comprimir que um gás perfeito, e para z <1 as forças atractivas são dominantes e o gás mais fácil de comprimir. Vejamos agora um diagrama p,Vm mostrando as isotérmicas experimentais para um gás real , tomando como exemplo o CO2. Figura 1.8. Isotérmicas experimentais para o CO2 CAPITULO 1 - Introdução 12 Como se pode observar, para valores de Vm elevados e temperaturas mais altas as isotérmicas reais são semelhantes às isotérmicas de um gás perfeito. Esta conclusão permite-nos expandir a equação dos gases perfeitos da seguinte forma: pVm = RT ( 1 + B’p + C’p2 + ... ) Esta expressão é a equação de estado do virial, sendo os coeficientes B’ e C’ os respectivos coeficientes de virial, dependentes unicamente da temperatura. É uma extensão importante da equação dos gases perfeitos. A temperatura para a qual o 2º coeficiente do virial é nulo designa-se por temperatura de Boyle, isto é B´(T =TB) = 0, verificando-se que, por coincidência, a esta temperatura o gás se comporta como perfeito. Vejamos agora o que acontece com a condensação do gás. Consideremos um dado volume de uma amostra de gás, inicialmente no estado A, que é diminuído a temperatura constante. Próximo de A a pressão do gás aumenta mais ou menos de acordo com a Lei de Boyle. Começam a surgir desvios quando o volume se aproxima de B. No ponto C ( que corresponde a cerca de 60 atm no caso do dióxido de carbono) começa a condensação do gás. Este ponto é chamado de ponto de orvalho. Ao longo da linha CDE existem duas fases presentes, a líquida e a gasosa. A linha CDE representa pois a curva de pressão de vapor do líquido à temperatura da experiência. No ponto E (ponto de bolha) toda a amostra é liquefeita. Qualquer redução de volume posterior requer um enorme aumento de pressão (E para F por exemplo). A isotérmica à temperatura Tc, neste caso 31.04 °C, é bastante importante e corresponde à isotérmica crítica. O ponto assinalado com um * é o ponto crítico do fluido. Acima desta temperatura é impossível formar-se líquido, seja qual for a pressão aplicada. Se a amostra for comprimida à temperatura Tc não se formam duas fases, mas uma única fase que ocupa todo o volume disponível. A temperatura, volume e pressão do ponto crítico são designados por temperatura crítica, Tc, pressão crítica, pc, e volume crítico , Vc. Para obter O2 líquido, por exemplo, temos de obter temperatura inferiores a 154.8 K e depois comprimir o gás isotermicamente. Equação de van der Waals CAPITULO 1 - Introdução 13 Uma das modificações mais notáveis da equação dos gases perfeitos é devida a van der Waals. Após estudos com o CO2 van der Waals chegou à conclusão de que os choques entre as partículas do gás e as paredes do recipiente eram reduzidas pelas forças atractivas entre as partículas do gás, como mostra a figura: Figura 1.9. Forças atractivas entre as partículas de um gás A pressão real é então igual à pressão ideal, menos um termo proporcional ao número de ‘encontros’ entre as partículas, isto é (n/V)2: preal = pideal - an2/V2 em que a é uma constante para cada gás. Por outro lado, o volume efectivo disponível às partículas de gás é o volume total ocupado menos um termo dependente do volume intrínseco das moléculas do gás, i.é: Vef = V - nb onde b é uma constante. Substituindo estes valores na equação dos gases perfeitos obtemos: CAPITULO 1 - Introdução 14 (p + an2/V2)(V - nb) = nRT Reorganizando a expressão em termos do volume molar obtemos: p= RT a − 2 Vm − b Vm Esta equação é a equação de estado de van der Waals e foi a 1ª equação a entrar em linha de conta com as forças intermoleculares. Princípio dos estados correspondentes A equação de van der Waals conduz, para T < Tc, a isotérmicas próximas das experimentais. Vejamos uma figura mais detalhada das isotérmicas experimentais para o CO2 , na proximidade do ponto crítico: Figura 1.10. Isotérmicas experimentais para o CO2 na proximidade do ponto crítico O comportamento real pode comparar-se com o comportamento dado pela equação de van der Waals. A equação reproduz razoavelmente o comportamento real do gás. Contudo, para T < Tc a equação tem um comportamento “anómalo” pois, CAPITULO 1 - Introdução 15 sendo cúbica no volume, apresenta na região bifásica (zona de equilíbrio líquido/ vapor) três raízes para o volume. Uma é o volume molar do líquido a outra é o volume molar do gás e a terceira não tem significado físico. À medida que nos aproximamos de Tc o máximo e mínimo da curva aproximam-se, fundindo-se precisamente no ponto crítico. Na isotérmica crítica tanto a 1ª como a 2ª derivada são nulas (ponto de inflexão) pelo que podemos escrever, para um mole de gás: ∂ 2 p ∂p = 2 =0 ∂V Tc ∂V Tc Calculando estas derivadas a partir da equação de van der Waals obtemos: pc = RTc a − 2 Vc − b Vc − RTc 2a ∂p + 3 = 2 ∂V T = Tc (V − b) Vc c ∂ 2 p 2 RTc 6a = − 4 2 3 ∂V T = Tc (Vc − b) Vc Resolvendo simultâneamente as três equações encontramos o valor de Tc, pc e Vc em função de a e b , isto é: Vc = 3b Tc = 8a 27 Rb pc = a 27b 2 A validade da equação de van der Waals pode ser testada calculando o valor do coeficiente de compressibilidade no ponto crítico, zc = pcVc/RTc. Substituindo as equações acima o valor obtido é zc = 0.375. Este valor é muito aproximado ao valor apresentado por vários gases, confirmando assim a validade da equação de van der Waals. CAPITULO 1 - Introdução 16 Vejamos agora como podemos utilizar os resultados anteriores para comparar vários gases. Vamos definir um conjunto de variáveis reduzidas dadas por: pR = p/pc ; TR = T/Tc ; VR = V/Vc van der Waals esperava que diferentes gases com o mesmo volume reduzido e com a mesma temperatura reduzida exercessem a mesma pressão reduzida. Na realidade isto verifica-se pois entrando com os valores dos parâmetros reduzidos na equação de van der Waals e utilizando os valores de a e b em termos de pc e Tc, obtemos: p R pc = RTR Tc a − 2 2 VRVc − b V R Vc ap R 8aTR a = − 2 2 2 27b(3bV R − b) 9b V R 27b e finalmente, pR = 8TR 3 − 2 3V R − 1 V R A equação anterior é uma equação de estado universal, que não depende do tipo de gás. Assim, dois gases diferentes com os mesmos valores de TR e pR têm o mesmo VR, dizendo-se que estão em estados correspondentes. Uma consequência directa do princípio dos estados correspondentes é que o factor de compressibilidade é apenas função de TR e pR. A figura seguinte mostra o factor de compressibilidade em função de pR, para vários TR, e para diferentes moléculas: CAPITULO 1 - Introdução 17 Figura 1.11. Factor de compressibilidade em função de variáveis reduzidas para vários gases Podemos verificar que a universalidade se verifica. Esta, pode dizer-se, foi a maior contribuição de van der Waals para a Ciência dos fluidos. Conhecendo as constantes críticas podemos, para um dado gás calcular o valor de z e a partir do gráfico anterior obter o volume que o gás ocupa. Esta universalidade sofre alguns desvios para gases com moléculas muito polares. A importância do trabalho de van der Waals foi reconhecida de diversas formas, incluindo a edição de um selo comemorativo da atribuição do prémio Nobel. Figura 1.12. Selo comemorativo da atribuição do prémio Nobel a Johannes Diderik van der Waals CAPÍTULO II INTRODUÇÃO À RELATIVIDADE ESPECIAL Albert Einstein em 1905. Neste ano ele publicou na revista Annalen der Physics a Teoria da Relatividade. Logo, o trabalho tornou-se famoso em todo o mundo. 2 II.1 – CONSIDERAÇÕES GERAIS: A Física proposta por I. Newton no século XVII tinha como base fatos fortes e convincentes, integralmente baseados na observação da natureza. Tão convincentes que foi amplamente utilizada nos séculos seguintes sem ser questionada. Os princípios da Mecânica Newtoniana determinaram praticamente todo o desenvolvimento técnicocientífico dos dois séculos que precederam. A Mecânica Newtoniana caracteriza-se de forma marcante por não questionar a validade de seus conceitos, como por exemplo, a questão sobre o referencial no qual são feitas as medidas e a influência do método de medida sobre as grandezas em questão. Mesmo nos nossos dias, os conceitos estabelecidos pela Mecânica Newtoniana permanecem firmemente ligados ao nosso raciocínio cotidiano. Estes conceitos estavam tão fortemente enraizados que atravessaram vários séculos sem que alguém questionasse seus fundamentos. As leis de Newton naturalmente dependem do referencial de observação. Elas só são válidas nos chamados referenciais inerciais, que são aqueles que deslocam-se relativamente entre eles com velocidades constantes. Se tivermos dois referenciais inerciais, um movendo com velocidade constante em relação ao outro, não há experimento que possamos fazer para revelar qual referencial esta em repouso e qual esta se movendo. Esta característica entre referenciais inerciais é chamada de principio da relatividade Newtoniana. Uma característica importante deste resultado é que o movimento absoluto não pode ser detectado. O primeiro físico a questionar alguns conceitos newtonianos foi o físico alemão Ernst Mach. Em seu texto intitulado “The Science of Mechanics” de 1883, Mach expressa críticas à dinâmica de Newton. Mach levantou a questão sobre a distinção entre movimento absoluto e relativo, discutiu o problema da inércia dos corpos e, acima de tudo, apontou como ponto fraco da dinâmica newtoniana sua concepção de espaço e tempo absolutos. Esta concepção newtoniana esta bem ilustrada na seguinte passagem dos “Principia”: “Absolute, true and mathematical time, of itself and by its own true nature, flows uniformly on, without regard to anything external”. 3 Mach observa que, sendo o tempo medido necessariamente pelo movimento repetitivo de um corpo ou sistema físico como, por exemplo, um pêndulo ou o movimento da Terra, é lógico que as medidas de intervalos de tempo devem, de alguma forma, estar conectadas com o movimento. Semelhante, o conceito de espaço deve estar intimamente ligado com as propriedades do sistema de medida e não deve ser considerado como algo absoluto. Tais críticas não causaram muito efeito de imediato, mas ocasionalmente foram de profunda importância para um jovem físico chamado A. Einstein. Einstein foi fortemente atraído pelas idéias de que os conceitos físicos devam ser definidos em termos de grandezas mensuráveis. Portanto, a maneira de observação e realização de medidas físicas deve influenciar os conceitos físicos, incluindo o espaço e o tempo, considerados absolutos por Newton. Este pensamento, muito diferente do absolutismo newtoniano, gerou uma revolução nos conceitos da Física, culminando com o aparecimento da relatividade, a qual será brevemente discutida neste capítulo. II.2 – A CAMINHO DA RELATIVIDADE: O EXPERIMENTO DE MICHELSON-MORLEY A teoria ondulatória da luz foi elaborada alguns anos antes da demonstração de sua natureza eletromagnética. Para os pioneiros no campo da Óptica parecia natural pensar na luz como ondas que se propagavam num meio elástico, chamado éter. Além de necessário para explicar a propagação da luz, o éter também representava o repouso absoluto, ou o sistema em relação ao qual tudo se desloca. As observações de difração e interferência com luz eram perfeitamente explicadas pela teoria do éter. Tais fatos fortaleceram de tal forma a teoria que muitos cientistas da época a aceitavam sem questionamento. Com o desenvolvimento da teoria eletromagnética da luz em 1864 por Maxwell e sua inquestionável comprovação experimental por Hertz em 1887, a teoria do éter ficou relegada a segundo plano. Isto porque já não era mais necessário um meio elástico para explicar a propagação da luz. Apesar de não mais necessário para explicar a natureza de propagação da luz, o éter ainda auxilia outros conceitos. Várias críticas e questões começaram a surgir com respeito a existência do éter. Apesar disto, a idéia básica que a luz propaga-se relativamente a alguma espécie de sistema de referencia universal mantinha vivo o éter. Para melhor entender as 4 implicações da idéia do éter com respeito à propagação da luz, vamos considerar uma situação física análoga a propagação da luz num meio. Seja um rio de largura D, no qual a água flui com velocidade v, como mostrado na figura 1. Fig. 2.1 – Esquema mostrando a viagem de um barco em duas situações De uma das margens do rio, dois barcos (denominados A e B) começam a movimentar-se com velocidade V. Esta é a velocidade que advém da potência do motor do barco, independente da velocidade das águas. O barco A faz uma viagem até a margem oposta e retorna. O barco B movimenta-se paralelamente ao rio e também retorna ao ponto de partida. Vamos calcular o tempo gasto por cada uma destas viagens, sabendo que ambas percorreram a mesma distância. Começando com o barco A, a correnteza tenderá a carregá-lo para a direita do ponto pretendido de chegada na margem oposta, com uma velocidade v paralela ao rio. Assim, para que sua trajetória seja perpendicular ao rio, V deve ter um componente –v na direção do rio, cancelando a velocidade deste. Isto faz com que a velocidade resultante na direção perpendicular ao rio seja V’. Da composição vetorial das velocidades temos que (ver figura 2.2): V2 = V’2 + V2 De modo que: v2 V '= V 1− 2 V 5 desta forma o tempo de viagem do barco A será: tA = 2D / V 1 − v2 /V 2 Fig. 2.2 – Composição vetorial para o movimento perpendicular à correnteza. Para o barco B, a situação é um pouco diferente. Sua velocidade é acrescida de v quando seu movimento é a favor da correnteza e decrescida de v quando oposto à correnteza. Como resultado o tempo total da viagem do barco B é: tB = D D 2D / V + = V + v V − v 1 − v2 /V 2 É fácil observar que tB > tA e que a razão entre os tempos é dada por: tA = 1 − v2 /V 2 tB O resultado acima nos mostra algo interessante: se soubermos a velocidade absoluta dos barcos (V) e medirmos a razão entre os tempos de movimento nas duas situações, podemos obter a velocidade do rio v. Esta observação pode ser usada de uma forma análoga para estudar o problema da propagação de ondas de luz no “éter”. Se existir um “éter” preenchendo todo o espaço, nós, da Terra, que estamos nos movimentando ao redor do Sol e, portanto, estamos navegando pelo éter com a nossa velocidade de translação. Para qualquer observador localizado na Terra o “éter” movimenta-se com essa mesma velocidade. 6 A fim de detectar o movimento e a existência do “éter”, pode-se usar dois feixes de luz ao invés de dois barcos. Imagine o sistema mostrado na figura 2.3: Fig. 2.3 – Interferômetro usado por Michelson Um feixe de luz intenso, ao incidir sobre um divisor de feixes (superfície parcialmente espelhada), é dividido em dois feixes que propagam-se perpendicularmente nas direções dos espelhos A e B. O caminho de A é suposto perpendicular ao fluxo do éter hipotético, enquanto B é paralelo. Após fazerem uma viagem de ida e volta em cada um dos caminhos, os feixes retornam ao mesmo plano de observação. Esta situação é, obviamente, muito semelhante ao exemplo do barco no rio, visto anteriormente. Se os dois caminhos têm exatamente o mesmo comprimento ou diferem por um número inteiro de comprimentos de onda, ambos os feixes chegam ao ponto de observação “em fase”. Assim produzem uma interferência construtiva, o que leva o observador a presenciar um máximo na intensidade da luz. No entanto, a existência do “éter” movimentando-se, como mostrado na figura, causaria (em analogia ao exemplo dos barcos) uma diferença nos tempos gastos pelos feixes A e B para percorrerem seus respectivos caminhos. De modo que estes feixes de luz não mais atingiriam o plano de observação em fase. Com isto a interferência observada não seria mais construtiva, mas parcialmente destrutiva. De uma forma muito simplificada este é, em essência, o experimento de Michelson e Morley, realizado em 1887. No experimento real, os espelhos A e B não eram perfeitamente perpendiculares, fazendo com que no plano de observação aparecesse uma série de franjas de interferência (regiões claras e escuras), devido à diferença em caminho entre os raios de luz adjacentes (figura 2.4) 7 Fig. 2.4 – Franjas observadas no interferômetro É claro que o aparelho estacionário, como mostrado na figura 3, não permite de forma alguma a observação do efeito previsto, ou seja, a diferença entre os tempos de percurso dos feixes A e B. Assim, com o aparelho numa determinada posição temos um determinado padrão de franjas de interferência. Rodando o dispositivo de 90º, os dois caminhos são comutados com relação ao movimento do “éter”, de modo que o feixe que requeria tA para percorrer o braço do interferômetro passa a requerer tB e vice-versa. Como resultado, se houver uma diferença nestes tempos haverá um deslocamento observável das franjas de interferência à medida que o sistema todo é rodado. Vamos calcular o movimento destas franjas após a rotação do dispositivo. Como vimos, a diferença entre os tempos de percurso é: ∆t = t B − t A = 2D / V 2D / V − 2 2 1 − v /V 1 − v2 /V 2 e, no presente caso, v é a velocidade do “éter” que corresponde à velocidade de translação da Terra (v ~ 3x104 m/s), enquanto V = c = 3x108 m/s é a velocidade da luz. Com estes valores temos que: v2 v2 = 2 ~ 10-8 2 V C e neste caso as expressões acima podem ser expandidas usando a expansão binomial para x < 1. (1 + x)n = 1 + nx ........... ≅ 1 + nx 8 de modo que uma boa aproximação para ∆t é: ∆t = 2 D v 2 1 v 2 1 + − 1 + c c 2 2 c 2 ou ∆t ≅ D v2 c c 2 Esta diferença de tempo, corresponde a uma diferente de caminho de ∆d = c∆t e se ∆d corresponde a uma variação ∆n franjas de interferência ∆d = λ ∆n e, portanto, ∆n = c∆t Dv 2 λc 2 = λ No experimento realizado por Michelson e Morley, D era da ordem 10m, o comprimento da luz usada era λ ~ 500 nm (1nm = 10-9m) e, portanto, ao girarmos o aparelho 90º espera-se uma variação nas franjas de: ∆n = ( 10 x 3 x10 4 ( ) 2 5 x10 − 7 x 3 x10 8 ) 2 ≅ 0.2 franjas Como este valor é invertido pela rotação, trocando A por B, há uma reversão de fases, espera-se observar 0.4 franjas de deslocamentos no total. Isto seria facilmente observado segundo as estimativas de Michelson, que previa uma sensibilidade de 0.01 franjas. O experimento foi, mesmo, repetido em estações diferentes do ano para eliminar a possibilidade da terra estar momentaneamente em repouso em relação ao éter. 9 Contudo, para surpresa de todos não foi observada nenhuma variação no padrão das franjas, embora o experimento fosse repetido em condições diversas. Esquecendo a idéia do éter, o experimento de Michelson-Morley tem um aspecto muito importante com respeito à velocidade da luz quando emitida por fontes em movimento. A fonte esta fixa na mesa rotatória e, portanto, podemos imaginar que a diferença de tempos de percurso calculados anteriormente seriam resultados das diferenças de velocidade da luz dependendo da direção da fonte. Ou seja, dependendo da direção que o feixe é mandado, a velocidade variará desde c + v até c – v. Esta edição de velocidades ocorre de acordo com as transformadas de Galileo, aplicável a corpos mecânicos, em movimento, etc. A variação de velocidade também causaria a variação de tempos e, portanto, de fase ao se rodar o experimento, devendo ocorrer um deslocamento das franjas. Várias tentativas de experimentos de M – M usando diferentes configurações foram realizados e os resultados estão reunidos no gráfico da figura abaixo. [Extraído de M. A. Handschy, Am. J. Phys. 50, 987 (1942)] Deslocamento de franjas esperado 10 Em resumo, o experimento de M – M também sugere a independência da velocidade de propagação da luz com o movimento da fonte, violando o Principio da Independência dos Movimentos de Galileo. Este resultado é de extrema importância para o estabelecimento da relatividade. O experimento de Michelson-Morley não foi a única tentativa experimental de determinação do referencial absoluto. Em 1904, Trouton e Noble realizaram um experimento visando observar o torque num capacitor carregado. Considere duas cargas de valor ± q, ligadas por uma haste rígida, segundo a figura 2.5. Como as forças de Coulomb estão na direção da haste, não há nenhum torque no sistema. Porém, como as leis de Maxwell são válidas somente no referencial fixo em relação ao éter, o movimento das cargas pelo éter faz com que isto represente a existência de uma densidade de corrente nas equações e, então, além dos campos elétricos devido as cargas, como indicado na figura 2.5. Este conjunto de forças causariam um torque de defleteria a haste. Trouton e Noble idealizaram um delicado sistema de suspensão onde pequenas deflexões poderiam ser detectadas através da rotação de um espelho. Observações variadas foram realizadas para vários ângulos de v (velocidade do éter) com relação a haste, porém as deflexões observadas nunca passaram de 5% do valor que era esperado, caso a idéia do éter fosse verdadeira. Fig. 2.5 – Capacitor de Trouton-Noble. As forças F advém do movimento das cargas pelo éter. O resultado negativo do experimento de Michelson e Morley permitiu várias conclusões. Uma primeira possível explicação proposta por Michelson era que o éter poderia ser arrastado pela Terra. Assim, movimenta-se junto com esta não permitindo observar variações no experimento. Este fato requer uma força Terra-éter, o que era pouco provável de existir e também produz discordâncias em outro experimento, o de aberração estelar, que discutiremos mais adiante. Uma Segunda alternativa, é que o éter ainda existe, mas a luz não é uma onda propagando-se neste meio, mas sim composta de partículas sujeitas às leis da mecânica Newtoniana. Neste caso, a velocidade destas 11 partículas só dependeriam da velocidade da fonte e não do meio, não havendo, assim, nenhum efeito retardador, não causando nenhum deslocamento no padrão de interferência. Isto é uma hipótese absurda, visto que as próprias franjas observadas demonstram o seu caráter ondulatório. Apesar de absurdo, esta Segunda hipótese germina a idéia de que caso a velocidade da luz seja independente do movimento da fonte (o que é de alguma forma uma nova lei da mecânica), o resultado obtido faz muito sentido. Mesmo implicando que a luz como um efeito ondulatório se propague obedecendo as leis da cinemática. De conclusivo os experimentos exterminaram a idéia do éter e várias de suas propriedades. Destruindo o que foi uma das idéias mais respeitadas de sua época. Contudo, não podemos esquecer que este experimento germinou uma das hipóteses mais importantes em relatividade. Fitz-Gerald e, independentemente, H. Lorentz apresentaram uma hipótese interessante para justificar a observação de Michelson-Morley. Eles lançaram a idéia de que nenhuma variação de franjas seria observada se o braço do enterferometro paralelo ao movimento da terra sofresse uma contração por um fator de (1 – v2 / c2)1/2. Chegou-se a generalizar que qualquer corpo em movimento através do éter sofreria tal contração paralela ao seu movimento. As considerações do Lorentz eram baseadas em um novo tipo de transformação de coordenadas usando um novo conceito de “tempo real” que dependerá do sistema de referencia. II.3 – A MECÂNICA NEWTONIANA E A VELOCIDADE LIMITE De acordo com a mecânica Newtoniana, não há, em principio, um limite superior para a velocidade imposta a um corpo. Imaginemos por exemplo um corpo sujeito a uma força constante. Após um determinado intervalo de tempo ∆t, supondo que inicialmente ele estava em repouso, temos que a velocidade adquirida pelo corpo será: ∆t K = ∫ F .d s 0 com 2K v= M 12 12 Por exemplo, seja um corpo constantemente sujeito a aceleração da gravidade (g = 9.8 m/s2). Partindo do repouso, após um ano sua velocidade seria igual à velocidade da luz no vácuo. Após dois anos seria duas vezes esta velocidade. Assim, a velocidade atingida parece ilimitada. No entanto, quando tentamos obter velocidades tão altas quanto a luz, observamos um dramático desvio da mecânica newtoniana. Este exemplo pode ser visto como um primeiro caso que demonstra que a mecânica clássica convencional não é adequada para todas as situações. É difícil obter altas velocidades com corpos que nos rodeiam no nosso cotidiano. No entanto, com elétrons, devido a sua massa relativamente pequena em relação à sua carga, podemos atingir altíssimas velocidades através da aplicação de campos. Assim, consideremos o arranjo experimental da figura 6. Fig. 2.6 – Acelerador linear para elétrons O experimento consiste em medir o tempo de vôo de elétrons viajando através de um acelerador linear (Linac), que pode produzir elétrons com energias até a ordem de 15 MeV. Elétrons são injetados por um acelerador tipo Van der Graaff no Linac. Antes de penetrarem no Linac passam por um detector sinalizando a entrada do pulso, sofrem então uma aceleração por forças elétricas. Após passarem pelo sistema, um disco de alumina freia o feixe e um novo detector mostra a chagada do pulso. A duração entre ambos os pulsos representa o tempo de vôo entre os extremos do Linac e permite o cálculo da velocidade atingida pelos elétrons, ou outro tipo de partícula carregada. A energia cinética dos elétrons é determinada através da RF e da velocidade com que os elétrons são injetados. Para várias energias, medimos a velocidade através do tempo de vôo e os resultados estão mostrados na tabela 2.1. 13 ( ) K (MeV) ∆t vôo 10 −8 seg 0.5 3.23 2.6 1.0 3.08 2.73 1.5 2.92 2.88 4.5 2.84 2.96 15 2.8 3.0 V (108 m/seg) Tabela 2.1 Os resultados são bastante distintos do que seria obtido caso a mecânica newtoniana fosse utilizada. Isto fica mais evidente se fizermos um gráfico mostrando v2 vs K. Fig. 2.7 – Gráfico de velocidade final quadrática versus a energia de aceleração. A previsão da mecânica clássica é valida somente para baixos valores de K. A velocidade parece ter uma valor limite de 3x108 m/s. Mais ainda, os resultados parecem consistentes com a hipótese de que “há uma velocidade limite para qualquer objeto, e esta é a velocidade da luz no vácuo”. Este resultado desperta muito a nossa curiosidade. Afinal, por que não é possível obter velocidades arbitrariamente altas se podemos fornecer uma quantidade praticamente ilimitada de energia a um corpo? Vamos ser tolerantes e aceitar que por alguma razão esta velocidade limite existe. Imaginemos então que podemos realizar o experimento acima, em um sistema de referencia com velocidade 0.85c na mesma direção dos elétrons. Para os pesquisadores deste novo sistema de referencia o limite também seria c. Assim, pelas regras de adição 14 de velocidade que conhecemos, quando para o referencial em movimento a partícula tem velocidade máxima de c, no laboratório mediríamos 1.85c, violando claramente o limite que lançamos por hipótese. Estaria isto acontecendo devido ao fato que estamos somando erroneamente as velocidades? Vamos resolver o problema do movimento de um corpo sujeito a uma força constante, modificando levemente a dinâmica que conhecemos. Após um determinado tempo t, F.t = mv, mas vamos tomar como num “toque de mágica” a massa como sendo: m = m0 (1 – v2 / c2)-1/2, m0 é a massa do corpo quando este tem v = 0. Assim, temos: Ft = mo v (1 − v 2 / c2 ) 12 isolando v temos: v(t ) = c m0 c 2 1 + Ft 12 Vamos analisar dois casos extremos: 1) Ft << m0c → m0c / Ft >> 1, v(t) ≡ Ft / m0 Ft << m0c. Como é previsto pela mecânica clássica. 2) Ft >> m0c, v (t) ≡ c Mostrando que pequenos impulsos reproduzem os resultados esperados pela mecânica clássica. Já para grandes impulsos parece produzir-se uma velocidade limite, como medida no experimento como elétrons. Estes fatos que mostramos despertam ainda mais nossa curiosidade para o desenvolvimento de uma nova mecânica, onde as relações como a mostrada por m= (1 − v m0 2 / c2 ) 12 sejam válidas. É exatamente isto que desenvolveremos em nosso capítulo de relatividade. 15 II.4 – TEORIA DA RELATIVIDADE ESPECIAL (a) Os Postulados Sempre que mencionamos o movimento de um corpo, evidentemente estamos nos referindo ao movimento relativo a um determinado sistema de referência. Este sistema de referência pode ser um objeto, a superfície da Terra, o centro da galáxia, etc. O que é importante é sempre especificar este sistema de referência para todos os movimentos a que nos referimos. A idéia discutida anteriormente, da introdução do “éter”, foi uma tentativa de estabelecer um referencial universal absoluto, o qual falhou e deixou a idéia clara de que não existe um sistema de referência absoluto. Imaginemos dois balões em movimento ascendente, de modo que um balão só pode observar o outro. Para o mais rápido o movimento do outro é descendente e vice-versa. Não há maneira de determinar o movimento real dos balões (com relação a Terra) se um só pode observar o outro. É importante neste ponto que tenhamos claro o fato que “sem um sistema de referência, o conceito de movimento pode não ter o menor significado”. A teoria da relatividade especial é o resultado do fato que não existe um sistema de referência absoluto. Esta teoria desenvolvida por Albert Einstein em 1905 trata o problema de sistemas de referência em movimento com velocidades constantes (v constante) uns em relação aos outros. No caso, de referenciais acelerados, o movimento deve ser analisados segundo a teoria da relatividade geral, que não será extensivamente analisada neste curso. A teoria da relatividade especial é normalmente baseada em dois postulados fundamentais. 1º. Postulado: As leis da Física devem ser descritas pelo mesmo conjunto de equações quando em qualquer sistema de referência que se desloca com velocidade uniforme. Este postulado nos parece natural e nos faz muito sentido se analisarmos o fato de que não existe um sistema de referência absoluto. De modo que, para determinarmos e descrevermos o movimento de um corpo é preciso sempre ter o referencial. Caso existisse uma dependência das leis físicas que descrevem o movimento, de acordo com o 16 fato do referencial usado estar ou não estacionário no espaço, significa que poderíamos decidir absolutamente sobre o movimento do corpo. Para isto, bastaria analisar no seu sistema de referencia o movimento de um terceiro corpo, o que sabemos não ser o possível. 2º. Postulado: A velocidade da luz em qualquer sistema de referência tem o mesmo valor, independente do movimento do referencial. Este postulado, de alguma forma, pode ser visto como seguindo diretamente do postulado anterior e viola, de alguma forma, nossos conceitos intuitivos, baseados em nossa experiência cotidiana; segundo a qual uma fonte que se movimenta com velocidade v deveria emitir luz agora se propagaria com c + v. A própria natureza ondulatória da luz (como em outros efeitos ondulatórios), assegura que sua velocidade de propagação deve ser propriedade do meio somente e não da fonte. A fim de justificar e mostrar que este postulado é muito razoável, vamos considerar a determinação da velocidade da luz. Aceitando o primeiro postulado, que é muito razoável, tomamos que as equações de Maxwell sejam válidas em qualquer referencial movendo-se com velocidade constante. Neste caso, a equação da onda para propagação no vácuo seria: ∇.E = 4πρ ∇x E = ∂B 1 . ∂t c ∇.B = 0 ∇x H = ∇2 E − 4π 1 ∂D j+ c c ∂t µε ∂ 2 E c 2 ∂t 2 =0 onde µ 0 e ε 0 são a permissividade magnética e elétrica do vácuo. Como já sabemos do nosso curso de eletromagnetismo, desta equação de onda a velocidade de propagação da radiação é dada por: c= 1 µε 17 que depende somente das constantes µ e ε do meio, sendo de maneira alguma dependente do movimento da fonte. A velocidade de propagação da luz, prevista pelas equações de Maxwell, depende somente do meio e não do referencial. Supondo que os postulados acima sejam verdadeiros, muitos resultados interessantes podem ser deduzidos e confirmados através de medidas experimentais. Isto corresponde a um dos grandes triunfos da física moderna. (b) Evidências Experimentais do Segundo Postulado Uma possível evidência experimental para o segundo postulado pode ser obtida se medirmos a velocidade da luz proveniente de uma fonte em movimento. Uma destas evidências advém de observações feitas com estrelas duplas. Imagine um sistema de estrelas duplas, A e B, rotacionando ao redor de seu centro de massa (fig. 2.8). Fig. 2.8 - Estrela dupla emitindo luz Para um observador na Terra (T) é possível determinar se a estrela aproxima-se através do efeito Doppler na luz emitida pela estrela. Considerando que a luz propaga com a mesma velocidade independente da fonte, a velocidade da estrela medida aqui na Terra como função do tempo seria uma senóide (fig. 2.9). Fig. 2.9 - Velocidade das estrelas medida pelo efeito Doppler 18 Imagine agora que, quando a estrela se aproxima, a velocidade é maior do que quando se afasta. Neste caso, a luz emitida na aproximação chega mais rápido ao observador do que na outra situação. O resultado é que o efeito Doppler observado depende de uma forma complicada da posição resultando em uma senóide distorcida como função do tempo (fig. 2.10). Fig. 2.10 - Distorção esperada caso a velocidade da luz dependesse da velocidade da fonte. Num caso extremo, a luz emitida durante a aproximação poderia chegar ao observador antes da luz emitida durante seu próprio ciclo de afastamento. Neste caso a medida seria confusa, revelando dois ou mais valores para a velocidade num determinado instante. A observação experimental de um sistema binário como "Castor - C", mostra que o dado coincide muito bem como a senóide, demonstrando a validade do segundo postulado. (c) Mudanças de Referências: Transformações de Coordenadas Um fato importante em Física é a caracterização de um efeito do ponto de vista de observadores distintos. A maneira de se fazer isto é através das chamadas transformações de referenciais. Ao realizarmos tais transformações, teremos informações de como um determinado evento físico será observado em um outro sistema de coordenadas em movimento em relação ao primeiro. A necessidade de manter válidas certas leis fundamentais ao se fazer mudanças de coordenadas, apresentam conseqüências interessantes, onde residem muitos dos fundamentos da relatividade especial. 19 (c.1) Transformações Galileanas Vamos supor que estejamos num sistema de referência S no qual um determinado evento ocorra no tempo t, nas coordenadas (x, y, z). Um observador estacionário num sistema de referência S' que move-se com respeito a S com uma velocidade v, observará o mesmo evento como ocorrido no tempo t' , nas coordenadas (x', y', z'). Para simplificar, vamos supor v = vx (figura 2.11). A pergunta que fazemos é: Qual é a relação entre x, y, z, t e x', y', z', t' ? Vamos tomar que o tempo em ambos sistemas é medido a partir do instante em que as origens de S e S' coincidem, de modo que: Fig. 2.11 - Um evento físico observado de dois sistemas de referências. x' = x – vt e não havendo movimento relativo nas direções y e z, temos: y' = y z' = z e como de nossa experiência cotidiana, não há razão nenhuma para acreditar que os relógios marcadores de tempo em ambos os referenciais sejam diferentes, temos: t' = t 20 Estas relações estão conectando o evento observado em dois referenciais distintos e são chamadas de Transformações Galileanas. Para conhecer a relação entre as velocidades medidas em cada um destes referenciais, basta tomarmos as derivadas temporais (já que o tempo é comum em ambos), e obtemos: dx' = vx − v dt dy ' v y' = = vy dt dz ' vz' = = vz dt vx' = Vamos agora parar para pensar se as transformações Galileanas (tanto de coordenada quanto de velocidade), contém os dois postulados básicos discutidos anteriormente. Com relação ao segundo postulado, está evidente que as transformações Galileanas o violam, bastando para isto olhar a primeira equação acima, para o caso que vx = c. O primeiro postulado é seriamente violado se considerarmos as equações de Maxwell que descrevem os fenômenos eletromagnéticos. Isto porque variações espaciais e temporais são misturadas de forma tal a fazer com que as equações originais percam sua forma. Vamos considerar a equação de onda eletromagnética e fazer a transformação: ∂2 E ∂2 E ∂2 E 1 ∂2 E + 2 + 2 − 2 =0 ∂x 2 ∂y ∂z c ∂t 2 a transformação para x', y', z', t': ∂ E ∂ E ∂x' ∂ E ∂y ' ∂ E ∂z ' ∂ E ∂t ' ∂ E = + + + = ∂x ∂x' ∂x ∂y ' dx ∂z ' ∂x ∂t ' ∂x ∂x' ∂E ∂E ∂E = −v + ∂t ∂x' ∂t ' 2 ∂2 E ∂2 E ∂2 E 2 ∂ E = − 2 + v v ∂x' ∂t ' ∂t 2 ∂t ' 2 ∂x' 2 ∂x' =1 ∂x 21 ∂x' ∂t ∂y ' ∂y ∂x' ∂y = −v = = ∂2 E ∂x' 2 ∂t ' ∂t ∂x' ∂t + =1 = .......... = 0 ∂2 E ∂y ' 2 + ∂2 E ∂z ' 2 − 1 ∂2 E c 2 ∂t ' 2 2 1 ∂2 E 2 ∂ E + −v 2v = 0 c 2 ∂x' ∂t ' ∂x' 2 A equação de onda para a radiação eletromagnética não é invariante ao realizarmos a transformação Galileana. Isto é bastante estranho já que a onda eletromagnética existe em ambos referenciais e não há dúvida quanto a isto. Claramente está violando o primeiro postulado. Desta forma, concluímos que as transformações Galileanas violam os postulados básicos da relatividade e para preservar sua validade devemos requerer um outro tipo de transformação entre as coordenadas de dois sistemas de referência que encontram-se em movimento relativo. (c.2) Transformações de Lorentz Como vimos, as transformações de Galileu não condizem com os postulados de relatividade, os quais concordamos que possuem grande sentido físico e, portanto, devem ser verdades. Uma transformação alternativa é necessária para manter os postulados verdadeiros. Vamos supor que tenhamos uma transformação que seja proporcional à relação da transformação Galileana. Assim, tomamos: x' = γ (x - vt) onde γ é uma constante que deverá ser determinada. Uma pergunta natural que fazemos neste ponto é: "Por que este "chute" é aceitável?". Primeiramente a linearidade entre x' e x é razoável, pois já que um evento observado em x (S) deve corresponder a um único evento observado em x' do referencial S". Caso tivéssemos algo do tipo x' α x2 , teríamos mais de uma possibilidade no referencial S' para observação de um único evento em S'. Além disto, sabemos que a 22 transformação proposta acima deve concordar com a transformação Galileana para a mecânica ordinária, onde baixíssimas velocidades estão envolvidas. Assim γ perto da unidade representa o limite da mecânica cotidiana de baixas velocidades. Do fato que as equações da física, incluindo as equações de transformação de referenciais, devem Ter a mesma forma em ambos os referenciais S e S', precisamos somente trocar o sinal de v, para desta forma levar em conta a mudança de direção do movimento e obtermos x como função de x' e t' no referencial S'. Revisando, a situação agora corresponde à observação de um evento que acontece em x no tempo t para o referencial S. E que no referencial S' (que se desloca com velocidade v com relação a S) o mesmo evento é observado em x' e t'. Segundo a nossa proposta de transformação (fig. 2.12), a relação entre as coordenadas são: Fig. 2.12 x' = γ (x-vt) x = γ (x' + vt') Como não há movimento relativo nas direções y e z, não há nada que indique diferenças entre y e y' e entre z e z', de modo que: y'= y e z' = z Note que os tempos t e t' não são iguais. Isto pode ser confirmado se substituirmos x' na equação de x. 23 x = γ (x'+ vt') = γ 2x - γ 2vt + γ vt' de onde tiramos: 1− γ 2 t ' = γt + γv x Com isto, as equações de transformação obtidas são: x' = γ ( x − vt ) y' = y z' = z 1− γ 2 t ' = γt + γv x Para que estas transformações estejam de acordo com a relatividade, elas devem satisfazer ambos postulados discutidos anteriormente. Como condição inicial, consideramos que em t = 0 ambos os sistemas de referências tenham suas origens coincidentes, de modo que: t = 0, t' = 0 => x' = 0 corresponde x = 0 Vamos tomar que em t = t' = 0 uma lâmpada é acessa na origem S (que coincide com a origem S'). Como a luz propaga-se com a mesma velocidade c em ambos os sistemas de referência, temos as seguintes equações de movimento para a luz: x = ct (em S) x' = ct' (em S') A fim de determinarmos a constante γ , vamos tomar a equação contendo t' e x' e substituir t' pela expressão acima: 1− γ 2 x' = c γt + γv x 24 e substituindo x' = γ (x-vt) 1− γ 2 γv γ (x − vt ) = c γt + x eliminando x desta questão tiramos: x= cγt + vγt 1− γ 2 c γ− γv ( ) colocando ct em evidência: γ + vγ c x = ct ( 1−γ 2 ) γ − γv c mas como vimos anteriormente, no referencial S, x = ct, de modo que toda a expressão entre colchetes deve ser igual à unidade e, portanto: v c γ + γ =γ − (1 − γ ) c 2 γv 2 v 2 γ = −1 + γ 2 2 c 1 γ = 1− v2 / c2 permitindo obter o valor da constante procurada. Utilizando esta constante, temos que a transformação completa para um evento medido no referencial S para o mesmo evento medido no referencial S' (que se desloca com v na direção x) é: 25 x − vt x' = 1− v2 / c2 y' = y z' = z t' = (t − x ) v c2 1− v2 / c2 Estas são as chamadas transformações de Lorentz, porque foram primeiramente sugeridas pelo físico alemão H. A Lorentz, como sendo as transformações para mudança de referencial em movimento uniforme que mantêm invariantes as equações do eletromagnetismo. Somente muitos anos mais tarde é que Einstein entendeu o significado completo destas transformações. Elas contêm embutidos os dois postulados fundamentais da relatividade especial. Vamos supor que desejamos determinar a transformação inversa, isto é, dado um evento medido em S', como encontramos as medidas feitas para o mesmo evento em S? A mudança é óbvia, basta mudarmos v por -v, já que a velocidade relativa é invertida e trocamos x → x' e t → t'. Esta substituição determina as transformações de Lorentz inversas: x= x'+ vt ' 1− v2 / c2 y = y' z = z' t= t '+ cv2 x' 1− v2 / c2 (c.3) A Simultaneidade de Eventos: Das transformadas de Lorentz, dois pontos chamam, de imediato, nossa atenção. Primeiramente, se tivermos dois eventos que ocorrem simultaneamente num sistema de referência, não necessariamente eles serão simultâneos num outro referencial. Para ver isto vamos supor que duas lâmpadas separadas por L no referencial S sejam acesas simultaneamente por um observador neste referencial. Como isto é visto por um observador em S'? Para o referencial S, t1 = t2 = t. Para o observador no referencial S' 26 t1 ' = t2 ' = (t − v c2 x1 ) 1 − (v / c ) (t − v c2 x2 2 ) 1 − (v / c ) 2 de modo que a diferença de tempo entre os eventos para S' é: ∆t ' = t1 '−t 2 ' = (x2 − x1 ) 2 1 − (v / c ) v c2 como x2 - x1 = L ∆t ' = Lv / c 2 1 − (v / c ) 2 Um segundo ponto importante a ser observado das transformações é que quando a velocidade relativa v entre os referenciais S e S' é bastante pequena, quando comparadas com a velocidade da luz (v/c « 1), as transformações de Lorentz são reduzidas às transformações Galileanas, como já havíamos requerido anteriormente. Este fato permite nos antecipar a seguinte conclusão: as peculiaridades da relatividade especial que estudaremos neste curso só serão marcantes nos casos ou em circunstâncias onde grandes velocidades estão presentes. Os efeitos da relatividade passam praticamente despercebidos nos movimentos rotineiros do dia-a-dia. (c.4) A Contração Espacial Vamos considerar outra importante conseqüência das transformadas de Lorentz. Seja uma haste colocada ao longo da direção x no referencial S. Neste referencial as coordenadas das extremidades da haste são x1 e x2, de modo que seu comprimento para o referencial S é: L o = x2 - x1 27 que denominaremos de comprimento da barra no referencial no qual a barra está em repouso. Consideremos agora, a mesma grandeza “comprimento" medida num referencial S' que se movimenta com velocidade v paralela à barra. Fig. 2.13 Chamado de L o comprimento da barra medido pelo referencial S' a pergunta que fazemos é: “Qual a relação entre L e Lo?”. Ou em outras palavras, se numa rodovia existe no acostamento uma barra no chão e um carro trafegando pela rodovia. Este mede a barra mais comprida, igual, ou mais curta do que seu tamanho medindo em repouso? Para calcularmos o comprimento L da Barra (em S') vamos aplicar as transformadas de Lorentz às coordenadas das extremidades. Usando as expressões e fazendo a diferença de x2 com x1, e considerando que ambas posições das extremidades podem ser lidas simultaneamente, x= x2 = x1 '+ vt ' 1− v2 / c2 x 2 '+ vt ' 1− v2 / c2 x 2 − x1 = L0 = L0 = ou x 2 '− x1 ' 1− v2 / c2 L 1− v2 / c2 ( L = L0 1 − v 2 / c 2 ) 28 Assim, "o comprimento de um objeto em movimento em relação ao observador parece mais curto do que quando o objeto está em repouso em relação ao observador". Este fenômeno é conhecido como contração de Lorentz-Fitz-Gerald. Observemos que devido à dependência da expressão com y2 não faz nenhuma diferença quem chamamos S ou S'. Se o comprimento de um foguete na plataforma de partida é Lo, observaremos um comprimento L após o foguete adquirir velocidade v, quando medimos daqui da terra. Da mesma forma para o astronauta no foguete, tudo que ficou na Terra apresenta um comprimento mais curto por um fator de (1-(v/c)2)1/2. O comprimento de um objeto é máximo quando medido por um observador em repouso em relação a ele. O fator (1-(v/c)2)1/2 é exatamente a razão entre L/Lo e, portanto, representa a porcentagem de diminuição do tamanho do objeto. L = 1− v2 / c2 L0 Para um corpo com velocidade de 1000 Km/seg., a contração seria: 2 10 6 L = 0.9999944 = 1 − 8 L0 3x10 o que representa uma contração de 0.00056%. Caso o corpo tenha velocidade de 0.9c, teria uma contração da ordem de 44%. É importante salientar que a contração espacial somente ocorre nas coordenadas da direção do movimento. Se o movimento é paralelo a x, as dimensões y e z não são inalteradas e representam as mesmas medidas em S e S'. (c.5) Dilatação Temporal Como já vimos, as transformações de Lorentz levam ao resultado não tradicional de que intervalos de tempo são afetados pelo movimento relativo. Relógios em movimento com relação ao observador parecem andar diferente do que quando em repouso. Se um acontecimento é observado como tendo a duração de tempo t no 29 referencial S, o mesmo evento tem uma duração menor no referencial S'. Este efeito é conhecido como dilatação temporal. Vamos derivar a dilatação temporal a partir das transformadas de Lorentz. Imaginemos um relógio num ponto x' do referencial S' em movimento. Quando um observador neste referencial observar t'1, um observador no referencial S encontrará t1, de modo que: t1 = t '1 + vxc 2' 1− v2 / c2 Após a decorrência de um intervalo de tempo ∆t' em S' o observador deste referencial mede t2’, enquanto o observador em S observa t2, tal que: t2 = t 2 '+ vxc 2' 1− v2 / c2 Subtraindo ambas relações: t 2 − t1 = t ' 2 −t '1 1− v2 / c2 como t2 - t1 = ∆t e t'2 - t'1 = ∆t' ∆t = ∆t ' 1− v2 / c2 que é a relação para a dilatação temporal para um relógio em movimento. Como um exemplo para a dilatação temporal, vamos considerar as partículas chamadas mésons - µ. Estas partículas apresentam um tempo de vida da ordem 2x10-6 seg. e pode aqui ser considerado como um pequeno relógio. Isto significa que após sua produção, decorre este intervalo de tempo médio medido no referencial em que o méson está em repouso (referencial de repouso) até que o méson - µ decai em elétrons. Os mésons - µ são produzidos na alta atmosfera por raios cósmicos provenientes do espaço e são observados em grande quantidade ao nível do mar, mas se levarmos em conta sua 30 velocidade da ordem de 2.994x108 m/seg., e seu tempo de vida to = 2x10-6 seg., a distância que tais partículas poderiam percorrer antes de decair seria: y = vto = 2.994 x 108 x 2 x 10-6 ≅ 600 m como eles são criados em altitudes pelo menos 10 vezes maiores e deveriam decair antes de atingirem a superfície. Vamos agora resolver o problema mais realisticamente usando relatividade. Primeiramente, examinando o problema do referencial da partícula, no qual seu tempo de vida é 2x10-6 seg. e no qual haverá um percurso de 600 m, em média, antes do decaimento. Esta distância é, no entanto, mais curta do que aquela observada por um observador na Terra pelo fator (1-(v/c)2)1/2. Ou seja, a distância para um observador na superfície da Terra seria: y y 600 = 1 − v 2 / c 2 → y0 = = ~ 9500m 2 2 2 y0 1− v / c 1 − (0.998) o que justifica plenamente observar tais partículas na superfície. Alternativamente, podemos analisar o problema a partir de um observador na superfície da Terra. Nesse referencial, o tempo de vida é alterado pela dilatação temporal, e o novo tempo de vida é: ∆t = ∆t ' 1− v / c 2 2 = 2 x10 −6 1 − (0.998) 2 = 31.7 x10 −6 seg e, portanto, a distância percorrida antes do decaimento é: yo = v∆t = 2.994 x 108 x 3.17 x 10-6 = 9500 m que também justifica perfeitamente a observação destas partículas na superfície da Terra. 31 (c.6) Alguns Esclarecimentos sobre Medidas em Repouso e em Movimento. Após termos estudado duas importantes conseqüências das transformações de Lorentz: a contração espacial e a dilatação temporal, uma série de dúvidas envolvendo situações distintas surgem naturalmente. Vamos considerar uma série de situações que sejam ilustrativas e esclarecedoras. Antes de iniciarmos, é importante afirmar que a maneira com que medidas de tempo e comprimento são realizadas por diferentes observadores são fundamentais em relatividade, e embora muitas vezes uma determinada situação seja totalmente equivalente entre considerarmos um referencial em movimento e outro parado ou viceversa, estas situações são bastante distintas na maneira com que as grandezas são medidas e isto deve distinguir totalmente os dois sistemas de referência. Consideremos inicialmente medidas de intervalos de tempo. Seja uma plataforma rígida sobre a qual é colocada uma fonte de liz, um espelho e um relógio, como mostra a figura abaixo: Fig. 2.14 - Plataforma c/ fonte de luz. Vamos imaginar dois eventos, a saber saída e retorno de um pulso de luz emitido pela fonte. Queremos medir o intervalo de tempo entre dois eventos: saída e retorno. Para um observador sobre a plataforma esta é uma questão trivial e o tempo medido é exatamente ∆t'= 2L/c. Independentemente da plataforma estar em movimento, o tempo de ocorrência de cada evento foi medido pelo mesmo relógio que estava presente em cada um dos eventos entre os quais estamos medindo o intervalo de tempo. O evento global iniciou e terminou no mesmo relógio, ou seja, a medida de tempo foi realizada para os dois eventos na mesma posição em S'. Este é denominado de intervalo de tempo próprio, medido sempre pelo mesmo relógio. 32 Considere agora a plataforma em movimento com velocidade v. Vejamos como um observador estacionário, vendo a plataforma se deslocar, vê o evento acima. O quadro visto pelo observador está representado abaixo, os dois eventos não mais ocorrem no mesmo ponto. Fig. 2.15 - Plataforma em movimento com fonte de luz Levando em conta o fato que a velocidade da luz propaga-se com velocidade c, a distância total percorrida pela luz agora é 2 (L2 + (v∆t/2)2)1/2 e, portanto, temos que: v∆t c∆t = 2 L + 2 2 2 de onde podemos resolver para ∆t e tirarmos: ∆t = 2L c 1− v2 / c2 Assim, o intervalo de tempo decorrido entre os dois mesmos eventos é diferente para os dois referenciais. É extremamente importante observar que no segundo caso, referencial S em repouso, os dois eventos ocorreram em diferentes pontos do espaço, enquanto no primeiro referencial fixo na plataforma eles ocorreram no mesmo ponto. Isto fez com que no caso do referencial estacionário, ocorrendo em pontos diferentes, os eventos foram necessariamente medidos com relógios diferentes, já que se fossem feitos pelo mesmo relógio, significaria que o relógio teve que se movimentar junto com a plataforma. O que descaracterizaria nossa consideração que trata de um observador em 33 repouso. Assim, o intervalo de tempo medido por este observador é o intervalo de tempo impróprio. E a dilatação temporal pode ser mais apropriadamente escrita como: ∆t próprio = ∆t impróprio 1 − v 2 / c 2 Este exemplo tem como mensagem principal salientar as diferenças intrínsecas de como uma medida é realizada num sistema de referência em repouso ou em outro em movimento. Para relatividade especial o "relógio" que mede o tempo de ocorrência dos eventos deve ser colocado precisamente na posição onde o evento ocorre. Alguém pode perguntar como o observador em S no exemplo anterior mede o tempo entre os eventos, já que o relógio tem que estar fixo? Certamente ele deve possuir uma coleção de relógios sincronizados (no mesmo ponto do espaço) e levados para as várias diferentes posições, como mostrado na fig. 2.16. Assim, a medida que o dispositivo se desloca, ele passa pela linha de relógios e a diferença de tempo ou o intervalo de tempo entre dois eventos é medido pela diferença de leituras entre dois relógios. No caso dos eventos considerados, entre os relógios 3 e 13. Note que existe uma diferença conceitual bastante grande entre os tempos medidos por observadores em S e S' e entender isto é essencial para entendermos as conseqüências da relatividade especial. Fig. 2.16 - Seqüência de relógios capazes de medir intervalos de tempo no referencial em repouso. É muito comum, quando descrevemos a dilatação temporal, a afirmação que “relógios em movimento andam mais devagar”. Não há nada errada com isto, mas leva a um aparente paradoxo. Suponha que um relógio A esteja em movimento com relação a outro B. Desta forma, A anda mais devagar que B. No entanto, do ponto de vista do relógio A, B é que anda mais devagar, isto cria uma contradição. A qual na verdade não existe, já que somente em um dos referenciais a diferença de tempo entre dois eventos 34 poderá ser medida por um único relógio. Tempo em relatividade só tem significado quando representa a diferença de ocorrência entre dois eventos, e neste caso o tempo próprio é sempre menor. O aparente paradoxo acima na verdade não existe. Lembrando que a relatividade especial trata de efeitos cinemáticos entre observações do mesmo evento feitas de diferentes referenciais. Assim, sempre é válido dizer que os relógios em movimento andam mais devagar, se soubermos o que significa. No entanto, seria mais apropriado se dissermos que: "O relógio que mede o intervalo de tempo próprio entre dois eventos, mede um intervalo menor do que relógios medindo o intervalo de tempo impróprio entre estes mesmos eventos". É ainda importante salientar que o mecanismo do relógio não é afetado pelo movimento, e que é errôneo dizer que a dilatação temporal ou qualquer outro efeito em relatividade ocorre devido ao fato que a observação feita de um evento leva algum tempo para atingir o observador, porque caminha com a velocidade da luz. Após esta breve discussão sobre medidas de tempo, vamos semelhantemente fazer medidas de comprimento. O importante aqui é como estas medidas são realizadas por diferentes observadores, ou o que entendemos por medida de comprimento. Com isto poderemos verificar a contração espacial de uma forma alternativa. Seja um veículo que se desloca com velocidade v percorrendo um ponto A, até outro B, cobrindo uma distância L num tempo L/v. O intervalo de tempo medido pelo observador no veículo é um intervalo próprio, já que saída e chegada são medidas pelo mesmo relógio. Por outro lado, o tempo L/v medido no referencial S (parado em relação a A-B) é impróprio, pois foi medido necessariamente por relógios diferentes. Deve ficar claro que os dois eventos que estamos medindo aqui são: carro passa pela marca A, carro passa pela marca B e lembramos que qualquer medida deve ser feita com o instrumento (no caso relógio) na posição do evento, pois como vimos realizadas em posições diferentes não necessitam ser simultâneas. 35 Fig. 2.17 - Medida da distância A B por um observador em movimento Assim, temos que: (S') tempo próprio = L/v (1-(v/c)2)1/2 (S) tempo impróprio = L/v Como a velocidade é a mesma em ambos sistemas de referência, o comprimento medido pelo piloto do veículo (S') é: L' = vt (tempo próprio) L' = L 1 − v 2 / c 2 enquanto L é medido em S. É importante notar que a dilatação temporal leva necessariamente a contração espacial, já que a velocidade é preservada entre os dois referenciais. Além disso, deve ficar claro que a relatividade especial constitui-se no efeito cinemático em medidas e, portanto, de um modo geral, comprimento é medido através do conhecimento da velocidade e do tempo. A utilização de réguas é uma medida puramente estática e, portanto, feita em referencial onde o objeto a ser medido está em repouso. Vamos analisar um segundo experimento de medida espacial. Seja uma barra com duas marcas A e B separadas por uma distância L, que se movimenta com relação a outra barra na qual temos as marcas A' e B'. Quando medidas no referencial de repouso das barras, ambas distâncias tem dimensão L. Tiramos agora uma fotografia quando a primeira barra desloca-se em relação a Segunda com velocidade v. A questão é AB e A'B' serão iguais na foto? Ou seja, se A coincide com A', B' coincidirá com B? Para evitar problemas com atrasos na propagação da luz a câmera é colocada exatamente a meia distância das marcas (fig. 2.18). 36 Fig. 2.18 - Comparação de duas barras de mesmo tamanho, uma em movimento e a outra em repouso. É evidente que na fotografia ambas as marcas coincidirão, já que estamos realizando o mesmo tipo de medida e comparando eventos distintos em pontos distintos do espaço. Não estamos de forma alguma fazendo uma medida cinemática, onde o efeito de sua velocidade se manifeste. A fim de verificarmos a contração espacial é preciso termos um observador em movimento fazendo medida de tempo. Se considerarmos um observador em A, ele medirá um intervalo de tempo entre os eventos A passa A' e A passa B' (fig. 2.19) que é um intervalo de tempo próprio. Enquanto se compararmos o intervalo medido por dois relógios posicionados em A' e B' mediremos o tempo impróprio L/v. Desta forma, para o observador em A (em movimento), a medida de L pode ser tirada de : L' L v2 = 1− 2 v v c ou seja L' = L 1 − v2 c2 Fig. 2.19 - Esquema do experimento para medir distância entre AB pelo observador em movimento. 37 Baseado no experimento acima, afirmamos que o comprimento entre as marcas (que poderia ser o metro padrão) sofreu uma contração quando medida no referencial em movimento. Daí afirmamos que, para um observador em movimento os objetos em repouso parecem contrair de tamanho. Isto gera um aparente paradoxo: "Como pode ser que um metro padrão movendo-se parece ter diminuído de tamanho com respeito a outro no laboratório, quando para um observador no metro em movimento, o laboratório está se movendo e, portanto, para ele o metro no laboratório deve ter contraído?" Este aparente paradoxo pode ser facilmente resolvido se lembrarmos que dois eventos que ocorrem simultaneamente em um referencial não são simultâneos num segundo referencial em movimento com relação ao primeiro. No caso em questão, os eventos A passa por A' e B passa por B' são simultâneos no laboratório (por exemplo, medidas com auxílio da fotografia), mas não são simultâneos para um observador movendo-se em relação ao laboratório. E não sendo simultâneos não podem ser usados para medida de comprimento, como sendo uma medida em repouso. Assim, o paradoxo não existe porque embora seja "relativamente equivalente" o movimento de ambos referenciais, as medidas realizadas nestes referenciais são completamente não equivalentes. O primeiro passo para entendermos os resultados previstos pela relatividade especial é entender o significado da realização de uma medida. (c.7) Massa Relativística Até agora, vimos que grandezas fundamentais como tempo e comprimento só têm significado quando o referencial no qual elas são observadas é específico, e que os valores destas grandezas medidas neste referencial estão relacionadas com as feitas em outro referencial. Isto faz com que um dado evento que ocorra no tempo e no espaço tenha aspectos diferentes em cada referencial. No entanto, segundo o primeiro postulado da relatividade, as leis de movimento observadas em cada referencial deve ter a mesma forma. Vamos analisar a colisão elástica entre dois corpos sendo observada de dois sistemas de referência distintos e vamos considerar os princípios de conservação de momentum e energia. 38 Na colisão elástica a energia mecânica é conservada. Sejam duas partículas A e B, A está inicialmente em repouso no referencial S e B está inicialmente em repouso no referencial S', o qual se move com velocidade v relativa a S na direção + x (fig. 2.20). Ambos os corpos são idênticos. Fig. 2.20 - Início da colisão entre dois corpos. A velocidade vA em S e B tem velocidade v'B em S' Num determinado intervalo de tempo, simultaneamente A começa a mover-se com VA na direção +y enquanto B move-se com V'B na direção -y'. Para simplificar, vamos tomar VA = V'B fazendo com que cada corpo seja idêntico ao outro em cada um dos referenciais. O aspecto da colisão vista por cada um dos referenciais é diferente. No entanto, para cada um o comportamento da colisão é o mesmo, de modo que S "vê" A da mesma forma que S' "vê" B (fig. 2.21). A colisão como vista por cada um dos referenciais está mostrada abaixo: Fig. 2.21 - Colisão vista por um dos referenciais. 39 Após a colisão, A retorna na direção -y com velocidade VA, enquanto B retorna na direção +y' com velocidade V'B. Se a distância entre eles era inicialmente Y, o observador em S encontra a colisão em y = Y/2 enquanto que para S' ocorre y'=Y/2. O tempo gasto por A para sair da posição inicial, colidir e regressar é To, que medido por S é: T0 = Y VA e para B medido em S' To = Y/V'B. Para o observador em S, o momentum é conservado e, portanto, a componente y do momentum permite escrever mAVA = mBVB onde mA, mB, VA, VB são as massas e velocidades medidas em S. A velocidade VB, pode ser calculada em S como: VB = Y T onde T é o tempo necessário para B realizar sua ida e retorno quando medido por S. Como este tempo visto por S' é To, temos que T = To (1-(v/c)2)-1/2, de acordo com a dilatação temporal vista anteriormente. Assim, a velocidade de B medida por S é: VB = Y 1− v2 / c2 T0 e usando VA = Y/T0 e VB na equação de conservação de momentum, tiramos: m A = mB 1 − v 2 / c 2 Como assumimos inicialmente que A e B são idênticos quando em repouso com relação a um observador comum, devemos atribuir a diferença entre as massas ao fato que eles estão em movimento relativo. Assim, da mesma forma que espaço e tempo, 40 massa também é uma grandeza que depende do movimento relativo entre o observador e o objeto observado. Se chamamos mA = mo como sendo a massa medida quando o corpo está em repouso em relação a S, a massa medida por um observador em S' (para o qual a massa desloca-se com v) será mB = m e, portanto: m= m0 1− v2 / c2 é a relação relativística para a massa. A massa medida para um corpo que desloca-se com velocidade v é maior do que aquela medida quando o corpo está em repouso. Assim, a massa relativística é uma conseqüência do fato que a lei de conservação de momentum deve ser válida em ambos os referenciais como assegurado pelo primeiro postulado da relatividade. Com respeito à mecânica newtoniana, ela é válida se o momentum é definido como mv e, portanto, a segunda lei de Newton passa a ser expressa por: F= m0 v d dt 1 − v 2 / c 2 d = (mv ) dt ou seja, sempre devemos considerar a variação temporal do momentum e não apenas da velocidade. O aumento relativístico da massa só é importante para velocidades próximas à velocidade da luz. No momento, somente partículas atômicas e subatômicas como elétrons, prótons, mésons, etc são os que apresentam velocidades suficientes para que efeitos relativísticos sejam medidos. Historicamente, a primeira confirmação experimental da massa relativística foi feita em 1908 quando Bucherer verificou que a relação e/m para elétrons era maior para elétrons lentos. Algumas medidas experimentais da relação m(v)/mo para elétrons são mostradas no gráfico (Fig. 2.22) a seguir: 41 Fig. 2.22 - Variação da massa inercial do elétron como função da velocidade. O valor inicial de mo é denominado de massa de repouso, enquanto m é chamado de massa inercial. Esta nomenclatura aplica-se para todas as partículas. (c.8) A Relação Massa e Energia A partir dos postulados da relatividade especial é possível obter uma importante relação entre massa-energia, o que consiste numa das mais famosas relações obtidas por A. Einstein. Utilizando a definição de energia cinética como sendo o trabalho realizado por uma força para trazer o corpo do repouso até o presente estado de movimento, podemos escrever para o caso da força paralela ao deslocamento: s K = ∫ Fds 0 onde F é o componente da força aplicada na direção do movimento (deslocamento ds). Usando F = d (mv)/dt, temos: d (mv ) K=∫ ds = ∫ vd (mv ) dt 0 0 s s que pode ser substituído pela relação da massa relativística, m0 v K = ∫ vd 2 2 0 1− v / c s 42 Integrando por partes, temos: K= v m0 v 2 1− v / c 2 2 v 0 vdv − m0 ∫ 1− v / c 2 0 2 + m0 c 2 1 − v 2 / c 2 ou seja: K = mc 2 = m0 c 2 = (m − m0 )c 2 que estabelece que “a energia cinética de um corpo é igual ao aumento de sua massa como conseqüência de seu movimento relativo, multiplicado pela velocidade da luz ao quadrado”. Se interpretamos mc2 como a energia total do corpo E, quando o corpo não apresenta movimento K = 0, terminamos com o fato que o corpo apresenta como energia total para o seu estado de repouso a energia E0 = m0c2 que é denominada de energia de repouso. Como mc2 corresponde à energia total do corpo ela resulta da adição de energia cinética com a energia de repouso, ou seja: E = K + moc2 = mc2 sendo m = mo (1-(v/c)2)1/2 temos que: E= m0 c 2 1− v2 / c2 Vamos tomar esta relação e elevar ao quadrado: m02 c 4 m c = 1− v2 / c2 2 4 43 de onde obtemos: m2c2 - m2v2 = m02c2 Como p = mv, obtemos: m2c4 = p2c2 + m02c4 ou E2 = p2c2 + m02c4 Como sendo a relação momentum energia relativística amplamente utilizada em colisões, etc. (c.9) Diagramas Espaço-Tempo Ao derivarmos as transformações de Lorentz anteriormente, somente consideramos casos onde a luz se propaga na direção x. Poderíamos, no entanto, ter tratado o problema para a luz propagando-se em qualquer direção. Afinal, a composição de todas as direções resulta na luz propagando-se com a mesma velocidade. Vamos considerar o seguinte exemplo: Suponhamos que um “flash” de luz é emitido em t = 0 na origem de S. Este pulso propaga-se em todas as direções de modo que num instante mais tarde t, o pulso alcançou a região correspondente a uma esfera de raio r = ct e centrada na origem de S. Se o mesmo fenômeno é observado do referencial S', cuja origem só coincide com a origem de S em t' = t = 0. O mesmo fato é observado, sendo agora uma esfera de raio r' = ct' e centrada na origem de S'. Tomemos a equação r = ct e escrevendo em termos das coordenadas cartesianas temos: x2 + y2 + z2 = c2 t2 usando as transformações de Lorentz para x, y, z e t, obtemos: γ 2 (x' + vt')2 + y’2 + z’2 = γ 2 c2 (t' + vx' / c2)2 44 desenvolvendo, obtemos: γ 2 x’2 (1 - v2/c2) + y’2 + z’2 = γ 2 t’2 (c2 - v2) de onde temos que: x’2 + y’2 + z'2 = c2 t’2 que novamente define uma esfera centrada na origem de S'. Assim, a luz é descrita como expandindo-se esfericamente em ambos os sistemas de referência. Uma forma bastante conveniente de mostrar a "estória" completa de um determinado movimento unidimensional é através de um diagrama representando nos eixos posição e tempo, ou melhor, ct. Estes diagramas são costumeiramente mencionados como diagramas de Minkowski, em homenagem ao cientista que os introduziu. Neste diagrama, um evento em S é descrito pelas coordenadas (x, t) e em S' por (x', t'), as quais estão relacionadas pelas transformações de Lorentz. É interessante utilizar ct ao invés de tempo por uma questão de escala e também devido ao fato que a propagação da luz neste sistema é representada pela bissetriz do quadrante x – ct. Outros sistemas de referência são representados no mesmo diagrama, por eixos não ortogonais. Referenciais com velocidade positiva em S apresentam eixos formando ângulos menores que 90° e referenciais com velocida des negativas, ângulos maiores que 90° (fig. 2.25). Fig. 2.23 - Eixos para vários referenciais. 45 Qualquer evento P tem duas coordenadas em cada referencial determinadas trocando-se retas paralelas aos respectivos eixos e passando pelo ponto. Automaticamente, temos as leituras de coordenadas em diversos referenciais. Notemos que a quantidade: r2 = (ct)2 - x2 é um invariante do problema, sendo verdadeira em qualquer referencial e, por isso, é denominada de invariante do espaço-tempo. Isto significa que, dado um evento, em qualquer referencial a quantidade acima tem o mesmo valor. Não vamos nos ater a interpretação de r, porém r2 = 0 representa a propagação de um sinal de luz e r2 = -1 temos a escala dos eixos do sistema. É importante notar que no diagrama de Minkowski os eixos representando os vários referenciais não apresentam a mesma escala. De fato, a hipérbole x2 - (ct)2 = 1 determina os pontos da escala dos vários referenciais. Ficará como exercício verificar que a quantidade r2 é um invariante. Se estivermos considerando dois eventos distintos de ∆x e ∆t, a quantidade ∆s 2 = (c∆t ) − (∆x ) 2 2 é chamado de intervalo no espaço-tempo; e para qualquer referencial que observe este evento é, também, um invariante. No caso de ∆s2 = 0 é claro que estamos tratando de eventos conectados via raio de luz. As quantidades invariantes em relatividade são importantes porque representam o equivalente às constantes de movimento que estamos acostumados. De um modo geral, estas quantidades envolvem quatro grandezas distintas e por isso são denominadas de quadro-vetores. Assim, o quadro-vetor espaço-tempo (visto anteriormente) relaciona as três coordenadas espaciais e o tempo (x, ct). Um outro quadro-vetor importante é o momento-energia (p, E/c) que representa o estado dinâmico da partícula. Da mesma forma que espaço-tempo, a quantidade E p + p + p − c 2 x 2 y 2 z 2 46 é um invariante físico, tendo o mesmo valor para qualquer referencial inercial. Assim, consideremos uma partícula em repouso num determinado referencial. Neste caso seu quadro-veto é (0, E0/c). Para um outro referencial, esta partícula pode estar deslocandose de modo que (p, E/c). Da invariância deste quadro-vetor obtemos que é a relação energia-momentum obtida anteriormente. (c.10) Cinemática Relativística e as Transformadas de Velocidade Um dos postulados da relatividade especial definido no começo de nossa exposição estabelece que a velocidade da luz no espaço livre tem o mesmo valor para todos os observadores independentemente de seus movimentos relativos. No entanto, sabemos de nossa experiência cotidiana que este resultado não é válido para bolas atiradas de trens em movimento ou disparos de espingardas feitos em movimento, etc. A fim de obtermos resultados que englobem ambos os casos, vamos determinar a partir das transformações de Lorentz as leis de composição de velocidade. Ou melhor, as relações que transformam velocidades observadas num referencial para velocidades observadas em outros referenciais. Vamos novamente considerar dois referenciais S e S', com S' movendo-se com velocidade v na direção x com relação a S. Seja também um objeto que se move com velocidade (Vx, Vy, Vz) no referencial S. A pergunta que fazemos é: Como esta velocidade está relacionada com a outra. (Vx', Vy', Vx') medida no referencial S'? Para um observador em S as componentes da velocidade são: dx dt dy Vy = dt dz Vz = dt Vx = enquanto que para um observador em S' 47 dx' dt ' dy ' Vy' = dt ' dz ' Vz ' = dt ' Vx' = Considerando as transformações de Lorentz, temos que o diferencial das variáveis são dados por: dx' dx − vdt = dt ' dt − cv2 dx Vx' = Utilizando-se estas equações acima, obtemos que: Vx' = dx dt 1− −v ou v dx c 2 dt Vx' = Vx − v 1 − cv2 V x De forma semelhante: Vy' = dy ' dy = dt ' dt − vdx c2 1− v 2 / c 2 de onde tiramos: Vy' = dy dt 1 − cv2 Vy' = e finalmente para a velocidade Z, 1− v2 / c2 dx dt Vy 1 − v 2 / c 2 1 − cv2 V x 48 Vz 1 − v 2 / c 2 1 − cv2 V x Vz ' = Estas três relações constituem as transformações relativísticas de velocidade, e é interessante notar que as componentes de velocidade y' e z' são afetadas pela componente x e não somente por y e z, como no caso das transformadas de coordenadas. Se considerarmos situações onde v « c, de modo que v/c ~ 0, obtemos que como esperado e de acordo com a observação de fatos do cotidiano. Imaginemos (Vx, Vy, Vz), neste caso temos que obter as transformadas inversas, as quais podem ser obtidas trocando v por -v e colocando Vx, Vy, Vz no lugar de Vx', VY',Vz' e vice-versa. Assim, as transformadas são: Vx = Vx' + v vV 1 + 2x c Vy' 1 − v 2 / c 2 Vy = vV 1 + 2x c Vz = Vz ' 1 − v 2 / c 2 vV 1 + 2x c Como exemplo ilustrativo, imaginemos uma fonte de luz que desloca-se com velocidade v. Qual é a velocidade da luz medida por um observador em repouso? Considerando as transformadas inversas acima com Vx' = c, temos: Vx = c+v =c vc 1+ 2 c e Vy = Vz = 0. As relações de transformação de velocidades são importantes para uma série de efeitos observáveis e que veremos a seguir. 49 II.5 - Aplicações e Exemplos em Relatividade Especial Vamos nesta parte considerar alguns exemplos que são aplicações dos vários conceitos discutidos até o momento. (a) O Paradoxo dos Gêmeos Como dissemos anteriormente, intervalos de tempo medidos por observadores em movimento são menores. Vamos analisar a seguinte situação: Dois gêmeos estão em repouso na Terra. Um dos gêmeos toma um foguete e parte para uma viagem a um planeta distante. Enquanto este está em sua viagem, o gêmeo que ficou na Terra afirma que o relógio de seu irmão anda mais devagar e, portanto, quando este retornar a Terra ele será mais jovem do que ele que permaneceu na Terra. Podemos, no entanto, perguntar como o gêmeo do foguete vê a situação. Para ele, em repouso em relação ao foguete, é como se seu irmão que ficou na Terra tivesse viajado junto com a Terra e retornado. Assim, quando se reencontraram, o gêmeo que estava no foguete pensa que seu irmão que ficou na Terra está mais jovem. Afinal, quem está mais jovem? Fig. 2.24 - Esquema representando o paradoxo dos gêmeos. Este aparente paradoxo é resolvido se observarmos cuidadosamente que as situações expostas acima não são equivalentes. A situação física do gêmeo na Terra observar a viagem do foguete não é equivalente à situação onde o gêmeo no foguete observa a viagem da Terra. A diferença física entre as situações é que o gêmeo do foguete sofrerá períodos de movimento acelerado (início, retorno e fim), enquanto que, para seu irmão, na Terra isto não ocorre. Este movimento acelerado distingue claramente 50 as duas situações. Isto permite concluir que o gêmeo do foguete é o que está mais jovem. Esta situação pode ser resolvida matematicamente, envolvendo uma discussão quando os observadores estão acelerados, o que é mais apropriado para a teoria da relatividade geral. Assim, como vimos, a situação não apresenta reciprocidade. Para mostrarmos isto, vamos demonstrar que o tempo decorrido em relógios movimentando-se no espaço tempo depende do caminho realizado pelos relógios. Consideremos dois relógios R1 e R2, inicialmente sincronizados e localizados em 0 como mostra a fig. 2.24. O relógio R1 permanece em repouso no ponto 0 enquanto R2 faz uma viagem que passa por alguns pontos e retorna ao ponto 0, com velocidade tomada como v = 0.8c. Fig. 2.25 - Representação no diagrama ct vs x da situação dos gêmeos. Na figura mostramos o diagrama espaço-tempo (ct vs x) para a situação descrita. O relógio R2 move-se de 0 para A e, então, retorna a B. O relógio R1 apenas desloca-se no eixo do tempo, enquanto R2 move-se também no eixo das coordenadas. Calculamos o tempo decorrido em cada um dos relógios. A relação entre o tempo próprio e o impróprio é: dx 2 dτ = dt 1 − v / c = dt − 2 c 2 2 2 onde usamos vdt = dx. Para o deslocamento do relógio R1, dx = 0 (não há deslocamento de coordenadas) e, portanto, o intervalo de tempo decorrido entre o deslocamento 0 → B será: 51 B ∆τ 1 = ∫ dt = TB − T0 = ∆T 0 já para o caminho OAB, o tempo decorrido será: A B A A 0 A 0 0 ∆τ 2 = ∫ dτ + ∫ dτ = 2 ∫ dτ = 2 ∫ dt 2 − (dx )2 c2 como dx = vdt, temos: ∆τ 2 = 2 1 − v2 v 2 ∆T dt = 2 1 − c 2 ∫0 c2 2 A ou ∆τ 2 = ∆T 1 − v 2 / c 2 Observamos que ∆τ 1 > ∆τ 2 mostrando que quando os relógios voltam a ser confrontados no ponto B sempre haverá uma diferença, sendo que o relógio que deslocase sempre mostrará um tempo menor. Conclusão: o gêmeo no foguete estará mais jovem do que seu irmão. Note que os trechos de aceleração foram desprezados. (b) Emissão de luz por um objeto em movimento Seja um objeto (por exemplo um átomo) que move-se com velocidade v ao longo da direção x. O referido corpo emite raios de luz, que no seu próprio sistema de referência faz um ângulo θ’ com o eixo x'. A pergunta que queremos responder é: Qual será o ângulo θ entre o feixe de luz e o eixo x observado no referencial em repouso (fig. 2.26)? 52 Fig. 2.26 - Emissão de luz por fonte em movimento. No referencial S' a luz propaga-se com: Ux' = c cos θ' Uy' = c sen θ' usando as relações de transformação de velocidades: Ux = c cos θ '+ v c cos θ '+ v = v cos θ ' vc cos θ ' 1+ 1+ 2 c c csenθ ' 1 − v 2 / c 2 Uy = v cos θ ' 1+ c Desta forma o ângulo θ é definido como: senθ ' 1 − v 2 / c 2 tan θ = = Ux cos θ '+ v / c Uy Consideremos agora, que o corpo em questão emita luz em todas as direções uniformemente, quando visto de seu referencial. Devido a relação angular anterior, para um observador, o ângulo de emissão com relação à direção de movimento parece ficar menor. A conseqüência disto é que para um observador parado a luz parece estar mais concentrada ao longo da direção do movimento. (fig. 2.27). 53 Fig. 2.27 - Anisotropia de emissão como feito relativístico. No limite v → c, sen θ → 0 o que implica que toda luz caminha concentrada na direção do movimento. Isto é uma observação rotineira nos aceleradores. Para pequenas velocidades, podemos expandir: 1− v2 1 v2 ≅ 1 − 2 c2 c2 e v 1 ≅ 1 − cos θ ' c 1 + cos θ ' v c de onde tiramos: senθ ≅ senθ '− v senθ ' 2c mostrando a concentração da luz ao longo da direção de movimento. Emissões ao longo de θ = 0 ou π não são afetadas pelo movimento. Exemplos práticos desta observação podem ser feitos em aceleradores de elétrons e prótons. (c) O Efeito Cerenkov Como vimos, a massa relativística de um corpo impõe uma “espécie” de limite na velocidade que o corpo pode ter com respeito a um observador. 54 m= m0 1− v2 / c2 Quando a velocidade do corpo aproxima-se da velocidade da luz, sua massa aproxima-se do infinito. Neste caso, uma força infinita seria necessária para colocar o corpo numa velocidade tal que sua massa seria infinita, e como não existem massa ou forças infinitas concluímos que não há corpos deslocando-se com velocidade superior ou igual a c. Em determinados meios como água, vidro, ar, etc., a velocidade da luz é inferior ao seu valor no vácuo. E em tais meios podemos encontrar partículas que se movem com velocidade superior à da luz naqueles meios, jamais, no entanto, superior à luz no vácuo. Fig. 2.28 - Partícula radiante num meio, deixando um cone de radiação após sua passagem Quando partículas carregadas propagam-se em tais meios com velocidades acima da luz naquele meio, um cone de luz é emitido (Fig. 2.28) num processo parecido daquele das ondas emitidas por um barco que propaga-se com uma velocidade acima das velocidades das ondas na água. Esta radiação emitida é denominada de Radiação Cerenkov. Consideremos o meio de índice de refração n, definido como: n = veloc. luz vácuo veloc. luz meio 55 de modo que a velocidade da luz no meio é c/n, que no caso em questão é inferior à velocidade v da partícula. À medida que a partícula carregada propaga-se no meio, colisões provocam emissão de luz, que propaga-se à velocidade c/n. A radiação emitida propaga-se em todas as direções, mas como a partícula é mais rápida, a frente de onda da radiação propaga-se e nunca atinge a partícula. Pelo esquema acima, a radiação originada no ponto 0 propaga-se ct/n, enquanto que a partícula deslocou-se de vt, deixando para trás este cone de Cerenkov. O ângulo de abertura do cone é dado por: senθ = (c / n ) = vt c nv (d) Derivação Alternativa da Relação Massa-Energia A dedução do equivalente massa-energia pode ser feita de várias formas diferentes. Uma das formas sugeridas por Einstein utiliza a noção de que o centro de massa de um sistema não pode mover-se quando não existem agentes externos atuando sobre o sistema. Neste exemplo, imaginemos uma caixa fechada e vedada. De uma das extremidades desta caixa é emitido um pulso de luz, como mostra a fig. 2.29. Quando a emissão ocorre, a caixa sofre um recuo devido à conservação de momentum. Quando a radiação é reabsorvida no outro lado o momentum é removido da caixa e novamente o sistema volta ao repouso. Durante o tempo de vôo do pulso de luz dentro da caixa, esta sofreu um deslocamento ∆s. Como acreditamos que o centro de massa não mudou de posição, devemos aceitar que o pulso de luz transferiu uma certa quantidade de massa de um extremo para outro da caixa. Fig. 2.29 - Sistema imaginado para obtenção da relação massa-energia. 56 Vamos calcular a quantidade de massa transferida pela luz, a fim de que o centro de massa não seja alterado. Para simplificar o problema, vamos supor que metade da massa da caixa está concentrada em cada extremo da mesma e, portanto, inicialmente distantes L/2 do centro de massa. O pulso de luz, que apresenta massa zero, carrega um momentum dado por Ppul = E/c, pois pela relação E2 = (pc)2 + (m0c2)2 com m0 = 0 e, sendo E a energia correspondente do pulso. Vamos considerar que esta quantidade de energia transferida corresponde a uma massa m. Antes de emitir a caixa tem massa M e após M - m, e velocidade v. Do princípio de conservação de momentum: Pcaixa = Ppulso ( M − m) = E c de onde obtemos: V= E E = ( M − m)c Mc já que M » m O tempo de vôo da luz é da ordem de t = L/c e, assim, o deslocamento da caixa é dado por: ∆s = vt ~ EL Mc 2 Após a luz ser absorvida e a caixa deixar de mover-se, temos M/2 - m de massa à esquerda e M/2 + m à direita. Como supusemos que o centro de massa não alterou, a transferência de massa deve ter sido compensada pelo deslocamento de modo que: M L M L − m + ∆s = + m − ∆s 2 2 2 2 resolvendo, temos: 57 m= M∆s M EL = → E = mc 2 L L Mc 2 Como vimos, a energia E = mc2 é associada à partícula existe uma quantidade de massa de repouso mo, de modo que descontando a energia de repouso, o resto é energia cinética. Assim: v2 1 E cinética ~ m0 c 2 1 + − m0 c 2 ≈ m0 v 2 2 2c reduzindo-se à expressão já conhecida. Assim, para baixas velocidades podemos escrever: E= 1 m0 v 2 + m0 c 2 2 (e) Luz Propagando-se num Meio em Movimento: O Coeficiente de Arrastamento A luz passando por um meio que tem índice de refração n, propaga-se com velocidade c/n. Se o meio desloca-se com velocidade v paralelo à propagação da luz, qual é a velocidade observada por um referencial fora do meio (Fig. 2.30), em repouso? Fig. 2.30 - Luz propagando-se num meio em movimento Usando adição de velocidades Vx = Vx' + v vV 1 + 2x ' c 58 Sendo Vx' = c/n, temos: Vx = c / n + v c vn v = 1 + 1 + vc n c nc 1+ 2 c n −1 para v « c, vamos expandir o termo em parênteses e realizar a multiplicação, mantendo até a primeira ordem: Vx ~ c 1 + 1 − 2 v n n Assim, temos o termo esperado, mais um termo de arrastamento devido ao movimento do meio. O coeficiente f = 1 - 1/n2 é chamado de coeficiente de arraste de Fresnel. (f) Aberração Estelar Utilizando-se as leis de composição de velocidade podemos calcular a aparente mudança na direção quando um corpo estelar é observado. Vamos considerar como referencial estacionário o sol (ref. S Fig. 2.31) e como referencial em movimento (S') a Terra em seu movimento orbital. Seja uma estrela que para um observador em S esteja inclinada a um ângulo θ com relação ao plano de órbita da Terra. Para um observador em S' a inclinação é θ' que difere de θ por uma quantidade α. Fig. 2.31 - Observação de uma estrela por observador em movimento. Assim, θ = θ' + α. Para um observador em S, a luz chega a ele com as componentes. 59 Vx = - c cos θ Vy = - c sen θ enquanto para um observador em S', movimentando-se com velocidade v em S, as componentes da velocidade da luz que chega são diferentes e daí a origem da aberração ou mudança na direção de observação. Utilizando as equações para composição de velocidades e podemos verificar obviamente que Vx’2 + Vy’2 = c2, não violando, desta forma, o segundo postulado. Assim, o ângulo e' do qual a luz provém para S' é: cos θ ' = V x ' cos θ + v / c = v cos θ c 1+ c e, para v « c, temos: v cos θ ' ~ cos θ + sen 2θ c Como θ' = θ + α, temos cos θ' = cos θ cos α. E, sendo a pequeno temos cos α ~ 1 e sen α ~ α: v cos θ + αsenθ = cos θ + sen 2θ c de onde obtemos: α ~ v senθ c que é o desvio causado pelo movimento. Note que estamos tomando o movimento da Terra como uniforme num curto período. Neste caso v ~ 30 Km/seg. o que leva a um α ~ 10-4 rad para sen θ = 1. (g) Efeito Doppler Relativístico O efeito Doppler relativístico é qualitativamente equivalente ao mesmo efeito observado com som quando fonte e/ou observador estão em movimento. Neste caso, 60 devido ao movimento da fonte ou do observador, o comprimento de onda do fenômeno ondulatório é alterado. A título de ilustração, antes de estudarmos o efeito Doppler relativístico, consideremos uma fonte sonora em movimento com velocidade v, emitindo ondas sonoras na freqüência υ 0 (freqüência para o observador no referencial de repouso da fonte). Em t = 0, a fonte emitiu um máximo da onda, o próximo será emitido em um tempo τ após a primeira. E neste caso ela já não se encontra na posição da emissão da primeira, pois a fonte se deslocou (u = velocidade da onda no meio, v velocidade da fonte, fig. 2.32). Fig. 2.32 - Efeito Doppler Sonoro. Devido ao movimento da fonte, o comprimento de onda observado é alterado. Se a fonte vai de encontro ao observador (e vice-versa) há uma aparente diminuição no comprimento de onda observado. E no caso de afastamento fonte-observador, há um aparente aumento do comprimento de onda. Para o caso acima: λ ' = uτ − vτ = (u − v )τ como λ ' = u / υ ' , já que a velocidade de propagação da onda no meio não é alterada, e τ = 1 / υ 0 , temos: u u −v = v' v0 61 ou seja: v' = 1 v 1− u v0 Assim, devido ao movimento da fonte, o observador notará uma maior freqüência (caso v > 0) ou no caso da fonte se afastando (v < 0) uma menor freqüência. Após esta introdução preliminar, voltemos nossa atenção ao caso semelhante em relatividade especial. Suponhamos uma fonte de radiação eletromagnética localizada na origem de um sistema de referência S considerado estacionário e um observador em repouso em S' que desloca-se com velocidade v em relação a S. Cada pulso emitido viaja com velocidade c, e estes pulsos são emitidos periodicamente com período τ . Assim, em t = O é emitido o primeiro pulso, em t = τ o segundo e assim sucessivamente, até t = n τ quando é emitido o (n + 1) ézimo pulso. Vamos analisar como esta situação é observada pelo observador em S'. Cada vez que o pulso passa pelo observador, ele evidentemente o detecta. Se colocarmos num diagrama t vs x o deslocamento do observador e de cada pulso emitido, cada vez que houver cruzamento entre a propagação do pulso e a do observador é porque houve detecção de um pulso (fig. 2.33). Fig. 2.33 - Diagrama espaço-tempo para propagação da radiação e deslocamento do observador. A pergunta que fazemos é: Qual é a periodicidade (ou frequência) que o observador recebe os pulsos? Entre os pontos (x1, t1) e (x2, t2) o observador recebeu n pulsos: x1 = ct1 = x0 + vt1 62 x2 = c (t2 - n τ ) = x0 + vt2 e destas temos duas equações: t 2 − t1 = cnτ c−v e x 2 − x1 = vcnτ c−v Isto é observado por S. Se quisermos saber o observado por S', utilizamos as transformações de Lorentz : t 2 − t1 = (t 2 − t1 ) − v(x 2 − x1 ) / c 2 1− v2 / c2 e substituindo os resultados obtidos temos: t ' 2 −t '1 = ncτ v2 1 − (c − v ) 1 − v 2 / c 2 c 2 Como este período refere-se à observação de n pulsos, temos que o período observado em S' é: τ '= t ' 2 −t '1 n cτ v2 1 − 2 τ '= 2 2 (c − v ) 1 − v / c c expandindo τ '= τ 1+ v / c 1− v / c V '= v 1− v / c 1+ v / c ou em termos de freqüências: 63 Assim, o efeito Doppler relativístico, segue qualitativamente o que já dissemos, com modificações quantitativas causadas pelas restrições impostas pela relatividade especial. (h) Colisão: Um Exemplo de Conservação Energia-Momentum Vamos considerar, agora, um exemplo envolvendo conservação de energia e momentum. Seja a colisão entre uma partícula de massa de repouso mo, energia Eo e momentum Po com uma outra semelhante a esta, porém em repouso. Considerando que as partículas emergirão da colisão com a mesma energia e momentum, pergunta-se: "Qual será o ângulo de espalhamento θ (fig. 2.34)? ". Fig. 2.34 - Colisão não frontal entre duas partículas de mesma massa de repouso que emergem da colisão com iguais momento energia. Tratando o caso onde as partículas emergem com mesmo p e E, a conservação de momentum na direção y requer que os ângulos de espalhamentos sejam iguais, como mostrado na figura acima. Conservação de energia e momentum nos permite escrever: Po = 2p cos θ Eo + moc2 = 2E e como E2 - (pc)2 = (moc2)2 , a primeira equação fica: E 02 − m02 c 4 = 2 E 2 − m02 c 4 cos θ 64 e substituindo nesta última equação E = (Eo + moc2) / 2, obtemos: E −m c = 2 2 0 2 0 4 (E 0 ) + m0 c 2 − m02 c 4 cos θ 2 de onde é possível eliminar θ : cos θ = E 0 + m0 c 2 E 0 + 3m0 c 2 No regime de baixas velocidades, Eo ~ moc2, de onde obtemos cos θ ~ (2)-1/2 ou θ = 45°. Isto corresponde exatamente à situação não relativística já conhecida. Um segundo exemplo é a colisão frontal entre duas partículas de massas de repouso diferentes. Assim, seja uma partícula de massa mo, energia Eo e momentum p0, que colide frontalmente com uma segunda partícula de massa Mo, em repouso. Após a colisão, a primeira partícula emerge com (p1, E1) e a segunda com (p2, E2). Conhecendo (po, Eo), queremos determinar a situação pós colisão (fig. 2.35). Fig. 2.35 - Situação pós colisão. Pela observação de momentum e energia, po = p1 + p2 Eo + Moc2 = E1 + E2 A equação relativa à conservação de energia pode ser convertida em: E 0 + M 0 c 2 = P12 c 2 + m02 c 4 + P22 c 2 + M 02 c 4 65 onde usamos a relação momentum-energia. Substituindo p1 = po - p2, temos: E0 + M 0 c 2 − p 22 c 2 + M 02 c 4 = ( p 0 − p 2 )2 c 2 + m02 c 4 que quadrando resulta em: (E 0 + M 0c 2 ) 2 ( + p 22 c 2 + M 02 c 4 − 2 E0 + M 0 c 2 )( ) p 22 c 2 + M 02 c 4 = ( p0 − p 2 ) c 2 + m02 c 4 2 Usando Eo2 = (poc)2 + (moc2)2 e desenvolvendo o primeiro termo obtemos: ( 2 E0 M 0 c 2 + 2M 02 c 4 − 2 E 0 M 0 c 2 ) p 22 c 2 + M 02 c 4 = −2 p0 p 2 c 2 que é equivalente à: ( 2 E0 M 0 c 2 + 2M 02 c 4 + 2 p 0 p 2 c 2 = 2 E 0 + M 0 c 4 ) p 2 c 2 + M 02 c 4 que pode ser novamente quadrada e após eliminarmos p2, obtemos: ( ) p2 = 2 p0 M 0 c 2 E0 + M 0 c 2 2 M 0 c 2 E0 + M 02 c 4 + m02 c 4 p1 = P0 m02 − M 02 c 4 2 M 0 C 2 E0 + M 02 C 4 + m02 c 4 e, conseqüentemente: ( ) Um caso particular de interesse é quando mo = Mo, onde teremos p1 = 0 e p2 = po, mostrando que neste caso a partícula 1 fica em repouso cedendo totalmente seu momentum para 2. No limite de baixas energias, Eo ~ moc2, as expressões acima resultam em: 66 2M 0 p 2 = p 0 m0 + M 0 m − M0 p1 = p 0 0 m0 + M 0 que corresponde ao resultado esperado no caso não relativístico. (i) Colisão Fóton – Átomo Vamos considerar a colisão entre uma partícula de massa zero (o fóton) com uma partícula massiva (o átomo). Seja Mo a massa atômica e Eo a energia do fóton. Imaginando o átomo inicialmente em repouso, queremos determinar a velocidade adquirida pelo átomo devido à absorção. Antes e após a absorção a energia se conserva, de modo que: E = Eo + Moc2 Se uma partícula tem momentum p e velocidade v, vale a relação: pc2 = mvc2 = mc2v = vE ou pc2 = vE Como o momentum do átomo após a colisão será o mesmo que o do fóton antes da colisão, já que o momentum se conserva, P = Pfóton = E0 c escrever: ( E0 2 .c = v E 0 + M 0 c 2 c ) , e como E = Eo + Moc2, podemos 67 ou seja, a velocidade adquirida pelo átomo após absorção é: v= E0 c E0 + M 0 c 2 normalmente denominada de velocidade de recuo durante a absorção. O processo de absorção também está acompanhado de uma variação de massa, causada pela porção de energia transferida. Assim, é natural perguntarmos qual é a nova massa do átomo após a absorção? Para o átomo, a nova massa de repouso será M. E2 = p2c2 + M2c4 e p= E0 , E = Eo + Moc2 c substituindo E e p na relação energia-momentum, tiramos: (Eo + Moc2)2 = Eo2 + M2 C4 de modo que: M = 2 E 0 M 0 c 2 + M 02 c 4 c4 ou M = M 0 1+ 2 E0 M 0c 2 Mostrando que a massa de repouso do átomo sofre variação. (j) Breve Análise do Movimento Uniformemente Acelerado Vamos brevemente analisar como o movimento acelerado é visto em outros referenciais inerciais. Note que os referenciais continuam não acelerados e, portanto, a relatividade especial continua válida. Consideremos um corpo uniformemente acelerado 68 no referencial S' que se move com velocidade v relativo a S. Para um observador em S', a equação horária deste corpo acelerado é dada por: x' = 1 a' t ' 2 2 Para encontrarmos a posição como função do tempo para o observador no referencial S, vamos utilizar a transformada de Lorentz: x − vt x' = 1− v2 / c2 v x c2 t' = 1− v2 / c2 e substituindo acima fornece: ( ) v 1 t − c2 x x − vt = a ' 2 1− v2 / c2 2 Note que embora o movimento seja acelerado, os referenciais ainda são inerciais. A equação acima é quadrática em t e x, podendo ser facilmente resolvida, fornecendo: c2 x= a ' γβ 2 2 a ' γβ t 2a ' γβ 2 a ' γt 2 a ' γβt 1 + − 1 + + β ct − c c c 2 2 onde γ = ( Usando a relação γ 2 = 1 − β 2 1 1− v / c 2 2 e β= v c ) , a expressão anterior é reduzida a: x= c2 a ' γβ 2 −1 / 2 a ' γβ t 2a ' β − 1− 1 + c cγ t 69 que representa a equação horária de um movimento uniformemente acelerado (num referencial S'), visto num outro referencial S. Se considerarmos que para pequenos tempos a velocidade do corpo ainda não cresceu muito, podemos expandir a equação acima e obtemos: x= c 2 a ' γβ t a ' β a' 2 β 2 2 t t + ... 1 + − 1 + − 2 2 2 c cγ a ' γβ 2c γ e considerando somente termos até Segunda ordem em t, x = βct + 1 a' 2 t + ... 2γ3 Assim, para tempos curtos, a aceleração medida em S é dada por: a= (1 − v a' 2 / c2 ) −3 / 2 Como exemplo, analise o movimento de queda livre visto por um balão que sobe (ou desce) com velocidade constante v em relação a terra. Verifique diferenças que seriam observadas nos tempos de queda. (II.6) A Relação Força e Aceleração Da mecânica de Newton, aprendemos que força e aceleração são paralelas. F =m dv = ma dt Queremos examinar esta relação do ponto de vista relativístico, onde momentum tem agora uma nova definição. É importante lembrar que como em relatividade os componentes de velocidades estão independentes, suas variações também farão o que pode causar, do ponto de vista vetorial, consideráveis alterações na dependência forçaaceleração. 70 Iniciamos com a expressão: F= dp dt de modo que: F = m0 d v dt 1 − v 2 c 2 1 = m0 d v + m v d 0 2 dt 1 − v 2 c 2 1 − vc 2 dt Para a última derivada temos: d 1 dt 1 − v 2 c 2 v2 = 1 − c 2 −3 / 2 v dv c 2 dt Assim, F= M0 1− v 2 c2 v2 dv + vM 0 1 − 2 dt c −3 / 2 v dv c 2 dt Para facilitar nossa análise, vamos calcular o produto F .v : m0 v dv m0 v 3 F .v = + 2 2 c 1 − v 2 dt c v2 1 − 2 c −3 / 2 v2 mo v1 − 2 c 3 2 dv m0 v(1 − v c 2 ) + m0 v / c dv = dt dt (1 − v2 c2 )3 / 2 2 −3 / 2 dv dt d 1 Assim podemos identificar rapidamente que uma maneira de escrever dt 1 − v 2 c 2 d 1 dt 1 − v 2 c 2 = F .v m0 c 2 é: 71 Como a definição de aceleração é a ≡ F= dv , temos que: dt m0 1− v 2 c2 v v a + F. c c ou seja: a= 1− v 2 m0 c2 v v F − F . c c mostrando claramente que, relativisticamente, aceleração e força não são paralelas, ao contrário da mecânica newtoniana. É claro que este efeito é considerável a altíssimas velocidades já que o desvio do paralelismo entre a e F é proporcinal a ( vc )2 . Esta quebra do paralelismo entre aceleração e força é consequência direta do fato que nenhuma velocidade pode exceder c e do fato que a velocidade depende de todos os componentes espaciais, não somente da direção da força. → Caso F ⊥ v , então a // F . Neste caso a força é incapaz de variar o módulo de v , somente sua direção, como já conhecido. (II.7) Relatividade Especial e o Eletromagnetismo Uma das áreas da Física onde a relatividade tem o maior impacto é o eletromagnetismo. Se considerarmos que a carga elétrica é invariante sob transformação de Lorentz é possível, a partir da lei de Coulomb, obter as leis básicas do eletromagnetismo. Assim, por exemplo, imaginemos duas cargas q1 e q2 movendo-se com velocidade v paralelamente a x. No referencial em repouso (S), existirá uma força magnética entre elas. Já no referencial S', que desloca-se com v, não haverá forçamagnética; porém, haverá uma força entre elas de natureza elétrica. Deste exemplo vemos que do ponto de vista relativístico o campo elétrico e magnético não existem como entidades separadas, mas sim são combinados como um único conceito em eletromagnetismo. 72 Normalmente em eletromagnetismo é importante conhecermos densidade de carga e corrente. Desta forma verificar como estas quantidades se transformam é essencial, já que elas são as fontes de campos. Consideremos um condutor de secção transversal Ao e comprimento lo contendo N elétrons e localizado paralelo ao eixo x' no referencial S' que desloca-se com v em relação a S. A densidade de carga é ρ = Ne / Ao lo e a densidade de corrente é jo = 0, pois as cargas não se movimentam neste referencial (Fig. 2.36). Fig. 2.36 - Condutor observado de dois referenciais. Observemos a situação por S com relação ao qual o condutor carregado deslocase com v. Neste referencial o comprimento do condutor é I = lo (1-v/c)2)1/2 enquanto a secção transversal permanece inalterada. Como a carga não muda, a nova densidade de carga é dada por: ρ= Ne A0 10 1 − v 2 / c 2 ρ= a densidade de corrente será j = ρ v. Portanto: j= ρ0 1− v2 / c2 ρ 0v 1− v2 / c2 Um tratamento mais geral, no caso das cargas estarem movendo-se também no referencial S', leva às seguintes transformações: 73 j' x = j x − ρv 1− v2 / c2 j' y = j y e j' z = j z ρ'= ρ − vj x / c 2 1− v2 / c2 onde jx, jy, jz e p são observados por S, enquanto que j'x, j'y, j'z e p' são observados por S'. Como um exemplo das transformações acima, consideremos um condutor que conduz corrente e está em repouso em relação a S. Neste caso, as cargas negativas deslocam-se (elétrons) em relação a S com velocidade u, enquanto que as cargas positivas estão em repouso. A densidade de carga neste referencial é: ρ= ρ++ ρ =0 pois ρ + = Ne e ρ = -Ne. A densidade de corrente é jx = j+ + j = ρ + . 0 + ρ - u = ρ - u. Pelo fato que a densidade de carga é nula, não haverá observação de campo elétrico. Contudo, haverá um campo magnético devido a movimentação das cargas negativas. Vamos agora observar este condutor de um outro referencial S' que desloca-se com v com relação a S, como mostra a figo 2.37. Fig. 2.37 74 Visto por S' a densidade de carga será: ρ ' = ρ '+ + ρ ' = ρ + − vj x+ / c 2 1− v2 / c2 + ρ − − vj x− / c 2 1− v2 / c2 como ρ + = Ne e ρ - = -Ne, j+x = 0 e j-x = ρ -u, da transformação anterior tiramos que: ρ'= Nevu / c 2 1− v2 / c2 de modo que observado pelo referencial S' o condutor não é neutro, apresentando carga positiva, e consequentemente observa-se um campo elétrico em S'. Da mesma forma, j'x ~ 0 e um campo magnético também é observado em S'. Este exemplo demonstra de forma clara nossa frase inicial de que pela relatividade especial, eletricidade e magnetismo devem ser considerados como sendo um único conceito, dependendo apenas do referencial. (II.8) - Breve Introdução à Teoria da Relatividade Geral Após entendermos as principais considerações da teoria da relatividade restrita, ficamos convencidos que nada pode viajar com velocidade superior à velocidade da luz no vácuo. Isto cria certos problemas, um dos quais está associado à lei da Gravitação. Segundo essa lei, F = GmgM/r2, onde r é a distância entre as massas. A pergunta é: se eu destruísse uma das massas instantaneamente, será que a Segunda massa perceberia instantaneamente? Ou esta reação à distância demoraria certo tempo? Outro ponto importante é que na mecânica de Newton, a massa inercial (F = mi a) e a massa gravitacional mg são sempre consideradas idênticas, fato que merece uma explicação mais fundamental. Além destas questões, o problema de referenciais não inerciais, não incluídos na relatividade especial, merecem ser considerados. Embebido em todas estas questões, Einstein (1916) formulou a teoria da relatividade geral, na qual o princípio da equivalência é seu resultado mais significativo. Da mesma maneira que a relatividade especial foi fortemente motivada por experimentos como o de Michelson-Morley, a relatividade geral também teve seus 76 passos iniciais motivados no experimento de Eotvos (1922), que tinha como propósito 75 demonstrar a equivalência entre massa inercial e massa gravitacional. Quando uma força age sobre um corpo, ela o faz sobre a massa inercial (mi). Já a gravidade age sobre a massa gravitacional. Assim, sejam dois corpos em queda sob a ação da gravidade, adquirindo acelerações a1 e a2: GM r2 GM mi 2 a 2 = m g 2 2 r mi1 a1 = m g1 ou dividindo as equações: mi1 a1 mi 2 = m g1 a 2 m g 2 Assim, se a1 / a2 = 1 ficaria provada a equivalência entre a massa inercial e gravitacional. O experimento mais decisivo nesta equivalência foi feito em 1922 por R.V. Eotuos. Em seu experimento um pêndulo colocado na superfície da Terra verticalmente sem oscilação fica sujeito a duas forças, a gravitacional e a centrífuga (Fig. 2.38). O pêndulo localiza-se ao longo da resultante R. A força centrífuga age na massa inercial enquanto a gravitacional em mg. Fig. 2.38 - o ângulo entre o pêndulo e a direção do centro da terra é função de mi/mg. A a resultante não está na direção do centro da Terra, mas fazendo um certo ângulo θ com esta, de modo que (veja detalhe no diagrama da fig. 2.38). mi ω 2 re mi ω 2 tan θ = = mg g m g g re 76 Variando a latitude, pode-se observar a variação de θ. Os experimentos realizados mostraram que se houver diferenças entre mi e mg, esta é menor que 10-8. Experimentos mais recentes chegam a 10-10. Com estes resultados, Einstein enunciou o chamado Princípio da Equivalência: "Os efeitos produzidos pelo campo gravitacional são idênticos aos produzidos por aceleração. E não há maneiras de distinguir um do outro, eles são completamente equivalentes". Isto equivale dizer que se tivermos num sistema de referência onde há um campo gravitacional e não há aceleração e um segundo onde não há campo gravitacional, mas há aceleração, com respeito ao primeiro. Apesar do primeiro ser um referencial inercial (pois não há aceleração) e o segundo não ser inercial, eles são fisicamente idênticos. Ou seja, experimentos realizados em situações equivalentes nestes dois referenciais levarão a resultados idênticos (situação equivalente significa a = g). Ou ainda, sistemas acelerados ou em campos gravitacionais são equivalentes. De acordo com Einstein, isto mostra que não há sistema de referência acelerado que seja absoluto. O movimento em qualquer sistema acelerado também é relativo. Vamos agora analisar algumas situações em relatividade geral. A primeira delas é o chamado deslocamento gravitacional para o vermelho das linhas espectrais (ou relógios em campos gravitacionais). Considere dois observadores E e R, separados por uma distância d num referencial na presença de um campo gravitacional uniforme g (Fig. 2.39). Fig. 2.39 - o sistema de referência na presença de um campo gravitacional é equivalente ao sistema movendo com a = -g. 77 Uma situação equivalente é criada num segundo sistema de referência Si que não tem campo gravitacional, mas move-se com uma aceleração a = -g. O princípio da equivalência afirma que ambos referenciais são equivalentes. Suponha que tenhamos um átomo localizado na posição E e que emita um fóton de seqüência υ o . Estando no campo gravitacional (Sg), queremos saber qual é a freqüência detectada pelo receptor R. Como pelo princípio da equivalência esta situação é análoga ao referencial acelerado a = -g, vamos analisar a situação neste caso. Considerando que ambos referenciais estavam em repouso em t = 0, quando o sinal foi emitido, o tempo para atingir R é t = d/c. Neste tempo, ambos os observadores (E, R) adquirem uma velocidade v = gd/c e, portanto, no instante que o sinal chega ao receptor ele afasta-se com velocidade v = gd/c e, portanto, observa o sinal defasado para o vermelho.Utilizando nosso conhecimento do efeito Doppler, a freqüência observada é dada por: v = v0 1− v / c , expandindo esta expressão, 1+ v / c temos: 3 v = v0 1 − β + β 2 + ... 4 em primeira ordem: gd v ≅ v 0 1 − 2 c Assim, podemos concluir que quando a luz caminha contrária ao campo gravitacional ela fica mais vermelha. Isto pode ser pensado como a luz perdendo energia quando propaga-se contra o campo gravitacional. É claro que se invertemos o receptor com o emissor, a luz agora propaga-se no sentido da gravidade e o deslocamento será o azul. Em 1960 este fato foi confirmado experimentalmente e obteve-se: ∆Vexp ∆Vteor = 1.05 ± 0.01 Se pulsos são emitidos periodicamente como se fosse um relógio, o período variaria com a altitude ( T ~ 1 / υ ): 78 hd T (h ) ≅ T0 1 + 2 c mostrando que relógios colocados em campo gravitacional passam a andar mais devagar de acordo com sua altitude. Uma maneira diferente de obter este mesmo resultado (embora não completamente correta) é imaginar o fóton de luz como tendo massa h υ 0 = m c2, ou seja m = h υ 0 / c2. Portanto, ao escalar um campo g, a energia perdida seria mgd: hv = hv0 − hv0 gd c2 ou gd v = v0 1 − 2 c Utilizando-se argumentos semelhantes, pode-se calcular a deflexão da luz por grandes campos gravitacionais. Supondo que o fóton tem massa m, possui um parâmetro de impacto s e o corpo massivo apresenta massa M. Com isso, podemos calcular o ângulo (Fig. 2.40): Fig. 2.40 - Deflexão da luz por um corpo massivo. Da teoria de espalhamento temos: tg θ 2 = GMm GM = 2 msv 02 sv0 79 Substituindo v0 por c temos que: tg θ 2 = GM sc 2 II.9 - Exercícios 1) Imagine um experimento onde uma partícula é acelerada por uma força cuja amplitude aumenta no tempo na forma F = 106t (em unidades CGS). a) calcule o tempo necessário para v = 0.5c b) repita o item "a", considerando m = mo / (1-v2/c2)1/2 c) discuta a diferença entre os resultados 2) No experimento de Michelson-Morley o comprimento de cada braço é de 11 m e a luz de Sódio λ = 5.9 10-7 foi utilizada. Se o sistema tem sensibilidade para uma variação de 0.005 franjas, qual é o limite na determinação da velocidade da Terra através do suposto "éter"? 3) O experimento de Michelson-Morley é considerado "um experimento de Segunda ordem", porque o efeito depende de (v/c)2. Vamos considerar o seguinte experimento de primeira ordem. Em t = 0 um observador em A envia um sinal para um observador em B, a uma distância L de A. B marca o tempo de chegada. Supondo que o sistema move-se através de um éter com velocidade v, como mostrado na figura abaixo: Considere que o laboratório é agora rodado de 180° e o experimento é repetido. Mostre que a diferença das medidas de tempo em ambas situações é: ∆t ≅ 21 v c c 80 Discuta uma possível situação onde este efeito possa ser observado. Aplique para o caso de um experimento realizado na Terra e verifique a viabilidade de medida. 4) Um observador na Terra mede o comprimento de uma nave espacial como sendo metade do comprimento próprio da nave. Qual é a velocidade desta nave? 5) Um avião move-se a 1000 m/s sobre a superfície da Terra. Determine em quanto tempo um relógio no avião levará para ficar 2 seg. atrasados com respeito a um relógio na Terra. 6) Um átomo radioativo decai em 2 µs. Qual será o tempo de decaimento quando medido por um observador no laboratório com relação ao qual o átomo desloca-se com 0.8 c? 7) Para um observador 0 dois eventos ocorrem separados de 3.6 108 m num intervalo de tempo de 2 seg. Qual seria o tempo próprio para a ocorrência destes dois eventos? 8) Um foguete viaja com velocidade 2.4 108 m/s. O relógio do astronauta e o da base foram sincronizados (t = t' = 0 em x = x' = 0). Se o astronauta observa um relógio na base através de um telescópio. Qual tempo ele observará na base quando seu próprio relógio 30 seg.? O que ele observa no seu próprio relógio quando o da base marca 30 seg.? 9) Mostre que a equação de onda eletromagnética é invariante sob a transformação de Lorentz. ∇2 E − 1 ∂2 E =0 c 2 ∂t 2 10) Uma partícula instável com tempo de vida média de 4 µs é produzida num acelerador e projetada com velocidade 0.6c. Qual será seu tempo de vida medido no laboratório? Qual é a distância média que a partícula percorrerá no laboratório antes de desintegrar? 11) Um "metro" move-se ao longo do eixo x com velocidade 0.6 c. O ponto médio do metro passa por um observador em repouso em t = 0. Determinado pelo observador, onde estão as extremidades do metro no instante da medida? 81 12) Dois eventos que ocorrem no mesmo lugar do espaço e estão separados de 4 seg., medidos por um observador. Se um segundo observador mede um intervalo de 5 seg. entre os eventos, qual é a separação espacial destes eventos para este segundo observador? 13) Uma partícula move-se com velocidade 0.8 c fazendo um ângulo de 30° com o eixo x, determinado no referencial S. Qual será a velocidade da partícula quando observada por um observador movendo-se com -0.6 c ao longo do eixo x - x'? 14) Calcule o momentum de um elétron com q Mev de energia. 15) Qual é a máxima velocidade que uma partícula pode ter, de modo que sua energia calculada por mv2/2 não apresente erro superior a 0.5 %? 16) Duas partículas idênticas de massa de repouso mo, colidem frontalmente cada uma tendo velocidade u. A colisão é perfeitamente inelástica formando um corpo compacto. Determine a massa de repouso deste corpo composto. Compare o valor obtido com 2 mo. 17) Uma partícula de massa de repouso mo e velocidade 0.8 c faz uma colisão completamente inelástica com outra de massa 3 mo e inicialmente em repouso. Qual é a massa de repouso e a velocidade da partícula resultante? 18) Uma estrela afasta-se da Terra com velocidade 0.005 c. Qual é o deslocamento Doppler para a linha D2 do Sódio (5890 Ao)? 19) Neste exercício faremos uma estimativa da massa de um Buraco Negro. Suponha que a densidade do Buraco Negro é idêntica à do Sol. Assim, qual deve ser seu raio (e consequentemente sua massa) para que a luz não possa escapar da sua atração gravitacional? Dica: Suponha que a velocidade de escape é c. Universidade de São Paulo Instituto de Física de São Carlos Departamento de Física e Ciência dos Materiais FÍSICA MODERNA ELEMENTAR CAPÍTULO III INTRODUÇÃO À ATOMÍSTICA Autores: Prof. Vanderlei Salvador Bagnato Prof. Luís Gustavo Marcassa São Carlos Maio 1999 2 CAPÍTULO III INTRODUÇÃO À ATOMÍSTICA III.1 - Introdução: A hipótese que toda matéria é constituída de porções denominadas de átomos teve sua origem na Grécia antiga, e sua introdução na ciência moderna ocorreu inicialmente na química por Dalton através de duas leis básicas bastante aplicadas nas reações químicas. O fato que em qualquer reação química os elementos combinam-se em proporções bem definidas suporta muito bem a hipótese de que a matéria é constituída de átomos. Coube à química, de um modo geral, introduzir de forma clara e definida o conceito e a diferenciação entre elemento e molécula. A hipótese de Avogadro de que um determinado volume de gás, nas mesmas condições de temperatura e pressão, sempre continha o mesmo número de constituintes dava pela primeira vez uma forma para se medir a massa ou tamanho do átomo. Numa quantidade de matéria chamada MOL, existe um número fixo de constituintes No = 6.0225 x 1023. Este número é de extrema importância em atomística, pois determina a "escala" que conecta o mundo atômico ao mundo macroscópico. A determinação do número de Avogadro, através de várias técnicas diferentes, chegando-se ao mesmo resultado, foi fundamental para o início da atomística, pois comprovou algumas hipóteses básicas sobre a constituição da matéria. As evidências de que tudo na natureza tem uma constituição atômica não restringiram-se somente aos fatos propostos e observados pelos químicos, naturalmente. Diversos experimentos, tais como o de Rutherford e o de Geiger, foram fundamentais para o desenvolvimento e estabelecimento deste novo aspecto da constituição da matéria, bem como sua composição e propriedades. Neste capítulo pretendemos descrever alguns experimentos históricos na área, os quais não somente foram importantes para revelar a natureza atômica da matéria e de seus subconstituintes, mas também pela interessante metodologia utilizada. Após uma breve apresentação destes experimentos, discutiremos em maior detalhe a teoria cinética dos gases que nos permitirá conectar, ou construir, a partir dos constituintes microscópicos básicos do gás, as propriedades macroscópicas utilizadas. Discutiremos em detalhes os sucessos e fracassos da teoria atomística clássica, nascida no século 3 anterior, e as necessidades de inová-la para explicação de outros fenômenos. Por fim, aplicaremos a teoria cinética dos gases para explicar alguns fenômenos de transporte observados em gases, líquidos ou mesmo sólidos. Este é um importante capítulo da Física Moderna, pois graças ao estabelecimento da constituição atômica da matéria é que acelerou o desenvolvimento tecnológico que assistimos as conseqüências hoje em dia. III.2 - Método de Perrin para Determinação do Número de Avogadro (No) Começaremos nosso estudo de atomística discutindo a constante de Avogadro, cujo valor é de extrema importância e de difícil determinação. Como já dissemos, o conhecimento de No significa conectar o mundo microscópico com o macroscópico, dando-nos a chance de imaginar e estimar o tamanho e massa de cada constituinte da matéria. De um modo geral, toda relação que envolve o número de Avogadro fornece uma forma de medi-Ia. Caso o volume de uma molécula vA pudesse ser determinado, o número No poderia ser obtido da relação: Va = NovA onde VA é o volume de um mol e vA o volume de cada molécula. Semelhantemente, se a massa de uma molécula individual puder ser determinada, MA = NomA, também possibilitará o cálculo e determinação de No. Em 1865 Laschmidt seguiu esta linha de pensamento para determinar No baseado em alguns aspectos da teoria cinética dos gases que veremos mais adiante. Vamos aqui nos ater à medida de No baseando-se na medida massa elementar. Neste caso, a dificuldade na medida da massa molecular advém do fato que a molécula é muito pequena. Perrin idealizou um método para determinação de No baseado em "pseudomoléculas", grandes o bastante para serem medidas e pequenas o suficiente para comportarem-se como moléculas. Vamos brevemente descrever seu método. Considere inicialmente um gás a uma temperatura T, na presença de um campo gravitacional da terra. Para movimentarmos um volume V deste gás através de uma diferença de pressão dp, será necessário à realização de um trabalho dw, de tal forma que: 4 dW = dF .dz = dF Adz = Vdp A Se o gás está em equilíbrio, no campo gravitacional, este trabalho é realizado às custas da energia potencial gravitacional Mgdz, onde M é a massa de gás contida no volume V, a ser deslocado de dz. Assim, a condição de equilíbrio requer que Mgdz + Vdp = 0 Outra forma de obter esta equação é através da análise de uma camada de espessura dz do gás. Para que esta camada se sustente é preciso que uma variação de pressão dp compense a gravidade, ou seja: - Mg = Adp como a pressão varia com z, de modo que uma variação dp corresponde a uma variação de altitude de dZ, dp = dp dz ; dz - Mgdz = Adzdp mas Adz = V e, finalmente, temos: Mgdz + Vdp = 0 Como estamos tratando de um suposto gás ideal pV = nRT (como veremos mais adiante), sendo n o número de moles em V. Substituindo na equação acima V = tiramos que: Mgdz + nRT ou dp =0 p nRT , p 5 Mg dp dz = − RT n p Se a pressão P varia de Po a P quando a posição varia de Zo a z, integramos Mg n Como ∫ z z0 dz = − RT ∫ p p0 dp p (3) M = M A é a massa molecular do gás em questão, a integral acima fornece: n P = P0 e −[M A g ( z − z0 ) / RT ] como à temperatura constante a pressão é proporcional à densidade, pois P = densidade x constante temos, portanto: ρ ( z ) = ρ 0 −[M Ag ( z − z0 ) / RT ] Esta equação mostra que a determinação da temperatura e do perfil de densidade de um gás no campo gravitacional permite determinar a massa molecular (Mol) MA. Para determinarmos No resta ainda determinarmos mA e, assim MA = N0 . mA Perrin usou o fato que pequenas partículas suspensas num líquido comportam-se como as moléculas de um gás apresentando um movimento aleatório e desordenado, com a vantagem de que tais partículas poderiam ser pesadas individualmente. 6 Através da preparação de uma emulsão de partículas de látex aproximadamente uniforme, Perrin determinou seu tamanho e peso, estabelecendo desta forma mA. Em seguida, utilizando um microscópio, Perrin determinou a distribuição de partículas em várias posições de emulsão colocadas no campo gravitacional. E após fazer uma correção, devido à força feita pelo fluído sobre as partículas, a distribuição mostrou-se em concordância com a lei exponencial acima, de onde foi possível obter o valor de MA. O valor de No determinado por Perrin foi de 6,8 x 1023, que é um resultado bastante bom considerando-se as condições em que o experimento foi realizado. Este valor nos dá uma boa ordem de grandeza da dimensão atômica, cerca de 10-23 do mundo macroscópio, em termos de massa ou volume. Portanto, aproximadamente 10-8 em dimensão linear. A contribuição de Perrin não parou na determinação do número de Avogadro. Inúmeros estudos envolvendo o chamado movimento Browniano permitiram a Perrin demonstrar a existência dos átomos e receber o Prêmio Nobel de Física em 1926. No movimento Browniano (descoberto em 1827, pelo botânico Brown), partículas pequenas situadas num líquido, ficam animadas de um movimento desordenado, interminável. Perrin conseguiu associar este movimento com existência de átomos no líquido e de sua interação com as partículas sólidas observadas. O movimento Browniano será visto em detalhes, mais adiante no curso. III.3 - Constituintes Atômicos: A Descoberta do Elétron J. J. Thomson (1856 - 1940) A hipótese atomística da matéria culminou com a determinação dos constituintes do átomo e a de algumas de suas propriedades básicas. Uma das interessantes descobertas no final do século passado foram os raios catódicos provenientes do cátodo (polo -) migrando para polo positivo (ânodo) durante 7 descargas elétricas em gases a baixas pressões. Neste tipo de descarga utiliza-se uma ampola evacuada onde estabelece-se uma diferença de potencial entre o cátodo e o ânodo (ver fig.1) de alguns milhares de Volts. Observa-se, na região da ampola à frente do cátodo, uma luminosidade esverdeada no vidro. Se o caminho do cátodo é obstruído a luminosidade desaparece. Dai a associação do efeito com os "raios" provenientes do cátodo, de onde provém o nome raios catódicos. Crookes, em 1879, fez uma série de experimentos com raios catódicos determinando grande parte de suas propriedades básicas, incluindo sua constituição, através da deflexão de tais raios quando na presença de um campo magnético, etc. Fig. 1 - Sistema para produção de raios catódicos Em 1897 o físico inglês J. Thompson realizou vários experimentos com raios catódicos, determinando que tais raios eram constituídos de partículas com cargas negativas. Além disto, Thompson realizou um importante experimento de deflexão destes raios por campos elétricos e magnéticos que determinou a relação carga/massa destas partículas. Chamemos de q a carga destas partículas e vamos estudar sua deflexão por campos. O experimento que vamos descrever consiste em fazer o feixe de raios catódicos de uma ampola de Crookes passar através de campos elétricos e/ou magnéticos, de modo que através da deflexão do feixe pela ação dos campos, possamos determinar a constituição do feixe. Assim, considere o arranjo mostrado na fig. 2 onde o feixe catódico passa pelo interior de um capacitor de placas paralelas. 8 Fig. 2 - Deflexão de feixe de partículas por campo elétrico. Quando o feixe de partículas negativas penetra no interior do capacitor de comprimento b, cujo campo elétrico é E , estas partículas são defletidas pelo campo num processo envolvendo aceleração constante. O campo atuará sobre tais partículas enquanto elas permanecem no interior do capacitor. Após isto, seu movimento continua retilíneo e uniforme até atingir a tela da ampola. Nesta parte final da ampola existe uma camada de um material fluorescente que revela a posição de impacto do feixe, permitindo assim observar o efeito dos campos sobre o feixe. Para o movimento no interior do capacitor, sendo vox a velocidade inicial das partículas do feixe (suposto na direção x), e q sua carga. A aceleração na direção y (do campo) será: ay = Eq m (5) de modo que a posição vertical da partícula passa a depender do tempo segundo: y= 1 ayt 2 2 e sua posição horizontal x = vox t Da combinação destas equações tiramos a trajetória parabólica do feixe: (6) 9 y(x ) = 1 Eq x 2 2 m v ox2 No ponto x = b (final das placas e, portanto, de atuação do campo), a inclinação da trajetória é: Eq x dy = 2 dx x −b m vox Eqb = 2 x =b mvox (7) e como x = b representa o final do campo elétrico, a partir deste ponto as partículas continuarão numa trajetória linear cuja inclinação é dada por esta última relação. Na posição onde o campo elétrico deixa de atuar, o deslocamento vertical vale: y (b ) = 1 Eq b 2 2 m vox2 (8) Considerando que a partir deste ponto temos uma trajetória retilínea, vamos supor que para x > b: y(x) = ax - β de modo que temos y = 0 em x = Para determinarmos ponto y(b) acima, tiramos (9) β a β Eqb dy , sabemos que α = = (inclinação) e usando o 2 α dx b mvox β b = . Assim, a extensão da trajetória retilínea da partícula, α 2 após o capacitor, cruza o eixo x em x = b . 2 Com isto, a equação da trajetória após passar pelo capacitor é: y(x ) = Eq b b x− 2 m vox 2 (10) 10 válida somente para x > b. Deste modo, o ponto onde tal feixe chegará na tela (final da ampola) posicionada em x = L é y (L ) = Eq b b L− 2 m v ox 2 (11) que quase determina a relação q/m, exceto pelo não conhecimento da velocidade inicial vox. Para determinarmos vox, superpomos ao sistema um campo magnético na direção de z, perpendicular ao esquema da figura 2. Este campo magnético agirá sobre a carga quando esta desloca-se com vox produzindo uma força magnética exatamente oposta à força elétrica (ver figura 3). Assim, podemos continuamente aumentar este campo (através do aumento na corrente da bobina geradora), até que a força elétrica é completamente compensada pela magnética. (Neste ponto Fmg=FeL). A força magnética sobre q é dada por: Fmg = q vx B c (12) de modo que igualando a força elétrica, obtemos: vox E = c B0 (13) Neste ponto, nenhuma deflexão é observada no feixe. Com este valor de vox, a relação carga massa fica determinada pela equação: q Ec 2 y (L ) = m B02 b L − b / 2 (14) 11 Fig. 3 - Composição de forças sobre a partícula carregada Resumindo: para determinarmos a relação q/m dos raios catódicos o procedimento é: para B = 0 e E conhecido, determinamos y (L). Aumentando a corrente nas bobinas determinamos o campo magnético B 0 onde o feixe não é defletido, isto é, atinge o ponto x = L, y = 0. Com estes valores e conhecendo a geometria do sistema, determinamos q/m. Utilizando-se deste método Thonson determinou que para os raios catódicos: q/m = 1,76 x 1011 col/kg O método descrito acima é conhecido como método de Thonson para medida de q/m. Este valor foi profundamente importante, pois observou-se que ele era cerca de 2000 vezes maior que o maior valor q/m conhecido para um sistema iônico (no caso hidrogênio), qH = 9,57 x10 7 coul / kg mH valor este determinado de outra forma (como por exemplo, em eletrólise). Isto mostrava que provavelmente a massa das partículas que constituíam os raios catódicos eram cerca de 2000 x menor do que átomo (em massa) conhecido. Este resultado teve importância na descoberta do elétron como constituinte do átomo. Assim, os raios catódicos nada mais são do que feixes de elétrons e o método de Thonson permite a determinação de e/m, onde e é a carga elementar. 12 A carga do elétron (e), é sem dúvida uma das mais importantes grandezas, pois dela depende a maioria das propriedades atômicas, elétricas, dos sólidos e as principais características da estrutura interna do átomo. A fim de medir a carga e, Millikan em 1911 realizou um experimento que consistia em observar partículas carregadas migrando num campo elétrico. Millikan utilizou gotículas de óleo carregadas movendo-se entre as placas de um capacitor, como é mostrado na figura 4. Robert A. Millikan (1868 – 1953) Fig. 4: Esquema para experimento de Millikan Imagine uma gotícula de massa m, carga +q e raio r no interior do capacitor mostrado na figura. Sobre ele teremos a força gravitacional mg, a força elétrica Eq e uma força viscosa f (devido à ação do gás de fundo). A força viscosa é proporcional à velocidade e ao raio da partícula, ou seja, f = krvy (onde k é uma constante) e na ausência de campo elétrico, a equação de movimento será: m dv y dt = mg − krv y e integrando dv y kr m vy − g = dt ou vy ∫ −v+ 0 t dv y gm kr m dt kr 0 =∫ (15) 13 de onde tiramos: − v + gm / kr m = t gm / kr kr de modo que finalmente, a variação da velocidade com o tempo é dada por: Vy = gm m 1 − exp − t kr kr (16) Assim, analisando o movimento na ausência de campos, determinamos a velocidade terminal Vt = g g 4 m = πr 3 ρ onde ρ é a densidade do óleo. kr kr 3 Fig. 5 - Velocidade da gotícula como função do tempo O conhecimento de vt permite a determinação do raio r da gotícula. Após esta medida, ligamos o campo elétrico e ajusta-se o valor de Eo (através da voltagem) até que a gotícula não mais se desloque. Neste caso, a força elétrica foi compensada pela força gravitacional e a força viscosa desaparece, já que o movimento foi interrompido. 4 E 0 q = πr 3 gρ 3 ou seja: 4 r 3 ρg q= π 3 E0 (17) 14 hvt Da velocidade terminal que medimos previamente tiramos r = 4 3 πρg 1 2 de modo que a carga da gotícula é : 1 3 3 2 vt 2 k q = E0 4πρg 2 3 (18) As constantes envolvidas ( ρ e k) podem ser determinadas de formas diversas e simples, permitindo assim a obtenção de q. Fazendo várias determinações, Millikan obteve valores como: 8.2 x 10-19C, 11.49 x 10-19C, 13.13 x 10-19C, 16 x 10-19C, 6.4 x 10-19C, notando que a diferença entre qualquer um destes valores era um número inteiro vezes o valor 1.6 x 10-19C. Assim, ele concluiu que a menor carga capaz de estar ali era: e = 1.6 x 10-19 C e que todas outras eram múltiplos desta quantidade. Desta forma esta carga foi associada ao elétron, e passou a ser a carga elementar. Com o conhecimento de e, podemos voltar ao resultado de Thonson e determinar que a massa do elétron é: m = 9.1 x 10-31 kg O conhecimento dos constituintes atômicos e de suas propriedades foram fundamentais para o estabelecimento da Física Moderna. III.4 - Introdução à Teoria Cinética dos Gases No século 19, as idéias atomísticas adquiriram bastante aceitação, pois descreviam bem as propriedades cinéticas dos gases e apresentavam ramificações na mecânica estatística e a outras partes da Física. As propriedades que inicialmente foram explicadas, considerando o gás como constituído de átomos e moléculas, eram totalmente insensíveis à existência de uma estrutura interna nestas entidades. A visualização dos átomos como esferas duras, 15 preenchia totalmente as necessidades básicas para explicar a cinética dos gases. Esta idéia do átomo perdurou consideravelmente na atomística do século 19. A primeira constatação de que os gases eram constituídos de átomos ou moléculas foi feito por L. Dunoyer em 1811. Em seu experimento esquematizado na fig. 6, sódio metálico foi colocado no fundo de um tubo evacuado contendo duas repartições com pequenos orifícios. Fig. 6 - Experimento de Dunoyer Após algum tempo de aquecimento do metal, observou-se no outro extremo do sistema a imagem do segundo orifício. Este experimento proporcionou todas as indicações que os constituintes do vapor metálico eram partículas que projetavam-se balisticamente. Após a conclusão de que o gás é constituído de partículas cujo comportamento é balístico, partiu-se para a obtenção das equações de estado de um gás ideal à partir das leis básicas da mecânica. Para isto, imaginemos um recipiente que contenha um determinado gás e fixemos nossa atenção nas colisões que as moléculas deste gás realizam com uma determinada porção da superfície. Nestas colisões, há transferência de momentum dos átomos para a superfície. A média temporal destas colisões é que gera a força que por unidade de área é conhecida como pressão do gás sobre as paredes. A contribuição de cada átomo que colide com a superfície para a pressão do gás, é igual à mudança do momentum do respectivo átomo (ou molécula) com o impacto. Consideremos uma molécula de velocidade v colidindo com a superfície segundo um 16 ângulo Θ como a fig. 7, onde mostramos o ângulo e o elemento de superfície de valor dA. Supondo uma reflexão total do átomo na superfície, temos que o momentum transferido para cada átomo (molécula) que colide é dado por: ∆ρ = 2mv cos Θ Vamos chamar de x, y as coordenadas ao longo da superfície e z a coordenada normal à superfície. Fig. 7 - Colisão de uma molécula com a parede. Neste caso, havendo reflexão total, o momentum transferido pode ser escrito como: ∆ρ = 2mv z (20) onde m é a massa de cada molécula e a velocidade é escrita como: v = (v x , v y , v z ) . Somente a componente perpendicular à superfície é que contribui para a transferência de momento. Para considerarmos o efeito de todas as colisões sobre a parede, construímos um cilindro oblíquo sobre o elemento de área dA, como mostrado na figura 8. 17 Fig. 8 - Elemento de volume que contém as moléculas que colidirão Se quisermos analisar todas as moléculas que colidem com o elemento de área durante um intervalo de tempo ∆t, tomamos a aresta do cilindro contendo v∆t, de modo que todas as moléculas propagando-se de encontro com a superfície que estejam contidas no cilindro, colidirão, no intervalo ∆t. Se o gás que estamos considerando, tem uma densidade n, o número total de molécula no interior do cilindro considerado é n x volume = n.v ∆t cos Θ dA. Assim, no. moléculas = nvz ∆tdA Este, evidentemente, é o número total de moléculas contidas neste elemento de volume. Não sabemos nada a respeito de como elas estão distribuídas com respeito a sua velocidade. Vamos, então, introduzir um novo conceito que é a densidade de partículas no espaço de velocidades. Assim, vamos chamar de g o número de átomos por unidade de volume, com velocidades entre vx e vx + dvx, vy e vy + dvy, vz e vz + dvz. Assim, g corresponde à densidade de átomos no espaço real e no espaço de velocidades. Com este novo conceito, a densidade de partículas (n) nada mais é do que uma soma sobre as várias possíveis velocidades, ou seja: ∞ ∞ −∞ −∞ n = ∫ dv x dv y dv z = ∫ gdw (21) onde dw = dvx dvy dvz = d3v denota um elemento de volume no espaço de velocidades. O número total de partículas contidas num volume V, seria uma integração em volume e velocidade, ou seja: 18 ∞ N = ∫ gdwdxdydz −∞ (22) onde gdvxdvydvz = número de moléculas com velocidades no intervalo [vx - vx + dvx, vy + dvy, vz - vz + dvz]. Supondo que todas as partículas no interior do cilindro com velocidade entre (vx, vy, vz) e (vx + dvx, vy + dvy, vz + dvz) atingirão a superfície, o número de moléculas colidindo no tempo ∆t é: (no. em ∆t) = gvz ∆tdwdA (23) Isto é, de todas selecionamos agora aquela fração que tem velocidade ao redor de vz. Como já sabemos, a contribuição de cada molécula para o momento transferido é dado por: dp = 2vzm (no. em ∆t) vx, vy, vz ou seja, como ∆ t → dt, dp = 2mgvz2dAdwdf (24) Assim, este momentum é a contribuição de moléculas com velocidade ao redor de (vx, vy, vz). É claro que para garantirmos a colisão devemos requerer que a molécula esteja se aproximando da superfície, o que nos restringe a considerar somente as moléculas com vz < 0. Se quisermos o momentum transferido devido às moléculas com as várias diferentes velocidades teremos que somar todas as contribuições, ou seja: ∫ dp = ∫ p = 2m ∫ gv dw∆tdA todasvelocidades v z∠ 0 ∫ ∫ v∠ 0 z v x v y 2 z 2mgv z2 dAdv x dv y dv z (25) Vamos aqui fazer um pequeno parênteses para introduzir o conceito de velocidade média. Como dissemos, g representa a quantidade de moléculas por volume e por 19 velocidade. Assim, g depende da velocidade que estamos considerando e quanto maior é seu valor, maior é o número de moléculas existentes com aquela determinada velocidade. Definimos os valores médios das velocidades quadráticas como: 2 vz = 1 ∞ 2 gv z dv x dv y dv z n ∫−∞ (26) ou de um modo geral, para qualquer componente de velocidades, 2 vi = Isto advém do fato que g 1 ∞ 2 gvi dw n ∫−∞ dw = ρ (vi ) que é a probabilidade da partícula ter (vx, vy, vz) no n intervalo dw, de modo que a soma vi2 P (vi) representa o valor médio da velocidade. Como g é uma função par ∫ ∞ −∞ gvi2 dw = 2 ∫ vi∠ 0 gvi2 dw , de modo que a expressão para o momento total transmitido à superfície é dada por: p = nm 2 2 gv z2 dwdA∆t n ∫vz ∠ 0 (27) 2 que usando definição de v z fica, p = nmv z ∆tdA . Como p é a pressão total sobre a superfície P, temos que: ∆tdA 2 P = nmv z que é uma expressão que conecta uma grandeza macroscópica (pressão) com as propriedades microscópicas de seus constituintes. 2 Ainda não sabemos o valor de v z , mas se usarmos o fato que o gás é perfeitamente isotrópico de modo que todas as direções são equivalentes, para o movimento atômico, temos que; 20 2 2 2 vx = v y = vz e como 2 2 2 2 2 1 2 v = vx + vy + vz → vz = v 3 (28) Assim, em termos da velocidade quadrática média, a pressão do gás é dada por: nmv P= 3 2 e se usarmos a definição de energia cinética K c = P= (29) 2 1 mv para uma única molécula, temos: 2 2 nK c 3 (30) A equação acima mostra claramente que a pressão é resultado do fato que as moléculas do gás apresentam movimento translacional (ou seja, energia cinética). Além disto, a comparação deste resultado com a lei dos gases ideais, já conhecido, nos permite obter uma definição cinética para a temperatura de um gás. Como sabemos, n = N , o que nos permite escrever a equação acima na forma: V PV = 2 NK c 3 (31) Se compararmos esta expressão com a famosa lei de Clapeyron PV = NKT obtida experimentalmente, vemos que: Kc = 3 KT 2 onde K é a constante de Boltzmann (K = 1.38 x 10-16 ergs/K) e T a temperatura na escala absoluta. Esta relação nos mostra que a temperatura de um gás nada mais é senão uma 21 medida direta da energia cinética de cada um dos seus constituintes. É claro que estamos tratando da energia cinética média. Esta definição é conhecida como definição cinética da temperatura. Notemos que o fator numérico 3 adveio do fato de estarmos tratando de um gás em três dimensões de modo que tivemos que repartir 1/3 da velocidade quadrática média para cada dimensão e para cada uma destas coube a parte ½ KT . Este resultado, de uma forma mais geral, é chamado de teorema de eqüipartição de energia, e estabelece que para cada grau de liberdade da energia com dependência quadrática no momento ou na coordenada, deveremos alocar ½ KT de energia, quando este sistema está em equilíbrio térmico à temperatura T. No caso do gás livre em questão a energia é dada por: 2 p x2 p y p2 + + z E= 2m 2m 2m de modo que temos três graus de liberdade quadráticos no momento (px, py, px) e, portanto, a energia média das partículas deste gás está relacionada com a temperatura pela relação: 1 3 1 3 E = 3 x KT = KT E = 3 x KT = KT 2 2 2 2 O teorema de eqüipartição de energia é bastante importante em Física e mereceria um capítulo a parte, por esta razão este tópico deverá ser considerado em maiores detalhes em cursos mais avançados. Para fixar melhor este conceito, vamos considerar alguns exemplos. Imagine um corpo ligado a seis molas flexíveis como indicado na fig. 9. Queremos saber a relação entre a energia média e a temperatura. 22 Fig. 9 - O Oscilador tridimensional Escrevendo a energia do sistema temos: E= 2 p x2 p y p2 1 1 1 + + z + kx 2 + ky 2 + kz 2 2 m 2m 2m 2 2 2 Assim, temos seis graus de liberdade com dependência quadrática para a energia total do 1 sistema. Deste modo, E = 6 KT = 3KT . 2 Um segundo exemplo está mostrado na figura 10. Duas massas conectadas por uma mola flexível tem liberdade de deslocar-se ao longo do eixo x. Fig. 10 - Massas acopladas, livres para deslocar na direção x Neste caso, todo movimento do sistema pode ser escrito em termos de duas coordenadas: o centro de massa X CM = x rei = x1 + x 2 e a coordenada relativa entre as massas 2 x1 − x 2 . A energia do sistema é, então: 2 E= p x2CM 2µ + p2 1 2 kx rei + rei 2 2µ 23 onde µ = m é a massa reduzida. A existência de 3 graus de liberdade quadrática na 2 energia faz que 1 3 E = 3 KT = KT 2 2 Caso este sistema possa se deslocar espacialmente, então o momento do centro de massa representa 3 graus (Px, Py, Pz) de modo que E = 5 KT . 2 Voltando ao caso do gás de partículas livres, com relação a relação da energia cinética, podemos calcular a velocidade média de seus constituintes. Seja gás He cuja massa molar é 4g. Assim, a temperatura ambiente (298 K) 2 2 1 3 1 4 3 mv = KT ⇒ v = 1.38 x10 −16 298 23 2 2 2 26.02 x10 2 de onde tiramos 2 v ≅ 1360m / s como sendo a velocidade média dos átomos de hélio à temperatura ambiente. Se tivermos, por exemplo, gás argônio que é da ordem de 10 vezes mais pesado que He, teremos um fator de 10 na velocidade, ou seja 2 v ~ 430 m/s. Se considerarmos o ar que respiramos, que é basicamente constituído Ar de N2, teremos um fator de 7 , já que a massa molecular deste composto é 28. Isto nos leva à: 2 v ≅ 514m / s N2 que é muito superior à velocidade do som no ar (340m/s). Assim, as perturbações sonoras (à 298 K) propagam-se com velocidade inferior à média das moléculas. Vamos imaginar um número No (de Avogadro) de moléculas contidas num recipiente. Neste caso, sendo o gás ideal, a energia interna do sistema é a soma da energia cinética de todas as moléculas, já que este é o único tipo de energia presente. 24 U = N0 3 KT 2 (33) Como NoK = R é a constante dos gases a energia total do sistema é dada por: U= 3 RT 2 Com esta expressão podemos calcular o calor específico a volume constante para este Mol de gás e temos: 3 dU Cv = = R dT r 2 (34) Como R ~ 2cal/Mol, tiramos Cv ~ 3cal/MolK. Como será visto uma quantidade importante em termodinâmica é a razão entre Cp (valor específico à P constante) e Cv. Utilizando a relação Cp - Cv = R (35) tiramos: Cp R Cp R −1 = ⇒γ = = + 1 ≅ 1.66 Cv Cv Cv Cv O valor 3 cal/Mol K para o calor específico, vale somente para o gás ideal. Olhando para os valores experimentais do calor específico de alguns gases rais, podemos observar um desvio deste valor. 25 Tabela 1 – Dados a 300 K Os gases monoatômicos apresentam a capacidade térmica bastante próxima do valor ideal calculado. No entanto, ao passarmos para gases constituídos de dois átomos o valor não mais concorda. Aumentando-se o número de átomos, o valor ce Cv fica ainda mais longe do valor calculado. A razão desta discrepância advém primordialmente de termos tratados moléculas com mais átomos como sendo um sistema rígido sem energia interna. A idéia discutida acima deve ser levemente modificada quando tratamos de moléculas poliatômicas. É claro que o número de átomos na molécula não altera grandemente a lei dos gases que relaciona pressão, volume e temperatura, já que somente a translação da molécula é importante na determinação da pressão. O número de átomos na molécula não altera grandemente este modelo. Ao tratarmos moléculas poliatômicas, além das moléculas poderem apresentar energia na forma de energia cinética translacional, elas podem também alocar energia para vibrações e rotações. Isto equivale a dizer que o número de graus de liberdade da molécula aumentou. Pelo teorema da eqüipartição de energia, temos que alocar ½ KT para cada termo da energia com dependência harmônica, i.e. quadrática, em momento ou coordenada. Vamos considerar uma molécula diatômica a qual visualizaremos como sendo duas massas separadas por uma mola. Semelhante ao exemplo da fig. 10, porém, agora com movimento tridimensional. 26 Fig. 11 - Modelo para molécula diatômica Além das três translações possíveis (ao longo x, y, z) do centro de massa, o sistema pode agora rodar ao redor de dois dos três eixos principais, produzindo termos de energias do tipo 1 l x ω x2 2 e 1 l z ω z2 2 como se fosse um rotor rígido. Isto corresponde à adição de 2 graus de liberdade ao sistema, que agora passa a ter 5 graus. Como a energia térmica é igualmente distribuída nestas possibilidades, 1 5 U = 5 x KTN 0 = N 0 KT 2 2 ou U= 5 RT 2 e obtemos para o calor específico 5 dU Cv = = R dT v 2 (Cv)diatômica ~ 5cal/molK quando translação e rotação são consideradas. (devido a rotação) 27 Além da rotação, ainda temos que considerar os graus de liberdade vibracionais x2 1 2 que no caso são 2 (energia vibracional = m + Kx ). Isto levaria a um total de 7 graus 2 2 de liberdade ou E = 7 KT . 2 Se fizermos um gráfico do calor específico (Cv) versus temperatura para um gás diatômico, por exemplo o H2, obtemos o gráfico da figura 12. Fig. 12 - Variação do calor específico de um gás diatômico com a temperatura Mesmo tratando-se de uma molécula diatômica, para baixas temperaturas, o calor específico tem valor próximo das 3cal/molK encontrado para um gás monoatômico. As mais altas temperaturas, Cv assume seu valor 5cal/molK que é calculado quando levamos em conta as rotações e finalmente para mais altas temperaturas o valor é 7cal/moIK, que é o valor encontrado quando rotação e vibrações são levadas em conta. O comportamento mostrado tem por razão que as baixas temperaturas a energia térmica não é suficiente para realizar rotações ou vibrações das moléculas e a energia é predominante acumulada nos graus de liberdade translacionais. Ao atingirmos temperaturas moderadas (500 K) a energia rotacional passa a ser compatível com KT e, portanto, este grau de liberdade começa a reter energia. Somente as temperaturas mais 1 elevadas é que KT passa a ser da ordem da energia de vibração Kx 2 e o sistema 2 passa a realizar vibrações, e neste caso, este grau de liberdade passa também a ser excitado, acumulando energia. Cada tipo de excitação da molécula tem seu valor característico de energia, e sua manifestação só ocorre quando KT passa a ser compatível a este valor. 28 Este resultado aproxima-se bastante dos valores experimentais medidos para moléculas diatômicas a 300 K mostrados na tabela 1. À medida que aumentamos o número de átomos da molécula, aumentamos simultaneamente o número de graus de liberdade, aumentando, portanto, o calor específico como observado com a molécula de éter mostrada na tabela. III.5 - A Distribuição de Velocidade nos Gases Ao analisarmos a equação dos gases ideais, dissemos brevemente que as moléculas de um gás devem ter velocidades diferentes obedecendo certa distribuição. Assim, para cada valor de velocidade que tomamos temos associado a ele um número (ou densidade) de moléculas. Como este valor varia continuamente, dizemos que temos uma distribuição continua de velocidades. Para o cálculo da maioria das propriedades macroscópicas que já mencionamos (pressão, energia, etc), não precisamos conhecer esta distribuição explicitamente, pois tais grandezas dependem sempre de valores médios de velocidade e energia. No entanto, em muitos casos, o conhecimento da distribuição se faz necessário. Assim seja a distribuição Nƒ(vx) mostrada na fig. 13 para um gás contido num determinado volume. Fig. 13 - Distribuição de velocidades Vamos analisar este exemplo a fim de ficarmos familiarizados com o conceito de distribuição de velocidades. Esta distribuição nos diz que teremos nenhuma molécula com velocidade nula e, à medida que aumentamos o valor da velocidade, encontramos mais moléculas até a velocidade de 500 m/s onde o número encontrado para esta velocidade máxima (=100) e 29 a partir desta velocidade o número novamente cairá chegando a 10 moléculas com velocidade 1000 m/s, e caindo ainda mais para mais altas velocidades. No presente caso, Nƒ(vx)dvx representa o número de moléculas com velocidades ao redor do valor vx, ou seja, com velocidade entre vx e vx + dvx. O número de moléculas com velocidade em cada intervalo dvx dividido pelo número total de moléculas é uma medida da probabilidade de uma dada molécula ter velocidade no intervalo considerado. Assim, p (v x → v x + dv x ) = f (v x )dv x ∫ f (v x )dv x . Se quisermos saber a velocidade média desta distribuição, teremos que somar todas as velocidades com seus respectivos pesos relativísticos, ou seja: v= ∫ v f (v )dv ∫ f (v )dv x x x x (37) x onde fica mais evidente que ƒ(vx) é na verdade a probabilidade de encontrarmos vx. Qualquer grandeza ς (vx) dependente de velocidade que queiramos calcular o valor médio pode ser calculado da mesma forma que a velocidade, ς= ∫ ς (v ) f (v )dv ∫ f (v )dv x x x x (38) x O cálculo do valor médio das grandezas microscópicas de um gás é extremamente importante, pois estes são os valores que efetivamente medimos macroscopicamente. Em muitos casos ∫ f (v )dv x x = 1 , ou seja, a função distribuição é normalizada. Vamos mantê-la integrando explicitamente. A análise que fizemos acima em somente um componente da velocidade, deve ser generalizada incluindo as 3 componentes vx, vy e vz para representar a realidade de um gás. Mas quem é afinal a função ƒ (vx)? O procedimento matemático que usaremos a seguir para obter a distribuição de velocidades num gás ideal foi originalmente usada por Maxwell em 1860. Seja um gás formado por N moléculas, contido num recipiente de paredes rígidas. Tomemos uma determinada molécula que apresenta velocidade V com componentes vx, 30 vy e vz. Se perguntarmos quantas moléculas apresentam velocidade cujo componente x cai entre os valores vx e (vx + dvx) a resposta seria Nƒ (vx) dvx, de modo que ƒ(vx) dvx é exatamente a probabilidade que, ao tomarmos uma molécula, ela tenha vx no intervalo considerado. Como o gás não pode ter uma direção preferencial já que as moléculas movem-se de uma forma aleatória e todas as direções são igualmente prováveis, a mesma dependência funcional ƒ(vx) deve ser encontrada ao analisarmos o número de moléculas com determinado valor de velocidade para outras componentes. Ou seja, a probabilidade de velocidades entre vy e vy + dvy e vz e vz + dvz serão também representadas por ƒ(vy)dvy e ƒ(vz)dvz, tendo, portanto, a mesma dependência funcional ƒ. Assim, se perguntarmos qual é a probabilidade de encontrarmos uma molécula com velocidade cujas componentes caem entre vx → vx + dvx, vy → vy + dvy e vz → vz + dvz teremos que multiplicar os valores mencionados acima (como normalmente é feito com probabilidades), ou seja: ƒ(vx) ƒ(vy) ƒ(vz) dvx dvy dvz é a probabilidade de uma molécula ter vetor velocidade V com sua extremidade localizada dentro de um cubo de volume dvxdvydvz e centrado no valor V , como esquematizado na fig. 14. Fig. 14 - Espaço de velocidades mostrando o vetor V e o volume dvxdvydvz Chamando este elemento de volume, no espaço de velocidades de dw = dvxdvydvz e, usando a isotropia da distribuição de velocidades de modo que o que deve diferenciar a 31 probabilidade das moléculas é o valor absoluto da velocidade e não a direção, podemos escrever a equação acima como: F (v) dw (40) onde F(v) é agora uma nova função que só depende do módulo da velocidade e deve ser igual ao produto dos ƒ definido na primeira equação. Assim ( ) F v x2 + v y2 + v z2 = f (v x ) f (v y ) f (v z ) (41) Esta última equação foi obtida apenas utilizando a isotropia do gás e o problema para determinar sua dependência funcional explicita passa a ser puramente matemático. Inicialmente tomemos a derivada da equação acima com respeito à vx, obtendo vx v x2 + v y2 + v z2 F ' (v ) = f ' (v x ) f ' (v y ) f ' (v z ) (42) e ao dividirmos (42) por (41) v x F ' (v ) f ' (v x ) = v F (v ) f (v x ) (43) 1 F ' (v ) 1 f ' (v x ) = v F (v ) v x f (v x ) (44) ou seja Nesta última equação, o primeiro termo só depende de v enquanto o segundo só de vx. Isto poderia ter sido feito para qualquer das componentes vy e vz e obteríamos o mesmo resultado. A única forma desta última equação ser verdadeira para quaisquer valores de v e vx, é ser igual a uma constante que chamaremos, por convivência, de − 2γ . Assim: 32 1 f ' (v x ) = −2γ v x f (v x ) (45) e através de uma simples integração, obtemos: df = −2γv x dv x f e, integrando, tiramos: f (v x ) = e α e −γv x , onde eα é a constante de integração. 2 Chamando eα = A, a equação toma a forma f (v x ) = Ae − rvx , que é uma Gaussiana 2 centrada na origem. Com isto obtemos que a distribuição F (vx, vy, vz), através de (41), F (v x , v y , v z ) = A3 e −γv x e 2 − γv 2y e −γv z 2 (46) como v x2 + v y2 + v z2 = v 2 , (46) torna-se: F (v ) = A3 e −γv 2 (47) Como discutimos anteriormente esta função F (v) dw representa a probabilidade de encontrarmos num gás uma molécula com velocidade cujo módulo seja v flutuando ao seu valor no interior de um cubo de valor dw no espaço das velocidades. Se multiplicarmos pelo número total de partículas do gás teremos quantas moléculas apresentam o valor da velocidade com esta característica. A fim de determinarmos a constante γ , vamos calcular o valor médio da velocidade vx e utilizarmos o que já conhecemos de v x . ∞ ∞ −∞ −∞ v x = ∫ v x f (v x )dv x / ∫ f (v x )dv x 33 que resulta, obviamente em v x = 0 como esperado, pois já que todas as direções são igualmente prováveis, o mesmo número de moléculas deverão estar deslocando-se na direção +x e -x com o mesmo valor de vx, resultando numa média nula. 2 Vamos, então, calcular v x . Neste caso: v 2 x ∫ = ∞ v f (v x )dv x 2 −∞ x ∞ ∫ −∞ f (v x )dv x e utilizando as expressões acima ∞ A∫ v x2 e −γv x dv x 2 x v = A integral do tipo ∫ +∞ −∞ ς e 2 − rς 2 2 −∞ A∫ e −γv x dv x 2 π dς = γ 1/ 2 pode ser facilmente executada, e derivando com respeito a γ , tiramos ∫ +∞ −∞ ς e 2 −γς 2 1 π 1/ 2 dς = 2 γ 3/ 2 Assim, usando estes resultados 2 vx = π 1/ 2 / γ 3 / 2 1 1 = 2γ π 1/ 2 / γ 1/ 2 1 2 e do teorema de eqüipartição de energia, já discutido anteriormente para o gás ideal, 2 1 1 mv x = KT 2 2 ou seja, 1 11 1 m m = KT ⇒ γ = 2 2γ 2 2 KT (48) 34 A determinação da constante A pode ser feita do fato que ƒ(vx) dvx representa a probabilidade de encontrar a molécula com vx entre vx e vx + dvx, de modo que a soma sobre todas possíveis velocidades deve fornecer a unidade, ou seja: ∫ ∞ −∞ π A γ 1/ 2 f (v x )dv x = 1 γ =1→ A = π 1/ 2 ou m A= 2πKT 1/ 2 Assim, com todas estas determinações, nossa função distribuição fica m F (v ) = 2πKT 3/ 2 1 mv 2 exp − 2 KT (49) Esta expressão é conhecida como função distribuição de velocidade de Maxwell. Fig. 15 - elemento de volume no espaço de velocidades Como vimos, é de extrema importância mantermos a notação vetorial através das componentes vx, vy e vz. Se, ao invés deste vetor velocidade quisermos estudar a distribuição de velocidade em termos de seu valor absoluto v, devemos considerar o fato que todas as direções são igualmente prováveis e, portanto, o elemento de volume dw a ser estudado deverá ser uma casca esférica de raio v e espessura dv (no espaço de velocidades com eixos vx, vy e vz), como indicado na fig. 15. Desta forma estaremos levando em conta todas as possíveis direções. O elemento de volume dw representado tem valor dw = 4πv 2 dv e, portanto, se perguntarmos, agora, qual é a probabilidade de encontrarmos, no gás considerado, uma 35 molécula com velocidade de valor absoluto (ou módulo) entre v e v + dv independentemente de sua direção, encontraríamos: m 2πKT φ (v ) = 4πv 2 3/ 2 e − 2mvKT2 (50) ou seja, φ (v )dv = 4πv 2 dvF (v ) = F (v )dw Evidentemente, para esta nova distribuição que encontramos, o valor de v só pode variar de zero até + ∞. Esta nova distribuição não é mais Gaussiana. O gráfico desta distribuição está mostrado na fig. 16. Fig. 16 - Distribuição Φ (v) Utilizando esta distribuição, podemos calcular o valor mais provável da velocidade (vm) que é aquele presente num número maior de moléculas. Como ele corresponde ao máximo da distribuição, seu valor pode ser determinado por: dφ (v ) =0 dv 2v 5 − 2v 3 m = 0 ⇒ vm = 2 KT 2 KT m O valor médio da velocidade ( v ), é calculado como já discutido (51) 36 v=∫ ∞ 0 m vφ (v )dv = 4π 2πKT m = 4π 2πKT 3/ 2 2/3 1 2(m / 2 KT ) 2 ∫ ∞ 0 v 3e − 2mvKT2 dv = (52) 2 KT = v = 1,12 m Da mesma forma podemos determinar a velocidade quadrática média (vrms) v rms m = v = 4π 2πKT v rms 2 KT = 1,22 m 2 1/ 2 ∫ ∞ 0 v 4e − 2mvKT2 dv (53) Com esta função, o valor médio de qualquer grandeza η (v) que depende da velocidade é: ∞ η (v ) = ∫ η (v )φ (v )dv (54) 0 Devido às contribuições apreciáveis de Boltzmann, a distribuição é denominada de distribuição de Maxwell-Boltzmann. Como visto, a distribuição de Maxwell-Boltzmann depende da temperatura, e a medida em que T aumenta, o valor de vm aumenta. Porém, o valor da distribuição naquele ponto diminui, conservando a propriedade ∞ ∫ φ (v )dv = 1 . 0 Assim, quanto maior a temperatura, mais espalhada é a distribuição de velocidades, ou seja, maior é a dispersão da distribuição. Fig. 17 - Distribuição a diferentes temperaturas 37 Ao invés de perguntarmos a respeito da distribuição de velocidade, podemos estar interessados diretamente na distribuição com respeito à sua energia. Para o caso do gás ideal, a velocidade e energia das partículas estão relacionadas através da relação. E= 1 2 mv 2 de modo que podemos converter diretamente a distribuição de velocidades para energia. A probabilidade de encontrarmos uma molécula com velocidade no intervalo v → v + dv é φ (v)dv, assim, a probabilidade de encontrarmos uma partícula com energia entre E e E + dE é: m φ (E )dE = 4π 2πKT 3/ 2 2 E − E / KT dv e dE m dE onde convertemos o elemento 4πv 2 dv em energia, sendo: dv d (2 E / m )1 / 2 = 1 2 = dE dE 2 mE 1/ 2 resultando em: 4π m φ (E )dE = 2 2πKT 3/ 2 2 m 3/ 2 E 1 / 2 e − E / KT dE ou seja: φ (E ) = 2π (πKT ) 3/ 2 E 1 / 2 e − E / KT Usando esta distribuição, podemos calcular a energia média E do gás, ∞ E = ∫ Eφ (E )dE 0 ou seja 38 E= e usando a integral ∫ ∞ 0 x n e ax = 2 2π (πKT ) ∫ 3/ 2 ∞ 0 E 3 / 2 e − E / KT dE Γ(n + 1) com Γ sendo a conhecida função gamma, tiramos a n +1 E= 3 KT 2 como previsto pelo teorema de eqüipartição de energia. Este último resultado não é dedução do teorema, já que utilizamos na determinação do valor de γ e, portanto, o resultado acima já era esperado. III.6 - Derivação Barométrica da Distribuição de Velocidades de Maxwell A dedução que fizemos anteriormente é baseada em considerações sobre a teoria de probabilidades e a isotropia do gás considerado. Podemos, no entanto, deduzir a distribuição de Maxwell de uma forma alternativa através da observação da variação da pressão do gás com a altitude quando o gás está na presença do campo gravitacional, aqui considerado como sendo homogêneo e com temperatura uniforme. Denominemos de zero a superfície da terra e tomemos a atmosfera como sendo um gás contínuo de densidade mássica ρ = nm. Se tomarmos uma determinada camada de gás localizada à posição z e de espessura dz, esta camada estará sujeita às pressões p(z+dz) e p(z) cuja diferença é equilibrada pelo peso da camada, ou seja: dp = - ρ gdz = nmgdz como n = P , tiramos que KT − dP mg = dz P KT ou mgz P = p (o ) exp − KT que é equivalente à (considerando temperatura homogênea): 39 n(z) = n(o)e-mgz/KT É claro que este é um caso específico de uma situação mais global, onde as moléculas estão sujeitas a uma energia potencial V(z) quando localizadas em (x, y, z). De modo que a expressão mais geral tem a forma: n(z) = Ce-v(z)/KT A dedução barométrica da distribuição de velocidades ƒ(vz), consiste no seguinte: a existência de uma distribuição de velocidades na posição z = 0 levaria ao estabelecimento de um perfil de densidades n(z), quando os átomos sobem contra a gravidade em movimento balístico. O modelo está representado na figura 18. Para simplificar o problema, imaginemos inicialmente o gás como sendo unidirecional, movendo-se somente na direção vertical. Neste caso, uma molécula partindo da posição z = 0 com velocidade vo, atingiria a altura z = v02 / 2g retornando a z = 0 onde sofrerá uma colisão totalmente elástica. Fig. 18 - Distribuição de velocidades na superfície da terra, na direção z. As mais rápidas são lançadas até alturas maiores e as mais lentas a alturas menores, gerando um perfil de densidade. Se todas as moléculas tivessem a mesma velocidade v0, teríamos uma densidade que cairia abruptamente a zero em z = v02 / 2g, além do fato que a temperatura diminuiria linearmente, já que a velocidade diminuiria com z, atingindo T = 0 em Z = v02 / 2g (pois v 2f = v02 − 2 gz e T ( z ) = T (o ) − 2 gm z ) evidentemente isto não acontece, mostrando a 2 existência de uma distribuição de velocidades. Vamos chamar ƒ (vo) a distribuição de velocidades dos átomos deixando a superfície. O número de partículas que deixa a 40 superfície com velocidade entre v0 e v0 x dv0, por unidade de área e tempo (fluxo) é dada por: fluxo = dN = n( z = 0 )v 0 f (v 0 )dv0 = densidade(v0 ).v0 A∆t Estas partículas terão sua máxima altura entre v02 /2g e (vo + dvo)2 / 2g. O número de partículas passando pelo plano zo = v02 / 2g é dado por n(zo) v (zo) por unidade de tempo e área. Da mesma forma, o número de partículas cortando plano localizado em zo + dzo por unidade de tempo e área é: n(zo + dzo) v (zo + dzo) A velocidade média das moléculas v , só depende da temperatura por hipótese, não dependendo de z, de modo que v (zo) = v (zo + dzo). A variação do fluxo de partículas entre as duas superfícies é: diferença fluxo = dN = [n( z 0 ) − n( z 0 + dz 0 )]v = átomos que conseguem atingir posição A∆t entre Zo e Zo + dZo − dn mg v = −v dz 0 = n(o )e dz 0 KT mgz0 KT dz 0 onde já utilizamos n(z) obtido anteriormente. Substituindo dN , pelo valor calculado, obtemos a igualdade: A∆t n(o )v0 f (v0 )dv0 = mg v n(o )e −mgz0 / KT dz 0 KT Como mgzo = mv02 / 2 tiramos mvodvo = mgdzo e, portanto: 41 2 z mv − 12 mv e KT f (v0 ) = KT (56) que é a forma unidimensional da distribuição de Maxwell 2 z mv − 12 mv e KT f (v z ) = KT onde o coeficiente é evidentemente uma constante que só depende da temperatura. Se tivermos uma distribuição de Maxwell em z = 0, teremos para todos pontos z. No modelo que fizemos as colisões entre as moléculas nada afetam, já que em uma dimensão o resultado da colisão elástica é uma simples inter-troca de velocidade e como as partículas são indistinguíveis, esta colisão não altera em nada o modelo apresentado. Uma pergunta natural que surge, é: como que a velocidade média pode ser independente da posição, se a energia cinética das moléculas continuamente diminui à medida que elas sobem? A resposta para esta pergunta é bastante simples. Lembremos que para o cálculo da velocidade média todas as partículas, com suas velocidades são levadas em conta. Quando uma distribuição emerge da superfície sujeita ao campo gravitacional, as partículas mais lentas não atingem as alturas mais altas, enquanto que as mais rápidas diminuem de velocidade mantendo, assim, a velocidade média que só depende da temperatura e não de z. Esta também é a razão pelo qual há variação da densidade sem variar a distribuição de velocidades. III.7 - Colisões entre as Moléculas do Gás e o Caminho Livre Médio Como vimos, as moléculas dentro do gás possuem um movimento desordenado sofrendo várias colisões com as paredes e também com as demais moléculas do gás, já que estas não são pontuais. Se pudéssemos fotografar a trajetória de uma molécula durante um determinado intervalo de tempo, encontraríamos uma trajetória tortuosa composta de segmentos retilíneos de comprimentos diferentes. Cada um destes segmentos corresponde ao intervalo do trajeto no qual a molécula desloca-se sem a influência das demais moléculas ou das paredes do recipiente que as contém. Nos vértices desta trajetória (pontos de encontro de cada dois segmentos) há ocorrência de 42 uma colisão mudando consideravelmente a trajetória. A existência destes pontos revela a influência das demais moléculas sobre o movimento de uma delas. A interação entre as moléculas do gás pode ser atrativa ou repulsiva e tem um potencial que varia de acordo com o tipo de interação existente em cada caso. Para uma primeira análise do problema os detalhes da interação podem ser deixados de lado e vamos considerar as moléculas como esferas rígidas de diâmetro d. A primeira pergunta que fazemos é: Qual é o número de colisões sofridas por uma molécula por unidade de tempo, dentro do gás? Fig. 19 - Trajetória tortuosa de uma molécula num gás Seja uma partícula de diâmetro d e velocidade v deslocando-se no interior de um gás constituído de partículas idênticas apresentando uma densidade n (partículas/volume), veja figura 20. Fig. 20 - Uma partícula de diâmetro d colidirá com todas contidas no cilindro Quando a partícula desloca-se em linha reta ela colidirá com todas as outras partículas cujos centros de massa encontram-se a uma distância menor ou igual a d da sua linha de deslocamento. Se estivermos considerando um ∆t, a molécula original desloca-se em média uma distância v ∆t e colidirá com todas as demais partículas contidas dentro do volume do cilindro de base de diâmetro 2d e altura v ∆t. Mesmo que 43 após cada colisão haja mudança da trajetória podemos alinhar todos os segmentos da fig. 20, criando uma trajetória linear. Assim: no. de colisões médias em ∆t = πd 2 v∆t (densidade) no. de col em ∆t = πd 2 v∆tn e, portanto, o número médio de colisões por unidade de tempo no. de col. / tempo = πd 2 vn (57) A quantidade πd 2 que representa a área frontal de colisão é chamada de secção de choque σ . no. de colisões / tempo = nσ v (58) Para conhecermos o tempo médio entre duas colisões consecutivas ( τ ) temos que inverter a expressão acima, obtendo: τ −1 = nσ v (59) Sendo τ o tempo médio decorrido entre duas colisões consecutivas, então a distância média percorrida pelo átomo entre duas colisões consecutivas l é, portanto: l =τv ⇒ l = 1 nσ (60) Este comprimento médio, que representa o espaço percorrido entre duas colisões consecutivas é denominado de livre caminho médio e, como vimos, para um gás constituído de moléculas que são consideradas esferas rígidas de diâmetro d, o livre caminho médio é: l= 1 πd 2 n (61) 44 que é independente da temperatura e só depende do tamanho das moléculas (d) e da densidade (n), ou da secção de choque e da densidade. O caminho livre médio é importante para nos dar uma idéia da ordem de grandeza da distância que a molécula consegue percorrer sem que ocorra influência das demais. Este parâmetro é de extrema importância para o transporte de massa e de energia pelo gás. Como estimativa numérica, consideremos o gás hélio à temperatura ambiente e pressão atmosférica. Pela lei dos gases ideais, podemos determinar que a densidade é, neste caso, n = 2.7 x 1019 átomo/cm3 e se tratando de um átomo cujo diâmetro é igual a d ≅ 2.2 Å, temos l= 1 1 1 = ~ 2.5 x 10-5 cm 2 −16 2 πd n 15.2 x10 cm 2.7 x1019 ( )( ) mostrando que o caminho livre médio é cerca de 1000 vezes o tamanho atômico. Para esta temperatura v ~ 105 cm/s de modo que o tempo entre colisões pode ser determinado resultando em: τ ~ 10-10 sec Este é o tempo decorrido entre colisões consecutivas. A duração da colisão poderia ser estimada se tomarmos ∆t ' ≅ d 2,2 10 −8 = ~ 2.2 1013 seg, ou seja, 0.22 v 10 5 pico/segundos. Sendo a duração da colisão tão curta, fica difícil o estudo do que ocorre durante seu decurso. É preciso usar técnicas modernas de pulsos curtos de luz ou átomos lentos aprisionados para melhorar nosso entendimento sobre detalhes do encontro atômico. O caminho livre médio é um parâmetro bastante importante para as propriedades de transporte de um sistema gasoso, como veremos mais adiante. O tempo τ , normalmente chamado de tempo de relaxação, mostra que τ frequência de colisão. No caso acima o gás apresenta 10 10 -1 éa colisões/seg. A secção de choque σ pode ser determinada a partir de experimentos de espalhamento, o que constitui uma importante técnica de medida para tamanhos atômicos 45 e caminho livre médio. Para entendermos este tipo de medida, vamos analisar uma determinada situação física. Consideremos um feixe molecular propagando-se por uma região que contém moléculas de uma outra espécie (Fig. 21). Quando as moléculas do feixe colidem com as moléculas do gás sua trajetória normal é modificada e elas são defletidas para fora do feixe original. Desta forma, à medida que o feixe propaga-se através do gás, a sua intensidade (I) molecular (i.e, o número de moléculas por unidade da área e por unidade de tempo) diminui devido às moléculas defletidas para fora. Analisando o decaimento da intensidade deste feixe molecular ao longo de sua propagação podemos aprender muito a respeito das colisões e do caminho livre médio e, conseqüentemente, do tamanho das moléculas. Seja o experimento na figura 21, onde átomos (ou moléculas) do feixe são espalhados pelo gás contido na região A, e a intensidade do feixe é medida pelo detector D. Fig. 21- Espalhamento de um feixe Considerando o feixe como constituído de partículas de diâmetro d, e o mesmo para as partículas do alvo A. Se a densidade do alvo é n, e S é a área do feixe (área transversal), o número de partículas incidentes sobre o alvo por unidade de tempo é lS que, ao propagar-se por uma distância ∆x no gás passa por nS∆x moléculas do alvo (I é a densidade do feixe). Como cada átomo apresenta uma secção choque πd 2 que é uma área efetiva de colisão, ao percorrer a distância ∆x, cada molécula do feixe colidirá com toda do gás no seu caminho, ou seja, de modo análogo ao que fizemos anteriormente. no. colisões / molécula no feixe = πd 2 n∆x Como existem I(x)S moléculas / tempo incidindo, 46 no. colisões / tempo = I(x)S πd 2 n∆x (62) Tomando que em cada colisão um átomo do feixe é defletido, a diminuição de número átomo do feixe/tempo ao passar pela fatia ∆x de gás é a diferença do fluxo de entrada e saída, ou seja: l ( x + ∆x )S = −l ( x )S = −lSπd 2 n∆x l ( x + ∆x ) − l ( x ) = −lπd 2 n ∆x e, tomando limite ∆x → 0 e σ = πd 2 n , tiramos a equação mestra do espalhamento dl = −lσn dx (63) de onde, por integração, tiramos que a intensidade do feixe decresce da forma: l ( x ) = l 0 e −σnx após propagar uma distância x no gás. Como l = l (x ) = l0 e (64) 1 σn −x l Fig. 22 - Reflexão de moléculas do feixe ao percorrerem a distância ∆x (65) 47 Assim, medindo o fluxo de partículas do feixe após percorrerem o gás e graficando seu logaritmo versus x, conforme a fig. 23, tiramos o livre caminho médio e, conseqüentemente, a secção de choque ou o tamanho d das moléculas. Fig. 23 - Determinação do livre caminho médio III.8 - Efusão de um Gás por um Orifício Uma das importantes aplicações da teoria cinética dos gases é o escape de um gás por um orifício de um recipiente que contém gás a uma determinada pressão. Seja um pequeno orifício (muito menor do que as dimensões do sistema) feito na parede de um recipiente que contém um gás. Sendo as dimensões do orifício pequenas comparadas com as dimensões dos recipientes, o equilíbrio existente no gás não é grandemente afetado pela presença do orifício. Neste caso, o número de partículas que emerge do orifício é exatamente o mesmo número que colidiria com a área ocupada pelo orifício. Este processo é denominado de "efusão" do gás, veja figura 24. Fig. 24 – Efusão Consideremos um recipiente contendo gás a uma pressão P, temperatura T e densidade n. Queremos calcular o fluxo (molécula/área tempo) que emerge por um orifício 48 de área A. A fim de calcular este número vamos tomar um elemento de área dA e achar o número de moléculas colidindo neste elemento por unidade de tempo. Como já dissemos anteriormente este será o número que emerge se ao invés de parede sólida houvesse ali um orifício de mesma área. Consideremos, inicialmente, as moléculas nas vizinhanças do elemento dA. De todas moléculas contidas nesta vizinhança, esperamos que aquelas que se movem na direção da superfície colidirão com ela. Assim, vamos fazer um simples modelo que consiste em tomar aquelas moléculas que deslocam-se com velocidade média v na direção da superfície. Durante um tempo dt, todas aquelas moléculas contidas num cilindro de área de base dA e altera v dt colidirão. Como a densidade do gás é n e em média somente 1 6 delas deslocam-se contra a superfície, temos que o número de moléculas que colidem com dA no tempo dt é 1 6 nvdt.dA e, portanto, o fluxo de moléculas que emergirão do orifício de área dA é: n o molecular 1 = nv dAdt 6 Este cálculo é, no entanto, apenas uma aproximação pois para sermos mais exatos deveremos levar em conta a distribuição de velocidades e integrar sobre todo o hemisfério interior do recipiente. Os detalhes de cálculo ficarão como exercício ao leitor e o resultado exato que se encontra é: Φ0 = 1 nv (partículas / área tempo) 4 (66) para o fluxo emergente pelo orifício. Este fluxo, no caso da parede ter espessura muito menor do que o diâmetro do orifício é uniformemente distribuído em todo o hemisfério externo do orifício e em cada direção temos a distribuição de Maxwell para a velocidade. Com a relação dos gases perfeitos e o valor de v para uma distribuição de Maxwell, podemos escrever a relação acima como: Φ0 = p 2πmKT (67) 49 Uma aplicação geral que podemos fazer da efusão é a determinação de vazamentos em sistemas de vácuo ou pressurizados, apenas acompanhando a evolução temporal da pressão. Analisaremos esta aplicação como exercício. III.9 - Propriedades de Transporte de um Gás Existem várias propriedades do sistema gasoso que são de interesse prático e que dependem das propriedades cinéticas dos gases. Entre inúmeras destas propriedades vamos iniciar analisando a condução térmica, fenômeno pelo qual um gás é capaz de transportar energia de um ponto a outro. A fim de estudarmos este fenômeno e determinarmos a capacidade de um gás em transportar energia, vamos considerar um sistema que não está em equilíbrio térmico, de modo que partes diferentes podem estar a temperaturas diferentes. Embora em não equilíbrio, vamos manter o sistema num estado estacionário, de modo que a configuração térmica das várias partes do sistema não são alterados com o passar do tempo. Por exemplo, consideremos um gás em contato com dois reservatórios à temperaturas T1 e T2, como mostrado na figura 25. Para o caso onde T1 > T2, haverá um fluxo de energia do reservatório 1 para o reservatório 2 e este transporte energético é, evidentemente, feito através das moléculas do gás. As moléculas entrando em contato com o reservatório 1, Fig. 25 - Condução térmica através de um gás aumentam sua temperatura ficando mais energéticas, ou seja, elas emergem de 1 com velocidade maior do que quando entraram. Através de colisões com demais partículas esta energia vai sendo transferida às demais partes do sistema até atingir o reservatório 2 que receberá esta energia transportada pelo gás. A força motriz para este transporte de energia é a diferença de temperatura entre as duas partes. A situação física descrita tem como fluxo de energia transferido a conhecida equação: 50 J = − K T ∇T = energia / (tempo . área) (68) ou seja, a energia fluirá oposta ao gradiente de temperatura, e a constante de proporcional idade é denominado de condutividade térmica (KT) do sistema. Nosso trabalho aqui é determinar o valor desta constante (KT) a partir do que conhecemos sobre os gases. Como vimos, a menor distância que a molécula consegue caminhar sem alterar seu estado energético é o caminho livre médio I. Assim, vamos considerar dois planos imaginários no interior do gás, separados por Ix (projeção do caminho livre médio na direção x). Num dos planos as moléculas apresentam energia U1 e no outro U2. Chamaremos de A a área dos planos em questão (veja fig. 26). Fig. 26 - Sistema para análise do transporte de energia em um gás Se as moléculas passam da posição x para a posição x + Ix com uma velocidade média v x e gastam ∆ t neste trajeto, sendo n a densidade do gás e cv o calor específico (energia / massa grau), temos que a energia transportada de x à x + Ix em ∆t é: ∆Q = (quantidade massa) x cv x ∆T ou seja, ∆Q = Anv x ∆tc v ∆T A variação de temperatura entre as posições consideradas pode ser escrita como: ∆T ≅ l x dT , dx e ∆Q =J A.∆t (fluxo de calor) 51 tiramos que dT dx J = ncv l x v x (69) Comparando a equação (69) com a lei de fluxo de calor visto anteriormente, equação (68) J = −KT dT dx obtemos que a condutividade térmica do gás é K T = ncv l x v x (70) Temos agora que determinar Ix v x em termos de I e v . Como Ix = I cos Θ e vx = v cos Θ (Note que aqui x fará o papel do eixo z em coordenadas esféricas), temos que 0< Θ <π /2 x/2 lxvx 2π ∞ 0 0 ∫ ∫ ∫ = 0 / cos 2 ΘF (v )v 2 senΘdΘρdv π /2 2π ∞ 0 0 0 ∫ ∫ ∫ F (v )dw = lv 2π ∫ π /2 0 cos 2 ΘsenΘdΘ 2π π /2 0 0 ∫ ∫ senΘdΘdρ 1 lx vx = lv 3 Fig. 27 - Sistema de coordenadas para cálculo de lxvx 52 (Nota: tivemos que normalizar, dividindo pela integral, pois agora só estamos trabalhando com um hemisfério do gás). Assim, a condutividade térmica é: energia.comp. grau.área.tempo 1 K T = ncv l v 3 que como vemos, é proporcional as várias grandezas relevantes para o transporte de energia, como era esperado, já que o aumento de quaisquer destas grandezas leva a um aumento na eficiência do transporte de energia. Além da condutividade térmica, outra propriedade de transporte bastante importante é a viscosidade do gás. A viscosidade está associada com a capacidade do gás em transmitir quantidade de movimento. Assim, seja o gás contido entre duas placas paralelas separadas pela distância ∆y (fig. 28). Fig. 28 - Arraste devido à viscosidade do meio Se colocarmos a placa superior em movimento, devido ao movimento transferido através do gás, a placa inferior também tenderá a entrar em movimento (arraste). A fim de manter a placa inferior em repouso é necessário imprimir a ela uma força, que por unidade de área é denominada de tensão de cisalhamento ( τ ). Esta tensão de cisalhamento deverá, obviamente, ser proporcional à ∆v (diferença de velocidade entre placas) e inversamente proporcional a ∆y (separação das placas), já que quanto maior for a velocidade, maior deve ser o arraste e quanto mais separadas as placas, menor será o arraste. Com isto podemos escrever: τ∞ ∆v ∆y 53 A constante de proporcionalidade da expressão acima é denominada de viscosidade do gás (η), e a equação acima é convenientemente escrita como: τ = −η dv dy (73) Assim, a viscosidade está relacionada com o poder que o fluido tem em arrastar corpos em contato com ele, ou mesmo camadas sucessivas do próprio fluido. Nosso trabalho agora é determinar η em termos das propriedades microscópicas do gás. Da mesma forma que procedemos na condutividade térmica, consideremos duas camadas do gás separadas pela distância Iy (projeção do caminho livre médio na direção y), veja figura 29. A camada superior desloca-se com velocidade vx + ∆vx e a inferior vx. Fig. 29 - Sistema para cálculo da viscosidade Se considerarmos um intervalo de tempo ∆t, a quantidade de momentum na direção x transferido ao passarmos gás de uma posição para outra é ∆px = (massa total) ∆vx = mAvy∆t∆vx onde a massa total considerada é a massa transferida da posição y para y+dy. Sendo n a densidade em número, mn a densidade de massa. Como: ∆v x ≅ l y dv x dy tiramos, ∆p x = − mnAv y l y ∆t dv x dy 54 de onde obtemos: τ= ∆p x dv = − mnv y l y x A∆t dy ( ) 1 e como já vimos que v y l y = lv , obtemos: 3 1 3 τ = − ml v dv x dy (74) que comparado com a equação fornecida anteriormente fornece para a viscosidade 1 3 η = nml v Assim, a viscosidade de um gás é diretamente proporcional à m, n, I e v . Uma outra interessante propriedade dos gases é a difusão segundo a qual massa é transportada através do gás. Para determinar o coeficiente de difusão de um gás, consideremos inicialmente a lei que relaciona o fluxo de massa com a variação de concentração em uma dimensão: J x = −D dn dx sendo D o chamado coeficiente de difusão. Semelhante aos casos de transporte de calor e momento, considere duas posições do gás separados por Ix entre os quais há uma diferença de concentração (ver fig. 30). Fig. 30 - Difusão entre duas regiões de concentração diferentes 55 O fluxo de massa sendo transportado do ponto de maior para o de menor concentração é: J = n( x )v x − n( x − l x )v x = −[n( x + l x ) − n( x )]v x = −l x dn vx dx 1 tirando a média, l x v x = l v e, comparando com a lei de difusão, o coeficiente D relaciona3 se com os parâmetros microscópicos: 1 D = lv 3 (76) o que significa que quanto maior for I e v , maior será a difusão. III.10 - Transporte de gás carregado eletricamente por uma rede de pontos: uma aplicação da cinética dos gases para condutividade elétrica dos metais. Ao considerarmos um gás que interage com campos externos, além de seu movimento aleatório, podemos ter um modelo simples para a condução eletrônica nos metais e outros importantes sistemas. Num metal, os elétrons podem ser vistos como as partículas de um gás sujeito a colisões com pontos fixos (pontos da rede). O fluxo eletrônico entre dois pontos quaisquer é normalmente zero. Porém, caso um campo elétrico seja aplicado ao sistema, o fluxo resultante não será mais nulo. O fluxo de carga resultante (chamado de densidade de corrente J ) cresce linearmente com o campo aplicado, estabelecendo a chamada lei de Ohm; J = σ E . Queremos determinar σ (condutividade) a partir de parâmetros microscópicos. Do fato de que os elétrons nos metais estão fracamente ligados aos seus átomos de origem, permite visualizar o material como sendo um gás de elétrons embebendo os íons positivos, e aplicar a este "gás" tudo o que conhecemos da cinética dos gases para obtermos informações a respeito das propriedades de transporte elétricos do sistema. 56 Ao juntarmos átomos de um determinado metal para formarmos o sólido, os elétrons de valência do sólido tornam-se praticamente livres enquanto os demais elétrons do átomo permanecem firmemente ligados ao núcleo. Assim, um metal constituído de átomos com zA elétrons de valência contribuirão para a condução os z elétrons/átomo enquanto os demais zA - z elétrons contribuem praticamente em nada para esta propriedade de transporte. Seja um metal com densidade mássica ρm e massa molecular A, a quantidade de moles/cm3 no metal é ρm A e a densidade de elétrons "condutores" será: n = 6,022 x10 23 Z ρm (77) A Cada elétron ocupa, em média, uma esfera de raio γ s, dada por: 1 4π 3 3 = γs →γs = n 3 4πn 1/ 3 Alguns exemplos estão listados a seguir: n(1022/cm3) γ s(Å) Na 2,65 2,08 Au 5,90 1,59 Fé 17,0 1,12 Bi 14,1 1,19 Como podemos ver a densidade do gás de elétrons nos metais são milhares de vezes maiores do que nosso convencional gás ideal a condições normais de pressão e temperatura. Apesar disto, e apesar da forte interação colombiana elétron-elétron e elétron-íon, vamos aplicar as leis da cinética de um gás neutro e diluído, iniciemos fazendo as seguintes suposições: 1) Não há interação elétron-elétron ou elétron-íon entre colisões. A interação só se manifesta durante a colisão do elétron com os íons de rede permanecendo em trajetória 57 linear entre colisões, período no qual são válidas as leis da mecânica para a interação elétron-campo, desprezando-se totalmente qualquer outra interação durante este período. A interação elétron-elétron pode ser abandonada na chamada aproximação dos elétrons independentes, enquanto o abandono da interação elétron-íon é chamado de aproximação de elétron livre. 2) No modelo que estamos adotando as colisões ocorrem instantaneamente mudando abruptamente a velocidade do elétron, sem alterar grandemente a velocidade dos íons da rede que são, evidentemente, muito mais massivos que os elétrons. 3) Vamos considerar que o tempo médio entre colisões é dado por τ , de modo que a frequência de colisão é I/ τ . Isto significa que, em média, um elétron sofrerá uma colisão e, após um determinado tempo τ , uma outra. Assumiremos que τ seja independente da posição e velocidade do elétron. 4) Finalmente, supomos que em cada colisão o elétron atinge equilíbrio térmico com sua redondeza. Isto nos leva a utilizar o fato que após cada colisão o elétron emerge do centro de colisão com uma velocidade que independe daquela que ele tinha inicialmente, dependendo somente da temperatura local do centro de colisão. Com estas suposições, a visão microscópica que temos da condução de elétrons num condutor está esquematicamente representada na figura 31: Fig. 31 Para o elétron, o sólido nada mais é senão uma coleção de centros de colisão que modificam sua trajetória e lhe fornece nova velocidade após cada colisão. Entre colisões o movimento é balístico e o elétron está sujeito somente à ação do campo externo. 58 Vamos inicialmente imaginar um campo estático E aplicado no sistema. Se uma determinada densidade n de elétrons movem-se com velocidade v , numa determinada direção, o fluxo de corrente gerado é: J = +nq v onde q é a carga dos portadores. Se não temos campo aplicado, o elétron que é termicamente excitado colide com os íons da rede, determinando uma trajetória desordenada que leva à: < v >=0 Na presença do campo, após cada colisão temos que adicionar a v o termo q Et m que corresponde à velocidade que o campo imprimiu a carga após a colisão de modo que v(t ) = v + q Et m (79) e a velocidade média entre colisões é, portanto: v med = < v > + v med = q E <t> m q Eτ m (80) independendo da velocidade com que o elétron emerge do centro, pois esta é aleatoriamente distribuída. Como j = nq v med , já que a densidade de corrente é uma manifestação macroscópica da resposta a efeitos microscópicos do sistema, temos que: j= nq τE m (81) 59 mostrando que a densidade de corrente é linear com o campo aplicado (Lei de Ohm) e a constante de proporcionalidade é a condutividade elétrica σ σ= nqτ m σ = nqµ µ= qτ = mobilidade m (82) que é o chamado modelo de Drude para a condutividade. A constante τ é normalmente chamada de tempo de relaxação e pode ser determinada a partir da medida experimental de σ e do suposto conhecimento das demais constantes. Normalmente τ ~ 10-14 – 10-15 3 1 sec. Se considerarmos a velocidade térmica dos elétrons, mv02 ~ KT determinada 2 2 para a temperatura ambiente vo ~ 107 cm/s, o que nos leva a um caminho médio entre colisões da ordem de 1 a 10 Å consistente com nossa suposição de que os elétrons colidem com os íons da rede é razoável. Um caso de bastante interesse é a resposta do sistema sujeito a campos magnéticos estáticos. Antes de tratarmos este caso, vamos considerar os portadores neste meio colisional sujeito a uma força externa F (t ) qualquer. Sendo I/ τ a taxa de colisão, a probabilidade de que um elétron sofra uma colisão entre t e t + dt é dt τ e, dt portanto, a probabilidade de que ele não sofra colisão entre t e t + dt é 1 − . τ Assim, se em t o momento do portador é p (t), em t + dt será dado por (para elétrons que não colidiram) [ dt p (t + dt ) = 1 − p (t ) + F (t )dt τ ] (83) onde o termo em [ ] representa a evolução de p para o portador sujeito a uma força externa F (t). O termo multiplicativo inicial representa a probabilidade da não ocorrência de colisão, pois caso haja colisão, todo momentum adicionado pela força é distribuído. Expandindo a expressão acima, retendo somente termos lineares em dt, obtemos: d p (t ) p (t ) =− + F (t ) dt τ (84) 60 Isto mostra um resultado muito importante, o efeito de colisões individuais de cada elétron é o de introduzir dissipação de movimento para o sistema. Esta equação é geral e mostra a evolução temporal de um sistema sujeito à força externa e a relaxação, simultaneamente. Vamos aplicar este resultado num caso de bastante interesse, quando um condutor conduzindo corrente é colocado na presença de um campo magnético estático H . Este efeito é conhecido como efeito Hall. III.11 - Efeito Hall como Aplicação da Equação Geral de Transporte Imaginemos a situação onde um condutor sujeito a um campo Ex, como mostra a figura 32, é colocado num campo Hz. O campo magnético tenta defletir as cargas em movimento criando um acumulo de cargas positivas de um lado e negativas no outro lado que promove o aparecimento de um campo Ey. A força sobre os portadores, neste caso, é: p F (t ) = q E + xH mc (85) e, portanto, a equação de movimento da carga neste caso será: p dp p = qE + xH − dt mc τ Fig. 32 - Efeito conjugado de campos elétricos e magnéticos num condutor (86) 61 Se imaginarmos que o sistema já passou pelo período transiente e atingiu o estado estacionário dp = 0 . Obtemos, então, o sistema: dt px qE x + ω c p y − τ = 0 qE + ω p − p y = 0 c x y τ onde ω c = (87) qH nqτ . Multiplicando as equações acima por e usando jx = nqvx, tiramos ( ω c mc m é a frequência ciclotron): σ 0 E x = −ω cτj x + j x σ 0 E y = ω cτj y + j y onde σ 0 = nq 2τ é a condutividade de Drude já determinada. m Quando as cargas atingem as faces jy = 0 , assim podemos determinar: ω τ E y = c σ0 H j x = jx nqc definindo uma importante quantidade conhecida como o coeficiente de Hall RH RH = Ey j xH = 1 nqc (88) Um importante fator na determinação experimental deste coeficiente está na dependência com q, o que pode revelar o tipo de portador responsável pela condução do material em questão, já que RH é sensível ao sinal de q. 62 III.12 – Gases Reais e Forças Intermoleculares1 Toda teoria cinética de gases que desenvolvemos até aqui considera as partículas constituintes dos gases como sendo pontos materiais que carregam momentum e que podem trocar esta quantidade de movimento com as demais partículas ou com as paredes do recipiente que as contém. Em algumas situações imaginamos as moléculas como sendo esferas duras (tipo bolas de bilhar) e pudemos determinar com este modelo o número de colisões por unidade de tempo, o caminho livre médio e, através destes conceitos, determinamos as propriedades de transporte mais importante para o gás. O gás que estudamos até agora obedecem a lei dos gases ideais PV = NKT, segundo a qual o volume de cada molécula ou a existência de interação entre eles não se manifesta e nem é importante. Tanto que as variáveis P e V na equação acima são permitidas terem qualquer valor de 0 a ∞. Mas qual é o significado de V = 0 quando sabemos que as moléculas apresentam por si só um volume? Isto mostra que existe um limite mínimo para a compressão do gás. Quando levamos em conta a existência de forças intermoleculares bem como o tamanho finito das moléculas denominamos o gás como sendo imperfeito ou real. Neste caso, a equação de estado difere um pouco do estado ideal. É claro que a manifestação do caráter não ideal dos gases, depende muito em que condições este se encontra. Normalmente em regimes de altas densidades a interação intermoleculares, bem como o efeito de volume finito das moléculas manifesta-se de forma bem mais marcante. Esperase, no entanto, que a lei dos gases ideais continue válida para baixas densidades. Assim, é esperado que a lei dos gases ideais apresente correções que deverão tornar-se irrelevantes para N/V → 0. Podemos, então, escrever 2 PV N N = 1 + B' + C' + ... NKT V V (89) onde N é o número total de partículas no volume V. Quando estamos tratando com 1 mol de gás, a equação é escrita como: P .V B (T ) C (T ) =1+ + + ... RT V V2 1 Baseado no livro: A Estrutura Quântica da Matéria – J. Leite Lopes (90) 63 onde B(T), C(T) são denominados de segundo e terceiro coeficiente do Virial. Observase que B(T) é negativo para todos os gases à baixas temperaturas. Ao aumentarmos a temperatura, B aumenta tornando-se positivo. A temperatura para qual B = 0 é denominada de temperatura de Boyle. Vamos tratar o gás de uma forma simples (embora a equação (90) seja mais geral) e obter a equação de estado. Devido ao volume finito das moléculas, esperamos que 3 4 d lim V = b = π N p→∞ 3 2 com d = diâmetro molecular. Desta forma, a primeira correção que podemos fazer na equação dos gases ideais é que P(V-b) = NKT ou seja, quando p → ∞, V → b. Imaginamos, agora, que exista uma certa atração entre as moléculas. Se olharmos para uma molécula próxima da parede do recipiente, veremos que o efeito da interação com os vizinhos é o de efetivamente diminuir a interação da molécula com a parede, diminuindo efetivamente a pressão do gás. Fig. 33 – Interação de moléculas com vizinhos O efeito da interação deverá ser maior no decréscimo de pressão quanto maior for a densidade n, pois neste caso as partículas estarão mais próximas. Sendo um efeito de interação de pares esperamos que a correção seja proporcional a n2. Assim, vamos dizer 64 que o termo de correção é proporcional a l/V2 e a constante de proporcionalidade será denominada de a, ou seja, P = NKT a − 2 V −b V de modo que a P + 2 (V − b ) = NKT V (91) que é denominada de equação de Van der Waals para um gás real. A dedução da equação de Van der Waals pode ser feita através de uma aproximação que consiste na utilização do teorema do virial. Antes de iniciarmos a dedução propriamente dita, vamos relembrar alguns resultados mais gerais da mecânica. Consideremos uma partícula de massa m sujeito a uma força F temos, então: F = m x&& Através do produto escalar com sua posição x ( ) ( ) m x&&.x = F .x Como 2 d2 2 x = 2 x .x&& + 2 x& 2 dt como ( x .x&& ) = temos que m d2 2 x − m x& 2 = F . X 2 dt 2 1 x2 − x& 2 2 dt 2 65 Como o estado macroscópio de um gás não muda com o passar do tempo quando este gás está em equilíbrio, o centro de massa do sistema não deve alterar sua posição. Assim, podemos escrever a seguinte equação: 2 d ma x A = 0 ∑ dt A (92) onde a soma deve ser feita sobre todas as moléculas do gás. Multiplicamos (93) por 1 1 e tomando derivadas, obtemos: N2 1 1 d d N 2 dt dt ∑m A A 2 1 xA = N ∑m A x& A2 + A 1 N ∑ F .x A (93) A e como, da equação (93), o primeiro membro é zero, decore que para cada molécula, < 2 1 1 mv >= − ( F .x ) 2 2 (94) i.e., a energia cinética média das moléculas de um gás em equilíbrio é igual a média do produto escalar da força pela posição das moléculas com sinal trocado. Vamos utilizar este resultado para deduzirmos a equação de Van der Waals. Imaginemos um gás onde a força exercida sobre uma molécula A devido a interação com (i ) as demais moléculas, é representada por F A . Podemos ainda ter uma força externa (e) F A agindo sobre esta molécula. Pelo resultado da equação (94), ( ) ( 1 1 1 m A v A2 = − ∑ x A .F A( i ) − ∑ x A .F A( e ) ∑ 2 A 2 A 2 A ) Vamos admitir que as forças intermoleculares sejam do tipo: i FA = ( xA − xB ) F ( r AB ) r AB B≠A ∑ c/ r AB = x A − xB 66 Como estamos somando sobre todos pares para efetuar a soma ∑x (i ) A FA , A podemos deslocar a origem para B, de modo a ficar ∑x A FA (i ) = A como ( x A − xB ) r ab ∑r AB F ( r AB ) . Assim, A,B está na direção da linha entre A e B, assumindo que a origem de coordenadas esteja sobre A, temos xA . ( xA − xb ) = rA = B rAB (95) de modo que podemos escrever : 1 2 ∑m A 2 A vA = − 1 2 ∑r AB F ( r AB ) − AB 1 2 ∑x (e ) a .F a (96) A Pelo teorema de eqüipartição de energia, as N moléculas apresentam uma energia N 3 KT . Como esta energia é o primeiro termo da equação, temos: 2 (e) 3 NKT = −∑ rAB F ( rAB ) − ∑ x A .F A AB (97) A A força externa F(e) pode ter sua origem nas paredes do recipiente, originando uma pressão sobre o gás. Se P é a pressão do gás, n o vetor unitário normal à superfície, de modo que n ds representa o elemento de área em cada ponto, a força exercida pelo elemento de área será – P n ds, ou seja: 67 − ∑ x A .F A = P ∫ ( x .n )ds (e) A (98) S onde S = área do recipiente. Usando o teorema do divergente, expressão (98) torna-se: = P ∫ ( ∇.x )d 3 x = 3 P .V (99) V 3 pois ∇.x = 3 , e V = ∫ d x é o volume do recipiente. Assim, 3NKT = 3PV − ∑ rABF ( rAB ) AB ou PV = NKT + 1 3 ∑r AB (100) F ( rAB ) AB que corresponde à equação de estado do gás real no caso onde a interação molecular tem a forma de força central. Nesta formulação o gás perfeito é aquele onde F(rAB) = 0. A soma dos termos de força da equação acima podem ser, em média, escritas como: ∑r AB AB F ( r AB ) = 1 N ( N − 1 ) < rF > 2 Cada uma das N moléculas interage com (N-1) e para não contarmos duas vezes o mesmo par, temos que o número total de pares interagindo é 1 N ( N − 1 ). Mas como N 2 23 é muito grande (~10 ), 1 1 N( N − 1 ) ≅ N 2 2 2 de modo que ficamos com uma equação dada por pV = NKT + 1 2 N < rF > 2 (101) 68 Assim, para calcularmos a correção do gás ideal devido a interação molecular temos que conhecer F(r) e calcularmos a média < rF >. Se a energia potencial de interação entre duas moléculas for U(r), a probabilidade de que duas moléculas estejam separadas dentro da distância r→r+ dr (probabilidade de pares) é obtida da mecânica estatística, como sendo: f ( r )dr = 4π − U ( r ) / KT r 2 dr ∫e − U ( r ) / KT d3X de modo que este será o “peso estatístico” no cálculo do valor médio de rF. Como F =− dU , o valor médio < rF > pode ser escrito como: dr dU dr dr − U ( r ) / KT 3 d X ∫e ∞ < rF >= − 4π ∫ e −U ( r ) / KT r 3 0 0 Vamos denominar I = ∫ e −U ( r ) / KT d 3 x de modo que ficamos com pV = NKT − Como 1 2 4π N 6 I ∫ ∞ e −U ( r ) / KT r 3 0 dU dr dr d −U ( r ) / KT 1 −U ( r ) / KT dU e =− e multiplicando e dividindo por KT, teremos: dr KT dr pV = NKT + 1 2 4π N KT 6 I ∫ ∞ 0 r3 ( ) d e −U ( r ) / KT dr dr ou seja: 2 πN pV = NKT 1 + 3 I ∫ ∞ 0 r3 ( ) d −U ( r ) / KT e dr dr (102) mostrando a equação de estado de um gás imperfeito, como função do potencial de interação entre as partículas. 69 Vamos, inicialmente, considerar o caso do chamado potencial de esfera dura, como mostra a fig. 34. Fig. 34 – Potencial de esfera dura 0 r > d U (r ) = ∞ r < d de modo que e −U ( r ) / Assim, ∫ ∞ 0 KT 1 r > dd = 0 r < d r 3 d ( e −U ( r ) / KT = d 3 , e I = V, tomando a expressão anterior fica: 2 N PV = NKT 1 + π d 3 3 V Se chamarmos b = 2 πN ( d )3 , obtemos: 3 b PV = NKT 1 + V ou seja: PV b 1 + V = NKT 70 Quando b << 1, V 1 1+ b V ≅1 − b e obtemos como aproximação V P (V − b ) = NKT (103) O potencial que tomamos neste exemplo, representa o fato de na realidade as moléculas apresentarem um volume finito, e o efeito disto na lei dos gases ideais é a alteração do valor do volume à disposição para as moléculas como na equação de Van de Waals. Além de apresentar um volume finito, que representa uma forte interação a curtas distâncias, existe uma interação à longa distância que embora pequena, tem um efeito considerável na equação de estado. Consideremos, então, um potencial atrativo mostrado na figura 35. U( r ) ≅ − B , B>0 rn (104) com a observação explicita que lim U(r) = 0 r→∞ Assim, a interação de (102) fica: 2 N π 3 VKT ∫r 3 e −U / KT dU a dr = − dr NKTV ( a >0 ) ou seja, pV = NKT − a V 71 Fig. 35 – Potencial combinado de atração-repulsão Vamos melhorar o modelo introduzindo um potencial que combina ambos potenciais vistos anteriormente, ou seja: ∞ U ( r ) = − W − B n r com a condição W << 1 , e − W / KT KT 2 N π 3 I r <d d < r < r0 (105) r < r0 ~ 1 obtemos: ∫ ∞ 0 r 3 ( e − U ( r ) / KT )dr ≅ b a − V NKTV b a PV = NKT 1 + − V V que para b << 1 , pode ser escrita como V a P + 2 (V − b ) = NKT V (106) que é a equação de Van der Waals, mostrando que realmente a correção na pressão deve-se à interação de longo alcance entre moléculas e a correção no volume deve-se ao volume finito apresentado pelas moléculas. 72 As constantes a e b são normalmente denominadas de constantes de Van der Waals onde b é determinado através do diâmetro molecular e a através da lei de força de atração entre moléculas. Para determinadas temperaturas podemos fazer gráficos de P vs V, obtendo as curvas que são denominadas de isotermas. Para altas temperaturas as isotermas de Van der Waals são bem parecidas com as hipérboles que obtemos com a lei dos gases ideais. No entanto, à medida que atingimos baixas temperaturas as isotermas começam a apresentar desvios chegando ao caso onde elas apresentam máximos e mínimos. A transição de um comportamento para outro ocorre quando o máximo e o mínimo coincidem. Neste caso, temos no diagrama de isoterma uma linha horizontal tangente a ponto de inflexão. A temperatura onde ocorre o ponto de inflexão é denominada de temperatura crítica (Tc) e P e V para este determinado ponto são denominados de valores críticos Pc e Vc. Fig. 36 – Isotermas P x V para gás real A existência do ponto crítico denota a ocorrência de mudança de fase no sistema o que existe apenas para sistemas de gases reais. O gás de Van der Waals é uma primeira aproximação realística dos gases prevendo a formação de um líquido. Detalhes maiores deste tipo de efeito deverão ser abordados num curso de Mecânica Estatística. 73 III.13 – A Teoria Cinética e o Movimento Browniano Vamos imaginar a situação física, onde uma partícula está presente num meio viscoso podendo realizar um movimento desordenado. Este é, por exemplo, o caso de uma molécula dce soluto em solução de uma molécula gasosa num gás estranho ou de uma minúscula partícula sólida num líquido (veja fig. 37). Fig. 37 – Movimento browniano Neste caso, a chamada equação de movimento para a referida partícula de soluto é dada por: m dv =− { βv + { F (t ) dt vis cos a aleatória A força F(t), aleatória advém de colisões com outras partículas. A equação acima é chamada de equação de Langevin e estamos interessados em conhecer o deslocamento quadrático médio desta partícula neste meio. A equação acima pode ser escrita como: d m ( xv ) − v 2 = − βxv + xF ( t ) dt tornando a média temporal, tiramos : m d xv − m v 2 = − β xv dt 74 onde usamos o fato que a força F(t) é aleatória e, portanto, F ( t ) = 0 . Da teoria cinética, temos que 1 1 m v 2 ~ KT 2 2 de modo que m 1 d xv = KT − β xv dt d 2 resolvendo para xv = 2 dt x , tiramos x2 = β − t 2 KT m m t − 1 − e β β Para tempos curtos, a exponencial pode ser expandida até ordem t2 e, desta forma, obtemos para o deslocamento médio quadrático. x2 ≅ Para t << m β KT β t2 , o termo entre parênteses desaparece e ficamos com outra dependência temporal para x 2 : x2 ~ 2 KT β t Na teoria de difusão obtém-se como solução da equação de Fick que o deslocamento quadrático médio está relacionado com o coeficiente de difusão através de: 〈x2〉 = 2Dt de modo que obtemos para o coeficiente de difusão: 75 D= KT β mostrando que o coeficiente de difusão neste caso depende da agitação térmica dos constituintes e da capacidade do soluto em perder energia através do processo viscoso. Este sistema físico, discutido acima, é normalmente chamado de movimento Browniano, originalmente observado para partículas em suspensão por Robert Brown (1827). Este movimento foi profundamente analisado por Einstein que mostrou ser devido às constantes colisões aleatórias que as moléculas de um meio exercem sobre outra. Uma importante característica deste movimento é que o percurso percorrido por uma partícula devido ao processo de difusão é: L2 dependência esta, bastante usada em física. ∝t Universidade de São Paulo Instituto de Física de São Carlos Departamento de Física e Ciência dos Materiais FÍSICA MODERNA ELEMENTAR CAPÍTULO IV INTEGRAÇÃO DO CAMPO ELETROMAGNÉTICO COM O SISTEMA ATÔMICO AUTORES: PROF. DR. VANDERLEI SALVADOR BAGNATO PROF. DR. LUIS GUSTAVO MARCASSA São Carlos, Junho 1999 2 CAPÍTULO IV INTERAÇÃO DO CAMPO ELETROMAGNÉTICO COM O SISTEMA ATÔMICO IV.1. INTRODUÇÃO Neste capítulo vamos introduzir o conceito de radiação eletromagnética e tratar os aspectos básicos de sua interação com o sistema atômico. Através desta interação é que convencionalmente realiza-se estudos com respeito aos fenômenos atômicos envolvendo a estrutura interna dos átomos, seu comportamento quando agrupados formando sólidos, etc. É através da interação radiação-átomo que vemos o mundo ao nosso redor. Ao interagir com o átomo os campos elétricos alteram consideravelmente a distribuição de cargas no sistema, literalmente chacoalhando as cargas, havendo a possibilidade de transferência de energia e momentum do campo eletromagnético para o átomo. Estudaremos neste capítulo as formas e variações pelas quais ocorre esta transferência de energia introduzindo uma série de novos conceitos que serão importantes quando estudarmos a interação da radiação com átomo com base na mecânica quântica. Conceitos importantes que dominam a física moderna podem ser introduzidos a partir do modelo clássico simples que aqui iremos tratar. IV.2. BREVE INTRODUÇÃO AO CAMPO ELETROMAGNÉTICO DE RADIAÇÃO Vamos iniciar nosso estudo considerando as equações de Maxwell do eletromagnetismo. Possuindo distribuições de cargas e correntes como sendo fontes de campos, podemos escrever as equações de Maxwell da seguinte forma: r r r 4π 1 ∂D ∇xH = j+ c c ∂t r r r r r 1 ∂B ∇.B = 0 ∇xE = c ∂t r r ∇.D = 4πρ (1) r r r r e se substituirmos B = µH e D = εE , onde µ é a permissividade magnética e ε a constante dielétrica do meio que assumiremos como sendo constantes, ficamos com 3 r r ε∇.E = 4 πρ r ∇. B = 0 r r r 4π r ∂E µJ + µε ∇xB = c ∂t r r r 1 ∂B ∇xE = c ∂t (2) Se estivermos bastante distante das fontes (carga e corrente) podemos desprezar r J os termos em ρ (densidade de cargas) e (densidade de corrente) e ficamos com um conjunto de equações mais simples: r ∇. E = 0 r ∇. B = 0 r r r 1 ∂B ∇xE = − c ∂t r v 1 ∂E ∇xB = µε c ∂t (3) As últimas equações têm uma informação bastante importante que mesmo na ausência de fontes um campo magnético variando no tempo gera um campo elétrico e vice-versa. Este é o princípio básico da onda eletromagnética que nada mais é senão uma auto-sustentação entre os campos elétricos e magnéticos, permitindo o transporte de energia, mesmo na ausência de matéria. Tomando o rotacional da última equação acima e usando a propriedade que r r r r r ∇x(∇xA) = ∇ ∇. A − ∇ 2 A , temos que r r r r µε ∂ r r ∇x(∇xB) = ∇(∇. B) − ∇ 2 B = (∇xE) c ∂t (4) v e utilizando a equação para ∇xE , tiramos que r r µε ∂ 2 r −∇ 2 B = − B c 2 ∂t 2 (5) 4 ou seja 2r ∇ B− r µε ∂ 2 B c2 ∂t 2 =0 (6) que é a famosa equação de onda mostrando que as equações de Maxwell prevêem que o campo magnético e o elétrico obedecem às equações de uma onda que se propaga com velocidade 1 v 2 = µε c2 , ou seja, v= onde c µε com c = 3 x 1010 cm / s (7) µε = n é o índice de refração. No vácuo a velocidade da luz é c. Podemos escrever a mesma equação acima para o campo elétrico, obtendo: 2r ∇ E− r µε ∂ 2 E c2 ∂t 2 =0 (8) A direção deste campo elétrico é chamada de direção da polarização e pode ter várias formas distintas. Vamos chamar esta direção de ê, de modo que a solução da equação de onda tem a forma: r $ 0 cos( kx − ωt + φ) E = eE (9) que representa uma onda que propaga-se na direção x, com amplitude E0 na direção ê, freqüência ω e vetor de onda k = 2π . λ Como o vetor de onda está associado a freqüência através de k= o campo elétrico pode ser escrito como ω c (10) 5 r x − ct E = eˆE 0 cos +φ λ (11) onde φ é uma fase que depende das condições iniciais. (Por simplicidade estamos considerando vácuo µε ~ 1). Com esta solução para o campo elétrico podemos usar as equações de Maxwell e obter a solução para o campo magnético. r B = eˆ' B0 cos(kx − ωt + φ ) onde (12) e$ ′ = x$ x e$ e B0 = E 0 . Isto mostra que a direção do vetor campo magnético é perpendicular ao campo elétrico, e ambos são perpendiculares à direção de propagação, r no caso x . A onda que descrevemos acima é chamada de onda plana pelo simples fato de descrever um plano, já que os valores de E e B só dependem de x e não de y e z. O desenho a seguir representa a onda num determinado instante. Fig. 1 – Representação esquemática dos campos numa onda plana Para uma determinada posição, os campos elétricos oscilam periodicamente no tempo, e se “congelarmos” o tempo (como mostrado acima), os campos oscilam periodicamente no espaço. A freqüência de oscilação dos campos determina o que chamamos de “cor” da radiação eletromagnética e, dependendo de seu valor, ela pode ou não ser observada pelos órgãos visuais humano. Assim, a classificação da radiação eletromagnética pela sua freqüência está mostrada a seguir (fig.2). 6 Fig. 2 – Regiões espectrais da radiação Em ótica normalmente usamos as unidades micron (µ) e angström (Å) definidos como 1µ = 10-6m, 1Å = 10-10m. Logo, o comprimento de onda correspondente ao centro da região visível pode ser expresso por 0,55µ ou 5550Å. Os limites de espectro visível não são bem definidos porque a curva de sensibilidade dos órgãos visuais se aproxima assintoticamente para maiores ou menores comprimentos de onda. Se tomarmos arbitrariamente como limites para o visível os comprimentos de onda para os quais a sensibilidade humana cai a 1% de seu máximo, seus valores serão cerca de 4300Å e 6900Å. A onda que discutimos anteriormente é linearmente polarizada, de modo que a direção do campo elétrico era fixo ê. Este não é o único estado possível para a polarização de fato, quando a direção na qual o campo elétrico é orientado não é bem definida, temos o que chamamos de radiação não polarizada. Pode, no entanto, ocorrer que o vetor campo elétrico gira na medida que a onda propaga-se. Nesta situação dizemos que a luz é circularmente polarizada, podendo estar circularmente polarizada à direita ou à esquerda. É claro que em todos os casos o campo magnético acompanha o campo elétrico sendo sempre perpendicular a ele. No caso da onda circularmente polarizada, o vetor ê é um vetor girante. Assim, no caso mais geral, onde a polarização é descrita por ê, e a direção de r propagação é n , a onda plana é escrita como: r r r r $ 0 cos( k. r − ωt + φ) E ( r , t ) = eE (13) 7 r r sendo o vetor de onda k = kn sempre na direção de propagação. A onda pode ser composta de várias freqüências diferentes, ao invés de uma única (monocromática). Neste caso, temos: r r r E (r , t ) = ∑ eˆE0 (ω ) cos(k .ωt + φk ) (14) ω ,k caracterizando a chamada radiação não monocromática. A intensidade média (potência por unidade de área) transportada pela onda é calculada como sendo: I= cE 20 8π (15) Os campos que fazem parte da radiação são capazes de trabalhar sobre cargas ou correntes, de modo que o campo eletromagnético contém determinada energia. Numa r r região do espaço onde o campo elétrico é E e o magnético B , a densidade de energia é exatamente: µ= ( 1 r2 r2 E +B 8π ) (16) ) (17) de modo que a energia total contida num volume V é U= ( r2 r2 1 ∫ E + B dV 8π V Considerando as ondas planas, linearmente polarizadas, a densidade de energia é: µ ( ( ) ( r r r r 1 E 20 cos2 k. r − ωt + φ + E 20 cos2 k. r − ωt + φ 8π = ( r r 1 2 E 0 cos2 k. r − ωt + φ 4π ) )) (18) 8 r se esta onda propaga-se na direção k , ocupando uma área transversal de valor A, passará uma quantidade de energia µAc∆t durante o intervalo de tempo ∆t. Fig. 3 – Volume imaginário que contém a radiação Assim, a quantidade de energia é U = µAc∆t e, portanto, a intensidade I= I= U = µ. c A∆t (19) rr 1 2 E 0 cos 2 ( k .r − ω t + φ ) 4π (20) rr 2 Se tomarmos a média temporal, lembrando que cos ( k. r − ωtk ) ~ 1/2 I= 1 2 E0c 8π (21) Esta é a quantidade média de energia transportada pela onda por unidade de tempo e área. É importante lembrar que aqui estamos utilizando o sistema CGS de unidades de modo que C = 31010 cm/s e a unidade de campo elétrico é Stat Volts/cm (1 stat volt ≅ 300 V). Neste sistema, intensidade deve ser expressa em erg s. cm 2 (1W = 107 erg/sec). IV.3. INTERAÇÃO DA RADIAÇÃO COM A MATÉRIA: ABSORÇÃO DE ENERGIA Vamos iniciar nossos estudos sobre a interação do sistema atômico com a radiação através de um modelo bastante simplificado. Para nós, em primeira 9 aproximação, o átomo nada mais é senão uma carga positiva rodeada de uma nuvem de carga negativa, distribuída uniformemente ao seu redor. Como modelo simplificado vamos supor que o sistema comporta-se como se a carga negativa estivesse harmonicamente ligada. Quando a radiação incide sobre este sistema, o campo elétrico deforma esta suposta densidade uniforme de carga tendendo a afastar cargas negativas das positivas. Como resultado desta deformação, há indução de um dipolo elétrico no átomo que sobre a presença do campo faz com que suas cargas oscilem forçosamente. Fig. 4 – Modelo simples para interação radiação-átomo Assim, o efeito da radiação sobre o meio (no caso átomos), é basicamente o de produzir uma polarização. O campo da radiação oscila temporalmente e espacialmente. A oscilação espacial ocorre em intervalo da ordem de λ (comprimento de onda) que é normalmente da ordem de 103 a 104 Å. As dimensões atômicas são, no entanto, muito menores da ordem de 1Å. Desta forma, a distribuição de cargas no átomo não sente grandemente a variação espacial do campo e para qualquer efeito prático, para o átomo é como se o campo de radiação somente oscilasse temporalmente. Isto estabelece uma simplificação importante. Vamos imaginar uma amostra que contenha N átomos/volume, interagindo com uma onda plana. Na aproximação na qual o elétron está preso harmonicamente, a equação de movimento para cada elétron na presença do campo é: r m&r& + mω 02 r = −eE0 cos(ωt ) (22) onde m = massa elétron, ω0 = freq. natural de oscilação. É de esperar que o elétron seja arrastado pelo campo, oscilando junto com ele, de modo que a solução da equação acima deva ser da forma: 10 r r r = r0 cosωt (23) e substituindo na equação inicial, tiramos: r r − mω 2 r0 + mω 02 r0 − er 0 cos ωt (24) r − eE 0 / m r r0 = ω 20 − ω 2 (25) tendo como valor de r0 r r Sendo r = r0 cos ωt o deslocamento do elétron, o dipolo induzido em cada átomo será: r r r p = − er = − er0 cos ωt (26) Para o sistema total (N átomos/cm3), o dipolo induzido leva a uma polarização do meio, cujo valor nada mais é senão a soma de todos os dipolos na unidade de volume, ou seja: r r r P = Np = − Ner0 cos ωt r r Ne 2 E 0 / m P=− 2 ω − ω 02 (27) (28) Desde já observamos que esta polarização induzida será mais intensa quando a freqüência de oscilação do campo for igual à freqüência natural de oscilação do sistema denominada de freqüência de ressonância. Do eletromagnetismo sabemos que: r r r r D = E + 4 πP = (1 + 4 πχ e ) E de modo que tiramos (29) 11 r 4 πNe 2 / m r D = 1 − ωt E 0 cos4 r 3 ω 2 − ω 0 142 E (30) e utilizando as equações de Maxwell: r r ∇.B = 0 r r 1 ∂D ∇xB = c ∂t r ∇.D = 0 ∇xE = (31) - 1 ∂B c ∂t obtemos que, após tomarmos o rotacional da última equação 1 c2 ∇2 E − 4 ρNe 2 / m ∂ 2 E =0 1 − 2 2 2 ω − ω ∂ t 0 (32) mostrando que a propagação da onda neste meio, ocorrerá com velocidade v dada por: 1 4 πNe 2 / m = 1 − 2 v 2 c 2 ω − ω 20 1 (33) Ne 2 / m 2 n = 1 − e como v = c(n), termos 2 2 como sendo o índice de refração do meio ω − ω 0 para a propagação desta radiação. Eliminando n(ω) temos: n( ω ) = 1 + 4 πNe 2 / m ω 20 − ω 2 ≅ 1+ 2 πe 2 N / m ω 20 − ω 2 (34) para gases cujo n(ω) não difere muito da unidade. Apesar de n(ω) tomar em algumas condições valores menores que 1, não significa c que v > c. Apenas a definição de v = não é mais adequada. n 12 Esta expressão para o índice de refração não é muito adequada para freqüências da radiação próximas de ω0, pois observamos a ocorrência de divergências. A razão desta divergência fazendo com que a polarização seja infinita nas proximidades de ω0 advém do fato que o modelo, até o momento, não tem uma forma de dissipar energia. Somente adquirindo a energia do campo, os elétrons oscilam cada vez com amplitude mais elevada, levando a uma divergência. Fig. 5 – Relação n(ω) versus ω. A fim de tornar nosso modelo mais realista, temos que introduzir no sistema dissipação de energia. Assim, teremos que adicionar na equação de movimento um termo de força proporcional à velocidade e oposta a ela, responsável pela dissipação. Fisicamente, este termo pode ser interpretado como a radiação emitida pelo dipolo oscilante como se fosse uma antena. Assim, a nova equação de movimento é: r r r mr + mζ r + mω 20 r = eE 0 cos ωt (35) onde ζ é chamada de constante de amortecimento e está relacionada com a taxa de dissipação de energia e será relacionada com os parâmetros físicos do sistema mais adiante. Anteriormente a solução estava em fase com o campo. Com a adição do termo dissipativo isto não é verdade necessariamente verdade, e a solução deverá ser da forma: r r r = r0 cos(ωt + φ) (36) 13 r onde agora r0 e a fase φ dependerão dos vários parâmetros do problema. Da solução proposta, tiramos: r r r = −ωr0 sen(ωt + φ ) (37) r r r = −ω 2 r0 cos(ωt + φ ) (38) e expandindo o seno e coseno da soma na equação original, temos: r r −ω 2 r0 cos ωt cos φ + ω 2 r0 senωtsenφ r r −ωζ r0 senωt cos φ − ωζr0 cos ωtsenφ +ω 20 cos ωt cos φ − ω 20 senωtsenφ = − (39) eE 0 cos ωt m Como esta equação tem que ser válida para qualquer instante de tempo, os termos em senωt e cosωt têm que estar em equivalência, isto é, a soma de seus coeficientes devem se anular. Assim, ( −ω 2 ) cos φ − ωζsenφ + ω 20 cos φ r0 = − ω 2 senφ − ωζ cos φ − ω 20 senφ = 0 eE 0 m (40) (41) Da segunda equação tiramos: tan φ = ωζ (42) 2 ω − ω 20 e usando relação cos2φ + sen2φ = 1, obtemos senϕ = − cosφ = − (ω ( ζω 2 0 −ω2 ) 2 + ζ 2ω 2 ω 2 − ω 20 ω 20 −ω ) 2 2 (43) (44) 2 +ζ ω 2 14 Utilizando estes valores na primeira equação, temos: ( ) 2 2 ω ω − ω 02 r0 + 2 2 2 ω − ω 0 ( ) ζ 2ω 2 (ω 2 0 −ω2 ( ( ) − (ω )( )( ω 02 (ω 2 − ω 02 ) 2 0 −ω2 ) 2 ) ) 2 2 2 2 2 2 r ω − ω0 ω − ω0 + ζ ω r0 ω 20 − ω 2 ω 20 − ω 2 + ζ 2 ω 2 = − eE 0 m + ζ 2ω 2 r eE 0 =− m (45) e, portanto, a amplitude de oscilação é dada por: r eE 0 1 r r0 = − 1/ 2 m 2 2 2 2 2 ω − ω0 + ζ ω ( (46) ) Com o valor de r0 podemos escrever a polarização do meio como sendo: v r r P = − Ner0 = − Ner0 cos(ωt + φ) (47) r r v P = − Ner0 cos ωt cos φ + Ner0 senωtsenφ (48) ou seja, e substituindo os valores encontrados acima, temos: ( ) r r r Ne 2 E 0 ω 02 − ω 2 ζωE 0 Ne 2 P= cosωt + senωt m ω 02 − ω 2 2 + ζ 2ω 2 m ω 02 − ω 2 + ζ 2ω 2 ( ) ( ) (49) Assim, na presença da radiação, o meio responde com duas partes distintas: uma completamente em fase com a radiação incidente (termo cosωt) e outra 90° fora de fase com a radiação incidente (termo em senωt = cos (ωt-π/2)). É importante notar que o segundo termo é conseqüência direta da dissipação já que ζ = 0 elimina este termo. 15 Considerando inicialmente somente o primeiro termo e utilizando a equação de onda como anteriormente, tiramos que a parte do índice de refração denominada de dispersiva é: 2 πNe 2 n ′ (ω ) ≅ 1 + m ( ω 20 − ω 2 ω 20 −ω ) 2 2 2 +ζ ω 2 (50) O gráfico de n ′ (ω ) como função de ω está mostrado abaixo: Fig. 6 – n’(ω) versus ω que é a forma dispersiva correta, não apresentando divergências ao redor de ω0. Longe da freqüência de ressonância, o sistema não nota muito a presença da radiação. As regiões onde n ′ (ω ) aumenta com a freqüência é denominada de região de dispersão normal, enquanto nas regiões onde n(ω ) descreve com ω são chamadas de dispersão anômala. O segundo termo da polarização que depende do termo dissipativo, representa na verdade uma absorção. Ele representa a maneira pela qual a energia é dissipada. Para melhor entendermos isto vamos calcular a taxa com que a energia é retirada do campo de radiação, ou seja, a taxa com que o campo elétrico está trabalhando sobre as cargas que constituem o sistema atômico. Assim, voltamos à equação inicial: r m&r& + mζ r& + mω 02 r = −eE cos ωt e multiplicamos esta equação por r& escalarmente, obtemos: (51) 16 r r m&r&.r& + mζr& 2 + mω 02 r .r& = −eE 0 .r& cos ωt (52) Reescrevendo o primeiro termo r r r d 1 1 2 2 r 2 & & m ( r ) + m ω ( r ) + m ζ r . r = ( − e E 0 0 cos ωt ).r dt 2 2 (53) Notamos que o termo dentro de colchetes é exatamente a variação da energia total do oscilador. O segundo termo representa a taxa na qual a potência está sendo dissipada pelo sistema, pois ela representa o produto da força viscosa pela velocidade, e finalmente o lado direito da equação representa a taxa com que a energia do campo está sendo fornecida ao sistema, pois é o produto da força sobre o elétron pela sua velocidade. No regime estacionário a taxa com que a energia está sendo fornecida ao sistema equivale à dissipada. A potência fornecida é: r r ( potência) P = (−eE0 cos ωt ).r cuja média temporal fornece, após substituição de (54) r r r = r0 cos(ωt + φ) lembrando (senωt cos ωt ) med ~ 0 ( Potencia ) P = − eE 0ω r0 senφ 2 (55) e usando a relação para senφ obtida anteriormente, a potência trocada com o sistema atômico é: (Potência) P = − eE 02 ζω 2 2m (ω 02 − ω 2 ) 2 + ζ 2ω 2 (56) Esta é a taxa com que a energia do campo é transferida ao sistema que posteriormente dissipa como pode ser visto pela equação de conservação de energia da página anterior. (Eq. 53) 17 Se fizermos um gráfico desta potência absorvida versus frequência: Fig. 7 – Potência versus freqüência À medida que variamos a frequência da radiação quando estamos longe da freqüência de ressonância ω0, a potência absorvida varia como Pα ω2 ω4 → 0 (57) e, portanto, a potência transmitida ao sistema atômico é nula. Ao aproximarmos ω de ω0 a potência absorvida cresce e é máxima exatamente para ω = ω0. Este comportamento gera a linha mostrada acima normalmente denominada de linha de absorção do material átomo e é caracterizada pela sua frequência de máximo ω0 e sua largura, que é dada por: ∆ω = ζ (58) Assim, é graças ao termo dissipativo que o sistema consegue absorver energia para freqüências próximas, mas diferentes de ω0. Como dissemos anteriormente, o termo de dissipação de energia está associado ao fato que ao interagir com o campo elétrico da radiação a carga é acelerada, e pelas leis básicas do eletromagnetismo cargas aceleradas emitem radiação. Pode-se mostrar que o valor médio da potência emitida por uma carga em movimento acelerado é 18 P= 2 e2 (&&) x 2 3 c3 (59) Se supusermos um elétron em movimento harmônico, X = X0cosωt, é fácil mostrar que P= pois X& = Xωsenωt ⇒ &x& 2 = ω 2 x& 2 2 &X& = −ω X cos ωt 0 já que sen 2 ωt = cos2 ωt 2 e2 2 2 ω ( x& ) 3 c3 (60) 2 Comparando esta expressão com a taxa de dissipação de energia mζ r& , considerando x& = r& , tiramos 2 e2 ω 2 ζ= 3 c3 m (61) que é a constante dissipativa em termos dos parâmetros do problema. Voltemos ao nosso meio constituído de N átomos/cm3 pelo qual a radiação é absorvida. Tomando a variação da intensidade da onda numa distância ∆z. Fig. 8 – Volume de controle para absorção da radiação 19 Temos que cada átomo do volume considerado absorve a potência mostrada anteriormente. Como I = P= 1 2 E 0 c , escrevemos: 8π 8 πc 2 I c ( ζω 2 ω 20 −ω ) 2 2 2 +ζ ω 2 = potência dissipada por átomo (62) (lembrando que I = P/A), tendo n átomos/cm3. A[I ( z + ∆ z ) − I ( s )] = − NA∆ z 8πe 2 ζω 2 I ( z) 2 c (ω 0 − ω 2 ) 2 + ζ 2ω 2 (63) onde tomamos ∆z pequeno. Assim, no limite ∆z → 0 dI e2 ζω 2 = −8πn I dz c (ω 02 − ω 2 ) 2 + ζ 2ω 2 E por definição, (64) dI = −αI , onde dz α = 8πn e2 ζω 2 c (ω 02 − ω 2 ) 2 + ζ 2ω 2 (65) é o chamado coeficiente de absorção do meio, e a variação da intensidade ao propagarse no meio é: I ( z ) = I 0 e − αz (66) A chamada secção de choque de espalhamento do sistema σ está relacionada com o coeficiente de absorção através de nσ = α sendo n = densidade (67) 20 de modo que a secção de choque de espalhamento fica escrita como: σ (ω ) = 8 πe 2 c ( ζω 2 ω 20 − ω 2 ) 2 + ζ2ω 2 (68) Esta secção de choque representa a capacidade que cada constituinte do sistema (no caso os átomos) tem em remover energia da radiação eletromagnética incidente e dependendo das regiões de frequência, ela adquire aspectos bastante interessantes. Vamos analisar os vários casos limites para a secção de choque de espalhamento ou absorção. 1o. caso ω << ω0 - Neste caso a freqüência da radiação é muito menor do que a freqüência de máxima absorção do sistema. Podemos desprezar os termos em ω no denominador e 8π 2 ζω 2 e c ω 40 (69) 8 πe 2 2 e 2 ω 4 c 3 c 3 m ω 40 (70) σ(ω ) ω << ω 0 = Se substituirmos ζ por sua expressão σ(ω ) ω << ω 0 = ou seja σ(ω ) = Const. ω4 ω 40 (71) chamado de espalhamento de Rayleigh e caracterizado por ser proporcional à freqüência à quarta potência. Neste caso, quanto maior é a freqüência da radiação mais eficientemente ela interage e é espalhada pelo sistema atômico. Este tipo de espalhamento (Rayleigh) é responsável pela aparência azul do céu. Os gases da chamada estratosfera apresentam freqüências de absorção no ultravioleta. Porém, a luz proveniente do sol (branca) está dominantemente no visível e, portanto 21 ω << ω0. Assim, a luz azul que compõe esta luz solar branca (que é a componente de maior frequência) é mais espalhada do que as demais, e sendo espalhada para todas direções ela nos atinge, e sendo sua maior componente azul, como resultado vemos o céu azulado. Em ordem de grandeza temos σ(ω) ~ 5 x 10-25 ω ~ 10 ω0 → (σ) ω ~ 10 -2 2 o. -33 ω4 ω 20 2 cm de modo que se 2 cm . caso ω >> ω0 - Neste caso a frequência da radiação é muito maior do que a absorção de modo que podemos desprezar ω0 do denominador e σ(ω ) = const. ω4 ω4 = Const. (72) A secção de choque é praticamente constante e este regime é chamado de espalhamento Thompson, caracterizado por espalhar igualmente todas as freqüências. Para espalhamento Thompson, temos: σ(ω ) ~ 5 x 10-25 cm2 (73) 3o. caso ω ~ ω0 - Finalmente quando a freqüência da radiação é próxima da freqüência natural do sistema temos o chamado espalhamento ressonante no qual a energia da radiação não é apenas desviada espacialmente, mas é realmente absorvida pelo átomo, tornando os átomos mais energéticos ou excitados. Neste caso, 2 −25 ω σ(ω ) ≅ 5 x 10 α 2 ζ 1 ω2 (74) Quando ω ~ ω0 podemos mostrar que o espalhamento apresenta a secção de choque σ (ω ) ≅ 3 2 λ cm 2 2π (75) 22 onde λ é o comprimento de onda da luz incidente, assim, basicamente na ressonância, a área efetiva para absorção de radiação é praticamente o comprimento de onda ao quadrado. Se fizermos um gráfico da secção de choque de espalhamento para os vários casos que analisamos, Fig. 9 – Comportamento da secção de choque radiação-átomo em toda a região espectral IV.4. COMPORTAMENTO NÃO LINEAR NA INTERAÇÃO RADIAÇÃO-ÁTOMO Como vimos até agora, a resposta do meio material à radiação é essencialmente linear, i.e., a polarização do meio na presença do campo elétrico da radiação é proporcional a este campo. Vamos, agora, considerar o caso onde o meio não responde somente proporcionalmente ao campo, mas inclui termos que dependem do campo ao quadrado, etc. Isto é chamado de uma resposta não linear do meio à estímulos externos. A resposta não linear do meio ao campo eletromagnético pode produzir uma troca de energia entre campos de freqüências diferentes. Assim, o meio gera radiação numa freqüência diferente do campo incidente produzindo, desta forma, uma troca de energia do campo incidente para campos com freqüências diferentes. Duas das mais importantes aplicações deste fenômeno são: geração harmônico, no qual parte de energia da onda incidente com freqüência ω é convertida em radiação com freqüência 2ω e oscilações paramétricas na qual um forte campo de radiação de freqüência ω gera através do meio dois campos de radiação de freqüências ω1 e ω2 , tal que ω = ω 1 + ω 2 . Vamos, então, imaginar um meio não linear no qual os elétrons do meio podem ser visto como estando harmonicamente ligados. Assim, ao incidir radiação o elétron é 23 deslocado e a força restauradora do equilíbrio apresenta o convencional termo linear e em adição o termo não linear. Imaginemos que a força restauradora seja do tipo: r r mω 20 r + mβ 2 r 2 (76) onde β é o coeficiente do termo não linear. r Sob a incidência de um campo E 0 cosωt externo, a equação do movimento para o 2 elétron é da forma: r r r m&r& + mω 02 r + mβ 2 r 2 = −eE 0 cos ωt (77) onde estamos deixando de lado o termo de dissipação para tornar os cálculos mais simples. Vamos considerar como solução aproximada o seguinte: r r r1 = r0 cosωt (78) que será considerado paralelo a E0. Da equação do oscilador, obtemos r e E r &r& = −ω 02 r − β 2 r 2 0 cos ωt m (79) r e substituindo a solução r1 considerada no segundo membro da equação, eE r &r& ≅ −ω 02 r cos ωt − β 2 r02 cos 2 ωt 0 cos ωt m (80) Podemos agora integrar esta equação duas vezes obtendo r(t). Antes, porém, vamos usar a substituição cos2 ωt = 2 cos2 ωt − 1 (81) 24 2 de modo que cos ωt = 1 1 cos(2ωt ) + , temos 2 2 1 eE 1 &&r ≅ −ω 20 r0 cos ωt − β 2 r02 cos2 ωt + − 0 cos ωt 2 2 m (82) e integrando uma vez: ω2 β 2 r02 eE &r ≅ − 0 r0 senωt − sen 2 ωt − β 2 r02 - 0 senωt ω 4ω ωm (83) e integrando novamente ω 20 β 2 r02 β 2 r02 2 r(t) ≅ r0 cos ωt + cos ωt + cos 2ωt − t 2 ω2 ω2m 8ω 2 eE 0 (84) que desprezando o termo em t2, pois não representa solução oscilatória, fica ω2 β 2 r02 eE 0 cos ωt + r ( t ) ~ 0 r0 + cos 2ωt ω 2 m 8ω 2 ω2 (85) Esta solução, embora esteja bastante longe de ser a solução real da equação acima, revela um fato bastante importante que a presença do termo não linear faz com que o sistema responda com freqüências múltiplas da freqüência de excitação. No caso acima, o termo em cos2ωt correspondem à chamada geração de segundo harmônico que, como vemos, deverá ser bastante pequeno já que β é pequeno. Embora a solução anterior não seja muito adequada, ela nos fornece conhecimento necessário para propor como solução da equação inicial como algo do tipo: ∞ r (t ) = ∑ An cos(nωt ) n =0 (86) 25 deixando claro que o meio responderá em múltiplos da freqüência de excitação. Como estamos interessados somente até a geração do segundo harmônico, vamos carregar a solução até n = 2, ou seja r ≅ A 0 + A 1 cos ωt + A 2 cos 2ωt (87) que substituído na equação inicial fornece − A 1ω 2 cos ωt − 4ω 2 A 2 cos 2ωt + ω 20 A 1 cos ωt + ω 20 A 2 cos 2ωt + A 0 ω 20 + β 2 (A 12 cos2 ωt + 2A 2 A 0 cos 2ωt ) = − eE 0 cos ωt m (88) Como estamos interessados nos termos de ordem ωt e 2ωt, fazendo as substituições: cos2 ωt = cos ωt cos 2ωt = cos2 2ωt = 1 1 cos 2ωt + 2 2 1 1 cos ωt + cos 3ωt 2 2 (89) 1 1 cos 4ωt + 2 2 Após substituição, vamos igualar os termos de mesma ordem em cosωt e cos2ωt desprezando os demais: − A 1ω 2 + A 1ω 20 + A 1A 2 + 2A 1A 0β 2 = − −4ω 2 A 2 + ω 02 A 2 + eE 0 m β 2 A 12 + 2 A 2 A 0β 2 = 0 2 (90) Na primeira equação, como esperamos que A1 seja o termo dominante, desprezamos os demais e obtemos: 26 A1 ≅ − eE 0 / m (91) ω 20 − ω 2 Substituindo este valor na segunda equação no qual o último termo será desprezado, temos ( ) A 2 ω 02 − 4ω 4 = A2 = − ( −β 2 e 2 E 20 / m 2 2 ( ω 20 −ω ) β 2 e 2 E 02 / m 2 2 ω 02 − ω 2 ) (ω 2 0 (92) 2 2 − 4ω 4 ) (93) Com isto, podemos calcular a polarização do meio, levando em conta somente os termos cosωt e cos2ωt e temos r β 2 e 2 E0 E0 / m 2 r r e 2 E0 / m p = −er = 2 cos t + cos 2ωt ω 2 ω 02 − ω 2 ω 02 − 4ω 2 ω0 − ω 2 ( )( ) (94) e para a polarização total r r P = Np (95) onde B é a densidade de átomos considerados. P= Ne 2 E 0 / m Ne 2 E 02 / m 2 cos ω t + cos 2ωt 2 ω 02 − ω 2 2 ω 02 − ω ω 02 − 4ω 2 ( )( ) (96) Como P = χE, onde χ é a chamada susceptibilidade, a susceptibilidade apresenta agora divergências em dois pontos distintos. Primeiro, a divergência que já esperávamos em ω−ω0, denotando a ressonância do sistema ao redor deste ponto. 27 A nova divergência que aparece agora corresponde a ω = radiação incidente na freqüência ω = ω0 . Neste ponto, a 2 ω0 emergirá do sistema com freqüência 2ω=ω0, 2 caracterizando a chamada geração de segundo harmônico. Fig. 10 – n(ω) versus ω para o caso não-linear É claro que não introduzimos no nosso cálculo termos dissipativos, mas isto poderia ser feito sem grandes dificuldades da mesma forma que foi feito anteriormente. Os efeitos não lineares em meios ópticos são extremamente importantes para dispositivos opto-eletrônicos e para geração de luz visível a partir de luz infra-vermelho. Num curso moderno de óptica este processo será necessariamente abordado com profundidade. IV.5. FORÇA DA RADIAÇÃO SOBRE O SISTEMA ATÔMICO Até agora estudamos o processo de espalhamento de radiação do ponto de vista energético, sem nos preocuparmos com o efeito mecânico que esta interação produz. A radiação não é composta apenas de campo magnético que oscila num plano perpendicular ao plano determinado pelo campo elétrico. Assim, como E e b oscilam em fase, o efeito de ambos sobre as cargas do átomo ocorre em conjunto. A ação do campo elétrico sobre o átomo produz um deslocamento do elétron na sua direção e sentido oposto. Isto significa que o campo elétrico da radiação imprime ao elétron do átomo uma velocidade r& . Como o campo magnético pode agir sobre esta carga animada de velocidade, isto resulta numa força. 28 r e r F = − r&xB c (97) Vamos considerar uma radiação que apresenta campo elétrico na direção x$ , magnético na direção y$ e, portanto, tem direção de propagação em z$ . O campo elétrico movimenta o elétron na direção x$ e, portanto, r& é na direção x$ , de modo que a força acima torna-se: r e F = − &rBz$ c (98) e desta forma, a força que a radiação exerce sobre o sistema atômico é na direção de propagação da mesma. Fig. 11 – Esquema da força produzida sobre o átomo durante interação com radiação A equação de movimento do elétron no átomo já foi considerada anteriormente como sendo: r r r mr + mζ r& + mω 02 r = −eE 0 cos ωt e obtivemos como solução para r& (99) 29 r& = + eE0ω 1 m ω 2 − ω 2 2 + ζ 2ω 2 0 [( ) ] 1/ 2 sen(ωt + φ ) (100) cos ωtˆz (101) que leva à seguinte força quando tomamos B = E 0 cosωt r eE02ω sen(ωt + φ ) F =− mc ω 2 − ω 2 2 + ζ 2ω 2 0 [( ) ] 1/ 2 Devemos lembrar que a fase φ existe devido ao termo dissipativo ζ. Podemos escrever: sen(ωt + φ) cos ωt = senωt cos ωt cos φ + cos2 ωtsenφ (102) e ao tomarmos o valor médio temporal o termo em < senωtcosωt > = 0, restando apenas cos2 ωt = 1 2 (103) de modo que r e 2 E 20 ω senφ F =− z$ 1/ 2 2 mc 2 2 2 2 2 ω − ω0 + ζ ω ( ) (104) e como já determinamos anteriormente que senφ = −ζω ( ) 1/ 2 2 2 2 2 2 ω − ω0 + ζ ω (105) obtemos que a força média exercida pela radiação sobre o sistema atômico como sendo 30 r e 2 E 20 ω 2 ζ F = 2 mc (ω 1 2 ) 2 − ω 20 z$ 2 +ζ ω 2 (106) Graficamente esta força está representada a seguir: Fig. 12 – Dependência da força com freqüência Esta força está estritamente ligada ao processo de absorção-emissão de luz e, portanto, tem seu valor máximo quando o átomo está numa situação ressonante. Isto é, ω=ω0. Note que se não houver dissipação de energia (ζ = 0), a força é nula, pois a expressão acima trata-se de uma média e o átomo só pode continuar o processo de absorção se continuamente estiver dissipando energia. No caso de não dissipação, a força é oscilatória, invertendo o sentido quando o campo oscila gerando, no entanto, uma força média nula. A força de radiação encontra hoje muitas aplicações importantes no desenvolvimento científico. Ela é a ferramenta principal nas técnicas modernas que procuram controlar o movimento de espécies atômicas. (apsfi305.doc) Universidade de São Paulo Instituto de Física de São Carlos Departamento de Física e Ciência dos Materiais FÍSICA MODERNA ELEMENTAR CAPÍTULO V EXPERIMENTOS QUE DETERMINARAM O INÍCIO DA FÍSICA MODERNA Autores: Prof. Dr. Vanderlei Salvador Bagnato Prof. Dr. Luís Gustavo Marcassa São Carlos Agosto de 1999 2 Capítulo V EXPERIMENTOS QUE DETERMINARAM O INÍCIO DA FÍSICA MODERNA 1 – Introdução: Em meados do final do século XIX e início do século XX, os fenômenos explicados pelos conceitos básicos existentes entrava numa profunda crise devido à impossibilidade de explicar determinados resultados experimentais da época. Tais resultados exigiam o estabelecimento de novos conceitos e modificações radicais das idéias que até então haviam persistido. Com a participação de personagens ilustres como: Planck, Rutherford, Niels Bohr, Einstein, Max Born e outros; estabeleceu-se uma linha de pensamentos que em conecção com experimentos brilhantes de diversas naturezas propiciou o aparecimento da Teoria Quântica. Esta nova maneira de ver o mundo físico estabelecia novos conceitos que descreviam ao mesmo tempo o ondulatório do elétron (ou partículas em geral) e o comportamento corpuscular da radiação. Nesta parte do nosso curso iremos estudar os resultados mais importantes que determinaram o nascimento desta nova teoria. Iniciaremos com uma discussão das leis básicas de radiação emitida por um corpo aquecido (radiação de corpo negro). Neste ponto será bastante apropriado a introdução do conceito de estatística quântica e do fóton. Após discutiremos os experimentos mais importantes como o efeito fotoelétrico, o efeito Compton, a natureza eletromagnética do raio-x e a natureza ondulatória de um feixe eletrônico. 2 - Estatística Quântica e Radiação do Corpo Negro: Já é do nosso conhecimento através de observações do cotidiano, que todos os corpos quando aquecidos emitem radiação eletromagnética. À medida que a temperatura do corpo aumenta, vemos a sua “luminosidade” passar de vermelho para amarelo e, eventualmente, branca, demonstrando a existência de uma dependência das características de sua emissão com a temperatura. Apesar de que possamos ser levados a pensar que corpos “frios” não emitem radiação, devemos salientar que mesmo os corpos em baixas temperaturas são emissores de radiação, só que, nestas circunstâncias, o comprimento de onda emitido localiza-se na região do infravermelho ou 3 mesmo abaixo desta, de modo que não é notado pelos órgãos visuais humanos.A fim de criarmos um sistema físico que nos permita observar somente sua radiação emitida, vamos imaginar uma caixa oca cujas paredes estão mantidas a uma determinada temperatura constante, de modo que a radiação existente no seu interior está em equilíbrio com as paredes. Assim, podemos associar a esta radiação a mesma temperatura T das paredes. Esta cavidade é um sistema termodinâmico que não depende dos processos químicos e físicos que ocorrem nas paredes, mas essencialmente do equilíbrio. Da forma apresentada este é um sistema isolado, ficando difícil seu estudo já que energia não está sendo trocada com o meio não permitindo observação direta. A fim de tornar acessível a observação da radiação na cavidade, façamos um pequeno buraco nesta cavidade, pequeno o bastante para que não perturbe a situação de equilíbrio, mas permitindo que uma pequena parte da radiação deixe a cavidade criando a possibilidade de observação. Quando parte da radiação externa penetra na cavidade, esta é totalmente absorvida pelas paredes da cavidade, não havendo reflexão nenhuma. Se olharmos para a abertura na cavidade, somente observamos a emissão de radiação. Nenhuma reflexão da radiação externa é observada. A esta radiação denominamos de radiação de corpo negro, caracterizando um corpo que é perfeitamente absorvedor, só emitindo sua radiação característica. É importante notar que toda radiação incidente será transformada em radiação de corpo negro, pois será envolvida no processo de equilíbrio do sistema. A radiação de corpo negro tem propriedades bastante interessantes e seu estudo foi um dos responsáveis pelo aparecimento da mecânica quântica e da chamada estatística quântica. Antes de iniciarmos o estudo das propriedades da radiação do corpo negro, é necessário alguns conceitos já vistos anteriormente. A radiação eletromagnética contém quantidade de movimento e energia. Anteriormente, vimos que a densidade de energia contida na radiação devido aos seus campos elétricos (E) e magnéticos (B) é dada por u = 1/8 π (E2 + B2). No caso que tratamos, tínhamos somente campos monocromáticos. No caso mais geral definimos u (ν,T) como sendo a densidade de energia por unidade de frequência, ou seja, u (ν, T) dν é a densidade de energia da radiação com frequência entre ν e ν + dν. Se quisermos saber a densidade de energia total, deveremos somar sobre todas as possíveis frequências. Note que já colocamos a dependência da temperatura em u pois estamos tratando da radiação que está em equilíbrio térmico com as paredes da 4 cavidade. Assim, a densidade total de energia será: ∞ u (T ) = ∫ u (v, T )dv 0 A notação u e u pretende diferenciar a densidade total (sem barra) daquela por unidade de frequência. Evidentemente, temos as seguintes unidades para ambas: .seg [u ] = energia cm 3 e [u ] = energia cm 3 Em 1859 o físico Kirchhoff provou que u = u (ν, T) é independente da natureza das paredes da cavidade, ou seja, ele demonstrou que independente do material que constitui a cavidade a radiação preserva suas características. O resultado descrito acima é denominado de Lei de Kirchhoff. A fim de demonstrarmos esta lei, vamos considerar duas cavidades A e B contendo aberturas, mas constituídas de materiais diferentes e mantidas à mesma temperatura. Para simplificarmos, analisemos a densidade de energia em somente uma região espectral (ν, dν). Vamos assumir que a densidade de energia em A seja maior do que a densidade em B. u A (ν , T ) = u B (ν , T ) Assim, a densidade de energia/V contida na cavidade (e, portanto, na radiação de corpo 5 negro), não depende da constituição das cavidades, sendo uma função universal de ν e T. Consequentemente, a densidade total de energia µ é uma função universal da temperatura. Vamos agora analisar com mais detalhes a radiação proveniente de um corpo negro. Imaginando uma cavidade da qual a radiação provém e denotando por K a quantidade de energia que emana do corpo por unidade de área e tempo (fluxo), obtemos facilmente que temos que: φ = c u (T ) 4π ou seja, o fluxo de energia emitido pelo corpo negro é também uma função universal da temperatura do corpo (da mesma forma que a densidade de radiação). Do fato que a radiação carrega momentos (como visto anteriormente no capítulo IV), significa que ao ser absorvida ou refletida por uma superfície haverá atuação de uma força que normalmente é referida, como sendo a pressão da radiação a qual passaremos agora a explicar. Consideremos um feixe de radiação incidindo sobre uma superfície segundo um determinado ângulo θ com a normal à superfície. Vamos denotar de p e p o momentum total contido num volume V para a onda incidente e refletida respectivamente. Se a transferência de momento ∆ p = p ocorre durante um tempo t, a força exercida sobre a superfície é: F = − ∆p p−p = ∆t ∆t ' −p 6 onde o sinal ( - ) foi introduzido porque estamos tratando da força sobre a superfície. O tempo para transferência deste momentum (t) é o mesmo gasto para todo volume V considerado chegar à superfície. Se a base do cilindro considerado tem que percorrer d para atingir a superfície, c∆t = d. O volume ∆ V que contém a radiação em questão é ∆V = Ad cos θ. Assim, ∆V = Ac∆t cosθ Do eletromagnetismo temos que (u = densidade energia) p = u' ∆V u∆V n e p' = n' c c ( n e n ) estão representadas na figura, de modo que podemos escrever F = cA cos θ u∆V u' ∆V n− n' c ∆V c ou seja ( F = A cos θ u n − u' n' ) Analisemos a pressão de radiação em dois casos distintos: primeiro quando temos reflexão total (u = u’). Neste caso, F = A cos θu( n − n' ) como n − n' = 2 cos θx̂ (já que n e n são unitários), temos F = Fx = 2 A cos 2 θu e, portanto, a pressão P = Fx/A P = 2cos2θu 7 Utilizemos este resultado para calcularmos a pressão da radiação no interior da cavidade. Quando estamos no interior da cavidade, ao analisarmos em determinado elemento de parede, vemos que naquele ponto, chega radiação de todas as direções de modo que a expressão que calculamos é apenas uma pequena contribuição de uma específica direção. A pressão num determinado ponto será a soma de toda incidência de radiação no ângulo sólido 2π strd determinado por todo semi-hemisfério defronte da parede. Sendo u a densidade de energia, a contribuição para a pressão devido à radiação contida no ângulo sólido d Ω será contida dP = 2 cos 2 θu dΩ 4π e a pressão teta’ P = ∫ dp (em todo semi-hemisfério) ou usando dΩ = sen θdθdγ, p = 2 u (T ) 4π = 2 π/ 2 2π 0 0 2 ∫ cos θdθ ∫ dγ u (T ) 1 .2 π 4π 3 ou seja, p = u (T ) 3 que é a pressão da radiação no interior de uma cavidade contendo uma densidade de energia u(T). No caso de termos absorção total da radiação pela parede, u’ = 0 os cálculos nos forneceriam o mesmo resultado a menos de um fator de 2. Assim, a radiação de corpo negro ocupa um volume V e apresenta pressão P. O 8 volume V pode ser mudado através do movimento do pistão. Vamos tratar este sistema termodinâmicamente. A energia total contida no sistema será: U = Vu(T) e havendo uma movimentação do pistão causando uma variação de volume dV, o trabalho realizado pelo pistão será, onde estamos preservando a quantidade de radiação, considerando reflexão total: dW = PdV = u( T ) dV 3 trabalho este que aumentará a entropia do sistema. Usando a primeira lei da termodinâmica (com dQ = TdS) dS = dU + dW T é a variação da entropia do sistema. As variações envolvidas nesta última expressão são: dU = udV + V dW = du dT dT u( T ) dV 3 Imaginemos uma situação termodinâmica onde a cavidade que contém a radiação será um pistão evacuado e obtemos para a variação da entropia dS = ν du 4 u + dV T dT 3T Vamos agora utilizar uma propriedade das funções termodinâmicas denominadas de diferenciais exatas. S e f dependem das variáveis e y, temos 9 df = ∂f ∂f dx + dy ∂ ∂y e, sendo df uma diferencial exata, ∂2f ∂2f = ∂y∂x ∂x∂y Como dS é um diferencial exato: 1 du 4 d u = T dT 3 dT T ou seja, tomando a derivada, 1 du 4 du 4 u = − T dT 3 TdT 3 T 2 1 du u du dT = 4 2 ⇒ = 4 T dT u T T e integrando esta equação, obtemos: u(T) = aT4 sendo a uma constante, esta expressão mostra que a densidade de energia na radiação de corpo negro depende com a quarta potência da temperatura. Assim, a quantidade de energia que é emitida pelo corpo negro preenchido com radiação de corpo negro à temperatura T. Por unidade de tempo e área, temos a forma: φ = φ = c 4 T 4π c u( T ) 4π (energia emitida/área tempo) 10 A constante ca ≡ σ chamada de constante de Stefan-Boltzmann para a radiação de um 4π corpo negro, e este resultado: Φ = σT4 é a chamada Lei de Stefan-Boltzmann para a energia emitida por um campo negro. Esta descrição feita pelos físicos Stefan e Boltzmann em 1884 corresponde a um dos grandes feitos teóricos que acabou como decisivo no desenvolvimento da física moderna. O valor da constante σ = 5,7 105 esq cm-2 S-1K-4 Esta expressão (Lei Stefan-Boltzmann) nos fornece apenas uma relação entre a intensidade da radiação emitida pela corpo negro como função de sua temperatura. O resultado acima é a soma total para todos os comprimentos de onda (ou frequência) contidos na radiação. Nada pode, desta expressão, ser concluído a respeito da dependência espectral da radiação do corpo negro. A dependência da densidade de energia na radiação do corpo negro com a frequência foi um importante ponto no surgimento da mecânica quântica, já que sua concordância com os resultados experimentais só foi possível com a introdução de novos conceitos. Vamos ver com algum detalhe o desenvolvimento teórico desta dependência. Vamos iniciar fazendo uma análise dimensional. Tomemos quatro unidades como sendo fundamentais. Uma delas (bastante lógica no presente problema) é a temperatura que denotaremos por θ. As demais serão as unidades mecânicas de comprimento (l), tempo (t) e energia (e), sendo que esta última entra no lugar da convencional massa, pois trataremos com a densidade de energia na radiação, sendo, portanto, energia mais apropriada que massa. Relembrando que u (ν, T) é a densidade de energia por unidade de frequência temos: [u (ν ,T )] = e' l [u (ν ,T )] = e' l 3 3 Queremos introduzir nesta expressão a dependência com a temperatura (T) e frequência (ν). Assim, vamos escrever as quantidades que temos interesse que estejam presentes em termos das unidades escolhidas. Vamos lembrar que K, T têm unidade de 11 energia, de modo que K = e θ -1 (constante Boltzmann). Assim: u v θ t-1 et T c lt-1 K eθ-1 l3 Importante para nós são estas conco grandezas, já que tratando de radiação é importante ν e c, e como estamos trabalhando com energia e temperatura, também são importantes T e K. Vamos tentar achar um produto entre estas grandezas de modo a termos uma quantidade dimensional. Denominemos este número admensional por Π temos: () a Π = u ν bT d c f K g onde permitiremos aos exponentes serem positivos ou negativos. Do fato que estamos querendo determinar u como função das demais, vamos estabelecer que a = 1. Isto é necessário porque temos 5 epoentes a determinar e somente 4 unidades independentes. Escrevendo as grandezas em termos das unidades temos (com a = 1): π = etl-3t-b θdl f t-f egθ-g Assim, por comparação teremos: 1+g=0 g = -1 1-b-f=0 -3 + f = 0 d-g=0 d = -1 f=3 b = -2 de modo que Π = uc 3 v 2 KT onde ∏ denota um determinado número universal. Daqui tiramos 12 u (v , T ) = v 2 KT Π c3 Esta expressão foi determinada em 1900 por Lord Rayleigh através da utilização de um tratamento estatístico, obtendo ∏ = 8π (com π = 3.1416......). Após alguns anos ela foi também determinada por J. H. Jeans e, portanto, é conhecida como fórmula de Rayleigh-Jeans para a radiação do corpo negro. u (ν, T ) = 8 π ν 2 KT c3 Uma maneira alternativa para obtenção da relação de Rayleigh-Jeans para radiação consiste em utilizarmos o princípio da equipartição de energia e para os modos de uma cavidade. Assim, consideremos inicialmente uma cavidade cúbica de lado L dentro da qual exite radiação. Para que esta radiação exista dentro da cavidade é necessário que toda energia da radiação esteja entre os vários modos da cavidade. Se a cavidade for constituída de um material perfeitamente refletor, o campo elétrico da radiação deverá anular-se nas paredes, pois a radiação não pode existir além destes contornos. Assim, é necessário que o comprimento L exista um número inteiro de λ . 2 13 Estas várias possibilidades constituem os vários modos da cavidade. As condições de contorno requerem que: nx λx = L 2 nX λ X L = 2π π ou de onde tiramos (nas várias direções): kxL = nxπ kyL = nyπ kzL = nzπ nx,y,z = 1, 2, 3, .... Qualquer conjunto de inteiros (nx, ny, nz) apresenta um modo da cavidade, como: k = k x x̂ + k y ŷ + k z ẑ k= Como k = 2π λ e λ = (n 2 x ) + ny2 + nz2 π / L c , temos ν ν= (n 2 x + ny2 + nz2 ) 2cL Para cada conjunto (nx, ny, nz), temos desta relação a freqüência do modo. Se apresentarmos todos os possíveis modos num gráfico nx, ny, nz, termos uma rede de ponto cúbico espaçados da unidade, preenchendo todo o octante positivo dos eixos. Se, então, perguntarmos quais são os vários modos para uma determinada freqüência ν, 2 n +n +n 2 x 2 y 2 z 2L 2 = ν c 14 basta verificarmos todos os pontos que encontram-se sobre uma esfera de raio R = 2L ν. c Se perguntarmos quantos modos existem dentro do intervalo de frequência ν e ν + dν, a resposta seria óbvia: todos aqueles que no gráfico anterior estão dentro de uma casca esférica de raio R e espessura dR, onde: R = 2L .ν c e dR = 2L dν c Com a densidade de pontos na rede de modos é 1 ponto/volume, o número de pontos que caem dentro do volume da casca esférica acima é: dN = 1 L3 4 πR 2 dR = 4 π 3 ν 2 dν 8 c Se agora lembrarmos que cada modo pode ter duas polarizações independentes (que corresponde a dois graus de liberdade por modo), pelo princípio da equipartivação de energia, podemos associar a cada grau de liberdade da cavidade 2x 1 kT e, portanto, 2 1 kT = kT por modo (cada modo representa um grau de liberdade que pode contar 2 energia de cavidade). Assim, a energia total contida na cavidade será: du = 2 xdNxkT = 2 .4 π L3 2 ν d ν .kT c3 portanto, a densidade de energia por unidade de frequência será: u (ν, T ) = du 8 πν 2 kT = L3 dν c3 15 Cada modo está levando kT devido a energia do campo ter a forma (E2 + B2) apresentando dois termos quadráticos cada um levando 1 kT . 2 É razoável que esta lei corresponda à realidade para baixas frequências, pois neste limite a seletividade dos modos é esperada de ser predominante. É evidente que a relação de Rayleigh-Jeans fornece valores absurdos para u quando altos valores na frequência são considerados, pois sabemos da prática, ao observarmos um cargo aquecido que não temos indefinidamente mais energia quando olhamos para maiores frequências da radiação emitida. Pelo contrário, normalmente as componentes de radiação de mais alta frequência estão ausentes. Podemos atestar este absurdo ainda de outra forma, dizendo que: ∞ u = ∫ u (ν , T )dν → ∞ 0 denotando uma quantidade infinita de energia contrariando mesmo a lei de StefanBoltzmann. Esta divergência de u é denominada de catástrofe do ultravioleta. Devemos salientar, no entanto, que a lei de Rayleigh-Jeans é bastante razoável com os resultados experimentais na região de baixas frequências. É claro que estamos procurando uma concordância com os resultados experimentais e, para isto, vamos considerar que se dependa de mais uma função que contém uma constante α na sua determinação, constante esta que é uma combinação de K e uma nova constante universal. Assim, escrevemos: 16 u (ν, T ) = ν 2 kT f αν T n 3 c ( ) a função f foi introduzida para sanar os problemas com a lei de Rayleigh-Jeans. Não sabemos ainda qual o valor de n, mas este exponente deverá ser escolhido de tal forma a satisfazer as leis já conhecidas para a radiação do corpo negro. Calculando a densidade total de energia no corpo negro. ∞ ∞ ∫ ν f (αυT )dν KT u = ∫ udν = 3 c 0 2 n 0 Chamando x = ανTn → dx = αTndV e, portanto kT 1 − 3 n u = α3c 3 ∞ ∫ f (x )x 2 dx 0 como u α T4 (Lei S. Boltzmann) ⇒ n = -1 Assim, temos u (ν, T ) = ν2 KT c3 αν f T Normalmente escrevemos k α = h, de modo que α = u (ν, T ) = h , K ν 2 KT hν f c3 KT ou seja, a densidade u (ν , T ) é o produto de ν 2 KT por uma função universal f que c3 hν depende da quantidade . Este resultado é conhecido como Lei de Wein. Esta lei KT foi bastante importante porque reduziu uma função desconhecida de duas variáveis numa 17 função desconhecida de uma única variável. A quantidade h que aparece nessa expressão representa uma nova constante que tem dimensão de energia vezes tempo, denominada de “ação”. Podemos antecipar que ela é denominada de constante de Planck e representa um quantum de ação, ou seja, a unidade elementar de energia-tempo que um sistema físico emitir ou absorver. ν 2 KT u = f (x ) c3 A fim de determinar a forma explícita da função f(x) Wien imaginou que dentro da cavidade a radiação era semelhante a proveniente de moléculas de um gás aquecido emitindo radiação. Portanto, a frequência da radiação poderia ser vista como dependendo intrinsecamente da velocidade das moléculas. Considerando uma distribuição de Maxwell-Boltzmann para as moléculas do suposto gás emissor de radiação, podemos associar a energia das partículas com a frequência emitida, de modo que a quantidade de partículas emitindo ν é proporcional a ν exp (-νh/KT) e como a energia emitida por cada uma deve ser proporcional a ν, temos: u (ν, T ) = (const )ν 2 νe − bν / T Conhecida como fórmula da radiação de Wien. Com um ajuste apropriado das constantes que aparecem nesta expressão, notamos que ela concorda relativamente bem com os resultados experimentais para altas frequências não sendo muito boa para baixas e muito pior para frequências intermediárias. A situação está esquematizada na figura abaixo. 18 A fórmula geral de Wien, baseada numa função universal, está qualitativamente certa. Neste sentido, ela prevê a existência de um máximo em u (ν,T) para determinada frequência. Impondo a existência do máximo com u , na forma de u , du = 0 , temos: dν 2 νKT ν 2 KT h f ( x ) + f ' (x ) = 0 3 3 KT c c e, como ν ≠ 0, a condição do máximo torna-se: 2f (x max) + x max f’ (x max) = 0 A existência deste x max = ν max α revela que, pelo menos qualitativamente, quando T temos aumento em temperatura, o máximo (ou pico) da emissão de radiação desloca-se para maiores valores de frequência, como esperado e este deslocamento ocorre de forma proporcional. Este resultado é conhecido como “Lei do Deslocamento de Wien”, estabelecendo que a relação entre as posições das máximas de emissão do corpo negro, 1) ν (max ν( 2 ) = max quando são consideradas duas temperaturas diferentes. A comprovação T1 T2 experimental da lei do deslocamento de Wien é uma importante constatação de que a proposta de wien com relação a dependência de u (ν, T) com a função universal f(x) é verdadeira. Até este momento o problema permanecia em aberto, estando bastante afastada uma teoria que reproduzia bem os resultados medidos. A conecção para os resultados a baixas frequências (Rayleigh-Jeans) e altas frequências (Wien) foi feita pelo físico Planck. Enquanto Rayleigh-Jeans considerou apenas a radiação confinada num volume, Planck procurou imaginar uma situação diferente. A radiação não é mais considerada isolada mas em equilíbrio com osciladores capazes de tomar e dar energia ao campo. Planck imaginou que a energia armazenada na radiação eletromagnética poderia ser descrita como a energia armazenada em osciladores harmônicos carregados em contato com radiação. Assim, para Planck, o sistema que constitui o corpo negro pode ser descrito por uma série de osciladores em equilíbrio com radiação. Cada oscilador tem sua frequência 19 natural ω0 e um termo dissipativo que torna possível a troca constante de energia entre osciladores e campo no interior da cavidade dando a radiação as caracterísitcas necessárias. Se o campo de radiação tem um valor Ex, a equação de movimento do oscilador torna-se (onde estamos considerando a carga do oscilador como e e a componente x do campo elétrico da radiação): ( ) m x&& + ξx& + ω02 x = eE x onde m e e denotam a massa e a carga do oscilador, enquanto ξ é o coeficiente de dissipação que já determinamos (cap. IV) como sendo: 2 e 2 ω2 ξ = 3 c3 m quando tratamos a interação da radiação com o sistema atômico. Note que, apesar do oscilador ser tridimensional, somente uma componente está sendo considerada e generalizaremos mais adiante. Para o campo de radiação da forma Ex = E0x sen ωt , o oscilador responderá com: x = x 0 sen (ωt + δ ) onde a amplitude xo = [(ω eE 0x / m 2 − ω02 ) 2 + ξ 2 ω2 ] 1/ 2 Vamos calcular a energia do oscilador que podemos imaginar como sendo a energia interna deste sistema. Neste caso ela está dividida entre cinética e potencial. cinética → 1 m e 2 E ox 2 / m 2 ω2 mx& = cos 2 (ωt + δ ) 2 2 2 2 2 2 2 ω − ω0 + ξ ω ( ) 20 potencial → 1 m e 2 E ox 2 / m 2 ω02 mω02 x 2 = sen 2 (ωt + δ ) 2 2 2 2 2 2 ω − ω0 + ξω ( ) de onde tiramos uma energia média para o sistema quando campo na frequência ω é considerado, e tirando média temporal U =< 1 1 mω02 x 2 + mx& 2 > 2 2 resultando em Uω = 1 m e 2E0x ω 2 + ω 02 2 2 2 2 m ω 2 − ω 02 + ξ 2ω 2 ( ) onde o fator ½ aparece da média temporal. U ω é a quantidade total de energia armazenada nos osciladore de frequência ω . Até este ponto consideramos a radiação como sendo monocromática. Esta é apenas uma contribuição à energia, pois no campo de radiação temos um contínuo de frequências formando o espectro da radiação. Assim, a amplitude E 0x passa agora a depender de ω, E 0x (ω) . Assumimos que U ω acima, representa a energia contida entre as frequências ω - ω + d ω e que E 0x representa uma espécie de densidade espectral de modo que: U = U = e2 4m ∫ ∞ 0 ∫ E ox (ω) 2 ∞ 0 U ω dω (ω ) + ω02 dω ω2 − ω02 + ξ 2 ω2 ( 2 ) A fim de simplificarmos esta integral, vamos considerar que E 0x (ω) varia bastante lentamente com ω, de modo que a maior contribuição vem do termo E 0x (ω0 ) . Também vamos assumir que ω próximo de ω0 é a maior contribuição, de modo que: 21 ω2 + ω02 ≈ 2 ω02 2 4 e 4 ω4 2 4 e4 1 6 ω ≈ ω0 = 4 aω02 ω02 6 2 6 2 9 c m 9 c m ( ξ 2 ω2 = (ω com a = 2 0 − ω2 ) 2 ) ≅ 4 ω02 (ω − ω0 ) 2 e2 3 mc 3 Assim, a energia para o oscilador centrado em ω0 fica: U= e2 x 2 dω Eo (ω 0 ) 4m (ω − ω 0 )2 + aω02 ( ) 2 1 2 e a integral, e 2 E ox (ω0 ) 1 U = . 4m 2 2 dω 00 ∫ (ω − ω ) 2 0 0 ( + aω02 ) 2 Esta última integral: I = com θ = 1 2 dω 00 ∫ (ω − ω ) 2 0 0 ( + aω 2 0 ) = 1 2 aω02 ∫ ∞ − 1 aω0 dθ θ +1 2 ω − ω0 e como temos aω02 << 1 , o limite inferior da integral pode tornar-se -∞ 2 aω0 I = 1 π Tan −1 θ / −∞∞ = 2 2 aω 0 2 aω02 e assim temos para energia: U = 2 πe 2 E 0x ω0 2 8 maω0 ( ) 22 Como sabemos, a densidade de energia na radiação é (já tirando média temporal): u= ( ) 1 1 1 2 E02 + B02 = E0 2 8π 8π e, como 3 E 0x = E 02 2 u (ωT0 ) = e, usando a = 3 2x 8π E 0 → E 02 x = u (ω0 ) 8π 3 e2 π2 c 3 , obtemos U = u (ω0 ) 3 mc 3 ω02 e podemos trocar ω0 com ω, já que ω0 é arbitrário e deveremos ter osciladores em todas as frequências. π2 c 3 U = u (ω) ω2 Como ω = 2 πν , e como a quantidade de energia entre ω - ω + dω é igual a quantidade de energia entre as equivalentes frequências ν → ν + dν. u (ω )dω = u (ν )dν → u (ω ) = u(ν ) 2π ou seja, U = U= π 2 c 3 u( ν ) 4 π2 ν 2 2 π c3 8πν 2 u (ν ) Esta é uma relação geral entre a energia do sistema e a densidade de energia no campo de radiação mostrando que a energia total dos osciladores que constituem a 23 radiação é uma função universal da mesma forma que a densidade de energia da radiação de corpo negro. Estamos procurando uma expressão para u (ν,T) do corpo negro, mas segundo Planck isto é equivalente a procurar a energia total do oscilador em equilíbrio com a radiação. Para podermos calcular u (T) vamos associar ao oscilador uma entropia S associado a uma temperatura T, de modo que: dS = dU T Isto é uma maneira adequada de tratar o problema: usar entropia ao invés de energia. Agora consideremos que fosse válido a lei de Wien, então usaríamos: u (ν, T ) = ν αKA 3 − α T ν e c3 Usando este resultado na epressão para U, obtemos: c 3 αKA 3 − αυ / T αK U = ν e = νAe − αυ / T 2 3 8 8 πν c de onde podemos eliminar a temperatura, obtendo a relação: 1 1 U = − Ln T αν α kν A 8 Como 1 dS = , podemos tomar uma nova derivada com respeito à U obtendo a T dU grandeza característica d 2S dU 2 24 este é o valor de d 2S quando assumimos relação de Wien. dU 2 Vamos agora assumir como verdadeira a relação de Rayleigh-Jeans para u( ν , T ) . Neste caso, u (ν , T ) = e com isto, 8 πνkT c3 1 K dS d 2S K = = ou seja = − 2 o sistema oscilador-radiação que é 2 T U dU dU U relação entropia-energia quando Rayleigh-Jeans é verdadeiro. Como sabemos dos resultados experimentais, Wien concorda para altas frequências enquanto Raylegh-Jeans concorda para baixas frequências. Desta forma, Planck assumiu que ambas devem ser verdadeiras em seus respectivos limites, tornando assim: d 2S 1 = − 2 dU αν U + U 2 / K Note que esta foi uma suposição feita por Planck que poderia não ter funcionado. A equação d 2S pode ser integrada com a radiação que quando U → ∞, devem dU 2 necessariamente ter T → ∞, portanto, dS dS 1 → 0 já que = . Com isto, dU dU T dS 1 U / ανκ = ln dU αν 1 + U / ανκ e como dS 1 = dU T ln U / ανκ αν =− 1 + U / ανκ T 25 de onde tiramos, substituindo α = h / K hν U = e hν / kT −1 que usado de volta na expressão que relaciona Ueµ(υ, T ) , teve a µ(ν, T ) = 8 πν 2 hν 3 hν / kT c e −1 que é a lei de Planck para a radiação, estabelecendo uma expressão completa válida para todo intervalo espectral. Os limites para baixo ν, leva à lei de Rayleigh-Jeans enquanto o limite para alta υ, leva à lei de Wien. É importante observar que o que Planck fez foi tratar a radiação contida na cavidade como sendo um sistema constituído de osciladores em equilíbrio com radiação e tratar este sistema termodinamicamente. A fórmula obtida por Planck inicialmente tratava-se de uma adivinhação sem nenhuma forte justificativa teórica. Alguns meses mais tarde, Planck deduziu sua relação baseada numa hipótese mais fundamentada. Sua nova demonstração baseia-se no fato que a energia de um oscilador não é uma grandeza contínua mas tem apenas valores discretos múltiplos de uma quantidade elementar denominada do quantum de energia. Assim, nesta hipótese, a energia do campo de radiação não pode assumir qualquer valor mas sim, múltiplos inteiros de um valor ε0 U = nε 0 n = 0, 1, 2, 3......... Com esta expressão podemos calcular a energia média do campo à uma determinada temperatura T (da mesma forma que fizemos ao tratar o gás ideal). ∞ ∫ U U= ∫ e −U / kT e 0 ∞ 0 −U / kT dU dU 26 Quando permitimos E ser contínuo, E = kT , mas sendo discreto, o integral transforma-se numa soma ∞ ∑ nε e U= ∑η e ηε − nε 0 / kT n =0 ∞ 0 − 0 / kT =0 que pode ser escrita como: U =− d dβ ∞ − nε 0 β ∑ e n =0 Esta soma é uma progressão geométrica de valor 1 1 − e − βε 0 Assim U = ε0 e −βε 0 ε = ε 0 / kT0 − βε 0 1−e e −1 c3 8π ε que usada em U = µ(υ, T ) , leva a µ(υ, T ) = 3 υ2 ε 0 / kT0 2 8 πυ c e −1 Para que esta expressão concorde com Rayleigh-Jeans e Wien nos apropriados limites, temos que ter ε0 = hν, ou seja 8 πh υ3 µ(υ, T ) = 3 hυ / kT c e −1 que é fórmula de Planck. Esta brilhante dedução introduz o conceito de quantização, exigindo uma discretização da energia ao invés de permitir sua variação contínua. Isto foi um dos pontos mais importantes no estabelecimento da mecânica quântica. O estabelecimento da relação Energia Média = ε e ε / kT −1 traz um conceito muito 27 mais abrangente que é chamada estatísticas quântica. A expressão acima representa a probabilidade de um determinado sistema ter energia ε, isto é, P (ε ) = 1 e ε / kt −1 Caso tenhamos um número N destes sistemas o provável número de osciladores com energia ε será: N (ε ) = 1 e ε / kt −1 Esta relação estabelece o chamado número de ocupação do estado com energia ε um importante conceito que veremos posteriormente. A fim de ilustrar o uso deste conceito vamos calcular o calor específico de um sólido que será aqui considerado como sendo uma coleção de osciladores harmônicos desacoplador. Este modelo é denominado de sólido de Einstein. A energia de um mol de tais osciladores é: U = 3N0 hυ e ε / kT −1 onde estamos considerando as 3 direções como independentes. O calor específico ao volume constante e, portanto: dU e hν / kT hν Cv = = 3N0k 2 dT kT e hν / kT − 1 2 ( ) e hν / kT ≅ 1 + hν / kT 1 hν Inicialmente, para altas temperaturas Cv = 3N0k ≅ 3N0k 2 kT hν kT 2 28 que é um resultado bastante conhecido. (Cν = 6 Cal/Mol ok) Para baixas temperaturas, 2 hυ − hυ / kT Cν = 3 N 0 k e kT que quando T → 0 a exponencial é dominante perante o termo quadrático. A variação Cv(T) está mostrado abaixo. 3 - O Caráter de Partículas para Radiação Eletromagnética Como vimos anteriormente, a existência do fóton de Planck como sendo a menor porção de radiação eletromagnética que ainda preserva todas as características da radiação começa a estabelecer um comportamento diferente para o campo eletromagnético. A possibilidade de poder tratar a radiação como constituída de pequenas porções que carregam energia e momentum, dão ao campo eletromagnético uma característica de partículas. Uma série de eperimentos estudados e eplicados no início do século revelam o comportamento corpuscular da radiação distinguindo-a de seu comportamento ondulatório tão evidente quando estudamos e descrevemos sua programação num meio material ou mesmo efeitos como interferência e difração Veremos agora alguns dos experimentos que revelaram este comportamento dual para a radiação. O primeiro efeito a estudarmos é o Efeito de Fotoelétrico. Ao redor de 1886, em 29 seus estudos envolvendo radiação e descargas em gases rarefeitos, H. Hertz observou que quando a radiação ultravioleta incidia sobre um dos eletrodos da descarga, esta ocorre mais prestemente, ou seja, a presença da radiação ultravioleta sobre um dos eletrodos, facilitava a descarga. Estudos seguidos por Lenard mostraram que o efeito da radiação na descarga era que a radiação ultravioleta fazia com que a superfície metálica do eletrodo emitisse elétrons. Este fenômeno da ocorrência de elétrons ejetados pela superfície de um metal quando iluminada pela luz suficientemente energética, é denominado de efeito fotoelétrico. O dispositivo eperimental que permite a observação deste efeito está esquematizado na figura abaixo: Brevemente descrevendo o sistema, uma ampola de quartzo evacuada, contém no seu interior dois eletrodos que encontram-se polarizados. Radiação monocromática de frequências ν atravessa as paredes de quartzo incidindo sobre a superfície do ânodo (polo negativo). A superfície metálica do eletrodo ejeta elétrons denominados de fotoelétrons que caminham em direção ao catodo (polo positivo). Os fotoelétrons podem ser medidos através da corrente produzida, indicada pelo amperímetro A, inserida em série com o circuito da ampola. A diferença de potencial entre os eletrodos pode ser variada através do potenciômetro indicado. Se graficarmos esta fotocorrente como função da voltagem de polarização, obtemos a curva mostrada na figura abaixo: 30 Quando aumenta-se indefinidamente a voltagem de polarização observamos que a fotocorrente não aumenta indefinidamente, mas sim atinge um valor de saturação aqui denominada de Is. Ao variarmos a intensidade da luz incidente, notamos que o valor da saturação também aumenta. Outra informação importante é que ao invertermos a polarização entre os eletrodos a fotocorrente não cai a zero abruptamente, mas sim lentamente até a polarização reserva atingir um determinado valor Vo que inibe completamente a fotocorrente. Esta observação nos permite concluir que os elétrons ejetados possuem uma determinada energia cinética. Enquanto a polarização é positiva eles são acelerados para o cátodo, quando a polarização é nula, eles não são acelerados, mas sua energia cinética (pelo menos de um grande número dos fotoelétrons) é suficiente para conduzí-lo ao cátodo produzindo a fotocorrente mesmo a polarização nula. Ao invertermos o potencial, o campo elétrico da polarização passa a trabalhos contrários ao movimento dos elétrons. Os elétrons mais energéticos são aqueles que conseguem sobreviver até a máxima voltagem invertida Vo. Neste ponto, a força elétrica é suficiente para desacelerar mesmo os elétrons ejetados de maior energia, impedindo que atinjam o “cátodo”. Chamando de Kmax, a máxima energia cinética dos fotoelétrons, temos que esta, relacionados com Vo pela relação: Kmax = eVo ou seja, o potencial elétrico é igual à energia cinética na situação onde a corrente vai a zero. Observa-se que Vo (ou Kmax) independe da intensidade da luz incidente. Se medirmos o potencial Vo para diferentes frequências da luz incidente, observamos que abaixo de determinada frequência denominada de frequência de corte νo, não há mais produção de fotoelétrons. Observa-se que νo é característico do metal que constitui a superfície (para sódio, νo = 4,39 10 14Hz). 31 Ao tentarmos explicar as observações no efeito fotoelétrico utilizando-se do conhecimento do eletromagnetismo clássico, aparecem várias contradições. Em primeiro lugar, notamos que a teoria ondulatória da radiação eletromagnética requer que o campo elétrico da radiação tenha maior amplitude quanto maior for a intensidade. Quanto maior for este campo, maior será a força sobre os elétrons do sólido, isto sugere que quanto mais intensa for a luz maior deveria ser a energia cinética dos elétrons ejetados. No entanto, observa-se experimentalmente que Kmax = eVo independe da intensidade da raidação incidente. Outra contradição é que segundo a teoria ondulatória, os fotoelétrons devem aparecer sempre que a energia do campo transferida ao elétron for intensa o suficiente para arrancá-lo. Isto não é verdade, porque não importa o quanto intensa seja a radiação, abaixo da frequência νo não há produção de elétrons. Este resultado mostra que o que é importante no problema é a frequência e não a intensidade de radiação. Outra contradição vem do fato que a luz apresenta um fluxo contínuo de energia (segundo teoria clássica), e se trabalharmos com baixas intensidades, a transferência de energia da radiação para o elétron, a fim de removê-lo, ocorrerá num tempo finito diferente de zero. No entanto, nenhum tempo de atraso entre ligar a radiação e detectar os elétrons tem sido observado, a menos do tradicional tempo de vôo, mostrando que a transferência de energia também não é bem explicada. Influenciado pelos experimentos do efeito fotoelétrico e conhecedor do eletromagnetismo, A. Einstein em 1905 propôs uma nova teoria para a luz que tinha como supote a explicação para o efeito fotoelétrico. Como já havia sido mencionado por Planck, ao tratar da radiação do corpo negro, que a radiação dos elétrons que constituíam paredes de uma cavidade emitiam radiação quantizada, Einstein propôs que a energia radiante é sempre quantizada em porções, que mais tarde vieram a ser chamadas de fótons. A aparente contradição de que isto teria nos experimentos de interferência e difração era explicada por Einstein como se tratando de situações onde um número muito grande de fótons estão envolvidos e os resultados representam uma média sobre o comportamento de vários fótons. Einstein concentrou sua atenção na forma com que os fótons são emitidos ou absorvidos. Assim, do resultado de Planck de que a energia da radiação tem energia 0, 1hν, 2hν, ...nhν, para Einstein isto adivinha do fato de que indo do estado nhν para (n+1) hν, a fonte emitiu um fóton de energia, ou absorveu no caso do processo oposto. Na hipótese de Einstein, este pacote de energia (fóton), está sempre localizado num 32 determinado volume de espaço que não se deslocaliza ao propagar-se com velocidade c. Para ele, a quantidade de energia neste pacote é: E = hν Para explicar o efeito fotoelétrico, Einstein assumiu que neste processo um fóton absorvido pela superfície libera um elétron de modo que a energia cinética do elétron ejetado é: K = hν - w dependendo apenas da energia do fóton (hν) e de w que é o trabalho necessário para remover o elétron do metal. Este trabalho é necessário para superar a atração que o elétron sente no metal e eventuais perdas no processo de ejeção (como colisão, etc). Alguns dos elétrons estão mais fortemente ligados, outros perdem mais energia na saída, de modo que mesmo sendo constante a energia do fóton, a energia cinética do elétron ejetado pode variar bastante. Isto é representado pela região de transiente nas curvas Ivs V. Os elétrons mais fracamente ligados e que apresentam a maior perda no processo de saída são aquelas que apresentarão a máxima energia cinética. Assim, Kmax = hν-wo onde Wo só depende do metal e é denominada de função trabalho, e representa o trabalho mínimo necessário para remoção do elétron. Esta explicação sustenta, de forma satisfatória, o fato de que a energia cinética dos fotoelétrons não dependa da intensidade da radiação. Um feixe de luz mais intensa, somente representa mais fótons, de modo que há produção de um número maior de fotoelétrons. Porém, sem nenhuma razão para aumento de sua energia dos elétrons. A observação de que abaixo de determinada frequência da luz incidente não se observa mais elétrons, advém do fato que a energia do fóton não tem energia para remover o elétron, não interessando quanto deles atinjam a superfície. Finalmente não haverá atraso na emissão porque toda energia é absorvida de uma única vez e não paulatinamente. 33 Como Kmax = eVo, podemos escrever: V0 = hν wo − e e Obtendo a relação linear mostrada anteriormente, e mais do que isto, com a corrente inclinação h/e = 3.910V-sec., que é um valor que só depende das constantes fundamentais. As suposições de Einstein, junto com sua explicação para o efeito fotoelétrico, lhe renderam o Prêmio Nobel em 1921. A idéia de fóton estabelecida por Einstein constitui um dos mais importantes conceitos da física moderna. Utilizando este conceito, junto com Bose eles determinaram a expressão da radiação de Planck, simplesmente tratando radiação como um gás de fótons como vimos anteriormente. Uma das demonstrações mais claras do comportamento corpuscular para a radiação encontra-se no Efeito Compton demonstrado em 1923. No experimento de Compton, um feixe de raio-x quase que monocromático de comprimento de onda λ é incidente sobre um alvo. O raio-x é espalhado pelo elétrons deste alvo, e a medida da intensidade espalhada para vários comprimentos de onda mostrou-se dependente do ângulo de espalhamento, dando origem a um segundo pico num comprimento de onda distinto àquele incidente. Assim, um raio x de energia distinta é originado neste processo. O resultado mostra que a radiação espalhada apresenta dois comprimentos de onda distintos λ (incidente) e λ cuja posição relativa à λo depende do ângulo de espalhamento. Esta variação ∆λ = λ' −λo é denominda de deslocamento Compton, que evidentemente depende do ângulo de espalhamento. Este deslocamento do comprimento de onda não pode ser explicado através da teoria eletromagnética clássica, segundo o qual, quando a radiação interage com um sistema atômico, faz com que o sistema oscile e reemita na mesma frequência. Assim, baseado no entendimento clássico, o comprimento de onda da radiação espalhada pelos elétrons do alvo deveriam ser igual ao incidente. A fim de explicar os resultados obtidos experimentalmente Compton adotou a visão quântica supondo que a radiação é composta de fótons, cada um com energia E = hν, e que durante a interação destes com o alvo, o comportamento é semelhante ao 34 processo de colisão entre partículas. Durante a colisão, o fóton (radiação) transfere aos elétrons do alvo uma porção de sua energia de modo que os fótons emergentes apresentam energia mais baixa E’. Assim, como E’ < E, necessariamente os fótons emergentes apresentam menor frequências ν’ = E’/h que os incidentes. Tendo uma frequência menor ν ' = longo, explicando o deslocamento c λ , representa um comprimento de onda mais de comprimento de onda observado experimentalmente. É importante salientar que os fótons que mudaram de frequência são aqueles que colidiram inelasticamente com o alvo. Há, no entanto, os que colidem elasticamente responsáveis pelo pico de intensidade não deslocado. Vamos tratar a interação fóton-elétron (do alvo) afim de obtermos resultados quantitativos para este processo. Para nós, a situação física está mostrada abaixo: Ao interagir com os elétrons do alvo, a radiação é espalhada segundo um ângulo θ, enquanto elétrons sofrem um recuo adquirindo energia cinética K e momentum p na direção γ com relação a direção inicial de incidência. Iniciemos considerando a relação relativística energia-momentum: E 2 = p 2 c 2 + m02 c 4 de modo que para partículas (fótons) com energia E = hν, temos associado a elas momentum segundo a relação h 2 ν 2 = c 2 p 2 , já que a massa de repouso mo dos fótons é nula. Assim, p = hν h = é o momentum carregado pelos fótons. c λ Vamos assumir que a colisão do raio-x com o alvo deve-se essencialmente a interação com os elétrons, já que os resultados medidos mostraram-se independentes do 35 material do alvo. Assim, considerando a colisão de um fóton com um elétron estacionário como mostrado anteriormente, apliquemos as conhecidas leis de conservação de energia e momentum. Da conservação de momentum, usando os parâmetros mostrados acima, hν 0 hν ' = cos θ + p cos ϕ c c (direção X) hν ' sen θ = p sen ϕ c (direção Y) De onde obtemos, elevando ambas equações ao quadrado. hνo hν ' − cos θ = p 2 cos2 ϕ c c 2 hν ' 2 2 2 sen θ = p sen ϕ c 2 e adicionando estas duas equações acima, 2 2 hνo hv' hν o hv' cos θ = p 2 + −2 c c c c Da conservação da energia, inicialmente temos somente a energia do fóton incidente e a energia de repouso do elétron. hνo + moc2 = hν’ + K + moc2, ou seja, hν' hv hνo − hν' = K ⇒ c 0 − = K c c Para o elétron, podemos escrever (K + moc2)2 = c2p2 + (moc2)2, de onde tiramos: K 2 / c 2 + 2Km0 = p2 36 Expressando K em termos de ν0 e ν’ nesta última equação e utilizando a equação anterior, tiramos: 2 2 2 hν 0 hν' hv' hν' hν 0 hν 0 hν hν' − cos θ + 2 moc 0 − = + − c c c c c c c c 2 ou seja, hν 0 hν' hν' hν (1 − cos θ) m0 c 0 − = c c c c que pode ser reduzida dividindo ambos os membros por: hν 0 hν' c c a : c c 1 − = (− 1 − cos θ) hν' hν 0 m0 c e multiplicando por h ∆λ = λ' ' −λo = h (1 − cos θ) m0 c que é a chamada equação de Compton e fornece o deslocamento do comprimento de onda espalhado relativo ao incidente. A quantidade λc = h = 0 ,0243 A0 para elétron é chamado de comprimento de m0 c onda Compton e representa a ordem de grandeza da variação de λ devido ao espalhamento. ∆λ poderá variar até 2 λc. Como estamos tratando do espalhamento de raio-x pela matéria, é conveniente entendermos um pouco a respeito da produção de raio-x. Em 1895 W. Roentgen observou que radiação altamente energética de natureza não conhecida era produzida quando elétrons acelerados colidiam com a matéria e que foram denominados de raio-x. Os raios eram mais penetrantes quanto mais rápidos eram os elétrons que os produziam e a densidade de Raio-X maior quanto maior a quantidade de elétrons. Logo depois de sua descoberta, sua natureza eletromagnética foi revelada 37 porque, afinal, o que estava acontecendo era que, durante o impacto na matéria, o elétron veloz é altamente desacelerado, emitindo radiação. A radiação produzida nestas circunstâncias é denominada de "Bremsstrahlumg" (do alemão). Um esquema para produção de Raio-x é mostrado na figura abaixo. Um cátodo aquecido gera elétrons que são acelerados contra um alvo metálico mantido com o ânodo. A ampola que constitui esta fonte de raio-x está sob vácuo para impedir que os elétrons sejam espalhados antes de atingirem o alvo. Ao atingirem o alvo, estes elétrons rápidos são trazidos ao repouso e, neste processo de desaceleração, é produzido radiação: o raio-x. Utilizando-se dois alvos distintos temos os resultados mostrados a seguir: Os dois materiais apresentam comportamentos distintos. No caso de Mo, notamos que determinados comprimentos de ondas apresentam produção mais acentuada de raio-x. Estes picos dependem do material e são originados devido a um rearranjo na estrutura eletrônica do alvo, sendo bombardeados pelos elétrons do feixe. Este fato é importante para produção de comprimentos de ondas bem definidos. Notamos, ainda, que existe um comprimento de onda mínimo a partir do qual não temos produção de raio-x. 38 No processo que estamos descrevendo temos energia cinética dos elétrons, sendo transformados em radiação, de modo que, para uma determinada voltagem V, temos um comprimento de onda mínimo, dado por: hν max = hc λmin = eV , de onde tiramos: λmin = 1,24 x10 −6 (em metros) V (emvolts ) Assim 35,0 kv, temos λmin = 1,2410-6 / 0,35104 = 3,5010m-10 = 0,35A que concorda com os resultados mostrados no gráfico anterior. 4- Comportamento Ondulatório para Partículas Como vimos anteriormente, em um grande número de situações o comportamento de partículas para ondas eletromagnéticas e sua quantização é a única forma de explicação para um número grande de observações experimentais, como as leis de radiação de um corpo negro, o efeito fotoelétrico e o espalhamento Compton. Existem, no entanto, uma série enorme de outros experimentos envolvendo partículas cujos resultados só podem ser explicados se associarmos a elas um comportamento ondulatório. Vamos agora discutir estes experimentos. Vamos iniciar nossa discussão introduzindo o conceito de ondas materiais introduzida pela físico francês Louis de Broglie, que analisando experimentos do efeito fotoelétrico e de Compton, lançou a hipótese de que não somente as ondas apresentam características de partículas mas, também, as partículas possuem comportamento ondulatórios. Segundo a hipótese de De Broglie, da mesma forma que associamos a uma onda de comprimento de onda λ um momentum p a toda partícula de momentum p pode ser associada um comprimento de onda. Assim, tanto para partícula material como para radiação, temos que a energia e frequência estão relacionados por: E = hν 39 e que o momentum p e o comprimento λ estão relacionadas através da radiação. P = h/λ Com estas equações, veremos que os conceitos de partículas (E e p) estão relacionados aos conceitos de onda (ν e λ) através da constante de Planck h. O comprimento de onda λ = h/p estabelece a chamada relação de De Brolgie e associa a cada entidade de momentum p um comprimento de onda λ. Assim, ao considerarmos uma bola de tênis com velocidade de 10m/seg., estamos tratando de uma onda cujo comprimento é λ ≅ 610-24 A0 infinitamente menor do que as dimensões físicas da bola. Se considerarmos, por outro lado, um elétron a 100eV, temos associado a ele λ = 1,2 A. Ao tratarmos a radiação devemos lembrar que a óptica geométrica estava presente sempre que as dimensões do dispositivo óptico em estudo (espessura de lente, distância entre espelhos ou tamanho de fendas) forem muito maiores do que o comprimento de onda da radiação em questão. Assim, chamando de d as dimensões típicas do sistema óptico, o limite λ/d → 0 representa a validade da óptica geométrica. Quando as dimensões do sistema que interagem com a radiação são comparáveis ao comprimento de onda, efeitos de difração da ordem de θ = λ/d são predominantes no processo e a manifestação da difração passa a ser importante, dando lugar ao domínio da óptica física. O mesmo ocorre com a manifestação da natureza ondulatória para partículas. Estas necessitam de sistemas de dimensões muito pequenas para poderem se manifestar. Para a bola de tênis descrita acima, sua manifestação ondulatória estaria presente quando ela interagisse com sistemas de dimensões da ordem de 10-24 A0 que não estão a disposição. Por outro lado, elétrons que apresentam comprimento De Broglie da ordem de 1A0, devem manifestar sua natureza ondulatória ao interagirem com estruturas cujas dimensões típicas são desta ordem, como cristais, superfícies sólidas, etc. Assim, semelhantemente aos raios-x, a interação de elétrons com redes cristalinas sólidas devem produzir padrões de difração. Os átomos na rede cristalina convenientemente espaçadas funcionam como centros de difração para os elétrons. Deste modo, Davisson e Germer realizaram um experimento onde elétrons acelerados por uma diferença de potencial V emergem do sistema com uma energia eV e colidem com uma superfície sólida e são posteriormente detectados por um detector D. O 40 esquema deste experimento está mostrado a seguir: O detector pode ser posicionado para qualquer ângulo θ. Numa primeira experiência, vamos fixar o ângulo θ de observação e variar a energia cinética do feixe eletrônico emergente através de variação do potencial de grade. Como resultado, observamos o resultado abaixo: A existência de um máximo nos elétrons difratados, como função de sua energia cinética, só pode ser explicado através da ocorrência de uma interferência construtiva quando elétrons apresentam uma determinada energia ou comprimento de onda. Esta interferência ocorre devido a elétrons serem espalhados em planos atômicos sucessivos do cristal. Este resultado experimental comprova, de forma irrefutável, a hipótese de Broglie, associando à partícula um comportamento ondulatório. Este mesmo resultado pode ser confirmado se fixarmos o potencial de aceleração em 54V e variamos o ângulo de observação. 41 A explicação desta observação pode ser feita analogamente à análise do espalhamento de Bragg e não pode, de forma alguma, ser explicada através do movimento clássico de partículas, pois partículas não apresentam interferências. Assim, se tratarmos elétrons como ondas de comprimento λ sendo refletidas pelos planos cristalinos de um cristal espaçados por d, podemos explicar as observações: A diferença de caminho entre os feixes é de 2d senϕ e haverá interferência construtiva sempre que esta diferença for um número inteiro de λ. nλ = 2d senϕ (no esquema do experimento 180-θ = 2ϕ) É importante salientar que, quando dizemos que elétrons sofrem interferências, não queremos dizer que ondas associadas com um elétron interferem com ondas associadas com outro elétron, mas sim estamos nos referindo à interferência entre partes diferentes da onda associada com o mesmo elétron. Assim, mesmo que tivéssemos trabalhando com um feixe eletrônico de intensidade bastante baixa, de modo que somente um elétron de cada vez colidisse com o cristal, observaríamos o mesmo padrão de interferência. No caso do cristal usado por Davisson e Germer, d = 0,91A (determinada por RX) de modo que λ = 2d sen γ = 2x 0,91 sen 65o ou seja λ = 1,65A0 . Se calcularmos λ usando a relação de De Broglie, h 6.610 −34 λ= = j − sec = 1,65 A0 − 24 P 410 ...m / seg (Me = 9,110-31 kg 1 e V = 1,610-19 joule) 42 Mostrando evidências experimentais claras da validade da relação de De Broglie. O experimento de Davisson e Gerner não foi o único que comprovou de forma marcante a relação de De Broglie. Experimentos realizados por G.P. Thomson em 1927 com espalhamento de elétrons em folhas finas de metal demonstrou os padrões de interferência que revelaram, de forma definitiva, a natureza ondulatória do elétron. Em 1937 G.P. Thomson e Davisson ganharam o Prêmio Nobel pela brilhante demonstração da natureza ondulatória do elétron. Somente a título de curiosidade, G.P. Thomson era filho de J.J. Thomson que, em 1897 descobriu o elétron. Os livros textos relatam que na época que G.P. Thomson ganhou o Prêmio Nobel, a comunidade científica da época brincava ao dizer que "Thomson" (o pai) ganhou o Prêmio Nobel por demonstrar que o elétron é uma partícula, enquanto que "Thomson" (o filho) ganhou o Prêmio Nobel por demonstrar que o elétron é onda. Melhor assim, pois as discordâncias entre eles não passou de um mero problema familiar e a comunidade científica absorveu ambos os conceitos, atribuindo ao elétron um caráter dual de onda-partícula. Não somente os elétrons, mas todas as partículas materiais apresentam comportamento ondulatório. Outros experimentos realizados por Estermann, Stern e Frisch demonstraram a difração de feixes moleculares de hidrogênio e hélio de uma superfície de LiF. No gráfico abaixo, mostramos o padrão de difração de feixes atômicos Hélio e H2 por cristais LiF. Experimentos mais modernos têm sido capazes de estabelecer de forma completa a chamada “Optica Atômica”. UNIVERSIDADE DE SÃO PAULO INSTITUTO DE FÍSICA DE SÃO CARLOS DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS CAPÍTULO VI COMPORTAMENTO ONDULATÓRIO PARA PARTÍCULAS E O PRINCÍPIO DE INCERTEZA DE HEISENBERG PROF. VANDERLEI S. BAGNATO 2 In classical physics science started from the belief – or should we say illusion? – that we could describe the world or at least parts of the world without any reference to ourselves. This is actually possible to a large extent. We know that the city of London exists whether we see it or not. It may be said that classical physics is just that idealization in which we can speak about parts of the world without any reference to ourselves. Werner Heisenberg 3 Capítulo VI COMPORTAMENTO ONDULATÓRIO PARA PARTÍCULAS E O PRINCÍPIO DE INCERTEZA DE HEISENBERG Como vimos nos capítulos anteriores, em um grande número de situações o comportamento de partículas para ondas eletromagnéticas (fótons) é a única forma de explicar observações experimentais como a radiação de um corpo negro, o efeito fotoelétrico e o espalhamento Compton. Existem, no entanto, uma série de outros experimentos envolvendo partículas cujos resultados só podem ser explicados se associarmos a elas um comportamento ondulatório. Vamos nesta parte do curso discutir estes conceitos inicialmente propostos pelo físico Louis De Broglie. Iniciemos nossa discussão introduzindo o conceito de ondas materiais introduzida por De Broglie que, analisando experimentos do efeito fotoelétrico e de Compton, lançou a hipótese de que não somente as ondas apresentam características de partículas, mas também as partículas possuem comportamento ondulatório. Segundo a hipótese de De Broglie da mesma forma que associarmos à uma onda de comprimento de onda λ um momentum p , a toda partícula de momentum p pode ser associado a um comprimento de onda. Assim, tanto para partículas materiais como para radiação, temos que a energia e freqüência estão relacionados por: E = hυ como E = pc; hυ = pc e assim tiramos que o momentum p e o comprimento λ estão relacionados através da relação: p= h λ convencionalmente chamada de relação de De Broglie. 4 Os parâmetros que normalmente caracterizam partículas E e p estão relacionados aos conceitos que normalmente caracterizam onda ν e λ através da constante de Planck h. O comprimento de onda λ= h associa a cada entidade de momentum p um p comprimento de onda λ. Como exemplo, seja uma bola de tênis com velocidade 10m/seg, aplicando a relação acima, vemos que estamos tratando de uma onda cujo comprimento é: λ=6 x 10-24Å, infinitamente menor do que as dimensões físicas da bola. Se considerarmos, por outro lado, um elétron a 100 e V, associados a ele temos λ = 1,2 Å Recordemos que no âmbito da óptica, a chamada óptica geométrica está presente sempre que as dimensões do dispositivo óptico em estudo (espessura da lente, distância entre espelhos ou tamanho de fendas) forem muito maiores do que o comprimento de onda da radiação em questão. Assim, chamando de d as dimensões típicas do sistema óptico, o limite λ/d→0 representa a validade da óptica geométrica. Quando este limite não vale temos o domínio da óptica física, onda efeitos inerentes da natureza ondulatória se manifestam. O mesmo ocorre com a manifestação da natureza ondulatória das partículas, que necessitam de sistemas com dimensões típicas muito pequenas para se manifestarem. Para a bola de tênis descrita acima, sua manifestação ondulatória estaria presente 0 quando ela interagisse com sistemas de dimensões da ordem de 10-24 A que não estão à disposição. Por outro lado, elétrons que apresentam comprimento de De Broglie da ordem de 1Ao, devem manifestar sua natureza ondulatória ao interagirem com estruturas cujas dimensões típicas são desta ordem, como é o caso do arranjo atômico em cristais, superfícies sólidas, etc. Assim, semelhantemente aos raios – x, a interação de elétrons com redes cristalinas sólidas, devem produzir padrões de difração. Os átomos na rede cristalina, uniformemente arranjadas, funcionam como centros de difração para os elétrons. Deste modo, Davisson e Germer realizaram um experimento onde elétrons acelerados por uma diferença de potencial V emergem do sistema com uma energia eV e colidem com uma superfície sólida e são posteriormente detectados por um detector D. O esquema deste experimento está mostrado a seguir: 5 O detector pode ser posicionado em qualquer ângulo θ, permitindo observações com dependência angular. Numa primeira observação vamos fixar o ângulo θ de observação e vamos variar a energia cinética do feixe eletrônico emergente. Isto pode ser feito através de variação do potencial de grade. Como resultado observa-se o gráfico mostrado abaixo: A existência de um máximo nos elétrons difratados como função de sua energia cinética só pode ser explicado através da ocorrência de uma interferência construtiva quando elétrons apresentam uma determinada energia ou comprimento de onda que permita este efeito. Esta interferência ocorre devido à elétrons espalhados em planos atômicos sucessivos do cristal. Este resultado experimental comprova, de forma clara, a hipótese de De Broglie, associando às partículas um comportamento ondulatório. Este mesmo resultado pode ser confirmado se fixarmos o potencial de aceleração em 54V, e variarmos o ângulo de observação. 6 A explicação destas observações pode ser feita analogamente à análise do espalhamento de Bragg, e não pode de forma alguma ser explicado através do movimento clássico de partículas, pois partículas não apresentam interferência. Assim, se tratarmos elétrons como ondas de comprimento λ sendo refletidas pelos planos cristalinos de um cristal espaçados por d, temos a situação mostrada abaixo: A diferença de caminhos entre os feixes espalhados em dois planos sucessivos é 2d senϕ e haverá interferência construtiva sempre que esta diferença for um número inteiro de λ. nλ = 2d senϕ (no esquema do experimento 180 - θ = 2ϕ) É importante salientar que quando dizemos que elétrons sofrem interferência, não queremos dizer que ondas associadas com um elétron interfere com onda associada com outro elétron, mas sim estamos nos referindo à interferência entre partes diferentes da onda associada com o mesmo elétron. Assim, mesmo que tivéssemos trabalhando com um feixe eletrônico de intensidade bastante baixa, de modo que somente um elétron de 7 cada vez colidisse com o cristal, observaríamos o mesmo padrão de interferência, quando o experimento fosse repetido um grande número de vezes. No caso do cristal usado por Davisson e Germer, d~0,9Å (determinado por técnicos de raio X) de modo que λ = 2d sen ϕ = 2 x 0,91 sen 65o, ou seja λ = 1,65Å. Se calcularmos λ usando relação de De Broglie, para elétron com energia de 54 eV, h 6.610 −34 j − sec . λ= = = 1,65Å p 410 −24 kgm / sec . (µ me = 9,1 10-31kg 1eV = 1,6 10-19 joule) mostrando evidências experimentais claras de validade da relação de De Broglie. O experimento de Davisson e Germer não foi o único que comprovou de forma marcante a relação de De Broglie. Experimentos realizados por G.P. Thompson em 1927 com espalhamento de elétron em folhas finas de metal demonstrou os padrões de interferência que revelaram de forma definitiva a natureza ondulatória do elétron. Em 1937 G.P. Thompson e Davison ganharam o Prêmio Nobel pela brilhante demonstração da natureza ondulatória do elétron. Somente a título de curiosidade, G.P. Thompson era filho de J.J. Thompson que em 1897 descobriu o elétron (como partícula). Os livros texto relatam que na época que G.P. Thompson ganhou o Prêmio Nobel, a comunidade científica da época brincava ao dizer que Thompson (o pai) ganhou o Prêmio Nobel por demonstrar que o elétron é uma partícula, enquanto Thonspon (o filho) ganhou o Prêmio Nobel por demonstrar que o elétron é uma onda. Melhor assim, pois as discordâncias entre eles não passaram de um mero problema familiar e a comunidade científica absorveu ambos os conceitos, atribuindo ao elétron um caráter dual de ondapartícula, até hoje ultilizado. Não são somente os elétrons, mas todas as partículas materiais apresentam comportamento ondulatório. Outros experimentos realizados por Estermann, Stern e Frisch demonstraram a difração de feixes moleculares de hidrogênio e hélio em uma superfície de LiF. Hoje já é possível construir interferômetros de partícula maiores que átomos . Tendo o comportamento de onda, é natural que associemos às partículas uma função de onda que descreva o seu movimento ondulatório. Esta função é normalmente denotada de ψ e representa a função de onda de uma partícula cujo comprimento 8 associado é λ. Partículas que se movem na direção x com um valor preciso de momentum e energia, deve ser representado por uma onda plana de parâmetros. λ= E h e υ= p h Denotando de A a amplitude desta onda, temos: x − νt λ ψ ( x ,t ) = A sen 2π Esta função de onda associada à partícula animada de momentum, deve ser interpretada como estando relacionada com a probabilidade de que a partícula esteja numa determinada posição num determinado instante de tempo. Esta é a chamada interpretação probabilística para a mecânica ondulatória. Segundo esta interpretação a função de onda ψ, por si só, não apresenta um significado físico direto, pois uma função de onda, de um modo geral, assume valores positivos e negativos e a probabilidade não representa nada físico, quando toma valores negativos. Assim, ψ não representa um observável físico. Se, no entanto, considerarmos a função ψ2, as objeções colocadas acima não mais se aplicam. Desta forma, podemos dizer que a densidade de probabilidade deve estar associado com ψ2. A interpretação probabilística de mecânica ondulatória toma, então, o seguinte aspecto: “A probabilidade de experimentalmente acharmos a partícula descrita pela função de onda ψ (x, t) na posição x e no instante t é ψ ( x,t ) . 2 Desta forma, quando ψ2 tem um valor elevado, significa que é grande a probabilidade de encontrarmos a partícula naquela localidade no instante de tempo considerado. Desde que ψ2 não seja nulo há chance de que a partícula seja encontrada num determinado ponto quando uma medida é realizada. A interpretação probabilística da função de onda devemos a Max Born em 1926. O problema todo em mecânica ondulatória corresponde à determinação da função de onda ψ, pois a partir dela todas as propriedades físicas do sistema podem ser determinadas através de operações matemáticas envolvendo esta função. Uma pergunta que de imediato vem a nossa mente é: “Com qual velocidade a onda de De Broglie deve propagar-se?” A resposta é óbvia: “Ela deve propagar-se com a 9 velocidade da partícula já que ela representa esta entidade movendo-se com v”. Assim, vamos considerar a freqüência através da relação E=mc2=hv2 e o comprimento de onda λ= h e determinarmos a velocidade de onda por mv v DB = νλ = v DB = h E mc 2 . = µv h mv c2 v o que mostra que como v nunca é superior a c, vDB (velocidade da onda) e a velocidade da partícula v nunca será igual. Isto leva a uma contradição do que dissemos como sendo óbvio acima. Afim de esclarecermos este ponto, devemos introduzir o conceito de velocidade de fase e velocidade de grupo. Antes, porém, vamos salientar que a onda plana ψ que associamos a onda de De Broglie está toda espalhada ocupando todo espaço considerado. Sendo esta associada à probabilidade de encontrarmos a partícula, vemos que esta está espalhada em todo espaço. Esperávamos um considerável aumento da probabilidade na posição clássica ocupada pela partícula. Vamos começar nossa discussão considerando uma onda de amplitude A, freqüência ν e comprimento de onda x. A função que descreve esta onda é x y = A cos 2π νt − λ que pode ser escrita como y = A cos(ωt – kx) onde definimos a freqüência angular ω = 2πν e o número de onda k = 2π λ . Pelos dois argumentos que descrevemos acima, é claro que a onda plana acima não deve ser uma boa representação para uma partícula movendo-se com velocidade v. Ao invés disto, nos parece razoável se a partícula for descrita por um pacote de onda mais localizado ao redor de sua posição clássica. 10 Neste caso, os dois pontos acima são esclarecidos, já que a maior concentração da probabilidade ocorre ao redor do centro do pacote, representando mais ou menos a região na qual a partícula está localizada além do fato que o que é importante agora é a velocidade com que o pacote se desloca ao invés da velocidade da onda em si. Este pacote de onda que aparentemente representa bem uma partícula preservando as características ondulatórias pode ser formado pela adição de ondas planas com amplitudes e freqüências levemente variadas. Vamos considerar a interação de duas ondas planas, cujas freqüências diferem levemente. A interferência de uma onda com a outra, resulta numa onda cuja amplitude varia, fato este que define o pacote de onda. Se a velocidade das ondas que compõem o pacote são as mesmas a velocidade do pacote seria a mesma da onda. No entanto, se as ondas componentes representam velocidades diferentes as ondas individuais não propagarão juntas e como resultado o pacote de onda propaga-se com uma velocidade diferente daquelas das ondas componentes. Assim, consideremos as duas ondas cuja freqüência angular difere por dω e cujo vetor de onda difere por dk. Tendo a mesma amplitude, temos: 11 y1 = Acos(ωt – kx) y2 = Acos[(ω+ dω)t - (k + dk)x] A resultante da soma destas duas oscilações, resulta em: 2ω + dω 2k + dk dωt dkx y = y1 + y 2 = 2 A cos − t − x cos 2 2 2 2 a + b a − b onde usamos a identidade cos a + cos b = 2 cos cos . Do fato que dω e 2 2 dk são pequenos, comparados com ω e k, 2ω + d ω ≈ 2 ω 2k + dk ≈ 2k e temos, então: dk dω y = 2A cos (ωt – kx) cos x t− 2 2 que representa uma onda de frequência ω e número de onda k, cuja amplitude está modulada por uma frequência dk dω e número de onda . O efeito desta modulação é o 2 2 de produzir sucessivos pacotes de onda, como mostrado na figura anterior. A velocidade das ondas é a convencional, vp = ω k denominada de velocidade de fase, enquanto o envoltório propaga-se com velocidade vg = denominada de velocidade de grupo. dω dk 12 Como já vimos, a velocidade de fase é dada por: Vp = c2 v enquanto a velocidade de grupo, vg = Como E = hυ , definindo h = dω dω / dv = dk dk / dv h h E = hω = ω = hυ = mc 2 = 2π 2π tiramos que: ω (v ) = ∴ Da mesma forma k = e como m = 2π λ = 2π h m0 1− 2 c2 v c2 2π vm 0 dω = 3/2 dv v2 h1 − 2 c 2π 2πmv = h h mv m0 1− v2 c2 k( v ) = 2π h m0 v 1− v2 c2 m0 1− 2 v c2 c2 13 de modo que dk 2π = dv h m0 v2 1− 2 c + 2πm0 v 2 1 2 h c v2 1 − 2 c 2 2 1 − v + v 2πm0 c 2 c 2 = h v 2 3 2 1 − 2 c 3 2 2π m0 = 3 h v2 2 1 − 2 c e calculando vg, de onde tiramos: vg = v demonstrando que a velocidade com que o pacote de onda se desloca corresponde à velocidade da partícula. Este resultado é bastante razoável já que o máximo de probabilidade acompanha o movimento do centro de massa da partícula e com a mesma velocidade desta. Assim, podemos afirmar que o pacote de onda de De Broglie associado com uma partícula que move-se, tem a mesma velocidade que a partícula. Da necessidade de uma partícula livre ser representada por um pacote de onda ao invés de uma onda plana sugere que sempre estaremos adicionando várias ondas de comprimento de onda ligeiramente diferente para formar o pacote. Como o comprimento de onda está associada com o momentum da partícula, vemos que teremos um compromisso entre saber exatamente o momentum da partícula com sua localização, pois quanto mais ondas de comprimento de onda diferentes adicionamos, mais localizado espacialmente é o pacote de onda e vice-versa. Chegando ao limite que quando só temos um único comprimento de onda ou momentum, a partícula é representada por uma onda plana igualmente espalhada em todo espaço, denotando que a partícula é igualmente provável de ser encontrada em qualquer posição, o que representa uma completa delocalização espacial. Este compromisso entre a perfeita determinação do momentum e da localização gera um dos mais importantes princípios da mecânica quântica que é o chamado princípio da incerteza de Heisenberg. 14 Vamos fazer uma análise bastante simplificada para determinarmos a relação entre a incerteza no conhecimento do centro do pacote de onda ∆x com a incerteza no conhecimento do momentum ∆p da partícula. Simplificadamente, vamos considerar um pacote de onda formado da adição de duas ondas planas que diferem levemente em frequência (∆ω) e em número de onda (∆k). Ψ1 = A cos (ωt – kx) Ψ2 = A cos [(ω + ∆ω)t – (k + ∆k) X] Fazendo o mesmo cálculo feito anteriormente, ∆ωt − ∆kx Ψ = Ψ1 + Ψ2 = 2 A cos (ωt – kx) cos 2 que representa a série de pacotes de onda mostrados abaixo: A extensão de cada grupo de onda e metade do comprimento de onda λm da modulação de amplitude. No caso de estarmos associando este pacote com uma partícula é razoável assumirmos que a partícula deva estar localizada dentro desta extensão do pacote de tamanho ∆x = λm 2 . Esta deve ser a incerteza máxima na determinação da posição da partícula. É importante lembrar que caso estivéssemos considerando infinitas ondas entre K e K + ∆k teríamos um único pacote ao invés de múltiplos. Como: λm = 2π 2π 2π = ⇒ ∆x = 1 km ∆k ∆k 2 15 Como as ondas que formam este grupo apresentam vetor de onda entre k e k + ∆k, estaremos incertos com respeito ao valor de k da onda final por uma quantidade no mínimo de ∆k. Assim vamos supor, com razão, que a incerteza no número de onda é ∆k. Desta forma, como k = ⇒k = 2π λ = 2π h p 2π p , de modo que h ∆k = 2π ∆p h e a incerteza em k representa uma incerteza no conhecimento do momentum da partícula. Portanto, temos: ∆x = 2π 2π ≅ , ∆k 2π ∆p h ∆x.∆p ≅ h Agora, os valores que tomamos para ∆x e ∆p são os mínimos aceitáveis dentro da lógica da construção de nosso problema. Desta forma, uma relação entre ∆x e ∆p mais razoável fornece: ∆x . ∆p ≥ h quaisquer outros fatores somente aumentarão ∆x e ∆p acima. Esta última expressão é uma forma simplificada do chamado princípio de incerteza de Heisenberg, obtido em 1927 pelo físico Werner Heisenberg. O princípio da incerteza estabelece que a incerteza na posição de uma partícula e a incerteza no momento durante uma determinada medida, apresenta na melhor das hipóteses como produto um valor da ordem da constante de Planck. Note que este é um resultado inerente com a natureza ondulatória da matéria. 16 Se especificássemos mais precisamente o que significa incerteza em posição e momentum através das chamadas variâncias ∆x = ∆x.∆p ≥ (x ) 2 2 − x encontraríamos: h 2 com um fator extra de 2π que é uma relação mais formal e precisa do princípio da incerteza. h h = 2π Da relação de incerteza entre momentum e posição, é possível obter uma relação semelhante entre energia e tempo. A incerteza em energia ∆E = h∆ν onde ∆ν é a incerteza na frequência. Se tomarmos como medida de tempo a frequência da onda, temos que ∆ν = 1 de modo que ∆t ∆E.∆t = h, e da mesma forma que anteriormente. ∆E.∆t ≥ h ou de uma forma mais formal. ∆E.∆t ≥ h 2π que é o princípio da incerteza envolvendo energia e tempo. A relação de incerteza entre energia e tempo tem uma importante consequência em física atômica. Do fato dos estados eletrônicos apresentarem um tempo de vida finito, implica que os estados estejam dentro de certo intervalo de energia. Após vermos, em linhas gerais, o princípio de incerteza, vamos fazer algumas aplicações deste importante resultado. Consideremos, inicialmente, a determinação da posição de um elétron que apresenta momentum px. A fim de observar tal elétron, incidimos sobre ele luz e observamos a luz espalhada (como fazemos com a obeservação de qualquer objeto). 17 O sistema óptico tem um poder de resolução na determinação da posição, que é escrita como (dependendo do ângulo de coleta de luz): ∆x = λ sen ϕ sendo λ o comprimento da onda da luz. Assim, erroneamente pensaríamos que diminuindo λ aumentaríamos indefinidamente a resolução da posição do elétron. No entanto, ao serem espalhados pelo elétron, os fótons transferem momentum ao elétron (lembre-se quando falamos de pressão de radiação), que no caso seria todo momentum espalhado dentro do ângulo ϕ. ∆p x = 2 hν sen ϕ c e o fator de 2 é colocado devido ao fato de estarmos colhendo fótons de +ϕ à -ϕ. Assim, teríamos: ∆p x .∆x ≈ 2 hν λ . sen ϕ = 2h c sen ϕ de modo que, na determinação da posição do elétron através da luz, vale a relação: ∆p.∆x ≥ h e, portanto, o princípio de incerteza é satisfeito. 18 Esta relação na determinação de ∆p e ∆x, pode ser escrita de outra forma. Multiplicando e dividindo a relação acima por p/m p∆p m∆x . ≥h m p Como m p∆p ∆x = ∆t, = ∆E e p m ∆E.∆t ≥ h demonstrando que a imprecisão no instante de medida relaciona-se com a incerteza na energia medida através da relação acima. Devido ao princípio de incerteza, a energia de um sistema localizado no espaço nunca pode ser nula, pois isto acarretará ∆p = 0 e ∆x = ∞, delocalizando o sistema que por princípio está localizado. Consideremos como exemplo a determinação da energia mais baixa do átomo de hidrogênio. Temos: E= p2 Ze2 − 2m r como p~∆p, r~∆r E≅ (∆p )2 2m − Ze2 ∆r mas ∆p.∆r ~ h 2 ( ∆p ) E≅ Ze2∆p − 2m h Sendo ∆p o ponto mínimo da energia dE =0 d ∆p 19 2∆p Ze2 Ze2m − = 0 ⇒ ∆p = ou 2m h h Z2e 4m2 e2 Zm 2 E= 2 − Ze h 2m h2 1 Z2e 4m E≅− 2 h2 Só para referência, a energia exata dos níveis de energia do átomo de hidrogênio é: 1 Z2e 4m En = − (n = 1,2,3...) 2 h 2n2 e estaremos abordando mais este tema adiante. OSCILADOR HARMÔNICO Para o oscilador harmônico a energia é: E= p2 1 + mω2 x 2 2m 2 de modo que: ∆p.∆x ~ h h → p.x ~ . 2 2 Desta forma, o estado de mais baixa energia: 2 p2 1 2 h E0 = + mω 2m 2 4p2 de modo que dE0 m ωh e, assim: = 0 , produz p2 = dp 2 20 E0 = 1 hω 2 Em linhas gerais, o estado de mais baixa energia de um sistema físico ligado (que é o caso de partículas presas em potenciais) é aquele compatível com o princípio de incerteza. A existência de uma Energia diferente de zero como mínima para uma partícula confinada tem importantes conseqüências pata os sistemas físicos. UNIVERSIDADE DE SÃO PAULO INSTITUTO DE FÍSICA DE SÃO CARLOS DEPARTAMENTO DE FÍSICA E CIÊNCIA DOS MATERIAIS ESTRUTURA ATÔMICA Prof. Dr. Vanderlei Salvador Bagnato 2 CAPÍTULO VII ESTRUTURA ATÔMICA O conceito de que toda matéria é constituída ao nível microscópico de partes fundamentais, denominadas de átomos, é bastante antigo antecipando todas as idéias mais modernas que levaram ao conhecimento do átomo. Este conceito ficou, no entanto, embebido em mistério até aproximadamente um século atrás, quando os físicos e químicos demonstraram, de forma decisiva, estas idéias. Vários foram os modelos desenvolvidos para explicar as propriedades do átomo. A descoberta do elétron e a conclusão de que todos os átomos contêm elétrons na sua composição básica foi um dos passos decisivos na direção da determinação da estrutura atômica. Sendo os elétrons negativos, enquanto os átomos são eletricamente neutros, faznos concluir que a matéria, mais precisamente o átomo, deve conter cargas positivas suficientes para balancear as negativas. Da informação de que elétrons são milhares de vezes mais leves que os átomos (obtidos dos experimentos anteriores de J. Thomson), sugere que as cargas positivas constituintes dos átomos é que determinaram grandemente a massa do átomo. Baseado nessas informações, J. Thompson propôs em 1898 que os átomos são esferas de cargas positivas nas quais os elétrons negativos estão embebidos. Este era, em linhas gerais, o modelo de Thompson para o átomo. O modelo era denominado de pudim com ameixas devido à semelhança. O modelo parecia razoável, baseado nas informações experimentais apresentadas. Nenhum experimento, no entanto, foi feito de imediato para comprovação do modelo. O raio desta esfera foi tomado como sendo da ordem de 1Å (10-10m), obtido através do uso do número de Avogrado e as densidades típicas do sólido. A repulsão mútua entre os elétrons produziria uma distribuição uniforme destes dentro da esfera, no que 3 determinaria as posições de equilíbrio para os elétrons. A excitação dos átomos, por exemplo, através do aumento de temperatura, era visto como vibrações destes elétrons ao redor de suas posições de equilíbrio, dando origem à radiação eletromagnética que é observada. Consideremos, a fim de realizarmos uma estimativa, que temos uma esfera de densidade ρ , carregada positivamente no interior da qual um elétron move-se ao redor do centro (posição de equilíbrio). Através da lei de Gauss, quando o elétron estiver a uma distância r do centro, a força sobre ele será 4 e 4 F = πr 3 ρ . 2 = − πeρr 3 3 r que é linear na posição, demonstrando que tal elétron executa um movimento harmônico ao longo do diâmetro, com constante de mola 4π eρ . Tomando a esfera como tendo um 3 diâmetro D da ordem de 1Å = 10-8 cm, teremos ρ = mola é 4x 4π e 8e 2 e. π D 3 = 3 3 3 2 D e 4 3 πD , de modo que a constante de 3 4 que vamos estimar 4 x (1,6 10-19 x 3109)2. 1 10 − 24 que é 23,5 x10 −20 ≅ 2 x10 6 dyn / cm . − 24 10 Esta força de mola leva a uma frequência de vibração v= 1 2π K 1 = m 2π 10 6 ≅ 6.5 x1015 Hz − 28 9,1110 Esta frequência corresponde à: λ ~ c 31010 = ≅ 600 Å v 5,21015 Este comprimento de onda, que localiza-se na ultra-violeta, caracterizaria totalmente a radiação emitida pelo átomo. Isto, evidentemente, não justifica a grande 4 variedade de linhas espectrais observada, mas descargas em vapores atômicos, demonstrando problemas com o modelo de Thomson. A evidência definitiva de que o modelo de Thomson estava incorreto aconteceu alguns anos mais tarde quando Rutherford realizou experimentos com o espalhamento de partículas α demonstrando que a parte carregada positivamente do átomo estava concentrada numa pequena região central no átomo, denominada de núcleo. Estudando radioatividade Rutherford utilizou partículas α (que são átomos de Hélio duplamente ionizados) para realizar experimento de espalhamento em películas finas de metal. Nos seus arranjos experimentais, uma fonte radioativa produz um feixe de partículas α que é colimado e colide sobre uma folha metálica. Interagindo com as cargas dos átomos através da força Coulombiana, estas partículas sofrem deflexões que são detectadas através de sua colisão com uma superfície convenientemente preparada. Caso o modelo Thomson fosse verdadeiro, não seriam esperadas deflexões a altos ângulos. No entanto um número excessivamente grande de partículas espalhadas a altos ângulos foi observado, propiciando a Rutherford a proposição de um novo modelo atômico. O modelo de Rutherford apresenta a estrutura atômica como tendo toda sua carga positiva (e, portanto, toda sua massa) concentrada na região central denominada de núcleo, cujas dimensões seriam muito menores do que as dimensões do átomo. Quando as partículas α passarem muito próximas deste núcleo a repulsão Coulombiana produzirá um grande desvio das partículas, como observado. Rutherford efetuou um cálculo bastante detalhado para demonstrar aquilo que propunha em seu modelo, com base nos resultados do espalhamento das partículas α . 5 Devido à grande concentração das cargas positivas numa determinada região é sua interação com as partículas α que determina o espalhamento, podemos, assim, esquecer os elétrons. Consideremos, então, como predominante, o espalhamento devido à repulsão Coulombiana entre as partículas α carregadas positivamente com os núcleos, também positivos. Como estaremos tratando de átomos pesados, consideremos o recuo causado pelas colisões nos núcleos como desprezíveis, ou seja, o modelo que tomaremos para efetuar os cálculos consiste em imaginar os núcleos como pontos de carga fixos. Assim, o modelo de espalhamento que tomaremos está convenientemente mostrado abaixo, onde mostramos a trajetória de uma partícula α espalhada pelo núcleo. Uma partícula α de carga ze e massa M passa próximo de um núcleo de carga +Zé, tomado este como estando na origem do sistema de coordenada. Antes de encontrar o núcleo, a partícula desloca-se em linha reta com velocidade v. Após o encontro a partícula também continua deslocando-se com v’ em linha reta. Em cada instante a posição da partícula com relação ao núcleo pode ser determinada pelas coordenadas polares r e v como mostra a figura. A distância entre a linha de movimento e a linha que determina um eixo coordenado passando pelo núcleo b é chamada de parâmetro de impacto. O ângulo θ, que a trajetória da partícula define após espalhamento, é chamado de ângulo de espalhamento. A distância entre a linha de movimento final e sua paralela passando pelo núcleo é b'. Como a força de Coulomb que atua sobre a partícula é central (sempre na direção radial), o torque exercido é nulo e, portanto: F xr = dL = 0 → L = cte dt 6 de onde tiramos Mvb = Mv'b' = L. Sendo a força conservativa a energia é conservada 1 1 Mv 2 = Mv' 2 ⇒ v = v' e, 2 2 portanto, b = b'. Vamos considerar a partícula movendo-se sob ação da força Coulombiana e vamos determinar sua equação de movimento. 2 A força é sempre radial valendo zZe r2 , e durante o movimento da partícula existe uma variação do comprimento do raio vetor r e de sua posição, de modo que temos: z 2 d 2r Ze 2 dϕ = M − r 2 r2 dt dt sendo o primeiro termo a contribuição da variação do módulo da posição e o segundo tipo força centrífuga − ω 2 r e variação da orientação do raio vetor. Isto vem do fato que: r& = r&rˆ + rϕ&ϕˆ de modo que (usando r&ˆ = ϕ&ϕˆ e ϕˆ& = −ϕ&r̂ ) ( ) r&& = &r& − rϕ& 2 rˆ + (rϕ&& + 2r&ϕ& )ϕˆ sendo a força central, ficamos somente com o primeiro termo. Vamos resolver esta equação de movimento escrevendo r = equação em termos de u. 1 u e escrevendo a 7 dr dr dϕ dr du dϕ = . = . . dt dϕ dt du dϕ dt ou seja dr L d 2u 1 du Lu 2 =− 2 . =− dt M dϕ u dϕ M pois dϕ .Mr 2 = L dt e a segunda derivada d 2r d dr dϕ L d 2 u Lu 2 = . = − M dϕ 2 M dt 2 dϕ dt dt d 2 r − L2 u 2 d 2 u ∴ 2 = M 2 dϕ 2 dt Substituindo na equação de movimento: L2 u 2 d 2 u M Lu 2 −M − dϕ 2 dϕ 2 u M 2 = zZe 2 u 2 de onde tiramos, usando L = Mvb d 2u zZe 2 + u = dϕ 2 Mv 2 b 2 De um modo geral, denominamos: 2 zZe 2 D= , (dimensão distância) Mv 2 de modo que 8 d 2u D +u = − 2 2 dϕ 2b A solução geral desta equação é: u = A1 cos ϕ + A2 senϕ − D 2b 2 o que nos leva à: − A1 cos ϕ − A2 senϕ + A1 cos ϕ + A2 senϕ − D D =− 2 2 2b 2b que prova a validade da solução. Quando r→ 00, ϕ → 0 → u → 0 0 = A1 − D Quando r → 00, ϕ → 0 → 2b 2 → A1 = D 2b 2 dr = −v dt dr L du −L ( A2 ) =− = −v = dt M dϕ M Mv 1 ⇒ A2 = = Mvb b Assim, u = D 1 D cos ϕ + senϕ − 2 e, portanto, a solução para a trajetória da 2 b 2b 2b partícula é: 1 1 D = senϕ + 2 (cos ϕ − 1) r b 2b 9 A distância D = zZe 2 , representa a distância na qual a energia cinética e potencial 2 1 Mv 2 2 igualam-se 1 = zZe e D e representa a menor distância que a partícula e o núcleo ficarão 2 1 2 mv quando a colisão for frontal. Neste ponto a partícula reverte sua velocidade e volta para sua origem. O ângulo de espalhamento θ pode ser encontrado da equação da trajetória, tomando-se o ponto ϕ onde r → ∞. Como neste ponto ϕ + θ = π senϕ + D D cos ϕ = 2b 2b de onde podemos tirar após alguns passos: cot ang θ 2 = 2b D A distância de maior aproximação R pode ser calculada quando ϕ = (π = θ )/ 2 1 1 π −θ D = sen + 2 R b 2 2b e de onde pode-se obter que: b= π −θ cos 2 − 1 D θ D π −θ cot an = + an 2 2 2 2 10 R= D 1 1+ 2 sen θ 2 No experimento de Rutherford, o que era observado era o número de partículas α que são espalhadas num determinado ângulo θ quando um grande fluxo de partículas α incide sobre o alvo. É claro que não podemos precisar exatamente θ e o que estamos procurando é o número de partículas que é espalhada entre θ e θ + dθ. Este número será denominado por: N(θ)dθ = número de partículas espalhadas entre θ e θ + dθ/tempo. Se olharmos a relação que fornece o ângulo de espalhamento θ, veremos que o que causará partículas espalharem em diferentes ângulos é somente o parâmetro de impacto b diferente. Deste modo, as partículas que espalham entre θ e θ + dθ são exatamente aquelas que colidem com parâmetro de impacto entre b e b + db. Vamos considerar uma porção do alvo de área de A/cm2, Ao redor de cada núcleo atômico nesta área analisaremos o efeito discutido acima. Para cada núcleo estamos considerando as partículas α colidindo num anel de área 2 π bdb ao redor do núcleo. Sendo t a espessura da porção considerada, o número de núcleos em A é ρAt , sendo ρ a densidade atômica do material. 11 Seja P(b)db a probabilidade que a partícula α passa por um destes anéis. Como estamos tomando uma densidade uniforme de partículas incidindo na amostra, temos que: P(b )db = área total anéis A Assim, P(b )db = ρt 2πbdb mas utilizando o fato que b = D cotan D/2 2 db = − D 1 dθ 2 sen 2 θ 2 2 bdb = − D 2 cos θ 2 dθ 8 sen 3 θ 2 bdb = − D 2 senθ dθ 16 sen 4 θ 2 e, portanto e cos θ 2 sen θ 2 = 12 senθ 12 e finalmente P(b )db = −π sin θdθ ρtD 2 8 sin 4 θ 2 o sinal (-) aparece devido ao fato que aumentando b diminuímos θ) Como -P(b)db representa a probabilidade que as partículas incidentes sejam espalhadas entre θ e θ + dθ, N (θ )dθ π sin θ = ρtD 2 dθ I 8 sin 4 θ2 sendo 1 o número incidente e n(θ)dθ o número espalhado no ângulo considerado. Este resultado mostra que a probabilidade de espalhamento em grandes ângulos não é nula. De fato é bastante elevada, concordando com resultados experimentais. Os experimentos realizados testaram a dependência angular usando chapas finas de Au e Ag no intervalo 5° a 150° demonstrando boa concordância. A quantidade N(θ)dθ mostrou-se experimentalmente proporcional a espessura t como previsto. 2 Sendo proporcional a D = zZe 2 2 ,N(θ)d(θ), varia inversamente proporcional Mv 2 2 com o quadrado da energia cinética das partículas α incidentes. Isto foi testado experimentalmente mostrando boa concordância. Uma última observação, e das mais conclusivas, veio da determinação do mundo Z a partir dos resultados de espalhamento. A concordância de Z medida com o número atômico do metal utilizado é muito boa. Tendo seu modelo confirmado pelas observações experimentais, Rutherford utilizou sua relação para estimar um limite do tamanho do núcleo. Observando as partículas que espalham a 180°, R180o = D = zZe 2 2 Mv 2 É claro que esta é uma estimativa superior, pois as partículas α aproximam-se do núcleo por uma distância muito maior do que o tamanho real do núcleo. 13 Se compararmos os resultados experimentais e teóricos de N(θ) veremos que eles concordam muito bem para R grandeza (~ 10-14m = 10-4Å). Isto mostra que esta deva ser a ordem de R grandeza do núcleo atômico. Para produzirmos menores R, aumentamos a energia das partículas. Neste caso há penetração destas partículas na região nuclear e aí evidentemente o modelo não concorda. A fórmula de Rutherford que obtivemos anteriormente pode ser escrita em termos dσ , definida como: dΩ da chamada secção do choque diferencial dN = dσ IndΩ dΩ dN → número de partículas espalhadas num ângulo sólido dΩ a um ângulo θ I → número de partículas que colidem N → densidade nuclear por área N=σIn A definição acima é parecida desta última N σ = . 1 I n Como definimos N(θ) dθ = dN, temos: 2 zZe 2 1 dN = 2 4 2 Mv sin θ 2 chamada de secção de choque diferencial de Rutherford. 14 De acordo com estas expressões, o número de partículas α por unidade de área que atingem a tela que floresce a uma distância r deve ser proporcional a espessura t da folha metálica, a densidade de átomos no metal e, o que é mais importante, com o quadrado do número atômico Z. Este número ainda depende inversamente com a energia cinética das partículas α e apresenta o termo de dependência com . Todas estas dependências puderam ser verificadas demonstrando a validade do modelo de Rutherford, no qual o átomo é constituído de um caroço positivo (núcleo) circundada pelos elétrons negativos. A concordância experimental deste modelo valeram a Rutherford o mérito da descoberta do núcleo atômico. Como vimos, através do modelo de Rutherford, a única interação considerada foi à eletrostática e os resultados obtidos permitem a determinação de um tamanho limite para o núcleo atômico. Vamos calcular a distância mais próxima do centro nuclear que uma partícula pode atingir. Para isto, vamos considerar aquelas colisões frontais (b = 0) onde o ângulo de espalhamento é praticamente θ = 180°. Nesta situação a energia potencial eletrostática no ponto mais próximo é igual à energia cinética inicial da partícula. 2 Ze 2 Energia cinética (~ 7.7 Mev) r0 Utilizando ouro Z = 79 ( ) 2 Z 1,610 −19 .91018 2 7,7.10 6 x1,610 −12 r0 para ouro (Au) → r0 ~ 3 10-12 cm ~ 3 10-4 Å Desta forma vemos que para ouro o raio nuclear é menor do que raio atômico. Experimentos mais modernos onde partículas α podem ser artificialmente aceleradas demonstraram que a relação de espalhamento de Rutherford começa a discordar dos resultados experimentais. O modelo estabelecido por Rutherford, no qual um núcleo massivo e positivo apresenta os elétrons ao seu redor, exige que tais elétrons descrevam trajetórias estáveis ao redor deste núcleo, semelhante ao modelo planetário que temos. Vamos examinar mais de perto os elétrons ao redor do núcleo num dos átomos mais simples que é o 15 átomo de hidrogênio. Tomando por simplicidade uma trajetória circular, temos para uma trajetória de raio r mv 2 e 2 = 2 r r e, assim, a velocidade está relacionada com o raio da órbita por: v= e mr Através da conservação de energia, temos que a energia total: E= 1 2 e2 mv − 2 r que com a relação anterior permite-nos obter 1 e2 e2 − 2 r r 2 e E=− 2r E= 1 coul = 3 109 stacoul Assim, a energia total do elétron é negativa como esperado, já que ele está ligado ao núcleo. Qualquer energia E ≥ 0 significaria um elétron não ligado ao núcleo. Utilizandose dos resultados experimentais conhecidos de que a energia necessária para extrair o elétron do átomo de hidrogênio é de 13,6 eV, − 13,6 x1,610 −12 (1,610 ) .910 =− −19 2 18 2r o 0,53 A ⇒ r ≅ 5,310 −9 cm ~ RaioBohr Esta análise clássica feita para avaliar o raio da órbita eletrônica, que evidentemente determina o raio do átomo, está completamente em desacordo com a 16 teoria eletromagnética segundo a qual este elétron acelerado deveria radiar energia na forma de elétron em movimento circular deveria continuamente perder energia e assim gradativamente, aproximando-se do núcleo de uma forma espiralhada, como mostrado abaixo, finalizando com o colapso do átomo. Este colapso, evidentemente, está em contradição com as observações reais dos átomos. A razão desta contradição está no fato de que estamos tratando o elétron como partícula de uma forma completamente clássica, mas como vimos anteriormente, seu comportamento é ondulatório. A fim de evitarmos esta instabilidade do modelo de Rutherford, é necessário a realização de um modelo que inclua as noções de onda discutidas anteriormente. No entanto, de forma alguma isto invalida a fórmula de Rutherford que sobrevive mesmo quando um tratamento puramente quântico é feito para o espalhamento de partículas α . A questão básica onde o modelo falha é a estabilidade das órbitas. A solução para tal problema foi proposta inicialmente por Niels Bohr (1913) que foi muito bem sucedido na explicação e predição do espectro atômico absorvido em vários experimentos. Antes de discutirmos modelos mais sofisticados para o átomo é necessário fazermos alguns comentários sobre a observação da radiação emitida pelos átomos no que denominamos de espectro atômico. Uma das maneiras de determinarmos a composição da radiação emitida pelos átomos está mostrada abaixo. 17 A radiação dos átomos pode ser obtida através de uma descarga elétrica no gás constituído pelos átomos em estudo. Durante a descarga ocorre colisões dos elétrons com os átomos e, nestas colisões, há transferência de energia colocando elétrons dos átomos em estados mais energéticos. Como estes estados mais energéticos não são estáveis, os elétrons voltam para seus estados normais e neste processo emitem luz. Esta luz emitida é uma assinatura dos níveis de energia do átomo e revelam toda informação da estrutura atômica. Esta radiação emitida pelos átomos pode ser bloqueada de modo que somente um fino flash que passa por uma fenda é permitido incidir sobre um prisma (ou rede de difração). Ao passar por este prisma a luz é dispersada, separando as várias porções de comprimento de onda diferentes que compõem esta radiação. Desta forma, a placa colocada para mostrar a luz dispersa também mostra a composição espectral da luz proveniente dos átomos. Ao realizarmos o experimento acima notamos que a composição espectral da luz proveniente dos átomos não é um contínuo (como a emanada de um corpo negro), mas é composta de somente alguns comprimentos de onda discretos, cada um denominado de uma linha espectral. Observa-se que cada tipo de átomo apresenta um conjunto de linhas espectras que o caracterizam totalmente. Isto permite em muitos casos a caracterização química de elementos desconhecidos, muito importante na determinação de composições, etc. Um dos espectros mais simples e, portanto, mais solicitado para estudos é o do átomo de hidrogênio. Na figura abaixo mostramos este espectro impresso num filme fotográfico. 18 Uma série de observações interessantes pode ser feita neste espectro ao começar pelo fato que seu espaçamento diminui ao diminuirmos , e que a série de linhas tem um limite em 3645,6 Å. Esta regularidade no espectro do hidrogênio fez com que vários autores procurassem uma fórmula empírica para descrevê-lo. Em 1885 Balmer propôs a relação n2 λ = 3646 2 n −4 que explicava as 3 primeiras. Em 1890 Rydberg propôs que 1 1 = R H 2 − 2 n = 3,4,5... λ n 2 1 onde RH é a chamada constante de Rydberg. A observação do espectro atômico foi um dos mais importantes estímulos experimentais para o início da mecânica quântica. A comunidade científica da época procurava por um modelo que todos estes resultados experimentais observados e ainda contivesse em seu corpo a precisão das linhas espectrais observadas. Em 1913 Niels Bohr desenvolveu um modelo dinâmico que preenchia os requisitos para explicar o espectro do átomo de hidrogênio, com a vantagem de ser escrito e desenvolvido de uma forma inteligível e matematicamente simples. O então chamado modelo atômico de Bohr tem seu desenvolvimento baseado em alguns postulados básicos. Os postulados são: 1 - Um elétron no átomo move ao redor do núcleo em uma órbita circular sob influência da atração Coulombiana obedecendo às leis clássicas da mecânica. 19 2 - Ao contrário de ser possível ao elétron existir em qualquer trajetória ao redor do núcleo, somente serão permitidas as trajetórias cujo momento angular L é um múltiplo de h / 2π = h . L = nh n = 1, 2, 3, ... 3 - Apesar de estar numa órbita constantemente acelerada, elétrons nas órbitas permitidas no postulado anterior são estáveis, não irradiando energia eletromagnética e, portanto, mantendo constante a sua energia. 4 - Toda vez que o elétron mudar de órbita passando de uma órbita de energia Ei para outra de energia Ef haverá emissão de energia na forma Ei − E f h de radiação eletromagnética cuja freqüência é = v sendo h a constante de Planck. Todos os postulados tentam, utilizando os conhecimentos gerados por outros modelos, justificar as observações experimentais, que existe um núcleo, que as órbitas de elétron são estáveis e que há emissão de radiação. A quantização é introduzida no momento angular, mas como veremos, reflete na energia. Vamos, então, resolver o átomo utilizando os postulados acima gerando, assim, o que chamaremos de modelo atômico de Bohr. Se considerarmos um átomo monoeletrônico, cujo elétron tem massa m e efetua trajetórias circulares, temos que Ze 2 v2 =m onde foi considerado que sendo o núcleo muito mais massivo tem seu r r2 movimento desprezível quando comparado com elétron. Utilizando-se a condição de quantização de Bohr, nh mr 2 2 2 Ze mn h n 2h 2 = ⇒ r = r m2r 2 r2 mZe 2 L = mvr = nh ⇒ v = ou seja 20 v= nh Ze 2 2 mZe = n 2h 2 n 2h 2 A energia total do elétron é: E= 1 2 Ze 2 1 Z 2 e 4 Ze 2 mv − = m 2 2 − 2 2 mZe 2 2 r 2 n h n h E=− 1 2 − mZ 2 e 4 n h2 n = 1, 2, 3, 4... 2 demonstrando que a condição de quantização do momento angular leva diretamente a uma quantização na energia total do elétron. Cada valor de n representa a energia de uma possível órbita estável para o elétron, que normalmente são denominados de estados do elétron. Representando os vários estados numa escala energética, teríamos: Usando os postulados de Bohr podemos determinar a freqüência da radiação emitida quando o elétron passa de um determinado estado Ei para outro Ef, caracterizados pelo números Ni e Nf. Assim temos que: v= Ei − E f h = mZ 2 e 4 1 1 − + 4πh 3 N i2 N 2f ou seja vi − f = mZ 2 e 4 4πh 3 1 1 2 − 2 N f N i 21 Assim, ao observador a luz proveniente de uma descarga eletrônica em hidrogênio, observamos vários agrupamentos de linhas de freqüências diferentes, provenientes de emissões distintas de elétrons em diferentes estados. As linhas de Lyman, entre 1000 - 1300Å, provém de transições eletrônicas de todos estados excitados para estado n = 1. As linhas Balmer, entre 4000 - 7000Å, são transições cujo estado final é o estado n = 2. As linhas Paschen são transições entre 10.000 - 20.000Å, que correspondem às transições que tem como estado final o estado n = 3. Estas linhas, perfeitamente em concordância com o modelo de Bohr, foram fundamentais no desenvolvimento dos conceitos básicos da estrutura atômica. Os postulados de Bohr não são afirmativas ao acaso, mas são resultados claros do comportamento ondulatório do elétron, ou seja, são implicações diretas do conceito quântico ou ondulatório para o elétron. Assim, consideremos um elétron em órbita ao redor do núcleo, através do balanço de forças o elétron apresenta uma velocidade (para átomo de hidrogênio). v2 e2 m = 2 r r v= e mr com esta velocidade seu comprimento de onde de De Broglie é: λ= h h mr = mv me 22 se colocarmos os valores numéricos teremos: o λ = 3,310 −8 cm = 3,3 A que corresponde exatamente ao perímetro da órbita clássica do elétron o o 2πr = 2.π .0,53 A = 3,3 A demonstrando que temos aqui um caso claro onde a região na qual o elétron está confinado é da ordem do comprimento de onda e, portanto, o tratamento ondulatório é mais apropriado. Assim não é nenhuma coincidência que para o estado de mais baixa energia tenhamos o perímetro igual a λ , pois este é o mínimo que podemos fazer. De um modo geral podemos ter o perímetro como sendo correspondente a um número inteiro de λ . Nunca poderemos ter um número fracionário de λ , pois neste caso levaria a uma rápida aniquilação da onda ao considerarmos algumas voltas. Desta forma nλ = 2πrn e substituindo λ n h nh = 2πrn ⇒ mvrn = mv 2π ou seja L = nh que é o postulado básico de Bohr. Assim, através da mecânica ondulatória, a interpretação das órbitas estáveis de Bohr nada mais são do que a situação que representam interferência construtiva entre as várias partes da onda que constitui o elétron considerado. Como outras trajetórias produzirão necessariamente interferências destrutivas da onda elas não podem existir. Como exemplo considere uma órbita como abaixo: 23 após considerarmos várias voltas, teremos um conjunto de órbitas fora de fase que somam-se interferindo destrutivamente. Como vimos, através de colisões com elétrons, é possível transferir energia para o átomo fazendo com que seus elétrons sejam promovidos para estados mais excitados, emitindo energia ao regressarem aos estados mais estáveis de mais baixa energia. Colisões não são, no entanto, a única forma de transferir energia ao átomo. A absorção de luz também é capaz de promover excitações. A luz só será absorvida quando a energia do fóton ( hν ) for exatamente a energia necessária para promover o elétron do estado que se encontra para algum estado excitado. Como conseqüência a luz só será absorvida para alguns comprimentos de onda. Este é o fundamento do chamado espectro de absorção do átomo. A observação do espectro atômico, como discutimos anteriormente, não é a única forma de investigarmos os níveis de energia discretos do átomo. É possível, em alguns casos, medir o espectro de excitação, através da medida da energia que está sendo fornecida ao átomo. O experimento realizado em 1914 por Franck e Hertz, demonstrou de forma nítida a existência dos níveis discretos de energia, bem como introduziram uma maneira alternativa para medida de níveis de energia (espectro). Franck e Hertz bombardearam vapores de vários elementos utilizando um dispositivo como abaixo. 24 Elétrons produzidos por um filamento são acelerados através de um gás por um potencial V0. Ao passarem pela grade tais elétrons experimentam uma diferença de potencial reserva V0, de modo que somente aqueles elétrons que passaram com energia cinética acima de K = e V0 é que atingirão a placa contribuindo para a corrente no galvanamento A. Desta forma, aumentando V, mais e mais elétrons atingirão a placa produzindo uma corrente maior. Ao percorrer o caminho no gás, os elétrons colidem com os átomos deste. Quando a energia do elétron é tal que cedendo esta para o átomo haverá excitação colocando o sistema num estado de energia maior, ocorre transferência desta energia por colisão. Perdendo esta energia os elétrons atingem a grade com baixa energia cinética e, portanto, não conseguem chegar até a placa não contribuindo com a corrente. Assim, ao aumentarmos a potência V, aumentando a energia dos elétrons, observamos quedas na corrente que correspondem às excitações eletrônicas. (Potenciais bastante elevados podem produzir elétrons que excitarão átomos mais do que uma vez). No entanto potenciais baixos reproduzem com fidelidade a estrutura de níveis do átomo. O experimento de Franck-Hertz foi realizado imediatamente após o nascimento da teoria de Bohr para átomo de hidrogênio e representa uma confirmação independente da discretização dos níveis de energia. O grande sucesso da teoria de Bohr, para explicar o átomo de hidrogênio e sua surpreendente concordância com os resultados experimentais, criou uma grande expectativa ao redor dos fundamentos envolvidos no modelo. Procurava-se obter resultados mais gerais que descrevessem também outros sistemas físicos diferentes do átomo de hidrogênio. Os primeiros passos no sentido de estabelecer uma nova teoria, válida sempre e que tornava-se mais evidente no micromundo foi dado por Wilson e Sommerfeld em 25 1916, que anunciaram determinadas regras que permitiam a quantização ou a determinação dos estados energéticos de qualquer sistema físico cujas coordenadas eram funções periódicas no tempo. Esta regra conhecida como regra de quantização de Sommerfeld-Wilson, pode ser enunciada da seguinte forma: “Em um sistema cujas coordenadas são funções periódicas no tempo, tem como condição de quantização para suas coordenadas ∫p d q q = nq h nq = 1, 2, 3... h = const. Planck onde q é uma coordenada que tem como momentum associado pq e nq será o número quântico que terá somente valores inteiros. A integral deve ser efetuada sobre um período de oscilação das coordenadas”. Esta regra de quantização pode ser melhor entendida se considerarmos um exemplo. Assim, vamos imaginar uma partícula no interior de uma caixa de paredes rígidas. A energia desta partícula é: E= p x2 2m de onde tiramos p x = ± 2mE . Se aplicarmos a regra quantização para este problema, temos: 26 a ∫ p x dx = ∫−a 2 −a 2mE dx + ∫a − 2mE dx = nh 2 2 2 2 2 n h h2 2 2mE = ⇒E=n 4a 2 8ma 2 n = 1, 2, 3... que são as energias possíveis para uma partícula numa caixa. Se olharmos para as trajetórias que estas energias representam no espaço das fases, teremos uma melhor idéia do que significa a condição de quantização W-S. Assim, vamos para cada valor de n desenhar as trajetórias no espaço fases. A integral ao longo de um período completo ∫ p dx , representa a área da figura x desenhada no espaço das fases e a regra de quantização requer que isto seja um número inteiro da constante h, ou de outra forma, a área valida ao se passar de uma trajetória para outra no espaço das fases deve ser um número inteiro de h. Outro exemplo que podemos tomar é o oscilador harmônico. p x2 1 E= + mω 2 x 2 2m 2 Fixada a energia do oscilador, temos que as trajetórias no espaço das fases são elipses. px 2 x2 + =1 2mE 2 E mω 2 27 cujos eixos valem a = 2mE b = 2 E mω 2 A integral ∫ P.dx = área elipse = πab Assim π 2mE 2 E mω 2 = nh 2 Eπ ω = nh ⇒ E = nhω Como já determinamos pelo princípio da incerteza E 0 = 1 hω 2 1 E = n + hω 2 Utilizando a regra de quantização de W-S podemos recuperar a condição de quantização de Bohr. Utilizando L e θ como coordenadas, ∫ Pdq = ∫ Ldθ = ∫ 2π 0 Ldo = 2πL = nh ⇒ L = nh cuja interpretação mais física já discutimos anteriormente mostrando que esta condição separa as trajetórias cujas ondas de Broglie interferem construtivamente. Uma das importantes aplicações da regra de quantização W-S é o átomo de hidrogênio, onde é permitido ao elétron mover-se em trajetórias elípticas. Este é normalmente designado como modelo de Sommerfeld. Ao observarmos as linhas espectrais previstas no modelo de Bohr para o hidrogênio, observamos no laboratório que elas são compostas por outras linhas bastante juntas, ao invés de ser uma única linha. Observa-se que o espaçamento entre linhas é 10-4 vezes o espaçamento entre linhas 28 principais. Esta estrutura de níveis é normalmente denominada de estrutura fina, e foi tentando explicar estas linhas que Sommerfeld realizou este modelo. Descrevendo o movimento do elétron em termos de θ e r, temos que W-S nos fornece ∫ Ldθ = n h ∫ p dr = n h nθ = 1,2,3,4... 0 r n r = 0,1,2... r Da primeira condição temos L = nθ h . Imaginando órbitas elípticas: p 2 e2 E= − 2m r mas pθ = L , de modo que r E= p r2 L2 e2 + − 2m 2mr 2 r Nos pontos A e A', pr = 0 → r2E + re2 - r1 − e 2 + e 4 + 4 E L = r2 2E 2 r1 + r2 = − e 2m L2 = 0 de onde tiramos r1 e r2. 2m e 2 + e 4 + 2 E L2 m r2 = − 2E r1 .r2 = − L 2 2 E 2 mE 29 (das propriedades de uma equação de 2° grau). Assim, ∫ p .dr = 2∫ r r2 r1 p r dr = n r h L2 e2 usando p r = E − + 2m 2mr 2 r 2 = [ ( 1 2 2m Er 2 + e 2 r − L 2 m r )] 1 2 dr Esta integral pode ser efetuada, revelando que E=− E=− 2π 2 me 4 (mr h + nθ h )2 2π 2 me 4 1 2 h (nr + nθ )2 Como nθ = 1, 2, 3 ..., nr = 0, 1, 2 ..., temos que n = nr + nθ = 1, 2, 3 ... que reproduz o resultado de Bohr, já que agora temos a dependência de 2 números quânticos. E= − 2π 2 me 4 1 h2 n2 O número quântico n é chamado de número quântico principal. Como nθ = n - nr, nθ só pode variar de modo a manter nθ < n, e assim pode variar de 1 até n. Assim, dado um número quântico principal n, que representa um determinado nível energético, existem n passíveis valores de nθ (chamado de número quântico azimutal), que corresponde a diferentes momentos angulares, correspondentes à mesma energia. Cada valor de nθ leva a uma trajetória elíptica diferente. Ex.: 30 Sempre o valor próximo de nθ corresponde às órbitas circulares e correspondem às órbitas previstas por Bohr, enquanto que as demais são elípticas, não previstas por Bohr. As várias órbitas possíveis caracterizadas pelo mesmo valor de n apresentam a mesma energia e, por isto, são ditas ser degeneradas. É importante notar que embora n caracterize o estado, nr e nθ estão mudando. Escolhemos n = nr + nθ como número quântico principal, já que a energia total depende dele, mas são necessários dois números (n e nθ) para determinar o estado energético, pois apenas existem várias combinações nr e nθ que levam à mesma soma. A tentativa de explicar a estrutura fina não foi bem sucedida com os cálculos acima, que mostraram que cada estado é composto de vários outros. A justificativa para a estrutura fina foi feita mais tarde pelo próprio Sommerfeld, que tratou o elétron no átomo relativisticamente, mostrando que cada nθ tem na verdade energia levemente diferente não revelada no primeiro tratamento. UNIVERSIDADE DE SÃO PAULO INSTITUTO DE FÍSICA DE SÃO CARLOS DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS CAPÍTULO VIII INTRODUÇÃO À MECÂNICA QUÂNTICA PROF. VANDERLEI S. BAGNATO 2 Capitulo VIII INTRODUÇÃO À MECÂNICA QUÂNTICA Tudo o que vimos desde a radiação do corpo negro até a explicação do espectro do átomo de hidrogênio representa um desenvolvimento de idéias que denominamos de mecânica quântica antiga e obteve grande sucesso devido a resolução que causou ao explicar muitos dos fenômenos pendentes na época. Este desenvolvimento, no entanto, apresentava vários aspectos inconvenientes. Como sabemos, a regra de quantização de Wilson-Sommerfeld somente pode ser aplicada para sistemas periódicos, mas existem muitos sistemas não periódicos que apresentam um grande interesse físico. Outro ponto em aberto é que embora reproduzisse o espectro do átomo de hidrogênio não há nenhuma explicação porque determinadas linhas espectrais são mais intensas do que outras. A teoria antiga só pode ser aplicada para átomos com um único elétron. A crítica mais forte à teoria antiga é no entanto o fato que ela é mais ou menos constituída empiricamente sem uma conexão clara e embasada para todos os seus fatos. Baseado nestes fatos, houve no começo do século um grande esforço para a construção de uma teoria quântica, livre das objeções colocadas acima e que fosse de alguma forma mais generalizada. Assim, em 1925 Erwin Schrödinger desenvolve uma teoria como uma generalização do postulado de De Broglie, deixando de lado alguns conceitos como órbitas, etc, que ainda prevaleciam na mecânica quântica 3 antiga. A nova mecânica quântica, além de ser matematicamente precisa introduzia uma nova forma abstrata para interpretação dos resultados físicos. Vamos passar a estudar, nas próximas páginas, o desenvolvimento da teoria de Schrödinger, mas não o faremos com toda precisão e formalismo já que esta será o objetivo de cursos posteriores. Comecemos, revendo o postulado de De Broglie onde uma partícula livre com momentum p e energia E é representada por uma onda cujo comprimento de onda e freqüências são h p E = hν λ= Neste caso, como vimos, a função de onda Ψ ( x, t ) que representa esta onda é dada por x Ψ ( x, t ) = A sen 2π − νt λ e como vimos. Com requisito para termos uma onda cuja velocidade corresponde à velocidade da partícula além de satisfazermos o princípio de incerteza de Heisenberg. A interpretação desta função de onda como vimos é devido a Born e representa a probabilidade de encontrarmos a partícula numa determinada posição num determinado instante de tempo. Aparentemente para partícula livres podemos manter a seleção sem no entanto sabermos qual equação a determina. Num caso mais geral com oscilador harmônico, etc, isto já não é verdade. Assim estamos procurando uma 4 maneira mais geral de tratarmos através da mecânica ondulatória qualquer problema físico. Em mecânica clássica a descrição física de um sistema é completamente conhecida se conhecermos a função trajetória de cada constituinte r r r = r (t ) Em mecânica quântica podemos ter a mesma afirmativa se conhecermos a função de onda: r Ψ (r , t ) cuja interpretação é que Ψ ( x, t ) 2 representa a densidade de probabilidade para a ocupação espacial da partícula e o problema central na mecânica quântica é determinar Ψ ( x, t ) quando partícula está sujeita a uma determinada lei de força. Mesmo antes de acharmos Ψ , podemos verificar as características importantes que esta função deve satisfazer. Do fato de que Ψ 2 representa a probabilidade de encontrarmos corpo numa determinada posição a integral desta quantidade em todo espaço deve ser finita, pois ao considerarmos todo espaço a partícula deve estar em algum lugar. ∫Ψ 2 dv = finita A função Ψ ( x, t ) ainda deve ser contínua em todo espaço já que a probabilidade não pode assumir valores diferentes no mesmo ponto do espaço. A função deve também 5 apresentar derivadas espaciais constantes em cada lugar do espaço pois, se considerarmos o caso conhecido da onda plana 2πx Ψ = A sen − 2πνt , λ temos que 2π ∂Ψ 2πx = +A cos − 2πνt ∂x λ λ e como, 2π λ = 2πp , h temos que a primeira derivada é proporcional ao momentum da partícula, e este não deve sofrer descontinuidades a menos que forças infinitas agem sobre a partícula. Assim, resumindo, a função de onda deve satisfazer as seguintes propriedades: (1) Finita em todo espaço (2) ter integral finta (em todo espaço) (3) ter derivadas espaciais contínuas (a menos que forças infinitas hajam na partícula). Vamos começar analisando uma partícula livre que se desloca na direção + x. Considerando uma das componentes de onda plana para tal partícula, x Ψ ( x, t ) = A sen 2π − νt , λ que ainda não é solução integral da equação de onda pois sendo a função seno solução também o será a função cosseno. Assim, uma solução aceitável é 6 x x Ψ ( x, t ) = A cos 2π − νt + γA sen 2π − νt λ λ Antes de continuarmos vamos, verificar baseados no que já sabemos, como deveria ser numa equação que determina Ψ . Tratando-se de uma onda, a primeira idéia que nos vem a cabeça é a função de onda tradicional. ∂ 2Ψ 1 ∂ 2Ψ − =0 ∂x 2 v 2 ∂t 2 Consideremos, então, a onda plana acima x x Ψ ( x, t ) = A cos 2π − νt + γA sen 2π − νt λ λ Tomando a derivada espacial ∂Ψ 2π x 2π x = −A sen − νt + γA cos − νt ∂x λ λ λ λ ∂ 2Ψ p2 2π = − Ψ = − Ψ ∂x 2 h2 λ 2 Tomando a derivada temporal ∂ 2Ψ E2 2 ( ) = − 2 πν Ψ = − Ψ ∂t 2 h2 7 que colocados na equação de onda anterior, p2 E2 − =0 h 2 v 2h 2 E = pv = mv 2 isto parece de acordo com as relações de De Broglie só que não estão adequadas com E= p2 a equação não nos dar chance de introduzirmos um potencial externo agindo 2m sobre a partícula. Para uma partícula movendo-se num potencial V(x), com uma energia E, temos que p2 + V (x ) = E 2m e isto deve está retratado na equação que procuramos. Como vimos anteriormente que o momentum da partícula ao quadrado está associado com ∂ 2Ψ α p 2 .Ψ 2 ∂x e que a energia está associada com a primeira derivada temporal ∂Ψ α Ε, Ψ ∂t faz sentido propormos como equação que descreva a onda 8 α ∂ Ψ ∂Ψ + V ( x, t )Ψ ( x, t ) = β 2 ∂t ∂x 2 onde α e β são constantes a determinar-se. Vamos, requerer que estejamos tratando com uma partícula livre V(x,t)=0, e vamos substituir a solução Ψ ( x, t ) na equação acima. 2π x 2π x 2π − α cos 2π − νt − α γ sen − νt λ λ λ λ λ 2π x x = + β 2π sen − νt − β 2πνγ cos 2π − νt λ λ λ 2 2 de modo que precisamos, 2π − α = − β 2πνγ λ 2 e 2πν 2π − α=β γ λ 2 Isto mostra que − β 2πνγ = β 2πν γ ⇒ γ 2 = −1 ⇒ γ = ±i de modo que 9 2π −α = ±i 2πνβ . λ 2 como p2 Ε 2π = 2 e 2πν = h h λ 2 −α p2 E = ±i β . 2 h h de modo que para esta equação ser satisfeita, escolhemos α= e terminamos com Ε = − h2 e β = mih 2m p2 . 2m Com isto, a equação que propusemos anteriormente fica. − h 2 ∂ 2Ψ ∂Ψ + V ( x, t )Ψ ( x, t ) = ih 2 2m ∂x ∂t que e chamada de Equação de Schrödinger dependente do tempo e para o caso da partícula livre tem como solução x Ψ = A cos − νt − iA sen Ψ λ Ψ = Ae x ± i 2π −νt λ A equação anterior, foi obtida inicialmente por Schrödinger em 1926 e a obtemos para um caso particular, o da partícula livre, mas podemos verificar que ela satisfaz os 10 requisitos básicos colocados inicialmente. Vamos postular que esta equação é válida para qualquer potencial. Antes de aplicarmos a equação de Schrödinger para alguns casos, analisamos o caso especial e bastante comum, quando o potencial V(x,t) não é dependente do tempo. Neste caso podemos escrever a solução como Ψ ( x, t ) = Ψ ( x )ϕ (t ) , e substituindo na equação − h 2 ∂ 2Ψ ∂ϕ .ϕ (t ) + V ( x )Ψ ( x )ϕ (t ) = ih Ψ (x ) 2 2m ∂x ∂t Dividindo por ϕ (t )Ψ ( x ) ih ∂ϕ 1 − h2 ∂ 2Ψ + V ( x )Ψ ( x ) = =c 2 Ψ 2m ∂x ϕ (t ) ∂t Assim −i dϕ = cϕ ⇒ ϕ = e h t dt c ih c c = cos t − −i sen t h h Como a dependência temporal i 2πνt , c = 2πν ⇒ c = Ε h ϕ =e E −i t h 11 da parte espacial, − h 2 d 2 Ψ (x ) + V ( x )Ψ ( x ) = EΨ ( x ) 2m dx 2 que é chamada equação de Schrödinger independente do tempo. Mostrando quando V(x) não depende do tempo (explicitamente) a dependência temporal é a de onda plana, portanto Ψ ( x, t ) não varia com tempo. 2 Esta equação que para nós será mais importante, já que trataremos essencialmente de potenciais independentes do tempo, poderia ser obtida através de um argumento bastante simples. Vamos supor que a equação procurada deva ser de acordo com a equação da conservação de energia p2 + V (x ) = E 2m E portanto p2 = (E − V ( x )) 2m Como vamos então imaginar em cada ponto uma onda plana de momentum p como d 2Ψ d 2 2πx = 2 sen − 2πνt 2 dx dx λ 2 p =− 2 Ψ h temos que, multiplicando a equação de energia pela função de onda Ψ 12 p2 Ψ = (E − V ( x ))Ψ 2m como d 2Ψ p Ψ = −h dx 2 2 2 h 2 d 2Ψ = (E − V ( x ))Ψ 2m dx 2 h 2 d 2 Ψ (x ) ⇒− + V ( x )Ψ ( x ) = EΨ ( x ) 2m dx 2 − que é a equação de Schrödinger independente do tempo. Nós somente mostramos a equação no caso unidimensional, mas ela pode ser generalizada em 3-D − h 2 ∂ 2Ψ ∂2Ψ ∂ 2Ψ + 2 + 2 + V ( x, y, z )Ψ ( x, y, z ) = EΨ ( x, y, z ) 2m ∂x 2 ∂y ∂z É importante sentir que a equação de Schrödinger é para a mecânica quântica aquilo que as leis de Newton são para a mecânica clássica. Nesta equação, normalmente o que conhecemos é o potencial V(x,y,z), o que queremos determinar é o espectro de energia E e a função de onda Ψ, que permite cálculo de outras propriedades do sistema. As condições de contorno são de extrema importância na solução desta equação. Vamos passar agora a utilizar, a equação de Schrödinger para a solução de alguns problemas. Comecemos com o caso da partícula na caixa. 13 O potencial que estamos tratando apresenta a seguinte forma 0 < x < L + ∞ V (x ) = x < 0 x > L Sendo infinito o potencial a única possível solução para Ψ = 0 pois a probabilidade de encontrarmos a partícula naquela região é nula. Vamos então resolver a equação para 0 < x < L . Neste intervalo h 2 d 2Ψ = EΨ 2m dx 2 d 2 Ψ 2m + 2 EΨ ( x ) = 0 dx 2 h − A solução é do tipo 14 Ψ1 = A cos Kx ou Ψ2 = B sen Kx ambas com a condição de contorno que Ψ (0) = Ψ (L ) = 0 , já que Ψ deve ser contínua Primeiro vamos considerar a solução Ψ1 −K2 + 2mΕ = 0, h2 portanto K= 2mE h2 e de todo que Ψ (0) = Ψ (L ) = 0 A cos 0 = 1 ⇒ A = 0 de modo que Ψ1 não pode representar a partícula na caixa. Para Ψ2, sen 0 = 0 sen KL = 0 ⇒ KL = nπ n = 1,2,3,... desta condição obtemos a quantização da energia K 2 L2 = n 2π 2 ⇒ E n = n2h2 8mL2 (as condições de contorno determinam a quantização) n = 1,2,.... Como já havíamos obtido anteriormente A função de onda 15 Ψ ( x ) = B sen nπ x L Como Ψ ( x ) representa a densidade de probabilidade, 2 ∫ L 0 Ψ 2 ( x )dx = 1 (Normalização) Portanto nπx 2 L B 2 ∫ sen 2 dx = 1 = B 2 L B= 2 L Ψn ( x ) = 2 nπ sen L L x Note que as várias energias possíveis para uma partícula na caixa, representam diferentes distribuições de probabilidades de encontrarmos a partícula na caixa 16 Um outro exemplo importante na introdução da mecânica quântica é o caso da barreira de potencial que além de ilustrativo introduz um conceito novo na mecânica quântica. Assim, imaginemos um potencial como mostrado abaixo. Imaginemos uma partícula que vem de x=-∞ e colide com esta barreira. (E<V0) classicamente esperaríamos que ela chocasse com esta barreira, invertesse seu movimento e voltasse para x=-∞. Quanticamente isto não ocorre desta forma e mesmo sendo classicamente impossível a partícula pode ultrapassar a barreira e continuar seu movimento para x=+∞. Na parte x<-a ou x>a, a partícula é praticamente livre e como vimos uma partícula livre tem como função de onda − h 2 d 2Ψ p2 = E Ψ = Ψ 2m dx 2 2m ou seja, − h2 d 2Ψ = p2Ψ 2 dx Ψ = Ae p ±i x h 17 a parte da solução com p>0 representa uma onda (ou a partícula) deslocando na direção positiva do eixo x. A parte p<0 representa a partícula deslocando-se na direção negativa do eixo x. Voltemos ao caso da nova barreira e analisemos uma partícula com E<V0, para x<-a h 2 d 2Ψ − − EΨ ( x ) = 0 2m dx 2 d 2 Ψ 2mE + 2 Ψ (x ) = 0 dx 2 h Chamando 2mE = K2 h2 d 2Ψ + K 2Ψ = 0 2 dx como nesta região poderemos ter a partícula propagando-se na direção +x ou –x, a solução é algo ΨI ( x ) = Ae iKx + Be −iKx fluxo = A 2 − B 2 à parte A2 representa probabilidade da partícula está incidindo sobre a barreira A2 = 1 já que temos certeza que a partícula existe e veio de -∞ na direção +x. B2 , representa a probabilidade da partícula está caminhando na direção –x, portanto representa a probabilidade da partícula ter chocado-se com a barreira investido seu movimento por conveniência vamos chamar B=R, para lembrar reflexão. A solução para x<-a é então 18 ΨI ( x ) = e iKx + Re −iKx com K = 2mE . h2 Para x>a, a equação é exatamente do mesmo tipo, só que agora como a partícula está vindo -∞, ao encontrar a barreira, ou ela volta (caso visto acima), ou ela ultrapassa a barreira e neste caso, só encontraremos partículas deslocando-se para +x de modo que a solução é ΨIII ( x ) = Te iKx sendo T 2 = (ΨIII ) 2 a probabilidade da partícula ser transmitida pela barreira. Classicamente T2=0. Vamos, agora, analisar o que ocorre na região (II) que representa o interior da barreira. Neste caso, h2 2m h2 − 2m − d 2Ψ + V0 Ψ = EΨ dx 2 d 2Ψ + (V0 − E )Ψ = 0 dx 2 e temos que E<V0, d 2 Ψ 2m − 2 (V0 − E )Ψ = 0 dx 2 h Chamando q 2 = 2m (V0 − E ), a equação fica: h2 19 d Ψ − q2Ψ = 0 2 dx 2 que tem como solução ΨII ( x ) = Ae qx + Be − qx Note portanto que ΨII2 não é nula e portanto a partícula pode ser encontrada numa região classicamente proibida. Como dissemos anteriormente Ψ deve ser contínua em todo espaço, impondo ΨI ( x = −a ) = ΨII ( x = −a ) ΨI′ ( x = −a ) = ΨII′ ( x = −a ) ΨII ( x = a ) = ΨIII ( x = a ) ′ (x = a ) ΨII′ ( x = a ) = ΨIII tiramos T = 2 (K 2 ) (2 Kq )2 + q 2 senh 2 2qa + (2qK ) 2 2 e Q2 = 1 − T 2 mostrando que, mesmo tendo E<V0 (energia menor do que a barreira) quanticamente a partícula pode passar através da barreira num processo denominado de tunelamento. Uma representação de Ψ 2 seria: 20 Dentro da barreira a amplitude da onda decai demonstrando uma diminuição de encontrarmos a partícula naquela região. Um importante exemplo na mecânica quântica e que foi fundamental na sua formulação é a solução do sistema atômico. A chamada mecânica quântica atômica é fundamental para o entendimento da natureza, com os átomos interagem formando moléculas estáveis, sólidos, etc. Vamos, aqui nos ater somente a formulação matemática do átomo de hidrogênio, porém este assunto é mais vasto merecendo maior atenção no futuro. Vamos considerar o átomo de hidrogênio que como sabemos de um próton central e um elétron. Sendo o próton 1840 vezes mais pesado que o elétron, consideraremos o próton estacionário (semelhantemente ao modelo de Bohr). Assim, em primeira aproximação a equação de Schrödinger para o elétron no átomo de hidrogênio é − h2 ∂ 2Ψ ∂ 2Ψ ∂ 2Ψ + 2 + 2 − 2m ∂x 2 ∂y ∂z e2 x2 + y2 + z2 Ψ = EΨ Pela natureza do problema, é mais conveniente trabalharmos em coordenadas esféricas (r, θ, ϕ) com 21 r =x +y +z x = r sen θ cos ϕ 2 2 2 2 y = r sen θ sen ϕ z = r cos θ θ= ângulo zenital ϕ= ângulo azimutal Com estas novas coordenadas a equação de Schrödinger fica escrita como h 2 1 ∂ 2 ∂Ψ 1 ∂ ∂Ψ 1 ∂2Ψ e2 − r + sen θ + − Ψ = EΨ 2m r 2 ∂r ∂r r 2 sen θ ∂θ ∂θ r 2 sen 2 θ ∂ϕ 2 r e multiplicando por r 2 sen 2 θ e − sen 2 θ 2m h2 ∂ 2 ∂Ψ ∂ ∂Ψ ∂ 2 Ψ 2mr 2 sen 2 θ sen sen + r + θ θ + ∂r ∂r ∂θ ∂θ ∂ϕ 2 h2 e2 + E Ψ = 0 r que é a equação diferencial que descreve o elétron no átomo de hidrogênio. Vamos procurar solução que passa ser escrita através de uma separação de variáveis Ψ (r ,θ , ϕ ) = R(r )Θ(θ )Φ(ϕ ) 22 onde R(r) é a função que descreve a dependência radial da função de onda, Θ a dependência zenital e φ a azimutal. Vamos, então substituir esta solução na equação original e dividir por Ψ obtemos: sen 2 θ ∂ 2 ∂R sen θ ∂ ∂Θ 1 ∂ 2 Φ 2m 2 r 2 sen 2 θ + r + sen θ + R ∂R ∂r Θ ∂θ ∂θ Φ ∂ϕ 2 h2 e2 + E = 0 r Rearranjando o termo que só depende de ϕ temos que ∂Θ 2m 2 r 2 sen 2 θ sen 2 θ ∂ 2 ∂R sen θ ∂ r + sen θ + R ∂r ∂r Θ ∂θ ∂θ h2 e2 1 ∂ 2Φ + E = − Φ ∂ϕ 2 r que requer que ambos lados desta equação sejam iguais à uma constante que chamaremos ml2 1 d 2Φ = ml2 − 2 Φ d ϕ 1 ∂ 2 ∂R 2m 2 e 2 r + 2 r + E = r R ∂R ∂r h 2 ml 1 ∂ ∂Θ = − sen θ 2 sen θ Θ sen θ ∂θ ∂θ A segunda equação, também tem seus membros dependendo de variáveis independentes, e portanto também devem ser iguais a uma constante que chamaremos l(l+1). Assim, terminamos com 23 d 2Φ 2 + ml2 Φ = 0 dϕ ml2 d 1 d ( ) sen Θ + l l + 1 − θ Θ = 0 dθ sen 2 θ sen θ dθ 2 1 d r 2 dR + 2m e + E − l (l + 1) R = 0 r 2 dr dr h 2 r r2 A solução de onda uma destas equações fornecerá uma parte da função de onda. Da equação para função Φ , tiramos que Φ(ϕ ) = Ae imlϕ onde A é uma constante pela própria geometria do átomo, esperamos que esta função Φ(ϕ) não se modifique, ou seja Φ (ϕ + 2π ) = Φ(ϕ ) Ae imlϕ .e iml 2π = Ae imlϕ ⇒ e iml 2π = 1 ml = 0,±1,±2,±3,...... O número ml é chamado de número quântico magnético. Olhando para equação as chamadas funções associadas de Legendre, mas o que é mais interessante é para que haja solução (o que é óbvio, pois a função de onda deve existir). É necessário que l seja inteiro e maior ou igual à ml ou seja ml = 0,±1,±2,.... ± l esta constante l é chamada de número quântico orbital. A solução para a parte radial é as conhecidas funções associadas de Laguerre. Esta equação só terá solução quando a quantidade E da equação for da forma 24 Ε=− me 4 1 2h 2 n 2 n = 1,2,.... com l não superando (n-1), ou seja l = 0,1,2,....(n − 1) O número n é denominado de número quântico principal. Estes tr~es parâmetros que só podem adquirir determinados valores para que haja solução são os números quânticos n = 1,2,3,.... principal l = 0,1,2,....( n − 1) orbital ml = 0,±1,±2,.... ± l magnético Assim, vemos que para descrevermos o estado de um elétron no átomo de hidrogênio, são necessários três números quânticos. Normalmente escrevemos a função de onda Ψ, como Ψ = Rnl Θ lml Φ ml onde os vários índices denotam a dependência da referida parte da função de onda com os números quânticos. É interessante visualizarmos os números quânticos em termos de um modelo clássico e simplificado. Imaginando o átomo clássico, como anteriormente semelhante a um sistema planetário, vemos que o número quântico principal determina o espaçamento entre as possíveis energias. Separando parte cinética da parte potencial da energia total Ε = K radial + K orbital − e2 r 25 Introduzindo esta energia na equação radial, tiramos que 1 d 2 dR 2m h 2 l (l + 1) r + K + K − orbital radial R = 0 r 2 dr dr h 2 2mr 2 Como queremos que a função radial seja determinada por uma equação que envolva ( ) 2 somente vetor radial e sendo K orbital α rθ& , vamos requerer que os dois últimos termos cancelem K orbital = h 2 l (l + 1) 2mr 2 como K orbital L2 h 2 l (l + 1) , = = 2mr 2 2mr 2 temos que L2 = l (l + 1)h 2 , mostrando que o momento angular total é quantizado e que o número quântico l é que o determina. É importante notar que o momento angular é um múltiplo de h L = l (l + 1)h Dependendo do valor de l, costumamos denominar os estados por s,p,d,f... r O vetor momento angular L é perpendicular ao plano da trajetória. O elétron percorrendo esta trajetória determina um loop de corrente determinando um momento r r magnético dipolar µ . Na presença de uma campo magnético externo Β , haverá uma r interação com µ , surgindo um torque µ θ B τ = µB sen θ r r A energia de interação ∝ µ .B , será nula para µ ← B e se quisermos determiná-los 26 0 U m = ∫ τdθ = − µB cos θ 900 o dipolo magnético µ = i. Área = −eνπr 2 como L = mvr = 2πmνr 2 , temos que r e r L 2m µ = − o fator e é denominado de fator giromagnético orbital. O valor de ml representa os 2m r possíveis projeções de L ao longo de um eixo determinado eixo escolhido z, de modo que L z = ml h No modelo de Bohr o elétron é visualizado como revolucionando ao redor do núcleo em trajetória circulares. No entanto a solução quântica do átomo de hidrogênio modifica a idéia de Bohr de maneira radial. Primeiramente não mais podemos falar em termos de trajetória e posição, mas sim somente em termos de probabilidades relativas de encontrarmos o elétron nas várias posições, o que é naturalmente uma conseqüência da natureza ondulatória do elétron. Como vimos, Ψ = RΘΦ , de modo que Ψ 2 = R 2Θ 2Φ 2 onde o quadrado é entendido como f 2 = f . f ∗ . A parte em ϕ, fornece uma constante já que 27 Φ = Ae iml Φ → A = Φ2 = 1 2π 1 2π A variação da radiação da função de onda e a variação com θ basicamente fornecem os vários estados diferentes como ψ2 é a densidade de probabilidade r Ψ 2 d 3 r = probabilidade de encontrar elétron em d 3 r como d 3 r = r 2 dϕdθdr , P(r → r + dr ) = ξr 2 Rnl2 dr A função Θ fornece a dependência da densidade de probabilidade com o ângulo zenital θ. Esta distribuição dependerá essencialmente de l e m. 28 É possível mostrar que a distribuição de probabilidade nunca está contida num plano. L2 = L2x + L2y + L2z = l (l + 1)h 2 como o máximo valor de Lz por exemplo Lz = hl , esta mostra que L2y + L2z = lh 2 , mostrando que havendo componente além de Lz a distribuição não está só contida no plano xy, este resultado é geral porque os eixos são arbitrários. 1 UNIVERSIDADE DE SÃO PAULO INSTITUTO DE FÍSICA DE SÃO CARLOS DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS CAPÍTULO IXII INTRODUÇÃO À FÍSICA NUCLEAR PROF. VANDERLEI S. BAGNATO 2 CAPÍTULO IX INTRODUÇÃO À FÍSICA NUCLEAR Até agora temos tratado o núcleo atômico como sendo uma massa puoontual que apresenta carga positiva. Na realidade o núcleo é mais complexo sendo tão complexo que mesmo nos dias atuais ainda permanece propriedades a serem entendidas. Vamos nesta parte do curso considerar algumas propriedades fundamentais do núcleo e expor os principais modelos para explicá-las. Comecemos discutindo algumas grandezas que nos permita ter um quadro representando o núcleo atômico. A composição nuclear foi determinada ao redor de 1932 por Bother e Becker através de experimentos de bombardeamento da matéria com particulapartículasr α e com radiação gamaom particulapartículasr α ?. Observaram que após bombardeamento com radiação misteriosa era emitida do núcleo. Experimentosa realizadosa por James Chadwick mostraram que esta misteriosa radiação era constituída de partíiculasr neutras cuja massa do próton. Devido a ser partícula eletricamente neutra recebeu o nome de nêutron. O nêutron é um elemento fundamental na composição nuclear, porém, é uma partícula que só é estável no interior do núcleo. Quando ela é colocada livremente torna-se instável decaindo, nêutron → próton + eletron elétron + anti-neutron ? Este processo de decaimento demora da ordem 103segc. Discutiremos o decaimento do nêutron oportunamente ?. Logo após a descoberta do nêutron observou-se que ele era um ingrediente necessário na estrutura nuclear sendo junto com o próton os constituintes fundamentais do núcleo atômico e que determinam em linhas gerais a massa total do átomo. As partículas que compõem o núcleo são chamadas de nuucleons. Assim, ambos: prótons e nêutrons são denominadasprótons e nêutrons são denominados nucleons. Normalmente usamos a seguinte notação para as espécies nucleares: Z = número atômico = número prótons N = número nêutrons A = Z + N = número massa 3 E normalmente quando vamos descrever uma determinada espécie química X usamos a notação: ZX A Assim, por exemplo: 33As 75 representa o isótopo de número de massa 75 do arsênico. Desta composição nuclear surge espontaneamente à idéia de isótopo que são átomos com mesmo número de prótons e diferentes números de nêutrons, portanto diferentes números de massa. Como as propriedades químicas dos elementos são predominantemente determinadas pelos elétrons os isótopos passam a ser elementos quimicamente equivalentes. Com respeito ao tamanho nuclear os experimentos de Rutherford forneceram as primeiras evidências do tamanho finito do núcleo. Como vimos naquele experimento através do espalhamento de partículas a 180° foi po ssível calcular um limite de 10-4 Å para o tamanho nuclear. Através de experimentos cuidadosos ? de espalhamento de partículas foi possível determinar que o volume do núcleo é diretamente proporcional ao número de nucleons contidos neste núcleo. Assim, se R é o raio nuclear o volume correspondente é 4 πR 3 que é proporcional à A (número massa) de modo que, 3 R = R0 A 1 3 E o valor de R0 obtido experimentalmente, R0 ≈ 1.2 × 10 −13 cm E o valor de R0 apresenta uma incerteza devido à variação de resultados de acordo com o método utilizado na sua determinação. Quando fazemos experimentos com espalhamento de nêutrons estes interagem com o núcleo somente através de forças nucleares enquanto num experimento de espalhamento de elétrons a interação é basicamente devido às interações elétricas geradas pelas cargas nucleares essencialmente. Um fato curioso é que R0 determinado a partir do espalhamento de elétrons ou partículas. α é menos do que o determinado pelo espalhamento de nêutrons revelando desta forma um resultado Formatado 4 importante que a distribuição de massa no núcleo e a distribuição de cargas não são iguais. Se conhecendo o tamanho dos núcleos vamos calcular a densidade mássica contida nestes centros. densidade = 1 10 −23 g 1 6 = 3 4 4 π R π 1 ,2 10 −13 0 3 3 ( ) 3 = 0,023 1016 g cm 3 densidade nuclear = 2,3 1014 g/cm3 mostrando que o núcleo é cerca de 1014 mais denso do que a matéria macroscópica que estamos acostumados. Este resultado mostra que praticamente a matéria é oca. Em determinadas estrelas denominadas de “anãs? brancas” os elétrons dos átomos Formatado colapsaram devido a grande pressão entre átomos de modo que tais estrelas são basicamente constituídas de matéria nuclear apresentando densidades como as mostradas acima. Ao analisarmos um núcleo estável vemos que sua massa é ligeiramente menor do que a soma das massas de seus constituintes isolados. Como exemplo vemos que o núcleo de 3 Li 6 3 LI6 tem massa 6,01697 uv.a. enquanto somando as massas dos três Formatado Formatado prótons e três nêutrons que compõem o núcleo encontramos 6,0514 uv.a. A quantidade de massa que esta faltando ∆m = 0,03443 uv.a que equivale a 32,1 MeV. Lembre-se que, u.a ⇒ 1 .9.10 20 = mc 2 ⇒ 6.03 10 23 −3 ⇒ 1,492 10 −3 ergs = 1,49210 6,21011 eV u.a = 925MeV de modo que ∆m = 0,03443 → 32,1 MeV. Isto significa que para quebrarmos o núcleo de 3Li 6 obtendo os vários nucleons individualmente é necessário fornecermos ao sistema esta quantidade de energia. Esta energia contida na ligação entre os vários nucleons é denominada de Energia de Ligação e como quanto mais fortemente ligados estiverem os nucleons mais estável será o núcleo, a energia de ligação mede a estabilidade dos núcleos. 5 A energia de ligação tem sua origem na força que mantém os nucleons unidos que são um pouco diferentes dos tipos de força que estamos acostumados até o momento. Se dividirmos a energia de Ligação de cada núcleo pelo número de nucleons obtemos a energia por nucleons. A energia / nucleon mostrada como função do número de massa do núcleo estáa abaixo: O máximo da energia / nucleon ocorre em torno de A = 56 (núcleo Ferro) após o qual há um vagaroso decréscimo. Como maior energia representa maior estabilidade, o gráfico acima sugere que núcleos pesados apresentam tendência em dividir-se em núcleos mais leves enquanto núcleos muito leves demonstram referência em juntar-se formando núcleos mais pesados e estáveis. De fato, em condições apropriadas isto ocorre sendo no caso de divisão nuclear denominado de fissão nuclear e no caso de combinação fusão nuclear. Ambos ocorrem com as corretas análises energéticas. Se forçarmos a fusão nuclear poderemos em muitas casas liberar energia sendo o fenômeno portanto, portanto uma fonte de energia. Vamos passar agora a estudar alguns modelos para forças nucleares. As forças que mantém os nucleons juntos no interior do núcleo constituem, sem dúevida, as forças mais fortes que conhecemos e por isto são comumente denominadas de interação fortes e não pertencem a nenhuma das classes de forças que estamos acostumados a tratar no nossno dia-a-dia. Existem vários modelos para explicar a natureza desta interação e mesmo atualmente muito é feito para estudar esta natureza. Vamos agora, brevemente descrever os melhores modelos propostoas. Comecemos estudando a teoria dos méesons para Formatado 6 forças nucleares. Formulada pelo físico japonês H.Yukawa, em 1935, explica que as forças nucleares éas forças nucleares são o resultado de uma constante de intertrocas de partíiculasr entre os núcleonsnucleons próximos. Estas partículas que participam da troca são denominadas de mesonsmésons. O processo seria em alguns aspectos semelhante aquele? no qual dois núcleos atômicos são mantidos juntas formando moléculas através da intertroca de quantao eletromagnético através da circulação eletrônica ao redor de ambos os núcleos. De acordo com a teoria do méeson para forças nucleares todos os nucleons consistem de centros idênticos circundados por uma nuvem de um ou mais mesonsmésons. Estes mesonsmésons podem ser neutras neutros ou possuírem? cargas. Neste contexto, a grande diferença entre nêutrons e prótons reside na composição de suas nuvens mesônicas. As forças existentes entre nêutrons ou entre prótons é o resultado de mesonsmésons neutros designados por π°. Por outro lado, as forças fortes existentes entre nêutrons e prótons resultam da intertroca de mesonsmésons carregados designados por π+ ou π-, cujas cargas são exatamente a carga eletrônica. Assim, um nêutron emitindo um meson π- converte-se num próton, n → p + πenquanto que a absorção de um mesonméson π- por um próton leva a formação de um nêutron, p + π- → n No processo inverso, p → n + π+ n + π+ → p Infelizmente embora o conceito seja bastante infinito não há uma forma simples de demonstrar matematicamente como a intertroca de mesonsmésons leva a forças atrativas ou repulsivas. Vamos, no entanto, usar um exemplo bastante simples para ilustração. Imaginemos dois garotos, um com cada bola de jogar basquete, etc. A idéia é que eles deverão trocar as bolas. Quando jogador A arremessa sua bola para jogador B e viceversa, no ato de emissão eles sofrem recuo de momentunmomentum? em direções 7 opostas, o mesmo ocorrendo quando eles recebem as bolas jogadas um contra o outro. Assim, este método de trocar as bolas leva a uma repulsão entre os dois meninos A e B. Repulsão Se ao invés de arremessar as bolas um contra o outro os meninos resolvem trocar as bolas, um tentando tirar as bolas do outro é fácil de imaginar que nesta nova situação de troca eles tentarão ser unidos. Portanto fisicamente esta situação leva a uma força de atração entre meninos A e B. Atração É possível provar através de técnicas matemáticas mais avançadas que a intertroca de mesonsmésons leva a forças extremamente fortes, esta idéia leva a um problema fundamental. Se os núcleonsnucleons constantemente emitem ou absorvem mesonsmésons, porque nêutrons ou prótons nunca são encontrados com massas 8 ligeiramente diferentes? A resposta para isto esta no princíipio da incerteza. Se o mesonméson emitido for absorvido por um nucleon vizinho ao emissor num tempo muito curto não será possível pelo princíipio da incerteza determinar a variação de energia melhor que, ∆E = ∆t ~ ħ (sendo troca rápida? ∆t é pequeno e ∆E é grande) Vamos considerar que as forças nucleares tem um alcance máximo da ordem de R ~ 1.410-15m, de modo que assumindo o mesonméson com velocidade c, o tempo do vôo? seria ∆t = R c e sendo ∆E = mπ c 2 , temos, (m c )R c ≅ h ⇒ m π 2 π ≈h Rc ≈ 2,510 −28 kg que corresponde á mπ ≈ 275me A teoria dos mesonsmésons para forças nucleares, apesar de fazerer previsões importantes, ainda não consegue descrever em detalhes a estrutura nuclear aparentemente mostra a correta direção para o pensamento. O modelo de intertroca não é a única tentativa para explicar as interações fortes entre nucleons. Um outro modelo conhecido como modelo dae gota líiquida que Formatado passaremos brevemente a descrever. As forças nucleares são extremamente fortes, porém de muito custo alcance de modo que cada nucleon basicamente interage somente com seus vizinhos mais próximos numa situação semelhante aquela das moléculas num líiquido onde a única interação importante é aquela da molécula com as moléculas que a rodeiam. Esta analogia das interações de um líiquido (numa gota) com forças nucleares leva ao chamado modelo da gota líiquida para o núcleo prevendo propriedades bastante importantes. Consideremos que a energia associada com cada par nucleon-nucleon tenha o valor U (evidentemente tratando-se de atração U é negativa, mas consideremos positiva por conveniência?). Sendo que cada ligação mesôonica é partilhada por dois nucleons, cada um deles tem 1 2 U de energia de ligação. Quando fazemos um empacotamento de esferas representando os nucleons cada um é circundado por 12 outros nucleons no máximo numa estrutura chamada de empacotada e que contém o maior número de esferas próximas possíveis., Formatado 9 que contém o maior numero de esferas próximas possível. Desta forma, cada nucleon terá associado a ele uma energia, 12 × 12 U = 6U Assim, se todos nucleons tivessem rodeadostivessem rodeado por 12 a energia de um determinado núcleo seria, Ev = 6AU = d1A esta energia Ev chamada de energia de volume é claramente uma idéia verdadeira para os nucleons no interior do volume do núcleo, mas certamente não é verdade para aqueles nucleons localizados na superfície do núcleo que não são circundados por 12 nucleons, mas por um número inferior. O número de nucleons superficiais dependemO número de nucleons superficiais depende da superfície do núcleo que é, 4πR 2 = 4πR0 A 2 3 Assim, o número de nucleons superficial é proporcional à A 2 3 e a energia de ligação de tais nucleons é Es, E s = −a 2 A 2 3 chamada de energia superficial do núcleo que leva o sinal negativo, pois corresponde á diminuição em Ε v . . Para núcleos que levar esta forma energética é importante já que Formatado 10 neste caso a fração de nucleons superficiais é elevada. Como o núcleo vai tentar tornar uma forma de modo a maximizar a energia de ligação que significa estáas mais estável. Desta forma o núcleo toma a forma mais próxima de uma esfera maximizando energia de ligação, pois esta é a forma com menos área para um determinado volume semelhante à gota de um líiquido. Além da energia entre nucleons a repulsão eletrostática entre prótons no núcleo também é importante, pois contribui para diminuir energia de ligação desestabilizando o núcleo. A energia Coulombiana Ec do núcleo terá o trabalho necessário para trazer do infinito os Zz prótons juntos numa distribuição volumétrica que é o núcleo. Dado Zz núcleos, o número de pares que temos é: Cada próton interage com Zz – 1 sendo z prótons separados em mídia de R 1 Formatado ( αA 3 ), Z (Z − 1) E c = − a3 A 1 3 e note sinal negativo pois esta energia desestabiliza o núcleo. Desta forma, a energia total de ligação do núcleo é, Eb = Ev + Es + Ec Ou seja, E b = a1 A − a 2 A 2 3 − a3 Z (Z − 1) A 1 3 e assim a energia de ligação por nucleon é, Eb a z (z − 1) a = a1 − 21 − 3 4 A A3 A3 Se graficarmos este resultado temos: 11 Assim, comparando Eb obtida com o discutido anteriormente vemos uma previsão razoável para Eb concordando como experimental demonstrando que este modelo pode ser útil para uma série de estudos principalmente em reações nucleares como veremos adiante. O modelo da gota líiquida para o núcleo atômico tem sua base no fato que cada Formatado núcleos interage primeiramente com seus vizinhos mais próximos como num líiquido. Formatado Existem, no entanto evidências experimentais fortes de que isto não é verdade dando evidências de uma interação generalizada ao invés de interações entre pares. Existe um modelo de camadas para o núcleo atômico que é bastante semelhante Formatado ao modelo de camadas eletrônicas para o átomo onde elétrons ocupam ou vão preenchendo camadas designadas pelo seu número quântico principal. Átomos com 2,10, 18, 36, 54 e 86 elétrons apresentam suas camadas preenchidas e portanto comportamcomporta-se de forma semelhante quimicamente além do que este modelo de camadas determina uma periodicidade nas propriedades. Da mesma forma, observamos que núcleos com 2, 8, 20, 28, 50, 82 e 126 nêutrons ou prótons são mais abundantes Formatado no uiniverso do que outros núcleos com número massa semelhante, sugerindo que tais números são mais estáveis. Estes números de prótons ou nêutrons para núcleos 2, 8, 20, 28, 50, 82 e 126 são normalmente conhecidos como números mágicos em estrutura nuclear. Núcleos com N ou Z equivalendo aos números mágicos apresentam estrutura nuclear bem próximo da esférica o que é demonstrado pelo pequeno momento quadripolar que eles apresentam. O modelo de camadas tem como importante suporte experimental à precisão correta dos números mágicos e o spin nuclear. Decaimento nuclear Formatado 12 Um dos fenômenos mais significantes no desenvolvimento da fisica atômica e da fisica nuclear é a radioatividade. Neste processo, um núcleo emite partíiculasr alfas (núcleo hélio) e elétrons (partículas betas) e prótons (raios gamas) adquirindo configurações mais estáveis. Nesta parte do curso iremos discutir um pouco este fenômeno que normalmente chamamos de decaimento nuclear. Imaginemos uma amostra de elementos radiativos que num determinado instante apresenta N núcleos. Definimos a atividade R como, R=− dN dt onde o sinal (-) é colocado para fazer R positivo. R é expresso em desintegraçõesão por segundo. Algumas vezes expressamos R em termos do Curie. 1 curie = 3.7 1010 desintegração / segéc Todas determinações experimentais de R mostram que a atividade apresenta um decaimento exponencial com o tempo. Definimos a meia vida do elemento T 12 como sendo o tempo para sua atividade cair a metade do valor no iníicio da medida. É importante salientar que após cada período T 12 a atividade da amostra esfera reduzida á metade, T1 2 T1 2 T1 2 R0 → 12 R0 → 14 R0 → 18 R0 ... 13 O comportamento mostrado acima permite que escrevamos a relação empírica, R = λN = − dN ⇒ R = R0 e − λ t dt onde λ é chamada de constante de decaimento e tem um valor diferente dependendo do elemento radiativo considerado. A relação entre λ e T 12 pode ser determinada, R = R0 e − λ t 1 2 R0 = R0 e − λT 1 2 λT = l n 2 → T = 1 1 2 2 0.693 λ Da dependência exponencial colocada acima temos uma forte evidencia de que o fenômeno de decaimento radiativo tem uma natureza estatística, isto é, cada núcleo radiativo apresenta uma certa probabilidade de decair, mas não há meios de saber quais núcleos decairão num certo instante de tempo. Se a amostra é grande o suficiente, fração que decai num determinado instante corresponde razoavelmente bem à probabilidade de decaimento de um único núcleo. Assim a probabilidade de um núcleo decair num período de tempo T 12 é 0,5. Vamos supor que a probabilidade por unidade de tempo para decaimento de um determinado núcleo seja constante λ . Assim, a probabilidade de decaimento num intervalo dt é λdt. Se tivermos a amostra com N núcleos que ainda não decaíram, a quantidade dN que decairá num intervalo dt é, dN = −λdt N de onde por integração tiramos, N = N 0 e − λt que mostra a evolução como tempo do número de núcleos que ainda não decaíram sendo N0 este número em t = 0. Desta lei podemos tirar a atividade radiativa. Formatado 14 R=− dN = λ N 0 e − λ t = R0 e − λ t dt com R0 = λN 0 que apresenta 66% probabilia uma partícula beta decair e 34% chance de emitir em 81 Tl 208 . figura Ou ainda podemos escrever, R = λN Outra constante de tempo importante é o tempo de vida médio, T= 1 λ diferente do tempo de meia vida T 12 . Normalmente T > T 12 . A maioriaedida dos elementos radiativos encontrados na natureza são membros de quatro grupos denominados de séries radiativas. Estas séeries são elementos que originam basicamente do mesmo elemento através de emissões radiativas (α e β ) . A razão para existir exatamente 4 séries vem de fato que o decaimento α reduz a massa atômica de 4 unidades. Assim, todos elementos radiativos cujas massas são 15 A = 4n , onde n é um inteiro, pode decair uns nos outros em ordem descendente do número de massa. Os núcleos radiativos cujo número massa é da forma acima 4n são denominados de membros da série 4n. Temos ainda 3 outras séries, A = 4n + 1 A = 4n + 2 A = 4n + 3 Em cada série radiativa os membros transformam-se uns nos outros através do decaimento. Cada série tem um elemento denominado do “pai da série” e um elemento estável final que interrompe o processo de decaimento. Número massa Série “pai” T 12 (anos) Estável final “pai” 4n Tório 232 90Th 1,39 1010 82Pb 208 4n + 1 Neptunio 237 93Np 2,25 106 83Bi 4n + 2 Urânio 92U 238 4,51 109 82Pb 206 4n + 3 Actinio 92U 235 7,07 108 82Pb 207 209 A série do neptunio tem um tempo de meia vida bastante curta comparada com a idade do universo (~ 1010 anos) de modo que os membros desta série quase não são encontrados nos dias atuais. Estes elementos podem, no entanto ser obtido através de bombardeamento de núcleos mais pesados feitos em laboratório. Estas series podem ser representadas graficamente. Cada decaimento α ou β proporciona um passo na série. Muitos núcleos radiativos podem decair de formas diferentes através de emissão α ou β. Como exemplo temos o 83Bi 212 , um membro da série do tório, que apresenta 66% probabilidade de emitir uma partícula beta decaindo em emitir alfa e decair em 81Tl 208 . (figura) 84 P0212 e 34% de chances de Formatado 16 Quando um núcleo zXA emite x particulasr α e y particular β, temos, z X A → x 2α 4 + y −1 β 0 + z ′ Y A′ transforma-se no núcleo z ′ Y A′ . A conservação do número de massa, A = 4x + A’1 → ∆A = 4x do número atômico, Z = A (2x – y) + Z’1 → ∆Z = -2x + y Assim, emitindo α o número massa altera de 4 unidades e o número atômico altera 2 unidades. Emitindo 1β, o número de massa não muda e o numero atômico altera (aumenta) de uma unidade. Desta forma podemos acompanhar as séries anteriores. Vamos agora ver em linhas gerais os produtos de decaimento. Decaimento alfa: Devido ao fato que as forças fortes de atração entre os nucleons somente manifesta-se a curto alcance, isto é, quando eles estão próximos à energia total de ligação entre os núcleos é proporcional ao número de massa A. Por outro lado, a força de repulsão coulombiana age mesmo a méedias distâncias. Esta repulsão coulombiana tenta Formatado 17 separar os prótons e o total desta tendência de ruptura do núcleo é aproximadamente proporcional à Z2. Assim, núcleos muito grandenúcleos muito grandes (normalmente com mais de 210 nucleons), apresentam a força de curto alcance que os mantém unidos, quase que totalmente contrabalanceadacontrabalançada pela repulsão entre prótons. Assim, o núcleo sendo grande há uma perda de estabilidade. O decaimento do núcleo através de emissão de partículas α e uma alternativa natural para estes núcleos diminuírem seu tamanho aumentando a estabilidade. Uma pergunta natural que fazemos nesta altura é: porque o núcleo não emite somente prótons ou núcleos de 2He3 para aumentar sua estabilidade ao invés de partículas α? A resposta para isto esta no fato que a partícula α tem uma alta energia de ligação além do que sua massa é muito menors que a de seus constituintes liberando parte da energia na forma de energia cinética necessária para a emissão da partícula. Assim, a quantidade de energia é, K = (mi − m f − m α )c 2 mi é a massa do núcleo inicial, mf a massa do núcleo final e mα a massa da partícula. Somente a emissão de partículas α é energicamente possível. Assim, imaginemos o decaimento 92U232. Neste caso temos, K = 5,4 MeV enquanto se supormos a emissão de um próton seria necessário fornecer ao sistema 6,1 MeV. A energia cinética real carregada pela partícula α emitida não é IK anterior, mas será um pouco inferior se considerarmos o recuo do núcleo na emissão. Através de conservação de energia e momentum podemos mostrar que, Kα ≅ A−4 K A é a energia cinética carregada pela partícula α emitida. Apesar de entendermos qualitativamente bem que a emissão nuclear de uma partícula α leva o núcleo à um estado mais estável ainda não entendemos muito bem como ocorre a emissão. Afim de entendermos este processo imaginemos o potencial de interação entre uma partícula α e um núcleo pesado. 18 Estando no interior do núcleo, a partícula α esta sujeita à um constante potencial e atingindo uma distância R0, que corresponde ao raio nuclear há um repentino aumento, impedindo que a partícula escape. Isto é, como uma caixa contendo as partículas. Esta barreira de potencial não é infinita, mas classicamente a partícula não pode sair desta configuração. Normalmente a altura da barreira é de ordem de 25 MeV. Fora do núcleo, a interação é essencialmente Coulombiana. Embora não possamos explicar classicamente o decaimento espontâneo do núcleo, a mecânica quântica nos fornece uma explicação clara e simples, sendo este fenômeno, mesmo tomado como comprovação desta última. No nossno modelo, a partícula no núcleo comporta-se como partícula na caixa de modo que vamos tratar quanticamente o potencial mostrado anteriormente e comparar o resultado do escape de partículas α com resultado experimental. 19 No presente modelo vamos imaginar que a partícula α tenha uma determinada energia no interior de núcleo oscilando no seu interior (como partícula na caixa). Cada vez que a partícula colide com a barreira de potencial localizada em r = R0 , há uma probabilidade da partícula passar através da barreira representando um decaimento do núcleo. Seja P a probabilidade da partícula colidir na barreira e passar por ela e ν a Formatado freqüência de colisão da partícula com a barreira. O número de vezes que a partícula passa pela barreira // unidade de tempo é λ, λ=νP Supondo que a partícula α tenha dentro do núcleo uma velocidade v, a freqüência com que ela colide com a barreira é, ν= V 2R0 Tomando v como a velocidade com que a partícula deixa o núcleo (~ 2 107 m/s) e sendo R0 ~ 10-14 m, → ν ≈ 1021 segc-1 Assim, vemos que mesmo colidindo 1021 vezes por segundo com a barreira a partícula α algumas vezes tem que esperar 1010 anos para escapar do núcleo. Classicamente como sabemos, Pp = 0, pois envolve passagem da partícula por uma região que tem energia potencial maior que a energia total. Quanticamente, no entanto, a partícula pode tunelar pela barreira (como vimos) e a probabilidade não é nula e pode ser calculada. Inicialmente vamos relembrar os resultados que vimos da transmissão de uma partícula por uma barreira de potencial. [FSU1] Comentário: 20 Seja um feixe partícula α com energia E = IK cinética incidindo da esquerda para a direita. Fora da barreira V = 0 e não há forças sendo partícula “livre”. Como já vimos à probabilidade de transmissão por esta barreira é, q2 = 2m(V − E ) h2 P=T onde K = 2 = (q 2 K2 = ) 2mE h2 (2 Kq )2 + K 2 senh 2 q + (2 Kq ) 2(E )m h2 2 q= e 2 2(V − E )m h2 Como P é pequeno, podemos escrever, 2 Kq P ≈ 2 2 q +K 2 − 2 qL e [FSU2] Comentário: 21 Este resultado vale para a barreira de altura V e largura L. Se quisermos aplicar este resultado para uma barreira qualquer podemos dividi-la em pequenas barreiras retangulares de tamanho V (x) e largura ∆x, como mostrado à seguir. De modo que, P= π . P barreiras barreira parciais individual ou seja, a probabilidade de transmissão da partícula na barreira será o produto das probabilidades de transição em cada uma das barreiras que constituem a barreira V (x). Ou seja, lnP = ∑ .lnP parciais barreiras mas lnPparciais = −2q∆x + 2ln 2 Kq q + K2 2 Como primeiro termo é dominante na maioria das casoas (pois o segundo termo é logaritmo do primeiro). lnP = ∑ − 2q∆x Como para cada barreira localizada em x, q= 2m(V (x ) − E ) h2 22 a soma transforma-se em integral fornecendo, lnP = −2 ∫ 2m (V (x ) − E )dx h2 L X0 e temos, P=e −2 L ∫X 0 2m h2 (V ( x )− E )dx Este resultado vale para a transmissão de uma partícula em qualquer barreira. Para o caso que estamos tratando do decaimento α uma partícula com energia E deveráa tunelar a barreira, V (x ) = 2 Ze 2 x do ponto x = R0 até o ponto x = R deixando o sistema com uma energia cinética IK que é todo E convertido em cinética. 23 Aplicando a relação da probabilidade de transmissão P a este caso: 1 2 2m 2 2 Ze q= 2 − K h x 1 2 Como ponto x = R é definido como sendo aquele que, 2 Ze 2 =K R temos, 2 Ze 2 = KR 1 2mK 2 R q (x ) = 2 − 1 h x 1 2 portanto, 1 1 2mK 2 R R 2 ∫R0 q(x )dx = h 2 ∫R0 x − 1 dx 1 1 1 1 2mK 2 −1 R0 2 R0 2 R0 2 = 2 R cos − 1 − R h R R R Como a barreira é muito mais larga do que as dimensões nucleares R0 << R, 24 R cos 0 R −1 R0 1 − R 1 2 1 2 π R ≅ − 0 2 R 1 2 ≈1 de modo que, 1 1 R0 2 2mK 2 π q ( x ) dx ≅ R − 2 ∫R0 2 h 2 R R E portanto, 1 R 2 2mK π lnP = −2 2 R − 2 0 h 2 R e usando R= 2mK lnP = −2 2 h 1 2 2 Ze 2 K 1 R0 2 2 Ze π −2 1 2 2 K 2 2 Ze K 2 2 2 1 2m 2 2 Ze π 2m 2 2 Ze 2 R0 2 = −2 2 + 4 2 K 2 1 1 2 2 2 12 2 h h K K 2 Ze 1 1 1 ( 1 4mZe 1 2m lnP = −2 2 πZe 2 K 2 + 8 2 h h 2 2 1 ) 1 R0 2 2 Utilizando os valores numéricos para a massa da partícula α, carga do elétron e ħ, 1 1 lnP = 2,97 Z 2 R0 2 − 3,95Z K −1 2 onde lK é a energia cinética da partícula α expressa em MeV, R0 o raio nuclear em unidades de 10-15m e Z o número de prótons no núcleo. A constante de decaimento λ que é a probabilidade por unidade de tempo, 25 λ = νP = v P 2 R0 v lnλ = ln 2 R0 −1 1 1 + 2,97 Z 2 R0 2 − 3,95Z K 2 Assim, fazendo um gráfico de lnλ medido versus Z K −1 2 medido temos, Os pontos experimentais concordam relativamente bem com a expressão teórica num intervalo grande de Z K −1 2 mostrando a validade do modelo proposto. Podemos usar 26 esta linha extrapolando para obter R0 quando Z → 0 e neste caso obtenha R0 ~ 10-14 m que concorda com resultado de Rutherford. A análise quântica do decaimento α é importante pois explica a grande variedade de constantes de decaimento λ tendo como mais longo decaimento anos? e mais curto 212 84Po 232 90Th 1,3x1010 com 3x10-7segc. Além desta, a explicação do decaimento α através de penetração na barreira de potencial é extremamente candescente com a natureza quântica do núcleo. Decaimento β Da mesma forma que no decaimento α, no decaimento β o núcleo procura uma forma de atingir maior estabilidade. O decaimento β consiste na emissão de um elétron pelo núcleo. Este elétron é originário do decaimento de um nêutron em um próton mais um elétron sendo que o próton continua evidentemente no núcleo. Medindo o momentum do elétron é possível calcular sua energia cinética, K = m02 c 4 + p 2 c 4 − m0 c 2 Observa-se que normalmente que a energia cinética no decaimento β varia de 0 até um valor máximo, K máx ≅ 1.17 MeV que deveria ser igual a variação máxima mássica do núcleo. No entanto, observa-se que isto não é verdade, normalmente parecendo que a energia esta sendo criada violando um dos importantes conceitos da Física. É possível medir com relativa precisão o recuo sofrido pelo núcleo após o decaimento beta e comparando seu momentum de recuo com o momentum do elétron também há uma aparente violação da conservação de momentum. Um terceiro agravante que aparece no decaimento β é o fato de que no processo, n → p + e- cada partícula tem spin 1 2 h de modo que não é possível conservar momento angular com este processo. Todas estas contradições foram resolvidas com a proposta do neutrino por Pauli em 1930. Para Pauli, o decaimento β deveria estar acompanhado da emissão de uma Formatado 27 partícula não carregada de spin 1 2 h que seria responsável de estar levando toda energia e momentum não explicado acima. Esta partícula seria o neutrino. Formatado Estudos mais apurados mostraram a existência de dois tipos de neutrino, o ν (neutrino) e ν (anti-neutrino), e que no decaimento β ordinário a partícula envolvida é o anti-neutrino, Formatado n → p + e- + ν A hipótese do neutrino para explicar o decaimento β foi muito bem sucedida. Esperava-se inicialmente a massa do neutrino como sendo uma fração muito pequena da massa do elétron. Hoje em dia acreditamos que a massa do neutrino seja realmente zero. Decaimento Gama O núcleo atômico existe em estados de energias bem definidas da mesma forma que os estados eletrônicos. Um núcleo excitado N* pode retornar ao seu estado fundamental emitindo fótons cuja energia correspondem à diferença entre os níveis envolvidos. Os fótons emitidos temOs fótons emitidos têm energia que pode atingir vários MeV e são denominados de raios gamasão denominados de raios gama. Normalmente o Formatado tempo de vida dos estados nucleares é bastante curto, mas em alguns poucos casos o decaimento gama, como é chamada esta missão, chega a atingir horas. Reações Nucleares Da mesma forma que em química, as reações entre elementos serve para trazer informações de cada elemento e seu comportamento na natureza, as reações nucleares são ricas em informações a respeito dos constituintes nucleares que é seu comportamento. Além disso, as reações nucleares constituem-se na maneira de tirarmos proveito prático do núcleo atômico, veja como um reservatório de energia, ou seja, como mecanismos de formação desta fauna de elementos químicos presentes no universo. A maioria das reações nucleares envolvem....... que contém o maior número de esferas próximas possível. Desta forma, cada nucleon terá associado a ele uma energia. 12 x 12 U = 6U Formatado 28 Assim, se todos nucleons tivessem rodeados por 12 a energia de um determinado núcleo seria. Ev = 6AU = d1A Esta energia 1 UNIVERSIDADE DE SÃO PAULO INSTITUTO DE FÍSICA DE SÃO CARLOS DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS CAPÍTULO X INTRODUÇÃO AOS SÓLIDOS PROF. VANDERLEI S. BAGNATO 2 Capítulo X Introdução aos sólidos Os sólidos constituem uma classe especial de arranjo microscópico. Quando os átomos ou moléculas se aproximam muito, vários efeitos ocorrem, determinando o comportamento macroscópico do sistema. As ligações químicas constituem uma das partes mais importantes das características dos sólidos. A natureza e a forma com que os átomos se unem, determina sua estrutura bem como suas características físicas, principalmente com relação à condutividade elétrica. Como uma introdução ao tema dos sólidos, vamos descrever as ligações químicas e realizar alguns modelos com relação ao transporte de cargas. Ligações químicas Devido às características eletrônicas apresentadas pelos átomos, eles têm capacidade de se combinarem formando moléculas e muitas vezes se agruparem em um maior número formandos os sólidos. As ligações iônicas têm origem quando átomos de baixa energia de ionização se unem com outros de alta afinidade eletrônica. O resultado é uma transferência de carga criando íons positivos e negativos que interagem via Coulomb. Normalmente neste caso a ligação formada não preserva informações dos orbitais atômicas originais e a estrutura do grupo de átomos ocorre principalmente de forma a obedecer aos impedimentos espaciais impostos pelo 3 tamanho efetivo entre os íons. Este é certamente o caso quando podemos visualizar os sólidos através do empacotamento de esferas um exemplo tradicional deste tipo de ligação é o NaCl . Onde íons de Na e Cl distribuem-se formando uma rede cúbica. Normalmente no caso de ligações iônicas, é importante falarmos em fator de empacotamento, etc. A distribuição dos átomos pode obedecer a vários tipos de arranjos sendo os mais importantes os chamados cúbicos. É importante salientar que na ligação iônica não há direção de ligação já que a conexão entre átomos dar-se através da interação de Coulomb entre cargas puntuais. É o impedimento esférico que aparece quando os átomos se aproximam muito que determinam a estrutura. Por outro lado, temos átomos que quando se aproximam adquirem uma situação mais estável se compartilharem elétrons com átomos adjacentes. Esta situação cria as ligações covalentes e conseqüentemente os sólidos covalentes. Neste caso, as ligações químicas que correspondem à concentração eletrônica numa região ligando os átomos obedecem esta direcionalidade no espaço, direcionalidade esta que normalmente advém das características do orbital atômico original. Um exemplo tradicional deste caso é o diamante. Neste caso, cada átomo de carbono possui 4 vizinhos partilhando elétrons. Os ângulos entre as ligações são bem determinados e é exatamente este fator dominante no estabelecimento da estrutura do sólido. A localização dos elétrons nas ligações covalentes faz com que estes sólidos sejam maus condutores de calor e os elétrons, mas muito estáveis quimicamente. Muitas vezes a natureza da ligação 4 química no sólido não é perfeitamente determinada, fazendo com que o sólido tenha uma característica mista. Este é certamente o caso do quartzo (SiO2). Há ainda substâncias que são bastante estáveis de tal forma que quando aproximadas preservam sua individualidade, promovendo sua ligação de forma diferente das iônicas ou covalentes. Exemplos desta classe de substâncias são certamente os compostos orgânicos formando polímeros. Neste caso, as forças intermoleculares são formadas por flutuações na polarizabilidade. Estas são a chamadas interações De Van der Waals. E são também chamadas de ligações secundárias por serem muito mais fracas do que as anteriores. Para ilustrar a natureza da ligação de Van de Waals considere dois átomos que se aproximam e vamos imaginar que suas nuvens eletrônicas como osciladores harmônicos. Ao se aproximarem, as nuvens eletrônicas se deformam estabelecendo um tipo de indução dipolar. 5 A energia deste sistema sem considerarmos interação é H0 = p12 1 2 p 22 1 2 + cx1 + + cx 2 2m 2 2m 2 e cada sistema tem sua freqüência natural ω 0 = c . Devido a interação m eletrostática H1 = que como x1, x2 e2 e2 e2 e2 + − − R R + x1 − x2 R + x1 R − x 2 R, pode ser expandida originando Ze 2 x1 x 2 H1 = − R3 Assim, o sistema físico é modelado como sendo dois osciladores acoplados por H1. Definidas novas coordenadas x1 = x2 = 1 2 1 2 (x s + xa ) p1 = (x s − xa ) A energia total é agora escrita como 1 2 ( ps + pa ) p2 = 1 2 ( ps − pa ) 6 H = H 0 + H1 = 1 2 1 2e 2 p s + C − 3 2m 2 R 2 1 2 1 2e 2 x s + p a + C + 3 2m 2 R 2 x a mostrando que este sistema acoplado tem dois modos de vibração de freqüências 1 2e 2 3 2 1 2e 2 1 2e 2 2 ωs C ± R ..... − = ∼ ω 0 1 ± 3 ωa 8 CR 3 m 2 CR A energia do ponto-zero deste sistema é 1 h (ω s + ω a ) de modo que devido a 2 interação há um saldo energético ∆Η = 1 h h(ω s + ω a ) − 2 ω 0 2 2 fornecendo ∆Η = − com C 6 = C6 R6 hω 0 e 4 2 c2 Isto mostra que a aproximação dos dipolos oscilantes, produz uma situação mais estável do que quando isolados. Assim, uma atração entre eles faz com que tais entidades permaneçam unidas. 7 Esta ligação é responsável pela união das moléculas orgânicas formando plásticos. 1 UNIVERSIDADE DE SÃO PAULO INSTITUTO DE FÍSICA DE SÃO CARLOS DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS CAPÍTULO XI PRINCÍPIOS DA MECÂNICA ESTATÍSTICA PROF. VANDERLEI S. BAGNATO 2 Capítulo XI Princípios da Mecânica Estatística A grande parte do esforço feito pela física constitui em explicar as observações macroscópicas através de modelos constituídos de porções microscópicas. No entanto, os constituintes microscópicos de um sistema têm normalmente suas grandezas físicas apresentando valores distintos dentro do que chamamos uma distribuição de valores. Deste modo, as grandezas microscópicas se manifestam através de uma certa média estatística de seus constituintes. A maneira como as grandezas de um conjunto de entidades microscópicas se distribuem estatisticamente dependem entre outras coisas do tipo e natureza dos constituintes do sistema. A mecânica estatística, procura formular este problema gerando os aspectos fundamentais das distribuições dos constituintes microscópicos. Constitui-se então numa importante ferramenta para a física. Vamos começar falando do conceito de Distribuição de Probabilidade. Considere uma caixa dividida em K- compartimentos nos quais vamos adicionar N- bolas de forma aleatória. 3 Como os compartimentos têm formas e tamanhos diferentes, os compartimentos terão diferentes chances de receberem bolas. Esta probabilidade de cada compartimento receber bola, chamaremos de probabilidade intrínseca de ocupação (gi). Por exemplo, se cada compartimento tem área ai, e sendo A a área total gi = ai A Esta probabilidade “a priori” ou intrínseca só depende do sistema. Ao deixarmos a N-bolas sobre os compartimentos, cada compartimento receberá ni. No entanto, há inúmeras maneiras de acomodarmos as N bolas nos K compartimentos. Por exemplo, uma possibilidade é termos todas as bolas em somente 1 compartimento e assim por diante. Este número de maneira que N bolas podem entrar nos K compartimentos também afetam as possíveis de preenchermos o sistema. Desta forma, a probabilidade do sistema ser encontrado numa determinada ocupação {ni } , depende destes dois fatores: Probabilidade “a priori” de a bola cair num compartimento. Número de possibilidades de distribuição das N bolas entre os vários compartimentos. A composição destes fatores, gera a probabilidade W ({ni }, {g i }) que chamamos de distribuição de probabilidades. Normalmente, nosso maior interesse é saber quando W é máximo. Ou seja, estamos interessados em 4 determinar que conjunto {ni }é o mais provável de ocorrer. Uma vez conhecida isto, conectamos a distribuição microscópica com a macroscópica. Voltando ao caso de nosso exemplo, ∑a ∑g i =A e i =1 A probabilidade de termos ni bolas na i-ézima caixa é então ( g i ) i . Desta forma a n probabilidade de termos uma certa distribuição n1, n2,....,nk é o produto: (g1 )n (g 2 )n ....(g i )n ...(g k )n 1 onde ∑n i 2 i k =N A próxima pergunta que fazemos é de quantas formas estas N bolas podem ser arranjadas? A resposta desta pergunta corresponde exatamente à combinação de N bolas em grupos n1, n2,......,nk, ou seja N! n1!n 2 !...n k ! Assim, a probabilidade total do sistema adquirir a distribuição n1, n2, ... nk é W= N! (g1 )n1 (g 2 )n2 ....(g k )nk n1!n2 !...nn ! que é a distribuição de probabilidades para a distribuição de bolas em questão. 5 A primeira curiosidade que temos é que a distribuição (n1, n2...nk) que produz o maior W? esta é a chamada distribuição mais provável para obtermos isto, vamos introduzir algumas aproximações ln n!≅ n ln n − n conhecida como fórmula de Stirling. Tomando logaritmo de W, ln W = ln N!−∑ ln ni !+ ∑ ni ln g i usando ∑n i = N e a fórmula para ln N ! , ln W = N ln N − ∑ ni ln ni + ∑ ni ln g i Para determinarmos (ln W )máx = ln Wmáx , realizamos variações nos valores de ni ni → ni + δni e verificamos para que conjunto {ni } a variação causada em ln W é mínima (Isto é equivalente á condição de máximo ∂W = 0 ). Assim, ∂ni δ ln Wmáx = −∑ ni δ ln ni − ∑ δni ln ni + ∑ δni ln g i = 0 como δ ln ni = já que o δni i ∑ δn número ∑ n δ ln n = ∑ δn i ,e ni i =0 i de =0 bolas é constante. Com isto chegamos á 6 ou seja − ∑ ln ni δni + ∑ ln g i δni = 0 Utilizando multiplicadores de Lagrange, obtemos que a distribuição mais provável corresponde a ni = N ai A ou seja, ni = Ng i Se quisermos aplicar o conceito de distribuição de probabilidades para analisarmos propriedades macroscópicas de sistemas físicos, é preciso primeiro conhecer a natureza dos constituintes microscópicos. No caso de partículas clássicas, elas são distinguíveis e em princípio podem adquirir qualquer valor da energia. Isto faz com que inúmeras possíveis distribuições microscópicas podem causar a mesma energia macroscópica. Caso as partículas sejam quânticas a indistinguibilidade é um fator dominante e o princípio de exclusão de Pauli deve ser levado em conta, quando montarmos as várias possibilidades de arranjos microscópicos que levam a uma determinada energia macroscópica. Um gás clássico, é um exemplo de partículas distinguíveis e estamos interessados em determinar como que a energia do sistema está distribuída entre os constituintes microscópicos do sistema. Esta é a chamada estatística de Maxwell-Boltzmann, extremamente propriedades dos gases clássicos. importante na determinação das 7 Comecemos considerando um conjunto de N moléculas cujas energias ( cinéticas neste caso), estão limitadas aos valores µ1 , µ 2 ,...µ k . Dentro das N moléculas, temos n1, n2,...nk. Moléculas com cada valor das energias listadas. O número total de partículas e a energia total do sistema E, estão vinculadas com a distribuição n1, n2,...nk através de ∑n = N ∑µ n = E i i i se a probabilidade á priori que uma molécula tenha energia µi for gi, então a probabilidade W para qualquer distribuição será W= N! (g1 )n1 ....(g k )nk . n1!n2 !...nk ! com vimos anteriormente. Agora, temos que determinar a distribuição mais provável com as condições acima. Neste caso, a aplicação dos métodos matemáticos para determinar a W máx faz-nos chegar a ni = g i e −α e − βµi que é conhecido como Lei de Distribuição de Maxwell-Boltzmann. Em outras palavras, as partículas estarão alocadas a cada possível valor de energia µi, da forma indicada como a forma mais provável. Ou seja, isto determina como a energia estará distribuída entre as partículas. 8 As constantes α e β são quantidades independentes dos {ni }. Para calcularmos α e β convém considerar uma distribuição contínua de energia e não discreta com bolas em caixas. Desta forma, o número de partículas com energia entre µ → µ + dµ será n(µ )dµ de modo que n(µ )dµ = ge −α e − βµ dµ Como em nosso sistema físico a energia está na forma cinética, Ou seja, n( p )dp = ge e −α −β p2 2m dp. A probabilidade á priori de que um certa molécula está com energia entre µ e µ + dµ deve ser determinada da mesma forma que no caso das bolas na caixa. Sendo o gás isotrópico e obedecendo ao princípio de eqüipartição da energia, ∞ N = ∫ n(µ )dµ 0 e ∞ 3 KT = 2 ∫ µn(µ )dµ 0 ∞ ∫ n(µ )dµ ∞ ou 3 NKT = ∫ µn(µ )dµ 2 0 0 de onde é possível eliminar g, α e β. Na verdade determinamos 9 β= 1 KT sendo K a constante de Boltzmann e ge −α , juntos. O resultado é que n(µ )dµ = Lembrando que µ = 2πN (πKT ) 3 µe −µ KT dµ 2 1 2 mv , podemos converter esta expressão na distribuição de 2 velocidade, obtendo n(v )dv = 2πNm (πKT ) 3 3 2 2 v 2e − mv 2 2 KT dv 10 Desta distribuição de energia podemos obter entre outras coisas a velocidade mais provável, etc. O conhecimento da distribuição de velocidades permite a determinação de importantes propriedades dos gases, como viscosidade, transferência de calor e difusão. As Estatísticas quânticas de Bose-Einstein e de Fermi-Dirac A distribuição estatística de Maxwell-Boltzmann considera um gás clássico de partículas que podem ser distinguíveis e que podem assumir energias quaisquer, ou seja, um contínuo de energia. Se o gás for quântico, no entanto os valores possíveis de energia são discretos e as partículas são naturalmente indistinguíveis. A ocupação de cada estado possui a mesma probabilidade à priori, de modo que a probabilidade total de ocupação de cada estado representa na verdade o número de estados com determinada energia. Se o número de partículas no sistema com determinada energia µ i e ni e havendo gi estados com esta energia, há um certo número de maneiras que estas ni partículas podem ser distribuídas pelos gi estados. O problema é parecido com a situação onde temos g i − 1 paredes móveis numa caixa onde serão colocadas ni bolas 11 O número de bolas entre cada 2 paredes e o número de partículas num determinado estado. O número de possíveis distribuições neste sistema será (ni + g i − 1)! ni !( g i − 1)! para um sistema de N partículas a probabilidade total é o produto de todas probabilidades W =∏ (ni + g i − 1) ni !( g i − 1)! Novamente estamos interessados em determinar o máximo de W, ou seja, qual é a distribuição de partículas entre os estados que produz um máximo de probabilidade, isto é, a distribuição mais provável. O procedimento é semelhante ao caso da distribuição de MaxwellBoltzmann. Considerando ni+gi-1∼ni+gi e usando ln n!= n ln n − n ln W = ∑ [(ni + g i ) ln (ni + g i ) − ni ln ni − ln ( g i − 1)!− g i ] Usamos agora um método variacional para obter o ponto máximo e W. o resultado é que o conjunto de ocupação para os vários estados com probabilidade máxima de ocorrer é ni = gi e e βµi − 1 α 12 conhecida como distribuição de Bose-Einstein. Por argumentos semelhantes, β= 1 e α é um parâmetro determinado a partir da condição KT ∑n i =N A distribuição de Bose-Einstein é válida para partículas que podem acumular-se num determinado estado. Portanto, tratam-se dos bósons, partículas com um determinado spin de valor zero ou inteiro. Uma importante aplicação da estatística de Bose é o caso de um gás de Fótons contidos numa caixa de volume V. neste caso, como os fótons estão constantemente sendo absorvidos e emitidos, não é possível preservar seu número. O resultado disto é que α=0, para que esta característica do sistema possa ser preservada. A cavidade que estamos considerando contém fótons indistinguíveis, cada um com energia hν . O número de possíveis estados para fótons com freqüência entre ν e ν + dν pode ser obtido somando-se os modos desta cavidade neste intervalo de freqüência. Isto pode ser feito facilmente e o resultado obtido é exatamente a probabilidade “a priori” gi, que aqui expressaremos como g (ν )dν g (ν )dν = 8πV 2 ν dν c2 Com isto, podemos calcular a distribuição de fótons como sendo: 13 n(ν )dν = 1 e hν KT . −1 8πV 2 ν dν c2 A densidade correspondente de energia espectral µ (ν )dν , que é a energia por unidade de volume contida na radiação entre as freqüências ν e ν + dν é dada por: µ (ν )dν = hν .n(ν )dν 8πh ν 3 dν = 3 hν V c e KT − 1 esta é a conhecida fórmula de Planck da radiação . A densidade total de energia dentro da cavidade é obtida adicionando-se todas as freqüências, ou seja ∞ u = ∫ u (ν )dν = AT 4 0 conhecida fórmula para a energia radiante emitida por um corpo negro. Outra importante aplicação da distribuição estatística de Bose é a famosa Condensação de Bose-Einstein (ver artigo sobre CBE, final da apostila). Quanto o sistema é composto por partículas de spin semi-inteiro o princípio de exclusão de Pauli impõe restrições que acabam por produzir uma nova distribuição estatística denominada de Fermi-Dirac. A dedução da estatística de Fermi-Dirac é parecida a de Bose-Einstein. Ao contrário desta ultima , férmions não podem ocupar o mesmo estado. Somente uma partícula pode ocupar cada estado. De forma paralela ao feito anteriormente, imaginemos que temos gi estados com energia µi preenchidas por ni partículas. Como cada estado acomoda apenas uma partícula, ni estados estão preenchidos e ( g i − ni ) ainda disponíveis. 14 O número de maneira que estas ni partículas podem ser acomodadas é dado pelo arranjo gi! ni !( g i − ni )! e portanto a distribuição de probabilidades para as várias possibilidades dos {ni }deste sistema é W =∏ gi! ni !( g i − ni )! Novamente, queremos determinar a distribuição mais provável {ni }máx que corresponde aquela que maximiza a probabilidade acima. Assim, tomando o logaritmo ln W = ∑ [ln g i !− ln ni !− ln ( g i − ni )!] com aproximação de Stirling ln n! = n ln n − n , ficamos com ln W = ∑ [g i ln g i − ni ln ni − (g i − ni ) ln (g i − ni )] Vamos agora utilizar o método variacional fazendo uma variação δni na população dos estados e verificar a condição onde isto não altera W, que deve corresponder ao extremo δWmáx = ∑ [− ln ni + ln (g i − ni )]δni = 0 15 Os vínculos para este problema são que o número de partículas seja conservado − α ∑ δni = 0 − β ∑ µ i δ ni = 0 Com estes vínculos, o método variacional leva a ∑ [− ln n i + ln ( g i − ni ) − α − βµ i ]δni = 0 Como δni são independentes, − ln ni + ln ( g i − ni ) − α − βµ i = 0 de onde tiramos, substituindo β = 1 KT ni = gi eα e µi KT +1 que corresponde a distribuição de Fermi-Dirac, mostrando como um sistema de férmions distribuem-se nos níveis de energia disponíveis num sistema físico. A principal aplicação da estatística de Fermi-Dirac é a teoria dos elétrons livres nos metais, que corresponde a um importante exemplo dentro da teoria dos sólidos. Comecemos considerando um gás de elétrons no metal. Na consideração que os elétrons são férmions e livres,a estatística anterior aplica-se bem. A ocupação de cada estado µi vale 16 ni = gi eα e µi +1 KT No entanto, devido a enormidade de partículas e estados é adequado considerarmos um contínuo de estados. Assim agora falamos na ocupação dos estados com energia entre µ e µ + dµ n(µ )dµ = g (µ )dµ eα e µ KT +1 para determinarmos g (µ )dµ (número de estados com energia entre µ µ+dµ, contamos os estados das partículas numa caixa de voluma V, verificando no espaço dos números quânticos (k x , k y ek z ) quantos estados estão no intervalo de energia considerado. Este procedimento nos leva a 8 2Vm g (µ )dµ = h3 3 2 1 µ 2 dµ Aqui é importante lembrar que cada estado foi contado duas vezes, devido as duas possibilidades de spin. Nosso próximo passo será determinar o parâmetro α. Considerando o gás a baixas temperaturas, temos que a ocupação dos estados é zero ou um, até que todos estados sejam preenchidos chegando a máxima energia ocupada µ f . Isto é uma conseqüência do princípio de exclusão de Pauli. Isto significa que o chamado índice de ocupação f = até uf e cair rapidamente acima de µf ni , deverá ser um ou zero gi 17 f (µ ) = 1 µ e KT +α +1 para que esta fórmula seja condizente com o princípio de exclusão mencionado acima, temos que colocar α = − µf KT , e desta forma, o índice de ocupação fica 1 f (µ ) = (µ − µ f ) KT e +1 para T 0, µ < µf leva a f (µ ) = 1 e para µ> µf f (µ ) → 0 . Temos f (µ f ) = 1 . 2 Se nossa amostra de metal apresenta n elétrons livres, em T=0 µf ∫ g (µ )dµ = N 0 e fazendo esta integral obtemos h 2 3N µf = 2m 8πV como 2 3 N = ρ , temos que V h2 3 µf = ρ 2m 8π 2 3 18 independendo obviamente das dimensões da amostra e dependendo somente da densidade. Um vez conhecida a distribuição e a energia de Fermi, podemos determinar propriedades termodinâmicas do sistema como o calor específico, etc.