Apostila - Bagnato

Propaganda
CAPITULO 1 - Introdução 1
CAPÍTULO I
INTRODUÇÃO
O estado gasoso
O estado gasoso é certamente o estado de agregação sob o qual menos nos
debruçamos, se pensarmos na observação que fazemos daquilo que nos rodeia. Todos
sabemos que existe (atmosfera, combustíveis gasosos...), mas não é fácil enumerar um
conjunto de propriedades que lhes sejam características. Podemos contudo afirmar, de
forma simplista, que os gases fluem com extrema facilidade, tem uma densidade
baixa, são bastante compressíveis, e ocupam todo o volume que lhes seja disponível.
Vamos neste capítulo rever alguns conhecimentos importantes sobre o estado
gasoso, pois é frequentemente utilizado como exemplo na demonstração dos
fundamentos básicos da Termodinâmica Química.
O modelo do gás perfeito
No estudo da Termodinâmica não necessitamos de qualquer teoria acerca da
estrutura molecular, mas no entanto é bom termos em mente um modelo molecular
para interpretar os seus resultados. Uma boa visão para um gás perfeito é o de um
conjunto de moléculas, consideradas partículas pontuais, em movimento aleatório,
com velocidades que aumentam com a temperatura, e sem interacções entre si,
excepto colisões elásticas de muito curta duração.
As propriedades fundamentais para estudarmos um sistema termodinâmico são o
volume, V, a pressão, p, a temperatura, T, e a quantidade de matéria, ou número de
moles, n. Um gás, num dado estado termodinâmico de equilíbrio, é caracterizado
univocamente por aquelas propriedades. No entanto estas propriedades não são
independentes umas das outras, pois existe uma equação de estado que relaciona todas
estas propriedades. Essa equação para um gás perfeito é a equação dos gases
perfeitos:
pV = n RT
CAPITULO 1 - Introdução 2
onde p é a pressão a que o gás está sujeito, T a sua temperatura absoluta, V o volume
que ocupa, n o número de moles de gás presente, e R é a constante dos gases perfeitos.
R = 8.314 J.mol-1.K-1 = 1.987 cal.mol-1.K-1 = 83.14 bar.cm3.mol-1 ou
R = 0.082 atm.L.mol-1.K-1
Voltaremos a esta equação mais adiante. Por agora vamos recordar alguns
conceitos básicos sobre pressão e temperatura que importa ter presentes ao longo do
curso. Estes conceitos são do maior interesse, pois todos os fenómenos químicos
dependem destas variáveis termodinâmicas.
Pressão
A pressão constitui com a temperatura o par de variáveis termodinâmicas
consideradas como independentes, pois é relativamente simples controlá-las num
laboratório ou instalação industrial.
A pressão é uma força exercida por unidade de área. Mede-se em várias unidades.
A unidade de pressão do Sistema Internacional (SI) é o Pascal. O Pascal é uma
unidade derivada deste sistema, e representa a pressão exercida pela força de 1 N
actuando numa área de 1 m2 , isto é:
1 Pa = 1 N m-2
Esta unidade é pouco prática pois representa uma quantidade muito pequena. A sua
relação com unidades mais práticas é a seguinte:
1 bar = 100 kPa
1 atm = 101325 Pa
Usam-se ainda unidades mais pequenas como o torr, que é muito aproximadamente
igual ao milímetro de mercúrio, mmHg:
1 torr = 133.322 Pa
CAPITULO 1 - Introdução 3
Da relação anterior deriva outra igualdade importante que relaciona a atmosfera
com esta última unidade:
1 atm = 760 torr
O método mais simples de medida da pressão para zonas entre ≈ 10 mbar e 1 bar é
o manómetro de mercúrio. Um exemplo é a medida da pressão atmosférica com um
barómetro. O princípio básico desta medida é o equilíbrio entre uma coluna de
mercúrio e uma coluna de ar à superfície líquida do mercúrio. Considere-se a figura
1.1:
Figura 1.1. Barómetro de mercúrio
Se o espaço acima da coluna de mercúrio for um vácuo perfeito, a pressão
atmosférica, p, pode ser relacionada com a altura da coluna de mercúrio, h, da
seguinte forma:
p = F/A = mg/A = ρπr2hg/πr2 = ρhg
onde F é a força exercida pela coluna de mercúrio por unidade de área, A, m é a massa
de mercúrio, g é a aceleração da gravidade, e ρ é a densidade do mercúrio.
Os manómetros mais simples são em forma de U. O tubo em forma de U encontrase cheio de mercúrio, como mostra a figura 1.2:
CAPITULO 1 - Introdução 4
Figura 1.2. Manómetro de mercúrio
Um dos braços do manómetro encontra-se ligado ao sistema ao qual se pretende
medir a pressão. O outro braço está fechado em vácuo, ou aberto. Se está aberto, a
pressão medida no sistema é relativa , isto é:
Psist = Pman + Patm
Se o tubo estiver fechado, Psist = Pman.
Os manómetros de mercúrio são utilizados em linhas de vácuo, para operações de
controle e medida de pressões relativamente baixas. Para pressões mais reduzidas, na
zona do vácuo primário temos de recorrer a manómetros do tipo Pirani. Estes
manómetros utilizam um filamento aquecido de um metal com um coeficiente de
variação da resistência com a temperatura elevado. A temperatura do filamento
depende da condutibilidade térmica do gás residual que, a baixas pressões, varia
linearmente com a pressão. Estes manómetros necessitam de calibração. Para o alto
vácuo utilizam-se manómetros de ionização.
Para pressões mais elevadas recorre-se frequentemente a manómetros de tubo de
Bourdon como o da figura seguinte:
CAPITULO 1 - Introdução 5
Figura 1.3. Manómetro de tubo de Bourdon
O tubo de Bourdon é um tubo fechado na extremidade e enrolado. Quando a
pressão é aplicada o tubo tende a desenrolar provocando o movimento de um
mecanismo com ponteiro.
Temperatura
Todos sabemos intuitivamente o significado de temperatura, mas definir
correctamente o termo é um pouco mais complicado. Podemos afirmar que a
temperatura é a propriedade que nos indica a direcção de um fluxo de energia. Se o
calor flui de um corpo A para um corpo B dizemos que A está mais quente, ou com
temperatura mais elevada do que B. Se não há fluxo de energia quando os corpos A e
B estão em contacto então dizemos que estão em equilíbrio térmico. Supondo agora
um corpo A em equilíbrio térmico com B e B em equilíbrio térmico com C então C e
A estão também em equilíbrio térmico. Isto é a base da Lei Zero da Termodinâmica:
Se A está em equilíbrio térmico com B e B em equilíbrio térmico com C , então C está
também em equilíbrio térmico com A
A lei zero da termodinâmica é o princípio fundamental que permite construir
termómetros. Estes são instrumentos que indicam uma variação de temperatura em
CAPITULO 1 - Introdução 6
função de uma propriedade física qualquer (como por exemplo o comprimento de
uma coluna de mercúrio).
Nos primórdios da termometria as temperaturas foram relacionadas com o
comprimento de uma coluna de líquido, e as diferenças de comprimento observadas
em contacto com gelo e em contacto com água em ebulição foram divididas em 100
partes iguais, atribuindo-se 0 graus ao valor mais baixo. Esta é a escala em graus
Celsius. Esta escala depende pois do fluido utilizado.
Pelo contrário, o volume de um gás é aproximadamente independente do tipo de
gás, à medida que a densidade tende para zero. Esta propriedade permite estabelecer a
escala de temperaturas termodinâmicas. As temperaturas termodinâmicas são
designadas por T e medem-se em kelvin, K. A relação entre a escala termodinâmica
de temperatura e a escala mais vulgarmente utilizada, ou escala em graus Celsius, °C,
é:
T/K = t/°C + 273.15
Nesta escala 0 °C corresponde exactamente a 273.15 K.
A temperatura pode ser medida utilizando um termómetro de gases. A
temperatura é medida comparando a pressão do gás quando está em contacto térmico
com a amostra à qual se pretende medir a temperatura, e com um padrão adequado.
Um padrão adequado é a água no seu ponto triplo (ver adiante no curso), a condição
única de p e T em que a água
coexiste simultaneamente nos três estados de
agregação, sólido, líquido e vapor. A temperatura do ponto triplo é definida
exactamente como:
T3 = 273.16 K
Se a pressão medida quando o termómetro de gás está em contacto com a amostra
é p, e a pressão quando está em contacto com T3 é p3, então a temperatura da amostra
é dada por:
T ≈ (p/p3)T3
CAPITULO 1 - Introdução 7
A relação anterior é exacta apenas quando o gás se comporta idealmente, isto é,
na zona das baixas pressões. Na figura seguinte mostra-se um termómetro de gás a
volume constante:
Figura 1.4. Termómetro de gás a volume constante
O termómetro anterior é evidentemente pouco prático. Os termómetros de
expansão fazem uso da dilatação das substâncias como propriedade termométrica. O
exemplo mais comum é o termómetro de mercúrio. Estes termómetros são
previamente calibrados, pois a dilatação da coluna de mercúrio também depende do
vidro utilizado.
Para maior rigor das medidas de temperatura utilizam-se outros tipos de
termómetros. Nos termómetros de resistência de Platina é medida a resistência da
platina em contacto com a amostra, que por sua vez é função da temperatura. Outro
tipo de termómetros são os termopares. Estes consistem em duas junções de
condutores diferentes (existem vários tipos). Uma das junções coloca-se a uma
temperatura t0 conhecida (pode ser o gelo em fusão) e a outra à temperatura t que se
pretende medir. A força electromotriz gerada é função da diferença de temperaturas,
podendo assim determinar-se t.
Para altas temperatura pode ainda utilizar-se um pirómetro óptico, em que é
medida a radiação emitida pela fonte, num dado comprimento de onda, que por sua
vez é função da temperatura.
CAPITULO 1 - Introdução 8
Leis dos gases
A equação dos gases perfeitos é uma lei limite, pois quando p Æ 0, quase todos os
gases obedecem a esta lei. A pressões próximas de 1 atm e temperatura ambiente a
maioria dos gases não se desvia muito deste comportamento. A equação dos gases
perfeitos pode ser facilmente deduzida das leis fundamentais dos gases. A primeira
destas leis é a Lei de Boyle. Para n e T constantes Boyle verificou o seguinte:
pV = constante
Num gráfico p,V obtemos isotérmicas como as da figura seguinte:
Figura 1.5. Isotérmicas ideais de um gás
Outra lei fundamental é a Lei de Charles e Gay-Lussac. Para n e p constantes
obtêm-se:
V∝T
e para n e V constantes obtêm-se igualmente:
P∝T
Verifica-se assim que V ∝ T com uma constante de proporcionalidade que
depende da pressão. Cada curva representa uma isobárica e é traduzida por uma linha
recta no diagrama V,T.
Lord Kelvin reconheceu a importância desta lei, definindo a partir dai uma escala
de temperaturas absolutas, ou escala termodinâmica. De facto Lord Kelvin verificou
que extrapolando o volume de vários gases em função da temperatura, para volume
nulo, obtém-se para todos uma intersecção na ordenada que correspondia a - 273.15
CAPITULO 1 - Introdução 9
°C. A este valor atribuiu o valor de 0 K, mantendo os intervalos entre graus iguais.
Isto significa que os 0 °C são precisamente 273.15 K. Esta escala é a única com
interesse em cálculos termodinâmicos. Isto pode ser observado na figura abaixo:
Figura 1.6. Isobáricas ideais de um gás
A ultima lei fundamental é a Lei de Avogadro . Para p e T constantes temos:
V∝n
Juntando todas estas leis obtemos:
V ∝ 1/p . T . n
V ∝ nT/p
ou
V = Constante × nT/p
Esta constante é uma constante universal e é a constante dos gases perfeitos, R. A
equação anterior vem então:
pVm = RT
onde Vm é o volume molar do gás. Um mole de gás perfeito ocupa em condições
PTP precisamente 22.414 litros.
CAPITULO 1 - Introdução 10
Misturas
No caso de misturas de gases perfeitos podemos aplicar a Lei de Dalton. A pressão
exercida por uma mistura de gases perfeitos (A + B) é a soma das pressões exercidas
pelos gases individuais, ocupando o mesmo volume:
p = pA + pB
Como a fracção molar de um dos componentes na mistura é yA = nA/(nA + nB) então
obtêm-se facilmente:
pA = y A × p
onde pA é a pressão parcial de A e p é a pressão total. Vamos achar esta equação
muito útil mais adiante.
Gases reais
Os gases reais são imperfeitos pois existem interacções intermoleculares, isto é,
forças repulsivas e atractivas entre os átomos ou moléculas. Os desvios à idealidade
são mais importantes a altas pressões e condições extremas de temperatura. Uma das
formas mais simples de visualizar estes desvios consiste em representar o factor de
compressibilidade em função da pressão. O factor de compressibilidade é dado por:
z = pVm/RT
Na figura seguinte mostra-se a variação de z com a pressão para um gás real,
comparativamente ao comportamento de um gás perfeito.
CAPITULO 1 - Introdução 11
Figura 1.7. Variação do coeficiente de compressibilidade com a pressão.
Quando z > 1 as forças repulsivas são dominantes e os gases são mais difíceis de
comprimir que um gás perfeito, e para z <1 as forças atractivas são dominantes e o
gás mais fácil de comprimir.
Vejamos agora um diagrama p,Vm mostrando as isotérmicas experimentais para
um gás real , tomando como exemplo o CO2.
Figura 1.8. Isotérmicas experimentais para o CO2
CAPITULO 1 - Introdução 12
Como se pode observar, para valores de Vm elevados e temperaturas mais altas as
isotérmicas reais são semelhantes às isotérmicas de um gás perfeito. Esta conclusão
permite-nos expandir a equação dos gases perfeitos da seguinte forma:
pVm = RT ( 1 + B’p + C’p2 + ... )
Esta expressão é a equação de estado do virial, sendo os coeficientes B’ e C’ os
respectivos coeficientes de virial, dependentes unicamente da temperatura. É uma
extensão importante da equação dos gases perfeitos. A temperatura para a qual o 2º
coeficiente do virial é nulo designa-se por temperatura de Boyle, isto é B´(T =TB) =
0, verificando-se que, por coincidência, a esta temperatura o gás se comporta como
perfeito.
Vejamos agora o que acontece com a condensação do gás. Consideremos um
dado volume de uma amostra de gás, inicialmente no estado A, que é diminuído a
temperatura constante. Próximo de A a pressão do gás aumenta mais ou menos de
acordo com a Lei de Boyle. Começam a surgir desvios quando o volume se aproxima
de B. No ponto C ( que corresponde a cerca de 60 atm no caso do dióxido de carbono)
começa a condensação do gás. Este ponto é chamado de ponto de orvalho. Ao longo
da linha CDE existem duas fases presentes, a líquida e a gasosa. A linha CDE
representa pois a curva de pressão de vapor do líquido à temperatura da experiência.
No ponto E (ponto de bolha) toda a amostra é liquefeita. Qualquer redução de volume
posterior requer um enorme aumento de pressão (E para F por exemplo).
A isotérmica à temperatura Tc, neste caso 31.04 °C, é bastante importante e
corresponde à isotérmica crítica. O ponto assinalado com um * é o ponto crítico do
fluido. Acima desta temperatura é impossível formar-se líquido, seja qual for a
pressão aplicada. Se a amostra for comprimida à temperatura Tc não se formam duas
fases, mas uma única fase que ocupa todo o volume disponível. A temperatura,
volume e pressão do ponto crítico são designados por temperatura crítica, Tc, pressão
crítica, pc, e volume crítico , Vc.
Para obter O2 líquido, por exemplo, temos de obter temperatura inferiores a 154.8
K e depois comprimir o gás isotermicamente.
Equação de van der Waals
CAPITULO 1 - Introdução 13
Uma das modificações mais notáveis da equação dos gases perfeitos é devida a
van der Waals. Após estudos com o CO2 van der Waals chegou à conclusão de que
os choques entre as partículas do gás e as paredes do recipiente eram reduzidas pelas
forças atractivas entre as partículas do gás, como mostra a figura:
Figura 1.9. Forças atractivas entre as partículas de um gás
A pressão real é então igual à pressão ideal, menos um termo proporcional ao
número de ‘encontros’ entre as partículas, isto é (n/V)2:
preal = pideal - an2/V2
em que a é uma constante para cada gás. Por outro lado, o volume efectivo disponível
às partículas de gás é o volume total ocupado menos um termo dependente do volume
intrínseco das moléculas do gás, i.é:
Vef = V - nb
onde b é uma constante. Substituindo estes valores na equação dos gases perfeitos
obtemos:
CAPITULO 1 - Introdução 14
(p + an2/V2)(V - nb) = nRT
Reorganizando a expressão em termos do volume molar obtemos:
p=
RT
a
− 2
Vm − b Vm
Esta equação é a equação de estado de van der Waals e foi a 1ª equação a entrar
em linha de conta com as forças intermoleculares.
Princípio dos estados correspondentes
A equação de van der Waals conduz, para T < Tc, a isotérmicas próximas das
experimentais. Vejamos uma figura mais detalhada das isotérmicas experimentais
para o CO2 , na proximidade do ponto crítico:
Figura 1.10. Isotérmicas experimentais para o CO2 na
proximidade do ponto crítico
O comportamento real pode comparar-se com o comportamento dado pela
equação de van der Waals. A equação reproduz razoavelmente o comportamento real
do gás. Contudo, para T < Tc a equação tem um comportamento “anómalo” pois,
CAPITULO 1 - Introdução 15
sendo cúbica no volume, apresenta na região bifásica (zona de equilíbrio líquido/
vapor) três raízes para o volume. Uma é o volume molar do líquido a outra é o volume
molar do gás e a terceira não tem significado físico. À medida que nos aproximamos
de Tc o máximo e mínimo da curva aproximam-se, fundindo-se precisamente no ponto
crítico. Na isotérmica crítica tanto a 1ª como a 2ª derivada são nulas (ponto de
inflexão) pelo que podemos escrever, para um mole de gás:
 ∂ 2 p
 ∂p 
  = 2 =0
 ∂V  Tc  ∂V  Tc
Calculando estas derivadas a partir da equação de van der Waals obtemos:
pc =
RTc
a
− 2
Vc − b Vc
− RTc
2a
 ∂p 
+ 3
=
 
2
 ∂V  T = Tc (V − b)
Vc
c
 ∂ 2 p
2 RTc
6a
=
− 4
 2
3
 ∂V  T = Tc (Vc − b) Vc
Resolvendo simultâneamente as três equações encontramos o valor de Tc, pc e
Vc em função de a e b , isto é:
Vc = 3b
Tc =
8a
27 Rb
pc =
a
27b 2
A validade da equação de van der Waals pode ser testada calculando o valor do
coeficiente de compressibilidade no ponto crítico, zc = pcVc/RTc. Substituindo as
equações acima o valor obtido é zc = 0.375. Este valor é muito aproximado ao valor
apresentado por vários gases, confirmando assim a validade da equação de van der
Waals.
CAPITULO 1 - Introdução 16
Vejamos agora como podemos utilizar os resultados anteriores para comparar
vários gases. Vamos definir um conjunto de variáveis reduzidas dadas por:
pR = p/pc ;
TR = T/Tc ; VR = V/Vc
van der Waals esperava que diferentes gases com o mesmo volume reduzido e
com a mesma temperatura reduzida exercessem a mesma pressão reduzida. Na
realidade isto verifica-se pois entrando com os valores dos parâmetros reduzidos na
equação de van der Waals e utilizando os valores de a e b em termos de pc e Tc,
obtemos:
p R pc =
RTR Tc
a
− 2 2
VRVc − b V R Vc
ap R
8aTR
a
=
− 2 2
2
27b(3bV R − b) 9b V R
27b
e finalmente,
pR =
8TR
3
− 2
3V R − 1 V R
A equação anterior é uma equação de estado universal, que não depende do tipo
de gás. Assim, dois gases diferentes com os mesmos valores de TR e pR têm o mesmo
VR, dizendo-se que estão em estados correspondentes.
Uma consequência directa do princípio dos estados correspondentes é que o
factor de compressibilidade é apenas função de TR e pR. A figura seguinte mostra o
factor de compressibilidade em função de pR, para vários TR, e para diferentes
moléculas:
CAPITULO 1 - Introdução 17
Figura 1.11. Factor de compressibilidade em função de variáveis reduzidas para vários gases
Podemos verificar que a universalidade se verifica. Esta, pode dizer-se, foi a
maior contribuição de van der Waals para a Ciência dos fluidos. Conhecendo as
constantes críticas podemos, para um dado gás calcular o valor de z e a partir do
gráfico anterior obter o volume que o gás ocupa. Esta universalidade sofre alguns
desvios para gases com moléculas muito polares. A importância do trabalho de van
der Waals foi reconhecida de diversas formas, incluindo a edição de um selo
comemorativo da atribuição do prémio Nobel.
Figura 1.12. Selo comemorativo da atribuição do prémio Nobel a Johannes Diderik van der Waals
CAPÍTULO II
INTRODUÇÃO À RELATIVIDADE ESPECIAL
Albert Einstein em 1905.
Neste ano ele publicou na revista Annalen der Physics a Teoria da Relatividade. Logo, o
trabalho tornou-se famoso em todo o mundo.
2
II.1 – CONSIDERAÇÕES GERAIS:
A Física proposta por I. Newton no século XVII tinha como base fatos fortes e
convincentes, integralmente baseados na observação da natureza. Tão convincentes que
foi amplamente utilizada nos séculos seguintes sem ser questionada. Os princípios da
Mecânica Newtoniana determinaram praticamente todo o desenvolvimento técnicocientífico dos dois séculos que precederam. A Mecânica Newtoniana caracteriza-se de
forma marcante por não questionar a validade de seus conceitos, como por exemplo, a
questão sobre o referencial no qual são feitas as medidas e a influência do método de
medida sobre as grandezas em questão.
Mesmo nos nossos dias, os conceitos estabelecidos pela Mecânica Newtoniana
permanecem firmemente ligados ao nosso raciocínio cotidiano. Estes conceitos estavam
tão fortemente enraizados que atravessaram vários séculos sem que alguém
questionasse seus fundamentos.
As leis de Newton naturalmente dependem do referencial de observação. Elas só
são válidas nos chamados referenciais inerciais, que são aqueles que deslocam-se
relativamente entre eles com velocidades constantes. Se tivermos dois referenciais
inerciais, um movendo com velocidade constante em relação ao outro, não há
experimento que possamos fazer para revelar qual referencial esta em repouso e qual
esta se movendo. Esta característica entre referenciais inerciais é chamada de principio
da relatividade Newtoniana.
Uma característica importante deste resultado é que o movimento absoluto não
pode ser detectado.
O primeiro físico a questionar alguns conceitos newtonianos foi o físico alemão
Ernst Mach. Em seu texto intitulado “The Science of Mechanics” de 1883, Mach expressa
críticas à dinâmica de Newton. Mach levantou a questão sobre a distinção entre
movimento absoluto e relativo, discutiu o problema da inércia dos corpos e, acima de
tudo, apontou como ponto fraco da dinâmica newtoniana sua concepção de espaço e
tempo absolutos. Esta concepção newtoniana esta bem ilustrada na seguinte passagem
dos “Principia”:
“Absolute, true and mathematical time, of itself and by its own true nature, flows
uniformly on, without regard to anything external”.
3
Mach observa que, sendo o tempo medido necessariamente pelo movimento
repetitivo de um corpo ou sistema físico como, por exemplo, um pêndulo ou o movimento
da Terra, é lógico que as medidas de intervalos de tempo devem, de alguma forma, estar
conectadas com o movimento. Semelhante, o conceito de espaço deve estar intimamente
ligado com as propriedades do sistema de medida e não deve ser considerado como algo
absoluto.
Tais críticas não causaram muito efeito de imediato, mas ocasionalmente foram de
profunda importância para um jovem físico chamado A. Einstein. Einstein foi fortemente
atraído pelas idéias de que os conceitos físicos devam ser definidos em termos de
grandezas mensuráveis. Portanto, a maneira de observação e realização de medidas
físicas deve influenciar os conceitos físicos, incluindo o espaço e o tempo, considerados
absolutos por Newton.
Este pensamento, muito diferente do absolutismo newtoniano, gerou uma
revolução nos conceitos da Física, culminando com o aparecimento da relatividade, a qual
será brevemente discutida neste capítulo.
II.2 – A CAMINHO DA RELATIVIDADE: O EXPERIMENTO DE MICHELSON-MORLEY
A teoria ondulatória da luz foi elaborada alguns anos antes da demonstração de
sua natureza eletromagnética. Para os pioneiros no campo da Óptica parecia natural
pensar na luz como ondas que se propagavam num meio elástico, chamado éter. Além de
necessário para explicar a propagação da luz, o éter também representava o repouso
absoluto, ou o sistema em relação ao qual tudo se desloca.
As observações de difração e interferência com luz eram perfeitamente explicadas
pela teoria do éter. Tais fatos fortaleceram de tal forma a teoria que muitos cientistas da
época
a
aceitavam
sem
questionamento.
Com
o
desenvolvimento
da
teoria
eletromagnética da luz em 1864 por Maxwell e sua inquestionável comprovação
experimental por Hertz em 1887, a teoria do éter ficou relegada a segundo plano. Isto
porque já não era mais necessário um meio elástico para explicar a propagação da luz.
Apesar de não mais necessário para explicar a natureza de propagação da luz, o éter
ainda auxilia outros conceitos.
Várias críticas e questões começaram a surgir com respeito a existência do éter.
Apesar disto, a idéia básica que a luz propaga-se relativamente a alguma espécie de
sistema de referencia universal mantinha vivo o éter. Para melhor entender as
4
implicações da idéia do éter com respeito à propagação da luz, vamos considerar uma
situação física análoga a propagação da luz num meio. Seja um rio de largura D, no qual
a água flui com velocidade v, como mostrado na figura 1.
Fig. 2.1 – Esquema mostrando a viagem de um barco em duas situações
De uma das margens do rio, dois barcos (denominados A e B) começam a
movimentar-se com velocidade V. Esta é a velocidade que advém da potência do motor
do barco, independente da velocidade das águas. O barco A faz uma viagem até a
margem oposta e retorna. O barco B movimenta-se paralelamente ao rio e também
retorna ao ponto de partida. Vamos calcular o tempo gasto por cada uma destas viagens,
sabendo que ambas percorreram a mesma distância.
Começando com o barco A, a correnteza tenderá a carregá-lo para a direita do
ponto pretendido de chegada na margem oposta, com uma velocidade v paralela ao rio.
Assim, para que sua trajetória seja perpendicular ao rio, V deve ter um componente –v na
direção do rio, cancelando a velocidade deste. Isto faz com que a velocidade resultante
na direção perpendicular ao rio seja V’. Da composição vetorial das velocidades temos
que (ver figura 2.2):
V2 = V’2 + V2
De modo que:
v2
V '= V 1− 2
V
5
desta forma o tempo de viagem do barco A será:
tA =
2D / V
1 − v2 /V 2
Fig. 2.2 – Composição vetorial para o movimento perpendicular à correnteza.
Para o barco B, a situação é um pouco diferente. Sua velocidade é acrescida de v
quando seu movimento é a favor da correnteza e decrescida de v quando oposto à
correnteza. Como resultado o tempo total da viagem do barco B é:
tB =
D
D
2D / V
+
=
V + v V − v 1 − v2 /V 2
É fácil observar que tB > tA e que a razão entre os tempos é dada por:
tA
= 1 − v2 /V 2
tB
O resultado acima nos mostra algo interessante: se soubermos a velocidade
absoluta dos barcos (V) e medirmos a razão entre os tempos de movimento nas duas
situações, podemos obter a velocidade do rio v. Esta observação pode ser usada de uma
forma análoga para estudar o problema da propagação de ondas de luz no “éter”. Se
existir um “éter” preenchendo todo o espaço, nós, da Terra, que estamos nos
movimentando ao redor do Sol e, portanto, estamos navegando pelo éter com a nossa
velocidade de translação. Para qualquer observador localizado na Terra o “éter”
movimenta-se com essa mesma velocidade.
6
A fim de detectar o movimento e a existência do “éter”, pode-se usar dois feixes de
luz ao invés de dois barcos. Imagine o sistema mostrado na figura 2.3:
Fig. 2.3 – Interferômetro usado por Michelson
Um feixe de luz intenso, ao incidir sobre um divisor de feixes (superfície
parcialmente espelhada), é dividido em dois feixes que propagam-se perpendicularmente
nas direções dos espelhos A e B. O caminho de A é suposto perpendicular ao fluxo do
éter hipotético, enquanto B é paralelo. Após fazerem uma viagem de ida e volta em cada
um dos caminhos, os feixes retornam ao mesmo plano de observação. Esta situação é,
obviamente, muito semelhante ao exemplo do barco no rio, visto anteriormente.
Se os dois caminhos têm exatamente o mesmo comprimento ou diferem por um
número inteiro de comprimentos de onda, ambos os feixes chegam ao ponto de
observação “em fase”. Assim produzem uma interferência construtiva, o que leva o
observador a presenciar um máximo na intensidade da luz. No entanto, a existência do
“éter” movimentando-se, como mostrado na figura, causaria (em analogia ao exemplo dos
barcos) uma diferença nos tempos gastos pelos feixes A e B para percorrerem seus
respectivos caminhos. De modo que estes feixes de luz não mais atingiriam o plano de
observação em fase. Com isto a interferência observada não seria mais construtiva, mas
parcialmente destrutiva. De uma forma muito simplificada este é, em essência, o
experimento de Michelson e Morley, realizado em 1887.
No experimento real, os espelhos A e B não eram perfeitamente perpendiculares,
fazendo com que no plano de observação aparecesse uma série de franjas de
interferência (regiões claras e escuras), devido à diferença em caminho entre os raios de
luz adjacentes (figura 2.4)
7
Fig. 2.4 – Franjas observadas no interferômetro
É claro que o aparelho estacionário, como mostrado na figura 3, não permite de
forma alguma a observação do efeito previsto, ou seja, a diferença entre os tempos de
percurso dos feixes A e B. Assim, com o aparelho numa determinada posição temos um
determinado padrão de franjas de interferência. Rodando o dispositivo de 90º, os dois
caminhos são comutados com relação ao movimento do “éter”, de modo que o feixe que
requeria tA para percorrer o braço do interferômetro passa a requerer tB e vice-versa.
Como resultado, se houver uma diferença nestes tempos haverá um deslocamento
observável das franjas de interferência à medida que o sistema todo é rodado.
Vamos calcular o movimento destas franjas após a rotação do dispositivo. Como
vimos, a diferença entre os tempos de percurso é:
∆t = t B − t A =
2D / V
2D / V
−
2
2
1 − v /V
1 − v2 /V 2
e, no presente caso, v é a velocidade do “éter” que corresponde à velocidade de
translação da Terra (v ~ 3x104 m/s), enquanto V = c = 3x108 m/s é a velocidade da luz.
Com estes valores temos que:
v2
v2
= 2 ~ 10-8
2
V
C
e neste caso as expressões acima podem ser expandidas usando a expansão binomial
para x < 1.
(1 + x)n = 1 + nx ........... ≅ 1 + nx
8
de modo que uma boa aproximação para ∆t é:
∆t =
2 D  v 2   1 v 2
1 +  − 1 +
c  c 2   2 c 2



ou
∆t ≅
D  v2

c  c 2



Esta diferença de tempo, corresponde a uma diferente de caminho de
∆d = c∆t
e se ∆d corresponde a uma variação ∆n franjas de interferência
∆d = λ ∆n
e, portanto,
∆n =
c∆t
Dv 2
λc 2
=
λ
No experimento realizado por Michelson e Morley, D era da ordem 10m, o
comprimento da luz usada era λ ~ 500 nm (1nm = 10-9m) e, portanto, ao girarmos o
aparelho 90º espera-se uma variação nas franjas de:
∆n =
(
10 x 3 x10 4
(
)
2
5 x10 − 7 x 3 x10 8
)
2
≅ 0.2 franjas
Como este valor é invertido pela rotação, trocando A por B, há uma reversão de
fases, espera-se observar 0.4 franjas de deslocamentos no total. Isto seria facilmente
observado segundo as estimativas de Michelson, que previa uma sensibilidade de 0.01
franjas. O experimento foi, mesmo, repetido em estações diferentes do ano para eliminar
a possibilidade da terra estar momentaneamente em repouso em relação ao éter.
9
Contudo, para surpresa de todos não foi observada nenhuma variação no padrão das
franjas, embora o experimento fosse repetido em condições diversas.
Esquecendo a idéia do éter, o experimento de Michelson-Morley tem um aspecto
muito importante com respeito à velocidade da luz quando emitida por fontes em
movimento. A fonte esta fixa na mesa rotatória e, portanto, podemos imaginar que a
diferença de tempos de percurso calculados anteriormente seriam resultados das
diferenças de velocidade da luz dependendo da direção da fonte. Ou seja, dependendo
da direção que o feixe é mandado, a velocidade variará desde c + v até c – v.
Esta edição de velocidades ocorre de acordo com as transformadas de Galileo, aplicável
a corpos mecânicos, em movimento, etc.
A variação de velocidade também causaria a variação de tempos e, portanto, de
fase ao se rodar o experimento, devendo ocorrer um deslocamento das franjas. Várias
tentativas de experimentos de M – M usando diferentes configurações foram realizados e
os resultados estão reunidos no gráfico da figura abaixo.
[Extraído de M. A. Handschy, Am. J. Phys. 50, 987 (1942)]
Deslocamento de franjas esperado
10
Em resumo, o experimento de M – M também sugere a independência da
velocidade de propagação da luz com o movimento da fonte, violando o Principio da
Independência dos Movimentos de Galileo.
Este resultado é de extrema importância para o estabelecimento da relatividade.
O experimento de Michelson-Morley não foi a única tentativa experimental de
determinação do referencial absoluto. Em 1904, Trouton e Noble realizaram um
experimento visando observar o torque num capacitor carregado. Considere duas cargas
de valor ± q, ligadas por uma haste rígida, segundo a figura 2.5. Como as forças de
Coulomb estão na direção da haste, não há nenhum torque no sistema. Porém, como as
leis de Maxwell são válidas somente no referencial fixo em relação ao éter, o movimento
das cargas pelo éter faz com que isto represente a existência de uma densidade de
corrente nas equações e, então, além dos campos elétricos devido as cargas, como
indicado na figura 2.5. Este conjunto de forças causariam um torque de defleteria a haste.
Trouton e Noble idealizaram um delicado sistema de suspensão onde pequenas
deflexões poderiam ser detectadas através da rotação de um espelho. Observações
variadas foram realizadas para vários ângulos de v (velocidade do éter) com relação a
haste, porém as deflexões observadas nunca passaram de 5% do valor que era
esperado, caso a idéia do éter fosse verdadeira.
Fig. 2.5 – Capacitor de Trouton-Noble. As forças F advém do movimento das cargas pelo éter.
O resultado negativo do experimento de Michelson e Morley permitiu várias
conclusões. Uma primeira possível explicação proposta por Michelson era que o éter
poderia ser arrastado pela Terra. Assim, movimenta-se junto com esta não permitindo
observar variações no experimento. Este fato requer uma força Terra-éter, o que era
pouco provável de existir e também produz discordâncias em outro experimento, o de
aberração estelar, que discutiremos mais adiante. Uma Segunda alternativa, é que o éter
ainda existe, mas a luz não é uma onda propagando-se neste meio, mas sim composta de
partículas sujeitas às leis da mecânica Newtoniana. Neste caso, a velocidade destas
11
partículas só dependeriam da velocidade da fonte e não do meio, não havendo, assim,
nenhum efeito retardador, não causando nenhum deslocamento no padrão de
interferência. Isto é uma hipótese absurda, visto que as próprias franjas observadas
demonstram o seu caráter ondulatório. Apesar de absurdo, esta Segunda hipótese
germina a idéia de que caso a velocidade da luz seja independente do movimento da
fonte (o que é de alguma forma uma nova lei da mecânica), o resultado obtido faz muito
sentido. Mesmo implicando que a luz como um efeito ondulatório se propague
obedecendo as leis da cinemática.
De conclusivo os experimentos exterminaram a idéia do éter e várias de suas
propriedades. Destruindo o que foi uma das idéias mais respeitadas de sua época.
Contudo, não podemos esquecer que este experimento germinou uma das hipóteses
mais importantes em relatividade.
Fitz-Gerald e, independentemente, H. Lorentz apresentaram uma hipótese
interessante para justificar a observação de Michelson-Morley. Eles lançaram a idéia de
que nenhuma variação de franjas seria observada se o braço do enterferometro paralelo
ao movimento da terra sofresse uma contração por um fator de (1 – v2 / c2)1/2. Chegou-se
a generalizar que qualquer corpo em movimento através do éter sofreria tal contração
paralela ao seu movimento. As considerações do Lorentz eram baseadas em um novo
tipo de transformação de coordenadas usando um novo conceito de “tempo real” que
dependerá do sistema de referencia.
II.3 – A MECÂNICA NEWTONIANA E A VELOCIDADE LIMITE
De acordo com a mecânica Newtoniana, não há, em principio, um limite superior
para a velocidade imposta a um corpo. Imaginemos por exemplo um corpo sujeito a uma
força constante. Após um determinado intervalo de tempo ∆t, supondo que inicialmente
ele estava em repouso, temos que a velocidade adquirida pelo corpo será:
∆t
K = ∫ F .d s
0
com
 2K 
v=

M 
12
12
Por exemplo, seja um corpo constantemente sujeito a aceleração da gravidade
(g = 9.8 m/s2). Partindo do repouso, após um ano sua velocidade seria igual à velocidade
da luz no vácuo. Após dois anos seria duas vezes esta velocidade. Assim, a velocidade
atingida parece ilimitada. No entanto, quando tentamos obter velocidades tão altas quanto
a luz, observamos um dramático desvio da mecânica newtoniana. Este exemplo pode ser
visto como um primeiro caso que demonstra que a mecânica clássica convencional não é
adequada para todas as situações.
É difícil obter altas velocidades com corpos que nos rodeiam no nosso cotidiano.
No entanto, com elétrons, devido a sua massa relativamente pequena em relação à sua
carga, podemos atingir altíssimas velocidades através da aplicação de campos.
Assim, consideremos o arranjo experimental da figura 6.
Fig. 2.6 – Acelerador linear para elétrons
O experimento consiste em medir o tempo de vôo de elétrons viajando através de
um acelerador linear (Linac), que pode produzir elétrons com energias até a ordem de 15
MeV. Elétrons são injetados por um acelerador tipo Van der Graaff no Linac. Antes de
penetrarem no Linac passam por um detector sinalizando a entrada do pulso, sofrem
então uma aceleração por forças elétricas. Após passarem pelo sistema, um disco de
alumina freia o feixe e um novo detector mostra a chagada do pulso. A duração entre
ambos os pulsos representa o tempo de vôo entre os extremos do Linac e permite o
cálculo da velocidade atingida pelos elétrons, ou outro tipo de partícula carregada.
A energia cinética dos elétrons é determinada através da RF e da velocidade com
que os elétrons são injetados. Para várias energias, medimos a velocidade através do
tempo de vôo e os resultados estão mostrados na tabela 2.1.
13
(
)
K (MeV)
∆t vôo 10 −8 seg
0.5
3.23
2.6
1.0
3.08
2.73
1.5
2.92
2.88
4.5
2.84
2.96
15
2.8
3.0
V (108 m/seg)
Tabela 2.1
Os resultados são bastante distintos do que seria obtido caso a mecânica
newtoniana fosse utilizada. Isto fica mais evidente se fizermos um gráfico mostrando
v2 vs K.
Fig. 2.7 – Gráfico de velocidade final quadrática versus a energia de aceleração.
A previsão da mecânica clássica é valida somente para baixos valores de K. A
velocidade parece ter uma valor limite de 3x108 m/s. Mais ainda, os resultados parecem
consistentes com a hipótese de que “há uma velocidade limite para qualquer objeto, e
esta é a velocidade da luz no vácuo”.
Este resultado desperta muito a nossa curiosidade. Afinal, por que não é possível
obter velocidades
arbitrariamente
altas se
podemos fornecer uma
quantidade
praticamente ilimitada de energia a um corpo?
Vamos ser tolerantes e aceitar que por alguma razão esta velocidade limite existe.
Imaginemos então que podemos realizar o experimento acima, em um sistema de
referencia com velocidade 0.85c na mesma direção dos elétrons. Para os pesquisadores
deste novo sistema de referencia o limite também seria c. Assim, pelas regras de adição
14
de velocidade que conhecemos, quando para o referencial em movimento a partícula tem
velocidade máxima de c, no laboratório mediríamos 1.85c, violando claramente o limite
que lançamos por hipótese. Estaria isto acontecendo devido ao fato que estamos
somando erroneamente as velocidades?
Vamos resolver o problema do movimento de um corpo sujeito a uma força
constante, modificando levemente a dinâmica que conhecemos. Após um determinado
tempo t, F.t = mv, mas vamos tomar como num “toque de mágica” a massa como sendo:
m = m0 (1 – v2 / c2)-1/2, m0 é a massa do corpo quando este tem v = 0. Assim, temos:
Ft =
mo v
(1 − v
2
/ c2
)
12
isolando v temos:
v(t ) =
c
  m0 c  2 
 
1 + 
  Ft  
12
Vamos analisar dois casos extremos:
1) Ft << m0c → m0c / Ft >> 1, v(t) ≡ Ft / m0
Ft << m0c. Como é previsto pela mecânica clássica.
2) Ft >> m0c, v (t) ≡ c
Mostrando que pequenos impulsos reproduzem os resultados esperados pela
mecânica clássica. Já para grandes impulsos parece produzir-se uma velocidade limite,
como medida no experimento como elétrons.
Estes fatos que mostramos despertam ainda mais nossa curiosidade para o
desenvolvimento de uma nova mecânica, onde as relações como a mostrada por
m=
(1 − v
m0
2
/ c2
)
12
sejam válidas. É exatamente isto que desenvolveremos em nosso capítulo de relatividade.
15
II.4 – TEORIA DA RELATIVIDADE ESPECIAL
(a) Os Postulados
Sempre que mencionamos o movimento de um corpo, evidentemente estamos nos
referindo ao movimento relativo a um determinado sistema de referência. Este sistema de
referência pode ser um objeto, a superfície da Terra, o centro da galáxia, etc. O que é
importante é sempre especificar este sistema de referência para todos os movimentos a
que nos referimos. A idéia discutida anteriormente, da introdução do “éter”, foi uma
tentativa de estabelecer um referencial universal absoluto, o qual falhou e deixou a idéia
clara de que não existe um sistema de referência absoluto. Imaginemos dois balões em
movimento ascendente, de modo que um balão só pode observar o outro. Para o mais
rápido o movimento do outro é descendente e vice-versa. Não há maneira de determinar
o movimento real dos balões (com relação a Terra) se um só pode observar o outro. É
importante neste ponto que tenhamos claro o fato que “sem um sistema de referência, o
conceito de movimento pode não ter o menor significado”.
A teoria da relatividade especial é o resultado do fato que não existe um sistema de
referência absoluto. Esta teoria desenvolvida por Albert Einstein em 1905 trata o problema
de sistemas de referência em movimento com velocidades constantes (v constante) uns
em relação aos outros. No caso, de referenciais acelerados, o movimento deve ser
analisados segundo a teoria da relatividade geral, que não será extensivamente analisada
neste curso.
A teoria da relatividade especial é normalmente baseada em dois postulados
fundamentais.
1º. Postulado:
As leis da Física devem ser descritas pelo mesmo conjunto de equações
quando em qualquer sistema de referência que se desloca com velocidade
uniforme.
Este postulado nos parece natural e nos faz muito sentido se analisarmos o fato de
que não existe um sistema de referência absoluto. De modo que, para determinarmos e
descrevermos o movimento de um corpo é preciso sempre ter o referencial. Caso
existisse uma dependência das leis físicas que descrevem o movimento, de acordo com o
16
fato do referencial usado estar ou não estacionário no espaço, significa que poderíamos
decidir absolutamente sobre o movimento do corpo. Para isto, bastaria analisar no seu
sistema de referencia o movimento de um terceiro corpo, o que sabemos não ser o
possível.
2º. Postulado:
A velocidade da luz em qualquer sistema de referência tem o mesmo valor,
independente do movimento do referencial.
Este postulado, de alguma forma, pode ser visto como seguindo diretamente do
postulado anterior e viola, de alguma forma, nossos conceitos intuitivos, baseados em
nossa experiência cotidiana; segundo a qual uma fonte que se movimenta com velocidade
v deveria emitir luz agora se propagaria com c + v. A própria natureza ondulatória da luz
(como em outros efeitos ondulatórios), assegura que sua velocidade de propagação deve
ser propriedade do meio somente e não da fonte. A fim de justificar e mostrar que este
postulado é muito razoável, vamos considerar a determinação da velocidade da luz.
Aceitando o primeiro postulado, que é muito razoável, tomamos que as equações de
Maxwell sejam válidas em qualquer referencial movendo-se com velocidade constante.
Neste caso, a equação da onda para propagação no vácuo seria:
∇.E = 4πρ
∇x E =
∂B 1
.
∂t c
∇.B = 0
∇x H =
∇2 E −
4π
1 ∂D
j+
c
c ∂t
µε ∂ 2 E
c 2 ∂t 2
=0
onde µ 0 e ε 0 são a permissividade magnética e elétrica do vácuo. Como já sabemos do
nosso curso de eletromagnetismo, desta equação de onda a velocidade de propagação
da radiação é dada por:
c=
1
µε
17
que depende somente das constantes µ e ε do meio, sendo de maneira alguma
dependente do movimento da fonte. A velocidade de propagação da luz, prevista pelas
equações de Maxwell, depende somente do meio e não do referencial.
Supondo que os postulados acima sejam verdadeiros, muitos resultados
interessantes podem ser deduzidos e confirmados através de medidas experimentais. Isto
corresponde a um dos grandes triunfos da física moderna.
(b) Evidências Experimentais do Segundo Postulado
Uma possível evidência experimental para o segundo postulado pode ser obtida se
medirmos a velocidade da luz proveniente de uma fonte em movimento. Uma destas
evidências advém de observações feitas com estrelas duplas. Imagine um sistema de
estrelas duplas, A e B, rotacionando ao redor de seu centro de massa (fig. 2.8).
Fig. 2.8 - Estrela dupla emitindo luz
Para um observador na Terra (T) é possível determinar se a estrela aproxima-se
através do efeito Doppler na luz emitida pela estrela. Considerando que a luz propaga
com a mesma velocidade independente da fonte, a velocidade da estrela medida aqui na
Terra como função do tempo seria uma senóide (fig. 2.9).
Fig. 2.9 - Velocidade das estrelas medida pelo efeito Doppler
18
Imagine agora que, quando a estrela se aproxima, a velocidade é maior do que
quando se afasta. Neste caso, a luz emitida na aproximação chega mais rápido ao
observador do que na outra situação. O resultado é que o efeito Doppler observado
depende de uma forma complicada da posição resultando em uma senóide distorcida
como função do tempo (fig. 2.10).
Fig. 2.10 - Distorção esperada caso a velocidade da luz dependesse da velocidade da fonte.
Num caso extremo, a luz emitida durante a aproximação poderia chegar ao
observador antes da luz emitida durante seu próprio ciclo de afastamento. Neste caso a
medida seria confusa, revelando dois ou mais valores para a velocidade num determinado
instante.
A observação experimental de um sistema binário como "Castor - C", mostra que o
dado coincide muito bem como a senóide, demonstrando a validade do segundo
postulado.
(c) Mudanças de Referências: Transformações de Coordenadas
Um fato importante em Física é a caracterização de um efeito do ponto de vista de
observadores distintos. A maneira de se fazer isto é através das chamadas
transformações de referenciais. Ao realizarmos tais transformações, teremos informações
de como um determinado evento físico será observado em um outro sistema de
coordenadas em movimento em relação ao primeiro. A necessidade de manter válidas
certas leis fundamentais ao se fazer mudanças de coordenadas, apresentam
conseqüências interessantes, onde residem muitos dos fundamentos da relatividade
especial.
19
(c.1) Transformações Galileanas
Vamos supor que estejamos num sistema de referência S no qual um determinado
evento ocorra no tempo t, nas coordenadas (x, y, z). Um observador estacionário num
sistema de referência S' que move-se com respeito a S com uma velocidade v, observará
o mesmo evento como ocorrido no tempo t' , nas coordenadas (x', y', z'). Para simplificar,
vamos supor v = vx (figura 2.11). A pergunta que fazemos é: Qual é a relação entre x, y,
z, t e x', y', z', t' ?
Vamos tomar que o tempo em ambos sistemas é medido a partir do instante em
que as origens de S e S' coincidem, de modo que:
Fig. 2.11 - Um evento físico observado de dois sistemas de referências.
x' = x – vt
e não havendo movimento relativo nas direções y e z, temos:
y' = y
z' = z
e como de nossa experiência cotidiana, não há razão nenhuma para acreditar que os
relógios marcadores de tempo em ambos os referenciais sejam diferentes, temos:
t' = t
20
Estas relações estão conectando o evento observado em dois referenciais distintos
e são chamadas de Transformações Galileanas. Para conhecer a relação entre as
velocidades medidas em cada um destes referenciais, basta tomarmos as derivadas
temporais (já que o tempo é comum em ambos), e obtemos:
dx'
= vx − v
dt
dy '
v y' =
= vy
dt
dz '
vz' =
= vz
dt
vx' =
Vamos agora parar para pensar se as transformações Galileanas (tanto de
coordenada quanto de velocidade), contém os dois postulados básicos discutidos
anteriormente. Com relação ao segundo postulado, está evidente que as transformações
Galileanas o violam, bastando para isto olhar a primeira equação acima, para o caso que
vx = c. O primeiro postulado é seriamente violado se considerarmos as equações de
Maxwell que descrevem os fenômenos eletromagnéticos. Isto porque variações espaciais
e temporais são misturadas de forma tal a fazer com que as equações originais percam
sua forma.
Vamos considerar a equação de onda eletromagnética e fazer a transformação:
∂2 E ∂2 E ∂2 E 1 ∂2 E
+ 2 + 2 − 2
=0
∂x 2
∂y
∂z
c ∂t 2
a transformação para x', y', z', t':
∂ E ∂ E ∂x' ∂ E ∂y ' ∂ E ∂z ' ∂ E ∂t ' ∂ E
=
+
+
+
=
∂x ∂x' ∂x ∂y ' dx ∂z ' ∂x ∂t ' ∂x ∂x'
∂E
∂E ∂E
= −v
+
∂t
∂x' ∂t '
2
∂2 E ∂2 E
∂2 E
2 ∂ E
=
−
2
+
v
v
∂x' ∂t '
∂t 2
∂t ' 2
∂x' 2
∂x'
=1
∂x
21
∂x'
∂t
∂y '
∂y
∂x'
∂y
= −v
=
=
∂2 E
∂x' 2
∂t '
∂t
∂x'
∂t
+
=1
= .......... = 0
∂2 E
∂y ' 2
+
∂2 E
∂z ' 2
−
1 ∂2 E
c 2 ∂t ' 2


2

1  ∂2 E
2 ∂ E
+
−v
2v

 = 0
c 2  ∂x' ∂t '
∂x' 2 


A equação de onda para a radiação eletromagnética não é invariante ao
realizarmos a transformação Galileana. Isto é bastante estranho já que a onda
eletromagnética existe em ambos referenciais e não há dúvida quanto a isto. Claramente
está violando o primeiro postulado.
Desta forma, concluímos que as transformações Galileanas violam os postulados
básicos da relatividade e para preservar sua validade devemos requerer um outro tipo de
transformação entre as coordenadas de dois sistemas de referência que encontram-se
em movimento relativo.
(c.2) Transformações de Lorentz
Como vimos, as transformações de Galileu não condizem com os postulados de
relatividade, os quais concordamos que possuem grande sentido físico e, portanto, devem
ser verdades. Uma transformação alternativa é necessária para manter os postulados
verdadeiros. Vamos supor que tenhamos uma transformação que seja proporcional à
relação da transformação Galileana. Assim, tomamos:
x' = γ (x - vt)
onde γ é uma constante que deverá ser determinada.
Uma pergunta natural que fazemos neste ponto é: "Por que este "chute" é
aceitável?". Primeiramente a linearidade entre x' e x é razoável, pois já que um evento
observado em x (S) deve corresponder a um único evento observado em x' do referencial
S". Caso tivéssemos algo do tipo x' α x2 , teríamos mais de uma possibilidade no
referencial S' para observação de um único evento em S'. Além disto, sabemos que a
22
transformação proposta acima deve concordar com a transformação Galileana para a
mecânica ordinária, onde baixíssimas velocidades estão envolvidas. Assim γ perto da
unidade representa o limite da mecânica cotidiana de baixas velocidades.
Do fato que as equações da física, incluindo as equações de transformação de
referenciais, devem Ter a mesma forma em ambos os referenciais S e S', precisamos
somente trocar o sinal de v, para desta forma levar em conta a mudança de direção do
movimento e obtermos x como função de x' e t' no referencial S'.
Revisando, a situação agora corresponde à observação de um evento que
acontece em x no tempo t para o referencial S. E que no referencial S' (que se desloca
com velocidade v com relação a S) o mesmo evento é observado em x' e t'. Segundo a
nossa proposta de transformação (fig. 2.12), a relação entre as coordenadas são:
Fig. 2.12
x' = γ (x-vt)
x = γ (x' + vt')
Como não há movimento relativo nas direções y e z, não há nada que indique
diferenças entre y e y' e entre z e z', de modo que:
y'= y e z' = z
Note que os tempos t e t' não são iguais. Isto pode ser confirmado se
substituirmos x' na equação de x.
23
x = γ (x'+ vt') = γ 2x - γ 2vt + γ vt'
de onde tiramos:
1− γ 2
t ' = γt + 
 γv

 x

Com isto, as equações de transformação obtidas são:
x' = γ ( x − vt )
y' = y
z' = z
1− γ 2
t ' = γt + 
 γv

 x

Para que estas transformações estejam de acordo com a relatividade, elas devem
satisfazer
ambos
postulados
discutidos
anteriormente.
Como
condição
inicial,
consideramos que em t = 0 ambos os sistemas de referências tenham suas origens
coincidentes, de modo que:
t = 0, t' = 0 => x' = 0 corresponde x = 0
Vamos tomar que em t = t' = 0 uma lâmpada é acessa na origem S (que coincide
com a origem S'). Como a luz propaga-se com a mesma velocidade c em ambos os
sistemas de referência, temos as seguintes equações de movimento para a luz:
x = ct (em S)
x' = ct' (em S')
A fim de determinarmos a constante γ , vamos tomar a equação contendo t' e x' e
substituir t' pela expressão acima:

1− γ 2
x' = c γt + 
 γv

 
 x 
 
24
e substituindo x' = γ (x-vt)
1− γ 2
 γv

γ (x − vt ) = c γt + 

 
 x 
 
eliminando x desta questão tiramos:
x=
cγt + vγt
1− γ 2
c
γ−
γv
(
)
colocando ct em evidência:
 γ + vγ 
c

x = ct 
(
1−γ 2 )
 γ − γv c 
mas como vimos anteriormente, no referencial S, x = ct, de modo que toda a expressão
entre colchetes deve ser igual à unidade e, portanto:
v
c
γ + γ =γ −
(1 − γ ) c
2
γv
2
v 2
γ = −1 + γ 2
2
c
1
γ =
1− v2 / c2
permitindo obter o valor da constante procurada.
Utilizando esta constante, temos que a transformação completa para um evento
medido no referencial S para o mesmo evento medido no referencial S' (que se desloca
com v na direção x) é:
25
x − vt
x' =
1− v2 / c2
y' = y
z' = z
t' =
(t − x )
v
c2
1− v2 / c2
Estas são as chamadas transformações de Lorentz, porque foram primeiramente
sugeridas pelo físico alemão H. A Lorentz, como sendo as transformações para mudança
de referencial em movimento uniforme que mantêm invariantes as equações do
eletromagnetismo. Somente muitos anos mais tarde é que Einstein entendeu o significado
completo
destas
transformações.
Elas
contêm
embutidos
os
dois
postulados
fundamentais da relatividade especial.
Vamos supor que desejamos determinar a transformação inversa, isto é, dado um
evento medido em S', como encontramos as medidas feitas para o mesmo evento em S?
A mudança é óbvia, basta mudarmos v por -v, já que a velocidade relativa é invertida e
trocamos x → x' e t → t'. Esta substituição determina as transformações de Lorentz
inversas:
x=
x'+ vt '
1− v2 / c2
y = y'
z = z'
t=
t '+ cv2 x'
1− v2 / c2
(c.3) A Simultaneidade de Eventos:
Das transformadas de Lorentz, dois pontos chamam, de imediato, nossa atenção.
Primeiramente, se tivermos dois eventos que ocorrem simultaneamente num sistema de
referência, não necessariamente eles serão simultâneos num outro referencial. Para ver
isto vamos supor que duas lâmpadas separadas por L no referencial S sejam acesas
simultaneamente por um observador neste referencial. Como isto é visto por um
observador em S'?
Para o referencial S, t1 = t2 = t. Para o observador no referencial S'
26
t1 ' =
t2 ' =
(t −
v
c2
x1
)
1 − (v / c )
(t −
v
c2
x2
2
)
1 − (v / c )
2
de modo que a diferença de tempo entre os eventos para S' é:
∆t ' = t1 '−t 2 ' =
(x2 − x1 )
2
1 − (v / c )
v
c2
como x2 - x1 = L
∆t ' =
Lv / c 2
1 − (v / c )
2
Um segundo ponto importante a ser observado das transformações é que quando
a velocidade relativa v entre os referenciais S e S' é bastante pequena, quando
comparadas com a velocidade da luz (v/c « 1), as transformações de Lorentz são
reduzidas às transformações Galileanas, como já havíamos requerido anteriormente. Este
fato permite nos antecipar a seguinte conclusão: as peculiaridades da relatividade
especial que estudaremos neste curso só serão marcantes nos casos ou em
circunstâncias onde grandes velocidades estão presentes. Os efeitos da relatividade
passam praticamente despercebidos nos movimentos rotineiros do dia-a-dia.
(c.4) A Contração Espacial
Vamos considerar outra importante conseqüência das transformadas de Lorentz.
Seja uma haste colocada ao longo da direção x no referencial S. Neste referencial as
coordenadas das extremidades da haste são x1 e x2, de modo que seu comprimento para
o referencial S é:
L o = x2 - x1
27
que denominaremos de comprimento da barra no referencial no qual a barra está em
repouso.
Consideremos agora, a mesma grandeza “comprimento" medida num referencial S'
que se movimenta com velocidade v paralela à barra.
Fig. 2.13
Chamado de L o comprimento da barra medido pelo referencial S' a pergunta que
fazemos é: “Qual a relação entre L e Lo?”. Ou em outras palavras, se numa rodovia existe
no acostamento uma barra no chão e um carro trafegando pela rodovia. Este mede a
barra mais comprida, igual, ou mais curta do que seu tamanho medindo em repouso?
Para calcularmos o comprimento L da Barra (em S') vamos aplicar as
transformadas de Lorentz às coordenadas das extremidades. Usando as expressões e
fazendo a diferença de x2 com x1, e considerando que ambas posições das extremidades
podem ser lidas simultaneamente,
x=
x2 =
x1 '+ vt '
1− v2 / c2
x 2 '+ vt '
1− v2 / c2
x 2 − x1 = L0 =
L0 =
ou
x 2 '− x1 '
1− v2 / c2
L
1− v2 / c2
(
L = L0 1 − v 2 / c 2
)
28
Assim, "o comprimento de um objeto em movimento em relação ao observador
parece mais curto do que quando o objeto está em repouso em relação ao observador".
Este fenômeno é conhecido como contração de Lorentz-Fitz-Gerald.
Observemos que devido à dependência da expressão com y2 não faz nenhuma
diferença quem chamamos S ou S'. Se o comprimento de um foguete na plataforma de
partida é Lo, observaremos um comprimento L após o foguete adquirir velocidade v,
quando medimos daqui da terra. Da mesma forma para o astronauta no foguete, tudo que
ficou na Terra apresenta um comprimento mais curto por um fator de (1-(v/c)2)1/2. O
comprimento de um objeto é máximo quando medido por um observador em
repouso em relação a ele.
O fator (1-(v/c)2)1/2 é exatamente a razão entre L/Lo e, portanto, representa a
porcentagem de diminuição do tamanho do objeto.
L
= 1− v2 / c2
L0
Para um corpo com velocidade de 1000 Km/seg., a contração seria:
2
 10 6 
L
 = 0.9999944
= 1 − 
8 
L0
 3x10 
o que representa uma contração de 0.00056%. Caso o corpo tenha velocidade de 0.9c,
teria uma contração da ordem de 44%.
É importante salientar que a contração espacial somente ocorre nas coordenadas
da direção do movimento. Se o movimento é paralelo a x, as dimensões y e z não são
inalteradas e representam as mesmas medidas em S e S'.
(c.5) Dilatação Temporal
Como já vimos, as transformações de Lorentz levam ao resultado não tradicional
de que intervalos de tempo são afetados pelo movimento relativo. Relógios em
movimento com relação ao observador parecem andar diferente do que quando em
repouso. Se um acontecimento é observado como tendo a duração de tempo t no
29
referencial S, o mesmo evento tem uma duração menor no referencial S'. Este efeito é
conhecido como dilatação temporal.
Vamos derivar a dilatação temporal a partir das transformadas de Lorentz.
Imaginemos um relógio num ponto x' do referencial S' em movimento. Quando um
observador neste referencial observar t'1, um observador no referencial S encontrará t1, de
modo que:
t1 =
t '1 + vxc 2'
1− v2 / c2
Após a decorrência de um intervalo de tempo ∆t' em S' o observador deste
referencial mede t2’, enquanto o observador em S observa t2, tal que:
t2 =
t 2 '+ vxc 2'
1− v2 / c2
Subtraindo ambas relações:
t 2 − t1 =
t ' 2 −t '1
1− v2 / c2
como t2 - t1 = ∆t e t'2 - t'1 = ∆t'
∆t =
∆t '
1− v2 / c2
que é a relação para a dilatação temporal para um relógio em movimento.
Como um exemplo para a dilatação temporal, vamos considerar as partículas
chamadas mésons - µ. Estas partículas apresentam um tempo de vida da ordem 2x10-6
seg. e pode aqui ser considerado como um pequeno relógio. Isto significa que após sua
produção, decorre este intervalo de tempo médio medido no referencial em que o méson
está em repouso (referencial de repouso) até que o méson - µ decai em elétrons. Os
mésons - µ são produzidos na alta atmosfera por raios cósmicos provenientes do espaço
e são observados em grande quantidade ao nível do mar, mas se levarmos em conta sua
30
velocidade da ordem de 2.994x108 m/seg., e seu tempo de vida to = 2x10-6 seg., a
distância que tais partículas poderiam percorrer antes de decair seria:
y = vto = 2.994 x 108 x 2 x 10-6 ≅ 600 m
como eles são criados em altitudes pelo menos 10 vezes maiores e deveriam decair antes
de atingirem a superfície.
Vamos agora resolver o problema mais realisticamente usando relatividade.
Primeiramente, examinando o problema do referencial da partícula, no qual seu tempo de
vida é 2x10-6 seg. e no qual haverá um percurso de 600 m, em média, antes do
decaimento. Esta distância é, no entanto, mais curta do que aquela observada por um
observador na Terra pelo fator (1-(v/c)2)1/2. Ou seja, a distância para um observador na
superfície da Terra seria:
y
y
600
= 1 − v 2 / c 2 → y0 =
=
~ 9500m
2
2
2
y0
1− v / c
1 − (0.998)
o que justifica plenamente observar tais partículas na superfície.
Alternativamente, podemos analisar o problema a partir de um observador na
superfície da Terra. Nesse referencial, o tempo de vida é alterado pela dilatação temporal,
e o novo tempo de vida é:
∆t =
∆t '
1− v / c
2
2
=
2 x10 −6
1 − (0.998)
2
= 31.7 x10 −6 seg
e, portanto, a distância percorrida antes do decaimento é:
yo = v∆t = 2.994 x 108 x 3.17 x 10-6 = 9500 m
que também justifica perfeitamente a observação destas partículas na superfície da Terra.
31
(c.6) Alguns Esclarecimentos sobre Medidas em Repouso e em Movimento.
Após termos estudado duas importantes conseqüências das transformações de
Lorentz: a contração espacial e a dilatação temporal, uma série de dúvidas envolvendo
situações distintas surgem naturalmente. Vamos considerar uma série de situações que
sejam ilustrativas e esclarecedoras.
Antes de iniciarmos, é importante afirmar que a maneira com que medidas de
tempo e comprimento são realizadas por diferentes observadores são fundamentais em
relatividade, e embora muitas vezes uma determinada situação seja totalmente
equivalente entre considerarmos um referencial em movimento e outro parado ou viceversa, estas situações são bastante distintas na maneira com que as grandezas são
medidas e isto deve distinguir totalmente os dois sistemas de referência.
Consideremos inicialmente medidas de intervalos de tempo. Seja uma plataforma
rígida sobre a qual é colocada uma fonte de liz, um espelho e um relógio, como mostra a
figura abaixo:
Fig. 2.14 - Plataforma c/ fonte de luz.
Vamos imaginar dois eventos, a saber saída e retorno de um pulso de luz emitido
pela fonte. Queremos medir o intervalo de tempo entre dois eventos: saída e retorno.
Para um observador sobre a plataforma esta é uma questão trivial e o tempo
medido é exatamente ∆t'= 2L/c. Independentemente da plataforma estar em movimento, o
tempo de ocorrência de cada evento foi medido pelo mesmo relógio que estava presente
em cada um dos eventos entre os quais estamos medindo o intervalo de tempo. O evento
global iniciou e terminou no mesmo relógio, ou seja, a medida de tempo foi realizada para
os dois eventos na mesma posição em S'. Este é denominado de intervalo de tempo
próprio, medido sempre pelo mesmo relógio.
32
Considere agora a plataforma em movimento com velocidade v. Vejamos como um
observador estacionário, vendo a plataforma se deslocar, vê o evento acima.
O quadro visto pelo observador está representado abaixo, os dois eventos não
mais ocorrem no mesmo ponto.
Fig. 2.15 - Plataforma em movimento com fonte de luz
Levando em conta o fato que a velocidade da luz propaga-se com velocidade c, a
distância total percorrida pela luz agora é 2 (L2 + (v∆t/2)2)1/2 e, portanto, temos que:
 v∆t 
c∆t = 2 L + 

 2 
2
2
de onde podemos resolver para ∆t e tirarmos:
∆t =
2L
c
1− v2 / c2
Assim, o intervalo de tempo decorrido entre os dois mesmos eventos é diferente
para os dois referenciais. É extremamente importante observar que no segundo caso,
referencial S em repouso, os dois eventos ocorreram em diferentes pontos do espaço,
enquanto no primeiro referencial fixo na plataforma eles ocorreram no mesmo ponto. Isto
fez com que no caso do referencial estacionário, ocorrendo em pontos diferentes, os
eventos foram necessariamente medidos com relógios diferentes, já que se fossem feitos
pelo mesmo relógio, significaria que o relógio teve que se movimentar junto com a
plataforma. O que descaracterizaria nossa consideração que trata de um observador em
33
repouso. Assim, o intervalo de tempo medido por este observador é o intervalo de tempo
impróprio. E a dilatação temporal pode ser mais apropriadamente escrita como:
∆t próprio = ∆t impróprio 1 − v 2 / c 2
Este exemplo tem como mensagem principal salientar as diferenças intrínsecas de
como uma medida é realizada num sistema de referência em repouso ou em outro em
movimento. Para relatividade especial o "relógio" que mede o tempo de ocorrência dos
eventos deve ser colocado precisamente na posição onde o evento ocorre.
Alguém pode perguntar como o observador em S no exemplo anterior mede o
tempo entre os eventos, já que o relógio tem que estar fixo? Certamente ele deve possuir
uma coleção de relógios sincronizados (no mesmo ponto do espaço) e levados para as
várias diferentes posições, como mostrado na fig. 2.16. Assim, a medida que o dispositivo
se desloca, ele passa pela linha de relógios e a diferença de tempo ou o intervalo de
tempo entre dois eventos é medido pela diferença de leituras entre dois relógios. No caso
dos eventos considerados, entre os relógios 3 e 13. Note que existe uma diferença
conceitual bastante grande entre os tempos medidos por observadores em S e S' e
entender isto é essencial para entendermos as conseqüências da relatividade especial.
Fig. 2.16 - Seqüência de relógios capazes de medir intervalos de tempo no referencial em repouso.
É muito comum, quando descrevemos a dilatação temporal, a afirmação que
“relógios em movimento andam mais devagar”. Não há nada errada com isto, mas leva a
um aparente paradoxo. Suponha que um relógio A esteja em movimento com relação a
outro B. Desta forma, A anda mais devagar que B. No entanto, do ponto de vista do
relógio A, B é que anda mais devagar, isto cria uma contradição. A qual na verdade não
existe, já que somente em um dos referenciais a diferença de tempo entre dois eventos
34
poderá ser medida por um único relógio. Tempo em relatividade só tem significado
quando representa a diferença de ocorrência entre dois eventos, e neste caso o tempo
próprio é sempre menor. O aparente paradoxo acima na verdade não existe. Lembrando
que a relatividade especial trata de efeitos cinemáticos entre observações do mesmo
evento feitas de diferentes referenciais. Assim, sempre é válido dizer que os relógios em
movimento andam mais devagar, se soubermos o que significa. No entanto, seria mais
apropriado se dissermos que:
"O relógio que mede o intervalo de tempo próprio entre dois eventos, mede um
intervalo menor do que relógios medindo o intervalo de tempo impróprio entre
estes mesmos eventos".
É ainda importante salientar que o mecanismo do relógio não é afetado pelo
movimento, e que é errôneo dizer que a dilatação temporal ou qualquer outro efeito em
relatividade ocorre devido ao fato que a observação feita de um evento leva algum tempo
para atingir o observador, porque caminha com a velocidade da luz.
Após esta breve discussão sobre medidas de tempo, vamos semelhantemente
fazer medidas de comprimento. O importante aqui é como estas medidas são realizadas
por diferentes observadores, ou o que entendemos por medida de comprimento. Com isto
poderemos verificar a contração espacial de uma forma alternativa. Seja um veículo que
se desloca com velocidade v percorrendo um ponto A, até outro B, cobrindo uma distância
L num tempo L/v.
O intervalo de tempo medido pelo observador no veículo é um intervalo próprio, já
que saída e chegada são medidas pelo mesmo relógio. Por outro lado, o tempo L/v
medido no referencial S (parado em relação a A-B) é impróprio, pois foi medido
necessariamente por relógios diferentes. Deve ficar claro que os dois eventos que
estamos medindo aqui são: carro passa pela marca A, carro passa pela marca B e
lembramos que qualquer medida deve ser feita com o instrumento (no caso relógio) na
posição do evento, pois como vimos realizadas em posições diferentes não necessitam
ser simultâneas.
35
Fig. 2.17 - Medida da distância A B por um observador em movimento
Assim, temos que:
(S') tempo próprio = L/v (1-(v/c)2)1/2
(S) tempo impróprio = L/v
Como a velocidade é a mesma em ambos sistemas de referência, o comprimento
medido pelo piloto do veículo (S') é:
L' = vt (tempo próprio)
L' = L 1 − v 2 / c 2
enquanto L é medido em S. É importante notar que a dilatação temporal leva
necessariamente a contração espacial, já que a velocidade é preservada entre os dois
referenciais.
Além disso, deve ficar claro que a relatividade especial constitui-se no efeito
cinemático em medidas e, portanto, de um modo geral, comprimento é medido através do
conhecimento da velocidade e do tempo. A utilização de réguas é uma medida puramente
estática e, portanto, feita em referencial onde o objeto a ser medido está em repouso.
Vamos analisar um segundo experimento de medida espacial. Seja uma barra com
duas marcas A e B separadas por uma distância L, que se movimenta com relação a
outra barra na qual temos as marcas A' e B'. Quando medidas no referencial de repouso
das barras, ambas distâncias tem dimensão L. Tiramos agora uma fotografia quando a
primeira barra desloca-se em relação a Segunda com velocidade v. A questão é AB e A'B'
serão iguais na foto? Ou seja, se A coincide com A', B' coincidirá com B? Para evitar
problemas com atrasos na propagação da luz a câmera é colocada exatamente a meia
distância das marcas (fig. 2.18).
36
Fig. 2.18 - Comparação de duas barras de mesmo tamanho, uma em movimento e a outra em repouso.
É evidente que na fotografia ambas as marcas coincidirão, já que estamos
realizando o mesmo tipo de medida e comparando eventos distintos em pontos distintos
do espaço. Não estamos de forma alguma fazendo uma medida cinemática, onde o efeito
de sua velocidade se manifeste.
A fim de verificarmos a contração espacial é preciso termos um observador em
movimento fazendo medida de tempo. Se considerarmos um observador em A, ele medirá
um intervalo de tempo entre os eventos A passa A' e A passa B' (fig. 2.19) que é um
intervalo de tempo próprio. Enquanto se compararmos o intervalo medido por dois
relógios posicionados em A' e B' mediremos o tempo impróprio L/v. Desta forma, para o
observador em A (em movimento), a medida de L pode ser tirada de :
L' L
v2
=
1− 2
v v
c
ou seja
L' = L 1 −
v2
c2
Fig. 2.19 - Esquema do experimento para medir distância entre AB pelo observador em movimento.
37
Baseado no experimento acima, afirmamos que o comprimento entre as marcas
(que poderia ser o metro padrão) sofreu uma contração quando medida no referencial em
movimento. Daí afirmamos que, para um observador em movimento os objetos em
repouso parecem contrair de tamanho. Isto gera um aparente paradoxo:
"Como pode ser que um metro padrão movendo-se parece ter diminuído de
tamanho com respeito a outro no laboratório, quando para um observador no metro
em movimento, o laboratório está se movendo e, portanto, para ele o metro no
laboratório deve ter contraído?"
Este aparente paradoxo pode ser facilmente resolvido se lembrarmos que dois
eventos que ocorrem simultaneamente em um referencial não são simultâneos num
segundo referencial em movimento com relação ao primeiro. No caso em questão, os
eventos A passa por A' e B passa por B' são simultâneos no laboratório (por exemplo,
medidas com auxílio da fotografia), mas não são simultâneos para um observador
movendo-se em relação ao laboratório. E não sendo simultâneos não podem ser usados
para medida de comprimento, como sendo uma medida em repouso.
Assim, o paradoxo não existe porque embora seja "relativamente equivalente" o
movimento de ambos referenciais, as medidas realizadas nestes referenciais são
completamente não equivalentes. O primeiro passo para entendermos os resultados
previstos pela relatividade especial é entender o significado da realização de uma medida.
(c.7) Massa Relativística
Até agora, vimos que grandezas fundamentais como tempo e comprimento só têm
significado quando o referencial no qual elas são observadas é específico, e que os
valores destas grandezas medidas neste referencial estão relacionadas com as feitas em
outro referencial. Isto faz com que um dado evento que ocorra no tempo e no espaço
tenha aspectos diferentes em cada referencial. No entanto, segundo o primeiro postulado
da relatividade, as leis de movimento observadas em cada referencial deve ter a mesma
forma.
Vamos analisar a colisão elástica entre dois corpos sendo observada de dois
sistemas de referência distintos e vamos considerar os princípios de conservação de
momentum e energia.
38
Na colisão elástica a energia mecânica é conservada. Sejam duas partículas A e B,
A está inicialmente em repouso no referencial S e B está inicialmente em repouso no
referencial S', o qual se move com velocidade v relativa a S na direção + x (fig. 2.20).
Ambos os corpos são idênticos.
Fig. 2.20 - Início da colisão entre dois corpos. A velocidade vA em S e B tem velocidade v'B em S'
Num determinado intervalo de tempo, simultaneamente A começa a mover-se com
VA na direção +y enquanto B move-se com V'B na direção -y'. Para simplificar, vamos
tomar VA = V'B fazendo com que cada corpo seja idêntico ao outro em cada um dos
referenciais.
O aspecto da colisão vista por cada um dos referenciais é diferente. No entanto,
para cada um o comportamento da colisão é o mesmo, de modo que S "vê" A da mesma
forma que S' "vê" B (fig. 2.21).
A colisão como vista por cada um dos referenciais está mostrada abaixo:
Fig. 2.21 - Colisão vista por um dos referenciais.
39
Após a colisão, A retorna na direção -y com velocidade VA, enquanto B retorna na
direção +y' com velocidade V'B. Se a distância entre eles era inicialmente Y, o observador
em S encontra a colisão em y = Y/2 enquanto que para S' ocorre y'=Y/2. O tempo gasto
por A para sair da posição inicial, colidir e regressar é To, que medido por S é:
T0 =
Y
VA
e para B medido em S' To = Y/V'B.
Para o observador em S, o momentum é conservado e, portanto, a componente y
do momentum permite escrever
mAVA = mBVB
onde mA, mB, VA, VB são as massas e velocidades medidas em S. A velocidade VB, pode
ser calculada em S como:
VB =
Y
T
onde T é o tempo necessário para B realizar sua ida e retorno quando medido por S.
Como este tempo visto por S' é To, temos que T = To (1-(v/c)2)-1/2, de acordo com a
dilatação temporal vista anteriormente. Assim, a velocidade de B medida por S é:
VB =
Y 1− v2 / c2
T0
e usando VA = Y/T0 e VB na equação de conservação de momentum, tiramos:
m A = mB 1 − v 2 / c 2
Como assumimos inicialmente que A e B são idênticos quando em repouso com
relação a um observador comum, devemos atribuir a diferença entre as massas ao fato
que eles estão em movimento relativo. Assim, da mesma forma que espaço e tempo,
40
massa também é uma grandeza que depende do movimento relativo entre o observador e
o objeto observado.
Se chamamos mA = mo como sendo a massa medida quando o corpo está em
repouso em relação a S, a massa medida por um observador em S' (para o qual a massa
desloca-se com v) será mB = m e, portanto:
m=
m0
1− v2 / c2
é a relação relativística para a massa. A massa medida para um corpo que desloca-se
com velocidade v é maior do que aquela medida quando o corpo está em repouso.
Assim, a massa relativística é uma conseqüência do fato que a lei de conservação
de momentum deve ser válida em ambos os referenciais como assegurado pelo primeiro
postulado da relatividade.
Com respeito à mecânica newtoniana, ela é válida se o momentum é definido como
mv e, portanto, a segunda lei de Newton passa a ser expressa por:
F=
m0 v
d 

dt  1 − v 2 / c 2
 d
 = (mv )
 dt
ou seja, sempre devemos considerar a variação temporal do momentum e não apenas da
velocidade.
O aumento relativístico da massa só é importante para velocidades próximas à
velocidade da luz. No momento, somente partículas atômicas e subatômicas como
elétrons, prótons, mésons, etc são os que apresentam velocidades suficientes para que
efeitos relativísticos sejam medidos. Historicamente, a primeira confirmação experimental
da massa relativística foi feita em 1908 quando Bucherer verificou que a relação e/m para
elétrons era maior para elétrons lentos. Algumas medidas experimentais da relação
m(v)/mo para elétrons são mostradas no gráfico (Fig. 2.22) a seguir:
41
Fig. 2.22 - Variação da massa inercial do elétron como função da velocidade.
O valor inicial de mo é denominado de massa de repouso, enquanto m é chamado
de massa inercial. Esta nomenclatura aplica-se para todas as partículas.
(c.8) A Relação Massa e Energia
A partir dos postulados da relatividade especial é possível obter uma importante
relação entre massa-energia, o que consiste numa das mais famosas relações obtidas por
A. Einstein. Utilizando a definição de energia cinética como sendo o trabalho realizado por
uma força para trazer o corpo do repouso até o presente estado de movimento, podemos
escrever para o caso da força paralela ao deslocamento:
s
K = ∫ Fds
0
onde F é o componente da força aplicada na direção do movimento (deslocamento ds).
Usando F = d (mv)/dt, temos:
d (mv )
K=∫
ds = ∫ vd (mv )
dt
0
0
s
s
que pode ser substituído pela relação da massa relativística,

m0 v
K = ∫ vd 
2
2
0
 1− v / c
s




42
Integrando por partes, temos:
K=
v
m0 v 2
1− v / c
2
2
v
0
vdv
− m0 ∫
1− v / c
2
0
2
+ m0 c 2 1 − v 2 / c 2
ou seja:
K = mc 2 = m0 c 2 = (m − m0 )c 2
que estabelece que “a energia cinética de um corpo é igual ao aumento de sua massa
como conseqüência de seu movimento relativo, multiplicado pela velocidade da luz ao
quadrado”.
Se interpretamos mc2 como a energia total do corpo E, quando o corpo não
apresenta movimento K = 0, terminamos com o fato que o corpo apresenta como energia
total para o seu estado de repouso a energia
E0 = m0c2
que é denominada de energia de repouso.
Como mc2 corresponde à energia total do corpo ela resulta da adição de energia
cinética com a energia de repouso, ou seja:
E = K + moc2 = mc2
sendo m = mo (1-(v/c)2)1/2 temos que:
E=
m0 c 2
1− v2 / c2
Vamos tomar esta relação e elevar ao quadrado:
m02 c 4
m c =
1− v2 / c2
2
4
43
de onde obtemos:
m2c2 - m2v2 = m02c2
Como p = mv, obtemos:
m2c4 = p2c2 + m02c4
ou
E2 = p2c2 + m02c4
Como sendo a relação momentum energia relativística amplamente utilizada em colisões,
etc.
(c.9) Diagramas Espaço-Tempo
Ao
derivarmos
as
transformações
de
Lorentz
anteriormente,
somente
consideramos casos onde a luz se propaga na direção x. Poderíamos, no entanto, ter
tratado o problema para a luz propagando-se em qualquer direção. Afinal, a composição
de todas as direções resulta na luz propagando-se com a mesma velocidade.
Vamos considerar o seguinte exemplo:
Suponhamos que um “flash” de luz é emitido em t = 0 na origem de S. Este pulso
propaga-se em todas as direções de modo que num instante mais tarde t, o pulso
alcançou a região correspondente a uma esfera de raio r = ct e centrada na origem de S.
Se o mesmo fenômeno é observado do referencial S', cuja origem só coincide com a
origem de S em t' = t = 0. O mesmo fato é observado, sendo agora uma esfera de raio r' =
ct' e centrada na origem de S'. Tomemos a equação r = ct e escrevendo em termos das
coordenadas cartesianas temos:
x2 + y2 + z2 = c2 t2
usando as transformações de Lorentz para x, y, z e t, obtemos:
γ 2 (x' + vt')2 + y’2 + z’2 = γ 2 c2 (t' + vx' / c2)2
44
desenvolvendo, obtemos:
γ 2 x’2 (1 - v2/c2) + y’2 + z’2 = γ 2 t’2 (c2 - v2)
de onde temos que:
x’2 + y’2 + z'2 = c2 t’2
que novamente define uma esfera centrada na origem de S'. Assim, a luz é descrita como
expandindo-se esfericamente em ambos os sistemas de referência.
Uma forma bastante conveniente de mostrar a "estória" completa de um
determinado movimento unidimensional é através de um diagrama representando nos
eixos posição e tempo, ou melhor, ct. Estes diagramas são costumeiramente
mencionados como diagramas de Minkowski, em homenagem ao cientista que os
introduziu. Neste diagrama, um evento em S é descrito pelas coordenadas (x, t) e em S'
por (x', t'), as quais estão relacionadas pelas transformações de Lorentz. É interessante
utilizar ct ao invés de tempo por uma questão de escala e também devido ao fato que a
propagação da luz neste sistema é representada pela bissetriz do quadrante x – ct.
Outros sistemas de referência são representados no mesmo diagrama, por eixos
não ortogonais. Referenciais com velocidade positiva em S apresentam eixos formando
ângulos menores que 90° e referenciais com velocida des negativas, ângulos maiores que
90° (fig. 2.25).
Fig. 2.23 - Eixos para vários referenciais.
45
Qualquer evento P tem duas coordenadas em cada referencial determinadas
trocando-se retas paralelas aos respectivos eixos e passando pelo ponto.
Automaticamente, temos as leituras de coordenadas em diversos referenciais.
Notemos que a quantidade:
r2 = (ct)2 - x2
é um invariante do problema, sendo verdadeira em qualquer referencial e, por isso, é
denominada de invariante do espaço-tempo. Isto significa que, dado um evento, em
qualquer referencial a quantidade acima tem o mesmo valor. Não vamos nos ater a
interpretação de r, porém r2 = 0 representa a propagação de um sinal de luz e r2 = -1
temos a escala dos eixos do sistema. É importante notar que no diagrama de Minkowski
os eixos representando os vários referenciais não apresentam a mesma escala. De fato, a
hipérbole x2 - (ct)2 = 1 determina os pontos da escala dos vários referenciais.
Ficará como exercício verificar que a quantidade r2 é um invariante.
Se estivermos considerando dois eventos distintos de ∆x e ∆t, a quantidade
∆s 2 = (c∆t ) − (∆x )
2
2
é chamado de intervalo no espaço-tempo; e para qualquer referencial que observe este
evento é, também, um invariante. No caso de ∆s2 = 0 é claro que estamos tratando de
eventos conectados via raio de luz.
As quantidades invariantes em relatividade são importantes porque representam o
equivalente às constantes de movimento que estamos acostumados. De um modo geral,
estas quantidades envolvem quatro grandezas distintas e por isso são denominadas de
quadro-vetores. Assim, o quadro-vetor espaço-tempo (visto anteriormente) relaciona as
três coordenadas espaciais e o tempo (x, ct). Um outro quadro-vetor importante é o
momento-energia (p, E/c) que representa o estado dinâmico da partícula.
Da mesma forma que espaço-tempo, a quantidade
E
p + p + p − 
c
2
x
2
y
2
z
2
46
é um invariante físico, tendo o mesmo valor para qualquer referencial inercial. Assim,
consideremos uma partícula em repouso num determinado referencial. Neste caso seu
quadro-veto é (0, E0/c). Para um outro referencial, esta partícula pode estar deslocandose de modo que (p, E/c). Da invariância deste quadro-vetor obtemos que é a relação
energia-momentum obtida anteriormente.
(c.10) Cinemática Relativística e as Transformadas de Velocidade
Um dos postulados da relatividade especial definido no começo de nossa
exposição estabelece que a velocidade da luz no espaço livre tem o mesmo valor para
todos os observadores independentemente de seus movimentos relativos. No entanto,
sabemos de nossa experiência cotidiana que este resultado não é válido para bolas
atiradas de trens em movimento ou disparos de espingardas feitos em movimento, etc.
A fim de obtermos resultados que englobem ambos os casos, vamos determinar a
partir das transformações de Lorentz as leis de composição de velocidade. Ou melhor, as
relações que transformam velocidades observadas num referencial para velocidades
observadas em outros referenciais.
Vamos novamente considerar dois referenciais S e S', com S' movendo-se com
velocidade v na direção x com relação a S. Seja também um objeto que se move com
velocidade (Vx, Vy, Vz) no referencial S. A pergunta que fazemos é: Como esta velocidade
está relacionada com a outra. (Vx', Vy', Vx') medida no referencial S'?
Para um observador em S as componentes da velocidade são:
dx
dt
dy
Vy =
dt
dz
Vz =
dt
Vx =
enquanto que para um observador em S'
47
dx'
dt '
dy '
Vy' =
dt '
dz '
Vz ' =
dt '
Vx' =
Considerando as transformações de Lorentz, temos que o diferencial das
variáveis são dados por:
dx' dx − vdt
=
dt ' dt − cv2 dx
Vx' =
Utilizando-se estas equações acima, obtemos que:
Vx' =
dx
dt
1−
−v
ou
v dx
c 2 dt
Vx' =
Vx − v
1 − cv2 V x
De forma semelhante:
Vy' =
dy '
dy
=
dt ' dt − vdx
c2
1− v 2 / c 2
de onde tiramos:
Vy' =
dy
dt
1 − cv2
Vy' =
e finalmente para a velocidade Z,
1− v2 / c2
dx
dt
Vy 1 − v 2 / c 2
1 − cv2 V x
48
Vz 1 − v 2 / c 2
1 − cv2 V x
Vz ' =
Estas três relações constituem as transformações relativísticas de velocidade, e é
interessante notar que as componentes de velocidade y' e z' são afetadas pela
componente x e não somente por y e z, como no caso das transformadas de
coordenadas.
Se considerarmos situações onde v « c, de modo que v/c ~ 0, obtemos que como
esperado e de acordo com a observação de fatos do cotidiano.
Imaginemos (Vx, Vy, Vz), neste caso temos que obter as transformadas inversas, as
quais podem ser obtidas trocando v por -v e colocando Vx, Vy, Vz no lugar de Vx', VY',Vz' e
vice-versa. Assim, as transformadas são:
Vx =
Vx' + v
vV
1 + 2x
c
Vy' 1 − v 2 / c 2
Vy =
vV
1 + 2x
c
Vz =
Vz ' 1 − v 2 / c 2
vV
1 + 2x
c
Como exemplo ilustrativo, imaginemos uma fonte de luz que desloca-se com velocidade
v. Qual é a velocidade da luz medida por um observador em repouso?
Considerando as transformadas inversas acima com Vx' = c, temos:
Vx =
c+v
=c
vc
1+ 2
c
e Vy = Vz = 0.
As relações de transformação de velocidades são importantes para uma série de
efeitos observáveis e que veremos a seguir.
49
II.5 - Aplicações e Exemplos em Relatividade Especial
Vamos nesta parte considerar alguns exemplos que são aplicações dos vários
conceitos discutidos até o momento.
(a) O Paradoxo dos Gêmeos
Como dissemos anteriormente, intervalos de tempo medidos por observadores em
movimento são menores. Vamos analisar a seguinte situação: Dois gêmeos estão em
repouso na Terra. Um dos gêmeos toma um foguete e parte para uma viagem a um
planeta distante. Enquanto este está em sua viagem, o gêmeo que ficou na Terra afirma
que o relógio de seu irmão anda mais devagar e, portanto, quando este retornar a Terra
ele será mais jovem do que ele que permaneceu na Terra. Podemos, no entanto,
perguntar como o gêmeo do foguete vê a situação. Para ele, em repouso em relação ao
foguete, é como se seu irmão que ficou na Terra tivesse viajado junto com a Terra e
retornado. Assim, quando se reencontraram, o gêmeo que estava no foguete pensa que
seu irmão que ficou na Terra está mais jovem. Afinal, quem está mais jovem?
Fig. 2.24 - Esquema representando o paradoxo dos gêmeos.
Este aparente paradoxo é resolvido se observarmos cuidadosamente que as
situações expostas acima não são equivalentes. A situação física do gêmeo na Terra
observar a viagem do foguete não é equivalente à situação onde o gêmeo no foguete
observa a viagem da Terra. A diferença física entre as situações é que o gêmeo do
foguete sofrerá períodos de movimento acelerado (início, retorno e fim), enquanto que,
para seu irmão, na Terra isto não ocorre. Este movimento acelerado distingue claramente
50
as duas situações. Isto permite concluir que o gêmeo do foguete é o que está mais jovem.
Esta situação pode ser resolvida matematicamente, envolvendo uma discussão quando
os observadores estão acelerados, o que é mais apropriado para a teoria da relatividade
geral.
Assim, como vimos, a situação não apresenta reciprocidade. Para mostrarmos isto,
vamos demonstrar que o tempo decorrido em relógios movimentando-se no espaço
tempo depende do caminho realizado pelos relógios. Consideremos dois relógios R1 e R2,
inicialmente sincronizados e localizados em 0 como mostra a fig. 2.24. O relógio R1
permanece em repouso no ponto 0 enquanto R2 faz uma viagem que passa por alguns
pontos e retorna ao ponto 0, com velocidade tomada como v = 0.8c.
Fig. 2.25 - Representação no diagrama ct vs x da situação dos gêmeos.
Na figura mostramos o diagrama espaço-tempo (ct vs x) para a situação descrita.
O relógio R2 move-se de 0 para A e, então, retorna a B. O relógio R1 apenas desloca-se
no eixo do tempo, enquanto R2 move-se também no eixo das coordenadas. Calculamos o
tempo decorrido em cada um dos relógios. A relação entre o tempo próprio e o impróprio
é:
dx 2
dτ = dt 1 − v / c = dt − 2
c
2
2
2
onde usamos vdt = dx.
Para o deslocamento do relógio R1, dx = 0 (não há deslocamento de coordenadas)
e, portanto, o intervalo de tempo decorrido entre o deslocamento 0 → B será:
51
B
∆τ 1 = ∫ dt = TB − T0 = ∆T
0
já para o caminho OAB, o tempo decorrido será:
A
B
A
A
0
A
0
0
∆τ 2 = ∫ dτ + ∫ dτ = 2 ∫ dτ = 2 ∫ dt 2 −
(dx )2
c2
como dx = vdt, temos:
∆τ 2 = 2 1 −
v2
v 2  ∆T 
dt
=
2
1
−


c 2 ∫0
c2  2 
A
ou
∆τ 2 = ∆T 1 − v 2 / c 2
Observamos que ∆τ 1 > ∆τ 2 mostrando que quando os relógios voltam a ser
confrontados no ponto B sempre haverá uma diferença, sendo que o relógio que deslocase sempre mostrará um tempo menor.
Conclusão: o gêmeo no foguete estará mais jovem do que seu irmão. Note que os
trechos de aceleração foram desprezados.
(b) Emissão de luz por um objeto em movimento
Seja um objeto (por exemplo um átomo) que move-se com velocidade v ao longo
da direção x. O referido corpo emite raios de luz, que no seu próprio sistema de referência
faz um ângulo θ’ com o eixo x'. A pergunta que queremos responder é: Qual será o ângulo
θ entre o feixe de luz e o eixo x observado no referencial em repouso (fig. 2.26)?
52
Fig. 2.26 - Emissão de luz por fonte em movimento.
No referencial S' a luz propaga-se com:
Ux' = c cos θ'
Uy' = c sen θ'
usando as relações de transformação de velocidades:
Ux =
c cos θ '+ v
c cos θ '+ v
=
v cos θ '
vc cos θ '
1+
1+
2
c
c
csenθ ' 1 − v 2 / c 2
Uy =
v cos θ '
1+
c
Desta forma o ângulo θ é definido como:
senθ ' 1 − v 2 / c 2
tan θ =
=
Ux
cos θ '+ v / c
Uy
Consideremos agora, que o corpo em questão emita luz em todas as direções
uniformemente, quando visto de seu referencial. Devido a relação angular anterior, para
um observador, o ângulo de emissão com relação à direção de movimento parece ficar
menor. A conseqüência disto é que para um observador parado a luz parece estar mais
concentrada ao longo da direção do movimento. (fig. 2.27).
53
Fig. 2.27 - Anisotropia de emissão como feito relativístico.
No limite v → c, sen θ → 0 o que implica que toda luz caminha concentrada na
direção do movimento. Isto é uma observação rotineira nos aceleradores.
Para pequenas velocidades, podemos expandir:
1−
v2
1 v2
≅
1
−
2 c2
c2
e
v
1
≅ 1 − cos θ '
c
1 + cos θ '
v
c
de onde tiramos:
senθ ≅ senθ '−
v
senθ '
2c
mostrando a concentração da luz ao longo da direção de movimento. Emissões ao longo
de θ = 0 ou π não são afetadas pelo movimento. Exemplos práticos desta observação
podem ser feitos em aceleradores de elétrons e prótons.
(c) O Efeito Cerenkov
Como vimos, a massa relativística de um corpo impõe uma “espécie” de limite na
velocidade que o corpo pode ter com respeito a um observador.
54
m=
m0
1− v2 / c2
Quando a velocidade do corpo aproxima-se da velocidade da luz, sua massa
aproxima-se do infinito. Neste caso, uma força infinita seria necessária para colocar o
corpo numa velocidade tal que sua massa seria infinita, e como não existem massa ou
forças infinitas concluímos que não há corpos deslocando-se com velocidade superior ou
igual a c.
Em determinados meios como água, vidro, ar, etc., a velocidade da luz é inferior ao
seu valor no vácuo. E em tais meios podemos encontrar partículas que se movem com
velocidade superior à da luz naqueles meios, jamais, no entanto, superior à luz no vácuo.
Fig. 2.28 - Partícula radiante num meio, deixando um cone de radiação após sua passagem
Quando partículas carregadas propagam-se em tais meios com velocidades acima
da luz naquele meio, um cone de luz é emitido (Fig. 2.28) num processo parecido daquele
das ondas emitidas por um barco que propaga-se com uma velocidade acima das
velocidades das ondas na água. Esta radiação emitida é denominada de Radiação
Cerenkov.
Consideremos o meio de índice de refração n, definido como:
n = veloc. luz vácuo
veloc. luz meio
55
de modo que a velocidade da luz no meio é c/n, que no caso em questão é inferior à
velocidade v da partícula. À medida que a partícula carregada propaga-se no meio,
colisões provocam emissão de luz, que propaga-se à velocidade c/n. A radiação emitida
propaga-se em todas as direções, mas como a partícula é mais rápida, a frente de onda
da radiação propaga-se e nunca atinge a partícula.
Pelo esquema acima, a radiação originada no ponto 0 propaga-se ct/n, enquanto
que a partícula deslocou-se de vt, deixando para trás este cone de Cerenkov. O ângulo de
abertura do cone é dado por:
senθ =
(c / n ) =
vt
c
nv
(d) Derivação Alternativa da Relação Massa-Energia
A dedução do equivalente massa-energia pode ser feita de várias formas
diferentes. Uma das formas sugeridas por Einstein utiliza a noção de que o centro de
massa de um sistema não pode mover-se quando não existem agentes externos atuando
sobre o sistema.
Neste exemplo, imaginemos uma caixa fechada e vedada. De uma das
extremidades desta caixa é emitido um pulso de luz, como mostra a fig. 2.29.
Quando a emissão ocorre, a caixa sofre um recuo devido à conservação de
momentum. Quando a radiação é reabsorvida no outro lado o momentum é removido da
caixa e novamente o sistema volta ao repouso. Durante o tempo de vôo do pulso de luz
dentro da caixa, esta sofreu um deslocamento ∆s. Como acreditamos que o centro de
massa não mudou de posição, devemos aceitar que o pulso de luz transferiu uma certa
quantidade de massa de um extremo para outro da caixa.
Fig. 2.29 - Sistema imaginado para obtenção da relação massa-energia.
56
Vamos calcular a quantidade de massa transferida pela luz, a fim de que o centro
de massa não seja alterado. Para simplificar o problema, vamos supor que metade da
massa da caixa está concentrada em cada extremo da mesma e, portanto, inicialmente
distantes L/2 do centro de massa. O pulso de luz, que apresenta massa zero, carrega um
momentum dado por Ppul = E/c, pois pela relação E2 = (pc)2 + (m0c2)2 com m0 = 0 e, sendo
E a energia correspondente do pulso. Vamos considerar que esta quantidade de energia
transferida corresponde a uma massa m. Antes de emitir a caixa tem massa M e após
M - m, e velocidade v. Do princípio de conservação de momentum:
Pcaixa = Ppulso
( M − m) =
E
c
de onde obtemos:
V=
E
E
=
( M − m)c Mc
já que M » m
O tempo de vôo da luz é da ordem de t = L/c e, assim, o deslocamento da caixa é
dado por:
∆s = vt ~
EL
Mc 2
Após a luz ser absorvida e a caixa deixar de mover-se, temos M/2 - m de massa à
esquerda e M/2 + m à direita. Como supusemos que o centro de massa não alterou, a
transferência de massa deve ter sido compensada pelo deslocamento de modo que:
M
 L
 M
 L

 − m  + ∆s  =  + m  − ∆s 
 2
 2
  2
 2

resolvendo, temos:
57
m=
M∆s M EL
=
→ E = mc 2
L
L Mc 2
Como vimos, a energia E = mc2 é associada à partícula existe uma quantidade de
massa de repouso mo, de modo que descontando a energia de repouso, o resto é energia
cinética. Assim:
 v2 
1
E cinética ~ m0 c 2 1 +  − m0 c 2 ≈ m0 v 2
2
 2c 
reduzindo-se à expressão já conhecida. Assim, para baixas velocidades podemos
escrever:
E=
1
m0 v 2 + m0 c 2
2
(e) Luz Propagando-se num Meio em Movimento: O Coeficiente de Arrastamento
A luz passando por um meio que tem índice de refração n, propaga-se com
velocidade c/n. Se o meio desloca-se com velocidade v paralelo à propagação da luz,
qual é a velocidade observada por um referencial fora do meio (Fig. 2.30), em repouso?
Fig. 2.30 - Luz propagando-se num meio em movimento
Usando adição de velocidades
Vx =
Vx' + v
vV
1 + 2x '
c
58
Sendo Vx' = c/n, temos:
Vx =
c / n + v c  vn 
v 
= 1 + 1 + 
vc
n
c  nc 
1+ 2
c n
−1
para v « c, vamos expandir o termo em parênteses e realizar a multiplicação, mantendo
até a primeira ordem:
Vx ~
c 
1 
+ 1 − 2 v
n  n 
Assim, temos o termo esperado, mais um termo de arrastamento devido ao
movimento do meio. O coeficiente f = 1 - 1/n2 é chamado de coeficiente de arraste de
Fresnel.
(f) Aberração Estelar
Utilizando-se as leis de composição de velocidade podemos calcular a aparente
mudança na direção quando um corpo estelar é observado. Vamos considerar como
referencial estacionário o sol (ref. S Fig. 2.31) e como referencial em movimento (S') a
Terra em seu movimento orbital. Seja uma estrela que para um observador em S esteja
inclinada a um ângulo θ com relação ao plano de órbita da Terra. Para um observador em
S' a inclinação é θ' que difere de θ por uma quantidade α.
Fig. 2.31 - Observação de uma estrela por observador em movimento.
Assim, θ = θ' + α. Para um observador em S, a luz chega a ele com as componentes.
59
Vx = - c cos θ
Vy = - c sen θ
enquanto para um observador em S', movimentando-se com velocidade v em S, as
componentes da velocidade da luz que chega são diferentes e daí a origem da aberração
ou mudança na direção de observação. Utilizando as equações para composição de
velocidades e podemos verificar obviamente que Vx’2 + Vy’2 = c2, não violando, desta
forma, o segundo postulado. Assim, o ângulo e' do qual a luz provém para S' é:
cos θ ' =
V x ' cos θ + v / c
=
v cos θ
c
1+
c
e, para v « c, temos:
v
cos θ ' ~ cos θ + sen 2θ
c
Como θ' = θ + α, temos cos θ' = cos θ cos α. E, sendo a pequeno temos cos α ~ 1 e
sen α ~ α:
v
cos θ + αsenθ = cos θ + sen 2θ
c
de onde obtemos:
α ~
v
senθ
c
que é o desvio causado pelo movimento.
Note que estamos tomando o movimento da Terra como uniforme num curto
período. Neste caso v ~ 30 Km/seg. o que leva a um α ~ 10-4 rad para sen θ = 1.
(g) Efeito Doppler Relativístico
O efeito Doppler relativístico é qualitativamente equivalente ao mesmo efeito
observado com som quando fonte e/ou observador estão em movimento. Neste caso,
60
devido ao movimento da fonte ou do observador, o comprimento de onda do fenômeno
ondulatório é alterado. A título de ilustração, antes de estudarmos o efeito Doppler
relativístico, consideremos uma fonte sonora em movimento com velocidade v, emitindo
ondas sonoras na freqüência υ 0 (freqüência para o observador no referencial de repouso
da fonte).
Em t = 0, a fonte emitiu um máximo da onda, o próximo será emitido em um tempo
τ após a primeira. E neste caso ela já não se encontra na posição da emissão da
primeira, pois a fonte se deslocou (u = velocidade da onda no meio, v velocidade da fonte,
fig. 2.32).
Fig. 2.32 - Efeito Doppler Sonoro.
Devido ao movimento da fonte, o comprimento de onda observado é alterado. Se a
fonte vai de encontro ao observador (e vice-versa) há uma aparente diminuição no
comprimento de onda observado. E no caso de afastamento fonte-observador, há um
aparente aumento do comprimento de onda.
Para o caso acima:
λ ' = uτ − vτ = (u − v )τ
como λ ' = u / υ ' , já que a velocidade de propagação da onda no meio não é alterada, e
τ = 1 / υ 0 , temos:
u u −v
=
v'
v0
61
ou seja:
v' =
1
v
1−
u
v0
Assim, devido ao movimento da fonte, o observador notará uma maior freqüência
(caso v > 0) ou no caso da fonte se afastando (v < 0) uma menor freqüência.
Após esta introdução preliminar, voltemos nossa atenção ao caso semelhante em
relatividade especial. Suponhamos uma fonte de radiação eletromagnética localizada na
origem de um sistema de referência S considerado estacionário e um observador em
repouso em S' que desloca-se com velocidade v em relação a S. Cada pulso emitido viaja
com velocidade c, e estes pulsos são emitidos periodicamente com período τ . Assim, em
t = O é emitido o primeiro pulso, em t = τ o segundo e assim sucessivamente, até t = n τ
quando é emitido o (n + 1) ézimo pulso.
Vamos analisar como esta situação é observada pelo observador em S'. Cada vez
que o pulso passa pelo observador, ele evidentemente o detecta. Se colocarmos num
diagrama t vs x o deslocamento do observador e de cada pulso emitido, cada vez que
houver cruzamento entre a propagação do pulso e a do observador é porque houve
detecção de um pulso (fig. 2.33).
Fig. 2.33 - Diagrama espaço-tempo para propagação da radiação e deslocamento do observador.
A pergunta que fazemos é: Qual é a periodicidade (ou frequência) que o
observador recebe os pulsos? Entre os pontos (x1, t1) e (x2, t2) o observador recebeu n
pulsos:
x1 = ct1 = x0 + vt1
62
x2 = c (t2 - n τ ) = x0 + vt2
e destas temos duas equações:
t 2 − t1 =
cnτ
c−v
e
x 2 − x1 =
vcnτ
c−v
Isto é observado por S. Se quisermos saber o observado por S', utilizamos as
transformações de Lorentz :
t 2 − t1 =
(t 2 − t1 ) − v(x 2 − x1 ) / c 2
1− v2 / c2
e substituindo os resultados obtidos temos:
t ' 2 −t '1 =
ncτ
 v2 
1 − 
(c − v ) 1 − v 2 / c 2  c 2 
Como este período refere-se à observação de n pulsos, temos que o período
observado em S' é:
τ '=
t ' 2 −t '1
n
cτ
 v2
1 − 2
τ '=
2
2 
(c − v ) 1 − v / c  c
expandindo
τ '= τ
1+ v / c
1− v / c
V '= v
1− v / c
1+ v / c
ou em termos de freqüências:



63
Assim, o efeito Doppler relativístico, segue qualitativamente o que já dissemos, com
modificações quantitativas causadas pelas restrições impostas pela relatividade especial.
(h) Colisão: Um Exemplo de Conservação Energia-Momentum
Vamos considerar, agora, um exemplo envolvendo conservação de energia e
momentum. Seja a colisão entre uma partícula de massa de repouso mo, energia Eo e
momentum Po com uma outra semelhante a esta, porém em repouso. Considerando que
as partículas emergirão da colisão com a mesma energia e momentum, pergunta-se:
"Qual será o ângulo de espalhamento θ (fig. 2.34)? ".
Fig. 2.34 - Colisão não frontal entre duas partículas de mesma massa de repouso que
emergem da colisão com iguais momento energia.
Tratando o caso onde as partículas emergem com mesmo p e E, a conservação de
momentum na direção y requer que os ângulos de espalhamentos sejam iguais, como
mostrado na figura acima. Conservação de energia e momentum nos permite escrever:
Po = 2p cos θ
Eo + moc2 = 2E
e como E2 - (pc)2 = (moc2)2 , a primeira equação fica:
E 02 − m02 c 4 = 2 E 2 − m02 c 4 cos θ
64
e substituindo nesta última equação E = (Eo + moc2) / 2, obtemos:
E −m c = 2
2
0
2
0
4
(E
0
)
+ m0 c 2
− m02 c 4 cos θ
2
de onde é possível eliminar θ :
cos θ =
E 0 + m0 c 2
E 0 + 3m0 c 2
No regime de baixas velocidades, Eo ~ moc2, de onde obtemos cos θ ~ (2)-1/2 ou
θ = 45°. Isto corresponde exatamente à situação não relativística já conhecida.
Um segundo exemplo é a colisão frontal entre duas partículas de massas de
repouso diferentes. Assim, seja uma partícula de massa mo, energia Eo e momentum p0,
que colide frontalmente com uma segunda partícula de massa Mo, em repouso. Após a
colisão, a primeira partícula emerge com (p1, E1) e a segunda com (p2, E2). Conhecendo
(po, Eo), queremos determinar a situação pós colisão (fig. 2.35).
Fig. 2.35 - Situação pós colisão.
Pela observação de momentum e energia,
po = p1 + p2
Eo + Moc2 = E1 + E2
A equação relativa à conservação de energia pode ser convertida em:
E 0 + M 0 c 2 = P12 c 2 + m02 c 4 + P22 c 2 + M 02 c 4
65
onde usamos a relação momentum-energia. Substituindo p1 = po - p2, temos:
E0 + M 0 c 2 −
p 22 c 2 + M 02 c 4 =
( p 0 − p 2 )2 c 2 + m02 c 4
que quadrando resulta em:
(E
0
+ M 0c 2
)
2
(
+ p 22 c 2 + M 02 c 4 − 2 E0 + M 0 c 2
)(
)
p 22 c 2 + M 02 c 4 = ( p0 − p 2 ) c 2 + m02 c 4
2
Usando Eo2 = (poc)2 + (moc2)2 e desenvolvendo o primeiro termo obtemos:
(
2 E0 M 0 c 2 + 2M 02 c 4 − 2 E 0 M 0 c 2
)
p 22 c 2 + M 02 c 4 = −2 p0 p 2 c 2
que é equivalente à:
(
2 E0 M 0 c 2 + 2M 02 c 4 + 2 p 0 p 2 c 2 = 2 E 0 + M 0 c 4
)
p 2 c 2 + M 02 c 4
que pode ser novamente quadrada e após eliminarmos p2, obtemos:
(
)
p2 =
2 p0 M 0 c 2 E0 + M 0 c 2
2 M 0 c 2 E0 + M 02 c 4 + m02 c 4
p1 =
P0 m02 − M 02 c 4
2 M 0 C 2 E0 + M 02 C 4 + m02 c 4
e, conseqüentemente:
(
)
Um caso particular de interesse é quando mo = Mo, onde teremos p1 = 0 e p2 = po,
mostrando que neste caso a partícula 1 fica em repouso cedendo totalmente seu
momentum para 2.
No limite de baixas energias, Eo ~ moc2, as expressões acima resultam em:
66
 2M 0
p 2 = p 0 
 m0 + M 0



 m − M0
p1 = p 0  0
 m0 + M 0



que corresponde ao resultado esperado no caso não relativístico.
(i) Colisão Fóton – Átomo
Vamos considerar a colisão entre uma partícula de massa zero (o fóton) com uma
partícula massiva (o átomo). Seja Mo a massa atômica e Eo a energia do fóton.
Imaginando o átomo inicialmente em repouso, queremos determinar a velocidade
adquirida pelo átomo devido à absorção.
Antes e após a absorção a energia se conserva, de modo que:
E = Eo + Moc2
Se uma partícula tem momentum p e velocidade v, vale a relação:
pc2 = mvc2 = mc2v = vE
ou
pc2 = vE
Como o momentum do átomo após a colisão será o mesmo que o do fóton antes da
colisão, já que o momentum se conserva, P = Pfóton =
E0
c
escrever:
(
E0 2
.c = v E 0 + M 0 c 2
c
)
, e como E = Eo + Moc2, podemos
67
ou seja, a velocidade adquirida pelo átomo após absorção é:
v=
E0 c
E0 + M 0 c 2
normalmente denominada de velocidade de recuo durante a absorção.
O processo de absorção também está acompanhado de uma variação de massa,
causada pela porção de energia transferida. Assim, é natural perguntarmos qual é a nova
massa do átomo após a absorção?
Para o átomo, a nova massa de repouso será M.
E2 = p2c2 + M2c4
e p=
E0
, E = Eo + Moc2
c
substituindo E e p na relação energia-momentum, tiramos:
(Eo + Moc2)2 = Eo2 + M2 C4
de modo que:
M =
2 E 0 M 0 c 2 + M 02 c 4
c4
ou
M = M 0 1+
2 E0
M 0c 2
Mostrando que a massa de repouso do átomo sofre variação.
(j) Breve Análise do Movimento Uniformemente Acelerado
Vamos brevemente analisar como o movimento acelerado é visto em outros
referenciais inerciais. Note que os referenciais continuam não acelerados e, portanto, a
relatividade especial continua válida. Consideremos um corpo uniformemente acelerado
68
no referencial S' que se move com velocidade v relativo a S. Para um observador em S', a
equação horária deste corpo acelerado é dada por:
x' =
1
a' t ' 2
2
Para encontrarmos a posição como função do tempo para o observador no
referencial S, vamos utilizar a transformada de Lorentz:
x − vt
x' =
1− v2 / c2
v
x
c2
t' =
1− v2 / c2
e substituindo acima fornece:
(
)
v
1 t − c2 x
x − vt = a '
2 1− v2 / c2
2
Note que embora o movimento seja acelerado, os referenciais ainda são inerciais.
A equação acima é quadrática em t e x, podendo ser facilmente resolvida, fornecendo:
c2
x=
a ' γβ 2
2
 a ' γβ t

2a ' γβ 2  a ' γt 2
 a ' γβt 
1 +

− 1 +
+ β ct 
 −
c
c 
c 2  2




onde
γ =
(
Usando a relação γ 2 = 1 − β 2
1
1− v / c
2
2
e
β=
v
c
)
, a expressão anterior é reduzida a:
x=
c2
a ' γβ 2
−1 / 2
 a ' γβ t
2a ' β
− 1−
1 +
c
cγ


t

69
que representa a equação horária de um movimento uniformemente acelerado (num
referencial S'), visto num outro referencial S.
Se considerarmos que para pequenos tempos a velocidade do corpo ainda não
cresceu muito, podemos expandir a equação acima e obtemos:
x=

c 2  a ' γβ t  a ' β
a' 2 β 2 2

t
t + ... 
1
+
−
1
+
−

2
2 2

c
cγ
a ' γβ 
2c γ


e considerando somente termos até Segunda ordem em t,
x = βct +
1 a' 2
t + ...
2γ3
Assim, para tempos curtos, a aceleração medida em S é dada por:
a=
(1 − v
a'
2
/ c2
)
−3 / 2
Como exemplo, analise o movimento de queda livre visto por um balão que sobe (ou
desce) com velocidade constante v em relação a terra. Verifique diferenças que seriam
observadas nos tempos de queda.
(II.6) A Relação Força e Aceleração
Da mecânica de Newton, aprendemos que força e aceleração são paralelas.
F =m
dv
= ma
dt
Queremos examinar esta relação do ponto de vista relativístico, onde momentum
tem agora uma nova definição. É importante lembrar que como em relatividade os
componentes de velocidades estão independentes, suas variações também farão o que
pode causar, do ponto de vista vetorial, consideráveis alterações na dependência forçaaceleração.
70
Iniciamos com a expressão:
F=
dp
dt
de modo que:
F = m0
d 
v
dt  1 − v 2 c 2



1
 = m0 d v + m v d 
0
2

dt  1 − v 2 c 2
1 − vc 2 dt






Para a última derivada temos:
d 
1
dt  1 − v 2 c 2

  v2
 = 1 −
  c 2




−3 / 2
v dv
c 2 dt
Assim,
F=
M0
1− v
2
c2
 v2
dv
+ vM 0 1 − 2
dt
 c



−3 / 2
v dv
c 2 dt
Para facilitar nossa análise, vamos calcular o produto F .v :
m0 v dv m0 v 3
F .v =
+ 2
2
c
1 − v 2 dt
c
 v2
1 − 2
 c



−3 / 2
 v2 
mo v1 − 2 
 c 
3
2
dv m0 v(1 − v c 2 ) + m0 v / c dv
=
dt
dt
(1 − v2 c2 )3 / 2
2
−3 / 2
dv
dt
d 
1
Assim podemos identificar rapidamente que uma maneira de escrever

dt 1 − v 2 c 2

d 
1
dt  1 − v 2 c 2


 = F .v
 m0 c 2


 é:


71
Como a definição de aceleração é a ≡
F=
dv
, temos que:
dt
m0
1− v
2
c2
v v
a +  F. 
c  c 
ou seja:
a=
1− v
2
m0
c2

v  v 
 F −  F . 
c  c 

mostrando claramente que, relativisticamente, aceleração e força não são paralelas, ao
contrário da mecânica newtoniana. É claro que este efeito é considerável a altíssimas
velocidades já que o desvio do paralelismo entre a e F é proporcinal a
( vc )2 .
Esta quebra do paralelismo entre aceleração e força é consequência direta do fato
que nenhuma velocidade pode exceder c e do fato que a velocidade depende de todos os
componentes espaciais, não somente da direção da força.
→ Caso F ⊥ v , então a // F . Neste caso a força é incapaz de variar o módulo de v ,
somente sua direção, como já conhecido.
(II.7) Relatividade Especial e o Eletromagnetismo
Uma das áreas da Física onde a relatividade tem o maior impacto é o
eletromagnetismo. Se considerarmos que a carga elétrica é invariante sob transformação
de Lorentz é possível, a partir da lei de Coulomb, obter as leis básicas do
eletromagnetismo.
Assim, por exemplo, imaginemos duas cargas q1 e q2 movendo-se com velocidade
v paralelamente a x. No referencial em repouso (S), existirá uma força magnética entre
elas. Já no referencial S', que desloca-se com v, não haverá forçamagnética; porém,
haverá uma força entre elas de natureza elétrica. Deste exemplo vemos que do ponto de
vista relativístico o campo elétrico e magnético não existem como entidades separadas,
mas sim são combinados como um único conceito em eletromagnetismo.
72
Normalmente em eletromagnetismo é importante conhecermos densidade de carga
e corrente. Desta forma verificar como estas quantidades se transformam é essencial, já
que elas são as fontes de campos.
Consideremos um condutor de secção transversal Ao e comprimento lo contendo N
elétrons e localizado paralelo ao eixo x' no referencial S' que desloca-se com v em relação
a S. A densidade de carga é ρ = Ne / Ao lo e a densidade de corrente é jo = 0, pois as
cargas não se movimentam neste referencial (Fig. 2.36).
Fig. 2.36 - Condutor observado de dois referenciais.
Observemos a situação por S com relação ao qual o condutor carregado deslocase com v. Neste referencial o comprimento do condutor é I = lo (1-v/c)2)1/2 enquanto a
secção transversal permanece inalterada. Como a carga não muda, a nova densidade de
carga é dada por:
ρ=
Ne
A0 10 1 − v 2 / c 2
ρ=
a densidade de corrente será j = ρ v. Portanto:
j=
ρ0
1− v2 / c2
ρ 0v
1− v2 / c2
Um tratamento mais geral, no caso das cargas estarem movendo-se também no
referencial S', leva às seguintes transformações:
73
j' x =
j x − ρv
1− v2 / c2
j' y = j y
e
j' z = j z
ρ'=
ρ − vj x / c 2
1− v2 / c2
onde jx, jy, jz e p são observados por S, enquanto que j'x, j'y, j'z e p' são observados por S'.
Como um exemplo das transformações acima, consideremos um condutor que
conduz corrente e está em repouso em relação a S. Neste caso, as cargas negativas
deslocam-se (elétrons) em relação a S com velocidade u, enquanto que as cargas
positivas estão em repouso. A densidade de carga neste referencial é:
ρ= ρ++ ρ =0
pois ρ + = Ne e ρ = -Ne.
A densidade de corrente é jx = j+ + j = ρ + . 0 + ρ
-
u = ρ - u. Pelo fato que a
densidade de carga é nula, não haverá observação de campo elétrico. Contudo, haverá
um campo magnético devido a movimentação das cargas negativas. Vamos agora
observar este condutor de um outro referencial S' que desloca-se com v com relação a S,
como mostra a figo 2.37.
Fig. 2.37
74
Visto por S' a densidade de carga será:
ρ ' = ρ '+ + ρ ' =
ρ + − vj x+ / c 2
1− v2 / c2
+
ρ − − vj x− / c 2
1− v2 / c2
como ρ + = Ne e ρ - = -Ne, j+x = 0 e j-x = ρ -u, da transformação anterior tiramos que:
ρ'=
Nevu / c 2
1− v2 / c2
de modo que observado pelo referencial S' o condutor não é neutro, apresentando carga
positiva, e consequentemente observa-se um campo elétrico em S'. Da mesma forma,
j'x ~ 0 e um campo magnético também é observado em S'. Este exemplo demonstra de
forma clara nossa frase inicial de que pela relatividade especial, eletricidade e
magnetismo devem ser considerados como sendo um único conceito, dependendo
apenas do referencial.
(II.8) - Breve Introdução à Teoria da Relatividade Geral
Após entendermos as principais considerações da teoria da relatividade restrita,
ficamos convencidos que nada pode viajar com velocidade superior à velocidade da luz
no vácuo. Isto cria certos problemas, um dos quais está associado à lei da Gravitação.
Segundo essa lei, F = GmgM/r2, onde r é a distância entre as massas. A pergunta é: se eu
destruísse uma das massas instantaneamente, será que a Segunda massa perceberia
instantaneamente? Ou esta reação à distância demoraria certo tempo?
Outro ponto importante é que na mecânica de Newton, a massa inercial (F = mi a) e
a massa gravitacional mg são sempre consideradas idênticas, fato que merece uma
explicação mais fundamental. Além destas questões, o problema de referenciais não
inerciais, não incluídos na relatividade especial, merecem ser considerados. Embebido
em todas estas questões, Einstein (1916) formulou a teoria da relatividade geral, na qual o
princípio da equivalência é seu resultado mais significativo.
Da mesma maneira que a relatividade especial foi fortemente motivada por
experimentos como o de Michelson-Morley, a relatividade geral também teve seus 76
passos iniciais motivados no experimento de Eotvos (1922), que tinha como propósito
75
demonstrar a equivalência entre massa inercial e massa gravitacional. Quando uma força
age sobre um corpo, ela o faz sobre a massa inercial (mi). Já a gravidade age sobre a
massa gravitacional. Assim, sejam dois corpos em queda sob a ação da gravidade,
adquirindo acelerações a1 e a2:
GM
r2
GM
mi 2 a 2 = m g 2 2
r
mi1 a1 = m g1
ou dividindo as equações:
mi1 a1 mi 2
=
m g1 a 2 m g 2
Assim, se a1 / a2 = 1 ficaria provada a equivalência entre a massa inercial e gravitacional.
O experimento mais decisivo nesta equivalência foi feito em 1922 por R.V. Eotuos. Em
seu experimento um pêndulo colocado na superfície da Terra verticalmente sem oscilação
fica sujeito a duas forças, a gravitacional e a centrífuga (Fig. 2.38). O pêndulo localiza-se
ao longo da resultante R. A força centrífuga age na massa inercial enquanto a
gravitacional em mg.
Fig. 2.38 - o ângulo entre o pêndulo e a direção do centro da terra é função de mi/mg.
A a resultante não está na direção do centro da Terra, mas fazendo um certo
ângulo θ com esta, de modo que (veja detalhe no diagrama da fig. 2.38).
mi ω 2 re mi  ω 2

tan θ =
=
mg g
m g  g

re

76
Variando a latitude, pode-se observar a variação de θ. Os experimentos realizados
mostraram que se houver diferenças entre mi e mg, esta é menor que 10-8. Experimentos
mais recentes chegam a 10-10. Com estes resultados, Einstein enunciou o chamado
Princípio da Equivalência:
"Os efeitos produzidos pelo campo gravitacional são idênticos aos produzidos por
aceleração. E não há maneiras de distinguir um do outro, eles são completamente
equivalentes".
Isto equivale dizer que se tivermos num sistema de referência onde há um campo
gravitacional e não há aceleração e um segundo onde não há campo gravitacional, mas
há aceleração, com respeito ao primeiro. Apesar do primeiro ser um referencial inercial
(pois não há aceleração) e o segundo não ser inercial, eles são fisicamente idênticos. Ou
seja, experimentos realizados em situações equivalentes nestes dois referenciais levarão
a resultados idênticos (situação equivalente significa a = g). Ou ainda, sistemas
acelerados ou em campos gravitacionais são equivalentes. De acordo com Einstein, isto
mostra que não há sistema de referência acelerado que seja absoluto. O movimento em
qualquer sistema acelerado também é relativo.
Vamos agora analisar algumas situações em relatividade geral. A primeira delas é
o chamado deslocamento gravitacional para o vermelho das linhas espectrais (ou relógios
em campos gravitacionais). Considere dois observadores E e R, separados por uma
distância d num referencial na presença de um campo gravitacional uniforme g (Fig. 2.39).
Fig. 2.39 - o sistema de referência na presença de um campo gravitacional é equivalente ao sistema
movendo com a = -g.
77
Uma situação equivalente é criada num segundo sistema de referência Si que não
tem campo gravitacional, mas move-se com uma aceleração a = -g. O princípio da
equivalência afirma que ambos referenciais são equivalentes. Suponha que tenhamos um
átomo localizado na posição E e que emita um fóton de seqüência υ o . Estando no campo
gravitacional (Sg), queremos saber qual é a freqüência detectada pelo receptor R. Como
pelo princípio da equivalência esta situação é análoga ao referencial acelerado a = -g,
vamos analisar a situação neste caso. Considerando que ambos referenciais estavam em
repouso em t = 0, quando o sinal foi emitido, o tempo para atingir R é t = d/c. Neste
tempo, ambos os observadores (E, R) adquirem uma velocidade v = gd/c e, portanto, no
instante que o sinal chega ao receptor ele afasta-se com velocidade v = gd/c e, portanto,
observa o sinal defasado para o vermelho.Utilizando nosso conhecimento do efeito
Doppler, a freqüência observada é dada por: v = v0
1− v / c
, expandindo esta expressão,
1+ v / c
temos:
3


v = v0 1 − β + β 2 + ... 
4


em primeira ordem:
 gd 
v ≅ v 0 1 − 2 
c 

Assim, podemos concluir que quando a luz caminha contrária ao campo
gravitacional ela fica mais vermelha. Isto pode ser pensado como a luz perdendo energia
quando propaga-se contra o campo gravitacional. É claro que se invertemos o receptor
com o emissor, a luz agora propaga-se no sentido da gravidade e o deslocamento será o
azul. Em 1960 este fato foi confirmado experimentalmente e obteve-se:
∆Vexp
∆Vteor
= 1.05 ± 0.01
Se pulsos são emitidos periodicamente como se fosse um relógio, o período
variaria com a altitude ( T ~ 1 / υ ):
78
 hd 
T (h ) ≅ T0 1 + 2 
c 

mostrando que relógios colocados em campo gravitacional passam a andar mais devagar
de acordo com sua altitude.
Uma
maneira
diferente
de
obter
este
mesmo
resultado
(embora
não
completamente correta) é imaginar o fóton de luz como tendo massa h υ 0 = m c2, ou seja
m = h υ 0 / c2. Portanto, ao escalar um campo g, a energia perdida seria mgd:
hv = hv0 −
hv0
gd
c2
ou
 gd 
v = v0 1 − 2 
 c 
Utilizando-se argumentos semelhantes, pode-se calcular a deflexão da luz por
grandes campos gravitacionais. Supondo que o fóton tem massa m, possui um parâmetro
de impacto s e o corpo massivo apresenta massa M. Com isso, podemos calcular o
ângulo (Fig. 2.40):
Fig. 2.40 - Deflexão da luz por um corpo massivo.
Da teoria de espalhamento temos:
tg
θ
2
=
GMm GM
= 2
msv 02
sv0
79
Substituindo v0 por c temos que:
tg
θ
2
=
GM
sc 2
II.9 - Exercícios
1) Imagine um experimento onde uma partícula é acelerada por uma força cuja amplitude
aumenta no tempo na forma F = 106t (em unidades CGS).
a) calcule o tempo necessário para v = 0.5c
b) repita o item "a", considerando m = mo / (1-v2/c2)1/2
c) discuta a diferença entre os resultados
2) No experimento de Michelson-Morley o comprimento de cada braço é de 11 m e a luz
de Sódio λ = 5.9 10-7 foi utilizada. Se o sistema tem sensibilidade para uma variação de
0.005 franjas, qual é o limite na determinação da velocidade da Terra através do suposto
"éter"?
3) O experimento de Michelson-Morley é considerado "um experimento de Segunda
ordem", porque o efeito depende de (v/c)2. Vamos considerar o seguinte experimento de
primeira ordem. Em t = 0 um observador em A envia um sinal para um observador em B,
a uma distância L de A. B marca o tempo de chegada. Supondo que o sistema move-se
através de um éter com velocidade v, como mostrado na figura abaixo:
Considere que o laboratório é agora rodado de 180° e o experimento é repetido. Mostre
que a diferença das medidas de tempo em ambas situações é:
∆t ≅
21 v
c c
80
Discuta uma possível situação onde este efeito possa ser observado. Aplique para o caso
de um experimento realizado na Terra e verifique a viabilidade de medida.
4) Um observador na Terra mede o comprimento de uma nave espacial como sendo
metade do comprimento próprio da nave. Qual é a velocidade desta nave?
5) Um avião move-se a 1000 m/s sobre a superfície da Terra. Determine em quanto
tempo um relógio no avião levará para ficar 2 seg. atrasados com respeito a um relógio na
Terra.
6) Um átomo radioativo decai em 2 µs. Qual será o tempo de decaimento quando medido
por um observador no laboratório com relação ao qual o átomo desloca-se com 0.8 c?
7) Para um observador 0 dois eventos ocorrem separados de 3.6 108 m num intervalo de
tempo de 2 seg. Qual seria o tempo próprio para a ocorrência destes dois eventos?
8) Um foguete viaja com velocidade 2.4 108 m/s. O relógio do astronauta e o da base
foram sincronizados (t = t' = 0 em x = x' = 0). Se o astronauta observa um relógio na base
através de um telescópio. Qual tempo ele observará na base quando seu próprio relógio
30 seg.? O que ele observa no seu próprio relógio quando o da base marca 30 seg.?
9) Mostre que a equação de onda eletromagnética é invariante sob a transformação de
Lorentz.
∇2 E −
1 ∂2 E
=0
c 2 ∂t 2
10) Uma partícula instável com tempo de vida média de 4 µs é produzida num acelerador
e projetada com velocidade 0.6c. Qual será seu tempo de vida medido no laboratório?
Qual é a distância média que a partícula percorrerá no laboratório antes de desintegrar?
11) Um "metro" move-se ao longo do eixo x com velocidade 0.6 c. O ponto médio do
metro passa por um observador em repouso em t = 0. Determinado pelo observador, onde
estão as extremidades do metro no instante da medida?
81
12) Dois eventos que ocorrem no mesmo lugar do espaço e estão separados de 4 seg.,
medidos por um observador. Se um segundo observador mede um intervalo de 5 seg.
entre os eventos, qual é a separação espacial destes eventos para este segundo
observador?
13) Uma partícula move-se com velocidade 0.8 c fazendo um ângulo de 30° com o eixo x,
determinado no referencial S. Qual será a velocidade da partícula quando observada por
um observador movendo-se com -0.6 c ao longo do eixo x - x'?
14) Calcule o momentum de um elétron com q Mev de energia.
15) Qual é a máxima velocidade que uma partícula pode ter, de modo que sua energia
calculada por mv2/2 não apresente erro superior a 0.5 %?
16) Duas partículas idênticas de massa de repouso mo, colidem frontalmente cada uma
tendo velocidade u. A colisão é perfeitamente inelástica formando um corpo compacto.
Determine a massa de repouso deste corpo composto. Compare o valor obtido com 2 mo.
17) Uma partícula de massa de repouso mo e velocidade 0.8 c faz uma colisão
completamente inelástica com outra de massa 3 mo e inicialmente em repouso. Qual é a
massa de repouso e a velocidade da partícula resultante?
18) Uma estrela afasta-se da Terra com velocidade 0.005 c. Qual é o deslocamento
Doppler para a linha D2 do Sódio (5890 Ao)?
19) Neste exercício faremos uma estimativa da massa de um Buraco Negro. Suponha que
a densidade do Buraco Negro é idêntica à do Sol. Assim, qual deve ser seu raio (e
consequentemente sua massa) para que a luz não possa escapar da sua atração
gravitacional? Dica: Suponha que a velocidade de escape é c.
Universidade de São Paulo
Instituto de Física de São Carlos
Departamento de Física e Ciência dos Materiais
FÍSICA MODERNA ELEMENTAR
CAPÍTULO III
INTRODUÇÃO À ATOMÍSTICA
Autores:
Prof. Vanderlei Salvador Bagnato
Prof. Luís Gustavo Marcassa
São Carlos
Maio 1999
2
CAPÍTULO III
INTRODUÇÃO À ATOMÍSTICA
III.1 - Introdução:
A hipótese que toda matéria é constituída de porções denominadas de átomos teve
sua origem na Grécia antiga, e sua introdução na ciência moderna ocorreu inicialmente na
química por Dalton através de duas leis básicas bastante aplicadas nas reações químicas.
O fato que em qualquer reação química os elementos combinam-se em proporções bem
definidas suporta muito bem a hipótese de que a matéria é constituída de átomos. Coube
à química, de um modo geral, introduzir de forma clara e definida o conceito e a
diferenciação entre elemento e molécula.
A hipótese de Avogadro de que um determinado volume de gás, nas mesmas
condições de temperatura e pressão, sempre continha o mesmo número de constituintes
dava pela primeira vez uma forma para se medir a massa ou tamanho do átomo. Numa
quantidade de matéria chamada MOL, existe um número fixo de constituintes No = 6.0225
x 1023. Este número é de extrema importância em atomística, pois determina a "escala"
que conecta o mundo atômico ao mundo macroscópico. A determinação do número de
Avogadro, através de várias técnicas diferentes, chegando-se ao mesmo resultado, foi
fundamental para o início da atomística, pois comprovou algumas hipóteses básicas sobre
a constituição da matéria.
As evidências de que tudo na natureza tem uma constituição atômica não
restringiram-se somente aos fatos propostos e observados pelos químicos, naturalmente.
Diversos experimentos, tais como o de Rutherford e o de Geiger, foram fundamentais
para o desenvolvimento e estabelecimento deste novo aspecto da constituição da
matéria, bem como sua composição e propriedades.
Neste capítulo pretendemos descrever alguns experimentos históricos na área, os
quais não somente foram importantes para revelar a natureza atômica da matéria e de
seus subconstituintes, mas também pela interessante metodologia utilizada. Após uma
breve apresentação destes experimentos, discutiremos em maior detalhe a teoria cinética
dos gases que nos permitirá conectar, ou construir, a partir dos constituintes
microscópicos básicos do gás, as propriedades macroscópicas utilizadas. Discutiremos
em detalhes os sucessos e fracassos da teoria atomística clássica, nascida no século
3
anterior, e as necessidades de inová-la para explicação de outros fenômenos. Por fim,
aplicaremos a teoria cinética dos gases para explicar alguns fenômenos de transporte
observados em gases, líquidos ou mesmo sólidos. Este é um importante capítulo da
Física Moderna, pois graças ao estabelecimento da constituição atômica da matéria é que
acelerou o desenvolvimento tecnológico que assistimos as conseqüências hoje em dia.
III.2 - Método de Perrin para Determinação do Número de Avogadro (No)
Começaremos nosso estudo de atomística discutindo a constante de Avogadro,
cujo valor é de extrema importância e de difícil determinação. Como já dissemos, o
conhecimento de No significa conectar o mundo microscópico com o macroscópico,
dando-nos a chance de imaginar e estimar o tamanho e massa de cada constituinte da
matéria.
De um modo geral, toda relação que envolve o número de Avogadro fornece uma
forma de medi-Ia. Caso o volume de uma molécula vA pudesse ser determinado, o
número No poderia ser obtido da relação:
Va = NovA
onde VA é o volume de um mol e vA o volume de cada molécula. Semelhantemente, se a
massa de uma molécula individual puder ser determinada, MA = NomA, também
possibilitará o cálculo e determinação de No. Em 1865 Laschmidt seguiu esta linha de
pensamento para determinar No baseado em alguns aspectos da teoria cinética dos
gases que veremos mais adiante.
Vamos aqui nos ater à medida de No baseando-se na medida massa elementar.
Neste caso, a dificuldade na medida da massa molecular advém do fato que a molécula é
muito pequena. Perrin idealizou um método para determinação de No baseado em
"pseudomoléculas", grandes o bastante para serem medidas e pequenas o suficiente para
comportarem-se como moléculas. Vamos brevemente descrever seu método.
Considere inicialmente um gás a uma temperatura T, na presença de um campo
gravitacional da terra. Para movimentarmos um volume V deste gás através de uma
diferença de pressão dp, será necessário à realização de um trabalho dw, de tal forma
que:
4
dW = dF .dz =
dF
Adz = Vdp
A
Se o gás está em equilíbrio, no campo gravitacional, este trabalho é realizado às
custas da energia potencial gravitacional Mgdz, onde M é a massa de gás contida no
volume V, a ser deslocado de dz. Assim, a condição de equilíbrio requer que
Mgdz + Vdp = 0
Outra forma de obter esta equação é através da análise de uma camada de espessura dz
do gás. Para que esta camada se sustente é preciso que uma variação de pressão dp
compense a gravidade, ou seja:
- Mg = Adp
como a pressão varia com z, de modo que uma variação dp corresponde a uma variação
de altitude de dZ,
dp =
dp
dz ;
dz
- Mgdz = Adzdp
mas Adz = V e, finalmente, temos:
Mgdz + Vdp = 0
Como estamos tratando de um suposto gás ideal pV = nRT (como veremos mais
adiante), sendo n o número de moles em V. Substituindo na equação acima V =
tiramos que:
Mgdz + nRT
ou
dp
=0
p
nRT
,
p
5
Mg
dp
dz = − RT
n
p
Se a pressão P varia de Po a P quando a posição varia de Zo a z, integramos
Mg
n
Como
∫
z
z0
dz = − RT ∫
p
p0
dp
p
(3)
M
= M A é a massa molecular do gás em questão, a integral acima fornece:
n
P = P0 e −[M A g ( z − z0 ) / RT ]
como à temperatura constante a pressão é proporcional à densidade, pois P = densidade
x constante temos, portanto:
ρ ( z ) = ρ 0 −[M
Ag
( z − z0 ) / RT ]
Esta equação mostra que a determinação da temperatura e do perfil de densidade
de um gás no campo gravitacional permite determinar a massa molecular (Mol) MA. Para
determinarmos No resta ainda determinarmos mA e, assim
MA
= N0 .
mA
Perrin usou o fato que pequenas partículas suspensas num líquido comportam-se
como as moléculas de um gás apresentando um movimento aleatório e desordenado,
com a vantagem de que tais partículas poderiam ser pesadas individualmente.
6
Através da preparação de uma emulsão de partículas de látex aproximadamente
uniforme, Perrin determinou seu tamanho e peso, estabelecendo desta forma mA. Em
seguida, utilizando um microscópio, Perrin determinou a distribuição de partículas em
várias posições de emulsão colocadas no campo gravitacional. E após fazer uma
correção, devido à força feita pelo fluído sobre as partículas, a distribuição mostrou-se em
concordância com a lei exponencial acima, de onde foi possível obter o valor de MA. O
valor de No determinado por Perrin foi de 6,8 x 1023, que é um resultado bastante bom
considerando-se as condições em que o experimento foi realizado. Este valor nos dá uma
boa ordem de grandeza da dimensão atômica, cerca de 10-23 do mundo macroscópio, em
termos de massa ou volume. Portanto, aproximadamente 10-8 em dimensão linear.
A contribuição de Perrin não parou na determinação do número de Avogadro.
Inúmeros estudos envolvendo o chamado movimento Browniano permitiram a Perrin
demonstrar a existência dos átomos e receber o Prêmio Nobel de Física em 1926.
No movimento Browniano (descoberto em 1827, pelo botânico Brown), partículas
pequenas situadas num líquido, ficam animadas de um movimento desordenado,
interminável. Perrin conseguiu associar este movimento com existência de átomos no
líquido e de sua interação com as partículas sólidas observadas. O movimento Browniano
será visto em detalhes, mais adiante no curso.
III.3 - Constituintes Atômicos: A Descoberta do Elétron
J. J. Thomson (1856 - 1940)
A hipótese atomística da matéria culminou com a determinação dos constituintes
do átomo e a de algumas de suas propriedades básicas.
Uma das interessantes descobertas no final do século passado foram os raios
catódicos provenientes do cátodo (polo -) migrando para polo positivo (ânodo) durante
7
descargas elétricas em gases a baixas pressões. Neste tipo de descarga utiliza-se uma
ampola evacuada onde estabelece-se uma diferença de potencial entre o cátodo e o
ânodo (ver fig.1) de alguns milhares de Volts. Observa-se, na região da ampola à frente
do cátodo, uma luminosidade esverdeada no vidro. Se o caminho do cátodo é obstruído a
luminosidade desaparece. Dai a associação do efeito com os "raios" provenientes do
cátodo, de onde provém o nome raios catódicos.
Crookes, em 1879, fez uma série de experimentos com raios catódicos
determinando grande parte de suas propriedades básicas, incluindo sua constituição,
através da deflexão de tais raios quando na presença de um campo magnético, etc.
Fig. 1 - Sistema para produção de raios catódicos
Em 1897 o físico inglês J. Thompson realizou vários experimentos com raios
catódicos, determinando que tais raios eram constituídos de partículas com cargas
negativas. Além disto, Thompson realizou um importante experimento de deflexão destes
raios por campos elétricos e magnéticos que determinou a relação carga/massa destas
partículas. Chamemos de q a carga destas partículas e vamos estudar sua deflexão por
campos.
O experimento que vamos descrever consiste em fazer o feixe de raios catódicos
de uma ampola de Crookes passar através de campos elétricos e/ou magnéticos, de
modo que através da deflexão do feixe pela ação dos campos, possamos determinar a
constituição do feixe. Assim, considere o arranjo mostrado na fig. 2 onde o feixe catódico
passa pelo interior de um capacitor de placas paralelas.
8
Fig. 2 - Deflexão de feixe de partículas por campo elétrico.
Quando o feixe de partículas negativas penetra no interior do capacitor de
comprimento b, cujo campo elétrico é E , estas partículas são defletidas pelo campo num
processo envolvendo aceleração constante. O campo atuará sobre tais partículas
enquanto elas permanecem no interior do capacitor. Após isto, seu movimento continua
retilíneo e uniforme até atingir a tela da ampola. Nesta parte final da ampola existe uma
camada de um material fluorescente que revela a posição de impacto do feixe, permitindo
assim observar o efeito dos campos sobre o feixe.
Para o movimento no interior do capacitor, sendo vox a velocidade inicial das
partículas do feixe (suposto na direção x), e q sua carga. A aceleração na direção y (do
campo) será:
ay =
Eq
m
(5)
de modo que a posição vertical da partícula passa a depender do tempo segundo:
y=
1
ayt 2
2
e sua posição horizontal
x = vox t
Da combinação destas equações tiramos a trajetória parabólica do feixe:
(6)
9
y(x ) =
1 Eq x 2
2 m v ox2
No ponto x = b (final das placas e, portanto, de atuação do campo), a inclinação da
trajetória é:
 Eq x
 dy 
  = 
2
 dx  x −b  m vox

Eqb
 =
2
 x =b mvox
(7)
e como x = b representa o final do campo elétrico, a partir deste ponto as partículas
continuarão numa trajetória linear cuja inclinação é dada por esta última relação. Na
posição onde o campo elétrico deixa de atuar, o deslocamento vertical vale:
y (b ) =
1 Eq b 2
2 m vox2
(8)
Considerando que a partir deste ponto temos uma trajetória retilínea, vamos supor
que para x > b:
y(x) = ax - β
de modo que temos y = 0 em x =
Para determinarmos
ponto y(b) acima, tiramos
(9)
β
a
β
Eqb
 dy 
, sabemos que α =   =
(inclinação) e usando o
2
α
 dx  b mvox
β b
= . Assim, a extensão da trajetória retilínea da partícula,
α 2
após o capacitor, cruza o eixo x em x =
b
.
2
Com isto, a equação da trajetória após passar pelo capacitor é:
y(x ) =
Eq b 
b
x− 
2 
m vox 
2
(10)
10
válida somente para x > b. Deste modo, o ponto onde tal feixe chegará na tela (final da
ampola) posicionada em x = L é
y (L ) =
Eq b 
b
L− 
2 
m v ox 
2
(11)
que quase determina a relação q/m, exceto pelo não conhecimento da velocidade inicial
vox.
Para determinarmos vox, superpomos ao sistema um campo magnético na direção
de z, perpendicular ao esquema da figura 2. Este campo magnético agirá sobre a carga
quando esta desloca-se com vox produzindo uma força magnética exatamente oposta à
força elétrica (ver figura 3). Assim, podemos continuamente aumentar este campo
(através do aumento na corrente da bobina geradora), até que a força elétrica é
completamente compensada pela magnética. (Neste ponto Fmg=FeL).
A força magnética sobre q é dada por:
Fmg =
q
vx B
c
(12)
de modo que igualando a força elétrica, obtemos:
vox
E
=
c
B0
(13)
Neste ponto, nenhuma deflexão é observada no feixe. Com este valor de vox, a
relação carga massa fica determinada pela equação:
q Ec 2  y (L ) 
=


m B02 b  L − b / 2 
(14)
11
Fig. 3 - Composição de forças sobre a partícula carregada
Resumindo: para determinarmos a relação q/m dos raios catódicos o procedimento
é: para B = 0 e E conhecido, determinamos y (L). Aumentando a corrente nas bobinas
determinamos o campo magnético B 0 onde o feixe não é defletido, isto é, atinge o ponto
x = L, y = 0. Com estes valores e conhecendo a geometria do sistema, determinamos q/m.
Utilizando-se deste método Thonson determinou que para os raios catódicos:
q/m = 1,76 x 1011 col/kg
O método descrito acima é conhecido como método de Thonson para medida
de q/m.
Este valor foi profundamente importante, pois observou-se que ele era cerca de
2000 vezes maior que o maior valor q/m conhecido para um sistema iônico (no caso
hidrogênio),
qH
= 9,57 x10 7 coul / kg
mH
valor este determinado de outra forma (como por exemplo, em eletrólise). Isto mostrava
que provavelmente a massa das partículas que constituíam os raios catódicos eram cerca
de 2000 x menor do que átomo (em massa) conhecido. Este resultado teve importância
na descoberta do elétron como constituinte do átomo. Assim, os raios catódicos nada
mais são do que feixes de elétrons e o método de Thonson permite a determinação de
e/m, onde e é a carga elementar.
12
A carga do elétron (e), é sem dúvida uma das mais importantes grandezas, pois
dela depende a maioria das propriedades atômicas, elétricas, dos sólidos e as principais
características da estrutura interna do átomo.
A fim de medir a carga e, Millikan em 1911 realizou um experimento que consistia
em observar partículas carregadas migrando num campo elétrico. Millikan utilizou
gotículas de óleo carregadas movendo-se entre as placas de um capacitor, como é
mostrado na figura 4.
Robert A. Millikan (1868 – 1953)
Fig. 4: Esquema para experimento de Millikan
Imagine uma gotícula de massa m, carga +q e raio r no interior do capacitor
mostrado na figura. Sobre ele teremos a força gravitacional mg, a força elétrica Eq e uma
força viscosa f (devido à ação do gás de fundo).
A força viscosa é proporcional à velocidade e ao raio da partícula, ou seja, f = krvy
(onde k é uma constante) e na ausência de campo elétrico, a equação de movimento
será:
m
dv y
dt
= mg − krv y
e integrando
dv y
kr
m
vy − g
= dt
ou
vy
∫ −v+
0
t
dv y
gm
kr
m
dt
kr
0
=∫
(15)
13
de onde tiramos:
− v + gm / kr m
= t
gm / kr
kr
de modo que finalmente, a variação da velocidade com o tempo é dada por:
Vy =
gm 
 m 
1 − exp − t 
kr 
 kr 
(16)
Assim, analisando o movimento na ausência de campos, determinamos a
velocidade terminal Vt =
g
g 4

m =  πr 3 ρ  onde ρ é a densidade do óleo.
kr
kr  3

Fig. 5 - Velocidade da gotícula como função do tempo
O conhecimento de vt permite a determinação do raio r da gotícula. Após esta
medida, ligamos o campo elétrico e ajusta-se o valor de Eo (através da voltagem) até que
a gotícula não mais se desloque. Neste caso, a força elétrica foi compensada pela força
gravitacional e a força viscosa desaparece, já que o movimento foi interrompido.
4
E 0 q = πr 3 gρ
3
ou seja:
4 r 3 ρg
q= π
3
E0
(17)
14
 hvt 

Da velocidade terminal que medimos previamente tiramos r = 
 4 3 πρg 
1
2
de modo
que a carga da gotícula é :
1
 3  3 2 vt 2
 k
q = 
E0
 4πρg 
2
3
(18)
As constantes envolvidas ( ρ e k) podem ser determinadas de formas diversas e
simples, permitindo assim a obtenção de q.
Fazendo várias determinações, Millikan obteve valores como: 8.2 x 10-19C, 11.49 x
10-19C, 13.13 x 10-19C, 16 x 10-19C, 6.4 x 10-19C, notando que a diferença entre qualquer
um destes valores era um número inteiro vezes o valor 1.6 x 10-19C. Assim, ele concluiu
que a menor carga capaz de estar ali era:
e = 1.6 x 10-19 C
e que todas outras eram múltiplos desta quantidade. Desta forma esta carga foi associada
ao elétron, e passou a ser a carga elementar. Com o conhecimento de e, podemos voltar
ao resultado de Thonson e determinar que a massa do elétron é:
m = 9.1 x 10-31 kg
O conhecimento dos constituintes atômicos e de suas propriedades foram
fundamentais para o estabelecimento da Física Moderna.
III.4 - Introdução à Teoria Cinética dos Gases
No século 19, as idéias atomísticas adquiriram bastante aceitação, pois descreviam
bem as propriedades cinéticas dos gases e apresentavam ramificações na mecânica
estatística e a outras partes da Física.
As propriedades que inicialmente foram explicadas, considerando o gás como
constituído de átomos e moléculas, eram totalmente insensíveis à existência de uma
estrutura interna nestas entidades. A visualização dos átomos como esferas duras,
15
preenchia totalmente as necessidades básicas para explicar a cinética dos gases. Esta
idéia do átomo perdurou consideravelmente na atomística do século 19.
A primeira constatação de que os gases eram constituídos de átomos ou moléculas
foi feito por L. Dunoyer em 1811. Em seu experimento esquematizado na fig. 6, sódio
metálico foi colocado no fundo de um tubo evacuado contendo duas repartições com
pequenos orifícios.
Fig. 6 - Experimento de Dunoyer
Após algum tempo de aquecimento do metal, observou-se no outro extremo do
sistema a imagem do segundo orifício. Este experimento proporcionou todas as
indicações que os constituintes do vapor metálico eram partículas que projetavam-se
balisticamente.
Após a conclusão de que o gás é constituído de partículas cujo comportamento é
balístico, partiu-se para a obtenção das equações de estado de um gás ideal à partir das
leis básicas da mecânica. Para isto, imaginemos um recipiente que contenha um
determinado gás e fixemos nossa atenção nas colisões que as moléculas deste gás
realizam com uma determinada porção da superfície. Nestas colisões, há transferência de
momentum dos átomos para a superfície. A média temporal destas colisões é que gera a
força que por unidade de área é conhecida como pressão do gás sobre as paredes.
A contribuição de cada átomo que colide com a superfície para a pressão do gás, é
igual à mudança do momentum do respectivo átomo (ou molécula) com o impacto.
Consideremos uma molécula de velocidade v colidindo com a superfície segundo um
16
ângulo Θ como a fig. 7, onde mostramos o ângulo e o elemento de superfície de valor dA.
Supondo uma reflexão total do átomo na superfície, temos que o momentum transferido
para cada átomo (molécula) que colide é dado por:
∆ρ = 2mv cos Θ
Vamos chamar de x, y as coordenadas ao longo da superfície e z a coordenada
normal à superfície.
Fig. 7 - Colisão de uma molécula com a parede.
Neste caso, havendo reflexão total, o momentum transferido pode ser escrito
como:
∆ρ = 2mv z
(20)
onde m é a massa de cada molécula e a velocidade é escrita como: v = (v x , v y , v z ) .
Somente a componente perpendicular à superfície é que contribui para a transferência de
momento.
Para considerarmos o efeito de todas as colisões sobre a parede, construímos um
cilindro oblíquo sobre o elemento de área dA, como mostrado na figura 8.
17
Fig. 8 - Elemento de volume que contém as moléculas que colidirão
Se quisermos analisar todas as moléculas que colidem com o elemento de área
durante um intervalo de tempo ∆t, tomamos a aresta do cilindro contendo v∆t, de modo
que todas as moléculas propagando-se de encontro com a superfície que estejam
contidas no cilindro, colidirão, no intervalo ∆t.
Se o gás que estamos considerando, tem uma densidade n, o número total de
molécula no interior do cilindro considerado é n x volume = n.v ∆t cos Θ dA.
Assim,
no. moléculas = nvz ∆tdA
Este, evidentemente, é o número total de moléculas contidas neste elemento de
volume. Não sabemos nada a respeito de como elas estão distribuídas com respeito a
sua velocidade. Vamos, então, introduzir um novo conceito que é a densidade de
partículas no espaço de velocidades. Assim, vamos chamar de g o número de átomos por
unidade de volume, com velocidades entre vx e vx + dvx, vy e vy + dvy, vz e vz + dvz. Assim,
g corresponde à densidade de átomos no espaço real e no espaço de velocidades. Com
este novo conceito, a densidade de partículas (n) nada mais é do que uma soma sobre as
várias possíveis velocidades, ou seja:
∞
∞
−∞
−∞
n = ∫ dv x dv y dv z = ∫ gdw
(21)
onde dw = dvx dvy dvz = d3v denota um elemento de volume no espaço de velocidades. O
número total de partículas contidas num volume V, seria uma integração em volume e
velocidade, ou seja:
18
∞
N = ∫ gdwdxdydz
−∞
(22)
onde gdvxdvydvz = número de moléculas com velocidades no intervalo [vx - vx + dvx, vy +
dvy, vz - vz + dvz].
Supondo que todas as partículas no interior do cilindro com velocidade entre (vx, vy,
vz) e (vx + dvx, vy + dvy, vz + dvz) atingirão a superfície, o número de moléculas colidindo
no tempo ∆t é:
(no. em ∆t) = gvz ∆tdwdA
(23)
Isto é, de todas selecionamos agora aquela fração que tem velocidade ao redor de
vz.
Como já sabemos, a contribuição de cada molécula para o momento transferido é dado
por:
dp = 2vzm (no. em ∆t) vx, vy, vz
ou seja, como ∆ t → dt,
dp = 2mgvz2dAdwdf
(24)
Assim, este momentum é a contribuição de moléculas com velocidade ao redor de
(vx, vy, vz). É claro que para garantirmos a colisão devemos requerer que a molécula
esteja se aproximando da superfície, o que nos restringe a considerar somente as
moléculas com vz < 0.
Se quisermos o momentum transferido devido às moléculas com as várias
diferentes velocidades teremos que somar todas as contribuições, ou seja:
∫
dp = ∫
p = 2m ∫
gv dw∆tdA
todasvelocidades
v z∠ 0
∫ ∫
v∠ 0 z v x v y
2
z
2mgv z2 dAdv x dv y dv z
(25)
Vamos aqui fazer um pequeno parênteses para introduzir o conceito de velocidade
média. Como dissemos, g representa a quantidade de moléculas por volume e por
19
velocidade. Assim, g depende da velocidade que estamos considerando e quanto maior é
seu valor, maior é o número de moléculas existentes com aquela determinada velocidade.
Definimos os valores médios das velocidades quadráticas como:
2
vz =
1 ∞ 2
gv z dv x dv y dv z
n ∫−∞
(26)
ou de um modo geral, para qualquer componente de velocidades,
2
vi =
Isto advém do fato que g
1 ∞ 2
gvi dw
n ∫−∞
dw
= ρ (vi ) que é a probabilidade da partícula ter (vx, vy, vz) no
n
intervalo dw, de modo que a soma vi2 P (vi) representa o valor médio da velocidade.
Como g é uma função par
∫
∞
−∞
gvi2 dw = 2 ∫
vi∠ 0
gvi2 dw , de modo que a expressão para o
momento total transmitido à superfície é dada por:
p = nm
2
2
gv z2 dwdA∆t
n ∫vz ∠ 0
(27)
2
que usando definição de v z fica, p = nmv z ∆tdA .
Como
p
é a pressão total sobre a superfície P, temos que:
∆tdA
2
P = nmv z
que é uma expressão que conecta uma grandeza macroscópica (pressão) com as
propriedades microscópicas de seus constituintes.
2
Ainda não sabemos o valor de v z , mas se usarmos o fato que o gás é
perfeitamente isotrópico de modo que todas as direções são equivalentes, para o
movimento atômico, temos que;
20
2
2
2
vx = v y = vz
e como
2
2
2
2
2
1 2
v = vx + vy + vz → vz = v
3
(28)
Assim, em termos da velocidade quadrática média, a pressão do gás é dada por:
nmv
P=
3
2
e se usarmos a definição de energia cinética K c =
P=
(29)
2
1
mv para uma única molécula, temos:
2
2
nK c
3
(30)
A equação acima mostra claramente que a pressão é resultado do fato que as
moléculas do gás apresentam movimento translacional (ou seja, energia cinética). Além
disto, a comparação deste resultado com a lei dos gases ideais, já conhecido, nos permite
obter uma definição cinética para a temperatura de um gás.
Como sabemos, n =
N
, o que nos permite escrever a equação acima na forma:
V
PV =
2
NK c
3
(31)
Se compararmos esta expressão com a famosa lei de Clapeyron PV = NKT obtida
experimentalmente, vemos que:
Kc =
3
KT
2
onde K é a constante de Boltzmann (K = 1.38 x 10-16 ergs/K) e T a temperatura na escala
absoluta. Esta relação nos mostra que a temperatura de um gás nada mais é senão uma
21
medida direta da energia cinética de cada um dos seus constituintes. É claro que estamos
tratando da energia cinética média. Esta definição é conhecida como definição cinética
da temperatura.
Notemos que o fator numérico 3 adveio do fato de estarmos tratando de um gás
em três dimensões de modo que tivemos que repartir 1/3 da velocidade quadrática média
para cada dimensão e para cada uma destas coube a parte ½ KT .
Este resultado, de uma forma mais geral, é chamado de teorema de eqüipartição
de energia, e estabelece que para cada grau de liberdade da energia com dependência
quadrática no momento ou na coordenada, deveremos alocar ½ KT de energia, quando
este sistema está em equilíbrio térmico à temperatura T. No caso do gás livre em questão
a energia é dada por:
2
p x2 p y
p2
+
+ z
E=
2m 2m 2m
de modo que temos três graus de liberdade quadráticos no momento (px, py, px) e,
portanto, a energia média das partículas deste gás está relacionada com a temperatura
pela relação:
1
3
1
3
E = 3 x KT = KT E = 3 x KT = KT
2
2
2
2
O teorema de eqüipartição de energia é bastante importante em Física e mereceria
um capítulo a parte, por esta razão este tópico deverá ser considerado em maiores
detalhes em cursos mais avançados.
Para fixar melhor este conceito, vamos considerar alguns exemplos. Imagine um
corpo ligado a seis molas flexíveis como indicado na fig. 9. Queremos saber a relação
entre a energia média e a temperatura.
22
Fig. 9 - O Oscilador tridimensional
Escrevendo a energia do sistema temos:
E=
2
p x2 p y
p2 1
1
1
+
+ z + kx 2 + ky 2 + kz 2
2 m 2m 2m 2
2
2
Assim, temos seis graus de liberdade com dependência quadrática para a energia total do
1

sistema. Deste modo, E = 6 KT  = 3KT .
2

Um segundo exemplo está mostrado na figura 10. Duas massas conectadas
por uma mola flexível tem liberdade de deslocar-se ao longo do eixo x.
Fig. 10 - Massas acopladas, livres para deslocar na direção x
Neste caso, todo movimento do sistema pode ser escrito em termos de duas
coordenadas: o centro de massa X CM =
x rei =
x1 + x 2
e a coordenada relativa entre as massas
2
x1 − x 2
. A energia do sistema é, então:
2
E=
p x2CM
2µ
+
p2
1 2
kx rei + rei
2
2µ
23
onde µ =
m
é a massa reduzida. A existência de 3 graus de liberdade quadrática na
2
energia faz que
1
 3
E = 3 KT  = KT
2
 2
Caso este sistema possa se deslocar espacialmente, então o momento do centro de
massa representa 3 graus (Px, Py, Pz) de modo que E =
5
KT .
2
Voltando ao caso do gás de partículas livres, com relação a relação da energia
cinética, podemos calcular a velocidade média de seus constituintes. Seja gás He cuja
massa molar é 4g. Assim, a temperatura ambiente (298 K)
2
2
1
3
1
4
3
mv = KT ⇒
v
= 1.38 x10 −16 298
23
2
2
2 26.02 x10
2
de onde tiramos
2
v ≅ 1360m / s como sendo a velocidade média dos átomos de hélio à
temperatura ambiente. Se tivermos, por exemplo, gás argônio que é da ordem de 10
vezes mais pesado que He, teremos um fator de
10
na velocidade, ou seja
 2
 v  ~ 430 m/s. Se considerarmos o ar que respiramos, que é basicamente constituído

 Ar
de N2, teremos um fator de
7 , já que a massa molecular deste composto é 28. Isto nos
leva à:
 2
 v  ≅ 514m / s

 N2
que é muito superior à velocidade do som no ar (340m/s). Assim, as perturbações
sonoras (à 298 K) propagam-se com velocidade inferior à média das moléculas.
Vamos imaginar um número No (de Avogadro) de moléculas contidas num
recipiente. Neste caso, sendo o gás ideal, a energia interna do sistema é a soma da
energia cinética de todas as moléculas, já que este é o único tipo de energia presente.
24
U = N0
3
KT
2
(33)
Como NoK = R é a constante dos gases a energia total do sistema é dada por:
U=
3
RT
2
Com esta expressão podemos calcular o calor específico a volume constante para
este Mol de gás e temos:
3
 dU 
Cv = 
 = R
 dT  r 2
(34)
Como R ~ 2cal/Mol, tiramos Cv ~ 3cal/MolK. Como será visto uma quantidade
importante em termodinâmica é a razão entre Cp (valor específico à P constante) e Cv.
Utilizando a relação
Cp - Cv = R
(35)
tiramos:
Cp
R
Cp
R
−1 =
⇒γ =
=
+ 1 ≅ 1.66
Cv
Cv
Cv Cv
O valor 3 cal/Mol K para o calor específico, vale somente para o gás ideal. Olhando
para os valores experimentais do calor específico de alguns gases rais, podemos
observar um desvio deste valor.
25
Tabela 1 – Dados a 300 K
Os gases monoatômicos apresentam a capacidade térmica bastante próxima do
valor ideal calculado. No entanto, ao passarmos para gases constituídos de dois átomos o
valor não mais concorda. Aumentando-se o número de átomos, o valor ce Cv fica ainda
mais longe do valor calculado. A razão desta discrepância advém primordialmente de
termos tratados moléculas com mais átomos como sendo um sistema rígido sem energia
interna.
A idéia discutida acima deve ser levemente modificada quando tratamos de
moléculas poliatômicas. É claro que o número de átomos na molécula não altera
grandemente a lei dos gases que relaciona pressão, volume e temperatura, já que
somente a translação da molécula é importante na determinação da pressão. O número
de átomos na molécula não altera grandemente este modelo. Ao tratarmos moléculas
poliatômicas, além das moléculas poderem apresentar energia na forma de energia
cinética translacional, elas podem também alocar energia para vibrações e rotações.
Isto equivale a dizer que o número de graus de liberdade da molécula aumentou. Pelo
teorema da eqüipartição de energia, temos que alocar ½ KT para cada termo da energia
com dependência harmônica, i.e. quadrática, em momento ou coordenada.
Vamos considerar uma molécula diatômica a qual visualizaremos como sendo
duas massas separadas por uma mola. Semelhante ao exemplo da fig. 10, porém, agora
com movimento tridimensional.
26
Fig. 11 - Modelo para molécula diatômica
Além das três translações possíveis (ao longo x, y, z) do centro de massa, o
sistema pode agora rodar ao redor de dois dos três eixos principais, produzindo termos de
energias do tipo
1
l x ω x2
2
e
1
l z ω z2
2
como se fosse um rotor rígido. Isto corresponde à adição de 2 graus de liberdade ao
sistema, que agora passa a ter 5 graus. Como a energia térmica é igualmente distribuída
nestas possibilidades,
1
5
U = 5 x KTN 0 = N 0 KT
2
2
ou
U=
5
RT
2
e obtemos para o calor específico
5
 dU 
Cv = 
 = R
 dT  v 2
(Cv)diatômica ~ 5cal/molK
quando translação e rotação são consideradas.
(devido a rotação)
27
Além da rotação, ainda temos que considerar os graus de liberdade vibracionais
x2 1 2
que no caso são 2 (energia vibracional = m
+ Kx ). Isto levaria a um total de 7 graus
2 2
de liberdade ou E =
7
KT .
2
Se fizermos um gráfico do calor específico (Cv) versus temperatura para um gás
diatômico, por exemplo o H2, obtemos o gráfico da figura 12.
Fig. 12 - Variação do calor específico de um gás diatômico com a temperatura
Mesmo tratando-se de uma molécula diatômica, para baixas temperaturas, o calor
específico tem valor próximo das 3cal/molK encontrado para um gás monoatômico. As
mais altas temperaturas, Cv assume seu valor 5cal/molK que é calculado quando levamos
em conta as rotações e finalmente para mais altas temperaturas o valor é 7cal/moIK, que
é o valor encontrado quando rotação e vibrações são levadas em conta. O
comportamento mostrado tem por razão que as baixas temperaturas a energia térmica
não é suficiente para realizar rotações ou vibrações das moléculas e a energia é
predominante acumulada nos graus de liberdade translacionais. Ao atingirmos
temperaturas moderadas (500 K) a energia rotacional passa a ser compatível com KT e,
portanto, este grau de liberdade começa a reter energia. Somente as temperaturas mais
1

elevadas é que KT passa a ser da ordem da energia de vibração  Kx 2  e o sistema
2

passa a realizar vibrações, e neste caso, este grau de liberdade passa também a ser
excitado, acumulando energia. Cada tipo de excitação da molécula tem seu valor
característico de energia, e sua manifestação só ocorre quando KT passa a ser
compatível a este valor.
28
Este resultado aproxima-se bastante dos valores experimentais medidos para
moléculas diatômicas a 300 K mostrados na tabela 1.
À medida que aumentamos o número de átomos da molécula, aumentamos
simultaneamente o número de graus de liberdade, aumentando, portanto, o calor
específico como observado com a molécula de éter mostrada na tabela.
III.5 - A Distribuição de Velocidade nos Gases
Ao analisarmos a equação dos gases ideais, dissemos brevemente que as
moléculas de um gás devem ter velocidades diferentes obedecendo certa distribuição.
Assim, para cada valor de velocidade que tomamos temos associado a ele um número
(ou densidade) de moléculas. Como este valor varia continuamente, dizemos que temos
uma distribuição continua de velocidades. Para o cálculo da maioria das propriedades
macroscópicas que já mencionamos (pressão, energia, etc), não precisamos conhecer
esta distribuição explicitamente, pois tais grandezas dependem sempre de valores médios
de velocidade e energia. No entanto, em muitos casos, o conhecimento da distribuição se
faz necessário. Assim seja a distribuição Nƒ(vx) mostrada na fig. 13 para um gás contido
num determinado volume.
Fig. 13 - Distribuição de velocidades
Vamos analisar este exemplo a fim de ficarmos familiarizados com o conceito de
distribuição de velocidades.
Esta distribuição nos diz que teremos nenhuma molécula com velocidade nula e, à
medida que aumentamos o valor da velocidade, encontramos mais moléculas até a
velocidade de 500 m/s onde o número encontrado para esta velocidade máxima (=100) e
29
a partir desta velocidade o número novamente cairá chegando a 10 moléculas com
velocidade 1000 m/s, e caindo ainda mais para mais altas velocidades.
No presente caso, Nƒ(vx)dvx representa o número de moléculas com velocidades
ao redor do valor vx, ou seja, com velocidade entre vx e vx + dvx. O número de moléculas
com velocidade em cada intervalo dvx dividido pelo número total de moléculas é uma
medida da probabilidade de uma dada molécula ter velocidade no intervalo considerado.
Assim, p (v x → v x + dv x ) =
f (v x )dv x
∫
f (v x )dv x
. Se quisermos saber a velocidade média desta
distribuição, teremos que somar todas as velocidades com seus respectivos pesos
relativísticos, ou seja:
v=
∫ v f (v )dv
∫ f (v )dv
x
x
x
x
(37)
x
onde fica mais evidente que ƒ(vx) é na verdade a probabilidade de encontrarmos vx.
Qualquer grandeza ς (vx) dependente de velocidade que queiramos calcular o valor médio
pode ser calculado da mesma forma que a velocidade,
ς=
∫ ς (v ) f (v )dv
∫ f (v )dv
x
x
x
x
(38)
x
O cálculo do valor médio das grandezas microscópicas de um gás é extremamente
importante, pois estes são os valores que efetivamente medimos macroscopicamente. Em
muitos casos
∫ f (v )dv
x
x
= 1 , ou seja, a função distribuição é normalizada. Vamos mantê-la
integrando explicitamente.
A análise que fizemos acima em somente um componente da velocidade, deve ser
generalizada incluindo as 3 componentes vx, vy e vz para representar a realidade de um
gás. Mas quem é afinal a função ƒ (vx)?
O procedimento matemático que usaremos a seguir para obter a distribuição de
velocidades num gás ideal foi originalmente usada por Maxwell em 1860.
Seja um gás formado por N moléculas, contido num recipiente de paredes rígidas.
Tomemos uma determinada molécula que apresenta velocidade V com componentes vx,
30
vy e vz. Se perguntarmos quantas moléculas apresentam velocidade cujo componente x
cai entre os valores vx e (vx + dvx) a resposta seria Nƒ (vx) dvx, de modo que ƒ(vx) dvx é
exatamente a probabilidade que, ao tomarmos uma molécula, ela tenha vx no intervalo
considerado. Como o gás não pode ter uma direção preferencial já que as moléculas
movem-se de uma forma aleatória e todas as direções são igualmente prováveis, a
mesma dependência funcional ƒ(vx) deve ser encontrada ao analisarmos o número de
moléculas com determinado valor de velocidade para outras componentes. Ou seja, a
probabilidade de velocidades entre vy e vy + dvy e vz e vz + dvz serão também
representadas por ƒ(vy)dvy e ƒ(vz)dvz, tendo, portanto, a mesma dependência funcional ƒ.
Assim, se perguntarmos qual é a probabilidade de encontrarmos uma molécula
com velocidade cujas componentes caem entre vx → vx + dvx, vy → vy + dvy e vz → vz +
dvz teremos que multiplicar os valores mencionados acima (como normalmente é feito
com probabilidades), ou seja:
ƒ(vx) ƒ(vy) ƒ(vz) dvx dvy dvz
é a probabilidade de uma molécula ter vetor velocidade V com sua extremidade
localizada dentro de um cubo de volume dvxdvydvz e centrado no valor V , como
esquematizado na fig. 14.
Fig. 14 - Espaço de velocidades mostrando o vetor
V e o volume dvxdvydvz
Chamando este elemento de volume, no espaço de velocidades de dw = dvxdvydvz
e, usando a isotropia da distribuição de velocidades de modo que o que deve diferenciar a
31
probabilidade das moléculas é o valor absoluto da velocidade e não a direção, podemos
escrever a equação acima como:
F (v) dw
(40)
onde F(v) é agora uma nova função que só depende do módulo da velocidade e deve ser
igual ao produto dos ƒ definido na primeira equação.
Assim
(
)
F v x2 + v y2 + v z2 = f (v x ) f (v y ) f (v z )
(41)
Esta última equação foi obtida apenas utilizando a isotropia do gás e o problema
para determinar sua dependência funcional explicita passa a ser puramente matemático.
Inicialmente tomemos a derivada da equação acima com respeito à vx, obtendo
vx
v x2 + v y2 + v z2
F ' (v ) = f ' (v x ) f ' (v y ) f ' (v z )
(42)
e ao dividirmos (42) por (41)
v x F ' (v ) f ' (v x )
=
v F (v )
f (v x )
(43)
1 F ' (v ) 1 f ' (v x )
=
v F (v ) v x f (v x )
(44)
ou seja
Nesta última equação, o primeiro termo só depende de v enquanto o segundo só
de vx. Isto poderia ter sido feito para qualquer das componentes vy e vz e obteríamos o
mesmo resultado. A única forma desta última equação ser verdadeira para quaisquer
valores de v e vx, é ser igual a uma constante que chamaremos, por convivência, de − 2γ .
Assim:
32
1 f ' (v x )
= −2γ
v x f (v x )
(45)
e através de uma simples integração, obtemos:
df
= −2γv x dv x
f
e, integrando, tiramos:
f (v x ) = e α e −γv x ,
onde eα é a constante de integração.
2
Chamando eα = A, a equação toma a forma f (v x ) = Ae − rvx , que é uma Gaussiana
2
centrada na origem.
Com isto obtemos que a distribuição F (vx, vy, vz), através de (41),
F (v x , v y , v z ) = A3 e −γv x e
2
− γv 2y
e −γv z
2
(46)
como v x2 + v y2 + v z2 = v 2 , (46) torna-se:
F (v ) = A3 e −γv
2
(47)
Como discutimos anteriormente esta função F (v) dw representa a probabilidade de
encontrarmos num gás uma molécula com velocidade cujo módulo seja v flutuando ao
seu valor no interior de um cubo de valor dw no espaço das velocidades. Se
multiplicarmos pelo número total de partículas do gás teremos quantas moléculas
apresentam o valor da velocidade com esta característica.
A fim de determinarmos a constante γ , vamos calcular o valor médio da velocidade
vx e utilizarmos o que já conhecemos de v x .
∞
∞
−∞
−∞
v x = ∫ v x f (v x )dv x / ∫ f (v x )dv x
33
que resulta, obviamente em v x = 0 como esperado, pois já que todas as direções são
igualmente prováveis, o mesmo número de moléculas deverão estar deslocando-se na
direção +x e -x com o mesmo valor de vx, resultando numa média nula.
2
Vamos, então, calcular v x . Neste caso:
v
2
x
∫
=
∞
v f (v x )dv x
2
−∞ x
∞
∫
−∞
f (v x )dv x
e utilizando as expressões acima
∞
A∫ v x2 e −γv x dv x
2
x
v =
A integral do tipo
∫
+∞
−∞
ς e
2
− rς 2
2
−∞
A∫ e −γv x dv x
2
π
dς = 
γ



1/ 2
pode ser facilmente executada, e derivando
com respeito a γ , tiramos
∫
+∞
−∞
ς e
2
−γς 2
1 π 1/ 2
dς =
2 γ 3/ 2
Assim, usando estes resultados
2
vx =
π 1/ 2 / γ 3 / 2 1 1
=
2γ
π 1/ 2 / γ 1/ 2
1
2
e do teorema de eqüipartição de energia, já discutido anteriormente para o gás ideal,
2
1
1
mv x = KT
2
2
ou seja,
1 11 1
m
m
= KT ⇒ γ =
2 2γ 2
2 KT
(48)
34
A determinação da constante A pode ser feita do fato que ƒ(vx) dvx representa a
probabilidade de encontrar a molécula com vx entre vx e vx + dvx, de modo que a soma
sobre todas possíveis velocidades deve fornecer a unidade, ou seja:
∫
∞
−∞
π
A
γ



1/ 2
f (v x )dv x = 1
γ 
=1→ A =  
π 
1/ 2
ou
 m 
A=

 2πKT 
1/ 2
Assim, com todas estas determinações, nossa função distribuição fica
 m 
F (v ) = 

 2πKT 
3/ 2
 1 mv 2 

exp −
 2 KT 
(49)
Esta expressão é conhecida como função distribuição de velocidade de Maxwell.
Fig. 15 - elemento de volume no espaço de velocidades
Como vimos, é de extrema importância mantermos a notação vetorial através das
componentes vx, vy e vz. Se, ao invés deste vetor velocidade quisermos estudar a
distribuição de velocidade em termos de seu valor absoluto v, devemos considerar o fato
que todas as direções são igualmente prováveis e, portanto, o elemento de volume dw a
ser estudado deverá ser uma casca esférica de raio v e espessura dv (no espaço de
velocidades com eixos vx, vy e vz), como indicado na fig. 15. Desta forma estaremos
levando em conta todas as possíveis direções.
O elemento de volume dw representado tem valor dw = 4πv 2 dv e, portanto, se
perguntarmos, agora, qual é a probabilidade de encontrarmos, no gás considerado, uma
35
molécula com velocidade de valor absoluto (ou módulo) entre v e v + dv
independentemente de sua direção, encontraríamos:
 m 

 2πKT 
φ (v ) = 4πv 2 
3/ 2
e
− 2mvKT2
(50)
ou seja,
φ (v )dv = 4πv 2 dvF (v ) = F (v )dw
Evidentemente, para esta nova distribuição que encontramos, o valor de v só pode
variar de zero até + ∞. Esta nova distribuição não é mais Gaussiana. O gráfico desta
distribuição está mostrado na fig. 16.
Fig. 16 - Distribuição Φ (v)
Utilizando esta distribuição, podemos calcular o valor mais provável da
velocidade (vm) que é aquele presente num número maior de moléculas. Como ele
corresponde ao máximo da distribuição, seu valor pode ser determinado por:
dφ (v )
=0
dv
2v 5 − 2v 3
m
= 0 ⇒ vm =
2 KT
2 KT
m
O valor médio da velocidade ( v ), é calculado como já discutido
(51)
36
v=∫
∞
0
 m 
vφ (v )dv = 4π 

 2πKT 
 m 
= 4π 

 2πKT 
3/ 2
2/3
1
2(m / 2 KT )
2
∫
∞
0
v 3e
− 2mvKT2
dv =
(52)
2 KT
= v = 1,12
m
Da mesma forma podemos determinar a velocidade quadrática média (vrms)
v rms
 m 
= v = 4π 

 2πKT 
v rms
2 KT
= 1,22
m
2
1/ 2
∫
∞
0
v 4e
− 2mvKT2
dv
(53)
Com esta função, o valor médio de qualquer grandeza η (v) que depende da
velocidade é:
∞
η (v ) = ∫ η (v )φ (v )dv
(54)
0
Devido às contribuições apreciáveis de Boltzmann, a distribuição é denominada de
distribuição de Maxwell-Boltzmann.
Como visto, a distribuição de Maxwell-Boltzmann depende da temperatura, e a
medida em que T aumenta, o valor de vm aumenta. Porém, o valor da distribuição naquele
ponto diminui, conservando a propriedade
∞
∫ φ (v )dv = 1 .
0
Assim, quanto maior a
temperatura, mais espalhada é a distribuição de velocidades, ou seja, maior é a dispersão
da distribuição.
Fig. 17 - Distribuição a diferentes temperaturas
37
Ao invés de perguntarmos a respeito da distribuição de velocidade, podemos estar
interessados diretamente na distribuição com respeito à sua energia. Para o caso do gás
ideal, a velocidade e energia das partículas estão relacionadas através da relação.
E=
1 2
mv
2
de modo que podemos converter diretamente a distribuição de velocidades para energia.
A probabilidade de encontrarmos uma molécula com velocidade no intervalo v → v + dv é
φ (v)dv, assim, a probabilidade de encontrarmos uma partícula com energia entre E e E +
dE é:
 m 
φ (E )dE = 4π 

 2πKT 
3/ 2
2 E − E / KT dv
e
dE
m
dE
onde convertemos o elemento 4πv 2 dv em energia, sendo:
dv
d
(2 E / m )1 / 2 = 1  2 
=
dE dE
2  mE 
1/ 2
resultando em:
4π  m 
φ (E )dE =


2  2πKT 
3/ 2
2
 
m
3/ 2
E 1 / 2 e − E / KT dE
ou seja:
φ (E ) =
2π
(πKT )
3/ 2
E 1 / 2 e − E / KT
Usando esta distribuição, podemos calcular a energia média E do gás,
∞
E = ∫ Eφ (E )dE
0
ou seja
38
E=
e usando a integral
∫
∞
0
x n e ax =
2
2π
(πKT ) ∫
3/ 2
∞
0
E 3 / 2 e − E / KT dE
Γ(n + 1)
com Γ sendo a conhecida função gamma, tiramos
a n +1
E=
3
KT
2
como previsto pelo teorema de eqüipartição de energia. Este último resultado não é
dedução do teorema, já que utilizamos na determinação do valor de γ e, portanto, o
resultado acima já era esperado.
III.6 - Derivação Barométrica da Distribuição de Velocidades de Maxwell
A dedução que fizemos anteriormente é baseada em considerações sobre a teoria
de probabilidades e a isotropia do gás considerado. Podemos, no entanto, deduzir a
distribuição de Maxwell de uma forma alternativa através da observação da variação da
pressão do gás com a altitude quando o gás está na presença do campo gravitacional,
aqui considerado como sendo homogêneo e com temperatura uniforme.
Denominemos de zero a superfície da terra e tomemos a atmosfera como sendo
um gás contínuo de densidade mássica ρ = nm. Se tomarmos uma determinada camada
de gás localizada à posição z e de espessura dz, esta camada estará sujeita às pressões
p(z+dz) e p(z) cuja diferença é equilibrada pelo peso da camada, ou seja:
dp = - ρ gdz = nmgdz
como n =
P
, tiramos que
KT
−
dP mg
=
dz
P
KT
ou
 mgz 
P = p (o ) exp −

 KT 
que é equivalente à (considerando temperatura homogênea):
39
n(z) = n(o)e-mgz/KT
É claro que este é um caso específico de uma situação mais global, onde as
moléculas estão sujeitas a uma energia potencial V(z) quando localizadas em (x, y, z). De
modo que a expressão mais geral tem a forma:
n(z) = Ce-v(z)/KT
A dedução barométrica da distribuição de velocidades ƒ(vz), consiste no seguinte: a
existência de uma distribuição de velocidades na posição z = 0 levaria ao estabelecimento
de um perfil de densidades n(z), quando os átomos sobem contra a gravidade em
movimento balístico. O modelo está representado na figura 18.
Para simplificar o problema, imaginemos inicialmente o gás como sendo
unidirecional, movendo-se somente na direção vertical. Neste caso, uma molécula
partindo da posição z = 0 com velocidade vo, atingiria a altura z = v02 / 2g retornando a
z = 0 onde sofrerá uma colisão totalmente elástica.
Fig. 18 - Distribuição de velocidades na superfície da terra, na direção z. As mais rápidas são lançadas até
alturas maiores e as mais lentas a alturas menores, gerando um perfil de densidade.
Se todas as moléculas tivessem a mesma velocidade v0, teríamos uma densidade
que cairia abruptamente a zero em z = v02 / 2g, além do fato que a temperatura diminuiria
linearmente, já que a velocidade diminuiria com z, atingindo T = 0 em Z = v02 / 2g (pois
v 2f = v02 − 2 gz e T ( z ) = T (o ) −
2 gm
z ) evidentemente isto não acontece, mostrando a
2
existência de uma distribuição de velocidades. Vamos chamar ƒ (vo) a distribuição de
velocidades dos átomos deixando a superfície. O número de partículas que deixa a
40
superfície com velocidade entre v0 e v0 x dv0, por unidade de área e tempo (fluxo) é dada
por:
fluxo =
dN
= n( z = 0 )v 0 f (v 0 )dv0 = densidade(v0 ).v0
A∆t
Estas partículas terão sua máxima altura entre v02 /2g e (vo + dvo)2 / 2g. O número
de partículas passando pelo plano zo = v02 / 2g é dado por n(zo) v (zo) por unidade de
tempo e área. Da mesma forma, o número de partículas cortando plano localizado em zo
+ dzo por unidade de tempo e área é:
n(zo + dzo) v (zo + dzo)
A velocidade média das moléculas v , só depende da temperatura por hipótese,
não dependendo de z, de modo que v (zo) = v (zo + dzo). A variação do fluxo de
partículas entre as duas superfícies é:
diferença fluxo =
dN
= [n( z 0 ) − n( z 0 + dz 0 )]v = átomos que conseguem atingir posição
A∆t
entre Zo e Zo + dZo
−
dn
mg v
= −v
dz 0 =
n(o )e
dz 0
KT
mgz0
KT
dz 0
onde já utilizamos n(z) obtido anteriormente.
Substituindo
dN
, pelo valor calculado, obtemos a igualdade:
A∆t
n(o )v0 f (v0 )dv0 =
mg v
n(o )e −mgz0 / KT dz 0
KT
Como mgzo = mv02 / 2 tiramos mvodvo = mgdzo e, portanto:
41
2
z
 mv  − 12 mv
e KT
f (v0 ) = 

 KT 
(56)
que é a forma unidimensional da distribuição de Maxwell
2
z
 mv  − 12 mv
e KT
f (v z ) = 

 KT 
onde o coeficiente é evidentemente uma constante que só depende da temperatura. Se
tivermos uma distribuição de Maxwell em z = 0, teremos para todos pontos z.
No modelo que fizemos as colisões entre as moléculas nada afetam, já que em
uma dimensão o resultado da colisão elástica é uma simples inter-troca de velocidade e
como as partículas são indistinguíveis, esta colisão não altera em nada o modelo
apresentado.
Uma pergunta natural que surge, é: como que a velocidade média pode ser
independente da posição, se a energia cinética das moléculas continuamente diminui à
medida que elas sobem? A resposta para esta pergunta é bastante simples. Lembremos
que para o cálculo da velocidade média todas as partículas, com suas velocidades são
levadas em conta. Quando uma distribuição emerge da superfície sujeita ao campo
gravitacional, as partículas mais lentas não atingem as alturas mais altas, enquanto que
as mais rápidas diminuem de velocidade mantendo, assim, a velocidade média que só
depende da temperatura e não de z. Esta também é a razão pelo qual há variação da
densidade sem variar a distribuição de velocidades.
III.7 - Colisões entre as Moléculas do Gás e o Caminho Livre Médio
Como vimos, as moléculas dentro do gás possuem um movimento desordenado
sofrendo várias colisões com as paredes e também com as demais moléculas do gás, já
que estas não são pontuais. Se pudéssemos fotografar a trajetória de uma molécula
durante um determinado intervalo de tempo, encontraríamos uma trajetória tortuosa
composta de segmentos retilíneos de comprimentos diferentes. Cada um destes
segmentos corresponde ao intervalo do trajeto no qual a molécula desloca-se sem a
influência das demais moléculas ou das paredes do recipiente que as contém. Nos
vértices desta trajetória (pontos de encontro de cada dois segmentos) há ocorrência de
42
uma colisão mudando consideravelmente a trajetória. A existência destes pontos revela a
influência das demais moléculas sobre o movimento de uma delas.
A interação entre as moléculas do gás pode ser atrativa ou repulsiva e tem um
potencial que varia de acordo com o tipo de interação existente em cada caso. Para uma
primeira análise do problema os detalhes da interação podem ser deixados de lado e
vamos considerar as moléculas como esferas rígidas de diâmetro d. A primeira pergunta
que fazemos é: Qual é o número de colisões sofridas por uma molécula por unidade de
tempo, dentro do gás?
Fig. 19 - Trajetória tortuosa de uma molécula num gás
Seja uma partícula de diâmetro d e velocidade v deslocando-se no interior de um
gás
constituído
de
partículas
idênticas
apresentando
uma
densidade
n
(partículas/volume), veja figura 20.
Fig. 20 - Uma partícula de diâmetro d colidirá com todas contidas no cilindro
Quando a partícula desloca-se em linha reta ela colidirá com todas as outras
partículas cujos centros de massa encontram-se a uma distância menor ou igual a d da
sua linha de deslocamento. Se estivermos considerando um ∆t, a molécula original
desloca-se em média uma distância v ∆t e colidirá com todas as demais partículas
contidas dentro do volume do cilindro de base de diâmetro 2d e altura v ∆t. Mesmo que
43
após cada colisão haja mudança da trajetória podemos alinhar todos os segmentos da fig.
20, criando uma trajetória linear. Assim:
no. de colisões médias em ∆t = πd 2 v∆t (densidade)
no. de col em ∆t = πd 2 v∆tn
e, portanto, o número médio de colisões por unidade de tempo
no. de col. / tempo = πd 2 vn
(57)
A quantidade πd 2 que representa a área frontal de colisão é chamada de secção
de choque σ .
no. de colisões / tempo = nσ v
(58)
Para conhecermos o tempo médio entre duas colisões consecutivas ( τ ) temos que
inverter a expressão acima, obtendo:
τ −1 = nσ v
(59)
Sendo τ o tempo médio decorrido entre duas colisões consecutivas, então a
distância média percorrida pelo átomo entre duas colisões consecutivas l é, portanto:
l =τv ⇒ l =
1
nσ
(60)
Este comprimento médio, que representa o espaço percorrido entre duas colisões
consecutivas é denominado de livre caminho médio e, como vimos, para um gás
constituído de moléculas que são consideradas esferas rígidas de diâmetro d, o livre
caminho médio é:
l=
1
πd 2 n
(61)
44
que é independente da temperatura e só depende do tamanho das moléculas (d) e da
densidade (n), ou da secção de choque e da densidade.
O caminho livre médio é importante para nos dar uma idéia da ordem de grandeza
da distância que a molécula consegue percorrer sem que ocorra influência das demais.
Este parâmetro é de extrema importância para o transporte de massa e de energia pelo
gás.
Como estimativa numérica, consideremos o gás hélio à temperatura ambiente e
pressão atmosférica. Pela lei dos gases ideais, podemos determinar que a densidade é,
neste caso, n = 2.7 x 1019 átomo/cm3 e se tratando de um átomo cujo diâmetro é igual a
d ≅ 2.2 Å, temos
l=
1
1
1
=
~ 2.5 x 10-5 cm
2
−16
2
πd n 15.2 x10 cm 2.7 x1019
(
)(
)
mostrando que o caminho livre médio é cerca de 1000 vezes o tamanho atômico.
Para esta temperatura v ~ 105 cm/s de modo que o tempo entre colisões pode ser
determinado resultando em:
τ ~ 10-10 sec
Este é o tempo decorrido entre colisões consecutivas. A duração da colisão
poderia ser estimada se tomarmos ∆t ' ≅
d 2,2 10 −8
=
~ 2.2 1013 seg, ou seja, 0.22
v
10 5
pico/segundos. Sendo a duração da colisão tão curta, fica difícil o estudo do que ocorre
durante seu decurso. É preciso usar técnicas modernas de pulsos curtos de luz ou
átomos lentos aprisionados para melhorar nosso entendimento sobre detalhes do
encontro atômico.
O caminho livre médio é um parâmetro bastante importante para as propriedades
de transporte de um sistema gasoso, como veremos mais adiante.
O tempo τ , normalmente chamado de tempo de relaxação, mostra que τ
frequência de colisão. No caso acima o gás apresenta 10
10
-1
éa
colisões/seg.
A secção de choque σ pode ser determinada a partir de experimentos de
espalhamento, o que constitui uma importante técnica de medida para tamanhos atômicos
45
e caminho livre médio. Para entendermos este tipo de medida, vamos analisar uma
determinada situação física.
Consideremos um feixe molecular propagando-se por uma região que contém
moléculas de uma outra espécie (Fig. 21). Quando as moléculas do feixe colidem com as
moléculas do gás sua trajetória normal é modificada e elas são defletidas para fora do
feixe original. Desta forma, à medida que o feixe propaga-se através do gás, a sua
intensidade (I) molecular (i.e, o número de moléculas por unidade da área e por unidade
de tempo) diminui devido às moléculas defletidas para fora. Analisando o decaimento da
intensidade deste feixe molecular ao longo de sua propagação podemos aprender muito a
respeito das colisões e do caminho livre médio e, conseqüentemente, do tamanho das
moléculas.
Seja o experimento na figura 21, onde átomos (ou moléculas) do feixe são
espalhados pelo gás contido na região A, e a intensidade do feixe é medida pelo detector
D.
Fig. 21- Espalhamento de um feixe
Considerando o feixe como constituído de partículas de diâmetro d, e o mesmo
para as partículas do alvo A. Se a densidade do alvo é n, e S é a área do feixe (área
transversal), o número de partículas incidentes sobre o alvo por unidade de tempo é lS
que, ao propagar-se por uma distância ∆x no gás passa por nS∆x moléculas do alvo (I é a
densidade do feixe). Como cada átomo apresenta uma secção choque πd 2 que é uma
área efetiva de colisão, ao percorrer a distância ∆x, cada molécula do feixe colidirá com
toda do gás no seu caminho, ou seja, de modo análogo ao que fizemos anteriormente.
no. colisões / molécula no feixe = πd 2 n∆x
Como existem I(x)S moléculas / tempo incidindo,
46
no. colisões / tempo = I(x)S πd 2 n∆x
(62)
Tomando que em cada colisão um átomo do feixe é defletido, a diminuição de
número átomo do feixe/tempo ao passar pela fatia ∆x de gás é a diferença do fluxo de
entrada e saída, ou seja:
l ( x + ∆x )S = −l ( x )S = −lSπd 2 n∆x
l ( x + ∆x ) − l ( x )
= −lπd 2 n
∆x
e, tomando limite ∆x → 0 e σ = πd 2 n , tiramos a equação mestra do espalhamento
dl
= −lσn
dx
(63)
de onde, por integração, tiramos que a intensidade do feixe decresce da forma:
l ( x ) = l 0 e −σnx
após propagar uma distância x no gás. Como l =
l (x ) = l0 e
(64)
1
σn
−x
l
Fig. 22 - Reflexão de moléculas do feixe ao percorrerem a distância ∆x
(65)
47
Assim, medindo o fluxo de partículas do feixe após percorrerem o gás e graficando
seu logaritmo versus x, conforme a fig. 23, tiramos o livre caminho médio e,
conseqüentemente, a secção de choque ou o tamanho d das moléculas.
Fig. 23 - Determinação do livre caminho médio
III.8 - Efusão de um Gás por um Orifício
Uma das importantes aplicações da teoria cinética dos gases é o escape de um
gás por um orifício de um recipiente que contém gás a uma determinada pressão.
Seja um pequeno orifício (muito menor do que as dimensões do sistema) feito na
parede de um recipiente que contém um gás. Sendo as dimensões do orifício pequenas
comparadas com as dimensões dos recipientes, o equilíbrio existente no gás não é
grandemente afetado pela presença do orifício. Neste caso, o número de partículas que
emerge do orifício é exatamente o mesmo número que colidiria com a área ocupada pelo
orifício. Este processo é denominado de "efusão" do gás, veja figura 24.
Fig. 24 – Efusão
Consideremos um recipiente contendo gás a uma pressão P, temperatura T e
densidade n. Queremos calcular o fluxo (molécula/área tempo) que emerge por um orifício
48
de área A. A fim de calcular este número vamos tomar um elemento de área dA e achar o
número de moléculas colidindo neste elemento por unidade de tempo. Como já dissemos
anteriormente este será o número que emerge se ao invés de parede sólida houvesse ali
um orifício de mesma área.
Consideremos, inicialmente, as moléculas nas vizinhanças do elemento dA. De
todas moléculas contidas nesta vizinhança, esperamos que aquelas que se movem na
direção da superfície colidirão com ela. Assim, vamos fazer um simples modelo que
consiste em tomar aquelas moléculas que deslocam-se com velocidade média v na
direção da superfície. Durante um tempo dt, todas aquelas moléculas contidas num
cilindro de área de base dA e altera v dt colidirão. Como a densidade do gás é n e em
média somente
1
6
delas deslocam-se contra a superfície, temos que o número de
moléculas que colidem com dA no tempo dt é
1
6
nvdt.dA e, portanto, o fluxo de moléculas
que emergirão do orifício de área dA é:
n o molecular 1
= nv
dAdt
6
Este cálculo é, no entanto, apenas uma aproximação pois para sermos mais exatos
deveremos levar em conta a distribuição de velocidades e integrar sobre todo o hemisfério
interior do recipiente. Os detalhes de cálculo ficarão como exercício ao leitor e o resultado
exato que se encontra é:
Φ0 =
1
nv (partículas / área tempo)
4
(66)
para o fluxo emergente pelo orifício. Este fluxo, no caso da parede ter espessura muito
menor do que o diâmetro do orifício é uniformemente distribuído em todo o hemisfério
externo do orifício e em cada direção temos a distribuição de Maxwell para a velocidade.
Com a relação dos gases perfeitos e o valor de v para uma distribuição de
Maxwell, podemos escrever a relação acima como:
Φ0 =
p
2πmKT
(67)
49
Uma aplicação geral que podemos fazer da efusão é a determinação de
vazamentos em sistemas de vácuo ou pressurizados, apenas acompanhando a evolução
temporal da pressão. Analisaremos esta aplicação como exercício.
III.9 - Propriedades de Transporte de um Gás
Existem várias propriedades do sistema gasoso que são de interesse prático e que
dependem das propriedades cinéticas dos gases. Entre inúmeras destas propriedades
vamos iniciar analisando a condução térmica, fenômeno pelo qual um gás é capaz de
transportar energia de um ponto a outro. A fim de estudarmos este fenômeno e
determinarmos a capacidade de um gás em transportar energia, vamos considerar um
sistema que não está em equilíbrio térmico, de modo que partes diferentes podem estar a
temperaturas diferentes. Embora em não equilíbrio, vamos manter o sistema num estado
estacionário, de modo que a configuração térmica das várias partes do sistema não são
alterados com o passar do tempo. Por exemplo, consideremos um gás em contato com
dois reservatórios à temperaturas T1 e T2, como mostrado na figura 25.
Para o caso onde T1 > T2, haverá um fluxo de energia do reservatório 1 para o
reservatório 2 e este transporte energético é, evidentemente, feito através das moléculas
do gás. As moléculas entrando em contato com o reservatório 1,
Fig. 25 - Condução térmica através de um gás
aumentam sua temperatura ficando mais energéticas, ou seja, elas emergem de 1 com
velocidade maior do que quando entraram. Através de colisões com demais partículas
esta energia vai sendo transferida às demais partes do sistema até atingir o reservatório 2
que receberá esta energia transportada pelo gás. A força motriz para este transporte de
energia é a diferença de temperatura entre as duas partes. A situação física descrita tem
como fluxo de energia transferido a conhecida equação:
50
J = − K T ∇T = energia / (tempo . área)
(68)
ou seja, a energia fluirá oposta ao gradiente de temperatura, e a constante de
proporcional idade é denominado de condutividade térmica (KT) do sistema. Nosso
trabalho aqui é determinar o valor desta constante (KT) a partir do que conhecemos sobre
os gases.
Como vimos, a menor distância que a molécula consegue caminhar sem alterar
seu estado energético é o caminho livre médio I. Assim, vamos considerar dois planos
imaginários no interior do gás, separados por Ix (projeção do caminho livre médio na
direção x). Num dos planos as moléculas apresentam energia U1 e no outro U2.
Chamaremos de A a área dos planos em questão (veja fig. 26).
Fig. 26 - Sistema para análise do transporte de energia em um gás
Se as moléculas passam da posição x para a posição x + Ix com uma velocidade
média v x e gastam ∆ t neste trajeto, sendo n a densidade do gás e cv o calor específico
(energia / massa grau), temos que a energia transportada de x à x + Ix em ∆t é:
∆Q = (quantidade massa) x cv x ∆T
ou seja,
∆Q = Anv x ∆tc v ∆T
A variação de temperatura entre as posições consideradas pode ser escrita como:
∆T ≅ l x
dT
,
dx
e
∆Q
=J
A.∆t
(fluxo de calor)
51
tiramos que
dT
dx
J = ncv l x v x
(69)
Comparando a equação (69) com a lei de fluxo de calor visto anteriormente,
equação (68)
J = −KT
dT
dx
obtemos que a condutividade térmica do gás é
K T = ncv l x v x
(70)
Temos agora que determinar Ix v x em termos de I e v . Como Ix = I cos Θ e vx = v
cos Θ (Note que aqui x fará o papel do eixo z em coordenadas esféricas), temos que
0< Θ <π /2
x/2
lxvx
2π
∞
0
0
∫ ∫ ∫
=
0
/ cos 2 ΘF (v )v 2 senΘdΘρdv
π /2
2π
∞
0
0
0
∫ ∫ ∫
F (v )dw
= lv
2π ∫
π /2
0
cos 2 ΘsenΘdΘ
2π
π /2
0
0
∫ ∫
senΘdΘdρ
1
lx vx = lv
3
Fig. 27 - Sistema de coordenadas para cálculo de
lxvx
52
(Nota: tivemos que normalizar, dividindo pela integral, pois agora só estamos trabalhando
com um hemisfério do gás).
Assim, a condutividade térmica é:
 energia.comp. 


 grau.área.tempo 
1
K T = ncv l v
3
que como vemos, é proporcional as várias grandezas relevantes para o transporte de
energia, como era esperado, já que o aumento de quaisquer destas grandezas leva a um
aumento na eficiência do transporte de energia.
Além da condutividade térmica, outra propriedade de transporte bastante
importante é a viscosidade do gás. A viscosidade está associada com a capacidade do
gás em transmitir quantidade de movimento. Assim, seja o gás contido entre duas placas
paralelas separadas pela distância ∆y (fig. 28).
Fig. 28 - Arraste devido à viscosidade do meio
Se colocarmos a placa superior em movimento, devido ao movimento transferido
através do gás, a placa inferior também tenderá a entrar em movimento (arraste). A fim de
manter a placa inferior em repouso é necessário imprimir a ela uma força, que por
unidade de área é denominada de tensão de cisalhamento ( τ ). Esta tensão de
cisalhamento deverá, obviamente, ser proporcional à ∆v (diferença de velocidade entre
placas) e inversamente proporcional a ∆y (separação das placas), já que quanto maior for
a velocidade, maior deve ser o arraste e quanto mais separadas as placas, menor será o
arraste. Com isto podemos escrever:
τ∞
∆v
∆y
53
A constante de proporcionalidade da expressão acima é denominada de
viscosidade do gás (η), e a equação acima é convenientemente escrita como:
τ = −η
dv
dy
(73)
Assim, a viscosidade está relacionada com o poder que o fluido tem em arrastar
corpos em contato com ele, ou mesmo camadas sucessivas do próprio fluido. Nosso
trabalho agora é determinar η em termos das propriedades microscópicas do gás. Da
mesma forma que procedemos na condutividade térmica, consideremos duas camadas
do gás separadas pela distância Iy (projeção do caminho livre médio na direção y), veja
figura 29. A camada superior desloca-se com velocidade vx + ∆vx e a inferior vx.
Fig. 29 - Sistema para cálculo da viscosidade
Se considerarmos um intervalo de tempo ∆t, a quantidade de momentum na
direção x transferido ao passarmos gás de uma posição para outra é
∆px = (massa total) ∆vx = mAvy∆t∆vx
onde a massa total considerada é a massa transferida da posição y para y+dy. Sendo n a
densidade em número, mn a densidade de massa. Como:
∆v x ≅ l y
dv x
dy
tiramos,
∆p x = − mnAv y l y ∆t
dv x
dy
54
de onde obtemos:
τ=
∆p x
dv
= − mnv y l y x
A∆t
dy
( )
1
e como já vimos que v y l y = lv , obtemos:
3
1
3
τ = − ml v
dv x
dy
(74)
que comparado com a equação fornecida anteriormente fornece para a viscosidade
1
3
η = nml v
Assim, a viscosidade de um gás é diretamente proporcional à m, n, I e v .
Uma outra interessante propriedade dos gases é a difusão segundo a qual massa
é transportada através do gás.
Para determinar o coeficiente de difusão de um gás, consideremos inicialmente a
lei que relaciona o fluxo de massa com a variação de concentração em uma dimensão:
J x = −D
dn
dx
sendo D o chamado coeficiente de difusão. Semelhante aos casos de transporte de calor
e momento, considere duas posições do gás separados por Ix entre os quais há uma
diferença de concentração (ver fig. 30).
Fig. 30 - Difusão entre duas regiões de concentração diferentes
55
O fluxo de massa sendo transportado do ponto de maior para o de menor
concentração é:
J = n( x )v x − n( x − l x )v x
= −[n( x + l x ) − n( x )]v x
= −l x
dn
vx
dx
1
tirando a média, l x v x = l v e, comparando com a lei de difusão, o coeficiente D relaciona3
se com os parâmetros microscópicos:
1
D = lv
3
(76)
o que significa que quanto maior for I e v , maior será a difusão.
III.10 - Transporte de gás carregado eletricamente por uma rede de pontos: uma
aplicação da cinética dos gases para condutividade elétrica dos metais.
Ao considerarmos um gás que interage com campos externos, além de seu
movimento aleatório, podemos ter um modelo simples para a condução eletrônica nos
metais e outros importantes sistemas.
Num metal, os elétrons podem ser vistos como as partículas de um gás sujeito a
colisões com pontos fixos (pontos da rede). O fluxo eletrônico entre dois pontos quaisquer
é normalmente zero. Porém, caso um campo elétrico seja aplicado ao sistema, o fluxo
resultante não será mais nulo. O fluxo de carga resultante (chamado de densidade de
corrente J ) cresce linearmente com o campo aplicado, estabelecendo a chamada lei de
Ohm;
J = σ E . Queremos determinar σ
(condutividade) a partir de parâmetros
microscópicos.
Do fato de que os elétrons nos metais estão fracamente ligados aos seus átomos
de origem, permite visualizar o material como sendo um gás de elétrons embebendo os
íons positivos, e aplicar a este "gás" tudo o que conhecemos da cinética dos gases para
obtermos informações a respeito das propriedades de transporte elétricos do sistema.
56
Ao juntarmos átomos de um determinado metal para formarmos o sólido, os
elétrons de valência do sólido tornam-se praticamente livres enquanto os demais elétrons
do átomo permanecem firmemente ligados ao núcleo. Assim, um metal constituído de
átomos com zA elétrons de valência contribuirão para a condução os z elétrons/átomo
enquanto os demais zA - z elétrons contribuem praticamente em nada para esta
propriedade de transporte.
Seja um metal com densidade mássica ρm e massa molecular A, a quantidade de
moles/cm3 no metal é
ρm
A
e a densidade de elétrons "condutores" será:
n = 6,022 x10 23 Z
ρm
(77)
A
Cada elétron ocupa, em média, uma esfera de raio γ s, dada por:
1 4π 3
 3 
=
γs →γs =

n
3
 4πn 
1/ 3
Alguns exemplos estão listados a seguir:
n(1022/cm3)
γ s(Å)
Na
2,65
2,08
Au
5,90
1,59
Fé
17,0
1,12
Bi
14,1
1,19
Como podemos ver a densidade do gás de elétrons nos metais são milhares de
vezes maiores do que nosso convencional gás ideal a condições normais de pressão e
temperatura. Apesar disto, e apesar da forte interação colombiana elétron-elétron e
elétron-íon, vamos aplicar as leis da cinética de um gás neutro e diluído, iniciemos
fazendo as seguintes suposições:
1) Não há interação elétron-elétron ou elétron-íon entre colisões. A interação só se
manifesta durante a colisão do elétron com os íons de rede permanecendo em trajetória
57
linear entre colisões, período no qual são válidas as leis da mecânica para a interação
elétron-campo, desprezando-se totalmente qualquer outra interação durante este período.
A interação elétron-elétron pode ser abandonada na chamada aproximação dos
elétrons independentes, enquanto o abandono da interação elétron-íon é chamado de
aproximação de elétron livre.
2) No modelo que estamos adotando as colisões ocorrem instantaneamente mudando
abruptamente a velocidade do elétron, sem alterar grandemente a velocidade dos íons da
rede que são, evidentemente, muito mais massivos que os elétrons.
3) Vamos considerar que o tempo médio entre colisões é dado por τ , de modo que a
frequência de colisão é I/ τ . Isto significa que, em média, um elétron sofrerá uma colisão
e, após um determinado tempo τ , uma outra. Assumiremos que τ seja independente da
posição e velocidade do elétron.
4) Finalmente, supomos que em cada colisão o elétron atinge equilíbrio térmico com sua
redondeza. Isto nos leva a utilizar o fato que após cada colisão o elétron emerge do
centro de colisão com uma velocidade que independe daquela que ele tinha inicialmente,
dependendo somente da temperatura local do centro de colisão.
Com estas suposições, a visão microscópica que temos da condução de elétrons
num condutor está esquematicamente representada na figura 31:
Fig. 31
Para o elétron, o sólido nada mais é senão uma coleção de centros de colisão que
modificam sua trajetória e lhe fornece nova velocidade após cada colisão. Entre colisões o
movimento é balístico e o elétron está sujeito somente à ação do campo externo.
58
Vamos inicialmente imaginar um campo estático E aplicado no sistema. Se uma
determinada densidade n de elétrons movem-se com velocidade v , numa determinada
direção, o fluxo de corrente gerado é:
J = +nq v
onde q é a carga dos portadores.
Se não temos campo aplicado, o elétron que é termicamente excitado colide com
os íons da rede, determinando uma trajetória desordenada que leva à:
< v >=0
Na presença do campo, após cada colisão temos que adicionar a v o termo
q
Et
m
que corresponde à velocidade que o campo imprimiu a carga após a colisão de modo que
v(t ) = v +
q
Et
m
(79)
e a velocidade média entre colisões é, portanto:
v med = < v > +
v med =
q
E <t>
m
q
Eτ
m
(80)
independendo da velocidade com que o elétron emerge do centro, pois esta é
aleatoriamente distribuída.
Como
j = nq v med , já que a densidade de corrente é uma manifestação
macroscópica da resposta a efeitos microscópicos do sistema, temos que:
j=
nq
τE
m
(81)
59
mostrando que a densidade de corrente é linear com o campo aplicado (Lei de Ohm) e a
constante de proporcionalidade é a condutividade elétrica σ
σ=
nqτ
m
σ = nqµ
µ=
qτ
= mobilidade
m
(82)
que é o chamado modelo de Drude para a condutividade. A constante τ é normalmente
chamada de tempo de relaxação e pode ser determinada a partir da medida experimental
de σ e do suposto conhecimento das demais constantes. Normalmente τ ~ 10-14 – 10-15
3
1

sec. Se considerarmos a velocidade térmica dos elétrons,  mv02 ~ KT  determinada
2
2

para a temperatura ambiente vo ~ 107 cm/s, o que nos leva a um caminho médio entre
colisões da ordem de 1 a 10 Å consistente com nossa suposição de que os elétrons
colidem com os íons da rede é razoável.
Um caso de bastante interesse é a resposta do sistema sujeito a campos
magnéticos estáticos. Antes de tratarmos este caso, vamos considerar os portadores
neste meio colisional sujeito a uma força externa F (t ) qualquer. Sendo I/ τ a taxa de
colisão, a probabilidade de que um elétron sofra uma colisão entre t e t + dt é
dt
τ
e,
 dt 
portanto, a probabilidade de que ele não sofra colisão entre t e t + dt é 1 −  .
τ 

Assim, se em t o momento do portador é p (t), em t + dt será dado por (para
elétrons que não colidiram)
[
 dt 
p (t + dt ) = 1 −  p (t ) + F (t )dt
τ 

]
(83)
onde o termo em [ ] representa a evolução de p para o portador sujeito a uma força
externa F (t). O termo multiplicativo inicial representa a probabilidade da não ocorrência
de colisão, pois caso haja colisão, todo momentum adicionado pela força é distribuído.
Expandindo a expressão acima, retendo somente termos lineares em dt, obtemos:
d p (t )
p (t )
=−
+ F (t )
dt
τ
(84)
60
Isto mostra um resultado muito importante, o efeito de colisões individuais de cada
elétron é o de introduzir dissipação de movimento para o sistema. Esta equação é geral
e mostra a evolução temporal de um sistema sujeito à força externa e a relaxação,
simultaneamente.
Vamos aplicar este resultado num caso de bastante interesse, quando um condutor
conduzindo corrente é colocado na presença de um campo magnético estático H . Este
efeito é conhecido como efeito Hall.
III.11 - Efeito Hall como Aplicação da Equação Geral de Transporte
Imaginemos a situação onde um condutor sujeito a um campo Ex, como mostra a
figura 32, é colocado num campo Hz.
O campo magnético tenta defletir as cargas em movimento criando um acumulo de
cargas positivas de um lado e negativas no outro lado que promove o aparecimento de
um campo Ey.
A força sobre os portadores, neste caso, é:


p
F (t ) = q  E +
xH 
mc


(85)
e, portanto, a equação de movimento da carga neste caso será:

 p
dp
p
= qE +
xH  −
dt
mc

 τ
Fig. 32 - Efeito conjugado de campos elétricos e magnéticos num condutor
(86)
61
Se imaginarmos que o sistema já passou pelo período transiente e atingiu o estado
estacionário
dp
= 0 . Obtemos, então, o sistema:
dt
px

qE x + ω c p y − τ = 0

qE + ω p − p y = 0
c x
 y
τ
onde ω c =
(87)
qH
nqτ
. Multiplicando as equações acima por
e usando jx = nqvx, tiramos ( ω c
mc
m
é a frequência ciclotron):
σ 0 E x = −ω cτj x + j x
σ 0 E y = ω cτj y + j y
onde σ 0 =
nq 2τ
é a condutividade de Drude já determinada.
m
Quando as cargas atingem as faces jy = 0 , assim podemos determinar:
ω τ
E y =  c
 σ0

H
 j x =
jx
nqc

definindo uma importante quantidade conhecida como o coeficiente de Hall RH
RH =
Ey
j xH
=
1
nqc
(88)
Um importante fator na determinação experimental deste coeficiente está na
dependência com q, o que pode revelar o tipo de portador responsável pela condução do
material em questão, já que RH é sensível ao sinal de q.
62
III.12 – Gases Reais e Forças Intermoleculares1
Toda teoria cinética de gases que desenvolvemos até aqui considera as partículas
constituintes dos gases como sendo pontos materiais que carregam momentum e que
podem trocar esta quantidade de movimento com as demais partículas ou com as
paredes do recipiente que as contém. Em algumas situações imaginamos as moléculas
como sendo esferas duras (tipo bolas de bilhar) e pudemos determinar com este modelo
o número de colisões por unidade de tempo, o caminho livre médio e, através destes
conceitos, determinamos as propriedades de transporte mais importante para o gás.
O gás que estudamos até agora obedecem a lei dos gases ideais PV = NKT,
segundo a qual o volume de cada molécula ou a existência de interação entre eles não
se manifesta e nem é importante. Tanto que as variáveis P e V na equação acima são
permitidas terem qualquer valor de 0 a ∞. Mas qual é o significado de V = 0 quando
sabemos que as moléculas apresentam por si só um volume? Isto mostra que existe um
limite mínimo para a compressão do gás.
Quando levamos em conta a existência de forças intermoleculares bem como o
tamanho finito das moléculas denominamos o gás como sendo imperfeito ou real. Neste
caso, a equação de estado difere um pouco do estado ideal. É claro que a manifestação
do caráter não ideal dos gases, depende muito em que condições este se encontra.
Normalmente em regimes de altas densidades a interação intermoleculares, bem como o
efeito de volume finito das moléculas manifesta-se de forma bem mais marcante. Esperase, no entanto, que a lei dos gases ideais continue válida para baixas densidades. Assim,
é esperado que a lei dos gases ideais apresente correções que deverão tornar-se
irrelevantes para N/V → 0. Podemos, então, escrever
2
PV
N
N 
= 1 + B'
+ C'   + ...
NKT
V
V 
(89)
onde N é o número total de partículas no volume V. Quando estamos tratando com 1 mol
de gás, a equação é escrita como:
P .V
B (T ) C (T )
=1+
+
+ ...
RT
V
V2
1
Baseado no livro: A Estrutura Quântica da Matéria – J. Leite Lopes
(90)
63
onde B(T), C(T) são denominados de segundo e terceiro coeficiente do Virial. Observase que B(T) é negativo para todos os gases à baixas temperaturas. Ao aumentarmos a
temperatura, B aumenta tornando-se positivo. A temperatura para qual B = 0 é
denominada de temperatura de Boyle.
Vamos tratar o gás de uma forma simples (embora a equação (90) seja mais
geral) e obter a equação de estado.
Devido ao volume finito das moléculas, esperamos que
3
4 d 
lim V = b = π   N
p→∞
3 2
com d = diâmetro molecular.
Desta forma, a primeira correção que podemos fazer na equação dos gases ideais
é que
P(V-b) = NKT
ou seja, quando p → ∞, V → b.
Imaginamos, agora, que exista uma certa atração entre as moléculas. Se
olharmos para uma molécula próxima da parede do recipiente, veremos que o efeito da
interação com os vizinhos é o de efetivamente diminuir a interação da molécula com a
parede, diminuindo efetivamente a pressão do gás.
Fig. 33 – Interação de moléculas com vizinhos
O efeito da interação deverá ser maior no decréscimo de pressão quanto maior for
a densidade n, pois neste caso as partículas estarão mais próximas. Sendo um efeito de
interação de pares esperamos que a correção seja proporcional a n2. Assim, vamos dizer
64
que o termo de correção é proporcional a l/V2 e a constante de proporcionalidade será
denominada de a, ou seja,
P =
NKT
a
− 2
V −b V
de modo que
a 

 P + 2  (V − b ) = NKT
V


(91)
que é denominada de equação de Van der Waals para um gás real.
A dedução da equação de Van der Waals pode ser feita através de uma
aproximação que consiste na utilização do teorema do virial.
Antes de iniciarmos a dedução propriamente dita, vamos relembrar alguns
resultados mais gerais da mecânica.
Consideremos uma partícula de massa m sujeito a uma força F temos, então:
F = m x&&
Através do produto escalar com sua posição x
( ) ( )
m x&&.x = F .x
Como
2
d2 2
x = 2 x .x&& + 2 x&
2
dt
como
( x .x&& ) =
temos que
m d2 2
x − m x& 2 = F . X
2 dt 2
1 x2
− x& 2
2 dt 2
65
Como o estado macroscópio de um gás não muda com o passar do tempo quando
este gás está em equilíbrio, o centro de massa do sistema não deve alterar sua posição.
Assim, podemos escrever a seguinte equação:
2 
d 
ma x A  = 0
∑

dt  A

(92)
onde a soma deve ser feita sobre todas as moléculas do gás.
Multiplicamos (93) por
1 1
e tomando derivadas, obtemos:
N2
1 1 d d
N 2 dt  dt
∑m
A
A
2 
1
xA =
 N
∑m
A
x& A2 +
A
1
N
∑ F .x
A
(93)
A
e como, da equação (93), o primeiro membro é zero, decore que para cada molécula,
<
2
1
1
mv >= − ( F .x )
2
2
(94)
i.e., a energia cinética média das moléculas de um gás em equilíbrio é igual a média do
produto escalar da força pela posição das moléculas com sinal trocado.
Vamos utilizar este resultado para deduzirmos a equação de Van der Waals.
Imaginemos um gás onde a força exercida sobre uma molécula A devido a interação com
(i )
as demais moléculas, é representada por F A . Podemos ainda ter uma força externa
(e)
F A agindo sobre esta molécula. Pelo resultado da equação (94),
(
)
(
1
1
1
m A v A2 = − ∑ x A .F A( i ) − ∑ x A .F A( e )
∑
2 A
2 A
2 A
)
Vamos admitir que as forças intermoleculares sejam do tipo:
i
FA =
( xA − xB )
F ( r AB )
r AB
B≠A
∑
c/
r AB = x
A
− xB
66
Como estamos somando sobre todos pares para efetuar a soma
∑x
(i )
A
FA ,
A
podemos deslocar a origem para B, de modo a ficar
∑x
A
FA
(i )
=
A
como
( x A − xB )
r
ab
∑r
AB
F ( r AB ) . Assim,
A,B
está na direção da linha entre A e B, assumindo que a origem de
coordenadas esteja sobre A, temos
xA .
( xA − xb )
= rA = B
rAB
(95)
de modo que podemos escrever :
1
2
∑m
A
2
A
vA = −
1
2
∑r
AB
F ( r AB ) −
AB
1
2
∑x
(e )
a
.F a
(96)
A
Pelo teorema de eqüipartição de energia, as N moléculas apresentam uma
energia N
3
KT . Como esta energia é o primeiro termo da equação, temos:
2
(e)
3 NKT = −∑ rAB F ( rAB ) − ∑ x A .F A
AB
(97)
A
A força externa F(e) pode ter sua origem nas paredes do recipiente, originando
uma pressão sobre o gás. Se P é a pressão do gás, n o vetor unitário normal à
superfície, de modo que n ds representa o elemento de área em cada ponto, a força
exercida pelo elemento de área será – P n ds, ou seja:
67
− ∑ x A .F A = P ∫ ( x .n )ds
(e)
A
(98)
S
onde S = área do recipiente.
Usando o teorema do divergente, expressão (98) torna-se:
= P ∫ ( ∇.x )d 3 x = 3 P .V
(99)
V
3
pois ∇.x = 3 , e V = ∫ d x é o volume do recipiente. Assim,
3NKT = 3PV − ∑ rABF ( rAB )
AB
ou
PV = NKT +
1
3
∑r
AB
(100)
F ( rAB )
AB
que corresponde à equação de estado do gás real no caso onde a interação molecular
tem a forma de força central. Nesta formulação o gás perfeito é aquele onde F(rAB) = 0.
A soma dos termos de força da equação acima podem ser, em média, escritas
como:
∑r
AB
AB
F ( r AB ) =
1
N ( N − 1 ) < rF >
2
Cada uma das N moléculas interage com (N-1) e para não contarmos duas vezes
o mesmo par, temos que o número total de pares interagindo é 1 N ( N − 1 ). Mas como N
2
23
é muito grande (~10 ),
1
1
N( N − 1 ) ≅ N 2
2
2
de modo que ficamos com uma equação dada por
pV = NKT +
1 2
N < rF >
2
(101)
68
Assim, para calcularmos a correção do gás ideal devido a interação molecular
temos que conhecer F(r) e calcularmos a média < rF >.
Se a energia potencial de interação entre duas moléculas for U(r), a probabilidade
de que duas moléculas estejam separadas dentro da distância r→r+ dr (probabilidade de
pares) é obtida da mecânica estatística, como sendo:
f ( r )dr =
4π − U ( r ) / KT r 2 dr
∫e
− U ( r ) / KT
d3X
de modo que este será o “peso estatístico” no cálculo do valor médio de rF. Como
F =−
dU
, o valor médio < rF > pode ser escrito como:
dr
dU
dr
dr
− U ( r ) / KT 3
d X
∫e
∞
< rF >= −
4π ∫ e −U ( r ) / KT r 3
0
0
Vamos denominar I = ∫ e −U ( r ) / KT d 3 x de modo que ficamos com
pV = NKT −
Como
1 2 4π
N
6
I
∫
∞
e −U ( r ) / KT r 3
0
dU
dr
dr
d −U ( r ) / KT
1 −U ( r ) / KT dU
e
=−
e
multiplicando e dividindo por KT, teremos:
dr
KT
dr
pV = NKT +
1 2 4π
N
KT
6
I
∫
∞
0
r3
(
)
d
e −U ( r ) / KT dr
dr
ou seja:
2 πN

pV = NKT 1 +
3 I

∫
∞
0
r3
(
)
d −U ( r ) / KT 
e
dr 
dr

(102)
mostrando a equação de estado de um gás imperfeito, como função do potencial de
interação entre as partículas.
69
Vamos, inicialmente, considerar o caso do chamado potencial de esfera dura, como
mostra a fig. 34.
Fig. 34 – Potencial de esfera dura
0 r > d
U (r ) = 
∞ r < d
de modo que
e −U ( r ) /
Assim,
∫
∞
0
KT
1 r > dd
= 
0 r < d
r 3 d ( e −U ( r ) / KT = d 3 , e I = V, tomando a expressão anterior fica:
2 N 

PV = NKT 1 + π d 3 
3 V


Se chamarmos b =
2
πN ( d )3 , obtemos:
3
b

PV = NKT  1 + 
V 

ou seja:
PV
b 

1 +

V 

= NKT
70
Quando b << 1,
V
1
1+
b
V
≅1 −
b
e obtemos como aproximação
V
P (V − b ) = NKT
(103)
O potencial que tomamos neste exemplo, representa o fato de na realidade as
moléculas apresentarem um volume finito, e o efeito disto na lei dos gases ideais é a
alteração do valor do volume à disposição para as moléculas como na equação de Van
de Waals.
Além de apresentar um volume finito, que representa uma forte interação a curtas
distâncias, existe uma interação à longa distância que embora pequena, tem um efeito
considerável na equação de estado.
Consideremos, então, um potencial atrativo mostrado na figura 35.
U( r ) ≅ −
B
, B>0
rn
(104)
com a observação explicita que lim U(r) = 0
r→∞
Assim, a interação de (102) fica:
2
N
π
3 VKT
∫r
3
e −U / KT
dU
a
dr = −
dr
NKTV
( a >0 )
ou seja,
pV = NKT −
a
V
71
Fig. 35 – Potencial combinado de atração-repulsão
Vamos melhorar o modelo introduzindo um potencial que combina ambos
potenciais vistos anteriormente, ou seja:

∞

U ( r ) = − W
− B
 n
r
com a condição W << 1 , e − W
/ KT
KT
2 N
π
3
I
r <d
d < r < r0
(105)
r < r0
~ 1 obtemos:
∫
∞
0
r 3 ( e − U ( r ) / KT )dr ≅
b
a
−
V
NKTV
b a

PV = NKT 1 +  −
V  V

que para
b
<< 1 , pode ser escrita como
V
a 

 P + 2  (V − b ) = NKT
V 

(106)
que é a equação de Van der Waals, mostrando que realmente a correção na pressão
deve-se à interação de longo alcance entre moléculas e a correção no volume deve-se
ao volume finito apresentado pelas moléculas.
72
As constantes a e b são normalmente denominadas de constantes de Van der
Waals onde b é determinado através do diâmetro molecular e a através da lei de força
de atração entre moléculas.
Para determinadas temperaturas podemos fazer gráficos de P vs V, obtendo as
curvas que são denominadas de isotermas. Para altas temperaturas as isotermas de Van
der Waals são bem parecidas com as hipérboles que obtemos com a lei dos gases
ideais. No entanto, à medida que atingimos baixas temperaturas as isotermas começam
a apresentar desvios chegando ao caso onde elas apresentam máximos e mínimos. A
transição de um comportamento para outro ocorre quando o máximo e o mínimo
coincidem. Neste caso, temos no diagrama de isoterma uma linha horizontal tangente a
ponto de inflexão. A temperatura onde ocorre o ponto de inflexão é denominada de
temperatura crítica (Tc) e P e V para este determinado ponto são denominados de
valores críticos Pc e Vc.
Fig. 36 – Isotermas P x V para gás real
A existência do ponto crítico denota a ocorrência de mudança de fase no sistema
o que existe apenas para sistemas de gases reais.
O gás de Van der Waals é uma primeira aproximação realística dos gases
prevendo a formação de um líquido. Detalhes maiores deste tipo de efeito deverão ser
abordados num curso de Mecânica Estatística.
73
III.13 – A Teoria Cinética e o Movimento Browniano
Vamos imaginar a situação física, onde uma partícula está presente num meio
viscoso podendo realizar um movimento desordenado. Este é, por exemplo, o caso de
uma molécula dce soluto em solução de uma molécula gasosa num gás estranho ou de
uma minúscula partícula sólida num líquido (veja fig. 37).
Fig. 37 – Movimento browniano
Neste caso, a chamada equação de movimento para a referida partícula de soluto
é dada por:
m
dv
=− {
βv + {
F (t )
dt
vis cos a
aleatória
A força F(t), aleatória advém de colisões com outras partículas. A equação acima
é chamada de equação de Langevin e estamos interessados em conhecer o
deslocamento quadrático médio desta partícula neste meio. A equação acima pode ser
escrita como:
d

m  ( xv ) − v 2  = − βxv + xF ( t )
 dt

tornando a média temporal, tiramos :
m
d
xv − m v 2 = − β xv
dt
74
onde usamos o fato que a força F(t) é aleatória e, portanto, F ( t ) = 0 . Da teoria cinética,
temos que
1
1
m v 2 ~ KT
2
2
de modo que
m
1
d
xv = KT − β xv
dt
d
2
resolvendo para xv = 2 dt x , tiramos
x2 =
β
− t 
2 KT 
m 
m 
t
−
1
−
e


β 
β 

Para tempos curtos, a exponencial pode ser expandida até ordem t2 e, desta
forma, obtemos para o deslocamento médio quadrático.
x2 ≅
Para t <<
m
β
KT
β
t2
, o termo entre parênteses desaparece e ficamos com outra dependência
temporal para x 2 :
x2 ~
2 KT
β
t
Na teoria de difusão obtém-se como solução da equação de Fick que o
deslocamento quadrático médio está relacionado com o coeficiente de difusão através
de:
⟨x2⟩ = 2Dt
de modo que obtemos para o coeficiente de difusão:
75
D=
KT
β
mostrando que o coeficiente de difusão neste caso depende da agitação térmica dos
constituintes e da capacidade do soluto em perder energia através do processo viscoso.
Este sistema físico, discutido acima, é normalmente chamado de movimento
Browniano, originalmente observado para partículas em suspensão por Robert Brown
(1827). Este movimento foi profundamente analisado por Einstein que mostrou ser
devido às constantes colisões aleatórias que as moléculas de um meio exercem sobre
outra. Uma importante característica deste movimento é que o percurso percorrido por
uma partícula devido ao processo de difusão é:
L2
dependência esta, bastante usada em física.
∝t
Universidade de São Paulo
Instituto de Física de São Carlos
Departamento de Física e Ciência dos Materiais
FÍSICA MODERNA ELEMENTAR
CAPÍTULO IV
INTEGRAÇÃO DO CAMPO ELETROMAGNÉTICO COM O SISTEMA ATÔMICO
AUTORES:
PROF. DR. VANDERLEI SALVADOR BAGNATO
PROF. DR. LUIS GUSTAVO MARCASSA
São Carlos, Junho 1999
2
CAPÍTULO IV
INTERAÇÃO DO CAMPO ELETROMAGNÉTICO COM O SISTEMA ATÔMICO
IV.1. INTRODUÇÃO
Neste capítulo vamos introduzir o conceito de radiação eletromagnética e tratar os
aspectos básicos de sua interação com o sistema atômico. Através desta interação é que
convencionalmente realiza-se estudos com respeito aos fenômenos atômicos envolvendo
a estrutura interna dos átomos, seu comportamento quando agrupados formando sólidos,
etc. É através da interação radiação-átomo que vemos o mundo ao nosso redor.
Ao interagir com o átomo os campos elétricos alteram consideravelmente a
distribuição de cargas no sistema, literalmente chacoalhando as cargas, havendo a
possibilidade de transferência de energia e momentum do campo eletromagnético para o
átomo. Estudaremos neste capítulo as formas e variações pelas quais ocorre esta
transferência de energia introduzindo uma série de novos conceitos que serão
importantes quando estudarmos a interação da radiação com átomo com base na
mecânica quântica. Conceitos importantes que dominam a física moderna podem ser
introduzidos a partir do modelo clássico simples que aqui iremos tratar.
IV.2. BREVE INTRODUÇÃO AO CAMPO ELETROMAGNÉTICO DE RADIAÇÃO
Vamos iniciar nosso estudo considerando as equações de Maxwell do
eletromagnetismo. Possuindo distribuições de cargas e correntes como sendo fontes de
campos, podemos escrever as equações de Maxwell da seguinte forma:
r
r r 4π
1 ∂D
∇xH =
j+
c
c ∂t
r
r r
r r 1 ∂B
∇.B = 0
∇xE =
c ∂t
r r
∇.D = 4πρ
(1)
r
r
r
r
e se substituirmos B = µH e D = εE , onde µ é a permissividade magnética e ε a
constante dielétrica do meio que assumiremos como sendo constantes, ficamos com
3
r r
ε∇.E = 4 πρ
r
∇. B = 0
r
r r 4π r
∂E
µJ + µε
∇xB =
c
∂t
r
r r 1 ∂B
∇xE =
c ∂t
(2)
Se estivermos bastante distante das fontes (carga e corrente) podemos desprezar
r
J
os termos em ρ (densidade de cargas) e
(densidade de corrente) e ficamos com um
conjunto de equações mais simples:
r
∇. E = 0
r
∇. B = 0
r
r r
1 ∂B
∇xE = −
c ∂t
r
v 1
∂E
∇xB = µε
c
∂t
(3)
As últimas equações têm uma informação bastante importante que mesmo na
ausência de fontes um campo magnético variando no tempo gera um campo elétrico e
vice-versa. Este é o princípio básico da onda eletromagnética que nada mais é senão
uma auto-sustentação entre os campos elétricos e magnéticos, permitindo o transporte
de energia, mesmo na ausência de matéria.
Tomando o rotacional da última equação acima e usando a propriedade que
r
r
r r r
∇x(∇xA) = ∇ ∇. A − ∇ 2 A , temos que
r r
r
r µε ∂ r r
∇x(∇xB) = ∇(∇. B) − ∇ 2 B =
(∇xE)
c ∂t
(4)
v
e utilizando a equação para ∇xE , tiramos que
r r
µε ∂ 2 r
−∇ 2 B = −
B
c 2 ∂t 2
(5)
4
ou seja
2r
∇ B−
r
µε ∂ 2 B
c2
∂t 2
=0
(6)
que é a famosa equação de onda mostrando que as equações de Maxwell prevêem que
o campo magnético e o elétrico obedecem às equações de uma onda que se propaga
com velocidade
1
v
2
=
µε
c2
, ou seja,
v=
onde
c
µε
com c = 3 x 1010 cm / s
(7)
µε = n é o índice de refração. No vácuo a velocidade da luz é c. Podemos
escrever a mesma equação acima para o campo elétrico, obtendo:
2r
∇ E−
r
µε ∂ 2 E
c2
∂t 2
=0
(8)
A direção deste campo elétrico é chamada de direção da polarização e pode ter
várias formas distintas. Vamos chamar esta direção de ê, de modo que a solução da
equação de onda tem a forma:
r
$ 0 cos( kx − ωt + φ)
E = eE
(9)
que representa uma onda que propaga-se na direção x, com amplitude E0 na direção ê,
freqüência ω e vetor de onda k =
2π
.
λ
Como o vetor de onda está associado a freqüência através de
k=
o campo elétrico pode ser escrito como
ω
c
(10)
5
r
 x − ct

E = eˆE 0 cos
+φ
 λ

(11)
onde φ é uma fase que depende das condições iniciais. (Por simplicidade estamos
considerando vácuo µε ~ 1).
Com esta solução para o campo elétrico podemos usar as equações de Maxwell e
obter a solução para o campo magnético.
r
B = eˆ' B0 cos(kx − ωt + φ )
onde
(12)
e$ ′ = x$ x e$ e B0 = E 0 . Isto mostra que a direção do vetor campo magnético é
perpendicular ao campo elétrico, e ambos são perpendiculares à direção de propagação,
r
no caso x .
A onda que descrevemos acima é chamada de onda plana pelo simples fato de
descrever um plano, já que os valores de E e B só dependem de x e não de y e z.
O desenho a seguir representa a onda num determinado instante.
Fig. 1 – Representação esquemática dos campos numa onda plana
Para uma determinada posição, os campos elétricos oscilam periodicamente no
tempo, e se “congelarmos” o tempo (como mostrado acima), os campos oscilam
periodicamente no espaço.
A freqüência de oscilação dos campos determina o que chamamos de “cor” da
radiação eletromagnética e, dependendo de seu valor, ela pode ou não ser observada
pelos órgãos visuais humano. Assim, a classificação da radiação eletromagnética pela
sua freqüência está mostrada a seguir (fig.2).
6
Fig. 2 – Regiões espectrais da radiação
Em ótica normalmente usamos as unidades micron (µ) e angström (Å) definidos
como 1µ = 10-6m, 1Å = 10-10m. Logo, o comprimento de onda correspondente ao centro
da região visível pode ser expresso por 0,55µ ou 5550Å.
Os limites de espectro visível não são bem definidos porque a curva de
sensibilidade dos órgãos visuais se aproxima assintoticamente para maiores ou menores
comprimentos de onda. Se tomarmos arbitrariamente como limites para o visível os
comprimentos de onda para os quais a sensibilidade humana cai a 1% de seu máximo,
seus valores serão cerca de 4300Å e 6900Å.
A onda que discutimos anteriormente é linearmente polarizada, de modo que a
direção do campo elétrico era fixo ê. Este não é o único estado possível para a
polarização de fato, quando a direção na qual o campo elétrico é orientado não é bem
definida, temos o que chamamos de radiação não polarizada. Pode, no entanto, ocorrer
que o vetor campo elétrico gira na medida que a onda propaga-se. Nesta situação
dizemos que a luz é circularmente polarizada, podendo estar circularmente polarizada à
direita ou à esquerda. É claro que em todos os casos o campo magnético acompanha o
campo elétrico sendo sempre perpendicular a ele. No caso da onda circularmente
polarizada, o vetor ê é um vetor girante.
Assim, no caso mais geral, onde a polarização é descrita por ê, e a direção de
r
propagação é n , a onda plana é escrita como:
r r
r r
$ 0 cos( k. r − ωt + φ)
E ( r , t ) = eE
(13)
7
r
r
sendo o vetor de onda k = kn sempre na direção de propagação.
A onda pode ser composta de várias freqüências diferentes, ao invés de uma única
(monocromática). Neste caso, temos:
r
r r
E (r , t ) = ∑ eˆE0 (ω ) cos(k .ωt + φk )
(14)
ω ,k
caracterizando a chamada radiação não monocromática.
A intensidade média (potência por unidade de área) transportada pela onda é
calculada como sendo:
I=
cE 20
8π
(15)
Os campos que fazem parte da radiação são capazes de trabalhar sobre cargas ou
correntes, de modo que o campo eletromagnético contém determinada energia. Numa
r
r
região do espaço onde o campo elétrico é E e o magnético B , a densidade de energia é
exatamente:
µ=
(
1 r2 r2
E +B
8π
)
(16)
)
(17)
de modo que a energia total contida num volume V é
U=
(
r2 r2
1
∫ E + B dV
8π V
Considerando as ondas planas, linearmente polarizadas, a densidade de energia
é:
µ
(
(
)
(
r r
r r
1
E 20 cos2 k. r − ωt + φ + E 20 cos2 k. r − ωt + φ
8π
=
(
r r
1 2
E 0 cos2 k. r − ωt + φ
4π
)
))
(18)
8
r
se esta onda propaga-se na direção k , ocupando uma área transversal de valor A,
passará uma quantidade de energia µAc∆t durante o intervalo de tempo ∆t.
Fig. 3 – Volume imaginário que contém a radiação
Assim, a quantidade de energia é U = µAc∆t e, portanto, a intensidade
I=
I=
U
= µ. c
A∆t
(19)
rr
1 2
E 0 cos 2 ( k .r − ω t + φ )
4π
(20)
rr
2
Se tomarmos a média temporal, lembrando que cos ( k. r − ωtk ) ~ 1/2
I=
1 2
E0c
8π
(21)
Esta é a quantidade média de energia transportada pela onda por unidade de
tempo e área. É importante lembrar que aqui estamos utilizando o sistema CGS de
unidades de modo que C = 31010 cm/s e a unidade de campo elétrico é Stat Volts/cm (1
stat volt ≅ 300 V). Neste sistema, intensidade deve ser expressa em
erg
s. cm
2
(1W = 107
erg/sec).
IV.3. INTERAÇÃO DA RADIAÇÃO COM A MATÉRIA: ABSORÇÃO DE ENERGIA
Vamos iniciar nossos estudos sobre a interação do sistema atômico com a
radiação através de um modelo bastante simplificado. Para nós, em primeira
9
aproximação, o átomo nada mais é senão uma carga positiva rodeada de uma nuvem de
carga negativa, distribuída uniformemente ao seu redor. Como modelo simplificado
vamos supor que o sistema comporta-se como se a carga negativa estivesse
harmonicamente ligada.
Quando a radiação incide sobre este sistema, o campo elétrico deforma esta
suposta densidade uniforme de carga tendendo a afastar cargas negativas das positivas.
Como resultado desta deformação, há indução de um dipolo elétrico no átomo que sobre
a presença do campo faz com que suas cargas oscilem forçosamente.
Fig. 4 – Modelo simples para interação radiação-átomo
Assim, o efeito da radiação sobre o meio (no caso átomos), é basicamente o de
produzir uma polarização.
O campo da radiação oscila temporalmente e espacialmente. A oscilação espacial
ocorre em intervalo da ordem de λ (comprimento de onda) que é normalmente da ordem
de 103 a 104 Å. As dimensões atômicas são, no entanto, muito menores da ordem de 1Å.
Desta forma, a distribuição de cargas no átomo não sente grandemente a variação
espacial do campo e para qualquer efeito prático, para o átomo é como se o campo de
radiação
somente
oscilasse
temporalmente.
Isto
estabelece
uma
simplificação
importante.
Vamos imaginar uma amostra que contenha N átomos/volume, interagindo com
uma onda plana. Na aproximação na qual o elétron está preso harmonicamente, a
equação de movimento para cada elétron na presença do campo é:
r
m&r& + mω 02 r = −eE0 cos(ωt )
(22)
onde m = massa elétron, ω0 = freq. natural de oscilação.
É de esperar que o elétron seja arrastado pelo campo, oscilando junto com ele, de
modo que a solução da equação acima deva ser da forma:
10
r r
r = r0 cosωt
(23)
e substituindo na equação inicial, tiramos:
r
r
− mω 2 r0 + mω 02 r0 − er 0 cos ωt
(24)
r
− eE 0 / m
r
r0 =
ω 20 − ω 2
(25)
tendo como valor de r0
r r
Sendo r = r0 cos ωt o deslocamento do elétron, o dipolo induzido em cada átomo
será:
r
r
r
p = − er = − er0 cos ωt
(26)
Para o sistema total (N átomos/cm3), o dipolo induzido leva a uma polarização do
meio, cujo valor nada mais é senão a soma de todos os dipolos na unidade de volume, ou
seja:
r
r
r
P = Np = − Ner0 cos ωt
r
r
Ne 2 E 0 / m
P=− 2
ω − ω 02
(27)
(28)
Desde já observamos que esta polarização induzida será mais intensa quando a
freqüência de oscilação do campo for igual à freqüência natural de oscilação do sistema
denominada de freqüência de ressonância.
Do eletromagnetismo sabemos que:
r r
r
r
D = E + 4 πP = (1 + 4 πχ e ) E
de modo que tiramos
(29)
11
r  4 πNe 2 / m  r
D = 1 −
ωt
 E 0 cos4
r 3
ω 2 − ω 0  142

E
(30)
e utilizando as equações de Maxwell:
r r
∇.B = 0
r
r 1 ∂D
∇xB =
c ∂t
r
∇.D = 0
∇xE =
(31)
- 1 ∂B
c ∂t
obtemos que, após tomarmos o rotacional da última equação
1
c2
∇2 E −
 4 ρNe 2 / m  ∂ 2 E
=0
1 − 2
2 
2
ω
−
ω
∂
t
0 

(32)
mostrando que a propagação da onda neste meio, ocorrerá com velocidade v dada por:
1  4 πNe 2 / m 
=
1 − 2

v 2 c 2 
ω − ω 20 
1
(33)

Ne 2 / m 
2
n
=
1
−


e como v = c(n), termos
2
2 como sendo o índice de refração do meio
 ω − ω 0 
para a propagação desta radiação. Eliminando n(ω) temos:
n( ω ) = 1 +
4 πNe 2 / m
ω 20 − ω 2
≅ 1+
2 πe 2 N / m
ω 20 − ω 2
(34)
para gases cujo n(ω) não difere muito da unidade.
Apesar de n(ω) tomar em algumas condições valores menores que 1, não significa
 c
que v > c. Apenas a definição de v =  não é mais adequada.
n
12
Esta expressão para o índice de refração não é muito adequada para freqüências
da radiação próximas de ω0, pois observamos a ocorrência de divergências. A razão
desta divergência fazendo com que a polarização seja infinita nas proximidades de ω0
advém do fato que o modelo, até o momento, não tem uma forma de dissipar energia.
Somente adquirindo a energia do campo, os elétrons oscilam cada vez com amplitude
mais elevada, levando a uma divergência.
Fig. 5 – Relação n(ω) versus ω.
A fim de tornar nosso modelo mais realista, temos que introduzir no sistema
dissipação de energia. Assim, teremos que adicionar na equação de movimento um
termo de força proporcional à velocidade e oposta a ela, responsável pela dissipação.
Fisicamente, este termo pode ser interpretado como a radiação emitida pelo dipolo
oscilante como se fosse uma antena. Assim, a nova equação de movimento é:
r
r
r
mr + mζ r + mω 20 r = eE 0 cos ωt
(35)
onde ζ é chamada de constante de amortecimento e está relacionada com a taxa de
dissipação de energia e será relacionada com os parâmetros físicos do sistema mais
adiante.
Anteriormente a solução estava em fase com o campo. Com a adição do termo
dissipativo isto não é verdade necessariamente verdade, e a solução deverá ser da
forma:
r r
r = r0 cos(ωt + φ)
(36)
13
r
onde agora r0 e a fase φ dependerão dos vários parâmetros do problema.
Da solução proposta, tiramos:
r
r
r = −ωr0 sen(ωt + φ )
(37)
r
r
r = −ω 2 r0 cos(ωt + φ )
(38)
e expandindo o seno e coseno da soma na equação original, temos:
r
r
−ω 2 r0 cos ωt cos φ + ω 2 r0 senωtsenφ
r
r
−ωζ r0 senωt cos φ − ωζr0 cos ωtsenφ
+ω 20 cos ωt cos φ − ω 20 senωtsenφ = −
(39)
eE 0
cos ωt
m
Como esta equação tem que ser válida para qualquer instante de tempo, os termos
em senωt e cosωt têm que estar em equivalência, isto é, a soma de seus coeficientes
devem se anular. Assim,
( −ω
2
)
cos φ − ωζsenφ + ω 20 cos φ r0 = −
ω 2 senφ − ωζ cos φ − ω 20 senφ = 0
eE 0
m
(40)
(41)
Da segunda equação tiramos:
tan φ =
ωζ
(42)
2
ω − ω 20
e usando relação cos2φ + sen2φ = 1, obtemos
senϕ = −
cosφ = −
(ω
(
ζω
2
0
−ω2
)
2
+ ζ 2ω 2
ω 2 − ω 20
ω 20
−ω
)
2 2
(43)
(44)
2
+ζ ω
2
14
Utilizando estes valores na primeira equação, temos:
(
)
 2 2
ω ω − ω 02

r0
+

2
2 2
ω
−
ω
0

(
)
ζ 2ω 2
(ω
2
0
−ω2
(
(
)
−
(ω
)(
)(
ω 02 (ω 2 − ω 02 )
2
0
−ω2
)
2
)
)

2
2
2
2
2 2
r  ω − ω0 ω − ω0 + ζ ω
r0 
 ω 20 − ω 2 ω 20 − ω 2 + ζ 2 ω 2


 = − eE 0

m
+ ζ 2ω 2 

r

eE 0
=−
m


(45)
e, portanto, a amplitude de oscilação é dada por:
r
eE 0
1
r
r0 = −
1/ 2
m 
2
2 2
2 2
 ω − ω0 + ζ ω 


(
(46)
)
Com o valor de r0 podemos escrever a polarização do meio como sendo:
v
r
r
P = − Ner0 = − Ner0 cos(ωt + φ)
(47)
r
r
v
P = − Ner0 cos ωt cos φ + Ner0 senωtsenφ
(48)
ou seja,
e substituindo os valores encontrados acima, temos:
(
)
r
r
r Ne 2
E 0 ω 02 − ω 2
ζωE 0
Ne 2
P=
cosωt +
senωt
m ω 02 − ω 2 2 + ζ 2ω 2
m ω 02 − ω 2 + ζ 2ω 2
(
)
(
)
(49)
Assim, na presença da radiação, o meio responde com duas partes distintas: uma
completamente em fase com a radiação incidente (termo cosωt) e outra 90° fora de fase
com a radiação incidente (termo em senωt = cos (ωt-π/2)).
É importante notar que o segundo termo é conseqüência direta da dissipação já
que ζ = 0 elimina este termo.
15
Considerando inicialmente somente o primeiro termo e utilizando a equação de
onda como anteriormente, tiramos que a parte do índice de refração denominada de
dispersiva é:
2 πNe 2
n ′ (ω ) ≅ 1 +
m
(
ω 20 − ω 2
ω 20
−ω
)
2 2
2
+ζ ω
2
(50)
O gráfico de n ′ (ω ) como função de ω está mostrado abaixo:
Fig. 6 – n’(ω) versus ω
que é a forma dispersiva correta, não apresentando divergências ao redor de ω0. Longe
da freqüência de ressonância, o sistema não nota muito a presença da radiação.
As regiões onde n ′ (ω ) aumenta com a freqüência é denominada de região de
dispersão normal, enquanto nas regiões onde n(ω ) descreve com ω são chamadas de
dispersão anômala.
O segundo termo da polarização que depende do termo dissipativo, representa na
verdade uma absorção. Ele representa a maneira pela qual a energia é dissipada. Para
melhor entendermos isto vamos calcular a taxa com que a energia é retirada do campo
de radiação, ou seja, a taxa com que o campo elétrico está trabalhando sobre as cargas
que constituem o sistema atômico. Assim, voltamos à equação inicial:
r
m&r& + mζ r& + mω 02 r = −eE cos ωt
e multiplicamos esta equação por r& escalarmente, obtemos:
(51)
16
r
r
m&r&.r& + mζr& 2 + mω 02 r .r& = −eE 0 .r& cos ωt
(52)
Reescrevendo o primeiro termo
r
r
r
d 1
1
2
2 r 2
&
&
m
(
r
)
+
m
ω
(
r
)
+
m
ζ
r
.
r
=
(
−
e
E
0
0 cos ωt ).r


dt  2
2

(53)
Notamos que o termo dentro de colchetes é exatamente a variação da energia
total do oscilador. O segundo termo representa a taxa na qual a potência está sendo
dissipada pelo sistema, pois ela representa o produto da força viscosa pela velocidade, e
finalmente o lado direito da equação representa a taxa com que a energia do campo está
sendo fornecida ao sistema, pois é o produto da força sobre o elétron pela sua
velocidade.
No regime estacionário a taxa com que a energia está sendo fornecida ao sistema
equivale à dissipada. A potência fornecida é:
r
r
( potência) P = (−eE0 cos ωt ).r
cuja média temporal fornece, após substituição de
(54)
r r
r = r0 cos(ωt + φ)
lembrando
(senωt cos ωt ) med ~ 0
( Potencia ) P =
− eE 0ω
r0 senφ
2
(55)
e usando a relação para senφ obtida anteriormente, a potência trocada com o sistema
atômico é:
(Potência) P =
− eE 02
ζω 2
2m (ω 02 − ω 2 ) 2 + ζ 2ω 2
(56)
Esta é a taxa com que a energia do campo é transferida ao sistema que
posteriormente dissipa como pode ser visto pela equação de conservação de energia da
página anterior. (Eq. 53)
17
Se fizermos um gráfico desta potência absorvida versus frequência:
Fig. 7 – Potência versus freqüência
À medida que variamos a frequência da radiação quando estamos longe da
freqüência de ressonância ω0, a potência absorvida varia como
Pα
ω2
ω4
→ 0
(57)
e, portanto, a potência transmitida ao sistema atômico é nula.
Ao aproximarmos ω de ω0 a potência absorvida cresce e é máxima exatamente
para ω = ω0.
Este comportamento gera a linha mostrada acima normalmente denominada de
linha de absorção do material átomo e é caracterizada pela sua frequência de máximo ω0
e sua largura, que é dada por:
∆ω = ζ
(58)
Assim, é graças ao termo dissipativo que o sistema consegue absorver energia
para freqüências próximas, mas diferentes de ω0.
Como dissemos anteriormente, o termo de dissipação de energia está associado
ao fato que ao interagir com o campo elétrico da radiação a carga é acelerada, e pelas
leis básicas do eletromagnetismo cargas aceleradas emitem radiação. Pode-se mostrar
que o valor médio da potência emitida por uma carga em movimento acelerado é
18
P=
2 e2
(&&)
x 2
3 c3
(59)
Se supusermos um elétron em movimento harmônico, X = X0cosωt, é fácil mostrar
que
P=
pois

X& = Xωsenωt
⇒ &x& 2 = ω 2 x& 2
2
&X& = −ω X cos ωt 
0

já que
sen 2 ωt = cos2 ωt
2 e2 2 2
ω ( x& )
3 c3
(60)
2
Comparando esta expressão com a taxa de dissipação de energia mζ r& ,
considerando x& = r& , tiramos
2 e2 ω 2
ζ=
3 c3 m
(61)
que é a constante dissipativa em termos dos parâmetros do problema. Voltemos ao
nosso meio constituído de N átomos/cm3 pelo qual a radiação é absorvida. Tomando a
variação da intensidade da onda numa distância ∆z.
Fig. 8 – Volume de controle para absorção da radiação
19
Temos que cada átomo do volume considerado absorve a potência mostrada
anteriormente. Como I =
P=
1 2
E 0 c , escrevemos:
8π
8 πc 2
I
c
(
ζω 2
ω 20
−ω
)
2 2
2
+ζ ω
2
= potência dissipada por átomo
(62)
(lembrando que I = P/A), tendo n átomos/cm3.
A[I ( z + ∆ z ) − I ( s )] = − NA∆ z
8πe 2
ζω 2
I ( z) 2
c
(ω 0 − ω 2 ) 2 + ζ 2ω 2
(63)
onde tomamos ∆z pequeno.
Assim, no limite ∆z → 0
dI
e2
ζω 2
= −8πn
I
dz
c (ω 02 − ω 2 ) 2 + ζ 2ω 2
E por definição,
(64)
dI
= −αI , onde
dz
α = 8πn
e2
ζω 2
c (ω 02 − ω 2 ) 2 + ζ 2ω 2
(65)
é o chamado coeficiente de absorção do meio, e a variação da intensidade ao propagarse no meio é:
I ( z ) = I 0 e − αz
(66)
A chamada secção de choque de espalhamento do sistema σ está relacionada
com o coeficiente de absorção através de
nσ = α
sendo
n = densidade
(67)
20
de modo que a secção de choque de espalhamento fica escrita como:
σ (ω ) =
8 πe 2
c
(
ζω 2
ω 20 − ω 2
)
2
+ ζ2ω 2
(68)
Esta secção de choque representa a capacidade que cada constituinte do sistema
(no caso os átomos) tem em remover energia da radiação eletromagnética incidente e
dependendo das regiões de frequência, ela adquire aspectos bastante interessantes.
Vamos analisar os vários casos limites para a secção de choque de espalhamento
ou absorção.
1o. caso ω << ω0 - Neste caso a freqüência da radiação é muito menor do que a
freqüência de máxima absorção do sistema. Podemos desprezar os termos em ω no
denominador e
8π 2 ζω 2
e
c
ω 40
(69)
8 πe 2 2 e 2 ω 4
c
3 c 3 m ω 40
(70)
σ(ω ) ω << ω 0 =
Se substituirmos ζ por sua expressão
σ(ω ) ω << ω 0 =
ou seja
σ(ω ) = Const.
ω4
ω 40
(71)
chamado de espalhamento de Rayleigh e caracterizado por ser proporcional à freqüência
à quarta potência. Neste caso, quanto maior é a freqüência da radiação mais
eficientemente ela interage e é espalhada pelo sistema atômico.
Este tipo de espalhamento (Rayleigh) é responsável pela aparência azul do céu.
Os gases da chamada estratosfera apresentam freqüências de absorção no ultravioleta.
Porém, a luz proveniente do sol (branca) está dominantemente no visível e, portanto
21
ω << ω0. Assim, a luz azul que compõe esta luz solar branca (que é a componente de
maior frequência) é mais espalhada do que as demais, e sendo espalhada para todas
direções ela nos atinge, e sendo sua maior componente azul, como resultado vemos o
céu azulado. Em ordem de grandeza temos σ(ω) ~ 5 x 10-25
ω ~ 10 ω0 → (σ) ω ~ 10
-2
2
o.
-33
ω4
ω 20
2
cm de modo que se
2
cm .
caso ω >> ω0 - Neste caso a frequência da radiação é muito maior do que a
absorção de modo que podemos desprezar ω0 do denominador e
σ(ω ) = const.
ω4
ω4
= Const.
(72)
A secção de choque é praticamente constante e este regime é chamado de
espalhamento Thompson, caracterizado por espalhar igualmente todas as freqüências.
Para espalhamento Thompson, temos:
σ(ω ) ~ 5 x 10-25 cm2
(73)
3o. caso ω ~ ω0 - Finalmente quando a freqüência da radiação é próxima da
freqüência natural do sistema temos o chamado espalhamento ressonante no qual a
energia da radiação não é apenas desviada espacialmente, mas é realmente absorvida
pelo átomo, tornando os átomos mais energéticos ou excitados.
Neste caso,
2
−25 ω
σ(ω ) ≅ 5 x 10
α
2
ζ
1
ω2
(74)
Quando ω ~ ω0 podemos mostrar que o espalhamento apresenta a secção de
choque
σ (ω ) ≅
3 2
λ cm 2
2π
(75)
22
onde λ é o comprimento de onda da luz incidente, assim, basicamente na ressonância, a
área efetiva para absorção de radiação é praticamente o comprimento de onda ao
quadrado.
Se fizermos um gráfico da secção de choque de espalhamento para os vários
casos que analisamos,
Fig. 9 – Comportamento da secção de choque radiação-átomo em toda a região espectral
IV.4. COMPORTAMENTO NÃO LINEAR NA INTERAÇÃO RADIAÇÃO-ÁTOMO
Como vimos até agora, a resposta do meio material à radiação é essencialmente
linear, i.e., a polarização do meio na presença do campo elétrico da radiação é
proporcional a este campo. Vamos, agora, considerar o caso onde o meio não responde
somente proporcionalmente ao campo, mas inclui termos que dependem do campo ao
quadrado, etc. Isto é chamado de uma resposta não linear do meio à estímulos externos.
A resposta não linear do meio ao campo eletromagnético pode produzir uma troca
de energia entre campos de freqüências diferentes. Assim, o meio gera radiação numa
freqüência diferente do campo incidente produzindo, desta forma, uma troca de energia
do campo incidente para campos com freqüências diferentes. Duas das mais importantes
aplicações deste fenômeno são: geração harmônico, no qual parte de energia da onda
incidente com freqüência ω é convertida em radiação com freqüência 2ω e oscilações
paramétricas na qual um forte campo de radiação de freqüência ω gera através do meio
dois campos de radiação de freqüências ω1 e ω2 , tal que ω = ω 1 + ω 2 .
Vamos, então, imaginar um meio não linear no qual os elétrons do meio podem ser
visto como estando harmonicamente ligados. Assim, ao incidir radiação o elétron é
23
deslocado e a força restauradora do equilíbrio apresenta o convencional termo linear e
em adição o termo não linear.
Imaginemos que a força restauradora seja do tipo:
r
r
mω 20 r + mβ 2 r 2
(76)
onde β é o coeficiente do termo não linear.
r
Sob a incidência de um campo E 0 cosωt externo, a equação do movimento para o
2
elétron é da forma:
r
r
r
m&r& + mω 02 r + mβ 2 r 2 = −eE 0 cos ωt
(77)
onde estamos deixando de lado o termo de dissipação para tornar os cálculos mais
simples.
Vamos considerar como solução aproximada o seguinte:
r r
r1 = r0 cosωt
(78)
que será considerado paralelo a E0.
Da equação do oscilador, obtemos
r
e
E
r
&r& = −ω 02 r − β 2 r 2 0 cos ωt
m
(79)
r
e substituindo a solução r1 considerada no segundo membro da equação,
eE
r
&r& ≅ −ω 02 r cos ωt − β 2 r02 cos 2 ωt 0 cos ωt
m
(80)
Podemos agora integrar esta equação duas vezes obtendo r(t).
Antes, porém, vamos usar a substituição
cos2 ωt = 2 cos2 ωt − 1
(81)
24
2
de modo que cos ωt =
1
1
cos(2ωt ) + , temos
2
2
1  eE
1
&&r ≅ −ω 20 r0 cos ωt − β 2 r02  cos2 ωt +  − 0 cos ωt
2
2
m
(82)
e integrando uma vez:
ω2
β 2 r02
eE
&r ≅ − 0 r0 senωt −
sen 2 ωt − β 2 r02 - 0 senωt
ω
4ω
ωm
(83)
e integrando novamente
ω 20
β 2 r02
β 2 r02 2
r(t) ≅
r0 cos ωt +
cos ωt +
cos 2ωt −
t
2
ω2
ω2m
8ω 2
eE 0
(84)
que desprezando o termo em t2, pois não representa solução oscilatória, fica
 ω2
β 2 r02
eE 0 
 cos ωt +
r ( t ) ~  0 r0 +
cos 2ωt

ω 2 m
8ω 2
 ω2
(85)
Esta solução, embora esteja bastante longe de ser a solução real da equação
acima, revela um fato bastante importante que a presença do termo não linear faz com
que o sistema responda com freqüências múltiplas da freqüência de excitação. No caso
acima, o termo em cos2ωt correspondem à chamada geração de segundo harmônico
que, como vemos, deverá ser bastante pequeno já que β é pequeno.
Embora a solução anterior não seja muito adequada, ela nos fornece
conhecimento necessário para propor como solução da equação inicial como algo do tipo:
∞
r (t ) = ∑ An cos(nωt )
n =0
(86)
25
deixando claro que o meio responderá em múltiplos da freqüência de excitação. Como
estamos interessados somente até a geração do segundo harmônico, vamos carregar a
solução até n = 2, ou seja
r ≅ A 0 + A 1 cos ωt + A 2 cos 2ωt
(87)
que substituído na equação inicial fornece
− A 1ω 2 cos ωt − 4ω 2 A 2 cos 2ωt + ω 20 A 1 cos ωt + ω 20 A 2 cos 2ωt
+ A 0 ω 20 + β 2 (A 12 cos2 ωt + 2A 2 A 0 cos 2ωt ) = −
eE 0
cos ωt
m
(88)
Como estamos interessados nos termos de ordem ωt e 2ωt, fazendo as
substituições:
cos2 ωt =
cos ωt cos 2ωt =
cos2 2ωt =
1
1
cos 2ωt +
2
2
1
1
cos ωt + cos 3ωt
2
2
(89)
1
1
cos 4ωt +
2
2
Após substituição, vamos igualar os termos de mesma ordem em cosωt e cos2ωt
desprezando os demais:
− A 1ω 2 + A 1ω 20 + A 1A 2 + 2A 1A 0β 2 = −
−4ω 2 A 2 + ω 02 A 2 +
eE 0
m
β 2 A 12
+ 2 A 2 A 0β 2 = 0
2
(90)
Na primeira equação, como esperamos que A1 seja o termo dominante,
desprezamos os demais e obtemos:
26
A1 ≅
− eE 0 / m
(91)
ω 20 − ω 2
Substituindo este valor na segunda equação no qual o último termo será
desprezado, temos
(
)
A 2 ω 02 − 4ω 4 =
A2 = −
(
−β 2 e 2 E 20 / m 2
2
(
ω 20
−ω
)
β 2 e 2 E 02 / m 2
2 ω 02 − ω 2
) (ω
2
0
(92)
2 2
− 4ω 4
)
(93)
Com isto, podemos calcular a polarização do meio, levando em conta somente os
termos cosωt e cos2ωt e temos
r
β 2 e 2 E0 E0 / m 2
r
r e 2 E0 / m
p = −er = 2
cos
t
+
cos 2ωt
ω
2 ω 02 − ω 2 ω 02 − 4ω 2
ω0 − ω 2
(
)(
)
(94)
e para a polarização total
r
r
P = Np
(95)
onde B é a densidade de átomos considerados.
P=
Ne 2 E 0 / m
Ne 2 E 02 / m 2
cos
ω
t
+
cos 2ωt
2
ω 02 − ω 2
2 ω 02 − ω ω 02 − 4ω 2
(
)(
)
(96)
Como P = χE, onde χ é a chamada susceptibilidade, a susceptibilidade apresenta
agora divergências em dois pontos distintos.
Primeiro, a divergência que já esperávamos em ω−ω0, denotando a ressonância do
sistema ao redor deste ponto.
27
A nova divergência que aparece agora corresponde a ω =
radiação incidente na freqüência ω =
ω0
. Neste ponto, a
2
ω0
emergirá do sistema com freqüência 2ω=ω0,
2
caracterizando a chamada geração de segundo harmônico.
Fig. 10 – n(ω) versus ω para o caso não-linear
É claro que não introduzimos no nosso cálculo termos dissipativos, mas isto poderia ser
feito sem grandes dificuldades da mesma forma que foi feito anteriormente.
Os efeitos não lineares em meios ópticos são extremamente importantes para
dispositivos opto-eletrônicos e para geração de luz visível a partir de luz infra-vermelho.
Num curso moderno de óptica este processo será necessariamente abordado com
profundidade.
IV.5. FORÇA DA RADIAÇÃO SOBRE O SISTEMA ATÔMICO
Até agora estudamos o processo de espalhamento de radiação do ponto de vista
energético, sem nos preocuparmos com o efeito mecânico que esta interação produz.
A radiação não é composta apenas de campo magnético que oscila num plano
perpendicular ao plano determinado pelo campo elétrico. Assim, como E e b oscilam em
fase, o efeito de ambos sobre as cargas do átomo ocorre em conjunto.
A ação do campo elétrico sobre o átomo produz um deslocamento do elétron na
sua direção e sentido oposto. Isto significa que o campo elétrico da radiação imprime ao
elétron do átomo uma velocidade r& . Como o campo magnético pode agir sobre esta
carga animada de velocidade, isto resulta numa força.
28
r
e r
F = − r&xB
c
(97)
Vamos considerar uma radiação que apresenta campo elétrico na direção x$ ,
magnético na direção y$ e, portanto, tem direção de propagação em z$ .
O campo elétrico movimenta o elétron na direção x$ e, portanto, r& é na direção x$ ,
de modo que a força acima torna-se:
r
e
F = − &rBz$
c
(98)
e desta forma, a força que a radiação exerce sobre o sistema atômico é na direção de
propagação da mesma.
Fig. 11 – Esquema da força produzida sobre o átomo durante interação com radiação
A equação de movimento do elétron no átomo já foi considerada anteriormente
como sendo:
r
r
r
mr + mζ r& + mω 02 r = −eE 0 cos ωt
e obtivemos como solução para r&
(99)
29
r& = +
eE0ω
1
m ω 2 − ω 2 2 + ζ 2ω 2
0
[(
)
]
1/ 2
sen(ωt + φ )
(100)
cos ωtˆz
(101)
que leva à seguinte força quando tomamos
B = E 0 cosωt
r
eE02ω
sen(ωt + φ )
F =−
mc ω 2 − ω 2 2 + ζ 2ω 2
0
[(
)
]
1/ 2
Devemos lembrar que a fase φ existe devido ao termo dissipativo ζ. Podemos
escrever:
sen(ωt + φ) cos ωt = senωt cos ωt cos φ + cos2 ωtsenφ
(102)
e ao tomarmos o valor médio temporal o termo em < senωtcosωt > = 0, restando apenas
cos2 ωt =
1
2
(103)
de modo que
r
e 2 E 20 ω
senφ
F =−
z$
1/ 2
2 mc 
2

2
2
2 2
 ω − ω0 + ζ ω 


(
)
(104)
e como já determinamos anteriormente que
senφ =
−ζω
(
)
1/ 2
 2
2 2
2 2
 ω − ω0 + ζ ω 


(105)
obtemos que a força média exercida pela radiação sobre o sistema atômico como sendo
30
r
e 2 E 20 ω 2 ζ
F =
2 mc
(ω
1
2
)
2
− ω 20
z$
2
+ζ ω
2
(106)
Graficamente esta força está representada a seguir:
Fig. 12 – Dependência da força com freqüência
Esta força está estritamente ligada ao processo de absorção-emissão de luz e,
portanto, tem seu valor máximo quando o átomo está numa situação ressonante. Isto é,
ω=ω0.
Note que se não houver dissipação de energia (ζ = 0), a força é nula, pois a
expressão acima trata-se de uma média e o átomo só pode continuar o processo de
absorção se continuamente estiver dissipando energia. No caso de não dissipação, a
força é oscilatória, invertendo o sentido quando o campo oscila gerando, no entanto, uma
força média nula.
A
força
de
radiação
encontra
hoje
muitas
aplicações
importantes
no
desenvolvimento científico. Ela é a ferramenta principal nas técnicas modernas que
procuram controlar o movimento de espécies atômicas.
(apsfi305.doc)
Universidade de São Paulo
Instituto de Física de São Carlos
Departamento de Física e Ciência dos Materiais
FÍSICA MODERNA ELEMENTAR
CAPÍTULO V
EXPERIMENTOS QUE DETERMINARAM O INÍCIO DA FÍSICA
MODERNA
Autores:
Prof. Dr. Vanderlei Salvador Bagnato
Prof. Dr. Luís Gustavo Marcassa
São Carlos
Agosto de 1999
2
Capítulo V
EXPERIMENTOS QUE DETERMINARAM O INÍCIO DA FÍSICA MODERNA
1 – Introdução:
Em meados do final do século XIX e início do século XX, os fenômenos explicados
pelos conceitos básicos existentes entrava numa profunda crise devido à impossibilidade
de explicar determinados resultados experimentais da época. Tais resultados exigiam o
estabelecimento de novos conceitos e modificações radicais das idéias que até então
haviam persistido. Com a participação de personagens ilustres como: Planck, Rutherford,
Niels Bohr, Einstein, Max Born e outros; estabeleceu-se uma linha de pensamentos que
em conecção com experimentos brilhantes de diversas naturezas propiciou o
aparecimento da Teoria Quântica. Esta nova maneira de ver o mundo físico estabelecia
novos conceitos que descreviam ao mesmo tempo o ondulatório do elétron (ou partículas
em geral) e o comportamento corpuscular da radiação.
Nesta parte do nosso curso iremos estudar os resultados mais importantes que
determinaram o nascimento desta nova teoria. Iniciaremos com uma discussão das leis
básicas de radiação emitida por um corpo aquecido (radiação de corpo negro). Neste
ponto será bastante apropriado a introdução do conceito de estatística quântica e do
fóton. Após discutiremos os experimentos mais importantes como o efeito fotoelétrico, o
efeito Compton, a natureza eletromagnética do raio-x e a natureza ondulatória de um
feixe eletrônico.
2 - Estatística Quântica e Radiação do Corpo Negro:
Já é do nosso conhecimento através de observações do cotidiano, que todos os
corpos quando aquecidos emitem radiação eletromagnética. À medida que a temperatura
do corpo aumenta, vemos a sua “luminosidade” passar de vermelho para amarelo e,
eventualmente, branca,
demonstrando a
existência de uma dependência das
características de sua emissão com a temperatura. Apesar de que possamos ser levados
a pensar que corpos “frios” não emitem radiação, devemos salientar que mesmo os
corpos em baixas temperaturas são emissores de radiação, só que, nestas
circunstâncias, o comprimento de onda emitido localiza-se na região do infravermelho ou
3
mesmo abaixo desta, de modo que não é notado pelos órgãos visuais humanos.A fim de
criarmos um sistema físico que nos permita observar somente sua radiação emitida,
vamos imaginar uma caixa oca cujas paredes estão mantidas a uma determinada
temperatura constante, de modo que a radiação existente no seu interior está em
equilíbrio com as paredes. Assim, podemos associar a esta radiação a mesma
temperatura T das paredes. Esta cavidade é um sistema termodinâmico que não
depende dos processos químicos e físicos que ocorrem nas paredes, mas
essencialmente do equilíbrio.
Da forma apresentada este é um sistema isolado, ficando difícil seu estudo já que
energia não está sendo trocada com o meio não permitindo observação direta. A fim de
tornar acessível a observação da radiação na cavidade, façamos um pequeno buraco
nesta cavidade, pequeno o bastante para que não perturbe a situação de equilíbrio, mas
permitindo que uma pequena parte da radiação deixe a cavidade criando a possibilidade
de observação. Quando parte da radiação externa penetra na cavidade, esta é totalmente
absorvida pelas paredes da cavidade, não havendo reflexão nenhuma. Se olharmos para
a abertura na cavidade, somente observamos a emissão de radiação. Nenhuma reflexão
da radiação externa é observada. A esta radiação denominamos de radiação de corpo
negro, caracterizando um corpo que é perfeitamente absorvedor, só emitindo sua
radiação característica. É importante notar que toda radiação incidente será transformada
em radiação de corpo negro, pois será envolvida no processo de equilíbrio do sistema.
A radiação de corpo negro tem propriedades bastante interessantes e seu estudo
foi um dos responsáveis pelo aparecimento da mecânica quântica e da chamada
estatística quântica.
Antes de iniciarmos o estudo das propriedades da radiação do corpo negro, é
necessário alguns conceitos já vistos anteriormente. A radiação eletromagnética contém
quantidade de movimento e energia. Anteriormente, vimos que a densidade de energia
contida na radiação devido aos seus campos elétricos (E) e magnéticos (B) é dada por
u = 1/8 π (E2 + B2).
No caso que tratamos, tínhamos somente campos monocromáticos. No caso mais
geral definimos u (ν,T) como sendo a densidade de energia por unidade de frequência,
ou seja, u (ν, T) dν é a densidade de energia da radiação com frequência entre ν e ν +
dν. Se quisermos saber a densidade de energia total, deveremos somar sobre todas as
possíveis frequências. Note que já colocamos a dependência da temperatura em u pois
estamos tratando da radiação que está em equilíbrio térmico com as paredes da
4
cavidade. Assim, a densidade total de energia será:
∞
u (T ) = ∫ u (v, T )dv
0
A notação u e u pretende diferenciar a densidade total (sem barra) daquela por
unidade de frequência. Evidentemente, temos as seguintes unidades para ambas:
.seg
[u ] = energia
cm
3
e
[u ] =
energia
cm 3
Em 1859 o físico Kirchhoff provou que u = u (ν, T) é independente da natureza das
paredes da cavidade, ou seja, ele demonstrou que independente do material que constitui
a cavidade a radiação preserva suas características. O resultado descrito acima é
denominado de Lei de Kirchhoff.
A fim de demonstrarmos esta lei, vamos considerar duas cavidades A e B
contendo aberturas, mas constituídas de materiais diferentes e mantidas à mesma
temperatura.
Para simplificarmos, analisemos a densidade de energia em somente uma região
espectral (ν, dν). Vamos assumir que a densidade de energia em A seja maior do que a
densidade em B.
u A (ν , T ) = u B (ν , T )
Assim, a densidade de energia/V contida na cavidade (e, portanto, na radiação de corpo
5
negro), não depende da constituição das cavidades, sendo uma função universal de ν e
T. Consequentemente, a densidade total de energia µ é uma função universal da
temperatura.
Vamos agora analisar com mais detalhes a radiação proveniente de um corpo
negro. Imaginando uma cavidade da qual a radiação provém e denotando por K a
quantidade de energia que emana do corpo por unidade de área e tempo (fluxo),
obtemos facilmente que temos que:
φ =
c
u (T )
4π
ou seja, o fluxo de energia emitido pelo corpo negro é também uma função universal da
temperatura do corpo (da mesma forma que a densidade de radiação).
Do fato que a radiação carrega momentos (como visto anteriormente no capítulo
IV), significa que ao ser absorvida ou refletida por uma superfície haverá atuação de uma
força que normalmente é referida, como sendo a pressão da radiação a qual passaremos
agora a explicar.
Consideremos um feixe de radiação incidindo sobre uma superfície segundo um
determinado ângulo θ com a normal à superfície.
Vamos denotar de p e p o momentum total contido num volume V para a onda
incidente e refletida respectivamente. Se a transferência de momento ∆ p = p
ocorre durante um tempo t, a força exercida sobre a superfície é:
F = −
∆p
p−p
=
∆t
∆t
'
−p
6
onde o sinal ( - ) foi introduzido porque estamos tratando da força sobre a superfície. O
tempo para transferência deste momentum (t) é o mesmo gasto para todo volume V
considerado chegar à superfície. Se a base do cilindro considerado tem que percorrer d
para atingir a superfície, c∆t = d. O volume ∆ V que contém a radiação em questão é ∆V
= Ad cos θ. Assim,
∆V = Ac∆t cosθ
Do eletromagnetismo temos que (u = densidade energia)
p =
u' ∆V
u∆V
n e p' =
n'
c
c
( n e n ) estão representadas na figura, de modo que podemos escrever
F =
cA cos θ  u∆V
u' ∆V 
n−
n' 

c
∆V
 c

ou seja
(
F = A cos θ u n − u' n'
)
Analisemos a pressão de radiação em dois casos distintos: primeiro quando temos
reflexão total (u = u’). Neste caso,
F = A cos θu( n − n' )
como n − n' = 2 cos θx̂ (já que n e n são unitários), temos
F = Fx = 2 A cos 2 θu
e, portanto, a pressão P = Fx/A
P = 2cos2θu
7
Utilizemos este resultado para calcularmos a pressão da radiação no interior da
cavidade. Quando estamos no interior da cavidade, ao analisarmos em determinado
elemento de parede, vemos que naquele ponto, chega radiação de todas as direções de
modo que a expressão que calculamos é apenas uma pequena contribuição de uma
específica direção. A pressão num determinado ponto será a soma de toda incidência de
radiação no ângulo sólido 2π strd determinado por todo semi-hemisfério defronte da
parede.
Sendo u a densidade de energia, a contribuição para a pressão devido à radiação
contida no ângulo sólido d Ω será contida
dP = 2 cos 2 θu
dΩ
4π
e a pressão teta’
P = ∫ dp (em todo semi-hemisfério)
ou usando dΩ = sen θdθdγ,
p = 2
u (T )
4π
= 2
π/ 2
2π
0
0
2
∫ cos θdθ ∫ dγ
u (T ) 1
.2 π
4π 3
ou seja,
p =
u (T )
3
que é a pressão da radiação no interior de uma cavidade contendo uma densidade de
energia u(T).
No caso de termos absorção total da radiação pela parede, u’ = 0 os cálculos nos
forneceriam o mesmo resultado a menos de um fator de 2.
Assim, a radiação de corpo negro ocupa um volume V e apresenta pressão P. O
8
volume V pode ser mudado através do movimento do pistão. Vamos tratar este sistema
termodinâmicamente. A energia total contida no sistema será:
U = Vu(T)
e havendo uma movimentação do pistão causando uma variação de volume dV, o
trabalho realizado pelo pistão será, onde estamos preservando a quantidade de radiação,
considerando reflexão total:
dW = PdV =
u( T )
dV
3
trabalho este que aumentará a entropia do sistema. Usando a primeira lei da
termodinâmica (com dQ = TdS)
dS =
dU + dW
T
é a variação da entropia do sistema. As variações envolvidas nesta última expressão são:
dU = udV + V
dW =
du
dT
dT
u( T )
dV
3
Imaginemos uma situação termodinâmica onde a cavidade que contém a radiação
será um pistão evacuado e obtemos para a variação da entropia
dS =
ν du 4 u
+
dV
T dT
3T
Vamos agora utilizar uma propriedade das funções termodinâmicas denominadas
de diferenciais exatas. S e f dependem das variáveis e y, temos
9
df =
∂f
∂f
dx +
dy
∂
∂y
e, sendo df uma diferencial exata,
∂2f
∂2f
=
∂y∂x
∂x∂y
Como dS é um diferencial exato:
1 du
4 d u
=
 
T dT
3 dT  T 
ou seja, tomando a derivada,
1 du
4 du
4 u
=
−
T dT
3 TdT 3 T 2
1 du
u
du
dT
= 4 2 ⇒
= 4
T dT
u
T
T
e integrando esta equação, obtemos:
u(T) = aT4
sendo a uma constante, esta expressão mostra que a densidade de energia na radiação
de corpo negro depende com a quarta potência da temperatura.
Assim, a quantidade de energia que é emitida pelo corpo negro preenchido com
radiação de corpo negro à temperatura T.
Por unidade de tempo e área, temos a forma:
φ =
φ =
c 4
T
4π
c
u( T )
4π
(energia emitida/área tempo)
10
A constante
ca
≡ σ chamada de constante de Stefan-Boltzmann para a radiação de um
4π
corpo negro, e este resultado:
Φ = σT4
é a chamada Lei de Stefan-Boltzmann para a energia emitida por um campo negro.
Esta descrição feita pelos físicos Stefan e Boltzmann em 1884 corresponde a um
dos grandes feitos teóricos que acabou como decisivo no desenvolvimento da física
moderna. O valor da constante σ = 5,7 105 esq cm-2 S-1K-4
Esta expressão (Lei Stefan-Boltzmann) nos fornece apenas uma relação entre a
intensidade da radiação emitida pela corpo negro como função de sua temperatura. O
resultado acima é a soma total para todos os comprimentos de onda (ou frequência)
contidos na radiação. Nada pode, desta expressão, ser concluído a respeito da
dependência espectral da radiação do corpo negro.
A dependência da densidade de energia na radiação do corpo negro com a
frequência foi um importante ponto no surgimento da mecânica quântica, já que sua
concordância com os resultados experimentais só foi possível com a introdução de novos
conceitos. Vamos ver com algum detalhe o desenvolvimento teórico desta dependência.
Vamos iniciar fazendo uma análise dimensional. Tomemos quatro unidades
como sendo fundamentais. Uma delas (bastante lógica no presente problema) é a
temperatura que denotaremos por θ. As demais serão as unidades mecânicas de
comprimento (l), tempo (t) e energia (e), sendo que esta última entra no lugar da
convencional massa, pois trataremos com a densidade de energia na radiação, sendo,
portanto, energia mais apropriada que massa.
Relembrando que u (ν, T) é a densidade de energia por unidade de frequência
temos:
[u (ν ,T )] = e' l [u (ν ,T )] = e' l
3
3
Queremos introduzir nesta expressão a dependência com a temperatura (T) e
frequência (ν).
Assim, vamos escrever as quantidades que temos interesse que estejam
presentes em termos das unidades escolhidas. Vamos lembrar que K, T têm unidade de
11
energia, de modo que K = e θ -1 (constante Boltzmann). Assim:
u
v
θ
t-1
et
T
c
lt-1
K
eθ-1
l3
Importante para nós são estas conco grandezas, já que tratando de radiação é
importante ν e c, e como estamos trabalhando com energia e temperatura, também são
importantes T e K.
Vamos tentar achar um produto entre estas grandezas de modo a termos uma
quantidade dimensional. Denominemos este número admensional por Π temos:
()
a
Π = u ν bT d c f K g
onde permitiremos aos exponentes serem positivos ou negativos. Do fato que estamos
querendo determinar u como função das demais, vamos estabelecer que a = 1. Isto é
necessário porque temos 5 epoentes a determinar e somente 4 unidades independentes.
Escrevendo as grandezas em termos das unidades temos (com a = 1):
π = etl-3t-b θdl f t-f egθ-g
Assim, por comparação teremos:
1+g=0
g = -1
1-b-f=0
-3 + f = 0
d-g=0
d = -1
f=3
b = -2
de modo que
Π =
uc 3
v 2 KT
onde ∏ denota um determinado número universal. Daqui tiramos
12
u (v , T ) =
v 2 KT
Π
c3
Esta expressão foi determinada em 1900 por Lord Rayleigh através da utilização de um
tratamento estatístico, obtendo ∏ = 8π (com π = 3.1416......). Após alguns anos ela foi
também determinada por J. H. Jeans e, portanto, é conhecida como fórmula de
Rayleigh-Jeans para a radiação do corpo negro.
u (ν, T ) = 8 π
ν 2 KT
c3
Uma maneira alternativa para obtenção da relação de Rayleigh-Jeans para
radiação consiste em utilizarmos o princípio da equipartição de energia e para os modos
de uma cavidade.
Assim, consideremos inicialmente uma cavidade cúbica de lado L dentro da qual
exite radiação. Para que esta radiação exista dentro da cavidade é necessário que toda
energia da radiação esteja entre os vários modos da cavidade.
Se a cavidade for constituída de um material perfeitamente refletor, o campo elétrico da
radiação deverá anular-se nas paredes, pois a radiação não pode existir além destes
contornos. Assim, é necessário que o comprimento L exista um número inteiro de
λ
.
2
13
Estas várias possibilidades constituem os vários modos da cavidade. As condições de
contorno requerem que:
nx
λx
= L
2
nX λ X
L
=
2π
π
ou
de onde tiramos (nas várias direções):
kxL = nxπ
kyL = nyπ
kzL = nzπ
nx,y,z = 1, 2, 3, ....
Qualquer conjunto de inteiros (nx, ny, nz) apresenta um modo da cavidade, como:
k = k x x̂ + k y ŷ + k z ẑ
k=
Como k =
2π
λ
e
λ =
(n
2
x
)
+ ny2 + nz2 π / L
c
, temos
ν
ν=
(n
2
x
+ ny2 + nz2
) 2cL
Para cada conjunto (nx, ny, nz), temos desta relação a freqüência do modo.
Se apresentarmos todos os possíveis modos num gráfico nx, ny, nz, termos uma
rede de ponto cúbico espaçados da unidade, preenchendo todo o octante positivo dos
eixos. Se, então, perguntarmos quais são os vários modos para uma determinada
freqüência ν,
2
n +n +n
2
x
2
y
2
z
 2L  2
= 
 ν
 c 
14
basta verificarmos todos os pontos que encontram-se sobre uma esfera de raio
R =
2L
ν.
c
Se perguntarmos quantos modos existem dentro do intervalo de frequência ν e ν +
dν, a resposta seria óbvia: todos aqueles que no gráfico anterior estão dentro de uma
casca esférica de raio R e espessura dR, onde:
R =
2L
.ν
c
e
dR =
2L
dν
c
Com a densidade de pontos na rede de modos é 1 ponto/volume, o número de
pontos que caem dentro do volume da casca esférica acima é:
dN =
1
L3
4 πR 2 dR = 4 π 3 ν 2 dν
8
c
Se agora lembrarmos que cada modo pode ter duas polarizações independentes
(que corresponde a dois graus de liberdade por modo), pelo princípio da equipartivação
de energia, podemos associar a cada grau de liberdade da cavidade
2x
1
kT e, portanto,
2
1
kT = kT por modo (cada modo representa um grau de liberdade que pode contar
2
energia de cavidade).
Assim, a energia total contida na cavidade será:
du = 2 xdNxkT
= 2 .4 π
L3 2
ν d ν .kT
c3
portanto, a densidade de energia por unidade de frequência será:
u (ν, T ) =
du
8 πν 2 kT
=
L3 dν
c3
15
Cada modo está levando kT devido a energia do campo ter a forma (E2 + B2)
apresentando dois termos quadráticos cada um levando
1
kT .
2
É razoável que esta lei corresponda à realidade para baixas frequências, pois
neste limite a seletividade dos modos é esperada de ser predominante.
É evidente que a relação de Rayleigh-Jeans fornece valores absurdos para u
quando altos valores na frequência são considerados, pois sabemos da prática, ao
observarmos um cargo aquecido que não temos indefinidamente mais energia quando
olhamos para maiores frequências da radiação emitida. Pelo contrário, normalmente as
componentes de radiação de mais alta frequência estão ausentes. Podemos atestar este
absurdo ainda de outra forma, dizendo que:
∞
u = ∫ u (ν , T )dν → ∞
0
denotando uma quantidade infinita de energia contrariando mesmo a lei de StefanBoltzmann. Esta divergência de u é denominada de catástrofe do ultravioleta. Devemos
salientar, no entanto, que a lei de Rayleigh-Jeans é bastante razoável com os resultados
experimentais na região de baixas frequências.
É claro que estamos procurando uma concordância com os resultados
experimentais e, para isto, vamos considerar que se dependa de mais uma função que
contém uma constante α na sua determinação, constante esta que é uma combinação de
K e uma nova constante universal. Assim, escrevemos:
16
u (ν, T ) =
ν 2 kT
f αν T n
3
c
(
)
a função f foi introduzida para sanar os problemas com a lei de Rayleigh-Jeans. Não
sabemos ainda qual o valor de n, mas este exponente deverá ser escolhido de tal forma a
satisfazer as leis já conhecidas para a radiação do corpo negro. Calculando a densidade
total de energia no corpo negro.
∞
∞
∫ ν f (αυT )dν
KT
u = ∫ udν = 3
c
0
2
n
0
Chamando x = ανTn → dx = αTndV e, portanto
kT 1 − 3 n
u =
α3c 3
∞
∫ f (x )x
2
dx
0
como u α T4 (Lei S. Boltzmann)
⇒ n = -1
Assim, temos
u (ν, T ) =
ν2 KT
c3
 αν 
f

T 
Normalmente escrevemos k α = h, de modo que α =
u (ν, T ) =
h
,
K
ν 2 KT  hν 
f

c3
 KT 
ou seja, a densidade u (ν , T ) é o produto de
ν 2 KT
por uma função universal f que
c3
 hν 
depende da quantidade 
 . Este resultado é conhecido como Lei de Wein. Esta lei
 KT 
foi bastante importante porque reduziu uma função desconhecida de duas variáveis numa
17
função desconhecida de uma única variável.
A quantidade h que aparece nessa expressão representa uma nova constante que
tem dimensão de energia vezes tempo, denominada de “ação”.
Podemos antecipar que ela é denominada de constante de Planck e representa
um quantum de ação, ou seja, a unidade elementar de energia-tempo que um sistema
físico emitir ou absorver.
ν 2 KT
u =
f (x )
c3
A fim de determinar a forma explícita da função f(x) Wien imaginou que dentro da
cavidade a radiação era semelhante a proveniente de moléculas de um gás aquecido
emitindo radiação. Portanto, a frequência da radiação poderia ser vista como
dependendo intrinsecamente da velocidade das moléculas.
Considerando uma distribuição de Maxwell-Boltzmann para as moléculas do
suposto gás emissor de radiação, podemos associar a energia das partículas com a
frequência emitida, de modo que a quantidade de partículas emitindo ν é proporcional a ν
exp (-νh/KT) e como a energia emitida por cada uma deve ser proporcional a ν, temos:
u (ν, T ) = (const )ν 2 νe − bν / T
Conhecida como fórmula da radiação de Wien.
Com um ajuste apropriado das constantes que aparecem nesta expressão,
notamos que ela concorda relativamente bem com os resultados experimentais para
altas frequências não sendo muito boa para baixas e muito pior para frequências
intermediárias.
A situação está esquematizada na figura abaixo.
18
A fórmula geral de Wien, baseada numa função universal, está qualitativamente
certa. Neste sentido, ela prevê a existência de um máximo em u (ν,T) para determinada
frequência. Impondo a existência do máximo com u , na forma de u ,
du
= 0 , temos:
dν
2 νKT
ν 2 KT
h
f
(
x
)
+
f ' (x )
= 0
3
3
KT
c
c
e, como ν ≠ 0, a condição do máximo torna-se:
2f (x max) + x max f’ (x max) = 0
A existência deste x max =
ν max α
revela que, pelo menos qualitativamente, quando
T
temos aumento em temperatura, o máximo (ou pico) da emissão de radiação desloca-se
para maiores valores de frequência, como esperado e este deslocamento ocorre de
forma proporcional. Este resultado é conhecido como “Lei do Deslocamento de Wien”,
estabelecendo que a relação entre as posições das máximas de emissão do corpo negro,
1)
ν (max
ν( 2 )
= max quando são consideradas duas temperaturas diferentes. A comprovação
T1
T2
experimental da lei do deslocamento de Wien é uma importante constatação de que a
proposta de wien com relação a dependência de u (ν, T) com a função universal f(x) é
verdadeira.
Até este momento o problema permanecia em aberto, estando bastante afastada
uma teoria que reproduzia bem os resultados medidos.
A conecção para os resultados a baixas frequências (Rayleigh-Jeans) e altas
frequências (Wien) foi feita pelo físico Planck. Enquanto Rayleigh-Jeans considerou
apenas a radiação confinada num volume, Planck procurou imaginar uma situação
diferente. A radiação não é mais considerada isolada mas em equilíbrio com osciladores
capazes de tomar e dar energia ao campo. Planck imaginou que a energia armazenada
na radiação eletromagnética poderia ser descrita como a energia armazenada em
osciladores harmônicos carregados em contato com radiação.
Assim, para Planck, o sistema que constitui o corpo negro pode ser descrito por
uma série de osciladores em equilíbrio com radiação. Cada oscilador tem sua frequência
19
natural ω0 e um termo dissipativo que torna possível a troca constante de energia entre
osciladores e campo no interior da cavidade dando a radiação as caracterísitcas
necessárias.
Se o campo de radiação tem um valor Ex, a equação de movimento do oscilador
torna-se (onde estamos considerando a carga do oscilador como e e a componente x do
campo elétrico da radiação):
(
)
m x&& + ξx& + ω02 x = eE x
onde m e e denotam a massa e a carga do oscilador, enquanto ξ é o coeficiente de
dissipação que já determinamos (cap. IV) como sendo:
2 e 2 ω2
ξ =
3 c3 m
quando tratamos a interação da radiação com o sistema atômico.
Note que, apesar do oscilador ser tridimensional, somente uma componente está
sendo considerada e generalizaremos mais adiante.
Para o campo de radiação da forma Ex = E0x sen ωt , o oscilador responderá com:
x = x 0 sen (ωt + δ )
onde a amplitude
xo =
[(ω
eE 0x / m
2
− ω02
)
2
+ ξ 2 ω2
]
1/ 2
Vamos calcular a energia do oscilador que podemos imaginar como sendo a energia
interna deste sistema. Neste caso ela está dividida entre cinética e potencial.
cinética →
1
m e 2 E ox 2 / m 2 ω2
mx& =
cos 2 (ωt + δ )
2
2
2
2
2
2
2 ω − ω0 + ξ ω
(
)
20
potencial →
1
m e 2 E ox 2 / m 2 ω02
mω02 x 2 =
sen 2 (ωt + δ )
2
2
2
2
2
2 ω − ω0 + ξω
(
)
de onde tiramos uma energia média para o sistema quando campo na frequência ω é
considerado, e tirando média temporal
U =<
1
1
mω02 x 2 + mx& 2 >
2
2
resultando em
Uω =

1  m e 2E0x
ω 2 + ω 02


2
2
2  2 m ω 2 − ω 02 + ξ 2ω 2 
(
)
onde o fator ½ aparece da média temporal. U ω é a quantidade total de energia
armazenada nos osciladore de frequência ω .
Até este ponto consideramos a radiação como sendo monocromática. Esta é
apenas uma contribuição à energia, pois no campo de radiação temos um contínuo de
frequências formando o espectro da radiação. Assim, a amplitude E 0x passa agora a
depender de ω, E 0x (ω) . Assumimos que U ω acima, representa a energia contida entre as
frequências ω - ω + d ω e que E 0x representa uma espécie de densidade espectral de
modo que:
U =
U =
e2
4m
∫
∞
0
∫
E ox (ω)
2
∞
0
U ω dω
(ω
)
+ ω02
dω
ω2 − ω02 + ξ 2 ω2
(
2
)
A fim de simplificarmos esta integral, vamos considerar que E 0x (ω) varia bastante
lentamente com ω, de modo que a maior contribuição vem do termo E 0x (ω0 ) . Também
vamos assumir que ω próximo de ω0 é a maior contribuição, de modo que:
21
ω2 + ω02 ≈ 2 ω02
2
4 e 4 ω4 2
4 e4 1 6
ω
≈
ω0 = 4 aω02 ω02
6
2
6
2
9 c m
9 c m
(
ξ 2 ω2 =
(ω
com
a =
2
0
− ω2
)
2
)
≅ 4 ω02 (ω − ω0 )
2
e2
3 mc 3
Assim, a energia para o oscilador centrado em ω0 fica:
U=
e2 x 2
dω
Eo (ω 0 )
4m
(ω − ω 0 )2 + aω02
(
)
2
1
2
e a integral,
e 2 E ox (ω0 ) 1
U =
.
4m
2
2
dω
00
∫ (ω − ω )
2
0
0
(
+ aω02
)
2
Esta última integral:
I =
com θ =
1
2
dω
00
∫ (ω − ω )
2
0
0
(
+ aω
2
0
)
=
1
2 aω02
∫
∞
−
1
aω0
dθ
θ +1
2
ω − ω0
e como temos aω02 << 1 , o limite inferior da integral pode tornar-se -∞
2
aω0
I =
1
π
Tan −1 θ / −∞∞ =
2
2 aω 0
2 aω02
e assim temos para energia:
U =
2
πe 2
E 0x ω0
2
8 maω0
( )
22
Como sabemos, a densidade de energia na radiação é (já tirando média temporal):
u=
(
)
1 1
1 2
E02 + B02 =
E0
2 8π
8π
e, como 3 E 0x = E 02
2
u (ωT0 ) =
e, usando a =
3 2x
8π
E 0 → E 02 x =
u (ω0 )
8π
3
e2
π2 c 3
,
obtemos
U
=
u (ω0 )
3 mc 3
ω02
e podemos trocar ω0 com ω, já que ω0 é arbitrário e deveremos ter osciladores em todas
as frequências.
π2 c 3
U =
u (ω)
ω2
Como ω = 2 πν , e como a quantidade de energia entre ω - ω + dω é igual a
quantidade de energia entre as equivalentes frequências ν → ν + dν.
u (ω )dω = u (ν )dν → u (ω ) =
u(ν )
2π
ou seja,
U =
U=
π 2 c 3 u( ν )
4 π2 ν 2 2 π
c3
8πν 2
u (ν )
Esta é uma relação geral entre a energia do sistema e a densidade de energia no
campo de radiação mostrando que a energia total dos osciladores que constituem a
23
radiação é uma função universal da mesma forma que a densidade de energia da
radiação de corpo negro.
Estamos procurando uma expressão para u (ν,T) do corpo negro, mas segundo
Planck isto é equivalente a procurar a energia total do oscilador em equilíbrio com a
radiação.
Para podermos calcular u (T) vamos associar ao oscilador uma entropia S
associado a uma temperatura T, de modo que:
dS =
dU
T
Isto é uma maneira adequada de tratar o problema: usar entropia ao invés de
energia. Agora consideremos que fosse válido a lei de Wien, então usaríamos:
u (ν, T ) =
ν
αKA 3 − α T
ν e
c3
Usando este resultado na epressão para U, obtemos:
c 3 αKA 3 − αυ / T
αK
U =
ν e
=
νAe − αυ / T
2
3
8
8 πν c
de onde podemos eliminar a temperatura, obtendo a relação:



1
1
U 

= −
Ln
T
αν
 α kν A 


 8 
Como
1
dS
=
, podemos tomar uma nova derivada com respeito à U obtendo a
T
dU
grandeza característica
d 2S
dU 2
24
este é o valor de
d 2S
quando assumimos relação de Wien.
dU 2
Vamos agora assumir como verdadeira a relação de Rayleigh-Jeans para u( ν , T ) .
Neste caso,
u (ν , T ) =
e com isto,
8 πνkT
c3
1
K
dS
d 2S
K
=
=
ou seja
= − 2 o sistema oscilador-radiação que é
2
T
U
dU
dU
U
relação entropia-energia quando Rayleigh-Jeans é verdadeiro.
Como sabemos dos resultados experimentais, Wien concorda para altas
frequências enquanto Raylegh-Jeans concorda para baixas frequências. Desta forma,
Planck assumiu que ambas devem ser verdadeiras em seus respectivos limites, tornando
assim:
d 2S
1
= −
2
dU
αν U + U 2 / K
Note que esta foi uma suposição feita por Planck que poderia não ter funcionado.
A equação
d 2S
pode ser integrada com a radiação que quando U → ∞, devem
dU 2
necessariamente ter T → ∞, portanto,
dS
dS
1
→ 0 já que
= . Com isto,
dU
dU
T
dS
1
U / ανκ
=
ln
dU
αν 1 + U / ανκ
e como
dS
1
=
dU
T
ln
U / ανκ
αν
=−
1 + U / ανκ
T
25
de onde tiramos, substituindo α = h / K
hν
U =
e
hν / kT
−1
que usado de volta na expressão que relaciona Ueµ(υ, T ) , teve a
µ(ν, T ) =
8 πν 2
hν
3
hν / kT
c e
−1
que é a lei de Planck para a radiação, estabelecendo uma expressão completa válida
para todo intervalo espectral.
Os limites para baixo ν, leva à lei de Rayleigh-Jeans enquanto o limite para alta υ,
leva à lei de Wien.
É importante observar que o que Planck fez foi tratar a radiação contida na
cavidade como sendo um sistema constituído de osciladores em equilíbrio com radiação
e tratar este sistema termodinamicamente.
A fórmula obtida por Planck inicialmente tratava-se de uma adivinhação sem
nenhuma forte justificativa teórica. Alguns meses mais tarde, Planck deduziu sua relação
baseada numa hipótese mais fundamentada. Sua nova demonstração baseia-se no fato
que a energia de um oscilador não é uma grandeza contínua mas tem apenas valores
discretos múltiplos de uma quantidade elementar denominada do quantum de energia.
Assim, nesta hipótese, a energia do campo de radiação não pode assumir
qualquer valor mas sim, múltiplos inteiros de um valor ε0
U = nε 0
n = 0, 1, 2, 3.........
Com esta expressão podemos calcular a energia média do campo à uma
determinada temperatura T (da mesma forma que fizemos ao tratar o gás ideal).
∞
∫ U
U=
∫ e
−U / kT
e
0
∞
0
−U / kT
dU
dU
26
Quando permitimos E ser contínuo, E = kT , mas sendo discreto, o integral
transforma-se numa soma
∞
∑ nε e
U=
∑η e ηε
− nε 0 / kT
n =0
∞
0
−
0
/ kT
=0
que pode ser escrita como:
U =−
d
dβ
 ∞ − nε 0 β 
 ∑ e

 n =0

Esta soma é uma progressão geométrica de valor
1
1 − e − βε 0
Assim
U =
ε0 e −βε 0
ε
= ε 0 / kT0
− βε 0
1−e
e
−1
c3
8π
ε
que usada em U =
µ(υ, T ) , leva a µ(υ, T ) = 3 υ2 ε 0 / kT0
2
8 πυ
c
e
−1
Para que esta expressão concorde com Rayleigh-Jeans e Wien nos apropriados limites,
temos que ter
ε0 = hν,
ou seja
8 πh
υ3
µ(υ, T ) = 3 hυ / kT
c e
−1
que é fórmula de Planck.
Esta brilhante dedução introduz o conceito de quantização, exigindo uma
discretização da energia ao invés de permitir sua variação contínua. Isto foi um dos
pontos mais importantes no estabelecimento da mecânica quântica.
O estabelecimento da relação Energia Média =
ε
e
ε / kT
−1
traz um conceito muito
27
mais abrangente que é chamada estatísticas quântica.
A expressão acima representa a probabilidade de um determinado sistema ter
energia ε, isto é,
P (ε ) =
1
e
ε / kt
−1
Caso tenhamos um número N destes sistemas o provável número de osciladores
com energia ε será:
N (ε ) =
1
e
ε / kt
−1
Esta relação estabelece o chamado número de ocupação do estado com energia ε
um importante conceito que veremos posteriormente.
A fim de ilustrar o uso deste conceito vamos calcular o calor específico de um
sólido que será aqui considerado como sendo uma coleção de osciladores harmônicos
desacoplador. Este modelo é denominado de sólido de Einstein.
A energia de um mol de tais osciladores é:
U = 3N0
hυ
e
ε / kT
−1
onde estamos considerando as 3 direções como independentes. O calor específico ao
volume constante e, portanto:
dU
e hν / kT
 hν 
Cv =
= 3N0k 

2
dT
 kT  e hν / kT − 1
2
(
)
e hν / kT ≅ 1 + hν / kT
1
 hν 
Inicialmente, para altas temperaturas Cv = 3N0k 
≅ 3N0k

2
 kT   hν 


 kT 
2
28
que é um resultado bastante conhecido.
(Cν = 6 Cal/Mol ok)
Para baixas temperaturas,
2
 hυ  − hυ / kT
Cν = 3 N 0 k 
 e
 kT 
que quando T → 0 a exponencial é dominante perante o termo quadrático. A variação
Cv(T) está mostrado abaixo.
3 - O Caráter de Partículas para Radiação Eletromagnética
Como vimos anteriormente, a existência do fóton de Planck como sendo a menor
porção de radiação eletromagnética que ainda preserva todas as características da
radiação
começa
a
estabelecer um
comportamento
diferente
para
o
campo
eletromagnético. A possibilidade de poder tratar a radiação como constituída de
pequenas porções que carregam energia e momentum, dão ao campo eletromagnético
uma característica de partículas.
Uma série de eperimentos estudados e eplicados no início do século revelam o
comportamento corpuscular da
radiação distinguindo-a de seu comportamento
ondulatório tão evidente quando estudamos e descrevemos sua programação num meio
material ou mesmo efeitos como interferência e difração
Veremos agora alguns dos experimentos que revelaram este comportamento dual
para a radiação.
O primeiro efeito a estudarmos é o Efeito de Fotoelétrico. Ao redor de 1886, em
29
seus estudos envolvendo radiação e descargas em gases rarefeitos, H. Hertz observou
que quando a radiação ultravioleta incidia sobre um dos eletrodos da descarga, esta
ocorre mais prestemente, ou seja, a presença da radiação ultravioleta sobre um dos
eletrodos, facilitava a descarga. Estudos seguidos por Lenard mostraram que o efeito da
radiação na descarga era que a radiação ultravioleta fazia com que a superfície metálica
do eletrodo emitisse elétrons. Este fenômeno da ocorrência de elétrons ejetados pela
superfície de um metal quando iluminada pela luz suficientemente energética, é
denominado de efeito fotoelétrico.
O dispositivo eperimental que permite a observação deste efeito está
esquematizado na figura abaixo:
Brevemente descrevendo o sistema, uma ampola de quartzo evacuada, contém no
seu interior dois eletrodos que encontram-se polarizados. Radiação monocromática de
frequências ν atravessa as paredes de quartzo incidindo sobre a superfície do ânodo
(polo negativo). A superfície metálica do eletrodo ejeta elétrons denominados de
fotoelétrons que caminham em direção ao catodo (polo positivo).
Os fotoelétrons podem ser medidos através da corrente produzida, indicada pelo
amperímetro A, inserida em série com o circuito da ampola. A diferença de potencial
entre os eletrodos pode ser variada através do potenciômetro indicado. Se graficarmos
esta fotocorrente como função da voltagem de polarização, obtemos a curva mostrada na
figura abaixo:
30
Quando aumenta-se indefinidamente a voltagem de polarização observamos que a
fotocorrente não aumenta indefinidamente, mas sim atinge um valor de saturação aqui
denominada de Is. Ao variarmos a intensidade da luz incidente, notamos que o valor da
saturação também aumenta.
Outra informação importante é que ao invertermos a polarização entre os eletrodos
a fotocorrente não cai a zero abruptamente, mas sim lentamente até a polarização
reserva atingir um determinado valor Vo que inibe completamente a fotocorrente. Esta
observação nos permite concluir que os elétrons ejetados possuem uma determinada
energia cinética. Enquanto a polarização é positiva eles são acelerados para o cátodo,
quando a polarização é nula, eles não são acelerados, mas sua energia cinética (pelo
menos de um grande número dos fotoelétrons) é suficiente para conduzí-lo ao cátodo
produzindo a fotocorrente mesmo a polarização nula.
Ao invertermos o potencial, o
campo elétrico da polarização passa a trabalhos contrários ao movimento dos elétrons.
Os elétrons mais energéticos são aqueles que conseguem sobreviver até a máxima
voltagem invertida Vo. Neste ponto, a força elétrica é suficiente para desacelerar mesmo
os elétrons ejetados de maior energia, impedindo que atinjam o “cátodo”. Chamando de
Kmax, a máxima energia cinética dos fotoelétrons, temos que esta, relacionados com Vo
pela relação:
Kmax = eVo
ou seja, o potencial elétrico é igual à energia cinética na situação onde a corrente vai a
zero.
Observa-se que Vo (ou Kmax) independe da intensidade da luz incidente.
Se medirmos o potencial Vo para diferentes frequências da luz incidente,
observamos que abaixo de determinada frequência denominada de frequência de corte
νo, não há mais produção de fotoelétrons. Observa-se que νo é característico do metal
que constitui a superfície (para sódio, νo = 4,39 10 14Hz).
31
Ao tentarmos explicar as observações no efeito fotoelétrico utilizando-se do
conhecimento do eletromagnetismo clássico, aparecem várias contradições. Em primeiro
lugar, notamos que a teoria ondulatória da radiação eletromagnética requer que o campo
elétrico da radiação tenha maior amplitude quanto maior for a intensidade. Quanto maior
for este campo, maior será a força sobre os elétrons do sólido, isto sugere que quanto
mais intensa for a luz maior deveria ser a energia cinética dos elétrons ejetados. No
entanto, observa-se experimentalmente que Kmax = eVo independe da intensidade
da raidação incidente. Outra contradição é que segundo a teoria ondulatória, os
fotoelétrons devem aparecer sempre que a energia do campo transferida ao elétron for
intensa o suficiente para arrancá-lo. Isto não é verdade, porque não importa o quanto
intensa seja a radiação, abaixo da frequência νo não há produção de elétrons. Este
resultado mostra que o que é importante no problema é a frequência e não a intensidade
de radiação. Outra contradição vem do
fato que a luz apresenta um fluxo contínuo de energia (segundo teoria clássica), e se
trabalharmos com baixas intensidades, a transferência de energia da radiação para o
elétron, a fim de removê-lo, ocorrerá num tempo finito diferente de zero. No entanto,
nenhum tempo de atraso entre ligar a radiação e detectar os elétrons tem sido
observado, a menos do tradicional tempo de vôo, mostrando que a transferência de
energia também não é bem explicada.
Influenciado pelos experimentos do efeito fotoelétrico e conhecedor do
eletromagnetismo, A. Einstein em 1905 propôs uma nova teoria para a luz que tinha
como supote a explicação para o efeito fotoelétrico. Como já havia sido mencionado por
Planck, ao tratar da radiação do corpo negro, que a radiação dos elétrons que
constituíam paredes de uma cavidade emitiam radiação quantizada, Einstein propôs que
a energia radiante é sempre quantizada em porções, que mais tarde vieram a ser
chamadas de fótons. A aparente contradição de que isto teria nos experimentos de
interferência e difração era explicada por Einstein como se tratando de situações onde
um número muito grande de fótons estão envolvidos e os resultados representam uma
média sobre o comportamento de vários fótons.
Einstein concentrou sua atenção na forma com que os fótons são emitidos ou
absorvidos. Assim, do resultado de Planck de que a energia da radiação tem energia 0,
1hν, 2hν, ...nhν, para Einstein isto adivinha do fato de que indo do estado nhν para (n+1)
hν, a fonte emitiu um fóton de energia, ou absorveu no caso do processo oposto. Na
hipótese de Einstein, este pacote de energia (fóton), está sempre localizado num
32
determinado volume de espaço que não se deslocaliza ao propagar-se com velocidade c.
Para ele, a quantidade de energia neste pacote é:
E = hν
Para explicar o efeito fotoelétrico, Einstein assumiu que neste processo um fóton
absorvido pela superfície libera um elétron de modo que a energia cinética do elétron
ejetado é:
K = hν - w
dependendo apenas da energia do fóton (hν) e de w que é o trabalho necessário para
remover o elétron do metal. Este trabalho é necessário para superar a atração que o
elétron sente no metal e eventuais perdas no processo de ejeção (como colisão, etc).
Alguns dos elétrons estão mais fortemente ligados, outros perdem mais energia na
saída, de modo que mesmo sendo constante a energia do fóton, a energia cinética do
elétron ejetado pode variar bastante. Isto é representado pela região de transiente nas
curvas Ivs V.
Os elétrons mais fracamente ligados e que apresentam a maior perda no processo
de saída são aquelas que apresentarão a máxima energia cinética. Assim,
Kmax = hν-wo
onde Wo só depende do metal e é denominada de função trabalho, e representa o
trabalho mínimo necessário para remoção do elétron.
Esta explicação sustenta, de forma satisfatória, o fato de que a energia cinética
dos fotoelétrons não dependa da intensidade da radiação. Um feixe de luz mais intensa,
somente representa mais fótons, de modo que há produção de um número maior de
fotoelétrons. Porém, sem nenhuma razão para aumento de sua energia dos elétrons.
A observação de que abaixo de determinada frequência da luz incidente não se
observa mais elétrons, advém do fato que a energia do fóton não tem energia para
remover o elétron, não interessando quanto deles atinjam a superfície. Finalmente não
haverá atraso na emissão porque toda energia é absorvida de uma única vez e não
paulatinamente.
33
Como Kmax = eVo, podemos escrever:
V0 =
hν wo
−
e
e
Obtendo a relação linear mostrada anteriormente, e mais do que isto, com a
corrente inclinação h/e = 3.910V-sec., que é um valor que só depende das constantes
fundamentais.
As suposições de Einstein, junto com sua explicação para o efeito fotoelétrico, lhe
renderam o Prêmio Nobel em 1921.
A idéia de fóton estabelecida por Einstein constitui um dos mais importantes
conceitos da física moderna. Utilizando este conceito, junto com Bose eles determinaram
a expressão da radiação de Planck, simplesmente tratando radiação como um gás de
fótons como vimos anteriormente.
Uma das demonstrações mais claras do comportamento corpuscular para a
radiação encontra-se no Efeito Compton demonstrado em 1923.
No experimento de Compton, um feixe de raio-x quase que monocromático de
comprimento de onda λ é incidente sobre um alvo. O raio-x é espalhado pelo elétrons
deste alvo, e a medida da intensidade espalhada para vários comprimentos de onda
mostrou-se dependente do ângulo de espalhamento, dando origem a um segundo pico
num comprimento de onda distinto àquele incidente. Assim, um raio x de energia distinta
é originado neste processo.
O resultado mostra que a radiação espalhada apresenta dois comprimentos de
onda distintos λ (incidente) e λ cuja posição relativa à λo depende do ângulo de
espalhamento. Esta variação ∆λ = λ' −λo é denominda de deslocamento Compton, que
evidentemente depende do ângulo de espalhamento.
Este deslocamento do comprimento de onda não pode ser explicado através da
teoria eletromagnética clássica, segundo o qual, quando a radiação interage com um
sistema atômico, faz com que o sistema oscile e reemita na mesma frequência. Assim,
baseado no entendimento clássico, o comprimento de onda da radiação espalhada pelos
elétrons do alvo deveriam ser igual ao incidente.
A fim de explicar os resultados obtidos experimentalmente Compton adotou a
visão quântica supondo que a radiação é composta de fótons, cada um com energia E =
hν, e que durante a interação destes com o alvo, o comportamento é semelhante ao
34
processo de colisão entre partículas.
Durante a colisão, o fóton (radiação) transfere aos elétrons do alvo uma porção de
sua energia de modo que os fótons emergentes apresentam energia mais baixa E’.
Assim, como E’ < E, necessariamente os fótons emergentes apresentam menor
frequências ν’ = E’/h que os incidentes.
Tendo uma frequência menor ν ' =
longo,
explicando
o
deslocamento
c
λ
, representa um comprimento de onda mais
de
comprimento
de
onda
observado
experimentalmente. É importante salientar que os fótons que mudaram de frequência são
aqueles que colidiram inelasticamente com o alvo. Há, no entanto, os que colidem
elasticamente responsáveis pelo pico de intensidade não deslocado.
Vamos tratar a interação fóton-elétron (do alvo) afim de obtermos resultados
quantitativos para este processo.
Para nós, a situação física está mostrada abaixo:
Ao interagir com os elétrons do alvo, a radiação é espalhada segundo um ângulo
θ, enquanto elétrons sofrem um recuo adquirindo energia cinética K e momentum p na
direção γ com relação a direção inicial de incidência. Iniciemos considerando a relação
relativística energia-momentum:
E 2 = p 2 c 2 + m02 c 4
de modo que para partículas (fótons) com energia E = hν, temos associado a elas
momentum segundo a relação h 2 ν 2 = c 2 p 2 , já que a massa de repouso mo dos fótons é
nula. Assim, p =
hν
h
=
é o momentum carregado pelos fótons.
c
λ
Vamos assumir que a colisão do raio-x com o alvo deve-se essencialmente a
interação com os elétrons, já que os resultados medidos mostraram-se independentes do
35
material do alvo.
Assim, considerando a colisão de um fóton com um elétron estacionário como
mostrado anteriormente, apliquemos as conhecidas leis de conservação de energia e
momentum.
Da conservação de momentum, usando os parâmetros mostrados acima,
hν 0 hν '
=
cos θ + p cos ϕ
c
c
(direção X)
hν '
sen θ = p sen ϕ
c
(direção Y)
De onde obtemos, elevando ambas equações ao quadrado.
 hνo hν '

−
cos θ  = p 2 cos2 ϕ

c
 c

2
 hν ' 
2
2
2

 sen θ = p sen ϕ
 c 
2
e adicionando estas duas equações acima,
2
2
hνo hv'
 hν o 
 hv' 
cos θ = p 2

 +
 −2
c c
 c 
 c 
Da conservação da energia, inicialmente temos somente a energia do fóton
incidente e a energia de repouso do elétron.
hνo + moc2 = hν’ + K + moc2,
ou seja,
hν' 
 hv
hνo − hν' = K ⇒ c  0 −
 = K
c 
 c
Para o elétron, podemos escrever (K + moc2)2 = c2p2 + (moc2)2, de onde tiramos:
K 2 / c 2 + 2Km0 = p2
36
Expressando K em termos de ν0 e ν’ nesta última equação e utilizando a equação
anterior, tiramos:
2
2
2 hν 0 hν'
hv' 
hν'   hν 0 
 hν 0
 hν
 hν' 
−
cos θ

 + 2 moc  0 −
 = 
 +
 −
c 
c   c 
c
c
 c 
 c
 c
2
ou seja,
hν 0 hν'
hν' 
 hν
(1 − cos θ)
m0 c  0 −
 =
c 
c c
 c
que pode ser reduzida dividindo ambos os membros por:
hν 0 hν'
c c
a :
c
c
1
−
=
(− 1 − cos θ)
hν' hν 0
m0 c
e multiplicando por h
∆λ = λ' ' −λo =
h
(1 − cos θ)
m0 c
que é a chamada equação de Compton e fornece o deslocamento do comprimento de
onda espalhado relativo ao incidente.
A quantidade λc =
h
= 0 ,0243 A0 para elétron é chamado de comprimento de
m0 c
onda Compton e representa a ordem de grandeza da variação de λ devido ao
espalhamento. ∆λ poderá variar até 2 λc.
Como estamos tratando do espalhamento de raio-x pela matéria, é conveniente
entendermos um pouco a respeito da produção de raio-x.
Em 1895 W. Roentgen observou que radiação altamente energética de natureza
não conhecida era produzida quando elétrons acelerados colidiam com a matéria e que
foram denominados de raio-x. Os raios eram mais penetrantes quanto mais rápidos eram
os elétrons que os produziam e a densidade de Raio-X maior quanto maior a quantidade
de elétrons. Logo depois de sua descoberta, sua natureza eletromagnética foi revelada
37
porque, afinal, o que estava acontecendo era que, durante o impacto na matéria, o
elétron veloz é altamente desacelerado, emitindo radiação. A radiação produzida nestas
circunstâncias é denominada de "Bremsstrahlumg" (do alemão).
Um esquema para produção de Raio-x é mostrado na figura abaixo.
Um cátodo aquecido gera elétrons que são acelerados contra um alvo metálico
mantido com o ânodo. A ampola que constitui esta fonte de raio-x está sob vácuo para
impedir que os elétrons sejam espalhados antes de atingirem o alvo. Ao atingirem o alvo,
estes elétrons rápidos são trazidos ao repouso e, neste processo de desaceleração, é
produzido radiação: o raio-x.
Utilizando-se dois alvos distintos temos os resultados mostrados a seguir:
Os dois materiais apresentam comportamentos distintos. No caso de Mo, notamos
que determinados comprimentos de ondas apresentam produção mais acentuada de
raio-x. Estes picos dependem do material e são originados devido a um rearranjo na
estrutura eletrônica do alvo, sendo bombardeados pelos elétrons do feixe. Este fato é
importante para produção de comprimentos de ondas bem definidos.
Notamos, ainda, que existe um comprimento de onda mínimo a partir do qual não
temos produção de raio-x.
38
No processo que estamos descrevendo temos energia cinética dos elétrons, sendo
transformados em radiação, de modo que, para uma determinada voltagem V, temos um
comprimento de onda mínimo, dado por:
hν max =
hc
λmin
= eV ,
de onde tiramos:
λmin =
1,24 x10 −6
(em metros)
V (emvolts )
Assim 35,0 kv, temos λmin = 1,2410-6 / 0,35104 = 3,5010m-10 = 0,35A que
concorda com os resultados mostrados no gráfico anterior.
4- Comportamento Ondulatório para Partículas
Como vimos anteriormente, em um grande número de situações o comportamento
de partículas para ondas eletromagnéticas e sua quantização é a única forma de
explicação para um número grande de observações experimentais, como as leis de
radiação de um corpo negro, o efeito fotoelétrico e o espalhamento Compton.
Existem, no entanto, uma série enorme de outros experimentos envolvendo
partículas cujos resultados só podem ser explicados se associarmos a elas um
comportamento ondulatório. Vamos agora discutir estes experimentos.
Vamos iniciar nossa discussão introduzindo o conceito de ondas materiais
introduzida pela físico francês Louis de Broglie, que analisando experimentos do efeito
fotoelétrico e de Compton, lançou a hipótese de que não somente as ondas
apresentam características de partículas mas, também, as partículas possuem
comportamento ondulatórios. Segundo a hipótese de De Broglie, da mesma forma que
associamos a uma onda de comprimento de onda λ um momentum p a toda partícula de
momentum p pode ser associada um comprimento de onda.
Assim, tanto para partícula material como para radiação, temos que a energia e
frequência estão relacionados por:
E = hν
39
e que o momentum p e o comprimento λ estão relacionadas através da radiação.
P = h/λ
Com estas equações, veremos que os conceitos de partículas (E e p) estão
relacionados aos conceitos de onda (ν e λ) através da constante de Planck h.
O comprimento de onda λ = h/p estabelece a chamada relação de De Brolgie e
associa a cada entidade de momentum p um comprimento de onda λ.
Assim, ao considerarmos uma bola de tênis com velocidade de 10m/seg., estamos
tratando de uma onda cujo comprimento é λ ≅ 610-24 A0 infinitamente menor do que as
dimensões físicas da bola. Se considerarmos, por outro lado, um elétron a 100eV, temos
associado a ele λ = 1,2 A.
Ao tratarmos a radiação devemos lembrar que a óptica geométrica estava
presente sempre que as dimensões do dispositivo óptico em estudo (espessura de lente,
distância entre espelhos ou tamanho de fendas) forem muito maiores do que o
comprimento de onda da radiação em questão. Assim, chamando de d as dimensões
típicas do sistema óptico, o limite λ/d → 0 representa a validade da óptica geométrica.
Quando as dimensões do sistema que interagem com a radiação são comparáveis
ao comprimento de onda, efeitos de difração da ordem de θ = λ/d são predominantes no
processo e a manifestação da difração passa a ser importante, dando lugar ao domínio
da óptica física.
O mesmo ocorre com a manifestação da natureza ondulatória para partículas.
Estas necessitam de sistemas de dimensões muito pequenas para poderem se
manifestar. Para a bola de tênis descrita acima, sua manifestação ondulatória estaria
presente quando ela interagisse com sistemas de dimensões da ordem de 10-24 A0 que
não estão a disposição. Por outro lado, elétrons que apresentam comprimento De Broglie
da ordem de 1A0, devem manifestar sua natureza ondulatória ao interagirem com
estruturas cujas dimensões típicas são desta ordem, como cristais, superfícies sólidas,
etc. Assim, semelhantemente aos raios-x, a interação de elétrons com redes cristalinas
sólidas
devem
produzir padrões
de
difração.
Os
átomos na
rede
cristalina
convenientemente espaçadas funcionam como centros de difração para os elétrons.
Deste modo, Davisson e Germer realizaram um experimento onde elétrons acelerados
por uma diferença de potencial V emergem do sistema com uma energia eV e colidem
com uma superfície sólida e são posteriormente detectados por um detector D. O
40
esquema deste experimento está mostrado a seguir:
O detector pode ser posicionado para qualquer ângulo θ.
Numa primeira experiência, vamos fixar o ângulo θ de observação e variar a energia
cinética do feixe eletrônico emergente através de variação do potencial de grade. Como
resultado, observamos o resultado abaixo:
A existência de um máximo nos elétrons difratados, como função de sua energia
cinética, só pode ser explicado através da ocorrência de uma interferência construtiva
quando elétrons apresentam uma determinada energia ou comprimento de onda. Esta
interferência ocorre devido a elétrons serem espalhados em planos atômicos sucessivos
do cristal. Este resultado experimental comprova, de forma irrefutável, a hipótese de
Broglie, associando à partícula um comportamento ondulatório. Este mesmo resultado
pode ser confirmado se fixarmos o potencial de aceleração em 54V e variamos o ângulo
de observação.
41
A explicação desta observação pode ser feita analogamente à análise do
espalhamento de Bragg e não pode, de forma alguma, ser explicada através do
movimento clássico de partículas, pois partículas não apresentam interferências.
Assim, se tratarmos elétrons como ondas de comprimento λ sendo refletidas pelos
planos cristalinos de um cristal espaçados por d, podemos explicar as observações:
A diferença de caminho entre os feixes é de 2d senϕ e haverá interferência
construtiva sempre que esta diferença for um número inteiro de λ.
nλ = 2d senϕ
(no esquema do experimento 180-θ = 2ϕ)
É importante salientar que, quando dizemos que elétrons sofrem interferências,
não queremos dizer que ondas associadas com um elétron interferem com ondas
associadas com outro elétron, mas sim estamos nos referindo à interferência entre partes
diferentes da onda associada com o mesmo elétron.
Assim, mesmo que tivéssemos trabalhando com um feixe eletrônico de
intensidade bastante baixa, de modo que somente um elétron de cada vez colidisse com
o cristal, observaríamos o mesmo padrão de interferência.
No caso do cristal usado por Davisson e Germer, d = 0,91A (determinada por RX)
de modo que λ = 2d sen γ = 2x 0,91 sen 65o ou seja λ = 1,65A0 . Se calcularmos λ
usando a relação de De Broglie,
h
6.610 −34
λ= =
j − sec = 1,65 A0
− 24
P 410 ...m / seg
(Me = 9,110-31 kg 1 e V = 1,610-19 joule)
42
Mostrando evidências experimentais claras da validade da relação de De Broglie.
O experimento de Davisson e Gerner não foi o único que comprovou de forma
marcante a relação de De Broglie. Experimentos realizados por G.P. Thomson em 1927
com espalhamento de elétrons em folhas finas de metal demonstrou os padrões de
interferência que revelaram, de forma definitiva, a natureza ondulatória do elétron. Em
1937 G.P. Thomson e Davisson ganharam o Prêmio Nobel pela brilhante demonstração
da natureza ondulatória do elétron.
Somente a título de curiosidade, G.P. Thomson era filho de J.J. Thomson que, em
1897 descobriu o elétron. Os livros textos relatam que na época que G.P. Thomson
ganhou o Prêmio Nobel, a comunidade científica da época brincava ao dizer que
"Thomson" (o pai) ganhou o Prêmio Nobel por demonstrar que o elétron é uma partícula,
enquanto que "Thomson" (o filho) ganhou o Prêmio Nobel por demonstrar que o elétron é
onda. Melhor assim, pois as discordâncias entre eles não passou de um mero problema
familiar e a comunidade científica absorveu ambos os conceitos, atribuindo ao elétron um
caráter dual de onda-partícula.
Não somente os elétrons, mas todas as partículas materiais apresentam
comportamento ondulatório. Outros experimentos realizados por Estermann, Stern e
Frisch demonstraram a difração de feixes moleculares de hidrogênio e hélio de uma
superfície de LiF.
No gráfico abaixo, mostramos o padrão de difração de feixes atômicos Hélio e H2
por cristais LiF.
Experimentos mais modernos têm sido capazes de estabelecer de forma completa
a chamada “Optica Atômica”.
UNIVERSIDADE DE SÃO PAULO
INSTITUTO DE FÍSICA DE SÃO CARLOS
DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS
CAPÍTULO VI
COMPORTAMENTO ONDULATÓRIO PARA
PARTÍCULAS E O PRINCÍPIO DE INCERTEZA DE
HEISENBERG
PROF. VANDERLEI S. BAGNATO
2
In classical physics science started from the belief – or should we say illusion? – that we
could describe the world or at least parts of the world without any reference to ourselves.
This is actually possible to a large extent. We know that the city of London exists whether
we see it or not. It may be said that classical physics is just that idealization in which we
can speak about parts of the world without any reference to ourselves.
Werner Heisenberg
3
Capítulo VI
COMPORTAMENTO ONDULATÓRIO PARA PARTÍCULAS E O PRINCÍPIO DE INCERTEZA DE
HEISENBERG
Como vimos nos capítulos anteriores, em um grande número de situações o
comportamento de partículas para ondas eletromagnéticas (fótons) é a única forma de
explicar observações experimentais como a radiação de um corpo negro, o efeito
fotoelétrico e o espalhamento Compton.
Existem, no entanto, uma série de outros experimentos envolvendo partículas cujos
resultados só podem ser explicados se associarmos a elas um comportamento
ondulatório. Vamos nesta parte do curso discutir estes conceitos inicialmente propostos
pelo físico Louis De Broglie.
Iniciemos nossa discussão introduzindo o conceito de ondas materiais introduzida
por De Broglie que, analisando experimentos do efeito fotoelétrico e de Compton, lançou
a hipótese de que não somente as ondas apresentam características de partículas, mas
também as partículas possuem comportamento ondulatório. Segundo a hipótese de De
Broglie da mesma forma que associarmos à uma onda de comprimento de onda λ um
momentum p , a toda partícula de momentum p pode ser associado a um comprimento
de onda.
Assim, tanto para partículas materiais como para radiação, temos que a energia e
freqüência estão relacionados por:
E = hυ
como E = pc; hυ = pc e assim tiramos que o momentum p e o comprimento λ estão
relacionados através da relação:
p=
h
λ
convencionalmente chamada de relação de De Broglie.
4
Os parâmetros que normalmente caracterizam partículas E e p estão relacionados
aos conceitos que normalmente caracterizam onda ν e λ através da constante de Planck
h.
O comprimento de onda
λ=
h
associa a cada entidade de momentum p um
p
comprimento de onda λ.
Como exemplo, seja uma bola de tênis com velocidade 10m/seg, aplicando a
relação acima, vemos que estamos tratando de uma onda cujo comprimento é:
λ=6 x 10-24Å, infinitamente menor do que as dimensões físicas da bola. Se
considerarmos, por outro lado, um elétron a 100 e V, associados a ele temos λ = 1,2 Å
Recordemos que no âmbito da óptica, a chamada óptica geométrica está presente
sempre que as dimensões do dispositivo óptico em estudo (espessura da lente, distância
entre espelhos ou tamanho de fendas) forem muito maiores do que o comprimento de
onda da radiação em questão. Assim, chamando de d as dimensões típicas do sistema
óptico, o limite λ/d→0 representa a validade da óptica geométrica. Quando este limite
não vale temos o domínio da óptica física, onda efeitos inerentes da natureza ondulatória
se manifestam.
O mesmo ocorre com a manifestação da natureza ondulatória das partículas, que
necessitam de sistemas com dimensões típicas muito pequenas para se manifestarem.
Para a bola de tênis descrita acima, sua manifestação ondulatória estaria presente
0
quando ela interagisse com sistemas de dimensões da ordem de 10-24 A que não estão à
disposição. Por outro lado, elétrons que apresentam comprimento de De Broglie da ordem
de 1Ao, devem manifestar sua natureza ondulatória ao interagirem com estruturas cujas
dimensões típicas são desta ordem, como é o caso do arranjo atômico em cristais,
superfícies sólidas, etc. Assim, semelhantemente aos raios – x, a interação de elétrons
com redes cristalinas sólidas, devem produzir padrões de difração. Os átomos na rede
cristalina, uniformemente arranjadas, funcionam como centros de difração para os
elétrons. Deste modo, Davisson e Germer realizaram um experimento onde elétrons
acelerados por uma diferença de potencial V emergem do sistema com uma energia eV e
colidem com uma superfície sólida e são posteriormente detectados por um detector D. O
esquema deste experimento está mostrado a seguir:
5
O detector pode ser posicionado em qualquer ângulo θ, permitindo observações
com dependência angular.
Numa primeira observação vamos fixar o ângulo θ de observação e vamos variar a
energia cinética do feixe eletrônico emergente. Isto pode ser feito através de variação do
potencial de grade. Como resultado observa-se o gráfico mostrado abaixo:
A existência de um máximo nos elétrons difratados como função de sua energia
cinética só pode ser explicado através da ocorrência de uma interferência construtiva
quando elétrons apresentam uma determinada energia ou comprimento de onda que
permita este efeito. Esta interferência ocorre devido à elétrons espalhados em planos
atômicos sucessivos do cristal. Este resultado experimental comprova, de forma clara, a
hipótese de De Broglie, associando às partículas um comportamento ondulatório. Este
mesmo resultado pode ser confirmado se fixarmos o potencial de aceleração em 54V, e
variarmos o ângulo de observação.
6
A explicação destas observações pode ser feita analogamente à análise do
espalhamento de Bragg, e não pode de forma alguma ser explicado através do
movimento clássico de partículas, pois partículas não apresentam interferência.
Assim, se tratarmos elétrons como ondas de comprimento λ sendo refletidas pelos
planos cristalinos de um cristal espaçados por d, temos a situação mostrada abaixo:
A diferença de caminhos entre os feixes espalhados em dois planos sucessivos é
2d senϕ e haverá interferência construtiva sempre que esta diferença for um número
inteiro de λ.
nλ = 2d senϕ
(no esquema do experimento 180 - θ = 2ϕ)
É importante salientar que quando dizemos que elétrons sofrem interferência, não
queremos dizer que ondas associadas com um elétron interfere com onda associada com
outro elétron, mas sim estamos nos referindo à interferência entre partes diferentes da
onda associada com o mesmo elétron. Assim, mesmo que tivéssemos trabalhando com
um feixe eletrônico de intensidade bastante baixa, de modo que somente um elétron de
7
cada vez colidisse com o cristal, observaríamos o mesmo padrão de interferência,
quando o experimento fosse repetido um grande número de vezes.
No caso do cristal usado por Davisson e Germer, d~0,9Å (determinado por técnicos
de raio X) de modo que λ = 2d sen ϕ = 2 x 0,91 sen 65o, ou seja λ = 1,65Å. Se
calcularmos λ usando relação de De Broglie, para elétron com energia de 54 eV,
h 6.610 −34 j − sec .
λ= =
= 1,65Å
p 410 −24 kgm / sec .
(µ
me
= 9,1 10-31kg 1eV = 1,6 10-19 joule)
mostrando evidências experimentais claras de validade da relação de De Broglie.
O experimento de Davisson e Germer não foi o único que comprovou de forma
marcante a relação de De Broglie. Experimentos realizados por G.P. Thompson em 1927
com espalhamento de elétron em folhas finas de metal demonstrou os padrões de
interferência que revelaram de forma definitiva a natureza ondulatória do elétron. Em 1937
G.P. Thompson e Davison ganharam o Prêmio Nobel pela brilhante demonstração da
natureza ondulatória do elétron.
Somente a título de curiosidade, G.P. Thompson era filho de J.J. Thompson que
em 1897 descobriu o elétron (como partícula).
Os livros texto relatam que na época que G.P. Thompson ganhou o Prêmio Nobel,
a comunidade científica da época brincava ao dizer que Thompson (o pai) ganhou o
Prêmio Nobel por demonstrar que o elétron é uma partícula, enquanto Thonspon (o filho)
ganhou o Prêmio Nobel por demonstrar que o elétron é uma onda. Melhor assim, pois as
discordâncias entre eles não passaram de um mero problema familiar e a comunidade
científica absorveu ambos os conceitos, atribuindo ao elétron um caráter dual de ondapartícula, até hoje ultilizado.
Não são somente os elétrons, mas todas as partículas materiais apresentam
comportamento ondulatório. Outros experimentos realizados por Estermann, Stern e
Frisch demonstraram a difração de feixes moleculares de hidrogênio e hélio em uma
superfície de LiF. Hoje já é possível construir interferômetros de partícula maiores que
átomos .
Tendo o comportamento de onda, é natural que associemos às partículas uma
função de onda que descreva o seu movimento ondulatório. Esta função é normalmente
denotada de ψ e representa a função de onda de uma partícula cujo comprimento
8
associado é λ. Partículas que se movem na direção x com um valor preciso de
momentum e energia, deve ser representado por uma onda plana de parâmetros.
λ=
E
h
e υ=
p
h
Denotando de A a amplitude desta onda, temos:
x

− νt 
λ

ψ ( x ,t ) = A sen 2π 
Esta função de onda associada à partícula animada de momentum, deve ser
interpretada como estando relacionada com a probabilidade de que a partícula esteja
numa determinada posição num determinado instante de tempo. Esta é a chamada
interpretação probabilística para a mecânica ondulatória. Segundo esta interpretação a
função de onda ψ, por si só, não apresenta um significado físico direto, pois uma função
de onda, de um modo geral, assume valores positivos e negativos e a probabilidade não
representa nada físico, quando toma valores negativos. Assim, ψ não representa um
observável físico.
Se, no entanto, considerarmos a função ψ2, as objeções colocadas acima não
mais se aplicam. Desta forma, podemos dizer que a densidade de probabilidade deve
estar associado com ψ2.
A interpretação probabilística de mecânica ondulatória toma, então, o seguinte
aspecto: “A probabilidade de experimentalmente acharmos a partícula descrita pela
função de onda ψ (x, t) na posição x e no instante t é ψ ( x,t ) .
2
Desta forma, quando ψ2 tem um valor elevado, significa que é grande a
probabilidade de encontrarmos a partícula naquela localidade no instante de tempo
considerado. Desde que ψ2 não seja nulo há chance de que a partícula seja
encontrada num determinado ponto quando uma medida é realizada.
A interpretação probabilística da função de onda devemos a Max Born em 1926. O
problema todo em mecânica ondulatória corresponde à determinação da função de onda
ψ, pois a partir dela todas as propriedades físicas do sistema podem ser determinadas
através de operações matemáticas envolvendo esta função.
Uma pergunta que de imediato vem a nossa mente é: “Com qual velocidade a onda
de De Broglie deve propagar-se?” A resposta é óbvia: “Ela deve propagar-se com a
9
velocidade da partícula já que ela representa esta entidade movendo-se com v”. Assim,
vamos considerar a freqüência através da relação E=mc2=hv2 e o comprimento de onda
λ=
h
e determinarmos a velocidade de onda por
mv
v DB = νλ =
v DB =
h E mc 2
. =
µv h mv
c2
v
o que mostra que como v nunca é superior a c, vDB (velocidade da onda) e a velocidade
da partícula v nunca será igual. Isto leva a uma contradição do que dissemos como sendo
óbvio acima.
Afim de esclarecermos este ponto, devemos introduzir o conceito de
velocidade de fase e velocidade de grupo.
Antes, porém, vamos salientar que a onda plana ψ que associamos a onda de De
Broglie está toda espalhada ocupando todo espaço considerado. Sendo esta associada à
probabilidade de encontrarmos a partícula, vemos que esta está espalhada em todo
espaço.
Esperávamos um considerável aumento da probabilidade na posição clássica
ocupada pela partícula.
Vamos começar nossa discussão considerando uma onda de amplitude A,
freqüência ν e comprimento de onda x. A função que descreve esta onda é
x

y = A cos 2π νt − 
λ

que pode ser escrita como
y = A cos(ωt – kx)
onde definimos a freqüência angular ω = 2πν e o número de onda k =
2π
λ
.
Pelos dois argumentos que descrevemos acima, é claro que a onda plana acima
não deve ser uma boa representação para uma partícula movendo-se com velocidade v.
Ao invés disto, nos parece razoável se a partícula for descrita por um pacote de onda
mais localizado ao redor de sua posição clássica.
10
Neste caso, os dois pontos acima são esclarecidos, já que a maior concentração
da probabilidade ocorre ao redor do centro do pacote, representando mais ou menos a
região na qual a partícula está localizada além do fato que o que é importante agora é a
velocidade com que o pacote se desloca ao invés da velocidade da onda em si.
Este pacote de onda que aparentemente representa bem uma partícula
preservando as características ondulatórias pode ser formado pela adição de ondas
planas com amplitudes e freqüências levemente variadas. Vamos considerar a interação
de duas ondas planas, cujas freqüências diferem levemente. A interferência de uma onda
com a outra, resulta numa onda cuja amplitude varia, fato este que define o pacote de
onda.
Se a velocidade das ondas que compõem o pacote são as mesmas a velocidade
do pacote seria a mesma da onda. No entanto, se as ondas componentes representam
velocidades diferentes as ondas individuais não propagarão juntas e como resultado o
pacote de onda propaga-se com uma velocidade diferente daquelas das ondas
componentes.
Assim, consideremos as duas ondas cuja freqüência angular difere por dω e cujo
vetor de onda difere por dk. Tendo a mesma amplitude, temos:
11
y1 = Acos(ωt – kx)
y2 = Acos[(ω+ dω)t - (k + dk)x]
A resultante da soma destas duas oscilações, resulta em:
 2ω + dω   2k + dk    dωt dkx 
y = y1 + y 2 = 2 A cos 
−
t − 
 x  cos
2
2 
  2    2

a + b
a − b
onde usamos a identidade cos a + cos b = 2 cos 
 cos 
 . Do fato que dω e
 2 
 2 
dk são pequenos, comparados com ω e k,
2ω + d ω ≈ 2 ω
2k + dk ≈ 2k
e temos, então:
dk 
 dω
y = 2A cos (ωt – kx) cos 
x
t−
2 
 2
que representa uma onda de frequência ω e número de onda k, cuja amplitude está
modulada por uma frequência
dk
dω
e número de onda
. O efeito desta modulação é o
2
2
de produzir sucessivos pacotes de onda, como mostrado na figura anterior. A velocidade
das ondas é a convencional,
vp =
ω
k
denominada de velocidade de fase, enquanto o envoltório propaga-se com velocidade
vg =
denominada de velocidade de grupo.
dω
dk
12
Como já vimos, a velocidade de fase é dada por:
Vp =
c2
v
enquanto a velocidade de grupo,
vg =
Como E = hυ , definindo h =
dω dω / dv
=
dk dk / dv
h
h
E = hω =
ω = hυ = mc 2 =
2π
2π
tiramos que:
ω (v ) =
∴
Da mesma forma k =
e como m =
2π
λ
=
2π
h
m0
1−
2
c2
v
c2
2π vm 0
dω
=
3/2
dv
 v2 
h1 − 2 
c 

2π
2πmv
=
h
h
mv
m0
1−
v2
c2
k( v ) =
2π
h
m0 v
1−
v2
c2
m0
1−
2
v
c2
c2
13
de modo que
dk 2π
=
dv
h
m0
v2
1− 2
c
+
2πm0 v 2
1
2
h c  v2
1 − 2
c


2
2
1 − v + v
2πm0  c 2 c 2
=

h   v 2 3 2
 1 − 2 
c 




3 2


 2π
m0
=
3
 h  v2  2
1 − 2 

c 


e calculando vg, de onde tiramos:
vg = v
demonstrando que a velocidade com que o pacote de onda se desloca corresponde à
velocidade da partícula. Este resultado é bastante razoável já que o máximo de
probabilidade acompanha o movimento do centro de massa da partícula e com a mesma
velocidade desta.
Assim, podemos afirmar que o pacote de onda de De Broglie associado com
uma partícula que move-se, tem a mesma velocidade que a partícula.
Da necessidade de uma partícula livre ser representada por um pacote de onda ao
invés de uma onda plana sugere que sempre estaremos adicionando várias ondas de
comprimento de onda ligeiramente diferente para formar o pacote. Como o comprimento
de onda está associada com o momentum da partícula, vemos que teremos um
compromisso entre saber exatamente o momentum da partícula com sua localização, pois
quanto mais ondas de comprimento de onda diferentes adicionamos, mais localizado
espacialmente é o pacote de onda e vice-versa. Chegando ao limite que quando só temos
um único comprimento de onda ou momentum, a partícula é representada por uma onda
plana igualmente espalhada em todo espaço, denotando que a partícula é igualmente
provável de ser encontrada em qualquer posição, o que representa uma completa
delocalização espacial.
Este compromisso entre a perfeita determinação do momentum e da localização
gera um dos mais importantes princípios da mecânica quântica que é o chamado
princípio da incerteza de Heisenberg.
14
Vamos fazer uma análise bastante simplificada para determinarmos a relação
entre a incerteza no conhecimento do centro do pacote de onda ∆x com a incerteza no
conhecimento do momentum ∆p da partícula. Simplificadamente, vamos considerar um
pacote de onda formado da adição de duas ondas planas que diferem levemente em
frequência (∆ω) e em número de onda (∆k).
Ψ1 = A cos (ωt – kx)
Ψ2 = A cos [(ω + ∆ω)t – (k + ∆k) X]
Fazendo o mesmo cálculo feito anteriormente,
 ∆ωt − ∆kx 
Ψ = Ψ1 + Ψ2 = 2 A cos (ωt – kx) cos 

2


que representa a série de pacotes de onda mostrados abaixo:
A extensão de cada grupo de onda e metade do comprimento de onda λm da
modulação de amplitude. No caso de estarmos associando este pacote com uma
partícula é razoável assumirmos que a partícula deva estar localizada dentro desta
extensão do pacote de tamanho ∆x =
λm
2
.
Esta deve ser a incerteza máxima na
determinação da posição da partícula. É importante lembrar que caso estivéssemos
considerando infinitas ondas entre K e K + ∆k teríamos um único pacote ao invés de
múltiplos.
Como:
λm =
2π
2π
2π
=
⇒ ∆x =
1
km
∆k
∆k
2
15
Como as ondas que formam este grupo apresentam vetor de onda entre k e k +
∆k, estaremos incertos com respeito ao valor de k da onda final por uma quantidade no
mínimo de ∆k. Assim vamos supor, com razão, que a incerteza no número de onda é ∆k.
Desta forma, como k =
⇒k =
2π
λ
=
2π
h
p
2π
p , de modo que
h
∆k =
2π
∆p
h
e a incerteza em k representa uma incerteza no conhecimento do momentum da partícula.
Portanto, temos:
∆x =
2π
2π
≅
,
∆k 2π ∆p
h
∆x.∆p ≅ h
Agora, os valores que tomamos para ∆x e ∆p são os mínimos aceitáveis dentro da
lógica da construção de nosso problema. Desta forma, uma relação entre ∆x e ∆p mais
razoável fornece:
∆x . ∆p ≥ h
quaisquer outros fatores somente aumentarão ∆x e ∆p acima.
Esta última expressão é uma forma simplificada do chamado princípio de incerteza
de Heisenberg, obtido em 1927 pelo físico Werner Heisenberg. O princípio da incerteza
estabelece que a incerteza na posição de uma partícula e a incerteza no momento
durante uma determinada medida, apresenta na melhor das hipóteses como produto um
valor da ordem da constante de Planck. Note que este é um resultado inerente com a
natureza ondulatória da matéria.
16
Se especificássemos mais precisamente o que significa incerteza em posição e
momentum através das chamadas variâncias ∆x =
∆x.∆p ≥
(x )
2
2
− x encontraríamos:
h
2
com um fator extra de 2π que é uma relação mais formal e precisa do princípio da
incerteza.
h 

h =

2π 

Da relação de incerteza entre momentum e posição, é possível obter uma relação
semelhante entre energia e tempo.
A incerteza em energia ∆E = h∆ν onde ∆ν é a incerteza na frequência. Se
tomarmos como medida de tempo a frequência da onda, temos que ∆ν =
1
de modo que
∆t
∆E.∆t = h, e da mesma forma que anteriormente.
∆E.∆t ≥ h
ou de uma forma mais formal.
∆E.∆t ≥
h
2π
que é o princípio da incerteza envolvendo energia e tempo.
A relação de incerteza entre energia e tempo tem uma importante consequência
em física atômica. Do fato dos estados eletrônicos apresentarem um tempo de vida finito,
implica que os estados estejam dentro de certo intervalo de energia.
Após vermos, em linhas gerais, o princípio de incerteza, vamos fazer algumas
aplicações deste importante resultado. Consideremos, inicialmente, a determinação da
posição de um elétron que apresenta momentum px. A fim de observar tal elétron,
incidimos sobre ele luz e observamos a luz espalhada (como fazemos com a obeservação
de qualquer objeto).
17
O sistema óptico tem um poder de resolução na determinação da posição, que é
escrita como (dependendo do ângulo de coleta de luz):
∆x =
λ
sen ϕ
sendo λ o comprimento da onda da luz. Assim, erroneamente pensaríamos que
diminuindo λ aumentaríamos indefinidamente a resolução da posição do elétron. No
entanto, ao serem espalhados pelo elétron, os fótons transferem momentum ao elétron
(lembre-se quando falamos de pressão de radiação), que no caso seria todo momentum
espalhado dentro do ângulo ϕ.
∆p x =
2 hν
sen ϕ
c
e o fator de 2 é colocado devido ao fato de estarmos colhendo fótons de +ϕ à -ϕ.
Assim, teríamos:
∆p x .∆x ≈
2 hν
λ
. sen ϕ
= 2h
c
sen ϕ
de modo que, na determinação da posição do elétron através da luz, vale a relação:
∆p.∆x ≥ h
e, portanto, o princípio de incerteza é satisfeito.
18
Esta relação na determinação de ∆p e ∆x, pode ser escrita de outra forma.
Multiplicando e dividindo a relação acima por p/m
p∆p m∆x
.
≥h
m
p
Como
m
p∆p
∆x = ∆t,
= ∆E e
p
m
∆E.∆t ≥ h
demonstrando que a imprecisão no instante de medida relaciona-se com a incerteza na
energia medida através da relação acima.
Devido ao princípio de incerteza, a energia de um sistema localizado no espaço
nunca pode ser nula, pois isto acarretará ∆p = 0 e ∆x =
∞, delocalizando o sistema que
por princípio está localizado.
Consideremos como exemplo a determinação da energia mais baixa do átomo de
hidrogênio. Temos:
E=
p2
Ze2
−
2m
r
como p~∆p, r~∆r
E≅
(∆p )2
2m
−
Ze2
∆r
mas ∆p.∆r ~ h
2
(
∆p )
E≅
Ze2∆p
−
2m
h
Sendo ∆p o ponto mínimo da energia
dE
=0
d ∆p
19
2∆p Ze2
Ze2m
−
= 0 ⇒ ∆p =
ou
2m
h
h
Z2e 4m2 e2 Zm 2
E= 2
−
Ze
h 2m
h2
1 Z2e 4m
E≅−
2 h2
Só para referência, a energia exata dos níveis de energia do átomo de hidrogênio
é:
1 Z2e 4m
En = −
(n = 1,2,3...)
2 h 2n2
e estaremos abordando mais este tema adiante.
OSCILADOR HARMÔNICO
Para o oscilador harmônico a energia é:
E=
p2
1
+ mω2 x 2
2m 2
de modo que:
∆p.∆x ~
h
h
→ p.x ~ .
2
2
Desta forma, o estado de mais baixa energia:
2
p2
1
2 h
E0 =
+ mω
2m 2
4p2
de modo que
dE0
m ωh
e, assim:
= 0 , produz p2 =
dp
2
20
E0 =
1
hω
2
Em linhas gerais, o estado de mais baixa energia de um sistema físico ligado (que
é o caso de partículas presas em potenciais) é aquele compatível com o princípio de
incerteza.
A existência de uma Energia diferente de zero como mínima para uma partícula
confinada tem importantes conseqüências pata os sistemas físicos.
UNIVERSIDADE DE SÃO PAULO
INSTITUTO DE FÍSICA DE SÃO CARLOS
DEPARTAMENTO DE FÍSICA E CIÊNCIA DOS MATERIAIS
ESTRUTURA ATÔMICA
Prof. Dr. Vanderlei Salvador Bagnato
2
CAPÍTULO VII
ESTRUTURA ATÔMICA
O conceito de que toda matéria é constituída ao nível microscópico de partes
fundamentais, denominadas de átomos, é bastante antigo antecipando todas as idéias
mais modernas que levaram ao conhecimento do átomo. Este conceito ficou, no entanto,
embebido em mistério até aproximadamente um século atrás, quando os físicos e
químicos demonstraram, de forma decisiva, estas idéias.
Vários foram os modelos desenvolvidos para explicar as propriedades do átomo. A
descoberta do elétron e a conclusão de que todos os átomos contêm elétrons na sua
composição básica foi um dos passos decisivos na direção da determinação da estrutura
atômica.
Sendo os elétrons negativos, enquanto os átomos são eletricamente neutros, faznos concluir que a matéria, mais precisamente o átomo, deve conter cargas positivas
suficientes para balancear as negativas. Da informação de que elétrons são milhares de
vezes mais leves que os átomos (obtidos dos experimentos anteriores de J. Thomson),
sugere que as cargas positivas constituintes dos átomos é que determinaram
grandemente a massa do átomo. Baseado nessas informações, J. Thompson propôs em
1898 que os átomos são esferas de cargas positivas nas quais os elétrons negativos
estão embebidos. Este era, em linhas gerais, o modelo de Thompson para o átomo. O
modelo era denominado de pudim com ameixas devido à semelhança.
O modelo parecia razoável, baseado nas informações experimentais apresentadas.
Nenhum experimento, no entanto, foi feito de imediato para comprovação do modelo. O
raio desta esfera foi tomado como sendo da ordem de 1Å (10-10m), obtido através do uso
do número de Avogrado e as densidades típicas do sólido. A repulsão mútua entre os
elétrons produziria uma distribuição uniforme destes dentro da esfera, no que
3
determinaria as posições de equilíbrio para os elétrons. A excitação dos átomos, por
exemplo, através do aumento de temperatura, era visto como vibrações destes elétrons
ao redor de suas posições de equilíbrio, dando origem à radiação eletromagnética que é
observada.
Consideremos, a fim de realizarmos uma estimativa, que temos uma esfera de
densidade ρ , carregada positivamente no interior da qual um elétron move-se ao redor
do centro (posição de equilíbrio).
Através da lei de Gauss, quando o elétron estiver a uma distância r do centro, a
força sobre ele será
4
e
4
F = πr 3 ρ . 2 = − πeρr
3
3
r
que é linear na posição, demonstrando que tal elétron executa um movimento harmônico
ao longo do diâmetro, com constante de mola
4π
eρ . Tomando a esfera como tendo um
3
diâmetro D da ordem de 1Å = 10-8 cm, teremos ρ =
mola é
4x
4π
e
8e 2
e. π D 3 = 3
3 3 2
D
e
4
3
πD
, de modo que a constante de
3
4
que vamos estimar 4 x (1,6 10-19 x 3109)2.
1
10 − 24
que é
23,5 x10 −20
≅ 2 x10 6 dyn / cm .
− 24
10
Esta força de mola leva a uma frequência de vibração
v=
1
2π
K
1
=
m 2π
10 6
≅ 6.5 x1015 Hz
− 28
9,1110
Esta frequência corresponde à:
λ ~
c
31010
=
≅ 600 Å
v 5,21015
Este comprimento de onda, que localiza-se na ultra-violeta, caracterizaria
totalmente a radiação emitida pelo átomo. Isto, evidentemente, não justifica a grande
4
variedade de linhas espectrais observada, mas descargas em vapores atômicos,
demonstrando problemas com o modelo de Thomson.
A evidência definitiva de que o modelo de Thomson estava incorreto aconteceu
alguns anos mais tarde quando Rutherford realizou experimentos com o espalhamento de
partículas α demonstrando que a parte carregada positivamente do átomo estava
concentrada numa pequena região central no átomo, denominada de núcleo.
Estudando radioatividade Rutherford utilizou partículas α (que são átomos de
Hélio duplamente ionizados) para realizar experimento de espalhamento em películas
finas de metal. Nos seus arranjos experimentais, uma fonte radioativa produz um feixe de
partículas α que é colimado e colide sobre uma folha metálica.
Interagindo com as cargas dos átomos através da força Coulombiana, estas
partículas sofrem deflexões que são detectadas através de sua colisão com uma
superfície convenientemente preparada.
Caso o modelo Thomson fosse verdadeiro, não seriam esperadas deflexões a altos
ângulos. No entanto um número excessivamente grande de partículas
espalhadas a altos ângulos foi observado, propiciando a Rutherford a proposição de um
novo modelo atômico.
O modelo de Rutherford apresenta a estrutura atômica como tendo toda sua carga
positiva (e, portanto, toda sua massa) concentrada na região central denominada de
núcleo, cujas dimensões seriam muito menores do que as dimensões do átomo. Quando
as partículas α
passarem muito próximas deste núcleo a repulsão Coulombiana
produzirá um grande desvio das partículas, como observado. Rutherford efetuou um
cálculo bastante detalhado para demonstrar aquilo que propunha em seu modelo, com
base nos resultados do espalhamento das partículas α .
5
Devido à grande concentração das cargas positivas numa determinada região é
sua interação com as partículas α que determina o espalhamento, podemos, assim,
esquecer os elétrons.
Consideremos, então, como predominante, o espalhamento devido à repulsão
Coulombiana entre as partículas α carregadas positivamente com os núcleos, também
positivos. Como estaremos tratando de átomos pesados, consideremos o recuo causado
pelas colisões nos núcleos como desprezíveis, ou seja, o modelo que tomaremos para
efetuar os cálculos consiste em imaginar os núcleos como pontos de carga fixos. Assim, o
modelo de espalhamento que tomaremos está convenientemente mostrado abaixo, onde
mostramos a trajetória de uma partícula α espalhada pelo núcleo.
Uma partícula α de carga ze e massa M passa próximo de um núcleo de carga
+Zé, tomado este como estando na origem do sistema de coordenada. Antes de
encontrar o núcleo, a partícula desloca-se em linha reta com velocidade v. Após o
encontro a partícula também continua deslocando-se com v’ em linha reta. Em cada
instante a posição da partícula com relação ao núcleo pode ser determinada pelas
coordenadas polares r e v como mostra a figura.
A distância entre a linha de movimento e a linha que determina um eixo
coordenado passando pelo núcleo b é chamada de parâmetro de impacto. O ângulo θ,
que a trajetória da partícula define após espalhamento, é chamado de ângulo de
espalhamento. A distância entre a linha de movimento final e sua paralela passando pelo
núcleo é b'.
Como a força de Coulomb que atua sobre a partícula é central (sempre na direção
radial), o torque exercido é nulo e, portanto:
F xr =
dL
= 0 → L = cte
dt
6
de onde tiramos Mvb = Mv'b' = L.
Sendo a força conservativa a energia é conservada
1
1
Mv 2 = Mv' 2 ⇒ v = v' e,
2
2
portanto, b = b'.
Vamos considerar a partícula movendo-se sob ação da força Coulombiana e
vamos determinar sua equação de movimento.
2
A força é sempre radial valendo zZe
r2
, e durante o movimento da partícula existe
uma variação do comprimento do raio vetor r e de sua posição, de modo que temos:
z
2
d 2r
Ze 2
 dϕ  
=
M
−
r

 
 2
r2
 dt  
 dt
sendo o primeiro termo a contribuição da variação do módulo da posição e o segundo tipo
força centrífuga − ω 2 r e variação da orientação do raio vetor. Isto vem do fato que:
r& = r&rˆ + rϕ&ϕˆ
de modo que (usando r&ˆ = ϕ&ϕˆ e ϕˆ& = −ϕ&r̂ )
(
)
r&& = &r& − rϕ& 2 rˆ + (rϕ&& + 2r&ϕ& )ϕˆ
sendo a força central, ficamos somente com o primeiro termo.
Vamos resolver esta equação de movimento escrevendo r =
equação em termos de u.
1
u
e escrevendo a
7
dr dr dϕ dr du dϕ
=
.
=
. .
dt dϕ dt du dϕ dt
ou seja
dr
L d 2u
1 du Lu 2
=− 2
.
=−
dt
M dϕ
u dϕ M
pois
dϕ
.Mr 2 = L
dt
e a segunda derivada
d 2r
d  dr  dϕ
L d 2 u Lu 2
=
.
=
−
 
M dϕ 2 M
dt 2 dϕ  dt  dt
 d 2 r − L2 u 2 d 2 u 
∴ 2 =

M 2 dϕ 2 
 dt
Substituindo na equação de movimento:
L2 u 2 d 2 u M  Lu 2
−M
− 
dϕ 2 dϕ 2 u  M
2

 = zZe 2 u 2

de onde tiramos, usando L = Mvb
d 2u
zZe 2
+
u
=
dϕ 2
Mv 2 b 2
De um modo geral, denominamos:
2 zZe 2
D=
, (dimensão distância)
Mv 2
de modo que
8
d 2u
D
+u = − 2
2
dϕ
2b
A solução geral desta equação é:
u = A1 cos ϕ + A2 senϕ − D
2b 2
o que nos leva à:
− A1 cos ϕ − A2 senϕ + A1 cos ϕ + A2 senϕ −
D
D
=− 2
2
2b
2b
que prova a validade da solução.
Quando r→ 00, ϕ → 0 → u → 0
0 = A1 − D
Quando r → 00, ϕ → 0 →
2b 2
→ A1 = D
2b 2
dr
= −v
dt
dr
L du
−L
( A2 )
=−
= −v =
dt
M dϕ
M
Mv 1
⇒ A2 =
=
Mvb b
Assim, u =
D
1
D
cos ϕ + senϕ − 2 e, portanto, a solução para a trajetória da
2
b
2b
2b
partícula é:
1 1
D
= senϕ + 2 (cos ϕ − 1)
r b
2b
9
A distância D =
zZe 2
, representa a distância na qual a energia cinética e potencial
2
1
Mv
2
2
igualam-se 1 =
zZe e D
e representa a menor distância que a partícula e o núcleo ficarão
2
1
2 mv
quando a colisão for frontal. Neste ponto a partícula reverte sua velocidade e volta para
sua origem.
O ângulo de espalhamento θ pode ser encontrado da equação da trajetória,
tomando-se o ponto ϕ onde r → ∞.
Como neste ponto ϕ + θ = π
senϕ +
D
D
cos ϕ =
2b
2b
de onde podemos tirar após alguns passos:
cot ang
θ
2
=
2b
D
A distância de maior aproximação R pode ser calculada quando ϕ = (π = θ )/ 2
1 1
π −θ  D
= sen
+ 2
R b
 2  2b
e
de onde pode-se obter que:
b=
 π −θ 
cos 2 − 1
D
θ D
π −θ 
cot an = + an

2
2 2
 2 
10
R=
D
1 
1+

2  sen θ 2 
No experimento de Rutherford, o que era observado era o número de partículas α
que são espalhadas num determinado ângulo θ quando um grande fluxo de partículas α
incide sobre o alvo. É claro que não podemos precisar exatamente θ e o que estamos
procurando é o número de partículas que é espalhada entre θ e θ + dθ. Este número será
denominado por:
N(θ)dθ = número de partículas espalhadas entre θ e θ + dθ/tempo.
Se olharmos a relação que fornece o ângulo de espalhamento θ, veremos que o
que causará partículas espalharem em diferentes ângulos é somente o parâmetro de
impacto b diferente.
Deste modo, as partículas que espalham entre θ e θ + dθ são exatamente aquelas
que colidem com parâmetro de impacto entre b e b + db.
Vamos considerar uma porção do alvo de área de A/cm2, Ao redor de cada núcleo
atômico nesta área analisaremos o efeito discutido acima. Para cada núcleo estamos
considerando as partículas α colidindo num anel de área 2 π bdb ao redor do núcleo.
Sendo t a espessura da porção considerada, o número de núcleos em A é ρAt , sendo ρ
a densidade atômica do material.
11
Seja P(b)db a probabilidade que a partícula α passa por um destes anéis. Como
estamos tomando uma densidade uniforme de partículas incidindo na amostra, temos
que:
P(b )db =
área total anéis
A
Assim,
P(b )db = ρt 2πbdb
mas utilizando o fato que b =
D
cotan D/2
2
db = −
D 1 dθ
2 sen 2 θ 2 2
bdb = −
D 2 cos θ 2
dθ
8 sen 3 θ 2
bdb = −
D 2 senθ
dθ
16 sen 4 θ 2
e, portanto
e cos θ 2 sen θ 2 = 12 senθ
12
e finalmente P(b )db =
−π
sin θdθ
ρtD 2
8
sin 4 θ 2
o sinal (-) aparece devido ao fato que aumentando b diminuímos θ)
Como -P(b)db representa a probabilidade que as partículas incidentes sejam
espalhadas entre θ e θ + dθ,
N (θ )dθ π
sin θ
= ρtD 2
dθ
I
8
sin 4 θ2
sendo 1 o número incidente e n(θ)dθ o número espalhado no ângulo considerado.
Este resultado mostra que a probabilidade de espalhamento em grandes ângulos
não é nula. De fato é bastante elevada, concordando com resultados experimentais.
Os experimentos realizados testaram a dependência angular usando chapas finas
de Au e Ag no intervalo 5° a 150° demonstrando boa concordância. A quantidade N(θ)dθ
mostrou-se experimentalmente proporcional a espessura t como previsto.
2

Sendo proporcional a D =  zZe

2
2

 ,N(θ)d(θ), varia inversamente proporcional
Mv 2 
2 
com o quadrado da energia cinética das partículas α incidentes. Isto foi testado
experimentalmente mostrando boa concordância.
Uma última observação, e das mais conclusivas, veio da determinação do mundo Z
a partir dos resultados de espalhamento. A concordância de Z medida com o número
atômico do metal utilizado é muito boa.
Tendo seu modelo confirmado pelas observações experimentais, Rutherford
utilizou sua relação para estimar um limite do tamanho do núcleo. Observando as
partículas que espalham a 180°,
R180o = D =
zZe 2
2
Mv 2
É claro que esta é uma estimativa superior, pois as partículas α aproximam-se do
núcleo por uma distância muito maior do que o tamanho real do núcleo.
13
Se compararmos os resultados experimentais e teóricos de N(θ) veremos que eles
concordam muito bem para R grandeza (~ 10-14m = 10-4Å). Isto mostra que esta deva ser
a ordem de R grandeza do núcleo atômico. Para produzirmos menores R, aumentamos a
energia das partículas. Neste caso há penetração destas partículas na região nuclear e aí
evidentemente o modelo não concorda.
A fórmula de Rutherford que obtivemos anteriormente pode ser escrita em termos
dσ
, definida como:
dΩ
da chamada secção do choque diferencial
dN =
dσ
IndΩ
dΩ
dN → número de partículas espalhadas num ângulo sólido dΩ a um ângulo θ
I → número de partículas que colidem
N → densidade nuclear por área
N=σIn
A definição acima é parecida desta última
N σ
= .
1
I
n
Como definimos N(θ) dθ = dN, temos:
2
 zZe 2 
1

dN = 
2 
4
 2 Mv  sin
θ
2
chamada de secção de choque diferencial de Rutherford.
14
De acordo com estas expressões, o número de partículas α por unidade de área
que atingem a tela que floresce a uma distância r deve ser proporcional a espessura t da
folha metálica, a densidade de átomos no metal e, o que é mais importante, com o
quadrado do número atômico Z. Este número ainda depende inversamente com a energia
cinética das partículas α e apresenta o termo de dependência com .
Todas estas dependências puderam ser verificadas demonstrando a validade do
modelo de Rutherford, no qual o átomo é constituído de um caroço positivo (núcleo)
circundada pelos elétrons negativos. A concordância experimental deste modelo valeram
a Rutherford o mérito da descoberta do núcleo atômico.
Como vimos, através do modelo de Rutherford, a única interação considerada foi à
eletrostática e os resultados obtidos permitem a determinação de um tamanho limite para
o núcleo atômico. Vamos calcular a distância mais próxima do centro nuclear que uma
partícula pode atingir. Para isto, vamos considerar aquelas colisões frontais (b = 0) onde o
ângulo de espalhamento é praticamente θ = 180°. Nesta situação a energia potencial
eletrostática no ponto mais próximo é igual à energia cinética inicial da partícula.
2
Ze 2
Energia cinética (~ 7.7 Mev)
r0
Utilizando ouro Z = 79
(
)
2
Z 1,610 −19 .91018
2
7,7.10 6 x1,610 −12
r0
para ouro (Au) → r0 ~ 3 10-12 cm ~ 3 10-4 Å
Desta forma vemos que para ouro o raio nuclear é menor do que raio atômico.
Experimentos mais modernos onde partículas α
podem ser artificialmente
aceleradas demonstraram que a relação de espalhamento de Rutherford começa a
discordar dos resultados experimentais.
O modelo estabelecido por Rutherford, no qual um núcleo massivo e positivo
apresenta os elétrons ao seu redor, exige que tais elétrons descrevam trajetórias estáveis
ao redor deste núcleo, semelhante ao modelo planetário que temos. Vamos examinar
mais de perto os elétrons ao redor do núcleo num dos átomos mais simples que é o
15
átomo de hidrogênio. Tomando por simplicidade uma trajetória circular, temos para uma
trajetória de raio r
mv 2 e 2
= 2
r
r
e, assim, a velocidade está relacionada com o raio da órbita por:
v= e
mr
Através da conservação de energia, temos que a energia total:
E=
1 2 e2
mv −
2
r
que com a relação anterior permite-nos obter
1 e2 e2
−
2 r
r
2
e
E=−
2r
E=
1 coul = 3 109 stacoul
Assim, a energia total do elétron é negativa como esperado, já que ele está ligado
ao núcleo. Qualquer energia E ≥ 0 significaria um elétron não ligado ao núcleo. Utilizandose dos resultados experimentais conhecidos de que a energia necessária para extrair o
elétron do átomo de hidrogênio é de 13,6 eV,
− 13,6 x1,610
−12
(1,610 ) .910
=−
−19 2
18
2r
o
0,53 A
⇒ r ≅ 5,310 −9 cm ~
RaioBohr
Esta análise clássica feita para avaliar o raio da órbita eletrônica, que
evidentemente determina o raio do átomo, está completamente em desacordo com a
16
teoria eletromagnética segundo a qual este elétron acelerado deveria radiar energia na
forma de elétron em movimento circular deveria continuamente perder energia e assim
gradativamente, aproximando-se do núcleo de uma forma espiralhada, como mostrado
abaixo, finalizando com o colapso do átomo.
Este colapso, evidentemente, está em contradição com as observações reais dos
átomos.
A razão desta contradição está no fato de que estamos tratando o elétron como
partícula de uma forma completamente clássica, mas como vimos anteriormente, seu
comportamento é ondulatório. A fim de evitarmos esta instabilidade do modelo de
Rutherford, é necessário a realização de um modelo que inclua as noções de onda
discutidas anteriormente. No entanto, de forma alguma isto invalida a fórmula de
Rutherford que sobrevive mesmo quando um tratamento puramente quântico é feito para
o espalhamento de partículas α . A questão básica onde o modelo falha é a estabilidade
das órbitas. A solução para tal problema foi proposta inicialmente por Niels Bohr (1913)
que foi muito bem sucedido na explicação e predição do espectro atômico absorvido em
vários experimentos.
Antes de discutirmos modelos mais sofisticados para o átomo é necessário
fazermos alguns comentários sobre a observação da radiação emitida pelos átomos no
que denominamos de espectro atômico.
Uma das maneiras de determinarmos a composição da radiação emitida pelos
átomos está mostrada abaixo.
17
A radiação dos átomos pode ser obtida através de uma descarga elétrica no gás
constituído pelos átomos em estudo. Durante a descarga ocorre colisões dos elétrons
com os átomos e, nestas colisões, há transferência de energia colocando elétrons dos
átomos em estados mais energéticos. Como estes estados mais energéticos não são
estáveis, os elétrons voltam para seus estados normais e neste processo emitem luz.
Esta luz emitida é uma assinatura dos níveis de energia do átomo e revelam toda
informação da estrutura atômica.
Esta radiação emitida pelos átomos pode ser bloqueada de modo que somente um
fino flash que passa por uma fenda é permitido incidir sobre um prisma (ou rede de
difração). Ao passar por este prisma a luz é dispersada, separando as várias porções de
comprimento de onda diferentes que compõem esta radiação. Desta forma, a placa
colocada para mostrar a luz dispersa também mostra a composição espectral da luz
proveniente dos átomos.
Ao realizarmos o experimento acima notamos que a composição espectral da luz
proveniente dos átomos não é um contínuo (como a emanada de um corpo negro), mas é
composta de somente alguns comprimentos de onda discretos, cada um denominado de
uma linha espectral. Observa-se que cada tipo de átomo apresenta um conjunto de linhas
espectras que o caracterizam totalmente. Isto permite em muitos casos a caracterização
química
de
elementos
desconhecidos,
muito
importante
na
determinação
de
composições, etc.
Um dos espectros mais simples e, portanto, mais solicitado para estudos é o do
átomo de hidrogênio. Na figura abaixo mostramos este espectro impresso num filme
fotográfico.
18
Uma série de observações interessantes pode ser feita neste espectro ao começar
pelo fato que seu espaçamento diminui ao diminuirmos , e que a série de linhas tem um
limite em 3645,6 Å.
Esta regularidade no espectro do hidrogênio fez com que vários autores
procurassem uma fórmula empírica para descrevê-lo.
Em 1885 Balmer propôs a relação
n2
λ = 3646 2
n −4
que explicava as 3 primeiras. Em 1890 Rydberg propôs que
1 
 1
= R H  2 − 2 n = 3,4,5...
λ
n 
2
1
onde RH é a chamada constante de Rydberg.
A observação do espectro atômico foi um dos mais importantes estímulos
experimentais para o início da mecânica quântica. A comunidade científica da época
procurava por um modelo que todos estes resultados experimentais observados e ainda
contivesse em seu corpo a precisão das linhas espectrais observadas.
Em 1913 Niels Bohr desenvolveu um modelo dinâmico que preenchia os requisitos
para explicar o espectro do átomo de hidrogênio, com a vantagem de ser escrito e
desenvolvido de uma forma inteligível e matematicamente simples. O então chamado
modelo atômico de Bohr tem seu desenvolvimento baseado em alguns postulados
básicos. Os postulados são:
1 - Um elétron no átomo move ao redor do núcleo em uma órbita
circular sob influência da atração Coulombiana obedecendo às leis
clássicas da mecânica.
19
2 - Ao contrário de ser possível ao elétron existir em qualquer
trajetória ao redor do núcleo, somente serão permitidas as
trajetórias cujo momento angular L é um múltiplo de h / 2π = h .
L = nh
n = 1, 2, 3, ...
3 - Apesar de estar numa órbita constantemente acelerada,
elétrons nas órbitas permitidas no postulado anterior são estáveis,
não irradiando energia eletromagnética e, portanto, mantendo
constante a sua energia.
4 - Toda vez que o elétron mudar de órbita passando de uma órbita
de energia Ei para outra de energia Ef haverá emissão de energia
na
forma
Ei − E f
h
de
radiação
eletromagnética
cuja
freqüência
é
= v sendo h a constante de Planck.
Todos os postulados tentam, utilizando os conhecimentos gerados por outros
modelos, justificar as observações experimentais, que existe um núcleo, que as órbitas de
elétron são estáveis e que há emissão de radiação. A quantização é introduzida no
momento angular, mas como veremos, reflete na energia.
Vamos, então, resolver o átomo utilizando os postulados acima gerando, assim, o
que chamaremos de modelo atômico de Bohr. Se considerarmos um átomo
monoeletrônico, cujo elétron tem massa m e efetua trajetórias circulares, temos que
Ze 2
v2
=m
onde foi considerado que sendo o núcleo muito mais massivo tem seu
r
r2
movimento desprezível quando comparado com elétron.
Utilizando-se a condição de quantização de Bohr,
nh
mr
2
2 2
Ze
mn h
n 2h 2
=
⇒
r
=
r m2r 2
r2
mZe 2
L = mvr = nh ⇒ v =
ou seja
20
v=
nh
Ze 2
2
mZe
=
n 2h 2
n 2h 2
A energia total do elétron é:
E=
1 2 Ze 2 1 Z 2 e 4 Ze 2
mv −
= m 2 2 − 2 2 mZe 2
2
r
2 n h
n h
E=−
1
2
− mZ 2 e 4
n
h2
n = 1, 2, 3, 4...
2
demonstrando que a condição de quantização do momento angular leva diretamente a
uma quantização na energia total do elétron.
Cada valor de n representa a energia de uma possível órbita estável para o elétron,
que normalmente são denominados de estados do elétron.
Representando os vários estados numa escala energética, teríamos:
Usando os postulados de Bohr podemos determinar a freqüência da radiação
emitida quando o elétron passa de um determinado estado Ei para outro Ef,
caracterizados pelo números Ni e Nf. Assim temos que:
v=
Ei − E f
h
=
mZ 2 e 4  1
1 
−
+


4πh 3  N i2 N 2f 
ou seja
vi − f =
mZ 2 e 4
4πh 3
 1
1 
 2 − 2
 N f N i 
21
Assim, ao observador a luz proveniente de uma descarga eletrônica em hidrogênio,
observamos vários agrupamentos de linhas de freqüências diferentes, provenientes de
emissões distintas de elétrons em diferentes estados.
As linhas de Lyman, entre 1000 - 1300Å, provém de transições eletrônicas de
todos estados excitados para estado n = 1.
As linhas Balmer, entre 4000 - 7000Å, são transições cujo estado final é o estado
n = 2.
As linhas Paschen são transições entre 10.000 - 20.000Å, que correspondem às
transições que tem como estado final o estado n = 3.
Estas linhas, perfeitamente em concordância com o modelo de Bohr, foram
fundamentais no desenvolvimento dos conceitos básicos da estrutura atômica.
Os postulados de Bohr não são afirmativas ao acaso, mas são resultados claros do
comportamento ondulatório do elétron, ou seja, são implicações diretas do conceito
quântico ou ondulatório para o elétron. Assim, consideremos um elétron em órbita ao
redor do núcleo, através do balanço de forças o elétron apresenta uma velocidade (para
átomo de hidrogênio).
v2 e2
m
= 2
r
r
v=
e
mr
com esta velocidade seu comprimento de onde de De Broglie é:
λ=
h
h mr
=
mv
me
22
se colocarmos os valores numéricos teremos:
o
λ = 3,310 −8 cm = 3,3 A
que corresponde exatamente ao perímetro da órbita clássica do elétron
o
o
2πr = 2.π .0,53 A = 3,3 A
demonstrando que temos aqui um caso claro onde a região na qual o elétron está
confinado é da ordem do comprimento de onda e, portanto, o tratamento ondulatório é
mais apropriado.
Assim não é nenhuma coincidência que para o estado de mais baixa energia
tenhamos o perímetro igual a λ , pois este é o mínimo que podemos fazer.
De um modo geral podemos ter o perímetro como sendo correspondente a um
número inteiro de λ . Nunca poderemos ter um número fracionário de λ , pois neste caso
levaria a uma rápida aniquilação da onda ao considerarmos algumas voltas.
Desta forma
nλ = 2πrn
e substituindo λ
n
h
nh
= 2πrn ⇒ mvrn =
mv
2π
ou seja L = nh que é o postulado básico de Bohr.
Assim, através da mecânica ondulatória, a interpretação das órbitas estáveis de
Bohr nada mais são do que a situação que representam interferência construtiva entre as
várias partes da onda que constitui o elétron considerado.
Como outras trajetórias produzirão necessariamente interferências destrutivas da
onda elas não podem existir. Como exemplo considere uma órbita como abaixo:
23
após considerarmos várias voltas, teremos um conjunto de órbitas fora de fase que
somam-se interferindo destrutivamente.
Como vimos, através de colisões com elétrons, é possível transferir energia para o
átomo fazendo com que seus elétrons sejam promovidos para estados mais excitados,
emitindo energia ao regressarem aos estados mais estáveis de mais baixa energia.
Colisões não são, no entanto, a única forma de transferir energia ao átomo. A absorção
de luz também é capaz de promover excitações. A luz só será absorvida quando a
energia do fóton ( hν ) for exatamente a energia necessária para promover o elétron do
estado que se encontra para algum estado excitado. Como conseqüência a luz só será
absorvida para alguns comprimentos de onda. Este é o fundamento do chamado espectro
de absorção do átomo.
A observação do espectro atômico, como discutimos anteriormente, não é a única
forma de investigarmos os níveis de energia discretos do átomo. É possível, em alguns
casos, medir o espectro de excitação, através da medida da energia que está sendo
fornecida ao átomo. O experimento realizado em 1914 por Franck e Hertz, demonstrou de
forma nítida a existência dos níveis discretos de energia, bem como introduziram uma
maneira alternativa para medida de níveis de energia (espectro). Franck e Hertz
bombardearam vapores de vários elementos utilizando um dispositivo como abaixo.
24
Elétrons produzidos por um filamento são acelerados através de um gás por um
potencial V0. Ao passarem pela grade tais elétrons experimentam uma diferença de
potencial reserva V0, de modo que somente aqueles elétrons que passaram com energia
cinética acima de K = e V0 é que atingirão a placa contribuindo para a corrente no
galvanamento A. Desta forma, aumentando V, mais e mais elétrons atingirão a placa
produzindo uma corrente maior.
Ao percorrer o caminho no gás, os elétrons colidem com os átomos deste. Quando
a energia do elétron é tal que cedendo esta para o átomo haverá excitação colocando o
sistema num estado de energia maior, ocorre transferência desta energia por colisão.
Perdendo esta energia os elétrons atingem a grade com baixa energia cinética e,
portanto, não conseguem chegar até a placa não contribuindo com a corrente. Assim, ao
aumentarmos a potência V, aumentando a energia dos elétrons, observamos quedas na
corrente que correspondem às excitações eletrônicas.
(Potenciais bastante elevados podem produzir elétrons que excitarão átomos mais do
que uma vez). No entanto potenciais baixos reproduzem com fidelidade a estrutura de
níveis do átomo.
O experimento de Franck-Hertz foi realizado imediatamente após o nascimento da
teoria de Bohr para átomo de hidrogênio e representa uma confirmação independente da
discretização dos níveis de energia.
O grande sucesso da teoria de Bohr, para explicar o átomo de hidrogênio e sua
surpreendente concordância com os resultados experimentais, criou uma grande
expectativa ao redor dos fundamentos envolvidos no modelo. Procurava-se obter
resultados mais gerais que descrevessem também outros sistemas físicos diferentes do
átomo de hidrogênio.
Os primeiros passos no sentido de estabelecer uma nova teoria, válida sempre e
que tornava-se mais evidente no micromundo foi dado por Wilson e Sommerfeld em
25
1916, que anunciaram determinadas regras que permitiam a quantização ou a
determinação dos estados energéticos de qualquer sistema físico cujas coordenadas
eram funções periódicas no tempo. Esta regra conhecida como regra de quantização de
Sommerfeld-Wilson, pode ser enunciada da seguinte forma:
“Em um sistema cujas coordenadas são funções periódicas no
tempo, tem como condição de quantização para suas coordenadas
∫p d
q
q
= nq h
nq = 1, 2, 3...
h = const. Planck
onde q é uma coordenada que tem como momentum associado pq
e nq será o número quântico que terá somente valores inteiros. A
integral deve ser efetuada sobre um período de oscilação das
coordenadas”.
Esta regra de quantização pode ser melhor entendida se considerarmos um exemplo.
Assim, vamos imaginar uma partícula no interior de uma caixa de paredes rígidas.
A energia desta partícula é:
E=
p x2
2m
de onde tiramos p x = ± 2mE . Se aplicarmos a regra quantização para este problema,
temos:
26
a
∫ p x dx = ∫−a
2
−a
2mE dx + ∫a − 2mE dx = nh
2
2
2
2
2
n h
h2
2
2mE =
⇒E=n
4a 2
8ma 2
n = 1, 2, 3...
que são as energias possíveis para uma partícula numa caixa.
Se olharmos para as trajetórias que estas energias representam no espaço das
fases, teremos uma melhor idéia do que significa a condição de quantização W-S.
Assim, vamos para cada valor de n desenhar as trajetórias no espaço fases.
A integral ao longo de um período completo
∫ p dx , representa a área da figura
x
desenhada no espaço das fases e a regra de quantização requer que isto seja um número
inteiro da constante h, ou de outra forma, a área valida ao se passar de uma trajetória
para outra no espaço das fases deve ser um número inteiro de h.
Outro exemplo que podemos tomar é o oscilador harmônico.
p x2 1
E=
+ mω 2 x 2
2m 2
Fixada a energia do oscilador, temos que as trajetórias no espaço das fases são
elipses.
px 2
x2
+
=1
2mE 2 E mω 2
27
cujos eixos valem
a = 2mE
b = 2 E mω 2
A integral
∫ P.dx = área elipse = πab
Assim π 2mE 2 E mω 2 = nh
2 Eπ
ω
= nh ⇒ E = nhω
Como já determinamos pelo princípio da incerteza E 0 =
1
hω
2
1

E =  n +  hω
2

Utilizando a regra de quantização de W-S podemos recuperar a condição de
quantização de Bohr. Utilizando L e θ como coordenadas,
∫ Pdq = ∫ Ldθ = ∫
2π
0
Ldo = 2πL = nh
⇒ L = nh
cuja interpretação mais física já discutimos anteriormente mostrando que esta condição
separa as trajetórias cujas ondas de Broglie interferem construtivamente.
Uma das importantes aplicações da regra de quantização W-S é o átomo de
hidrogênio, onde é permitido ao elétron mover-se em trajetórias elípticas. Este é
normalmente designado como modelo de Sommerfeld. Ao observarmos as linhas
espectrais previstas no modelo de Bohr para o hidrogênio, observamos no laboratório que
elas são compostas por outras linhas bastante juntas, ao invés de ser uma única linha.
Observa-se que o espaçamento entre linhas é 10-4 vezes o espaçamento entre linhas
28
principais. Esta estrutura de níveis é normalmente denominada de estrutura fina, e foi
tentando explicar estas linhas que Sommerfeld realizou este modelo.
Descrevendo o movimento do elétron em termos de θ e r, temos que W-S nos
fornece
∫ Ldθ = n h
∫ p dr = n h
nθ = 1,2,3,4...
0
r
n r = 0,1,2...
r
Da primeira condição temos L = nθ h .
Imaginando órbitas elípticas:
p 2 e2
E=
−
2m r
mas pθ =
L
, de modo que
r
E=
p r2
L2
e2
+
−
2m 2mr 2 r
Nos pontos A e A', pr = 0 → r2E + re2 -
r1 − e 2 + e 4 + 4 E L
=
r2
2E
2
r1 + r2 = − e
2m
L2
= 0 de onde tiramos r1 e r2.
2m
 e 2 + e 4 + 2 E L2 m 

r2 = −


2E


r1 .r2 = − L
2
2
E
2 mE
29
(das propriedades de uma equação de 2° grau).
Assim,
∫ p .dr = 2∫
r
r2
r1
p r dr = n r h

L2
e2 
usando p r =  E −
+  2m
2mr 2 r 2 

=
[ (
1
2
2m Er 2 + e 2 r − L 2 m
r
)]
1
2
dr
Esta integral pode ser efetuada, revelando que
E=−
E=−
2π 2 me 4
(mr h + nθ h )2
2π 2 me 4
1
2
h
(nr + nθ )2
Como nθ = 1, 2, 3 ..., nr = 0, 1, 2 ..., temos que n = nr + nθ = 1, 2, 3 ... que reproduz
o resultado de Bohr, já que agora temos a dependência de 2 números quânticos.
E=
− 2π 2 me 4 1
h2
n2
O número quântico n é chamado de número quântico principal. Como nθ = n - nr,
nθ só pode variar de modo a manter nθ < n, e assim pode variar de 1 até n.
Assim, dado um número quântico principal n, que representa um determinado nível
energético, existem n passíveis valores de nθ (chamado de número quântico azimutal),
que corresponde a diferentes momentos angulares, correspondentes à mesma energia.
Cada valor de nθ leva a uma trajetória elíptica diferente.
Ex.:
30
Sempre o valor próximo de nθ corresponde às órbitas circulares e correspondem às
órbitas previstas por Bohr, enquanto que as demais são elípticas, não previstas por Bohr.
As várias órbitas possíveis caracterizadas pelo mesmo valor de n apresentam a
mesma energia e, por isto, são ditas ser degeneradas. É importante notar que embora n
caracterize o estado, nr e nθ estão mudando. Escolhemos n = nr + nθ como número
quântico principal, já que a energia total depende dele, mas são necessários dois
números (n e nθ) para determinar o estado energético, pois apenas existem várias
combinações nr e nθ que levam à mesma soma.
A tentativa de explicar a estrutura fina não foi bem sucedida com os cálculos
acima, que mostraram que cada estado é composto de vários outros. A justificativa para a
estrutura fina foi feita mais tarde pelo próprio Sommerfeld, que tratou o elétron no átomo
relativisticamente, mostrando que cada nθ tem na verdade energia levemente diferente
não revelada no primeiro tratamento.
UNIVERSIDADE DE SÃO PAULO
INSTITUTO DE FÍSICA DE SÃO CARLOS
DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS
CAPÍTULO VIII
INTRODUÇÃO À MECÂNICA QUÂNTICA
PROF. VANDERLEI S. BAGNATO
2
Capitulo VIII
INTRODUÇÃO À MECÂNICA QUÂNTICA
Tudo o que vimos desde a radiação do corpo negro até a explicação do espectro
do átomo de hidrogênio representa um desenvolvimento de idéias que denominamos
de mecânica quântica antiga e obteve grande sucesso devido a resolução que
causou ao explicar muitos dos fenômenos pendentes na época. Este desenvolvimento,
no entanto, apresentava vários aspectos inconvenientes. Como sabemos, a regra de
quantização de Wilson-Sommerfeld somente pode ser aplicada para sistemas
periódicos, mas existem muitos sistemas não periódicos que apresentam um grande
interesse físico. Outro ponto em aberto é que embora reproduzisse o espectro do
átomo de hidrogênio não há nenhuma explicação porque determinadas linhas
espectrais são mais intensas do que outras. A teoria antiga só pode ser aplicada
para átomos com um único elétron.
A crítica mais forte à teoria antiga é no entanto o fato que ela é mais ou menos
constituída empiricamente sem uma conexão clara e embasada para todos os seus
fatos.
Baseado nestes fatos, houve no começo do século um grande esforço para a
construção de uma teoria quântica, livre das objeções colocadas acima e que fosse
de alguma forma mais generalizada. Assim, em 1925 Erwin Schrödinger desenvolve
uma teoria como uma generalização do postulado de De Broglie, deixando de lado
alguns conceitos como órbitas, etc, que ainda prevaleciam na mecânica quântica
3
antiga. A nova mecânica quântica, além de ser matematicamente precisa
introduzia uma nova forma abstrata para interpretação dos resultados físicos.
Vamos passar a estudar, nas próximas páginas, o desenvolvimento da teoria de
Schrödinger, mas não o faremos com toda precisão e formalismo já que esta será o
objetivo de cursos posteriores.
Comecemos, revendo o postulado de De Broglie onde uma partícula livre com
momentum p e energia E é representada por uma onda cujo comprimento de onda e
freqüências são
h
p
E = hν
λ=
Neste caso, como vimos, a função de onda Ψ ( x, t ) que representa esta onda é dada
por
x

Ψ ( x, t ) = A sen 2π  − νt 
λ

e como vimos. Com requisito para termos uma onda cuja velocidade corresponde à
velocidade da partícula além de satisfazermos o princípio de incerteza de Heisenberg.
A interpretação desta função de onda como vimos é devido a Born e representa
a probabilidade de encontrarmos a partícula numa determinada posição num
determinado instante de tempo. Aparentemente para partícula livres podemos manter a
seleção sem no entanto sabermos qual equação a determina. Num caso mais geral
com oscilador harmônico, etc, isto já não é verdade. Assim estamos procurando uma
4
maneira mais geral de tratarmos através da mecânica ondulatória qualquer problema
físico.
Em mecânica clássica a descrição física de um sistema é completamente
conhecida se conhecermos a função trajetória de cada constituinte
r r
r = r (t )
Em mecânica quântica podemos ter a mesma afirmativa se conhecermos a função de
onda:
r
Ψ (r , t )
cuja interpretação é que Ψ ( x, t )
2
representa a densidade de probabilidade para a
ocupação espacial da partícula e o problema central na mecânica quântica é
determinar Ψ ( x, t ) quando partícula está sujeita a uma determinada lei de força.
Mesmo antes de acharmos Ψ , podemos verificar as características importantes
que esta função deve satisfazer. Do fato de que Ψ
2
representa a probabilidade de
encontrarmos corpo numa determinada posição a integral desta quantidade em todo
espaço deve ser finita, pois ao considerarmos todo espaço a partícula deve estar em
algum lugar.
∫Ψ
2
dv = finita
A função Ψ ( x, t ) ainda deve ser contínua em todo espaço já que a probabilidade não
pode assumir valores diferentes no mesmo ponto do espaço. A função deve também
5
apresentar derivadas espaciais constantes em cada lugar do espaço pois, se
considerarmos o caso conhecido da onda plana
 2πx

Ψ = A sen
− 2πνt ,

 λ
temos que
2π
∂Ψ
 2πx

= +A
cos
− 2πνt 
∂x
λ
λ


e como,
2π
λ
=
2πp
,
h
temos que a primeira derivada é proporcional ao momentum da partícula, e este não
deve sofrer descontinuidades a menos que forças infinitas agem sobre a partícula.
Assim, resumindo, a função de onda deve satisfazer as seguintes propriedades:
(1) Finita em todo espaço
(2) ter integral finta (em todo espaço)
(3) ter derivadas espaciais contínuas (a menos que forças infinitas hajam na partícula).
Vamos começar analisando uma partícula livre que se desloca na direção + x.
Considerando uma das componentes de onda plana para tal partícula,
x

Ψ ( x, t ) = A sen 2π  − νt  ,
λ

que ainda não é solução integral da equação de onda pois sendo a função seno
solução também o será a função cosseno. Assim, uma solução aceitável é
6

x

x
Ψ ( x, t ) = A cos 2π  − νt  + γA sen 2π  − νt 
λ

λ

Antes de continuarmos vamos, verificar baseados no que já sabemos, como deveria
ser numa equação que determina Ψ .
Tratando-se de uma onda, a primeira idéia que nos vem a cabeça é a função de
onda tradicional.
∂ 2Ψ 1 ∂ 2Ψ
−
=0
∂x 2 v 2 ∂t 2
Consideremos, então, a onda plana acima
x

x

Ψ ( x, t ) = A cos 2π  − νt  + γA sen 2π  − νt 
λ

λ

Tomando a derivada espacial
∂Ψ
2π
x
 2π
x

= −A
sen − νt  +
γA cos − νt 
∂x
λ
λ
 λ
λ

∂ 2Ψ
p2
 2π 
=
−
Ψ
=
−
Ψ


∂x 2
h2
 λ 
2
Tomando a derivada temporal
∂ 2Ψ
E2
2
(
)
=
−
2
πν
Ψ
=
−
Ψ
∂t 2
h2
7
que colocados na equação de onda anterior,
p2
E2
−
=0
h 2 v 2h 2
E = pv = mv 2
isto parece de acordo com as relações de De Broglie só que não estão adequadas com
E=
p2
a equação não nos dar chance de introduzirmos um potencial externo agindo
2m
sobre a partícula.
Para uma partícula movendo-se num potencial V(x), com uma energia E, temos
que
p2
+ V (x ) = E
2m
e isto deve está retratado na equação que procuramos.
Como vimos anteriormente que o momentum da partícula ao quadrado está associado
com
∂ 2Ψ
α p 2 .Ψ
2
∂x
e que a energia está associada com a primeira derivada temporal
∂Ψ
α Ε, Ψ
∂t
faz sentido propormos como equação que descreva a onda
8
α
∂ Ψ
∂Ψ
+ V ( x, t )Ψ ( x, t ) = β
2
∂t
∂x
2
onde α e β são constantes a determinar-se. Vamos, requerer que estejamos tratando
com uma partícula livre V(x,t)=0, e vamos substituir a solução Ψ ( x, t ) na equação
acima.
2π  x
 2π 
x

 2π 

−
 α cos 2π  − νt  − α 
 γ sen
 − νt 
λ
λ
λ
λ
λ








2π  x
x


= + β 2π sen
 − νt  − β 2πνγ cos 2π  − νt 
λ λ

λ

2
2
de modo que precisamos,
 2π 
−
 α = − β 2πνγ
 λ 
2
e
2πν
 2π 
−
 α=β
γ
 λ 
2
Isto mostra que
− β 2πνγ =
β 2πν
γ
⇒ γ 2 = −1 ⇒ γ = ±i
de modo que
9
 2π 
−α
 = ±i 2πνβ .
 λ 
2
como
p2
Ε
 2π 

 = 2 e 2πν =
h
h
 λ 
2
−α
p2
E
= ±i β .
2
h
h
de modo que para esta equação ser satisfeita, escolhemos
α=
e terminamos com Ε =
− h2
e β = mih
2m
p2
.
2m
Com isto, a equação que propusemos anteriormente fica.
−
h 2 ∂ 2Ψ
∂Ψ
+ V ( x, t )Ψ ( x, t ) = ih
2
2m ∂x
∂t
que e chamada de Equação de Schrödinger dependente do tempo e para o caso
da partícula livre tem como solução
x

Ψ = A cos − νt  − iA sen Ψ
λ


Ψ = Ae
x

± i 2π  −νt 
λ

A equação anterior, foi obtida inicialmente por Schrödinger em 1926 e a obtemos para
um caso particular, o da partícula livre, mas podemos verificar que ela satisfaz os
10
requisitos básicos colocados inicialmente. Vamos postular que esta equação é válida
para qualquer potencial.
Antes de aplicarmos a equação de Schrödinger para alguns casos, analisamos o
caso especial e bastante comum, quando o potencial V(x,t) não é dependente do
tempo. Neste caso podemos escrever a solução como
Ψ ( x, t ) = Ψ ( x )ϕ (t ) , e substituindo na equação
−
h 2 ∂ 2Ψ
∂ϕ
.ϕ (t ) + V ( x )Ψ ( x )ϕ (t ) = ih
Ψ (x )
2
2m ∂x
∂t
Dividindo por ϕ (t )Ψ ( x )

ih ∂ϕ
1 − h2 ∂ 2Ψ
+ V ( x )Ψ ( x ) =
=c

2
Ψ  2m ∂x
 ϕ (t ) ∂t
Assim
−i
dϕ
= cϕ ⇒ ϕ = e h t
dt
c
ih
c
c
= cos t − −i sen t
h
h
Como a dependência temporal i 2πνt ,
c
= 2πν ⇒ c = Ε
h
ϕ =e
E
−i t
h
11
da parte espacial,
−
h 2 d 2 Ψ (x )
+ V ( x )Ψ ( x ) = EΨ ( x )
2m dx 2
que é chamada equação de Schrödinger independente do tempo.
Mostrando quando V(x) não depende do tempo (explicitamente) a dependência
temporal é a de onda plana, portanto Ψ ( x, t ) não varia com tempo.
2
Esta equação que para nós será mais importante, já que trataremos essencialmente de
potenciais independentes do tempo, poderia ser obtida através de um argumento
bastante simples.
Vamos supor que a equação procurada deva ser de acordo com a equação da
conservação de energia
p2
+ V (x ) = E
2m
E portanto
p2
= (E − V ( x ))
2m
Como vamos então imaginar em cada ponto uma onda plana de momentum p como
d 2Ψ d 2
 2πx

= 2 sen 
− 2πνt 
2
dx
dx
 λ

2
p
=− 2 Ψ
h
temos que, multiplicando a equação de energia pela função de onda Ψ
12
p2
Ψ = (E − V ( x ))Ψ
2m
como
d 2Ψ
p Ψ = −h
dx 2
2
2
h 2 d 2Ψ
= (E − V ( x ))Ψ
2m dx 2
h 2 d 2 Ψ (x )
⇒−
+ V ( x )Ψ ( x ) = EΨ ( x )
2m dx 2
−
que é a equação de Schrödinger independente do tempo.
Nós somente mostramos a equação no caso unidimensional, mas ela pode ser
generalizada em 3-D
−
h 2 ∂ 2Ψ ∂2Ψ ∂ 2Ψ 
+ 2 + 2  + V ( x, y, z )Ψ ( x, y, z ) = EΨ ( x, y, z )

2m  ∂x 2
∂y
∂z 
É importante sentir que a equação de Schrödinger é para a mecânica quântica aquilo
que as leis de Newton são para a mecânica clássica.
Nesta equação, normalmente o que conhecemos é o potencial V(x,y,z), o que
queremos determinar é o espectro de energia E e a função de onda Ψ, que permite
cálculo de outras propriedades do sistema. As condições de contorno são de extrema
importância na solução desta equação.
Vamos passar agora a utilizar, a equação de Schrödinger para a solução de alguns
problemas. Comecemos com o caso da partícula na caixa.
13
O potencial que estamos tratando apresenta a seguinte forma
0 < x < L
+ ∞

V (x ) = 
x < 0
 x > L
Sendo infinito o potencial a única possível solução para Ψ = 0 pois a probabilidade de
encontrarmos a partícula naquela região é nula. Vamos então resolver a equação para
0 < x < L . Neste intervalo
h 2 d 2Ψ
= EΨ
2m dx 2
d 2 Ψ 2m
+ 2 EΨ ( x ) = 0
dx 2
h
−
A solução é do tipo
14
Ψ1 = A cos Kx
ou
Ψ2 = B sen Kx
ambas com a condição de contorno que Ψ (0) = Ψ (L ) = 0 , já que Ψ deve ser contínua
Primeiro vamos considerar a solução Ψ1
−K2 +
2mΕ
= 0,
h2
portanto
K=
2mE
h2
e de todo que Ψ (0) = Ψ (L ) = 0
A cos 0 = 1 ⇒ A = 0
de modo que Ψ1 não pode representar a partícula na caixa.
Para Ψ2,
sen 0 = 0
sen KL = 0 ⇒ KL = nπ
n = 1,2,3,...
desta condição obtemos a quantização da energia
K 2 L2 = n 2π 2 ⇒ E n =
n2h2
8mL2
(as condições de contorno determinam a quantização) n = 1,2,....
Como já havíamos obtido anteriormente A função de onda
15
Ψ ( x ) = B sen
nπ
x
L
Como Ψ ( x ) representa a densidade de probabilidade,
2
∫
L
0
Ψ 2 ( x )dx = 1
(Normalização)
Portanto
 nπx 
2 L
B 2 ∫ sen 2 
dx = 1 = B
2
 L 
B=
2
L
Ψn ( x ) =
2
 nπ
sen
L
 L

x

Note que as várias energias possíveis para uma partícula na caixa, representam
diferentes distribuições de probabilidades de encontrarmos a partícula na caixa
16
Um outro exemplo importante na introdução da mecânica quântica é o caso da
barreira de potencial que além de ilustrativo introduz um conceito novo na mecânica
quântica.
Assim, imaginemos um potencial como mostrado abaixo.
Imaginemos uma partícula que vem de x=-∞ e colide com esta barreira. (E<V0)
classicamente esperaríamos que ela chocasse com esta barreira, invertesse seu
movimento e voltasse para x=-∞. Quanticamente isto não ocorre desta forma e mesmo
sendo classicamente impossível a partícula pode ultrapassar a barreira e continuar seu
movimento para x=+∞.
Na parte x<-a ou x>a, a partícula é praticamente livre e como vimos uma partícula livre
tem como função de onda
−
h 2 d 2Ψ
p2
=
E
Ψ
=
Ψ
2m dx 2
2m
ou seja,
− h2
d 2Ψ
= p2Ψ
2
dx
Ψ = Ae
p
±i x
h
17
a parte da solução com p>0 representa uma onda (ou a partícula) deslocando na
direção positiva do eixo x. A parte p<0 representa a partícula deslocando-se na direção
negativa do eixo x.
Voltemos ao caso da nova barreira e analisemos uma partícula com E<V0, para
x<-a
h 2 d 2Ψ
−
− EΨ ( x ) = 0
2m dx 2
d 2 Ψ 2mE
+ 2 Ψ (x ) = 0
dx 2
h
Chamando
2mE
= K2
h2
d 2Ψ
+ K 2Ψ = 0
2
dx
como nesta região poderemos ter a partícula propagando-se na direção +x ou –x, a
solução é algo
ΨI ( x ) = Ae iKx + Be −iKx
fluxo = A 2 − B 2
à parte A2 representa probabilidade da partícula está incidindo sobre a barreira
A2 = 1
já que temos certeza que a partícula existe e veio de -∞ na direção +x.
B2 , representa a probabilidade da partícula está caminhando na direção –x, portanto
representa a probabilidade da partícula ter chocado-se com a barreira investido seu
movimento por conveniência vamos chamar B=R, para lembrar reflexão. A solução
para x<-a é então
18
ΨI ( x ) = e iKx + Re −iKx
com K =
2mE
.
h2
Para x>a, a equação é exatamente do mesmo tipo, só que agora como a partícula está
vindo -∞, ao encontrar a barreira, ou ela volta (caso visto acima), ou ela ultrapassa a
barreira e neste caso, só encontraremos partículas deslocando-se para +x de modo
que a solução é
ΨIII ( x ) = Te iKx
sendo T 2 = (ΨIII )
2
a probabilidade da partícula ser transmitida pela barreira.
Classicamente T2=0.
Vamos, agora, analisar o que ocorre na região (II) que representa o interior
da barreira.
Neste caso,
h2
2m
h2
−
2m
−
d 2Ψ
+ V0 Ψ = EΨ
dx 2
d 2Ψ
+ (V0 − E )Ψ = 0
dx 2
e temos que E<V0,
d 2 Ψ 2m
− 2 (V0 − E )Ψ = 0
dx 2
h
Chamando q 2 =
2m
(V0 − E ), a equação fica:
h2
19
d Ψ
− q2Ψ = 0
2
dx
2
que tem como solução
ΨII ( x ) = Ae qx + Be − qx
Note portanto que ΨII2 não é nula e portanto a partícula pode ser encontrada numa
região classicamente proibida.
Como dissemos anteriormente Ψ deve ser contínua em todo espaço, impondo
ΨI ( x = −a ) = ΨII ( x = −a )
ΨI′ ( x = −a ) = ΨII′ ( x = −a )
ΨII ( x = a ) = ΨIII ( x = a )
′ (x = a )
ΨII′ ( x = a ) = ΨIII
tiramos
T =
2
(K
2
)
(2 Kq )2
+ q 2 senh 2 2qa + (2qK )
2
2
e
Q2 = 1 − T 2
mostrando que, mesmo tendo E<V0 (energia menor do que a barreira) quanticamente a
partícula pode passar através da barreira num processo denominado de tunelamento.
Uma representação de Ψ 2 seria:
20
Dentro da barreira a amplitude da onda decai demonstrando uma diminuição de
encontrarmos a partícula naquela região.
Um importante exemplo na mecânica quântica e que foi fundamental na sua
formulação é a solução do sistema atômico. A chamada mecânica quântica atômica é
fundamental para o entendimento da natureza, com os átomos interagem formando
moléculas estáveis, sólidos, etc. Vamos, aqui nos ater somente a formulação
matemática do átomo de hidrogênio, porém este assunto é mais vasto merecendo
maior atenção no futuro.
Vamos considerar o átomo de hidrogênio que como sabemos de um próton
central e um elétron. Sendo o próton 1840 vezes mais pesado que o elétron,
consideraremos o próton estacionário (semelhantemente ao modelo de Bohr). Assim,
em primeira aproximação a equação de Schrödinger para o elétron no átomo de
hidrogênio é
−
h2 ∂ 2Ψ ∂ 2Ψ ∂ 2Ψ 
+ 2 + 2 −

2m  ∂x 2
∂y
∂z 
e2
x2 + y2 + z2
Ψ = EΨ
Pela natureza do problema, é mais conveniente trabalharmos em coordenadas
esféricas (r, θ, ϕ) com
21
r =x +y +z
x = r sen θ cos ϕ
2
2
2
2
y = r sen θ sen ϕ
z = r cos θ
θ= ângulo zenital
ϕ= ângulo azimutal
Com estas novas coordenadas a equação de Schrödinger fica escrita como
h 2  1 ∂  2 ∂Ψ 
1
∂ 
∂Ψ 
1
∂2Ψ  e2
−
r
+
 sen θ
+

 − Ψ = EΨ
2m  r 2 ∂r  ∂r  r 2 sen θ ∂θ 
∂θ  r 2 sen 2 θ ∂ϕ 2  r
e multiplicando por r 2 sen 2 θ e −
sen 2 θ
2m
h2
∂  2 ∂Ψ 
∂ 
∂Ψ  ∂ 2 Ψ 2mr 2 sen 2 θ
sen
sen
+
r
+
θ
θ



+
∂r  ∂r 
∂θ 
∂θ  ∂ϕ 2
h2
 e2

 + E Ψ = 0
r

que é a equação diferencial que descreve o elétron no átomo de hidrogênio. Vamos
procurar solução que passa ser escrita através de uma separação de variáveis
Ψ (r ,θ , ϕ ) = R(r )Θ(θ )Φ(ϕ )
22
onde R(r) é a função que descreve a dependência radial da função de onda, Θ a
dependência zenital e φ a azimutal.
Vamos, então substituir esta solução na equação original e dividir por Ψ
obtemos:
sen 2 θ ∂  2 ∂R  sen θ ∂ 
∂Θ  1 ∂ 2 Φ 2m 2 r 2 sen 2 θ
+
r
+
 sen θ
+
R ∂R  ∂r 
Θ ∂θ 
∂θ  Φ ∂ϕ 2
h2
 e2

 + E  = 0
 r

Rearranjando o termo que só depende de ϕ temos que
∂Θ  2m 2 r 2 sen 2 θ
sen 2 θ ∂  2 ∂R  sen θ ∂ 
r
+
 sen θ
+
R ∂r  ∂r 
Θ ∂θ 
∂θ 
h2
 e2

1 ∂ 2Φ
 + E  = −
Φ ∂ϕ 2
 r

que requer que ambos lados desta equação sejam iguais à uma constante que
chamaremos ml2
 1 d 2Φ
= ml2
−
2
 Φ d ϕ
 1 ∂  2 ∂R  2m 2  e 2

r
 + 2 r  + E  =

 r

 R ∂R  ∂r  h
2

ml
1
∂ 
∂Θ 
=
−
 sen θ

2
 sen θ Θ sen θ ∂θ 
∂θ 
A segunda equação, também tem seus membros dependendo de variáveis
independentes, e portanto também devem ser iguais a uma constante que
chamaremos l(l+1). Assim, terminamos com
23
 d 2Φ
 2 + ml2 Φ = 0
 dϕ

ml2 
d  
 1 d 
(
)
sen
Θ
+
l
l
+
1
−
θ




Θ = 0
dθ  
sen 2 θ 
 sen θ dθ 

2
 1 d  r 2 dR  +  2m  e + E  − l (l + 1)  R = 0

 r 2 dr  dr   h 2  r
r2 


A solução de onda uma destas equações fornecerá uma parte da função de onda. Da
equação para função Φ , tiramos que
Φ(ϕ ) = Ae imlϕ
onde A é uma constante pela própria geometria do átomo, esperamos que esta função
Φ(ϕ) não se modifique, ou seja
Φ (ϕ + 2π ) = Φ(ϕ )
Ae imlϕ .e iml 2π = Ae imlϕ ⇒ e iml 2π = 1
ml = 0,±1,±2,±3,......
O número ml é chamado de número quântico magnético.
Olhando para equação as chamadas funções associadas de Legendre, mas o que é
mais interessante é para que haja solução (o que é óbvio, pois a função de onda deve
existir). É necessário que l seja inteiro e maior ou igual à ml ou seja
ml = 0,±1,±2,.... ± l
esta constante l é chamada de número quântico orbital.
A solução para a parte radial é as conhecidas funções associadas de
Laguerre. Esta equação só terá solução quando a quantidade E da equação for da
forma
24
Ε=−
me 4 1
2h 2 n 2
n = 1,2,....
com l não superando (n-1), ou seja
l = 0,1,2,....(n − 1)
O número n é denominado de número quântico principal.
Estes tr~es parâmetros que só podem adquirir determinados valores para
que haja solução são os números quânticos
n = 1,2,3,.... principal
l = 0,1,2,....( n − 1) orbital
ml = 0,±1,±2,.... ± l magnético
Assim, vemos que para descrevermos o estado de um elétron no átomo de hidrogênio,
são necessários três números quânticos. Normalmente escrevemos a função de onda
Ψ, como
Ψ = Rnl Θ lml Φ ml
onde os vários índices denotam a dependência da referida parte da função de onda
com os números quânticos.
É interessante visualizarmos os números quânticos em termos de um modelo
clássico e simplificado. Imaginando o átomo clássico, como anteriormente semelhante
a um sistema planetário, vemos que o número quântico principal determina o
espaçamento entre as possíveis energias. Separando parte cinética da parte potencial
da energia total
Ε = K radial + K orbital −
e2
r
25
Introduzindo esta energia na equação radial, tiramos que
1 d  2 dR  2m 
h 2 l (l + 1) 
r
+
K
+
K
−


orbital
 radial
R = 0
r 2 dr  dr  h 2 
2mr 2 
Como queremos que a função radial seja determinada por uma equação que envolva
( )
2
somente vetor radial e sendo K orbital α rθ& , vamos requerer que os dois últimos termos
cancelem
K orbital =
h 2 l (l + 1)
2mr 2
como
K orbital
L2
h 2 l (l + 1)
,
=
=
2mr 2
2mr 2
temos que L2 = l (l + 1)h 2 , mostrando que o momento angular total é quantizado e que o
número quântico l é que o determina. É importante notar que o momento angular é um
múltiplo de h
L = l (l + 1)h
Dependendo do valor de l, costumamos denominar os estados por s,p,d,f...
r
O vetor momento angular L é perpendicular ao plano da trajetória. O elétron
percorrendo esta trajetória determina um loop de corrente determinando um momento
r
r
magnético dipolar µ . Na presença de uma campo magnético externo Β , haverá uma
r
interação com µ , surgindo um torque
µ
θ
B
τ = µB sen θ
r r
A energia de interação ∝ µ .B , será nula para µ ← B e se quisermos determiná-los
26
0
U m = ∫ τdθ = − µB cos θ
900
o dipolo magnético
µ = i. Área = −eνπr 2
como L = mvr = 2πmνr 2 , temos que
r
 e r
L
 2m 
µ = −
o fator
e
é denominado de fator giromagnético orbital. O valor de ml representa os
2m
r
possíveis projeções de L ao longo de um eixo determinado eixo escolhido z, de modo
que
L z = ml h
No modelo de Bohr o elétron é visualizado como revolucionando ao redor do
núcleo em trajetória circulares. No entanto a solução quântica do átomo de hidrogênio
modifica a idéia de Bohr de maneira radial. Primeiramente não mais podemos falar em
termos de trajetória e posição, mas sim somente em termos de probabilidades relativas
de encontrarmos o elétron nas várias posições, o que é naturalmente uma
conseqüência da natureza ondulatória do elétron.
Como vimos, Ψ = RΘΦ , de modo que
Ψ 2 = R 2Θ 2Φ 2
onde o quadrado é entendido como f 2 = f . f ∗ .
A parte em ϕ, fornece uma constante já que
27
Φ = Ae iml Φ → A =
Φ2 =
1
2π
1
2π
A variação da radiação da função de onda e a variação com θ basicamente
fornecem os vários estados diferentes como ψ2 é a densidade de probabilidade
r
Ψ 2 d 3 r = probabilidade de encontrar elétron em d 3 r
como d 3 r = r 2 dϕdθdr ,
P(r → r + dr ) = ξr 2 Rnl2 dr
A função Θ fornece a dependência da densidade de probabilidade com o ângulo zenital
θ. Esta distribuição dependerá essencialmente de l e m.
28
É possível mostrar que a distribuição de probabilidade nunca está contida num plano.
L2 = L2x + L2y + L2z = l (l + 1)h 2
como o máximo valor de Lz por exemplo Lz = hl , esta mostra que L2y + L2z = lh 2 ,
mostrando que havendo componente além de Lz a distribuição não está só contida no
plano xy, este resultado é geral porque os eixos são arbitrários.
1
UNIVERSIDADE DE SÃO PAULO
INSTITUTO DE FÍSICA DE SÃO CARLOS
DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS
CAPÍTULO IXII
INTRODUÇÃO À FÍSICA NUCLEAR
PROF. VANDERLEI S. BAGNATO
2
CAPÍTULO IX
INTRODUÇÃO À FÍSICA NUCLEAR
Até agora temos tratado o núcleo atômico como sendo uma massa puoontual que
apresenta carga positiva. Na realidade o núcleo é mais complexo sendo tão complexo que
mesmo nos dias atuais ainda permanece propriedades a serem entendidas.
Vamos nesta parte do curso considerar algumas propriedades fundamentais do
núcleo e expor os principais modelos para explicá-las. Comecemos discutindo algumas
grandezas que nos permita ter um quadro representando o núcleo atômico.
A composição nuclear foi determinada ao redor de 1932 por Bother e Becker
através de experimentos de bombardeamento da matéria com particulapartículasr α e
com
radiação
gamaom
particulapartículasr α
?.
Observaram
que
após
bombardeamento
com
radiação misteriosa era emitida do núcleo. Experimentosa
realizadosa por James Chadwick mostraram que esta misteriosa radiação era constituída
de partíiculasr neutras cuja massa do próton. Devido a ser partícula eletricamente neutra
recebeu o nome de nêutron. O nêutron é um elemento fundamental na composição
nuclear, porém, é uma partícula que só é estável no interior do núcleo. Quando ela é
colocada livremente torna-se instável decaindo,
nêutron → próton + eletron elétron + anti-neutron ?
Este processo de decaimento demora da ordem 103segc. Discutiremos o
decaimento do nêutron oportunamente ?.
Logo após a descoberta do nêutron observou-se que ele era um ingrediente
necessário na estrutura nuclear sendo junto com o próton os constituintes fundamentais
do núcleo atômico e que determinam em linhas gerais a massa total do átomo.
As partículas que compõem o núcleo são chamadas de nuucleons. Assim, ambos:
prótons e nêutrons são denominadasprótons e nêutrons são denominados nucleons.
Normalmente usamos a seguinte notação para as espécies nucleares:
Z = número atômico = número prótons
N = número nêutrons
A = Z + N = número massa
3
E normalmente quando vamos descrever uma determinada espécie química X usamos a
notação:
ZX
A
Assim, por exemplo:
33As
75
representa o isótopo de número de massa 75 do arsênico.
Desta composição nuclear surge espontaneamente à idéia de isótopo que são
átomos com mesmo número de prótons e diferentes números de nêutrons, portanto
diferentes números de massa. Como as propriedades químicas dos elementos são
predominantemente determinadas pelos elétrons os isótopos passam a ser elementos
quimicamente equivalentes.
Com respeito ao tamanho nuclear os experimentos de Rutherford forneceram as
primeiras evidências do tamanho finito do núcleo. Como vimos naquele experimento
através do espalhamento de partículas a 180° foi po ssível calcular um limite de 10-4 Å
para o tamanho nuclear. Através de experimentos cuidadosos ? de espalhamento de
partículas foi possível determinar que o volume do núcleo é diretamente proporcional ao
número de nucleons contidos neste núcleo. Assim, se R é o raio nuclear o volume
correspondente é 4 πR 3 que é proporcional à A (número massa) de modo que,
3
R = R0 A
1
3
E o valor de R0 obtido experimentalmente,
R0 ≈ 1.2 × 10 −13 cm
E o valor de R0 apresenta uma incerteza devido à variação de resultados de acordo com o
método utilizado na sua determinação. Quando fazemos experimentos com espalhamento
de nêutrons estes interagem com o núcleo somente através de forças nucleares enquanto
num experimento de espalhamento de elétrons a interação é basicamente devido às
interações elétricas geradas pelas cargas nucleares essencialmente. Um fato curioso é
que R0 determinado a partir do espalhamento de elétrons ou partículas. α é menos do
que o determinado pelo espalhamento de nêutrons revelando desta forma um resultado
Formatado
4
importante que a distribuição de massa no núcleo e a distribuição de cargas não são
iguais.
Se conhecendo o tamanho dos núcleos vamos calcular a densidade mássica
contida nestes centros.
densidade =
1 10 −23 g
1
6
=
3
4
4
π
R
π
1
,2 10 −13
0
3
3
(
)
3
= 0,023 1016 g
cm 3
densidade nuclear = 2,3 1014 g/cm3
mostrando que o núcleo é cerca de 1014 mais denso do que a matéria macroscópica que
estamos acostumados. Este resultado mostra que praticamente a matéria é oca. Em
determinadas estrelas denominadas de “anãs? brancas” os elétrons dos átomos
Formatado
colapsaram devido a grande pressão entre átomos de modo que tais estrelas são
basicamente constituídas de matéria nuclear apresentando densidades como as
mostradas acima.
Ao analisarmos um núcleo estável vemos que sua massa é ligeiramente menor do
que a soma das massas de seus constituintes isolados. Como exemplo vemos que o
núcleo de
3
Li 6 3 LI6 tem massa 6,01697 uv.a. enquanto somando as massas dos três
Formatado
Formatado
prótons e três nêutrons que compõem o núcleo encontramos 6,0514 uv.a. A quantidade
de massa que esta faltando ∆m = 0,03443 uv.a que equivale a 32,1 MeV.
Lembre-se que,
u.a ⇒
1
.9.10 20 = mc 2 ⇒
6.03 10 23
−3
⇒ 1,492 10 −3 ergs = 1,49210 6,21011 eV
u.a = 925MeV
de modo que ∆m = 0,03443 → 32,1 MeV. Isto significa que para quebrarmos o núcleo de
3Li
6
obtendo os vários nucleons individualmente é necessário fornecermos ao sistema
esta quantidade de energia. Esta energia contida na ligação entre os vários nucleons é
denominada de Energia de Ligação e como quanto mais fortemente ligados estiverem os
nucleons mais estável será o núcleo, a energia de ligação mede a estabilidade dos
núcleos.
5
A energia de ligação tem sua origem na força que mantém os nucleons unidos que
são um pouco diferentes dos tipos de força que estamos acostumados até o momento. Se
dividirmos a energia de Ligação de cada núcleo pelo número de nucleons obtemos a
energia por nucleons.
A energia / nucleon mostrada como função do número de massa do núcleo estáa
abaixo:
O máximo da energia / nucleon ocorre em torno de A = 56 (núcleo Ferro) após o
qual há um vagaroso decréscimo. Como maior energia representa maior estabilidade, o
gráfico acima sugere que núcleos pesados apresentam tendência em dividir-se em
núcleos mais leves enquanto núcleos muito leves demonstram referência em juntar-se
formando núcleos mais pesados e estáveis. De fato, em condições apropriadas isto
ocorre sendo no caso de divisão nuclear denominado de fissão nuclear e no caso de
combinação fusão nuclear. Ambos ocorrem com as corretas análises energéticas. Se
forçarmos a fusão nuclear poderemos em muitas casas liberar energia sendo o fenômeno
portanto, portanto uma fonte de energia.
Vamos passar agora a estudar alguns modelos para forças nucleares. As forças
que mantém os nucleons juntos no interior do núcleo constituem, sem dúevida, as forças
mais fortes que conhecemos e por isto são comumente denominadas de interação fortes
e não pertencem a nenhuma das classes de forças que estamos acostumados a tratar no
nossno dia-a-dia.
Existem vários modelos para explicar a natureza desta interação e mesmo
atualmente muito é feito para estudar esta natureza. Vamos agora, brevemente descrever
os melhores modelos propostoas. Comecemos estudando a teoria dos méesons para
Formatado
6
forças nucleares. Formulada pelo físico japonês H.Yukawa, em 1935, explica que as
forças nucleares éas forças nucleares são o resultado de uma constante de intertrocas de
partíiculasr entre os núcleonsnucleons próximos. Estas partículas que participam da troca
são denominadas de mesonsmésons. O processo seria em alguns aspectos semelhante
aquele? no qual dois núcleos atômicos são mantidos juntas formando moléculas através
da intertroca de quantao eletromagnético através da circulação eletrônica ao redor de
ambos os núcleos.
De acordo com a teoria do méeson para forças nucleares todos os nucleons
consistem de centros idênticos circundados por uma nuvem de um ou mais
mesonsmésons. Estes mesonsmésons podem ser neutras neutros ou possuírem? cargas.
Neste contexto, a grande diferença entre nêutrons e prótons reside na composição de
suas nuvens mesônicas.
As forças existentes entre nêutrons ou entre prótons é o resultado de
mesonsmésons neutros designados por π°. Por outro lado, as forças fortes existentes
entre nêutrons e prótons resultam da intertroca de mesonsmésons carregados
designados por π+ ou π-, cujas cargas são exatamente a carga eletrônica. Assim, um
nêutron emitindo um meson π- converte-se num próton,
n → p + πenquanto que a absorção de um mesonméson π- por um próton leva a formação de um
nêutron,
p + π- → n
No processo inverso,
p → n + π+
n + π+ → p
Infelizmente embora o conceito seja bastante infinito não há uma forma simples de
demonstrar matematicamente como a intertroca de mesonsmésons leva a forças atrativas
ou repulsivas. Vamos, no entanto, usar um exemplo bastante simples para ilustração.
Imaginemos dois garotos, um com cada bola de jogar basquete, etc. A idéia é que eles
deverão trocar as bolas. Quando jogador A arremessa sua bola para jogador B e viceversa, no ato de emissão eles sofrem recuo de momentunmomentum? em direções
7
opostas, o mesmo ocorrendo quando eles recebem as bolas jogadas um contra o outro.
Assim, este método de trocar as bolas leva a uma repulsão entre os dois meninos A e B.
Repulsão
Se ao invés de arremessar as bolas um contra o outro os meninos resolvem trocar
as bolas, um tentando tirar as bolas do outro é fácil de imaginar que nesta nova situação
de troca eles tentarão ser unidos. Portanto fisicamente esta situação leva a uma força de
atração entre meninos A e B.
Atração
É possível provar através de técnicas matemáticas mais avançadas que a
intertroca de mesonsmésons leva a forças extremamente fortes, esta idéia leva a um
problema fundamental. Se os núcleonsnucleons constantemente emitem ou absorvem
mesonsmésons, porque nêutrons ou prótons nunca são encontrados com massas
8
ligeiramente diferentes? A resposta para isto esta no princíipio da incerteza. Se o
mesonméson emitido for absorvido por um nucleon vizinho ao emissor num tempo muito
curto não será possível pelo princíipio da incerteza determinar a variação de energia
melhor que,
∆E = ∆t ~ ħ (sendo troca rápida? ∆t é pequeno e ∆E é grande)
Vamos considerar que as forças nucleares tem um alcance máximo da ordem de
R ~ 1.410-15m, de modo que assumindo o mesonméson com velocidade c, o tempo do
vôo? seria ∆t = R
c
e sendo ∆E = mπ c 2 , temos,
(m c )R c ≅ h ⇒ m
π
2
π
≈h
Rc
≈ 2,510 −28 kg
que corresponde á mπ ≈ 275me
A teoria dos mesonsmésons para forças nucleares, apesar de fazerer previsões
importantes, ainda não consegue descrever em detalhes a estrutura nuclear
aparentemente mostra a correta direção para o pensamento.
O modelo de intertroca não é a única tentativa para explicar as interações fortes
entre nucleons. Um outro modelo conhecido como modelo dae gota líiquida que
Formatado
passaremos brevemente a descrever. As forças nucleares são extremamente fortes,
porém de muito custo alcance de modo que cada nucleon basicamente interage
somente com seus vizinhos mais próximos numa situação semelhante aquela das
moléculas num líiquido onde a única interação importante é aquela da molécula com as
moléculas que a rodeiam. Esta analogia das interações de um líiquido (numa gota) com
forças nucleares leva ao chamado modelo da gota líiquida para o núcleo prevendo
propriedades bastante importantes.
Consideremos que a energia associada com cada par nucleon-nucleon tenha o
valor U (evidentemente tratando-se de atração U é negativa, mas consideremos positiva
por conveniência?). Sendo que cada ligação mesôonica é partilhada por dois nucleons,
cada um deles tem
1
2
U de energia de ligação. Quando fazemos um empacotamento de
esferas representando os nucleons cada um é circundado por 12 outros nucleons no
máximo numa estrutura chamada de empacotada e que contém o maior número de
esferas próximas possíveis.,
Formatado
9
que contém o maior numero de esferas próximas possível.
Desta forma, cada nucleon terá associado a ele uma energia,
12 × 12 U = 6U
Assim, se todos nucleons tivessem rodeadostivessem rodeado por 12 a energia de
um determinado núcleo seria,
Ev = 6AU = d1A
esta energia Ev chamada de energia de volume é claramente uma idéia verdadeira para
os nucleons no interior do volume do núcleo, mas certamente não é verdade para aqueles
nucleons localizados na superfície do núcleo que não são circundados por 12 nucleons,
mas por um número inferior. O número de nucleons superficiais dependemO número de
nucleons superficiais depende da superfície do núcleo que é,
4πR 2 = 4πR0 A
2
3
Assim, o número de nucleons superficial é proporcional à A
2
3
e a energia de
ligação de tais nucleons é Es,
E s = −a 2 A
2
3
chamada de energia superficial do núcleo que leva o sinal negativo, pois corresponde á
diminuição em Ε v . . Para núcleos que levar esta forma energética é importante já que
Formatado
10
neste caso a fração de nucleons superficiais é elevada. Como o núcleo vai tentar tornar
uma forma de modo a maximizar a energia de ligação que significa estáas mais estável.
Desta forma o núcleo toma a forma mais próxima de uma esfera maximizando energia de
ligação, pois esta é a forma com menos área para um determinado volume semelhante à
gota de um líiquido.
Além da energia entre nucleons a repulsão eletrostática entre prótons no núcleo
também é importante, pois contribui para diminuir energia de ligação desestabilizando o
núcleo. A energia Coulombiana Ec do núcleo terá o trabalho necessário para trazer do
infinito os Zz prótons juntos numa distribuição volumétrica que é o núcleo. Dado Zz
núcleos, o número de pares que temos é:
Cada próton interage com Zz – 1 sendo z prótons separados em mídia de R
1
Formatado
( αA 3 ),
Z (Z − 1)
E c = − a3
A
1
3
e note sinal negativo pois esta energia desestabiliza o núcleo.
Desta forma, a energia total de ligação do núcleo é,
Eb = Ev + Es + Ec
Ou seja,
E b = a1 A − a 2 A
2
3
− a3
Z (Z − 1)
A
1
3
e assim a energia de ligação por nucleon é,
Eb
a z (z − 1)
a
= a1 − 21 − 3 4
A
A3
A3
Se graficarmos este resultado temos:
11
Assim, comparando Eb obtida com o discutido anteriormente vemos uma previsão
razoável para Eb concordando como experimental demonstrando que este modelo pode
ser útil para uma série de estudos principalmente em reações nucleares como veremos
adiante.
O modelo da gota líiquida para o núcleo atômico tem sua base no fato que cada
Formatado
núcleos interage primeiramente com seus vizinhos mais próximos como num líiquido.
Formatado
Existem, no entanto evidências experimentais fortes de que isto não é verdade dando
evidências de uma interação generalizada ao invés de interações entre pares.
Existe um modelo de camadas para o núcleo atômico que é bastante semelhante
Formatado
ao modelo de camadas eletrônicas para o átomo onde elétrons ocupam ou vão
preenchendo camadas designadas pelo seu número quântico principal. Átomos com 2,10,
18, 36, 54 e 86 elétrons apresentam suas camadas preenchidas e portanto
comportamcomporta-se de forma semelhante quimicamente além do que este modelo de
camadas determina uma periodicidade nas propriedades. Da mesma forma, observamos
que núcleos com 2, 8, 20, 28, 50, 82 e 126 nêutrons ou prótons são mais abundantes
Formatado
no uiniverso do que outros núcleos com número massa semelhante, sugerindo que tais
números são mais estáveis. Estes números de prótons ou nêutrons para núcleos 2, 8, 20,
28, 50, 82 e 126 são normalmente conhecidos como números mágicos em estrutura
nuclear. Núcleos com N ou Z equivalendo aos números mágicos apresentam estrutura
nuclear bem próximo da esférica o que é demonstrado pelo pequeno momento
quadripolar que eles apresentam.
O modelo de camadas tem como importante suporte experimental à precisão
correta dos números mágicos e o spin nuclear.
Decaimento nuclear
Formatado
12
Um dos fenômenos mais significantes no desenvolvimento da fisica atômica e da
fisica nuclear é a radioatividade. Neste processo, um núcleo emite partíiculasr alfas
(núcleo hélio) e elétrons (partículas betas) e prótons (raios gamas) adquirindo
configurações mais estáveis. Nesta parte do curso iremos discutir um pouco este
fenômeno que normalmente chamamos de decaimento nuclear.
Imaginemos uma amostra de elementos radiativos que num determinado instante
apresenta N núcleos. Definimos a atividade R como,
R=−
dN
dt
onde o sinal (-) é colocado para fazer R positivo. R é expresso em desintegraçõesão por
segundo. Algumas vezes expressamos R em termos do Curie.
1 curie = 3.7 1010 desintegração / segéc
Todas determinações experimentais de R mostram que a atividade apresenta um
decaimento exponencial com o tempo. Definimos a meia vida do elemento T 12 como
sendo o tempo para sua atividade cair a metade do valor no iníicio da medida.
É importante salientar que após cada período T 12 a atividade da amostra esfera reduzida
á metade,
T1
2
T1
2
T1
2
R0 → 12 R0 → 14 R0 → 18 R0 ...
13
O comportamento mostrado acima permite que escrevamos a relação empírica,
R = λN =
− dN
⇒ R = R0 e − λ t
dt
onde λ é chamada de constante de decaimento e tem um valor diferente dependendo do
elemento radiativo considerado. A relação entre λ e T 12 pode ser determinada,
R = R0 e − λ t
1
2
R0 = R0 e
− λT 1
2
λT = l n 2 → T =
1
1
2
2
0.693
λ
Da dependência exponencial colocada acima temos uma forte evidencia de que o
fenômeno de decaimento radiativo tem uma natureza estatística, isto é, cada núcleo
radiativo apresenta uma certa probabilidade de decair, mas não há meios de saber quais
núcleos decairão num certo instante de tempo. Se a amostra é grande o suficiente, fração
que decai num determinado instante corresponde razoavelmente bem à probabilidade de
decaimento de um único núcleo. Assim a probabilidade de um núcleo decair num período
de tempo T 12 é 0,5.
Vamos supor que a probabilidade por unidade de tempo para decaimento de um
determinado núcleo seja constante λ . Assim, a probabilidade de decaimento num
intervalo dt é λdt. Se tivermos a amostra com N núcleos que ainda não decaíram, a
quantidade dN que decairá num intervalo dt é,
dN
= −λdt
N
de onde por integração tiramos,
N = N 0 e − λt
que mostra a evolução como tempo do número de núcleos que ainda não decaíram sendo
N0 este número em t = 0. Desta lei podemos tirar a atividade radiativa.
Formatado
14
R=−
dN
= λ N 0 e − λ t = R0 e − λ t
dt
com R0 = λN 0
que apresenta 66% probabilia uma partícula beta decair e 34% chance de emitir em
81
Tl 208 .
figura
Ou ainda podemos escrever,
R = λN
Outra constante de tempo importante é o tempo de vida médio,
T=
1
λ
diferente do tempo de meia vida T 12 . Normalmente T > T 12 .
A maioriaedida dos elementos radiativos encontrados na natureza são membros de
quatro grupos denominados de séries radiativas. Estas séeries são elementos que
originam basicamente do mesmo elemento através de emissões radiativas (α e β ) . A
razão para existir exatamente 4 séries vem de fato que o decaimento α reduz a massa
atômica de 4 unidades. Assim, todos elementos radiativos cujas massas são
15
A = 4n
, onde n é um inteiro, pode decair uns nos outros em ordem descendente do número de
massa. Os núcleos radiativos cujo número massa é da forma acima 4n são denominados
de membros da série 4n. Temos ainda 3 outras séries,
A = 4n + 1
A = 4n + 2
A = 4n + 3
Em cada série radiativa os membros transformam-se uns nos outros através do
decaimento.
Cada série tem um elemento denominado do “pai da série” e um elemento estável
final que interrompe o processo de decaimento.
Número massa
Série
“pai”
T 12 (anos)
Estável final
“pai”
4n
Tório
232
90Th
1,39 1010
82Pb
208
4n + 1
Neptunio
237
93Np
2,25 106
83Bi
4n + 2
Urânio
92U
238
4,51 109
82Pb
206
4n + 3
Actinio
92U
235
7,07 108
82Pb
207
209
A série do neptunio tem um tempo de meia vida bastante curta comparada com a
idade do universo (~ 1010 anos) de modo que os membros desta série quase não são
encontrados nos dias atuais. Estes elementos podem, no entanto ser obtido através de
bombardeamento de núcleos mais pesados feitos em laboratório.
Estas series podem ser representadas graficamente. Cada decaimento α ou β
proporciona um passo na série.
Muitos núcleos radiativos podem decair de formas diferentes através de emissão α
ou β. Como exemplo temos o
83Bi
212
, um membro da série do tório, que apresenta 66%
probabilidade de emitir uma partícula beta decaindo em
emitir alfa e decair em 81Tl 208 . (figura)
84
P0212 e 34% de chances de
Formatado
16
Quando um núcleo zXA emite x particulasr α e y particular β, temos,
z
X A → x 2α 4 + y −1 β 0 + z ′ Y A′
transforma-se no núcleo z ′ Y A′ .
A conservação do número de massa,
A = 4x + A’1 → ∆A = 4x
do número atômico,
Z = A (2x – y) + Z’1 → ∆Z = -2x + y
Assim, emitindo α o número massa altera de 4 unidades e o número atômico altera
2 unidades.
Emitindo 1β, o número de massa não muda e o numero atômico altera (aumenta)
de uma unidade. Desta forma podemos acompanhar as séries anteriores.
Vamos agora ver em linhas gerais os produtos de decaimento.
Decaimento alfa:
Devido ao fato que as forças fortes de atração entre os nucleons somente
manifesta-se a curto alcance, isto é, quando eles estão próximos à energia total de
ligação entre os núcleos é proporcional ao número de massa A. Por outro lado, a força de
repulsão coulombiana age mesmo a méedias distâncias. Esta repulsão coulombiana tenta
Formatado
17
separar os prótons e o total desta tendência de ruptura do núcleo é aproximadamente
proporcional à Z2. Assim, núcleos muito grandenúcleos muito grandes (normalmente com
mais de 210 nucleons), apresentam a força de curto alcance que os mantém unidos,
quase que totalmente contrabalanceadacontrabalançada pela repulsão entre prótons.
Assim, o núcleo sendo grande há uma perda de estabilidade. O decaimento do núcleo
através de emissão de partículas α e uma alternativa natural para estes núcleos
diminuírem seu tamanho aumentando a estabilidade. Uma pergunta natural que fazemos
nesta altura é: porque o núcleo não emite somente prótons ou núcleos de 2He3 para
aumentar sua estabilidade ao invés de partículas α? A resposta para isto esta no fato que
a partícula α tem uma alta energia de ligação além do que sua massa é muito menors que
a de seus constituintes liberando parte da energia na forma de energia cinética necessária
para a emissão da partícula. Assim, a quantidade de energia é,
K = (mi − m f − m α )c 2
mi é a massa do núcleo inicial, mf a massa do núcleo final e mα a massa da partícula.
Somente a emissão de partículas α é energicamente possível. Assim, imaginemos o
decaimento 92U232. Neste caso temos,
K = 5,4 MeV
enquanto se supormos a emissão de um próton seria necessário fornecer ao sistema 6,1
MeV.
A energia cinética real carregada pela partícula α emitida não é IK anterior, mas
será um pouco inferior se considerarmos o recuo do núcleo na emissão. Através de
conservação de energia e momentum podemos mostrar que,
Kα ≅
A−4
K
A
é a energia cinética carregada pela partícula α emitida.
Apesar de entendermos qualitativamente bem que a emissão nuclear de uma
partícula α leva o núcleo à um estado mais estável ainda não entendemos muito bem
como ocorre a emissão. Afim de entendermos este processo imaginemos o potencial de
interação entre uma partícula α e um núcleo pesado.
18
Estando no interior do núcleo, a partícula α esta sujeita à um constante potencial e
atingindo uma distância R0, que corresponde ao raio nuclear há um repentino aumento,
impedindo que a partícula escape. Isto é, como uma caixa contendo as partículas. Esta
barreira de potencial não é infinita, mas classicamente a partícula não pode sair desta
configuração. Normalmente a altura da barreira é de ordem de 25 MeV. Fora do núcleo, a
interação é essencialmente Coulombiana.
Embora não possamos explicar classicamente o decaimento espontâneo do
núcleo, a mecânica quântica nos fornece uma explicação clara e simples, sendo este
fenômeno, mesmo tomado como comprovação desta última. No nossno modelo, a
partícula no núcleo comporta-se como partícula na caixa de modo que vamos tratar
quanticamente o potencial mostrado anteriormente e comparar o resultado do escape de
partículas α com resultado experimental.
19
No presente modelo vamos imaginar que a partícula α tenha uma determinada
energia no interior de núcleo oscilando no seu interior (como partícula na caixa). Cada vez
que a partícula colide com a barreira de potencial localizada em r = R0 , há uma
probabilidade da partícula passar através da barreira representando um decaimento do
núcleo.
Seja P a probabilidade da partícula colidir na barreira e passar por ela e ν a
Formatado
freqüência de colisão da partícula com a barreira. O número de vezes que a partícula
passa pela barreira // unidade de tempo é λ,
λ=νP
Supondo que a partícula α tenha dentro do núcleo uma velocidade v, a freqüência
com que ela colide com a barreira é,
ν=
V
2R0
Tomando v como a velocidade com que a partícula deixa o núcleo (~ 2 107 m/s) e
sendo R0 ~ 10-14 m,
→ ν ≈ 1021 segc-1
Assim, vemos que mesmo colidindo 1021 vezes por segundo com a barreira a
partícula α algumas vezes tem que esperar 1010 anos para escapar do núcleo.
Classicamente como sabemos, Pp = 0, pois envolve passagem da partícula por
uma região que tem energia potencial maior que a energia total. Quanticamente, no
entanto, a partícula pode tunelar pela barreira (como vimos) e a probabilidade não é nula
e pode ser calculada.
Inicialmente vamos relembrar os resultados que vimos da transmissão de uma
partícula por uma barreira de potencial.
[FSU1] Comentário:
20
Seja um feixe partícula α com energia E = IK cinética incidindo da esquerda para a
direita. Fora da barreira V = 0 e não há forças sendo partícula “livre”.
Como já vimos à probabilidade de transmissão por esta barreira é,
q2 =
2m(V − E )
h2
P=T
onde K =
2
=
(q
2
K2 =
)
2mE
h2
(2 Kq )2
+ K 2 senh 2 q + (2 Kq )
2(E )m
h2
2
q=
e
2
2(V − E )m
h2
Como P é pequeno, podemos escrever,
 2 Kq
P ≈  2
2
q +K
2
 − 2 qL
 e

[FSU2] Comentário:
21
Este resultado vale para a barreira de altura V e largura L. Se quisermos aplicar
este resultado para uma barreira qualquer podemos dividi-la em pequenas barreiras
retangulares de tamanho V (x) e largura ∆x, como mostrado à seguir.
De modo que,
P= π
. P
barreiras barreira
parciais individual
ou seja, a probabilidade de transmissão da partícula na barreira será o produto das
probabilidades de transição em cada uma das barreiras que constituem a barreira V (x).
Ou seja,
lnP =
∑ .lnP
parciais
barreiras
mas
lnPparciais = −2q∆x + 2ln
2 Kq
q + K2
2
Como primeiro termo é dominante na maioria das casoas (pois o segundo termo é
logaritmo do primeiro).
lnP = ∑ − 2q∆x
Como para cada barreira localizada em x,
q=
2m(V (x ) − E )
h2
22
a soma transforma-se em integral fornecendo,
lnP = −2 ∫
2m
(V (x ) − E )dx
h2
L
X0
e temos,
P=e
−2
L
∫X 0
2m
h2
(V ( x )− E )dx
Este resultado vale para a transmissão de uma partícula em qualquer barreira.
Para o caso que estamos tratando do decaimento α uma partícula com energia E
deveráa tunelar a barreira,
V (x ) =
2 Ze 2
x
do ponto x = R0 até o ponto x = R deixando o sistema com uma energia cinética IK que é
todo E convertido em cinética.
23
Aplicando a relação da probabilidade de transmissão P a este caso:
1
2

 2m  2  2 Ze
q= 2  
− K
h   x

1
2
Como ponto x = R é definido como sendo aquele que,
2 Ze 2
=K
R
temos,
2 Ze 2 = KR
1
 2mK  2  R 
q (x ) =  2   − 1
 h  x 
1
2
portanto,
1
1
 2mK  2 R  R  2
∫R0 q(x )dx =  h 2  ∫R0  x − 1 dx
1
1
1
1
 2mK  2  −1  R0  2  R0  2  R0  2 
=  2  R cos   −   1 −

R 

 h 
 R 
 R 

R
Como a barreira é muito mais larga do que as dimensões nucleares R0 << R,
24
R 
cos  0 
 R
−1
 R0 
1 −

R

1
2
1
2
π
R 
≅ − 0 
2  R
1
2
≈1
de modo que,
1
1
 R0  2 
 2mK  2  π

q
(
x
)
dx
≅
R
−
2




∫R0
2
 h 
 2
 R  
R
E portanto,
1
 R  2
 2mK   π
lnP = −2 2  R  − 2 0  
 h   2
 R  
e usando
R=
 2mK 
lnP = −2 2 
 h 
1
2
2 Ze 2
K




1
R0 2
2 Ze  π

−2
1 
2
2
K 2


2 Ze


 

K

 

2
2
2
1
 2m  2 2 Ze π
 2m  2 2 Ze 2 R0 2
= −2 2 
+ 4 2 
K 2
1
1
2
2
2 12
2
h
h
K
K




2 Ze
1
1
1
(
1
 4mZe
1
 2m 
lnP = −2 2  πZe 2 K 2 + 8
2
h 
 h
2
2
1
)

1
 R0 2

2
Utilizando os valores numéricos para a massa da partícula α, carga do elétron e ħ,
1
1
lnP = 2,97 Z 2 R0 2 − 3,95Z K
−1
2
onde lK é a energia cinética da partícula α expressa em MeV, R0 o raio nuclear em
unidades de
10-15m e Z o número de prótons no núcleo.
A constante de decaimento λ que é a probabilidade por unidade de tempo,
25
λ = νP =
v
P
2 R0
 v
lnλ = ln
 2 R0
−1
1

1
 + 2,97 Z 2 R0 2 − 3,95Z K 2

Assim, fazendo um gráfico de lnλ medido versus Z K
−1
2
medido temos,
Os pontos experimentais concordam relativamente bem com a expressão teórica
num intervalo grande de Z K
−1
2
mostrando a validade do modelo proposto. Podemos usar
26
esta linha extrapolando para obter R0 quando Z → 0 e neste caso obtenha R0 ~ 10-14 m
que concorda com resultado de Rutherford.
A análise quântica do decaimento α é importante pois explica a grande variedade
de constantes de decaimento λ tendo como mais longo decaimento
anos? e mais curto
212
84Po
232
90Th
1,3x1010
com 3x10-7segc. Além desta, a explicação do decaimento α
através de penetração na barreira de potencial é extremamente candescente com a
natureza quântica do núcleo.
Decaimento β
Da mesma forma que no decaimento α, no decaimento β o núcleo procura uma
forma de atingir maior estabilidade. O decaimento β consiste na emissão de um elétron
pelo núcleo. Este elétron é originário do decaimento de um nêutron em um próton mais
um elétron sendo que o próton continua evidentemente no núcleo.
Medindo o momentum do elétron é possível calcular sua energia cinética,
K = m02 c 4 + p 2 c 4 − m0 c 2
Observa-se que normalmente que a energia cinética no decaimento β varia de 0
até um valor máximo, K máx ≅ 1.17 MeV que deveria ser igual a variação máxima mássica do
núcleo. No entanto, observa-se que isto não é verdade, normalmente parecendo que a
energia esta sendo criada violando um dos importantes conceitos da Física.
É possível medir com relativa precisão o recuo sofrido pelo núcleo após o
decaimento beta e comparando seu momentum de recuo com o momentum do elétron
também há uma aparente violação da conservação de momentum.
Um terceiro agravante que aparece no decaimento β é o fato de que no processo,
n → p + e-
cada partícula tem spin
1
2
h de modo que não é possível conservar momento angular com
este processo.
Todas estas contradições foram resolvidas com a proposta do neutrino por Pauli
em 1930. Para Pauli, o decaimento β deveria estar acompanhado da emissão de uma
Formatado
27
partícula não carregada de spin
1
2
h que seria responsável de estar levando toda energia
e momentum não explicado acima. Esta partícula seria o neutrino.
Formatado
Estudos mais apurados mostraram a existência de dois tipos de neutrino, o ν
(neutrino) e ν (anti-neutrino), e que no decaimento β ordinário a partícula envolvida é o
anti-neutrino,
Formatado
n → p + e- + ν
A hipótese do neutrino para explicar o decaimento β foi muito bem sucedida.
Esperava-se inicialmente a massa do neutrino como sendo uma fração muito pequena da
massa do elétron. Hoje em dia acreditamos que a massa do neutrino seja realmente zero.
Decaimento Gama
O núcleo atômico existe em estados de energias bem definidas da mesma forma
que os estados eletrônicos. Um núcleo excitado N* pode retornar ao seu estado
fundamental emitindo fótons cuja energia correspondem à diferença entre os níveis
envolvidos. Os fótons emitidos temOs fótons emitidos têm energia que pode atingir vários
MeV e são denominados de raios gamasão denominados de raios gama. Normalmente o
Formatado
tempo de vida dos estados nucleares é bastante curto, mas em alguns poucos casos o
decaimento gama, como é chamada esta missão, chega a atingir horas.
Reações Nucleares
Da mesma forma que em química, as reações entre elementos serve para trazer
informações de cada elemento e seu comportamento na natureza, as reações nucleares
são ricas em informações a respeito dos constituintes nucleares que é seu
comportamento. Além disso, as reações nucleares constituem-se na maneira de tirarmos
proveito prático do núcleo atômico, veja como um reservatório de energia, ou seja, como
mecanismos de formação desta fauna de elementos químicos presentes no universo.
A maioria das reações nucleares envolvem....... que contém o maior número de esferas
próximas possível.
Desta forma, cada nucleon terá associado a ele uma energia.
12 x 12 U = 6U
Formatado
28
Assim, se todos nucleons tivessem rodeados por 12 a energia de um
determinado núcleo seria.
Ev = 6AU = d1A
Esta energia
1
UNIVERSIDADE DE SÃO PAULO
INSTITUTO DE FÍSICA DE SÃO CARLOS
DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS
CAPÍTULO X
INTRODUÇÃO AOS SÓLIDOS
PROF. VANDERLEI S. BAGNATO
2
Capítulo X
Introdução aos sólidos
Os sólidos constituem uma classe especial de arranjo microscópico.
Quando os átomos ou moléculas se aproximam muito, vários efeitos ocorrem,
determinando o comportamento macroscópico do sistema. As ligações químicas
constituem uma das partes mais importantes das características dos sólidos. A
natureza e a forma com que os átomos se unem, determina sua estrutura bem
como suas características físicas, principalmente com relação à condutividade
elétrica. Como uma introdução ao tema dos sólidos, vamos descrever as ligações
químicas e realizar alguns modelos com relação ao transporte de cargas.
Ligações químicas
Devido às características eletrônicas apresentadas pelos átomos, eles têm
capacidade de se combinarem formando moléculas e muitas vezes se agruparem
em um maior número formandos os sólidos.
As ligações iônicas têm origem quando átomos de baixa energia de
ionização se unem com outros de alta afinidade eletrônica. O resultado é uma
transferência de carga criando íons positivos e negativos que interagem via
Coulomb. Normalmente neste caso a ligação formada não preserva informações
dos orbitais atômicas originais e a estrutura do grupo de átomos ocorre
principalmente de forma a obedecer aos impedimentos espaciais impostos pelo
3
tamanho efetivo entre os íons. Este é certamente o caso quando podemos
visualizar os sólidos através do empacotamento de esferas um exemplo tradicional
deste tipo de ligação é o NaCl . Onde íons de Na e Cl distribuem-se formando
uma rede cúbica. Normalmente no caso de ligações iônicas, é importante falarmos
em fator de empacotamento, etc.
A distribuição dos átomos pode obedecer a vários tipos de arranjos sendo
os mais importantes os chamados cúbicos.
É importante salientar que na ligação iônica não há direção de ligação já
que a conexão entre átomos dar-se através da interação de Coulomb entre cargas
puntuais. É o impedimento esférico que aparece quando os átomos se aproximam
muito que determinam a estrutura.
Por outro lado, temos átomos que quando se aproximam adquirem uma
situação mais estável se compartilharem elétrons com átomos adjacentes. Esta
situação cria as ligações covalentes e conseqüentemente os sólidos covalentes.
Neste caso, as ligações químicas que correspondem à concentração eletrônica
numa região ligando os átomos obedecem esta direcionalidade no espaço,
direcionalidade esta que normalmente advém das características do orbital
atômico original. Um exemplo tradicional deste caso é o diamante. Neste caso,
cada átomo de carbono possui 4 vizinhos partilhando elétrons. Os ângulos entre
as ligações são bem determinados e é exatamente este fator dominante no
estabelecimento da estrutura do sólido. A localização dos elétrons nas ligações
covalentes faz com que estes sólidos sejam maus condutores de calor e os
elétrons, mas muito estáveis quimicamente. Muitas vezes a natureza da ligação
4
química no sólido não é perfeitamente determinada, fazendo com que o sólido
tenha uma característica mista. Este é certamente o caso do quartzo (SiO2).
Há ainda substâncias que são bastante estáveis de tal forma que quando
aproximadas preservam sua individualidade, promovendo sua ligação de forma
diferente das iônicas ou covalentes. Exemplos desta classe de substâncias são
certamente os compostos orgânicos formando polímeros. Neste caso, as forças
intermoleculares são formadas por flutuações na polarizabilidade. Estas são a
chamadas interações De Van der Waals. E são também chamadas de ligações
secundárias por serem muito mais fracas do que as anteriores.
Para ilustrar a natureza da ligação de Van de Waals considere dois átomos
que se aproximam e vamos imaginar que suas nuvens eletrônicas como
osciladores harmônicos. Ao se aproximarem, as nuvens eletrônicas se deformam
estabelecendo um tipo de indução dipolar.
5
A energia deste sistema sem considerarmos interação é
H0 =
p12 1 2 p 22 1 2
+ cx1 +
+ cx 2
2m 2
2m 2
e cada sistema tem sua freqüência natural ω 0 =
c
. Devido a interação
m
eletrostática
H1 =
que como x1, x2
e2
e2
e2
e2
+
−
−
R R + x1 − x2 R + x1 R − x 2
R, pode ser expandida originando
Ze 2 x1 x 2
H1 = −
R3
Assim, o sistema físico é modelado como sendo dois osciladores acoplados por
H1. Definidas novas coordenadas
x1 =
x2 =
1
2
1
2
(x s + xa )
p1 =
(x s − xa )
A energia total é agora escrita como
1
2
( ps + pa )
p2 =
1
2
( ps − pa )
6
H = H 0 + H1 =
1 2 1
2e 2
p s +  C − 3
2m
2
R
 2
1 2 1
2e 2
 x s +
p a +  C + 3
2m
2
R

 2
 x a

mostrando que este sistema acoplado tem dois modos de vibração de freqüências
1

2e 2 3  2
 1 2e 2 1  2e 2  2 
ωs   C ±

R
 .....
− 
=
 ∼ ω 0 1 ±
3
ωa  
8  CR 3 
m
 2 CR




A energia do ponto-zero deste sistema é
1
h (ω s + ω a ) de modo que devido a
2
interação há um saldo energético
∆Η =
1
h
h(ω s + ω a ) − 2 ω 0
2
2
fornecendo
∆Η = −
com C 6 =
C6
R6
hω 0 e 4
2 c2
Isto mostra que a aproximação dos dipolos oscilantes, produz uma situação mais
estável do que quando isolados. Assim, uma atração entre eles faz com que tais
entidades permaneçam unidas.
7
Esta ligação é responsável pela união das moléculas orgânicas formando
plásticos.
1
UNIVERSIDADE DE SÃO PAULO
INSTITUTO DE FÍSICA DE SÃO CARLOS
DEPARTAMENTO DE FÍSICA E CIÊNCIAS DOS MATERIAIS
CAPÍTULO XI
PRINCÍPIOS DA MECÂNICA ESTATÍSTICA
PROF. VANDERLEI S. BAGNATO
2
Capítulo XI
Princípios da Mecânica Estatística
A grande parte do esforço feito pela física constitui em explicar as
observações macroscópicas através de modelos constituídos de porções
microscópicas. No entanto, os constituintes microscópicos de um sistema têm
normalmente suas grandezas físicas apresentando valores distintos dentro do que
chamamos uma distribuição de valores. Deste modo, as grandezas microscópicas
se manifestam através de uma certa média estatística de seus constituintes. A
maneira como as grandezas de um conjunto de entidades microscópicas se
distribuem estatisticamente dependem entre outras coisas do tipo e natureza dos
constituintes do sistema. A mecânica estatística, procura formular este problema
gerando
os
aspectos
fundamentais
das
distribuições
dos
constituintes
microscópicos. Constitui-se então numa importante ferramenta para a física.
Vamos começar falando do conceito de Distribuição de Probabilidade.
Considere uma caixa dividida em K- compartimentos nos quais vamos adicionar
N- bolas de forma aleatória.
3
Como os compartimentos têm formas e tamanhos diferentes, os compartimentos
terão diferentes chances de receberem bolas. Esta probabilidade de cada
compartimento receber bola, chamaremos de probabilidade intrínseca de
ocupação (gi). Por exemplo, se cada compartimento tem área ai, e sendo A a área
total
gi =
ai
A
Esta probabilidade “a priori” ou intrínseca só depende do sistema. Ao deixarmos a
N-bolas sobre os compartimentos, cada compartimento receberá ni. No entanto,
há inúmeras maneiras de acomodarmos as N bolas nos K compartimentos. Por
exemplo, uma possibilidade é termos todas as bolas em somente 1 compartimento
e assim por diante. Este número de maneira que N bolas podem entrar nos K
compartimentos também afetam as possíveis de preenchermos o sistema.
Desta forma, a probabilidade do sistema ser encontrado numa determinada
ocupação {ni } , depende destes dois fatores:
Probabilidade “a priori” de a bola cair num compartimento.
Número de possibilidades de distribuição das N bolas entre os vários
compartimentos. A composição destes fatores, gera a probabilidade
W ({ni }, {g i })
que chamamos de distribuição de probabilidades. Normalmente, nosso maior
interesse é saber quando W é máximo. Ou seja, estamos interessados em
4
determinar que conjunto {ni }é o mais provável de ocorrer. Uma vez conhecida
isto, conectamos a distribuição microscópica com a macroscópica. Voltando ao
caso de nosso exemplo,
∑a
∑g
i
=A e
i
=1
A probabilidade de termos ni bolas na i-ézima caixa é então ( g i ) i . Desta forma a
n
probabilidade de termos uma certa distribuição n1, n2,....,nk é o produto:
(g1 )n (g 2 )n ....(g i )n ...(g k )n
1
onde
∑n
i
2
i
k
=N
A próxima pergunta que fazemos é de quantas formas estas N bolas podem ser
arranjadas? A resposta desta pergunta corresponde exatamente à combinação de
N bolas em grupos n1, n2,......,nk, ou seja
N!
n1!n 2 !...n k !
Assim, a probabilidade total do sistema adquirir a distribuição n1, n2, ... nk é
W=
N!
(g1 )n1 (g 2 )n2 ....(g k )nk
n1!n2 !...nn !
que é a distribuição de probabilidades para a distribuição de bolas em questão.
5
A primeira curiosidade que temos é que a distribuição (n1, n2...nk) que
produz o maior W? esta é a chamada distribuição mais provável para obtermos
isto, vamos introduzir algumas aproximações
ln n!≅ n ln n − n
conhecida como fórmula de Stirling. Tomando logaritmo de W,
ln W = ln N!−∑ ln ni !+ ∑ ni ln g i
usando
∑n
i
= N e a fórmula para ln N ! ,
ln W = N ln N − ∑ ni ln ni + ∑ ni ln g i
Para determinarmos (ln W )máx = ln Wmáx , realizamos variações nos valores de ni
ni → ni + δni
e verificamos para que conjunto {ni } a variação causada em ln W é mínima (Isto é
equivalente á condição de máximo
∂W
= 0 ). Assim,
∂ni
δ ln Wmáx = −∑ ni δ ln ni − ∑ δni ln ni + ∑ δni ln g i = 0
como δ ln ni =
já
que
o
δni
i
∑ δn
número
∑ n δ ln n = ∑ δn
i
,e
ni
i
=0
i
de
=0
bolas
é
constante.
Com
isto
chegamos
á
6
ou seja
− ∑ ln ni δni + ∑ ln g i δni = 0
Utilizando multiplicadores de Lagrange, obtemos que a distribuição mais provável
corresponde a
ni = N
ai
A
ou seja,
ni = Ng i
Se quisermos aplicar o conceito de distribuição de probabilidades para
analisarmos propriedades macroscópicas de sistemas físicos, é preciso primeiro
conhecer a natureza dos constituintes microscópicos. No caso de partículas
clássicas, elas são distinguíveis e em princípio podem adquirir qualquer valor da
energia. Isto faz com que inúmeras possíveis distribuições microscópicas podem
causar a mesma energia macroscópica. Caso as partículas sejam quânticas a
indistinguibilidade é um fator dominante e o princípio de exclusão de Pauli deve
ser levado em conta, quando montarmos as várias possibilidades de arranjos
microscópicos que levam a uma determinada energia macroscópica.
Um gás clássico, é um exemplo de partículas distinguíveis e estamos
interessados em determinar como que a energia do sistema está distribuída entre
os constituintes microscópicos do sistema. Esta é a chamada estatística de
Maxwell-Boltzmann,
extremamente
propriedades dos gases clássicos.
importante
na
determinação
das
7
Comecemos considerando um conjunto de N moléculas cujas energias (
cinéticas neste caso), estão limitadas aos valores µ1 , µ 2 ,...µ k . Dentro das N
moléculas, temos n1, n2,...nk. Moléculas com cada valor das energias listadas. O
número total de partículas e a energia total do sistema E, estão vinculadas com a
distribuição n1, n2,...nk através de
∑n = N
∑µ n = E
i
i
i
se a probabilidade á priori que uma molécula tenha energia µi for gi, então a
probabilidade W para qualquer distribuição será
W=
N!
(g1 )n1 ....(g k )nk .
n1!n2 !...nk !
com vimos anteriormente. Agora, temos que determinar a distribuição mais
provável com as condições acima. Neste caso, a aplicação dos métodos
matemáticos para determinar a W máx faz-nos chegar a
ni = g i e −α e − βµi
que é conhecido como Lei de Distribuição de Maxwell-Boltzmann. Em outras
palavras, as partículas estarão alocadas a cada possível valor de energia µi, da
forma indicada como a forma mais provável. Ou seja, isto determina como a
energia estará distribuída entre as partículas.
8
As constantes α e β são quantidades independentes dos
{ni }.
Para
calcularmos α e β convém considerar uma distribuição contínua de energia e não
discreta com bolas em caixas. Desta forma, o número de partículas com energia
entre µ → µ + dµ será n(µ )dµ de modo que
n(µ )dµ = ge −α e − βµ dµ
Como em nosso sistema físico a energia está na forma cinética,
Ou seja,
n( p )dp = ge e
−α
−β
p2
2m
dp.
A probabilidade á priori de que um certa molécula está com energia entre µ e
µ + dµ deve ser determinada da mesma forma que no caso das bolas na caixa.
Sendo o gás isotrópico e obedecendo ao princípio de eqüipartição da energia,
∞
N = ∫ n(µ )dµ
0
e
∞
3
KT =
2
∫ µn(µ )dµ
0
∞
∫ n(µ )dµ
∞
ou
3
NKT = ∫ µn(µ )dµ
2
0
0
de onde é possível eliminar g, α e β. Na verdade determinamos
9
β=
1
KT
sendo K a constante de Boltzmann e ge −α , juntos. O resultado é que
n(µ )dµ =
Lembrando que µ =
2πN
(πKT )
3
µe
−µ
KT
dµ
2
1 2
mv , podemos converter esta expressão na distribuição de
2
velocidade, obtendo
n(v )dv =
2πNm
(πKT )
3
3
2
2
v 2e
− mv 2
2 KT
dv
10
Desta distribuição de energia podemos obter entre outras coisas a velocidade
mais provável, etc. O conhecimento da distribuição de velocidades permite a
determinação de importantes propriedades dos gases, como viscosidade,
transferência de calor e difusão.
As Estatísticas quânticas de Bose-Einstein e de Fermi-Dirac
A distribuição estatística de Maxwell-Boltzmann considera um gás clássico
de partículas que podem ser distinguíveis e que podem assumir energias
quaisquer, ou seja, um contínuo de energia. Se o gás for quântico, no entanto os
valores possíveis de energia são discretos e as partículas são naturalmente
indistinguíveis. A ocupação de cada estado possui a mesma probabilidade à priori,
de modo que a probabilidade total de ocupação de cada estado representa na
verdade o número de estados com determinada energia. Se o número de
partículas no sistema com determinada energia µ i e ni e havendo gi estados com
esta energia, há um certo número de maneiras que estas ni partículas podem ser
distribuídas pelos gi estados. O problema é parecido com a situação onde temos
g i − 1 paredes móveis numa caixa onde serão colocadas ni bolas
11
O número de bolas entre cada 2 paredes e o número de partículas num
determinado estado. O número de possíveis distribuições neste sistema será
(ni + g i − 1)!
ni !( g i − 1)!
para um sistema de N partículas a probabilidade total é o produto de todas
probabilidades
W =∏
(ni + g i − 1)
ni !( g i − 1)!
Novamente estamos interessados em determinar o máximo de W, ou seja, qual é
a distribuição de partículas entre os estados que produz um máximo de
probabilidade, isto é, a distribuição mais provável.
O procedimento é semelhante ao caso da distribuição de MaxwellBoltzmann. Considerando ni+gi-1∼ni+gi e usando ln n!= n ln n − n
ln W = ∑ [(ni + g i ) ln (ni + g i ) − ni ln ni − ln ( g i − 1)!− g i ]
Usamos agora um método variacional para obter o ponto máximo e W. o resultado
é que o conjunto de ocupação para os vários estados com probabilidade máxima
de ocorrer é
ni =
gi
e e βµi − 1
α
12
conhecida como distribuição de Bose-Einstein. Por argumentos semelhantes,
β=
1
e α é um parâmetro determinado a partir da condição
KT
∑n
i
=N
A distribuição de Bose-Einstein é válida para partículas que podem
acumular-se num determinado estado. Portanto, tratam-se dos bósons, partículas
com um determinado spin de valor zero ou inteiro.
Uma importante aplicação da estatística de Bose é o caso de um gás de
Fótons contidos numa caixa de volume V. neste caso, como os fótons estão
constantemente sendo absorvidos e emitidos, não é possível preservar seu
número. O resultado disto é que α=0, para que esta característica do sistema
possa ser preservada.
A cavidade que estamos considerando contém fótons indistinguíveis, cada
um com energia hν . O número de possíveis estados para fótons com freqüência
entre ν
e ν + dν pode ser obtido somando-se os modos desta cavidade neste
intervalo de freqüência. Isto pode ser feito facilmente e o resultado obtido é
exatamente a probabilidade “a priori” gi, que aqui expressaremos como g (ν )dν
g (ν )dν =
8πV 2
ν dν
c2
Com isto, podemos calcular a distribuição de fótons como sendo:
13
n(ν )dν =
1
e
hν
KT
.
−1
8πV 2
ν dν
c2
A densidade correspondente de energia espectral µ (ν )dν , que é a energia por
unidade de volume contida na radiação entre as freqüências ν e ν + dν é dada
por:
µ (ν )dν =
hν .n(ν )dν 8πh ν 3 dν
= 3 hν
V
c e KT − 1
esta é a conhecida fórmula de Planck da radiação . A densidade total de energia
dentro da cavidade é obtida adicionando-se todas as freqüências, ou seja
∞
u = ∫ u (ν )dν = AT 4
0
conhecida fórmula para a energia radiante emitida por um corpo negro.
Outra importante aplicação da distribuição estatística de Bose é a famosa
Condensação de Bose-Einstein (ver artigo sobre CBE, final da apostila).
Quanto o sistema é composto por partículas de spin semi-inteiro o princípio
de exclusão de Pauli impõe restrições que acabam por produzir uma nova
distribuição estatística denominada de Fermi-Dirac. A dedução da estatística de
Fermi-Dirac é parecida a de Bose-Einstein. Ao contrário desta ultima , férmions
não podem ocupar o mesmo estado. Somente uma partícula pode ocupar cada
estado. De forma paralela ao feito anteriormente, imaginemos que temos gi
estados com energia µi preenchidas por ni partículas. Como cada estado acomoda
apenas uma partícula, ni estados estão preenchidos e ( g i − ni ) ainda disponíveis.
14
O número de maneira que estas ni partículas podem ser acomodadas é dado pelo
arranjo
gi!
ni !( g i − ni )!
e portanto a distribuição de probabilidades para as várias possibilidades dos
{ni }deste sistema é
W =∏
gi!
ni !( g i − ni )!
Novamente, queremos determinar a distribuição mais provável
{ni }máx
que
corresponde aquela que maximiza a probabilidade acima. Assim, tomando o
logaritmo
ln W = ∑ [ln g i !− ln ni !− ln ( g i − ni )!]
com aproximação de Stirling ln n! = n ln n − n , ficamos com
ln W = ∑ [g i ln g i − ni ln ni − (g i − ni ) ln (g i − ni )]
Vamos agora utilizar o método variacional fazendo uma variação δni na população
dos estados e verificar a condição onde isto não altera W, que deve corresponder
ao extremo
δWmáx = ∑ [− ln ni + ln (g i − ni )]δni = 0
15
Os vínculos para este problema são que o número de partículas seja conservado
− α ∑ δni = 0
− β ∑ µ i δ ni = 0
Com estes vínculos, o método variacional leva a
∑ [− ln n
i
+ ln ( g i − ni ) − α − βµ i ]δni = 0
Como δni são independentes,
− ln ni + ln ( g i − ni ) − α − βµ i = 0
de onde tiramos, substituindo β =
1
KT
ni =
gi
eα e
µi
KT
+1
que corresponde a distribuição de Fermi-Dirac, mostrando como um sistema de
férmions distribuem-se nos níveis de energia disponíveis num sistema físico.
A principal aplicação da estatística de Fermi-Dirac é a teoria dos elétrons
livres nos metais, que corresponde a um importante exemplo dentro da teoria dos
sólidos. Comecemos considerando um gás de elétrons no metal. Na consideração
que os elétrons são férmions e livres,a estatística anterior aplica-se bem. A
ocupação de cada estado µi vale
16
ni =
gi
eα e
µi
+1
KT
No entanto, devido a enormidade de partículas e estados é adequado
considerarmos um contínuo de estados. Assim agora falamos na ocupação dos
estados com energia entre µ e µ + dµ
n(µ )dµ =
g (µ )dµ
eα e
µ
KT
+1
para determinarmos g (µ )dµ (número de estados com energia entre µ
µ+dµ,
contamos os estados das partículas numa caixa de voluma V, verificando no
espaço dos números quânticos (k x , k y ek z ) quantos estados estão no intervalo de
energia considerado. Este procedimento nos leva a
8 2Vm
g (µ )dµ =
h3
3
2
1
µ 2 dµ
Aqui é importante lembrar que cada estado foi contado duas vezes, devido as
duas possibilidades de spin. Nosso próximo passo será determinar o parâmetro α.
Considerando o gás a baixas temperaturas, temos que a ocupação dos estados é
zero ou um, até que todos estados sejam preenchidos chegando a máxima
energia ocupada µ f . Isto é uma conseqüência do princípio de exclusão de Pauli.
Isto significa que o chamado índice de ocupação f =
até uf e cair rapidamente acima de µf
ni
, deverá ser um ou zero
gi
17
f (µ ) =
1
 µ

e  KT

+α 

+1
para que esta fórmula seja condizente com o princípio de exclusão mencionado
acima, temos que colocar α = −
µf
KT
, e desta forma, o índice de ocupação fica
1
f (µ ) = (µ − µ f ) KT
e
+1
para T 0, µ < µf leva a f (µ ) = 1 e para µ> µf f (µ ) → 0 . Temos f (µ f ) = 1 .
2
Se nossa amostra de metal apresenta n elétrons livres, em T=0
µf
∫ g (µ )dµ = N
0
e fazendo esta integral obtemos
h 2  3N 
µf =


2m  8πV 
como
2
3
N
= ρ , temos que
V
h2  3 
µf =
ρ

2m  8π 
2
3
18
independendo obviamente das dimensões da amostra e dependendo somente da
densidade. Um vez conhecida a distribuição e a energia de Fermi, podemos
determinar propriedades termodinâmicas do sistema como o calor específico, etc.
Download