notas de aula

Propaganda
Mecânica Quântica
June 24, 2013
Contents
1 Introdução
1.1 Ondas e partículas . . . . . . . . . . . . .
1.2 Ondas de Partículas . . . . . . . . . . . .
1.2.1 Espalhamento de um único elétron
1.3 Pacotes de ondas . . . . . . . . . . . . . .
1.3.1 Velocidade de grupo . . . . . . . .
1.4 Incertezas . . . . . . . . . . . . . . . . . .
1.5 A verdade (pelo menos até agora) . . . . .
1.6 O átomo de Bohr . . . . . . . . . . . . . .
1.7 Quantização de Sommerfeld . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
7
10
11
13
15
18
21
25
2 Mecânica
34
2.1 Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.2 Equações de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . 35
2.2.1 Coordenadas generalizadas . . . . . . . . . . . . . . . . . 36
3 Transformada de Legendre
40
4 Equações de Hamilton
4.0.2 Signi…cado físico da Hamiltoniana
4.1 Princípio variacional (opcinal) . . . . . . .
4.1.1 Exemplo: a braquistocrôna. . . . .
4.1.2 Equações de Euler-Lagrange . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Parênteses de Poisson
41
43
44
48
50
52
6 Vetores e equações lineares
6.1 Operadores, autovetores e autofunções no Rn
6.1.1 Produto externo . . . . . . . . . . . .
6.1.2 Auto-vetores . . . . . . . . . . . . . .
6.2 Mudança de base . . . . . . . . . . . . . . . .
6.3 Espaço de Hilbert . . . . . . . . . . . . . . . .
6.4 O espaço L2 . . . . . . . . . . . . . . . . . . .
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
54
61
62
66
67
69
72
6.5
6.6
6.7
6.8
6.9
6.10
Rigged Hilbert space . . . . . . . . . .
Operadores simétricos, ou hermitianos
Operadores diferenciais . . . . . . . . .
Domínio dos operadores . . . . . . . .
Operadores auto-adjuntos . . . . . . .
Operadores lineares . . . . . . . . . . .
.
.
.
.
.
.
78
80
86
93
94
95
7 Postulados da Mecânica Quântica
7.1 Interpretação probabilística . . . . . . . . . . . . . . . . . . . . .
7.2 Conseqüências físicas do primeiro postulado . . . . . . . . . . . .
7.3 Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
100
102
103
8 Quantização canônica
8.1 Evolução temporal .
8.2 Resumo . . . . . . .
8.3 Realização do espaço
8.4 Rotações . . . . . . .
8.5 Espinores . . . . . .
105
106
113
113
134
138
. . . . . .
. . . . . .
de Hilbert
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9 Ressonância
143
10 Observáveis compatíveis
149
10.1 Relações de incerteza . . . . . . . . . . . . . . . . . . . . . . . . . 153
11 Sistemas de várias partículas
154
11.1 Interação de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . 157
11.2 Dois spins acoplados . . . . . . . . . . . . . . . . . . . . . . . . . 161
12 Realização de espaços de dimensão in…nita
12.1 O operador de multiplicação . . . . . . . . . . .
12.2 O operador de posição . . . . . . . . . . . . . .
12.3 O operador de momento . . . . . . . . . . . . .
12.4 O problema do ordenamento . . . . . . . . . . .
12.5 Partícula na caixa . . . . . . . . . . . . . . . .
12.6 O momento da partícula . . . . . . . . . . . . .
12.6.1 Sistemas com vários graus de liberdade
12.7 O oscilador harmônico . . . . . . . . . . . . . .
12.7.1 Normalização . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
168
168
170
174
175
177
183
186
187
192
13 Potenciais centrais
195
13.1 Autovalores e autovetores do momento angular . . . . . . . . . . 196
13.2 O átomo de hidrogênio . . . . . . . . . . . . . . . . . . . . . . . . 204
13.2.1 Acoplamento spin-órbita . . . . . . . . . . . . . . . . . . . 208
14 Teoria das perturbações
210
14.1 Acoplamento spin-órbita (continuação) . . . . . . . . . . . . . . . 215
2
1
Introdução
Nesta parte do curso vamos estudar a MQ não relativística. Neste modelo
se considera, por exemplo, uma partícula carregada (um elétron) se movendo
num certo potencial (o núcleo). A estrutura quântica do próprio núcleo não é
muito relevante, mas apenas o potencial (ou o campo) que ele gera. Neste caso,
dizemos que o campo é externo, i.e., o próprio campo não é quantizado. Este
é o setor de uma partícula da mecânica quântica (MQ) não-relativística.
Para a análise de estruturas internas do próprio núcleo esta abordagem é
completamente inadequada. Uma vez que a dinâmica dos processos ocorre em
uma escala relativística e, o que é mais importante, a intensidade dos campos é
su…ciente para criar novas partículas. Destarte, não podemos mais nos limitar
ao setor de uma partícula e precisamos trabalhar no chamado espaço de Fock,
ou, de outra forma, realizarmos a segunda quantização. Onde se considera como
a primeira quantização a quantização canônica (ou de Dirac), ou a associação
de observáveis clássicos com operadores quânticos. Ao estudarmos a segunda
quantização estamos entrando nos domínios da Teoria Quântica de Campos
(TQC). Este será um assunto da última parte deste curso.
Vamos relembrar alguns pontos vistos no curso de quântica e de Física modera.
1. Hipótese de Planck: A troca de energia entre as paredes do negro e a
cavidade são quantizadas. Ou seja, a parede é tratada como osciladores
que só podem oscilar múltiplos inteiros de sua freqüência natural. Mas a
própria radiação não é quantizada. Esta hipótese resolvia o problema
da catástrofe do ultravioleta.
2. Hipótese de Einstein: Além da radiação é emitida em múltiplos inteiros
da freqüência natural e está localizada no espaço na forma de pacotes de
energia (fótons). Isso explica o efeito fotoelétrico. Nesta descrição a radiação se comporta como inda enquanto se propaga (com todos os fenômenos
ondulatórios de interferência) e como uma partícula quando é detectada.
Temos a dualidade onda-partícula para a radiação eletromagnética.
3. Hipótese de De Broglie: não apenas a luz (partículas sem massa) apresenta
uma dualidade onda-partícula, mas todas as entidades da natureza. Ou
seja,qualquer quantidade que possua um momento p terá a ele
associado uma onda. Esta hipótese foi comprovada pelo espalhamento
de elétrons pelas camadas subseqüentes de um cristal.
1.1
Ondas e partículas
O que signi…ca a dualidade onda-partícula?
Vamos primeiro analisar a diferença nos conceitos clássicos de ondas e partículas.
Imagine a superfície de um aquário cuja metade está separada por uma
parede com duas fendas. Na parte do aquário antes da parede batemos (de
3
Figure 1: Figura 2 - Retirada de The Feynman Lectures on Physics.
forma bem regular) na superfície da água com uma régua. Isso gerará ondas
planas, com uma certa freqüência (igual ao ritmo da régua), que chegarão até a
parede com os furos. Do outro lado desta parede temos um detector que pode
medir a intensidade da onda que chega, ou seja, ele mede a amplitude (claro que
a amplitude vai variar com o tempo, mas registramos apenas o máximo) que a
água sobe e desce (o que equivale à energia da onda). Estamos interessados, na
verdade, na razão entre a amplitude que sai dos dois furos e a amplitude
que chega até o detector. Imagine também que não há re‡exão nas
paredes do nosso aquário.
Primeiro nós tampamos um dos furos (o 2), movemos o nosso detector em
toda a coordenada x e vemos o que ele registra. Como a onda é circular, para
manter a energia constante, a amplitude deve cair com o raio. Assim, o detector
registrará uma maior intensidade quanto mais próximo ele estiver do furo 1. Um
grá…co desta intensidade teria a forma I1 (x) da …gura 2-b. Se repetirmos agora
o experimento com apenas a fenda 2 aberta, o detector irá registrar a intensidade
I2 mostrada na …gura 2-b.
O que ocorre então quando os dois furos estão abertos? Neste caso a distribuição da intensidade não é tão simples. Como as duas ondas circulares
são produzidas em pontos diferentes haverá certos pontos onde a crista
de uma onda encontrará a crista da outra, se intensi…cando, e outros onde a
crista de uma encontrará o vale da outra, se anulando. Mais especi…camente,
qualquer ponto cuja diferença da distância entre os furos seja um múlti4
plo inteiro do comprimento de onda a combinação, ou a interferência,
será máxima. Para pontos onde esta diferença tenha um valor semi-inteiro
do comprimento de onda esta interferência será completamente destrutiva.
Com isso, a intensidade registrada pelo detector será como a I12 (x) mostrada
na …gura 2-c.
Vamos dar ao processo acima uma descrição mais precisa. Ao tamparmos
o furo 2 e colocarmos o detector num certo ponto x a amplitude da onda varia
com o tempo como a parte real da quantidade
A1 = h1 exp (i!t) ; h1 2 C :
A quantidade h1 é complexa para levar em conta todas as diferentes fases da
oscilação em diferentes pontos do espaço. Toda a dependência na posição
está nesta fase h1 = h1 (x), ou seja, em pontos diferentes a onda oscila com
a mesma freqüência, mas com fase diferente. Pontos a mesma distância do
furo estão em fase. Em especial, para diferentes valores de x a onda terá fase
diferente, pois a onda é circular e estes pontos estão em raios diferentes
h1 = jh1 j exp (i 1 ) ;
1
=
1
(x) :
Nesta descrição, a intensidade da onda registrada pelo detector quando o furo
2 está tampado é proporcional (não é igual, porque estamos dividindo pela
intensidade total dos furos, h1 = h1 (r)) a
2
2
I1 / jA1 j = jh1 j :
O mesmo valendo para o experimento com o furo 1 tampado
A2 = h2 exp (i!t) ; h2 2 C ;
2
2
I2 / jA2 j = jh2 j :
Quando os dois furos estão abertos a intensidade, no mesmo ponto x acima,
será proporcional a
2
2
2
I12 / jA1 + A2 j = jh1 exp (i!t) + h2 exp (i!t)j = j(h1 + h2 )j
2
2
/ jh1 j + jh2 j + 2 jh1 j jh2 j cos
= (x) = 1 (x)
2 (x)
Ou seja, toda a oscilação da amplitude I12 esta na fase das quantidades complexas h1 e h2 .
Se chamarmos de A a intensidade total que sai dos dois furos, podemos
escrever:
1
2
2
jh1 j + jh2 j + 2 jh1 j jh2 j cos
:
I12 (x) =
A
Remark 1 É importante deixar claro que, nesta descrição, a onda que sai de
um furo interfere com a onda que sai do outro furo. Ou seja, quando falamos
em interferência queremos dizer sempre a interferência entre, no mínimo, duas
coisas.
5
Figure 2: Figura 3 - Retirada de The Feynman Lectures on Physics.
O que acontece agora se …zermos um experimento semelhante ao anterior,
mas com partículas e não ondas. Imagine uma metralhadora montada num
cavalete não muito bem …xado. Na frente desta metralhadora temos uma parede
com dois furos e, depois desta parede um dispositivo capaz de coletar as balas
que passam pelo furo. Este dispositivo pode ser colocado em qualquer ponto ao
longo da parede numa posição que marcamos com a coordenada x.
O experimento é realizado colocando o detector em uma posição x, ligando a
metralhadora, em seguida desligamos a metralhadora (isso é importante), pegamos o detector e contamos o número de balas no seu interior. Esta quantidade,
dividida pelo número de balas que passou pelos furos, pode ser interpretado
como a intensidade I de balas em x.
Realizamos primeiro o experimento com a fenda 2 fechada. Como os buracos
são da ordem de grandeza das balas estes as espalharão em todas as direções e
podemos esperar que estas se acumulem preferencialmente na frente do buraco
1 (ou em algum outro ponto em torno deste, devido a geometria do furo). Isso
nos daria uma intensidade registrada na forma I1 da …gura.
Se agora repetimos o experimento com a fenda 1 tampada, esperamos obter
uma intensidade I2 como a da …gura.
Problem 2 O que acontece agora se ambas as fendas estão abertas?
Neste caso, devemos esperar que as balas se espalhem como a soma destas
intensidade
I12 (x) = I1 (x) + I2 (x) :
O que nos dá o valor de I12 mostrado na …gura. Ou seja,
6
Remark 3 para partículas não observamos os efeitos de interferência apresentado pelas ondas.
Temos agora uma questão no mínimo curiosa:
1. É sabido desde tempos remotos que a luz apresenta o fenômeno de interferência. Quando a luz passa por um experimento de duas fendas observamos
as …guras de interferência descritas na experiência do aquário.
2. A teoria de Einstein dos fótons, bem como os dados experimentais do
espalhamento Compton e do efeito fotoelétrico, nos mostram que a radiação é composta por quantidades bem localizadas no espaço, ou seja, se
comporta como partículas.
Mas, como deve ter …cado claro, ondas e partículas são coisas diferentes e
devem se comportar de forma diferente.
Este comportamento bizarro da luz de, para certos experimentos, se comportar como onda e, para outros, se comportar como partícula, foi chamado
de dualidade onda-partícula. Como veremos, este estranho efeito é a chave da
mecânica quântica.
1.2
Ondas de Partículas
O problema descrito na seção anterior toma uma proporção ainda maior com
a hipótese de de Broglie (apresentada em sua tese de doutorado em 1924).
Segundo está o comportamento onda-partícula (ou a dualidade onda-partícula)
não seria peculiar a luz, mas a todas as quantidades presentes na natureza.
De acordo com a hipótese de Einstein temos que a luz é composta de fótons
com energia
E
E = h =) =
h
Ou, em termos do comprimento de onda,
=
c
)E=h
c
)
=
hc
:
E
Se o fóton viaja a velocidade da luz (hipótese de Einstein) este não deve ter
massa, mas, por ter energia, ele possui um momento
E2
2
(cp) = 0 =) E = cp :
Substituindo na expressão para o comprimento de onda e uma frequência
=
h
hc
= ;
E
p
=
E
:
h
A hipótese de de Broglie foi estender este resultado, valido para o fóton, e
a…rmar: qualquer quantidade que possua um momento p terá a ele
associado uma onda cujo comprimento vale
=
7
h
:
p
Problem 4 O que signi…ca exatamente “ter associado uma onda”?
Na época de de Broglie isso signi…ca apenas que todas as entidades com
um momento p apresentariam um comportamento ondulatório, de interferência
etc, correspondente a uma onda de comprimento . Falaremos mais sobre isso
depois, mas agora vamos ver uma conseqüência deste fato.
Se a hipótese de de Broglie é verdadeira, um elétron em movimento deve
se comportar como uma onda com o comprimento de ondas acima. Assim, se
realizarmos um experimento de dupla fenda (ou experimento de Young1 ) com
elétron, devemos observar uma …gura de interferência. Este experimento foi
feito e esta …gura foi observada!
O experimento original realizado envolve o espalhamento de elétrons pelas
diferentes camadas de um cristal, mas experiências mais modernas são bem mais
próximas a do experimento de Young.
Para descrever este experimento você deve imaginar algo como a nossa experiência com a metralhadora. Ou seja, existe um dispositivo que emite elétrons
(e.g., um …o aquecido), estes elétrons são atirados com uma certa velocidade contra uma chapa com furos (e.g., através de um campo elétrico) e, ao passarem
pelo furo, são coletados por algum detector. Temos então uma intensidade I de
elétrons no detector. Se os elétrons se comportarem como partículas, devemos
esperar a intensidade
I12 = I1 + I2 ;
(1)
igual a da metralhadora. Já se eles se comportarem como ondas, devemos
esperar uma intensidade
2
I12 / jA1 + A2 j ;
(2)
igual a das ondas no aquário. O fato é que, se o diâmetro e a distância
entre os furos for da ordem de grandeza do comprimento de onda
dos elétrons emitidos, realmente uma …gura de interferência (2) é
observada!
Temos aqui algo muitíssimo mais curioso:
No experimento das ondas no aquário, temos que a onda plana inicial, ao
passar pelos furos, cria duas outras ondas e estas se interferem. Ou seja, é
a interferência de uma onda com a outra. Entretanto, em experimentos com
elétrons é possível obter uma intensidade muito pequena do feixe. De sorte
que é possível garantir que apenas um elétron seja emitido, por exemplo, num
intervalo de alguns segundos.
Neste caso, apenas um elétron passa pelos furos de cada vez. Estes elétrons
se acumulam na parede com o detector formando uma …gura de interferência.
Problem 5 Se o elétron bateu na parede antes do próximo ser lançado, com o
que ele interferiu para temos uma …gura de interferência?
1 Thomas
Young, 1800.
8
Mais ainda, é possível colocar detectores para saber por qual fenda o elétron
passou. Ao colocarmos estes detectores, podemos garantir que o elétron passou
apenas por uma das fendas (i.e., diferente das ondas, não detectamos uma parte
dos elétrons em cada fenda). Mas, sempre que colocamos estes detectores (e
podemos com isso garantir que o elétron é uma partícula) a …gura de interferência desaparece e passamos a observar uma intensidade (1) igual a das balas
da metralhadora.
Por que o elétron muda o seu comportamento dependendo da nossa observação?
Discussões deste tipo estarão presentes em todo o nosso curso.
Uma vez que a hipótese acima uni…ca o comportamento de todas as entidades
na natureza, podemos agora descrever de forma, num certo sentido, equivalente
o nosso experimento com ondas e com balas, i.e., partículas. Ou seja, tanto
as ondas como as partículas possuem uma onda associada que descreve o seu
comportamento. Mas como descrever então as duas …guras de intensidade diferente? Imagine então um emissor (uma metralhadora) que atira partículas (e.g.,
elétrons) ou fótons com comprimento de onda e freqüência
=
h
;
p
=
E
h
Ambos são agora descritos por como uma onda que vamos supor na forma
A = h exp (i!t) ; h 2 C
lembrando que a fase de h, que depende de é diferente em cada ponto do
espaço, = (x). Quando esta onda atinge os dois furos temos o comportamento
peculiar às ondas de gerarem duas novas ondas em cada furo (como descrito no
caso das ondas no aquário)
A1 = h1 exp (i!t) ; h1 2 C
A2 = h2 exp (i!t) ; h2 2 C
onde, por terem a sua fonte em pontos distintos, cada hi possui uma fase i
diferente. Onde chamamos de hi a amplitude da onda i. Separamos a nossa
onda desta forma porque estamos interessados no seu comportamento num determinado ponto x. Isto é um comportamento ondulatório, i.e., ao assumirmos
que uma quantidade se comporta como uma onda, estamos dizendo que este
comportamento existe. Entretanto você não deve pensar que o elétron
se dividiu em dois, cada um representando uma das ondas do furo,
nem que ele passou pelos dois furos. A interpretação do que signi…ca esta
divisão da onda em duas é um problema central em mecânica quântica. Como
veremos, a interpretação deste efeito é o que separa a chamada antiga da nova
mecânica quântica. Mas voltemos para as nossas ondas.
(Soma das intensidades)
A intensidade de cada onda no ponto x, quando um dos furos está tampado, é proporcional a
2
Ii / jhi j
9
(lembre que Ii tinha a mesma forma para ondas e balas). Agora, supondo
que, ao …m da experiência, você observou uma …gura de interferência, i.e., você
observou I12 da …gura 2, isso signi…ca que a intensidade …nal é proporcional à
2
I12 / jh1 + h2 j
(3)
Suponha agora que, por alguma razão, você não observou uma …gura de interferência, i.e., você observou uma intensidade I12 como a da …gura 3, isso signi…ca
que esta intensidade é proporcional a soma das intensidades:
2
2
I12 / jh1 j + jh2 j
Assim, a mesma descrição permite obter os dois tipos de comportamento. Ou seja:
1. quando as entidades se comportam como ondas a intensidade …nal é o
módulo quadrado da soma das amplitudes (quantidades complexas),
2. mas quando se comporta como partículas, a intensidade …nal é a
soma dos módulos quadrados das intensidades.
A razão da nossa entidade se comportar de uma ou outra forma está relacionado com uma série de características do experimento, e.g., o diâmetro e a
separação dos furos em relação ao comprimento de onda. Além das possíveis
interferências que possamos causar no sistema (ou outros mistérios que surgirão
com a interpretação da nova MQ). Os detalhes de quando devemos esperar um
ou outro comportamento serão discutidos nas seções seguintes.
1.2.1
Espalhamento de um único elétron
Primeiro vamos tentar entender porque é razoável supor que o elétron, ou o
fóton, é uma partícula. Ou seja, que o comportamento ondulatório apresentado
pelo elétron não se refere a uma onda no sentido físico (algo que carrega alguma
forma de energia). Em primeiro lugar temos o fato descrito que ao colocarmos
detectores no experimento de duas fendas sempre detectamos a entidade em
apenas uma das fendas e não detectamos absolutamente nada (nenhuma forma
de energia) na outra fenda.
Vamos agora preparar um experimento de duas fendas com um único elétron.
Neste experimento preparamos a fonte para emitir um único elétron, o fazemos
passar através de um anteparo com duas fendas e o detectamos no …nal. Bem,
por ser apenas um elétron não esperamos ter nenhuma …gura de interferência. Imagine ago que preparamos várias cópias deste experimento, exatamente
iguais, e os enviamos para cientistas nas mais diferentes partes do mundo, ou
do universo. Cada cientista, ao receber o experimento, ira acioná-lo e registrar
o ponto onde a partícula caiu. Em seguida ele pegará este dado e nos envia de
volta o resultado da medida.
Depois de algum tempo, tendo recebido os dados de todos os experimentos,
nós os plotarmos em um único grá…co. O que obtemos com isso: uma …gura de
interferência!
10
Remark 6 Observe que não importa quando cada cientista realize o experimento, tudo que importa é que todos sejam iguais.
Imagine agora que cada cientista colocou um detector para saber, por qual
fenda o elétron passou. Neste caso, como seria de se esperar, não teremos
nenhuma …gura de interferência. Ou seja, a medida interferiu no sistema e
destruiu a …gura de interferência.
Imagine agora que todos …zeram o experimento sem trapacear (sem tentar
detectar o elétron). Mas uma parte deles (digamos uns 60%) não nos enviou os
dados. O que acontece com a …gura neste caso? Neste caso teremos uma menor
intensidade no número de elétrons detectado em cada ponto, mas, mesmo assim,
continuaríamos observando a …gura de interferência. Podemos ainda imaginar
que, depois de digitados os dados no computador, um problema no HD nos fez
perder 60% dos dados. Plotando os dados que não se perderam ainda temos a
nossa …gura.
Remark 7 Ou seja, podemos jogar fora uma boa parte dos nossos dados sem
comprometer em nada a …gura.
Imagine agora o seguinte variante. Cada cientista escolheu aleatoriamente
uma das fendas e colocou um detector apenas em uma fenda. Ao realizar o
experimento este cientista pode ter ou não detectado algo. Entretanto, mesmo
que ele não tenha detectado absolutamente nada ele sabe por que
fenda o elétron passou. Ou seja, se ele não detectou o elétron na fenda onde
colocou o detector, é porque ele passou pela outra fenda. Feito isso, apenas os
cientistas que não detectaram nada nos enviam os seus dados. Assim,
nós recebemos apenas os dados dos cientistas que não in‡uenciaram
na trajetória do elétron. Ou seja, neste caso não podemos dizer que o
elétron foi espalhado por nada emitido pelo nosso detector. De nenhuma forma
interagimos com o elétron, mas sabemos exatamente por qual fenda cada elétron
passou. Desta forma, novamente perderemos uma parte dos dados (digamos
60%). Mas o que ocorre agora se plotarmos os dados? A …gura de interferência
foi destruída!
Resumindo, nós sabemos que o elétron é uma partícula, porque quando
o detector não detectou o elétron ele também não detectou nada (não detectou
a presença de nenhuma onda) e não interagimos com esta partícula. E
mesmo assim destruímos a …gura de interferência.
1.3
Pacotes de ondas
Uma onda, e.g., na direção x e de comprimento está espalhada por toda a
direção x. Mas uma partícula, e.g., um elétron, ocupa uma região …nita do
espaço. Como então compatibilizar o comportamento ondulatório com o de
uma partícula?
A idéia aqui, que vai sofrer algumas modi…cações no futuro, é que é possível
se atenuar a intensidade de uma onda através da superposição de outras ondas.
Por exemplo, considere duas ondas de mesma amplitude, uma de número de
11
Figure 3: Figura 4
onda k e outra com número de onda k + k, com freqüência, respectivamente
e +
. A sobreposição destas ondas nos dará
= sin (kx !t) ; 2 = sin ((k + k) x (! + !) t) ;
= 1 + 2 = sin (kx + !t) + sin ((k + k) x + (! + !) t) ;
1
usando ago
sin A + sin B = 2 cos
1
(A
2
B) sin
1
(A + B)
2
temos
(x; t) = 2 cos
1
( !t
2
kx) sin (kx
!t) +
1
( kx
2
!t)
;
considerando
kx
!t >>
kx
!t ;
podemos escrever
(x; t) = 2 cos
1
( !t
2
kx) sin (kx
!t)
ou seja, para um tempo …xo, e.g., t = 0, temos
(x; 0) = 2 cos
1
( kx) sin (kx)
2
como
k << k
a nossa onda oscila com número de onda k maior (igual a da onda original),
mas toda ela tem uma amplitude modulada por k.
Desta forma, podemos atenuar a onda em alguns pontos do espaço. Se
continuarmos este processo somando uma in…nidade de ondas, podemos obter
um pacote de ondas concentrado em apenas uma região do espaço. Este processo
é o mesmo de tomar a decomposição em série de Fourier da onda acima.
Remark 8 Podemos obter uma onda localizada numa certa região do espaço
através de um pacote de ondas.
12
Figure 4: Figura 5
1.3.1
Velocidade de grupo
Uma onda se move com velocidade V = =k. Entretanto, quando trabalhamos
com a combinação de um grupo de ondas formando um pacote, temos também
a velocidade de movimento do pacote como um todo. Lembre-se que cada
onda tem uma velocidade e a velocidade do pacote não é igual a velocidade
de nenhuma destas ondas individualmente. Além disso, não estamos supondo
que o pacote mantém a sua forma com o tempo. Ou seja, como as ondas têm
velocidades diferentes o pacote pode se deformar (se espalhar, ou se contrais)
com um tempo, mas continua sendo um pacote e estamos falando da velocidade
do movimento deste pacote. Esta velocidade é chamada de velocidade de grupo
g e está relacionada com a velocidade da envoltória que modula nosso pacote.
Voltando ao nosso exemplo anterior de duas ondas temos
(x; t) = 2 cos
1
( !t
2
kx) sin (kx
!t) +
1
( kx
2
!t)
:
Se seguirmos a velocidade da primeira crista, ou do primeiro nó, temos que neste
ponto o cosseno tem seu valor máximo (igual a um), ou seja,
1
( !t
2
kx) = 0 =)
usando
k=
2
x
=
t
; !=2
!
d
=2
=g
k
dk
;
temos que a primeira, parte do produto (que é a envoltória da nossa onda)
possui uma velocidade
d
g=2
;
dk
13
usando a hipótese de De Broglie
2
=
k
=
temos
h
;
p
=
E
:
h
dE
d
=
dk
dp
g=2
Usando agora a relação relativística
E2
2
(pc) = mc2
2
) 2E dE = c2 2p dp
temos
p
:
E
Usando as expressões da energia e do momento relativístico
g = c2
mc2
; p = pi = m
E = c:p0 = q
u2
1 c2
i
m
=q
1
u2
c2
ui
onde u é a velocidade da partícula de massa m, temos
g=u
ou seja, a velocidade de grupo é igual a velocidade u da partícula.
Exercise 9 Repita o cálculo acima para o caso de fótons (m = 0) e mostre que
g = c.
Assim, uma quantidade localizada no espaço (uma partícula) pode ser vista
como um pacote de ondas se movendo com a velocidade de grupo (mas esta
interpretação será alterada no futuro).
Mas se a nossa “partícula” é formada por uma in…nidade de ondas com
freqüências e comprimentos de número de onda diferentes e sabemos que
p=
h
=
h
k ; E=h :
2
Problem 10 Qual é a…nal o momento e a energia da nossa onda (ou
da partícula associada)?
Esta é mais uma das questões centrais da mecânica quântica.
14
1.4
Incertezas
Voltando então ao problema dos nossos pacotes de onda, resta-nos entender
como as várias freqüências e comprimentos de onda presentes no pacote se relacionam com o momento e a energia da partícula. Um resultado muito conhecido
em problemas envolvendo pacotes de onda é que o pacote não possui um
comprimento de onda de…nido, mas sim todo um range de comprimentos
que varia de a +
(ou k a k + k). Da mesma forma, usando a relação
de de Broglie
h
h
k;
p= =
2
podemos a…rmar que a partícula associada ao pacote não possui um momento
determinado, mas que seu momento está dentro do range entre
p e p+
p
Entretanto, sempre que a partícula interage com algo transferindo
momento, e.g., num problema de espalhamento, esta transfere um momento
bem de…nido. O que indica que, dos valores no range acima, apenas um
determinado valor se manifesta quando observamos a interação do
pacote em algum experimento.
Na velha mecânica quântica este fenômeno foi explicado como se, quando
observado, a entidade perdesse seu comportamento ondulatório e agisse como
uma partícula de posição e momento bem de…nidos. Observe que o mesmo
acontece no problema de espalhamento de duas fendas, mesmo quando temos a
formação da …gura de interferência. Cada elétron, ou fóton, é detectado numa
posição especí…ca, com momento e energia bem determinados. Mesmo que,
ao passar pelas fendas, estes apresentem um comportamento puramente ondulatório (permitindo a interferência entre duas ondas).Assim, mais uma vez, na
interpretação da velha mecânica quântica, as entidades, quando não observadas, se comportam como ondas (espalhadas numa certa região do espaço
e com momento dentro de um range), mas, quando observadas, toda esta
região se concentra numa área compatível com as dimensões das partículas associadas, ou ainda, no caso de elétrons e fótons, toda a região da onda se
contrai, ou colapsa, num único ponto e todo o seu range de momento
colapsa num único valor. Este fenômeno foi chamado de colapso da função
de onda.
Assim, a todo pacote de onda temos associada um range de valores do momento que, ao ser observada a partícula, nos dará um valor especí…co (mas um
valor qualquer dentro deste range). Dizemos então que a partícula associada a
onda possui um (único) momento, mas este valor possui uma incerteza dentro
do range
p e p+ p
Ou ainda, quando uma partícula é descrita por um pacote de ondas, o momento
associado ao seu comportamento corpuscular possui uma incerteza dentro dos
valores acima.
15
O mesmo ocorre com a manifestação da posição do comportamento corpuscular da entidade. Um pacote de onda, como o da …gura 5, se estende por uma
região do espaço geralmente muito maior que as dimensões da partícula a ele
associada. Dizemos então que, quando este pacote colapsar, o caráter corpuscular da partícula poderá se manifestar em toda a região x. Ou ainda, a posição
da partícula possui uma incerteza x.
Assim, a toda a entidade está associada um pacote de onda, que, ao ser observado, irá colapsar numa partícula. Antes deste colapso, a partícula associada
ao pacote possui uma incerteza x em sua posição e p em seu momento.
Se usarmos o exemplo simples do nosso pacote de duas ondas senoidais
1
( !t
2
(x; t) = 2 cos
kx) sin (kx
!t) +
1
( kx
2
!t)
;
podemos estimar a espessura de um dos pacotes como a distância entre os pontos
x1 e x2 tais que
x1 =
x2 =
k
2
k
1
2
1
= 2 cos
2
; 0 = 2 cos
k
;0
k
sin (kx) = 0
k
2
k
sin (kx) = 0
com o que temos
x = x2
x1 =
k
=)
x k=
:
Este resultado pode ser generalizado para um conjunto de in…nitas ondas formando um pacote verdadeiramente concentrado. Utilizando resultados obtidos com as desigualdades das transformadas de Fourie (uma conseqüência do
chamado teorema de Plancherel ) é possível obter a desigualdade
x k
1
2
Não vamos nos preocupar aqui com este desenvolvimento matemático, pois no
futuro obteremos o mesmo resultado através de argumentos mais simples e, num
certo sentido, mais gerais.
Usando agora a relação de de Broglie
p=
h
k =)
2
temos
k=
2
h
p
1 h
~
h
=) x p
; ~=
22
2
2
com ~ (agá-barra) uma constante introduzida por Dirac. Este resultado representa um caso particular de um desenvolvimento (devido a Dirac) que veremos
no futuro e é conhecido como relação de incerteza de Heisenberg.
x p
16
Em especial, observe que se não há incerteza no número de onda, nossa
partícula é descrita apenas por uma única onda que, conseqüentemente, estará
espalhada em todo o espaço. Ou seja, uma partícula de momento bem de…nido
tem a incerteza na posição in…nita.
Relações semelhantes podem ser derivadas quanto estudamos o range de
freqüências do pacote. Neste caso temos uma relação entre o tempo e a energia
do sistema:
~
E t
2
Exercise 11 Usando
t !
1
2
obtenha a relação acima.
Esta relação é um pouco mais difícil de ser interpretada e, por isso, voltaremos a ela apenas quando estudarmos alguns exemplos concretos. Uma analogia
(talvez) útil seria a a…nação de um instrumento musical. A soma de duas freqüências próximas produz o efeito de batimento, ou seja, se duas freqüências
muito próximas são tocadas juntas ouvimos uma variação na intensidade do
som. Quanto mais as freqüências se aproximam maior o intervalo entre os picos
desta variação. Isso é usado para a…nar um instrumento com uma freqüência
padrão. Quando o tempo é longo, o instrumento está a…nado. Entretanto, para
garantir que a freqüência seja exatamente a desejada, precisaríamos garantir que
o tempo do batimento é in…nito. Neste sentido, quanto maior a incerteza
na energia de um sistema, por exemplo entre dois níveis de energia,
maior será a instabilidade do sistema e, para garantirmos que o sistema
está num nível de energia bem de…nido, teríamos de veri…car que jamais haverá
transição entre os dois níveis.
A relação acima representa uma das maiores diferença entre a mecânica
quântica e toda a física anterior. Estes conceitos de incertezas em quantidades
físicas já eram utilizados em várias teorias anteriores, como, por exemplo, a
mecânica estatística. Mas, neste caso, a incapacidade de se observar com precisão as características do sistema estavam relacionadas com alguma limitação
prática. Por exemplo, em mecânica estatística o grande número de constituintes dos sistemas físicos torna impraticável a aplicação da mecânica clássica
como o desenvolvimento de cada ente. Assim, estas teorias trabalham com médias sujeitas a desvios. Entretanto, o caráter da incerteza da MQ é inerente a
própria teoria. Ou seja, não é possível se determinar com precisão absoluta a posição e o momento de qualquer entidade física. Conseqüentemente, não apenas estes valores, mas toda a evolução temporal da entidade
(que na mecânica é uma conseqüência da posição e momento) possuirá também
uma incerteza. Não sabemos o estado …nal de nenhum sistema, mas apenas
intervalos de valores onde ele pode se encontrar. Este comportamento pode
ter duas interpretações. Na primeira o sistema possui um valor bem de…nido
de posição e momento, mas não nos é permitido conhecer estes valores (como
se estes valores estivessem “escondidos” no sistema). Neste caso é como se a
17
partícula existisse, mas não fossemos capazes de olhar para ela. Na segunda,
estes valores realmente não existem bem de…nidos em nenhuma entidade física,
até o momento em que esta é observada. Neste caso, é como se a partícula
realmente não existisse enquanto não olhamos para ela.
A defesa dos pontos de vista acima (ou de algo parecido com eles) gerou
uma verdadeira ruptura entre os defensores e fundadores da MQ. Einstein, um
grande defensor do primeiro ponto de vista chegou a dizer coisas como “então
a lua não está lá quando eu não estou olhando pra ela”. Um ponto ainda
mais importante sobre estes dois pontos de vista é que, a primeira vista, eles
podem parecer apenas diferenças …losó…cas. Entretanto, em 1964, John Stewart
Bell apresentou meios quantitativos que permitiriam, através de experimentos,
veri…car qual destes pontos de vista correspondia com o comportamento da
natureza. Mas isso é uma outra história...
1.5
A verdade (pelo menos até agora)
Vamos primeiro fazer uma breve retrospectiva. Em 1901 Planck apresentou
seu trabalho solucionando o problema da radiação do corpo negro. Neste
trabalho surge a estranha idéia da energia dos osciladores (elétrons) poder assumir apenas valores separados por intervalos discretos. Como se, de alguma
forma, o movimento destes elétrons não tivesse uma forma contínua.
Esta mesma idéia está por trás do problema do calor especí…co, onde, como se
por conseqüência da quantização dos níveis de energia, os graus de liberdade não
fossem mais acessíveis para energias muito baixas. O movimento das coisas
não se apresentava de forma contínua em escalas muito baixas de energia. Em seguida, 1905, temos a explicação de Einstein do efeito fotoelétrico,
nesta explicação, a radiação (quantizada por Planck) emitida por cargas em
movimento, não apenas tinha uma quantidade discreta de energia, mas
também estava localizada numa região …nita do espaço. Esta interpretação deu a luz, que até então era tratada como uma onda, um caráter
corpuscular. Temos então o curioso efeito da dualidade onda-partícula da
luz. O espalhamento Compton, veri…cado em 1922, corroborou a hipótese de
Einstein.
As coisas se tornam ainda mais estranhas com a hipótese de de Broglie, em
1925, de que o comportamento dual onda-partícula, não era uma peculiaridade
da luz, mas sim de todas as entidades da natureza. Temos então a idéia das
“ondas de matéria”. Todas as coisas então possuem um comportamento ondulatório, mas, ao serem detectadas, comportam-se como partículas. A hipótese
de de Broglie foi comprovada em 1927 no experimento de Davisson-Germer
através do espalhamento de elétrons por cristais.
Um grande problema para esta nova teoria é a interpretação do que signi…ca …sicamente a função de onda associada às partículas. Por não transportar
nenhuma forma de energia, esta onda certamente não poderia ser reconhecida
como uma onda no sentido ordinário da física. Como veremos adiante, a teoria
evoluiu muito, no sentido de fazer várias previsões que foram con…rmadas experimentalmente e explicar uma série de dados até então inexplicáveis. Todos estes
18
resultados foram obtidos a partir do modelo atômico de Bohr (1913), e do
desenvolvimento de duas formulações independentes de como este novo conceito
de “ondas de matéria” deve ser aplicado. Estas formulações foram propostas
por Schrödinger, em 1926, e a outra por Heisenberg, em 1927. Mas todos
estes resultados e formulações não foram su…cientes para elucidar o mistério do
signi…cado físico da função de onda.
As relações de incerteza de Heisenberg, apresentadas em 1925, permitiram quanti…car quando deveríamos esperar um comportamento ondulatório
ou corpuscular das entidades físicas. Se a incerteza na posição x é pequena, a
entidade estará localizada no espaço e se comportará como um corpúsculo. Já
quando a incerteza no momento p é pequena, a entidade não estará localizada
no espaço e se comportará como uma onda. Entretanto, estas relações não explicavam porque, por maior que fosse a incerteza na posição, a entidade
sempre era detectada numa região. Ou seja, qual o mecanismo do
colapso da função?
As idéias de Niels Bohr e Heisenberg sobre as incertezas inerentes nos processos de detecção das partículas (quando falamos partículas, estamos dizendo qualquer coisa) remetem naturalmente as idéias de medida de posição e velocidade
da mecânica estatística e, naturalmente, a idéia de probabilidades. Mas foi apenas em 1927 que Max Born apresentou o que é considerado hoje a correta
interpretação da função de onda. O postulado de Born a…rma que:
A intensidade da função de onda associada à partícula representa a probabilidade da partícula ser detectada naquela região do espaço.
Ou seja, se (x; y; z) é um pacote de onda associado a uma partícula (lembre
que a intensidade é proporcional ao módulo quadrado da função de onda) então
2
2
j (x; y; x)j dx dy dz = j j dV ;
é a probabilidade da partícula ser detectada no volume dV .
Dentro desta interpretação a função de onda associada à partícula perde
todo o seu caráter físico, no sentido de não estar relacionado com o transporte de nenhuma quantidade mensurável. Ou seja, não é possível se
medir, ou observar, diretamente a função de onda. Além disso, uma vez
que partículas podem ser observadas e preservam a sua “realidade física”, no
sentido usual de serem detectadas, esta interpretação privilegia a idéia de que
as entidades físicas em todos os processos são partículas.
Sendo as ondas a probabilidade de se encontrar a partícula em algum lugar (usaremos a partir daqui esta linguagem). Esta interpretação elimina o
problema do colapso da função de onda, mas, obviamente, temos ainda de
encontrar um “sentido físico” para os fenômenos de interferência causados por
esta função de onda. A…nal, como algo que não transporta nenhuma quantidade física (momento, energia etc) pode interferir no comportamento das quantidades físicas. Este problema está diretamente relacionado com a formulação
da MQ proposta por Feynman, em 1948. Voltaremos a este problema quando
tratarmos especi…camente da hipótese de Born, ou da chamada Interpretação
19
de Copenhague. Só é importante ter em mente que uma boa parte do desenvolvimento a seguir foi feito antes desta interpretação. Mas, mesmo que seus
criadores não tivessem esta interpretação em mente (ou mesmo não a aceitassem
posteriormente), tudo se torna bem mais fácil de entender se, desde já, seguirmos
as idéias de Born.
20
1.6
O átomo de Bohr
Por que os átomos (em especial o átomo de hidrogênio) emitem radiações apenas
em freqüências com intervalos bem de…nidos? E por que o elétron não colapsa
no núcleo átomico?
O problema acima foi resolvido por um modelo proposto por Bohr em 1913,
através dos seguintes postulados:
1. O átomo de hidrogênio existe apenas em níveis discretos de energia. Estes
níveis são caracterizados pelos seguintes valores discretos do momento
angular dos elétrons em órbitas circulares
2 p = nh ; n 2 N :
onde p é o momento angular do elétron. Quando o elétron possui um
destes valores de momento angular, ele está estável, i.e., não irradia.
2. Quando um átomo efetua uma transição do nível de energia En para um
Em ele irradia (se En > Em ) ou absorve (se En < Em ) um fóton de
energia:
h = jEn Em j :
Uma boa motivação para estes postulados foi apresentada por de Broglie em
1924??, usando a sua própria hipótese de ondas. O elétron pode ser descrito
por uma onda. Se ele está numa orbita onde a sua energia está bem de…nida
(pois sabemos exatamente a energia que ele emite ao sair desta órbita), então
a sua função de onda deve ser uma onda de freqüência bem de…nida e não um
pacote. Esta onda de comprimento bem de…nido está distribuída por
todo o percurso acessível ao elétron. Com isso, pela hipótese de uma órbita
circular de raio r, no perímetro da circunferência deve caber um número inteiro
do comprimento de onda
2 r=n
Usando a relação
=
h
;
p
temos
2 rp = nh ;
onde rp é o momento angular do elétron
p = rp
Com isso, sendo a força coulombiana uma força central (que preserva o momento
angular), podemos escrever
I
I
I
2 rp = pr d = prd = p d = nh ;
21
Figure 5: Órbita de Bohr e a onda de de Broglie para n = 4. Figura retirada
do Libo¤.
que é a primeira hipótese de Borh. Ou seja, esta hipótese esta relacionada
com o argumento que a onda que descreve o elétron tem comprimento
de onda bem de…nido e este comprimento deve ser condizente com o
tamanho da órbita.
A segunda hipótese de Bohr está diretamente relacionada com as hipóteses
de Einstein e Planck de que a radiação eletromagnética é emitida em pacotes
com energia h .
Vejamos agora quê resultados podemos obter do modelo de Bohr. Primeiramente, o colapso do átomo é eliminado por um postulado.
Como a órbita é estável, a força centrípeta (estamos usando o sistema de
unidades Gaussiano)
v2
p2
mac = m =
;
r
mr3
deve contrabalançar a atração da força coulombiana (para o núcleo tendo a
mesma carga do elétron)
e2
p2
p2
=
=)
r
=
:
r2
mr3
e2 m
Usando a primeira hipótese de Bohr
I
p d = nh =) 2 p = nh =) p = n~
temos
rn =
~2
n2 ~ 2
= n2 a0 ; a0 =
2
e m
me2
22
(4)
Onde a0 ( 0,53 Å) é chamado raio de Bohr e corresponde ao primeiro raio
permitido do modelo. A energia do elétron numa dada órbita é a soma de sua
energia cinética e potencial:
E=
1
mv 2
2
e2
p2
=
r
2mr2
e2
r
usando (4)
e2
p2
p2
p2
=) E =
=
=
2
2
r
mr
2mr
mr2
Usando agora o valor de rn e a hipótese de Bohr
p2
2mr2
2
En =
=
~2 1
n2 ~ 2
1
=
2
2m n a0
2ma20 n2
R1
~2
;
R
=
1
n2
2ma20
o valor negativo apenas indica que a força é de ligação. Ou seja, o elétron tem
energia zero no in…nito e, quanto mais perto do núcleo, mais ligado (i.e., mais
estável) e menor a sua energia. O rótulo n, que caracteriza o nível de energia,
é chamado de número quântico principal.
O resultado acima nos permite calcular a energia de transição entre dois
níveis de energia
h
n!m
= Em
En =
R1
1
m2
1
n2
= En!m :
Tudo que precisamos agora é comprara este resultado com o experimental, i.e.,
com a séries de Balmer e Lyman. Primeiro vamos esquecer a constante e escrever:
1
1
En!m /
2
n
m2
com n = 1 para a série de Lyman (??) e n = 2 para a série de Balmer (??). Em
outras palavras, se o modelo de Bohr está correto, a série de Lyman representa
transições dos níveis excitados para o nível de menor energia (nível fundamental), enquanto a série de Balmer representa as transições dos níveis mais excitados para o primeiro nível excitado. Isso é fácil de entender. Como as medidas
de Balmer se referem a espectro estelar, ou outros corpos em alta temperatura,
o menor nível que o átomo de hidrogênio pode atingir neste ambiente (por estar
em equilíbrio térmico) é o primeiro estado excitado. Caso ele tente ir para o
estado fundamental, o próprio meio fornecerá energia para que ele se excite.
Já os resultados de Lyman se referem a gases a temperatura ambiente, onde o
nível do primeiro estado excitado (como veremos) é muito maior que a energia
térmica do meio, de sorte que os átomos podem perfeitamente se encontrar no
estado fundamental.
O grande sucesso do modelo de Bohr para explicar e prever o comportamento
atômico foi um grande triunfo para a MQ. Uma vez que este modelo estava
23
Figure 6: Figura retirada do Eisberg.
em completo acordo com as hipóteses de Einstein e de Broglie e com dados
experimentais.
Entretanto, como veremos, o modelo de Bohr é muito simpli…cado e não pode
dar conta de todos os fenômenos observados no espectro do átomo de hidrogênio.
Naquela época, medidas mais precisas das linhas espectrais mostravam que os
níveis de energia En eram, na verdade, vários níveis muito próximos, i.e., são
observadas radiações com freqüências muito próximas. Esta é a chamada estrutura …na do átomo de hidrogênio. Voltaremos a este problema, juntamente com
outras características não contempladas pelo modelo de Bohr, no futuro.
24
1.7
Quantização de Sommerfeld
A teoria quântica estava sendo criada, então a idéia (que não é muito diferente
da de hoje) seria procurar as características peculiares desta teoria para um
caso especí…ca e generalizar para todos os casos. Como fez de Broglie com a
dualidade onda-partícula do fóton.
A solução de Planck para o corpo negro corresponde a uma quantização
nos níveis de energia (ou das amplitudes de oscilações) do oscilador harmônico.
Enquanto a quantização de Bohr do átomo de hidrogênio corresponde a uma
quantização do momento angular (ou das órbitas) do elétron no átomo. Existe
alguma relação entre estes dois processos?
Perceba que para obter os níveis de energia e os raios das órbitas de Bohr,
partimos do modelo clássico, cuja energia é dada por
E=
1
mv 2
2
e2
p2
=
r
2mr2
e2
:
r
E impusemos que estes níveis são discretizados segundo a regra:
p = n~ :
O mesmo equivale (teoria de Planck) a partir da expressão clássica para o oscilador harmônico e impor uma regra de quantização nas amplitudes.
Todos estes dois modelos partem de uma teoria clássica conhecida e "quantizam" o problema clássico através de uma certa regra de quantização sobre
alguma quantidade física mensurável.
Remark 12 Existiria uma forma de sistematizar esta regra de quantização das
quantidades físicas, de sorte que pudéssemos obter as versões quânticas de outros
sistemas classicamente conhecidos.
A um procedimento deste tipo damos o nome de regra de quantização, ou
simplesmente, quantização.
Remark 13 Quantização é o problema central da física teórica atual.
Em primeiro lugar, na mecânica clássica qual quantidade precisa ser conhecida para descrevermos completamente o comportamento de um sistema (i.e.,
a sua evolução temporal)?
Na formulação de Hamilton da mecânica toda a evolução de um sistema clássico pode ser determinado conhecendo-se a chamada hamiltoniana do sistema,
H (q; p; t). A hamiltoniana é uma função dos momentos p e das coordenadas
q generalizadas do sistema e, no geral, do tempo. Neste formalismo a evolução
do sistema é dada pelas equações de Hamilton
p_i =
@H
@H
; q_i =
@qi
@pi
Para sistemas conservativos, nos quais H (q; p) não depende do tempo, a
hamiltoniana pode ser identi…cada com a energia do sistema.
25
Uma grande vantagem no uso das equações de Hamilton e das coordenadas
generalizadas é que as equações para cada coordenada têm a mesma forma independente do sistema de coordenada escolhido. Isso não acontece, por exemplo,
na equação de Newton. Para coordenadas cartesianas, as equações do movimento são:
dxi
Fi = m
=) Fx = m•
x ; Fy = m•
y
dt
Já se usarmos coordenadas polares
x1 = r cos ; x2 = r sin ;
^ = y^ cos
x
^ sin ;
r^ = x cos + y^ sin ;
as equações passam a ter a forma
Fr = m•
r + mr _2 ; F = mr • + 2mr_ _ :
Inclusive, uma forma simples de se obter as expressões acima é usando as
equações de Hamilton. Em coordenadas polares, a energia da partícula, num
potencial U , vale:
2
1
1
1
1
2
2
2
m (v ) + m (vr ) = m r _ + m (r)
_
2
2
2
2
Introduzindo o momento angular p e o momento radial pr
K=
p = rp = rmv = r2 m _
pr = mvr = mr_
podemos escrever
p2
p2r
+
2mr2
2m
assim, a energia total do sistema e, conseqüentemente, a hamiltoniana, tem a
forma
p2
p2r
H=
+
+ U (r; )
2mr2
2m
De onde temos as equações de Hamilton:
K=
@H
@U
@H
=
; p_r =
=
@
@
@r
_ = @H = p ; r_ = @H = pr
@p
mr2
@p2
m
p_ =
@U
@r
p2
mr3
Para obter, por exemplo, a equação para r, podemos derivar a última das
equações acima com relação ao tempo
r• =
p_r
m
26
E usar a equação para p_r :
@U
@r
m•
r = p_r =
p2
mr3
usando a expressão para o momento angular, p = r2 m _, temos
m•
r + rm _2 =
@U
= Fr :
@r
e o mesmo procedimento pode ser usado para obter F = @U=@ .
Vejamos como …ca a descrição do oscilador harmônico na mecânica de Hamilton. Para um oscilador harmônico
E=
1
p2
1
mv 2 + kx2 =) H (q; p) =
+ kx2
2
2
2m
Assim, as equações de Hamilton têm a forma
@H
= kx ;
@x
@H
p
x_ =
=
@p
m
p_ =
Derivando a segunda equação do relação ao tempo e usando a primeira temos
x
•=
p_
=) x
•=
m
kx
=) m•
x + kx = 0 ;
m
que é conhecida equação do oscilador harmônico.
Como toda a informação esta contida na hamiltoniana e esta depende apenas
das posições e momentos, podemos descrever a evolução do sistema através de
uma curva no plano p q, chamado espaço de fase.
Por exemplo, no caso do OH, para uma dada energia (i.e., um valor …xo de
H) temos
p2
1
E=
+ m! 2 x2
2m 2
ou seja, as trajetórias formam uma …gura fechada, neste caso, mais especi…camente, uma elipse. Isso acontece porque a coordenada x é periódica.
Assim, para qualquer coordenada periódica, a trajetória no espaço
de fase forma uma …gura fechada. Por ser fechada, esta …gura certamente
encerra uma área.
Classicamente esta área pode assumir qualquer valor, mas, se a energia só
puder assumir valores discretos, conseqüentemente esta área também só poderá
assumir valores discretos. Assim, ao quantizar os níveis de energia do OH,
automaticamente quantizamos as áreas das trajetórias do oscilador no espaço
de fase.
Esta idéia está diretamente relacionada com ás relações de incerteza pois,
enquanto classicamente os estados das partículas são pontos, quanticamente
devem ser áreas com valores
~
:
q p
2
27
Ou seja, a relação de incerteza implica que as órbitas de um oscilador, ou
de qualquer outra variável periódica, não pode ter uma área menor que
q p ~=2. Em especial:
Remark 14 O oscilador, cujo centro da órbita é conhecido, não pode parar e,
obrigatoriamente, tem uma energia mínima diferente de zero!
O mesmo vale para um elétron numa orbita circular em torno do próton.
Como a massa do próton é muito maior que a do elétron, seu comprimento
de onda (do próton), para uma mesma velocidade, é muito menor. Assim,
podemos localizar o próton (centro da orbita), numa região muito menor que
poderíamos localizar o elétron. Assim, imaginando que sabemos onde está o
próton, o elétron numa órbita circular de raio r deve respeitar
r = 2 r =)
r p
~
=) r p
2
p
~
:
4
Resumindo, as relações de incerteza implicam valores mínimos para
as áreas das coordenadas periódicas no espaço de fase. E a hipótese de
Planck implica ainda que estas áreas crescem apenas em quantidades
discretas.
28
A regra de quantização de Sommerfeld, ou a regra de quantização da velha
MQ, é uma generalização dos resultados acima. Esta regra impõe que:
Para qualquer coordenada periódica a órbita da trajetória no espaço
de fase só pode assumir valores múltiplos da constante de Planck
I
pi dqi = ni h :
H(q;p)=E
O fator inteiro de proporcionalidade ni recebe o nome de número quântico.
(Planck)
Vejamos como esta regra está relacionada com a hipótese de Planck.
O primeiro passo é identi…car a coordenada periódica.
Neste caso, obviamente estamos falando da posição (coordenada cartesiana)
do oscilador. Qualquer ponto a ser alcançado pelo oscilador será revisitado
periodicamente. Então, a nossa coordenada periódica é x e o momento a ela
conjugado é o momento linear p = mx.
_
Agora precisamos escrever a hamiltoniana, do sistema usando esta coordenada e momento. Como o sistema é conservativo, a hamiltoniana não depende
do tempo e é igual a energia total do oscilador
H (p; x) =
1
p2
+ m! 2 x2 = E
2m 2
Como a energia do sistema se conserva, para uma dada energia (amplitude de
oscilação), podemos escrever
s
1
p = 2m E
m! 2 x2
2
Com o que podemos calcular
I
I r
p
p dx = 2mE
1
m 2 2
! x dx
2E
fazendo (aqui está implícito que x é periódica)
r
r
1 2E
m
!x = sin =) dx =
cos d
2E
! m
e usando que para um período completo 2 [0; 2 ] temos
r
I
Z 2 p
1 2E p
2mE
1 sin2 cos d
p dx =
! m
0
Z
E 2
2
=2
cos d
! 0
29
usando
cos2 a =
1
(cos (2a) + 1)
2
temos
I
p dx =
E
!
=2
Z
2
cos (2 ) d +
0
Z
2
1d
0
E
E
=
:
!
Usando a regra e quantização de Sommerfeld
I
E
p dx =
= nh ) En = nh
obtermos a regra de quantização de Planck.
(Bohr)
Vejamos agora como esta regra está relacionada com os postulados de Bohr.
Assumindo o modelo de Bohr, temos que as órbitas são circulares em torno do
núcleo. Mais uma vez, precisamos identi…car a coordenada periódica. Neste
caso, obviamente estamos falando do ângulo que identi…ca a posição para um
certo raio R. Como a nossa variável de posição é um ângulo, o momento a
ela relacionado é um momento angular p = R2 me _. Neste caso, como a força
coulombiana é central e conserva momento angular, temos
I
Z 2
p d =p
d =2 p
0
Usando agora a regra de quantização de Sommerfeld temos:
I
p d = nh = 2 p =) p = n~
Que é o primeiro postulado de Bohr.
Assim, a aplicação direta da regra de quantização de Sommerfeld permite
obter (sistematicamente) os resultados de Planck e Bohr.
A grande vantagem do processo está no fato de podemos agora aplicar esta
regra para outros sistemas. Isto foi feito por Sommerfeld para tentar explicar
a estrutura …na do átomo de hidrogênio. O ponto de partida é que a restrição
de Bohr de que as órbitas devem ser circulares talvez seja forte demais. Vamos
então (seguindo Sommerfeld) relaxar esta restrição e admitir órbitas elípticas.
Neste caso, continuamos tendo a variável angular periódica, mas, agora, a
variável radial r também pode variar dentro de um valor mínimo a (raio menor
da elipse) até um valor máximo b (raio maior da elipse). A energia cinética total
do sistema agora é a soma da energia cinética de cada uma das variáveis:
K=
1
1
1
2
2
m (v ) + m (vr ) = m r _
2
2
2
30
2
1
2
+ m (r)
_ :
2
E temos agora dois momentos, um conjugado a variável angular (momento angular)
p
p = rp = rmv = r2 m _ =) _ = 2 ;
r m
e outro conjugado a variável radial (momento linear radial)
pr = mvr = mr_ =) r_ =
pr
:
m
Com estes momentos a energia cinética pode ser escrita como
K=
p2
p2
+ r
2
2mr
2m
E, mais uma vez como o sistema é conservativo, a hamiltoniana é a energia total
do sistema:
p2
p2
e2
H (pr ; p ; ; r) =
+ r
=E
(5)
2
2mr
2m
r
Antes de tudo, note que a variável radial também é periódica r 2 [a; b].
Temos agora duas variáveis periódicas e, conseqüentemente, dois números
quânticos
I
I
p d = n h ; pr dr = nr h :
Como o potencial do nosso problema não mudou, continuamos tendo a conservação do momento angular e, conseqüentemente, continuamos tendo a regra
de quantização
I
p d = n h =) p = n ~
Para a coordenada radial, usamos novamente a lei de conservação de energia, e
escrevemos
s
p2
e2
pr =
2m E +
r
2mr2
Onde o sinal de + se refere a trajetória de a ! b e o de de b ! a. Como só
estamos admitindo órbitas elípticas, temos
I
Z bs
p2
e2
a
2m E +
1 :
pr dr = 2
dr = 2 p
2
r
2mr
b
a
Aplicando agora a regra de quantização de Sommerfeld temos
I
a
nr
a
pr dr = hnr =) p
1 = ~nr =)
=
b
n
b
onde, para uma órbita circular
a = b =) nr = 0
31
1
ou seja
nr 2 N ; n 2 N :
Além disso, seguindo um procedimento análogo ao que …zemos para encontrar os níveis de energia do átomo de Bohr, para uma órbita estável devemos
ter
p2
e2
p2
+ r
=0;
2
2mr
2m
r
de onde obtemos as relações
2
a=
(n + nr ) ~2
n
; b=a
:
2
Ze
(n + nr )
Voltando para (5)
1
Z 2 e4
:
2~2 (n + nr )2
Enr ;n =
De…nindo
n
nr + n
podemos escrever
a=
n
n2 ~ 2
; b=a
; En =
Ze2
n
Z 2 e4 1
2~2 n2
Nosso problema tem dois números quânticos. Com a energia depende apenas de
n, continuamos usando este número e chamado de número quântico principal.
Além disso, temos agora o número quântico azimutal n .
(Degenerescência)
O ponto novo nesta descrição é o surgimento de estados de energia degenerados, i.e., estado diferentes com o mesmo valor de energia. Por exemplo,
para o primeiro estado excitado devemos ter n = 2. Mas isso pode ser obtido
tanto fazendo
nr = 0; n = 2;
numa orbita circular, ou
nr = 1; n = 1:
numa órbita elíptica. Estes dois níveis são diferentes (estados, ou con…gurações,
diferentes para o elétron), mas representam elétrons com a mesma energia. Ou
seja, agora especi…car o estado de energia do elétron não é su…ciente para sabermos em que estado ele está. Para isso, devemos dar nr e n , ou n e n .
Da mesma forma, para n = 3 podemos ter
n = 3 =) nr = 0
n = 2 =) nr = 1
n = 1 =) nr = 2
32
De forma geral, para um dado nível de energia n temos n estados degenerados.
Para os químicos, os níveis com nr = 0 (maior n ) é chamado de s (sharp),
o nível nr = 1 é chamado de p (principal ). O procedimento segue este esquema
com a nomenclatura d para nr = 1 (sharp, principal, di¤ use, e fundamental, o
restante sendo nomeado em ordem alfabética). Um nível é nomeado pelo valor
de n e nr , ou seja, o estado fundamental (único) é chamado 1s (n = 1; nr = 0
ou n = 1; n = 1). Já para o primeiro estado excitado, temos dois estados 2s e
2p, e assim segue
1s
2s 2p
3s 3p 3d
..
.
Esta divisão dos níveis (dependendo da excentricidade da órbita) está relacionada com a estrutura …na do átomo de hidrogênio.
Como dissemos acima, todos os níveis com mesmo n possuem a mesma
energia. Mas as linhas espectrais observadas se referem a freqüências diferentes
e, conseqüentemente, a diferentes energias.
Exercise 15 Então como estes estados de mesma energia podem gerar transições com diferentes energias?
O ponto observado por Sommerfeld é que todo o tratamento usado até aqui
é clássico e não leva em conta os efeitos da Teoria da Relatividade. Ao se mover
no campo puramente elétrico gerado pelo núcleo, o elétron, em seu referencial,
enxerga um campo magnético e este campo faz com que órbitas circulares e elípticas tenham uma energia diferente. Este efeito pode ser acentuada colocando-se
o átomo num campo magnético externo. O resultado obtido por Sommerfeld
usando a mecânica relativística foi
En;n =
2
Z 2 e4
1 + Z2
2
2
2~ n
n
1
n
3
4n
;
onde ' 1=137 é a chamada constante de estrutura …na. Voltaremos a falar
sobre isso (com detalhes) no tratamento do átomo de hidrogênio no …nal deste
curso. Mas agora já sabemos que os níveis de energia do átomo de hidrogênio
possuem a estrutura da …gura abaixo.
O modelo de Sommerfeld, apesar de explicar adequadamente os níveis de
energia tomando em conta a estrutura …na, ainda não é su…ciente para explicar
outras observações. Medidas ainda mais precisas mostram que mesmo os níveis
descritos acima possuem uma separação em outros níveis. Esta nova diferença,
muito menor que a anterior, é chamada de estrutura hiper…na do átomo de
hidrogênio. Esta estrutura não aparece no nosso modelo porque ele ainda é
muito simpli…cado. O elétron, além de massa e carga, possui também uma
característica interna chamada spin. Para dar conta da estrutura hiper…na,
precisamos incluir esta característica no nosso modelo.
33
2
Mecânica
Como vimos no caso da quantização de Sommerfeld, a descrição da Mecânica
Clássica (MC) adequada para se introduzir um processo de quantização não é
a formulação de Newton. Isso é verdade em geral. Tanto para os processos
da velha mecânica quântica, quanto da nova até a sua evolução relativística (a
Teoria Quântica de Campos). Um primeiro ponto que podemos salientar é que,
tendo como base uma descrição ondulatória, as equações envolvidas no processo
de descrição quântica devem, assim como a equação de onda, envolver derivadas
parciais. Enquanto a mecânica de Newton envolve derivadas totais. Além disso,
como veremos a seguir, existe uma semelhança muito grande (notada bem antes
do advento da MQ) entre estas outras descrições da MC (Hamilton, Lagrange
etc) e a descrição das características da luz na óptica geométrica. De uma
forma geral, não só nesta parte do curso como na segunda parte (Moderna II) é
impossível apreciar o processo de surgimento e evolução da MQ sem um conhecimento (ainda que enciclopédico) da descrição clássica da Mecânica Analítica.
Destarte, dedicaremos algum tempo para ganharmos uma certa familiaridade
com os termos e expressões envolvidos na Mecânica Analítica.
2.1
Preliminar
Se f = f (a; b) é uma função de duas variáveis a; b então
df =
@f
@f
da +
db
@a
@b
e, da mesma forma, se
df = g:da + h:db =) f = f (a; b)
34
não importando de quais variáveis depende g e h. Pois, independente desta
variáveis, a função f só varia quando alteramos a e b.
Se
@f
@f
df = g:da + h:db =) g =
; h=
@a
@b
2.2
Equações de Euler-Lagrange
Partindo da equação de Newton temos
d2 xi
dt2
(6)
@U
d
= m x_ i
@xi
dt
(7)
Fi = m
Para forças conservativas
Fi =
A energia cinética em coordenadas cartesianas é dada por (onde, assim como na
notação da relatividade, estamos admitindo que sempre existe uma somatória
implícita quando dois índices se repetem)
T =
X
1
2
2
(x_ k ) ; (x_ k ) =
x_ 2k
2
i
com isso temos
@T
@ x_ k
m @
1
=
(x_ k ) (x_ k ) =
@ x_ i
2 @xi
2
@ x_ i
m
[( ik ) x_ k + x_ k ik ] = mx_ i
=
2
x_ k + x_ k
@ x_ k
@ x_ i
Voltando em (7)
@U
d @T
d
d @T
@U
= mx_ i =
=)
+
= 0 ; i = 1; 2; 3:
@xi
dt
dt @ x_ i
dt @ x_ i
@xi
(8)
Para siatema conservativos a energia potencial depende apenas das coordenadas
U = U (xi ; t). Enquanto a energia cinética é, em coordenadas cartesianas2 , uma
função apenas das velocidades, T = T (x_ i ). Podemos com isso de…nir uma
função que depende de x e x_
L (xi ; x_ i ; t) = T (x_ i )
com isso
2 Em
U (xi ; t)
@T
@L
@L
=
;
=
@ x_ i
@ x_ i @xi
@U
@xi
coordenadas polares, por exemplo, a energia cinética
T =
1
r_ 2 + r_ 2 _2
m
depende da coordenada 6 r.
35
;
Substituindo em (8) temos
d @L
dt @ x_ i
@L
=0
@xi
A função L é chamada de lagrangiana do sistema e as (3) equações acima as
equações de Lagrange.
2.2.1
Coordenadas generalizadas
Pela construção acima vemos que as equações diferenciais parciais de Lagrange
são equivalente a equações de Newton. A princípio equações diferenciais parciais
são mais complicadas que EDO. Entretanto, existe uma grande vantagem nas
equações de Lagrange.
Suponha que você queira resolver o problema de pêndulo sob a ação da
gravidade. O ideal, neste caso, é usar a coordenada polar . Para obter as
equações do movimento na mecânica de Newton você deve escrever
x = R cos ; y = R sin ;
calcular x
• e y•, substituir na equação de Newton e usar o vínculo
x2 + y 2 = R2 :
Vamos ver como obter as equações do movimento na mecânica de Lagrange.
Primeiro nos obtemos a energia cinética
T =
1
1
mv 2 ; v = R _ =) T = mR2 _2
2
2
enquanto a energia potencial é dada por
V ( ) = mgR (1
cos )
Com isso temos
L=T
V =
1
mR2 _2
2
mgR (1
cos )
Se esquecermos por um instante que estamos usando coodenadas polares e usarmos as equações de Lagrange (trocando x por ) temos
@L
@ 1
=
mR2 _2
@
@ 2
@L
@ 1
=
mR2 _2
_
@
@_ 2
@
(cos ) =
@
mgR (1
cos ) = mgR
mgR (1
cos ) = mR2 _
com isso,
d @L
dt @ _
@L
d
=
mR2 _ + mgR sin
@
dt
= mR2 • + mgR sin = 0
36
mgR sin
ou ainda
• + g sin = 0 :
R
Que é precisamente a equação que seria obtida a partir da equação de Newton
e o laborioso processo descrito acima.
Este resultado pode ser provado de forma geral usando uma transformação
geral de coordenadas.
Para veri…car isso imaginamos uma transformação qualquer (inversível) das
coordenadas (também chamado transformação de ponto)
xi = xi (q; t) ; qi = qi (x; t)
com isso, podemos escrever
L = L (q; q;
_ t)
ou3
L = L (x; x;
_ t)
Resultados que vamos precisar
1. Calculando
q_j =
@qj dxi
@qj dx_ i
@qj
@qj
@qj
dqj
=
+
+
=
x_ i +
dt
@xi dt
@ x_ i dt
@tj
@xi
@t
vemos que
q_j =
dqj
@qj
@qj
=
x_ i +
dt
@xi
@t
(9)
2. Lembrando agora que
qi = qi (x; t) =)
@qj
@qj
= fij (x; t) ;
= gi (x; t)
@xi
@t
podemos escrever4
q_j = fij x_ i + gi
3 Na
verdade, a função
L (x; x;
_ t)
não é a mesma função das coordenadas L (q; q;
_ t), ou seja, se formos rigorósos devemos esvrece
~ (q; q;
L
_ t). Mas podemos esquecer o til lembrando que estamos usando a de…nição de que a
lagrangiana é uma função escalar das coordenadas. Seu valor num determinado ponto físico
não se altera por uma mudança das coordenadas.
4 Lembre que se
qi = qi (q; t) ;
temos
mas
d
qi = fi (q; q;
_ t) ;
dt
@qi
= fi (q; t) :
@t
37
e calcular
@ q_j
@fij
@ x_ i
@gi
=
x_ i + fij
+
@ x_ m
@ x_ m
@ x_ m
@ x_ m
onde nem f nem g dependem de x,
_
@ q_j
@ x_ i
= fij
= fij
@ x_ m
@ x_ m
im
= fmj =
@qj
@xm
ou seja,
@qj
@ q_j
=
:
@xi
@ x_ i
(10)
3. Usando (9) temos
@qj
@qj
=)
x_ i +
@xi
@t
@ q_m
@ 2 qm
@qm @ x_ j
@ 2 qm
@ 2 qm
@ 2 qm
=
x_ j +
+
=
x_ j +
@xi
@xi @xj
@xj @xi
@xi @t
@xi @xj
@xi @t
q_j =
(11)
4. Vamos agora calcular
L (q; q;
_ t) =)
@L
@L @qm
@L @ q_m
=
+
:
@xi
@qm @xi
@ q_m @xi
Substituindo (11) temos
@L
@L @qm
@L
@ 2 qm
@ 2 qm
=
+
x_ j +
@xi
@qm @xi
@ q_m @xi @xj
@xi @t
(12)
5. lembrando que
d
@f
@f
f (x; t) =
x_ m +
dt
@xm
@t
fazendo
fkj (x; t) =
temos
@qk
@xj
d @qk
@ 2 qk
@ 2 qk
=
x_ m +
dt @xj
@xm @xj
@t@xj
(13)
Voltaldo agora para a nossa lagrangiana L (q; q;
_ t) temos
@L
@L @qk
@L @ q_k
=
+
@ x_ j
@qk @ x_ j
@ q_k @ x_ j
e lembrando que q não depende de x_
@L @ q_k
@L
=
@ x_ j
@ q_k @ x_ j
38
(14)
Usando (10)
@L
@L @qk
=
@ x_ j
@ q_k @xj
Derivando em relação ao tempo
d @L
=
dt @ x_ j
d @L
dt @ q_k
@qk
@L d @qk
+
@xj
@ q_k dt @xj
(15)
Substituindo (13) na relação acima
d @L
=
dt @ x_ j
d @L
dt @ q_k
@qk
@L
+
@xj
@ q_k
@ 2 qk
@ 2 qk
x_ m +
@xm @xj
@t@xj
:
(16)
Subtraindo (16) e (12) temos
d @L
dt @ x_ i
@L
=
@xi
=
=
d @L
dt @ q_k
@qk
@L
+
@xi
@ q_n
@ 2 qn
@ 2 qm
x_ m +
@xm @xi
@t@xi
d @L @qk
@L
@ 2 qn
+
dt @ q_k @xi
@ q_n
@xm @xi
d @L
@L @qm
dt @ q_m
@qm @xi
@L @qm
@qm @xi
@ 2 qn
@ 2 qm
x_ m +
@xi @xm
@t@xi
@L
@ 2 qn
@ 2 qn
x_ j +
@ q_n @xi @xj
@xi @t
@ 2 qn
@xi @t
Como a nossa transformação é geral e L (x; x;
_ t) obedece as EL, podemos
a…rmar que
d @L
@L
=0:
dt @ q_m
@qm
Ou seja, as EL têm a mesma forma para qualquer sistema de coordenada.
Assim, utilizando as equações de Lagrange temos uma liberdade completa
na escolha das coordenadas do sistema, o que pode ser utilizado explorando as
simetrias do problema. Ou seja, a principal vantagem das equações de Lagrange
é que elas independem do sistema de coordenadas usados. Com isso, se qi é um
conjunto qualquer de coordenadas que descrevem um sistema mecânico, este
sistema deve obedecer as equações de Lagrange
d @L
dt @ q_i
@L
=0:
@qi
(17)
As coordenadas qi são chamadas de coordenadas generalizadas.
Remark 16 Mais uma vez, enquanto a equação de Newton (6) só tem esta
forma em coordenadas cartesianas, as equações de Lagrange (17) têm esta forma
em qualquer sistema de coordenadas.
Exercise 17 Uma conta (miçanguinha) de massa m pode se mover livremente
numa barra rígida e reta que gira com velocidade constante !. Escreva a equação
do movimento da conta.
39
@L @qm
@qm @xi
3
Transformada de Legendre
Em uma série de problemas em física é importante mudarmos as variáveis que
usamos num problema. Por exemplo, na termodinâmica uma quantidade muito
importante é a energia interna de um sistema U (S; V ). Um inconveniente
desta quantidade é que ela depende da entropia S, uma quantidade que não
pode ser medida diretamente com nenhum instrumento. Entretanto, pelas leis
da termodinâmica, sabemos que a temperatura T de um corpo é a variação da
sua energia interna com a entropia
@U
:
@S
T =
(18)
Vamos então de…nir uma nova quantidade F como
F = T:S
U
(19)
Diferenciando esta quantidade temos
dF = T dS + SdT
dU ;
Sabendo que U = U (S; V ) temos
dU =
@U
@U
dS +
dV ;
@S
@V
(20)
com isso
@U
dS
@S
dF = T dS + SdT
=
@U
@S
T
dS + SdT
@U
dT
@T
@U
dV
@V
O fato importante na de…nição de F é que, usando (18), temos
dF = SdT
@U
dV ;
@V
(21)
ou seja, a função (19) assim de…nida não depende da entropia
F = F (T; V )
Com isso
dF =
@F
@F
dT +
dV ;
@T
@V
comparando com (21) temos
S=
@F
@F
;
=
@T
@V
@U
:
@V
O importante da quantidade F , chamada energia livre de Helmholtz, é que ela
depende da temperatura e do volume, ambas quantidades que, diferente da
entropia, podem ser medidas com instrumentos usuais.
40
Ou seja, podemos determinar F estudando as variações das característica
do sistema com respeito ao seu volume e a sua temperatura.
O procedimento acima é um exemplo de um procedimento mais geral chamado
de transformada de Legendre. De forma geral, se f = f (x1 ; x2 ; :::; y1 ; y2 ; :::)
podemos de…nir uma nova função
g = pi y i
f
(somatória em i) onde
pi =
@f
@yi
com isso
dg = (dpi :yi + pi :dyi )
df
@f
@f
dxi +
dyi
@xi
@yi
@f
dyi + dpi :yi
dxi
@xi
= (dpi :yi + pi :dyi )
=
pi
@f
@yi
que, pela de…nição de pi ,
@f
dxi
@xi
dg = yi :dpi
Ou seja a função g não depende mais de yi , mas sim de um novo conjunto de
variáveis pi .
4
Equações de Hamilton
Nosso objetivo agora é usar a transformada de Legendre nas equações de Lagrange. Primeiramente lembramos que, pela de…nição acima
L = L (qi ; q_i ) ;
ou seja, a Lagrangiana depende das posições e das velocidades.
Agora vamos de…nir a quantidade
H = pi q_i
onde
pi =
L
(22)
@L
@ q_i
é chamado momento conjugado da variável qi (i.e., para q = x temos um momento linear, para q = um momento angular e, no caso geral, um momento
41
conjugado). Das equações de Lagrange temos que, se uma determinada coordenada qm não aparece na Lagrangiana (chamada de coordenada cíclica)
d @L
@L
= 0 =)
= p_i = 0 =) pi = const:
@qm
dt @ q_i
então o momento associado a esta coordenada se conserva (e.g., para uma
partícula livre L = T o momento linear em qualquer direção se conserva).
Seguindo o procedimento da seção anterior temos
dH = dpi :q_i + pi :dq_i
dL :
Lembrando que L = L (q; q)
_ temos
dL =
@L
@L
dqi +
dq_i ;
@qi
@ q_i
com isso
@L
@L
dqi +
dq_i
@qi
@ q_i
@L
@L
dq_i + q_i :dpi
dqi ;
@ q_i
@qi
dH = dpi :q_i + pi :dq_i
= pi
e pela de…nição de pi
dH = q_i :dpi
@L
dqi
@qi
;
(23)
e, como esperávamos, a função H assim obtida é uma função de q e p e não mais
de q,
_ H = H (q; p). A quantidade H assim de…nida é chamada de Hamiltoniana.
Sabendo que H = H (q; p) temos
dH =
@H
@H
dqi +
dpi :
@qi
@pi
Lembrando agora que q e p são coordenadas independentes em H (assim como
q e q_ eram em L, i.e, obviamente q_ depende de q, mas é exatamente está relação
que queremos encontrar ao resolver a equações de Lagrange) e comparando com
(23) temos
@H
@L
@H
= q_i ;
=
@pi
@qi
@qi
Se usarmos agora as equações de Lagrange temos
@L
d @L
=
@qi
dt @ q_i
Lembrando a de…nição de p
pi =
@L
@L
d
=)
= pi = p_i
@ q_i
@qi
dt
42
Com o que
@H
@H
= q_i ;
=
@pi
@qi
p_i :
(24)
Estas são as chamadas equações de Hamilton (EH).
Qual a vantagem destas equações?
Uma vantagem prática destas equações é que elas possuem apenas derivadas
de primeira ordem. Como a equação de Newton, a equação de Lagrange possui derivadas das velocidades o que resulta em derivadas de segunda ordem na
posição. Obviamente perdemos algo ao ganharmos esta facilidade. O ponto é
que temos dois pares de EH, ou seja, usando a transformada de Legendre conseguimos transformar um sistema de n equações diferenciais de segunda ordem
num sistema de 2n equações diferenciais de primeira ordem5 .
4.0.2
Signi…cado físico da Hamiltoniana
No caso geral, a energia cinética de um sistema é uma função quadrática das
velocidades generalizadas
T = aij q_i q_j ; aij = aij (q)
(somatória em i e j) no caso de coordenadas cartesianas aij =
ciando a expressão acima temos
1
ij 2 m.
Diferen-
X
@T
@ q_i
@ q_j
=
aij
q_j + aij q_i
@ q_k
@ q_k
@ q_k
X
=
(aij ik q_j + aij q_i jk )
X
X
=
aij ik q_j +
aij q_i jk
ij
=
X
akj q_j +
j
=
X
X
ij
aik q_i
i
aki q_i +
i
X
aik q_i
i
Multiplicando por q_k e efetuando uma somatória em k temos
X @T
X
X
q_k =
aki q_i q_k +
aik q_i q_k
@ q_k
k
i;k
i;k
= T + T = 2T
5 Na verdade, esta não é a maior vantagem da EH, mas sim que, além de todo o conjunto de
transformações de coordenadas disponíveis na formulação de Lagrange, tempos agora um conjunto muito maior de transformações a nossa disposição. Voltaremos a isso quando falarmos
em transformações canônicas.
43
Este resultado é conhecido como teorema de Euler. Se usarmos agora este
resultado na de…nição de H temos
X
H=
pi q_i L
i
X @L
q_i
=
@ q_i
i
X @T
=
q_i
@ q_i
i
(T
U)
(T
U)
= 2T T + U
=T +U :
Ou seja, a hamiltoniana é a energia total do sistema.
Observe que, diferente da Lagrangiana (T U ) a energia total do sistema é
uma quantidade que pode ser medida e, além disso, é uma quantidade
conservada para um sistema isolado. Esta é outra vantagem da teoria de
Hamilton. Assim, utilizando a mecânica de Hamilton podemos, a partir da
energia total do sistema e de um sistema de 2n equações de primeira ordem,
estudar a dinâmica dos corpos.
4.1
Princípio variacional (opcinal)
Um problema importante e comumente encontrado é o seguinte: dada uma
função y = f (x) para quais valores de x a função f , e conseqüente y, possui
valores máximos e mínimos (estes valores são chamados de extremos da função).
A resposta, obviamente, são os pontos onde a derivada de f se anula.
Um problema bem mais complicado, e interessante, é o seguinte: considere
a integral
Z b
I=
F (y (x) ; y 0 (x) ; x) dx
a
onde F é uma dada função de y (x), y 0 = dy=dx e x. Assim, para cada função
y (x) diferente I assume um valor diferente. Para quais funções y(x) a integral
I é um extremos?
Antes um pouco de nomenclaturas. Dada uma certa função y(x) podemos
calcular o valor de I. A quantidade I, que depende de uma função, e não apenas
de um número, é chamada de funcional. Outro ponto importante é que dado dos
valores y(x0 ) = a1 e y0(x0 ) = a2 é sempre possível encontrar uma função y(x)
que satisfaça esta condição. Neste sentido, as variáveis y e y0 são tratadas em
F como sendo independentes. Agora, para calcular I nós não podemos dar
apenas o valor de y(x) num dado ponto x0 , mas sim o valor desta função em todo
o intervalo x 2 [a; b], ou seja, precisamos dar toda uma curva y(x). Dada uma
curva o valor da derivada desta curva está completamente determinada. Assim,
em I não é possível se especi…car separadamente o valor de y e y0. Resumindo
enquanto F é uma função de y, y0 e x
F = F (y; y 0 ; x)
44
Figure 7: Figura retirada do Marion.
enquanto I é um funcional apenas de y
I = I [y] :
Nosso problema de encontrar a função y para a qual I é um extremo é um
problema do chamado cálculo variacional.
Por que a derivada de uma função é nula nos extremos? Isso ocorre porque a
variações do parâmetro (x) em torno deste ponto não geram variações na função
y(x) (pelo menos até primeira ordem em dx). O mesmo acontece com uma
função de duas variáveis (o que pode ser visualizado facilmente) ou com funções
com um número qualquer de variáveis (o que não é tão simples de visualizar). Ou
seja, se estivermos num ponto extremo da função, ao deslocarmos o argumento
uma quantidade in…nitesimal não haverá variação da nossa função. A idéia por
detrás do cálculo variacional é exatamente a mesma. Se tivermos encontrado
a função y(x) para a qual nosso funcional I [y] é um extremos, esperamos que
ao variamos um pouco esta função (ou seja, pegarmos uma curva y(x) muito
próxima a y (x)) o valor do nosso funcional não irá variar (Figura).
Suponha que y (x) é a função que resolve este problema (obviamente esta é
a função que queremos encontra). O fato de y (x) ser um extremo de I signi…ca
então que com pequenas variações em torno de y (x) o valor do integrando não
varia apreciavelmente (de forma análoga ao cálculo ordinário). Vamos então
analisar como I varia se substituímos y pela função (Figura)
y (x) = y (x) + " (x)
45
para uma função (x) que, apesar de arbitrária, vamos supor dada, i.e., vamos
variar apenas o valor de ". Como queremos estudar todas as funções que passam
pelo mesmo ponto inicial e …nal devemos ter
y (a) = y (a) ; y (b) = y (b) =)
y
(a) =
y
(b) = 0 :
Para a variação acima (onde y e são funções conhecidas) nosso integrando I
passa a ser uma função (pois " é um número) de "
Z b
I [y] ! I (") =
F (y + " ; y 0 + " 0 ; x) dx :
a
O ponto é que agora, como é uma função, podemos usar o resultado do cálculo
usual é dizer que para " = 0 a nossa função I é um extremo e, consequentemente,
sua derivada é nula, ou seja,
dI
=0:
(25)
d" "=0
Tudo que precisamos agora é de…nir a diferencial dI=d". Fazemos isso da forma
usual
"Z
#
Z b
b
I [y + "] I [y]
1
dI
0
0
0
= lim
= lim
F (y + " ; y + " ; x) dx
F (y; y ; x) dx
"!0 "
d" "!0
"
a
a
Z
1 b
[F (y + " ; y 0 + " 0 ; x) F (y; y 0 ; x)] dx
= lim
"!0 " a
Z b
[F (y + " ; y 0 + " 0 ; x) F (y; y 0 ; x)]
=
dx :
lim
"
a "!0
Agora
F (y + " ; y 0 + " 0 ; x) = F (y; y 0 ; x) +
ou seja
F (y + " ; y 0 + " 0 ; x)
"!0
"
lim
com isso
dI
=
d"
Z
a
b
@F
@F
" + 0 " 0 + O "2
@y
@y
F (y; y 0 ; x)
@F
@F
+ 0
@y
@y
0
=
@F
@F
+ 0
@y
@y
dx :
0
(26)
Lembrando que 0 = d =dx podemos integrar o segundo membro da expressão
acima por partes
Z b
Z b
b
@F d
@F
d @F
dx =
dx :
(27)
0 dx
0
@y
@y
dx
@y 0
a
a
a
Agora usamos o fato de que a função (x) (apesar de arbitrária) deve se anular
nos extremos (a) = (b) = 0
Z b
Z b
@F d
d @F
dx =
dx :
0 dx
@y
dx
@y 0
a
a
46
Substituindo em (26) temos
dI
=
d"
=
Z
b
a
Z
b
a
@F
@y
d @F
dx @y 0
@F
@y
d @F
dx @y 0
dx
dx :
(28)
Voltando agora para (25) temos
dI
d"
=0=
Z
b
a
"=0
@F
@y
d @F
dx @y 0
dx
Para qualquer função (x). Isso só é possível se o integrando for zero
@F
@y
d @F
dx @y 0
=0:
Para F uma função de várias variáveis este resultado tem de ser válido independentemente para cada variação
@F
@yi
d @F
dx @yi0
=0
(29)
Esta é a chamada equação de Euler.
Observe que, no …nal, a nossa expressão (28) não depende de ". Além disso,
para lembrar que não estamos falando do cálculo usual, as pessoas inventam um
novo símbolo para a derivada (mas é apenas um símbolo)
Z b
dI
I [y] =
F (y; y 0 ; x) dx :
d"
a
E lesse a variação funcional de I. Ou ainda, se mudarmos a notação para
e usarmos a notação acima, (28) pode ser escrita como
Z b
d @F
dI
@F
I [y] =
y dx
d"
@y
dx
@y 0
a
y
(30)
e, em analogia com o cálculo ordinário de uma função f (x), costuma-se escrever
Z b
Z b
I
@F
d @F
df
dx ! I [y]
y dx =
y dx ;
df =
dx
y
@y
dx @y 0
a
a
ou seja,
I
@F
=
y
@y
d @F
dx @y 0
e lesse, a derivada funcional de I [y] em relação a função y (x). Mais uma vez,
isso é apenas uma notação6 , mas é importante que você a conheça porque ela é
muito usada em livros e artigos.
6 Obviamente existe muito mais por trás do cálculo variacional. Mas se trabalharmos apenas
com funções bem comportadas (e.g., diferenciáveis em todos os pontos), na grande maioria
dos casos podemos encarar apenas como uma notação.
47
Figure 8: Figura retirada do Marion de Mecânica.
Com isso, nesta simbologia, a nossa expressão …ca
I [y] =
Z
b
F (y; y 0 ; x) dx = 0 =)
a
I
=
y
d @F
dx @yi0
@F
=0:
@yi
e lesse que, o fato da derivada funcional de I ser um extremo implica na equação
de Euler.
4.1.1
Exemplo: a braquistocrôna.
Um problema variacional bastante famoso, proposto em numa revista ciêntí…ca
por Bernoulli em 1696, é o chamado problema da braquistocrôna (do grego,
o tempo mais curto). Imagine dois pontos num plano, (x1 ; y1 ) e (x2 ; y2 ), se
uma força constante for aplicada na direção x e uma partícula de massa m se
mover do primeiro ponto ao segundo sob ação desta força, qual o caminho que
esta partícula deve percorrer para efetua o trajeto no menor tempo possível?
Imagine que você quer colocar um cano para guiar o movimento de uma bolinha
e quer saber a forma do cano para minimizar o tempo de percurso. A resposta
do problema acima é exatamente a trajetória que a sua pedra terá de fazer.
Ou ainda, imagine que você pendure uma corrente entre os dois pontos acima
(onde a força é, novamente, a gravidade), que curva esta corrente irá desenhar
(esta curva se chama catenária)? Todos estes exemplos se referem ao mesmo
problema. Vamos então a sua solução. Para fazer uma referência mais natural
a força gravitacional, colocamos os eixos como na …gura abaixo
Sabemos que a energia total do sistema T + U se conserva. Colocando o
zero do potencial no ponto de início (x1 ; y1 ) e considerando que a partícula
foi lançada do repouso na direção x (podemos ignorar qualquer velocidade na
direção y pois, como não há forças nesta direção, ela se conserva) temos que no
48
ponto inicial
Ei = T + U = 0
Seguindo a analogia da força gravitacional temos
F = mg =
T =
@U
)U =
@x
mgx
1
mv 2
2
A conservação de energia nos dá
T + U = 0 =) v =
Com isso
1
ds
= v ) dt = ds ) t =
dt
v
onde
2
2
p
2gx
Z
(x2 ;y2 )
(x1 ;y1 )
1
ds
v
2
(ds) = (dx) + (dy)
Finalmente, o tempo vale
Z (x2 ;y2 )
q
1
2
2
p
t=
(dx) + (dy)
2gx
(x1 ;y1 )
Z (x2 ;y2 ) s
Z (x2 ;y2 ) r
1
1 + y 02
1 + y 02
=
dx = p
dx
2gx
x
2g (x1 ;y1 )
(x1 ;y1 )
y0 =
dy
dx
Ou seja, o nosso problema se reduz a minimizar a integral (como (2g)
uma constante)
s
Z (x2 ;y2 )
1 + y 02
I=
F (y 0 ; x) dx ; F (y 0 ; x) =
2gx
(x1 ;y1 )
1=2
é
Onde, neste caso, a função F não depende explicitamente de y. A solução do
nosso problema é, então, a função y que obedece a equação de Euler (29)
@F
@y
d @F
dx @y 0
=0
Como, neste caso, F não depende explicitamente de y
@F
d @F
@F
=0)
=0)
=C
@y
dx @y 0
@y 0
r
@F
@
1 + y 02
y0
p
=
=
=C
@y 0
@y 0
x
x (1 + y 02 )
49
Assim, a curva que a partícula deve seguir y (x) deve ser solução da equação
s
y0
xC 2
02
2
02 2
0
p
= C ) y = xC + xy C ) y =
;
(1 xC 2 )
x (1 + y 02 )
ou ainda,
dy
=
dx
s
xC 2
)y=
(1 xC 2 )
2a = 1=C 2
Z
x2
x1
x
p
(2ax
x2 )
dx ;
Fazendo
x = a (1
cos ) ) dx = a sin d
temos
Z
y=
ou seja, a curva procurada é
y = a(
a (1
cos ) d =
sin ) + const.
Com isso, a nossa curva obedece
x = a (1
cos ) ; y = a (
sin )
que são as equações paramétricas de uma curva chamada ciclóide.
Se a sua partícula for uma conta guiada por um …o (com massa) e você
prender o …o nos pontos acima o …o assumirá exatamente esta a forma que
levará a partícula entre os dois pontos no menor tempo, i.e., o …o formará uma
catenária.
A parte da curva entre o ponto (x1 ; y1 ) até o seu mínimo é chamada de curva
tautocrônica (como muito bem observado pela senhorita Palma), i.e., é a curva
na qual o tempo gasto por um objeto para deslizar sem fricção em gravidade
uniforme até seu ponto de mínimo é independente de seu ponto de partida (este
problema foi resolvido por Christiaan Huygens em 1659).
4.1.2
Equações de Euler-Lagrange
O ponto importante para nós no desenvolvimento acima é o seguinte: suponha
que a nossa variável é o tempo (x ! t) e que a função que procuramos seja a
trajetória de uma partícula com coordenada generalizada q(t) (y (x) ! q (t)).
Alem disso, suponha que a função F que estamos integrando seja exatamente a
lagrangiana L do sistema. Com isso
Z
a
b
0
F (y; y ; x) dx !
50
Z
a
b
L (q; q;
_ t) dt
Figure 9: Figura retirada do Marion de Mecânica.
e a expressão (28) toma a forma:
Z b
L (q; q;
_ t) dt = 0 =)
a
d @L
dt @ q_i
@L
=0:
@qi
Que é exatamente a equação de Lagrange obtida anteriormente. Por isso estas
equações são chamadas de equações de Euler-Lagrange (EL).
A integral
Z
L (q; q;
_ t) dt
S [q]
é chamada de ação. Usando a linguagem do cálculo funcional, podemos obter
as equações de EL se impusermos que a derivada funcional da ação seja um extremo. Esta exigência recebe o nome de princípio da mínima ação (ou princípio
de Hamilton).
Neste sentido as equações de Lagrange e, consequentemente, toda a mecânica,
podem ser construídas a partir do princípio da mínima ação e esta construção
é equivalente a mecânica de Newton (perceba que este é um caminho diferente
do seguido no início deste texto).
O fato da mecânica de Lagrange ser uma conseqüência do princípio da mínima ação tem uma conseqüência crucial na questão do comportamento ondulatório ou corpuscular da luz. Porque todos os resultados da óptica geométrica
podem ser obtidos a partir de um princípio muito semelhante chamado princípio de Fermat do tempo mínimo. Este princípio estabelece que ao atravessar
meios diferentes, dentre todos os caminhos possíveis o feixe luminoso escolhe
aquele que minimiza o tempo da sua trajetória. Este princípio determina todos
51
os efeitos de refração e re‡exão. Como analogia, imagine que você está de
bicicleta na praia e quer atravessar a avenida da orla para chegar num ponto
a 45o da normal à avenida. Qual caminho você deve seguir para chegar mais
rápido? O menor caminho é, obviamente, uma linha reta. Mas, como a bicicleta se move com maior facilidade no asfalto é conveniente que você passe
menos tempo na areia. Porém, se você se mover na direção normal na praia a
distância percorrida será muito maior. Encontrar o caminho que minimize este
tempo é um problema de cálculo variacional. Assim, a trajetória tanto da
luz como das partículas pode ser obtida por um princípio de mínimo
de um funcional.
5
Parênteses de Poisson
Existe uma forma bastante compacta de se escrever as EH através dos chamados
parênteses de Poisson (PP). Os PP de duas funções f (q; p) e g (q; p) são de…nidos
como
X @g @f
@f @g
ff; gg =
@q
@p
@q
i
i
i @pi
i
Vamos calcular os PP de uma função g em relação ao Hamiltoniano
fg; Hg =
X
i
@g @H
@qi @pi
@H @g
@qi @pi
Usando agora as eq. de Hamilton temos
fg; Hg =
=
X
i
X
i
=
X
i
=
X
i
@g @H
@qi @pi
@H @g
@qi @pi
@g
(q_i )
@qi
( p_i )
@g
@pi
@g
@g
q_i + p_i
@qi
@pi
@g dqi
@g dpi
+
@qi dt
@pi dt
Lembrando agora que
dg =
X
i
dg
=
dt
X
i
temos
g_ =
@g
@g
dqi +
dpi
@qi
@pi
@g dqi
@g dpi
+
@qi dt
@pi dt
dg
@g
= fg; Hg +
dt
@t
52
+
@g
dt
@t
+
@g
@t
Ou seja, calculando os PP de qualquer função da posição e momento com o
hamiltoniano temos a variação temporal desta função.
Em especial, para as variáveis de posição e momento temos
q_k = fqk ; Hg =
X
X
@qk @H
@qi @pi
i
@qk @H
@H
=
=
ik
@q
@p
@p
i
i
k
i
X @pk @H
p_k = fpk ; Hg =
@qi @pi
i
@H @qk
@qi @pi
@H @pk
@qi @pi
=
@H
@qk
Ou seja, podemos escrever as EH como
p_k = fpk ; Hg ; q_k = fqk ; Hg
Observe que
ff; gg =
fg; f g
de sorte que
fh; hg = 0
Assim, do resultado acima temos
@H
@H
H_ = fH; Hg +
=
@t
@t
Ou, se o Hamiltonianao (a energia) não depende explicitamente do tempo
H_ = 0 =) H = E = const.
A energia do sistema se conserva.
Mais ainda, para qualquer quantidade h (q; p) que não dependa explicitamente do tempo, temos que
se fh; Hg = 0 =) h = const.
Quando os PP de duas quantidades é nulo
ff; gg = 0
dizemos que estas quantidades comutam.
Assim, uma quantidade se conserva se ela comuta com o H.
Se calcularmos os PP das próprias variáveis q e p temos
fqk ; pm g =
=
X
i
X
@qk @pm
@qi @pi
ik im
i
fqk ; pm g =
km
53
@pm @qk
@qi @pi
Que são chamadas regras canônicas de comutação. E as variáveis são
chamadas de canonicamente conjugadas.
Como vimos anteriormente, as EL mantém a sua forma para qualquer transformação de ponto nas coordenadas. Dos resultados acima vemos que as EH
manterão a mesma forma (e, conseqüentemente, descreverão a mesma dinâmica)
para qualquer transformação inversível
Pk = Pk (p; q) ; Qk = Qk (p; q)
que mantenha as regras canônicas de comutação
fQk ; Pm g = fqk ; pm g =
km
:
Vemos assim que a liberdade na escolha das coordenadas e dos momentos é na
teoria de Hamilton. Transformações que mantém a forma canônica dos PP são
chamadas de transformações canônicas.
Resumindo:
1. na MC toda a informação que caracteriza o sistema está contido nas variáveis (q; p). Estas quantidades podem ser desenhadas em um grá…co que
se chama espaço de fase. Ou seja, dado um ponto no espaço de fase eu sei
o momento é a posição do sistema. Diz-se então que pontos no espaço
de fase representam os estados físicos do sistema.
2. Para um sistema conservativo (onde H não depende explicitamente do
tempo) toda a dinâmica do sistema (variação temporal das quantidades)
depende apenas de H. Dado H a evolução de qualquer quantidade f pode
ser calculada pelos parêntese de Poisson
f_ = ff; Hg :
3. A liberdade na escolha das coordenadas que descrevem corretamente a
dinâmica do sistema está contida nas regras canônicas de comutação
fqk ; pm g =
km
:
Estes são os resultados necessários para se entender o processo de quantização canônica.
6
Vetores e equações lineares
Além da mecânica analítica, um segundo ferramental indispensável para o nosso
desenvolvimento é a álgebra linear e vetores.
Uma das estruturas mais simples e fundamentais que temos são os números
inteiros (Z). Neste conjunto temos a de…nição de duas operações: soma e multiplicação. A generalização desta idéia, ou seja, a …xação destas propriedades
54
algébricas relaxando uma ou outra característica leva a construção de outras
estruturas matemáticas como monóides, grupos, anéis, espaços vetoriais etc.
Um espaço vetorial V é qualquer conjunto de elementos onde de…nimos uma
regra de composição entre estes elementos, que simbolizamos geralmente pelo
sinal de soma (+ : V ! V ). Ou seja, dado dois elementos quaisquer v1 ; v2 2 V ,
sabemos realizar a composição:
8 v1 ; v2 2 V : v1 + v2 = v3 2 V ; (closure)
Ademais estabelecesse uma outra regra, chamada de produto com um escalar
( : R; V ! V ), da composição dos elementos deste conjunto sobre o corpo dos
reais (ou dos complexos). Ou seja:
8 v1 2 V; a 2 R : a:v1 = av1 = v3 2 V ;
Além disso, esta operação de soma deve respeitar (lembre-se que podemos
de…nir diferentes somas, e.g., soma de setas, de matrizes.):
a Associativa: v1 + (v2 + v3 ) = (v1 + v2 ) + v3 .
b Comutativa: v1 + v2 = v2 + v1 .
c Elemento identidade: 9 0 2 V : v + 0 = v; 8 v 2 V .
d Elemento inverso: 8 v 2 V; 9
v 2 V : v + ( v) = 0 :
e Distributiva pelo produto com um escalar: a (v1 + v2 ) = av1 + av2 .
f Distributiva pela soma escalar: (a1 + a2 ) v = a1 v + a2 v
g compatível com a multiplicação escalar do carpo: a1 (a2 v) = (a1 a2 ) v
Um conjunto ordenado de n números reais x1 ; x2 ; ::xn pode ser chamado de
um vetor de dimensão n, ou um vetor num espaço n dimensional, denotamos este
espaço por Rn (i.e., a coleção de n números reais). Usualmente esta quantidade
é simbolizada como jxi. Cada um dos elementos xi (i = 1; 2; ::; n) é chamado de
componente i do vetor. Se todas as componentes são nulas, o vetor é chamado
de vetor nulo e usualmente simbolizado por 0 (mas lembre-se que este símbolo
é, na verdade, a coleção de n zeros). Para n = 2, ou n = 3 o vetor pode ser
interpretado geometricamente como as coordenadas cartesianas de uma seta que
inicia na origem e termina neste ponto.
Para n > 3 a visualização geométrica não é possível, mas as expressões
algébricas e a terminologia continuam as mesmas.
Para números reais arbitrário a; b 2 R a quantidade a jxi+b jyi = jzi fornece
um novo vetor (também de dimensão n) cujas componentes são dadas por
zi
axi + byi :
55
Uma estrutura adicional que podemos incluir no nosso espaço vetorial (mas
que não faz parte da de…nição desta estrutura) é a operação
hxj yi = x1 y1 + x2 y2 + ::: + xn yn =
n
X
xi yi ;
(31)
i=0
chamada de produto interno dos vetores jxi e jyi. Esta quantidade também é
chamada de projeção de jyi em jxi, ou a componente de jyi na direção jxi (ou
vice-versa).
Fácil ver que o produto interno de…nido acima é:
1. Simétrico: hxj yi = hyj xi
2. Linear: jzi = a jyi + b jwi : hxj zi = a hxj yi + b hxj wi
Observe que podemos obter a expressão da linearidade acima se simbolicamente escrevermos
hxj zi = (hxj) (a jyi + b jwi) = hxj a jyi+hxj b jwi = a hxj jyi+b hxj jwi
a hxj yi+b hxj wi
Ou seja, a linearidade permite interpretar a quantidade hxj a esquerda do símbolo de produto como sendo também um vetor, chamado de vetor dual do vetor
jxi. Esta notação simbólica é chamada notação de Dirac. Ou seja, hxj é um
outro espaço vetorial também formado por uma seqüência de número e de…nido
com as operações de soma e produto acima. Dizer que este espaço é outro espaço
vetorial signi…ca, em especial, dizer que não podemos realizar composições do
tipo
hxj + jwi =?
Dizemos que dois vetores jxi e jyi são ortogonais quando
hxj yi = 0 :
Para n = 2 e 3 esta terminologia possui um signi…cado imediato. Pois, neste
caso, numa representação geométrica onde cada termo da seqüência é a componente de uma seta num sistema cartesiano, quaisquer dois vetores que respeitam
a igualdade acima fazem entre si um ângulo de 90o . Por exemplo, para n = 2,
os vetores
jxi = (1; 1) ; jyi = (1; 1)
temos
hxj yi = 1
1=0:
E é fácil ver que estes vetores no plano tem entre si um ângulo de 90o . Mais
uma vez, para n > 3, a interpretação geométrica não pode ser mais usada, mas
a nomenclatura continua a mesma.
O produto interno de um vetor com ele mesmo
hxj xi
56
2
jxj
é chamado de norma do vetor. A raiz positiva da norma
p
hxj xi jxj 0
é chamado de comprimento do vetor (alguns autores chamam esta raiz de
norma). Mais uma vez, para n = 2 ou 3, esta quantidade representa o comprimento (ou a distância) da origem até as coordenadas do ponto. Observe
que
hxj xi = 0 =) jxi = 0 ; xi = 0 ; i = 1; 2; :::n :
Um vetor para o qual
hxj xi = 1 ;
é chamado de vetor unitário, ou vetor normalizado.
As de…nições acima também podem ser escritas identi…cando os vetores jxi
com matrizes de n linhas
0
1
x1
B x2 C
B
C
jxi = B . C
@ .. A
xn
Neste caso, o produto vetorial pode ser realizado identi…cando o dual do vetor
como a matriz de n colunas (ou a transposta) correspondente
hxj =
x1
x2
xn
e identi…cando a operação de produto interno com a multiplicação usual de
matrizes
0
1
x1
n
B x2 C X
B
C
yn B . C =
hyj xi = hxj jyi = y1 y2
xi yi :
@ .. A
i=0
xn
Um conjunto de m vetores jx1 i ; jx2 i ; ::: jxm i são ditos linearmente dependentes, se
m
m
X
X
9ai (i = 1; ::; m) 2 R ;
a2i 6= 0 :
ai jxi i = 0
i=1
i=1
caso contrário, eles são linearmente independentes.
Num espaço de dimensão n qualquer conjunto de n vetores jwi i (distintos
e não nulos) e linearmente independentes formam uma base do espaço. Ou
seja, qualquer vetor jxi pode ser escrito como:
9ai (i = 1; ::; n) 2 R ;
m
X
i=1
a2i 6= 0 : jxi =
57
m
X
i=1
ai jwi i :
Ou, de outra forma, num espaço de dimensão n dado o conjunto de n vetor fjwi ig
(não nulos) LI, qualquer outro vetor é LD a este conjunto. Ou ainda, num
espaço de dimensão n qualquer conjunto de n + 1 vetores é LD. As quantidades
ai da expressão acima são chados de componente do vetor jxi na base fjwi ig.
Se o conjunto de n vetores LI jwi i são também ortogonais entre si
hwi j wj i = 0 para i 6= j
dizemos que esta base é ortogonal.
Um conjunto de m vetores jei i que respeitam
hei j ej i =
ij
;
(32)
i.e., são ortogonais entre si e normalizados, são chamados de ortonormais. Se
m = n (onde n é a dimensão do espaço) estes vetores formam uma base, chamada
de base ortonormal.
Observe que, se fjwi ig é uma base ortogonal do nosso espaço, podemos
facilmente construir com eles uma base ortonormal fjei ig fazendo
jei i =
1
1
jwi i = p
jwi i
jwi j
hwi j wj i
Este procedimento se chama a normalização dos vetores jwi i.
Dada uma base ortonormal fjei ig podemos facilmente usar o produto
interno para encontrar as componentes de um vetor qualquer nesta base. Basta
para isso tomar o produto interno do vetor expandido com os elementos da base
jxi = a1 je1 i + a2 je2 i + ::: =) he1 j jxi = a1 he1 j e1 i + a2 he1 j e2 i + ::
Usando agora (32) temos
he1 j xi = a1 he1 j e1 i = a1
ou, de forma geral
ai = he1 j xi :
Assim, numa base ortonormal as componentes do vetor nesta base é o produto
interno do vetor com cada elemento da base (ou a projeção de jxi na direção
jei i).
Além disso, para uma base ortonormal, temos
3
" n
#2 n
n X
n
X
X
X
hxj yi =
ai hei j 4
bj jej i5 =
ai aj hei j ej i
i=1
=
n X
n
X
i=1 j=1
j=1
ai bj
ij
=
i=1 j=1
n
X
ai bi :
i=1
Que é uma expressão idêntica a de…nição anterior do produto interno (31), mas
agora com as componetes do vetor na base fjej ig. Assim, o produto interno
58
entre dois vetores pode ser calculado pelas componentes originais deste vetor ou
pela suas componentes em qualquer base ortonormal.
Lembre que o nosso vetor é a seqüência ordenada x1 ; x2 ; ::: ou seja
0
1
x1
B x2 C
B
C
jxi = B . C
@ .. A
xn
Estas são as componentes do vetor e não se referem à base alguma. Já as
quantidades ai acima são as componentes numa determinada base.
Em especial, para o produto interno de um vetor com ele mesmo, i.e., a
norma deste vetor, temos
3
" n
#2 n
n X
n
X
X
X
2
aj jej i5 =
ai aj hei j ej i
jxj = hxj xi =
ai hei j 4
j=1
i=1
=
n
n X
X
ai aj
ij
=
n
X
i=1 j=1
a2i :
i=1
i=1 j=1
Exemplo: Voltando para o nosso exemplo em 2 dimensões tomemos o vetor
com componentes x1 = 1; x2 = 2. Que na representação matricial assume a
forma
1
jxi =
2
a norma deste vetor vale
2
2
2
jxj = (x1 ) + (x2 ) = 12 + 22 = 5
Uma base para este espaço é qualquer conjunto de dois vetores LI. Por exemplo,
temos a base
1
2
jf1 i =
; jf2 i =
1
3
Fácil ver que
a jf1 i + b jf2 i = 0 = a
1
1
2
3
+b
)
a + 2b = 0 ) a =
2 + 3b = 0 ) a =
2b
;
3b
que só pode ser satisfeita para a = b = 0. Logo jf1 i e jf2 i são LI e, consequentemente, formam uma base do espaço. Entretando
hf1 j f2 i =
1
2
3
1
= 5 6= 0 ;
esta base não é ortogonal. As componentes de jxi na base fjfi ig valem
jxi = c1 jf1 i + c2 jf2 i = c1
1
1
+ c2
2
3
=
c1 + 2c2 = 1 ) c1 = 1 2c2 ;
c1 + 3c2 = 2 ) 1 2c2 = 2 3c2 ) c2 = 1 ) c1 =
59
c1 + 2c2
c1 + 3c2
1:
=
1
2
(temos de resolver o sistema de equações). Assim, as componentes de jxi na
base fjfi ig valem: c1 = 1, c2 = 1. Fácil ver que
2
2
2
2
(c1 ) + (c2 ) = 1 + 1 = 2 6= 5 = (x1 ) + (x2 ) ;
ou seja, não podemos usar estas componentes para calcular a norma do vetor.
Tomemos agora outros dois vetores
1
1
jw1 i = jf1 i ; jw2 i =
:
Facil ver que estes vetores também são LI. Mas, além disso
hw1 j w2 i =
1
1
1
1
=1
1=0:
Assim, fjwi ig é uma base ortogonal. As componentes c0i de jxi nesta base
valem
c01
1
1
1
1
+ c02
=
1
2
c01 + c02 = 1 ) c01 = 1
c01
c02 = 2 ) c02 =
c02
1
2
3
1
=
2
2
c01 = 1 +
Mais uma ver
9 1
41
+ =
6= 5 :
5 4
20
Mas, como a nossa nova base fjwi ig é ortogonal, podemos aplicar o processo de
normalização e de…nir uma nova base fjei ig com
2
2
(c01 ) + (c02 ) =
jw1 i
1
=p
jw1 j
2
jw2 i
1
je2 i =
=p
jw2 j
2
je1 i =
1
1
1
1
As componentes c00i de jxi na base fjei ig valem
1
jxi = c001 je1 i + c002 je2 i = p
2
p
p
c001 + c002 = 2 ) c001 = 2 c002
p
p
2
c001 c002 = 2 2 ) c002 =
2
p
p
2
3p
00
c1 = 2 +
=
2
2
2
60
c001 + c002
c001 c002
=
1
2
onde agora podemos usar a projeção
1
c001 = he1 j xi = p
2
1
c001 = he2 j xi = p
2
1
1
2
1
1
1
3
=p ;
2
1
1
= p ;
2
2
(não precisamos resolver o sistema de equações). Além disso, nas componentes
de jxi na base ortonormal fjei ig temos
2
2
(c001 ) + (c002 ) =
1 9
2
2
2
+ = 5 = (x1 ) + (x2 ) = jxj
2 2
Um conjunto de m vetores fjei ig ortonormais, com m = n, é também
chamado de um conjunto ortogonal completo. Para m < n os vetores fjei ig
são chamados de um conjunto ortogonal incompleto. Este conjunto forma uma
base para um sub-espaço de dimensão m do espaço vetorial de dimensão n.
Assim, encontrar uma base para um espaço vetorial é equivalente a encontrar
um conjunto completo de vetores ortogonais (e normalizá-los).
Uma base bastante muito conveniente (e simples de construir) é a seguinte
0 1
0 1
0 1
1
0
0
B 0 C
B 1 C
B 0 C
B C
B C
B C
B C
B C
B C
je1 i = B 0 C ; je2 i = B 0 C ; je3 i = B 1 C ; :::
B 0 C
B 0 C
B 0 C
@ A
@ A
@ A
..
..
..
.
.
.
Fácil ver que esta base é ortonormal. Além disso, nesta base as componentes
do vetor são exatamente as componentes do vetor na base
0
1
x1
n
B x2 C X
jxi = @
ai jei i ) ai = hei j xi = xi :
(33)
A=
..
i=1
.
Esta é a chamada base canônica.
6.1
Operadores, autovetores e autofunções no Rn
Em Rn dado um conjunto de n2 números reais Mij (i; j = 1; 2; :::n) podemos
de…nir o seguinte mapa entre as componentes de dois vetores jxi e jyi deste
espaço
n
X
yi =
Mik xk
k=1
ou, simbolicamente
^ jxi
jyi = M
61
onde o chapéu indica que M não é um número, mas sim o que chamamos de operador. Ou seja, dado um espaço vetorial, um operador é um mapa entre vetores
^ : V ! V ). Na notação matricial introduzida anteriormente, os
deste espaço (M
operadores podem ser identi…cados como matrizes n n.
Como exemplo, vamos estudar as operações de rotações num plano. Ou seja,
vamos trabalhar num espaço com n = 2. Suponha que um vetor neste espaço
tenha coordenadas (x1 ; x2 ). Se aplicarmos uma rotação de um ângulo no
sentido anti-horário, neste vetor quais as componentes (x01 ; x02 ) do novo vetor
obtido? Fazendo desenhos no plano é fácil ver que
x01
x02
=
cos
sin
sin
cos
x1
x2
:
Ou seja, o conjunto de quatro números Rij , ou a matriz
^( )=
R
cos
sin
sin
cos
;
é um operador de rotação no nosso espaço bidimensional. Um caso
particular é o operador de rotação de um ângulo de 1800
^( )=
R
1
0
0
1
:
Um outro exemplo é o operador que troca a troca a coordenada x1 por x1 (i.e.,
coloca um espelho no plano normal a x2 ), chamado de operador de paridade em
x1
1 0
P^1 =
:
(34)
0 1
Observe que isso não é nenhuma rotação.
6.1.1
Produto externo
Além do produto interno, realizado entre vetores de um certo espaço vetorial,
podemos também de…nir o produto entre vetores de dois (ou mais) espaços
vetoriais diferentes
a b ; a 2 V1 ; b 2 V 2 :
A quantidade assim obtida é um novo vetor num terceiro espaço vetorial V3 com
dimensão
dim V3 = dim V1 : dim V2 :
Na representação matricial, onde todo vetor é uma matriz m n, uma forma
62
bastante conveniente de implementar o produto tensorial é através da de…nição
0
0
1
1
a11
a1m
a11 B
a1m B
B
C
..
.. C B B
..
..
..
A B = @ ...
@
A
.
.
.
. A
.
a1n
anm
a1n B
anm B
!
! 1
0
B11
B11
a1m
B a11
C
..
..
..
..
B
C
.
.
.
.
B
C
B
C
.
.
..
..
..
(35)
=B
C :
.
B
C
!
!
B
C
B
B
11
11
@
A
a1n
anm
..
..
..
..
.
.
.
.
Ou seja, é a matriz formada quando multiplicamos a matriz da direita com cada
elemento da matriz da esquerda. Este é o chamado produto de Kronecker.
No espaço vetorial das seqüência, que estamos trabalhando, temos dois espaços vetoriais diferentes: o espaço dos vetores e o espaço dos duais. Podemos
assim estabelecer o produto externo entre dois elementos de cada um destes
espaços
^ = jxi hyj :
M
Pela de…nição acima é fácil ver que esta nova matriz tem componentes
^ ij = xi yj :
M
^ é a matriz
ou seja, neste caso, M
0
x1 y1
B x2 y1
^ =B
M
B ..
@ .
xn y1
x1 y2
x2 y2
..
.
xn y2
..
.
(36)
x1 yn
x2 yn
..
.
xn yn
1
C
C
C :
A
Usando o produto de Kronecker, para o produto de
espaço com n = 3 temos
0
1
0
x1 y1 y2
x1
@ x2 y1 y2
y1 y 2 y3
jxi hyj = @ x2 A
x3
x3 y1 y2
dois vetores temos num
y3
y3
y3
1
0
x1 y2
x2 y2
x3 y2
(37)
que na mais é que a expressão (??) organizada numa forma matricial. A quantidade acima é chamada um tensor de segunda ordem.
63
x1 y1
A = @ x2 y1
x3 y1
1
x1 y3
x2 y3 A ;
x3 y3
Da de…nição acima é fácil ver que
20
1
x1
T
y1 y 2 y3
(jyi hxj) = 4@ x2 A
x3
0
1
y1
@ y2 A
x1 x2 x3
y3
= jxi
de forma geral
(A
3T
5
hyj :
T
B) = B T
AT :
Se jxi 2 V e dim V = n a quantidade acima pode ser vista como um vetor
num espaço V 0 de dimensão n2 , ou, por ser uma matriz n n, como um operador
agindo no espaço V . Ou seja, matematicamente um tensor de segunda ordem
pode ser pensado visto como um operador. Para o produto de…nido acima
^ como
(entre um tensor e o dual), em MQ estamos interessados apenas em M
um operador agindo em V .
A aplicação deste operador num vetor jzi é a multiplicação matricial
0
10
1 0 Pn
zi x1 yi
x1 y1 x1 y2
x1 yn
z1
Pi=1
n
B
B x2 y1 x2 y2
C
B
C
x
y
z
2 n CB 2 C
i=1 zi x2 yi
B
^ jzi = (jxi hyj) jzi = B
=B
M
B ..
C
B
C
..
.
.
..
.
..
.. A @ .. A @
@ .
.
Pn .
xn y1 xn y2
xn yn
zn
i=1 zi xn yi
0
1
1 0
1 0
Pn
x1 Pi=1 zi yi
x1
x1 hyj zi
B x2 n zi yi C B x2 hyj zi C B x2 C
i=1
C
C B
C B
B
=B
C = B .. C hzj yi
C=B
..
..
@
@
@
A
A
. A
.
Pn.
xn
xi i=1 zi yi
xn hyj zi
= jxi hzj yi
(38)
A notação de Dirac possui uma forma muito conveniente de expressar o
^
produto externo acima e, ao mesmo tempo, salientar a interpretação de M
como um operador:
jxi hyj jxi hyj
pois, com isso, a aplicação deste produto externo num vetor jzi pode ser simbolicamente calculado como
(jxi
hyj) jzi
(jxi hyj) jzi = jxi hyj jzi
jxi hyj zi :
Que é exatamente a expressão (38).
A de…nição acima, apesar de ser apenas uma mudança de notação, simpli…ca
absurdamente a nossa vida. Suponha, por exemplo, que você tenha 2 operadores
P^1 = je1 i
1
je1 i = p
2
je2 i ; P^1 = je2 i
1
1
1
; je2 i = p
2
64
je2 i
1
1
1
C
C
C
A
e quer saber qual operador corresponde a composição destes operadores P^ =
P^1 P^2 . Na notação matricial temos:
1
2
1
= je2 i je1 i =
2
1
1
= P^1 P^2 =
1
4
1
1 1
=
1 1
2
P^1 = je1 i
P^2
P^
1
1
je2 i =
1
1
1
1
;
1
1
1
1
1
1
1
1
=
1
4
2
2
2
2
Usando a notação de Dirac, temos
P^ = P^1 P^2 = (je1 i he2 j) (je2 i he1 j) = je1 i he2 j e2 i he1 j = je1 i he1 j
=
1
2
1
1
1
1
Ou seja, apenas no …nal das contas precisamos usar a forma explicita das matrizes.
Além disso, a notação de Dirac nos permite identi…car uma série de propriedades de certos operadores. Vejamos, por exemplo, o seguinte operador
^ =
M
n
X
i=1
jei i
n
X
hei j =
i=1
jei i hei j
onde fjei ig é uma base ortonormal qualquer de um espaço de dimensão n.
Assim, qualquer vetor pode ser decomposto em
jxi =
n
X
k=1
ck jek i
e a aplicação do nosso operador em jxi fornece
^ jxi =
M
=
n
X
jei i hei j
i=1
n X
n
X
i=1 k=1
n
X
k=1
ck jei i
ck jek i =
ik
=
n
X
k=1
n X
n
X
i=1 k=1
ck jei i hei j ek i
ck jek i = jxi
para qualquer vetor do nosso espaço. Com isso concluímos que
^ jxi = jxi ; 8 jxi 2 V ) M
^ =I
M
Onde I é o operador identidade no nosso espaço (numa representação matricial
65
a matriz unitária). O argumento pode também ser facilmente invertido
jxi =
=
n
X
ck jek i ) ck = hek j xi ) jxi =
k=1
n
X
k=1
!
n
X
jek i hek j jxi )
k=1
n
X
k=1
hek j xi jek i =
n
X
k=1
jek i hek j xi
jek i hek j = I :
Estas manipulações mostram a força da notação de Dirac.
A expressão
n
X
jek i hek j = I ;
(39)
k=1
chama-se resolução da identidade.
Entretanto em MQ ocorre também o produto externo de dois vetores e não
apenas de um vetor com o dual. Neste caso, para jxi 2 V1 ; jyi dim V1 = 2 e
jyi 2 V2 ; dim V2 = 3, temos
0
0
1 1 0
1
y1
x1 y1
0
1 B x1 @ y2 A C B x1 y2 C
B
C B
C
y1
B
C B
C
x1
@ y2 A = B
0 y3 1 C = B x1 y3 C
jxi jyi jxyi =
B
C
B
C
x2
y1
B
C B x2 y1 C
y3
@ x2 @ y2 A A @ x2 y2 A
x2 y3
y3
Que, obviamente, não é um operador nem em V1 nem em V2 , mas sim um vetor
num novo espaço com dim = 2 3 = 6. Como veremos com detalhes no futuro,
este produto descreve um sistema quântico composto de dois subsistemas jxi e
jyi (e.g., duas partículas).
6.1.2
Auto-vetores
Uma relação entre operadores e vetores que é de especial interesse é quando a
aplicação de um operador sobre um vetor resulta num vetor na mesma direção
(i.e., proporcional) ao vetor original. Isso é, quando:
^ jxi = a jxi ; a 2 R ; jxi =
M
6 0:
^ e que a é o autovalor
Neste caso, dizemos que jxi é um autovetor do operador M
do autovetor jxi.
Por exemplo, se aplicarmos o operador P^ (34) no vetor
0
1
jp1 i =
teremos
P^ jp1 i =
1
0
0
1
0
1
66
=
0
1
= jp1 i ;
Ou seja, o vetor jp1 i é um autovetor de P^ com autovalor 1. Já o vetor
jp2 i =
1
0
1
0
) P^ jp2 i =
0
1
1
0
1
0
=
Assim, jp2 i é outro autovetor de P^ , mas com auto valor
jp3 i =
1
1
1
0
)
0
1
1
1
=
1
0
=
1
1
=
jp2 i :
1: Já o vetor
6= a jp3 i
então, jp3 i não é auto vetor de P^ . Da mesma forma, qualquer vetor é au^ ( ) com autovalor 1, pois
tovetor de R
^ ( ) jxi =
R
1
0
0
1
x1
x2
=
x1
x2
=
jxi :
^ ( =2) não possui nenhum autovetor.
Além disso, o operador R
^ com autovalor m,
Observe que, se jxi é autovetor de M
^ jxi = m jxi ;
M
o vetor
jx0 i = a jxi ; a 2 R ;
também será autovetor com o mesmo autovalor
^ jx0 i = M
^ a jxi = aM
^ jxi = am jxi = m (a jxi) = m jx0 i :
M
Com isso, dizemos que jxi e jx0 i são os mesmos autovetores. Usualmente estaremos interessados em vetores normalizados, assim, teremos apenas um vetor e a
constante multiplicativa é determinada no processo de normalização.
6.2
Mudança de base
Como vimos anteriormente, a forma explicita das componentes do vetor dependem de qual base escolhemos.
Se numa certa base fjei ig um vetor jvi tem componentes
X
jvi =
vi jei i
i
numa outra base fje0i ig este mesmo vetor terá outras componentes
X
jvi =
vi0 je0i i
i
Se você escolher uma certa base ortonormal fjei ig, como comparar suas
quantidades com as de algém que ecolheu outra base ortonormal fje0i ig? Ou
seja, como vi se relaciona com vi0 ?
67
Para saber isso basta lembrar que todos estes vetores fomam uma base do
espaço. Assim, podemos escrever
X
jei i =
aij e0j ;
j
onde, sendo nossa base ortonormal, os coe…cientes desta expanção tem a forma
X
e0j ei i je0i i
aij = e0j ei i =) jei i =
j
Assim, para um vetor qualquer jvi podemos escrever
jvi =
X
i
vi jei i =
XX
i
j
vi e0j ei i e0j =
X X
j
i
!
vi e0j ei i
e0j
:
(40)
Ou seja, se vi são as componentes de jvi na base fjei ig as componentes vi0 deste
mesmo vetor na base fje0i ig são
X
vj0 =
vi e0j ei i
i
As quantidades he0i j ej i também podem ser organizadas numa matriz com
linha i e coluna j. Esta matriz é chamada de matriz de mudança da base fjei ig
para a base fje0i ig.
Vemos assim como é conveniente identi…carmos nossos vetores com matrizes.
De forma geral, todas as quantidades com um único índice podem ser vistos
como uma matriz coluna de n elementos e qualquer quantidade com dois índices
como uma matriz n n.
A expressão (40) acima pode ser facilmente obtida se usarmos a resolução
da identidade (39)
n
X
e0j e0j = I :
j=1
Pois
jvi =
=
X
vi jei i = I jvi =
i
n
n
XX
j=1 i=1
vi e0j
n
X
j=1
e0j
e0j
n
X
i=1
vi jei i
e0j ei i :
Ou seja, a resolução da identidade nos permite mudar de base num espaço
vetorial.
68
6.3
Espaço de Hilbert
Nosso objetivo aqui é obter uma generalização dos resultados da seção anterior.
O primeiro ponto é lembrar que nossos vetores, e os números que multiplicam
estes vetores, são todos reais. Assim, a primeira generalização que podemos
fazer é dizer que um vetor num espaço de dimensão n é qualquer seqüência de
números complexos 1 ; 2 ; :::; n ( i 2 C) e que nossos vetores podem se
multiplicados também por números complexo
j i+
j i=j i ;
;
2C;
com
i
=
i
+
i
:
Até aqui nada mudou. O ponto agora é que devemos lembrar que se
número complexo, podemos ter
2
é um
<0;
(e.g., para
= i). Isso implica que a somatória do quadrado de números
complexo não é uma quantidade positiva de…nida e, consequentemente, a norma
de…nida anteriormente pode nos dar valores negativos. Não queremos ter vetores
de norma negativa (isso é, na verdade, contra a de…nição do que é uma norma).
Podemos resolver este problema lembrando que
:
0; 8 2 C
onde, além disso,
: =0)
=0:
Assim, podemos recuperar a característica de positividade da nossa norma se,
no lugar de (31) de…nirmos o produto interno como
h j i=
1 1
+
2 2
+ ::: +
n n
=
n
X
i i
;
(41)
i=1
com isso temos, novamente,
2
j j =h j i=
com
n
X
i i
0
i=0
2
j j = 0 =) j i = 0 :
A única diferença neste produto interno é que, no lugar da simetria, temos
agora uma simetria conjugada
h j i=
n
X
i=0i
i i
=
n
X
(
i i)
i=0
=
n
X
i=0
69
i i
!
=h j i:
Da mesma forma, no que se refere a representação matricial, continuamos
representando nossos vetores por matrizes coluna
0
1
1
B 2 C
B
C
j i=B . C
@ .. A
n
mas, para ser compatível com o produto interno (41), devemos de…nir o dual de
j i, não apenas como o transposto, mas como o transposto conjugado
h j=
1
2
n
:
Com a de…nição acima vemos que, para o produto externo entre os vetores,
no lugar de
T
jxi hyj = (jyi hxj) :
temos agora
T
j i h j = (j i h j) :
A segunda generalização que vamos fazer é permitir que a dimensão do
espaço assuma qualquer valor, incluindo o in…nito. Ou seja, vamos admitir
espaços com n = 1. Esta é, na verdade, a motivação deste desenvolvimento.
Neste caso, obviamente não podemos mais representar nossos vetores por matrizes. Mas podemos continuar usando todas as expressões anteriores (fazendo
n = 1).A grande diferença é que antes, bastava que cada elemento do nosso vetor estivesse bem de…nido (não fosse in…nito) e, certamente, todas as expressões
de…nidas também estariam bem de…nidas.
Agora, para n = 1, pode acontecer de cada elemento do nosso vetor estar
bem de…nido, e mesmo assim não conseguirmos calcular quantidades como, por
exemplo, o produto interno. Ou seja, agora precisamos exigir que as somatórias
de…nidas anteriormente convirjam.
Por exemplo, podemos de…nir as componentes do nosso “vetor” como
1
; k2N :
k 1=2
Cada componente está bem de…nida. Em especial, para n ! 1
xk =
x1 =
1
1=2
(1)
=0:
Entretanto, se desejarmos calcular a norma deste “vetor” teremos7
2
jxj =
7 Lembre
1
1
X
X
1
1
1
=
1=2
1=2
k
k
k
k=1
k=1
que
diverge para s
1.
1
X
1
ns
n=1
70
!1:
E não podemos utilizar para estas componentes a noção de norma que é indispensável em todas as nossas análises. Destarte, se quisermos de…nir um espaço
vetorial tratável, devemos exigir que os vetores do nosso espaço respeitem a
restrição
1
X
j kj < 1 :
k=1
Ou seja, para nós agora, vetores são todas as seqüência, …nitas e in…nitas, sobre
o corpo dos complexos, tal que a soma do módulo quadrado convirja.
Um espaço vetorial de dimensão arbitrária (incluindo in…nito) sobre o corpo
dos complexos onde (para todo elemento) está de…nido um produto interno,
juntamente com uma condição técnica de completeza8 forma um espaço de
Hilbert.
Todo o desenvolvimento da MQ, é o estudo do espaço de Hilbert.
Todos os conceitos desenvolvidos anteriormente, incluindo a noção de ortogonalidade e base, são válidos no EH. A diferença é que agora a nossa base pode
conter in…nitos termos.
Problem 18 Mas será que, como os casos anteriores, este espaço possui uma
base?
Para um espaço de dimensão N (…nito) qualquer, podemos sempre construir
uma base fjei ig na forma canônica
0 1
0 1
0 1
..
0
1
B . C
B 1 C
B 0 C
B C
B C
B C
(42)
; jeN i = B 0 C :
je1 i = B 0 C ; je2 i = B 0 C ;
@ 0 A
@ A
@ A
..
..
1
.
.
Sendo cada jei i uma matriz N 1.
escrito como:
0
x1
B x2
B
jxi = B .
@ ..
xN
Obviamente, qualquer vetor jxi pode ser
1
N
C X
C
xk jek i
C=
A
k=1
Onde, como vimos, as componentes de um vetor qualquer na base canônica
são as próprias componentes do vetor.
Além disso, esta base é ortonormal
hei j ej i =
8 Convergência
ij
de todas as seqüências de Cauchy j
71
:
n
lj
! 0.
Podemos imaginar uma base do nosso espaço de Hilbert das seqüenciais
in…nitas como uma coleção de in…nitos termos na forma (42). Ou seja,
0 1
0 1
0 1
0
0
1
B 1 C
B 1 C
B 0 C
B C
B C
B C
(43)
je1 i = B 0 C ; je2 i = B 0 C ; je3 i = B 0 C ;
@ A
@ A
@ A
..
..
..
.
.
.
O ponto aqui é que, para qualquer um destes elementos, temos
hei j ei i = 1 < 1 =) jei i 2 H ; i = 1; 2; 3; :::
Ou seja, todos os (in…nitos) elementos desta seqüência estão em H. Além disso,
qualquer elemento de H pode ser escrito como
j i=
1
X
k=1
k
jek i ;
k
2C:
Com isso, fjek ig forma uma base do nosso espaço H. Esta base possui in…nitos elementos e, conseqüentemente, nosso espaço tem dimensão in…nita.
6.4
O espaço L2
A generalização da dimensão introduzida anteriormente parece a mais geral que
podemos fazer. Isso seria verdade se não existissem vários tipos de in…nito,
também chamado de cardinalidade. Este é um assunto bastante complicado
da teoria dos conjuntos. Na verdade, a cardinalidade mede o “tamanho” de
um conjunto. Mas, como vimos, a dimensão de um espaço está diretamente
relacionada com o tamanho (ou o número de elementos) da base.
Para um conjunto qualquer podemos considerar duas noções: tamanho
do conjunto e o número de elementos deste conjunto. Para qualquer
conjunto com um número …nito de elementos estas noções coincidem. Um conjunto com três elementos tem um tamanho, ou cardinalidade, três. Além disso,
para conjuntos …nitos, sempre que pegamos uma parte deste conjunto (um subconjunto) este tem um tamanho menor que o original. A comparação entre os
tamanhos dos conjuntos está ligada com a idéia de bijeção entre os elementos
destes conjuntos.
Remark 19 Se podemos criar uma bijeção entre dois conjuntos, então estes
conjuntos tem o mesmo tamanho.
Assim, o conjunto de 3 frutas tem o mesmo tamanho do conjunto de 3
animais. Esta idéia também é válida para conjuntos com in…nitos termos. Mas,
neste caso, a noção de cardinalidade e número de elementos não é mais a mesma.
Por exemplo, tomemos o conjunto dos naturais N e o conjunto dos números
pares P . Certamente estes conjuntos não têm os mesmos elementos. Em especial
o número 1 está no primeiro conjunto e não está no segundo. Mais ainda, qualquer elemento do segundo conjunto está no primeiro,mas o contrário
não é verdade.
72
Problem 20 Qual destes conjuntos é maior?
Poderíamos então imaginar que o conjunto dos naturais é maior que o conjunto dos números pares. Entretanto, é possível estabelecer uma bijeção entre os
naturais e os números pares. Obviamente, dado um número natural n, podemos
fácilmente associar a ele o número par
p = 2n
Mas, além disso, dado um número par p 2 P associamos a ele (de forma
unívoca) o natural
p
n=
2
Ou seja, a cada número inteiro temos um (único) número par associado
e vice-versa. Isto mostra que os dois conjuntos têm o mesmo tamanho,
ou a mesma cardinalidade.
Assim, para conjuntos in…nitos, podemos pegar apenas uma parte deste
conjunto e obter um conjunto com o mesmo tamanho.
Vejamos um exemplo um pouco mais complicado. Recapitulando, um dos
resultados da teoria dos conjuntos é que sempre que for possível estabelecer
uma bijeção entre dois conjuntos estes conjuntos têm a mesma cardinalidade.
Peguemos, por exemplo, o conjunto dos naturais N, i.e., a seqüência
0 1
1
B 2 C
B C
B 3 C
@ A
..
.
e a seqüência de um par ordenado de naturais, o produto N N, i.e., as seqüências
1
0
1; 1 1; 2
B
. C
B 2; 1 2; 1 .. C
A
@
..
..
.
.
Problem 21 Qual destes conjuntos é maior?
Aparentemente o segundo conjunto tem mais elementos que o primeiro. Entretanto, estes dois conjuntos podem ser mapeados (um-pra-um) através do
diagrama de Cantor
identi…cando n ! (x; y) ou seja
0
! (0; 0) ; 1
! (1; 0) ; 2
! (0; 1) ; 3
! (2; 0) ; 4
! (1; 1) ; 5
! (0; 2) ; 6
Desta forma, o par ordenado N N tem a mesma cardinalidade de N, ou
seja, são do mesmo tamanho e tem o mesmo tipo de in…nito. Como resultado
disso, os números racionais Q, que podem ser escritos como a=b, com a; b 2 N
e b > 0 tem a mesma cardinalidade dos naturais.
73
! (3; 0) :::
Figure 10: Figura da Wikipedia
Mais ainda, com argumentos semelhantes é possível mostrar que qualquer
seqüência …nita de números naturais N N ::: N pode ser mapeado nos
naturais N e conseqüentemente, tem a mesma cardinalidade. Esta cardinalidade
é chamada de in…nito (pois N é in…nito) contável. Também chamado de @0
(aleph-0).
Remark 22 Assim, se os elementos que formam a base de um conjunto tem
uma cardinalidade contável (possui uma bijeção com N) dizermos que a dimensão do espaço é contável.
Talvez você imagine com isso que todos os conjuntos in…nitos têm a mesma
cardinalidade, mas isso não é verdade.
Agora, se você considerar o conjunto dos reais, é impossível estabelecer
uma relação um-pra-um entre este conjunto e os naturais. Mais precisamente,
é possível estabelecer a relação
N !R;
mas a inversa não
R9N:
Podemos dizer que, apesar de ambos serem in…nitos, o conjunto dos
reais é maior que o dos naturais. Mais ainda, qualquer intervalo …nito da
reta real, e.g. [0; 1], tem mais elemento que qualquer seqüência …nita de todos
os naturais.
Assim, se você …zer um HD de computador capaz de armazenar todos os
naturais, este HD pode encher e não registrar os reais (ou mesmo um internalo
dos reais).
74
Com isso, os reais são de uma cardinalidade diferente (maior) que os naturais.
Dizemos que o conjunto dos reais é um in…nito incontável. Também chamado
de @1 (aleph-1).
Remark 23 Assim, se não for possível estabelecer uma bijeção entre os elementos da base e N, mas for possível estabelecer entre R, os elementos que
formam a base de um conjunto tem uma cardinalidade incontável dizermos que
a dimensão do espaço é incontável.
Remark 24 Vemos então que todo o desenvolvimento apresentado na seção
anterior sobre o espaço de Hilbert diz respeito, na verdade, apena a in…nitos
contáveis.
Do que foi dito acima, vemos que o nosso espaço H, de…nido anteriormente,
tem dimensão in…nita, mas contável. Pois possui uma base com um in…nito
contável de elementos fjek ig. A existência de diferentes tipos de in…nito nos leva
a crer (o que é verdade) que possam existir também espaços com uma dimensão
(e consequentemente uma base) in…nita incontável.
Considere agora uma função f (x) sobre os reais num intervalo x 2 [a; b].
Esta função pode ser considerada uma seqüência
1
0
f (x1 )
B f (x2 ) C
C
B
B f (x3 ) C
C
B
C
B
..
A
@
.
f (xn )
entretanto, neste caso o índice da nossa seqüência (x) não é um número
natural N, mas um número real R. Pois podemos fazer x2 x1 < " para qual
valor de ". Assim, entre quaisquer dois elementos existem in…nitos elemento:
0
1
f (x1 )
B
C
..
B
C
.
B
C
B f (x1;0001 ) C
B
C
B
C
..
(44)
B
C
.
B
C
B f (x2 ) C
B
C
B
C
..
@
A
.
f (xn )
Este tipo de seqüência é, certamente, diferente da de…nida anteriormente. Mais
precisamente, a nossa seqüência, assim como a anterior, possui in…nitos termos,
mas esta seqüência possui um in…nito incontável de termos.
Assim, aquele HD hipotético capaz de registrar uma seqüência in…nita (xk ),
não seria capaz de registrar a função acima.Certamente o procedimento
anterior para a construção de uma base canônica falha neste caso.
75
Com isso, não há nenhuma razão para crer que os resultados desenvolvidos
na seção anterior sejam válidos para funções sobre os reais.
Vamos então tentar construir um espaço vetorial para as nossas funções f .
Como uma extensão natural da notação anterior, se queremos um vetor que
represente a nossa função f (x) ; x 2 [a; b], podemos chamá-lo de jf i. Ou seja,
jf i é a coleção ordenada de todos os valores da função num certo intervalo (a
“seqüência” simbólica (44)). Observe que jf i não é a função calculada num
ponto, mas uma quantidade abstrata que representa uma coleção in…nita de
termos.
A soma destas quantidades pode ser de…nido de forma análoga a anterior.
Ou seja, a “seqüência” simbólica
jwi =
jf i +
jgi ;
;
2C
é de…nida como a coleção ordenada de todos os pontos w (x) = f (x) +
g (x) ; x 2 [a; b].
Na construção do nosso espaço, assim como …zemos anteriormente, o primeiro
ponto é a construção de um produto interno. Podemos fazer isso apenas generalizando a expressão anterior para o caso de duas “seqüências contínuas” jf i e
jgi (todas de…nidas, sempre, no mesmo intervalo)
h j i=
n
X
i i
i=0
! hf j gi =
Z
b
f (x) g (x) dx :
a
Com isso, novamente, garantimos a positividade do produto
hf j f i
0 ; hf j f i = 0 =) jf i = 0 ;
onde a última igualdade signi…ca f (x) = 0 para x 2 [a; b].
Novamente, para que o nosso produto faça sentido, devemos exigir que
hf j f i =
Z
a
b
2
jf (x)j dx < 1 :
(45)
Ou seja, o nosso espaço é o espaço das funções de quadrado integrável no intervalo [a; b], também chamado L2 (a; b).
O fato de que a soma (de…nida acima) de duas funções de quadrado integrável
é também ser de quadrado integrável, garante que L2 (a; b) é um espaço vetorial
(assim como as nossas seqüências em H).
O ponto (e toda a di…culdade do trabalho) é estudar a dimensão deste espaço.
Para isso, podemos invocar aqui o resultado de Fourie. Para qualquer função
(bem comportada) que respeite (45), de…nida no intervalo [ ; ] existe uma
correspondência unívoca entre esta função e a seqüência (contável)
f (x) =
1
X
xk exp (ikx)
k= 1
76
(46)
onde
Z b
1
xj = p
f (x) exp ( ikx) dx
(47)
2 a
Ou seja, registrar a seqüência contável xj é equivalente a registrar a função
(de…nida num intervalo incontável) f (x).
Assim, apesar do HD hipotético não poder registrar o valor da função em
todos os pontos, ele pode registrar a seqüência fxk g e, com isso, reconstruir a
função (exatamente) em todos os pontos. Ou ainda, mesmo estando a função
de…nida num contínuo de pontos, não precisamos de um conjunto incontável
para especi…car a função. O fato de esta ser de quadrado integrável cria uma
relação entre estes pontos, de sorte que eles possam ser especi…cados pelo conjunto menor formado por uma seqüência contável de pontos.
Mais ainda, existe uma relação unívoca entre o espaço das funções em
L2 (a; b) e o espaço das seqüências contáveis in…nitas. O que mostra que estes
dois espaços têm a mesma dimensão. Ou seja, se existir uma base contável para
a seqüência fxk g existirá também uma base contável para L2 . Observe que
ainda não falamos nada sobre as sequencias acima (em especial, não sabemos
se estas seqüências pertencem a um espaço de Hilbert).
Ou ainda, existe uma base contável para o espaço L2 (a; b).
Além disso, existe um resultado, devido a Parseval, que a…rma
Z
1
X
2
jf (x)j dx =
x2j
j= 1
Ou seja, se a seqüência xj pertence ao nosso espaço de Hilbert H se
f 2 L2 . Ou seja, para toda sequencia xk 2 H existe uma função
f (x) =
1
X
k= 1
xk exp (ikx) ; f 2 L2
e para toda a função f 2 L2 existe uma seqüências
Z b
1
f (x) exp ( ikx) dx ; fxk g 2 H :
xj = p
2 a
Podemos assim considerar L2 (a; b) como um espaço de Hilbert H. E dizer
que a função f (x) pertence ao espaço de Hilbert L2 .
Observe que as próprias funções
1
p exp ( ikx)
2
pertencem a L2 ( ; ). Assim, se chamarmos estas funçõespde jek i (ou seja,
jek i é a coleção de todos os valores da função exp ( ikx) = 2 no intervalo
( ; )), podemos escrever (46) como
jf i =
1
X
k= 1
77
xk jek i :
Observe que
hek j ej i =
1
2
Z
exp ( i (k
j) x) dx =
kj
:
Ou seja, fjek ig é uma base (contável) para o nosso espaço L2 ( ; ) e esta
base é ortonormal. Além disso, xk são as componentes de jf i nesta base.
Sendo nossa base ortonormal, as componentes de f nesta base são simplesmente
a projeção:
Z b
1
f (x) exp ( ikx) dx ;
(48)
xk = hek j f i = p
2 a
que são as componentes xk da série de Fourie (47).
Estas funções fjek ig são um exemplo de funções ortogonais.
Assim, dado um vetor jf i 2 L2 podemos trabalhar com as componentes
deste vetor f (x), ou com as componentes xk deste vetor na base fjek ig.
Vemos então que todo o ferramental desenvolvido para seqüência de quadrado
somável é válido para funções de quadrado integrável. Além disso, as noções de
norma
p
jf j = hf j f i
e ortogonalidade
hf j gi = 0
podem agora ser estendida para estas funções.
Mais ainda, quando valamos agora sobre um vetor j i, podemos estar falando de uma matriz coluna, de uma seqüência in…nita, ou mesmo de uma
função. Toda as manipulações formais com j i são idênticas e, apenas quando
precisarmos calcular alguma quantidade explicitamente, precisamos especi…car
qual dos espaços de Hilbert estamos falando.
6.5
Rigged Hilbert space
Para o caso em que o intervalo se torna in…nito [ 1; 1], as nossas funções de
base
1
p exp ( ikx)
2
não pertencem mais a H. Entretanto, ainda assim é possível escrever
Z 1
1
hek0 j ek i =
exp [i (k k 0 ) x] dx
(k k 0 ) ;
2
1
E, mais ainda, para qualquer função f (k) bem comportada temos
Z 1
(k k 0 ) f (k) dk = f (k 0 ) :
1
78
Mas agora, como tanto k como x são contínuos, podemos também introduzir
os “vetores” fjex ig, cujas componentes são
1
ex (k) = p exp ( ikx) = (ek (x))
2
Da mesma forma que antes temos
Z 1
1
hex0 j ex i =
exp [i (x0
2
1
com
Z
1
(x
x) k] dk = (x0
x)
x0 ) f (x) dx = f (x0 )
1
No que segue, mudaremos a notação para
jex i
jxi ; jek i
jki
Se para qualquer vetor (este sim um vetor) legitimo jf i 2 L2 ( 1; 1) de…nirmos a quantidade
Z 1
jf i =
jx0 i hx0 j f i dx0
1
temos
hxj f i =
Z
1
1
0
Z
0
hxj x i hx j f i dx =
1
1
(x0
x) hx0 j f i dx = f (x)
Podemos dizer que a projeção de jf i na direção do “vetor” jxi é exatamente a
componente f (x).
Da mesma forma, fazendo
Z 1
jf i =
jk 0 i hk 0 j f i dk 0
1
Lembrando agora que (48)
1
f (k) = hkj f i = p
2
Z
b
f (x) exp ( ikx) dx ;
a
é exatamente a componente de Fourie da função f (onde estamos usando f (k) e
não xk porque k é contínuo) temos:
Z 1
Z 1
0
0
0
hk jf i =
hkj k i f (k ) dk =
(k 0 k) f (k 0 ) dk 0 = g (k)
1
1
Podemos dizer que a projeção de jf i na direção do “vetor” jki é exatamente a
componente f (k).
As funções ex (k) e ek (x) acima estão de…nidas no chamado espaço de Hilbert
generalizado. Neste espaço podemos tratar os vetores fjxig e fjkig como uma
79
base e dizer que f (x) são as componentes de jf i na base fjxig e f (k) suas
componentes na base fjkig.
Além disso, pela resolução da identidade temos
Z 1
Z 1
0
0
0
jk 0 i hk 0 j dk 0 = I
jx i hx j dx =
1
1
temos
Z
1
Z
1
jx0 i hx0 j f i dx0
jx i hx j f i dx = I
1
1
Z 1Z 1
jk 0 i hk 0 jx0 i hx0 j f i dk 0 dx0
=
jf i =
1
0
0
0
1
da forma explicita das funções temos
1
hkj xi = p exp ( ikx) :
2
é a matriz de mundança da base fjxig para a base fjkig. Podemos assim tratar
a transformada de Fourie apenas como uma mudança de base.
6.6
Operadores simétricos, ou hermitianos
Como vimos anteriormente, o produto externo de dois vetores j i e j i pode
^ é de…nido como
ser visto como um operador. Se um operador M
^ = j ih j ;
M
^ + será
então, seu hermitiano conjugado (ou o seu adjunto) M
^+
M
j ih j :
Para o caso do espaço de dimensão …nita, este operador é apenas o transposto
^ , mas a nomenclatura continua para o caso de dimenconjugado da matriz M
são in…nita. Neste caso podemos imaginar nossos operadores como matrizes
quadradas in…nitas.
^ jxi com o vetor jyi vale
O produto interno do vetor jzi = M
^ jxi
hyj zi = hyj M
;
podemos eliminar o parênteses acordando que o operador sempre age no vetor a
direita (o que é equivalente a acordar que o conjugado do operador age no dual
^ + jyi, mas basta convencionar
do vetor a esquerda, hyj zi = hwj xi com jwi = M
que ele age a direita). Com isso, temos
^ jxi = hy j i h jxi = h jyi hx j i = hx j i h jyi = hxj M
^ + jyi
hyj M
80
(49)
onde usamos
hy j i = h jyi :
^ acima é dito simétrico, ou hermitiano se
O operador M
^ =M
^+ ) j ih j = j ih j :
M
^ : H ! H podemos de…nir o seu
De forma geral, para qualquer operador M
+
^
adjunto M : H ! H usando (49)
^ + jyi ; 8x; y 2 H :
^ + : hyj M
^ jxi = hxj M
M
Assim, para um operador simétrico, ou hermitiano, temos
^ =M
^ + ) hyj M
^ jxi = hxj M
^ jyi ;
M
(50)
ou seja, para espaços de dimensão …nita são matrizes cuja transposto conjugado
é igual a ela mesma. Por exemplo, qualquer matriz na forma
0
1
a11 a12 a13
B a12 a22 a23
C
B
C
B a13 a23 a33
C ; aii 2 R ; i = 1; 2; 3::
@
A
..
..
..
..
.
.
.
.
Propriedades dos operadores hermitianos:
Imagine agora que você encontrou um autovetor j i de um operador her^ com autovalor , ou seja,
mitiano M
^ j i=
M
j i ;
observe que estamos usando a mesma letra apenas por conveniência, mas
enquanto j i 2 H.
Com isso, a propriedade acima fornece
^ jyi =)
^ jxi = hxj M
hyj M
^ j i = h j j i = h j i = h jM j i = h j j i = h j i :
h jM
Mas
h j i=h j i
com isso
h j i=
h j i
como
h j i=
6 0 ; h j i < 1,
81
2C
temos
=
)
2R:
Ou seja, todos os autovalores de um operador hermitiano são reais.
Na mecânica clássica os estados de um sistema são identi…cados como pontos
no chamado espaço de fase. Ou seja, dado um ponto no espaço de fase eu sei tudo
sobre o sistema. Já na mecânica quântica estes estados são identi…cados com
vetores no espaço de Hilbert. Ou seja, saber qual vetor representa o sistema
é saber tudo sobre ele. Além disso, observáveis (quantidade que podem ser
medidas) são associadas a operadores agindo neste espaço. Um dos postulados
da MQ a…rma que os valores possíveis de se obter numa medida deste observável
são (apenas) o autovalor do operador correspondente. Outro postulado a…rma
que este operador é hermitiano. O resultado acima mostra que esta exigência é
necessária para que valores medidos sejam reais.
Exemplo: Num espaço de dimensão 2 o operador
^2 =
0
i
i
0
:
(em MQ este é um dos operadores associados ao spin das partículas). É hermitiano.
Vamos encontrar seus autovalores. O processo geral é o seguinte: Encontrar
um autovetor signi…ca resolver a equação
^ j i=
M
^
j i) M
I j i=0:
^
A quantidade M
I é um novo operador. Para um espaço de dimensão …nita,
este operador é uma nova matriz. Vamos chamar esta nova matriz de
^
T^ = M
I
Nossa equação …ca
T^ j i = 0
Se T^ é uma matriz inversível, podemos calcular T^
lados da expressão acima
T^
1
T^ j i = T^
1
1
e multiplicar pelos dois
0)j i=0:
^ não terá
Ou seja, se T^ é inversível, o vetor j i é único e vale j i = 0. Assim, M
^
^
^
autovetor. Portanto: A única forma de M ter autovetor é que T = M
I
não tenha inversa. Para que uma matriz não tenha inversa, basta que
^
det T^ = det M
Para o nosso caso
^ = ^2
M
82
I =0:
Logo devemos exigir que
det (^2
I )=
0
i
i
0
1
0
0
1
=
i
i
=0;
ou seja,
2
( i:i) =
2
1 = 0 =)
2
= 1 =)
=
1:
Vemos então que ^2 tem dois autovaloes 1 = 1 e 2 = 1 e, como esperado,
ambos são reais.
Suponha agora que temos dois autovetores de um operador hermitiano
^ j i=
M
^ j i=
j i ; M
j i
com
6=
:
Para estes vetores podemos calcular
^ j i=h j j i=
h jM
^ j i=h j j i=
h jM
h j i ;
h j i
além disso, usando (49) temos
^ j i = h jM
^ j i =)
h jM
onde usamos que ;
h j i= h j i=
h j i
2 R. Com isso
[
Se usarmos agora
h j i=
6=
]h j i = 0 :
a igualdade acima implica
h j i=0:
Ou seja, autovetores correspondentes a autovalores distintos são ortogonais.
O resultado acima fornece uma forma prática e bastante útil de encontramos
bases ortogonais para um espaço qualquer. Bastando, para isso, encontrarmos
operadores hermitianos neste espaço.
Exemplo: Voltemos a nossa matriz
2
=
0
i
i
0
Sendo esta matriz hermitiana, devemos esperar que seus auto vetores sejam
ortogonais. Encontremos então estes autovetores. Voltando a equação de autovalores,
i
1
( 2
I) j i = 0 )
=0
i
2
83
sabemos que
=
1. Para
1
i
= 1 temos
i
1
1
i
1
=0)
2
i
1
=0
=0
2
2
Primeiro note que, se multiplicarmos a primeira equação por
i
1
2
i temos
=0
que é idêntica a segunda equação. Assim, na verdade, temos apenas uma
equação e duas incógnitas. Isso nada mais é do que uma conseqüência do
fato da matriz
1
i
i
1
não possuir inversa (ou ter determinante nulo). Lembre-se que construímos os
valores de impondo esta exigência. Assim, usando a única equação que temos
i
1
2
=0)i
=
1
2
Ou seja, o nosso autovetor tem a forma
j
+i
1
=
i
=
1
i
1
1
para qualquer valor 1 2 C. Lembre-se que, se multiplicarmos um autovetor
por uma constante ele continua sendo um autovetor (pois apontará na mesma
direção). Portanto não há nada de estranho em termos um fator arbitrário.
Tudo isso está relacionado com o fato da nossa matriz não ser inversível.
Isso é uma característica geral destes problemas. Para um sistema qualquer
^ exigindo
de dimensão N , construímos seus autovalores de um operador M
^
que a matriz M
I não tenha inversa. Isso faz com que, para estes valores
de , tenhamos um sistema de N 1 equações para N incógnitas. Com isso
sempre teremos uma parâmetro livre nos nossos autovetores. É a
existência deste parâmetro que nos permite normalizar nossos vetores. Ou seja,
escolhemos este parâmetro de forma que nossos vetores tenham norma 1.
Com isso, o autovetor associado ao autovalor 1 vale
+
= +1 ; j
+i
=
1
i
1
:
Da mesma forma, encontramos o autovetor associado ao auto-valor
1
i
i
1
1
2
=0)
1
i
1
i
+
2
2
=
1
=0
:
=0
Onde já sabemos que podemos usar apenas uma destas equações. Assim, usando
a segunda equação,
i 1+ 2=0) i 1= 2
84
Ou seja, o autovetor associado ao auto-valor
=
Como vimos, uma vez que
sejam ortogonais. De fato
h
+j
i=
+
1 ;j
6=
1
1
i=
=
1 vale
1
i
1
:
devemos esperar que os vetores j
i
1
i
1
=j
2
1j
(1
iej
+i
1) = 0 :
Assim, fj + i ; j ig formam uma base ortogonal do nosso espaço. Podemos
ainda normalizar esta base fazendo
je i = p
h
j
1
= p ei
2
j
i
i
1
i
=
1
p
j 1j 1 + 1
;
1
=p
2j
1
i
1
1
1j
1
i
2 R:
Ou seja, a nossa normalização também está de…nida a menos de uma
constante. Como veremos, os princípios da MQ nos permitem …xar arbitrariamente esta constante. Escolhendo o caso mais simples = 0 temos
1
je i = p
2
1
i
:
Da mesma forma, podemos de…nir o vetor normalizado
1
je+ i = p
2
1
i
estes vetores respeitam
he+ j e i = 0 ; he+ j e+ i = he j e i = 1
e, consequentemente, formam uma base ortonormal do nosso espaço.
Este resultado é geral. Para um espaço de Hilbert H de dimensão N qual^ neste espaço, os autoquer, inclusive in…nito, dado um operador hermitiano M
vetores deste operador formam uma base deste espaço. Assim, qualquer vetor
j i 2 H pode ser escrito como
j i=
N
X
ck j
=
k
k=1
ki
onde
^j
M
ki
85
j
ki
:
Os resultados anteriores nos permitem também veri…car diretamente a relação de completeza. Calculando
1
2
1
je+ i he+ j =
2
je i he j =
1
i
1 i
1
1
i
i
=
=
1
2
1 i
i 1
1
2
1
i
1
i
i
1
i
1
;
;
temos
je i he j + je+ i he+ j =
6.7
1
2
1 i
i 1
+
=
1
0
0
1
:
Operadores diferenciais
Recapitulando os resultados do exemplo anterior: ao resolvermos o problema
de autovetores para o operador 2 2 R2 obtivemos dois vetores ortogonais num
espaço de duas dimensões. Um resultado que vamos usar sem provar, pois isso
consumiria um tempo razoável, é:
Remark 25 Dado um operador hermitiano (não degenerado) num espaço de
Hilbert de dimensão N , este operador possui N autovetores (que, como sabemos,
são ortogonais). Consequente, a coleção de todos os autovetores de um operador
hermitiano forma uma base para o espaço de dimensão arbitrária N .
Esta é uma forma bastante prática para construir bases para espaços e é
exatamente o que vamos usar para construir nossas funções ortogonais.
Para qualquer espaço de dimensão …nita o procedimento anterior para encontrar os autovetores pode ser aplicado (obviamente com uma di…culdade algébrica
crescente).
Mas e quando N = 1? Como resolver um sistema de in…nitas equações?
Primeiramente, vamos analisar melhor o tipo de operadores que podem surgir
em espaços de dimensão in…nita. Como vimos a correspondência
Z
X
1
f (x) exp ( ikx) dx
jf i =
ck jek i ; ck = hf j ek i =
2
k
para funções L2 permite tratar a função (de…nida num intervalo contínuo), como
a seqüência discreta ck .
Lembre que, uma vez de…nida uma base, podemos pensar nos operadores
como atuando, não diretamente nos vetores, mas nos elementos da base. Ou
^ agindo em H dado pelo produto esterno
seja, para um operador D
^ = j ih j ;
D
e cada um destes vetores possui uma decomposição na base escolhida
X
X
j i=
i jei i ; j i =
i jei i
i
i
86
signi…ca que nosso operador, nesta mesma base, possui a decomposição
X
^ =
D
Dmn jem i hen j
mn
onde
Dmn =
m n
:
A ação deste operador num vetor j i pode ser escrito como
X
X
X
X
^
j i=
Dmn jem i hen j
Dmn
i jei i ) D j i =
i jei i =
i
mn
mn
i
^ j i tem componentes
Ou seja, o novo vetor j i = D
X
X
j i=
Din
i jei i ;
i =
n
n
jem i :
(51)
:
n
i
^ em H como a atuação da
Podemos assim pensar na atuação do operador D
matriz Dnm nas componentes do vetor numa determinada base ortonormal e
^ j i como
calcular D
X
Din n ;
n
que nada mais é que o produto da matriz quadrada D pela matriz coluna
.
Lembre que, apesar de estarmos usando a mesma letra, j i e são quantidades diferentes. O vetor
0
1
x1
B
C
j i = @ x2 A
..
.
representa uma seqüência xk que independe da base, enquanto as componentes
k dependem da base. Assim, se vamos trabalhar com o produto matricial D
devemos lembrar que todas estas quantidades (diferente de xk ) dependem da
base.
O ponto da explicação acima é que operadores atuando em vetores
podem ser vistos, uma vez …xada uma base, como matrizes atuando
nas componentes do vetor nesta base. Isso implica que:
^ agindo no espaço das funções, existe uma matriz D
A cada operador D
(in…nita) agindo no espaço das seqüências in…nitas que de…nem as componentes
do vetor jf i 2 L2 . Assim como podemos tratar tanto as seqüência como as
^ : L2 ! L2 quanto com D : C1 ! C1
funções, podemos trabalhar tanto com D
dependendo da conveniência. Mais ainda, a cada operador agindo em C1 , ou
seja, uma matriz quadrada in…nita, corresponde um operador agindo em L2 .
Voltemos para a nossa base fjek ig com componentes
1
ek (x) = p exp (ikx)
2
87
e, para os coe…cientes ck da nosso função f de…nidos nesta base (i.e., os coe…cientes da série de Fourie)
X
jf i =
ck jek i ;
(52)
n
vamos estudar a ação do seguinte operador
0
..
..
..
..
..
..
.
.
.
.
.
B .
B
i:2
0
0
0
0
B
B
0
i:1 0 0
0
B
0
0
0
0
0
D=B
B
B
0
0
0 i:1 0
B
B
0
0
0 0 i:2
@
..
..
..
..
..
..
.
.
.
.
.
.
1
. C
C
C
C
C
C=
C
C
C
C
A
..
.
..
mn
(in) :
Ou seja, a matriz diagonal onde a k-ésima componente é a multiplicação de i
pór k.
Lembre-se que, pela de…nição da soma de nossos vetores em L2 o vetor jf i
(52) tem componentes
1 X
f (x) = p
ck exp (ikx) :
2 n
^ atuando em jf i cuja ação é o
Pelo que vimos acima, existe um operador D
produto da matriz acima com as suas componentes, ou seja, a aplicação deste
operador no vetor jf i fornece (51)
X
X
^ jf i =
jf i =
ck jek i =) D
Dmn cn jem i
mn
k
Lembrando agora que, no nosso caso,
Dmn = i
temos
^ jf i =
D
jgi
X
i
mn ncn
mn
mn n
jem i =
X
n
incn jen i :
^ jf i valem
Ou seja, as componentes do vetor jgi = D
X
g (x) =
incn exp (inx) :
n
Mas estas componentes também podem ser escritas como
g (x) =
X
n
cn
d
d X
d
exp (inx) =
cn exp (inx) =
f (x)
dx
dx n
dx
88
Assim, as componentes do novo vetor jgi são as derivadas das compo^ associando a matriz D
nentes de jf i. Podemos então identi…car o operador D
com o operador diferencial d=dx agindo nas componentes do vetor jf i, ou ainda,
como um operador diferencial
^ = d
D
dx
agindo no espaço das funções de quadrado integrável.
Da mesma forma, podemos construir operadores que correspondem à diferenciais de ordem mais alta. Assim, um tipo bastante especial de operadores que
agem em L2 são operadores diferenciais.
Cabe aqui uma observação sobre a MQ. O exposto acima nos diz que a
igualdade
X
ck jek i ; jf i 2 L2 (a; b) :
jf i =
k
nos da a liberdade de trabalhar tanto no lado esquerdo, i.e., operadores diferenciais agindo no espaço das funções, quanto no direito, i.e., matrizes agindo
em seqüência contáveis. Nos primórdios da MQ havia duas teorias quânticas
aparentemente independentes. A teoria de Schroedinger, baseada numa equação
diferencial, e a teoria de Heisenberg, baseada na álgebra de matrizes. Grosso
modo, podemos dizer que estas duas teorias são as mesmas (ou equivalentes).
Apenas que a teoria de Schroedinger trabalha no lado esquerdo da igualdade
acima (i.e., no espaço L2 ), enquanto a teoria de Heisenberg trabalha no lado
esquerdo (i.e., no espaço R1 ). Dizemos que é a mesma teoria utilizando uma
representação diferente do espaço de Hilbert.
^ é um operador em L2 este se relaciona
Da mesma forma que em R1 , se M
com seu adjunto pela relação (49)
^ + jf i ;
^ jgi = hf j j i h j jgi = h jf i hg j i = hg j i h jf i = hgj M
hf j M
ou, explicitando o produto interno,
^ jgi =
hf j M
^ + jf i =
hgj M
Z
b
a
Z
a
b
i
h
^ g (x) dx
f (x) M
h
i
^ + f (x) dx
g (x) M
^ jgi = hgj M
^ + jf i
Usando a igualdade hf j M
Z
a
b
Z
h
i
^ g (x) dx =
f (x) M
a
b
Z
h
i
^ + f (x) dx =
g (x) M
a
b
Z
h
i
^ + f (x) dx =
g (x) M
A relação acima de…ne o adjunto dos operadores agindo em L2 .
Em especial, para operadores hermitianos, temos a relação (47)
^ jgi = hgj M
^ jf i :
hf j M
89
a
b
(53)
h
i
^ + f (x) g (x) dx
M
que fornece
Z
a
b
Z
h
i
^ g (x) dx =
f (x) M
b
a
h
i
^ f (x) g (x) dx ;
M
^ no espaço das funções a igualdade acima permite
assim, dado um operador M
veri…car se este operador é (ou não) hermitiano.
Exemplo: vamos veri…car se o operador
^ = d
D
dx
agindo em L2 (a; b) é hermitiano. Para isso calculamos
^ jgi =
hf j D
Z
b
a
Z
i
h
^ (x) dx =
f (x) Dg
b
dg
dx
f
a
dx :
Usando agora uma integração por partes temos
Z
b
a
f
dg
dx
dx = f g
b
a
Z
a
b
df
g dx
dx
Ou ainda, se observamos que
df
df
=
dx
dx
temos
Z
a
b
h i
^
f Dg
dx = f g
b
a
Z
b
a
h
Z
i
^ g dx 6=
Df
a
b
h
i
^ g dx
Df
Ou seja, nosso operador não é simétrico em L2 (a; b).
Mais ainda, para o caso de operadores de dimensão in…nita, não basta termos
a forma do operador, mas precisamos também …xar certas características nas
nossas funções.
b
Observe que, graças ao termo de fronteira f g a , devemos esperar que nenhum operador diferencial seja hermitiano em L2 (a; b). Entretanto, podemos
tentar contornar este problema. Uma vez que nosso operador não é simétrico
em todo o espaço L2 (a; b), podemos tentar encontrar um sub-espaço de L2 onde
(talvez) ele seja simétrico. Vamos, por exemplo, de…nir o subespaço das funções
que valem zero nas extremidades. Ou seja, nosso espaço não é todo o espaço
L2 , mas:
L2 (a; b)
L02 (a; b)
g; g 0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c:
Onde estamos exigindo
1. as funções pertençam a L2 (a; b), obviamente;
90
2. a derivada das funções também pertençam a L2 (a; b). Isso é necessário
porque nosso operador é uma diferencial e, para que este seja um operador
no nosso espaço, ele deve levar funções do espaço em outras funções do
^ 2 L2 (a; b). Esta exigência deve ser ampliada
mesmo espaço. Ou seja, Df
quando tratamos de operadores diferenciais de ordem mais alta.
3. as funções sejam nulas nas extremidades, f (a) = f (b) = 0. Isso é
necessário (na nossa esperança de simetrizar o operador) para eliminar
o termo de fronteira da integração por partes;
4. Finalmente, as funções devem ser absolutamente contínuas (a:c:). Este
é um detalhe técnico intrincado, mas podemos simpli…cá-lo dizendo que,
grosso-modo, funções absolutamente contínuas são aquelas que podem ser
integradas por partes. Isso certamente é válido para todas as funções
bem comportadas que vamos trabalhar. Ou seja, esta teoria vale também
para funções que não sejam in…nitamente diferenciáveis e que possuem
certas descontinuidades em suas derivadas. Mas isso é muito mais do que
precisamos.
Neste espaço L02 (a; b) temos
Z b h
Z
i
0
^
f D g dx =
a
a
b
h
Z
i
0
^
D f g dx 6=
a
b
h
i
^ 0 f g dx
D
Onde colocamos uma linha no operador para indicar que este age no espaço L0 .
Mas, ainda assim, nosso operador não é hermitiano.
Mais ainda, podemos escrever a relação acima como
Z b h
Z bh
i
i
0
^
^ 0 f g dx
f D g dx =
D
a
a
lembrando da relação (53) temos
Z b
Z
h
i
^ 0 g (x) dx =
f (x) D
a
b
a
comparando as duas relações acima temos
^ 0+ =
D
h
i
^ 0+ f (x) g (x) dx
D
^0 :
D
(54)
Entretanto, tudo isso era de se esperar, pois se olharmos para a matriz relacionada com este operado
0
B
B
B
D=B
B
B
@
..
.
..
.
..
.. ..
.
. .
i2 0 0
0
0 0
0
0 i2
..
.. ..
.
. .
91
1
. C
C
C
C
C
C
A
..
.
..
vemos que os elementos diagonais desta matriz não são reais. Além disso, se
tirarmos o transposto conjudado desta matriz temos
1
0
.. ..
..
..
..
. C
.
B . . .
C
B
i2
0
0
C
B
T
C= D
B
0 0
0
D =B
C
C
B
0 0
i2
A
@
. .
..
..
..
. .. ..
.
.
que nada mais é que a relação (54).
O exemplo acima mostra que, se quisermos um operador hermitiano, devemos partir de uma matriz hermitiana. Partamos então da matriz
1
0
.. .. .. .. .. . .
..
.
.
. . . . .
C
B
C
B
2 0 0 0 0
C
B
C
B
0 1 0 0 0
C
B
C ;
B
0 0 0 0 0
D2 = B
C
C
B
0 0 0 1 0
C
B
C
B
0
0
0
0
2
A
@
.. .. .. .. .. . .
..
. . . . . .
.
que pode ser hermitiana ao agir sobre certas seqüência. Observe que
D2 = iD ;
o que, obviamente, fornece
^ 2 = iD
^ =i d :
D
dx
Vamos então calcular novamente
Z b
Z
h
i
^
^
hf j D2 jgi =
f (x) D2 g (x) dx =
a
b
a
f i
dg
dx
Usando novamente uma integração por partes temos
Z b
Z b
dg
df
b
f i
dx = i f g a i
g dx
dx
dx
a
a
Observe agora que
i
pois { =
df
df
=i
=
dx
dx
i. Com isso temos
Z b
dg
f i
dx
a
dx = i f g
92
b
a
i
+
Z
a
df
;
dx
b
i
df
g dx
dx
dx
^0
Novamente, para eliminarmos o termo de fronteira, de…nimos o operador D
2
02
que atua no espaço L (a; b) de…nido anteriormente, com isso
Z b
Z b
d
d
f i g dx =
i f g dx
dx
dx
a
a
que pode ser escrito como
Z b h
Z
i
^ 20 g dx =
f D
a
Ou seja, o operador
6.8
^0
D
2
a
b
h
i
^ 0 f g dx
D
2
é hermitiano.
Domínio dos operadores
Um ponto extremamente importante no que foi exposto acima é que o operador
^ 2 , que age em L2 , não é hermitiano, mas já o operador D
^ 0 , que age em
D
2
L02 (a; b)
g; g 0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c:
é hermitiano.
Certamente um operador que é hermitiano é diferente de um operador que
^ 2 é diferente de D
^ 0 . Assim, apesar destes dois
não é hermitiano, ou seja, D
2
operadores terem a mesma forma
d
dx
ou seja, atuam da mesma maneira, eles atuam em espaços diferentes e,
conseqüentemente, são operadores diferentes.
O espaço de atuação de um operador é também chamado de domínio deste
^ por D D
^ , ou seja
operados. Indicamos o domínio de D
i
^ 0 = g; g 0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c:
D D
2
Assim:
Remark 26 Em espaços de dimensão in…nita, um operador não é apenas uma
regra de atuação mas também a especi…cação do domínio onde esta atuação é
válida. A mesma regra, para domínios diferentes, especi…ca operadores diferentes.
A especi…cação deste domínio não apenas traduz as características físicas do
sistema na descrição quântica, mas também in‡uencia nos resultados teóricos
esperados.
Na prática as características do nosso operador, como ser ou não hermitiano,
depende da …xação das condições de fronteira do problema. Além disso, para o
caso de funções com singularidades, depende da especi…cação do comportamento
destas funções nas fronteiras dos pontos de singularidade.
Além disso, como veremos no futuro, estas condições de fronteira estão diretamente ligadas com propriedades físicas do sistema.
93
6.9
Operadores auto-adjuntos
Voltemos nossa atenção agora para o operador adjunto. Ou seja, qual o domínio
^ + para que D
^ 2 seja hermitiano?
do operador adjunto D
2
^ pode ser de…nido pela expressão
Como vimos, o adjunto de um operador M
(53)
Z b
Z bh
i
h
i
+
^
^ g (x) dx ; 8g 2 D M
^ ;f 2 D M
^+ ;
M f (x) g (x) dx
f (x) M
a
a
^ agem em g, i.e., g 2 D M
^ , enquanto
onde devemos notar que o operador M
^ + age em f , i.e., f 2 D M
^ + . A pergunta acima pode ser
o operador M
^ ) no qual M
^ é
formulada da seguinte forma: Uma vez …xado um domínio D(M
+
^
simétrico, qual o domínio de M que não quebra esta simetria?
^ 0 sabemos que
Para o nosso operador D
2
^ 20 = g; g 0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c:
D D
E quais podem ser as funções f para que a relação
Z bh
Z b h
Z
i
i
0
0
^
^
f D2 g dx =
D2 f g dx =
a
a
a
b
h
:
(55)
i
^ 0+ f g dx
D
2
^ 0 no lado direito da igualdade é, na verdade, o
se mantenha (lembrando que D
2
^ 0 ). Voltemos para a forma completa da integral por partes
adjunto de D
2
Z b h
Z bh
i
i
^ 0 g dx = i f g b +
^ 0 f g dx
f D
D
2
2
a
a
=
Z
a
b
h
i
a
^ 0 f g dx + i f (b) g (b)
D
2
f (a) g (a)
Para que nosso operador seja simétrico, basta que o último termo se anule.
Então, a nossa pergunta se torna:
quais podem ser as funções f para que o último termo se anule?
^0
Lembrando que, pela de…nição do domínio (55) de D
2
Z b h
Z bh
Z
i
i
^ 0 g dx =
^ 0 f g dx + i f (b) :0 f (a) :0 =
f D
D
2
2
a
a
a
b
h
i
^ 0 f g dx ;
D
2
para qualquer valor …nito de f (b) e f (a) e, consequentemente, para qualquer
^ + não precisam se
valor de f (b) e f (a). Ou seja, as funções f onde age D
2
2
anular nas fronteiras. Ou ainda, além de serem L não precisamos colocar
^ +0 , para
mais nenhuma restrição nestas funções. Assim, o domínio de D
2
^ 2 seja hermitiano vale
que D
^ +0 = f; f 0 2 L2 (a; b) ; a:c:
D D
2
94
:
Vemos explicitamente que
^ +0 6= D D
^ 20
D D
2
;
ou seja, apesar de terem a mesma forma
^ +0 = i d
^ 20 = i d ; D
D
2
dx
dx
^0 e D
^ +0 são operadores difer(pois o operador é simétrico) os operadores D
2
2
entes. Este ponto pode parecer uma tecnicalidade, mas será importante no
futuro.
^ 2 que não é hermiNo procedimento acima, partimos de um operador D
^ 0 (que tem a mesma forma de D
^ 2 , mas
tiano e de…nimos um novo operador D
2
^ 2 . Feito
atua num espaço diferente) que é, fazendo uma restrição no domínio de D
^ +0 que não quebre esta simetria.
isso, podemos obter o domínio do adjunto D
2
Além disso, como veremos no futuro, a especi…cação do domínio do operador
(ou das condições de fronteira) é como introduzimos as características físicas do
nosso problema na descrição quântica.
^ para os quais
Operadores hermitianos M
^ =D M
^+
D M
são chamados de operadores auto-adjuntos. Ou seja, todo operador auto-adjunto
é hermitiano, mas o contrário não é verdade.
6.10
Operadores lineares
Como vimos, um tipo de operador que age em nosso espaço L2 são operadores
diferenciais. Da forma mais geral possível, um operador diferencial linear,
agindo no espaço das funções de quadrado integrável tem a forma tem a forma
2
^ = a0 (x) + a1 (x) d + a2 (x) d + :::
L
dx
dx2
m
n
X
d
=
an (x) n
dx
n=0
(56)
onde m é chamado a ordem do operador. Estes operadores são lineares
^ (c1
L
1
+ c2
2)
^
= c1 L
1
^
+ c2 L
2
; c1 ; c2 2 C
^ i 2 L2 .
se exigirmos que L
Obviamente nem todas as funções em L2 possuem sua derivada de ordem m
em L2 , além disso, como vimos no exemplo anterior, condições de contorno (ou
considerações físicas) podem impor certas restrições nas funções nas fronteiras,
i.e., …xar o valor de (a) e (b). Assim, geralmente, um operador não atua em
todo L2 , mas sim num subconjunto D (L) L2 .
95
^ devemos sempre informar sua
Remark 27 Para especi…carmos um operador L
expressão diferencial (56) e seu domínio de atuação.
Uma equação diferencia linear tem a forma
^ = f (x) :
L
O caso com f 0 é chamado de equação homogênea.
Pela condição de linearidade, vemos que, se 1 e 2 são soluções da equação
^ então qualquer combinação c1 1 + c2 2 também
homogênea para o operador L
^ De forma mais geral, uma combinação
será solução da equação homogênea de L.
arbitrária de soluções da equação homogênea também é uma solução. Este é o
princípio da superposição.
^ chamado de L
^ + , é de…nido
O hermitiano conjugado de um operador L,
através do produto interno e através da expressão (??)
h
^+
2j L
j
1i
^
=h
1j L j 2i
;
^ de…nimos o seu conjugado pela expressão
ou seja, dado um operador L
Z
Z
b
[L+
1
(x)]
(x) dx
2
a
b
a
h
^
(x)
L
1
2
i
(x) dx :
Exemplo: Se
^= d
L
dx
e D (L) são as funções 2 L2 (a; b) com 0 2 L2 e (a) = (b) = 0 encontre
^ + . Este é o mesmo exemplo que resolvemos acima. Pela de…nição temos
L
h
^
1j L j
2i =
Z
a
b
h
^
1 (x) L
Z
i
(x)
dx
=
2
b
1
(x)
a
d
dx
2
(x)
dx
se nossas funções são absolutamente contínuas, i.e., podem ser integradas por
partes, temos
Z
b
1 (x)
a
d
dx
2 (x)
dx = [
=
1 (x)
Z
a
b
b
2 (x)]a
d
dx
1
(x)
Z
b
a
[
2
d
dx
1
(x) [
(x)] dx =
Z
a
assim
^+ =
L
2
b
(x)] dx
h
^+
L
1
i
(x)
2
(x) dx
d
dx
^ + . Para de…nirmos completamente este operador
Esta é a forma diferencial de L
precisamos ainda especi…car D (L+ ).
Exemplo: O operador
^=c; c2C
L
96
Novamente
h
^+
2j L
j
1i
Z
=
h
b
a
Z
=
b
^+
L
1
i
(x)
1
(x) [c
2
2
(x) dx
h
^
1j L j 2i
(x)] dx
a
Z
=
b
[c
a
Z
=
h
b
a
1
^+
L
(x)]
2
(x) dx
i
(x)
1
2
(x) dx ;
assim
^+ = c :
L
^ + pode ser todos o espaço L2 (e, é claro, a restrição
A princípio o domínio de L
+
2
^
^
L
2 L ). Entretanto, podemos impor certas característica no operador L
(e.g., hermiticidade) que, para serem mantidas, restringem também o domínio
^+.
de L
Exemplo: Como vimos anteriormente, o operador
^=i d ; D L
^ =
L
dx
0
;
2 L2 (a; b) ;
(a) =
(b) = 0; a:c:
é hermitiano, mas não é auto-adjunto. Pois
^ + = f; f 0 2 L2 (a; b) ; a:c: 6= D L
^
D L
:
Vamos agora de…nir o operador
^c = i d ; D L
^c =
L
dx
;
0
2 L2 (a; b) ; a:c: ;
Usando o procedimento usual temos
E
D
^ c 2 = [ 1 (x) 2 (x)]b + L
^
h 1j L
a
=
1
(b)
= [ 1 (b)
D
^c 1
6= L
2
1
(a) = c (b)
2i
D
^
(a) + L
D
^ 1
c 1 (a)] 2 (b) + L
(b)
1
(a)
2
; c2C
1
2i
2i
2i
^+
Para tentar simetrizar este operador, vamos tentar de…nir o domínio de D L
como
^+ =
D L
c
;
0
2 L2 (a; b) ; a:c: ;
97
^
(a) = c (b) = D L
com isso,
h
1j
^
L
2
E
D
^ 1 2i
(b) + L
D
^ 1 2i
= [ 1 (b) cc 1 (b)] 2 (b) + L
D
^ 1 2i
= [1 cc ] 1 (b) 2 (b) + L
h
i
D
2
^
= 1 jcj
2i
1 (b) 2 (b) + L 1
=[
1
(b)
c
1
(a)]
2
Vemos então que nosso operador será simétrico se (e somente se)
2
jcj = 1 =) c = ei ;
2R:
ou seja, se de…nirmos o operador
^ =i d ; D L
^
L
dx
=
;
0
2 L2 (a; b) ; a:c: ;
(a) = ei
(b)
;
2R:
^ , diferente de L,
^ é um operador auto-adjunto.
Assim, o novo operador L
A fase , apesar de não possuir um análogo clássico (i.e., não é possível
especi…car esta fase apenas olhando o sistema clássico), pode in‡uenciar nos
resultados esperados (e.g., níveis de energia) para certos potenciais. Assim,
para estes potenciais esta fase pode ser determinada experimentalmente através
da medido do espectro de energia do sistema.
^ + é maior que
Dos exemplos acima vemos que, no primeiro caso o D L
^+
^ ,D L
oD L
^+
^ , enquanto no segundo caso D L
D L
^ . É
=D L
^
^ + , i.e., o domínio de L
^ nunca é maior que
possível provar que D L
D L
^ + . O que …zemos no segundo exemplo foi restringir o domínio
o domínio de L
^ + , que chamamos de D L
^ + . Obviamente D L+
de L
D (L+ ). Assim,
se D (L+ ) 6= D (L), como no primeiro exemplo, as vezes (mais nem sempre)
é possível reduzir o domínio do adjunto de forma que o novo operador seja
auto-adjunto.
Vemos assim que todo operador auto-adjunto é, por de…nição, hermitiano,
mas o contrário não é verdade. Esta diferença, que a primeira vista parece
uma tecnicalidade, possui importantes conseqüências tanto matemáticas quanto
físicas.
7
Postulados da Mecânica Quântica
A MQ pode ser construída através de algumas regras ou postulados. Como um
primeiro postulado temos:
98
Remark 28 O estado de um sistema físico é completamente descrito por um
vetor (normalizado) no espaço de Hilbert
j i2H :
E vetores que di…ram apenas por uma fase representam o mesmo estado físico.
Sabendo-se agora qual vetor representa o sistema, sabemos todas as características físicas deste sistema.
Neste momento não podemos falar muito sobre este postulado, mas voltaremos a isso no futuro. Contudo, precisamos começar por ele uma vez que todo o
desenvolvimento depende desta associação.
Uma vez preparado um sistema no laboratório, este sistema “será”um vetor
no espaço de Hilbert. Precisamos agora saber como descrever (dentro da teoria)
a manipulação, a evolução temporal e as possíveis medidas que fazemos
neste sistema.
Quando um sistema no estado j i sofre qualquer tipo de modi…cação ele
passa a ser descrito por um novo vetor j 0 i. Ou seja (qualquer) modi…cações
no sistema são transições
j i ! j 0i
Estas transições podem ser descritas por operadores agindo em H,
^j i
j 0i = M
Assim, tudo que acontece com o sistema pode ser representado por
um operador agindo em H.
Um tipo muito especial destes operadores são exatamente as medidas que
podemos fazer no sistema (e.g., sua energia), ou seja, tudo o que podemos
observar do sistema. Estas quantidades são chamadas de observáveis.
Outro postulado da MQ a…rma que :
Remark 29 A todas quantidades clássicas mensuráveis (e.g., H) estão associ^ agindo nos vetores de H: H ! H
^ .
ados operadores auto-adjuntos (H)
Para sistemas de dimensão …nita podemos de…nir os observáveis
como operadores hermitianos. Assim, na maior parte do que segue pense
neste observáveis como matrizes simétricas.
Para entendermos melhor este postulado, precisamos ainda de um terceiro
postulado.
(Valores são auto-valores)
^ é um operador (hermitiano) relacionado com um observável m (i.e.,
Se M
m é o valor que o aparelho que mede esta quantidade pode marcar), e se no
laboratório efetuarmos uma medida deste observável os únicos valores pos^ (ou seja, o valor m
síveis de se obter são os auto-valores do operador M
^ ). Ou seja:
marcado no aparelho é necessáriamente um autovalor de M
99
^ pode fornecer apenas autovalores
Remark 30 Uma medida do observável M
deste operador e, logo após uma medida em que se obteve o valor mn o sistema
estará no estado j n i.
^ é o operador que representa a energia do sistema, sabemos que
Assim, se H
este operador possui uma série de auto-vetores e auto-valores.
^j
H
ni
= En j
ni
O que o postulado acima sobre os autovalores nos diz é que, numa medida da
energia do sistema, podemos obter apenas um dos valores En acima.
7.1
Interpretação probabilística
Problem 31 Mas qual é a física por trás de toda esta descrição matemática?
Esta física está descrita pela chamada interpretação probabilística. A qual
a…rma que:
Se um sistema se encontra num determinado estado, dado por um vetor j i,
a probabilidade de que este sistema seja encontrado num estado j i é dado por:
( P
N
; j i ; j i 2 RN
2
R b i=1 i i
jh j ij =
:
(x) (x) dx ; j i ; j i 2 L2 (a; b)
a
Problem 32 Mas o que signi…ca o sistema estar num estado e ser encontrado
em outro?
Este é o ponto principal de tudo que …zemos até aqui e a maior diferença
^
entre a teoria clássica e quântica. Lembre-se que um operador hermitiano H
possui um conjunto de autovetores e autovalores reais
^j
H
ni
= En j
ni
; En 2 R :
Além disso, o conjunto de seus auto-vetores formam uma base do
espaço H. Isso signi…ca que qualquer vetor j i pode ser escrito como
j i=
N
X
i=1
cn j
ni
; cn 2 C :
Podemos também fazer a a…rmação inversa e dizer que a todo vetor temos
associado um estado físico. Assim, por exemplo, imagine que o sistema está
num estado j i cuja decomposição é dada por
j i = c1 j
1i
+ c2 j
2i
Este é um vetor especí…co e algum estado especí…co do sistema.
100
Problem 33 Qual a energia deste estado?
Pelo postulado sobre a medida e os autovalores, sabemos que, numa medida
da energia do sistema, podemos obter apenas os valores En . Isso é geral. Para
sabermos o que iremos obter numa medida do estado j i acima, lembramos
que, logo após uma medida, o sistema se encontra no auto-estado
do auto-valor correspondente. Assim, podemos fazer a pergunta: qual a
probabilidade P (E1 ) de, numa medida da energia, obtermos o valor E1 . Neste
caso, logo após a medida, o sistema se encontrará no estado (observe que a
medida modi…cou o sistema9 ) j 1 i. Assim, pela interpretação probabilística, a
resposta a nossa pergunta vale:
P (E1 ) = jh
2
1j
ij :
Para cálcular efetivamente este valor, lembramos que os auto-estados de um
operador hermitiano são ortogonais (i.e., eles formam uma base ortonormal)
h
1j
i = h 1 j (c1 j
= c1
1i
+ c2 j
2 i)
e a quantidade procurada vale
P (E1 ) = jh
1j
2
2
ij = jc1 j :
Assim, o módulo quadrado do coe…ciente da expansão de um vetor numa
certa base de um observável é a probabilidade de se obter o autovalor correspondente na medida deste observável.
Da mesma forma a quantidade
h
^
2j A j 1i
2
(57)
(i.e., o módulo quadrado do produto interno de dois vetores no espaço de
Hilbert), deve ser interpretado como a probabilidade de um sistema que se
encontrava inicialmente no estado j 1 i, mudar para o estado …nal j 1 i após a
^
ação do operador A.
Remark 34 Um ponto importante é que esta descrição probabilística não é
uma ignorância nossa sobre o sistema (como ocorre na teoria clássica),
mas uma característica intrínseca do sistema. Por exemplo, classicamente você pode produzir uma partícula e, por uma ignorância no processo de
construção, você não sabe exatamente qual a energia desta partícula. Assim,
usando uma certa descrição clássica (por exemplo, usando o ferramental da
mecânica estatística) você é capaz de fazer uma previsão desta energia e calcular qual a probabilidade da partícula ter energia E1 . Mas então você faz uma
9 Dizemos assim que o sistema que estava numa superposição de ondas (ou num pacote de
ondas) colapsou para uma das ondas do pacote. Este efeito é chamado de colapso da função
de onda.
101
medida da energia e obtém (porque é tudo uma probabilidade) uma energia E2 .
Suponha agora que você seja capaz de produzir com este mesmo equipamento,
exatamente sobre as mesmas condições (o que é possível em teoria), uma
segunda partícula idêntica a primeira (ou você construiu dois equipamentos
exatamente iguais). Neste caso, dentro das condições ideais colocadas, pelo resultado da primeira partícula você sabe que, para esta segunda, P (E1 ) = 0 e
que, numa medida da energia, você obterá certamente o valor E2 . Quanticamente isso não é necessariamente verdade. Se você produzir duas partículas
idênticas no estado j i acima (e isso é possível!) e efetuar uma medida da
energia destas duas partículas você poderá obter valores diferentes com probabil2
2
idade P (E1 ) = jc1 j e P (E2 ) = jc2 j .
Remark 35 Outro ponto a se notar é que sob certas condições (como vimos
no átomo de Bohr) observáveis como energia podem assumir apenas valores
discretos. Não existe nenhum análogo clássico para este comportamento.
7.2
Conseqüências físicas do primeiro postulado
Pela de…nição de probabilidade, sabemos que se P (E1 ) e a probabilidade de
numa medida do observável obtermos o valor E1 e P (E2 ) de se obter o valor
E2 . Então a probabilidade de se obter E1 ou E2 vale
P (E1 jE2 ) = P (E1 ) + P (E2 ) :
Assim, a quantidade
N
X
i=1
2
jcn j ;
é a probabilidade de se obter qualquer valor possível, ou ainda a probabilidade
do sistema ser encontrado em um estado qualquer, conseqüentemente,
N
X
i=1
2
jcn j = 1 :
Que, como você deve se lembrar, signi…ca que as própria seqüências cn possíveis formam um espaço de Hilbert.
Outra forma de dizer a mesma coisa acima é exigir que o estado esteja
normalizado
2
jh j ij = 1 :
Que pode ser lida como: se sabemos que o sistema está no estado j i a probabilidade dele ser encontrado neste estado é 100%. Observe que, para todo estado
quântico
2
jh j ij < 1 =) j i 2 H :
e além disso
2
jh j ij = 1 (normalizado):
102
Além disso, se de…nirmos uma novo estado
j 0 i = ei j i
que di…ra apenas por uma fase temos
2
jh 0 j ij = h j ei
i
2
2
= ei
=1
Ou seja, este estado apresenta a mesma probabilidade (i.e., a mesma característica física) de j i (no futuro veremos que estes estados são …sicamente
indistinguiveis). Vemos então como a interpretação probabilística se relaciona
com o primeiro postulado.
Além disso, vemos que o processo de normalização, que antes possuía uma
utilidade técnica bastante conveniente na de…nição das bases de H, agora está
relacionado como a interpretação probabilística da MQ. Ou seja, para usarmos
a interpretação probabilística obrigatoriamente devemos exigir que
nossos vetores estejam normalizados.
Um ponto importante é observar que a fase referida acima deve ser global.
Como vimos, na descrição quântica um sistema pode estar numa superposição
de dois estados
j i = a j 1i + b j 2i ;
o estado acima é equivalente ao estado
j 0 i = ei [a j
1i
+ bj
2 i]
1i
+ bj
2i
;
mas não é equivalente ao estado
j
00
i = ei a j
:
A fase não-global presente no estado j 00 i gera fenômenos de interferência
que permitem (…sicamente) distinguir este estado de j i.
Podemos ver também o signi…cado físico da ortogonalidade dos auto-estados
de um operador hermitiano. Ou seja, se após uma medida obtivermos o valor
E2 o sistema estará no estado j 2 i a probabilidade de, logo após esta medida,
o sistema ser encontrado no estado j 3 i deve ser nulo
h
3
j
2i
=0:
E o fato destes vetores j n i formarem uma base signi…ca que nosso sistema
pode, em princípio assumir qualquer valor do observável, com uma certa prob2
abilidade jcn j .
Além disso, o fato de operadores hermitianos terem apenas autovalores reais
está relacionado com medidas nos darem apenas valores reais.
7.3
Valor esperado
Dada uma in…nidade de cópias idênticas do sistema, podemos nos perguntar
sobre o valor médio de algum observável. Ou seja, pegamos uma in…nidade
103
de exemplares desta coleção de sistema, efetuamos em cada um a medida de
um certo observável M e tiramos a média deste valor para obter hM i. Esta
quantidade é também chamada de valor esperado do observável.
Classicamente, se cada exemplar do nosso sistema tem uma probabilidade
Pi de que o observável M forneça o valor mi , esta média pode ser calculada
como
X
hM i =
P i mi
i
somado para todos os valore mi possíveis do observável M . No caso de m ser
uma variável contínua, temos
Z
hM i = mP (m) dm
onde P (m) dm é a probabilidade do sistema ter o valor medido entre m e
m + dm.
O próximo postulado da MQ a…rma que, se o sistema está no estado j i, o
^ é dado por
valor esperado do observável M
^j i :
hM i = h j M
(58)
Esta expressão está diretamente relacionada a noção clássica de média. Sendo
^ um observável, podemos escrever:
M
X
j i=
ci j i i
i
onde
^ j i i = mi j i i
M
Substituindo em (58) temos
2
3 "
#
X
X
XX
^ j i=4
^
h jM
h j j cj 5 M
ci j i i =
cj ci h
j
=
XX
j
=
X
i
i
i
cj ci h
2
jci j mi =
j j mi
X
j ii =
XX
j
j
i
mi cj ci
^ j ii
jj M
ij
i
Pi mi ;
i
2
onde usamos que jci j é a probabilidade de se obter o valor mi numa medida de
^.
M
Um ponto importante deste postulado está no fato de geralmente, em experiências, não estamos tratando apenas com uma entidade, mas sim uma coleção
destas entidades. Por exemplo, uma corrente de elétrons, um feixe de laser
(vários fótons), ou um feixe de partículas. Assim, o que nossos aparelhos registram pode não ser o valor possível do observável, mas sim uma média destes
104
valores. Com isso, o valor esperado de um observável quântico está diretamente
relacionado com o limite clássico no valor deste observável. Ou seja, se temos
um feixe de partículas (e.g., elétron) no estado
j i = c1 j
1i
+ c2 j
2i
onde
^ j i i = Ei j i i
H
são autoestados da energia, se medirmos a energia do feixe (não de um único
elétron) nosso aparelho clássico mostrará o valor
^ j i = E1 jc1 j2 + E2 jc2 j2 :
E = hHi = h j H
O ponto descrito acima é apenas um exemplo de uma característica mais
geral da teoria quântica de, sob certas circunstâncias, o valor esperado reproduz os mesmo resultados da teoria clássica. Por exemplo, para um grande
número de partículas, ou para altas energias. Este é o chamado Princípio
da Correspondência. Este princípio, que na velha MQ foi usado apenas para
testar certas teorias e estabelecer um link entre as previsões da teoria e os fenômenos observados em laboratório, será de importância crucial no processo de
quantização de sistemas com in…nitos graus de liberdade.
8
Quantização canônica
O ponto, obviamente crucial, que ainda não foi respondido é: como encontrar o
^ que corresponde à quantidade clássica M . Um procedimento qualoperador M
quer que permite associar quantidades clássicas a operadores (ou quantidades
quânticas) é chamado de quantização.
O procedimento mais geral e e…ciente de quantização foi proposto por Dirac.
Este processo parte da descrição hamiltoniana do sistema clássico e, por isso,
é chamado de quantização canônica. Este processo está relacionado com a
seguinte conseqüência do Princípio da correspondência:
^ j i) deve corRemark 36 A dinâmica da médias dos operadores (e.g., h j M
responder evolução temporal da respectiva quantidade clássica M (t).
De outra forma, a pergunta a ser respondida pelo processo de quantização
^ j i = j?i. Para responder esta pergunta,
é como agem os operadores. Isto é, H
voltamos à mecânica clássica. Na mecânica clássica, um elemento crucial para
se descrever a dinâmica dos sistemas são os parênteses de Poisson
ff; gg =
@f @g
@x @p
@f @g
:
@p @x
Dirac mostrou que, para se respeitar a condição acima (o princípio da correspondência), basta exigir que para dois observáveis f e g tenhamos
i h^ i h^ i
ff; gg !
f ; g^ ; f ; g^ = f^g^ g^f^ :
(59)
~
105
Em outras palavras, se os operadores f^ e g^ respeitarem a relações acima,
chamada relações canônica de comutação, o princípio da correspondência está
garantido. Por incrível que pareça, isto é tudo que precisamos!
Diferente do processo de quantização de Sommerfeld, ou mesmo o de Schroedinger
(i.e., a equação de Schroedinger) este processo permite obter não apenas certas
características do sistema (e.g., posição e energia), mas como descrever quanticamente praticamente qualquer quantidade classicamente observável. Além disso,
podemos com este método introduzir novas características no nosso sistema.
8.1
Evolução temporal
Uma das principais características de uma teoria (clássica ou quântica) é fazer
previsões. Ou seja, informar como as quantidades evoluem no tempo. Como
vimos, tudo que ocorre em MQ é descrito pela ação de um operador. Isso não
seria diferente com a dinâmica dos sistemas. Precisamos então determinar qual
é o operador de evolução temporal na MQ.
Remark 37 Um ponto a se salientar é que, diferente dos demais observáveis,
o tempo não é um operador em MQ. Esta quantidade é utilizada apenas para
parametrizar os estados do sistema.
Da mesma forma que a dinâmica dos sistemas eram descritos por trajetórias
no espaço de fase, em MQ esta dinâmica é dada pela mudança do vetor que
descreve o sistema em H. Ou seja, é uma trajetória no espaço de Hilbert.
Assim, a dinâmica do sistema (sua evolução temporal) também é descrita por
um operador. Ou seja, se um sistema está no estado j 0 i no tempo t0 seu estado
num tempo posterior t será
j
ti
= U (t; t0 ) j
0i
:
A primeira exigência sobre o operador U é que este seja unitário
U (t) U + (t) = I^ ; para todo t ;
(60)
onde I^ é o operador identidade em H. Dizemos que na MQ toda evolução é
unitária.
Remark 38 Assim, a MQ lida apenas com sistemas conservativos e reversíveis.
O requerimento acima está relacionado com a interpretação probabilística
(conservação da probabilidade)
h
t
j
ti
=h
0j U
+
(t; t0 ) U (t; t0 ) j
0i
=h
0
j
0i
:
Além disso, exigimos que
U (t2 ; t0 ) = U (t2 ; t1 ) U (t1 ; t0 ) ; t2 = t1 = t0 e U (t0 ; t0 ) = I^ :
106
(61)
Supondo que U é um operador contínuo com relação ao parâmetro t, podemos
escrever para uma evolução in…nitesimal dt,
U (t + dt; t) = 1 + T^dt :
onde T^ = T^ (t) é um novo operador, que precisamos determinar, cuja forma é
conhecida no instante t.
A condição de U ser unitário (60)
1 + T^dt
1 + T^dt
+
=1;
2
implica que T^ é anti-unitário (até ordem de (dt) ),
T^+ =
T^ :
Da lei de composição (61) temos
U (t + dt; t0 ) = U (t + dt; t) U (t; t0 ) = 1 + T^dt U (t; t0 )
U (t + dt; t0 )
dt
U (t; t0 )
dU
= T^U :
dt
= T^U (t; t0 ) =)
(62)
Tudo que precisamos agora é achar T^. Para isso, mais uma vez, invocamos o
princípio da correspondência e a relação (59). Ou seja, estudamos a evolução
temporal da média de um observável qualquer A^ (que é uma função em R2 e
não e um vetor em H). Pelo postulado dos valores médios temos
h (t)j A^ j (t)i = h
0j U
+
^ j
AU
0i
;
e a evolução temporal deste valor é dada por
d
h
dt
0j U
+
^ j
AU
0i
_ + AU
^ + U + A^U_ j
=h
0j U
=h
0j
+
T^U
0i
^ + U + A^ T^U j
AU
0i
^ + U + A^T^U j
U + T^AU
0i
Usando a anti-initariedade de T^
d
h
dt
0j U
+
^ j
AU
0i
=h
0j
=
h
=
=
=h
onde
^
T^AU
^
h 0 j T^U + AU
0j U
h
T^A^ (t)
0j
0j
h
+
A^ (t) ; T^
^
A^ (t) = U + AU
107
i
U + A^T^U j
^ T^ j
U + AU
A^ (t) T^ j
j
0i
:
0i
0i
0i
:
(A (t) é um operador na representação de Heisenberg). Ou seja, o valor médio
de qualquer operador A^ evolui no tempo como
h
i
d ^
A (t) = A^ (t) ; T^ :
dt
(63)
Agora, na mecânica clássica sabemos que a evolução temporal de uma função
A (t) no espaço de fase pode ser escrita como
dA
= fA; Hg :
dt
Assim, usando (63) e (62), invocando novamente a relação (59), temos
i h ^ ^ i h ^ ^i
A; H = A; T =) T^ =
~
dA
= fA; Hg !
dt
com isso
i ^
H ;
~
dU
i ^
dU
= T^U =)
=
HU :
(64)
dt
dt
~
Diferente do que ocorre para funções ordinárias a solução da equação diferencial acima para um operador não é, em geral, uma simples exponencial. Pois
a identi…cação
1
a N X an
a
;
e = lim 1
=
N !1
N
n!
n=0
depende de uma reorganização dos elementos da somatória que, por sua vez,
depende da comutação destes elementos. Entretanto, para o caso geral, podemos
ter
h
i
^ (t1 ) ; H
^ (t2 ) 6= 0 :
H
Por exemplo, num sistema com dois níveis de energia, pode ocorrer que
^ (t1 ) =
H
3
1
0
=
0
1
^ (t2 ) =
; H
1
0
1
=
1
0
:
com isso,
h
i
^ (t1 ) ; H
^ (t2 ) =
H
=
1
0
0
2
0
1
0
1
1
0
0
1
1
0
1
0
0
1
2
0
No futuro veremos alguns exemplos físicos deste caso.
Podemos escrever a solução formal do nosso problema (64) na forma
U (t; t0 ) = 1
i
~
Z
t
^ ( ) U ( ; t0 ) d ;
H
t0
108
(65)
pois, com isso,
dU (t; t0 )
d
=
1
dt
dt
i
~
Z
t
^ ( ) U ( ; t0 ) d
H
d i
dt ~
=
t0
Z
t
^ ( ) U ( ; t0 ) d
H
t0
Usando o teorema fundamental do cálculo
Z b
@
f (x) dx = f (b) ;
@b a
temos
Z
d
dt
t
^ ( ) U ( ; t0 ) d =
H
t0
i ^
H (t) U (t; t0 )
~
e, com isso,
i ^
dU (t; t0 )
=
H (t) U (t; t0 ) :
dt
~
A expressão (65) é uma solução do nosso problema. Entretanto, dizemos que
esta solução é formal porque ela não nos dá um resultado que possa ser efetivamente aplicado nos vetores de H, uma vez que estamos escrevendo o operador
U em função deste mesmo operador. Entretanto podemos obter uma expressão
melhor iterando esta de…nição:
Z
i t ^
H ( ) U ( ; t0 ) d
U (t; t0 ) = 1
~ 0
Z
Z
i
i t ^
^ ( 1 ) U ( 1 ; t0 ) d 1 d
H( ) 1
H
=1
~ t0
~ t0
Z
Z
Z 1
i t ^
i
i
^ ( 2 ) U ( 2 ; t0 ) d 2 d
^
=1
H
H( ) 1
H ( 1) 1
~ t0
~ t0
~ t0
..
.
Podemos agora abrir o produto e reorganizar os temos na ordem
U (t; t0 ) = 1 +
..
.
+
..
.
Z
i
~
i
~
n
t
^( ) d +
H
t0
Z tZ
t0
t0
:::
Z
n
1
i
~
2
Z tZ
t0
^ ( )H
^ ( 1) d
H
1
d
t0
^ ( )H
^ ( 1 ) :::H
^(
H
n 1)
d
n 1 :::d 1
d
t0
Onde, pela expressão original, …ca claro que na expressão acima t0
t.
2
1
109
n 1 :::
1
d
Assim, nosso operador temporal pode ser calculado como
U (t; t0 ) =
1
X
n
i
~
n=0
Z tZ
t0
t0
:::
Z
n
1
^ ( )H
^ ( 1 ) :::H
^(
H
n 1)
d
n 1 :::d 1
d
t0
(66)
A expressão acima pode ser colocada numa forma mais simples mudando
todos os integrandos para o mesmo limite. Suponha que o hamiltoniano comute
em tempos diferentes. Com isso é fácil ver que
Z tZ
Z Z
1 t t ^
0
0
^
^
^ ( 1 ) d 1 d ; (H
^ comuta)
H ( )H ( ) d d =
H ( )H
2 t0 t0
t0 t0
Pois se antes a região de integração era um triângulo agora é um quadrado (i.e.,
estamos contando a área 2 vezes e o integrando envolve o produto do mesmo
operador).
De forma geral temos
Z tZ
Z n 1
^ ( )H
^ ( 1 ) :::H
^ ( n 1 ) d n 1 :::d 1 d
:::
H
t0
=
t0
1
n!
Z tZ
t0
t0
t
t0
:::
Z
t
^ ( )H
^ ( 1 ) :::H
^(
H
n 1)
d
n 1 :::d 1
^ comuta)
d (H
t0
Entretanto a restrição natural de ordenamento temporal presente na série
original através dos limites de integração não existe mais. Assim, para o caso
em que o hamiltoniano não comuta em instantes diferentes (i.e., quando esta
ordem é importante) precisamos explicitar que a ordem temporal t0
1
t deve ser mantida. Para fazer isso usamos o símbolo T ,
2 :::
n 1
110
chamado de operador de ordenamento temporal
Z n 1
Z tZ
^ ( )H
^ ( 1 ) :::H
^ ( n 1) d
:::
H
t0
t0
1
=
n!
Z tZ
t0
t0
t
Z
:::
t0
t
t0
h
^ ( )H
^ ( 1 ) :::H
^(
T H
n 1 :::d 1
i
n 1)
d
d
n 1 :::d 1
d
Esta simbologia indica que (assim como acontece no lado esquerdo da expressão)
os termos dentro do sinal de integral devem ser colocados em ordem crescente
do tempo.
Com isso, nosso operador de evolução temporal pode ser escrito como
Z
i t ^
U (t; t0 ) = T exp
H( ) d
~ t0
Z t h
1
nZ tZ t
i
X
1
i
^ ( )H
^ ( 1 ) :::H
^ ( n 1 ) d n 1 :::d 1 d
:::
T H
n!
~
t0 t0
t0
n=0
(67)
Obviamente tanto a expressão (66) quanto (67) podem ser usadas para se
determinar a evolução temporal do sistema.
O cálculo da série acima é, em geral, um problema extremamente complicado que, na verdade, não pode ser resolvido na maior parte dos casos. Mas,
felizmente, nem todos os problemas são tão complicados assim.
Para o caso mais simples em que o hamiltoniano comuta em diferentes instantes
i
h
^ (t1 ) ; H
^ (t2 ) = 0 ;
H
podemos esquecer completamente o ordenamento temporal e simplesmente reorganizar a série e escrever
Z
Z
i t ^
i t ^
H ( ) d ! exp
H( ) d
;
T exp
~ t0
~ t0
ou seja, usando (67) sem o operador T ,
Z
Z Z
Z t
i t ^
1 t t
^ ( ) :H
^ ( 1 ) ::H
^ ( n 1 ) d n 1 :::d 1 d :
exp
H( ) d =
:::
H
~ t0
n! t0 t0
t0
Z t
Z t
1
nZ t
X
1
i
^( ) d
^ ( 1 ) d 1 :::
^ ( n 1) d
=
H
H
H
n!
~
t0
t0
t0
n=0
n
1
n Z t
X
1
i
^
=
H( ) d
;
n!
~
t0
n=0
ou seja, neste caso
U (t) = exp
i
~
Z
0
t
H( ) d
=
1
X
n=0
111
i
~
n
Z
0
n
t
H( ) d
:
(68)
n 1
Além disso, para o caso ainda mais simples onde o hamiltoniano não depende do tempo temos
Z
Z
i ^ t
i ^
i t ^
H d = exp
d = exp
U (t) = exp
H
Ht
~ 0
~
~
0
1
n
X
i
^n :
=
t H
~
n=0
O caso mais complicado onde o hamiltoniano não comuta para diferentes
instantes geralmente não pode ser resolvido exatamente e exige o auxílio de
técnicas aproximativas (e.g., teoria da perturbação). Assim, nesta primeira
parte do curso vamos trabalhar apenas com o caso onde o hamiltoniano comuta
para diferentes instantes do tempo.
Da expressão (68) vemos porque é tão conveniente expandir as soluções em
autovetores do Hamiltonio (estados de energia bem de…nido). Pois a evolução
de um dado estado j 0 i
j
ti
i ^
Ht j
~
= exp
0i
envolve a exponencial de um operador. Uma quantidade, em geral, extremamente difícil de se calcular (quando possível!). Agora se j n i são os autovetores
^ com autovalores n , sempre podemos escrever
de H
X
^ j n i = En j n i =) j 0 i =
cn j n i ;
H
n
^ independente do tempo,
com isso, para o caso de H
X
X
i ^
j ti =
exp
H t cn j n i =
cn (t) j
~
n
n
i
En t
~
cn (t) = cn exp
ni
;
:
Onde a expressão acima envolve apenas números (não mais operadores).
(Unitáriedade dos coe…cientes)
A unitáriedade do operador de evolução temporal garante que para qualquer
^ se
observável A,
X
j 0i =
an j n i ; A^ j n i = an j n i ;
n
então
X
n
2
2
jan (t)j =
2
X
n
2
jan j = 1 ;
apesar de, em geral, jan (t)j 6= jan j .
Assim, expandindo a nossa função na base de autovetores do hamiltoniano
podemos introduzir toda a evolução temporal do sistema nos coe…cientes da
expanção.
112
8.2
Resumo
As regras do processo de quantização canônica, ou os postulados acima, podem
ser resumidos como:
1. O estado de um sistema físico é completamente descrito por um vetor
(normalizado) no espaço de Hilbert
j i2H:
(69)
E vetores que di…ram apenas por uma fase representam o mesmo estado
físico. Sabendo-se agora qual vetor representa o sistema, sabemos todas
as características físicas deste sistema;
2. A todo o observável esta relacionado um operador hermitiano;
^ pode fornecer apenas autovalores deste
3. Uma medida do observável M
operador e, logo após uma medida em que se obteve o valor mn o sistema
^ com autovalor mn ;
estará no estado n , auto-estado de M
4. A dinâmica da médias destes operadores
^j i ;
h jM
hM i
corresponde evolução temporal da respectiva quantidade clássica M (t);
5. A evolução temporal de um sistema no estado inicial j
^ (t) comutativo)
caso de H
j
8.3
t i = U (t) j
^
0 i ; U (t) = exp
i
~
Z
0i
é dado por (no
t
^ dt
H
:
0
Realização do espaço de Hilbert
Toda a descrição acima é bastante abstrata e, para calcularmos alguma coisa,
precisamos escolher um espaço de Hilbert especí…co para trabalhar, ou, como
se diz, realizar o nosso espaço de Hilbert.
Vamos então aplicar tudo que foi visto acima num sistema físico real e veri…car como o processo de quantização pode ser efetivamente implementado. Para
isso vamos começar tratando sistemas com graus …nitos de liberdade.
Uma espira por onde passa uma corrente induz um campo magnético que
pode ser descrito pelo chamado momento magnético do sistema. Classicamente,
um sistema com momento magnético imerso num campo magnético B possui
uma energia potencial
U=
B
Que dá origem a uma força
F = r(
113
B)
Para B = B z^, temos
@B
;
@z
O momento magnético na presença de um campo magnético gera também
um torque
=
B:
F = r(
z B)
=
z
Entretanto, como mostrado nos trabalhos de Einstein e de-Hass, o momento
magnético não se curva em direção do campo, mas apenas passa a precessionar
nesta direção. Assim, quando um sistema com momento magnético é colocado
num campo magnético, ele se desloca na direção de variação do campo, sem
variar a projeção do momento na direção do campo. Ou ainda, mantendo
B constante. Além disso, qualquer variação nesta projeção alteraria a energia
U do sistema e esta energia teria de vir do campo.
Concluindo: o momento magnético não se alinha com o campo, mas o
sistema como um todo se desloca na direção da variação do campo.
Pelo comportamento de algumas partículas num campo magnético, sabemos
experimentalmente que estas possuem um momento magnético. Um dispositivo
para medir este momento magnético seria fazer passar um feixe destas partículas
por um campo variável na direção z. Este é o chamado experimento de SternGerlach.
O feixe é produzido termicamente, de sorte que seus constituintes possuem
todos os valores possíveis de momento magnético. Classicamente, se um tal
feixe passar pelo experimento acima, esperamos que ele sofra uma força
Fz =
z
@B
;
@z
que depende da projeção de
na direção do campo. Assim, classicamente
esperamos que as partículas sejam de‡etidas continuamente dede o valor z = 0
até um valor máximo z = j j. Entretanto, quando o experimento foi realizado
nos idos de 1922 não foi isso que se observou.
Ao passar pelo aparato o feixe se dividiu em duas componentes com valor
B
~
:
2
Assim, fazendo
~
2
temos que o momento magnético z é proporcional ao spin Sz e este pode
assumir apenas os valores discretos ~=2.
Os constituintes dos átomos, bem como combinações destes constituintes
possuem está característica. O próprio experimento foi realizado com átomos
de prata que dos seus 47 elétrons 46 estão emparelhados e anulam seus spins.
Sobrando apenas o spin do elétron da camada mais externa. Além disso, o
momento magnético de todos os constituintes vale
gs
S;
=
2m
z
=
B Sz
; Sz =
114
de sorte que podemos ignorar a in‡uência do momento magnético do núcleo.
Sendo o átomo neutro, apenas o spin do último elétron in‡uência no comportamento de todo o átomo.
Partículas com esta característica são chamada de partículas de spin 12 (prótons, neutrons, elétrons etc).
Assim, no que se refere ao spin na direção z, partículas de spin 12 podem
apresentar apenas dois valores possíveis deste observável. Sendo o spin
um observável, e pelos postulados colocados anteriormente, sabemos que estes
valores são os autovalores do operador de spin. Chamemos seus auto-vetores de
S^z j i =
~
j i :
2
Sabemos também que estes autovetores formam uma base do nosso espaço.
Assim, se queremos estudar apenas o spin de um partícula de spin 12 (e.g.,
um elétron), podemos trabalhar com um espaço de Hilbert de duas dimensões.
Como vimos, neste espaço vetores são matrizes coluna de dois elementos e operadores matrizes 2 2.
Observe que se estamos estudando um elétron, estamos ignorando completamente qualquer outra característica desta partículas, como posição e momento.
Queremos saber apenas como o spin deste elétron se comporta num campo
magnético.
Uma vez escolhida a base fj+i ; j ig, temos também uma forma matricial
para os nossos operadores. Lembre-se que, dada uma base fjei ig nosso operador
nesta base atua como
X
S^z =
Szmn jem i hen j ;
mn
ou seja Szmn é a representação matricial do nosso operador na base jei i. Multiplicando a expressão acima por jei i e hej j temos
X
hej j S^z jei i =
Szmn hej jem i hen jei i
mn
=
=
X
Szmn
jm ni
mn
Szji
Ou seja, as componentes matriciais do nosso operador pode ser cálculado como
Szji = hej j S^z jei i ;
Para o nosso caso, onde je1 i = j+i e je2 i = j i temos
Sz11
Sz12
Sz21
Sz22
=
=
~
2
h+j S^z j+i h j S^z j+i
h+j S^z j i h j S^z j i
1
0
0
1
115
=
~
2
~
2
h+ j+i
h+ j i
~
2 h
~
2 h
j+i
j i
Ou seja
~
S^z =
2
1
0
0
1
:
Podemos ver explicitamente que, como supúnhamos,
~
S^z+ =
2
1
0
0
1
= S^z :
Algumas características gerais podem ser tiradas deste exemplo: Sempre que
escolhemos trabalhar na base de autovetores de um operador, a forma matricial
deste operador (nesta base) é diagonal. Com a diagonal formada pelos seus
autovalores.
Uma vez de posse da forma matricial do nosso operador, podemos determinar
a forma dos nossos autovetores
~
~
S^z j+i = j+i )
2
2
b=
1
0
0
1
a
b
=
~
2
a
b
a
0
b ) b = 0 ) j+i =
Normalizando nosso vetor e …xando (arbitrariamente) a fase global, temos:
j+i =
1
0
:
0
1
:
Da mesma forma, podemos determinar:
j i=
Onde, por serem autovetores de um operador hermitiano com autovalores distintos
h+ j i = 0 :
Exercise 39 Use os resultados acima para veri…car a resolução da identidade.
Ou seja, usando as formas matriciais acima mostre que:
X
n
jen i hen j = j+i h+j + j i h j =
1
0
0
1
:
Outra forma de escrever o operador S^z é
~
S^z = (j+i h+j
2
j i h j)
Pois, com isso:
~
S^z j+i = (j+i h+j
2
~
^
Sz j i = (j+i h+j
2
~
(j+i h+ j+i
2
~
j i h j) j i = (j+i h+ j i
2
j i h j) j+i =
116
j ih
j ih
~
j+i ;
2
~
j i) =
j+i :
2
j+i) =
Classicamente o momento magnético é um vetor (i.e., tem 3 componentes).
No nosso caso também devemos ter 3 operadores para o spin da nossa partícula.
Os dois outros operadores, que podemos chamar de S^x e S^y são obtidos, obviamente, medindo o momento magnético nas demais direções. Ou seja, girando
nosso SG nas direções x e y. Vamos tentar determinar a forma destes operadores.
Mas nós queremos fazer isso trabalhando ainda mesma base de
antes. Ou seja, sabemos que uma medida do spin na direção x deve fornecer
também 2 valores (a…nal não há nada especial com a direção z). Assim devemos
ter
~
jx i
S^x jx i =
2
onde
+
jx+ i = a+
(70)
1 j+i + a2 j i :
Uma vez escolhida a forma matricial de j i temos a forma matricial de jx+ i.
Tudo que precisamos então e achar os coe…cientes a+
i da expressão acima.
Para isso usamos mais um dos nossos postulados. Sabemos que
a+
1
2
2
= jh+ jx+ ij
é a probabilidade de estando a partícula na posição jx+ i, numa medida de Sz
encontrarmos o valor +~=2. Além disso, pelo que vimos anteriormente, sabemos
que
2
2
2
a+
= jh+ jx+ ij = jhx+ j+ij :
1
Ou seja, está também é a probabilidade do sistema estar no estado j+i e, numa
medida de S^x , encontramos o valor jx+ i.
Remark 40 Neste caso, a igualdade acima re‡ete a isotropia do espaço.
Problem 41 Como podemos medir experimentalmente esta probabilidade?
Tudo que precisamos fazer é preparar uma in…nidade de partículas, todas
no estado j+i, realizamos uma medida de S^x e veri…car qual a proporção de
partículas apresenta o valor +~=2. Ou seja, precisamos estudar um problema
de espalhamento.
(Não podemos conhecer o estado, mas podemos preparar)
Como dissemos antes, é impossível determinar o estado quântico de um sistemas. Entretanto, é possível conhecer este estado se nós mesmos o preparamos.
Problem 42 Como preparamos uma in…nidade de sistemas no esta j+i?
Para isso basta passarmos o feixe, inicialmente contendo todos os estados
possíveis, num aparato na direção z. Todas as partículas que sobem possuem o
valor de spin +~=2 e, pelos postulados da MQ, estarão no estado j+i. Assim,
117
se pegarmos este feixe e passarmos por um segundo SG orientado na direção x,
2
tudo que precisamos fazer para determinar a+
e medir a intensidade deste
1
feixe.
Realizado o experimento, veri…ca-se que o feixe se divide, novamente, em
dois feixes de igual intensidade. Ou seja, metade das partículas possuem
Sx = +~=2 e metade Sx = ~=2. Com este resultado, podemos a…rmar que
a+
1
2
=
1
= a+
2
2
2
ei 2
ei 1
; a+
;
) a+
2 = p
1 = p
2
2
1;2
2R:
Assim, lembrando que uma fase global é irrelevante (primeiro postulado), sabemos que o estado (70) possui a forma:
1
ei x
jx+ i = p j+i + p j i ;
2
2
+
2R:
(71)
Lembre agora que a fase x acima não é uma fase global e, conseqüentemente,
possui signi…cado físico. Ou seja, não podemos escolher arbitrariamente esta
fase.
Este resultado, completamente inesperado, mostra a característica mencionada anteriormente que, em MQ, a probabilidade não é uma ignorância do
sistema, mas uma característica intrínseca ao sistema. Observe que o estado
acima é uma superposição de dois estados com spins na direção oposta. Mas,
ao mesmo tempo, é um sistema bem determinado. Ou seja, todas as partículas
que saíram do SG na direção +^
x estão no estado jx+ i. Estes estados são todos
iguais, pois foram preparados exatamente da mesma maneira. Entretanto, uma
medida do spin na direção z deste estado fornece hora o valor +~=2 e hora o
valor +~=2.
Dizemos que o sistema no estado jx+ i acima não possui o valor de sz bem
de…nido e, apenas após a nossa medida, quando o sistema estará no estado j+i ou
j i, este valor foi …xado. Uma medida subseqüente do spin na mesma direção
fornecerá o mesmo valor, mas numa direção ortogonal voltará a apresentar o
resultado estatístico. Esta estatística é inerente ao sistema (é o elétron que está
neste estado) não uma ignorância nossa sobre os efeitos do aparelho de medida
no sistema.
Com argumentos análogos aos anteriores podemos escrever
0
1
ei x
jx i = p j+i + p j i ;
2
2
0
x
2R:
(72)
Entretanto, temos também que respeitar a condição de ortogonalidade dos ve-
118
tores,
hx jx+ i =
!
0
1
e ix
p h+j + p h j
2
2
ei x
1
p j+i + p j i
2
2
=
1
ei x
e i
h+ j+i +
h+ j i +
2
2
2
=
1 1 ix
+ e e
2 2
com isso,
ei x e
i
0
x
=
i
0
x
0
x
h
1
j+i + ei x e
2
i
0
x
h
!
j i
=0
1)e
i
0
x
=
e
i
x
) ei
0
x
=
ei
x
De sorte que
1
ei x
jx i = p j+i p j i ; + 2 R :
(73)
2
2
Da mesma forma que …zemos no caso de Sz , o operador Sx pode ser escrito
como
~
S^x = (jx+ i hx+ j jx i hx j)
(74)
2
pois, novamente,
~
S^x jx+ i = (jx+ i hx+ j
2
~
S^x jx i = (jx+ i hx+ j
2
~
jx+ i
2
~
jx i hx j) jx i =
jx i
2
jx i hx j) jx+ i =
Além disso, como no caso anterior, a forma matricial do operador S^x na base
fj+i ; j ig é dada por:
Sx11
Sx21
Sx12
Sx22
=
h+j S^x j+i h+j S^x j i
h j S^x j+i h j S^x j i
Calculando explicitamente estes termos, usando (74), temos
~
h+j S^x j+i = h+j (jx+ i hx+ j
2
jx i hx j) j+i :
Usando (71) e (73) temos
1
ei x
p j+i + p j
2
2
1
e ix
= j+i h+j +
2
2
1
ei x
jx i hx j = p j+i p j
2
2
1
e ix
= j+i h+j
2
2
jx+ i hx+ j =
1
p h+j +
2
ei x
j+i h j +
j
2
1
p h+j
i
2
ei x
j+i h j
j
2
i
119
e ix
p h j
2
1
i h+j + j i h j
2
e ix
p h j
2
1
i h+j + j i h j
2
Com isso
Sx11 = h+j S^x j+i =
~
h+j (jx+ i hx+ j
2
jx i hx j) j+i
~
h+j j+i h+j + e i x j+i h j + ei x j i h+j + j i h j
4
j+i h+j + e i x j+i h j + ei x j i h+j j i h j j+i
~
= (1 1) = 0
4
=
Da mesma forma
~ i
Sx21 = h j S^x j+i =
e
4
Sx22 = h j S^x j i = 0 ;
x
+ ei
Sx12 = h+j S^x j i = h j S^x j+i =
~ i
e
2
=
x
~
e
2
i
x
x
;
:
Ou seja
~
S^x =
2
0
i
e
e
i
x
:
0
x
Um procedimento completamente análogo pode ser desenvolvido para S^y .
Ou seja:
1. Estudando o problema de espalhamento com o aparelho de SG orientado
na direção y temos:
1
ei y
jy+ i = p j+i + p j i ;
2
2
2R;
y
2. Pela ortogonalidade dos estados
ei y
p j i
2
1
jy i = p j+i
2
3. Escrevendo
temos
~
S^y = (jy+ i hy+ j
2
~
S^y =
2
0
i
e
jy i hy j)
e
y
i
0
y
:
Obviamente a forma explicita de todas estas quantidades depende da determinação das fases x e y . Para isso existe ainda um experimento de espalhamento a nossa disposição. Suponha que você orientou o SG na direção x
^,
selecionou o feixe que foi na direção +^
x e passou este feixe por um segundo SG
na direção y^. Pelo que foi dito antes, e pela homogeneidade do espaço, você deve
120
imaginar que, mais uma vez, o feixe se dividiu em duas partes de intensidades
iguais nas direções +^
y e y^. Isso signi…ca que, estado a partícula no estado
jx+ i a probabilidade de encontrar esta partícula no estado jy+ i ou jy i vale
1
:
2
2
jhy jx+ ij =
Usando os resultados anteriores temos
=
e iy
p h j
2
1
p h+j
2
hy jx+ i =
1
1
2
ei(
y)
x
1
ei x
p j+i + p j i
2
2
:
Com isso
1
ei(
Lembrando que
y)
x
1
2
=
=2
2
ij = 11 + 12 = 2 ;
j1
temos
ei(
2
y)
x
2
1
1
2
2
jhy+ jx+ ij =
:
2
Isso é tudo que podemos …xar com nossos experimentos de espalhamento.
Obviamente nosso problema apresenta uma fase que pode ser …xada arbitrariamente, sem in‡uenciar nos resultados experimentais. Assim, fazendo
x
x
y
=
= 0 =)
y
=
2
Temos a forma explicita de nossos vetores
1
0
jz+ i = j+i =
1
jx i = p [j+i
2
1
jy i = p [j+i
2
0
1
; jz i = j i =
1
j i] = p
2
1
i j i] = p
2
1
1
1
i
;
;
;
e dos nossos operadores
~
S^z =
2
1
0
0
1
; S^x =
~
2
0
1
1
0
~
; S^y =
2
0
i
i
0
:
A notação acima pode ser escrita de forma mais compacta se introduzirmos a
notação
1
0
1
1
0
;
2
0
i
121
i
0
;
3
1
0
0
1
com isso
~
^
S^i =
i ; S1
2
ou, numa notação vetorial,
com
Pauli.
S^x ; S^2
S^y ; S^3
S^z
^=~
S
2
= ( 1 ; 2 ; 3 ). As três matrizes s acima são chamadas como matrizes de
Exercise 43 Veri…que as seguintes propriedades das matrizes de Pauli:
2
( i) = 1 ;
i
=
+
i
; [ i;
j]
= 2i
3
X
"ijk
k
;
k=1
onde "ijk é o símbolo de Levi-Civita.
Um ponto a se observar nos resultados acima é a diferença de fase x
y =
=2. Ou seja, mesmo o sistema mais simples (2 níveis) não pode ser descrito
usando apenas coe…cientes reais. Neste exemplo …ca patente a necessidade
de estendermos o corpo do nosso espaço vetorial para os complexos. Este ponto
já havia sido observado por Schroedinger na sua formulação usando funções de
onda. A utilização de quantidades complexas já era utilizada como um artifício
matemático para tratar problemas de ondas (mecânicas ou eletromagnéticas).
Mas esta técnica (fasores) apenas facilitava as manipulações algébricas e as
quantidades físicas eram obtidas simplesmente ignorando a parte complexa dos
resultados. Na MQ, porém, esta parte não pode ser ignorada e possui in‡uência
direta no comportamento das quantidades físicas.
Assim, o operador associado ao momento magnético clássico das nossas
partículas de spin meio vale:
^ ; ~ = gs :
^ = ~S
2m
Como vimos, a energia potencial de uma partícula de momento magnético
m sujeita a um campo magnético B vale:
U=
B
Se ignorarmos completamente o movimento da partícula (i.e., ignorarmos a
sua energia cinética), podemos escrever
E=U =
B=H :
Onde H é o hamiltoniano clássico do sistema. Pelos resultados anteriores, sabemos que o operador associado a este hamiltoniano vale
^ =
H
^=
^ B ; ^ = ~S
122
~
~
2
com isso
^ =
H
B;
=
=
e~
2me
Para o caso do elétron
=
B
~
~:
2
é o magneton de Bohr.
Exemplo 1.
Suponha então um elétron num campo magnético B constante na direção z^
(não é mais um SG). Este elétron tem dois estados possíveis de energia
^ =
H
E+ =
^j i= ( )
)H
BB ; E = + BB
BB 3
BB
j i=
BB
j i
Suponha que o sistema é inicialmente preparado no estado jx+ i, i.e., antes
de iniciar o experimento, passamos o feixe por um SG e coletamos o feixe que
foi na direção +^
x. Com isso
j
0i
1
= jx+ i = p (j+i + j i) :
2
Problem 44 Qual a probabilidade de, após um tempo t, o spin deste elétron
estar na direção x
^?
A resposta para o nosso problema vale
jhx j
2
t ij
:
Para isso precisamos primeiro determinar o estado
j
ti
= U (t) j
0i
; U (t) = exp i
B
~
B
3t
Como vimos, a aplicação deste operador é simpli…cada pelo fato do nosso
estado inicial estar escrito na base de autovetores do hamiltoniano,
j
ti
= U (t) j
0i
= exp i
B
~
B
3t
1
p (j+i + j i)
2
1
B
B
= p exp i
B 3 t j+i + exp i
B 3t j i
~
~
2
1
B
B
= p exp i
Bt j+i + exp
i
Bt j i
~
~
2
1
= p (exp (i!t) j+i + exp ( i!t) j i)
2
com
!=
B
~
123
B
Podemos então cálcular
hx j
ti
=
=
1
p (h+j
2
(exp (i!t)
1
p (exp (i!t) j+i + exp ( i!t) j i)
2
exp (i!t))
h j)
2
= i sin !t
Com isso
2
t ij
jhx j
B
= sin2 !t ; ! =
B:
~
Em especial, em t = 0, temos que a probabilidade é nula, pois sabemos que
a partícula está no estado jx+ i.
Problem 45 Suponha que você quer inverter o spin do elétron, por quanto
tempo você deve aplicar o campo?
Inverter o spin do elétron, inicialmente no estado jx+ i, signi…ca que, se você
pegar o elétron após a aplicação do campo e passar por um SG na direção x,
você tem certeza que este elétron irá para a direção x
^. Assim
jhx j
2
t ij
= 1 ) sin2 !t = 1 ) !t =
com isso
2
~
t=
2B
(1 + 2n) ) t =
2!
(1 + 2n) ; n 2 N ;
(1 + 2n) :
B
Desta forma, dada um estado inicial qualquer, podemos manipular o spin
do elétron e deixá-lo no estado que desejamos através da aplicação de campos
magnéticos.
No caso geral, a forma mais conveniente de se aplicar o operador de evolução
é expandindo o estado inicial na base de autovetores da hamiltoniana. Entretanto, em alguns casos especí…cos, é possível encontrar uma forma matricial
também para este operador. Por exemplo, no caso tratado acima temos
U (t) = exp i
=1+ i
B
~
B
~
B
3t
=
1
X
i
n=0
Bt
3
+ i
B
~
B
~
n
Bt
2
Bt
2
3
n
3
+ i
B
~
3
Bt
Note, entretanto, que
2
3
=
1
0
0
1
1
0
0
1
=
Além disso
3
3
=
2
3 3
124
=
3I
1
0
0
1
=I
3
3
+ :::
assim
(
2n
3)
2n+1
3)
=I ; (
=
3
Podemos então dividir a nossa somatória em termos pares e impares
U (t) =
=
=
1
X
n=0
1
X
n=0
1
X
i
i
i
n=0
= cos
B
~
cos
=
B
~
B
~
B
~
2n
Bt
B
1
X
+
Bt
+
1
X
i
n=0
2n
Bt
+
3
1
X
B
~
3
sin
Bt + i sin
0
exp i ~ Bt
0
B
~
B
~
B
~
2n+1
Bt
2n+1
3
2n+1
Bt
B
i
~
n=0
3
2n+1
Bt
Bt
Bt
B
=
i
n=0
2n
Bt + i
~
2n
3
exp
0
cos
0
i
B
~
Bt
B
~
Bt
i sin
B
~
Bt
:
Assim, se quisermos aplicar este operador no estado inicial
1
jx+ i = p
2
1
1
temos
1
exp i ~B Bt
0
1
U (t) jx+ i = p
1
0
exp i ~B Bt
2
B
1
exp i ~ Bt
=p
exp i ~B Bt
2
1
1
0
B
B
Bt
+ exp
i
Bt
= p exp i
0
1
~
~
2
i
1 h
B
B
= p exp i
Bt j+i + exp
i
Bt j i
~
~
2
Que é o mesmo resultado obtido anteriormente.
O resultado acima pode ser generalizado para qualquer operador A^ num
espaço de dimensão …nita
A^2 = I ) exp i! A^ = cos ! + iA^ sin ! :
Assim, dado um estado inicial qualquer, podemos decompor este estado em
auto-estados do hamiltoniano e usar a expressão
j
ti
= c+ exp (i!t) j+i + c exp ( i!t) j i
o que implica em encontrar os coe…cientes c , ou usar diretamente este estado,
sem fazer nenhuma decomposição, e multiplicar pela forma matricial de U acima.
125
Remark 46 Sempre que tivermos a sorte de encontrar esta forma matricial do
operador de evolução não precisamos decompor o estado inicial.
Ainda no mesmo campo
^ =
H
BB 3
;
qual a probabilidade de um estado inicialmente preparado em j+i ser encontrado
em j i depois de um tempo t. Ou seja,
2
jh j U (t) j+ij :
Lembrando de nosso hamiltoniano só depende de
são autoestados deste operador temos
h
j+i = h j exp i
B
~
B
3t
j+i = exp i
3
B
~
e que os estados acima
Bt h
j+i = 0 :
Remark 47 Isso é um caso geral. Sempre que nosso sistema estiver num auto
estado do operador hamiltoniano ele permanecerá inde…nidamente neste estado.
Por isso estes estados são chamados de estados estacionários.
Exempo 2:
Uma partícula de spin 12 está sujeita a superposição de dois campos, de
mesma intensidade B, um na direção x
^ e outro na direção y^,
B=x
^B + y^B
Neste caso o Hamiltoniano do sistema tem a forma
^ =
H
B= B(
+
1
2)
:
Ou seja, nosso operador de evolução tem a forma (68):
i ^
Ht
~
Bt
i
(
~
U (t) = exp
= exp
= exp [ i!t (
B
!=
~
1
1
+
+
2)
2 )]
Problem 48 Será que podemos escrever
exp [ i!t (
1
+
2 )]
?
= [ i!t
126
1] [
i!t
2]
?
A resposta é não! A igualdade
eA+B = eA eB
é válida apenas quando
[A; B] = 0 :
Além disso, observe que
(
1
2
2)
+
= 1 1+ 1
=I+ 1 2
= 2I 6= I
2
+
2 1
1 2
+I
+
2 2
De sorte que não podemos usar a nossa decomposição em senos e cossenos.
Entretanto, apesar de não ser proporcional a identidade, o resultado é proporcional a identidade (i.e., se comporta como um número, não como um operador).
Assim, podemos de…nir o seguinte operador
1
=p (
2
1
+
2)
1
=p
2
0
1 i
1+i
0
que satisfez
1
1
2
( 1 + 2 ) = 2I = I :
2
2
Em termos deste operador nosso operador de evolução se torna
2
U (t) = exp
=
h
p ( 1 + 2)
p i
i!t 2 p
=
i!t 2
;
2
E podemos escrever
h
p i
p
U (t) =
i!t 2 = cos !t 2
p
cos !t 2
p
=
p1 (1
i) sin !t 2
2
p
i sin !t 2
p1
2
p !
(i + 1) sin !t 2
p
cos !t 2
p
Observe que a freqüência e oscilação do campo possui um fator 2.
Como mencionado, nem sempre é possível encontrar uma forma matricial
para o operador de evolução. Entretanto, o método de expansão dos estados
em auto-estados do hamiltoniano sempre funciona. Vamos então aplicar este
método para resolver o problema anterior, i.e., com hamiltoniano
^ =
H
B= B(
127
1
+
2)
:
Para isso precisamos realizar uma mudança de base no nosso sistema e não mais
trabalhar na base fj+i ; j ig, mas sim na base fj + i ; j ig de autovetores de
^
H
0
1 i
^j i=E j i ; H
^ = B
H
:
1+i
0
Resolvendo o problema de autovalores temos:
p
p
1
2 (1 i)
; E+ = B 2
j +i = p
2
2 2
p
p
1
2 (i 1)
; E = B 2
j i= p
2
2 2
Vamos calcular, por exemplo, a probabilidade de transição dos estados
j+i ! j i
Para isso temos de escrever estes vetores na nova base:
j+i = c1 j
+i
+ c2 j
i
p
1
j+i = p
2 (1 + i) 2
2 2
p
1
c2 = h
j+i = p
2 ( i 1) 2
2 2
(1 + i)
j+i =
(j + i j i)
2
c1 = h
1
0
+
=
1
0
1
(1 + i)
2
1
=
(1 + i)
2
e
j i = d1 j
d1 = h
d2 = h
+
+i
+ d2 j
1
j+i = p
2 2
1
j+i = p
2 2
1
j i = p (j
2
+i
+j
i
p
2 (1 + i)
p
2( i
1)
0
1
2
2
1
=p
2
1
0
=p
1
2
i)
Problem 49 Por que as probabilidades de encontrar a partícula com spin pra
cima é tão difernet da de encontrá-la com spin pra baixo?
Note que, apesar de parecerem diferentes, os coe…cientes
e
1
1
(1 + i) =
1 + ei 2 = ei 4
2
2
1
i4
= e cos = p ei 4 = d1 ei 4
4
2
c1 =
128
i4
+ ei 4
2
diferem apenas por uma fase e, conseqüentemente, representam a mesma probabilidade. Ou seja, nos dois casos, a probabilidade de, estando a partícula no
estado j i, encontrá-la no estado j i vale 21 .
Concluindo as contas temos
i ^
Ht (c1 j + i + c2 j i)
~
i
d1 h + j + d2 h j c1 exp
E+ t j + i + c2 exp
~
i
i
d1 c1 exp
E+ t + d2 c2 exp
E t
~
~
!
p
p !!
B 2
B 2
1
p (1 + i) exp
i
exp i
t
t
~
~
2 2
p !
i
B 2
p (1 + i) sin
t ;
~
2
h j U (t) j+i = d1 h
=
=
=
=
+j
+ d2 h
j exp
i
E t j
~
que representa a probabilidade
2
p !
B 2
t :
~
2
jh j U (t) j+ij = sin
Para estados no caso de estados genéricos dados cujas componentes são
dadas na base fj+i ; j ig podemos obter suas componentes na base fj + i ; j ig
através do procedimento de mudança de base estudado anteriormente. Pela expressão
X
vj0 =
vi e0j ei i
j
he0i j
sabemos que as quantidades
ej i é a de matriz de mudança da base fjei ig
para a base fje0i ig. Assim, a matriz de mudança da base fj+i ; j ig para a base
fj + i ; j ig vale
h
j
i=
c1
c2
h
h
+j
d1
d2
+i
j +i
h
h
+j
1
0
j
i
i
=
c1
c2
d1
d2
e um estado inicial qualquer dados na base fj+i ; j ig tem, na base fj
a forma
fj
+ i;j
a0
b0
ig
=
c1
c2
d1
d2
+i ; j
ig
fj+i;j ig
c0
v0
:
Exemplo 3
Uma partícula de spin 21 está sujeita a um campo magnético que circula no
plano x; y
B (t) = x
^B cos !t + y^B sin !t :
129
i
Neste caso o Hamiltoniano do sistema tem a forma
^ =H
^ (t) =
H
B= B(
1
cos !t +
2
sin !t)
= B
2
;
Observe que, neste caso
^ (0) = B
H
com isso
h
^
; H
1
2!
i
^ (0) ; H
^
H
2
= 2i ( B) 3 6= 0 :
2!
Ou seja, estamos tratando um dos casos complicados onde o hamiltoniano
não comuta para diferentes instantes do tempo. Felizmente, neste caso (e nem
imagine que isso é comum) o problema pode ser tratado exatamente. Observe
que
Z tZ
Z tZ
0
0
^
^
H ( )H ( ) d d =
( B ( 1 cos ! + 2 sin ! )) ( B ( 1 cos ! 0 +
t0
t0
t0
t0
Z tZ
2
= ( B)
t0
+
+
1 2
Z tZ
t0
Z tZ
t0
cos ! cos !
0
d
0
d
t0
0
[cos ! sin !
sin ! cos ! 0 ] d
0
d
t0
sin ! sin !
0
d
0
d
t0
Ou seja, mesmo que as matrizes de Pauli não cumutem, estas são fatoradas
em todas as integrais. Assim, todas as integrais envolvidas na expansão em
série do operador de evolução envolvem apenas funções reais (não operadores)
e, conseqüentemente, comutativas. Com isso, neste caso (e, mais uma vez,
este é um caso muito especial) não precisamos levar em conta a ordenação
temporal. Conseqüentemente nossa exponencial toma a mesma forma para o
caso comutativo. Ou seja, nosso operador de evolução tem a forma (68)
Z
n
1
n Z t
X
i t
i
U (t) = exp
H( ) d =
H( ) d
:
~ 0
~
0
n=0
Mais explicitamente
U (t) = exp
= exp
= exp
i
~
Z
t
B
~
B
i
(
~!
i
B(
0
1
1
Z
cos ! +
2
sin ! ) d
t
cos ! d +
0
1
2
Z
t
sin ! d
0
sin !t
130
2
(cos !t
1))
:
2
sin ! 0 )) d
0
d
Remark 50 Observe que o termo
mos
U (0) = exp
1 em (cos !t
i
B
(
~!
2
(1
1) é indispensável para ter1)) = I :
Entretanto, neste caso, fazendo
^ =
M
1
sin !t
2
(cos !t
1)
temos
h
^ 2 = I sin2 !t + (cos !t
M
= 2I [1
2
1)
cos !t] 6= 1 :
i
Ou seja, novamente, não podemos usar a nossa expansão em senos e cossenos.
Poderíamos então tentar um procedimento análogo ao anterior e de…nir
^
M
^=p
G
2 (1 cos !t)
com o que temos
^2 =
G
^2
2I [1 cos !t]
M
=
=I :
2 (1 cos !t)
2 (1 cos !t)
^
Então escreveríamos U em função de G
U (t) = exp
i
Bp
2 (1
~!
^
cos !t)G
:
e, depois, em termos de senos e cossenos
Bp
2 (1
~!
?
U (t) = cos
Bp
2 (1
~!
^ sin
iG
cos !t)
cos !t)
:
^
Entretanto, este procedimento não é legítimo pelo fato deste novo operador G
^ (0) = I. Nem
não estar de…nido em t = 0, ou seja, não podemos garantir que U
para qualquer outro instante t = 2n =!. Ou seja, para continuar é necessário
veri…car que G tem um valor …nito em t=0. Para isso expandimos
^=
G
=
1
1
sin !t
p
2 (1
+
1
2
2
2
(cos !t
cos !t)
(!t) =
1
1)
!t
'
+
r
2
1
:
131
2
(!t)2
2
(!t)2
2
!t
=
1
+
2
!t
(!t)2
2
^
^ 2 (0) = I. Com isso podemos continuar
De onde temos, G(0)
< I e ainda G
usando
Bp
Bp
^ sin
U (t) = cos
2 (1 cos !t)
iG
2 (1 cos !t) :
~!
~!
Usando a igualdade
cos !t = 2 cos2
!t
2
1
podemos escrever
p
2 (1
cos !t) =
s
2 cos2
2 1
s
cos2
1
=2
r
!t
2
1
!t
2
!t
2
= 2 sin2
!t
2
= 2 sin
com isso,
B
!t
2 sin
~!
2
!t
B
2 sin
~!
2
U (t) = cos
= cos
B
!t
2 sin
~!
2
1 sin !t
2 (cos !t
i
2 sin !t
2
^ sin
iG
1)
B
!t
2 sin
~!
2
sin
Temos ainda o inconveniente de um termo divergente. Mas isso pode ser
resolvido observando que
1
sin !t
(cos !t
1)
2
0
1 ei!t
=i
1
0
!
t
2
= 2 sin
i!t
e
0
e
i!
2t
e
i!
2t
0
com isso
B
!
2 sin t
~!
2
U (t) = cos
0
i
e
i!
2t
e
i!
2t
B
!t
2 sin
~!
2
sin
0
Outra forma de resolver este problema e usando direto
1 sin !t
^ (t) =
N
(cos !t
0
i!
2t
e
e
1)
i!
2t
0
2
= 2 sin
!
t
2
;
132
0
i!
2t
e
e
i!
2t
0
= 2 sin
!
^ (t) ;
t N
2
e escrever
B
( 1 sin !t
2 (cos !t
~!
B
!
^ (t)
i2
sin
t N
~!
2
U (t) = exp
i
= exp
1))
Observando agora que
^2 = I ;
N
temos
B
!
^ (t)
sin
t N
~!
2
!
B
^ sin 2 B sin ! t
sin
t
iN
= cos 2
~!
2
~!
2
U (t) = exp
i2
Que, obviamente, concorda com o resultado anterior. Nesse último caso não
precisamos nos preocupar com divergências.
Assim, ainda neste caso mais complicado, podemos encontrar uma forma
matricial para o nosso operador de evolução.
Podemos agora responder perguntas do tipo: neste novo campo qual a probabilidade de uma partícula inicialmente prepara no estado j+i ser encontrada
no estado j i depois de um tempo t?
2
jh j U (t) j+ij =?
^ Ou seja estes estados
Observe que agora j i não é mais auto estado de H.
não são estacionários.
Com o resultado acima calculamos:
B
!
^ sin 2 B sin ! t
sin
t
iG
~!
2
~!
2
^ j+i sin 2 B sin ! t
h j iG
:
~!
2
h j U j+i = h j cos 2
=
Usando as formas matriciais
^ j+i =
h j iG
0
0
1
i!
2t
e
e
i!
2t
0
1
0
Temos
h j U j+i =
2
1
B
!
sin
t
~!
2
B
!
2
sin
t
~!
2
e 2 it! sin 2
jh j U j+ij = sin2
133
1
= e 2 it!
j+i
8.4
Rotações
Como vimos, a dinâmica dos sistemas em MQ pode ser descrita através do
operador de evolução temporal, o qual respeita a equação diferencial
i~
dU
^ :
= HU
dt
Obviamente, ambos os lados desta equação representam operadores. O que
implica que, para qualquer vetor j 0 i num instante inicial t = 0, temos
i~
dU
j
dt
0i
^ j
= HU
0i
) i~
d
j
dt
ti
^j
=H
ti
; j
ti
= U (t) j
0i
:
^ e tendo as
Encontrar a dinâmica do sistema descrito pelo hamiltoniano H
condições iniciais adequadas é encontrar uma coleção de vetores j t i, identi…cados pelo parâmetro t, que respeite a equação diferencial acima. No que segue
chamaremos esta coleção de vetores de “um vetor dependente do tempo”.
Suponha então que você encontrou um vetor j t i que respeita a equação
acima. Isso implica que, dado um operador inversível (independente do
^ , o vetor
tempo) M
^ j ti ;
j ti = M
respeitará a seguinte equação:
^ d j
i~M
dt
ti
^H
^j
=M
ti
) i~
d ^
Mj
dt
ti
^H
^M
^
=M
1
Mj
ti
) i~
d
^H
^M
^
j ti = M
dt
com isso
d
^ 0 j ti ; H
^0 = M
^H
^M
^ 1:
j ti = H
dt
Com isso, conhecida a solução de uma equação diferencial podemos construir soluções para outras equações diferenciais (diferentes). Esse é um procedimento matemático geral. No caso da MQ, gostaríamos que esta nova equação
diferencial também descreva algum sistemas físico (diferente do inicial). Ou
seja, gostaríamos que j t i fosse a evolução temporal de algum sistema físico
^ 0 . Para isso, obviamente, H
^ 0 deve ser também
descrito pelo hamiltoniano H
um hamiltoniano, ou seja, deve ser um operador hermitiano
i~
^0 = H
^ 0+ ) M
^H
^M
^
H
1
^H
^M
^
= M
1
+
^
= M
1
+
^M
^+
H
Assim,
^+ = M
^
M
1
;
^ deve ser um operador unitário.
ou seja, M
Assim, dado um operador unitário qualquer, e a solução de um sistema
físico qualquer, podemos construir soluções de um novo sistema físico. Neste
processo temos a di…culdade em identi…car esta nova descrição quântica com
algum sistema clássico (ou mesmo se este existe). Além, é claro, de saber se
este sistema tem algum interesse.
134
1
j ti ;
Além disso, usando
U (t) =
1
X
n=0
temos
n
i
t
~
i
^+
t H
~
^n = I +
H
i
^H
^M
^+ +
t M
~
^ U (t) M
^+ = M
^ IM
^+ +
M
=I+
i
^H
^M
^+ +
t M
~
=I+
i
^0 +
t H
~
=
1
X
i
t
~
n=0
n
i
t
~
2
^H
^ + :::
H
2
i
t
~
^H
^H
^M
^ + + :::
M
2
i
t
~
^H
^ M
^ +M H
^M
^ + + :::
M
2
i
t
~
^ 0H
^ 0 + :::
H
^ 0 n = U 0 (t) :
H
Ou seja,
^ U (t) M
^+ ;
U 0 (t) = M
^ 0.
é o operador de evolução temporal para o sistema com hamiltoniano H
Exercise 51 O resultado acima continua válido para o caso geral em que o
hamiltoniano não comuta em diferentes instantes do tempo?
Por exemplo, suponha agora que você encontrou (como feito anteriormente)
a solução do problema de uma partícula de spin 1=2 num campo magnético da
direção z. Neste caso,
^ =
H
3 :B
=
1
0
B
0
1
:
E deseje encontrar a solução para o mesmo problema, mas com um campo (de
mesma intensidade) na direção x, ou seja, como o hamiltoniano
^0 =
H
1 :B
=
0
1
B
1
0
:
Fisicamente isso signi…ca, obviamente, que você girou de 90o o aparelho que
gera o campo.
Agora, usando as propriedades das matrizes é fácil ver que
"p
# "p
#
2
2
1
(1 i 2 ) 3
(1 + i 2 ) = ( 2i 2 3 ) = 1 :
2
2
2
Além disso,
p
2
(1 i 2 ) =
2
p
2
2
p
2
i
2
2
!
= cos
4
135
i
2
sin
4
= exp
i
4
2
^ :
=M
Assim
^0 =
H
1 :B
^
M
=
^ + :B = M
^(
^+ = M
^H
^M
^+
3M
3 :B) M
onde
^ = exp
M
i
:
2
4
^ acima representa uma rotação (no sentido
Assim, o operador (unitário) M
anti-horário) na direção do eixo y de um ângulo de 90o
^y
R
2
= exp
i
:
2
4
Isso se aplica a qualquer dispositivo do nosso experimento. Por exemplo, se temos um SG na direção x, i.e., estamos medindo o spin na direção
x
~
S^x =
1
2
e fazemos
^y
R
^y
S^x R
2
2
=
~^
Ry
2
^
1 Ry
2
2
=
~
2
3
= S^z ;
teremos um SG na direção z e passaremos a medir o spin na direção z.
Da mesma forma, é possível mostrar que uma rotação de um ângulo qualquer
no sentido anti-horário na direção do eixo y vale
^ y ( ) = exp
R
i
2
2
:
Exercise 52 Mostre que se temos um campo na direção z e rodamos de um
ângulo , os hamiltonianos obtidos estarão ligados pelo operador acima.
Mais ainda, repetindo todos estes argumentos para as direções x e z temos
que
^ x ( ) = exp
R
i
2
1
^ z ( ) = exp
; R
i
2
3
^ i ( ) = exp
)R
i
2
i
:
Ou seja, de forma geral,
^ n^ ( ) = exp
R
^:
i n
2
= cos
2
i^
n: sin
2
;
é o operador de rotação na direção do vetor normal n
^ de um ângulo
anti-horário.
Exercise 53 Mostre que
2
(^
n: ) = I :
136
no sentido
Exemplo 1:
Suponha que você resolveu o problema para um campo de intensidade
na direção x,
!
p
p
p
2B
i
^ =
H
2B 1 ) U (t) = exp
2B 1 t = cos
t
i 1 sin
~
~
p
2B
p
2B
t
~
!
e quer resolver o problema para um campo de mesma intensidade fazendo um
ângulo de 45o no plano x; y. Neste caso,
^0 = B (
H
1
+
2)
:
Primeiramente veri…camos que
^z
R
4
^R
^z
H
= exp
4
i
= exp i
8
p
=
2B
Usando
3
1
4
^R
^z
H
8
sin2
8
8
i
i 8
3
2
2
sin
2
sin
cos
8
8
p
p
=
4
cos2
3
q
temos
^z
R
h
^ exp i
H
8
p
2B 1 exp
q
p
1
2 + 2 ; sin =
2
2
8
2
p
p
2
2
sin2 =
; sin cos =
8
2
8
8
4
1
cos =
8
2
cos2
3
8
2B
1
p
p
h
cos2
8
2
( 1+
2
= B ( 1 + 2)
= B 2
sin2
8
i
2
cos
8
8
2)
que é o hamiltoniano cuja solução gostaríamos de encontrar. Ou seja, como era
de se esperar, uma rotação de 45o levou o campo que estava no eixo x no campo
desejado.
Assim, a solução do nosso problema vale
^z
U 0 (t) = R
= exp
= cos
= cos
4
i
^z
U (t) R
"
3
8
!
p
2B
t
~
!
p
2B
t
~
4
2B
t
~
cos
i
p
h
1
cos
p
2
i
(
2
!
1
+
i
1
p
2B
t
~
sin
2
2
8
sin
2 ) sin
137
8
p
+2
2B
t
~
!
2
:
!#
cos
exp i
8
sin
8
8
3
i
sin
p
2B
t
~
!
Que concorda com o resultado (??) obtido para o mesmo problema anteriormente.
Exercise 54 Uma partícula de spin
1
2
está sujeita ao campo
B = (0; By ; Bz ) :
^ que leva este campo para a direção z
Encontre a rotação R
B0 = (0; 0; Bz0 ) :
Em seguida encontre U 0 para B0 e use o resultado para encontrar a solução para
o campo B. Resolva diretamente o problema para B e compare os resultados.
O procedimento do exercício acima pode ser usado para resolver o problema
para um campo estático numa direção arbitrária. Vemos assim que qualquer
problema de dois níveis independente do tempo possui solução exata.
8.5
Espinores
Observe que o ângulo presente no operador de rotação é o ângulo (no espaço
físico) que giramos nosso experimento.
Além disso, como vimos anteriormente, é possível orientar o spin da partícula
numa direção qualquer através da aplicação de campos magnéticos. Ou seja, se
uma partícula é preparada no estado j+i e desejamos girar seu spin de 90o na
direção y, de sorte que este …que na direção +x basta aplicar o campo
^ =
B = B y^ ) H
B
2
) U (t) = exp
para termos
i
B
~
2t
2
jhx+ j U (t) j+ij = 1 :
Calculando explicitamente
hx+ j exp
i
B
~
2t
h
i
j+i = hx+ j cos Bt + i 2 sin Bt j+i
~
~
i
h
= hx+ j cos Bt j+i + i 2 j+i sin Bt
~
~
h
i
= cos Bt hx+ j+i + ii hx+ j i sin Bt
~
~
1
1
= p cos Bt p sin Bt
~
~
2
2
h
i
1
= p cos Bt sin Bt
~
~
2
i
1 h
= p cos Bt sin Bt
~
~
2
138
temos
2
jhx+ j U (t) j+ij =
sin 2 Bt =
~
1h
1
2
2 cos
~
i 1h
i
1 sin 2 Bt = 1
Bt =
~
2
~
~
)t=
:
2
4B
Bt sin
1 ) 2 Bt =
~
Assim, para levarmos o spin de +z para a direção +x basta aplicar o operador
U (T ) = exp
i
B
~
2T
= exp
i
2
4
= Ry
4
;
que nada mais é que uma rotação de 90o no eixo y. Ou seja, se o spin estava
na direção +^
z (o que signi…ca que, numa medida de Sz obteremos +h=2 com
certeza), depois de virado 90o ele foi pra direção +^
x (o que signi…ca que, numa
medida de Sx obteremos +h=2 com certeza). O que concorda bastante com a
visão clássica de momento angular.
Remark 55 Aplicar o operador Rn^ ( ) num estado j i gira o spin deste estado
de um ângulo na direção n
^.
Problem 56 O que acontece quando você gira de 360o o spin de uma partícula?
Pelo que foi dito acima, o resultado será o vetor
^ n^ (2 ) j i = exp
j 0i = R
= (cos
= j i
i
2
n
^:
2
j i = exp ( i n
^: ) j i
i (^
n: ) sin ) j i
Remark 57 Ou seja, você não vai obtermos o mesmo estado, mas sim com um
sinal invertido!
Lembre-se que, em problemas de mecânica, temos uma de…nição mais restrita para o conceito de vetores. Vetores são quantidades que, por uma rotação
do sistema de coordenadas, se transformam como as componentes das coordenadas (veja, por exemplo, o livro do Marion de Mecânica). Em especial, por
uma rotação de 360o todos os vetores voltam ao mesmo estado. Vemos
então que os nossos estados para as partículas de spin 12 não se comportam
como vetores (no sentido da lei de transformação). Quantidades que se
transformam como os estados acima são chamados de espinores. Ou seja, para
retornar ao seu estado original um espinor precisa sofrer uma rotação de 720o .
Assim, o momento magnético estudado aqui possui uma natureza diferente
do momento magnético estudado em mecânica (ou eletromagnetismo). Enquanto este último é um vetor, o primeiro é um espinor.
139
Como na mecânica clássica, este momento magnético pode ser associado ao
momento angular do sistema
C
^:
= L ; ^Q = S
^ é um espinor. Ou seja, quando usamos as
Entretanto, enquanto L é um vetor S
notações
^ = B
^=~ ; H
S
B;
2
estamos fazendo um abuso da notação vetorial.
Recapitulando, se j i é o estado da partícula num certo estado de spin,
então, o estado j 0 i obtido por uma rotação do spin de um ângulo vale
^ n^ ( ) j i :
j 0i = R
Observe também que,
0
^:
i n
2
^ n^ (0) = exp
R
=I :
Além disso, para rotações na mesma direção
^ n^ ( 1 ) R
^ n^ ( 2 ) = exp
R
i
1
2
n
^:
exp
i
2
2
n
^:
= exp
i
(
1
+
2
2)
n
^:
^ n^ (
=R
Ou seja, o operador de rotação compartilha todas as características do operador de evolução. Tudo que precisamos fazer e achar um hamiltoniano que
nos dê o operador de evolução desejado. Lembrando agora que
^ =
H
B
B =) U (t) = exp i B
t
~
B
= exp i
B
(
~
n
^) t
;
onde n
^ é um vetor unitário na direção de B. Basta agora comparar
U (t) = exp i
B
(
~
n
^) t
= exp
i n
^:
2
^ n^ ( ) :
=R
Ou seja, a aplicação de um campo B, por um tempo t é equivalente a girar o
spin da partícula de um ângulo
=2
B
t;
~
na direção do campo (o sinal de
indica que o giro é no sentido horário).
Desta forma, através da aplicação de campos magnéticos, podemos manipular
e produzir estados com qualquer valor desejado de spin.
Como vimos acima, diferente de um vetor, por uma rotação de 360o um
espinor se transforma como
360o
j i !
j i :
Entretanto, os dois estados acima diferem apenas por uma fase.
140
1
+
2)
Problem 58 Será que esta fase tem algum signi…cado físico?
Em outras palavras, será que é possível detectar alguma diferença quando
um sistema físico é girado de 360o .?
Como apresentado no primeiro postulado, uma fase global não possui nenhum signi…cado físico. Entretanto, a diferença de fase entre dois estados (que
se comporta como uma fase local) pode ser medido. Pois, pelo comportamento
ondulatório dos sistemas, a combinação de dois estados com uma defasagem de
180o é completamente destrutiva. Lembre-se que a probabilidade é o módulo
quadrado da soma das amplitudes.
O experimento da …gura abaixo (proposto por J. Bernstein, Yakir Aharonov
e Leonard Susskind) utiliza um feixe de nêutrons que é dividido por um cristal
A e, em seguida, por mais dois cristais B e C, e se recombinam num cristal D.
Estes cristais (feitos com silício) dividem o feixe em dois feixes de intensidades iguais. Assim, este se comporta exatamente como um experimento de
duas fendas para o elétron. Ou seja, se jABi é o estado do nêutron quando ele
sobe após passar pelo cristal A e jACi o estado quando ele desce, ao passar pelo
cristal o nêutron estará num estado
1
p (jABi + jACi) ;
2
onde a soma indica que estes dois estados estão em fase.
Após passar pelo cristal o nêutron pode ter seguido qualquer um dos dois
caminhos (com a mesma probabilidade), de sorte que no ponto D as suas funções
de onda em todas as trajetórias possíveis se interferem (ou seja, assim como no
experimento de duas fendas, ele interfere com ele mesmo).
Mais ainda, podemos descrever o estado do nêutron quando chega em D
como
1
p (jCDi + jBDi)
2
O feixe no caminho BD passa por um campo que, quando ligado, gira o spin
do nêutron de 360o . Se o campo está desligado os dois feixe são idênticos e sua
recombinação é construtiva no ponto D (o experimento é ajustado para que isso
aconteça)
2
1
1
P = p (hCDj + hBDj) p (jCDi + jBDi) = 1
2
2
Observe que, se a partícula foi numa direção ela certamente não foi na outra,
hCD jBDi = 0. Entretanto, quando o campo é ligado, o estado do nêutron que
chega em D passa a ser
1
p (jCDi jBDi)
2
e a combinação em E é completamente destrutiva e nenhuma partícula é
detectada
1
P = p (hCDj
2
1
hBDj) p (jCDi + jBDi)
2
141
2
=
1
(1
2
2
1)
=0:
Figure 11: Bernstein, Herbert J.; Phillips, Anthony V., Fiber Bundles and
Quantum Theory, Scienti…c American, vol. 245, issue 1, pp. 122-137 (1981)
142
Assim, é possível detectar experimentalmente uma diferença num sistema girado
de 360o . Nenhuma quantidade clássica apresenta esta característica.
Este experimento foi realizado (entre outras vezes) em 1975 por Helmut
Rauch e Ulrich Bonse no Instituto Laue-Langevin em Genebra.
A descrição acima deixa claro que o spin é um momento angular de natureza
completamente diferente do momento angular orbital. Assim, quando no futuro
obtivermos um operador que represente o momento angular orbital clássico de
um sistema, este terá um comportamento completamente diferente do descrito
para o spin (em especial, ele se comportará com um vetor e não como um
espinor). Com isso, o spin é uma característica (sem análogo clássico) que as
partículas possuem. E não uma característica gerada por algum efeito, como
rotação ou qualquer coisa do gênero.
9
Ressonância
Vamos usar o resultado acima para resolver o seguinte problema (complicado!).
Uma partícula de spin 1=2 está sujeita a um campo de intensidade Bz0 na direção
z^ e um campo, de intensidade B 0 , que gira no plano x; y
B0 =
(B 0 cos !t; B 0 sin !t; Bz0 )
Com isso, o hamiltoniano do nosso sistema se torna
^0 = H
^ 0 (t) =
H
(B 0
cos !t + B 0 2 sin !t + Bz0 )
h
i
^ (t) ; H
^ (t0 ) 6= 0, podemos escrever
Pelas razões discutidas antes, mesmo H
U (t) = exp
1
i
~
Z
t
H (t) d
0
entretanto, a presença do termo Bz t inviabiliza a aplicação da técnica anterior.
Tudo que precisamos fazer é “mudar nosso sistema de coordenada”, i.e., vamos observar este campo de um sistema que gira junto com o campo. Ou seja,
um sistema que gira na direção do eixo z com velocidade angular !t. Neste
caso, temos apenas um campo estático no plano x; y de intensidade B e outro,
também estático, na direção z de intensidade Bz . Este problema com campo
independente do tempo pode ser resolvido sem muitos problemas. Seguindo a
nomenclatura da seção anterior, vamos chamar de quantidades com linha aquelas que queremos resolver (o campo girante) e sem linha aquelas que sabemos
^ 0 se relaciona
resolver (o campo estático). Sabemos que nosso hamiltoniano H
^ pela relação (??)
com H
!
^ 1
d
M
^0 = M
^H
^M
^ 1 i~M
^
:
H
dt
^
Problem 59 Mas qual o hamiltoniano H?
143
^ representa um campo estático no plano x; y combinado com
Sabemos que H
um campo estático na direção z. Além disso, podemos começar a girar o nosso
sistema no instante em que o campo girante aponta na direção do eixo x (isso
signi…ca apenas escolher adequadamente a fase da nossa rotação). Com isso,
podemos escrever
^ = (B 1 + Bz 3 ) :
H
Além disso, também pelo que foi apresentado antes, sabemos que o operador
responsável pela rotação desejada é
Rz (!t + ) = exp
i
(!t + )
2
3
Onde é apenas uma fase indicando quando começamos a girar. Escolher esta
fase signi…ca dizer em que direção do plano x; y estamos vendo o campo. Assim,
se j 0 i é a solução do problema com o campo girante, a solução j i com o campo
estático é dada por
j i = Rz j 0 i =) j 0 i = Rz 1 j i :
Comparando com (??) vemos que, neste caso,
^ (t) = R
^ 1 (!t + )
M
z
^ 0 com o campo girante se relaciona com o
Sabendo que o hamiltoniano H
^
hamiltoniano H com o campo estático pela relação (??)
!
!
^ 1
^z
d
R
d
M
0
1
1
1
^ =M
^H
^M
^
^
^z H
^R
^ z i~R
^z
H
i~M
=R
dt
dt
Com isso, temos
dRz
=
dt
i
!
2
3
exp
1
^ 0 = Rz HR
^
H
z
(!t + )
!
= i 3 Rz
3
2
2
!
!~
1
^
i~Rz i 3 Rz 1 = Rz HR
z +
2
2
i
3
calculando
^z H
^R
^z 1 =
R
^z
BR
^
1 Rz
1
^z
+ Bz R
^
3
sin
2
sin (!t + )
3 Rz
1
=
^z
BR
^
1 Rz
1
+ Bz
3
onde
^z
R
^
1 Rz
1
(!t + )
i
2
(!t + )
cos2
2
= cos
=
1
=
1
cos (!t + ) +
(!t + )
(!t + )
(!t + )
+ i 3 sin
1 cos
2
2
2
(!t + )
(!t + )
(!t + )
sin2
+ 2 2 cos
sin
2
2
2
144
Podemos agora acertar a nossa fase exigindo que em t = 0 o campo aponte
apenas na direção x
^ z (0)
R
^
1 Rz
1
(0) =
1
cos ( ) +
2
sin ( ) =
1
=)
=0;
com isso temos
^z H
^R
^z 1 =
R
[B
1
cos (!t) + B
2
sin (!t) + Bz
3]
^ 0 temos
Substituindo agora em H
^ 0 = Rz HR
^ z1+ !
H
2
=
B
1
3
=
[B
cos (!t) + B
1
cos (!t) + B
sin (!t) + Bz +
2
2
sin (!t) + Bz
!~
2
3]
+
!~
2
3
3
Ou seja, o nosso problema girado representa a aplicação do seguinte campo
dependente do tempo
B=
B cos (!t) ; B sin (!t) ; Bz +
!~
2
podemos identi…car com o campo desejado
B0 =
(B 0 cos !t; B 0 sin !t; Bz0 )
fazendo
B 0 = B ; Bz0 = Bz +
!
) Bz = Bz0
2
!~
2
onde lembramos que as quantidades conhecidas (i.e., os campos reais) são aquelas com linha.
Tudo que precisamos fazer agora é encontrar a solução para
^ =
H
(B
1
+ Bz
3)
) U (t) = exp
Usando
(B
1
+ Bz
2
3)
i
(B
~
1
+ Bz
3) t
= B 2 + Bz2
temos
!
i p 2
(B
+
B
)
1
z
3
U (t) = exp
B + Bz2 p
t
~
B 2 + Bz2
p
p
(B 1 + Bz 3 )
= cos
B 2 + Bz2 t
i p
B 2 + Bz2 t
sin
2
2
~
~
B + Bz
(B 1 + Bz 3 )
= cos ( t) i p
sin ( t)
B 2 + Bz2
p
=
B 2 + Bz2
~
145
Podemos agora responder qualquer pergunta sobre o comportamento do sistema.
Suponha, por exemplo, que você preparou sistema inicialmente no estado
j+i, ou seja,
j 0 i = j+i
observe que
0
0i
j
^ z (0) j
=R
0i
=j
0i
;
ou seja, a condição inicial vale tanto para o nosso sistema com e sem linha.
Problem 60 Ao aplicarmos o campo girante, qual a probabilidade de, depois
de um tempo T , o sistema ser encontrado no estado j i?
Para isso basta calcular
0
f
j
0
ti
onde
h
0
f
=
Rz 1 (!t) j
"
1
0
f
=
Rz 1 (!t) U (t) j
1
Rz (!t) U (t) j+i = h
Rz (!t) j+i cos ( t)
i h j Rz
1
0i
#
(B 1 + Bz 3 )
(!t) p
j+i sin ( t)
B 2 + Bz2
#
h j Rz 1 (!t) B j i + h j Rz 1 (!t) Bz j+i
p
cos ( t) i
sin ( t)
= h j+i e
B 2 + Bz2
"
#
!
!
h j i ei 2 t B + h j+i e i 2 t Bz
p
=
i
sin ( t)
B 2 + Bz2
"
#
B
i!
t
=
ie 2 p
sin ( t)
B 2 + Bz2
"
com isso
jh
ti
i!
2t
2
Rz (!t) U (t) j+ij =
=
B2
sin2 ( t) =
B 2 + Bz2
~
s
B 02 + Bz0
!
2
B 02
B 02
+
Bz0
!
2
2
sin2 ( t)
2
Do resultado acima vemos que a nossa probabilidade é máxima quando
2 Bz0
!~
=0)!=
:
2
~
Bz0
Esta é a freqüência de ressonância do sistema. Ou seja, apenas quando o campo
na direção z respeita esta relação com a freqüência de giro do campo no plano
x; y, temos a possibilidade de inversão de todos os spins do nosso sistema. Obviamente, para que esta inversão ocorra, o campo tem de ser aplicado exatamente
por um tempos
sin2 (
R t)
=1)
Rt
=
2
mod ( ) =
146
~
B0t ) t =
~
mod ( ) ;
2 B0
onde
R
é calculado na ressonância
R
=
jB 0 j
:
~
Observe que o nosso hamiltoniano tem a forma
^ =
H
=
(B 0
1
cos !t + B 0
Bz0
B 0 ei!t
2
sin !t + Bz0
3)
Bz0
B 0 (cos !t i sin !t)
B (cos !t + i sin !t)
Bz0
=
0
B 0 e i!t
Bz0
que, na forma de operadores, na base fj+i ; j ig pode ser escrito como
^ =
H
Bz0 j+i h+j
Bz0 j i h j + B 0 e
i!t
j+i h j + B 0 ei!t j i h+j
ou seja, os elementos fora da diagonal são os responsáveis pela transição entre
diferentes estados da nossa base. Quando B0 = 0 não existe transição e os
estados j+i e j i são estacionários. A presença do campo B 0 promove esta
transição e esta é máxima na freqüência de ressonância.
Como dissemos, a descrição de uma partícula de spin 1=2 é apenas um caso
particular do caso geral de um sistema de dois níveis. Para um sistema geral de
dois níveis podemos escrever
^ = E1 j+i h+j + E2 j i h j + V12 j+i h j + V21 j i h+j ;
H
ou ainda, para o caso de um sistema de dois níveis sujeito a um potencial girante
(que pode ser um campo elétrico, magnético ou qualquer outra coisa)
^ = E1 j+i h+j + E2 j i h j + V e
H
i!t
j+i h j + V ei!t j i h+j :
Quando o potencial é desligado V = 0 os estados com energia E1 e E2 são
estacionários e quando este potencial é ligado, temos a transição entre os níveis.
A transição é máxima na freqüência de ressonância. Para encontrar a freqüência
de ressonância neste caso, basta observar que, no caso do campo magnético a
diferença de energia entre os níveis diagonais valia
E1
E2 =
(Bz0 + Bz0 ) = 2 Bz0
então, no caso geral temos
!=
2 Bz0
E1 E2
=
) ~! = E1
~
~
E2 :
Se usarmos o modelo de que o campo eletromagnético é formado por fótons
com energia ~!, a ressonância ocorre quando a freqüência dos fótons do campo
girante é igual a diferença de energia dos níveis do sistema.
147
=
Exercise 61 Mostre que,
^ =M
^
H
=
1
^
dM
dt
^ 0M
^ + i~
H
B0 f
1
cos (
1
)+
!
2
^
M
sin (
)g + Bz0 +
!~
2
3
onde
^0 = H
^ 0 (t) =
H
^ = Rz (!t
M
(B 0
1
cos !t + B 0
) = exp
i
2
(!t + )
2
sin !t + Bz0
3)
3
Os resultados acima possuem uma in…nidade de aplicação em física. Por
exemplo, uma molécula de amônia (NH3 ) num campo elétrico constante possui dois níveis de energia que dependem da orientação do átomo de nitrogênio.
Através de um experimento tipo SG (mas usando campo elétrico variável no espaço e não campo magnético) é possível selecionar toras as moléculas no estado
j2i, i.e., com energia no estado fundamental. Se estas moléculas entram num
campo girante na freqüência de ressonância no tempo certo (calculado anteriormente) todas estarão no estado excitado. Ainda pela ação do campo estas
moléculas vão decair emitindo fótons de mesma energia que os absorvidos anteriormente. Estes fótons irão se somar com o do campo aplicado e, durante algum
tempo, teremos uma ampli…cação do campo. Desta forma podemos gerar pulsos de campo ampli…cado. Este processo se chama Ampli…cation by Stimulated
Emission of Radiassion. No caso das moléculas de amônia, como a freqüência
de ressonância esta no espectro de microondas: Microwave ASER, ou MASER.
No caso de sistemas cuja freqüência de ressonância está no espectro do visível:
Light ASER ou LASER.
Para a próxima aplicação é importante analisar o comportamento da amplitude máxima com relação à freqüência. Plotando a função
V2
f (!) =
V2+
(E1 E2 ) ~!
2
2
temos algo como a …gura abaixo.
Controlando o potencial (ou campo) constante é possível estreitar a largura
do pico. Assim, sob condições experimentais adequadas este pico é tão estreito
que, mesmo na presença de uma série de sistemas (átomos, moléculas etc) diferentes, é possível excitar apreciavelmente apenas um tipo de sistema especí…co.
Com isso, outro exemplo de aplicação é quando você tem uma grande quantidade de um certo átomo que sabidamente estão no estado fundamental (e.g.,
por equilíbrio térmico). Neste caso, se você sabe a diferença de energia entre
o estado fundamental e o primeiro estado excitado, é possível excitar o sistema
com uma radiação na freqüência de ressonância e, quando o sistema decair, você
148
Figure 12: Figura retirada do Sakurai
pode medir a intensidade da radiação emitida e saber quantos átomos daquele
tipo existem no sistema. Além disso, se o sistema é composto por vários átomos diferentes, apenas o elemento que você deseja medir irá responder a este
processo. Este é o mecanismo dos aparelhos médicos MRI (Magnetic resonance
imaging). Além do mecanismo de qualquer tipo de análise com ressonância
magnética (e.g., MRN).
Este mesmo processo é usado para excitar certas moléculas, como a de água
no forno de microondas e uma in…nidade de aplicações.
Um detalhe na teoria desenvolvida acima é a di…culdade de se produzir
campos girantes com freqüências altas o su…ciente. Por isso, no lugar de um
campo girante é utilizado um campo linear do tipo
B = (B cos (!t) ; 0; Bz ) :
Este problema não pode ser resolvido pelo método anterior, mas deve ser atacado por métodos aproximativos. Entretanto, o fato de um campo linearmente
polarizado ser a superposição de dois campos circulares em direções opostas,
faz com que os resultados sejam idênticos aos obtidos acima. Voltaremos a este
problema quando estudarmos métodos aproximativos.
10
Observáveis compatíveis
Uma questão crucial em MQ é quando uma medida perturba o sistema, ou
ainda, quando um observável tem um valor bem de…nido. Como vimos, para
149
que a medida de uma quantidade A^ não perturbe o sistema, este deve estar
^ Assim, A^ não irá perturbar um sistema que esteja num
num auto-estado de A.
auto-estado
A^ j i = a j i :
De outra forma, a medida do observável A^ num estado genérico
X
j i=
cn j n i ; A^ j n i = an j n i ;
fará com que, após a medida, o sistema colapse num dos auto-estados j n i de
^
A.
Suponha agora que, depois de efetuada uma medida de A^ desejamos efetuar
^ Isso só será possível, sem perturbar o
uma medida de outro observável B.
sistema, se o vetor obtido após a aplicação de A^ em j a i também for um
^ ou seja, se
autovetor de B,
^ A^ j i = b0 A^ j i = b0 a j i = b j i ; b = b0 a ;
B
ou seja, j
^
B,
ai
tem de ser simultaneamente autovetor dos dois operadores A^ e
^ j i = bj i :
A^ j i = a j i ; B
Mas, se isso é verdade, temos
^ j i = ab j i ;
A^B
^ A^ j i = ba j i = ab j i ;
B
ou ainda,
h
^
A^B
i
^ A^ j i = 0
B
^
Para qualquer auto-vetor simultâneo de A^ e B.
^
A quantidade acima é o comutador entre os operadores A^ e B
h
i
^ B
^ = A^B
^ B
^ A^ :
A;
^ temos
Além disso, se todo o autovetor de A^ for também autovetor de B
h
i
^ B
^ j n i = 0 ; A^ j n i = n j n i
A;
e sabemos que qualquer vetor pode ser escrito como
X
j i=
cn j n i
n
temos que
h
i
h
iX
^ B
^ j i = A;
^ B
^
A;
cn j
n
ni
150
=
X
n
h
i
^ B
^ j
cn A;
ni
=0
h
i
^ B
^ = 0 para qualquer vetor j i do nosso espaço, então A^ e B
^
Ou seja, se A;
tem uma base de auto-vetores em comum. Mais ainda, podemos efetuar
medidas de um dos operadores sem alterar o valor do outro.
Ou ainda, os dois observáveis podem ser medidos simultaneamente. Quando
h
i
^ B
^ =0
A;
^ comutam, ou ainda, que estes observáveis são compatíveis.
dizemos que A^ e B
Remark 62 Apenas observáveis compatíveis podem ser medidos simultaneamente em MQ.
Os resultados acima nos dizem quando devemos esperar uma incerteza relacionada a medida de dois observáveis quaisquer.
Por exemplo: Um exemplo é o caso do spin da partícula.
Como vimos, os operadores de spin nas direções x; y; z são dados por:
~
S^i =
2
i
;
1
0
1
=
1
0
;
2
0
i
=
i
0
;
3
1
0
=
0
1
:
Vamos então à descrição de uma série de medidas do spin de uma partícula.
Suponha que você alinhou o aparato de SG na direção z, ou seja, efetuou uma
medida de S^3 e obteve o valor +1 (a partícula subiu). Com isso, pelos postulados
vistos, sabemos que a partícula, após a medida, está num auto-estado de S^3 com
valor +1:
1
jz+ i =
:
0
Suponha agora que, depois desta medida, você alinha o aparato da direção
x efetua uma nova medida.
Após esta segunda medida o sistema irá colapsar num dos autovetores de S^1
1
jx+ i = p
2
1
1
1
1
= p (j+i + j i) ; jx i = p
2
2
1
1
:
Exercise 63 Veri…que que estes vetores são autovetores de S^1 com auto valor
+1 e 1.
A questão é a seguinte: você sabe que o seu sistema está no estado jz+ i (pois
você mediu o spin na direção z) e que saber, por exemplo, a probabilidade de,
numa medida do spin na direção x obter o valor +1. Pelos postulados vistos
anteriormente, sabemos que a probabilidade P (x+ ) de encontrar o sistema no
estado jx+ i, sabendo que ele está no estado jz+ i, vale
2
P (x+ ) = jhx+ jz+ ij =
1
1
p
2
0
Da mesma forma
2
P (x ) = jhx jz+ ij =
151
1
2
1
1
2
=
1
2
ou seja, você tem uma incerteza total na medida do spin na direção x.
Agora, se você efetuou a medida na direção x (do estado jz+ i) e obteve o
valor +1 (a partícula foi para a direita), você sabe que após a medida a partícula
está no estado
1
1
1
jx+ i = p
= p (j+i + j i) :
1
2
2
Se você …zer novamente uma medida do spin na direção z, a probabilidade de
obter novamente +1 vale
1
2
P (z+ ) = jhz+ jx+ ij = p
2
1
1
0
1
2
=
1
2
Da mesma forma P (z ) = 1=2. Ou seja, após a medida na direção x você
perdeu toda a informação do spin na direção z.
O ponto aqui é que a medida de um dos observáveis perturbou o valor do
outro. Ou seja, não podemos medir, simultaneamente, Sx e Sz .
Isso já era de se esperar pelo resultado anterior, pois estes operadores não
comutam:
h
i
~
S^x ; S^z =
2
2
~
=
2
0
1
0
1
1
0
;
1
0
~
2
1
0
=
0
1
i
~2
2
=
0
i
~
2
2
i
0
0
2
=
2
0
i
~2
S2 6= 0 :
2
A caracterização de um certo sistema físico depende, em geral de uma série de
características e medidas. Por exemplo, a partícula pode ter spin Sz e momento
P e nomeamos seu estado como
jSz ; P i ;
^
ou ainda, dois valores quaisquer dos observáveis A^ e B,
jA; Bi :
Quanto mais características damos a um estado físico melhor o especi…camos.
Entretanto, dizer que o sistema possui as características A e B signi…ca que estas
características possam ser determinadas simultaneamente. Ou seja, para
rotular os estados devemos escolher apenas observáveis compatíveis.
Assim, não podemos caracterizar o sistema num estado do tipo
jSz ; Sx i :
Diferente da MC onde podemos fazer cada vez mais medidas no nosso sistema e,
destarte, melhor caracterizá-lo, na MQ a caracterização do sistema está restrito
a compatibilidade dos observáveis. Quando temos um conjunto de observáveis
compatíveis que são capazes de caracterizar completamente um sistema físico,
dizemos que temos um conjunto completo de observáveis.
152
10.1
Relações de incerteza
Uma quantidade clássica muito usada para caracterizar a incerteza de uma
medida A é o desvio quadrado médio
2
A
2
= A2
hAi
Pelos postulados da MQ sabemos que, o valor médio de um observável A^ num
estado vale
hAi = h j A^ j i ;
e a versão quântica para o desvio padrão pode ser escrita como
2
A
( ) = h j A^2 j i
2
h j A^ j i
se …zemos
A^ = A^
h j A^ j i
podemos escrever
2
A
( ) = h j A^2 j i
Exercise 64 Veri…que a a…rmação acima.
^
Considere agora dois observáveis A^ e B.
Um resultado conhecido como desigualdade de Schwarz
h j ih j i
2
jh j ij ;
nos diz que, para qualquer operador hermitiano A^ e qualquer vetor j i (não
necessariamente normalizado),
^2 j i
h j A^2 j i h j B
^ j i
h j A^ B
2
com isso temos
2
A
( )
2
B
^2 j i
( ) = h j A^2 j i h j B
^ j i
h j A^ B
2
(75)
^ nem sempre o será.
Além disso, apesar de serem hermitianos, o produto A^B
Com isso a quantidade
^ j i
h j A^ B
será, em geral, complexa
^ j i
h j A^ B
2
h
i2 h
i2
^ j i
^ j i
= Re h j A^ B
+ Im h j A^ B
Podemos agora calcular
^ j i
^ j i = 1 h j A^ B
Im h j A^ B
2i
153
^ j i
h j A^ B
h
^ j i
Im h j A^ B
(76)
i2
Mas,
+
^ j i = h j A^ B
^
h j A^ B
^ + A^+ j i = h j B
^ A^ j i
j i = h jB
^ Com isso
onde, na última igualdade, usamos a hermiticidade de A^ e B.
^ j i = 1 h j A^
Im h j A^ B
2i
1
h j A^
=
2i
h
1
h j A^
=
2i
usando
h
temos
^
A^ ; B
i
h
= A^
^ j i
B
^
B
^ A^ j i
h jB
^ A^
B
^
;B
i
j i
j i
i h
i
^ j i = A;
^ B
^
h jB
^
h j A^ j i ; B
i
h
^ B
^ j i
^ j i = 1 h j A;
Im h j A^ B
2i
Usando (75), (76), (77) temos
2
A
2
B
( )
( )
^ j i
h j A^ B
h
2
^ j i
Im h j A^ B
i2
(77)
=
i
h
1
^ B
^ j i
h j A;
2i
Com isso
i
h
1
^ B
^ j i
h j A;
2
ou seja, o produto da incerteza de qualquer medida é proporcional ao comutador
dos operadores correspondentes.
A
11
( )
B
( )
Sistemas de várias partículas
Em MQ a descrição de um sistema com mais de uma entidade se dá através
do produto tensorial dos espaços de cada sistema. Então, usando a notação
anterior, se j 1 i 2 H1 representa uma entidade do sistema (e.g., uma partícula)
e j 2 i 2 H2 uma segunda entidade (e.g., uma segunda partícula), o estado
quântico do sistema como um todo será:
j i=j
1i
j
2i
j
1
2i
; j i 2 H = H1
Todos os operadores também serão escritos desta forma
X
^i ; A^i 2 H1 ; B
^ i 2 H2
A^ =
A^i B
i
A^ j i =
X
i
A^i
^i j
B
1i
j
2i
154
=
X
i
A^i j
1i
H2 :
^i j
B
2i
2
:
Suponha, por exemplo, que você possui duas partículas de spin 12 . Primeiro,
obviamente, precisamos escolher um observável para caracterizar as partículas.
Podemos usar, por exemplo, o spin na direção z para caracterizar a primeira
partícula e na direção x para caracterizar a segunda. Com isso, a forma geral
de um vetor de estado do nosso sistema será
j i = j 1 i j 2 i = (a+ j+i + a j i) (b+ jx+ i + b jx i)
= a+ b+ j+; x+ i + a+ b j+; x i + a b+ j ; x+ i + b a j ; x i
2
Onde ja b j é a probabilidade de encontrar a primeira participa no estado j i
e a segunda no estado jx i.
Suponha que as duas partículas estão distantes e você passou a primeira por
um SG na direção z e veri…cou que ela subiu (i.e., está no estado j+i) com isso
o estado …nal do seu sistema será
j
fi
= b+ j+; x+ i + b j+; x i :
Vamos imaginar agora que as partículas estão juntas e vamos realizar experimento com ambas nos mesmos dispositivos. Neste caso, é interessante usarmos
o mesmo observável para caracterizar ambas as partículas. Vamos então usar
Sz para as duas partículas. Neste caso, um estado geral do nosso sistema vale
j i = a+ b+ j+; +i + a+ b j+; i + a b+ j ; +i + b a j ; i
2
Onde agora ja b j é a probabilidade de encontrar a primeira participa no
estado j i e a segunda no estado j i. O conjunto de vetores acima forma uma
base para o nosso espaço. Observe que agora nossos vetores são matrizes coluna
de 4 elementos. Na base canônica, usando o produto de Kronecker podemos
escrever
0 1
1
B 0 C
1
1
C
j+; +i =
=B
@ 0 A :
0
0
0
Suponha agora que estas duas partículas passam por um campo magnético
B.
Problem 65 Qual o hamiltoniano do sistema?
Neste caso, nós precisamos saber se as partículas interagem entre si ou não.
Ou seja, se o estado de spin de uma partícula in‡uencia no estado da outra.
Supondo que as partículas não interagem, o hamiltoniano pode ser escrito como
H=
B
I +I
B:
Para o caso em que os campos são diferentes em cada partícula, i.e., a
partícula 1 está sujeita ao campo B1 e a 2 a um campo B2 temos:
H=
B1
I +I
155
B2 :
Para o caso mais geral de partículas interagentes o hamiltoniano tem a forma
H=
I +I
B1
B2 +
3
X
Vij
i
j
:
ij=1
Exemplo:
Duas partículas não interagente de spin 12 estão sujeitas a um campo de
intensidade B na direção z. Se o sistema foi preparado inicialmente com ambas
no estado j+i, qual a probabilidade de, depois de um tempo t, ambas serem
encontradas no estado jx+ i?
O operador de evolução do sistema será
i
Ht
~
U (t) = exp
iB
(
~
iB
(
~
U (t) = exp
= exp
; H=
3B
3
I +I
3
I) t exp
I +I
3B
iB
(I
~
3) t
3) t
observe agora que
(
2
onde I é a identidade 4
exp
I) = (
3
iB
(
~
3 3
I=I
II) = I
4. Com isso
3
I) t
= cos
B
t
~
i
3
I sin
B
t
~
Para responder nossa pergunta calculamos
hx+ x+ j U (t) j++i = hx+ x+ j exp
= exp
= exp
= exp
iB
(
~
3
I) t exp
iB
t hx+ x+ j++i
~
iB
2 t hx+ j+i hx+ j+i = exp
~
iB
1
2 t
~
2
iB
(I
~
3) t
j++i
2
2
iB
t
~
1 1
p p
2 2
ou seja
1
:
4
O que já era de se esperar, pois os estados j++i são estacionários e a probabilidade de cada um deles ser encontrado no estado jx+ i vale 1=2.
2
jhx+ x+ j U (t) j++ij =
156
Suponha que no exemplo acima a primeira partícula esteja sujeita ao campo
B1 = B1 z^ e a segunda ao campo B2 = B2 x
^,
H=
lembrando que [
exp
i
(B1
~
3
1;
3]
3 B1
I +I
1 B2
6= 0 será que podemos escrever
I +I
B2
1) t
iB1
(
~
= exp
3
I) t exp
iB2
(I
~
1) t
A resposta é sim, pois
[
3
I; I
1]
=(
=(
3
3
I) (I
(
1)
1)
(I
1) (
1) = 0 :
3
3
I)
^ 1 , o sistema 2
De forma geral, se o sistema 1 está sujeito ao hamiltoniano H
^
ao hamiltoniano H2 é os sistema não interagem:
U (t) = exp
i ^
H1
~
I +I
^2 t
H
i ^
H1
~
= exp
It exp
i
I
~
^ 2t
H
Remark 66 Como era de se esperar, sistemas sem interação evoluem independentemente, cada um com seu hamiltoniano.
Como ocorre então na MQ a descrição da interação de duas partículas?
Suponha agora que as partículas interajam entre si. Então esta interação
será descrita por um operador na forma
X
A^i A^i
A^ =
i
Ou seja, um operador que age, simultaneamente, nos dois espaços (e, conseqüentemente, nas duas partículas). O hamiltoniano total será
X
^ =H
^1 I + I H
^2 +
H
A^i A^i
i
Onde os primeiro dois termos descrevem a interação de cada uma das partículas
com o meio e o último termo a interação de uma partícula com a outra.
11.1
Interação de Heisenberg
Vamos estudar com um pouco mais de detalhes o caso de duas partículas de spin
1
2 que interagem entre si. Em primeiro lugar este hamiloniano é um operador
agindo no EH dos vetores de dimensão 4. Ou seja, é uma matriz 4 4. Uma
base para este espaço pode ser construída com 16 matrizes LI. Lembrando que
157
:
?
as matrizes i mais a identidade formam uma base para as matrizes 2 2,
podemos formar com estas matrizes a seguinte base para o espaço das matrizes
4 4
I=I I ; i=I
I ; ij = i
i ;
i = i
j
Ou seja, qualquer operador de interação (ou não) pode ser escrito na forma
M= I+
3
X
iI
i+
i=1
3
X
i i
I+
i=1
3
X
!ij
i
j
i;j=1
^ 0 todos os demais termos, o
Vamos olhar o primeiro termo. Chamando de H
operador de evolução temporal para o sistema pode ser escrito como
i
~
U (t) = exp
= I exp
^0 t
I +H
i
It exp
~
= exp
i ^0
Ht
~
i ^0
Ht
~
i
t exp
~
Ou seja, quando aplicado em qualquer vetor
h j U j i = h j exp
i
t exp
~
i ^0
H t j i = exp
~
i
t h j exp
~
i ^0
Ht j i
~
ou seja
2
jh j U j ij = h j exp
i ^0
Ht j i
~
2
Assim, este termo não in‡uência nas probabilidades e, conseqüentemente,
na física do sistema. Fisicamente este termo está relacionado apenas com uma
escolha no zero da energia do sistema, o que, em geral, é arbitrário. Com isso,
podemos fazer = 0.
Vamos agora analisar o segundo e o terceiro termo
3
X
i=1
iI
i
;
3
X
i i
I
i=1
Como já vimos estes termos descrevem operações que agem em cada um dos
sistemas separadamente e não representam uma interação. Ou seja, podemos,
em geral incorporar estes termos na hamiltoniana de cada sistema independentemente:
^ 10 = H
^1 +
H
3
X
i i
i=1
^ 20 = H
^1 +
H
3
X
i=1
158
i i
O tratamento matemático destes termos é o mesmo analisado anteriormente
para sistemas sem interação. Por isso nós não vamos voltar nossa atenção para
eles. Observe que não estamos fazendo i = i = 0. Pode ocorre que a
presença de um sistema faça o outro “sentir” o campo aplicado de forma diferente. Mas, em muitos casos, isso pode ser descrito como um campo gerado pela
própria partícula e descrito como um campo B0 efetivo. Por exemplo, no caso
do momento elétrico e partículas carregadas este seria o campo elétrico que uma
partícula cria na posição da outra. O importante é que, uma vez conhecido este
campo ele pode ser tratado como um termo de campo externo e não como uma
interação.
Com tudo isso o termo que realmente importa para nossa interação é o
produto tensorial das matrizes e nosso hamiltoniano pode ser escrito como:
^ =
H
B1
I +I
B2 +
3
X
!ij
i
j
:
ij=1
Os valores de !ij (no caso geral !ij = !ij (t)) devem ser determinadas experimentalmente analisando a in‡uência que um sistema tem sobre o outro. Neste
aspecto o exemplo de duas partículas de spin 21 é o melhor e o pior exemplo
possível.
Ele é um exemplo ruim porque a interação que o spin de uma partícula exerce
sobre a outra não é proveniente de nenhuma força conhecida na natureza (i.e.,
não de natureza gravitacional, eletrofraca, forte). Mesmo assim estas quantidades se in‡uenciam, no sentido que o fato do spin de uma partícula estar
num certo valor pode diminuir a probabilidade do spin da outra partícula estar
no mesmo valor. Este é o chamado princípio da exclusão e será visto quando
estudarmos estatísticas quânticas. O ponto é que, por exemplo, quando uma
partícula (e.g., um elétron num ponto quântico) é colocado no estado fundamental, necessariamente a outra irá para o estado excitado. Mesmo que nenhuma
energia seja trocada entre as partículas. Por isso esta é chamada interação
de troca. Mas o fato desta interação não ser de nenhuma natureza de forças
conhecidas, faz com ela não possa ser medida diretamente por nenhum equipamento conhecido. Tudo que podemos fazer e estudar o comportamento de uma
partícula na presença da outra e ver se houve alguma alteração em relação a
partícula sozinha. Com tudo isso é fácil ver que é extremamente difícil determinar !ij e, em geral, esta quantidade depende não apenas das partículas em
questão, mas das características do sistema como um tudo (se os elétrons estão
num átomo ou num quantum dot). Ao mesmo tempo o caso de dois spins é
um exemplo bom porque deixa explícito o fato que ao analisar a interação entre
sistema não basta levar em conta os campos produzidos pelas partículas.
Felizmente é possível fazer uma aproximação que funciona bem na maioria
dos casos. Devido a simetria do espaço é de esperar que esta interação não
dependa da orientação espacial do sistema (veja que isso não é verdade se um
campo quebrar esta simetria, por isso dizemos que é uma aproximação). Assim,
159
^ procurado deve comutar com as rotações
o operador M
h
i
^n; M
^ =0:
R
É possível mostrar (exercício) que o seguinte operador possui esta característica
^ =V (
M
=V
1
1
3
X
i
+
i
2
2
+
3)
3
:
i=1
Esta é a chama interação de Heisenberg e é usada para modelar grande parte
dos sistemas onde a interação de spin é relevante.
Assim a hamiltoniana para o sistema de dois spins que interagem pela interação de Heisenberg pode ser escrito como
^ =
H
B1
I +I
B2 + V
3
X
i
i
ij=1
E o operador de evolução do sistema (para o caso independente do tempo)
2
3 1
0
3
X
i
4 B1 I + I
5 A
B2 + V
U (t) = exp @
i
i t
~
ij=1
Observe que agora, no caso geral, nosso hamiltoniano não pode mais ser dividido
em produtos.
Por exemplo, supondo que a primeira partícula está sujeita a um campo na
direção x a segunda esta livre temos:
0
3 1
2
3
X
i4
5 A
U (t) = exp @
I +V
i
i t
1B
~
ij=1
Podemos calcular
[
1
I;
1
1
+
2
2
+
3
3]
= [ 1 I;
= [ 1 I;
= [ 1; 3]
= i 2
6= 0 :
+ 3
3
3] + [ 1
3 + [ 1; 2]
3+i 3
2
2
2
3]
I;
2
2]
2
Assim, mesmo para o caso mais simples de campos independentes do tempo
não podemos, em geral, encontrar uma forma matricial para o operador de
evolução. Assim, no caso geral, precisamos construir explicitamente a matriz
^ encontrar seus auto-vetores e expandir o estado inicial na base destes
4 4 H,
auto-vetores.
Vemos assim a grande di…culdade introduzida quando os sistemas interagem.
Entretanto, para alguns casos especiais este problema pode ser resolvido exatamente (exercícios).
160
11.2
Dois spins acoplados
Quando estudamos o caso de partículas de spin 12 , vimos que estas podem ser
caracterizadas pelo valor da projeção, do spin numa certa direção (e.g., S^z ) e o
valor do módulo do spin
S^2 = S^x2 + S^y2 + S^z2 = S:S
pois
h
i
S^i ; S^2 = 0 :
Naquele momento, como tínhamos apenas um valor para o módulo, este operador não mereceu muita atenção. Entretanto, quando temos sistemas acoplados
isso muda bastante.
Usando a forma explicita dos operadores temos
~2
S^2 =
4
2
1
+
~2
4
2
2
+
~2
4
2
3
=
3 2
3
~ I = ~2
4
4
de onde vemos diretamente a comutação deste operador com todos os demais,
uma vez que ele é proporcional a identidade.
Além disso, um operador que será importante no que segue é o chamado
operador de levantamento + (abaixamento
) que levanta (abaixa) de o spin
da nossa partícula de spin 1=2,
+
= j+i h j ;
= j i h+j ;
onde
j i = j+i h j i = j+i ;
+ j+i = j+i h j +i = 0 ;
j+i = j i h+j +i = j i ;
j i = j i h+j i = 0 :
+
Lembrando agora a forma explícita dos operador de spin
~
S^z = (j+i h+j j i h j) ;
2
~
S^x = (jx+ i hx+ j jx i hx j) ;
2
~
S^y = (jy+ i hy+ j jy i hy j)
2
usando
161
1
1
jx+ i = p [j+i + j i] ; jx i = p [j+i j i]
2
2
1
1
1
jx+ i hx+ j = p (j+i + j i) p (h+j + h j) = (j+i h+j + j+i h j + j i h+j + j i h j)
2
2
2
1
jx i hx j = (j+i h+j j+i h j j i h+j + j i h j)
2
1
jx+ i hx+ j jx i hx j = [2 j+i h j + 2 j i h+j] = j+i h j + j i h+j
2
temos
~
S^x = (j+i h j + j i h+j) :
2
Da mesma forma, usando
1
jy i = p [j+i
2
temos
~
S^y = i (j i h+j
2
i j i] ;
j+i h j) :
Com isso
S^x + iS^y = ~ j+i h j = ~
S^x iS^y = ~ j i h+j = ~
Das expressões acima é fácil ver que
h
i
S^z ; S^ =
+
+
S^+ ;
S^ :
~S^
Exercise 67 Veri…que.
Para entender o signi…cado de S^ suponha que você tem um auto-estado jsi
de S^z
S^z jsi = s jsi
(obviamente s = ~=2 e jsi = j i). Vamos ver o que acontece com o a projeção
do momento ângular deste estado quando aplicamos o operador S^
S^z S^ jsi = S^ S^z
~S^
jsi = S^ s
~S^
jsi = (s
~) S^ jsi
Ou seja, o estado S^ jsi é também um auto-vetor de S^z com o autovalor aumentado (diminuindo) de uma unidade de ~ (lembre que S^+ j+i = 0).
Além disso, é fácil ver que
h
i
S^2 ; S^ = 0 ;
ou seja, este operador não muda o valor da norma do momento angular de spin.
162
Exercise 68 Usando a base canônica de S^z construa a forma matricial de S^ .
Vamos agora estudar o momento angular total de um sistema de duas partículas de spin 12 . Como vimos, uma base para o espaço de Hilbert deste sistema
é
j++i ; j+ i ; j +i ; j
i
Esta base é formada pelos auto-vetores do operador de projeção de spin total
J z = Sz
I +I
Sz = S1z + S2z ;
que por sua vez é formada pela base de autovetores de S^1z e S^2z .
Por exemplo
Jz j+ i = (Sz
I +I
Sz ) j+ i = (I
I
I
I) j+ i = 0
Ou seja, o estado j+ i tem projeção de momento angular igual a zero (o que
era de se esperar uma vez que as partículas possuem spins opostos). Da mesma
forma
Jz j++i =
~ ~
+
2
2
Jz j
~j
i=
j++i = ~ j++i
i
Ou seja, este sistema pode ter valores de Sz igual a (~; 0; ~). Se o sistema é
composto de duas partículas separadas isso signi…ca que a soma dps momentos
angulares de cada uma terá estes valores.Por outro lado, se o sistema é formado
por duas partículas ligadas (por exemplo, um núcleo de deutério) ao passar por
um SG um feixe destas partículas se dividiriam em 3 feixes com estes valores de
spin.
Da mesma forma que antes podemos de…nir um operador de módulo do
momento angular total:
^1 + S
^2
J2 = S
2
^ 21 + S
^ 22 + 2S
^1 S
^2
=S
Usando os operadores
S^1 = S^1x
S^2 = S^2x
S^1y = S^x I
S^2y = I S^x
S^y
I
I ;
S^y ;
podemos escrever
^1 S
^ 2 = 2S^1z S^2z + S^1+ S2 + S^1 S^2+
2S
e, consequentemente,
^1 + S
^2
J^2 = S
2
^ 21 + S
^ 22 + 2S^1z S^2z + S^1+ S^2 + S^1 S^2+
=S
163
observe que, apesar de S^1;2
Por exemplo
não ser hermitiano, J^2 é.
^ 21 + S
^ 22 + 2S^1z S^2z + S^1+ S^2 + S^1 S^2+ j++i
J^2 j++i = S
^ 21 + S
^ 22 j++i + 2S^1z S^2z j++i + S^1+ S^2 j++i + S^1 S^2+ j++i
= S
^ 21 + S
^ 22 j++i + 2S^1z S^2z j++i
= S
=
~~
3 2 3 2
~ + ~ j++i + 2
j++i
4
4
22
= 2~2 j++i
ou seja, o estado j++i é um autovetor do operador de módulo do momento
angular com auto-valor 2~2 (o mesmo é válido para o estado j
i).
Vamos agora calcular
J^2 j+ i = S21 + S22 + 2S1z S2z j+ i + S1+ S2 j+ i + S1 S2+ j+ i
= ~2 (j+ i + j +i)
Ou seja, o estado j+ i não é auto estado do operador J 2 . Sendo este operador
hermitiano seus auto-vetores formam uma base. Temos então duas escolhas
diferentes de base para o nosso espaço (ambas obviamente caracterizam completamente o sistema): podemos trabalhar na base original de autovetores de
S^1z e S^2z (o que explicita a individualidade das partículas) ou podemos trabalhar numa base com autovetores de J^z e J^2 (que trata o sistema como uma
única entidade de momento angular J). A utilização de uma, ou outra, base
obviamente depende da conveniência.
Vamos então montar a base de autovetoes de J^z e J^2 . Como vimos antes,
dois destes autovetores nós já conhecemos
J^z j++i = ~ j++i ; J^z j
i = ~j
i
2
2
2
2
^
^
J j++i = 2~ j++i ; J j
i = 2~ j
i
^
Podemos então renomear estes estados com os valores de J^z e J 2 . Para
isso, por conveniência (…cará claro no futuro) vamos escrever estes autovetores
e autovalores como
J^z jjz ; ji = ~jz jjz ; ji
J^2 jjz ; ji = ~j (j + 1) jjz ; ji
com isso
j++i = jjz = 1; j = 1i = j1; 1i
j
i = jjz = 1; j = 1i = j 1; 1i
164
Para construir os demais autovetores você pode construir a forma matricial destes operadores e usar o procedimento usual. Note, entretanto, que os
operadores
J = S1 + S2 = (S1x iS1y ) + (S1x
= (Sx I iSy I) + (I Sx iI
iS1y )
Sy )
respeitam a seguinte regra de comutação
h
i
J^z ; J^ = ~J^ ;
h
i
J^2 ; J^ = 0
Exercise 69 Veri…que.
Assim, da mesma forma que antes, quando aplicado num auto estado de J^z
com auto-valor jz
J^z J^ jjz ; ji = J^ J^z
~J^
jjz ; ji = (jz
~) J^ jjz ; ji
temos um autovetor com valor diminuído de uma unidade.
Um ponto importante a se lembrar aqui é que os autovalores de um
operador não mudam com a escolha da base. Assim, mesmo na nova
base, nossos autovalores continuam sendo (~; 0; ~). Com isso, para obtermos
o autovetor com autovalor de jz igua a zero
jjz = 0; j = 1i = j0; 1i ;
basta aplicarmos J^ no estado com autovalor igual a ~ (ou J^+ no estado com
autovalor igual a ~)
j0; 1i = J^ j1; 1i = J^ j++i
= S^1 + S^2
j++i = j +i + j+ i
Obviamente este estado deve ser normalizado
1
j0; 1i = p (j +i + j+ i)
2
Se aplicarmos S^ novamente neste vetor obteremos j 1; 1i = j
i. Ou seja,
este processo não nos dá mais nenhum resultado.
Entretanto sabemos que nosso espaço tem dimensão 4 e, conseqüentemente,
devemos ter 4 vetores de base. Para encontrar podemos construir o estado (na
base antiga)
jjz ; ji = a j++i + b j
i + c j+ i + d j +i
165
e exigir que ele seja ortogonal a todos os outros três vetores obtidos
h++ jjz ; ji = 0 ) a = 0
h
jjz ; ji = 0 ) b = 0
1
h0; 1 jjz ; ji = 0 ) p (h +j + h+ j) (c j+ i + d j +i) =
2
1
p (c + d) = 0 ) c = d
2
1
jjz ; ji = p (j+ i
2
j +i)
Problem 70 Quais os valores de jz e j?
Para isso basta calcular
1
J^z jjz ; ji = p S^1z + S^2z (j+ i j +i)
2
1 ^
= p S1z j+ i + S^2z j+ i S^1z j +i S^2z j +i
2
1
~
~
~
~
=p
j+ i
j+ i + j +i
j +i
2
2
2
2
2
=0
1
J^2 j0; ji = S21 + S22 + 2S1z S2z + S1+ S2 + S1 S2+ p (j+ i
2
1
S21 + S22 + 2S1z S2z p (j+ i
2
j +i)
1
j +i) = p
S21 + S22 + 2S1z S2z j+ i
S21 + S22 + 2S1z S2z j +i
2
3 2 3 2
1
~2
3 2 3 2
~2
=p
~ + ~
2
j+ i
~ + ~
2
j +i
4
4
4
4
4
4
2
1
1
= p ~2 (j+ i j +i) = ~2 p j0; ji
2
2
1
(S1+ S2 + S1 S2+ ) p (j+ i
2
j +i) =
=
1
p ~2 (j+ i
2
1
~2 p j0; ji
2
j +i)
1
1
J^2 j0; ji = ~2 p j0; ji ~2 p j0; ji = 0
2
2
Ou seja, nosso estado tem módulo do momento angular igual a zero:
1
jjz = 0; j = 0i = j0; 0i = p (j+ i
2
166
j +i)
Estes quatro estados formam uma base do nosso espaço.
A base J^z ,J^2 é muito conveniente quando queremos tratar o sistema como um
único sistema. O que é especialmente útil quando as partículas tratadas formam
um estado ligado, o que pode ser considerado como uma única partícula. Em
especial, os resultados acima mostram que, apesar do feixe destas partículas se
dividir em 3, no feixe não de‡etido existem dois tipos diferentes de estado
(ou de partículas).
j0; 1i ; j0; 0i :
Estes estados, possuem características físicas completamente diferentes. Enquanto um feixe de partículas no primeiro estado, quando passadas por um
SG orientado perpendicularmente se dividirão em outros 3 feixes, um feixe com
partículas no segundo continuarão sempre passando direto pelo aparelho. Em
outras palavras, partículas no segundo estado se comportam como partículas
sem spin.
Outra vantagem da base j, jz é que o momento angular total do sistema é
uma quantidade conservada, enquanto o momento angular de cada constituinte
não. Por isso é muito conveniente trabalhar nesta base. Isso exige, é claro,
que escrevamos o hamiltoniano não na base que estamos usando até agora, mas
nesta nova base. Fora a diferença da base o procedimento para o tratamento de
problemas é o mesmo discutido anteriormente.
Assim quando formamos uma nova partícula pela ligação de outras duas
podemos formar dois conjuntos diferentes de estados. Os
j1; 1i = j++i
1
j0; 1i = p (j+ i + j +i)
2
j 1; 1i = j
i
todos com módulo do momento angular iglau a 1. Por serem 3 estes são chamados estados tripleto. E o estado
1
j0; 0i = p (j+ i
2
j +i)
que possui módulo de momento angular igual a zero. Por ser apenas um este é
chamado estado singleto.
Observe que por aplicação de campos (magnéticos ou elétricos) podemos mudar a projeção do spin das partículas, mas sem alterar o módulo desta quantidade (por isso falamos em “girar”). Assim se nosso sistema formar uma partícula
de um tipo ele permanecerá com este mesmo tipo. Além disso, também por características relacionadas a estatística quântica (mais precisamente a resultados
da TQC) combinações de partículas formam sempre novas partículas com o
mesmo valor de j. Por exemplo, a combinação de um próton e um nêutron
(deutério) tem spin 1, já uma partícula alfa (núcleo de hélio, formado por 4
partículas de spin 1/2) tem spin 0.
Voltaremos à teoria geral da soma de momento angular quando estudarmos
o momento angular orbital.
167
12
Realização de espaços de dimensão in…nita
Como vimos, todo espaço de Hilbert de dimensão …nita pode ser representado
por matrizes. Vejamos agora como tratar os casos de problemas que envolvam
dimensões in…nitas. Neste caso, uma das opções é usar o espaço das funções de
quadrado integrável L2 discutido na seção 6.4.
Anteriormente estudamos sistemas físicos onde o valor dos observáveis (compatíveis) usados para rotular nossos estados, possui apenas um número …nito de
possibilidade (e.g., o spin da partícula). Entretanto certos observáveis, como o
momento de uma partícula que se move, não possui esta limitação. Obviamente,
para tal sistema a representação (e a álgebra) matricial se torna inadequada.
Entretanto, como vimos anteriormente na seção 6.4, neste caso podemos herdar os resultados do cálculo diferencial (assim como no caso de dimensão …nita
herdamos a álgebra matricial) se realizarmos o nosso espaço de Hilbert como as
funções de quadrado integrável L2 (a; b). Ou seja, dada uma função f : C ! C
com um (ou mais) parâmetro real t 2 [a; b], podemos indicar o vetor correspondente como
jf i
cujas componentes são todos os valores de f (t). Esta função pertence ao nosso
espaço de Hilbert se
Z b
2
hf jf i =
jf (t)j dt < 1 :
a
12.1
O operador de multiplicação
Dentre os operadores que agem no espaço L2 [a; b], um muito importante é o
^ Quando age num estado
operador de multiplicação pelo parâmetro livre Q.
^ jf i = jgi
Q
este operador fornece o estado jgi que é o vetor em L2 com componentes
g (t)
tf (f ) :
A norma deste novo vetor vale
hg jgi =
Z
b
a
2
t2 jf (t)j dt
a qual, como t 2 [a; b], também possui um valor …nito e, conseqüentemente,
pertence a L2 [a; b].
^ que
Um análogo deste operador no caso das seqüências seria o operador Q
agindo no vetor jai com componentes ai daria a seqüência jbi com componentes
iai .
O operador de multiplicação acima é auto-adjunto (para intervalo [a; b]
…nito).
168
^ + tal que
Exercise 71 Veri…que a a…rmação acima. Ou seja, encontre Q
Z
a
b
Z
h
i
^ (x) dx =
f (x) Qg
h
b
a
i
^ + f (x) g (x) dx ;
Q
^ é simétrico (Q
^=Q
^ + ) em seguida mostre que
veri…que que Q
^ =D Q
^+
D Q
:
^
^ + ). Assim, para mostrar
Lembre que, para todo operador simétrico, D(Q)
D(Q
+
^
^
que os domínios são iguais, basta mostrar que D(Q ) D(Q).
Agora, um ponto extremamente importante sobre o operador de multiplicação acima e:
Remark 72 O operador de multiplicação pelo parâmetro livre não possui
nenhum auto-vetor.
^ então
Pela de…nição de auto-vetor, sabemos que se jf i é um auto-vetor de Q,
^
existe uma constante 2 R (pois Q é simétrico) tal que
^ jf i =
Q
^
jf i =) Q
jf i = 0 :
^
Multiplicando a expressão acima por Q
conseqüentemente, 2 R temos:
^
hf j Q
^
Q
jf i = 0 )
=
Z
b
Z
a
b
h
^ é simétrico e,
jf i, usando que Q
^ (x)
Qf
[(xf (x)
f (x)
ih
f (x))] [(xf (x)
^ (x)
Qf
f (x)
i
dx =
f (x))] dx
a
=
Z
b
[(x
)] f (x) [(x
)] f (x) dx
(x
) jf (x)j dx = 0
a
=
Z
a
b
2
2
Lembrando que é uma constante, a única solução da equação acima é f (x) = 0.
^ não possui nenhum autovetor.
Ou seja, Q
Assim, o operador de multiplicação pelo parâmetro livre é auto-adjunto, mas
não possui nenhum auto-vetor (conseqüentemente, nenhum auto-valor). Com
isso, apesar deste operador poder ser associado a um observável clássico (já que
é auto-adjunto) não devemos esperar que isso ocorra, porque nenhuma medida
desta quantidade poderia ser feita.
169
12.2
O operador de posição
Como vimos nos exemplos com espaço de dimensão …nita, todo processo de medida é (basicamente) um processo de …ltragem. Assim, se desejamos determinar
a posição de uma partícula, tudo que precisamos fazer é colocar um colimador
e, caso a partícula passe por ele, sabemos que ela está (pelo menos logo após
a medida) dentro de um intervalo x. Mais ainda, se temos uma placa com
vários furos, que podemos nomear de xi , onde esta é a coordenada do centro
do furo e 2dx é a espessura, podemos dizer que: se numa medida da posição
obtivemos o valor xi , sabemos que a partícula está no intervalo xi +dx e xi dx.
Seguindo também o procedimento das seções anteriores, isso nos permite especi…car este estado com o valor medido. Ou seja, jxi i é o estado do nosso sistema
quando sabemos que ele está na posição xi + dx e xi dx. Mais ainda, sedo esta
quantidade um observável (uma medida) quanticamente a ela está associada um
operador auto-adjunto
x
^ jxi i = xi jxi i :
Ademais, sabemos que a coleção de todos os vetores (contáveis) fjxi ig formam
uma base do nosso espaço. Ou seja, todo vetor pode ser escrito como
X
jf i =
ai jxi i
i
para vetores devidamente normalizados
ai = hxi jf i
2
e jai j é a probabilidade de encontra a partícula no intervalo xi dx.
O que queremos fazer agora é melhorar a precisão da nossa medida de
posição, fazendo a espessura do colimado dx cada vez menor. Ou seja, queremos
tomar o limite dx ! 0. A tomada direta deste limite possui (no mínimo) dois
problemas tecno-conceituais:
1. Neste limite, como a partícula pode estar no estado x 2 [a; b], devemos
ter um conjunto contínuo de autovetores jxi correspondente a estes autovalores. Entretanto, sabemos que nosso espaço de Hilbert possui uma base
contável (vimos isso pela série de Fourier da seção 6.4) e toda base deve
ter o mesmo tamanho (no caso in…nito, como vimos na seção 6.4,a mesma
cardinalidade). Assim, este conjunto contínuo de vetores obrigatoriamente
deve possuir mais elemento que qualquer base. Ou seja, não é uma base e
não pode ser ortonormalizada.
2. Voltemos a decomposição de um vetor jf i na base fjxi ig e calculemos o
produto deste vetor com um vetor jgi qualquer
X
X
hg x
^ jf i =
ai hg x
^ j ii =
ai xi hg j i i
i
=
X
i
i
ai xi hg j i i =
170
X
i
xi bi ai
onde bi = hxi jgi são as componentes de jgi na base fjxi ig. Podemos agora
escolher uma representação matricial (in…nita) para os nossos vetores de
base fjxi ig. Em especial, podemos escolher a representação canônica (33)
para estas matrizes. Tomemos agora o limite dx ! 0, neste caso a nossa
decomposição se torna
jf i =
X
i
ai jxi i !
Z
b
a (x) jxi dx ; a (x) = hx jf i
a
Com isso
hg x
^ jf i =
Z
b
xb (x) a (x) dx ;
a
onde b (x) = hx jgi são as componentes de jgi na base fjxig. Lembrando
que f (x) são as componentes do vetor jf i e e que a(x) são as componentes deste mesmo vetor jf i na base fjxig. Se escolher a representação
canônica sabemos que as componentes do vetor na base são iguais as
componentes do vetor (veja a expressão (33))
a (x) = f (x) ; b (x) = g (x) ;
(78)
e a expressão acima se torna
hg x
^ jf i =
Z
b
xg (x) f (x) dx =
a
Z
b
g (x) [xf (x)] dx =
a
Z
a
b
i
h
^ (x) dx ;
g (x) Qf
^ é o operador de multiplicação pelo parâmetro livre. Ou seja,
onde Q
no caso limite dx ! 0 o operador de posição é igual ao operador de
multiplicação por uma constante. E, como vimos na seção anterior, o
^ não possui nenhum autovetor. Conseqüente, neste limite
operador Q
a posição não é um observável.
Os dois pontos acima mostram o problema na tomada do limite acima.
Suponha agora que façamos dx muito pequeno, mas de forma a garantir que
^ Ou seja, nossa somatória não se torna uma integral. Podemos agora
x
^ 6= Q.
nos perguntar:
^ no lugar de x
Problem 73 Qual o erro que cometemos ao usar Q
^.
Ou seja, para dois vetores quais que jf i e jgi do nosso espaço, quanto vale a
diferença
Z b
X
^
hg x
^ jf i hg Q jf i =
xi bi ai
xg (x) f (x) dx
a
i
onde, de (78),
ai = f (xi ) ; bi = f (xi ) :
171
Para responder esta pergunta, observe que (para funções contínuas por partes),
podemos quebrar a integral em cada uma das regiões xi ,
Z b
X Z xi +dx
xg (x) f (x) dx :
xg (x) f (x) dx =
a
i
xi dx
Com isso,
hg x
^ jf i
^ jf i =
hg Q
X
i
"
xi g (xi ) f (xi )
Z
xi +dx
#
xg (x) f (x) dx
xi dx
A determinação do erro acima depende apenas do comportamento das nossas funções no intervalo [xi dx; xi + dx]. Se as funções consideradas não
forem todas as funções de H, mas apenas aquelas cuja variação no intervalo
[xi dx; xi + dx] seja pequeno, podemos fazer
Z
xi +dx
xg (x) f (x) dx = xi g (xi ) f (xi )
xi dx
lembrando que xi é o ponto médio do intervalo. De outra forma, a aproximação
acima se torna melhor quanto menor o intervalo dx (ou seja, quanto menor dx,
mais funções podemos incluir no nosso espaço), esta é uma conseqüência do
teorema do valor médio.
Agora vale lembrar que em MQ nem sempre podemos tomar os limites dos
observáveis. Este foi o ponto chave na hipótese de Planck. Ou seja, substituindo
a integral pela somatória, Planck resolveu o problema da catástrofe do ultravioleta. O fato de não podermos usar a integral (i.e., não podemos tomar o
limite) para calcular a radiação do corpo negro está no fato de termos uma
precisão máxima que as nossas medidas estão sujeitas.
O fato de, para a radiação do corpo negro, a média de energia hEi
R1
P
En
E
dE
E exp
n En exp
KT
KT
0
R
hEi = P
=
6
1
En
E
dE
exp
n exp
KT
0
KT
onde
En = h n
não está no fato não podemos fazer En En+1 ! 0. Pois não existe nenhuma
restrição na freqüência do oscilados. Ou seja, devemos considerar o fato de
En En+1 poder ser tão pequeno quanto se queira, mas não podemos tomar o
limite desta quantidade tendendo a zero (pois, se pudéssemos, a integral acima
seria igual a somatória). Este problema está diretamente ligado ao conceito de
um conjunto denso em matemática. Qualquer número real pode ser aproximado,
com a precisão que se queira, por um número racional. Mas um racional não
é igual a um irracional. Como os reais são formados por todos estes números,
dizemos que o conjunto dos racionais é denso nos reais. Observe que, apesar
de podemos fazer a aproximação com a precisão que se queira, o conjunto dos
172
reais é completamente diferente do dos racionais, em especial a cardinalidade é
maior. Assim, no exemplo acima da energia, nós podemos fazer a diferença de
energia tão pequena quanto se desejar, isso signi…ca que este espectro discreto
é tão próximo quanto se queira de um conjunto contínuo, mas ele nunca será
igual a este conjunto. É sempre neste sentido que devemos entender o termo
“espectro contínuo de energia” que aparece nos livros de MQ.
Resumindo, no caso da energia nós não podemos substituir a somatória por
uma integral. Mas e no caso do operador de posição? Podemos substituir
^ O fato de não podermos substituir a somatória por uma integral
x
^ por Q?
no caso da energia, está relacionado com o fato de que a energia do oscilador
depende do conhecimento simultâneo de sua posição (energia potencial) e do seu
momento (energia cinética). Como vimos na seção 1.7, existe um limite na área
mínima do espaço de fase (o que está relacionado com a incerteza momentoposição). Isso nos impede de tomarmos o limite desta área como um ponto e,
conseqüentemente, fazermos a somatória virar uma integral.
E no caso do operador de posição, existe alguma relação de incerteza que
nos impeça de tomar este limite? Neste caso, tudo que queremos medir é a
posição. Entretanto, para medirmos a posição na direção x precisamos ter
alguma informação da partícula na direção y e z. Pois, de outra forma, não
saberemos se a partícula não passou pelo colimador porque foi bloqueada, ou
simplesmente porque ainda não chegou ao furo. Assim, uma conjectura do
autor destas notas, é que podermos ou não tomar o limite depende do fato da
medida das coordenadas em direções diferentes comutarem, ou não. Segundo os
prícipios da MQ esta comutação deve ser proporcional aos parênteses de Poisson
(veja (59))
fx; yg = fx; zg = 0 ;
e, conseqüentemente, comutam. Assim, o limite pode ser tomado. Entretanto, existem teoria atuais que especulam sobre a geometria do universo poder
ser não comutativa. Se isso for verdade devemos ter
[^
x; y^] = i ;
com uma nova constante universal. Obviamente, o fato de nunca termos detectado esta não-comutação garante que este , se existir, é muito pequeno (muito
menor mesmo, nas unidades adequadas, que a constante de Planck). Assim, se a
geometria do universo for não-comutativa, a MQ não é mais uma teoria correta,
2
mas uma aproximação correta até, provavelmente, ordem de ( =h) (assim como
2
a mecânica clássica é correta até ordem de (v=c) em relação à relativística).
Entretanto, como nosso objetivo aqui é fazer MQ (usual) vamos admitir que
^ no
podemos substituir a somatória pela integral, ou, o que é equivalente, usar Q
lugar de x
^. Mas é sempre bom lembrar que estes dois operadores são diferentes:
um é um observável, o outro não. Esta aproximação signi…ca dizer que
^ jxi = x jxi ;
x
^ jxi = Q
mesmo para x 6= xi . Observe que estes dois operadores são iguais quando atuam
nos auto-vetores de jxi i, mas, estes auto-vetores formam um conjunto discreto.
173
^ é uma extensão contínua do operador x
Desta forma Q
^ e o conjunto discreto xi
é denso no intervalo [a; b].
Assim, no que segue, vamos de…nir
x
^ jxi
x jxi ; x 2 [a; b] :
(79)
E qualquer vetor do nosso espaço pode ser decomposto como
Z b
jf i =
dx a (x) jxi ; a (x) = hx jf i
a
2
e a quantidade ja (x)j é a probabilidade da partícula ser encontrada o intervalo
x dx. Usando a igualdade (78),
Z b
a (x) = f (x) ) jf i =
dx f (x) jxi ; f (x) = hx jf i
a
2
e jf (x)j é a probabilidade da partícula ser encontrada o intervalo x
Observe ainda que
"Z
Z
Z
b
hg jf i =
b
dx g (x) f (x) =
a
ou seja, o operador
a
Z
b
dx hg jxi hx jf i = hgj
a
dx.
#
dx jxi hxj jf i
b
a
dx jxi hxj = I ;
é a resolução da identidade do nosso espaço.
12.3
O operador de momento
Como sabemos da nossa experiência em mecânica clássica, o estado (clássico) de
um sistema é completamente determinado pela sua posição e o seu momento.
Assim, se quisermos estender a descrição clássica para quântica, precisamos
encontrar um operador p^ que esteja relacionado com o observável de momento.
Ou seja, os autovalores de p^ são os possíveis valores que o momento da partícula
pode assumir.
Para encontrar este operador, tudo que precisamos é a regra de quantização
de Dirac (59)
i
f^
x; p^g !
[^
x; p^] ) [^
x; p^] = i~ ;
(80)
~
ou seja, precisamos construir p tal que este respeite a álgebra acima.
Para realizar a álgebra acima, precisamos …xar a forma de um dos operadores
(^
x ou p^) e determinar a forma do outro. Fixando a forma do operador x
^ como
em (79) (mas esta é apenas uma escolha possível), a álgebra (80) pode ser
concretamente realizada escolhendo
p^
p=
174
i~
d
:
dx
(81)
Onde usamos o chapéu invertido para lembrar que p não é mais um operador
num espaço abstrato, mas sim a realização deste operador em algum espaço
concreto. Ou seja, enquanto p^ é um operador qualquer que respeita (80), p é
especi…camente um operador diferencial (81) agindo no espaço das funções de
quadrado integrável.
Para ver que (81) realiza a álgebra (80) basta calcular
hxj x
^p^
p^x
^ j i = hxj x
^p^ j i
=
i~ x
d
d
hxj j i + i~ [x hxj j i]
dx
dx
d
d
d
[x (x)] = i~ x
(x) x
dx
dx
dx
hxj p^x
^j i =
d
(x)
dx
xi~
hxj [^
x; p^] j i = i~ (x) :
Neste nosso espaço concreto, a equação (62) para o operador de evolução temporal pode ser escrita como
dU
i ^
dU
i
^ j 0i
=
HU =) hxj
j 0i =
hxj HU
dt
~
dt
~
d
d
i
^ j 0i
hxj U j 0 i =
hxj U j 0 i =
hxj HU
dt
dt
~
i
d
hx j t i =
H hx j t i
dt
~
d
i~
(x; t) = H (x; t) ;
dt
(x; t) = hxj U (t) j
0i
^ x
; H=H
^
x; p^
i~
d
dx
:
Esta é a equação de Schrödinger.
Para o caso de uma partícula de massa m sujeita a um potencial V (x)
sabemos da mecânica clássica que
H (x; p) =
p2
+ V (x)
2m
Assim, o operador correspondente deste problema na MQ vale
H=
~2 d 2
+ V (x) :
2m dx2
Os estados estacionários desta partícula são os autovetores deste operador e,
numa medida da energia desta partícula, podemos obter apenas um de seus
auto-valores.
12.4
O problema do ordenamento
Um dos problemas que surge no processo de quantização acima (e, de uma
certa forma, em todos os processos de quantização), é o chamado problema do
175
ordenamento. Dado um observável clássico que envolva o produto (o momento
angular é um exemplo)
xp ;
quanticamente podemos associar a este observável os operadores
^ =x
^ 0 = p^x
M
^p^ ; M
^
onde
^0
M
= p^x
^ =
^
=M
d
x = i~
dx
^ i~
i~ = M
i~
i~x
d
dx
=
i~ + x
^p^
ou ainda
^0 = M
^
M
i~
Ou seja, os dois operadores acima dizem respeito a mesma quantidade clássica
xp. Assim, para um observável clássico pode estar relacionado mais de um
operador quântico.
Um ponto a se observar é que, assim como no exemplo acima, no problema
de ordenamento os operadores sempre diferem por uma quantidade proporcional
a ~n . Lembrando que uma das formas de tomarmos o limite clássico do nosso
^ eM
^ 0 possuem o mesmo
sistema é fazer ~ ! 0, vemos que os dois operadores M
limite clássico. Assim, teorias quânticas que di…ram por um problema
de ordenamento possuem o mesmo limite clássico. Ou de outra forma,
para o mesmo sistema clássico podemos ter várias teorias quânticas
diferentes. Entretanto, apesar de todas terem o mesmo limite clássico, estas
teorias podem gerar resultados puramente quânticos (e.g., supercondutividade)
bastante diferentes.
No caso especí…co acima, xp, o problemas do ordenamento pode ser resolvido
usando os postulados da MQ. Observe que
+
(^
xp^) = p^+ x
^+ = p^x
^ 6= x
^p^ ;
ou seja, apesar de x
^ e p^ serem hermitianos, o operador x
^p^ não é hermitiano.
Assim, se existe o observável xp o operador a ele associado deve ser hermitiano
^ nem M
^ 0 ). Com isso, podemos construir um operador
(não deve ser nem M
hermitiano através de uma combinação simétrica dos operadores
1 + +
+
^ = 1 (^
^ + = 1 (^
M
xp^ + p^x
^) ) M
xp^ + p^x
^) =
p^ x
^ +x
^+ p^+
2
2
2
como x
^ e p^ são hermitianos
1
^ + = 1 p^+ x
^ :
M
^+ + x
^+ p^+ = (^
px
^+x
^p^) = M
2
2
Uma prescrição, chamado ordenamento de Weyl, é usar sempre a ordenação
simétrica dos operadores. Entretanto, nem sempre esta opção é única possível.
176
Por exemplo, no caso p2 x temos
^ =x
M
^p^x
^
1
^0 =
M
p^2 x
^+x
^p^2
2
^ 00 = 1 p^2 x
^ + p^x
^p^ + x
^p^2
M
2
todos hermitianos. Usar a prescrição de Weyl é escolher o último operador.
Entretanto, apenas uma medida extremamente precisa de efeitos puramente
quânticos pode nos dizer quais destes é o operador correto.
12.5
Partícula na caixa
Vamos usar as idéias da seção anterior para quantizar o sistema unidimensional
de uma partícula de massa m num intervalo (uma partícula numa caixa). Uma
vez que, dentro do intervalo (caixa), a partícula está livre, vamos começar analisando uma partícula livre, cuja energia é puramente cinética e o Hamiltoniano
vale
1 2
H=
p :
2m
A descrição quântica, no H abstrato, se dá pelo operador Hamiltoniano
^ = 1 p^2 :
H
2m
E no nosso espaço concreto em L2 :
H=
~2 d 2
:
2m dx2
Dizer que a partícula está na caixa signi…ca dizer que esta pode ser encontrado apenas dentro de um certo intervalo [a; b]. Ou, de outra forma, que ela
não pode ser encontrada fora deste intervalo. Quanticamente isso signi…ca que
(x) = 0 ; a > x > b :
Pela continuidade da função devemos ter (lembre que H exige que as nossas
funções sejam, pelo menos, duas vezes diferenciáveis)
(a) =
(b) = 0 :
(Condições físicas impõe condições de fronteira)
Desta forma as condições físicas do nosso sistema informam como devemos impor
as condições de fronteira do problema. Na verdade, só agora temos realmente
especi…cado o operador H, pois conhecemos, não só a sua forma, mas também
seu domínio. Este é o espaço de Hilbert do nosso problema.
177
Exercise 74 Veri…que que o operador H acima é hermitiano. Qual o domínio
do adjunto H + .
Como em todo problema de MQ, estamos interessados em estudar a evolução
do sistema. Isso, obviamente, é equivalente a encontrar o operador de evolução
que, por sua vez, é equivalente a resolver a equação de Schroedinger (dependente
do tempo)
d
(x; t) = H (x; t) :
i~
dt
Entretanto, para sistemas com graus …nitos, vimos que é possível evitar o
trabalho (as vezes impossível) de obter uma forma explicita para o operador
^ e decompormos
de evolução, se trabalharmos na base de auto vetores de H
todos os nossos vetores nesta base. Da mesma forma, podemos agora evitar
o trabalho (di…cílimo) de resolver a equação de Schroedinger dependente do
^ e decompormos nossos vetores
tempo, se encontrarmos os autovetores de H
nestes estados. Neste caso, para qualquer vetor j i temos
X
j i=
an j n i ;
n
ou, multiplicando por jxi
X
hx j i =
an hx j
n
ni
)
(x) =
X
an
n
(x)
n
onde
H
n
(x) = En
n
(x) :
Observe que os estados j n i tem energia bem de…nida e tomamos o produto
interno deste vetor com jxi. Não estamos falando de um estado que seja, si^ ou seja, que tenha posição e energia bem
multaneamente, autovetor de x
^ e H,
de…nida. Isso não é possível uma vez que estes observáveis não são compatíveis.
Assim, nosso problema é encontrar soluções para a equação de Schroedinger
independente do tempo
H
=E
=)
~2 •
=
2m
E
:
Onde E (autovalores de H) são as possíveis energia que o sistema pode assumir.
Problem 75 Quantas soluções a equação acima possui?
Observe que, para um valor …xo de E, por ser uma equação de segunda ordem
a equação acima possui apenas duas soluções linearmente independentes
(sempre). A solução geral da equação dependerá de duas constantes que serão
…xadas pelas condições iniciais do problema. Entretanto, não é neste sentido
que queremos “encontrar as soluções da equação acima”. Queremos encontrar todos os valores de E para que a equação acima tenha solução e
178
respeite as condições de contorno. Ou seja, nosso problema não é apenas
o problema de resolver uma equação diferencial. Na verdade, no tratamento de
problemas quânticos, acreditamos que as soluções das equações diferenciais já
são conhecidas.
Como mencionado acima, para um valor …xo de E a equação acima possui
duas soluções LI
2m
eikx ; e ikx ; k 2 = 2 E ;
~
de sorte que uma solução geral pode ser escrita como uma combinação linear
destas soluções
(x) = Aeikx + Be
ikx
; k2 =
2m
E:
~2
Problem 76 Quais os valores possíveis de E?
Observe que, por ser hermitiano, E 2 R. Entretanto, nada impede que este
assuma qualquer valor real e, em especial, valores negativos. Neste caso (E < 0)
temos
H
=
jEj
~2 •
= jEj
2m
=)
=)
(x) = Aekx + Be
kx
; k2 =
2m
jEj ;
~2
Entretanto, para ser solução do nosso problema, a função não deve apenas
ser solução da ES, mas pertencer ao nosso espaço de Hilbert, ou seja, pertencer
ao domínio de H. Com isso:
(b) = 0 ) Aeka + Be
(a) =
ka
= Aekb + Be
e
k
kb
=0:
Para o caso especial a = 0; b = 1
A+B =0)A=
k
Ae
Ae
k
B;
= 0 ) A ek
=0)A=0:
E, para o caso geral, é fácil ver que não existem A e B diferentes de zero que
respeitem as condições de fronteira (para k = 0, = A A = 0). Assim, os
estados com E < 0 são descartados por não pertencerem ao nosso espaço
^ ser hermitiano implica que o sistema
de Hilbert. Ou ainda, o fato de H
só pode ter energias positivas. Este resultado é completamente compatível
com a física clássica. Porém, como veremos a seguir, os demais resultados são
bastante distintos dos esperados classicamente.
Problem 77 Como determinamos as constantes A,B e k da solução geral
acima?
179
Como vimos nos exemplos anteriores, em geral, as constantes A e B (na
verdade, apenas uma delas) serão …xadas pelo processo de normalização. Restanos então …xar k. Esta constante está relacionada com as condições de contorno
do problema. Para facilitar as contas, no que segue façamos a = L e b = L,
^ =
D H
;
0
2 L2 ( L; L) ;
( L) =
(L) = 0; a:c:
Assim, exigindo que a partícula esteja con…nada no intervalo de
(L) =
:
L até L
( L) = 0 ;
temos
(L) = 0 =) AeikL + Be ikL = 0 =) AeikL =
A (cos kL + i sin kL) = B (cos kL i sin kL) :
Be
ikL
(82)
Podemos satisfazer esta igualdade de duas formas, a primeira fazendo
sin kL = 0 =) kL = n ; n 2 N
observe que n = 0 não é um autovetor. Além disso, o caso n < 0 corresponde as
mesma funções com sinal trocado e, consequentemente, são as mesmas funções
(lembre que a normalização possui uma arbitrariedade na fase e os
autovalores dependem de n2 ). Com a escolha acima, temos,
A (cos kL) =
B (cos kL) ) A =
B:
Podemos também satisfazer a igualdade (82) fazendo
cos kL = 0 =) kL =
n+
1
2
; n2N;
(observe que agora n = 0 é um autovetor), com isso
A (i sin kL) =
B ( i sin kL) ) A = B :
Assim, o nosso problema possui dois tipos (conjuntos) de soluções estacionárias
n
(x) = N sin kn x ; kn =
+
n
(x) = N + cos kn+ x ; kn+ =
L
L
n ) En =
n+
1
2
~2
2m
n
L
) En+ =
2
;
~2
2m L
n+
1
2
2
:
(83)
Exercise 78 Obtenha as constantes de normalização N + e N .
Problem 79 Por que precisamos apenas de uma das condições de contorno?
180
Pela simetria do problema estes estados automaticamente satisfazem a condição
( L). Mas, no caso geral, precisamos aplicar ambas as condições de fronteira.
Remark 80 Observe como a limitação da partícula no intervalo tornou os
níveis de energia discretos. Este é o fenômeno por trás da maioria das peculiaridades do comportamento quântico dos sistemas, em especial, dos chamados
pontos quânticos (QD).
As soluções acima mostram que o con…namento da partícula num intervalo
tornou os níveis de energia discretos. Ou seja, numa medida da energia da
partícula con…nada numa caixa de tamanho 2L, podemos obter apenas os valores
En e En+ . Isso é, obviamente, um comportamento completamente diferente do
esperado classicamente, onde a partícula pode ter qualquer valor de energia.
Além disso, o menor valor possível da energia para a partícula na caixa vale
(observe que E0 = 0 implica 0 (x) = 0 e a partícula não está mais na caixa)
~ 2 h i2
:
E0+ =
2m 2L
Ou seja, este é o menor valor de energia cinética que a partícula pode ter. Mais
ainda, se esta partícula interagir com alguma coisa (e.g., fótons) ela só poderá
absorver e emitir energias que sejam proporcionais a diferença entre dois níveis
En
!n
= En+
Em
Esta é a chamada energia de transição de n para m.
Suponha que você prendeu um elétron numa caixa e baixou a temperatura
do sistema de forma a garantir que este elétron está no estado fundamental E0+
(é mais natural imaginarmos que temos vários elétrons não interagentes nesta
caixa). Primeiramente veja que existe uma energia do sistema que você
não pode retirar, ou seja, esta energia não se dissipa em forma de calor.
Em segundo lugar, se você tentar aquecer o sistema, por exemplo o iluminando
com um laser, se este laser tiver uma energia menor que E0 !1 o sistema
não irá interagir com seu laser (ou seja, ele será transparente). Se você for
aumentando a freqüência deste laser, quando a sua energia chegar a E1 E0+ o
sistema passa a absorver o laser (se torna opaco) e os elétrons passam para um
nível de energia mais alto. Na prática, se a temperatura for baixa o su…ciente,
o sistema irá emitir estes fótons tornando-se reluzente na cor do laser. Este
“salto”de um nível de energia para o outro, sem que o sistema possa existir em
níveis intermediários (o que classicamente é um contínuo) é chamado de salto
quântico. Este efeito de absorção de apenas alguns comprimentos de onda pode
ser observado em pontos quânticos. Este é também o mecanismo porque os
elétrons em torno do núcleo só absorvem e emitem radiações com determinada
freqüência (e.g., a série de Balmer).
O fato de nosso operador ser auto-adjunto signi…ca que suas autofunções
formam uma base (agora ortonormal) do espaço. Assim, qualquer função
do nosso espaço pode ser escrita como
1
1
h
i
1 X +
1
1 X
(x) = p
cn cos
n+
x +p
cn sin
nx :
L
2
L
L n=0
L n=1
181
Onde o módulo quadrado de cada coe…ciente cn = h n j i representa a probabilidade de, numa medida da energia, a partícula ser encontrada com energia
En . Assim, o fato de qualquer estado poder ser expandido na decomposição
acima, tem o signi…cado físico de que todo sistema pode ser encontrado (com
uma certa probabilidade) em algum valor de energia.
Usando a notação de Dirac temos a base composta pelos dois pares de funções
fj^
e+
en ig com componentes
n i ; j^
1
e^+
n (x) = p cos
L
L
n+
1
2
h
i
1
; e^n (x) = p sin
nx :
L
L
x
Exercise 81 Veri…que que esta base é ortonormal
^n e^m =
^+
^+
e^n e^+
m = e
m =0 ; e
n e
Com isso
j i=
1
X
c+
^+
n e
n +
1
X
nm
:
cn e^n
n=1
n=0
e as componentes cn são a projeção de na base fj^
e+
en ig
n i ; j^
Z L
1
1
c+
^+
i= p
cos
n+
x
(x) dx
n = e
n
L
2
L L
Z L
h
i
1
sin
nx (x) dx
cn = e^n i = p
L
L L
A decomposição acima é a conhecida série de Fourier da função (x).
Agora, dada uma condição inicial j 0 i qualquer fazer a decomposição
X
+
j 0i =
c+
:
n
n + cn
n
n
Lembrando que estes estados j n i têm energia bem de…nida (são auto-estados
do operador Hamiltoniano), podemos determinar a evolução temporal de j 0 i
fazendo
X
i
i
+
j t i = U (t) j 0 i = exp
Ht j 0 i = exp
Ht
c+
n
n + cn
n
~
~
n
X
i +
i
+
=
c+
En t
E t
:
n + cn exp
n
n exp
~
~ n
n
Ou, projetando no espaço x,
hx j
ti
=
(x; t) =
X
c+
n exp
i +
E t hx
~ n
c+
n exp
i +
E t
~ n
n
X
n
+
n
+
n
+ cn exp
(x) + cn exp
182
i
E t hx
~ n
i
E t
~ n
n
n
(x)
:
Aqui é interessante ver como a realização do nosso espaço depende muito de
qual parte do sistema nos interessa. De forma geral,
~
L
E
2
:
Assim, se no exemplo acima a distância L for muito pequena, os níveis de
energia vão estar tão espaçados que para sofrer uma transição de nível precisaríamos fornecer uma quantidade muito grande de energia. Podemos garantir
assim que o sistema não sofra nenhuma transição indesejada (e.g., térmica) e as
únicas transições possíveis são aquelas que nós provocamos. Neste caso, apenas
alguns níveis de energia são relevantes e podemos tratar o sistema como um
problema de n níveis. Ao fazemos isso nosso sistema passa a ter um número
…nito de estados e passa a ser descrito por uma matriz. É por isso que um
QD pode ser tratado como um sistema de dois níveis da mesma forma como no
exemplo de uma partícula de spin 12 .
Além disso, se o tamanho da caixa vai para in…nito (partícula livre) a diferença dos níveis de energia vão a zero e, conseqüentemente, a partícula pode
assumir “qualquer” (mas sempre contável) valor de energia.
12.6
O momento da partícula
Vamos agora estudar os possíveis valores que o momento de uma partícula
numa caixa pode assumir. Neste caso, precisamos encontrar os autovalores do
operador
d
d
p^ = i~
; p^ = ~k )
= ik
dx
dx
Mais uma vez, para um valor …xo de k, esta equação possui apenas uma solução
e a solução geral pode ser escrita como
(x) = A exp ( ikx) :
Entretanto, as nossas condições de fronteira exigem que
(L) = A exp ( ikL) = A (cos (kL) + i sin (kL)) = 0 :
Cuja única solução é A = 0. Ou seja, o operador de momento não tem
auto-vetores.
Problem 82 Mas se o operador p^ é hermitiano ele não deveria ser um observável?
Apesar de ser hermitiano este operador não é autoadjunto. Assim, o momento de uma partícula numa caixa não é um observável.
Exercise 83 Veri…que que o operador
p^ =
i~
d
;
dx
^ =
D H
;
0
2 L2 ( L; L) ;
não é auto-adjunto.
183
( L) =
(L) = 0; a:c:
;
Entretanto, podemos tornar nosso operador p^ auto-adjunto se mudarmos
as nossas condições de fronteira. Como vimos anteriormente na seção ??, este
operador se trona auto-adjunto se adotarmos condições periódicas de contorno
( L) = ei
(L) :
Exercise 84 Veri…que que o operador
p^ =
i~
d
;
dx
^ =
D H
;
0
2 L2 ( L; L) ;
( L) = ei
(L) ; a:c:
;
é auto-adjunto.
Neste caso as nossas soluções se tornam
exp (ikL) = ei exp ( ikL) = exp ( i (kL
))
cos (kL) + i sin (kL) = cos (kL
) i sin (kL
Para cada valor diferente de
exemplo, pada = 0
temos um conjunto diferente de soluções. Por
cos (kL) + i sin (kL) = cos (kL)
i sin (kL) ;
logo
sin (kL) = 0 ) kL = n ) kn =
Para
)
n
:
L
=
cos (kL) + i sin (kL) = cos kL
2
i sin kL
2
= cos kL cos
+ sin kL sin
2
2
= sin kL + i cos kL
i sin kL cos
2
sin
2
cos kL
ou seja
sin kL = cos (kL) ) kn =
L
1
+n
4
:
Ou seja, neste caso o momento da nossa partícula é um observável e pode
assumir apenas os valores acima. E seus auto-estados são
n
;
L
=0
(x) = A cos (kn x) ; kn =
=
(x) = A exp ( ikn x) ; kn =
L
1
+n
4
;
onde A é determinado por normalização.
O ponto é que a condição de fronteira (L) = ( L) = 0 signi…ca (…sicamente) que a partícula não pode penetrar na parede e, como esta partícula
184
não pode desaparecer, ela tem de ser re‡etida. Assim, para esta condição
de fronteira temos a visão clássica de uma partícula indo e voltando na caixa.
Tal partícula tem seu momento mudando constantemente e, certamente, não
está num auto-estado do momento. Já para a condição periódica de fronteira
=0 (L) =
=0 ( L) é como se, ao chegar no ponto x = L a partícula reaparecesse no ponto x = L (ou vice-versa). O melhor modelo clássico para
isso não seria uma partícula numa caixa, mas sim presa num anel. Neste caso,
obviamente, a partícula pode “girar” sempre numa determinada direção e ter
um momento bem de…nido.
Assim, a escolha das condições de fronteira para um problema depende do
sistema físico em consideração. Mas os resultados matemáticos nos dizem muita
coisa. Por exemplo, as autofunções de p^ são da forma
e^ (x) = N exp (ikx) ;
e, para estas funções, não conseguimos …xar a condição de fronteira
(L) =
( L) = 0 :
O que nos diz que o momento não é uma quantidade bem de…nida da nossa
partícula numa caixa. Neste caso a interpretação é óbvia, mas, em casos mais
complicados, a incapacidade de …xar certas condições de fronteira, ou alguma
outra peculiaridade matemática, pode nos dar uma in…nidade de informações
físicas novas sobre o sistema.
Problem 85 Será que outros valores de
possíveis?
representam outras condições físicas
Os valores com = , por exemplo, estão relacionadas com outras características puramente quânticas que são resultados da estatística quântica. Mais
precisamente, está relacionada com a descrição de férmions.
A escolha de diferentes é chamado de escolha da extensão auto-adjunta
da teoria. A relação geral entre as diferentes escolhas (diferente MQ) e os
correspondentes análogos clássicos destas teorias são um objeto atual de estudo
em MQ.
Assim como o problema do ordenamento, todas as extensões auto-adjuntas
possuem o mesmo limite clássico. Vemos apenas alguns exemplos (presentes
em todos os processos de quantização) de que a uma teoria clássica temos uma
in…nidade de teorias quânticas associadas. A determinação de qual destas teorias
é a correta, depende de uma interpretação correta das imposições matemáticas
(e.g., partícula na caixa ou no anel), medidas de fenômenos quânticos (e.g.,
níveis de energia), estudo das simetrias do problema (e.g., férmions e bósons)
ect.
Na análise do problema de uma partícula numa caixa pudemos acentuar:
1. Entender como as características quânticas da discretização dos níveis de
energia estão relacionadas com o con…namento espacial dos sistemas.
185
2. Veri…car que o espectro pontual de energia tende a um contínuo para
sistemas livres (estados não ligados).
3. A relação entre o problema com in…nitos graus de liberdade e com um
número …nito de graus de liberdade para con…namentos em regiões muito
estreita (e.g., QD),
4. Veri…car algumas minudências matemáticas referente a sistemas com in…nitos graus de liberdade (continuidade, extensões auto-adjuntas etc.)
5. Veri…car como as imposições matemáticas (e.g., condições de fronteira)
estão relacionadas com as características físicas do sistema.
12.6.1
Sistemas com vários graus de liberdade
A descrição quântica de dois observáveis compatíveis pode ser feita exatamente
como no caso do sistema de várias partículas, ou seja, através do produto tensorial dos autoestado de cada um destes operadores. Seria como se tivéssemos
duas cópias do sistema e, em uma olhamos para um observável e, na outra, para
o segundo.
Remark 86 Usualmente um observável escolhido para caracterizar o sistema
^ Assim, os demais obé a energia, associada ao operador Hamiltoniano, H.
^
serváveis escolhidos devem ser compatíveis com H, o que signi…ca que também
que estas quantidades não variam com o tempo (lembrando que o operador de
evolução temporal é a exponencial do Hamiltoniano).
Por exemplo, imagine um sistema bidimensional. Este sistema possui momento em duas direções. Pelas regras de comutação canônica sabemos que
[^
px ; p^y ] = 0. Então, se o sistema se encontrar num estado com momento bem
de…nido nas duas direções, i.e., num estado j i que seja simultaneamente autovetor de p^x e p^y , (^
px + p^y ) j i = (kx + ky ) j i, este estado é descrito pelo
vetor
j i = jkx ky i = jkx i jky i ;
p^x jkx i = kx jkx i ; p^y jky i = ky jky i :
Destarte, podemos resolver separadamente cada parte do problema e construir o
estado …nal pelas regras de produto tensorial que já conhecemos. Para obtermos
a representação de funções do estado acima fazemos
hx; y j i =
(x; y) = hx; y jkx ky i = hx jkx i hy jky i =
kx
(x)
ky
(y) :
Os estados acima sempre serão auto-estados de p^x e p^y , mas se estes estados
terão energia bem de…nida, depende apenas do operador Hamiltoniano. Para
o caso em que este depende de x ou de y os estados acima não serão soluções
da ES independente do tempo. Neste caso, devemos decompor estes estados
nestas soluções. Para o caso em que os operadores em questão comutam com
o Hamiltoniano o processo acima é o conhecido procedimento de separação de
variáveis usado em equações diferenciais parciais.
186
12.7
O oscilador harmônico
São incontáveis os sistemas e aplicações em física que podem ser modelados
pelo problema do oscilador harmônico (OH). Uma das razões para isso é que
um potencial V (x) qualquer (dado por uma função analítica) sempre pode ser
expandido em sua série de Taylor
V (x) = V0 +
dV
dx
1 d2 V
2 dx2
x+
x0
x2 +
x0
1 d3 V
3! dx3
x3 + ::::
x0
Além disso, em muitos problemas em física estamos interessados no comportamento do sistema perto da condição de equilíbrio. Nesta condição
dV
dx
=0
x0
e nosso potencial se torna
1 2
kx + O x3
2
d2 V
k=
dx2 x0
V (x) =
onde usamos que uma constante no potencial não altera o comportamento do
sistema. Assim, próximo do equilíbrio, qualquer potencial pode ser aproximado
por um OH.
A hamiltoniana clássica do OH é dada por
p2
1
+ m! 2 x :
2m 2
H=
Assim, para tratar o problema atual, vamos introduzir os seguintes operadores diferenciais lineares
L
H=
~2 d 2
1
+ m! 2 x
^2 ;
2m dx2
2
d
dx
D (p) = D H =
p=
i~
;
0
;
00
2 L2 ;
( 1) ! 0; a:c:
^ é o operador hamiltoniano de um oscilador harmônico. A solução do
aqui H
problema quântico se obtém pela solução da ES estacionária, i.e., através da
^
solução do problema de autovalores de H,
H
=E
=)
~2 d 2
1
+ m! 2 x
^2
2m dx2
2
Esta equação não é nada simples de se resolver.
187
=E
Vamos então fazer uso de alguns artifícios. Lembrando a relação de comutação
[x; p^] = i~ ;
(84)
ou seja, sempre que aparecer o comutador entre x e p^ podemos substituir por i~. Lembre que a quantidade acima é um operador enquanto a
quantidade à direita da igualdade é um número.
Remark 87 Assim, esta igualdade só faz sentido quando ambos os lados atuam
numa função qualquer.
Vamos agora de…nir os seguintes operadores diferenciais
a
^= p
x=
2
1
p
x+
2
r
m!
=
~
i^
p
m!
a
^+a
^+
; a
^+ = p
; p^ = i~ p
2
2
x
a
^+
i^
p
m!
a
^
(85)
Com estes novos operadores o Hamiltoniano pode ser escrito como (veri…que):
2
1
^ = p^ + 1 m! 2 x
H
^2 = !~ a
^a+ + a+ a
^ :
2m 2
2
(86)
Exercise 88 Veri…que a igualdade acima.
As regras de comutação (84) implicam que (veri…que):
2
i^
p
i^
p
; x
2
m!
m!
2
i^
p
i^
p
=
x+
;x
x+
2
m!
m!
2
i
i
=
[^
p; x]
[x; p^]
2 m!
m!
2
2
= i
[x; p^]
2 m!
m! 1 2
= i
(i~)
~ 2 m!
=1;
a
^; a
^+ =
x+
;
i^
p
m!
ou seja,
[x; p^] = i~ =) a
^; a
^+ = 1 :
com isso
1
^ = 1 !~ a
H
^a+ + a+ a
^ = ~! a+ a
^+
2
2
188
(87)
:
Além disso, é fácil ver que
h
i
^ a
H;
^ = ~! a
^+ ; a
^ a
^ = ~!^
a
h
i
^ a
H;
^+ = ~!a+ a
^; a
^+ = ~!a+
Suponha agora que
n
(88)
(89)
^ ou seja,
(x) é uma auto função qualquer de H,
^
H
n
= En
n
Agora uma característica muito mais do que importante dos operadores (85): Usando a regra de comutação (88) vemos que
^a
H^
^
~!^
a+a
^H
=
n
= ~!
fazendo
n
=a
^ (En
En
~!
1 a
^
n
:
n
^
=) H
n
= ~!
En
=
~!
n
~!)
n
n
temos
^a
H^
n
= ~! (
1) a
^
n
n
:
^ com autovalor ~! n , então a
Ou seja, se n é autovetor de H
^ n é outro
^
autovetor de H, mas com autovalor ~! ( n 1) diminuindo de uma unidade.
Simbolicamente podemos chamar este vetor de n 1 ;
a
^
n
n 1
^
; H
n 1
= ~!
n 1
n 1
;
n 1
1:
n
Da mesma forma, usando (89)
^ a+
H^
n
^
= ~!^
a+ + a
^+ H
=a
^+ ~! (1 +
= ~! (1 +
n
n)
+
=a
^+ (~! + En )
n
n
^
n) a
n
^ com autovalor ~! n , então a
Ou seja, se n é autovetor de H
^+ n é outro au^
tovetor de H, mas com autovalor ~! ( n + 1) acrescido de uma unidade. Simbolicamente podemos chamar este vetor de n+1 ;
a
^+
n
n+1
^
; H
n+1
= ~!
n+1
n+1
;
n+1
n
+1 :
(90)
Por isso estes operadores são chamados de operadores de criação a+ e aniquilação
a.
189
Vamos usar agora que a energia do sistema é uma quantidade positiva10
^j i
h jH
num estado
h
n
0
qualquer
^j
nj H
ni
=h
n j ~! n
j
ni
= ~!
n
h
nj
ni
= ~!
n
0:
(91)
(onde supusemos que n está normalizado).
Se a energia é positiva deve haver um estado de energia fundamental, i.e.,
um estado cuja energia não possa ser reduzida. Podemos chamar este estado
simbolicamente de 0 com energia 0 min ( n ).
Mas a existência do operador a
^ garante que sempre podemos baixar a energia
do sistema. Ou seja, o vetor = a
^ 0 teria uma energia 0 1 < 0 , a menos
que (x) = 0, ou seja,
a
^ 0=0:
Voltando agora para os nossos operadores originais (x; p^) temos:
a
^
0
= 0 =) p
x
0
+
2
k=
d 0
=
dx
1
x
k
i^
p
m!
0
=0
~ d 0
=0
m! dx
fazendo
temos
x
^+
0
~
m!
1 d 0
d
=
ln
dx
dx
0
=)
0
x
;
k
=
Fácil ver que a equação acima é bem mais fácil de resolver que a nossa
equação original (??). Sua solução vale
ln
0
=
x2
+ C =)
2k
(x) = N exp
0
x2
2k
:
com N uma constante (normalização).
1 0 Isso
pode ser visto observando que para qualquer autovetor normalizado
Z b
h nj a
^+ a
^ j ni =
[ n (x)] a+ a n (x) dx
=
Z
a
b
[a
n
(x)] [a
a
= h^
a
n
j^
a
190
ni
0:
n
(x)] dx
n
temos
A exigência a
^ 0 = 0, nos permite ainda determinar a energia deste estado
fundamental. Partido da eq. (86)
^
H
= ~!
n
n
n
1
~! a
^+ a
^+
2
~! a
^+ (^
a
~!
0
1
2
=
0
0)
= ~!
0
+
1
2
0
0
= ~!
0
0
= ~!
0
0
0
1
2
Então já temos o estado fundamentas e a sua energia (auto-valor).
Observe que a descrição quântica do OH implica na existência de uma energia
mínima (o oscilador nunca para de oscilar).
Problem 89 Como construir os outros estados
n?
Para isso, basta usar a propriedade (90)
a
^+
n
=
n+1
E1 = ~! (
0
=) a
^+
0
=
1
=) p
i^
p
m!
x
^
2
0
=
1
1
+1
2
+ 1) = ~!
explicitamente
p
2
x
~ d
m! dx
0
1
(x) = p x 1 +
2
1
(x) = 2 p x
2
0
0
=
~
~
m! m!
1
!
0
x2
2k
2
= N1 p x exp
2
com uma nova constante de normalização N1 . Da mesma forma, podemos obter
todos os outros estados (não-normalizados) n
n
= a
^+
n
0
n (x) = N p
2
x
Com autovalor
En = ~! n +
191
n
~ d
m! dx
1
2
0
:
(x)
12.7.1
Normalização
As funções n (x) não estão normalizadas, i.e., após a aplicação do operador a
^+
n vezes, precisamos calcular Nn . Isso pode ser simpli…cado supondo que, se n
é um vetor normalizado, queremos obter N e N + para que
a
^
+
a
^
a
^
n
ea
^+
n
n
N
n
N+
n 1
n+1
também já estejam normalizados.
^j
H
ni
= En j
j
ni
= ~! n +
a
^+ a
^j
ni
= nj
~! a
^+ a
^+
multiplicando pelo dual de j
h
1
2
ni
ni
1
2
j
ni
ni
temos
^+ a
^ j ni
nj a
= nh
n
j
ni
=n:
(92)
Agora observe que, pela de…nição de adjunto
h j A^ j i = h j A^+ j i
temos
Z
A^
dx =
Z
(A+ ) dx =
Z
(A+ ) dx
ou seja, podemos calcular h j A^ j i como o produto do dual de j i com A^ j i,
ou como o produto de j i com o dual de A^+ j i. Com isso
Z
Z
+
h nj a
^+ a
^ j ni =
a
(a
)
dx
=
(^
a n ) (^
a n ) dx
n
n
se …zemos
j
ni
a expressão acima se torna
Z
( n ) ( n ) dx = h
=a
^j
n
j
ni
ni
=j
2
nj
= j^
a
2
nj
usando (92)
j^
a
a
^ n
2
nj = n ) p
n
2
=1
ou seja, se quisermos um vetor normalizado não devemos de…nir a
^
mas sim
p
a
^ n
p
^ n= n n 1:
n 1 )a
n
192
n
=
n 1,
Da mesma forma
h
^a
^+
nj a
j
a
^+
ni
n
= h nj 1 + a
^+ a
^j
p
= n + 1 n+1
ni
=1+h
Ou, fazendo m = n + 1,
a
^+
m 1
=
p
m
^+ a
^ j ni
nj a
= 1 + n = N+
2
m
com isso
m
a
^+ m 1
a
^+
a
^+
a
^+
p
p
=p p
m
m m 1 m 2
a
^+
a
^+
a
^+
a
^+
p
::: p
=p p
m m 1 m 2
m m
+ m
(^
a )
= p
0 :
m!
=
m 3
m m
Assim, a formula para a n-ésima autofunção do hamiltoniano do OH se torna
n
N0
p
(x) = p
2
n!
~ d
m! dx
x
n
0
(x)
onde N0 é a normalização do estado 0 .
As funções n assim construídas são chamadas de funções de Hermite.
Exercise 90 Use a integral gaussiana
Z 1
p
2
e x dx =
1
e ache a normalização N0 .
Exercise 91 Construa a função de Hermite
4
(x).
O fato do nosso operador ser auto-adjunto implica que a base formada pelas
funções de Hermite também são completas e qualquer função pode ser decomposta como
1
X
(x) =
cn n (x) ; cn = h n j i :
n=0
Além disso, estas funções respeitam a seguinte relação de ortogonalidade
h
n
j
mi
=
nm
:
Da mesma forma, a o conjunto de autofunções de outros operadores lineares
(queaparecem muito em física) geram outros conjuntos de funções ortogonais:
193
1. O operador de momento
d
dx
com condições periódicas de contorno, fornece as funções ortogonais
p^ =
i~
n
1
e (x) = p exp (ikn x) ; kn =
L
2L
presentes na decomposição da série de Fourie. Este operador está relacionado com vários problemas em física, em especial com o problema
quântico de uma partícula numa caixa.
2. O operador
^ =
H
1
~2 d 2
+ m! 2 x
^2
2m dx2
2
no espaço das funções L2 ( 1; 1) cujas autofunções são
n
N0
p
(x) = p
2
n!
n
~ d
m! dx
x
0
(x)
conhecidas como funções de Hermite. Este problema está relacionado, em
especial, com a equação do oscilador harmônico.
Outros casos muito encontrados são:
1. Equação diferencial de Legendre
^= 1
L
x2
d2
dx2
2x
d
+ n (n + 1)
dx
Cujas soluções são os polinômios de Legendre
Pn (x) = N
1
2n n!
dn
x2
dxn
1
n
:
Esta equação esta relacionada, por exemplo, com o problema quântico do
átomo de hidrogênio.
2. Equação diferencial generalizada de Legendre
^= 1
L
x2
d2
dx2
2x
d
+ l (l + 1)
dx
m2
1 x2
Cujas soluções são os polinômios generalizados de Legendre
m
Plm (x) = N ( 1)
194
1
x2
m=2
dm
(Pj ) :
dxm
3. A equação de Laplace em coordenadas esféricas
2
1
^=2 @ + @ +
L
2
2
r @r @r
r sin
@
@2
+ sin
@
@ 2
cos
+
r2
1
@2
2 @'2
sin
cujas autofunções são os harmônicos esféricos
Ylm ( ; ') = N eim' Plm (cos )
Esta equação esta relacionada, por exemplo, também com o problema
quântico do átomo de hidrogênio.
Estas soluções são chamadas, de forma geral, como funções especiais.
13
Potenciais centrais
Até aqui tratamos praticamente todos os exemplo em 1D e argumentamos que a
extensão destes resultados para 3D não envolvia nenhuma di…culdade conceitual
mais profunda.
Vamos agora considerar o momento angular orbital de um sistema, ou seja,
uma característica que exige que nosso sistema tenha mais de 1D. O momento
angular que vamos tratar aqui é chamado de momento angular orbital. Este
representa a quantização, nos moldes introduzidos anteriormente, do observável
clássico momento angular
L=x
^=
p!L
i~x
r:
Obviamente esta é apena a forma do operador e para realmente especi…cá-lo,
precisamos do seu domínio.
Exercise 92 Se x
^ep
^ são hermitianos, o operador acima é hermitiano?
Esta distinção é necessária porque em MQ temos ainda um outro tipo de
momento angular, chamado spin, que representa uma característica interna das
partículas (a seguir veremos a diferença). Este último não representa a quantização de nenhum observável clássico e, mais ainda, não possui nenhum análogo
em MC.
O operador de momento angular respeita a seguinte regra de comutação
h
3
i
X
^
^
^i
Lj ; Lk = i~
"ijk L
i=1
e, conseqüentemente, não podemos esperar medir suas três componentes
simultaneamente (não são compatíveis). Portanto escolhemos uma destas
^z.
componentes para caracterizar o sistema,usualmente L
Exercise 93 Veri…que a regra de comutação acima.
195
Entretanto, apesar de não podemos medir simultaneamente as 3 componentes do momento angular, podemos de…nir um operador relacionado com o
módulo (ou o valor total do momento angular)
^2 = L
^2 + L
^2 + L
^ 23 ;
L
1
2
(na verdade, a raiz quadrada do autovalor do operador acima). Este operador
comuta com todas as componentes do momento angular
h
i
^2; L
^i = 0 :
L
h
i
^3; L
^ 2 = 0.
Exercise 94 Veri…que explicitamente que L
Assim, podemos caracterizar (medir simultaneamente) tanto o momento an^ 3 ), quanto o seu módulo. Ou seja, podemos
gular numa dada direção (e.g., L
procurar por autofunções simultâneas destes dois operadores. Vamos chamar
estas autofunções de Km e, por conveniência, vamos escrever seus autovalores
como
^2
L
^3
L
Km
= ~2 K 2
Km
= ~m
Km
Km
;
:
Os índices K; m caracterizam nosso estado físico. Índices que caracterizam
um estado físico em MQ são chamados de números quânticos. Ou seja, dizer que
nosso sistema esta no estado K;m signi…ca dizer que ele tem momento angular
na direção z igual a ~m e o módulo do vetor momento angular vale ~K.
Remark 95 Qualquer outra tentativa para especi…car melhor o valor do vetor
L irá destruir as informações obtidas anteriormente.
Uma visão clássica para o nosso sistema (que ajuda a desenvolver alguns
raciocínios) é que, após uma medida de L3 e L2 o vetor momento angular está
precessionando em torno do eixo z. Mas este imagem não deve ser levada
tão à sério. O resultado mais preciso, mas que é difícil de visualizar, é que,
após a medida de L3 , nosso sistema está numa superposição de todos os valores
possíveis de Lx e Ly , compatíveis com o valor de L2 .
13.1
Autovalores e autovetores do momento angular
Vamos agora discutir os possíveis valores dos autovalores e a forma dos autove^3 e L
^ 2 . Estes operadores são, obviamente, operadores diferenciais e
tores de L
a obtenção destas quantidades representa a resolução do problema de autovalores para estas equações.Entretanto, no lugar de resolvermos diretamente estas
equações, podemos usar um método completamente análogo ao desenvolvido
196
para resolver o problema do oscilador harmônico. Neste caso, introduzamos os
operadores
^+ = L
^ 1 + iL
^2 ;
L
^ =L
^1
L
+
^2 = L
^+
iL
:
Estes operadores fazem às vezes de a
^ e a
^+ neste problema e obedecem as
seguintes regras de comutação
h
i
^3; L
^ + = ~L
^+
L
h
i
^3; L
^ = ~L
^
L
[L+ ; L ] = 2~L3
h
i
^2; L
^ =0
L
Exercise 96 Veri…que as leis de comutação acima.
h
i
^3; L
^
^ são exatamente as
Observe que as leis de comutação L
= ~L
mesmas que as leis de comutação (88) e (89)
h
i
^ OH ; a
a
^ a
^ ; a
^+ a
^+ ) H
^ = ~!a ;
^ aja em L
^ 3 de
calculadas no caso do osculador harmônico. Isso faz com que L
^
forma semelhante a a
^ em H do OH.
Assim como …zemos no caso do OH, imagine que você encontrou um autove^3
tor K;m do operador L
^3
L
= ~m
i
^3; L
^ =
Usando as regras de comutação L
K;m
h
K;m
:
^
~L
é possível mostrar que
^3 L
^+
L
K;m
^+
= ~ (m + 1) L
^3 L
^
L
K;m
= ~ (m
^
1) L
K;m
K;m
^ + (L
^ ) permite construir um novo autovetor com o autoOu seja, o operador L
valor aumentado (diminuído) de uma unidade. Por isso este operador é chamado
de operador de levantamento (abaixamento).
Exercise 97 Veri…que as igualdades acima.
^ 2 comuta com L
^ 3 , podemos esperar que o autovetor
Uma vez que L
^
acima seja também autovetor de L2
^2
L
K;m
= ~2 K 2
197
K;m
:
K;m
(93)
h
i
^ ;L
^ 2 = 0 temos
Além disso, como L
^ 2 (L
L
K;m )
^2
=L L
K;m
= L ~2 K 2
K;m
= ~2 K 2 (L
K;m )
;
^ 2 como
Ou seja, os autovetores construídos acima são também autovetores de L
^
o mesmo autovalor. Assim, os operadores L abaixam e levantam a projeção
do momento angular no eixo z sem mudar o valor do módulo do vetor.
Fazer desenho
^ do OH, o operador (quadrático) L
^ 2 é positivo de…nido, com
Assim como H
isso,
D E
^2
L
0 ) K2 0 :
K;m
^ é hermitiano e K 2 R).
(isso é obviamente verdade porque L
Além disso, temos
D E
D E
D E
D E
D E
D E
^2
^ 21
^ 22
^ 23
^ 21
^ 22
L
= L
+ L
+ L
= L
+ L
K;m
K;m
K;m
K;m
K;m
+~2 m2 ;
K;m
ou seja
K 2 = m2 + C ; C > 0
ou ainda
jKj
jmj )
jKj < m < jKj :
Que obviamente signi…ca apenas que o módulo de um vetor é maior ou igual
qualquer uma de suas componentes.
Entretanto, o fato de podermos sempre aumentar o valor da projeção com
^ + (ou diminuir com L
^ ) leva a uma contradição com a igualdade
o operador L
acima (assim como no caso da energia mínima do OH). Por isso, se mmax jKj
é o maior valor possível para a projeção do momento angular na direção z,
devemos exigir que
^ + K;m
L
=0:
(94)
max
Pela mesma razão
^
L
K;mmin
=0:
^ 2 pode ser escrito como
O operador L
^2 = L
^ 21 + L
^ 22 + L
^ 23
L
^ L
^+ + L
^ 2 + ~L
^3
=L
3
^+L
^ +L
^ 23
=L
Exercise 98 Veri…que as igualdades acima.
198
^3
~L
(95)
Usando a relação acima e (94) podemos escrever (93) como
^2
L
K;mmax
= ~2 K 2
mmax
^ 23 + ~L
^3
= L
^ L
^+ + L
^ 23 + ~L
^3
= L
mmax
mmax
= ~2 m2max + ~2 mmax
mmax
ou seja
K 2 = mmax (mmax + 1)
Da mesma forma
K 2 = mmin (mmin
1)
Com isso
mmax (mmax + 1) = mmin (mmin
m2max
+ mmax =
m2min
1)
mmin
que implica
mmax =
mmin
Ou seja, os valores possíveis de m variam de uma em uma unidade
^ os faz varia de uma unidade) e se distribuem simetricamente
(porque L
em torno de 0.
A simetria da distribuição acima, nos mostra que temos apenas duas possibilidades para os valores de mmax
mmax = inteiro ) m = f mmax ; mmax + 1; ::; 0; ::; mmax g
mmax = semi-inteiro ) m = f mmax ; mmax + 1; ::; mmax g
no segundo caso m 6= 0. Qualquer outro valor de mmax não teria a simetria
necessária para que mmax = mmin .
Por exemplo, para mmax = 5=3 teríamos
5 2
; ;
3 3
1
;
3
4
;
3
7
) mmin =
3
4
6= mmax :
3
Os dois tipos de valores para mmax caracterizam os dois tipos diferentes de
^
momento angular mencionados anteriormente. Para mmax um semi-inteiro, L
é um momento angular intrínseco, i.e., um spin (e.g., férmions tem spin 1=2).
Como veremos mais pra frente, para o caso do momento angular orbital, necessariamente devemos ter mmax inteiro11 .
Vamos chamar
l mmax = mmin
Ou seja, os valores de m variam de uma em uma unidade desde
a de…nição acima temos
l até l. Com
K 2 = mmax (mmax + 1) = l (l + 1)
1 1 Não estamos a…rmando que m
max inteiro não pode ser um valor de spin, mas apenas que
o momento angular orbital tem, obrigatoriamente, um valor inteiro de mmax .
199
^ 2 são
Ou seja, os autovalores de L3 e L
^2
L
l;m
= ~2 l (l + 1)
^3
L
l;m
= ~m
l;m
l;m
; m=
; l=
0; 1; 3:::
1 3
2 ; 2 ; :::
l; l + 1; :::; 0; :::; l
Para cada valor de m temos 2l + 1 valores de m.
Para l inteiro, por razões que se tornarão claras futuramente, l é chamado de
número quântico orbital, enquanto m é chamado de número quântico azimutal
(ou número quântico magnético).
Vemos que o valor máximo da projeção l é sempre menor que o módulo
do vetor l (l + 1), ou seja, o vetor nunca está projetado inteiramente
no eixo z. Se isso fosse possível, teríamos um estado com L3 bem de…nido
e com L1 = L2 = 0, ou seja, haveria um estado em que conheceríamos as 3
componentes do momento angular.
Observe que a MQ nos diz que as partículas podem ter apenas valores inteiros
e semi-inteiros de l. Desta forma, temos 3 casos distintos:
1. o momento angular orbital, com l inteiro;
2. o momento angular intrínseco (spin) com l inteiro (e.g, o estado ligado de
duas partículas de spin 1=2) e semi-inteiro. No que se refere ao spin,
(a) partículas com spin inteiro são chamados de bósons e
(b) partículas com spin semi-inteiro são chamados de férmions.
Da mesma forma como no caso do OH, temos agora uma equação diferencial
mais simples pra resolver
^ + l;l = 0 :
L
Uma vez obtida esta solução, podemos construir as demais soluções baixando o
auto-valor de m
^ l;l
l;l 1 = L
^ l; l = 0 :Esta construção é válida tanto
e assim até l; l onde, obviamenteL
no caso do spin quanto do momento angular orbital. Entretanto, no primeiro
caso os operadores são matrizes e no segundo operadores diferenciais. O caso
com matrizes foi tratado quando estudamos sistemas com graus …nitos de liberdade (usando os operadores J^ ). Vamos agora nos ater no caso do momento
angular orbital.
Para resolver explicitamente este problema, ou seja, encontrar a forma explicita das autofunções, o ideal é trabalhamos em coordenadas esféricas
x = r sin cos
; y = r sin sin
; z = r cos ;
e suas inversas
r2 = x2 + y 2 + z 2 ; cos =
200
z
; tan
r
=
y
:
x
Nestas coordenadas temos
^ =L
^1
L
^2 =
L
^ 2 = ~e
iL
i
@
@
@
@
2
@
:
@ 2
i cot
1 @
@
1
sin
+
sin @
@
sin2
;
(96)
^ 3 assume uma forma bem simples
Em especial, o operador L
^3 =
L
i~
@
:
@
Observe que a coordenada r não participa dos nossos operadores.
Assim, as funções procuradas obedecem a equação (fazendo Ylm
l;m )
^ 3 Y m = imY m ;
L
l
l
Ylm = Ylm ( ; )
fazendo uma separação de variáveis
Ylm ( ; ) =
m
( )
m
l
( )
temos
^ 3 Ylm = imYlm )
L
m
( ) = N exp (im ) :
Onde N é, obviamente, a normalização (no parâmetro livre ).
Lembrando que a o produto interno das nossas funções originais são dadas
por
Z Z Z
Z Z Z
hgj f i =
g (x; y; z) f (x; y; z) dxdydz =
g (x; y; z) f (x; y; z) dV
e que, em coordenadas esféricas, o elemento de volume de uma casca com raio
r é dado por12
dV = r2 sin d d dr ;
temos que a área devido a variação das variáveis angulares ( ; ) vale
d
= sin d d ;
Chamado de elemento de ângulo sólido. Assim, o produto interno das nossas
funções (e, conseqüentemente, a normalização) devem ser calculados como
Z 2 Z
hY j Y 0 i =
Y ( ; ) Y 0 ( ; ) sin d d :
0
Para a coordenada
podemos escrever
1
N =p
2
12 A
0
)
m
1
( ) = p exp (im ) :
2
quantidade que multiplica d d dr é o jacobiano da transformação.
201
No caso do momento angular orbital estamos (diferente do spin) efetivamente
quantizando um sistema clássico que descreve um movimento circular. As
características físicas (clássicas) deste sistema exigem que o estado da partícula
no ponto (r; ; ) sejam os mesmos que nos pontos (r; + 2 ; + 2 ) (pois são
os mesmos pontos do espaço). Assim, a condição de unicidade da solução (que
usamos em problemas de mecânica clássica) exige que
( )=
m
m
( + 2 ) ) eim2 = 1 ) m = 0; 1; 2; ::
Ou seja, m deve ser inteiro. Como a…rmamos para o caso do momento
angular orbital.
Assim, nossas soluções têm a forma
1
Ylm ( ; ) = p
2
m
l
( ) exp (im ) ; m 2 N :
Voltando agora para a nossa equação
^ + Yll = 0 ) ~ei
L
@
@
+
@
@
i cot
1
p
2
l
l
( ) exp (il ) = 0 ;
ou seja
@
@
l
l
l
l
( ) = l cot
( )
observando que
d
sinl = l sinl
d
1
cos = l sinl
cos
sin
= l cot sinl
temos a solução
l
l
Nl
( ) = Nl sinl ) Yll ( ; ) = p exp (il ) sinl
2
onde Nl é uma normalização.
Exercise 99 Obtenha a constante de normalização Nl (lembre que
2 [0; ]).
^
As demais soluções são obtidas pela aplicação do operador L
Yll
m
^
( ; )= L
m
Yll ( ; ) = Nl
m
~e
i
i cot
@
@
@
@
m
sinl eil ; m
As funções Yll m assim construídas, e devidamente normalizadas, são chamadas
de harmônicos esféricos. Com isso
^ 2 Ylm = ~2 l (l + 1) Ylm ; l 2 N:::
L
^ 3 Y m = ~mY m ; m = l; l + 1; :::; 0; :::; l
L
l
l
Z 2 Z
hYlm j Ylm0
i
=
Ylm ( ; ) Ylm0
( ; ) sin d d =
0
0
0
0
202
mm0
ll0
2l :
^2,
Se usarmos ainda a primeira expressão acima e forma diferencial de L
temos que as nossas soluções obedecem também a equação:
m2
sin2
1 d
sin d
sin
d
d
m
l
= ~2 l (l + 1)
m
l
fazendo
cos ;
1
1
2
~ l (l + 1)
1 d
d
=
sin d
d
2
= cos2 = 1
2
1
temos
d
d
d
d
2
1
sin2
= sin2
m
l
m2
2)
(1
m
l
m
l
+
=0
Para m = 0 esta é a equação de Legendre, cujas soluções são os polinômios de
Legendre
1
dl
l
cos2
1
Pl (cos ) = l
l
2 l! d (cos )
para o caso geral, as soluções são dadas pela formula de Rodrigues
Ylm ( ; ) = Nl
m
m Pl
(cos ) eim
ondePlm são os polinômios associados de Legendre
m
1
cos2
m=2
m
1
cos2
m=2
Plm (cos ) = ( 1)
= ( 1)
dm
m Pl (cos )
d (cos )
1
dl+m
cos2
l
2 l! d (cos )l+m
1
l
Usando as propriedades dos polinômios de Legendre a forma acima permite
determinar as constantes de normalização
Nl
m
=
2l + 1 (l m)!
4
(l + m)!
1=2
:
A vantagem da expressão acima é que as propriedades dos polinômios associados de Legendre permitem resolver uma série de problemas envolvendo os
harmônicos esféricos.
203
13.2
O átomo de hidrogênio
Recapitular principais resultados do átomo de Bohr-Sommerfeld.
Como vimos, o modelo de Bohr-Sommerfeld do átomo de hidrogênio consiste
na quantização de duas variáveis clássicas: X
E cada estado do elétron é determinado pelos números n e NT.
I
I
p d = n h ; pr dr = nr h :
com
nr 2 N ; n 2 N :
A energia de cada um destes estados é dado por
Enr ;n =
RH
; n = n + nr :
n2
Assim, para cada valor de n temos vários diferentes de n e nr que resultam
na mesma energia. Esta degenerescência explica a estrutura …na observada nas
linhas espectrais do átomo de hidrogênio.
Na notação usada em química um nível é nomeado pelo valor de n e nr , onde
os níveis com nr = 0 (maior n ) é chamado de s, o nível nr = 1 é chamado de
p etc.
n = 1 ) n = 0; n = 1 1s
n = 2 ) nr = 0; n = 2 2s; nr = 1; n = 1 2p
n = 3 ) nr = 0; n = 3 3s; nr = 1; n = 2 3p ; nr = 2; n = 1
..
.
3d
Vejamos agora como estes resultados podem ser obtidos na teoria de Schroedinger.
Veremos, além disso, que esta teoria não só fornece os resultados anteriores
como permite uma descrição mais …na dos níveis acima (e.g., a degenerescência
do nível 2p). Além disso, e o que é mais importante, a teoria de Schroedinger
permite re…nar a descrição do átomo de hidrogênio acrescentando outras características além da atração coulombiana. Por exemplo, o spin do elétron e do
núcleo.
Uma vez que a teoria de Schroedinger parte da quantização do hamiltoniano
clássico, precisamos primeiro montar este hamiltoniano.
Partindo do hamiltoniano da partícula livre
H=
~2 2
r
2m
e escrevendo o laplaciano em coordenadas esféricas temos
H=
^2
p^2r
L
+
2m 2mr2
204
com
1 @
r
r @r
2
^ 2 = 1 @ sin @ + 1 @
L
2
sin @
@
sin @ 2
p^r =
^ 2 é o operador de momento angular introduzido anteriormente (96) e p^r é
onde L
chamado de momento radial. Assim, para o caso de um potencial que dependa
apenas da coordenada radial, i.e., um potencial central, temos que o operador
hamiltoniano se torna
2
^2
^ = p^r + L + V (r)
H
2m 2mr2
Para o caso de um sistema ligado de um próton e um elétron (i.e., um átomo
de hidrogênio) temos que o potencial do elétron devido ao próton vale
V (r) =
e2
r
com o que nosso hamiltoniano …ca
2
^2
^ = p^r + L
H
2m 2mr2
e2
r
Remark 100 Lembre que, na verdade, sendo um sistema de dois corpos, devemos usar a massa reduzida
me mp
=
' me ;
me + mp
reveja o capítulo sobre o átomo de Bohr.
Assim, na teoria de Schroedinger, o problema dos estados estacionário (estados com energia de…nida) do átomo de hidrogênio, consiste em encontrar os
autoestados do operador acima
^
H
=
jEj
:
Além disso, como estamos interessados em estados ligados, estamos interessados
no caso E < 0 (pois, como no problema usual do potencial acima, estamos
colocando o zero de energia no in…nito).
O problema acima pode ser facilitado usando, novamente, uma separação de
variáveis. Entretanto, observe que
h
i h
i
^ L
^ 2 = H;
^ L
^3 = 0 ;
H;
^ 3 (ou ainda,
^ L
^2 e L
ou seja, podemos procurar por autofunções simultâneas de H;
2
^
^
^
podemos medir simultaneamente H; L e L3 ). Com isso, vamos procurar as
nossas soluções na forma
= R (r) Ylm ( ; ) :
205
Substituindo a solução
~2
2m
na forma acima na ES temos:
~2 l (l + 1)
1 d2
r +
2
r dr
2mr2
e2
+ jEj R (r) = 0
r
Esta equação pode ser simpli…cada fazendo
u
rR
com o que
2me2
2m jEj
u (r) = 0
+
2
~ r
~2
l (l + 1)
d2
r +
2
dr
r2
que pode ser colocada numa forma ainda mais simples através das variáveis
~2 2
= jEj ;
2m
~2
~2
=
; a0 =
2
2ma0
me2
2 r;
RH
=
RH
jEj
onde RH é a constante de Rydberg e a0 o raio de Bohr introduzidos na seção
sobre o átomo de Bohr. Nestas novas variáveis temos
d2 u
d 2
l (l + 1)
2
1
4
u+
u=0
Nosso trabalho se resume, obviamente, em resolver a equação diferencial acima.
Assim como nos casos anterior existem técnicas especí…cas para encontrar a
solução desta equação. Após a aplicação destas técnicas, as soluções do problema acima podem ser escritos como:
un;l ( ) =
onde
Fnl ( ) =
nX
l 1
i=0
l+1
exp
2
2
i
Fnl ( )
2
( 1) [(n + l)!] i
; n2N
i! (n l 1 i)! (2l + 1 + i)!
são os polinômios associados de Laguerre. Para que estas funções sejam de
quadrado integrável, devemos ter13
n
l
1
0)l
n
1)l<n
Assim, a solução do problema do átomo de hidrogênio pode ser escrito como
(r; ; ) = Rn;l (r) Ylm ( ; ) ;
1
2 r
Rn;l (r) = un;l ( ) ;
r
n;l;m
un;l ( ) = exp
l+1
2
Fnl ( ) :
1 3 Podemos de…nir os polinômios acima para valores negativos do fatorial usando a função
. Entretanto, ( m)) = 1 para m inteiro positivo.
206
com os autovalores
RH
n2
que são exatamente os mesmos obtidos pela quantização de Bohr.
A solução da parte radial do problema (como era de se esperar) introduziu
o novo número quântico n nas nossas soluções. Chamado de número quântico
principal.
En =
Remark 101 A energia depende apenas do número quântico principal.
As restrições acima impõem
l<n:
e as restrições obtidas anteriormente
jmj < l :
Assim, para um dado valor de l temos 2l + 1 estados com o mesmo valor de l e,
para um dado valor de n temos n2 estados com a mesma energia.
Na notação usada em química, os valores de n rotulam os chamados orbitais.
Os valores de l são chamados, em seqüência, s; p; d etc. E para cada um destes
valores, temos m = 2l + 1 estados distintos.
1s1
2s1 2p3
3s1 3p3 3d5
..
.
A descrição completa dos orbitais atômicos depende ainda de uma característica negligenciada até aqui: o spin do elétron. Esta quantidade faz com
que cada estado possa existir em dois estados distintos de spin. Ou seja, o
número de estados de cada orbital é dobrado.
1s2
2s2 2p6
3s2 3p6 3d10
..
.
Além disso, a estrutura da distribuição eletrônica, bem como a estabilidade de
toda a matéria conhecida, depende diretamente da in‡uência do spin nestes
níveis eletrônicos. Ou seja, é impossível compreender a distribuição eletrônica
(em especial a tabela periódica) sem tomar em conta o spin do elétron.
207
13.2.1
Acoplamento spin-órbita
Podemos melhorar um pouco o nosso modelo se tomarmos em conta os efeitos
causados pelo spin dos elétron. Como sabemos, além de carga e massa o elétron
possui ainda outra característica intrínseca chamada spin. Esta quantidade
interage apenas com campos magnéticos. Assim, se colocarmos nosso átomo
^o
imerso num campo magnético B, teremos de acrescentar ao hamiltoniano H
um termo da forma
~
^ =H
^o + ^
H
s:B ; ^
s=
2
^
s é o operador de spin. Este operados comuta com os introduzidos anteriormente
i h
i
h
i h
^z = 0 :
^ ^
^2 = ^
s; L
H;
s = ^
s; L
Assim, como vimos, nosso sistema adquire mais um grau de liberdade e, escolhendo nossa base de spin nossas j i na direção z, soluções passam a ter a
forma
~
2
~
j i
2
1
jn; l; m; ms i = jn; l; mi jms i ; ms =
2
s^z jn; l; m; ms i = ~ms jn; l; m; ms i
jn; l; mi
j i ; s^z j i =
3
j i=
(97)
Assim, além dos números quânticos introduzidos anteriormente, temos agora o
novo número quântico ms .
O problema aqui é que uma carga em movimento num campo elétrico (devido
as transformações de Lorentz) enxerga um campo magnético (mais termos da
ordem de 2 ),
p
Bef f =
E
mc
Escrevendo
E = r'
surge no nosso Hamiltoniano um termo na forma
1
^
^
s:Bef f = f (r) ^
s L
2
; f (r) =
1 1 1 d'
2 m2e c2 r dr
(o fator 1=2, chamado fator de Thomas, surge quando mudamos do referencial
do elétron, onde Bef f foi calculado, para o referencial do centro de massa) e o
hamiltoniano para o átomo de hidrogênio, tomando agora em conta o spin, tem
a forma
^ =H
^ o + f (r) ^
^
H
s L
Obviamente, uma vez que o Hamiltoniano e, conseqüentemente, as equações
diferenciais envolvidas são diferentes, as soluções anteriores não servem mais.
Este novo problema é in…nitamente mais difícil de resolver. Entretanto,
é possível mostrar que este novo termo envolve energias muito menores que
208
as energias envolvidas em Ho . Assim, o que efetivamente é feito, é se tratar
este novo temo do Hamiltoniano como uma perturbação. Ou seja, utiliza-se as
mesmas soluções obtidas para Ho e se estima as alterações destas quantidades
na presença do novo termo.
Um problema ainda é que este novo termo no Hamiltoniano não mais comuta
nem Lz nem com s^z . Portanto, estas quantidades não podem mais ser usadas
^ L
^ z ; s^z ).
para rotular nossos soluções (existe agora relações de incerteza entre H;
Mais especi…camente, não podemos mais usar o número quântico m nem a
projeção do spin ms . Contudo, o Hamiltoniano acima pode ser escrito como
^ =H
^ o + f (r) ^
|2
H
2
onde
^2
L
^
s2
(98)
h
i
^ ^
^ +^
^
|=L
s ; H;
| =0
é o momento angular total do sistema. Além disso, é fácil ver que jz comuta
^ Assim, no lugar de m (autovalores de L
^ z ) usamos jz , os autovalores do
com H.
operador |^z . Lembre-se que tínhamos dois números (m; ms ) e agora só temos
um (jz ). Pela forma do Hamiltoniano (98) é fácil ver que
h
i
^ ^
H;
|2 = |^z ; ^
|2 = 0
podemos então usar os autovalores de ^
|2 para rotular nossos estados quânticos.
^ não podemos usar outra componente
Observe que apesar de ^
| comutar com H,
de ^
|, porque estas não comutam com |^z .
Assim, no lugar dos vetores (97) os estados quânticos para o átomo de
hidrogênio são rotulados como
jn; l; j; jz i
onde
^ jn; l; j; jz i = En;? jn; l; j; jz i ;
H
^ 2 jn; l; j; jz i = ~l (l + 1) jn; l; j; jz i ;
L
J^2 jn; l; j; jz i = ~j (j + 1) jn; l; j; jz i ;
|^z jn; l; j; jz i = ~jz jn; l; j; jz i :
(99)
Observe que, para o novo Hamiltoniano, não existe nenhuma razão para se
^ não dependam dos demais números quânticos.
supor que os auto-valores de H
Mais uma vez: para construir efetivamente as funções de onda n;l;j;jz (r; ; ) =
hr; ; j jn; l; j; jz i precisamos resolver a equação de Schroedinger. Mas o que
fazemos é continuar usando as funções R (r) e Ylm ( ; ), obtidas anteriormente,
e tratamos o novo Hamiltoniano como uma perturbação do anterior.
209
14
Teoria das perturbações
Como vimos, o problema do átomo de hidrogênio (mesmo com um único elétron)
tomando em conta os efeitos do spin, não pode ser resolvido exatamente (isso
acontece com a maioria dos problemas em MQ). Vamos então ver como este
tipo de problema pode ser atacado. A idéia é queremos encontrar os estados
estacionários (auto-funções) j n i para um Hamiltoniano na forma
^ =H
^ 0 + V^ ; H
^j
H
ni
= "n j
ni
;
2R;
<< 1 :
(100)
^ 0 , i.e., nós conhecemos
onde sabemos resolver o problema exatamente para H
todas as soluções
^ 0 j m i = Em j m i :
H
^ 0 , i.e., as enA suposição que fazemos aqui é que V^ é uma perturbação em H
^
ergias (auto-valores) do hamiltoniano H, apesar de ser diferente dos autovalores
^ 0 , não são muito diferentes j"n En j << 1. Isso pode ser garantido se
de H
^ =H
^ 0 . Este parâmetro
…zemos o parâmetro muito pequeno. Para = 0, H
surge naturalmente em cada problema especí…co. A idéia aqui (que é muito
^ apemais fácil de entender no espaço abstrato) é que o auto-vetor j n i de H,
^ 0 , que
sar de desconhecido, não é um vetor muito diferente de algum vetor de H
chamaremos de j n i. Com isso, fazemos a seguinte aproximação para a projeção
de j n i em j n i
h n j ni = 1 :
(101)
É conveniente escrever esta expressão usando o seguinte operador de projeção
P^n = j
ni h nj
ou seja, quando opera em um vetor qualquer j i, P^n j i = h n j j i j n i nos da
a projeção de j i em j n i. Com isso, nossa aproximação (??) se torna
P^n j
ni
=j
ni h nj j ni
=j
ni
(102)
ou ainda
j
ni
=j
ni
+ I
P^n j
=j
ni
^n j
+Q
ni
ni
^n = I
; Q
P^n
:
(103)
Se você não se sentir tão confortável no espaço abstrato, lembre-se que tudo
isso pode ser traduzindo num espaço concreto. Por exemplo, usando funções de
onda,
Z
hxj P^n j n i = hxj j n i h n j j i = hxj j n i h n j jxi hxj j n i dx
Z
= n (x)
n (x) n (x) dx
210
^ 0 . Obonde n (x) é a solução da equação de Schrödinger com hamiltoniano H
viamente, para efetuarmos o cálculo acima, precisamos antes encontrar n (x),
que é o nosso objetivo adora.
Voltando agora para a nossa notação abstrata em (100) temos
^0 j
H
n
j
ni
ni
= Vj
ni
V^ j
ni
1
=
^0
H
"n
=) V^ j
ni
^0 j
H
= "n
ni
1
^0
onde, até aqui, "n H
a seguinte propriedade
é apenas um símbolo para um operador que com
1
^0
H
"n
"n
^0 = I
H
=j
ni
mas que nós ainda não conhecemos.
Voltando agora para (103) temos
j
ni
=j
ni
^n j
+Q
j
ni
=j
ni
^n j
+ M
ni
=) j
ni
ni
1
^n
+ Q
"n
1
^n = Q
^n
; M
^0
H
"n
^0
H
V^ j
ni
V^
O grande truque agora é aplicar este processo recursivamente, ou seja, na expressão acima (que possui j n i dos dois lados da igualdade) substituímos toda
a igualdade no j n i do lado direito. Com isso
j
ni
=j
ni
^n j
+ M
=j
ni
^n j
+ M
ni
ni
^n j
+ M
ni
^ n2 j
M
ni
+
2
(104)
Observe agora que o terceiro termo depende de 2 e sendo muito pequeno,
é obrigatoriamente muito menor que o segundo. Assim, uma primeira aproximação para j n i, i.e., ignorando os termos da ordem de 2 , vale
E
1
(1)
^n
= j ni + Q
V^ j n i
n
^
"n H0
onde, mais uma vez, lembramos que conhecemos o vetor j
Para efetuarmos
1
^0
a conta acima, precisamos ainda saber como age o operador E H
. Para
isso, basta usarmos a propriedade
E
X
X
1
^n
j k i h k j = I =) n(1) = j n i +
Q
j k i h k j V^ j n i
^
"n H0
k
k
=j
ni
+
X
k
^n
Q
1
("n
Ek )
211
j
k i Vkn
n i.
onde sabemos calcular cada elemento da matriz Vkn
Z
Vkn = h k j V^ j n i = h k j jxi hxj V^ jx0 i hx0 j j
Z
0
0
0
=
k (x) V (x; x ) n (x ) dx dx
ni
dx dx0
Em particular, se V^ só depender de x, como é o vaso mais comum,
V (x; x0 ) = hxj V^ jx0 i = V (x) (x
Z
Vkn =
k (x) V (x) n (x) dx
x0 )
É importante notar que
^n j
Q
ki
=j
ki
= (j
Com isso
(1)
n
E
P^n j
= I
ki
nk
=j
ni
j
n i)
ki
j
1
("n
k6=n
n i h n j) j k i
0; n=k
j k i ; n 6= k
=
X
+
= (I
Ek )
j
k i Vkn
Ou, projetando no espaço das funções de onda
(1)
n
(x) =
n
X
(x) +
k
k6=n
("n
(x)
Vkn
Ek )
(105)
Mas ainda resta um problema: quanto vale "n ? Para resolver este problema,
voltamos a nossa equação original (100) e fazemos o produto interno com j n i,
^ 0 + V^ j
H
h
nj
h
n j H0
^ j
ni
e usamos novamente (101), h
n
+ h
j
ni
ni
=h
n j "n
^j
nj V
ni
En
ni
= "n h
nj j ni
= 1,
^ j ni
h n j V^ j n i
" n = En + h
"n
j
n
=
nj V
(106)
onde n é a diferença entre a energia perturbada e não perturbada, que estamos
supondo pequena (observe que é proporcional a ). Precisamos então calcular
1
"n
Ek
=
=
1
En )
1
(Ek
1
!nk 1
=
n
1
!nk
; !nk = Ek
n
!nk
212
n
En :
Se supusermos que n << !nk podemos expandir (1
Taylor em torno da origem
1
1
=
n
1
X
n
1
em série de
2
n
=1+
!nk
n=0
!nk
n =!nk )
n
!nk
n
+
+ :::
!nk
usando agora (106)
1
1
=1+
^j
!nk
nj V
n
!nk
1
"n
h
Ek
=
ni
+
2
1 4
h n j V^ j
1+
!nk
!nk
2
^j
!nk
h
ni
nj V
+
2
ni
!2
3
+O
h n j V^ j
!nk
ni
!2
+O
(1)
3
3
5 (107)
Precisamos agora lembrar que na nossa primeira aproximação n (x) estamos
interessados apenas em termos da ordem de , i.e., se mantivermos o segundo
da expressão acima em (75) teremos um termo da ordem de 2 . Então, para
obtermos a aproximação de ordem 1 (ignorar termos de 2 ) na função de onda,
usamos a aproximação de ordem zero (ignorar temos de ) na energia. Assim,
em primeira ordem em , temos
E
X Vkn
(1)
= j ni
j ki
n
Ek En
k6=n
(1)
(x) =
1
(x)
X
k6=n
Vkn
E k En
k
(x)
(108)
O que signi…ca a expressão acima? Ela nos diz que o vetor perturbado j n i
é quase igual ao vetor não perturbado j n i, mas com uma pequena componente
(pois << 1) na direção ortogonal. Além disso, a suposição n << !nk nos
diz que a perturbação tem de ser muito menor que a diferença nos níveis de
energia do hamiltoniano não perturbado.
Para se saber o valor da primeira aproximação na energia, quanto V^ alterou
a energia do sistema, basta usar o resultado acima em (106)
E
(1)
^
=
h
j
V
= h n j V^ j n i + O 2 ;
(109)
n
n
n
ou seja, a primeira ordem de perturbação na energia é apenas a média de V^ .
O poder do processo descrito acima é que ele pode ser repetido inde…nidamente para se obter as outras ordens de aproximação em . Por exemplo, para
a segunda ordem de aproximação, voltamos para (104)
j
ni
=j
=
^ n j ni + 2M
^2j
+ M
n
E
(1)
2 ^2
+ Mn j n i
n
ni
213
ni
usamos nossa primeira aproximação
E
^ n2
j n i = n(1) + 2 M
(1)
n
ignorando termos de ordem mais alta que
E
E
(2)
= n(1) +
n
(1)
n
onde
^ n2
M
(1)
n
E
E
E
4
+
2
,
2
^ n2
M
^ n4 M
^ n2 j
M
(1)
n
ni
E
foi obtido no passo anterior. Explicitamente
1
^n
=Q
=
X
"n
^0
H
^n
Q
1
k;j
=
X
("n
k6=n;j6=n
"n
Ek )
Ek )
^0
H
^j
j
1
("n
1
^n
V^ Q
ki h kj V
j
^j
ki h kj V
V^
(1)
n
E
1
^
j i Qn
ji
("n
Ej )
1
("n
h
Ej )
h
^
jj V
^
jj V
(1)
n
E
:
Mas agora, para "n precisamos manter termos até a primeira ordem em
em
1
"n
Ek
=
=
=
"
#
1
h n j V^ j n i
1+
+O
!nk
!nk
"
h n j V^ j n i
1
1+
+ h
!nk
!nk
"
#
1
h n j V^ j n i
1+
+O
!nk
!nk
2
^ j
n j Mn
!#
ni
+O
2
2
Então, para obtermos a aproximação de ordem 2 (ignorar termos de 3 ) na
função de onda, usamos a aproximação de ordem 1 (ignorar termos de 2 ) na
energia. Isso é válido para qualquer ordem. Com isso
E
E
(2)
= n(1) +
n
"
#"
#
X
^ j ni
^ j ni
1
h
j
V
h
j
V
1
n
n
h k j V^ j j i 1 +
1+
h
(En Ek ) (En Ej )
(En Ek )
(En Ej )
k6=n;j6=n
Este procedimento pode ser aplicado inde…nidamente. Usualmente, em problemas práticos, a convergência deste método é bem rápida, sendo necessário o
cálculo apenas da primeira e segunda ordem de perturbação.
O procedimento descrito acima é utilizado em praticamente todos os modelos
de QFT. Em especial, o primeiro destes modelos a fornecer uma in…nidade de
resultados consistentes com as experiências, a QED, é, basicamente, uma teoria
214
^
jj V
(1)
n
E
j
ki
perturbativa. O procedimento é aplicado com tanta freqüência que um método
sistemático foi desenvolvido para se somar os termos das séries em QFT chamado
de diagramas de Feynman.
Obviamente, se a perturbação não é pequena, o método não pode ser usado.
Por exemplo, várias interações (e.g., quark-gluon) da QCD a baixas energias não
podem ser tratadas com este procedimento. Esta é uma das razões destas teorias
não fornecerem tantos resultados experimentáveis quanto a QED. Processos
de transição de fase (e.g., supercondutividade e condensados) não podem ser
descritos por este método, pois os novos vetores no espaço de Hilbert são muito
distintos dos originas (a imposição (102) não pode ser feita). Para todos estes
sistemas existem outros métodos aproximativos, como, por exemplo, os métodos
variacionais e a aproximação WKB e ainda métodos puramente numéricos como
density functional theory.
O procedimento descrito acima se torna consideravelmente mais complicado
quando a perturbação depende do tempo e quando o sistema possui degenerescências (neste caso, veja a divergência em (108)).
14.1
Acoplamento spin-órbita (continuação)
Voltando agora ao nosso átomo de hidrogênio com spin. Como vimos, a primeira
ordem de correção para a energia é simplesmente a média do novo operador
Hamiltoniano calculado nas funções não perturbadas (109). Com isso
^ j i = h jH
^o +
E = h jH
^o j i +
= h jH
f (r) 2
^
|
2
1
hf (r)i h j ^
|2
2
^2
L
^2
L
^
s2 j i
^
s2 j i
^ o com autovalor En (soluções (??)) e
Lembrando que j i são autovetores de H
que usando as regras (99) temos
En;l;j = En + j (j + 1)
l (l + 1)
3 ~2
hf (r)inlm
4 2
(110)
Mais uma vez: este resultado é só uma aproximação que somente será
válida se o segundo termo for muito menor primeiro . Mas já em primeira
ordem de aproximação vemos que os níveis de energia do novo Hamiltoniano
dependem, não só de n, mas de n; l e j. Ou seja, o termo spin-órbita quebra
uma parte da degenerescência do sistema. Além disso, como estamos usando
ainda as funções originais, as seguintes regras continuam válidas
n 2 N ; l; m 2 N
l < n ; jmj 6 l =) jz
1
6l:
2
Para avaliar o valor de hf (r)i basta usar também os estados não perturbados
215
(??) e calcular as integrais, com isso
Z
~
hf (r)inlm =
2
En
2
l (2l + 1) (l + 1) n
hf (r)inl
onde = e2 =~c = 1=137 é a chamada constante de estrutura …na (este é o nosso
parâmetro de perturbação neste caso). Observe agora que
~2 hf (r)inl
/
En
2
= 5; 33
10
5
:
O que mostra que, efetivamente, o segundo termo de (110) é muito menor que
o primeiro termo (se isso não fosse verdade teríamos de abandonar a nossa
teoria14 ). Com isso nossa expressão de energia se torna
)
(
2
(Z )
1
3
l (l + 1)
En;l;j = jEn j 1
j (j + 1)
4
l (2l + 1) (l + 1) n
Para l = 0 temos j = 0 +
1
2
e a expressão acima se torna
j =0+
1
(0)
=) En;l =
2
jEn j
ou seja, não há acoplamento spin-órbita neste caso (os orbitais s são
esfericamente simétricos).
Para o caso de um único elétron (esta conta deve ser refeita para mais
elétrons, pois para n elétrons temos n contribuições do spin), lembrando que
j = l 1=2, para um dado l > 0 temos
!
2
1
1
(Z )
(+)
j = l + =) En;l = jEn j 1
2
(2l + 1) (l + 1) n
!
2
1
1
(Z )
( )
j=l
=) En;l = jEn j 1 +
2
l (2l + 1) n
Por exemplo, para n = 2, temos
1. Para l = 0 =) j = 1=2
(0)
E2;0; 12 = E2;0 =
2. Para l = 1 =) j = 1
jE2 j (1
0) =
jE2 j
1=2
1 4 Nem sempre temos esta sorte. Teorias onde os termos de aproximação sucessivas não
necessariamente diminuem são chamadas de "teorias não perturbativas".
216
E2;1; 12 =
+
E21
"
=
jE2 j 1
2
1 (Z )
6 n
"
2
1 (Z )
jE2 j 1 +
3 n
En1 32 = E21 =
#
#
As relações acima descrevem com grande precisão o espectro de emissão dos
átomos hidrigenoides.
Vamos então voltar para a nossa tabela periódica e tentar descrever a con…guração do átomo de lítio. Neste caso, temos 3 elétrons, os dois primeiros
completam o orbital 2s. O terceiro certamente ocupará a Shell n = 2, mas com
que valor de l? De acordo com as expressões acima nosso terceiro elétron tem a
sua disposição os estados:
(0)
E2;0 =
jE2 j
1
2
(Z )
12
1
2
jE2 j (Z )
6
+
E21
=
jE2 j + jE2 j
E21 =
jE2 j
Vemos então que o estado de menor energia é o E21 . Mas este estado tem
l = 1? Ou seja, a nossa teoria, apesar de descrever muito bem o espectro de
vários átomos e, inclusive várias de suas propriedades químicas, ainda não é
su…ciente para nos dar a regra n + l de Madelung.
217
Download