A INTEGRAL DE FEYNMAN DAS ORIGENS ÀS TEORIAS DE CAMPOS A TEMPERATURAS FINITAS Prof. Armando Flavio Rodrigues CBPF 2010 1 Conteúdo I. Prolegômenos ............................................................................................................................ 6 I.0. Introdução ........................................................................................................................... 6 I.1. As origens: uma conjetura de Dirac e a tese de Feynman .................................................. 8 I.2. A integral de Feynman e a equação de Schrödinger......................................................... 11 I.3. Analogias formais: as integrais de Wiener e Itô................................................................ 12 I.3.1. O movimento browniano revisitado ................................................................... 13 I.3.2. A integral de Wiener .......................................................................................... 14 I.3.3. A integral de Itô ................................................................................................... 15 I.3.4 A integral de Stratonovich....................................................................................... 16 I.4. Os Epígonos e o enigma matemático ................................................................................ 18 II. A Medida e a Integral .............................................................................................................. 20 II.1. Os conceitos e os elementos da integração ..................................................................... 20 II.2. Teoria da Medida (H. Lebesgue) – uma breve exposição ........................................... 21 II.3. A integral de Riemann: a exaustão da Análise Real ................................................... 26 II.4. A integral de Lebesgue e a extensão a espaços abstratos ......................................... 31 II.4.1. A integral ............................................................................................................. 31 II.4.2. Funções integráveis ............................................................................................. 33 II.5. Alguns exemplos de medidas em Física Teórica ........................................................ 37 II.5.1. A medida de Dirac ..................................................................................................... 37 II.5.2. Integração sobre grupos: a medida de Haar. ............................................................ 38 II.5.3. Outras medidas de integração .................................................................................. 44 III. Uma Teoria Geral da Integral de Feynman ............................................................................ 56 III.1. A Lei de Movimento da MQ ............................................................................................ 56 III.1.1. A Ação Clássica ........................................................................................................ 56 III.1.2. A Amplitude de Probabilidade na MQ .................................................................... 57 III.1.3. O limite clássico ....................................................................................................... 57 III.1.4. A soma sobre trajetórias .......................................................................................... 58 III.1.4.1. A analogia com a integral de Riemann.................................................................. 58 III.1.4.2. Construindo a soma .............................................................................................. 59 III.1.4.3. A integral de trajetória .......................................................................................... 60 III.1.4.4. A regra para dois eventos sucessivos .................................................................... 60 III.2. A fórmula de Trotter ....................................................................................................... 61 III.3. O Oscilador Harmônico Simples (OHS) e o Oscilador Harmônico Forçado ..................... 66 2 III.3.1. Integrais gaussianas ................................................................................................. 66 III.3.2. Cálculo da ação do OHS............................................................................................ 67 III.3.3. Cálculo da função F (T )OHS .................................................................................... 68 III.3.4. OHS forçado e as fontes J ( t ) de Schwinger .......................................................... 71 III.4. Derivadas funcionais ....................................................................................................... 74 III.5. O cálculo perturbativo..................................................................................................... 75 III.5.1. O funcional gerador.................................................................................................. 75 III.5.2. O propagador de Feynman ...................................................................................... 77 III.5.3. Cálculo perturbativo da teoria φ 3 .......................................................................... 81 III.5.3.1. Cálculo das funções de Green para um potencial arbitrário ................................ 81 III.5.3.2. Cálculo da série perturbativa para o potencial V (φ ) = − g 3 φ .......................... 83 3! III.5.3.3. Interpretação diagramática da teoria φ 3 ............................................................. 86 IV. Técnicas e Aplicações da Integral Funcional .................................................................. 95 IV.1. Cálculo Perturbativo: métodos e técnicas gerais............................................................ 95 IV.1.1. Regras de Feynman para o potencial φ 4 ............................................................ 98 IV.2. A Partícula Livre num espaço euclidiano D-dimensional .............................................. 101 IV.3. O Oscilador Harmônico num espaço euclidiano D-dimensional................................... 102 IV.4. Quantização Funcional de Campos Escalares .......................................................... 104 IV.4.1. Funções de Correlação .......................................................................................... 104 IV.5. A Analogia entre Teoria Quântica dos Campos e Física Estatística.............................. 108 IV.6. Quantização Funcional do Campo Eletromagnético (campo de Maxwell) .................. 109 IV.7. Quantização Funcional do Campo Espinorial ............................................................... 113 IV.7.1 Cálculo Geométrico, ou Álgebra de Grassmann .................................................... 113 IV.7.2. – O funcional gerador para o campo de Dirac ....................................................... 115 IV.8. QED: Eletrodinâmica Quântica .................................................................................. 116 IV.9. Determinantes Funcionais ........................................................................................ 117 Lista de exercícios do Módulo A................................................................................................ 120 V. O Formalismo de Tempo Imaginário .................................................................................... 121 V.1. Sistemas em equilíbrio: tempo imaginário .................................................................... 121 V.1.1. Uma Breve Revisão de Termodinâmica Estatística no Equilíbrio ........................... 121 V.1.2. O Formalismo de Matsubara .................................................................................. 123 V.1.3. As Frequências de Matsubara ................................................................................. 126 3 V.1.4. A Formulação Integral Funcional ............................................................................ 129 V.1.5. V.1.5.1. Representação Integral Funcional da Função de Partição ................................ 131 Amplitude de Transição para Bósons ............................................................ 131 V.1.5.2. A Função de Partição Bosônica ............................................................................ 133 V.1.5.3. Campo escalar neutro ................................................................................... 134 V.1.5.4. Férmions .............................................................................................................. 137 V.1.6. Aplicações do formalismo de Matsubara ............................................................... 141 V.1.6.1. A Correção de Massa em Um Laço para a teoria φ 4 ........................................... 142 V.1.6.2. A Auto-energia em Temperatura Finita ............................................................... 146 V.1.6.3. Condensação de Bose-Einstein ..................................................................... 151 VI. O Formalismo de Tempo Real .............................................................................................. 157 VI.1. Introdução ..................................................................................................................... 157 VI.2. O Formalismo CTP ......................................................................................................... 157 VI.3. Propagadores e sua Estrutura Matricial ....................................................................... 161 VI.4. Propriedades de Analiticidade ...................................................................................... 171 VI.5. O Propagador a Um Laço .............................................................................................. 172 VII. Formalismo de Tempo Real com Campos Térmicos ........................................................... 176 VII.1. Introdução .................................................................................................................... 176 VII.2. Formalismo TFD ........................................................................................................... 177 VII.2.1. Transformação de Bogoliubov e Vácuos Térmicos ............................................... 177 VII.2.1.1. Correlação no Vácuo .......................................................................................... 177 VII.2.1.1.1. Representação de Número (de Osciladores) ................................................. 177 VII.2.1.1.2. Estados Coerentes........................................................................................... 179 VII.2.1.1.3. Estados Comprimidos (squeezed states) ........................................................ 181 VII.2.1.1.4. Estados comprimidos com dois modos .......................................................... 183 VII.2.2. Abordagem por Operadores: Duplicação do Espaço de Hilbert ........................... 185 VII.2.3. Osciladores Bosônicos e Fermiônicos ................................................................... 187 VII.2.3.1. Oscilador Bosônico............................................................................................. 187 VII.2.3.2. Oscilador Fermiônico ......................................................................................... 189 VII.2.4. Teoria Livre do Campo de Schrödinger: Operadores Térmicos ............................ 194 VII.2.5. O Propagador da Teoria Livre do Campo de Klein-Gordon................................... 198 VII.2.6. A Condição KMS .................................................................................................... 201 VII.2.7. Relações de Dispersão para Propagadores Arbitrários ........................................ 202 VII.2.7. O Teorema de Goldstone na TFD .......................................................................... 204 4 VIII. Aplicabilidade da Integração Funcional à TFD – Alguns Resultados .................................. 208 VIII.1. Teorias de Calibre ....................................................................................................... 208 VIII.1.1. Teorias de Calibre para T=0 ................................................................................. 208 VIII.1.2. Invariância BRST a Temperatura Zero .................................................................. 213 VIII.1.3. Identidades de Ward-Takahashi e Slavnov-Taylor a Temperatura Zero.............. 218 VIII.1.4. Condições de Contorno Fermiônicas ................................................................... 228 VIII.1.5. Função de Partição de uma Teoria de Calibre Não-abeliana ............................... 231 VIII.1.6. Identidades de Ward-Takahashi a Temperatura Finita ....................................... 233 VIII.2. Modificações no Cálculo a Temperatura Finita .......................................................... 236 VIII.2.1. ε -regularização ................................................................................................... 236 VIII.2.2. Parametrização de Feynman ............................................................................... 238 VIII.2.3. Modificação da Fórmula de Feynman.................................................................. 239 VIII.3. Quebra Dinâmica de Simetria ..................................................................................... 240 VIII.4. A Fórmula de Redução LSZ.......................................................................................... 243 VIII.4.1. LSZ a Temperatura Zero ....................................................................................... 244 VIII.4.2. LSZ a Temperatura Finita ..................................................................................... 249 IX.1. Campo escalar com massa na teoria TFD em dimensões 1+1 ..................................... 250 IX.2. Número médio (no ensemble) de partículas com massa em 1+1 dimensões ............. 252 Lista de exercícios do Módulo B ................................................................................................ 253 X. Referências ........................................................................................................................ 255 5 A Integral de Feynman: das Origens às Teorias de Campos a Temperaturas Finitas I. Prolegômenos I.0. Introdução Para um entendimento mais completo das origens da integral de Feynman, enquanto ferramenta de cálculo e de investigação teórica em Física, será apresentado um breve e esquemático resumo dos dois formalismos – o hamiltoniano e o lagrangiano – preexistentes e empregados desde o século XIX na sistematização da Mecânica Clássica. Deve-se isto ao fato de que, em 1925, quando Heisenberg, Dirac, Born, Jordan e outros deram início à produção de propostas originais que resultaram no arcabouço da Mecânica Quântica, o Princípio de Correspondência de Bohr era o único critério de que dispunham para se guiar num terreno desconhecido, além de resultados experimentais inesperados que se acumulavam à espera de explicações sólidas. E, inicialmente, como os dados mais precisos à disposição, dados pela espectroscopia, se referiam a diferenças entre níveis atômicos de energia, aliados à associação direta entre a função hamiltoniana de um sistema e sua energia total, levaram naturalmente à escolha do formalismo hamiltoniano. Esta hegemonia só começou a ser superada em 1942, na proposta central da tese de doutorado de Richard Feynman, que adotou explicitamente pela primeira vez o formalismo lagrangiano como ferramenta de cálculo e de análise de fenômenos quânticos, apoiando-se num trabalho seminal de Dirac já com dez anos de existência. Mesmo assim, por razões que a própria razão desconhece, Dirac (1902-1984) sustentou até o fim da vida que só considerava confiável o formalismo hamiltoniano. São apresentadas a seguir as principais características e equações dos dois formalismos. FORMALISMO HAMILTONIANO – o estado ( q, p ) de um sistema físico com n graus de liberdade é descrito por n coordenadas generalizadas q e n momenta generalizados p ; o estado do sistema pode ser representado por um ponto num espaço de fase ( q1 ,…, qn ; p1 ,…, pn ) com 2n dimensões; os 2n momenta e coordenadas generalizados obedecem a 2n equações diferenciais de primeira ordem, que traduzem o aspecto local do formalismo, inerente à segunda lei de Newton; para uma dada função de Hamilton H ( p, q ) somente uma trajetória passa por um dado ponto do espaço de fase; o formalismo hamiltoniano canônico é não-relativístico, suas equações não são manifestamente covariantes, ou invariantes de Lorentz - para que isto ocorra necessitam ser modificadas por redefinições de operadores locais (v. p.ex., “An Introduction to Quantum Field Theory”, M. E. Peskin, D. V. Schroeder, eq. 3.85, p. 52), ou pela 6 introdução de termos não-locais (v. p.ex. , Y. Aharonov & M. Vardi, Phys. Rev. D 21(8), 2235-2240 (Appendix), 1980). FORMALISMO LAGRANGIANO – o estado ( q, q ) de um sistema físico com n graus de liberdade é descrito por n coordenadas generalizadas q e n velocidades generalizadas q ; o estado do sistema pode ser descrito por um ponto que se move com velocidade definida num espaço de configuração com n dimensões; as n coordenadas generalizadas evoluem de acordo com n equações diferenciais de segunda ordem; para uma dada função de Lagrange L ( q, q , t ) , várias trajetórias podem passar por um ponto dado no espaço de configuração, dependendo de q ; o formalismo lagrangiano é intrinsecamente global, por ser construído através do Princípio de Ação Mínima (ou Princípio de Hamilton) representado pela condição δ S = 0 , onde a ação S é definida como sendo o funcional S = ∫ L ( q, q , t ) dt , tf ti calculado, num intervalo temporal finito, sobre uma trajetória no espaço-tempo; e manifestamente covariante e relativístico, devido à invariância de S , uma grandeza escalar, em relação às transformações de Lorentz. É fácil ver que da invariância de S resulta a invariância de L , se escrevermos a expressão da ação da ação parametrizada pelo tempo próprio τ , fazendo dt = γ dτ , onde γ = 1 − q 2 c2 próprio também é invariante, L também o será. −1 2 . Como o tempo ALGUMAS FÓRMULAS: Equações canônicas de Hamilton: ∂H = qi ; ∂pi Equações de Euler-Lagrange: ∂L d ∂L = ∂qi dt ∂qi Transformações de Legendre: pi = LΛ ( q, q , t ) ≡ L ( q, q , t ) + − ∂H = p i ∂qi ∂L : momento canônico conjugado de qi ∂qi d Λ ( q, t ) : a função lagrangiana é determinada a menos de uma dt derivada temporal de uma função qualquer que dependa somente de ( q, t ) . Em seguida, como a tese de Feynman trata essencialmente da aplicação do Princípio de Ação Mínima às equações de Maxwell, é de interesse ver as formas das 7 funções hamiltoniana Hem e lagrangiana Lem para uma partícula de massa m e carga elétrica e sujeita a uma força de Lorentz F = e ( E + v × B ) , em três dimensões: H em = ( p − eA ) 2m 2 + eφ ; Lem = 1 mvi v − eφ + evi A , onde B = ∇ × A . 2 E, finalmente, considerando que o desenvolvimento da teoria por Feynman resultou na versão hoje utilizada da eletrodinâmica quântica relativística (QED) – mesmo que, em 1948, a teoria ainda fosse apresentada como uma “abordagem espaçotemporal da Mecânica Quântica não-relativística” -, é importante conhecer alguns detalhes da construção da função lagrangiana em notação quadridimensional usual. Neste contexto, as equações de Maxwell podem ser escritas na forma invariante de calibre Aµ − ∂ µ ( ∂ν Aν ) = j µ , onde j µ = ( ρ , j) é o quadrivetor densidade de corrente, µ = 0,1, 2, 3 , e o operador d’alembertiano está definido como ( ∂t ) ≡ ∂µ∂µ ≡ ∂ 2 − ∇ 2 . Com o fim de manter a covariância manifesta das equações de Maxwell, usa-se escolher o calibre de Lorentz ∂ µ Aµ ( x ) = 0 , que resulta nas equações de Maxwell Aµ = j µ . E, para que seja preservado o caráter local da teoria, uma vez que Aµ ( x ) pode variar para cada x ≡ ( x 0 , x1 , x 2 , x 3 ) , a função lagrangiana deve ser tomada como a integral espacial sobre uma densidade lagrangiana L ( x ) , e a expressão da ação invariante de Lorentz será, portanto, dada por S = ∫ d 4 x L ( x ) . Nesta notação, no calibre de Lorentz, e com o tensor intensidade de campo eletromagnético definido como F µν = ∂ µ Aν − ∂ν A µ , a densidade lagrangiana eletromagnética quadridimensional será 1 L ( x ) = − Fµν F µν + jµ Aµ . 4 I.1. As origens: uma conjetura de Dirac e a tese de Feynman. Em setembro de 1932, quando Carl Anderson publicou a primeira foto de um pósitron, confirmando espetacularmente a previsão contida desde 1927 na sua famosa equação relativística do elétron, P. A. M. Dirac estava imerso em uma de suas linhas de trabalho prediletas: a elaboração da Mecânica Quântica (MQ) por analogias com a Mecânica Clássica (MC). Publicado numa revista científica soviética no início de 1933, o artigo “A Lagrangiana na Mecânica Quântica” já afirmava na introdução que as formulações hamiltoniana e lagrangiana “são intimamente relacionadas, mas há razões para crer que a lagrangiana é a fundamental”. Prossegue indicando que é impossível se encontrar um sistema de equações diferenciais em MQ que fosse análogo às equações 8 de Euler-Lagrange, uma vez que a única diferenciação possível é dada pelo análogo dos colchetes de Poisson – ou seja, pelas relações canônicas de comutação. E continua, até mostrar que o análogo quântico do Princípio da Ação Mínima (PAM) para uma variável dinâmica que evolui entre os tempos t e T é dado por ( qt | qT ) = ∫ ( qt | qm ) dqm ( qm | qm−1 ) dqm−1 ( q2 | q1 ) dq1 ( q1 | qT ) , considerando-se uma seqüência de tempos intermediários T → t1 , t2 ,…tm → t , da qual, fazendo-se tk − tk −1 = δ t , resulta que ( qt +δ t | qt ) CORRESPONDE a exp 1 qt +δ t − qt , qt +δ t δ t . L δt Dirac mostra então que L é a função lagrangiana, usando mais uma vez o Princípio da Correspondência de Bohr, pois quando → 0 , ∫ t tm Ldt + ∫ tm tm−1 t2 t1 t t1 T T Ldt + … + ∫ Ldt + ∫ Ldt = ∫ Ldt = S , onde S é a ação do sistema clássico correspondente. Vale comentar que, com toda a fleugma britânica de Paul Adrien Maurice Dirac demonstrada frente à descoberta de Anderson, a confirmação da existência do pósitron lhe valeu o prêmio Nobel de 1933, aos 31 anos, compartilhado com Erwin Schrödinger e, com um ano de atraso, porém na mesma cerimônia, também com Werner Heisenberg. Adiantando desde já que a dedução acima será citada (tendo como fonte indicada o livro “The Principles of Quantum Mechanics”, P. A. M. Dirac, p. 124-126), quase ipsis litteris, dez anos depois, por Richard Phillips Feynman, cabe agora apresentar resumidamente a motivação – na verdade, era a única escolha possível – do uso do formalismo lagrangiano em 1942. Constatando que a QED até então desenvolvida estava repleta de valores infinitos para quantidades experimentais obviamente finitas, Feynman vê nisso a hipótese de que a própria noção de campo pode não ser a mais adequada ao tratamento das interações eletrodinâmicas, e, em conjunto com John Archibald Wheeler, seu orientador de doutorado, propõe uma interação coulombiana direta à distância entre partículas pontuais. Desta forma, eliminaria a auto-interação do elétron com o campo – segundo a opinião vigente entre os físicos da época, esta seria a origem dos valores infinitos -, e passaria a considerar o campo como apenas uma construção matemática auxiliar na descrição teórica daquelas interações, um “conceito derivado”. Numa primeira tentativa, Feynman considera apenas o potencial coulombiano “retardado” na auto-interação de um elétron consigo mesmo, através de um espelho distante, mas Wheeler chama a atenção para o fato de que, na verdade, esta situação corresponde a uma teoria eletromagnética da reflexão, e por isso sugere a aplicação da solução mais geral para o potencial maxwelliano de uma partícula carregada em movimento, 9 encontrada independentemente por A. Liénard (1898) e E. Wiechert (1900), uma combinação linear de um potencial “retardado”, medido no tempo t ′ = t − x − x′ ( t ′ ) c e um potencial “avançado”, medido no tempo t ′ = t + x − x′ ( t ′ ) c – embora este último aparentemente viole o princípio de causalidade, ao menos fora do contexto da Mecânica Quântica. Por outro lado, se for considerado apenas o potencial retardado, a limitação relativística da velocidade da transmissão da interação ( vint ≤ c ) faz com que uma função de Lagrange, que dependa unicamente das coordenadas e velocidades de um sistema físico, sem a introdução de graus de liberdade próprios a este, não seja mais suficiente para a descrição rigorosa de um sistema de duas ou mais partículas carregadas (numa interação no calibre coulombiano ∇ i A = j , instantânea, a velocidade de interação é assumida como sendo infinita – v. “Théorie Du Champ”, L. Landau e E. Lifchitz, 2ème édition, Éd. Mir, 1966, §65, p. 213; “Classical Electrodynamics”, J. D. Jackson, 1st edition, Wiley, 1962, p. 409-410). Feynman estabelece então três princípios para uma nova teoria quântica da interação eletromagnética: 1. “A aceleração de uma carga pontual se deve à soma das suas interações com outras partículas carregadas. Uma partícula não atua sobre si mesma; 2. A força de interação que uma carga exerce sobre outra é dada pela fórmula de Lorentz, F = e [ E + v × B ] , onde os campos são aqueles gerados pelas cargas de origem, segundo as equações de Maxwell; 3. Os fenômenos fundamentais (microscópicos) da natureza são simétricos com relação à troca do passado com o futuro. O que determina que a solução das equações de Maxwell que deve ser usada para calcular as interações seja a soma simétrica, meio a meio, da solução retardada com a solução avançada de Liénard-Wiechert.” Os três princípios acima equivalem, na Mecânica Clássica (MC), às equações de movimento resultantes do PAM. Segundo Feynman afirma (e reconhecerá o erro numa carta a Wheeler, décadas após) em sua tese, “a representação do campo como um conjunto de osciladores harmônicos, cada um com seu grau de liberdade, pode não estar correta, uma vez que são as partículas reais que determinam esse campo.” Aplicando o PAM a um exemplo de funcional de ação, “em conexão com a teoria de ação à distância”, que é “aproximadamente a ação para uma partícula em um potencial V ( x ) , e auto-interagindo em um espelho distante através de ondas retardadas e avançadas”: m ( x ( t ) )2 S=∫ − V ( x ( t ) ) + k 2 x ( t ) x ( t + T0 ) dt , −∞ 2 ∞ onde “o tempo que a luz leva para ir da partícula ao espelho é assumido como constante, e igual a T0 2 ”, conclui que “a força que atua no tempo t depende do movimento da partícula num outro tempo diferente de t . As equações de movimento não podem ser descritas diretamente na forma hamiltoniana.” 10 Ressalve-se que a visão de Feynman sobre a origem dos infinitos que assolavam a QED precede a descoberta da renormalização, um conceito fundamental - que Dirac nunca aceitou - para o posterior desenvolvimento da teoria. E acrescente-se que o princípio (3) – na verdade, é um postulado -, além de permitir a interpretação do pósitron como um elétron que viaja no sentido inverso do tempo – e vice-versa, isto é, um elétron também pode ser um pósitron na contramão do tempo -, pode ser o germe da estranha simetria que está no cerne da (matematicamente desafiadora e fisicamente reveladora) integral de Feynman. Uma rápida amostra da espantosa fronteira descortinada pelo princípio (3) entre a MC e a MQ (melhor dizendo, entre a MC e a Teoria Quântica dos Campos, que será frutiferamente desenvolvida nos anos seguintes) é a constatação de que, se o usarmos para construir o vetor de Poynting e daí calcular o fluxo de energia F através da superfície de uma esfera de raio R r (onde r é o raio de um círculo que a carga e descreve com velocidade constante), encontraremos que F = 0 (J. L. Synge “Relativity: the Special Theory”, 1956, p. 394 & Appendix B). Ou seja, classicamente, não há radiação alguma! Nem poderia haver, porque hoje sabemos que esta situação corresponde fisicamente, no nível quântico, à aniquilação elétronpósitron, impensável à época de Liénard e Wiechert, a qual virá a ser facilmente descrita (com a emissão de um fóton gama com energia mínima igual a 2me = 2 × ( 0,511) MeV ), e precisamente calculada, pela... integral de Feynman! I.2. A integral de Feynman e a equação de Schrödinger. Em seguida à citação anterior do livro de Dirac, Feynman dá o grande salto que levará a uma nova formulação da MQ, quando diz que “podemos agora assinalar que, 1 q′ − qt′ , qt′+δ t δ t , onde não somente ( qt′+δ t | qt′ ) corresponde à expressão exp L t +δ t δt L ( q, q ) é a função lagrangiana para o sistema clássico, considerada como uma função de velocidade e coordenada, mas que frequentemente é, na verdade, igual a ela”. Depois de encontrar, na primeira ordem em δ t → ε , uma expressão integral genérica para a função ψ ( qt′+ε , t + ε ) , exemplifica para a função lagrangiana clássica L = mx 2 2 − V ( x ) , de uma partícula de massa m que se move em uma dimensão espacial sob a influência de um potencial V ( x ) : ψ ( x, t + ε ) = ∫ e 2 iε m x − y −V ( x ) 2 ε ψ ( y, t ) dy , A sendo A uma constante de normalização a ser calculada. Note-se que surge pela primeira vez uma nova “medida de integração”, constituída do quociente do elemento de volume dy por uma constante a determinar. Fazendo a substituição de variáveis y = η + x , e observando que somente os valores de η próximos a zero contribuem na integral, devido ao caráter rapidamente oscilatório da exponencial, é feita a expansão em série de Taylor em torno de η = 0 , resultando na expressão 11 ψ ( x, t + ε ) = e iε − V ( x) i m ∫ e 2ε A η2 ∂ψ ( x, t ) η 2 ∂ 2ψ ψ x , t + η + + … dη . ( ) 2 ∂x 2 ∂x 2π ε i π4 2π ε i dη = e = Como ∫ e ( v. “Tables of Integrals, Series and m m Products”, Gradshteyn, eq. 3.322(3)), podemos calcular, por diferenciação de ambos os lados da equação com respeito a m , que i m 2 η 2ε ∫ ∞ −∞ i m 2 η 2 2ε η e dη = 2π ε i ε i , m m mas, como o integrando em η é uma função ímpar, a integral correspondente é nula, e teremos que ψ ( x, t + ε ) = 2π ε i iε 2 m e− V ( x ) ψ x, t + ε i ∂ ψ + O ε 2 . ( ) ( ) A m 2 x2 Porém limψ ( x, t + ε ) → ψ ( x, t ) , logo, devemos ter A = 2πε i m , e, após expandir ε →0 ambos os lados em potências de ε , na primeira ordem, e igualando os coeficientes, resulta a equação de Schrödinger correspondente ao sistema: − ∂ψ 2 ∂ 2ψ =− + V ( x )ψ . i ∂t 2m ∂x2 O fato de que o limite acima só possa ser calculado para este valor particular de A conhecido na literatura como a prescrição do ponto médio - se deve a que a medida de integração, no espaço complexo das trajetórias possíveis para a partícula, não é positivodefinida. Nas palavras do próprio Feynman, “... Isto é necessário porque as trajetórias que realmente importam são aquelas não-diferenciáveis.”. I.3. Analogias formais: as integrais de Wiener e Itô. Ao longo de anos, Feynman ensinou MQ no Caltech usando como técnica a sua abordagem por integral de trajetória. Um aluno, A. R. Hibbs, produziu as notas de aula que resultaram em um livro, hoje clássico: “Quantum Mechanics and Path Integrals” (McGraw-Hill, 1965), onde os conceitos e várias aplicações da integral de trajetória são mostrados em detalhe. Na seção 2.4 é assinalada a analogia com a integral de Riemann – com a ressalva de que, em alguns casos, “a definição de Riemann (...) não é adequada, e deve-se recorrer a alguma outra definição, tal como a de Lebesgue” -, e a “soma sobre trajetórias” em duas dimensões espaços-temporais é definida como um limite, quando o intervalo fixo de tempo ti − ti +1 = ε tende a zero, das integrais sobre os segmentos de linhas retas que unem as coordenadas entre ti e ti +1 e formam uma poligonal entre os 12 tempos e coordenadas iniciais ( x1 , t1 ) e ( xN , t N ) . Esta construção explícita leva naturalmente a se imaginar uma analogia formal com a teoria do movimento browniano, que efetivamente existe e será desenvolvida em seguida. I.3.1. O movimento browniano revisitado. Consideremos um random walk discreto, sobre uma linha reta horizontal, com todos os passos de igual comprimento ∆ , em tempos iguais t , com probabilidade p à direita e q à esquerda ( p + q = 1 ). Fazendo x = j ∆ , t = N ε , a probabilidade do sistema, partindo do ponto ( x = 0, t = 0 ) , se achar em x ( j ) depois do tempo t ( N ) será u ( j , N ) . Para andar uma distância j à direita serão necessários µ passos à direita e ν à esquerda, de tal forma que µ −ν = j e µ +ν = N , N O que pode se dar de maneiras distintas, resultando nas probabilidades µ N u ( j, N ) = p µ qν (no caso em que N − j é par) e u ( j, N ) = 0 ( N − j µ ímpar). Para grandes valores de j e N , usando a aproximação de Stirling N ∞ N N ! = ∫ e − y y n dy ∼ 2π N , 0 e e fazendo α = N ( p − q ) , obtém-se a probabilidade para o caso discreto ( j − α )2 2 u ( j, N ) = exp − . 2 N πN Do ponto de vista físico, porém, o movimento browniano é um processo aleatório, ou estocástico, em tempo contínuo. Esta é exatamente a definição do processo de Wiener – assim chamado porque a teoria foi desenvolvida pelo matemático americano Norbert Wiener, nas décadas de 1920-30 -, fundamental para o desenvolvimento posterior do estudo matemático-estatístico dos fenômenos e da dinâmica da economia de mercado. Do ponto de vista matemático, o processo de Wiener iniciou o estudo em tempo contínuo dos martingales, conjuntos que o cálculo estocástico utiliza para descrever processos estocásticos mais complexos. Fazendo, portanto, a versão contínua da fórmula anterior, devemos considerar agora a densidade ρ ( x, t ) de partículas por intervalo unitário em x . 13 Considerando que u ( j, N ) = 0 para N − j ímpar, devemos acrescentar um fator 1 2 e dividir por ∆ a fórmula acima, resultando então que, em função de x e t : ρ ( x, t ) = ε 1 ε 2 exp − 2 ( x − α∆ ) . 2 2π t ∆ 2t ∆ Em seguida, devemos fazer ε , ∆ → 0 , mantendo finitos x e t , o que só é possível conservando finita a relação ε ∆2 . Definindo agora o coeficiente de difusão (constante) como sendo D= ∆2 ε , e observando que, para obtermos um resultado finito, a diferença p − q também deverá tender a zero, definindo α∆ = t ∆ ( p − q ) ε ≡ ct , teremos ao final ρ ( x, t ) = ( x − ct ) 2 1 exp − . 4π Dt 4 Dt Esta é a equação que descreve a difusão de uma partícula cuja posição média se movimenta com velocidade constante de deslocamento c . A densidade ρ ( x, t ) é também solução da equação diferencial ∂ρ ∂2 ∂ρ = D 2 −c . ∂t ∂x ∂x Uma vez que c é constante, podemos, sem perda de generalidade, fazer c = 0 , e escrever que x2 1 ρ ( x, t ) = exp − . 4π Dt 4Dt I.3.2. A integral de Wiener Fazendo agora a soma sobre trajetórias do movimento browniano, ou processo de Wiener, se x = 0 em t = 0 , a probabilidade da partícula se encontrar entre a e b num tempo t será dada por ∫ ρ ( x, t ) dx . b a Aplicando o mesmo procedimento para ai < bi , ti < ti +1 , a probabilidade total entre o intervalo inicial ( a1 , b1 ) , partindo de ( x = 0, t = 0 ) , e o intervalo final ( aN , bN ) será 14 ∫ b1 a1 dx1 ∫ dxN ρ ( x1 , t1 ) ρ ( x2 − x1 , t2 − t1 ) ρ ( xN − xN −1 , t N − t N −1 ) . bN aN A passagem final ao caso contínuo é realizada fazendo-se com que N → ∞ , e assim se obtém uma medida µ para a integral ∫ d µ ( x (τ ) ) no espaço das trajetórias do movimento browniano, que é o espaço das funções contínuas x ( • ) com x ( 0 ) = 0 e, ou x ( t ) arbitrário (medida de Wiener), ou x ( t ) = x (medida de Wiener condicional, na qual os pontos inicial e final são fixados). No sentido da medida de Wiener, neste espaço, quase todas as funções contínuas são nãodiferenciáveis em toda parte. A integral correspondente é chamada de integral de Wiener. I.3.3. A integral de Itô O cálculo de Itô, desenvolvido nas décadas de 1940-50 pelo matemático japonês Kyioshi Itô, estende os métodos do cálculo usual a processos estocásticos, como o de Wiener, ou movimento browniano. O conceito central t desse cálculo é a integral de Itô Yt = ∫ H s dX s , onde X s é um processo de 0 Wiener (um martingale) ou, de forma mais geral, um semimartingale, e o valor de H s ( t ) é inteiramente definido pelo intervalo de tempo 0 < tα < t . As trajetórias do movimento browniano são funções não-diferenciáveis, além de exibirem outras anomalias, e esta integral não pode ser definida, por exemplo, como uma integral de Riemann-Stieltjes (a função de Wiener X s não é de variação limitada – BV, ou bounded variation -, uma condição necessária para uma tal definição). As fórmulas do cálculo de Itô, como p.ex. derivação, integração por partes, regra da cadeia, diferem daquelas do cálculo usual por incluírem termos de variação quadrática. Para calcular a integral Yt = ∫ ϕ ( x ( t ) ) dx , b a onde x ( t ) é uma determinada trajetória de uma partícula sujeita a um movimento browniano, Itô usou um procedimento similar ao usado para definir a integral de Riemann-Stieltjes (o limite convergente em probabilidade de somas de Riemann), com as seguintes definições: n −1 Yt = lim ∑ ( x j +1 − x j ) ϕ ( x j ) ; n →∞ j (b − a ) xj = x a + ; n j =0 xn = x ( b ) = xb ; x0 = x ( a ) = xa . 15 O estranho resultado obtido foi que ∫ xb xa 2 dϕ 1 b d ϕ ( x (t )) = ϕ ( xb ) − ϕ ( xa ) − ∫ dt . dx 2 a dx 2 O ponto de contato com a integral de Feynman, que mostra que esta também é calculada sobre trajetórias (não mais reais, e sim complexas) brownianas, e que ilustra a necessidade – para que sejam mantidas as expressões do cálculo usual da prescrição do ponto médio, surge quando definimos, empregando as definições de Itô para x j , xa e xb , a expressão uθ j ≡ x j + θ ( x j +1 − x j ) , onde 1 ≥ θ ≥ 0 , no cálculo de ϕ ( xb ) − ϕ ( xa ) , e se vê que, para θ = 1 2 , no limite n → ∞ (o mesmo processo de limite e de divisão de intervalos usados na integração de Feynman), o termo anômalo desaparece. Quando θ = 0 obtemos a integral de Itô, e todas as expressões correspondentes do seu cálculo estocástico. I.3.4 A integral de Stratonovich Para apresentar agora uma justificativa mais fundamentada da prescrição do ponto médio, vamos percorrer o caminho inverso, partindo da equação de Schrödinger, ou mais precisamente, do operador hamiltoniano da MQ para uma partícula com carga e , em um potencial vetorial A . Primeiramente, vamos expressar o fator da partícula i p2T na forma de uma integral de trajetória. Introduzindo o espaço livre exp − 2m D X b = L2,1 + das funções ξ : [ 0, T ] → , absolutamente contínuas e com o quadrado da 2 m T ξ t ( ) sobre ∫0 X b . A teoria das transformadas de Fourier das integrais gaussianas num espaço de derivada integrável, tais que ξ ( 0 ) = 0 , e a forma quadrática Q (ξ ) = Banach (um espaço vetorial normado) nos dá que i p2T i T m 2 j ∫ Dξ ⋅ exp ∫0 dt 2 ξ ( t ) − p jξ ( t ) = exp − 2m . O hamiltoniano quântico para uma partícula em um potencial vetorial A e em um potencial escalar V é dado por 1 Hˆ = −i∇ − eA + eV = Hˆ 0 + eHˆ 1 + e 2 Hˆ 2 , 2m onde Ĥ 0 = − 2 2 ∇ , m 1 Hˆ 1 = − pˆ ⋅ A + A ⋅ pˆ + V , 2m ( ) 1 2 Hˆ 2 = A , 2m p̂ é o operador −i∇ , e a ordenação dos fatores é tal que Ĥ resulte hermítico. 16 O funcional da ação correspondente é S (ξ ) = S0 (ξ ) + eS1 (ξ ) , onde 2 m dx S0 (ξ ) = ∫ , 2 ξ dt S1 ( ξ ) = ∫ A ⋅ dx − Vdt ≡ ∫ A . ξ ( ) ξ Observe-se que, em contraste com o operador hamiltoniano, o funcional de ação não contém termos em e 2 . Deve-se, portanto, calcular a integral funcional até a perturbação de segunda ordem em (até o segundo laço), quando se desejar identifica-la como solução da equação de Schrödinger. A integral ∫ξ A ⋅ dx é uma integral sobre t ao longo do caminho ξ . Pode ser definida tanto por uma integral de Itô como por uma integral de Stratonovich, como veremos a seguir. Divide-se o intervalo de tempo [ta , tb ] em incrementos ∆ti de forma que ∆xi = x ( ti +1 ) − x ( ti ) ≡ xi +1 − xi . ∆ti ≡ ti +1 − ti , e Façamos agora Ai ≡ A ( xi ) , Ai ,αβ = ∂α Aβ ( xi ) . Uma integral de Itô para x ( t ) ∈ D é, por definição, I ∫ξ A ⋅ dx ∑ Ai ⋅ ∆xi . i Uma integral estocástica de Stratonovich, por definição, será S ∫ξ 1 A ⋅ dx ∑ Ai + Ai +1 ⋅ ∆xi . i 2 ( ) Feynman se referiu à definição de integral de Stratonovich como a prescrição do ponto médio. Enquanto a integral de It^é típica de um processo de Markov, não-antecipadora, a de Stratonovich é adequada à física quântica pelos seguintes motivos. • É invariante quanto à inversão temporal; • Corresponde à ordenação de fatores 1 pˆ ⋅ A + A ⋅ pˆ 2 ( ) escolhida para o hamiltoniano, e que é necessária para que Ĥ seja auto-adjunto; • É coerente com o espaço funcional L2,1 , isto é, o espaço das funções contínuas cujas derivadas (no sentido de distribuições) são de quadrado integrável. 17 Os espaços L2,1 de trajetórias foram escolhidos como domínios de integração para assegurar que a energia cinética seja finita. E isto obriga a que a integral de Stratonovich, e não a de Itô, seja a única adequada ao contexto da MQ, uma vez S I 1 que a diferença entre ambas as integrais é dada por δ ∫ − ∫ = ∫ dt∇ ⋅ A , ξ ξ 2 que é um termo que não pode ser desprezado, e que, embora não pertença ao espaço dos caminhos contínuos, está bem definido nos espaços L2,1 , uma vez ( que ∆xi 2 ) e ∆ti são da mesma ordem de grandeza. I.4. Os Epígonos e o enigma matemático. A literatura matemática gerada pela integral e correspondente cálculo de Feynman é extensa e inesgotável. Talvez o resultado mais sólido e útil seja a fórmula de Feynman-Kac, desenvolvida pelo matemático Marc Kac a partir de 1949. Kac provou que a solução da equação de propagação do calor ∂ f ( x, t ) = σ ⋅∇ 2 f ( x, t ) − V ( x ) f ( x, t ) , ∂t que é análoga à equação de Schrödinger quando t é substituído por − it , sendo σ a constante de difusão, pode ser expressa por − V ( γ (τ ) + x ) dx t ϕ (γ ( 0 ) + x ) dW (γ ) , f ( x, t ) = ∫ e ∫0 onde dW ( γ ) é a medida de Wiener para o movimento browniano com variância σ 2 dτ , definido sobre trajetórias contínuas γ (τ ) , com 0 ≤ τ ≤ t e γ ( 0 ) = 0 . Esta equação pode ser formalmente reescrita como a expressão de Feynman, em integral de trajetória, para a solução da equação de Schrödinger ∫ γ τ ( )= x i e St ( γ ) ϕ (γ ( 0 ) ) d γ , t i 1 t 1 dγ St ( γ ) substituído por − ∫ dτ − ∫ V ( γ (τ ) ) dτ . Logo, é uma 0 2 0 2σ dτ matematicamente rigorosa integral de trajetória de Wiener, que tem o mesmo papel em relação à equação do calor que a integral de trajetória de Feynman tem em relação à equação de Schrödinger. Este fato tem sido usado desde então para fornecer “definições por continuação analítica” da integral de trajetória de Feynman, no sentido de que esta pode ser entendida como a continuação 2 com analítica da integral de Wiener f ( x, t ) para um tempo imaginário puro. Mas nenhuma dessas “continuações analíticas” consegue reproduzir o comportamento esperado por Dirac e Feynman no limite clássico → 0 , talvez 18 um dos resultados de maior beleza do formalismo da integral de trajetória de Feynman. Um outro caminho, que parte da forma de operador da função de Green dependente do tempo (com o hamiltoniano H independente do tempo) G ( t ) = θ ( t ) e−iHt , resulta numa expressão assintótica para a fórmula de Feynman-Kac, bastante eficaz para o cálculo de níveis de energia do estado fundamental, dada por 1 E0 = lim − log Tr e −τ H . τ →∞ τ Um exemplo simples de aplicação desta fórmula assintótica de Feynman-Kac, no caso de um oscilador harmônico, será mostrado mais adiante, em comparação com o método precursor empregado por Feynman no mesmo problema. 19 II. A Medida e a Integral II.1. Os conceitos e os elementos da integração Aquilo a que chamamos hoje de Teoria da Integração tem seus precursores nos geômetras gregos Eudoxos (408-355 AC) e Arquimedes (287-212 AC), que, interessados em calcular áreas de figuras geométricas curvilíneas, desenvolveram o “método de exaustão”. O cálculo das áreas de polígonos regulares era bem conhecido – bastava dividi-los internamente em triângulos adjacentes e somar as áreas dos mesmos e o método consistia simplesmente em inscrever figuras poligonais nas áreas a calcular, aumentando o número de arestas tanto quanto fosse necessário, até atingir a precisão desejada. Por este método, Arquimedes obtinha valores para π , por exemplo, inscrevendo em um círculo polígonos regulares com muitos lados e dividindo a área calculada pelo quadrado do raio do círculo. Hoje, curiosamente, usamos π para calcular a área A de um polígono regular, com n lados de comprimento s , pela fórmula A = s 2 ( n 4 ) cot (π n ) . Mas, somente no final do século XVII, com os esforços independentes e contemporâneos de Isaac Newton e Gottfried Leibniz, foram incorporados ao repertório dos matemáticos, ainda sem muita clareza e sem o conceito preciso de limite, os primeiros conceitos e técnicas gerais do cálculo de áreas e volumes, batizado por Leibniz e Johann Bernoulli de “cálculo integral”. È num livro de Bernoulli (“Lições matemáticas do método integral”, 1742) que são expostos os novos métodos, apesar de o autor modificar a versão inicial de Leibniz - que via a integração como uma soma de quantidades diferenciais –, para conceituar a integração como a “operação inversa” da derivação. Esse conceito, que hoje sabemos formalmente impreciso, irá prevalecer até o início do século XIX (1821-1823), quando Augustin Louis Cauchy publica seu “Cours d’Analyse”, onde lança as bases rigorosas do conceito de limite (já discutido de forma incipiente por D’Alembert em 1754), retorna à definição de Leibniz da integral como soma, e, a partir daí, demonstra pela primeira vez o Teorema Fundamental do Cálculo. Até a metade do século XIX o conceito de função traz implícito o “bom-comportamento” – continuidade e diferenciabilidade, ou, como disse Leonhard Euler em um de seus 888 trabalhos teóricos: “uma função é aquela curva que se pode traçar suavemente à mão livre!” Somente em 1850 a teoria da integração adquire o status de rigor matemático de que desfruta hoje, a partir do trabalho do matemático alemão Bernhard Riemann, que se apoiou firmemente na concepção de Cauchy quanto ao procedimento de passagem ao limite, e quanto à consideração da integral definida de uma função bem-comportada como essa passagem ao limite de somas bem definidas, que ainda são conhecidas como “somas de Riemann”. Aprofundando o estudo da integração proposta por Riemann, em 1887 um matemático francês, Marie Ennemond Camille Jordan, desenvolve um novo enfoque das somas de Riemann, iniciando uma evolução teórica que resultará em 1902 no estabelecimento inaugural da Teoria da Medida, por Henri Léon Lebesgue. O novo conceito proposto por Jordan, com base geométrica ainda tão acentuada que em verdade resgata e amplia, mais de vinte séculos depois, o “método de exaustão” de Eudoxos e Arquimedes, é conhecido hoje como a “medida de Jordan”, de importância mais 20 histórica que teórica, por estar no fundamento da integração riemanniana, e será visto mais abaixo. II.2. Teoria da Medida (H. Lebesgue) – uma breve exposição Funções Mensuráveis A princípio estaremos considerando classes de funções definidas sobre um conjunto X e valoradas em . Este conjunto X tanto pode ser o intervalo unitário I = [ 0,1] , consistindo em todos os números reais x que satisfaçam à relação 0 ≤ x ≤ 1 ; quanto o conjunto = {1, 2,3,…} dos números naturais; ou a linha real inteira ; ou todo o plano; ou algum outro conjunto. Isto significa que o desenvolvimento da integral não depende do caráter do espaço de origem X . Mas vamos identificar uma família X de subconjuntos de X através de algumas características precisas, definidas a seguir, e chamaremos a esta família de uma σ -álgebra: Def. AII.2.1. – Dizemos que uma família X de subconjuntos de um conjunto X é uma σ -álgebra quando: ii) ∅ , X pertencem a X . Se A pertence a X , então o complemento C ( A) = X / A pertence a X . iii) Se ( An ) é uma sequência de conjuntos em X , então a união i) ∞ ∪A n pertence n =1 a X. Um par ordenado ( X , X ) , consistindo em um conjunto X e uma σ -álgebra X de subconjuntos de X , é chamado de um espaço mensurável. Todo conjunto em X é chamado de um conjunto X - mensurável, exceto se a σ -álgebra X é fixada (o que ocorre em geral), quando o conjunto é chamado simplesmente de mensurável. Segue-se das regras de De Morgan C ∪ Aa = ∩ C ( Aa ) , a a C ∩ Aa = ∪ C ( Aa ) a a que a interseção de uma sequência de conjuntos em X também pertence a X . Def. AII.2.2 – Seja X o conjunto dos números reais. A álgebra de Borel é a σ - álgebra B gerada por todos os intervalos abertos ( a, b ) em – significando que esta é a menor σ -álgebra de subconjuntos de que contém {( a, b )} . Decorre daí que B também é a σ -álgebra gerada por todos os intervalos fechados [ a, b] , ou semi-abertos [ a, b ) , ( a, b ] em . Todo conjunto em B é chamado de um conjunto de Borel (assim nomeado em homenagem a Émile Borel, matemático francês contemporâneo de Lebesgue). 21 Def. AII.2.3. – Seja X o conjunto estendido dos reais ≡ ∪ {−∞, +∞} , seja E um subconjunto de Borel de , e E1 , E2 e E3 tais que E1 = E ∪{−∞} , E2 = E ∪ {+∞} , E3 = E ∪ {−∞, +∞} ; A σ -álgebra B , que é a coleção de todos os conjuntos E , E1 , E2 e E3 quando E varia sobre B , é chamada de álgebra de Borel estendida. Def. AII.2.4. – Diz-se que uma função (estendida) f , sobre X e com valores em (ou ), é X -mensurável (ou simplesmente mensurável), se, para todo número real α , o conjunto {x ∈ X : f ( x ) > α } pertence a X . A coleção de todas as funções estendidas X -mensuráveis é referida como M ( X , X ) . Def. AII.2.5. – Se f é uma função sobre X com valores em , sejam f + e f − as funções não-negativas definidas sobre X como f + ( x ) = sup { f ( x ) , 0} , As funções f + e f − ( x ) = sup {− f ( x ) ,0} . f − são chamadas, respectivamente, de parte positiva e parte negativa de f , e é imediato dizer que f = f + − f − , e f = f + + f − . Pode-se demonstrar que f é mensurável se e somente se f + e f − são mensuráveis. Def. AII.2.6. – Se f é uma função sobre X a valores complexos ( f : X → ), existem duas únicas funções f1 e f 2 a valores reais tais que f = f1 + if 2 , diz-se que f é mensurável se e somente se suas partes real, f1 , e imaginária, f 2 , são ambas mensuráveis. Def. AII2.7 – Uma função sobre X e valorada em é X -mensurável no caso em que o conjunto { x ∈ X : f ( x ) > α } pertence a X , para todo número real α . A coleção de todas as funções sobre X e X -mensuráveis com valores em é representada por M ( X , X ) . Lema AII2.8 – Seja ( f n ) uma sequência em M ( X , X ) , e sejam as funções f ( x ) = inf f n ( x ) , F ( x ) = sup f n ( x ) , f ∗ ( x ) = lim inf f n ( x ) , F ∗ ( x ) = lim sup f n ( x ) . 22 Então f , F , f ∗ , F ∗ pertencem a M ( X , X ) [Corolário: Se ( f n ) é uma sequência em M ( X , X ) que converge para f em X , então f está em M ( X , X ) ] Uma vez estabelecido o conceito de um espaço mensurável ( X , X ) , consistindo em um conjunto X e numa σ -álgebra X de subconjuntos de X , consideraremos agora certas funções definidas sobre a σ -álgebra X e com valores em ou . Estas funções, chamadas de medidas, são definidas como se segue: Def. AII.2.9 – Uma medida é uma função real estendida µ , sobre uma σ -álgebra X de subconjuntos de X e com valores em , tal que i) µ (∅) = 0 . ii) µ ( E ) ≥ 0 , ∀E ∈ X . iii) µ é enumeravelmente aditiva, no sentido de que, se ( En ) é qualquer sequência disjunta (isto é, para n ≠ m → En ∩ Em = ∅ ) de conjuntos em X , resulta que ∞ ∞ n =1 µ ∪ En = ∑ µ ( En ) . n =1 A seguir, são mostrados alguns exemplos importantes de medidas, com suas definições particulares: Ex. AII.2.10. – Se X = e X = B , a σ -álgebra de Borel, então existe uma única medida λ definida sobre B que coincide com o comprimento dos intervalos abertos, isto é, se E = ( a, b ) ≠ ∅ , então λ ( E ) = b − a . Esta única medida é chamada de medida de Lebesgue (ou de Borel). Por não incluir necessariamente subconjuntos de medida nula em B , é chamada mais precisamente de medida de Lebesgue incompleta. A medida de Lebesgue completa é dada pela extensão (no sentido, por exemplo, do Teorema da Extensão de Carathéodory) λ ∗ , definida sobre E ∪ N , onde N é a coleção dos subconjuntos de todos os conjuntos de medida nula em B . Algumas vezes é mais simples, ou suficiente, ter uma noção da magnitude de um intervalo, e não necessariamente do seu comprimento. Nestes casos, pode-se empregar a definição a seguir. Ex. AII.2.11. – Se X = , X = B , e se f é uma função contínua monótona crescente (ou seja, para x′ ≥ x → f ( x′ ) ≥ f ( x ) , x, x′ ∈ ), existirá uma única medida λ f definida sobre B tal que, se E = ( a, b ) ≠ ∅ , então λ f ( E ) = f ( b ) − f ( a ) . Esta única medida λ f é chamada de medida de Borel-Stieltjes. Da mesma forma que no exemplo anterior, a 23 extensão completa λ f ∗ , definida sobre a σ -álgebra completa E ∪ N , onde N é a coleção dos subconjuntos de todos os conjuntos de medida nula em B , é conhecida como a medida de Lebesgue-Stieltjes. A noção de completeza das medidas de Lebesgue e Lebesgue-Stieltjes será essencial para se definir corretamente a medida em espaços produtos, como mostra o exemplo a seguir, devido a um teorema que afirma existir pelo menos um conjunto A ⊂ que não é mensurável. Ex. AII.2.12. – Consideremos o espaço de medida definido como S = ( , B, λ ) , e vamos definir tentativamente a medida de Lebesgue λ 2 no plano 2 como uma medida produto, com a σ -álgebra mínima B ⊗ B , contendo todos os retângulos Ai × A j , Ai , A j ∈ B . Como todo conjunto pontual tem medida nula, λ ({a} ) = 0 , podemos escrever que λ 2 ({a} ⋅ A) = λ ({a}) ⋅ λ ( A) = 0 , para todo A ⊂ . Se A não for mensurável, λ ( A) não é definida, mas, por outro lado, {a} ⋅ A ⊆ {a} ⋅ , e este último conjunto maior tem medida definida e nula. Daí a necessidade de extensão da medida. A completeza também é necessária frente à existência de subconjuntos mensuráveis da reta que não pertencem ao conjunto de Borel, como o conjunto de Cantor no exemplo a seguir. Ex. AII.2.13. – Seja X o intervalo fechado [ 0,1] . Chamemos de X1 = (1 3,2 3) o aberto no terço médio de X ; de X 2 = (1 9, 2 9 ) e X 3 = ( 7 9,8 9) os abertos terços médios dos dois fechados X − X 1 ; de X 4 , X 5 , X 6 e X 7 , por sua vez, os abertos terços médios dos quatro fechados X − ( X 1 ∪ X 2 ∪ X 3 ) ; e assim sucessivamente, ad infinitum. O conjunto ∞ de Cantor C = X − ∪ X n tem, entre outras, as seguintes propriedades: n =1 i) C é Lebesgue-mensurável, e λ ∗ ( C ) = 0 ; ii) quaisquer dois abertos distintos, X i e X j , i ≠ j , não têm pontos em comum; iv) C não pertence ao conjunto de Borel; v) a medida de Lebesgue do conjunto complemento (coset) M = [ 0,1] C é λ ∗ ( M ) = 1 3 + 2 (1 9 ) + 4 (1 27 ) + … = 1 . Vamos agora construir a função de Cantor α ( x ) como se segue: α ( x ) = 1 2, ∀x ∈ (1 3, 2 3) ; α ( x ) = 1 4, ∀x ∈ (1 9, 2 9 ) ; α ( x ) = 3 4, ∀x ∈ ( 7 9,8 9 ) , etc. Agora, estendendo de forma contínua α ( x ) a [ 0,1] , α ( x ) será um função contínua não-constante, com a estranha propriedade de que a derivada α ′ ( x ) existe (com respeito à medida de Lebesgue), e é igual a zero, em q.t.p. (quase toda parte). Formamos 24 agora a medida µα . Uma vez que α ( x ) é contínua, µα ({ p}) = 0 para todo conjunto { p} de pontos puros (pp), e µα está concentrada no conjunto de Cantor C , no sentido de que µα ([ 0,1] C ) = µα ( M ) = 0 . Por outro lado, já vimos que a medida de Lebesgue de C é zero. Em outras palavras, µα e a medida de Lebesgue λ ∗ habitam conjuntos completamente distintos. Em particular, µα é um exemplo da medida de LebesgueStieltjes λ ∗f . Def. AII.2.14. Diz-se que uma medida µ ≡ µsing é singular em relação à medida de Lebesgue se e somente se µ ( M ) = 0 para algum conjunto M tal que M possui medida de Lebesgue nula. Def. AII.2.15. Diz-se que uma medida de Borel µ ≡ µ pp em ( µ ( K ) < ∞ para todo conjunto compacto K ∈ ) é uma medida de ponto puro quando µ ( X ) = ∑ x∈X µ ( X ) para todo conjunto de Borel X . Uma medida de Borel µ ≡ µcont em é contínua quando não possui pontos puros. Será mostrado agora um lema fundamental para a demonstração de um resultado central sobre a convergência da integral de Lebesgue: Lema AII.2.16. – Seja µ uma medida definida sobre uma σ -álgebra X . i) Se ( En ) é uma sequência crescente em X , então ∞ µ ∪ En = lim µ ( En ) . n =1 ii) Se ( Fn ) é uma sequência decrescente em X e se µ ( F1 ) < +∞ , então ∞ µ ∩ Fn = lim µ ( Fn ) . n =1 Antes de passarmos à definição precisa da integral de Riemann, sempre mantendo o foco pelo viés da Teoria da Medida – vamos definir a família de medidas que corresponde a essa integral. Def. AII.2.17. – Consideremos o espaço n e, como uma generalização de intervalos, o retângulo n-dimensional, ou simplesmente retângulo, definido como o produto J dos intervalos semi-abertos J = [ a1 , b1 ) × [ a2 , b2 ) × × [ an , bn ) . 25 Define-se como a medida de Jordan µ J desse retângulo como sendo o produto dos comprimentos k [ ak , bk ) = ( bk − ak ) : µ J ( J ) = ( b1 − a1 )( b2 − a2 ) ( bn − an ) = 1 ⋅ 2 n . Consideremos agora os poli-retângulos formados pela união finita de retângulos: S = J1 ∪ J 2 ∪ ∪ J k , ∀k ≥ 1 . A medida de Jordan do poli-retângulo S é definida como a soma das medidas dos retângulos disjuntos que recobrem S : k µ J ( S ) = ∑ µ J ( J k ) , Ji ∩ J j = ∅ . 1 i≠ j Esta definição, porém, só serve como medida para a classe limitada de conjuntos que são inteiramente cobertos pelos poli-retângulos. Para um conjunto limitado qualquer B , é necessário definir a medida de Jordan interna µ J ∗ ( B ) = sup µ J ( S ⊂ B ) e a medida de Jordan externa µ J∗ ( B ) = inf µ J ( S ⊃ B ) . Diz-se então que B é Jordan-mensurável se e somente se µ J ∗ ( B ) = µ J∗ ( B ) . No caso do conjunto de Cantor C , a medida de Jordan externa é idêntica à medida de Lebesgue: µJ∗ ( C ) = λ ∗ ( C ) . Mas a medida interna de Jordan é nula, porque o complemento de C é um conjunto denso. II.3. A integral de Riemann: a exaustão da Análise Real. A importância da integral de Riemann reside em que, na maioria das aplicações práticas, ela é suficiente, ou mesmo a única utilizável, como é o caso principalmente nos cálculos e simulações computacionais e numéricos. Embora Feynman tenha obtido sua integral originalmente, segundo suas palavras, como “uma espécie de integral de Riemann”, cabe defini-la aqui, não só para fins de integridade e completeza do exposto, mas, sobretudo, para apresentar como e porque a integral de Riemann não pertence ao universo do cálculo de Feynman. 26 A integral de Riemann é uma parte fundamental do cálculo e um precursor essencial da integral de Lebesgue. Consideraremos aqui a integral de Riemann de uma função limitada em um intervalo fechado da linha real I = [ a, b] ⊂ . Uma partição P de I é uma coleção finita de subintervalos { J k : 0 ≤ k ≤ N } , disjuntos por toda parte, exceto por suas extremidades, cuja união é I . Podemos ordenar os J k = [ xk , xk +1 ] de acordo com a regra x0 < x0 < < xN < xN +1 , x0 = a , xN +1 = b . Chamaremos os xk de extremidades de P , e definimos os elementos ( J k ) = xk +1 − xk , maxsize ( P ) = max ( J k ) , 0≤ k ≤ N minsize ( P ) = min ( J k ) . 0≤ k ≤ N Construímos agora a soma superior I P ( f ) = ∑ sup f ( x ) ( J k ) k Jk e a soma inferior IP ( f ) = ∑ inf f ( x ) ( J k ) , k Jk ambas sobre a partição P . Observando que I P ( f ) ≥ IP ( f ) , dizemos que estas quantidades se aproximam da integral de Riemann de f sobre o intervalo I , se a partição P é suficientemente refinada. E sempre que f : I → é limitada, as seguintes quantidades são bem definidas sobre I : i) Integral de Riemann-Darboux superior: I ( f ) = inf I P ( f ) ; P ∈Π ( I ) ii) Integral de Riemann-Darboux inferior: I ( f ) = sup IP ( f ) , P ∈Π ( I ) onde Π ( I ) é o conjunto de todas as partições de I .Diz-se então que f é uma integral de Riemann, ou Riemann-integrável, sempre quando I ( f ) = I ( f ) , o que se representa como 27 ∫ f ( x ) dx = I ( f ) = I ( f ) . I Vejamos agora alguns exemplos de particularidades da integração de Riemann. Ex. AII.3.1. – Seja Pν qualquer seqüência de partições de I em ν subintervalos Jν k , 1 ≤ k ≤ ν , tal que maxsize ( Pν ) = δν → 0 , e seja ξν k qualquer escolha de um ponto em cada intervalo Jν k da partição Pν . Então, para toda função f ∈ R ( I ) , onde R ( I ) é o conjunto das funções Riemann-integráveis sobre V, teremos que ∫ I ν f ( x ) dx = lim ∑ f (ξν k ) ( Jν k ) . ν →∞ k =1 A soma do lado direito da equação acima é chamada de uma soma de Riemann. Deve-se ser cuidadoso com o fato, porém, de que, uma vez tendo sido feita a escolha de Pν e ξν k , o limite à direita pode existir para uma função limitada f que não seja Riemann-integrável. Consideremos, por exemplo, para x ∈ I , a função característica do conjunto dos números racionais: ϑ ( x ) = 1 , se x ∈ ; ϑ ( x ) = 0 , se x ∉ . Neste caso, cada intervalo J ⊂ I de comprimento positivo contém pontos em e pontos fora de , e em conseqüência, para toda partição P de I , teremos que I P (ϑ ) = ( I ) e IP (ϑ ) = 0 , e, logo, I (ϑ ) = ( I ) , I (ϑ ) = 0 . Observe-se mais que, se Pν for uma partição de I em ν subintervalos iguais, podemos escolher cada ξν k como sendo um número racional, fazendo com que o limite da soma de Riemann seja igual a ( I ) , ou escolher cada ξν k como sendo um irracional, e neste caso o limite será zero. Ou ainda, se escolhermos metade dos ξν k como racionais e a outra metade como irracionais, obteremos para o limite o valor ( I ) 2 . Ex. AII.3.2. – Como foi visto, a integral de Riemann se baseia na medida de Jordan, e é definida como o limite de uma soma de Riemann, que em , 2 e 3 , pode se escrever, respectivamente, como 28 ∫ b a ∫∫ ∫∫∫ max ∆xk →0 f ( x, y ) dA ≡ f ( x, y, x ) dV ≡ ∑ f ( x )∆x n f ( x ) dx ≡ lim ∗ k k =1 ∑ f ( x , y )∆A n lim max ∆Ak → 0 ∗ k k =1 max ∆Vk → 0 ∗ k k ∑ f ( x , y , z )∆V n lim k ∗ k k =1 ∗ k ∗ k k , onde a ≤ x ≤ b e xk∗ , yk∗ e zk∗ são pontos arbitrários nos intervalos ∆xk , ∆Ak e ∆Vk , respectivamente. O valor max ∆xk é chamado de malha de uma partição do intervalo [ a, b] em subintervalos ∆xk . Usando essa definição, pode-se calcular, por exemplo, a área sob a curva f ( x ) = x r , no intervalo de 0 a a . Dividindo [ 0, a ] em n subintervalos iguais ∆xk = a ≡h, n temos que f ( x1 ) = f ( 0 ) = 0 f ( x2 ) = f ( ∆xk ) = h r f ( x3 ) = f ( 2∆xk ) = ( 2h ) , r e, logo, por indução, f ( xk ) = f ( k − 1 ∆xk ) = ( k − 1) h = h r ( k − 1) , r r f ( xk ) ∆xk = h r +1 ( k − 1) , e finalmente r n ∑ f ( x ) ∆x k =1 k k n = h r +1 ∑ ( k − 1) . r k =1 Fixando, por exemplo, r = 2 , teremos que n ∑ k =1 n n n n 2 f ( xk ) ∆xk = h3 ∑ ( k − 1) = h3 ∑ k 2 − ∑ 2k + ∑1 = k =1 k =1 k =1 k =1 n ( n + 1)( 2n + 1) n ( n + 1) = h3 −2 + n . 6 2 29 Assim, passando ao limite, temos a integral de Riemann definida n n ( n + 1)( 2n + 1) n ( n + 1) I = lim ∑ f ( xk ) ∆xk = lim h3 −2 + n = n →∞ n →∞ 6 2 k =1 n ( n + 1)( 2n + 1) n ( n + 1) n 1 3 = a 3 lim −2 + 3= a . 3 n →∞ 6n 2n3 n 3 30 II.4. A integral de Lebesgue e a extensão a espaços abstratos. “Statistical mechanics may be defined as the application of the concepts of Lebesgue integration to mechanics.” – Norbert Wiener, “The Homogeneous Chaos”, 1938. II.4.1. A integral Uma vez fixado, com o mínimo de rigor e de resultados necessários, o conceito de medida, serão necessárias ainda algumas definições auxiliares para estabelecer os resultados centrais da integração de Lebesgue, o que vai ser feito a seguir. Consideremos um espaço de medida fixo ( X , X, µ ) . A coleção de todas as funções X -mensuráveis sobre X com valores em e a coleção de todas as funções X -mensuráveis não-negativas sobre X com valores em serão chamadas, respectivamente, de M = M ( X , X ) e M + = M + ( X , X ) . Para definirmos a integral de qualquer função em M + , com respeito à medida µ , é conveniente introduzirmos antes a noção de uma função simples, com valores em (e não em ). Def. AII.4.1. – Diz-se que uma função com valores em é simples se e somente se possui um número finito de valores. Uma função simples mensurável ϕ pode ser representada como n ϕ = ∑ a j χE , j j =1 onde χ E j é a função característica de um conjunto E j em X . E existe uma única representação padrão para ϕ , caracterizada pelo fato de que os a j são distintos e, portanto, os E j são disjuntos: se a1 , a2 ,… , an são os distintos valores de ϕ , e se E j = { x ∈ X : ϕ ( x ) = a j } , os E j são disjuntos, e X = ∪ E j . n j =1 Def. AII.4.2. – Se ϕ é uma função simples em M + ( X , X ) na representação padrão, define-se a integral de ϕ com respeito a µ como sendo o número real estendido n ∫ϕd µ = ∑ a j µ E j . j =1 31 Adota-se nesta expressão a convenção 0 ⋅ ( +∞ ) = 0 , de modo que a integral da função identicamente nula é sempre igual a zero, se a medida do espaço for finita ou infinita. Observe-se que o valor da integral de uma função simples em M + é bem-definido (podendo ser +∞ ), uma vez que os a j são nãonegativos, e jamais será encontrada uma expressão sem significado matemático tal como ( +∞ ) − ( +∞ ) . Precisamos ainda das seguintes propriedades elementares da integral: Lema AII.4.3. Se ϕ e ψ são funções simples em M + ( X , X ) , e c ≥ 0 , então i) ∫ cϕ d µ = c ∫ ϕ d µ , ∫ (ϕ + ψ ) d µ = ∫ ϕ d µ + ∫ ψ dµ Se λ é definida por E em X por λ ( E ) = ∫ ϕ χE d µ , ii) então λ é uma medida em X . Podemos agora introduzir a integral de uma função arbitrária em M + , observando que não se exige que o valor da integral seja finito. Def. AII.4.4. – Se f pertence a M + ( X , X ) , define-se a integral de f com respeito a µ como sendo o número real estendido ∫f d µ = sup ∫ ϕ dµ , onde o supremo é estendido sobre todas as funções ϕ em M + ( X , X ) que satisfaçam 0 ≤ ϕ ( x ) ≤ f ( x ) , ∀x ∈ X . Se f pertence a M + ( X , X ) e E pertence a X , então f χ E pertence a M + ( X , X ) , e se define então a integral de f sobre E com respeito a µ como sendo o número real estendido ∫ E f dµ = ∫ f χE d µ . Pode ser mostrado facilmente que a integral é monótona, tanto com respeito ao integrando, como com respeito ao conjunto sobre o qual se estende. Ou seja, Lema AII.4.5. i) Se f e g pertencem a M + ( X , X ) , e se f ≤ g , então ∫f dµ ≤ ∫ g dµ ; 32 Se f pertence a M + ( X , X ) , se E , F pertencem a X , e se E ⊆ F , então ii) ∫ E f dµ ≤ ∫ f dµ . F Depois dessa preparação de terreno, podemos agora apresentar, em uma linha, o resultado central da Teoria da Medida de Lebesgue, no qual se fundamentam as fortes propriedades de convergência da integral de Lebesgue: Teorema AII.4.6. Teorema da Convergência Monótona Se ( fn ) é uma sequência monótona crescente de funções em M + ( X , X ) que converge para f , então ∫f d µ = lim ∫ f n d µ . (A demonstração deste teorema pode ser feita a partir de resultados mostrados acima). II.4.2. Funções integráveis Na definição Def. AII.4.2.2 foi definida a integral de toda função pertencente a M = M + ( X , X ) , com respeito a uma medida µ , aceitando que o valor dessa integral + incluísse +∞ . Discutiremos agora a integração de funções mensuráveis que podem assumir valores reais positivos ou negativos, e para isto é mais conveniente requerer que os valores, tanto das funções quanto das integrais, sejam números reais finitos. Def. AII.4.7. A coleção L = L ( X , X, µ ) de funções integráveis (ou somáveis) consiste em todas as funções f , definidas sobre X com valores em , X -mensuráveis, tais que as suas respectivas partes positiva f + e negativa f − possuam integrais finitas, relativas à medida µ . Neste caso, define-se a integral de f com respeito a µ como sendo ∫f d µ = ∫ f +d µ − ∫ f −d µ . Se E pertence a X , define-se a integral sobre E como sendo ∫f d µ = ∫ f + d µ − ∫ f −d µ . E Teorema AII.4.8 E E (Propriedade de integrabilidade absoluta) – Uma função f mensurável pertence a L se e somente se f pertence a L . Neste caso, ∫f Corolário AII.4.9. dµ ≤ ∫ f dµ . Se f é mensurável, g é integrável, e f ≤ g , então f é integrável, e 33 ∫ f dµ ≤ ∫ g dµ . É trivial provar que a integral é linear sobre o espaço L , da forma: ∫α f ∫( f + g)dµ = ∫ f dµ = α ∫ f dµ , dµ + ∫ g dµ . Segue-se agora o teorema de convergência mais importante para funções integráveis: Teorema AII.4.10. (Teorema da Convergência Dominada de Lebesgue) – Seja ( f n ) uma seqüência de funções integráveis que converge em quase toda parte para uma função f mensurável e com valores em . Se existe uma função integrável g , tal que f n ≤ g para todo n , então f é integrável, e ∫f d µ = lim ∫ f n d µ . De posse da linearidade da integral de Lebesgue sobre o espaço L = L ( X , X, µ ) (o que o classifica como um espaço vetorial), podemos agora acrescentar a propriedade da norma a esse espaço (ou, mais formalmente, impondo a estrutura de um espaço de Banach ao espaço de todas as funções integráveis), e obter os espaços Lp , 1 ≤ p ≤ ∞ , dos quais especialmente o L2 tem importância central dentro do enfoque do presente estudo. Def. AII.4.11. – Se V é um espaço linear em (um espaço vetorial, portanto), define- se uma norma como sendo a função • sobre V , com valores em , que satisfaz às seguintes condições: i) v ≥ 0 , para todo v ∈V ; ii) v = 0 , se e somente se v = 0 ; iii) α v = α ⋅ v , para todo v ∈V , α ∈ ; iv) (u + v ) ≤ u + v , para todo u , v ∈ V . Para fazer agora com que L = L ( X , X, µ ) origine um espaço linear normado, será necessário criar uma identidade entre duas funções que são iguais por quase toda parte, e, a rigor, devemos definir uma classe de equivalência entre funções (embora, na prática, a classe seja subentendida, e os elementos dessa classe – as funções - sejam referidos diretamente, sem prejuízo dos resultados). 34 Def. AII.4.12. – Diz-se que duas funções em L = L ( X , X, µ ) são µ -equivalentes quando elas são iguais por quase toda parte (ou seja, diferem entre si, em relação a µ , apenas por conjuntos de medida nula). A classe de equivalência determinada por f em L é algumas vezes representada como [ f ] , e consiste no conjunto de todas as funções em L que são µ -equivalentes a f . O espaço de Lebesgue L1 = L1 ( X , X, µ ) é constituído por todas as classes de µ -equivalência em L . Se [ f ] pertence a L1 , sua norma (ou L1 -norma) é definida por [f] 1 = ∫ f dµ , e pode-se mostrar que L1 ( X , X, µ ) é um espaço linear normado. Def. AII.4.13. – Se 1 ≤ p ≤ ∞ , o espaço Lp = Lp ( X , X, µ ) consiste em todas as classes de µ -equivalência das funções f , X -mensuráveis e com valores em , para as quais f p possui integral finita com respeito a µ , sobre X . A Lp -norma será dada por [f] p {∫ f = p dµ } 1 p Como já foi assinalado anteriormente, o caso do espaço L2 = L2 ( X , X, µ ) é especial, porque, além da L2 -norma [f] existe também o produto interno 2 = ( f , g )L 2 ∫ f dµ 2 = ∫ f ⋅ g dµ . Estas propriedades identificam o espaço L2 = L2 ( X , X, µ ) como um espaço de Hilbert. Podemos agora completar o estudo das medidas sobre , com uma definição e um teorema adicionais, e um importante teorema de Lebesgue. Def. AII.4.14. – Diz-se que uma medida de Borel µ ≡ µ ac é absolutamente contínua com respeito à medida de Lebesgue se existir uma função f , localmente L1 (i.e., ∫ f ( x ) dx < ∞ para todo intervalo finito ( a, b ) , tal que ∫ g d µ = ∫ gf dx b a para toda função de Borel g em L1 ( , d µ ) . Podemos então escrever que d µ = f dx . Teorema AII.4.15. – Toda medida de Borel µ pode ser decomposta de forma única em uma soma µ = µ pp + µcont . Teorema AII.4.15. (Teorema da decomposição de Lebesgue) – Seja µ uma medida de Borel. Sempre existe a decomposição µ = µac + µsing , e é única. Portanto, dos dois teoremas acima se conclui que toda medida µ sobre possui uma única decomposição canônica µ = µ pp + µac + µsing , onde µ pp é de ponto puro, µac é absolutamente contínua em relação à medida de Lebesgue, e µsing é contínua e singular com respeito à medida de Lebesgue. Esta decomposição irá se refletir, em mecânica quântica não-relativística, onde cada estado será a soma de estados ligados, estados de espalhamento, e estados sem interpretação física (pode-se mostrar, com alguma dificuldade técnica, no contexto da análise espectral dos operadores no 35 formalismo de Schrödinger, que este último tipo de estado não ocorre, ou seja, que para certas medidas {µsing } = ∅ ) Um espaço importante para o estudo das distribuições, que são definidas a partir de uma generalização do conceito de medida, é o espaço de Schwartz, que é o espaço S ( n ) das funções rapidamente decrescentes. Toda função f ∈ S ( n ) pertence ao espaço f (λ ) = de Lebesgue 1 e ( 2π ) ∫ n2 − ix⋅λ L1 ( n ) , e a transformada de Fourier f ( x ) dx (onde x ⋅ λ = ∑ k =1 xk λk ) é um mapeamento injetivo do n n espaço de Schwartz sobre ele mesmo (isto é, um endomorfismo), o que resulta em que a 1 transformada inversa f ( λ ) = eix⋅λ f ( x ) dx seja exatamente o mapeamento n2 ∫ ( 2π ) n inverso (Teorema de Plancherel). Este endomorfismo da transformada de Fourier também ocorre em L2 ( n ) , embora nem todas as funções em L2 ( n ) estejam em L1 ( n ) . Def. AII.4.16. O espaço de Schwartz é definido pela condição { S ( n ) = f ∈ C ∞ ( n ) : f α ,b } < ∞, ∀α , β , onde α , β são multi-índices α = (α1 , α 2 ,…α n ) , β = ( β1 , β 2 ,… β n ) , C ∞ ( n ) é o conjunto das funções infinitamente diferenciáveis f : n → , e f α ,β = sup xα D β f ( x ) , x∈ n onde D β = −i∂α . Efetivamente, uma função de decrescimento rápido é uma função que, quando x → ∞ , vai a zero mais rapidamente do que qualquer potência inversa de x , assim S ( como também suas derivadas, e pode-se demonstrar que ) ⊂ L ( ) , ∀p ∈ [1, ∞] , e que as funções f ∈ S ( ) são limitadas (bounded). O espaço sobre os números complexos S ( ) é chamado de espaço de Fréchet. n p n n n Um resultado importante, principalmente no que se refere à valoração de integrais oscilantes, afirma que, se f ∈ L1 ( n ) , a sua transformada de Fourier é uma função injetiva f : L1 ( n ) → C∞ ( n ) , onde C∞ ( n ) é o conjunto das funções contínuas que são nulas em {±∞} (Lema de Riemann-Lebesgue). 36 II.5. Alguns exemplos de medidas em Física Teórica. II.5.1. A medida de Dirac Talvez nenhuma outra medida tenha um uso tão presente na Física, desde sua invenção, quanto a conhecida “função δ ”, ou “delta de Dirac”. Redescoberta por Dirac na década de 1920 (“The Physical Interpretation of the Quantum Dynamics”, Proceedings of the Royal Society of London, 113, p. 621-641, 1926-1927), esta “função” já fora citada por Oliver Heaviside em seu livro “Electromagnetic Theory” (1893-1912) como a derivada da hoje assim chamada “função de Heaviside”, ou “função degrau”, e o próprio Heaviside atribuía a Jean Baptiste Joseph Fourier o mérito de ter sido o primeiro a defini-la, ainda no contexto inaugural da representação de funções por séries trigonométricas (No seu livro “Théorie analytique de la chaleur” (1822), Fourier chega a uma expressão que, na notação de hoje, se traduziria por 1 2 + ∑ cos n ( x − α ) = πδ ( x − α ) ), no intervalo [ −π , π ] ). Qualquer livro-texto avançado atual de eletromagnetismo define as funções de Green como soluções da equação diferencial ∇2G ( x, x′ ) = −4πδ ( x − x′) . No ensino da Mecânica Quântica elementar são frequentemente usados exemplos com o potencial atrativo −δ , ou com a barreira de potencial +δ . E na verdade a “função δ de Dirac” é uma particular medida, e não uma função – segundo Laurent Schwartz, “é o exemplo mais simples de uma medida que não é uma função” (“Théorie des Distributions”, Ed. Hermann, 1998, p. 19), que tem a seguinte definição: Def. AII.5.1. – A medida de Dirac pode ser definida de forma geral a partir da integral de Lebesgue ( ) δ ( xν ) (ϕ ) = ∫ ϕ ( x ) d δ ( xν ) ( x ) = ϕ ( xν ) , xν ∈ X , X onde ϕ é uma função contínua sobre n , nula em torno de um conjunto compacto que contém xν , e que assume valores complexos em . É a partir da constatação de que, se a medida de Dirac pode ser considerada, do ponto de vista físico, como formada por uma massa, ou carga, Q = +1 , fixada no ponto xν , e de que já existiam, nas teorias da Física, outras configurações mais complexas, como dipolos, quadrupolos, carga superficial e volumétrica, etc., e estimulado também pelo sucesso da Mecânica Quântica desenvolvida por Dirac e outros, que Schwartz constrói, na década de 1940, a Teoria das Distribuições, como generalização da Teoria da Medida de Lebesgue. Resumindo, a delta de Dirac não é uma função, mas sim uma medida de integração em relação à classe δ -equivalente das funções ϕ , e, sendo o 37 conceito de distribuição a generalização do conceito de medida, um caso particular das distribuições associadas a essas funções. II.5.2. Integração sobre grupos: a medida de Haar. Medidas e funcionais invariantes são uma ferramenta vital para se estudar as representações de grupos genéricos localmente compactos, e também para se estabelecer a estrutura detalhada de grupos abelianos localmente compactos. Nesse contexto, a medida de Haar é um instrumento poderoso, que possibilita a atribuição de um “volume invariante” a subconjuntos de grupos topológicos localmente compactos, e, subsequentemente, a formulação de integrais de funções sobre esses grupos. Esta medida foi construída pelo matemático húngaro Alfréd Haar, em 1932, que demonstrou logo a seguir, em 1933, o caso especial da invariância da medida para grupos compactos. A medida de Haar foi usada por Kenneth Wilson na definição da teoria de calibre na rede, acrescentando a esta sua criação, sem dúvida alguma, o atributo da elegância matemática. Estaremos interessados aqui nas propriedades gerais das integrais invariantes sobre o particular conjunto dos grupos de Lie unimodulares, especialmente aqueles que podem ser representados por polinômios de matrizes SU ( n ) , embora a medida de Haar possa ser definida para um universo mais amplo, como já dito acima. Para começar, parafrasearemos Feynman quando diz que “independente da medida particular, o que permanece sempre é a idéia de integral” (Feynman & Hibbs, op. cit.), e escreveremos as propriedades básicas de qualquer integral como sendo descritas pelas relações ∫ dg ( af ( g ) + bh ( g ) ) = a ∫ dg f ( g ) + b ∫ dg h ( g ) , sempre que f ( g ) > 0 , ∀g . ∫ dg f ( g ) > 0 , Nestas relações, f e h são funções arbitrárias sobre o grupo, e a e b são números complexos arbitrários. Imporemos agora a restrição adicional de que a medida seja invariante à esquerda: ∫ ( dg ) E f ( g ) = ∫ ( dg ) E f ( g ′g ) , onde g ′ é um elemento fixo arbitrário do grupo. Em uma integral usual, isto corresponde a uma translação na variável de integração. Como estamos considerando apenas grupos compactos, podemos ainda normalizar a medida de forma que ∫ dg 1 = 1 . Mostraremos agora que esta medida existe e é única, assumindo primeiro sua existência e encontrando uma expressão para ela, para depois mostrar que essa expressão satisfaz a definição e é única. 38 Consideremos a princípio uma parametrização arbitrária dos elementos do grupo em termos de parâmetros αi , em que o índice i vai de 1 a n , que é a dimensão da variedade do grupo. Vamos admitir que, enquanto o parâmetro α percorre algum domínio D de n , o elemento correspondente percorre univocamente o grupo: G = { g (α ) | α ∈ D} . A multiplicação é definida no grupo por uma função α ( β , γ ) tal que g (α ( β , γ ) ) = g ( β ) g ( γ ) , onde α , β , γ ∈ D . Vamos agora buscar uma função-peso J (α ) que faça com que a integral sobre o grupo seja uma integral n -dimensional usual: ∫ dg f ( g ) = ∫ dα dα J (α ) f ( g (α ) ) . 1 n A integral do lado direito da equação é um funcional sobre o domínio D . Usando a mesma notação para escrever a propriedade de invariância sobre o grupo obtemos que ∫ d β J ( β ) f ( g ( β ) ) = ∫ d β J ( β ) f ( g (α ( γ , β ) ) ) , onde agora γ parametriza o elemento g ′ , usado acima na definição da invariância à esquerda da medida. Fazendo agora a mudança de variáveis para α ( γ , β ) : ∂α ∫ d β J ( β ) f ( g ( β ) ) = ∫ dα ∂β −1 J ( β ) f ( g (α ) ) , onde ∂α ∂β representa o determinante jacobiano referente à mudança de variáveis. Com essa expressão é verdadeira para uma f arbitrária, podemos concluir que J (α ) = ∂α ∂β −1 J (β ) . Tomando agora β como a identidade e , obtemos que J ( γ ) = K ∂ (α ( β , γ ) ) ∂β −1 β =e , onde K = J ( e ) é um fator de normalização, determinado pela normalização da medida. Vemos assim que a medida do grupo é simplesmente um fator jacobiano, que representa o deslocamento de um pequeno volume padrão, próximo à identidade, para qualquer ponto do grupo. 39 Portanto, se existe uma medida invariante, sua expressão será dada por essa última equação. Para mostrarmos que a expressão é consistente com a definição, é suficiente verificar que a expressão anterior continua válida para todo β , ou seja, após introduzirmos um parâmetro δ ∈ D , comprovar que as duas expressões ( ) J (α ( β , γ ) ) = K ∂ α (δ , α ( β , γ ) ) ∂δ −1 δ =e e ∂α ( β , γ ) ∂β J ( β ) = K ∂β ∂α ( β , γ ) −1 ∂α ( δ , β ) ∂δ −1 δ =e são iguais. Para que isso se verifique, precisamos da associatividade da multiplicação: α ( δ , α ( β , γ ) ) = α (α ( δ , β ) , γ ) . Efetuando agora a derivação em relação a δ ∂α (δ , α ( β , γ ) ) ∂γ = ∂α ( ρ , γ ) ∂ρ ρ =α (δ , β ) ∂α (δ , β ) . ∂δ Tomando agora δ = e obtemos a igualdade de forma imediata. Excluindo a possibilidade de uma parametrização singular do grupo, esta análise prova que a medida existe, é única, e que é possível se obter uma expressão formal para a mesma. Será mostrado agora, neste caso específico de grupos localmente compactos e unimodulares, que as medidas invariantes à esquerda e à direita coincidem (no caso de grupos não-unimodulares, ambas são, na verdade, proporcionais). Vamos definir de forma análoga a medida invariante à direita como sendo ∫ ( dg ) D f ( g ) = ∫ ( dg ) D f ( gg ′ ) . Vamos supor agora a seguinte definição ∫ ( dg )′ f ( g ) = ∫ ( dg ) D f ( g 0 gg0−1 ) , onde g 0 é um elemento fixo arbitrário do grupo. Esta nova medida satisfaz ∫ ( dg )′ f ( gg ) = ∫ ( dg ) 1 D f ( g 0 gg0−1 g1 ) = ∫ ( dg ) D f ( g0 gg0−1 ) = ∫ ( dg )′ f ( g ) , 40 após a aplicação da invariância à direita de ( dg ) D . Em consequência, ( dg )′ é também invariante à direita, e a unicidade já mostrada anteriormente implica a igualdade ( dg )′ = ( dg ) D . Finalmente, usamos novamente a invariância à direita para obter que ∫ ( dg ) D f ( g ) = ∫ ( dg ) D f ( g 0 gg 0−1 ) = ∫ ( dg ) D f ( g 0 g ) , o que mostra que a medida invariante à direita também é invariante à esquerda, e, logo, por unicidade, ambas têm que ser iguais. Observe-se, é bom repetir, que, se as medidas não fossem normalizadas na unidade – isto é, se o grupo não fosse unimodular -, todas as medidas, finais e intermediárias, usadas na análise, poderiam sempre diferir por fatores constantes. Pode ser demonstrado que todo grupo compacto é unimodular. Vale notar que ∫ dg f ( g ) = ∫ dg f ( g ) . −1 Isto ocorre porque o lado esquerdo da equação define uma nova medida invariante – por definição, todo elemento de um grupo possui um elemento inverso pertencente ao mesmo grupo -, e, por unicidade, deve ser igual ao lado direito. O reflexo deste resultado na teoria de calibre na rede de Wilson é que os sentidos das ligações entre os vértices da rede não alteram a medida de integração. Entretanto, saber que a medida de Haar sobre um grupo existe pode não ser de muita ajuda, nos casos em que as leis de combinação de um determinado grupo são complicadas. Uma fórmula um pouco mais explícita, e de muito maior utilidade para obtermos as medidas de Haar sobre grupos de matrizes, é a que decorre da definição de um tensor métrico sobre um grupo, ( ) M ij = Tr g −1 ( ∂ i g ) g −1 ( ∂ j g ) , onde as derivadas são tomadas com respeito aos parâmetros αi : ∂i g = ( ∂ ∂α i ) g (α ) . Em relação a essa métrica, a expressão da medida invariante de Haar passa a ter a forma ∫ dg f ( g ) = K ∫ dα det ( M ) 12 f ( g (α ) ) , sendo o fator K uma constante de normalização. Esta é uma fórmula bem conhecida da geometria diferencial dos grupos de Lie compactos. No caso dos grupos SU ( n ) , sendo conhecido o tensor métrico em uma dada representação – fundamental ou adjunta -, a medida de Haar será dada por 41 n 2 −1 ∫ dg f ( g ) =∫ det M ∏ dω f (ω ,… , ω ) . 12 i 1 n i =1 A normalização das matrizes de base do grupo será dependente da representação, e dada pela relação T k , T l = cδ kl ; na representação fundamental, a constante de normalização será c = 2 n , e na adjunta, c = n ( n 2 − 1) . Vejamos agora alguns exemplos simples: • • sobre um grupo discreto, a medida de Haar é uma simples soma sobre os elementos do grupo; as medidas de Dirac e Haar podem ser consideradas mutuamente “inversas”, no seguinte sentido: ∫ dg δ ( g ) = 1 ; • sobre o grupo U (1) = {eiθ | −π < θ ≤ π } a medida de Haar será iθ ∫ dg f ( g ) = (1 2π ) ∫ dθ f ( e ) . As funções sobre o grupo são funções π −π • periódicas em θ , e a invariância do grupo se dá com relação a deslocamentos de fase (v. Michael Creutz, “Quarks, Gluons and Lattices”, cap. 8, ed. Cambridge UP, 1983); no caso da representação fundamental de SU ( 2 ) , podemos parametrizar os elementos como a superfície de uma esfera quadridimensional S3 (idem, ibidem): SU ( 2 ) = {a0 + ia ⋅ σ | a02 + a 2 = 1} , onde σ simboliza as matrizes de Pauli (mais precisamente, o tripleto de matrizes) e a02 + a2 é o raio quadridimensional da esfera S3 . Com esta parametrização, e usando-se a notação abreviada a 2 = a02 + a 2 , a medida de Haar sobre o grupo SU ( 2 ) adquire uma forma particularmente simplificada: ∫ dg f ( g ) = π ∫ d −2 4 a δ ( a 2 − 1) f ( a0 + ia ⋅ σ ) . Com uma parametrização diferente, angular (4-esférica), sobre a superfície da esfera quadridimensional S3 de raio unitário, e usando a representação adjunta do grupo, a medida de Haar terá a forma ∫ dg f ( g ) = ∫ 4sen ω sen θ d ω dθ dφ f (ω , θ , φ ) , 2 onde ω 2 é o ângulo azimutal principal. 2 Estes dois resultados exemplificam algo que já foi avançado acima, ou seja: as representações e/ou parametrizações dos elementos do grupo fazem com que a medida de Haar possa assumir formas diferentes, porém rigorosamente invariantes, nas representações e/ou parametrizações escolhidas. 42 • sobre o grupo SU ( 3) , Bég e Ruegg (Mirza Bég e Henri Ruegg, J. Math. Phys. 6, 677 (1965)) construíram uma base ortogonal completa para todas as representações irredutíveis do grupo, usando as funções harmônicas esféricas Ym , sobre a superfície de uma variedade invariante de SU ( 3) : a hiperesfera S5 com raio unitário. Em coordenadas esféricas, a parametrização será dada por 2 2 2 z1 + z2 + z3 = 1; z1 , z2 , z3 ∈ z1 = eiφ1 cos θ , z2 = eiφ2 sen θ cos ξ , z3 = eiφ3 sen θ sen ξ sobre os intervalos 0 ≤ θ ≤ π 2 , 0 ≤ ξ ≤ π 2 , 0 ≤ φi ≤ 2π , i = 1, 2,3 . A função densidade será neste caso dada por 1 12 det M = sen 2 θ sen 2θ sen 2ξ , 4 e a medida de Haar será dada por 3 1 dg f g = K dφi ∫ d ξ ∫ dθ sen 2 θ sen 2θ sen 2ξ f (φi , θ , ξ ) . ( ) ∫ ∫∏ 4 i =1 A constante K será determinada pela normalização −1 π 2 π 2 1 3 K = ( 2π ) ∫ dθ ∫ d ξ sen 2 θ sen 2θ sen 2ξ . 4 0 0 A integral em ξ é imediata, e usando Gradshteyn, eq. 2.535(1), para integrar em θ , obtemos que K = π −3 . Logo, a medida de Haar sobre SU ( 3) , nesta parametrização e com a base ortogonal completa composta por um conjunto bem definido de harmônicos esféricos descritos por Bég e Ruegg, será dada por dg = π −3 sen 2 θ sen 2θ sen 2ξ dφ1dφ2 dφ3 dθ d ξ . 43 II.5.3. Outras medidas de integração Def. AII.5.2. Define-se a medida gaussiana, ou distribuição normal, como uma medida de probabilidade de Borel definida sobre n da forma seguinte. Seja λ n a medida de Lebesgue completa usual, definida sobre a σ -álgebra B ∪ N em n . A medida gaussiana padrão é definida pela expressão γ n ( A) = 1 1 exp − ( 2π ) ∫ 2 n2 A x 2 n n dλ ( x) , onde A ⊂ ( B ∪ N ) . De forma mais geral, a medida gaussiana com média µ ∈ n e variância Σ 2 > 0 será dada por γ µn ,Σ ( A) = 2 1 ( 2πΣ ) 2 n2 1 ∫ exp − 2 x−µ 2 n A n dλ ( x) . As medidas gaussianas em que µ = 0 são chamadas de medidas gaussianas centradas. A medida de Dirac δ µ ( x ) é considerada uma medida gaussiana degenerada¸ por corresponder ao caso limite particular em que Σ → 0 . No caso de dimensões infinitas, não existe nenhum análogo à medida de Lebesgue, porém pode ser demonstrado que a medida de Dirac na origem, δ µ ( 0 ) , é a única medida de probabilidade esfericamente simétrica em um espaço de Hilbert com dimensão infinita. Def. AII.5.3. A medida da teoria quântica de puro calibre de Yang-Mills D(Y − M ) = DAµaDη∗aDηa é definida, no espaço produto do campo não-abeliano de calibre Aµa pelos campos de Fadeev-Popov ηa e η∗a , através do funcional gerador 2 α Z J µa = ∫ DAµaDη∗aDηa exp i ∫ d 4 x LYM + LFP − ( ∂ µ Aaµ ) + J µa Aaµ , 2 segundo o procedimento a seguir. Quantização de Feynman- DeWitt – O Método de Faddeev-Popov . 1 A ação para a teoria Y-M pura é S A µ = − ∫ d 4 x Tr ( Fµν ( x ) Fµν ( x ) ) , onde 2 Fµν ( x ) ∂ µ A ν − ∂ ν A µ + i g0 A µ , A ν . A µ é o campo de calibre na 1 λ a Aµa ( x ) , onde Aµa ( x ) 2 2 está na representação fundamental e λ a são os N − 1 geradores do grupo de calibre. representação adjunta do grupo de calibre SU ( N ) : A µ ( x ) 44 Podemos escrever S Aµa = − 1 Fµν = λ a Fµνa como 2 Tr ( λ a λ b ) = 1 δ ab 2 , e obtemos 1 4 µν d xFa ( x ) Fµνa , onde Fµνa = ∂ µ Aνa − ∂ ν Aµa − g 0 f abc Aµb Aνc . Temos então 4∫ N 2 − 1 campos de calibre Aµa : os campos de “glúons”. A ação de Yang-Mills acima é invariante sob transformações de calibre locais sobre os N 2 − 1 campos de glúons Aµa : U i i A µ ( x ) = U ( x ) Aµ ( x ) − ∂ µ U −1 ( x ) = U ( x ) A µ ( x ) U † ( x ) − U ( x ) ∂ µU † ( x ) = g0 g0 = U ( x ) Aµ ( x )U † ( x ) + i ( ∂µU ( x ) )U † ( x ) , onde usamos que U ( x ) é um operador g0 unitário, U ( x ) = exp −i g 0 Λ a ( x ) λ a = exp −i g 0 ∏ Λ ( x ) , tal que S U A = S [ A ] . Denotaremos a integral funcional sobre os N 2 − 1 elementos do grupo de calibre por ∫ D U = ∫ ∏ DΛ a , lembrando de que esta integração é “invariante” pela transformação a de calibre ∫ D (UU ' ) = ∫ DU " = ∫ DU . O funcional gerador para a teoria de Yang-Mills é N 2 −1 i 4 a Z J ∫ ∏ DA exp ∫ d x LYM ( Aµ ) + ∑ J µa Aaµ . a =1 a µ a a µ Daqui em diante utilizaremos a notação de Einstein para a soma: ∑J µa A µa . a • No funcional gerador Z estamos integrando sobre todas as configurações de campos de calibre Aµa , e, portanto, devemos formar classes de equivalência de configuração de calibre e integrar apenas sobre estas classes, para evitar integrações redundantes. Desta forma dividimos Z pelo volume de calibre e fixamos um Aµa representativo de cada classe de equivalência, escolhendo a seção de calibre (gauge slice). A mudança de coordenadas necessária para cancelar o volume de calibre envolve a ( ) mudança de uma configuração geral Aµa para Aµa′ , U , onde Aµa′ satisfaz à escolha de calibre (condição de fixação de calibre - gauge fixing), se encontra sobre a seção de calibre, e U é a transformação de calibre que leva Aµa′ para fora da seção, sobre a órbita de calibre, para Aµa . 45 (OBS.: Na linguagem da Teoria de Fibrados podemos dizer que a órbita { OA a ≡ Aµa ∈ A SU ( 2 ) | ∃U ∈ SU ( 2 ) → Aµa′ = U Aµa µ } é a fibra definida para cada ∏ → A SU ( 2 ) , a ∈ SU ( 2 ) em relação ao fibrado principal não-trivial OA → A onde A é o conjunto de todos os potenciais de Yang-Mills e ∏ é a projeção de A sobre A SU ( 2 ) - o moduli space , que nada mais é do que o espaço físico da teoria de Yang-Mills. Nesse contexto, a seção de calibre passa a ser identificado como a cross section, ou simplesmente seção do fibrado OA ). Para introduzir a condição de vínculo de fixação de calibre, usamos a condição Fa Abµ = 0 , e no caso do calibre de Lorentz, Fa Abµ = ∂ µ Aaµ = 0 . ( ) Consideremos a identidade I = ∫ DFa δ Fa Abµ ≡ ∆ −1 Aµa ∆ Aµa , que é “invariante de calibre”. Fazendo uma mudança de variáveis Fa → U no lado esquerdo da equação: δFa U Abµ U µ ∫ DU det δU δ Fa Ab = Fa =0 ( ) δFa U Abµ = ∫ ∏ DΛa det δ Fa U Abµ . δΛ b F =0 a a ( Podemos então identificar ) ( ∆ Aµa = ∫ DU δ Fa U Aµb ) , cujo inverso é δFa U Abµ ∆ A = det , que é o determinante de Faddeev-Popov. δΛ F = 0 b a −1 a µ ∫ ( ) O funcional ∆ Aµa é invariante de calibre: ∆ U 'Aµa DU δ Fa UU 'Aµb = = ∫ D (UU ') δ Fa ( UU 'Aµb ) = ∫ DU ''δFa ( U ''Aµb ) = ∆ Aµa . Inserindo a identidade I no funcional gerador, obtemos Z J µa = ∫ ∏ DAµa e iS Aµa , J µa ∫ DAµa e iS Aµa , J µa = ∫ DAµa ∆ −1 Aµa ∆ Aµa e iS Aµa , J µa = a = ∫ DAµa ∆ −1 Aµa ∫ DU δ Fa ( U Aµb ) e iS Aµa , J µa . 46 Como a ação S Aµa , J µa e o funcional ∆ Aµa são invariantes de calibre (a ação S Aµa , J µa é invariante de calibre para correntes J µa conservadas!), então ( ) Z J µa = ∫ DAµa ∆ −1 Aµa ∫ [DU ] δ Fa U Aµa e ( ) ≡ ∫ D U Aµa ∆ −1 U Aµa ∫ [DU ] δ Fa U Aµa e ( ) iS U Aµa , J µa iS U Aµa , J µa ≡ = iS A , J = ∫ DAµa ∆ −1 Aµa ∫ [DU ] δ Fa Aµa e µ µ = = ( ∫ [DU ]) ∫ DA a µ ( a ) ∆ −1 Aµa δ Fa Aµa e ( ) ( ) ≡ Vgauge ∫ DAµa ∆ −1 Aµa δ Fa Aµa e a iS Aµa , J µa iS Aµa , J µa ≡ . Portanto Vg−1Z J µa = ∫ DAµa ∆ −1 Aµa δ Fa Aµa e iS Aµa , J µa , onde δFa U Aµb , e S A a , J a = S A a + d 4 xJ µ A a . ∆ A = det a µ µ µ µ ∫ δΛ b Fa =0 −1 a µ De forma análoga ao caso da QED ( g0 → 0 ) no calibre de Lorentz, a condição de vínculo ∂ µ Aaµ não aparece explicitamente na ação. Portanto, é mais conveniente introduzir a condição de fixação de calibre na forma Fa ( Aµb ) = ∂ µ Aµa − f a ( x ) = 0 , isto é, ( ) δ Fa Aµb ≡ ∏ δ ( Fa ) = ∏ δ ( ∂ µ Aaµ − f a ( x ) ) . a a iα Introduzindo agora a identidade 1 = cte.∫ ∏ Df c exp − ∫ d 4 x f a ( x ) f a ( x ) 2 c funcional gerador, obtemos no iα δFa U Abµ − ∫ d 4 x f c2 ( x ) iS A a , J a Z J = ∫ DA det D f e δ ( ∂ µ Aaµ − f a ( x ) ) e µ µ . [ c] 2 ∫ δΛ b F =0 a a µ a µ Integrando em Df obtemos 47 δFa Aµc 2 α exp i ∫ d 4 x LYM Aµa + J aµ Aµa − ( ∂ µ Aaµ ) . Z J = ∫ DA det b 2 δΛ F = 0 a a µ a µ A próxima etapa consiste em calcular o determinante (Jacobiano) de Faddeev-Popov: δFa U Aµc ( x ) ≡ det M; sendo F a ΛA b = 0 ; ∆ A = det b µ δΛ y ( ) Λ= 0 −1 µ a ∆ −1 Aaµ = det M ; Fa = 0 . Os elementos de matriz Mab ( x, y ) são Mab ( x, y ) δFa ΛAµc δΛ b ( y ) = ∫d z 4 Λ= 0 δFa ΛAµc ( x ) δ ΛAνd ( z ) δ ΛAνd ( z ) δΛ b ( y ) . Λ= 0 Para uma transformação de calibre infinitesimal, temos Aµd ( x ) = Aµd ( x ) + ∂µ Λ d ( x ) + g0 f def Λ e ( x ) Aµf ( x ) e F a ΛAνb = ∂ ν ΛAaν ( x ) − f a ( x ) . Λ Portanto, as derivadas funcionais acima são dadas por: δ ΛAνd ( z ) δ = b Aνd ( z ) + ∂ ν Λ d ( z ) + g0 f def Λ e ( z ) Aνf ( z )} = { b δΛ ( y ) δΛ ( y ) = ∂ ν δ ( z − y ) δbd + g0 f def δeb Aνf ( z ) δ ( z − y ) = {δbd ∂ ν + g0 f def δeb Aνf ( z )} δ ( z − y ) . δFa ΛAµb ( x ) Λ δ A d ν (z) = δ {∂ µ ΛAaµ ( x ) − f a ( x )} = ∂µδ ( z − x ) δad δνµ . δ Aνd ( z ) Λ Substituindo na expressão original, obtemos Mab ( x, y ) = ∫ d 4 z {∂ ν δ ( z − x ) δ ad }{∂ ν δ ( z − y ) δbd + g0 f def A fν ( z ) δ ( z − y ) δeb } = = ∫ ∂ ν {∂ ν δad δbd + i g0 f def δeb δad A fν ( z )} δ ( z − x ) δ ( z − y ) = ( ) = ∫ d 4 z ∂ ν ∂ ν δab + g0 f abc Acν ( z ) δ ( z − x ) δ ( z − y ) ≡ ∫ d 4 z∂ ν Dabν δ ( z − x ) δ ( z − y ) = = ( ∂ ν D ν ) δ( 4) ( x − y ) , ab ( ) onde Dabµ é a derivada covariante D µ ab = ∂ µ δab + g0 f abc Acµ . 48 O determinante de Faddeev-Popov será então det ( Mab ( x, z ) ) = det ( ∂µ Dµ ) δ ( x − y ) , e é dependente de Aµa . ab O funcional gerador no calibre de Lorentz generalizado será { } Z J µa = ∫ DAµa det [ Mab ] exp iS Aµa , J µa + iα ∫ d 4 x ( ∂ µ Aaµ ) . 2 Observe-se que, no caso não-Abeliano, o Jacobiano não é independente de Aµa (como ocorre no caso Abeliano), e não pode ser absorvido na normalização da integral funcional. Isto constitui um grande problema para o cálculo do funcional gerador, mesmo que perturbativamente, pois teremos contribuições não-locais. Campos de Faddeev-Popov (Faddeev-Popov Ghosts) A solução para este problema foi proposta separadamente por Bryce DeWitt e Richard Feynman, e consiste em converter o determinante det [ M] em uma exponencial, introduzindo os campos fantasmas de Faddeev-Popov. Estes campos, entretanto, não correspondem a partículas físicas. É conhecido o resultado de que uma integração funcional gaussiana sobre campos fermiônicos é identificada ao determinante do operador que está “ensanduichado” entre os campos fermiônicos, isto é, { } det [ M] = ∫ DηνDη exp − ∫ d 4 x d 4 x ' η* ( x ) M ( x − x ' ) η ( x ' ) . Desta forma, podemos escrever o Jacobiano ∆ −1 = det Mab da seguinte maneira: det Mab = ∫ ∏ Dη*a ∏ Dη a a = ∫ ∏ Dη*a a { a ∏ Dη a a = ∫ ∏ Dη*a a { } exp − ∫ d 4 x d 4 x ' η*a ( x ) ( ∂ µ Dabµ δ ( x − x ') ) ηb ( x ') = ∏ Dη a { ∏ Dη a a } exp − ∫ d 4 x η*a ( x ) ∂ µ Dabµ ηb ( x ) = a = ∫ ∏ Dη*a a } exp − ∫ d 4 x d 4 x ' η∗a ( x ) Mab ( x − x ') ηb ( x ') = { } exp i ∫ d 4 xLFP ( x ) , onde LF − P = ∂ µ η*a ( ∂ µ ηa + g0 f abc ηb Acµ ) = ∂ µ η*a ∂ µ ηa + g0 η*a f abc ∂ µ ( Acµ ηb ) . Podemos então escrever o funcional gerador para a teoria de Yang-Mills pura na forma 2 α Z J µa = ∫ DAµa ∫ Dη∗aDηa exp i ∫ d 4 x LYM + LFP − ( ∂ µ Aaµ ) + J µa Aaµ . 2 49 Note-se que a Lagrangiana de Faddeev-Popov assemelha-se à de uma teoria de férmions acoplados a um campo externo Aµc . Entretanto, o termo cinético η*a ηa corresponde ao termo cinético de um campo bosônico complexo. Estes campos fictícios η*a e ηa são denominados de “Faddeev-Popov ghosts”. O termo “ghost” é usado na Teoria Quântica dos Campos de duas maneiras completamente diferentes. Uma delas é esta, que corresponde a usar campos fictícios para representar um Jacobiano. A outra é para descrever estados cuja norma possui sinal trocado, e conseqüentemente destrói a unitariedade da teoria, impossibilitando, portanto, a interpretação probabilística. (N Vimos então que, para converter o Jacobiano numa exponencial, introduzimos 2 − 1) campos escalares anticomutáveis ηa , η*a , o que resultou, do ponto de vista da integração funcional, na fixação de uma determinada medida DY − M = DAµaDηνaDηa , ou mais rigorosamente, de uma classe de medidas [DY − M ] . Analisando em detalhe, na verdade, a integral ∫ D Aµa pode ser fatorada, uma vez que representa um volume finito em SU ( 2 ) , obtido pela integração, sobre este grupo unimodular, da medida invariante de Haar D Aµa , multiplicado pelo volume infinito da variedade de Minkowski. Como estes campos ηa e η*a violam a conexão entre spin e estatística (Teorema de spin-estatística, v. “PCT, Spin and Statistics, and All That”, A. S. Wightman & R. Streater, 2000, Princeton U.P.), por possuírem métrica indefinida, são ghosts, e devem contribuir apenas nos loops, e não devem existir fora da região de interação, pois não correspondem a partículas físicas. Em resumo, são artefatos matemáticos introduzidos para eliminar as ambigüidades do cálculo, e não possuem correspondência no sistema físico. Da expressão para o Jacobiano deduzimos que a parte livre dos campos fantasmas “coloridos” comporta-se como campos escalares carregados, de massa nula, com um propagador da forma convencional 0 T ( η*a ( x ) ηb ( y ) ) 0 = ∫ d 4 p ie− ip⋅( x − y ) δab . p 2 + iε A título de comentário, cabe notar que o método de Faddeev-Popov é consistentemente utilizado também no contexto da Teoria de Cordas Bosônicas, onde se podem tomar como pontos de partida a integral de trajetória da ação de Polyakov (que apresenta redundâncias de calibre da mesma origem geométrica que a ação de Yang-Mills) e a Teoria Conforme de Campos (CFT). 50 Def. II.4.18. – A medida de Fujikawa para as teorias fermiônicas invariantes de calibre é definida de acordo com o procedimento a seguir (Kazuo Fujikawa, Phys. Rev. Lett.. 42, 18, p.1195-1198, 1979) Partindo da lagrangiana invariante de calibre 1 L = ψ ( iD − m )ψ + g 2 Tr Fµν F µν , 2 onde Fµν ≡ ∂ µ Aν − ∂ν Aµ + Aµ , Aν , e procedendo à sua continuação no espaço euclidiano, o operador D ≡ iγ 0 D4 + γ k Dk ≡ γ 4 D4 + γ k Dk passa a ser hermítico. Aplicando a transformação sob o operador quiral γ 5 ( ≡ iγ 0γ 1γ 2γ 3 = γ 4γ 1γ 2γ 3 ) com um parâmetro infinitesimal α ( x ) , a lagrangiana se modifica da forma L → L − ∂ µα ( x )ψγ µ γ 5ψ − 2miα ( x )ψγ 5ψ . Expandindo os campos fermiônicos em termos de um conjunto completo de autofunções ϕ n do operador D no espaço euclidiano, podemos escrever: ψ ( x ) = ∑ n anϕn ( x ) , ψ ( x ) = ∑ n ϕn ( x ) bn , † Onde an e bn são elementos de uma álgebra de Grassmann. A medida da integral funcional é dada então por : d µ ≡ ∏ x DAµ ( x ) Dψ ( x ) Dψ ( x ) = ∏ x DAµ ( x ) ∏ n.m dbm dan . Calculando o Jacobiano, obtém-se a lei de transformação da medida funcional fermiônica, igualmente válida para a teoria de calibre abeliana, sob a transformação γ 5 : d µ → d µ exp i ∫ α ( x ) (1 8π 2 ) Tr ∗ F µν Fµν dx , onde * F µν ≡ 1 µναβ ∈ Fαβ 2 e ∈1234 =∈0123 = 1 Este fator de fase extra induzido pela transformação quiral corresponde exatamente à anomalia ABJ (S. Adler, J. Bell & R. Jackiw, 1969), de onde se recuperam as identidades “anômalas” (“axial” e “quiral”) de Ward-Takahashi, e se conclui que a medida da integral de trajetória das teorias de férmions não é invariante sob a transformação γ 5 . Para exemplificar essa propriedade dentro do contexto de uma teoria física bem conhecida, partiremos da lagrangiana clássica da QCD, a qual tem como graus de liberdade fundamentais os campos de quarks qα ( α = 1, 2,3 ) e de glúons Aµa ( 51 a = 1, 2, ,8 ), com qα e Aµa pertencendo, portanto, respectivamente, ao tripleto e ao octeto do grupo de simetria de cor SU c ( 3) . A densidade lagrangiana, para um quark com massa m , será dada por 1 Lcl = q α ( iD / αβ − mδαβ ) q β − Fµνa Faµν , 4 / = γ µ Dµ , sendo Dµ uma derivada covariante atuando sobre o tripleto de cor do onde D campo de quark: Dµ ≡ ∂ µ + igt a Aµa . Nesta notação, g é a constante de acoplamento adimensional na QCD, e t a corresponde à representação fundamental da álgebra de Lie em SU c ( 3) , dada pelas matrizes hermitianas 3 × 3 com traço nulo que satisfazem às seguintes relações de comutação: t a , t b = if abc t c 1 tr ( t a t b ) = δ ab , 2 onde f abc são as constantes de estrutura da álgebra SU ( 3) : f123 = 1 , f147 = − f156 = f 246 = f 257 = f 345 = − f367 = 1 2 , f 458 = f 678 = 3 2 . Podemos definir também a derivada covariante que atua sobre o octeto de cor do campo de glúon como sendo dada por Dµ ≡ ∂ µ + igT a Aµa , sendo T a as representações adjuntas da álgebra de Lie SU ( 3) , que correspondem às ( ) matrizes hermitianas 8 × 8 com traço nulo que obedecem à relação T a bc = −if abc . O tensor de intensidade de campo de glúon Fµνa é definido como Fµνa = ∂ µ Aνa − ∂ν Aµa − gf abc Aµb Aνc Esta definição pode ser apresentada numa forma mais elegante se fizermos as substituições Aµ ≡ t a Aµa e Fµν ≡ t a Fµνa : 52 Fµν = ∂ µ Aν − ∂ν Aµ + ig Aµ , Aν = −i Dµ , Dν . g Agora, por analogia com a teoria eletromagnética padrão, podemos definir campos “elétricos” e “magnéticos” de cor a partir do tensor de intensidade de campo Fµν , que serão, respectivamente, Ei = F i0 1 B i = − ∈ijk F jk , 2 sendo ∈ijk uma densidade tensorial completamente antissimétrica de Lévi-Civita com ∈123 = 1 . Extraindo as equações de movimento de Euler-Lagrange da densidade lagrangiana clássica, obtemos então ( iD/ − m ) q = 0 e Dν , F νµ = gj µ , ou Dνab Fbνµ = gjaµ , onde j µ = t a jaµ e jaµ = q γ µ t a q . Estas são, simples e respectivamente, a equação de Dirac para os campos fermiônicos de quarks, e a equação de Yang-Mills para os campos de calibre de glúons. Sabemos que a solução da equação de Dirac para o elétron livre é dada por ϕ ψ = exp {−ip ⋅ x} , χ onde ϕ e χ são espinores com duas componentes e p ≡ p µ = ( p 0 , p ) . Nesta notação, a equação de Dirac para o elétron livre se torna um sistema de equações para ϕ e χ acopladas entre si: ϕ m I σˆ ⋅ p ϕ ϕ p0 = 0 = m , χ σˆ ⋅ p m0 I χ χ onde m0 I é o produto da massa de repouso do elétron pela matriz identidade 2 × 2 e σ̂ é o vetor formado com as matrizes de Pauli. O fator σˆ ⋅ p define a helicidade do elétron, negativa quando o spin e o momento linear são “opostos”, positiva em caso contrário. Podemos definir por analogia a quiralidade de um quark, decompondo o operador de campo relativamente às duas soluções de autoestados ±1 (quiralidade à direita ou à esquerda) do operador de quiralidade γ 5 , correspondentes a: 53 qR = (1 + γ 5 ) q qL = (1 − γ 5 ) q . e Considerando a QCD ( N f = 6 ) com seis sabores, por exemplo, podemos escrever um quark q como um vetor t q = ( u, d , s, c, b, t ) , cuja massa m será descrita agora por uma matriz 6 × 6 . Podemos observar, fazendo uma analogia a partir da equação do elétron livre, que, para um quark livre com massa nula, a quiralidade se reduz à helicidade. A lagrangiana clássica do quark se decompõe então de acordo com a expressão Lcl = Lcl ( qL , A) + Lcl ( qR , A) − ( qL mqR + qR mqL ) . O gerador funcional das funções de Green da QCD é dado por W [J ] = e iZ [ J ] { } = ∫ [ dAdqdq ][ dcdc ] exp i ∫ d 4 x ( L + J Φ ) , onde c = c a t a e c = c a t a representam os campos fantasma e anti-fantasma de FadeevPopov, e L é a lagrangiana quântica, invariável em relação à transformação BRST: 1 1 µ a 2 L = q α ( iD / αβ − mδαβ ) q β − Fµνa Faµν − ca ∂ µ Dµab cb − ( ∂ Aµ ) . 4 2ξ Pode ser verificado de imediato que tanto L quanto Lcl são invariantes, para m = 0 , em relação à transformação global U L ( N f ) × U R ( N f qL → exp {−iλ jθ Lj qL } , ) definida por qR → exp {−iλ jθ Rj qR } , onde θ Lj, R ( j = 0,1,… , N 2f − 1) são parâmetros independentes em relação ao espaço- tempo, e λ 0 = 2 N f , λ j = 2t j ( j = 1,… , N 2f − 1) . Esta é a chamada simetria quiral. É conveniente agora definirmos as transformações vetorial e axial dadas por q → exp {−iλ jθVj } q e q → exp {−iλ jθ Aj ⋅ γ 5 } q , onde θV = θ L = θ R , e θ A = −θ L = θ R . Estão embutidas aí duas transformações U (1) : a que chamaremos de U B (1) está relacionada ao número bariônico (θVj ∝ δ j 0 , θ Aj = 0 ) ; e a outra, U A (1) , corresponde à rotação axial do singleto de sabor (θVj = 0, θ Aj ∝ δ j0 ). 54 Usando agora o teorema de Nöther, que correlaciona simetrias a leis de conservação, as relações obtidas para a corrente vetorial J µj = q γ µ λ j q e axial J µj 5 = q γ µ γ 5λ j q serão ∂ µ J µj = iq m, λ j q , ∂ µ J µj 5 = iq {m, λ j } γ 5 q , ( j = 0,… , N 2 f ( j = 1,… , N − 1) , 2 f − 1) g2 ∂ µ J µ0 5 = 2 N f 2iqmγ 5 q − 2 N f Faµν Fµνa 2 32π , onde Fµνa = ∈µνλρ Faµν 2 , com ∈0123 = 1 , é o tensor dual de intensidade de campo. Como se pode observar, a conservação da corrente axial J µ0 5 do singleto de sabor é violada não somente pela matriz de massa do quark, mas também pelo efeito quântico chamado de anomalia axial. Do ponto de vista da integração funcional, este efeito é originado pela não-invariância da medida fermiônica [ dqdq ] com respeito à transformação axial U A (1) , demonstrada por Fujikawa (op. cit.). 55 III. Uma Teoria Geral da Integral de Feynman O título “Por uma Teoria Geral da Integral de Feynman” seria mais fiel à realidade, uma vez que existe mais de uma proposta para uma formulação rigorosa da teoria, como veremos a seguir. De início, será exposta em III.1 a proposta original do próprio Feynman, conforme utilizada repetidamente ao longo dos anos em que ensinou MQ no California Technology Institute – Caltech. Será seguido de perto o texto do Cap. 2 do livro Quantum Mechanics and Path Integrals, R. P. Feynman & A. R. Hibbs, 1965 – mesmo porque, não tendo sido nunca reeditado, este livro é hoje uma raridade, quase um objeto de colecionador. III.1. A Lei de Movimento da MQ III.1.1. A Ação Clássica Uma das formas mais elegantes de expressar a condição que determina a particular trajetória x ( t ) dentre todas as possíveis trajetórias é o princípio de ação mínima. Significa que há uma certa quantidade S que pode ser calculada para cada trajetória, e que a trajetória clássica é aquela para a qual S tem o valor mínimo. A condição real, na verdade, é que S assuma um valor extremo, o qual não se altera, até a primeira ordem, mesmo quando x ( t ) é ligeiramente modificada. A quantidade S é dada pela expressão S = ∫ L ( x , x, t ) dt , onde L é a tb ta lagrangiana do sistema. Para uma partícula de massa m que se move num potencial V ( x, t ) que é uma função da posição e do tempo, a lagrangiana será dada por m 2 x − V ( x, t ) . A forma da trajetória extrema x ( t ) é determinada pelos 2 procedimentos usais do cálculo de variações. Assim, vamos supor que a trajetória x ( t ) L= sofra um desvio de δ x ( t ) ; a condição de que o ponto inicial e o ponto final sejam fixos se traduz como δ x ( ta ) = δ x ( tb ) = 0 . A condição de que x seja um extremo de S corresponde à expressão δ S = S [ x + δ x ] − S [ x ] = 0 , até a primeira ordem em δ x . Usando a definição anterior de S podemos escrever que tb tb ∂L ∂L S [ x + δ x ] = ∫ L ( x + δ x, x + δ x, t ) dt = ∫ L ( x , x, t ) + δ x + δ x dt ta ta ∂x ∂x tb ∂L ∂L = S [ x ] + ∫ δ x + δ x dt . ta ∂x ∂x Integrando por partes, a variação de S resulta em que tb ∂L b d ∂L ∂L − ∫ δ x − dt . t a ∂x ta dt ∂x ∂x t δS =δx Uma vez que δ x = 0 nas extremidades fixas da trajetória, o primeiro termo da expressão à direita é nulo. Entre as extremidades, δ x pode assumir um valor arbitrário. Logo, o extremo corresponde à curva ao longo da qual a seguinte condição é satisfeita: 56 d ∂L ∂L = 0. − dt ∂x ∂x Esta é a equação de Euler-Lagrange clássica para o movimento, equivalente à segunda lei de Newton. Na Mecânica Clássica (MC), a forma da integral da ação S = ∫ Ldt é o que interessa, e não o valor extremo SCl . Este interesse se origina da necessidade de se conhecer a ação ao longo de um conjunto de trajetórias vizinhas, e a partir daí determinar a trajetória de ação mínima. Na MQ, tanto a forma da integral quanto o valor do seu extremo são importantes. Com exemplo, vamos calcular o valor de SCl para uma partícula livre em que L = mx 2 2 . Da equação de movimento sai imediatamente que mx = 0 . Integrando a ação por partes teremos 2 tb m tb dx m tb m t SCl = ∫ L dt = ∫ dt = ∫ x dx = xx tb − ∫ xx dt . ta 2 ta dt 2 ta 2 a ta O integrando à direita é nulo, e, como x ( ta ) = x ( tb ) = constante = ( xb − xa ) ( tb − ta ) , tb resulta que SCl = m ( xb − xa ) 2 ( tb − ta ) . 2 III.1.2. A Amplitude de Probabilidade na MQ Podemos chegar agora à regra da MQ que diz o quanto cada trajetória contribui para a amplitude total de probabilidade para ir do ponto a ao ponto b . Neste caso, não é apenas a trajetória particular do valor extremo da ação que contribui, mas é a totalidade das trajetórias possíveis entre os dois pontos que vai contribuir, em proporções iguais, porém com diferentes fases, para a amplitude total. A fase da contribuição de uma determinada trajetória é a ação S própria a essa trajetória, em unidades do quantum de ação . Resumindo: a probabilidade P ( b, a ) para uma partícula ir de um ponto xa com tempo t a para um ponto xb com tempo tb é o quadrado absoluto P ( b, a ) = K ( b, a ) de 2 uma amplitude K ( b, a ) correspondente ao trajeto de a para b . E esta amplitude é dada pela soma das contribuições φ x ( t ) de cada trajetória: K ( b, a ) = ∑ φ x ( t ) . A trajetórias entre a e b contribuição de uma trajetória possui uma fase proporcional à ação S : φ x ( t ) = A ⋅ exp {iS x ( t ) } . Esta ação é a do sistema clássico correspondente. A constante A será escolhida de forma a normalizar K ( b, a ) convenientemente, e será retomada mais à frente, quando discutirmos de modo mais matematicamente preciso o significado da equação K ( b, a ) = ∑ φ x ( t ) . trajetórias entre a e b III.1.3. O limite clássico Antes de proceder a uma formulação matemática mais completa, vamos comparar essa regra quântica com a regra clássica. À primeira vista, a equação 57 φ x ( t ) = A ⋅ exp {iS x ( t ) } diz que todas as trajetórias contribuem igualmente, embora suas fases variem, mas não fica claro de que maneira, no limite clássico, uma determinada trajetória é selecionada como a mais importante. A aproximação clássica, contudo, corresponde ao caso em que as dimensões, massas, tempos, etc., são tão grandes que S se torna imensa em comparação com ( = 1.05 × 10−27 erg-s), e a fase S da contribuição é algum ângulo muito grande. A parte real (imaginária) de φ é o cosseno (seno) desse ângulo, e tem chances iguais de ser positiva ou negativa. Se movermos agora a trajetória por uma pequena distância δ x , pequena na escala clássica, a alteração em S também será pequena nessa escala, mas não quando medida na ínfima unidade . Essas pequenas mudanças na trajetória acarretarão, em geral, enormes mudanças na fase, e o cosseno ou o seno oscilarão, de forma tremendamente rápida, entre valores positivos e negativos. Assim, a contribuição total somada será contabilizada como nula, pois quando uma trajetória contribui positivamente, uma outra, infinitesimalmente próxima (do ponto de vista clássico) contribuirá negativamente, anulando-a. Desta forma, nenhuma trajetória será considerada quando sua vizinha tem uma ação diferente que cancele a sua contribuição. Para a trajetória especial x , porém, para a qual S se encontra num extremo, uma pequena variação não produz, ao menos em primeira ordem, variação alguma em S . Todas as contribuições das trajetórias nesta região estão aproximadamente em fase – na fase SCl -, e não se cancelarão. Portanto, podemos ter contribuições importantes somente para trajetórias nas vizinhanças de x , e no limite clássico precisaremos considerar importante apenas esta trajetória em particular. É desta maneira que as leis clássicas de movimento surgem a partir das leis quânticas correspondentes. III.1.4. A soma sobre trajetórias III.1.4.1. A analogia com a integral de Riemann Embora esteja clara, qualitativamente, a noção da soma das contribuições de cada uma das trajetórias, é necessário que seja feita uma definição mais rigorosa, matematicamente, desta soma. A quantidade de trajetórias é, em alta ordem, infinita, e não é evidente qual medida de integração deva ser associada ao espaço dessas trajetórias. Para iniciar, consideremos a integral de Riemann usual. Podemos dizer, grosso modo, que a área A sob uma curva é igual à soma de todas as suas ordenadas. Melhor ainda, podemos dizer que é proporcional a essa soma. Para tornar a idéia precisa, façamos o seguinte: tomemos um subconjunto de todas as ordenadas (aquele em que o espaçamento entre elas é constante e igual a ∆ ). Somando-as, obtemos que A ∼ ∑ f ( xi ) , i onde a soma é calculada sobre o conjunto finito de pontos { x0 , x1 ,… xi , xi +1 ,…} , onde ( xi − xi −1 ) = ∆ Para obtermos o valor exato da área basta agora tomar o limite 58 A = lim ∆ ∑ f ( xi ) . ∆→∞ i III.1.4.2. Construindo a soma Podemos seguir um procedimento análogo para definir a soma sobre todas as trajetórias. Em primeiro lugar, escolhemos um subconjunto de trajetórias, dividindo o tempo, uma variável independente, em intervalos constantes de largura ε . O que nos dá um conjunto de valores ti , espaçados entre os valores t a e tb nas extremidades, separados por ε . A cada tempo ti selecionamos especialmente um ponto xi , e em seguida construímos uma trajetória, interligando todos esses pontos selecionados através de segmentos de linhas retas. É possível então definir uma soma sobre todas as trajetórias assim construídas, tomando uma integral múltipla sobre todos os valores xi , com i variando entre 1 e N − 1 , de tal forma que N ⋅ ε = tb − ta , ε = ti +1 − ti , t0 = ta , t N = tb , x0 = xa , xN = xb . A equação resultante é K ( b, a ) ∼ ∫∫ ∫ φ x ( t ) dx1dx2 … dxN −1 . A integral não abrange x0 nem xN , por serem as extremidades fixas xa e xb . Formalmente, esta equação corresponde a A ∼ ∑ f ( xi ) . No caso presente, tornando ε i cada vez menor, podemos obter uma amostra mais representativa do conjunto completo de todas as trajetórias possíveis entre a e b . Entretanto, não podemos passar diretamente ao limite deste processo, porque esse limite não existe sem que seja definido um fator de normalização que dependa de ε . Infelizmente, definir esse fator é um problema muito difícil, e não sabemos como resolver isso em termos gerais. Mas sabemos apresentar a definição que, para qualquer situação, parece ser, até o momento, aquela que tem valor prático. Tomemos, m por exemplo, o caso já visto em que a lagrangiana é dada por L = x 2 − V ( x, t ) . Como 2 já foi mostrado na seção I.2, o fator de normalização para este caso será A− N , onde A = ( 2π iε m ) . Com este fator o limite existe e podemos escrever que 12 K ( b, a ) = lim ε →0 tb dx 1 dx dx ∫ exp ( iS [b, a ]) 1 2 … N −1 , onde S [ b, a ] = ∫ L ( x , x, t ) dt ∫∫ ta A A A A é uma integral de linha executada sobre a trajetória poligonal composta pelos segmentos de reta que conectam todos os pontos xi . 59 III.1.4.3. A integral de trajetória Há muitas maneiras de se definir um subconjunto de todas as trajetórias entre a e b . A definição particular que usamos aqui poderá não ser a que sirva melhor a certos propósitos matemáticos. Por exemplo, vamos supor que a lagrangiana dependa da aceleração de x . Da forma pela qual construímos a trajetória, a velocidade é descontínua nos vários pontos ( xi , ti ) , uma vez que a aceleração é infinita nesses pontos. Esta será uma situação em que, possivelmente, teremos problemas. Entretanto, x = ( xi +1 − 2 xi + xi −1 ) ε 2 será nos exemplos que estamos apresentando, a substituição suficiente. Podem existir outros casos em que esta substituição não seja adequada, ou mesmo possível, e nos quais a definição de soma sobre todas as trajetórias apresentada aqui será inadequada. Esta situação ocorre na integração usual, em que a definição de Riemann não se aplica, e precisamos recorrer a alguma outra definição, como, por exemplo, a de Lebesgue. Mas esta necessidade de redefinir o método de integração não destrói o conceito de integração, e sentimos que a possível inadequação da particular definição da soma sobre todas as trajetórias possa eventualmente requerer a formulação de novas definições de integração. Por outro lado, o conceito de soma sobre todas as trajetórias, assim como o conceito de uma integral usual, é independente de uma definição especial, e permanece válido, a despeito do fracasso dessas definições sob certas condições não usuais. Portanto, podemos escrever a soma sobre todas as trajetórias usando uma notação menos restritiva, como, por exemplo, K ( b, a ) = ∫ exp {( i ) S [b, a ]} D x ( t ) , b a que será chamada de kernel da integral de trajetória, identificada pela notação D que representa a medida de integração adequada, ou mais precisamente, o nosso desconhecimento sobre a natureza precisa desta medida. III.1.4.4. A regra para dois eventos sucessivos Vamos supor que tc seja um determinado tempo entre t a e tb . Neste caso a ação ao longo de qualquer trajetória entre a e b pode ser escrita como a soma S [b, a ] = S [b, c] + S [ c, a ] . Isto resulta da definição de ação como uma integral sobre o tempo e do fato de L só depender da derivada de primeira ordem de x . Podemos então escrever o kernel como K ( b, a ) = ∫ exp {( i ) S [b, c ] + ( i ) S [ c, a ]} Dx ( t ) . Sempre é possível dividir uma trajetória em duas partes, a primeira com as extremidades xa e xc ≡ x ( tc ) , e a segunda com extremidades xc e xb . Também é possível integrar sobre todas as trajetórias de a para c , depois sobre todas as trajetórias de c para b , e 60 finalmente integrar o resultado sobre todos os valores possíveis de xc . Na primeira etapa da integração, S [b, c ] é constante, e o resultado parcial será dado por K ( b, a ) = ∫ xc ∫ b c exp {( i ) S [b, c ]} K ( c, a ) D x ( t ) dxc , onde agora as integrações devem ser efetuadas não somente entre as trajetórias entre c e b , mas também sobre a variável intermediária xc . Na etapa seguinte, será efetuada a integração sobre todas as trajetórias entre um ponto arbitrário xc e o ponto b , e tudo o que resta é uma integral sobre todos os valores possíveis de xc : K ( b, a ) = ∫ K ( b, c ) K ( c, a ) dxc . xc Este resultado pode ser resumido assim: cada uma das trajetórias alternativas de a para b pode ser associada ao passar num tempo tc por uma posição específica xc . E o kernel para uma partícula que vai de a para b pode ser calculado pelas seguintes regras: 1. O kernel para ir de a para b é a soma, sobre todos os possíveis valores de xc , das amplitudes probabilísticas correspondentes aos percursos intermediários de a para c e de c para b ; 2. A amplitude para a partícula ir de a para c e em seguida para b é o kernel para ir de a para c , multiplicado pelo kernel de ir de c para b . Isto é, as amplitudes para eventos que ocorrem sucessivamente no tempo se multiplicam. III.2. A fórmula de Trotter O fundamento matemático que justifica os resultados da seção anterior – a qual corresponde a uma adaptação livre, mas fiel, do texto de Feynman e Hibbs – é a fórmula do produto de Trotter. Esta fórmula é resultado de um teorema, que necessita do conceito de um semigrupo como um conjunto fechado sob uma operação binária associativa - contendo ou não a identidade correspondente a essa operação (quando um semigrupo admite e contém os inversos dos seus elementos, passa a ser um grupo) -, e das seguintes definições preparatórias: Def. AIII.2.1. Um semigrupo de contração no espaço de Banach X é uma família de operadores lineares { P t : X → X | 0 ≤ t < ∞} , definidos e limitados por toda parte (t.p.), tais que P0 = 1 ; Pt P s = Pt + s Pt ≤ 1 0 ≤ t, s ≤ ∞ 0≤t <∞ 61 lim Ptψ = ψ t →0 ψ ∈X . A norma utilizada acima é definida da seguinte forma: Q = inf β β ∈B onde B = {β | Qx ≤ β x , ∀x ∈ X } , e x é a norma em X . O termo “contração” vem do fato de que P t ≤ 1 , na medida em que os vetores ou se contraem, ou não se alteram, quando sofrem a ação de P t . Def. AIII.2.2. Define-se um gerador infinitesimal A de P t através da expressão 1 t ( P ψ −ψ ) t →0 t Aψ = lim sobre o domínio D ( A ) de todo vetor ψ ∈ X para o qual o limite existe. Teorema AIII.2.3. (Fórmula do Produto de Trotter) – Sejam A e B operadores lineares sobre um espaço de Banach X , tais que A , B e A + B sejam, respectivamente, os geradores infinitesimais dos semigrupos de contração P t , Q t e R t . Então, para todo vetor ψ ∈ X Rtψ = lim ( Pt nQt n ) ψ . n n →∞ A demonstração rigorosa desta fórmula não será apresentada, e em lugar disto será feita uma demonstração heurística no âmbito da MQ, suficiente para os presentes objetivos, como se segue. A função de onda de uma partícula, não-relativística e com spin nulo, evolui em uma dimensão segundo a equação de Schrödinger Hψ = i ∂ψ ∂t ; H = T +V = 1 2 −2 ∂ 2 p +V = +V . 2m 2m ∂x 2 Analisaremos o propagador, ou função de Green, G , que satisfaz à equação de operadores ∂ H − i G ( t , t0 ) = −i ( I ) δ ( t − t0 ) . ∂t No espaço de coordenadas, esta equação se escreve como ∂ H x − i G ( x , t ; y , t 0 ) = − i δ ( x − y ) δ ( t − t 0 ) . ∂t Os propagadores G em ambas as notações se relacionam por 62 G ( x, t; y, t0 ) = x G ( t , t0 ) y . Conhecer a expressão de G significa obter uma solução para a equação de Schrödinger dependente do tempo, no sentido de que, se ψ ( t0 ) é o estado do sistema em t0 , o estado em t será dado por ψ ( t ) = G ( t , t0 )ψ ( t0 ) . No caso em que H independe do tempo, a solução de operador para o propagador pode ser imediatamente escrita como iH ( t − t0 ) G ( t , t0 ) = θ ( t − t0 ) exp − , onde θ é a função degrau, ou função de Heaviside. Uma vez que é assumido que H independe do tempo, podemos, sem perda de generalidade, fazer uma translação temporal e fixar t0 = 0 . Assim, para t > 0 , teremos G ( x, t; y ) = x exp [ −iHt ] y . A integral de trajetória surge do fato de que e A = ( e A N ) . Fazendo λ = it : N G ( x, t ; y ) = x e − λ (T +V ) N − λ (T +V ) N e e − λ (T +V ) N y , onde o produto entre o bra e o ket é repetido N vezes. Usando a fórmula de BakerCampbell-Hausdorff para produtos de exponenciais de operadores e Ae B = e A+ B + ( ) 1 1 [ A, B ]+ A,[ A, B ] + B ,[ B , A] +… 2 12 , onde os colchetes representam comutadores, extraímos que exp {−λ (T + V ) N } = exp {−λT N } exp {−λV N } + O ( λ 2 N 2 ) . Só precisamos agora substituir os termos da forma abaixo e − λ (T +V ) N = e− λT N e − λV N N + O (1 N 2 ) → e − λT N e− λV N . N N Para números reais, mas não para operadores, esta substituição é imediata, e depende apenas de uma propriedade fundamental da exponencial: a expressão (1 + ( x + yn ) n ) n converge para e x , independente de yn , desde que yn → 0 quando n → ∞ . No caso de operadores se devem tomar cuidados adicionais, como por exemplo, calculando a diferença entre os termos acima da seguinte maneira: 63 (e − λT N e − λV N +e − λT N e− λV N + ( e − λT N e− λV ) − (e N − λ (T +V ) N e− λT N e − λV N ) N −1 N ) = (e N −e e− λT N e− λV − λT N − λ (T +V ) N −e N e − λV N −e − λ ( T +V ) N e − λ (T +V )( N − 2) − λ (T +V ) N N )(e − λ (T +V ) N ) N −1 + . Esta última expressão é uma identidade, em que todos os N termos possuem um fator igual a e− λT N e− λV N −e − λ (T +V ) N , o qual, segundo já foi visto, é da ordem de 1 N 2 , e, logo, no limite N → ∞ , a diferença será nula. Justificamos assim a expressão para o propagador de Green G ( x, t; y ) = lim x ( e− λT N e− λV ) N N →∞ N y . Para obtermos a integral de trajetória, introduzimos agora, entre cada termo no produto de exponenciais, o operador identidade, representado no espaço de coordenadas por I x = ∫ dx j x j xj , j = 1, 2,… , N − 1 , para obter N −1 G ( xN , t; x0 ) = lim ∫ dx1 dxN −1 ∏ x j +1 e− λT N e − λV N →∞ N j =0 xj . O operador de multiplicação V é diagonal no espaço de coordenadas, logo ( ) exp ( −λV N ) x j = x j exp −λV ( x j ) N . No caso do operador de energia cinética T precisamos da relação de completeza dos estados de momento linear, representada no espaço de coordenadas como onde p ξ = ( 2π ) I p = ∫ dp p p , −1 2 exp ( −ipξ ) . Teremos então que, para dois estados quaisquer ξ e η , η e− λT N ξ = ∫ dp η e − λT N p p ξ = ∞ 1 dp e 2π ∫ − λ p 2 2 mN i p (η −ξ ) e . −∞ Esta é uma integral gaussiana, cuja solução geral é conhecida e dada por ∞ ∫e − ay 2 + by dy = π a ⋅ eb 2 4a . −∞ 64 Resulta então que η e− λT N ξ = mN 2πλ 2 e− mN (η −ξ ) 2 2 λ 2 , e a expressão do propagador terá a forma m ( x − x )2 N λV ( x ) j +1 j j mN N −1 . G ( xN , t ; x0 ) = lim ∫ dx1 dxN −1 exp − − ∏ 2 2 N →∞ N 2λ 2πλ j =0 Fazendo as substituições ε = t N = λ iN , e combinando as exponenciais, obtém-se finalmente a integral de trajetória correspondente ao propagador: N iε m 2 G ( xN , t; x0 ) = lim ∫ dx1 dxN −1 exp N →∞ 2π iε m x j +1 − x j 2 − V x ( ) ∑ j . ε j =0 2 N −1 Para justificar porque essa expressão é uma “integral de trajetória”, ou uma “soma sobre histórias”, imaginemos que os pontos x0 , x1 ,… , xN sejam conectados por segmentos retilíneos. A linha resultante será uma poligonal entre x0 e xN , e a soma dentro da exponencial pode ser interpretada, no limite, como uma soma de Riemann de uma certa integral ao longo dessa poligonal: m x j +1 − x j 2 1 dx 2 t ε − V x ∼ d τ m − V x ( ) ( ) . ∑ j ∫0 2 dτ ε j =0 2 N −1 O integrando é justamente a função lagrangiana da mecânica clássica, correspondente ao sistema: 2 1 dx L = m −V ( x) , 2 dτ E o argumento da exponencial é exatamente iS , onde S corresponde à ação clássica do sistema S = ∫ L dt , calculada sobre a linha poligonal que conecta os pontos x0 , x1 ,… , xN . As integrais sobre esses pontos podem ser interpretadas como uma soma sobre todas as possíveis poligonais conectando x0 a xN , e mais, como toda trajetória contínua e suave pode ser aproximada por uma trajetória poligonal, considerando-se o limite N → ∞ , as integrais podem ser interpretadas como uma soma sobre a totalidade das trajetórias, e não apenas sobre as poligonais. Pode ainda ser dado um pequeno arremate, chamando de “constante de normalização” a m 2π iε N 2 =C, que, embora assuma um valor infinito no limite N → ∞ , serve meramente para assegurar que G seja um operador unitário. Teremos então que 65 G ( x, t ; y ) = C ∑ e iS x ( i ) . x( i ) x( 0 ) = y x( t ) = x Esta é uma soma sobre trajetórias, ou sobre histórias, de e iS x ( i ) , que garante a contribuição para a soma de todas as trajetórias que satisfaçam às condições x ( 0 ) = y , x ( t ) = x . O símbolo maiúsculo Σ é usado para evitar a impressão de que temos uma medida confiável - bona fide -, e o estado presente do conhecimento sobre a integração de trajetória só permite que cheguemos até aí. III.3. O Oscilador Harmônico Simples (OHS) e o Oscilador Harmônico Forçado III.3.1. Integrais gaussianas As integrais de trajetória mais simples são aquelas em que as variáveis aparecem no expoente até no máximo a segunda potência. Correspondem, portanto, a funções de Lagrange quadráticas, e as integrais da ação serão as conhecidas e calculáveis gaussianas. Consideremos uma lagrangiana quadrática da forma − c ( t ) x2 2 − e ( t ) x , Lquad = mx 2 2 + b ( t ) xx que tem como casos particulares o OHS, o OHS forçado e o campo de força uniforme. A ação é a integral desta função em relação ao tempo, entre dois pontos fixos ( xa , ta ) e ( xb , tb ) . Queremos determinar a expressão para o kernel b i tb K ( b, a ) = ∫ exp ∫ L ( x, x, t ) D x (t ) . a t a A maneira mais direta, mas a mais trabalhosa e tediosa, é seguir o método de divisão em intervalos de tempos iguais, fazer a passagem ao limite, etc. Mas podemos fazer a mesma coisa, definindo como x ( t ) a trajetória clássica e constante entre os pontos inicial e final, e representando x em termos de x e de uma nova variável y ( t ) , que representará o desvio da trajetória clássica, através de: x = x + y . Como as trajetórias têm os mesmos pontos fixos iniciais e finais, resulta que y ( ta ) = y ( tb ) = 0 , e, como x − y = x é constante, Dx ( t ) = Dy ( t ) . A integral para a ação assume então a forma + y 2 + dt . S x ( t ) = S x ( t ) + y ( t ) = ∫ α ( t ) x 2 + 2 xy ta tb 66 Como sabemos que a escolha de x ( t ) é tal que não cause alterações em S , até a primeira ordem, para pequenas variações de trajetória na vizinhança de x , podemos concluir que tudo o que resta são os termos de segunda ordem em y ( t ) , e escrevemos + γ ( t ) y 2 dt . S x ( t ) = SCl [b, a ] + ∫ α ( t ) y 2 + β ( t ) yy ta tb Mas a integral sobre Dy ( t ) não depende da trajetória clássica, logo, o kernel será i 0 i tb + γ ( t ) y 2 dt Dy ( t ) . K ( b, a ) = exp SCl [b, a ] ∫ exp ∫ α ( t ) y 2 + β ( t ) yy 0 ta Como construímos y ( t ) de forma a que inicie e termine em y = 0 , a integral sobre todas essas trajetórias somente pode depender dos tempos t a e tb , e mais exatamente, da diferença T = ( tb − ta ) . O que significa que o kernel será descrito pela expressão i K ( b, a ) = exp SCl [b, a ] F (T ) . III.3.2. Cálculo da ação do OHS Para o OHS unidimensional associado a uma partícula de massa m com a m freqüência angular constante ω , a lagrangiana clássica é dada por L = ( x 2 − ω 2 x 2 ) , e 2 a ação será calculada no intervalo T = tb − ta , entre os pontos xb = x ( tb ) e xa = x ( ta ) . A equação de Euler-Lagrange ∂L ∂x = d ( ∂L ∂x ) dt nos dá a equação de movimento x = −ω 2 x , cuja solução é x ( t ) = A sen ωt + B cos ωt . Fixando as extremidades, calculamos A e B : A sen ωta + B cos ωta = xa ; A sen ωtb + B cos ωtb = xb . Explicitando: A= xa − B cos ωta ; sen ωta B= xb sen ωta − xa sen ωtb ; sen ωta cos ωtb − sen ωtb cos ωta o que nos dá as expressões, para T = ( tb − ta ) : A= xb cos ωta − xa cos ωtb ; sen ωT B= xa sen ωtb − xb sen ωta . sen ωT 67 A integral da ação é dada por SCl = ∫ tb ta = m 2 mω 2 2 2 ω x − x dt = ( ) 2 2 ∫ (A tb 2 ta cos 2ωt − B 2 cos 2ωt − 2 AB sen 2ωt ) dt = mω A2 B2 ω ω t t sen 2 − sen 2 − ( ) ( sen 2ωtb − sen 2ωta ) + AB ( cos 2ωtb − cos 2ωta ) = b a 2 2 2 mω A2 − B 2 = ( sen 2ωtb − sen 2ωta ) + AB ( cos 2ωtb − cos 2ωta ) . 2 2 Mas A2 − B 2 1 = 2 2sen 2 ωT −1 AB = sen 2 ωT xa2 ( cos 2 ωtb − sen 2 ωtb ) + xb ( cos 2 ωta − sen 2 ωta ) + , e + xa xb ( sen ωta sen ωtb − cos ωta cos ωtb ) 2 xa2 sen ωtb cos ωtb + xb2 sen ωta cos ωta − . − xa xb ( sen ωta cos ωtb + sen ωtb cos ωta ) Efetuando os produtos e os cancelamentos, e observando que sen ωT cos ωT = = sen ωtb cos ωtb ( cos 2 ωta − sen 2 ωta ) + sen ωta cos ωta ( cos 2 ωtb − sen 2 ωtb ) , obtemos finalmente que SCl = mω mω ( xa2 + xb2 ) sen ωT cos ωT − 2 xa xb sen ωT = ( xa2 + xb2 ) cos ωT − 2 xa xb 2 2sen ωT 2sen ωT e o kernel do OHS será parcialmente dado pela expressão imω 2 K OHS = F (T )OHS exp xa + xb2 ) cos ωT − 2 xa xb . ( 2 sen ωT III.3.3. Cálculo da função F (T )OHS Para simplificar o cálculo do kernel completo para o OHS, vamos antes calcular o kernel da partícula livre, cuja ação clássica já foi mostrada anteriormente como sendo m ( xb − xa ) = . 2 tb − ta 2 livre Cl S Neste caso, após um cálculo simples, o kernel será dado por 68 K ( b, a )livre im ( xb − xa )2 = m 2π iT ⋅ exp . 2 T Usando o método, desenvolvido anteriormente, das diferenças de trajetórias y ( t ) , a função F (T )OHS pode ser escrita como 0 i T m 2 F (T )OHS = ∫ exp ∫ y − ω 2 y 2 ) dt Dy ( t ) . ( 0 0 2 Como já foi visto, todas as trajetórias y ( t ) vão de 0 , em t = 0 , a 0 , em t = T , e em consequência podem ser expandidas em uma série de Fourier com período fundamental igual a T , da forma que se segue: y ( t ) = ∑ an sen n nπ t . T Esta representação torna possível considerarmos as trajetórias como funções dos coeficientes an , ao invés de funções de y para qualquer valor particular de t . Temos agora uma transformação linear cujo jacobiano ∆ J é constante, e obviamente independente de ω , m e . Todos os fatores independentes de ω , inclusive ∆ J , serão consolidados em uma só constante C , que poderá ser calculada ao final, uma vez que conhecemos o seu valor para ω = 0 , que é a função multiplicadora do kernel da partícula livre F (T )livre = m 2π iT , já mostrada acima. Agora a integral para a ação pode ser escrita em termos dessa série, e o termo de energia cinética será dado por ∫ T 0 y 2 dt = ∑∑ n m T nπ t mπ t nπ t mπ t T nπ t 2 an am ∫ cos cos dt = ∑ an , 0 T T T T 2 n T 2 assim como o termo da energia potencial será dado por ∫ T 0 y 2 dt = T ∑ an2 . 2 n Assumindo agora que o tempo T está dividido em intervalos discretos de tamanho ε , de maneira a que só exista um número finito N de coeficientes an , a integral de trajetória se escreverá como F ( T )OHS = ∆ J ∞ N im nπ 2 2 da1 da2 daN 2 ω exp − . an ∫−∞ −∞∫ −∞∫ ∑ T A A A n =1 2 ∞ ∞ 69 Como o expoente pode ser separado em fatores, as integrações sobre cada coeficiente an podem ser feitas separadamente, apresentando a forma geral im n 2π 2 n 2π 2 2 2 dan 2 ∫−∞ exp 2 T 2 − ω an A = T 2 − ω ∞ −1 2 . Assim, a integral de trajetória será proporcional a n 2π 2 2 ∏ 2 −ω n =1 T N −1 2 n 2π 2 = ∏ 2 n =1 T N −1 2 ω 2T 2 ∏ 1 − 2 2 nπ n =1 N −1 2 . O primeiro produtório não depende de ω , e se combina com o jacobiano e com outros fatores que vamos combinar em uma só constante C . O limite do segundo fator quando n → ∞ , o que é o mesmo que ε → 0 , será [sen ωT ωT ] −1 2 F (T )OHS Por outro lado, lim [sen ωT ωT ] −1 2 ω →0 sen ωT =C ωT , portanto: −1 2 . = 1 , e como para ω = 0 a integral corresponde à da partícula livre, encontramos que C = ( m 2π iT ) 12 = F (T )livre , e, logo, mω F (T )OHS = , 2π i sen ωT 12 e a expressão final do kernel para o OHS será mω imω 2 = xa + xb2 ) cos ωT − 2 xa xb . ( exp 2π i sen ωT 2 sen ωT 12 K OHS Obs.: A lagrangiana quadrática mais geral apresentada acima (III.3.1) pode ter o seu kernel (gaussiano) calculado de forma genérica pelo método de autovalores, e sua expressão final será dada por K quad ( b, a ) = m i ⋅ exp SCl [b, a ] , 2π i ⋅ f ( tb , ta ) onde f ( tb , ta ) é a solução da equação diferencial m ∂2 f ( t , ta ) + c ( t ) f ( t , t a ) = 0 , ∂t 2 com as condições de contorno iniciais 70 f ( ta , ta ) = 0 ; ∂ f ( t , ta ) =1. ∂t t = ta III.3.4. OHS forçado e as fontes J ( t ) de Schwinger O campo eletrodinâmico quântico pode ser visto como uma coleção, possuindo um número infinito de graus de liberdade, ou de coordenadas generalizadas, de osciladores harmônicos simples. Para analisar as interações do campo com forças externas, Julian Seymour Schwinger introduziu o conceito de uma fonte de interação externa J ( t ) , que atua durante um intervalo de tempo finito sobre um sistema. Desta forma é possível se calcular a amplitude de transição Ψ′−∞ Ψ ∞ J , entre um estado sem interação Ψ′ ( t = −∞ ) , anterior à ativação da fonte, e outro estado sem interação Ψ ( t = ∞ ) , posterior à desativação da fonte. Já em 1949, Freeman Dyson demonstrou a equivalência dos formalismos de Feynman, Schwinger e Tomonaga, e talvez o exemplo mais simples em que surge o elo entre essas teorias seja o do OHS que interage com uma força externa J ( t ) , ou OHS forçado. Será adotada nesta seção a notação usual da Teoria Quântica dos Campos (TQC), com a coordenada generalizada (campo) representada por ψ , e fazendo as constantes m, = 1 . Vamos calcular a amplitude de transição para uma força atuante real J ( t ) t Ψ ′t Ψ T = ∫ Dψ exp i ∫ dt ψ 2 2 − ω 2ψ 2 2 + J ( t )ψ , T com as condições de contorno ψ ( t ) = Ψ′ e ψ (T ) = Ψ . Assim como está, o integrando é puramente oscilatório, e uma forma eficaz de restabelecer a convergência da integral é acrescentar um termo de amortecimento 1 t − ε ∫ dt ψ 2 ( t ) 2 T ε >0, e fazer com que ε → 0 ao final dos cálculos. O integrando passa agora a ser escrito como t 1 1 exp i ∫ ψ 2 − (ω 2 − iε )ψ 2 + Jψ . 2 T 2 Vamos supor agora que queremos calcular a amplitude de transição para o OHS, partindo de um estado Ψ no passado infinito e chegando a um estado Ψ ′ no futuro infinito, na presença de uma força externa. Será conveniente trabalharmos com as transformadas de Fourier direta G , que é qualquer função bem-comportada de t , e sua inversa G : 71 G (t ) = ∫ ∞ −∞ dE iEt e G(E) 2π ∞ dt − iEt G ( E ) = ∫ e G (t ) . −∞ 2π Teremos então as expressões ∞ dE dE ′ i( E + E ′)t ψ 2 − (ω 2 − iε )ψ 2 = ∫ − EE ′ − ω 2 + iε ψ ( E )ψ ( E ′ ) ~ −∞ 2π 2π e J ( t )ψ ( t ) = 1 +∞ dE dE ′ i( E + E ′)t ψ ( E ) J ( E ′ ) + ψ ( E ′ ) J ( E ) . e 2 ∫−∞ π π +∞ Usando a identidade δ ( x − x′) = ∫ e ik ( x − x′) −∞ dk 2π , integrando sobre t e depois sobre E ′ , obtemos para o expoente a expressão +∞ i dE ( E 2 − ω 2 + iε )ψ ( E )ψ ( − E ) +ψ ( E ) J ( − E ) +ψ ( − E ) J ( E ) . ∫ 2 −∞ Definindo agora as novas variáveis, em ambas as representações, ψ ′ ( E ) = ψ ( E ) + J ( E ) ( E 2 − ω 2 + iε ) , ou ψ ′ (t ) =ψ (t ) + ∫ +∞ −∞ J ( E ) dE iEt e , E 2 − ω 2 + iε 2π a amplitude de transição será dada por Ψ ′+∞ Ψ −∞ J = i +∞ i +∞ J ( E ) J ( − E ) 2 2 = exp − ∫ dE 2 D ψ exp ∫ ∫ dE ψ ′ ( E ) ( E − ω + iε )ψ ′ ( − E ) 2 E − ω + iε 2 −∞ 2 −∞ Como os jacobianos das transformações equivalentes de variáveis acima têm valor 1, Dψ ′ = Dψ , e verificamos que, adicionalmente, a participação da fonte J ( E ) foi explicitamente fatorada na primeira exponencial, e restou no segundo fator a amplitude de probabilidade para J = 0 . Temos, portanto, que Ψ ′+∞ Ψ −∞ J = Ψ ′+∞ Ψ −∞ +∞ J ( E ) J ( − E ) i ⋅ exp − dE ∫ E 2 − ω 2 + iε . J =0 2 −∞ Podemos clarificar mais as coisas explicitando a dependência em J ( t ) : 72 i +∞ exp − ∫ dt ′ J ( t ) D ( t − t ′ ) J ( t ′ ) , 2 −∞ onde D (t − t′) = ∫ +∞ −∞ dE e − i(t −t ) E . 2π E 2 − ω 2 + iε ′ O significado físico desse resultado é o seguinte: nos tempos infinitos t = ±∞ , a fonte não atua. Logo, os estados de energia fundamental do campo, ou de vácuo, nesses tempos, não dependem de J . Sejam Ω±∞ os estados de vácuo nos tempos infinitos futuros e passados, e vamos expressá-los em termos do ket Ψ +∞ que aparece acima. Teremos, usando a notação • para indicar as integrações sobre t e t ′ , que Ω +∞ Ω −∞ J = ∫ d Ψ ′d Ψ Ω +∞ Ψ ′+∞ Ψ ′+∞ Ψ −∞ = ∫ d Ψ ′d Ψ Ω+∞ Ψ ′+∞ Ψ ′+∞ Ψ −∞ Mas Ω+∞ Ω −∞ J =0 J =0 J Ψ −∞ Ω −∞ Ψ −∞ Ω −∞ e − i J DJ 2 . é a amplitude de transição para que o sistema, partindo de seu estado fundamental no passado infinito, se encontre no seu estado fundamental no futuro infinito, na ausência de toda e qualquer força externa. E terá que ser obrigatoriamente igual a 1 (desde que a normalização seja possível). Assim, podemos identificar i +∞ W [ J ] ≡ exp − ∫ dt ′ J ( t ) D ( t − t ′ ) J ( t ′ ) 2 −∞ como a amplitude de transição para que o sistema vá do estado fundamental do passado para o do futuro, na presença de uma fonte de força externa. Vamos agora, com a notação • 1,2 indicando a integração sobre as variáveis mudas 1 e 2, definir o funcional gerador W [ J ] , com a normalização W [ 0] = 1 , e, a partir deste, o funcional Z [J ] : i W [ J ] ≡ exp − J1 D12 J 2 2 1,2 iZ [ J ] ≡e . Mostra-se sem maiores dificuldades que D (t ) = 1 θ ( t ) e − iωt + θ ( −t ) eiωt , 2iω 73 onde θ ( x ) é a função degrau de Heaviside. E também, diferenciando diretamente a expressão integral D ( t − t ′ ) = ∫ +∞ −∞ dE e − i(t −t ) E , obtemos a equação diferencial 2π E 2 − ω 2 + iε ′ d2 2 2 + ω D ( t ) = −δ ( t ) . dt Portanto, D ( t ) é a função de Green para o operador ( d 2 dt 2 + ω 2 ) , e a prescrição −iε presente na integral de trajetória fixa as condições de contorno. Como se pode ver pelas funções θ na expressão anterior, D ( t ) é uma mistura de sinais avançados e retardados. Este operador é o precursor do propagador de Feynman, que descreve a propagação de um sinal como se fosse originada de duas fontes: estados de energia positiva (partícula) movendo-se à frente no tempo, e estados de energia negativa (antipartícula) movendo-se reversamente no tempo. Uma vantagem dessa formulação é que não depende realmente das configurações inicial e final Ψ e Ψ ′ , que aparecem apenas na normalização, quando não existe a fonte J . Será visto mais adiante como este método se aplica para extrair as funções de Green, de dois até n pontos, apenas pela derivação funcional de segunda ou n -ésima ordem de W [ J ] em relação a J , o que será de grande importância para os cálculos perturbativos a partir da integral de trajetória. III.4. Derivadas funcionais As derivadas funcionais foram introduzidas por Schwinger em 1951 [Proc. N. A. S., v.37, 452], como elementos de cálculo de uma teoria geral, no sentido de independer da expansibilidade ou não dessas funções em séries de potências dos parâmetros de acoplamento, das funções de Green para campos quânticos. Seja o funcional F A ( x ) = ∫ f ( A ( x ) ) dx . Podemos definir uma derivada funcional de F em relação a A , a partir da extensão da idéia da diferencial de uma função G ( x1 , x2 ,…) de N variáveis em relação a incrementos infinitesimais ηi em cada uma de suas variáveis: G ( x1 + η1 , x2 + η2 ,…) − G ( x1 , x2 ,…) = ∑ i ∂G ηi . ∂xi No caso de F A ( x ) , o incremento se dá através de uma função infinitesimal η ( x ) , e podemos definir a extensão da diferencial, e, portanto, da derivada, a partir da expressão F A ( x ) + η ( x ) − F A ( x ) = ∫ δF δ A( y ) η ( y ) dy . 74 Todas as regras do cálculo usual, como diferenciação de produtos (regra de Leibniz), integração por partes, etc., permanecem válidas no cálculo funcional assim definido. Obtemos então os seguintes e importantes resultados: δ F [ A] df ; = f ′ ( A( x )) = δ A( x) dA δ δ A( x) δ , A ( x ) = − A( x) = δ ( x − y) , δ A ( y ) δ A ( y ) δ A( y) onde δ ( x − y ) é a função delta de Dirac. De posse desse instrumental, verificamos que já dispomos de um meio para extrair funções de Green, na presença de uma fonte, da amplitude de transição vácuovácuo: basta extrair derivadas funcionais do funcional gerador, por exemplo, do modo seguinte: ( −i ) 2 i − JD δ2 δ δ 2 W [ J ] = ( −i ) e 2 δ J1δ J 2 δ J ( t1 ) δ J ( t2 ) 1 12 J 2 1,2 = D12 = D ( t1 − t2 ) . Esse procedimento será repetidamente utilizado a seguir, como um dos métodos de cálculo no formalismo de integração funcional em TQC. III.5. O cálculo perturbativo III.5.1. O funcional gerador Vamos agora generalizar a integral de trajetória, passando do âmbito da MQ não-relativística para a TQC, onde o formalismo recebe o nome mais adequado de integração funcional, já que o conceito de trajetória só faz algum sentido quando se fala de partículas, e não de campos. Por analogia com a MQ, e tomando como exemplo mais simplificado um campo escalar real, podemos descrever o estado de um sistema em um dado instante através do ket φ ( x ) t , e calcular em seguida a amplitude de transição deste ket entre um tempo t0 e outro tempo posterior t , mas nos deparamos imediatamente com a necessidade de associar o ket aos possíveis estados físicos do sistema. A maneira pela qual se identificam os estados do sistema repousa usualmente sobre o sucesso da teoria de perturbação utilizada: parte-se de uma aproximação à teoria, de ordem zero, em que os estados são mais facilmente identificados. A teoria completa é então recobrada, pela adição de uma pequena perturbação à teoria idealizada de ordem zero. Em seguida os efeitos desta pequena perturbação sobre os estados de zero ordem são calculados. Um exemplo desse procedimento ocorre na eletrodinâmica quântica (QED), na qual se identifica logo o diminuto parâmetro de acoplamento α ≈ (1 137 ) , e a teoria de ordem zero é aquela em que α = 0 . Neste caso, a identificação é fácil, e o sucesso do procedimento se deve ao fato de α ser um número 75 muito pequeno, o que faz com que toda série perturbativa expandida em função de α exiba uma convergência muito rápida. Como fazer, porém, no caso geral, em que não sabemos a priori nem a solução, nem estimar a ordem de grandeza dos parâmetros de acoplamento, e temos que obter uma formulação da teoria, em integrais funcionais, que não pode depender dos estados físicos que não conhecemos? A saída é na verdade muito simples, e já foi usada acima: quaisquer que sejam os estados físicos de um sistema, por mais complexos e surpreendentes que sejam, existe o consenso de que deve sempre haver um estado de energia mínima, chamado de estado de vácuo. Imaginemos que vamos trabalhar com a amplitude de transição do sistema a partir do estado de vácuo em t = −∞ até o estado de vácuo em t = +∞ na presença de uma fonte de força arbitrária J ( x ) , onde x representa o quadrivetor de posição no espaço-tempo. Isto quer dizer que, a qualquer instante, reservamo-nos o direito de conduzir o sistema aonde bem entendermos, e observar sua reação, com mecanismos de prova apropriados para a obtenção de respostas reconhecíveis. Exatamente esta será a estratégia: a) trabalhar com a amplitude ΩΩ J para uma fonte arbitrária J ( x ) ; b) reconhecer e interpretar os resultados em termos de amplitudes de espalhamento; c) usar essas amplitudes para calcular as consequências físicas da teoria. Tradicionalmente, a fonte será associada a um campo local, pela forte razão de que, desta forma, é gerado um termo de interação suficientemente genérico para que todas as possíveis fontes possam vir a ser construídas a partir do mesmo. Quando a teoria de perturbação for aplicável, os campos locais serão naturalmente interpretados em termos de partículas. Iniciaremos com a TQC mais simples: um campo escalar com auto-interação, descrito pela ação clássica no espaço-tempo quadridimensional 1 1 S = ∫ d 4 x ∂ µφ ∂ µφ − m 2φ 2 − V (φ ) = ∫ d 4 x L (φ , ∂ µφ ) . 2 2 Para construir a densidade hamiltoniana H , define-se o momentum canônico π ( x) = ∂L = ∂ 0φ ≡ φ , ∂ ( ∂ 0φ ) fazendo-se em seguida uma transformação de Legendre 1 H π , φ , ∇φ = πφ − L = π 2 + ∇φ ⋅∇φ + m 2φ 2 + V (φ ) . 2 ( ) ( ) A amplitude vácuo-vácuo é definida como sendo ΩΩ J { ≡ W [ J ] = N ∫ Dφ Dπ exp i πφ − H + J φ }, 76 onde a constante N não é em geral bem-definida. A notação • indica integração sobre o espaço-tempo, e J ( x ) é uma fonte arbitrária. Integrando sobre π , da mesma forma que anteriormente, obtemos 1 1 W [ J ] = N ′∫ Dφ exp i ∂ µφ ∂ µφ − m 2φ 2 − V (φ ) + J φ . 2 2 O produto de todos os d φk , onde φk = φ ( x ) x = x , foi abreviado como Dφ . k O integrando acima é oscilatório, e esta integral funcional não é bem-definida. Temos dois caminhos para resolver o problema: a) acrescentar um fator de convergência { exp −ε φ 2 } 2 , com ε > 0 ; ou b) definir W no espaço euclidiano, por uma rotação de Wick em que, denotando variáveis e derivadas euclidianas por um índice ( • ) : E d 4 x = −id 4 x E ∂ µφ ∂ µφ = −∂ µEφ ∂ µEφ , x0 = −ix0E a expressão da amplitude vácuo-vácuo se transforma em 1 1 W E [ J ] = N E ∫ Dφ exp − ∂ µEφ ∂ µEφ − m 2φ 2 − V (φ ) + J φ . 2 2 Em ambos os casos, o funcional gerador é usado para produzir as funções de Green que são os coeficientes da expansão funcional ∞ W [J ] = ∑ N =0 (i ) N N! J1 J 2 J N G ( N) (1, 2, , N ) 1N , ou G( N) (1, 2, , N ) = 1 (i ) N δ δ δ W [J ] δ J1 δ J 2 δ J N . J =0 A tarefa agora é calcular as funções de Green, perturbativamente ou de outra maneira possível. III.5.2. O propagador de Feynman O funcional gerador W0 [ J ] , quando V = 0 , será calculado a seguir no espaço de Minkowski, usando-se a prescrição −iε , como se segue. Seja 1 1 W0 [ J ] ≡ N ∫ Dφ exp i ∂ µφ ∂ µφ − ( m 2 − iε ) φ 2 + J φ . 2 2 77 Como no caso do OHS forçado, o cálculo é mais simples no espaço dos momentos canônicos, que é o espaço das transformadas de Fourier dos campos canônicos conjugados, usando as transformadas 4 +∞ d x F ( p ) = ∫ e−ip⋅ x F ( x ) , 2 −∞ ( 2π ) +∞ d4 p −∞ ( 2π ) F ( x) = ∫ 2 eip⋅ x F ( p ) , e a função de Dirac, com sua transformada em quatro dimensões ( ) δ ( 4) ( x − x′ ) = δ x 0 − x 0′ δ ( x − x′ ) = +∞ d4 p ∫ ( 2π ) 4 e( i x − x ′ )⋅ p , −∞ onde x ⋅ p = x 0 p 0 − x ⋅ p , e F é qualquer função bem-comportada.. O expoente do integrando pode ser facilmente expresso em termos das transformadas de Fourier de φ e J , na forma −1 i d 4 p φ′ ( p ) p 2 − m 2 + iε φ′ ( − p ) − J ( p ) p 2 − m 2 + iε J ( − p ) , ∫ 2 −1 onde φ′ ( p ) = φ ( p ) + p 2 − m 2 + iε J ( p ) . A nova variável φ ′ ( p ) difere de φ ( p ) no espaço funcional apenas por uma constante, portanto, Dφ = Dφ ′ . Reunindo tudo, temos ( p) 2 J 1 1 2 µ 2 W0 [ J ] = N exp i ∫ d 4 p 2 ∫ Dφ ′ exp i ∂ µφ ′ ∂ φ ′ − ( m − iε ) φ ′ , 2 p − m + iε 2 2 e, observando que o termo dependente de φ ′ ( p ) é uma gaussiana – logo, é calculável e corresponde ao termo em φ ( p ) na expressão original, com J = 0 , podemos escrever que J ( p ) J ( − p ) i W0 [ J ] = W0 [ 0] exp − ∫ d 4 p 2 . p − m 2 + iε 2 Ajustando a constante N , podemos fazer com que W0 [ 0] = 1 , mas o fato importante é que desta forma conseguimos estabelecer a dependência explícita de W0 [ J ] em relação a J . Aplicando agora a transformada de Fourier inversa, extraímos as expressões ( −i ) δ 2W0 [ J ] = ∆ , i W0 [ J ] = W0 [ 0] exp − J1∆ F 12 J 2 ∴ F 12 W0 [ 0] δ J1δ J 2 J = 0 2 2 78 onde ∆ F 12 ≡ ∆ F ( x1 − x2 ) = ∫ d4p ( 2π ) 4 e − ip ⋅( x1 − x2 ) p 2 − m 2 + iε é o propagador de Feynman. Podemos agora associar ∆ F 12 com as funções de Green obtidas a partir de W0 [ J ] , utilizando a fórmula correspondente a V = 0 : G0( N) (1, 2, , N ) = 1 (i ) N δ δ δ W [J ] δ J1 δ J 2 δ J N 0 . J =0 Realizando os cálculos, vemos que somente não são nulas as funções de Green com número par de variáveis (devido à única dependência em J 2 de W0 [ J ] ), e todas são funções apenas das diferenças ( xi − x j ) , refletindo a invariância translacional da teoria. Teremos, por exemplo: G0( 2) ( x1 , x2 ) = i∆ F ( x1 − x2 ) G0( 4) ( x1 , x2 , x3 , x4 ) = − ∆ F ( x1 − x2 ) ∆ F ( x3 − x4 ) + ∆ F ( x1 − x3 ) ∆ F ( x2 − x4 ) + ∆ F ( x1 − x4 ) ∆ F ( x2 − x3 ) G0( 6) ( x1 , x2 , x3 , x4 , x5 , x6 ) = −i ∆ F ( x1 − x2 ) ∆ F ( x3 − x4 ) ∆ F ( x5 − x6 ) + e assim por diante. Essa combinação de índices não-repetidos na composição dos produtos dos propagadores resulta de uma operação chamada de contração, que se fundamenta teoricamente no Teorema de Wick. É importante observar que todas as funções de Green de mais alta ordem são formadas por produtos da função não-nula mais simples, G0( ) . Neste caso particular em que estamos trabalhando com o funcional 2 gerador W0 [ J ] , é mais simples definir novas funções de Green Gc( ) , em termos de N Z [ J ] (a mesma definida pela relação W [ J ] = exp ( iZ [ J ]) ), da seguinte forma: iZ [ J ] = ∑ N O subscrito em Gc( N) ( −1) N N! Gc( N) (1,, N ) J1 J N 1N . significa que estas são as funções de Green que correspondem aos diagramas de Feynman conexos, que serão mostrados mais adiante, e cuja denominação, de origem topológica, decorre do fato de poderem ser integralmente “percorridos” sem interrupção. 79 O significado físico das funções de Green geradas a partir de W0 [ J ] pode ser visto pela equação diferencial que resulta da derivada da integral que define o propagador, o qual resulta ser a função de Green do operador (∂ ∂ µ µ + m 2 ) ∆ F ( x ) = −δ ( 4) + m2 : ( x) . As condições de contorno são determinadas pela prescrição −iε , através da integral de trajetória. Podemos então identificar ∆ F ( x − y ) como sendo o propagador de sinais, de x para y , correspondentes a estados de partícula e de antipartícula, uma vez que esses estados são soluções da equação de Klein-Gordon ( ) + m2 φ = 0 . A variação do sinal na prescrição ± iε indica quais as soluções que são propagadas, e de que forma. Resulta que as soluções das equações de Klein-Gordon que possuem energia positiva E = p 0 = p 2 + m 2 se propagam à frente no tempo, enquanto que aquelas com energia negativa − p 2 + m 2 se propagam reversamente no tempo. Em resumo, esses 2 estados correspondem a partículas de massa m , e a função de Green G0( ) ( x − y ) é interpretada como a amplitude de probabilidade para essas partículas irem de x para y . Isto nos conduziria, numa primeira visão, a associar ao propagador ∆ F ( x − y ) um diagrama esquemático no espaço de coordenadas, como uma reta interligando os pontos x e y. G0( 2) ( x, y ) = x__________y Mas verifica-se rapidamente que uma interpretação mais fácil de analisar é a que pode ser feita no espaço das transformadas de Fourier, o espaço dos momentos lineares. A natureza característica de ∆ F ( x − y ) nos leva a interpretar p µ como o momento linear quadridimensional de um estado de partícula. Esta interpretação é consistente com a invariância translacional, que conduz naturalmente ao princípio de conservação do momento linear p µ , cuja caracterização operacional na função de Green transformada 4 N G ( ) ( p1 , , pN ) , por sua vez, se traduz matematicamente pela função δ ( ) . A expressão se escreve então como 4 N 4 − i p x ++ pN xN ) ( N ) G ( ) ( p1 , , pN )( 2π ) δ ( ) ( p1 + + pN ) = ∫ d 4 x1 d 4 xN e ( 1 1 G ( x1 , , xN ) , N com G ( ) ( p1 , , pN ) estando definida apenas na condição ( p1 + + pN ) = 0 . Por exemplo, a função de Green de dois pontos transformada 80 2 G 0( ) ( p, − p ) = 1 p − m 2 + iε 2 2 G 0( ) ( p ) = p dá a amplitude de propagação de uma partícula com momento linear p e massa m . III.5.3. Cálculo perturbativo da teoria φ 3 Para mostrar os procedimentos de cálculo perturbativo de uma teoria de campos, através do uso das regras e diagramas de Feynman, será usada uma teoria não-realística (toy model) que reúne características presentes em teorias físicas vigentes. A teoria quântica φ 3 não possui um estado de vácuo estável – qualquer estado possível decai sem limite -, uma vez que o hamiltoniano da teoria clássica correspondente não é limitado inferiormente, podendo ter um valor negativo arbitrário. Isto é, não existe estado fundamental na teoria quântica φ 3 . Por outro lado, a teoria perturbativa é bemdefinida, os diagramas e as regras de Feynman apresentam todas as propriedades das teorias físicas, sendo mais simples, por exemplo, do que seus correspondentes na interação φ 4 . E, como justificativas adicionais, a seis dimensões espaço-temporais (não usadas aqui), não só a constante de acoplamento da interação φ 3 é adimensional, tal qual o α = (1 137 ) da QED de Feynman-Schwinger-Tomonaga, como a teoria é renormalizável em nível de primeiro laço (one-loop level renormalizable) e possui liberdade assintótica, tal qual a QCD de ‘t Hooft-Veltman-Gross-Wilczek. Tudo isso justifica a introdução da teoria φ 3 como modelo pedagógico para o estudo perturbativo a partir da integral de Feynman. Vamos agora obter as relações gerais entre as funções de Green que resultam dos funcionais geradores de uma teoria de campo com auto-interação arbitrária, e, em seguida, calcular a série perturbativa para a teoria φ 3 . III.5.3.1. Cálculo das funções de Green para um potencial arbitrário Vamos trabalhar agora com o operador de campo escalar neutro φˆ ( x ) , e considerar as funções de Green de n pontos relativas a esse campo. O T abaixo representa o operador de ordenação temporal, ou ordenação de Weyl, essencial nas expressões de operadores, e implícito na integração funcional, que já é construída de modo a que os produtos de integrandos apareçam ordenados na ordem crescente dos tempos das interações. Sejam então as funções de Green Gn ( x1 , , xn ) = 0 T φˆ ( x1 )φˆ ( xn ) 0 . A função de Green G2 ( x1 , x2 ) , em particular, é chamada de “propagador”, uma vez que representa a propagação da partícula de x1 para x2 (ou vice-versa). As funções de Green Gn não são, em geral, as funções de Green conexas Gnc , uma vez que aquelas incluem diagramas compostos de partes disjuntas, e estas não. Portanto, tomaremos como pontos de partida as funções Gnc . 81 Existe uma maneira elegante de definir a função de Green conexa Gnc em termos do formalismo integral funcional. Vamos definir Z [ J ] como sendo um funcional gerador que produz apenas as funções de Green conexas, ou seja, c n G onde o fator ( −i ) n −1 ( x1 , , xn ) = ( −i ) n −1 δ nZ [J ] J = 0, δ J ( x1 )δ J ( xn ) foi introduzido para maior conveniência posterior. Mostraremos agora, mais uma vez, que o funcional Z [ J ] está relacionado com o funcional gerador W [ J ] para as funções de Green Gn através da relação W [J ] = e iZ [ J ] . Basta aplicar a definição de derivação funcional a ambos os lados da equação, e fazendo em seguida J ( x ) = 0 , obteremos δZ δ J ( x ) J =0 =− i δW = 0 φˆ ( x ) 0 . W [ 0] δ J ( x ) J = 0 O VEV, ou valor esperado no vácuo, do operador de campo φˆ ( x ) deve ser nulo, se estamos considerando o estado de vácuo 0 estável. Em outras palavras, a menos que, na teoria examinada, ocorra quebra espontânea de simetria, 0 φˆ ( x ) 0 = 0 . Como não estamos estudando casos de quebra espontânea de simetria, teremos sempre nulo o VEV do campo. Levando essa condição em conta, teremos agora que δ 2Z [ J ] δ 2W i =− δ J1δ J 2 J =0 W [ 0] δ J1δ J 2 δ 3Z [ J ] δ J1δ J 2δ J 3 =− J =0 δ 2W W [ 0] δ J1δ J 2δ J 3 J =0 i J =0 = 0 T φˆ ( x1 ) φˆ ( x2 ) 0 , = 0 T φˆ ( x1 ) φˆ ( x2 ) φˆ ( x3 ) 0 . Os termos à direita são únicos, logo, os termos à esquerda representam funções de Green conexas, como se pode constatar de forma trivial. Efetuando a quarta derivada funcional, já aparece um primeiro exemplo não-trivial, como é mostrado a seguir. δ 4Z [ J ] δ J1δ J 2δ J 3δ J 4 + =− J =0 δ 4W W [ 0] δ J1δ J 2δ J 3δ J 4 i + J =0 δ 2W δ 2W δ 2W δ 2W δ 2W δ 2W + + = 2 W [ 0] δ J1δ J 2 δ J 3δ J 4 δ J1δ J 3 δ J 2δ J 4 δ J1δ J 4 δ J 2δ J 3 J = 0 i 82 = iG2 ( x1 , x2 ) G2 ( x3 , x4 ) + iG2 ( x1 , x3 ) G2 ( x2 , x4 ) + iG2 ( x1 , x4 ) G2 ( x2 , x3 ) − iG4 ( x1 , x2 , x3 , x4 ) Vemos então que a função de Green conexa de 4 pontos está relacionada com a função de Green de 4 pontos por G4c ( x1 , x2 , x3 , x4 ) = G4 ( x1 , x2 , x3 , x4 ) − −G2 ( x1 , x2 ) G2 ( x3 , x4 ) − G2 ( x1 , x3 ) G2 ( x2 , x4 ) − G2 ( x1 , x4 ) G2 ( x2 , x3 ) . III.5.3.2. Cálculo da série perturbativa para o potencial V (φ ) = − g 3 φ 3! Passemos agora ao caso específico da teoria de campo escalar neutro com autointeração φ 3 . A densidade lagrangiana correspondente a essa teoria é dada por 1 g L = ( ∂ µφ∂ µφ − m 2φ 2 ) − φ 3 , 2 3! onde g é uma constante de acoplamento, e o fator 1 3! foi introduzido por conveniência posterior de notação. O funcional gerador W [ J ] é dado por g 1 W [ J ] = ∫ Dφ exp i ∫ d 4 x ( ∂ µφ∂ µφ − m2φ ) + φ 3 + φ J . 3! 2 Vamos considerar primeiramente o funcional gerador para o campo livre, isto é, com a interação “desligada” ( g = 0 ): 1 W0 [ J ] = ∫ Dφ exp i ∫ d 4 x ( ∂ µφ∂ µφ − m 2φ ) + φ J . 2 Derivando W0 [ J ] funcionalmente três vezes em relação a J obtemos que 3 1 δ 4 W0 [ J ] = ∫ Dφ (φ ( x ) ) exp i ∫ d x ( L0 + φ J ) , i J δ { 3 } onde L0 é a lagrangiana livre. Repetindo o procedimento formamos uma série infinita: δ 1 ig 4 ∫ d x ∑ n = 0 n ! 3! iδ J ( x ) ∞ ∞ n 3 n W0 [ J ] = { } 3 1 ig = ∫ Dφ ∑ ∫ d 4 x (φ ( x ) ) exp i ∫ d 4 x ( L0 + φ J ) , n = 0 n ! 3! que é a mesma coisa que 83 δ exp −i ∫ d 4 x V W0 [ J ] = iδ J ( x ) { } { } = ∫ Dφ exp −i ∫ d 4 x (V (φ ) ) exp i ∫ d 4 x ( L0 + φ J ) . Esta última equação fornece uma representação útil para W [ J ] , δ W [ J ] = exp −i ∫ d 4 x V W0 [ J ] , iδ J ( x ) a qual é válida para qualquer função arbitrária V (φ ) . Estamos interessados agora em obter uma expansão perturbativa desta equação em potências de g . Rearrumando a série que já foi obtida no passo anterior, temos 3 2 3 2 g 1 g 4 δ 4 δ W [ J ] = 1 − ∫ d x + ∫ d x + W0 [ J ] . δ J 2 3! δJ 3! Para chegar a uma expressão explícita para esta série precisamos efetuar a integração funcional de W0 [ J ] com respeito a φ ( x ) , e ter uma forma explícita para W0 [ J ] como funcional de J ( x ) . Integrando por partes, podemos reescrever W0 [ J ] como −i W0 [ J ] = ∫ Dφ exp ∫ d 4 xd 4 yφ ( x ) K ( x, y ) φ ( y ) + i ∫ d 4 xφ ( x ) J ( x ) , 2 onde K ( x, y ) = δ 4 ( x − y ) ( y ) + m2 , y = ∂ ∂ . ∂y µ ∂yµ Devemos estar sempre lembrando que, aqui, m 2 é na verdade m 2 − iε ( ε > 0 e infinitesimal), para assegurar a convergência da integral gaussiana acima. Um método para calcular essa integral é representá-la como o limite contínuo de uma integral múltipla discreta (cada integral tratada analogamente a uma soma de Riemann) −i W0 [ J ] = C lim ∫ dφ1 dφN exp ∑ φ Kijφ j + i ∑ φ J i , N →∞ i 2 ij onde C é um fator numérico irrelevante, e K ij são constantes cujo limite contínuo é K ( x, y ) . Fazendo a mudança de variáveis φi′ = φi − ∑(K ) −1 j ij J j , resulta que 1 W0 [ J ] = C lim exp i ∑ J i ( K −1 ) J j I N , ij N →∞ 2 ij 84 onde 1 I N = ∫ dφ1′ dφN′ exp −i ∑ φi′Kijφ ′j . 2 ij O fator I N é evidentemente independente de J ( x ) , e é calculado facilmente pela diagonalização da matriz simétrica K ij através de uma matriz ortogonal R , tal que RT KR = ( λiδ ij ) , e o resultado será N IN = ∏ j =1 2π = constante iλ j det K . Esta equação produz uma constante numérica, e então, desprezando um fator numérico irrelevante, obtemos que i W0 [ J ] = exp ∫ d 4 xd 4 y J ( x ) ∆ ( x, y ) J ( y ) , 2 onde ∆ ( x, y ) é o operador inverso de K ( x, y ) no sentido funcional, ou seja, K , ∆ = ∫ d 4ξ K ( x, ξ ) ∆ (ξ , y ) = δ 4 ( x − y ) . Substituindo nesta integral a expressão diferencial K ( x, ξ ) → δ 4 ( x − y ) ( y ) + m2 , e tomando a transformada de Fourier, obtemos ∆ ( x, y ) = ∫ d 4 k exp {−ik ⋅ ( x − y )} , 4 ( 2π ) m2 − k 2 − iε que nada mais é senão a equação do propagador de Feynman para o campo livre φ . E, de fato, para esse campo livre, ocorre que ( −i ) δ 2W0 [ J ] G2 ( x, y ) = 0 T φˆ ( x ) φˆ ( y ) 0 = W0 [ 0] δ J ( x ) δ J ( y ) 2 = −i∆ F ( x, y ) . J =0 Já estamos agora suficientemente aparelhados para calcular os termos perturbativos da série em potências de g que encontramos anteriormente, inserindo a expressão i W0 [ J ] = exp ∫ d 4 xd 4 y J ( x ) ∆ ( x, y ) J ( y ) 2 em 85 3 2 3 2 g δ 1 g δ 4 W [ J ] = 1 − ∫ d 4 x + d x + W0 [ J ] , ∫ δ J 2 3! δJ 3! e efetuando repetidamente as derivações funcionais indicadas. Após uma “certa” trabalheira, obtemos que { } W [ J ] = W0 [ J ] 1 − gz1 [ J ] + g 2 z2 [ J ] + O ( g 3 ) , onde z1 [ J ] = z2 [ J ] = 1 i2 i3 4 d x ∆ ∆ J + d 4 x1 ( ∆1 J1 )( ∆1 J 2 )( ∆1 J 3 ) , 1 11 ( 1 1 ) ∫ ∫ 2! 3! ∫d 2 ( 3!) 4 2 3 x1d 4 x2 {6i 3 ∆12 + 9i 3 ∆11∆12 ∆ 22 + 9i 4 ∆11∆ 22 ( ∆1 J1 )( ∆ 2 J 2 ) 2 +18i 4 ∆12 ( ∆1 J1 )( ∆2 J 2 ) + 6i5∆11 ( ∆1 J1 )( ∆ 2 J 2 )( ∆ 2 J 3 )( ∆2 J 4 ) + 9i5∆12 ( ∆1 J1 )( ∆2 J 2 )( ∆2 J3 )( ∆2 J 4 ) +i 6 ( ∆1 J1 )( ∆1 J 2 )( ∆1 J 3 )( ∆ 2 J 4 )( ∆ 2 J 5 )( ∆ 2 J 6 )} , onde ∆ ij = ∆ ( xi , x j ) , i, j = 1, 2 ; (∆ J ) = ∫ d i j 4 y j ∆ ( xi , y j ) J ( y j ) , i = 1, 2; j = 1, 2,3, 4, 5, 6. III.5.3.3. Interpretação diagramática da teoria φ 3 Finalmente introduziremos uma interpretação diagramática, devida a Feynman, para essas extensas e complicadas integrais. A representação, assim como os fatores de simetria das combinações de estruturas gráficas, remete imediatamente à Teoria dos Grafos, que por sua vez está associada à Topologia, ramo da matemática fundado no final do século XIX e extensamente desenvolvido no século seguinte, com forte utilização nas teorias físicas em geral. Graças ao seu invento gráfico e ao mesmo tempo mnemônico, Feynman era capaz de, em poucas horas, obter resultados que pelos cálculos usuais na época só eram alcançáveis depois de meses de trabalho duro. Faz parte do anedotário da física do século XX a decepção de Schwinger com o fato de que, com seus diagramas, Feynman havia tornado a QED “acessível para as massas”. Faremos as seguintes correspondências entre elementos das equações e símbolos gráficos, na ordem (i), (ii) e (iii), segundo a figura abaixo: 86 Os símbolos significam, respectivamente: i) uma fonte externa em y ; ii) um propagador, ou seja, o operador de propagação de uma partícula entre dois pontos x e y ; iii) um vértice em x , ou seja, uma interação quântica, quântica, ou de espalhamento entre duas partículas, no caso da MQ, ou, além disso, de criação/aniquilação de partícula e antipartícula, no caso da TQC. Mas, de qualquer modo, uma interação ocorrida no ponto x , de acordo com as especificações da integral funcional e de seu modo peculiar de cálculo ordenado no tempo. Seguindo esta convenção gráfica, os dois termos no lado direito da expressão de z1 [ J ] encontrada acima podem ser representados por 87 Da mesma maneira, os oito termos z2 [ J ] podem ser representados como de Os dois primeiros termos correspondem aos diagramas de vácuo (a) e (b), e são imediatamente eliminados quando W [ J ] é normalizado por W [ 0] . De fato, vemos que W [ 0] = 1 + g2 ∫ dx dx ( 6i ∆ 2 ( 3!) 3 2 1 2 3 12 + 9i 3∆11∆12 ∆ 22 ) + O ( g 4 ) . Além disso, o terceiro, sexto e oitavo termos de z2 [ J ] , de acordo com o diagrama acima, estão representados dos por grafos desconexos, e podem ser rearrumados dentro da expressão compacta z2 [ J ] 2 . Obtemos assim 2 2 1 W [ J ] W [ 0] = W0 [ J ] 1 − gz1 [ J ] + g 2 z1 [ J ] + z [ J ] + O ( g 3 ) , 2 onde z [ J ] consiste apenas dos termos conexos z[J ] = i4 dx1dx2 dy1dy2 ∆ ( x1 , x1 ) ∆ ( x1 , x2 ) ∆ ( x2 , y1 ) ∆ ( x2 , y2 ) J ( y1 ) J ( y2 ) + 4∫ 88 + i4 2 dx1dx2 dy1dy2 ∆ ( x1 , x2 ) ∆ ( x1 , y1 ) ∆ ( x2 , y2 ) J ( y1 ) J ( y2 ) + ∫ 4 i5 + ∫ dx1dx2 dy1 dy4 ∆ ( x1 , x2 ) ∆ ( x1 , y1 ) ∆ ( x1 , y2 ) ∆ ( x2 , y3 ) × 8 ×∆ ( x2 , y4 ) J ( y1 ) J ( y4 ) . O funcional gerador para as funções de Green conexas, como já vimos, é dado por Z [ J ] = −i ln W [ J ] . Substituindo, temos que 2 1 Z [ J ] = −i ln (W0 [ J ]W [ 0]) − i ln 1 − gz1 [ J ] + g 2 z1 [ J ] + z [ J ] + O ( g 3 ) . 2 Introduzindo essa expressão na expansão em potências de g , encontramos Z [ J ] = −i ln W [ 0] + { } 1 dxdyJ ( x ) ∆ ( x, y ) J ( y ) − i − gz1 [ J ] + g 2 z [ J ] + O ( g 3 ) . ∫ 2 Como já vimos, Z [ J ] é o funcional gerador das funções de Green conexas Gnc ( x1 , , xn ) , e agora estamos em condições de calcular essas funções, até a ordem g 2 : G1c ( x ) = −i G2c ( x ) = −i∆ ( x, y ) − − g dy∆ ( x, y ) ∆ ( y, y ) + O ( g 3 ) , 2∫ g dx1dx2 ∆ ( x1 , x1 ) ∆ ( x1 , x2 ) ∆ ( x2 , x ) ∆ ( x2 , y ) − 2∫ g2 2 dx1dx2 ∆ ( x1 , x2 ) ∆ ( x1 , x ) ∆ ( x2 , y ) + O ( g 4 ) , ∫ 2 G3c ( x, y, z ) = − g ∫ dx1∆ ( x1 , x ) ∆ ( x1 , y ) ∆ ( x1 , z ) + O ( g 3 ) , G4c ( x, y , z , w ) = ig 2 ∫ dx1dx2 ∆ ( x1 , x2 ) {∆ ( x1 , x ) ∆ ( x1 , y ) ∆ ( x2 , z ) ∆ ( x2 , w ) + +∆ ( x1 , x ) ∆ ( x1 , z ) ∆ ( x2 , y ) ∆ ( x2 , w ) + ∆ ( x1 , x ) ∆ ( x1 , w ) ∆ ( x2 , z ) ∆ ( x2 , y )} + O ( g 4 ) Para o caso particular da teoria em que V (φ ) = − gφ 3 3! , podemos agora definir as regras de Feynman no espaço de configuração. Def. AIII.5.3.4. Regras de Feynman no espaço de configuração da teoria φ 3 89 1) A linha, reta ou curva, que representa o propagador, unindo os pontos x e y , é identificada ao operador −i∆ ( x, y ) ; 2) As linhas, retas ou curvas, convergentes no ponto x , que representam um vértice, são ∫ identificadas ao funcional i d 4 x g ; 3) Para calcular uma contribuição de ordem g n às funções de Green conexas Gnc ( x1 , , xn ) , devem ser desenhados todos os diagramas conexos e topologicamente independentes (isto é, que não podem se transformar em outro por uma deformação contínua), com n linhas externas e nv vértices, e aplicadas as identificações anteriores; 4) Cada contribuição dee laço −○, −○− , etc., deve ser multiplicada pelo fator de simetria 1 S , definido por S = Pv ∏ ( n !) n = 2,3 dn , onde d n é o número de pares de vértices conectados por n linhas, e Pv é o número de permutações de vértices que deixam o diagrama inalterado, uma vez fixadas as linhas externas. A título de exemplo ilustrativo, são mostrados abaixo todos os diagramas conexos das funções de Green, para n ≤ 4 e nv ≤ 4 , no espaço de configuração da teoria φ 3 , com indicação dos respectivos fatores de simetria. Os círculos negros simbolizam as fontes. 90 91 Para efeito de cálculo, aqueles diagramas em que o corte uma linha faz com que se dividam em dois outros, sendo um deles sem fonte, deve ser desprezados, pois são automaticamente cancelados por contra-termos termos adicionados à lagrangiana. Os diagramas desprezados desprezados e sem fonte alguma, compostos apenas por linhas e laços, são chamados na literatura de tadpoles (“girinos”), por sua aparência característica. Do conjunto acima de diagramas, após essa “limpeza cirúrgica” de extirpação dos diagramas-girinos, diagramas restam tam os treze diagramas abaixo, para a expansão perturbativa das funções de Green correspondentes aos números de linhas externas e vértices n, nv ≤ 4 : 92 Na maioria das vezes, é mais conveniente trabalhar no espaço dos momentos lineares, ou espaço de fase, e não no espaço de configuração. E, nesse caso, é mais conveniente, também, trabalhar com as funções de Green truncadas, ou “amputadas”, definidas a seguir, que eliminam os propagadores redundantes associados com linhas externas. Def. AIII.5.3.5. Definem-se as funções de Green truncadas, ou amputadas G nt , no espaço dos momentos lineares, e em relação às funções de Green genéricas G n , pela seguinte expressão: G n ( p1 , , pn −1 ) = G 2 ( p1 ) G 2 ( pn ) G nt ( p1 , , pn −1 ) , onde 4 − i p ⋅ x ++ pn ⋅ xn ) G n ( p1 , , pn−1 )( 2π ) δ 4 ( p1 + + pn ) = ∫ d 4 x1 d 4 xn e ( 1 1 Gn ( x1 , , xn ) . Em particular, a função de Green de 2 pontos truncada G 2t ( p ) é um propagador inverso: G 2t ( p ) = 1 G 2 ( p ) . E, da mesma forma que fizemos no espaço de configuração, até a ordem g 2 , obtemos no espaço de fase as funções de Green truncadas, que também serão conexas, e indicadas pela notação G ntc ( p1 , , pn −1 ) , resultando em g d 4k 1 −iG1tc = ∫ +O ( g3 ) , 4 2 2 2 ( 2π ) i m − k g 1 −iG 2tc ( p ) = m 2 − p 2 − 2 2 m 1 d 4k 1 1 4 + ∫ ( 2π )4 i m2 − k 2 ∫ ( 2π )4 i m2 − k 2 m2 − ( k − p )2 + O ( g ) , tc 3 −iG ( p, q ) = g + O ( g ) , d 4k 3 1 1 1 −iG 4tc ( p, q, k ) = g 2 2 + + +O (g4 ) . 2 2 2 2 2 m − ( p + q ) m − ( q + k ) m − ( k + p ) As regras de Feynman no espaço de fase para a teoria φ 3 serão: Def. AIII.5.3.6. Regras de Feynman no espaço dos momentos lineares para a teoria φ 3 : 1) Para calcular uma contribuição de ordem g nv à função de Green truncada e conexa de n pontos, multiplicada por ( −i ) , devem ser desenhados todos os diagramas conexos e topologicamente independentes que possuam n pontos externos e nv vértices.; 93 2) A linha que representa o propagador como momento k deve ser identificada ao fator 1 m 2 − k 2 ; as linhas que convergem em um vértice devem ser identificadas a um ( ) fator g ; 3) Deve-se observar em cada vértice a conservação do quadrivetor energia-momento; 4) A integração em cada laço deve usar sempre, em quatro dimensões, a medida d 4 k i ( 2π ) ; 4 5) Cada contribuição de um laço deve ser multiplicada pelo mesmo fator de simetria 1 S , já definido acima. 94 IV. Técnicas e Aplicações da Integral Funcional IV.1. Cálculo Perturbativo: métodos e técnicas gerais Veremos agora como extrair do funcional gerador as séries perturbativas, exemplificando no caso de outro potencial sem correspondência física, V (φ ) = ( − λ 4!) φ 4 , mas que possui uma constante de acoplamento λ adimensional, em quatro dimensões. Para um potencial genérico, já vimos que podemos escrever o funcional gerador como 1 1 W [ J ] = N ∫ Dφ exp i ∂ µφ∂ µφ − ( m2 − iε ) φ 2 − V (φ ) + J φ = 2 2 = N ∫ Dφ e Observemos agora que − i V (φ ) 1 1 exp i ∂ µφ∂ µφ − ( m 2 − iε ) φ 2 + J φ . 2 2 1 δ i J ( x) i Jφ e = φ ( x) e , e como J e φ são variáveis i δ J ( x) independentes, esta relação continua válida para qualquer função de φ . Em particular e − i V (φ ) e i Jφ =e 1 δ −i V iδJ e i Jφ . O que nos permite extrair da integral o termo dependente de V : W [J ] = e 1 δ −i V iδJ 1 1 N ∫ Dφ exp i ∂ µφ∂ µφ − ( m 2 − iε ) φ 2 + J φ = 2 2 =e 1 δ −i V iδJ W0 [ J ] , Ou, equivalentemente, e iZ [ J ] = W [ J ] = Ne 1 δ −i V iδJ e − i J1∆ F 12 J 2 2 . Esta equação será o ponto de partida para a expansão perturbativa usada no cálculo de W [ J ] e das quantidades físicas observáveis decorrentes. Agora, visando simplificar a notação e apresentar também o outro método de cálculo possível, sairemos do espaço de Minkowski e usaremos as expressões do funcional gerador no espaço euclidiano 95 W [J ] = e −Z[J ] 1 1 = N ∫ Dφ exp − ∫ d 4 x ∂ µφ∂ µφ + m 2φ 2 + V (φ ) − J φ , 2 2 W [ J ] = Ne δ − V δJ e − Z0 [ J ] , onde Z0 [ J ] = − 1 J ( x) ∆F ( x − y ) J ( y ) 2 ∆F ( x − y) = ∫ ,e xy eip( x − y ) . p2 + m2 d4 p ( 2π ) 4 Para fazermos a expansão perturbativa sobre o potencial, escrevemos na forma − V δδJ −Z J Z0 Z [ J ] = − ln N + Z 0 [ J ] − ln 1 + e e − 1 e 0 [ ] , − V δδJ e, definindo agora δ ≡ e e − 1 e − Z0 , obtemos a série Z0 1 1 Z [ J ] = − ln N + Z 0 [ J ] − δ [ J ] + δ 2 [ J ] − δ 3 [ J ] + 2 3 No caso particular do potencial V (φ ) = ( − λ 4!) φ 4 , fazendo δ = λδ1 + λ 2δ 2 + , teremos que 1 Z [ J ] = − ln N + Z 0 [ J ] − λδ1 [ J ] − λ 2 δ 2 [ J ] − δ12 [ J ] − 2 1 −λ 3 δ 3 [ J ] − δ1 [ J ] δ 2 [ J ] + δ13 [ J ] + 3 − V δ Expandindo a exponencial em δ ≡ e e δ J − 1 e − Z0 e comparando com a série, obtemos: Z0 δ1 = − 1 Z0 δ 4 e e − Z0 ; δJ4 4! δ2 = 1 2 ( 4!) 2 e Z0 δ4 δ J14 1 δ4 δ J 24 e − Z0 . 2 Pode-se mostrar que, para todas as ordens da expansão perturbativa, as funções de Green conexas são obtidas a partir de Z [ J ] , segundo a expressão (euclidiana) G( N) ( x1 , , xN ) = − δ N Z [J ] δ J1 δ J N . J =0 96 Por exemplo, as funções de Green conexas de dois pontos, no espaço de coordenadas, resultam dessa expressão como sendo dadas por G( 2) λ ( x1 , x2 ) = ∆ ( x1 − x2 ) − ∫ d 4 y∆ ( x1 − y ) ∆ ( y − y ) ∆ ( y − x2 ) + 2 + + + λ 2 4 ∫d 4 λ 2 4 λ2 6 ∫d 4 ∫d 4 xd 4 y∆ ( x1 − x ) ∆ 3 ( x − y ) ∆ ( y − x2 ) + xd 4 y ∆ ( x1 − x ) ∆ 2 ( x − y ) ∆ ( y − y ) ∆ ( x − x2 ) + xd 4 y ∆ ( x1 − x ) ∆ ( x − x ) ∆ ( x − y ) ∆ ( y − y ) ∆ ( y − x2 ) + O ( λ 3 ) . As funções de Green correspondentes, no espaço dos momentos lineares, são dadas pela expressão euclidiana geral 4 N G ( ) ( p1 , , pN )( 2π ) δ ( p1 + + pN ) = = ∫ d 4 x1 d 4 xN e ( i p1 x1 + p N xN ) G( N) ( x1 , , xN ) , que, aplicada à expressão anterior, nos fornece as funções de Green de dois pontos 2 G ( ) ( p, − p ) = λ2 + + ( p 2 + m2 ) λ2 1 + 4 λ2 4 d 4 q1 d 4 q2 d 4 q3 1 6 ( p 2 + m2 ) (p 1 2 +m 1 λ 1 − 2 2 p +m 2 ( p 2 + m2 )2 2 4 d 4q 2 ) 2 2 ∫ ( 2π ) 4 d 4q ∫ ( 2π ) 4 1 2 q + m2 4 ∫ ( 2π ) 4 1 + q + m2 2 δ ( p − q1 − q2 − q3 )( 2π ) ∫ ( 2π ) ( 2π ) ( 2π ) ( q 4 d 4q 2 1 + m 2 )( q22 + m 2 )( q32 + m 2 ) d 4 1 d 4 2 δ ( 1 − 2 )( 2π ) ∫ ( 2π ) ( 2π ) ( 4 1 1 2 2 2 q + m p + m2 4 4 d 4 2 1 + 4 + m 2 )( 22 + m 2 ) + ∫ ( 2π ) ( + m ) + O ( λ ) . 1 4 3 2 Não é preciso observar que essas expressões são de impossível memorização e de extenuante manipulação, mesmo no caso idealizado de uma interação λφ 4 . Felizmente, a cada uma das expressões integrais podemos fazer corresponder um diagrama, construído especificamente para esta interação, de acordo com regras simples e bem precisas, de acordo com os procedimentos descritos a seguir. 97 IV.1.1. Regras de Feynman para o potencial φ 4 1. Para cada fator 1 , deve-se se desenhar uma linha orientada no sentido do p + m2 2 momento linear p : 2. Para cada fator − λ 4! , deve-se deve se desenhar um vértice para onde convergem quatro momentos lineares p1, p2 , p3 , p4 , observando que o momento linear total resultante no vértice deve ser nulo: 3. Para obter as contribuições para as funções de Green G ( N ) ( p1 , , p N ) , e depois de identificar as linhas externas, deve-se deve se desenhar todas as possíveis combinações topologicamente equivalentes. O número de formas em que o mesmo diagrama pode ser representado é o fator de simetria, ou peso topológico, do diagrama, que divide sua expressão analítica. 4. Depois de assegurar a conservação do momento linear em cada vértice, deve-se deve integrar sobre os momentos do laço interno, com a medida d 4q ∫ ( 2π ) 4 . Ou, equivalentemente, deve-se deve associar a cada vértice o fator ( − λ 4!) δ ( ∑ p ) ( 2π ) , 4 onde ∑p é o momento linear resultante que converge naquele vértice, e em seguida integrar sobre todos os momentos lineares internos. Desta maneira se obtém um fator δ ( ∑ p ) ( 2π ) , onde 4 ∑p é o fluxo de momentos resultante dentro da função de Green. n. Exemplificando, a expressão analítica acima para a função ( 2) G ( p, − p ) é representada através de diagramas da seguinte forma: De forma inversa, destas regras podemos facilmente obter as expressões analíticas correspondentes, da seguinte forma: a) Precisamos de um vértice e de três propagadores. Há quatro maneiras de fixar a primeira linha ao vértice 1, e três maneiras de ligar a 98 1 1 4 ⋅ 3 = . O vértice pede o 4! 2 fator − λ . Consideremos q como sendo o momento linear circulando pelo laço. Pelas regras acima, teremos então segunda linha ao vértice 2. Isto resulta no peso − b) λ d 4q ( 2π ) δ ( p + p 2 ∫ ( 2π ) 4 1 4 2 + q − q) 1 1 . 2 2 q + m ( p + m 2 )2 2 Precisamos de dois vértices. Há quatro maneiras de fixar a primeira perna do primeiro vértice a 1, quatro maneiras de fixar a primeira perna do segundo vértice a 2, três maneiras de colar a segunda perna do primeiro vértice ao segundo, e duas maneiras de colar colar a terceira perna do 1 1 1 primeiro vértice ao segundo. O fator de simetria será então ⋅ ⋅ 4 ⋅ 4 ⋅ 3 ⋅ 2 = 4! 4! 6 . Note-se se que não levamos em consideração inicialmente que havia dois vértices, uma vez que os diagramas seriam os mesmos, quaisquer que fossem os vértices a que chamamos de 1 e 2. A intensidade deste diagrama é dada por ( −λ ) 2 = λ 2 . Se chamamos os momentos lineares que percorrem as pernas internas de q1 , q2 , q3 , as regras de Feynman resultam na expressão analítica λ2 6 c) (p 2 +m d 4 q1 d 4 q2 d 4 q3 ∫ ) ( 2π ) ( 2π ) ( 2π ) 2 2 4 4 4 ( 2π ) 8 δ ( p1 − q1 − q2 − q3 ) δ ( p2 + q1 + q2 + q3 ) (q 2 1 + m 2 )( q22 + m 2 )( q32 + m 2 ) Precisamos de dois vértices: há quatro maneiras de fixar a primeira perna ao vértice 1, quatro de fixar a terceira perna do vértice já ligado ao outro vértice, três maneiras de fixar a quarta perna do primeiro vértice ao 1 1 1 ⋅ ⋅ 4 ⋅ 3 ⋅ 4 ⋅ 3 = , e a intensidade será segundo. Logo, o peso será 4! 4! 4 ( −λ ) d) 1 2 = λ2 . Precisamos de dois vértices; há quatro maneiras de fixar um vértice a 1, quatro maneiras de ligar o outro vértice a 2. Isto deixa três pernas de cada vértice livres para serem ligadas de uma maneira. Para cada vértice há três 1 1 1 maneiras de encerrar a tarefa. Logo, o peso será ⋅ ⋅ 4 ⋅ 4 ⋅ 3⋅ 3 = , e a 4! 4! 4 intensidade ( −λ ) = λ 2 . 2 99 Neste ponto, vale registrar, apenas como observação introdutória, que é mais simples trabalhar com a ação efetiva Γ ( N ) , definida pelas equações funcionais δ Γ [φ ] = −J ; δφ δ Z [J ] =φ . δJ A ação efetiva é o funcional gerador das funções de Green correspondentes aos diagramas 1-ponto ponto irredutíveis, irredutíveis abreviadamente notados como 1PI , que são aqueles que não podem ser desconectados em dois outros diagramas pelo seccionamento de qualquer uma das suas suas linhas internas. As transformadas de Fourier de Γ( N) ( x1 , xN ) pelo funcional 4 − i p x + p x Γ ( N ) ( p1 , pN )( 2π ) δ ( p1 + pN ) = ∫ d 4 x1 d 4 xN e ( 1 1 N N ) Γ( N ) ( x1 , xN ) . Somente como comentário ilustrativo da importância da ação efetiva, enquanto a função de Green G ( 4 ) ( p1 , p2 , p3 , p4 ) gerada, como transformada de Fourier, a partir do funcional Z [ J ] , apresenta os oito diagramas, ou parcelas funcionais abaixo, na função de Green gerada pela ação efetiva Γ ( 4 ) ( p1 , p2 , p3 , p4 ) restam apenas os quatro diagramas seguintes, por consequência da eliminação, própria aos grafos 1PI , dos propagadores para as pernas externas: O estudo detalhado da ação efetiva e dos diagramas 1PI , porém, merece uma dedicação e um espaço muito maiores do que o presente trabalho permite, além do fato de esses elementos serem presença obrigatória em todo livro-texto livro texto de TQC que aborde a integração funcional de Feynman. Feynman 100 IV.2. A Partícula Livre num espaço euclidiano D-dimensional. Observando a representação do kernel da partícula livre no espaço euclidiano ND ∞ im tb 2 im N ( j ) m 2 N −1 j −1 ( j) = lim K ( b, a ) = ∫ D x ( t ) exp ∫ xdt dx exp x − x( ) ∑ ∏ ∫ N →∞ 2π iε j =1 −∞ 2ε j =1 a 2 ta fica claro que as integrais se fatoram em um produto D -dimensional, pois todas as b ( ) integrais são gaussianas. Começando com ( µ = 1,…, D ) : ( ∞ ) ( ) 2 m m 2 0 2 1 (1) K N = 2 xµ( ) , xµ( ) ; 2ε = xµ( ) − xµ( ) = ∫ dx exp − 2π iε −∞ 2iε = ( ) 2 m m 2 0 ⋅ exp − xµ( ) − xµ( ) , 4π iε 4iε mostra-se facilmente que ( ) ( ) 2 m m K N xµ( N ) , xµ( 0) ; ε N = xµ( N ) − xµ( 0) . exp − 2π iε N 2iε N Definindo que ε N = T , obtemos no limite N → ∞ que m K ( b, a; T ) = 2π iT D2 1 2 im exp ( xb − xa ) = D 2T ( 2π ) ∞ p 2 . dp exp ip x − x − iT ( ) b a ∫ 2m −∞ Considerando que x, p ∈ D , podemos extrair daí as funções de onda normalizadas e o espectro de energia: ψ ( x) = eip⋅ x ( 2π ) D Ep = , p22 . 2m A função de Green dependente da energia, em uma dimensão, será ∞ G(1) ( b, a; E ) = i ∫ K ( b, a; T ) eiET dT = − 0 x −x m exp i b a 2E 2mE . No caso D -dimensional o resultado será, após a integração, m G( D ) ( b, a; E ) = 2i 2π i D 2 1 2 2 m xb − xa 2E (1− D 2 ) x − xa K1− D 2 −i b 2 2 mE , onde Kν ( z ) é a função de Bessel modificada de argumento complexo. 101 IV.3. O Oscilador Harmônico num espaço euclidiano D-dimensional Já foi mostrado que o kernel do oscilador harmônico simples é dado por mω imω 2 K OHS = xa + xb2 ) cos ωT − 2 xa xb ( exp i T T 2 sen 2 sen π ω ω . 12 Usando a fórmula (Erdélyi, Higher Transcendental Functions, vol. 3, eq. 19.12(14)) e − ( 1 2 2 x +y 2 ) n 4 xyt − ( x 2 + y 2 )(1 + t 2 ) 1t 1 , exp ∑ Hn ( x) Hn ( y) = 2 (1 − t 2 ) n=0 n ! 2 1− t2 ∞ onde os H n representam os polinômios de Hermite, e fazendo x ≡ xa mω , y ≡ xb mω , e t = e − iωT , obtemos que ∞ K ( xb , xa , T ) = ∑ e− iTEn Ψ*n ( xb ) Ψ n ( xa ) , n =0 com os respectivos autovetores e espectro de energia: mω H mω x exp − mω x 2 , Ψn ( x) = n 2 ( 2n n !) π 2 1 En = ω n + . 2 Estas soluções são válidas, porém, somente para 0 < ωT < π . Fazendo agora n = 0,1, 2,… nπ T= +τ , resulta que sen ωT = e inπ sen ωτ , cos ωT = e inπ cos ωτ , 0 < τ < π ω ω sen ωT = sen ωτ , e a nova expressão geral do kernel será K ( xb , xa , T )OHS mω iπ 1 imω ( xa2 + xb2 ) cos ωT − 2 xa xb = exp − + n + 2π i sen ωτ 2 sen ωT 2 2 12 ( ) nπ n i que, no limite τ → 0 , terá a forma K xa , xb , = exp − π n δ xb − ( −1) xa . ω 2 Podemos extrair, em D dimensões, relações de recorrência, tanto para o kernel quanto para a função de Green, do OHS. Definindo µ = xa2 + xb2 e ν = xa ⋅ xb , x ∈ D , temos 102 K( D) ( xb , xa ; T ) = mω 1 ∂ ( D −2) 1 ∂ K ( xb , xa ; T ) = e−iωT − 2 K ( D −2) ( xb , xa ; T ) ; 2π ∂ν 2π ∂µ Para determinar as funções de Green dependentes da energia, usaremos a representação integral (Gradshteyn, Tables of integrals, series and products, eq. 6.669(1)): 2λ ∞ 1 − β cosh x J 2 µ (α senh x ) dx = ∫0 coth 2 x e 1 Γ − λ + µ 12 2 M 2 12 2 = − β ⋅Wλ , µ (α 2 + β 2 ) + β , − λ , µ (α + β ) α Γ ( 2µ + 1) 1 Re β > Re α , Re ( µ − λ ) > − 2 , onde M − λ , µ ( z ) ,Wλ , µ ( z ) são as funções hipergeométricas de Whittaker, e obtemos G ( xb , xa ; E ) = − 2mω 1 m 1 E Γ − xa + xb + xb − xa ) ( D− 1 + E 2 π ω 2 ω 2 ω ×D 1 E − + 2 ω 2mω xa + xb − xb − xa ) , ( − onde Dν ( z ) é a função hipergeométrica cilindro-parabólica. As relações recursivas das funções de Green em D dimensões serão então G( D) ( xb , xa ; E ) ≡ G( D) ( µ |ν ; E ) = Para finalizar, usamos 1 ∂ ( D −2) 1 mω ∂ G ( µ |ν ; E ) = − 2 G( D−2) ( µ |ν ; E ) 2π ∂ν 2π ∂ν 1 ξ = ( xa + xb + xb − xa ) as substituições e 2 1 ( xa + xb − xb − xa ) , e encontramos, para D = 1, 3, 5,… , a fórmula geral para D 2 dimensões ( D = 1, 3, 5,… ) das funções de Green do OHS: η= G ( D) 1 m D E 1 Γ − ( xb , xa ; E ) = − 2 π ω 2 ω 2π ×D D E − + 2 ω D −1 2 1 ∂ ∂ mω ξ −η 2 + 2 ∂η η − ξ ∂ξ D −1 2 2 mω 2mω ξ D 1 E − η . − + 2 ω 103 IV.4. Quantização Funcional de Campos Escalares IV.4.1. Funções de Correlação Para trabalhar diretamente com integração funcional, precisamos de uma fórmula funcional para calcular funções de correlação. Consideremos o objeto T 4 D φ x φ x φ x exp ( ) ( ) ( ) i ∫ d xL (φ ) , 1 2 ∫ −T com as condições de contorno da integração sendo φ ( −T , x ) = φa ( x ) e φ (T , x ) = φb ( x ) , para certos φa e φb . Gostaríamos de relacionar essa quantidade acima à função de correlação de dois pontos Ω TφH ( x1 ) φH ( x2 ) Ω . (Para distinguir operadores de números usuais, escrevemos o operador no formalismo de Heisenberg com um subscrito explícito: φH ( x ) ). De forma similar, φS ( x ) denotará o operador no formalismo de Schrödinger). Podemos fatorar o funcional acima como ∫ Dφ ( x ) = ∫ Dφ ( x ) ∫ Dφ ( x ) 1 2 φ φ O funcional principal ∫ Dφ ( x ) ( ( ∫ x10 , x x20 , x ) =φ ( x ) ) =φ ( x ) φ ( x) . 1 2 está agora vinculado aos tempos x10 e x20 , além dos pontos extremos −T e T , porém devemos integrar separadamente sobre as configurações intermediárias φ1 ( x ) e φ2 ( x ) . Após essa decomposição, os fatores extras φ ( x1 ) e φ ( x2 ) se transformam em φ1 ( x1 ) e φ1 ( x2 ) , e podem ser extraídos da integral. A integral principal é então fatorada em três integrais, cada uma delas correspondendo a uma amplitude de transição. Os tempos x10 e x20 estarão ordenados automaticamente: se x10 < x20 , teremos a expressão resultante ∫ Dφ1 ( x )∫ Dφ2 ( x ) φ1 ( x1 )φ2 ( x2 ) φb e ( − iH T − x20 ) φ2 φ2 e ( − iH x20 − x10 ) φ1 φ1 e ( − iH T + x10 ) φa . Podemos transformar o campo φ1 ( x1 ) em um operador de Schrödinger, usando que φS ( x1 ) φ1 = φ1 ( x1 ) φ1 . A relação de completeza ∫ Dφ 1 φ1 φ1 = 1 nos permite agora eliminar o estado intermediário φ1 . Procedendo da mesma forma com φ2 , obteremos − iH T − x − iH x − x ) − iH x +T φb e ( )φS ( x2 ) e ( φS ( x1 ) e ( ) φa . 0 2 0 2 0 1 1 0 104 A maioria dos fatores exponenciais se combina com os operadores de Schrödinger, produzindo operadores de Heisenberg. No caso em que x10 > x20 , basta inverter a ordem entre x10 e x20 . Podemos escrever então a última expressão como φb e−iHT T {φH ( x1 ) φH ( x2 )} e−iHT φa . Esta expressão é quase idêntica à função de correlação de dois pontos. Para torná-la mais aproximadamente igual, fazemos o limite T → ∞ (1 − iε ) . Assim como na seção 4.2, este recurso opera a extração do estado de vácuo 0 a partir de φa e φb (desde que esses estados tenham intercessão não-nula com 0 , o que estamos supondo que ocorra). Por exemplo, decompondo φa nos auto-estados n de H , temos que e −iHT φa = ∑ e− iEnT n n φa → 0 φa e T →∞ (1−iε ) − iE0 ⋅∞ (1−iε ) 0 . n Assim como na seção 4.2, obtivemos uma fase estranha e fatores superpostos. Mas podemos cancelá-los, se dividirmos essa expressão pela expressão inicial sem os campos extras φ ( x1 ) e φ ( x2 ) . Obtemos assim uma fórmula simples para a função de dois pontos, que será 0 T φH ( x1 ) φH ( x2 ) T 4 D φ x φ x φ x exp ∫ ( ) ( 1 ) ( 2 ) i −∫T d xL (φ ) . 0 = lim T →∞ (1− iε ) T 4 ∫ Dφ ( x ) exp i −∫T d xL (φ ) Esta é a nossa esperada fórmula para a função de correlação de dois pontos, em termos de integrais funcionais. Para construir funções de correlação de ordem superior, basta acrescentar fatores φ ( xi ) adicionais em ambos os lados da equação. A próxima tarefa é calcular várias funções de correlação diretamente a partir do lado direito da última fórmula. Isto é, usaremos essa equação para deduzir as regras de Feynman para uma teoria de campo escalar. Calcularemos em seguida a função de dois pontos da teoria de Klein-Gordon livre, generalizando depois para ordens mais altas. Em primeiro lugar, vamos considerar a ação de um campo escalar real sem interação 2 1 1 S0 = ∫ d 4 x L0 = ∫ d 4 x ( ∂ µφ ) − m2φ 2 . 2 2 Como L0 é quadrática em φ , essas integrais funcionais tomam a forma de integrais gaussianas generalizadas e de dimensão infinita. Portanto, poderemos calculá-la exatamente e em detalhe, ainda que não da maneira mais elegante. Definiremos 105 primeiro a integral D φ sobre configurações de campo, considerando a integral contínua como um limite de um grande, porém finito, número de integrais. Trocaremos então as variáveis φ ( x ) , definidas sobre um continuum de pontos, por variáveis φ ( xi ) , definidas sobre os pontos xi , vértices das malhas quadradas de uma rede. Chamaremos o espaçamento (igual) das malhas de ε , o volume do espaço-tempo quadridimensional de L4 , e definiremos, a menos de uma constante irrelevante, Dφ = ∏ dφ ( xi ) . i Os valores de campo φ ( xi ) podem ser representados por uma série de Fourier discreta φ ( xi ) = 1 V ∑e ik n ⋅ xi φ ( kn ) , n onde knµ = 2π n µ L , sendo n µ um inteiro, kn < π ε , e V = L4 . Os coeficientes de Fourier φ ( k ) são complexos. Entretanto, φ ( x ) é real, e logo aqueles coeficientes devem obedecer à condição φ ∗ ( k ) = φ ( −k ) . Consideraremos como variáveis independentes as partes reais e imaginárias de cada φ ( kn ) , sendo kn0 > 0 . A mudança de variáveis dos φ ( xi ) originais para esses novos φ ( kn ) é unitária, logo podemos reescrever a integral como Dφ ( x ) = ∏ d Re φ ( kn ) d Im φ ( kn ) . kn0 > 0 Mais tarde, faremos o limite L → ∞ , ε → 0 . O efeito desse limite é converter somas discretas e finitas sobre kn em integrais contínuas sobre k : 1 V ∑ n →∫ d 4k ( 2π ) 4 . Uma vez definida a “medida” de integração, calculemos a integral sobre φ . A ação pode ser reescrita em termos dos coeficientes de Fourier na forma ∫d 4 2 2 1 1 1 1 x ( ∂ µφ ) − m2φ 2 = − ∑ ( m2 − kn2 ) φ ( kn ) = 2 V n 2 2 =− 1 2 2 m2 − kn2 ) ( Re φn ) + ( Im φn ) , φn ≡ φ ( kn ) . ( ∑ V kn0 >0 106 ( A quantidade ( m 2 − kn2 ) = m 2 + k n − ( k n0 ) 2 2 ) será positiva na medida em que k 0 n não seja muito grande. Trataremos essa quantidade como positiva, ou, mais precisamente, a mesma será calculada por continuação analítica da região em que kn > kn0 . O denominador da expressão para a função de Green de dois pontos encontrada anteriormente tomará a forma de um produto de integrais gaussianas: 1 D φ exp iS = d Re φ d Im φ exp [ ] [ ] [ ] − ∏ n n 0 ∫ k 0 >0 ∫ V n ∑ (m kn0 > 0 2 2 − kn2 ) φn 2 2 i i = ∏ ∫ d [ Re φn ] ex − ( m2 − kn2 ) ( Re φn ) ∫ d [ Im φn ] ex − ( m2 − kn2 ) ( Im φn ) V V kn0 > 0 =∏ kn0 > 0 −iπ V m 2 − kn2 −iπ V −iπ V =∏ . 2 2 m − kn m 2 − kn2 kn O uso de fórmulas de integrais gaussianas quando o expoente aparenta ser puramente imaginário se justifica quando observamos que a integração deve ser feita ao longo de um contorno que sofre uma rotação no plano complexo, no sentido horário: t → t − iε . O que significa que devemos fazer também as substituições k 0 → k 0 (1 + iε ) , e, em particular, ( k 2 − m 2 ) → ( k 2 − m 2 + iε ) , em todas as equações integrais. O fator iε assegura a necessária convergência das integrais gaussianas, e define também as condições de contorno, ou seja, a direção da continuação analítica necessária para definir as raízes quadradas acima. Para clarificar melhor as coisas, consideremos agora uma integral gaussiana geral análoga, dada por ∏ ∫ d ξ k exp −ξi Bijξ j , k onde B é uma matriz simétrica com autovalores bi . Para calcular esta integral, fazemos ξi = Oij x j , onde O é a matriz ortogonal de autovetores que diagonaliza B . Fazendo a mudança de variáveis de ξ i para os coeficientes xi , teremos 2 ∏ ∫ d ξ k exp −ξi Bijξ j = ∏ ∫ dxk exp −∑ bi xi = ∏ i i k k =∏ i π bi = const × [ det B ] −1 2 ( ∫ dx exp −b x ) i 2 i i . 107 A analogia fica mais clara ainda se integrarmos por partes, a partir da ação de KleinGordon, resultando na expressão S0 = 1 4 d x φ ( −∂ 2 − m2 ) φ + ( termo de superfície ) . ∫ 2 A matriz B corresponde então ao operador (∂ 2 + m 2 ) , e podemos escrever formalmente esse resultado como ∫ Dφ e iS0 = const × det ( m2 + ∂ 2 ) −1 2 . Este objeto é conhecido como um determinante funcional. O cálculo da função de Green de dois pontos para a ação de Klein-Gordon, após se fazer as expansões de Fourier do numerador e do denominador para o caso discreto, e efetuando o limite contínuo L → ∞ , ε → 0 , fornece o resultado exato (inclusive no termo + iε ) 0 T φ ( x1 ) φ ( x2 ) 0 = ∫ d 4k ( 2π ) 4 ie − ik ( x1 − x2 ) = ∆ F 12 = ∆ F ( x1 − x2 ) , k 2 − m 2 + iε onde ∆ F é o propagador de Feynman para o campo de Klein-Gordon. IV.5. A Analogia entre Teoria Quântica dos Campos e Física Estatística A rotação de Wick t → −it nas exponenciais das integrais funcionais, que resulta na prescrição iε necessária ao propagador de Feynman, equivale, no espaço de configuração, à seguinte relação entre produtos de vetores, respectivamente, no espaço de Minkowski e no espaço euclidiano: x2 = t 2 − x → − ( x0 ) − x = − x E . 2 2 2 2 É possível mostrar que a continuação analítica das variáveis temporais produz, para toda função de Green de uma teoria quântica de campos, uma função de correlação invariante quanto à simetria rotacional do espaço euclidiano quadridimensional. A rotação de Wick de uma teoria em TQC resulta numa formulação euclidiana correspondente a uma teoria em Mecânica Estatística. Por exemplo, a ação de teoria φ 4 acoplada a uma fonte J é dada por 2 1 λ 4 4 1 d x L + J φ = d x ∂ φ − m2φ 2 − φ 4 + J φ , ( ) ( ) µ ∫ ∫ 2 2 4! 108 que, após uma rotação de Wick, assume a forma ∫d 4 2 1 λ 1 x E ( LE − J φ ) = i ∫ d 4 x E ( ∂ µEφ ) + m2φ 2 + φ 4 − J φ . 2 4! 2 Esta expressão é idêntica à da função G , de energia livre de Gibbs, para um ferromagneto, na teoria de Landau: onde s ( x ) é a densidade local de spin, T ( TC ) é a temperatura (crítica) e H é a intensidade de um campo magnético externo. IV.6. Quantização Funcional do Campo Eletromagnético (campo de Maxwell) Consideremos a integral funcional ∫ DAe iS [ A] , onde S [ A] é a ação para o campo eletromagnético, e a integração se dá sobre o produto das medidas de cada uma das componentes ( DA ≡ DA0 ⋅ DA1 ⋅ DA2 ⋅ DA3 ) . Integrando por partes e expandindo o campo como uma integral de Fourier, podemos escrever a ação como 2 1 1 SM = ∫ d 4 x − ( Fµν ) = ∫ d 4 x Aµ ( x ) ( ∂ 2 g µν − ∂ µ ∂ν ) Aν ( x ) 4 2 = 1 d 4k Aµ ( k ) ( − k 2 g µν + k µ kν ) Aν ( − k ) . 2 ∫ ( 2π ) 4 Esta expressão se anula quando A µ ( k ) = kµα ( k ) , para qualquer função escalar α ( k ) . Logo, para este conjunto infinito de configurações de campo, o integrando da integral funcional é igual a 1, e a integral diverge. Ou, vendo de outra forma equivalente, a equação (∂ g 2 µν ρ ( 4) − ∂ µ ∂ν ) ∆νρ ( x − y) , F ( x − y ) = iδ µ δ ou sua transformada 109 ( −k 2 ρ g µν + k µ kν ) ∆ νρ F ( x − y ) = iδ µ , que definem o propagador de Feynman para o fóton, ∆νρ F , nenhuma das duas possui solução, uma vez que a matriz 4 × 4 representada por ( −k 2 g µν + kµ kν ) é singular. Estas dificuldades se devem precisamente à invariância de calibre do campo. Observe-se que o tensor de campo Fµν (e, logo, a lagrangiana L 0, é invariante sob uma transformação geral de calibre da forma 1 Aµ ( x ) → Aµ ( x ) + ∂ µα ( x ) . e 1 Os modos problemáticos são aqueles para os quais Aµ ( x ) = ∂ µα ( x ) , isto é, aqueles e que são equivalentes em calibre a Aµ ( x ) = 0 . A integral funcional é mal definida porque estamos integrando repetidamente sobre uma infinidade contínua de configurações de campo fisicamente equivalentes. Para resolver o problema, precisamos isolar a parte da integral funcional que interessa, em que cada configuração física é contabilizada apenas uma vez. E podemos fazer exatamente isto, por meio de um artifício engenhoso devido a Fadeev e Popov. Seja G ( A ) uma determinada função que queremos igualar a zero como condição de fixação de calibre, como, por exemplo, no calibre de Lorentz, G ( A ) = ∂ µ Aµ . Podemos obrigar a integral funcional a considerar somente as configurações em que G ( A ) = 0 através da introdução de uma função delta δ ( G ( A ) ) , que representa um produto infinito de funções delta, uma para cada ponto do espaço de integração. Faremos isso introduzindo uma representação funcional da identidade δ G ( Aα ) , I = ∫ Dα ( x )δ ( G ( A ) ) det δα onde Aα representa o campo transformado de calibre 1 Aµα ( x ) = Aµ ( x ) + ∂ µα ( x ) . e A identidade funcional acima nada mais é que a generalização ao contínuo da identidade para vetores discretos n -dimensionais δg n I = ∏ ∫ dai δ ( ) ( g ( a ) ) det i δa i j . 110 No calibre de Lorentz, vale a relação G ( Aα ) ∂ µ Aµ + (1 e ) ∂ 2α , fazendo com que o ( ) determinante funcional det δ G ( Aα ) δα seja igual a det ( ∂ 2 e ) . A única propriedade relevante deste determinante para a presente discussão é que o mesmo independe de A , e, logo, podemos tratá-lo como uma constante dentro da integral funcional. Após a inserção da identidade acima no funcional, resulta que δ G ( Aα ) Dα ∫ DAeiS [ A]δ G ( Aα ) . det δα ∫ ( ) Efetuando a mudança de variáveis A → Aα , que equivale a uma translação, DA = DAα . E também, pela invariância de calibre, S [ A] = S Aα . Como Aα se transformou, portanto, numa simples variável muda de integração, podemos renomeá-la como A : δ G ( Aα ) iS [ A] Dα ∫ DAeiS [ A]δ ( G ( A ) ) . D Ae = det ∫ δα ∫ A integral funcional sobre A , por força da atuação da função delta, está restrita apenas às configurações de campo fisicamente não-equivalentes, como era desejado. A integral divergente sobre α ( x ) resulta apenas num fator multiplicativo infinito. Devemos agora especificar uma função de fixação de calibre G ( A ) , para prosseguir o cálculo. Vamos escolher a classe das funções genéricas G ( A) = ∂ µ Aµ ( x ) − ω ( x ) , onde ω ( x ) pode ser qualquer função escalar. Igualando esta função G ( A ) a zero, obtemos uma generalização da condição de calibre de Lorentz. O determinante ( ) funcional é o mesmo que no calibre de Lorentz, det δ G ( Aα ) δα = det ( ∂ 2 e ) . A nova forma da integral funcional será então ∫ DAe iS [ A] 1 = det ∂ 2 e ( ∫ Dα ) ∫ DAe [ ]δ ( ∂ iS A µ Aµ ( x ) − ω ( x ) ) . Esta igualdade vale para toda função ω ( x ) , logo continuará válida se substituirmos o termo à direita por qualquer combinação linear, normalizada apropriadamente, de diferentes funções ω ( x ) . E, para finalizar, faremos a integração sobre todas as ω ( x ) , usando como peso uma função gaussiana centralizada em ω = 0 . Desta forma, a expressão acima será transformada em 111 2 1 4 ω N ( ξ ) ∫ Dω exp −i ∫ d x det ∂ 2 2ξ e 1 = N ( ξ ) det ∂ 2 e ( ∫ Dα ) ∫ DAe [ ]δ ( ∂ iS A µ Aµ ( x ) − ω ( x ) ) ( ∫ Dα ) ∫ DAe [ ] exp −i ∫ d x 21ξ ( ∂ A ) , iS A µ 4 2 µ onde usamos a função delta para integrar sobre ω ( x ) , e N (ξ ) é uma constante de normalização irrelevante,. Podemos escolher ξ como sendo qualquer constante finita. O que fizemos, na verdade, foi adicionar um novo termo − ( ∂ µ Aµ ) 2ξ à lagrangiana. 2 Trabalhamos até aqui somente com o denominador da fórmula para funções de correlação i T d 4 xL D A O A exp ( ) ∫ ∫−T . 0 T O ( A ) 0 = lim T T →∞ (1−ε ) i d 4 xL exp D A ∫ ∫−T As mesmas manipulações podem ser feitas no numerador, desde que o operador O ( A ) seja invariante de calibre (caso contrário, a mudança de variáveis A → Aα não dará resultado). Assumindo esta condição, a função de correlação será 0 T O ( A ) 0 = lim 2 1 µ d 4 x L − ∂ Aµ ) ( −T 2ξ . 2 T 4 1 µ ∫ DA exp i ∫−T d x L − 2ξ ( ∂ Aµ ) ∫ DAO ( A) exp i ∫ T →∞ (1−ε ) T Note-se que os fatores multiplicativos infinitos foram cancelados na divisão, e o único resultado desse procedimento foi o novo termo extra em ξ , que foi adicionado à lagrangiana de Maxwell. Este termo é exatamente o que será necessário para, agora, obter o propagador do fóton, pois agora a equação para o mesmo será 2 1 µ ν −k g µν + 1 − k k ξ νρ ρ ∆ F ( k ) = iδ µ , que tem como solução ∆ Fµν ( k ) = −i 2 k + iε µν k µ kν g − 1 − ξ ( ) k2 , e que é a expressão procurada para o propagador de Feynman para o fóton. O valor da constante ξ que define o calibre será escolhido de forma adequada às simplificações do 112 cálculo específico a ser feito, como, por exemplo: ξ = 0 (calibre de Landau); ξ = 1 (calibre de Feynman); ξ = 3 (calibre de Yennie). O procedimento de Fadeev-Popov garante que o valor de qualquer função de correlação referente a operadores invariantes de calibre calculados a partir de diagramas de Feynman seja independente do valor de ξ utilizado (uma vez, é claro, que o mesmo valor constante de ξ seja usado de forma consistente). IV.7. Quantização Funcional do Campo Espinorial IV.7.1 Cálculo Geométrico, ou Álgebra de Grassmann Para o cálculo das funções de correlação de campos espinoriais, os quais obedecem a relações canônicas de anticomutação, precisaremos usar números que obedeçam a uma álgebra dotada de propriedades de anticomutatividade, conhecida como Álgebra de Grassmann, criada e desenvolvida por Hermann Günther Grassmann, a partir de generalizações algébricas de produtos de segmentos de reta orientados, em 1843. A generalização dos resultados de Grassmann por William Kingdon Clifford, em 1878, resultou na Álgebra de Clifford, também chamada de Álgebra Geométrica, muito usada hoje em diferentes áreas de pesquisa em física matemática. Def. AIV.7.1.1 – Define-se a álgebra cujos geradores x1 , x2 ,, xn pertencem a um espaço vetorial e possuem um produto exterior que satisfaz as relações xi xk + xk xi ≡ { xi , xk } = 0 como uma álgebra de Grassmann com n geradores, também chamados de números de Grassmann, sendo notada como Gn . Em particular, xi2 = 0 . Segue-se da definição que Gn é um espaço linear com dimensão 2n . Todo elemento f ( x ) da álgebra Gn pode ser representado na forma de uma combinação linear de monômios, ou multivetores, de acordo com a seguinte expressão: f ( x ) = f 0 + ∑ f1 ( k ) xk + ∑ f 2 ( k1 , k2 ) xk1 xk2 + + ∑ f n ( k1 , , kn ) xk1 xkn , k ki ki que é única somente com a condição de que os coeficientes f p ( k1 , , k p ) sejam antissimétricos, trocando de sinal com a permutação de qualquer par de argumentos. 113 Def. AIV.7.1.2. – Definimos as medidas de integração de Grassman dx1, dx2 ,, dxn , a partir dos geradores da álgebra, naturalmente sujeitas às relações de anticomutação {dxi , dxk } = { xk , dxi } = 0 , e a integral sobre a álgebra de Grassmann será definida pelas duas relações ∫ dx =0 i ∫ x dx e i i =1. A integral múltipla será sempre calculada da direita para a esquerda, como abaixo: ∫ x x dx dx = ∫ x dx ∫ x dx i k i k i i k k =1 Desta definição de integral resulta que, para um elemento arbitrário f ( x ) da álgebra Gn , representado pela série acima, teremos que ∫ f ( x ) dx dx n 1 = n ! f n (1, , n ) . Podemos sempre trabalhar com números de Grassmann complexos, compostos, como usual, de uma parte real e outra imaginária, e com a operação de conjugação definida como ( xi xk ) ∗ ≡ xk∗ xi∗ = − xi∗ xk∗ . Para a integração sobre o espaço complexo, definimos os números de Grassmann independentes x= x1 + ix2 x∗ = e 2 x1 − ix2 2 , e podemos adotar de forma consistente a mesma convenção da integração múltipla: ∫ ( x x ) dxdx = ∫ x dx ∫ xdx = 1 . ∗ ∗ ∗ ∗ Calculando agora uma integral gaussiana generalizada que envolve uma matriz hermitiana B com autovalores bi , teremos que − xi∗ Bij x j − x∗b x ∗ = ∏ ∫ dxi∗ dxi e ∑ i i i i = ∏ bi = det B . ∏ ∫ dxi dxi e i i i Se a integral fosse sobre números usuais, o resultado seria ( 2π ) n ( det B ) . Da mesma forma, pode-se mostrar que 114 ∗ 1 ∗ ∗ − xi Bij x j det B . = ∏ ∫ dxi dxi xk xl e Bkl i Em resumo, integrais gaussianas sobre variáveis de Grassmann, a menos de fatores constantes, e de o determinante não estar no denominador, mas sim no numerador do resultado, se comportam da mesma forma que integrais gaussianas sobre variáveis usuais. IV.7.2. – O funcional gerador para o campo de Dirac O funcional gerador para o campo de Dirac é definido como W [η ,η ] = ∫ Dψ Dψ exp i ∫ d 4 x ψ ( i ∂ − m )ψ + ηψ + ψη , onde η ( x ) é um campo grassmanniano como fonte. Com a intenção de completar o quadrado, fazemos agora uma substituição por translação, ao introduzir um campo ψ ′ ( x ) ≡ ψ ( x ) − i ∫ d 4 x S F ( x − y )η ( y ) , onde S F ( x − y ) = 0 Tψ ( x )ψ ( y ) 0 = ∫ d 4x ( 2π ) 4 ie − ik ( x − y ) , k − m + iε para obter a expressão mais simples W [η ,η ] = W [ 0 ] ⋅ exp − ∫ d 4 xd 4 yη ( x ) S F ( x − y )η ( y ) . Para obter as funções de correlação, precisamos fazer as derivadas funcionais de W com respeito a η e η , depois de definirmos uma convenção de sinal para as derivadas funcionais com números de Grassmann anticomutativos θ e η , que será d d θη = − ηθ = −θ . dη dη De acordo com a definição acima de W , por exemplo, a função de dois pontos é dada pela expressão 0 Tψ ( x )ψ ( y ) 0 = δ δ −i +i W [η ,η ] η ,η = 0 , W [ 0 ] δη ( x ) δη ( y ) 1 115 que, após calculada, com os devidos cuidados com os sinais, verifica-se verifica reproduzir exatamente o propagador de Feynman fermiônico S F ( x − y ) , como esperado. IV.8. QED: Eletrodinâmica Quântica A lagrangiana da QED é dada por LQED = ψ ( i ∂ − m )ψ − 2 2 1 1 Fµν ) − eψγ µψ Aµ = ψ ( iD − m )ψ − ( Fµν ) , ( 4 4 onde Dµ = ∂ µ + ieAµ é a derivada covariante. Para calcular as funções de correlação, faz faz-se se a expansão da exponencial do termo de interação: exp i ∫ L = exp i ∫ ( L0 − eψγ µψ Aµ ) = exp i ∫ L0 1 − ie ∫ d 4 xψγ µψ Aµ + . Os dois termos da lagrangiana livre correspondem aos propagadores de Dirac e eletromagnético (no calibre de Feynman ξ = 1 ) ∫ ( 2π ) ie ( ) (propagador de férmion) p − m + iε − ip ⋅ x − y d4x 4 − ip⋅( x − y ) d 4 x −i g µν e ∫ ( 2π )4 q 2 + iε (propagador de fóton). O termo de interação corresponde ao vértice da QED 116 −ieγ µ ∫ d 4 x . Das integrações sobre os vértices são obtidas as funções delta de conservação do momento linear total, as quais serão usadas na maioria das integrações dos propagadores de cada momento linear. IV.9. Determinantes Funcionais Para finalizar o presente módulo, módulo, vamos definir mais precisamente e expor com mais detalhes o objeto a que chamamos de determinante funcional, de uso frequente em TQC. Consideremos o funcional ℑ = ∫ Dψ Dψ exp i ∫ d 4 x ψ ( iD − m )ψ , onde Dµ = ∂ µ + ieAµ , e Aµ ( x ) é um dado potencial externo. Formalmente, essa expressão é um determinante funcional, que podemos representar nas formas abreviadas i ℑ = det ( iD − m ) = det ( i ∂ − m − eA ) = det ( i ∂ − m ) ⋅ det 1 − −ieA ) . ( i∂ − m A última forma é o produto de uma constante infinita det ( i ∂ − m ) por um segundo termo que contém a dependência do determinante em relação ao campo externo Aµ ( x ) . Veremos agora, usando apenas identidades padrão usadas na álgebra linear, que essa dependência é bem-definida, definida, e exatamente equivalente à soma de diagramas de vácuo. Tomando uma matriz B com autovalores bi , podemos escrever o seu determinante como det B = ∏ bi = exp ∑ ln bi = exp Tr ( ln B ) , i i onde o logaritmo de uma matriz se define através de sua expansão em série de potências. Aplicando esta identidade ao segundo termo do determinante funcional anterior, e expandindo o logaritmo em série, obtemos 117 n ∞ 1 i i det 1 − ( −ieA ) = exp ∑ − n Tr i ∂ − m ( −ieA ) . i∂ −m n =1 Uma forma equivalente nte de calcular o determinante é simplesmente aplicar as regras de Feynman adequadas, a partir do funcional ℑ original. Expandindo o termo de interação, obtemos a regra de vértice = −ieγ µ ∫ d 4 x Aµ ( x ) . O determinante resulta ser uma soma de diagramas de Feynman: A série é exponenciada, uma vez que os diagramas desconexos são produtos de grafos desconexos (observando-se se sempre os fatores de simetria gerados pela repetição de grafos topologicamente equivalentes). Por exemplo, Para exemplificar o cálculo, vamos tomar tomar o enésimo diagrama do expoente acima. Há um fator de −1 gerado pelo laço fermiônico, e um fator de simetria de 1 n , uma vez que podemos fazer n vezes a rotação das interações em torno do diagrama, sem que o mesmo se altere (atenção! Como a ordem cíclica dos dos pontos de interação é relevante, o fator não é igual a 1 n ! ). O diagrama resultante será então exatamente igual ao expoente de ordem n encontrado na expressão anterior do determinante funcional: 118 =− 1 dx1 dxn tr ( −ieA ( x1 ) ) S F ( x2 − x1 ) ( −ieA ( xn ) ) S F ( x1 − xn ) n∫ n 1 i = − Tr ( −ieA ) , n i ∂ − m onde tr [] representa o traço de matrizes de Dirac, com suas propriedades características em quatro dimensões (v., p.ex., Peskin & Schroeder, apêndice A.3, “Numerator Algebra”). 119 Lista de exercícios do Módulo A Prof. Armando F. Rodrigues - 29/09/09 Ex. A-1. Usando a abordagem por integral de trajetória, determinar a diferença de fase entre as trajetórias P1 e P1 no dispositivo experimental abaixo (efeito Aharonov-Bohm). Ex. A-2. - Calcular a expressão de δ 2 [ J ] na teoria em que V = − λ 4! φ4 . ============================================================== 120 V. O Formalismo de Tempo Imaginário V.1. Sistemas em equilíbrio: tempo imaginário. V.1.1. Uma Breve Revisão de Termodinâmica Estatística no Equilíbrio Costuma-se estudar o comportamento estatístico de um sistema quântico no equilíbrio térmico após a escolha de um ensemble apropriado às características desse sistema. De forma geral, é definida uma matriz densidade de estados como ρ ( β ) = e− β H , onde β = 1 T representa o inverso da temperatura de equilíbrio (na verdade, estamos considerando a relação clássica β = 1 k BT num sistema de unidades em que = k B = 1 ), e o operador H corresponderá ao hamiltoniano apropriado ao particular ensemble adotado. Teremos, por exemplo, no caso de um ensemble grão-canônico, H = H − µN , onde H e N representam, respectivamente, o operador hamiltoniano e o operador número para o sistema específico, e µ é o potencial químico. Já por outro lado, para um ensemble canônico, considerado como o caso particular de um ensemble grão-canônico em que o potencial químico é nulo, teremos simplesmente H = H . Uma vez que, na presente discussão geral, as propriedades qualitativas de um sistema a temperatura finita independem da escolha do ensemble, este será considerado de natureza arbitrária. Para o tratamento quantitativo de exemplos específicos, porém, será sempre necessária a adoção de um ensemble apropriado ao problema. Def. V.1.1.1. A função de partição de um sistema com essa matriz de densidade é definida como Z ( β ) = Tr ρ ( β ) = Tr e − β H , onde o traço da matriz densidade é a soma sobre os valores esperados em alguma base completa que diagonalize a matriz. Consequentemente, o ensemble médio de qualquer observável A passa a ser definido como A Tr e − β H A = Z ( β ) Tr ρ ( β ) A = , Tr e − β H −1 β 121 e a média térmica da função de correlação de dois operadores quaisquer A e B , definidos em coordenadas diferentes, também passa a ser AB β = Z −1 ( β ) Tr ρ ( β ) AB . Iremos agora definir operadores numa formulação de Heisenberg um tanto modificada, a partir de um ensemble dado e um conjunto de operadores de Schrödinger, da seguinte forma: dizemos que, para um operador de Schrödinger arbitrário A , o operador de Heisenberg correspondente será dado por AH ( t ) = eiHt Ae−iHt . Aplicando seguidamente esta definição, assim como as propriedades cíclicas do traço, podemos obter a seguinte expressão, válida para a função de correlação térmica genérica de dois operadores de Heisenberg AH ( t ) e BH ( t ) : AH ( t ) BH ( t ′) β = Z −1 ( β ) Tr ρ ( β ) AH ( t ) BH ( t ′) = Z −1 ( β ) Tr e− β H AH ( t ) BH ( t ′) = Z −1 ( β ) Tr e− β H AH ( t ) e β H e− β H BH ( t ′) = Z −1 ( β ) Tr AH ( t + iβ ) e− β H BH ( t ′) = Z −1 ( β ) Tr e − β H BH ( t ′) AH ( t + iβ ) = BH ( t ′ ) AH ( t + i β ) β . A equação resultante, no caso em que exprime a lei de permutação dos valores esperados no vácuo (v.e.v.) de dois operadores, reproduz as conhecidas condições KMS, ou condições de Kubo-Martin-Schwinger, de grande utilidade no estudo de estados quânticos em equilíbrio térmico. É importante observar que essa equação é válida, independentemente das paridades grassmannianas dos operadores A e B ; isto é, vale tanto para operadores bosônicos como para fermiônicos. Em particular, podemos verificar que AH ( t ) AH ( t ′ ) β = AH ( t ′) AH ( t + iβ ) β . Esta última relação acarreta a periodicidade, ou antiperiodicidade, de várias funções de Green de dois pontos a temperatura finita. As condições KMS são também extremamente úteis no estudo do comportamento assintótico de vários elementos de matriz, assim como de relações de dispersão a temperatura finita. Cabe uma última ressalva: a propriedade cíclica do traço pode deixar de ser válida quando o traço diverge – como no caso de uma quebra espontânea de simetria, por exemplo -, e nestas condições o resultado acima não se aplica. 122 V.1.2. O Formalismo de Matsubara De modo geral, a função de partição de um sistema estatístico não pode ser calculada exatamente. A simples observação da expressão que define a função de partição deixa ver que até mesmo a expansão perturbativa em potências de uma constante de acoplamento é uma tarefa formidável, em primeiro lugar, porque envolve a soma dos valores esperados em todos os estados possíveis do espaço de Hilbert, e em qualquer teoria quântica de campos, o número desses estados é infinito. O formalismo de Matsubara (T. Matsubara, Progr. Theor. Phys. 14, 351 (1955)) fornece uma maneira de cálculo perturbativo da função de partição, usando um método diagramático análogo àquele empregado nas teorias quânticas de campos usuais a temperatura zero. Há mais de uma forma de se introduzir o formalismo de Matsubara, sendo a mais comum a que usa o método integral funcional. Por generalidade, vamos primeiramente apresentar o método de operadores, e em seguida o funcional. A pedra fundamental de ambas as construções, porém, é lançada pela constatação de que, da forma que é definida, a matriz densidade ρ ( β ) = e− β H pode ser formalmente considerada como um operador de evolução em que t → −iτ , ou seja, para tempos imaginários negativos. Daí a razão pela qual esse formalismo é conhecido como “formalismo de tempo imaginário”, e fica restrito a sistemas em equilíbrio, que não variam no tempo real. Da definição acima da matriz densidade observa-se que, se o hamiltoniano total H do sistema pode ser separado em uma parte livre e outra de interação H = H0 + H ′ , podemos escrever que HH = 0 + H′, e, neste caso a matriz densidade também pode ser escrita como ρ ( β ) = e − β H = ρ0 ( β ) S ( β ) , onde definimos ρ0 ( β ) ≡ e − β H , 0 e logo podemos também escrever ( H0 e H ′ não necessariamente comutam entre si) S ( β ) = e β H0 e− β H = ρ0−1 ( β ) ρ ( β ) . A matriz densidade, portanto, satisfaz as seguintes equações (análogas às equações de Bloch, que descrevem o tempo de relaxação das componentes transversais da magnetização de um sistema até atingir o equilíbrio térmico), que podem ser vistas como a sua equação de evolução no intervalo 0 ≤ τ ≤ β : 123 ∂ρ0 (τ ) ∂τ ∂ρ (τ ) ∂τ = − H0 ρ0 (τ ) = − Hρ (τ ) = − ( H0 + H ′ ) ρ (τ ) . Segue-se daí que a equação de evolução satisfeita por S (τ ) é dada por ∂S (τ ) ∂ρ 0−1 (τ ) ∂ρ (τ ) = ρ (τ ) + ρ 0−1 (τ ) = ρ 0−1 (τ ) H0 ρ (τ ) − ρ 0−1 (τ ) Hρ (τ ) ∂τ ∂τ ∂τ = ρ0−1 (τ )( H0 − H ) ρ0 (τ ) ρ0−1 (τ ) ρ (τ ) = − H I′ (τ ) S (τ ) , onde definimos H I′ (τ ) = ρ0−1 (τ ) H ′ρ0 (τ ) = eτ H0 H ′e−τ H0 . Esta última relação é análoga à que define, na teoria de campos a temperatura zero, uma representação de interação de um operador através da transformação AI (τ ) = eτ H0 Ae −τ H0 . Uma transformação deste tipo não é necessariamente unitária para τ real, e, portanto, o operador adjunto de um operador transformado não coincide em geral com o operador transformado do adjunto. Entretanto, caso τ fosse uma variável complexa, essa transformação seria unitária para valores imaginários de τ . Por este motivo, o formalismo de Matsubara também é conhecido como o formalismo de tempo imaginário. Uma outra forma de ver seria notar que o operador que implementa a transformação de evolução coincide com os usuais se fizermos a identificação t = −iτ , que equivale a uma rotação de Wick sobre o eixo imaginário. Cabe ressaltar que, mesmo após essa rotação, o campo permanece hermitiano, uma vez que se considere a definição de hermiticidade para coordenadas complexas, φ † ( z ) = φ ( z ∗ ) . Também a relação obtida anteriormente, ∂S (τ ) ∂τ = − H I′ (τ ) S (τ ) , já é conhecida da teoria de campos a temperatura zero, como simplesmente a equação de evolução, na representação de interação, do operador de evolução temporal. E que, uma vez integrada formalmente, resulta em β − dτ H I′ (τ ) S ( β ) = Tτ e ∫0 , onde Tτ indica a ordenação relativa à variável τ . A analogia com a expressão para a matriz S da teoria de campos a temperatura zero é quase total, a não ser pelo fato de que a integração no tempo agora se dá sobre um intervalo finito no eixo imaginário. 124 Assim como no caso a temperatura zero, podemos expandir a exponencial, e cada termo dessa expansão dará origem a um diagrama de Feynman – modificado -, e, desta forma, as quantidades térmicas poderão estar associadas a uma representação diagramática. Em particular, a generalização do teorema de Wick a temperatura finita pode ser feita sem maiores problemas, e mais, se definirmos, para τ 1 > τ 2 , τ − ∫ 1 dτ H I′ (τ ) −1 S (τ 1 ,τ 2 ) = Tτ e τ 2 = S (τ 1 ) S (τ 2 ) , Este operador satisfaz as mesmas propriedades de semigrupo do operador de evolução temporal a temperatura zero, que são S (τ ) = S (τ ,0) ; S −1 (τ ) = S ( 0,τ ) ; S (τ 1 ,τ 2 ) S (τ 2 ,τ 3 ) = S (τ 1 ,τ 3 ) , para τ 1 > τ 2 > τ 3 . Observe-se também que as funções de Green de dois pontos podem ser definidas na representação de Heisenberg, assumindo sempre que o campo φ seja complexo: Gβ (τ ,τ ′) = Tτ φH (τ ) φH† (τ ′ ) β = Z −1 ( β ) Tr e − β HTτ φH (τ ) φH† (τ ′ ) . O campo φH tanto pode ser bosônico como fermiônico. E vemos também, pela definição, que, se φ e φ † são operadores na representação de Schrödinger, φH (τ ) = eτ Hφ e−τ H , e φH† (τ ′) = eτ ′Hφ †e−τ ′H ≠ (φH (τ ′) ) , † conforme foi avançado anteriormente. Assim como a ordenação no tempo a temperatura zero, a ordenação em τ não é indiferente à paridade grassmaniana das variáveis de campo, e é definida como sendo Tτ φH (τ ) φH† (τ ) = θ (τ − τ ′ ) φH (τ ) φH† (τ ′ ) ± θ (τ ′ − τ ) φH† (τ ′ ) φH (τ ) , onde o sinal negativo no segundo termo diz respeito a campos fermiônicos. A relação entre a representação de interação e a representação de Heisenberg, no presente contexto, pode ser expressa como AH (τ ) = eτ H Ae −τ H = eτ H e −τ H0 AI (τ ) eτ H0 e −τ H = S −1 (τ ) AI (τ ) S (τ ) . Usando os dois últimos resultados e as propriedades de semigrupo de S (τ ) , podemos escrever a função de dois pontos, considerando 0 ≤ τ , τ ′ ≤ β , na forma Tr e− β HTτ S −1 (τ ) φI (τ ) S (τ ) S −1 (τ ′) φI† (τ ′ ) S (τ ′) Gβ (τ ,τ ′) = Tr e− β H 125 Tr e− β H0 S ( β ) Tτ S −1 (τ ) φI (τ ) S (τ ) S −1 (τ ′ ) φI† (τ ′ ) S (τ ′ ) = Tr e− β H0 S ( β ) Tr e− β H0 Tτ S ( β ) S −1 (τ ) φI (τ ) S (τ ) S −1 (τ ′ ) φI† (τ ′ ) S (τ ′ ) = Tr e− β H0 S ( β ) Tr e − β H0 Tτ φI (τ ) φI† (τ ′ ) S ( β ) = Tr e − β H0 S ( β ) Tτ φI (τ ) φI† (τ ′ ) S ( β ) = S ( β ) β ,0 β ,0 , onde usamos os seguintes fatos: i) como β é o valor mais alto, S ( β ) pode ser incluído no colchete de ordenação; ii) a ordem interna dos fatores não afeta a operação de ordenação Tτ . O subscrito “ 0 ” significa que os valores esperados são calculados num ensemble não-interagente. O resultado reproduz exatamente o que ocorre a temperatura zero. Além das semelhanças, cabe também ressaltar as diferenças para o caso de temperatura zero. A mais importante, para o fim proposto, é o fato de que a variável “tempo” τ é integrada num intervalo finito, o que nunca ocorre a temperatura zero em tempo real. V.1.3. As Frequências de Matsubara Antes de enfrentarmos o problema de construir e calcular diagramas a temperatura finita, lembremo-nos de que, em temperatura zero, o mesmo procedimento é muito mais fácil quando realizado sobre o espaço dos momentos lineares. Precisamos, porém, estar seguros das propriedades das funções de Green de dois pontos que serão usadas nos funcionais analíticos correspondentes aos diagramas. Em primeiro lugar, mostra-se com facilidade que, a partir da definição acima e da relação entre as representações de Heisenberg e de Schrödinger, as funções de Green de dois pontos dependem somente da diferença τ − τ ′ . Em segundo lugar, cada uma dessas variáveis tem valores em intervalos definidos, τ ≥ 0 e τ ′ ≤ β , e, consequentemente, o argumento das funções de dois pontos pertencerá ao intervalo −β ≤ τ − τ ′ ≤ β . Finalmente, considerando as propriedades cíclicas do traço e a definição de ordenamento temporal Tτ , podemos mostrar que Gβ (τ < 0 ) = ±Gβ (τ + β ) , ou, mais explicitamente, que no caso em que τ > 0 , 126 Gβ ( 0,τ ) = ± φH† (τ ) φH ( 0 ) β = ± φH ( β ) φH† ( 0 ) β = ±Gβ ( β ,τ ) . O sinal positivo corresponde às funções de Green bosônicas, e o negativo às fermiônicas. É interessante observar que este mesmo resultado pode ser obtido, após uma rotação de Wick, da relação KMS geral já mostrada acima. Prosseguindo, notamos agora que, como as funções de Green são definidas em um intervalo de tempo finito, a transformação de Fourier correspondente só admitirá frequências discretas, e podemos escrever as expressões gerais Gβ (τ ) = 1 ∑e β − iωnτ Gβ (ωn ) n Gβ (ωn ) = 1 β dτ eiωnτ Gβ (τ ) ∫ β − 2 onde ωn = nπ β , com n = 0, ±1, ±2,… Mas, mesmo que, a princípio, todos os modos inteiros sejam permitidos nessas expressões da transformada de Fourier, as condições de periodicidade (ou antiperiodicidade) satisfeitas pelas funções Gβ acima determinam que apenas modos inteiros pares contribuam para as funções de Green bosônicas, e apenas modos inteiros ímpares contribuam para as funções de Green fermiônicas, como será mostrado a seguir. A transformada de Gβ (τ ) , usando a relação Gβ (τ < 0 ) = ±Gβ (τ + β ) , é Gβ (ωn ) = =± 1 0 1 β dτ eiωnτ Gβ (τ ) + ∫ dτ eiωnτ Gβ (τ ) ∫ β − 2 2 0 1 0 1 β 1 0 1 β iωn (τ − β ) iωnτ iωnτ d τ e G τ + β + d τ e G τ = ± d τ e G τ + dτ eiωnτ Gβ (τ ) ( ) ( ) ( ) β β β ∫ ∫ ∫ ∫ β β − 0 − 0 2 2 2 2 β β 1 1 n = (1 ± e−iωn β ) ∫ dτ eiωnτ Gβ (τ ) = 1 ± ( −1) ∫ dτ eiωnτ Gβ (τ ) . 0 0 2 2 ( ) Vê-se então, de imediato, que, para bósons, Gβ ( ωn ) se anula para valores ímpares de n , enquanto que para férmions o mesmo ocorre para valores pares de n . Separando os dois casos, podemos dizer finalmente que as funções de Green de dois pontos têm as transformadas de Fourier, em relação à variável τ , dadas por Gβ (τ ) = Gβ (ωn ) = 1 β ∑e − iωnτ Gβ (ωn ) n 1 β dτ eiωnτ Gβ (τ ) ∫ − β 2 127 onde 2nπ β , para bósons ( 2n + 1) π β , para férmions ωn = Estas são as chamadas frequências de Matsubara (H. Ezawa, Y. Tomozawa e H. Umezawa, Nuovo Cimento 5, 810 (1957)). As coordenadas espaciais, por sua vez, têm as mesmas características de continuidade do que na teoria a temperatura zero, e, portanto, nada há de especial com a transformada de Fourier. Usando os mesmos valores acima para as freqüências, podemos escrever, no caso quadridimensional: Gβ ( x,τ ) = 1 ∑ β ∫ n d 3k ( 2π ) 3 β e − i (ωnτ − k ⋅x ) Gβ ( k , ωn ) = ∫ dτ ∫ d 3 x e ( i ωnτ −k ⋅x ) 0 Gβ ( k , ωn ) Gβ ( x,τ ) . Agora já podemos obter a forma do propagador para qualquer teoria. Sabemos, por exemplo, que para a teoria bosônica de Klein-Gordon, na assinatura de Minkowski ( +, −, −, − ) , a função de Green a temperatura zero satisfaz a equação (∂ µ ∂ µ + m 2 ) G ( x ) = −δ 4 ( x ) . Efetuando a rotação de Wick t → −iτ , ou p 0 → ip 4 , resulta que G → −G , e a equação correspondente será ∂2 2 2 3 2 + ∇ − m Gβ ( x,τ ) = −δ ( x ) δ (τ ) . ∂ τ Aplicando a transformada e usando uma expressão discreta da δ (τ ) , obtemos que a função de Green no espaço dos momentos vem a ser, neste caso, Gβ ( k , ωn ) = 1 , ω + k 2 + m2 2 n com os mesmos valores de freqüências bosônicas anteriormente encontrados. As funções de Green fermiônicas são obtidas de forma inteiramente análoga. É importante notar nesta última expressão que as funções de Green não possuem singularidades para valores reais das variáveis de energia e momento linear. A análise dos propagadores, ou funções de Green, no espaço dos momentos, simplifica consideravelmente os cálculos por diagramas. Na verdade, esses cálculos serão – ao menos qualitativamente – inteiramente paralelos aos cálculos a temperatura 128 zero. Por exemplo, os vértices de interação da teoria são definidos da mesma forma que no caso de temperatura zero. Somente as formas exatas dos propagadores serão diferentes, uma vez que serão responsáveis por exibir a dependência da temperatura, o que já será suficiente para introduzir novos comportamentos nos sistemas quânticos a temperatura finita. V.1.4. A Formulação Integral Funcional O formalismo de Matsubara, ou formalismo de tempo imaginário, pode ser facilmente entendido através de uma abordagem integral funcional. Recordemos que a amplitude de transição em uma teoria quântica de campos a temperatura zero possui a seguinte representação funcional φ ( x1 , t1 ) φ ( x 2 , t2 ) = φ1 e− iH (t −t ) φ2 = N ′∫ Dφ eiS , 1 2 onde φ é a variável de campo, N ′ é uma constante de normalização irrelevante, e a ação S é definida como sendo S [φ ] = ∫ dt ∫ d 3 xL , t1 t2 com L representando a lagrangiana apropriada para o sistema. A integral funcional, neste caso, é definida sobre as trajetórias que satisfazem φ ( x1 ,t1 ) = φ1 e φ ( x 2 ,t2 ) = φ2 , e os pontos nas extremidades são mantidos fixos, externos à integração. Basta ver agora que, se fizermos a identificação t1 − t2 = −i β , poderemos escrever a função de partição para qualquer sistema quântico como Z ( β ) = Tr e− β H = ∫ dφ1 φ1 e− β H φ1 = N ′∫ Dφ e− S E , onde S E está relacionada com a ação euclidiana no tempo imaginário da forma β S E = S E + βµ N = ∫ dτ ∫ d 3 xLE + βµ N , 0 sendo µ o potencial químico não-nulo do sistema. E, por fim, assume-se que as variáveis de campo satisfaçam as condições de periodicidade, ou antiperiodicidade, φ ( x, β ) = ±φ ( x, 0 ) , 129 conforme as mesmas sejam bosônicas ou fermiônicas, e as extremidades passam também a ser integradas, uma vez que as trajetórias passam a ser fechadas. Resulta dessas condições ições que o contorno de integração no plano complexo do tempo, neste formalismo, se dá ao longo do eixo imaginário negativo, da forma abaixo. A formulação da função de partição na abordagem integral funcional tem uma importância particular, no sentido de de que mostra o quanto as descrições das teorias de campos a temperatura zero e a temperatura finita se desenvolvem em paralelo – ao menos qualitativamente. As definições dos diagramas – 1PI, conexos, etc. – são exatamente as mesmas e podem todas ser obtidas obtidas a partir de uma expansão da integral funcional. A única diferença é que as variáveis de campo agora obedecem a condições de (anti) periodicidade, e, portanto, precisam ser expandidas nas bases apropriadas. Isto leva a níveis de energia discretos, e é instigante instigante observar que é um problema inteiramente análogo a se quantizar um sistema dentro de uma caixa, em mecânica quântica – só que desta vez se trata de uma caixa unidimensional na direção τ , com uma topologia do espaço-tempo tempo descrita por 3 × S 1 . Cabe ressaltar ar mais uma vez que o formalismo de Matsubara foi completamente desenvolvido para um contexto de sistemas em equilíbrio termodinâmico – tanto assim, que abrimos mão da variável tempo para adotar a variável temperatura. Logo, este método é ideal para o estudo estudo das propriedades estáticas e de equilíbrio de um sistema quântico. A dependência temporal, mesmo assim, pode ser introduzida através de uma continuação analítica não--trivial trivial e problemática, mas de qualquer forma, somente aplicável na descrição de evoluções evoluções ou desvios, de sistemas quânticos em equilíbrio térmico, que variem lentamente no tempo. Ou seja, este formalismo é totalmente inadequado ao estudo de fenômenos fora do equilíbrio, como, por exemplo, mudanças de fase; e é difícil de ser aplicado ao estudo estudo de relações dinâmicas, tais como as identidades de Ward das teorias de calibre. Mas serve bem para calcular quantidades relacionadas ao equilíbrio termodinâmico. Recapitulando brevemente: i) no formalismo de Matsubara, a função de partição tem uma representação esentação integral funcional que integra num intervalo finito de tempo a ação euclidiana do sistema original; ii) as variáveis de campos fundamentais desta ação euclidiana devem satisfazer condições de contorno (anti)periódicas, com período β ; iii) as regras as de Feynman desta teoria podem ser extraídas da integral funcional: os vértices são os mesmo da teoria euclidiana a temperatura zero, mas os propagadores agora correspondem aos inversos dos operadores da parte quadrática da lagrangiana, definida em um espaço paço de funções (anti)periódicas. Esta última característica faz com que o 130 propagador dependa da temperatura de uma forma não-trivial, de tal modo que o mesmo não possa ser simplesmente decomposto, ou fatorado, em uma parte apropriada apenas a temperatura zero e outra genuinamente dependente da temperatura. Essa decomposição do propagador será, por outro lado, uma propriedade das teorias a temperatura finita nos formalismos de tempo real. V.1.5. Representação Integral Funcional da Função de Partição Um forte motivo para se utilizar o formalismo integral funcional em teorias de campos é que o tratamento de fenômenos não-perturbativos como tunelamento, ínstantons, sólitons, teorias de calibre na rede, e outros, é desenvolvido de forma mais direta do que se fosse usado o formalismo canônico de operadores, também conhecido historicamente como método da segunda quantização. Especialmente no que se refere às teorias de calibre, a integração funcional tem se mostrado um método praticamente indispensável. Serão revistos em seguida alguns resultados sobre gases ideais relativísticos, bosônicos e fermiônicos. V.1.5.1. Amplitude de Transição para Bósons Seja φˆ ( x, 0 ) um operador na representação de Schrödinger no tempo t = 0 , e πˆ ( x, 0 ) o seu operador conjugado de momento linear. Os autoestados do operador de campo são representados por φ , e satisfazem a relação φˆ ( x, 0 ) φ = φ ( x ) φ , onde φ ( x ) , o auto-estado, é uma função de x . Temos também, como de costume, as condições de completeza e ortogonalidade ∫ dφ ( x ) φ φ =1 φa φb = ∏ δ (φa ( x ) − φb ( x ) ) . x Da mesma forma, os autoestados do operador de campo conjugado de momento linear satisfazem πˆ ( x, 0 ) π = π ( x ) π , e as condições de completeza e ortogonalidade são, respectivamente, ∫ dπ ( x ) 2π π π =1 π a π b = ∏ δ (π a ( x ) − π b ( x ) ) . x 131 A transformação de contato entre as representações de coordenadas e de momento linear será dada por ( ) φ π = exp i ∫ d 3 x π ( x ) φ ( x ) . Para o tratamento da dinâmica, o hamiltoniano é um funcional do campo e de seu momento linear conjugado: ( ) H = ∫ d 3 xH πˆ , φˆ . Supondo que um determinado sistema esteja em um estado φa no tempo t = 0 , e que o hamiltoniano não dependa explicitamente do tempo, após um tempo t f o sistema evoluirá de acordo com a expressão e − iHt f φa . Logo, a amplitude de transição para o sistema ir, após um tempo t f , de um estado φa para um estado φb , será igual a φb e − iHt f φà . Para fins de mecânica estatística, nos interessarão os casos em que o sistema retorna ao estado original após o tempo t f . Para obter uma definição prática da transição de amplitude, usaremos mais uma vez a prescrição do ponto médio (v. integrais de Feynman e de Stratonovich), dividindo o intervalo ( 0, t ) f em N subintervalos iguais com duração ∆t = t f N . Em seguida, em cada intervalo de tempo será inserido um estado completo de estados, alternando as duas relações de completeza acima, da forma φa e − iHt f N φa = lim ∫ ∏ d π i dφi 2π × φa π N π N e − iH ∆t φN φN π N −1 N →∞ i =1 × π N −1 e−iH ∆t φN −1 × φ2 π 1 π 1 e −iH ∆t φ1 φ1 π a . Sabemos também que φ1 φa = δ (φ1 − φa ) , ( ) φi +1 π i = exp i ∫ d 3 x π i ( x ) φi +1 ( x ) . Uma vez que precisamos do limite ∆t → 0 , podemos usar a seguinte expressão, até os termos de primeira ordem: π ì e−iH ∆t φi ≈ π i (1 − iH i ) ∆t φì = π i φi (1 − H i ∆t ) i 132 ( ) = (1 − iH i ∆t ) exp −i ∫ d 3 x π i ( x ) φi ( x ) , onde H i = ∫ d 3 x H (π i ( x ) , φi ( x ) ) . Reunindo todos esses resultados, temos que φa e − iHt f N N i =1 j =1 φa = lim ∫ ∏ dπ i dφi 2π δ (φ1 − φa ) exp −i∆t ∑ ∫ d 3 x H (π j , φ j ) − π j (φ j +1 − φ j ) ∆t N →∞ onde φ N +1 = φa = φ1 . A razão pela qual a inserção de um conjunto completo de estados foi efetuada com a alternância entre φ e π é que, desta forma, o hamiltoniano é calculado em um único ponto temporal. Fazendo agora o limite da última expressão, que equivale a representá-la no contínuo, chegamos finalmente ao resultado central, que será posteriormente utilizado para sistemas específicos: φa e − iHt f φ ( x ,t f ) =φa ( x ) tf ∂φ ( x, t ) φa = ∫ [ dπ ] ∫ − H ( π ( x, t ) , φ ( x, t ) ) [ dφ ] exp i ∫ dt ∫ d 3 x π ( x, t ) ∂t . φ ( x ,0 ) =φa ( x ) 0 Note-se que a integração sobre π ( x,t ) é irrestrita, ao passo que a integração sobre φ ( x,t ) obedece à condição de que o campo inicia em φa ( x ) para t = 0 e termina novamente em φa ( x ) para t = t f . V.1.5.2. A Função de Partição Bosônica Recordemos que Z = Tr e ( − β H − µi Nˆ î ) = ∑ ∫ dφa φa e ( − β H − µi Nˆ i ) φà , a onde a soma percorre todos os estados (o símbolo da função é a inicial da palavra alemã correspondente Zustandsumme = “soma dos estados” : v. Frederick Reif, ‘Statistical and Thermal Physics’, Ed. McGraw-Hill, 1965, p. 213). Essa expressão é muito parecida com a da amplitude de transição definida mais acima, e, de fato, podemos exprimir Z como uma integral sobre campos e seus momentos conjugados, usando apenas a expressão da amplitude. É necessário, porém, fazer a substituição t = iτ , para um tempo imaginário ou euclidiano, e o operador de traço indica apenas que a integração deve ser 133 feita sobre todos os φa . Finalmente, se o sistema admitir uma carga conservada, devemos também fazer a substituição H (π , φ ) → H (π , φ ) − µ N ( π , φ ) , onde N (π , φ ) é a densidade da carga conservada. Chegamos assim à fórmula fundamental β ∂φ Z = ∫ [ d π ] ∫ [ dφ ] exp ∫ dτ ∫ d 3 x − H ( π , φ ) + µ N (π , φ ) . π ∂τ period . 0 O índice period . significa que a integração sobre o campo está restrita pela condição φ ( x, 0 ) = φ ( x, β ) . Isto decorre, como já foi visto, da ciclicidade do traço, quando se faz φa ( x ) = φ ( x, 0 ) = φ ( x, β ) . Mais uma vez, não há restrições quanto à integração sobre π . A generalidade dessa fórmula permite que seja facilmente estendida para números arbitrários de campos e de cargas conservadas. Veremos a seguir como são obtidas e tratadas as funções de partição para alguns campos particulares. V.1.5.3. Campo escalar neutro A densidade lagrangiana quadridimensional mais geral (e renormalizável) para um campo escalar neutro é dada pela expressão L= 1 1 ∂ µφ ∂ µφ − m 2φ 2 − U (φ ) , 2 2 onde o potencial é U (φ ) = gφ 3 + λφ 4 , e, para preservar a estabilidade do vácuo, consideramos que λ ≥ 0 . O momento conjugado desse campo é dado por π= ∂L ∂φ = , ∂ ( ∂ 0φ ) ∂t e o hamiltoniano é obtido através da transformação de Legendre usual H =π ∂φ 1 1 1 2 − L = π 2 + ( ∇φ ) + m 2φ 2 + U (φ ) . ∂t 2 2 2 Neste caso, não existe carga conservada. Calcularemos inicialmente a função de partição a partir da versão para valores discretos do campo e de seu momento conjugado: 134 N ∞ dπ i N 2 ∆τ 2 2 2 φ π φ φ φ Z = lim ∏ ∫ d exp d 3 x iπ j (φ j +1 − φ j ) − + ∇ + m + 2 U ( ) ( ) ∑ i j j j ∫ ∫ N →∞ 2 j =1 i =1 −∞ 2π period . As integrais sobre os momentos podem ser imediatamente efetuadas, uma vez que são simplesmente produtos de integrais gaussianas. Dividimos o espaço das posições em M 3 pequenos cubos, com V = L3 , L = aM , a → 0 , M → ∞ , sendo M um número inteiro. Para maior conveniência, e para assegurar que Z se conserve explicitamente adimensional a cada passo do cálculo, faremos π j = A j ( a ∆τ ) 3 12 e integraremos A j de −∞ a ∞ , obtendo assim, para cada cubo, ∞ ∫ −∞ − a 3 (φ − φ ) 2 3 12 1 a 1 2 − j +1 j . exp − A2j + i (φ j +1 − φ j ) A j = ( 2π ) exp 2π 2 ∆ 2 ∆ τ τ dA j A expressão inicial evoluiu, portanto, para Z = lim M , N →∞ ( 2π ) − M 3N 2 ∆τ N φ d exp i ∫ ∏ i =1 2 φ j +1 − φ j 2 2 2 2 φ φ φ − − ∇ − m − 2 U ( ) ( ) ∑ j j j ∆τ j =1 . N Tomando o limite contínuo, obtemos β Z = N ′ ∫ [ dφ ] exp ∫ dτ ∫ d 3L . period . 0 A lagrangiana é expressa como um funcional de φ e suas primeiras derivadas. A última fórmula expressa a função de partição Z como uma integral funcional, sobre φ , da exponencial da ação em um tempo imaginário τ , no espaço euclidiano. A constante de normalização total N ′ é irrelevante, uma vez que a multiplicação de Z por qualqeur constante não altera a termodinâmica do sistema. Vejamos agora o que acontece no caso de campos não-interagentes, fazendo U (φ ) = 0 . Definimos a ação correspondente por β S = ∫ dτ ∫ d 3 xL = − 0 β ∂φ 2 1 2 3 2 2 d τ d x + ∇ φ + m φ ( ) . 2 ∫0 ∫ ∂τ Integrando por partes e usando a periodicidade de φ , obtemos que S =− β ∂2 1 3 2 2 d τ d x φ − 2 − ∇ + m φ . ∫ ∫ 20 ∂τ 135 Como sabemos, o campo φ pode ser expandido por uma série de Fourier, que no caso terá a forma φ ( x, t ) = β V ∞ ∑ ∑e ( φn ( p ) i p ⋅x +ωnτ ) n =−∞ p onde ωn = 2π nT é a frequência de Matsubara correspondente à condição de periodicidade φ ( x, β ) = φ ( x, 0 ) , ∀x . A normalização é tal que cada amplitude de Fourier seja adimensional. Substituindo a expansão de φ na expressão da ação euclidiana, e observando que o campo φ deve ser real, obtemos que 1 S = − β 2 ∑∑ (ωn2 + ω 2 ) φn ( p ) φn∗ ( p ) , 2 n p Usando a notação abreviada ω = p 2 + m 2 . O integrando depende somente da magnitude do campo, An ( p ) = φn ( p ) . Integrando sobre as fases, temos que ∞ 1 Z = N ′∏∏ ∫ dAn ( p ) exp − β 2 (ωn2 + ω 2 ) An2 ( p ) 2 n p −∞ 12 = N ′∏∏ ( 2π ) β 2 (ωn2 + ω 2 ) n p −1 2 . Vemos então que, a cada integração sobre um momento linear, surge um fator final igual a ( 2π ) −1 2 , que independe de volume ou temperatura, logo, podemos dizer que Z = ∏∏ β 2 (ωn2 + ω 2 ) n −1 2 , p o que nos permite escrever a função de partição formalmente como 1 Z = N ′∫ [ dφ ] exp − (φ | Dφ ) , 2 onde D = β 2 ( − ∂ 2 ∂τ 2 − ∇ 2 + m 2 ) no espaço ( x,τ ) e D = β 2 (ωn2 + ω 2 ) no espaço ( p,τ ) , sendo (φ | Dφ ) a representação do produto interno no espaço funcional. Usando agora a fórmula para as integrais de Riemann de uma exponencial que contém uma matriz constante D : ∞ ∫ dx dx 1 −∞ n exp ( − xi Dij x j ) = π n 2 ( det D ) −1 2 , chegamos ao resultado ( N ′′ é uma constante) 136 Z = N ′′ ( det D ) −1 2 . Extraindo o logaritmo de ambos os termos da expressão de Z com os produtórios, temos que ln Z = − 1 ln β 2 (ωn2 + ω 2 ) . ∑∑ 2 n p Usando nessa expressão as identidades 2 ln ( 2π n ) + β 2ω 2 = β 2ω 2 ∫ dθ 2 θ + ( 2π n ) 2 1 2 2 + ln 1 + ( 2π n ) e ∞ ∑n n =−∞ 1 2 + (θ 2π ) 2 = 2π 2 2 , 1 + θ θ e − 1 obtemos, depois de descartar um termo independente da temperatura, que ln Z = −∑ p βω 1 1 ∫ dθ 2 + eθ − 1 , 1 o qual, uma vez efetuada a integração e sendo também descartados novos termos independentes da temperatura e do volume, resulta na expressão final para a função de partição bosônica: ln Z = V ∫ d3p 1 − βω − ln (1 − e − βω ) . 3 ( 2π ) 2 V.1.5.4. Férmions Sabemos da mecânica quântica relativística que elétrons e múons são descritos por um espinor ψ com quatro componentes, o férmion de Dirac. As componentes são identificadas por ψ α , α = 1, 2, 3, 4 . O movimento de um elétron livre é caracterizado por uma função de onda ψ ( x, t ) = 1 V ∑∑ p s M b ( p, s ) u ( p, s ) e − ip⋅ x + d ∗ ( p, s ) v ( p, s ) eip⋅ x . E Os espinores de onda plana com energia positiva e negativa são representados, respectivamente, por u e v . A soma sobre s se dá sobre os dois estados de orientação de spin para um férmion de Dirac com spin 1 2 . Os coeficientes b ( p, s ) e d ∗ ( p, s ) usados na expansão são representados por funções complexas na mecânica quântica 137 relativística, mas passam a corresponder a operadores numa teoria de campos. A normalização dessa função de onda nos dá ∫d Na ausência 3 2 2 x ψ † ( x, t )ψ ( x, t ) = ∑∑ b ( p, s ) + d ( p, s ) = 1 . p s de interações, a densidade lagrangiana ∂ = γ µ ∂ µ = γ µ ∂ ∂x µ ) é (ψ = ψ † γ0 e L = ψ ( i ∂ − m )ψ . As matrizes de Dirac γ µ , definidas pelos anticomutadores {γ µ , γ ν } = 2 g µν , se escrevem na convenção padrão como as matrizes 4 × 4 I 0 γ0 = 0 −I 0 σ γ = , −σ 0 onde I é a matriz identidade 2 × 2 e σ é o tripleto das matrizes de Pauli. Escrevendo a lagrangiana de forma explícita: ∂ L = ψ †γ 0 iγ 0 + iγ ⋅∇ − m ψ . ∂t Esta lagrangiana tem uma simetria U (1) global, de forma tal que ψ → ψ e − iα e ψ † → ψ †eiα . De acordo com o teorema de Nöther, existe uma corrente conservada associada a esta simetria. Para identificá-la, procedemos de forma análoga ao caso do campo escalar carregado, fazendo com que α → α ( x ) sofra um tratamento variacional como se fosse um campo independente. Aplicando a transformação neste caso, L → L + ψ ∂α ( x ) ψ . Uma vez encontrada a “equação de movimento” de α ∂L ∂L − ∂µ = 0, ∂ ∂ µα ( x ) ∂α ( x ) Obtemos as leis de conservação correspondentes ∂µ jµ = 0 j µ = ψγ µψ . Fazendo agora α = cte. recuperamos a teoria original, e a carga total conservada será 138 Q = ∫ d 3 x j 0 = ∫ d 3 x ψ †ψ . O momento conjugado relativo ao campo básico ψ será dado por ( γ 0γ 0 = 1 ) Π= ∂L = iψ † , ∂ ( ∂ψ ∂t ) o que indica que, no formalismo hamiltoniano, os campos ψ e ψ † devem ser tratados de forma independente. Obtendo a densidade hamiltoniana através do procedimento padrão de uma transformação de Legendre: H=Π ∂ψ ∂ − L = ψ † i ψ − L = ψ −iγ ⋅∇ + m ψ . ∂t ∂t ( ) A função de partição é dada por Z = Tr † e ( − β H − µQˆ ) β ∂ = ∫ idψ † [ dψ ] exp ∫ dτ ∫ d 3 x ψ −γ 0 + iγ ⋅∇ − m + µγ 0 ψ . ∂t 0 Lembremo-nos de que ψ e ψ † são campos independentes, que devem ser integrados independentemente. Em se tratando de férmions, contrastando com campos bosônicos, não há vantagem em se tentar integrar sobre o momento conjugado de forma separada do campo básico. As relações de comutação canônicas para campos bosônicos são φˆ ( x, t ) , πˆ ( y , t ) = i∂ ( x − y ) ˆ ˆ ˆ ˆ φ ( x, t ) , φ ( y , t ) = π ( x, t ) , π ( y , t ) = 0 e para campos fermiônicos são {ψˆ ( x, t ) ,ψˆ ( y, t )} = δ δ ( x − y ) α † β αβ {ψˆα ( x, t ) ,ψˆ β ( y, t )} = {ψˆα ( x, t ) ,ψˆ β ( y, t )} = 0 . † † Estas relações de comutação são as únicas permitidas pelo teorema fundamental de spin e estatística da teoria quântica de campos relativística. No limite → 0 os operadores de campo são substituídos por seus autovalores. No caso de bósons, esses autovalores são na verdade funções de campos clássicos, em termos dos quais é definida a função de partição. No caso de férmions, o limite → 0 é bastante peculiar, uma vez que os autovalores que substituem os operadores anticomutam entre si, como resultado do princípio de exclusão de Pauli e do teorema de spin e estatística. Ou seja, as integrais devem ser feitas sobre funções que representam campos clássicos mas anticomutam. 139 Essas funções são variáveis de Grassmann, ou grassmannianas, e operam de acordo com as regras da álgebra e do cálculo de Grassmann. Para os presentes fins, só precisaremos da integral ∫ dη dη dη † 1 1 † N onde ηi são variáveis grassmannianas e dη N eη Dη = det D , † é uma matriz N × N . Tal como no caso bosônico, é mais conveniente trabalharmos no espaço dos momentos ( p, ωn ) , e podemos expandir o campo fermiônico num tempo imaginário como ψ α ( x, t ) = 1 V ∑∑ e ( ψα ;n ( p ) , i p ⋅x +ωnτ ) n p onde tanto n como p assumem valores positivos e negativos. Para uma função arbitrária definida no intervalo 0 ≤ τ ≤ β , a frequência discreta ωn pode assumir os valores nπ T . Para bósons, a periodicidade de φ ( x,t ) , decorrente da propriedade cíclica do traço na função de partição, faz mandatório que ωn = 2π nT , para que φ ( x, 0 ) = φ ( x, β ) . No caso fermiônico, ψ ( x, 0 ) = −ψ ( x, β ) , e, logo, ωn = ( 2n + 1) π T . Podemos agora calcular a função de partição fermiônica, inserindo na expressão de Z a expansão do campo: Z = ∏∏∏ ∫ idψα† ;n ( p ) dψ ( p ) e S , n p α onde S = ∑∑ iψ α† ;n ( p ) Dαρψ ρ ;n ( p ) n p D = −i β ( −iωn + µ ) − γ 0γ ⋅ p − mγ 0 ; logo, Z = det D , sendo o determinante calculado sobre ambos os índices das matrizes 4 × 4 de Dirac, no espaço momento-frequência. Usando a identidade ln det D = Tr ln D e as definições das matrizes gama, obtemos a relação { } ln Z = 2∑∑ ln β 2 (ωn + iµ ) + ω 2 . n p 2 Uma vez que as somas são efetuadas sobre os valores positivos e negativos das frequências, podemos rearrumar essa expressão como 140 { ( ) )} ( 2 2 ln Z = ∑∑ ln β 2 ωn2 (ω − µ ) + ln β 2 ωn2 (ω + µ ) . n p Usando agora a mesma identidade já vista anteriormente para ln ( 2π n ) + β 2ω 2 , podemos escrever 2 ln ( 2n + 1) π + β 2 2 2 (ω ± µ ) 2 = β 2 (ω ± µ ) 2 ∫ dθ 2 1 + ( 2n + 1)2 π 2 . + ln θ 2 + ( 2n + 1) π 2 2 1 A soma sobre n pode ser calculada usando-se a fórmula de identidade ∞ 1 ∑ ( n − x )( n − y ) = π ( cot π x ) − cot π y y−x n =−∞ , que resulta no nosso caso na simplificação ∞ ∑ n =−∞ 1 ( 2n + 1) π 2 2 +θ 2 = 11 1 . − θ θ 2 e + 1 Integrando agora sobre θ e desprezando termos que independem de β e de µ , obtemos finalmente ln Z = 2V ∫ ( ) ( ) d3p βω + ln 1 + e− β (ω − µ ) + ln 1 + e− β (ω + µ ) . 3 ( 2π ) Podemos observar imediatamente que i) o fator 2 aparece automaticamente, e decorre da natureza dos férmions com spin 1 2 ; ii) as contribuições das partículas ( µ ) e antipartículas ( − µ ) são manifestas; e iii) surge também uma contribuição de energia de ponto zero. Outra observação importante é quanto aos resultados Z = det D para férmions e Z = ( det D ) −1 2 para bósons, que têm grande influência nas aplicações da teoria. V.1.6. Aplicações do formalismo de Matsubara No formalismo de tempo imaginário, conforme já foi visto, a única diferença entre as teorias de campos a temperatura zero e a temperatura finita reside na forma do propagador, que é o portador de toda a dependência da temperatura. Os vértices a temperatura finita são exatamente os mesmos que a temperatura zero. Decorre daí que, dada qualquer teoria quântica de campos, podemos realizar de forma perturbativa os cálculos de interesse termodinâmico, calculando os diagramas de Feynman 141 correspondentes. Lembrando que, agora, os propagadores para os campos de spin 0 e spin 1 2 são dados, respectivamente, por Gβ ( k , ωn ) = 1 1 ; = 2 2 ω + k + m ( 4n 2π 2 β 2 ) + k 2 + m2 2 n e 0 γ 0ωn + γ ⋅ k − m γ ( ( 2n + 1) π β ) + γ ⋅ k − m S β ( k , ωn ) = = . 2 ωn2 + k 2 + m 2 ( 2n + 1) π 2 + k 2 + m 2 ( ) De posse desses resultados, vamos primeiramente calcular a correção de massa, a um laço, para uma teoria bosônica auto-interagente φ 4 , e depois a auto-energia em uma teoria com dois bósons interagentes. V.1.6.1. A Correção de Massa em Um Laço para a teoria φ 4 Consideremos uma teoria auto-interagente φ 4 descrita pela densidade lagrangiana L (φ ) = 1 m2 2 λ 4 ∂ µφ∂ µφ − φ − φ . 2 2 4! De acordo com o que já foi exposto, para calcularmos quantidades a temperatura finita, devemos tratar o tempo como um parâmetro imaginário, e neste caso a teoria se torna euclidiana. O propagador bosônico é aquele designado anteriormente, e os vértices são os mesmos da teoria euclidiana a temperatura zero. Portanto, os cálculos podem ser efetuados de forma análoga à teoria a temperatura zero. A única diferença é que, uma vez que os valores de energia agora são quantizados, as integrais intermediárias sobre a energia devem ser substituídas por somatórios sobre valores discretos, ou seja: d 4kE ∫ ( 2π ) 4 → 1 β ∑ n d 3k ( 2π ) 3 . A única contribuição não-trivial a um laço corresponde a uma correção de massa, e tem a forma 142 λ −∆m = − 2β 2 ∑∫ n d 3k ( 2π ) λ β =− 2 2 2 2 ( 4n π β ) + ωk 2β 2π 1 3 2 ∑∫ n d 3k ( 2π ) 1 3 n 2 + ( βωk 2π ) 2 , onde foi usada a notação ωk = ( k 2 + m 2 ) . 12 Permutando o somatório com a integral e usando o método de resíduos, a soma acima pode ser diretamente calculada: ∞ ∑n n =−∞ 2 i π = coth π y , 2 +y y para y > 0 . Resulta então que ∆m 2 = λ d 3k 4 ∫ ( 2π ) βωk coth ωk 2 1 3 . Usando agora a identidade coth β x = 1 + 2nB ( 2 x ) , onde nB ( x ) = ( e β x − 1) −1 é a função de distribuição de Bose-Einstein, Bose Einstein, fica claro, em primeiro lugar, que a correção de massa é composta da soma de dois termos: um, correspondente à temperatura zero, e o outro dependente explicitamente da temperatura: ∆m 2 = ∆m02 + ∆mβ2 = λ d 3k 4 ∫ ( 2π ) 1 3 ωk + λ d 3k 2 ∫ ( 2π ) 1 3 ωk e 1 βωk −1 . Em segundo lugar, somente a parte correspondente à temperatura zero apresenta divergência UV, a parte que depende da temperatura não diverge no ultravioleta. Logo, a renormalização da teoria é a mesma empregada na teoria a temperatura zero. Ao contrário do que afirmam alguns autores autores (v. Ashok Das, “Finite Temperature Field Theory”, eq. 1.48, v. OBS. abaixo), a segunda integral pode ser exatamente calculada (Gradshteyn 1.23(3); 3.479(1); 6.663(1); 3.389(4); L. V. Belvedere, R. L. P. G. Amaral, 143 K. D. Rothe, A. F. Rodrigues, arXiv:0908.1558v1 [hep-th], 11 Aug 2009, Appendix; A. P. C. Malbouisson e N. F. Sweiter, Physica A 233, 573 (1996) ): ∆mβ2 = λ d 3k 2 ∫ ( 2π ) 1 3 1 ωk e βωk λm − 1 4π 2 β = ∞ 1 ∑ n K ( nmβ ) , 1 n =1 onde Kν ( z ) é a função de Bessel modificada de segunda espécie. Em alta temperatura ( β → 0 ), a correção de massa dependente da temperatura assume a forma assintótica ∆mT2 = λ mT 4π 2 1 λT 2 K nm ∝ β ( ) ∑ 1 4π 2 n =1 n ∞ 1 λ m2 + 2 ∑ 2 8π n =1 n ∞ ∞ ∑ ln n =1 nm λT 2 m + ≈ +O . 2T 24 T Verificamos assim que a temperatura induz uma massa positiva para os bósons, de forma análoga à de uma partícula que se move em um meio. OBS.: Cálculo da correção de massa, a temperatura finita, da teoria V (φ ) = − λ 4! φ4 Segundo Ashok Das, “Finite Temperature Field Theory”, eq. 1.48, o funcional que dá a correção de massa da teoria bosônica φ 4 é ∆m2 = λ d 3k 2 ∫ ( 2π ) 1 3 1 k 2 + m2 e β k +m 2 2 λ I β . 3 ( ) − 1 16π = Usando a identidade (Gradshteyn, eq. 1.23(3)) ∞ 1 e β k 2 + m2 −1 = ∑ e− nβ k 2 + m2 , n =1 podemos escrever que ∞ I ( β ) = ∑ ∫ dk1dk2 dk3 n =1 e − nβ k12 + k22 + k32 + m2 k12 + k22 + k32 + m 2 . Fazendo z 2 = k22 + k32 + m 2 , 144 temos que (Gradshteyn, 8.432(9), ν = 0 ): ∫ ∞ 0 ( exp − n β k12 + z 2 dk1 k +z 2 1 2 )=K 0 ( nβ ) k 22 + k32 + m 2 ; Integrando na variável k2 e fazendo k32 + m2 = s 2 ; k2 = s ⋅ senh t → dk2 = s ⋅ cosh t Temos que (Gradshteyn, eq.6.663(1), ν = µ = 1 2 ): ∫ ∞ 0 ( dk2 K 0 nβ k + s = 2 2 2 )=∫ ∞ 0 s nβ s dt s ⋅ K 0 ( nβ s ⋅ cosh t ) cosh t = K1 2 2 2 s π π − nβ s e − nβ s = e 2 2 ( nβ s 2 ) 2 nβ 2 (Gradshteyn, 8.469). Integrando finalmente em k3 , obtemos que (Gradshteyn, 3.389(4), ν = 1 2 ) ∫ ∞ 0 dk3 π 2n β e − nβ k32 + m2 = π 2n β ∫ ∞ m x dx x −m 2 2 e − nβ x = πm K1 ( nmβ ) . 2 nβ Obtemos assim a expressão exata para a correção de massa na teoria φ 4 : ∆mβ2 = λ d 3k 2 ∫ ( 2π ) 1 3 1 k +m e 2 2 β k 2 + m2 −1 = λm 4π 2 β ∞ 1 ∑ n K ( nβ m ) . n =1 1 Usando a expansão em série da função de Bessel (http://functions.wolfram.com/BesselTypeFunctions/BesselK/06/01/04/01/02/0002/) : conseguimos estimar a dependência da correção de massa para temperaturas muito altas, 1 π2 = (Gradshteyn, 0.233(3). ∑ 2 6 n =1 n ∞ usando também que 145 V.1.6.2. A Auto-energia energia em Temperatura Finita Com a finalidade de mostrar algumas condições específicas que surgem em temperatura finita, vamos agora estudar a auto-energia auto energia em uma teoria bosônica nãonão realista (toy model), ), na qual dois bósons de spin nulo, representados pelos campos φ , com massa m , e B , com massa M m , interagem entre si de acordo com a densidade lagrangiana L= 1 m2 2 1 M2 2 g ∂ µφ ∂ µφ − φ + ∂ µ B∂ µ B − B − φ B2 . 2 2 2 2 2 Como a lagrangiana depende do bóson mais pesado apenas quadraticamente, podemos fazer separadamente a integração de B , e investigar a sua contribuição para a autoauto energia do campo de massa mais leve. Usando as mesmas regras já definidas anteriormente para ra diagramas bosônicos, e lembrando que, como a energia é quantizada, as integrais de energia devem ser substituídas, nos vértices intermediários, por somas sobre valores discretos. A auto-energia auto a um laço para o campo φ , observando que o laço interno consiste siste no propagador de B , com fator de simetria 1 2 , será dada por Π ( p, p 0 ) = g2 2β ∑∫ n d 3k ( 2π ) 1 3 2 4n 2π 2 2 2 2 2 nπ 0 + k + M + p + (k + p) + M 2 2 β β , onde p 0 é a energia das linhas externas, a qual terá valores discretos a temperatura finita, no formalismo de tempo imaginário. Definindo as notações ωk = ( k 2 + M 2 ) ; 12 ( ωk + p = ( k + p ) + M 2 2 ) 12 , reescrevemos a auto-energia energia como co 2 d 3k 1 1 1 β g Π ( p, p 0 ) = − − ∑∫ 3 2π 2β n ( 2π ) 4ωk ωk + p n + i βωk n − i βωk 2π 2π 2 146 1 1 × − 0 0 n + β p + i βωk + p n + β p − i βωk 2π 2π 2π 2π . O somatório pode ser calculado com o auxílio da fórmula π ∑ n + ix n + iy = x − y ( coth (π x ) − coth (π y ) ) , 1 1 n resultando em Π ( p, p 0 ) = + 1 ωk + p g2 8 d 3k 1 1 βω ∫ ( 2π )3 ωk coth 2 k ω 2 − ω − ip 0 2 + ( k ) k+ p βωk + p 1 0 0 coth +( p ↔ −p ) . 2 2 ωk2 − (ωk + p − ip 0 ) Este cálculo simples já revela algumas das sutilezas associadas com as teorias quânticas de campo a temperatura finita. De início, já se pode notar que esta última integral não pode ser resolvida de forma fechada, só permite ser calculada nos limites de temperatura baixa e alta. Apesar disso, não é difícil ver que a auto-energia a temperaturas finitas é uma função do momento linear e da energia, não-analítica na origem. Para essa constatação, vamos supor que p 0 é uma variável contínua que permite a continuidade analítica de Π para valores contínuos de p 0 , de forma a permitir que se tome o limite p 0 → 0 . No caso geral, a continuação analítica de uma função para valores contínuos de seu argumento não é bem definida, se apenas conhecermos os valores da função num conjunto discreto de pontos. Porém, se conseguirmos associar esses valores com uma sequência convergente no infinito, poderemos fazer a continuação nessa região. Isto posto, obtemos que Π ( 0, p 0 ) = g2 8 d 3k ∫ ( 2π ) 4 3 1 ωk 4ωk2 − ( p ) 0 2 βωk coth 2 p0 →0 g → 8 2 d 3k ∫ ( 2π ) βωk coth ω 2 1 3 3 k Fazendo o limite na ordem inversa, obtemos, entretanto, que Π ( p, 0 ) = g2 8 d 3k ∫ ( 2π ) − 1 3 ωk ωk + p 1 ωk − ωk + p βωk coth 2 βω 1 βω coth k + coth k +p ωk + ωk + p 2 2 βωk +p − coth 2 147 p →0 → g2 8 d 3k ∫ ( 2π ) 3 1 βωk coth 3 ωk 2 βωk 2 βωk + 2 csch 2 . Estes resultados mostram que os limites p 0 → 0, p → 0 e p → 0, p0 → 0 não comutam, e, de fato, a auto-energia não é analítica na origem do espaço dos momentos lineares. Esta propriedade difere do que se espera na teoria a temperatura zero. Nesta, a invariância de Lorentz obriga a que as amplitudes a temperatura zero sejam funções do momento externo p µ , portanto, analíticas. Em temperatura finita, entretanto, a invariância de Lorentz é quebrada pela escolha de um referencial específico, permitindo assim que as amplitudes possam depender de p 0 e p por relações independentes. Os limites p 0 → 0, p → 0 e p → 0, p0 → 0 , por causa disso, não necessitam ser os mesmos. E a explicação disso não é meramente acadêmica, tem fundamentos físicos. O limite p → 0, p 0 = 0 corresponde a se tomar o limite estático, e conduz à blindagem dinâmica de massa para os campos elétricos. O outro limite, p 0 → 0, p = 0 , em contrapartida, dá a massa do plásmon associado com o amortecimento das oscilações em um plasma, e as duas massas não necessitam coincidir. Do ponto de vista físico, portanto, esta é a origem da não-analiticidade da auto-energia na origem do espaço dos momentos, a temperatura finita. Veremos a seguir uma forma alternativa de analisar a auto-energia a temperatura finita. Estaremos trabalhando com bósons e a distribuição estatística de Bose-Einstein, usando as seguintes definições de densidade de número de estados: n (ωk ) = 1 e βωk −1 n ( ωk + p ) = 1 βωk + p e −1 . Usando a identidade βωk coth = 1 + 2n (ωk ) , 2 e fazendo ω = ip 0 , podemos reescrever a auto-energia na forma Π (ω ) = g2 8 d 3k ∫ ( 2π ) { 1 + n (ω )) (1 + n (ω )) − n (ω ) n (ω ( ωk ωk + p 1 3 1 1 × − ω +ω +ω ω − ωk − ωk + p k k+ p k+ p k k k+ p ) + n (ωk ) 1 + n (ωk + p ) − n (ωk + p ) (1 + n (ωk ) ) ( ) 148 1 1 × − ω −ω +ω ω + ωk − ω k + p k k+ p Esta função está definida apenas para valores imaginários discretos de ω , mas podemos estendê-la facilmente a todo o plano complexo impondo a condição Π∗ (ω ) = Π (ω ∗ ) . Desta maneira, se vê de imediato que a extensão analítica possui cortes ao longo do eixo real, e essa descontinuidade passa através desses cortes, é imaginária pura para ω real, e é dada por Desc Π (ω ) = lim ( Π (ω + iη ) − Π (ω − iη ) ) = 2i Im Π (ω ) , η →0 onde se tira da expressão para a auto-energia que Im Π (ω ) = − { ( } ) g 2 d 3k 1 (1 + n (ωk ) ) 1 + n (ωk + p ) − n (ωk ) n (ωk + p ) 3 ∫ 16 ( 2π ) ωk ωk + p ) { ( ( ) × δ (ω + ωk + ωk + p ) − δ (ω − ωk − ωk + p ) + n ( ωk ) 1 + n (ωk + p ) − } ( ) −n (ωk + p ) (1 + n (ωk ) ) × δ (ω − ωk + ωk + p ) − δ (ω + ωk − ωk + p ) . Deste resultado podemos extrair características interessantes das teorias de campos a temperatura finita. Observe-se que, a temperatura zero, Im Π representa uma taxa de decaimento dada pelo quadrado da amplitude de decaimento integrada sobre os fatores de fase apropriados. A temperatura finita, porém, a densidade de estados precisa ser devidamente condicionada por fatores estatísticos. E também, como existem partículas reais em um meio, isto causa a existência de canais disponíveis a temperatura finita que não estão presentes a temperatura zero. No exemplo acima, o processo direto de decaimento φ → B+B ( ) ocorreria obrigatoriamente com o fator estatístico (1 + n (ωk ) ) 1 + n (ωk + p ) , de forma semelhante a uma emissão estimulada de um laser em um meio físico. E, mais importante, existem B ’s reais no meio térmico, e, logo, o processo inverso B + B →φ se apresenta também como uma possibilidade, só que com um peso estatístico n (ωk ) n (ωk + p ) . A taxa total para o decaimento de φ , neste caso, deverá corresponder à diferença entre essas duas taxas, e observamos que, de fato, ambos os processos estão 149 presentes no primeiro termo da expressão para a auto-energia. De forma semelhante, os demais termos representam os processos φ+B→B B →φ + B . Cabe notar que, se os produtos dos decaimentos fossem férmions, em vez de bósons, os fatores estatísticos teriam a forma (1 − n ) , correspondendo ao princípio de exclusão de Pauli, e representando o fato de que existe uma distribuição real de férmions com densidade n no meio térmico, suprimindo assim a disponibilidade de densidade de estados para o decaimento. Em geral, a localização dos ramos de corte também pode ser extraída da expressão para Im Π . Vamos assumir, como generalização, que as massas das partículas no laço são, respectivamente, m1 e m2 , e definir ω1 = ωk = ( k 2 + m12 ) 12 ω2 = ωk + p = ( k + p ) + m22 2 12 s = ω 2 − p2 . Empregando a desigualdade de Schwartz, observamos que ( ω1ω2 = k + m12 2 ) ( k +p 12 2 + m22 ) 12 ≥ k k + p + m1m2 ∴ω1ω2 − m1m2 ≥ k k + p . Assim, fica claro que, se na expressão encontrada acima para Im Π (ω ) , a condição satisfeita pela função delta for igual a ω = ω1 + ω2 , podemos escrever que s = ω 2 − p 2 = (ω1 + ω2 ) − p 2 = m12 + m22 + 2k ⋅ ( k + p ) + 2ω1ω2 = ( m1 + m2 ) + k ⋅ ( k + p ) + 2 (ω1ω2 − m1m2 ) ≥ ( m1 + m2 ) + 2 ( k k + p + k ⋅ ( k + p ) ) 2 2 ≥ ( m1 + m2 ) . 2 Obtivemos deste modo o primeiro branch cut da função de dois pontos, situado no intervalo ( m1 + m2 ) ≤ s ≤ ∞ , que coincide com o corte a temperatura zero que descreve 2 o limiar padrão para decaimento de partículas. 150 Além desse, porém, e devido aos novos processos adicionais a temperatura finita, verifica-se se um novo corte. Basta supor que a condição satisfeita pela função delta seja ω = ω1 − ω2 (ou a condição simétrica ω1 ↔ ω2 ), e vemos que s = ω 2 − p 2 = (ω1 − ω2 ) − p 2 = m12 + m22 + 2k ⋅ ( k + p ) − 2ω1ω2 2 = ( m1 − m2 ) + 2k ⋅ ( k + p ) − 2 (ω1ω2 − m1m2 ) 2 ≤ ( m1 − m2 ) − 2 ( k k + p − k ⋅ ( k + p ) ) ≤ ( m1 − m2 ) . 2 2 Logo, a temperatura finita, manifesta-se manifesta um novo branch cut ao longo de −∞ ≤ s ≤ ( m1 − m2 ) , onde o limite inferior é obtido para um s do tipo espaço. Este 2 novo corte corresponde à absorção de partículas pelo meio, e sua estrutura pode ser representada graficamente pela figura fig abaixo: Pode-se se observar que o primeiro corte, como era esperado da análise das teorias a temperatura zero, não produz não-analiticidades não na origem. O segundo corte, por outro lado, é responsável pelos limites não-comutativos, não quando m1 = m2 , já discutidos anteriormente. Essa mesma análise deixa claro também que, para processos em que o laço envolve partículas com massas distintas, a não-analiticidade não analiticidade deve desaparecer. Esta conclusão pode ser explicitamente verificada ao se fazer o cálculo da auto-energia auto do bóson de calibre em uma teoria de calibre com quebra espontânea de simetria, no calibre unitário. Cabe ressaltar também que a não-analiticidade não analiticidade não é uma característica particular da auto-energia energia do bóson, e está presente também no caso fermiônico. Na verdade, essa não-analiticidade analiticidade também se manifesta no cálculo de ações efetivas, e devemos sempre definir o que é entendido como potencial efetivo, quando a ação efetiva não é analítica na origem do espaço dos momentos. V.1.6.3. Condensação de Bose-Einstein Bose (BEC – Bose-Einstein Einstein Condensation – v. http://www.colorado.edu/physics/2000/bec/ http://www.colorado.edu/physics/2000/bec/) 151 Obtém-se um sistema bem interessante quando consideramos uma teoria com um campo escalar carregado Φ . O campo Φ neste caso é complexo, e descreve bósons com cargas positivas e negativas, ou seja, bósons e os seus antibósons. Desta forma, a densidade lagrangiana passa a ser L = ∂ µ Φ ∗∂ µ Φ − m 2 Φ ∗Φ − λ ( Φ ∗Φ ) . 2 Vê-se imediatamente que essa lagrangiana possui simetria U (1) global ( α é uma constante): Φ → Φ ′ = Φe − iα . Pelo teorema de Nöther existe uma corrente conservada associada a cada simetria contínua da lagrangiana. Uma forma rápida de obtermos essa corrente é supor inicialmente que α = α ( x ) , e retornar depois ao caso em que α ( x ) = cte. A transformação U (1) “local” será então ( L → L′ = ∂ µ Φ ∗e iα ( x ) ) d ( Φe µ − iα ( x ) ) − m Φ Φ − λ (Φ Φ ) 2 ∗ ∗ 2 = L + Φ ∗Φ∂ µα ∂ µα + i∂ µα ( Φ ∗∂ µ Φ − Φ∂ µ Φ ∗ ) . A equação de movimento do “campo” α ( x ) será então ∂µ ∂L′ ∂L′ . = µ ∂ ( ∂ α ) ∂α Mas como ∂L′ ∂α = 0 , obtemos a corrente conservada como sendo ∂L′ = Φ ∗Φ∂ µα + iΦ ∗∂ µ Φ − iΦ∂ µ Φ ∗ . µ ∂ (∂ α ) Recuperando agora a condição de simetria global, temos que a corrente conservada será jµ = i ( Φ ∗∂ µ Φ − Φ∂ µ Φ ∗ ) , ∂ µ jµ = 0 . A corrente e a carga totais conservadas serão dadas por J µ = ∫ d 3 x jµ ( x ) e Q = ∫ d 3 x j0 ( x ) . É conveniente decompormos agora Φ em suas partes real e imaginária, usando os campos reais φ1 e φ2 : 152 Φ= φ1 + iφ2 2 . Em termos dos momentos conjugados π 1 = ∂φ1 ∂t e π 2 = ∂φ2 ∂t a densidade hamiltoniana e a carga serão dadas, respectivamente, por: 2 1 2 1 2 2 π 1 + π 22 + ( ∇φ1 ) + ( ∇φ2 ) + m 2φ12 + m 2φ12 + λ (φ12 + φ22 ) , 2 4 H= Q = ∫ d 3 x (φ2π 1 − φ1π 2 ) . A função de partição será neste caso Z = ∫ [ d π 1][ d π 2 ] β ∂φ ∂φ φ φ d d exp [ 1 ][ 2 ] ∫ dτ ∫ d 3 x iπ1 + iπ 2 2 − H + µ (φ2π1 − φ1π 2 ) ∫ ∂τ ∂τ period . 0 onde foi incluído um potencial químico associado com a carga conservada Q . Integrando agora sobre os momentos conjugados, temos que Z = ( N ′) 2 2 2 β 1 ∂φ1 1 ∂φ2 3 ∫ [ dφ1 ][ dφ2 ] exp ∫0 dτ ∫ d x − 2 ∂τ − iµφ2 − 2 ∂τ − iµφ1 period . − 2 1 1 1 1 1 2 2 ( ∇φ1 ) − ( ∇φ2 ) − m 2φ12 − m 2φ22 − λ (φ12 + φ22 ) , 2 2 2 2 4 sendo N ′ o mesmo fator de normalização divergente já encontrado antes. É importante observar que o argumento da exponencial acima não é aquele que se poderia esperar à primeira vista, que seria L (φ1 , φ2 , ∂ µφ1 , ∂ µφ2 ; µ = 0 ) + µ j0 (φ1 , φ2 , i∂φ1 ∂τ , i∂φ2 ∂τ ) , diferindo do mesmo por um termo µ 2 Φ ∗Φ , oriundo da dependência de j0 em relação aos momentos π1 e π 2 . Essa expressão integral funcional de Z só pode ser calculada de forma fechada no caso em que λ = 0 , quando o potencial é nulo, e a integração se torna gaussiana, analogamente ao caso do campo escalar livre. Tomamos como ponto de partida as expansões das componentes reais de Φ em séries de Fourier: φ1 = 2ς cos θ + β e( ∑∑ V φ1;n ( p ) i p⋅x +ωnτ ) n p 153 φ2 = 2ς sen θ + β φ2;n ( p ) . e( ∑∑ V i p ⋅x +ωnτ ) n p Os parâmetros ς e θ são independentes de ( x,τ ) e determinam completamente o comportamento do campo no infravermelho; isto é, φ1;0 ( p = 0 ) = φ2;0 ( p = 0 ) = 0 . É esta condição que leva à possibilidade de condensação do bóson no estado de momento linear zero. “Condensação” significa que, no limite V → ∞ , uma parcela finita das partículas reside no estado em que n = 0, p = 0 . Fazendo, portanto, λ = 0 , integrando por partes a expressão de Z e substituindo as expansões acima no resultado, obtemos que 2 Z = ( N ′ ) ∏∏ ∫ dφ1;n ( p ) dφ2;n ( p ) e S , n p onde φ (p ) S = βV ( µ 2 − m 2 ) ς 2 − ∑∑ (φ1;− n ( −p ) , φ2;− n ( −p ) ) D 1;n n p φ2;n ( p ) e ω2 + ω2 − µ 2 −2 µωn D = β2 n . 2 2 2 − 2 µω ω + ω − µ n n Efetuando as integrações, ln Z = βV ( µ 2 − m2 ) ς 2 + ln ( det D ) −1 2 . O segundo termo pode ser reescrito da seguinte forma: 2 ln det D = ln ∏∏ β 4 (ωn2 + ω 2 − µ 2 ) + 4µ 2ωn2 n p ( ) ( ) 2 2 2 = ln ∏∏ β 2 ωn2 + ( ω − µ ) + ln ∏∏ β 2 ωn2 + (ω + µ ) . n p n p Reunindo tudo isso, temos o resultado ln Z = β V ( µ 2 − m 2 ) ς 2 − { } { } 1 1 2 2 ln β 2 ωn2 + (ω − µ ) − ∑∑ ln β 2 ωn2 + (ω + µ ) ∑∑ 2 n p 2 n p Os dois últimos termos são exatamente da mesma forma já encontrada anteriormente no caso do campo escalar neutro, e, para não repetirmos as contas, basta 154 fazer as substituições, respectivamente em cada termo: ω → ω − µ e ω → ω + µ , para obtermos ln Z = β V ( µ 2 − m 2 ) ς 2 − V ∫ ( ) ( ) d3 p βω + ln 1 − e− β (ω − µ ) + ln 1 − e − β (ω + µ ) . 3 ( 2π ) Podemos agora fazer várias observações a respeito desta expressão: • A integral sobre o momento linear só converge para µ ≤ m ; • O parâmetro ς permanece na expressão final, mas θ desapareceu, o que se deve • • à simetria U (1) global da lagrangiana; Como o parâmetro ς não é determinado ab initio, pode ser tratado como um parâmetro variacional relacionado à carga associada às partículas condensadas. Mantendo-se β e µ fixados, ln Z é um extremo com relação a variações do parâmetro livre ς , e teremos que ∂ ln Z = 2βV ( µ 2 − m2 ) ς = 0 , ∂ς o que implica que ς = 0 , exceto quando µ = m , condição em que a relação variacional acarreta a indeterminação de um valor para ς . A condição µ < m não acrescenta novas informações, resultando simplesmente no resultado já conhecido para o caso bosônico ln Z = V ∫ d3p ( 2π ) 3 ( ln 1 − e − β (ω − µ ) ) −1 . Para encontrarmos o valor de ς quando µ = m , notemos que a densidade de carga ρ = Q V é dada pela fórmula da termodinâmica ρ= T ∂ ln Z = 2mς 2 + ρ ∗ ( β , µ = m ) , V ∂µ µ = m onde ρ∗ = ∫ d3p 1 1 − β (ω + m ) . 3 β (ω − m ) −1 e −1 ( 2π ) e Manifesta-se aqui explicitamente a separação entre o condensado de partículas (ou seja, o modo de momento linear zero) e as excitações térmicas. Se a densidade ρ é mantida fixa enquanto a temperatura decresce, µ decrescerá até atingir o ponto µ = m , correspondente à temperatura crítica Tc . Se a temperatura continua decrescendo, ρ ∗ ( β , µ = m ) passará a ser menor do que ρ . Portanto, o parâmetro ς , para o caso em que µ = m e T < Tc , será dado pela relação ς2 = ρ − ρ ∗ ( β , µ = m) . 2m A temperatura crítica é determinada implicitamente pela equação 155 ρ = ρ ∗ ( βc , µ = m ) . No limite não-relativístico ρ m3 , obtido após a expansão do integrando em ρ ∗ , teremos então 23 2π 2 ρ Tc = ; m 3ς e no limite ultra-relativístico ρ m3 a temperatura crítica será dada por 3ρ Tc = . m 12 No limite m → 0 , ocorrerá que µ → 0 e Tc → ∞ . Quando m = 0 , toda a carga estará localizada no condensado, para todas as temperaturas, e nenhuma das excitações térmicas possuirá carga. Na temperatura Tc ocorre uma transição de fase de segunda ordem, ou seja, sem quebra de continuidade. Isto pode ser mostrado rigorosamente, por meio de uma análise em detalhe do comportamento do potencial químico µ ( ρ ,T ) , enquanto uma função de T , num entorno de Tc , mantendo-se ρ fixo. Pode-se também mostrar o mesmo através de argumento físicos, de maneira intuitiva, recorrendo à teoria geral de Landau para transições de fase e considerando-se ς como o parâmetro de ordem do sistema. Observa-se que, quando a temperatura tende para a temperatura crítica por valores T < Tc , ς tende continuamente para zero, e se mantém nulo para valores T > Tc . A explicação física para a transição de fase pode ser dada em poucas palavras. Quando T = 0 , toda a carga conservada pode estar localizada no modo de momento linear nulo, devido à estatística bosônica das partículas. À medida que a temperatura se eleva, parte da carga é continuamente “vaporizada” para fora do condensado, até que, eventualmente, a temperatura atinge um nível suficiente para “dissolver”, isto é, desordenar termicamente, o condensado, caracterizando, portanto, uma transição de fase, ou mudança de estado, do sistema de muitas partículas. Como não há razão para que o parâmetro de ordem ς sofra alguma descontinuidade até atingir o valor nulo, a transição de fase é tipicamente de segunda ordem. 156 VI. O Formalismo de Tempo Real VI.1. Introdução As primeiras elaborações de estudos, usando tempo real, de sistemas quânticos a temperatura finita, se deram a partir de 1961, com um trabalho de Schwinger (J. S. Schwinger, “Brownian Motion of a Quantum Oscillator”, J. Math. Phys., 2, 407) em que o objetivo inicial é o de desenvolver uma técnica geral, usando o princípio de ação mínima, para o tratamento de um oscilador submetido por acoplamento a um sistema externo de forças essencialmente macroscópico. Daí são obtidos valores esperados térmicos, integrados numa trajetória fechada no tempo - CTP (closed time path). Em 1962, Leo Kadanoff e Gordon Baym (L. P. Kadanoff e G. Baym, “Quantum Statistichal Mechanics: Green’s Function Methods in Equilibrium and Non-Equilibrium Problems”, Ed. Benjamin, N. York, 1962; Hartmut J. W. Haug e Antti-Pekka Jauho, “Quantum Kinetics in Transport and Optics of Semiconductors”, Chap. 5, 2nd edition, Ed. Springer, 2008) estabelecem um conjunto de equações, desenvolvidas a partir da aproximação de Hartree-Fock e das equações de Schwinger-Dyson, para as funções de Green de um sistema quântico de muitos corpos a temperatura finita. A natural adoção dos diagramas de Feynman no formalismo de tempo real, porém, só ocorreu em 1964, num trabalho publicado independentemente pelo russo Leonid. V. Keldysh (L. V. Keldysh, “Diagram Technique for Non-equilibrium Processes”, JETP, 20, 1018-1026, 1964), e muitos autores usam a denominação de método de Schwinger-Keldysh para o formalismo integral funcional de tempo real em trajetória fechada no tempo, uma vez que o método de Kadanoff-Baym mescla equações integrais e diferenciais, e não define claramente condições de contorno adequadas. Todas essas pesquisas e resultados foram fortemente motivados pela necessidade de se equacionar teoricamente problemas de estatística quântica fora do equilíbrio, como processos em masers e lasers, condensação bosônica, transições de fase em geral, e outros, inacessíveis às técnicas de cálculo em tempo imaginário iniciadas por Matsubara. Surgirá mais tarde, a partir de 1971, uma outra teoria em tempo real a temperatura finita, a Thermofield Theory (TFD), mais geral que a CTP, e que será vista em detalhe na seção VII. VI.2. O Formalismo CTP Vamos considerar a descrição, na representação de Schrödinger, de um sistema quântico genérico em um estado misto que é descrito por uma matriz de densidade ρ . Esse sistema está imerso em um meio externo, podendo estar ou não em equilíbrio térmico. Neste caso, como é sabido, a matriz de densidade é dada por ρ ( t ) = ∑ pn ψ n ( t ) ψ n ( t ) . n 157 A probabilidade de se encontrar o sistema quântico no estado ψ n ( t ) é igual a pn , e como, para simplificar, vamos assumir que os estados possíveis para o sistema são discretos, resulta que ∑p n = 1 . A média de qualquer operador associado a esse sistema n pode ser calculada a partir do conhecimento da matriz densidade, e toma a seguinte forma, na representação de Schrödinger: A ( t ) = Tr ρ ( t ) A = ∑ pn ψ n ( t ) A ψ n ( t ) . n Fica claro, portanto, que a média de qualquer operador, em casos semelhantes, desenvolve uma dependência temporal que é determinada pela dependência temporal da matriz densidade. Vemos também que é possível definir, do modo usual, uma entropia associada ao sistema, que será S = − ln p = −∑ pn ln pn , n positivo-definida (em decorrência da condição ∑p n = 1 ). n A evolução no tempo da matriz densidade pode ser obtida pela evolução dos estados do sistema. Se esses estados satisfazem a relação i ∂ ψ n (t ) ∂t = H ψ (t ) , sendo H o hamiltoniano do sistema, resulta então da definição da matriz densidade, que sua evolução será dada pela equação de Liouville quântica (que difere da equação de evolução de Heisenberg apenas por um sinal) i ∂ρ ( t ) ∂t = H , ρ ( t ) . Foi assumido aqui que as probabilidades pn não variam com o tempo, o que é o mesmo que dizer que a entropia é uma constante no tempo. A razão para essa hipótese é a falta de conhecimento, da parte do observador, sobre a evolução dinâmica do sistema externo, enquanto banho térmico. Como, por outro lado, podemos usar frequentemente evoluções adiabáticas para estudar sistemas físicos, a hipótese assumida terá a sua utilidade. Decorre da equação de evolução acima que, se o hamiltoniano que governa a dinâmica do sistema quântico independe do tempo, podemos escrever então que ρ ( t ) = e−iHt ρ ( 0 ) eiHt . 158 Se, também, o hamiltoniano comuta com ρ ( 0 ) , a matriz densidade será constante no tempo, e, portanto, descreverá um sistema em equilíbrio. Isto é verdade, por exemplo, se os estados do sistema são estacionários, ou se as probabilidades seguem uma distribuição de Boltzmann – o que, neste caso, identifica um equilíbrio térmico. Em geral, porém, o sistema não estará em equilíbrio, o hamiltoniano poderá depender do tempo, e seremos obrigados a exprimir a matriz densidade usando o operador de evolução temporal ρ ( t ) = U ( t , 0 ) ρ ( 0 )U † ( t , 0 ) = U ( t , 0 ) ρ ( 0 )U ( 0, t ) , sendo o operador de evolução definido da maneira usual como i ∂U ( t , t ′ ) ∂t = H ( t )U ( t , t ′ ) , ou − i dt ′′H ( t ′′) U ( t , t ′ ) = T e ∫t′ , t com as condições equivalentes U (t, t ) = 1 ; U ( t1 , t2 ) U ( t2 , t1 ) = 1 ; U ( t1 , t2 ) U ( t2 , t3 ) = U ( t1 , t3 ) , t1 >t 2 >t 3 . Como a matriz densidade ρ ( 0 ) é uma matriz hermitiana positiva e com traço unitário, podemos, sem perda de generalidade, considerá-la como tendo a forma ρ (0) = e− β Hi , Tr e − β H i para algum operador hermitiano H i . Suponhamos agora que o sistema quântico é governado por um hamiltoniano da forma H i para Re t ≤ 0 H (t ) = H ( t ) para Re t ≥ 0 O significado disto está bem claro: para tempos negativos, o sistema é preparado em um estado de equilíbrio com temperatura β , e evolui, para tempos positivos, com o real hamiltoniano do sistema, H ( t ) , que pode depender do tempo. Fica claro que o sistema só evolui em equilíbrio no caso em que H ( t ) = H i . Podemos tirar desses resultados que ρ ( 0) = U (T − i β , T ) , Tr U (T − i β , T ) 159 e, logo, ρ ( t ) = U ( t , 0 ) ρ ( 0 ) U ( 0, t ) = U ( t , 0 ) U (T − i β , T ) U ( 0, t ) , Tr U ( T − i β , T ) onde T representa um tempo negativo muito grande (para o qual o hamiltoniano do sistema, H i , independe do tempo). Agora já podemos calcular a evolução no tempo de qualquer operador, e, uma vez que esse resultado está no núcleo do formalismo CTP, faremos as contas com algum detalhamento. De resultados acima podemos tirar que A ( t ) = Tr ρ ( t ) A = = Tr U ( t , 0 ) U (T − i β , T ) U ( 0, t ) A Tr U (T − i β , T ) Tr U (T − i β , T ) U ( 0, t ) AU ( t , 0 ) U ( 0, T ) U (T , 0 ) Tr U (T − i β , T ) U ( T , 0 ) U ( 0, t ) AU ( t , 0 ) U ( 0, T ) = Tr U (T − i β , T ) Tr U (T − i β , T ) = Tr U ( T − i β , T ) U (T , t ) AU ( t , T ) , Tr U (T − i β , T ) onde foram usados a ciclicidade do traço, as propriedades do operador de evolução, e o fato de que, para T < 0 , U (T − iβ , T ) e U (T , 0 ) comutam. Falta apenas uma etapa final para que essa expressão assuma a forma padrão. ′ Seja T um tempo positivo muito grande. Usando as propriedades do operador de evolução, podemos escrever então que A (t ) = = Tr U (T − i β , T ) U (T , T ′ ) U (T ′, T ) U (T , t ) AU ( t , T ) Tr U (T − i β , T ) Tr U (T − i β , T ) U ( T , T ′ ) U (T ′, t ) AU ( t , T ) . Tr U (T − i β , T ) U (T , T ′ ) U (T ′, T ) O significado físico dessa expressão é bastante claro (não esquecendo que os operadores estão seguindo a ordenação temporal: tempos iniciais à direita, tempos finais à esquerda): o sistema evolui a partir de um tempo negativo muito grande T para um certo tempo t , quando ocorre a inserção do operador A . Daí em diante, o sistema evolui a partir de t até um tempo positivo muito grande T ′ , depois do que ele evolui para trás no tempo para T , e finalmente segue ao longo de um tempo imaginário. No plano complexo t , portanto, o contorno C associado ao funcional tem a forma: 160 Deve-se observar que os caminhos ao longo do eixo real são separados apenas infinitesimalmente ao longo do eixo imaginário. Eventualmente, gostaríamos de tomar os limites T → −∞ e T ′ → ∞ , e, nesse caso, a forma da média do operador obtida sugere que podemos definir um funcional gerador da forma W [ J c ] = Tr U J c (T − i β , T ) U J c (T ′, T ) , onde J c define uma fonte ao longo do contorno de tempo que foi descrito acima. Podemos notar também que U Jc representa o operador de evolução na presença das fontes externas definidas ao longo do contorno. Para um hamiltoniano independente do tempo e para J c = J , isto é, para uma fonte constante ao longo de todo o contorno, transparece que o funcional gerador acima é exatamente o mesmo que foi discutido no formalismo de tempo imaginário, uma vez que, nesse caso, e como resultado das propriedades do operador de evolução, U J c (T , T ′) U Jc (T ′, T ) = 1 . Isto ocorre porque, neste caso, estamos aplicando o formalismo de tempo real a um sistema em equilíbrio. Por outro lado, quando as fontes não são as mesmas ao longo do caminho no tempo – em particular, nos dois ramos que seguem à frente e para trás no tempo -, o hamiltoniano poderá ser diferente em tempos diferentes, e o funcional gerador estará apto a descrever um sistema fora do equilíbrio, o que não seria possível no formalismo de tempo imaginário. VI.3. Propagadores e sua Estrutura Matricial Deve ter ficado claro agora que, se tomarmos a expressão acima para W [ J c ] como definição do funcional gerador da nossa teoria, podemos, tal como ocorre a temperatura zero, escrevê-la na representação integral funcional. Assim, por exemplo, 161 para uma teoria de Klein-Gordon real, interagindo somente com uma fonte externa, o funcional gerador será escrito como i dt d 3 x ( L + J cφ ) ∫ ∫ W [ J c ] = ∫ Dφ e c , onde podemos escolher a densidade lagrangiana livre como sendo L= 1 m2 2 ∂ µφ ∂ µφ − φ . 2 2 O campo φ deve satisfazer condições de contorno periódicas, e a integral no tempo é definida ao longo do contorno descrito acima, que se compõe principalmente de três partes. Chamaremos de C+ o ramo que vai de −∞ a ∞ acima do eixo real, de C− o caminho de retorno de ∞ a −∞ por debaixo do eixo real, e de C3 o segmento final ao longo do eixo imaginário. Será mostrado rapidamente que este último segmento contribui apenas de forma trivial para o funcional gerador, e, logo, pode ser ignorado. Portanto, para todos os propósitos práticos, podemos pensar no contorno como sendo constituído somente de C+ e C− , definindo assim um contorno fechado no plano complexo. Daí o fato deste formalismo ser conhecido como CTP (closed time path formalism). Observe-se agora que a integração em torno desse contorno fechado pode ser escrita como ∫ dt = ∫ c ∞ −∞ ∞ dt+ − ∫ dt− . −∞ Dada uma integral funcional para a função de partição, como foi feito acima, podemos obter várias funções de Green, perfazendo as derivadas funcionais com relação às fontes, e fazermos estas corresponderem às apropriadas médias sobre o ensemble. Entretanto, diferentemente do caso a temperatura zero, estas funções de Green, deverão ser ordenadas temporalmente, ao longo do contorno C , no plano de tempo complexo. Chamemos essas funções de Green ordenadas de Tc ( A ( t1 ) B ( t2 )) . Assim, por exemplo, podemos definir o propagador, para a teoria real de Klein-Gordon, como sendo iGc ( t − t ′ ) = Tc (φ ( t ) φ ( t ′ ) ) = θ c ( t − t ′ ) φ ( t ) φ ( t ′ ) + θ c ( t ′ − t ) φ ( t ′ ) φ ( t ) ~ = ( −i ) 2 δ 2W [ J c ] 1 W [ J c ] δ J c (t ) δ J c (t′) J , c =0 onde t e t ′ são dois pontos quaisquer do contorno, e onde, por simplicidade, suprimimos as coordenadas espaciais (podemos supor que estamos trabalhando no espaço dos 162 momentos lineares, por exemplo). A função teta está definida sobre o contorno de forma natural, tal que θ ( t − t ′ ) para t , t ′ ∈ C+ θ ( t ′ − t ) para t , t ′ ∈ C− θc ( t − t ′) = 0 para t ∈ C+ , t ′ ∈ C− 1 para t ′ ∈ C+ , t ∈ C− e isto faz com que a função delta seja definida sobre o contorno como sendo δ ( t − t ′ ) para t , t ′ ∈ C+ dθ c ( t − t ′ ) δ c ( t − t′) = = −δ ( t − t ′ ) para t , t ′ ∈ C− dt 0 em caso contrário o que satisfaz claramente ∫ dt ′δ ( t − t ′) f ( t ′) = f ( t ) . c Com isso, o funcional gerador pode ser facilmente calculado, e tem a forma i W [ J c ] = N exp − ∫ dtdt ′∫ d 3 xd 3 y J c ( x, t ) Gc ( x − y, t − t ′ ) J c ( y, t ′ ) , 2c onde N é uma constante de normalização irrelevante, e Gc satisfaz a equação (∂ µ ∂ µ + m 2 ) Gc ( x − y , t − t ′ ) = −δ 3 ( x − y ) δ c ( t − t ′ ) . Passando agora para o espaço dos momentos, tomamos a transformada de Fourier e reescrevemos essa equação de forma equivalente como ∂2 2 2 + ωk Gc ( t − t ′, ωk ) = −δ c ( t − t ′ ) , ∂t onde, como antes, ωk = ( k 2 + m 2 ) . 12 A solução, usando-se a condição KMS Gc ( t ) Gc ( t ′ ) = Gc ( t ′ ) G ( t + i β ) , será Gc ( t − t ′, ω ) = nB ( ω ) ′ ′ ′ ′ θ c ( t − t ′ ) e βω −iω (t −t ) + eiω (t −t ) + θ c ( t − t ′ ) e βω + iω (t −t ) + e − iω (t −t ) , 2iω ( ) ( ) 163 onde nB é a distribuição estatística de Bose-Einstein. Desta expressão do propagador podemos extrair várias observações. Em primeiro lugar, o limite a temperatura zero sobre C+ restitui o propagador usual, como era esperado. Em segundo lugar, o propagador, assim como a temperatura zero, é uma função par: Gc ( t − t ′) = Gc ( t ′ − t ) . Por último, notemos que, se t ∈ C+ (ou t ∈ C− ) quando t ′ ∈ C3 (ou vice-versa), o propagador se anula, isto é, ( ) lim Gc ( t − T + is, ω ) = lim e − iω (t −T +is ) + e βω +iω ( t −T +is ) → 0 . T →−∞ T →−∞ Isto mostra que o propagador não pode conectar dois pontos distintos, quando um deles está sobre C+ , ou C− , e o outro em C3 . Em outras palavras, o funcional gerador não pode ter termos que misturem J 3 e J + , ou J − . Isto equivale a dizer que a contribuição do ramo C3 à integral funcional pode ser fatorada, o que permite que se considerem as fontes sobre esse ramo como sendo nulas. Esta contribuição pode ser absorvida em um fator de normalização dependente da temperatura, que é irrelevante quando se consideram questões dinâmicas, e, consequentemente, aquele ramo do contorno pode ser inteiramente ignorado para fins de cálculo. O que transforma agora o contorno, na prática, em um contorno fechado no plano complexo de tempo, justificando assim a denominação do formalismo. Os mesmos argumentos, e, logo, o mesmo resultado, se aplicam ao propagador dos campos fermiônicos. Já ficou claro, portanto, que o propagador, em qualquer teoria, pode ser obtido de forma paralela ao caso de temperatura zero, desde que se obedeça às condições apropriadas de periodicidade, e também que, a temperatura finita, esse propagador tem uma estrutura mais complexa, uma vez que é o portador da dependência da temperatura. Considerando que propagadores são simplesmente as funções de Green multiplicadas por i , temos sobre os ramos C+ e C− um total de quatro propagadores não-triviais, obtidos de G++ ( t − t ′, ω ) = − { } i − iω t − t ′ iω t − t ′ θ ( t − t ′ ) + nB (ω ) e ( ) + θ ( t ′ − t ) + nB ( ω ) e ( ) 2ω { } { } G+− ( t − t ′, ω ) = − i − iω t −t ′ iω t −t ′ nB (ω ) e ( ) + (1 + nB (ω ) ) e ( ) 2ω G−+ ( t − t ′, ω ) = − i iω t −t ′ − iω t −t ′ nB (ω ) e ( ) + (1 + nB ( ω ) ) e ( ) 2ω G−− ( t − t ′, ω ) = − { } i iω t −t ′ − iω t −t ′ θ ( t − t ′ ) + nB (ω ) e ( ) + θ ( t ′ − t ) + nB (ω ) e ( ) . 2ω 164 Os subscritos das funções de Green indicam os ramos do contorno fechado no plano complexo de tempo aos quais as coordenadas de tempo correspondentes pertencem. Em termo se médias no ensemble, as definições passam a ser as seguintes: iG++ ( t − t ′ ) = T φ ( t ) φ ( t ′ ) t , t ′ ∈ C+ iG−− ( t − t ′ ) = T ∗ φ ( t ) φ ( t ′ ) t , t ′ ∈ C− iG+− ( t − t ′ ) = φ ( t ) φ ( t ′ ) t ∈ C+ , t ′ ∈ C− iG−+ ( t − t ′ ) = φ ( t ) φ ( t ′ ) t ∈ C− , t ′ ∈ C+ , onde T ∗ indica a ordenação reversa no tempo. Esta estrutura do propagador sugere que possamos definir um dupleto de variáveis de campo e fontes da forma φ φa = + φ− J Ja = + , J− onde a = +, −; φ+ , J + ∈ C+ e φ− , J − ∈ C− . Assumindo a assinatura da métrica deste espaço bidimensional como sendo igual a ( +, − ) , podemos escrever o funcional gerador para a teoria livre como i W [ J + , J − ] = N exp − ∫ d 4 xd 4 y J a ( x ) Gab ( x, y ) J b ( y ) , 2 o que corresponde a uma ação S = S (φ+ , J + ) − S (φ− , J − ) = ∫ d 4 x L (φ+ , J + ) − L (φ− , J − ) que permite que as componentes do propagador sejam dadas simplesmente por iGab ( x, y ) = ( −i ) 2 δ 2W [ J ] . W [ J ] δ J a ( x ) δ J b ( y ) J =0 1 Podemos observar aqui que, neste caso, a integração se dá sobre o intervalo usual, −∞ ≤ t ≤ ∞ , e que o ramo C− foi eliminado do contorno de trajetória fechada de tempo (CTP), tendo sido substituído pela duplicação dos graus de liberdade do sistema. 165 Decorre imediatamente desta conclusão que a função de Green G++ corresponde à função de Green convencional ordenada no tempo, enquanto que G−− faz o papel da função de Green ordenada reversamente no tempo – uma vez que a ordenação no tempo sobre C− , no qual o tempo flui reversamente, corresponde à ordenação reversa no sentido convencional em TQC. Intuitivamente, já se pode prever que as funções de Green a temperatura finita possuirão propriedades de analiticidade bem diferentes das funções a temperatura zero. Nesta representação bidimensional, resulta também que podemos escrever as funções de Green como uma matriz 2 × 2 da forma G G = ++ G−+ G+− . G−− Como já sabemos por experiência que os cálculos com as funções de Green são grandemente simplificados no espaço dos momentos, usaremos agora as transformadas de Fourier das funções de Green, que, no formalismo de tempo real, é uma operação bem mais fácil do que no formalismo de tempo imaginário, e teremos então que ( ) 1 G++ ( p ) = 2 − 2iπ nB p 0 δ ( p 2 − m 2 ) 2 p − m + iε ( ) 1 G−− ( p ) = − 2 − 2iπ nB p 0 δ ( p 2 − m 2 ) 2 p − m − iε ( ) G+− ( p ) = −2iπ θ ( − p 0 ) + nB p 0 δ ( p 2 − m2 ) ( ) G−+ ( p ) = −2iπ θ ( p 0 ) + nB p 0 δ ( p 2 − m2 ) . As distribuições estatísticas acima foram escritas diretamente em função de p 0 , e não de ω p , apenas com a finalidade futura de simplificar os cálculos. Fica bem óbvio agora que as funções de Green a temperatura finita, mesmo para a teoria livre, não possuem propriedades de analiticidade bem definidas. O motivo disto é que, por definição, δ ( x ) = lim ε →0 1 1 1 − 2iπ x − iε x + iε , e, portanto, a função delta não é analítica em nenhum dos semiplanos complexos. Também da simples inspeção das expressões das funções de Green, verifica-se que nem todos os elementos da matriz são independentes, pois satisfazem a relação de vínculo G++ + G−− = G+− + G−+ . Ou seja, apenas três das quatro componentes da matriz são independentes. 166 É importante ressaltar que os propagadores em tempo real iGab possuem uma descrição física intuitiva, o que não ocorre no formalismo de tempo imaginário. Em primeiro lugar, observe-se que os propagadores em tempo real são constituídos por duas partes, uma correspondendo à temperatura zero, e a outra sendo a portadora da dependência da temperatura. E esta última é a mesma, para todas as componentes das funções de Green. Em segundo lugar, analisando G++ , pode-se considerar convencionalmente a parte de temperatura zero do propagador como representando a troca de uma partícula virtual, ao passo que a outra parte representa uma contribuição on-shell. Ocorre que, em um plasma de partículas aquecidas, há uma distribuição de partículas reais, e essas partículas reais também podem participar dos processos de absorção e emissão, além daqueles ocasionados pela troca de partículas virtuais. E a parte do propagador dependente da temperatura descreve precisamente esta situação física real. Uma outra propriedade importante, cuja constatação corrobora o que já foi visto antes, e que está patente na estrutura do propagador, é que, uma vez que a parte dependente da temperatura corresponde a uma contribuição on-shell, não deverá ter influência no comportamento da teoria no ultravioleta. Explicitando: um sistema quântico não pode acrescentar divergências adicionais no UV a temperatura finita (embora as divergências no infravermelho possam vir a ser significativas). Uma forma também fisicamente intuitiva de ver isso é observar que, se a contribuição térmica vem de uma distribuição de partículas reais em um meio aquecido (macroscopicamente falando, o equivalente ao banho térmico da termodinâmica), esta distribuição tenderá, no ultravioleta, a uma distribuição de Boltzmann, com a característica supressão de modos de altas energias, tornando as contribuições da temperatura desprezíveis nesta região. Este processo em que, naturalmente, tanto campos quanto propagadores a temperatura finita adquirem uma estrutura matricial em duas dimensões, é uma característica dos formalismos de tempo real, e é referido usualmente como “duplicação dos graus de liberdade”. Esta característica ficará mais clara e rigorosamente demonstrada através da teoria TFD, mas, grosso modo, pode ser explicada assim: a temperatura finita, o sistema total é composto na realidade por duas partes – o sistema quântico e o banho térmico, e essa duplicação de graus de liberdade reflete este fato. As funções de Green acima podem, na presença de interações, também ser calculadas perturbativamente, pela técnica diagramática de Feynman, e o maior interesse recai sobre as funções de Green físicas (respectivamente: retardada ( R ), avançada ( A ), e de correlação( C )), que são dadas, no caso de campos bosônicos, por iGR ( x, x′ ) = θ ( t − t ′ ) φ ( x ) , φ ( x′ ) iGA ( x, x′ ) = θ ( t ′ − t ) φ ( x ) , φ ( x′ ) 167 iGC ( x, x′ ) = φ ( x ) , φ ( x′ ) + . Estas funções podem ser expressas em termos das componentes das funções de Green causais anteriormente encontradas, de acordo com GR = G++ − G+− = G−+ − G−− GA = G++ − G−+ = G+− − G−− GC = G++ + G−− = G+− + G−+ . Assim, podemos descrever, em seguida, uma forma de se calcular as funções de Green físicas através da técnica de diagramas. A mais comum é, partindo do cálculo das funções causais, que sabemos que pode ser feito por diagramas, se usar as expressões acima e obter uma transformação unitária que forneça de imediato as funções de Green físicas. Definindo uma matriz de funções de Green físicas como 0 Gˆ = GR GA GC podemos escrever que ˆ G = Q −1GQ Ĝ = QGQ −1 onde a matriz unitária que relaciona as duas funções é dada por Q= Q −1 = 1 1 −1 2 1 1 1 1 1 † −1 1 = Q 2 Temos, portanto, que, uma vez que a matriz G das funções de Green causais tenha sido calculada por diagramas, as funções de Green físicas Ĝ podem de imediato ser obtidas Por uma mudança de base proporcionada pela matriz unitária Q . Vejamos agora as formas das funções de Green físicas a temperatura finita para a teoria de Klein-Gordon, que resultam da aplicação deste método. Obtemos as expressões 168 GR ( p ) = 1 1 = 2 2 0 p − m + iε p ( p0 + iε 2 ) − ω p GA ( p ) = 1 1 = 2 2 0 p − m − iε p ( p 0 − iε 2 ) − ω p 2 2 ( ( ))δ ( p GC ( p ) = −2iπ 1 + 2nB p 0 2 − m2 ) . Note-se que as funções de Green retardada e avançada independem da temperatura, como esperado. O efeito das condições de contorno, ou das condições de estado inicial, é completamente absorvido pela função de Green de correlação. Por outro lado, a função retardada é analítica no semiplano superior, e a função avançada é analítica no semiplano inferior, ao passo que a função de Green de correlação não tem um comportamento analítico bem definido. As formas das funções de Green para campos fermiônicos a temperatura finita podem também ser diretamente obtidas, e são ( ) 1 S++ ( p ) = ( γ µ pµ + m ) 2 + 2iπ nF p 0 δ ( p 2 − m 2 ) 2 p − m + iε ( ) 1 S−− ( p ) = ( γ µ pµ + m ) − 2 + 2iπ nF p 0 δ ( p 2 − m 2 ) 2 p − m − iε ( ( ) ) S+− ( p ) = 2iπ ( γ µ pµ + m ) nF p 0 − θ ( − p 0 ) δ ( p 2 − m2 ) ( ( ) ) S−+ ( p ) = 2iπ ( γ µ pµ + m ) nF p 0 − θ ( p 0 ) δ ( p 2 − m2 ) , onde a distribuição de Fermi-Dirac é dada pela expressão ( ) 1 nF p 0 = e β p0 +1 . Da mesma forma, a partir daí, as funções de Green físicas podem ser obtidas de imediato, pela aplicação da matriz de transformação unitária Q . O CTP pode ser generalizado e representado graficamente como ( 0 ≤ σ ≤ β ): 169 Para este contorno, as funções de Green para o campo escalar tem a seguinte forma, no espaço dos momentos: G11 ( p ) = G++ ( p ) G22 ( p ) = G−− ( p ) G12 ( p ) = eσ p G+− ( p ) 0 G21 ( p ) = e−σ p G−+ ( p ) . 0 Uma escolha possível para σ é fazer σ = β 2 , e neste caso, G12 ( p ) = −2iπ e β p = −2iπ e β p 02 {1 + n ( p ) θ ( − p ) + n ( p )θ ( p )}δ ( p − m ) 0 0 0 B = −2iπ e 02 0 2 2 B β p0 2 G21 ( p ) = −2iπ e− β p = −2iπ e − β p ( ) θ ( − p 0 ) + nb p 0 δ ( p 2 − m2 ) 02 0 2 ( ) nB p 0 δ ( p 2 − m 2 ) ; ( ) θ ( p 0 ) + nB p 0 δ ( p 2 − m2 ) {1 + n ( p ) θ ( p ) + n ( p )θ ( − p )}δ ( p − m ) 0 0 B = −2iπ e 0 0 2 2 B β p0 2 ( ) nB p 0 δ ( p 2 − m 2 ) . Ou seja, com essa escolha para σ , resulta que G12 ( p ) = G21 ( p ) . O contorno generalizado corresponde ao contorno usado pelo formalismo de tempo real da TFD. 170 VI.4. Propriedades de Analiticidade Para mostrar em mais detalhe as anomalias de analiticidade das funções de Green a temperatura finita, vamos investigar melhor, usando as funções de Green da teoria do campo escalar livre. Conclusões semelhantes podem ser obtidas a partir das médias de ensemble de quaisquer pares de operadores, o que é mais fácil de mostrar no formalismo TFD. Tiramos das funções de Green causais acima que 1 Re G++ ( p ) = P 2 2 p −m β p0 Im G++ ( p) = −π coth 2 δ ( p 2 − m2 ) , onde, na primeira expressão, P significa a parte principal da integral, e a segunda será usada para compor a relação de dispersão Re G++ ( p 0 , p ) = − 1 π ∞ P ∫ dp′0 Im G++ ( p′0 , p ) −∞ p 0 − p ′0 β p ′0 tanh , 2 que mostra mais uma vez que G++ não possui propriedades de analiticidade bem definidas. De forma similar, podemos observar que Re GR ( p ) = Re G++ ( p ) β p0 Im GR ( p ) = tanh Im G++ ( p ) . 2 E, mais uma vez, como a função de Green retardada é analítica no semiplano superior do plano complexo p 0 , resulta que G++ não é analítica em qualquer dos dois semiplanos, assim como ocorre com a função delta δ ( x ) em relação ao plano complexo x . Observe-se que essas relações para as funções de Green e propagadores da teoria bosônica livre também serão válidas em uma teoria interagente. E, do mesmo modo, podem ser obtidas da função de Green avançada. Podemos agora exibir as relações entra as funções de Green no formalismo de tempo imaginário e no formalismo de tempo real. No primeiro formalismo, já obtivemos que 171 Gβ ( p 0 , p ) = (p ) 0 2 1 + p2 + m2 , com p 0 assumindo somente valores discretos. Entretanto, se permitirmos que p 0 seja uma variável contínua, e fizermos a continuação analítica para o plano complexo p 0 , o resultado será que ( ) Gβ i ( p 0 + iε ) , p = − (p 1 2 + iε ) − p 2 − m 2 2 =− 1 = −GR ( p ) . p − m + 2iε p 0 2 2 Em outras palavras, se soubermos os valores das funções de Green com tempo imaginário num conjunto de pontos discretos, e fizermos a continuação analítica das mesmas, obteremos a função de Green retardada com tempo real GR ( p ) , que através da relação entre a sua parte real/imaginária e a parte real/imaginária da função de Green de Feynman (causal) G++ ( p ) , permite, em tese, a reconstituição desta última. A ressalva se deve ao fato de que a continuação analítica, para o eixo real, de uma função cujos únicos valores conhecidos formam um conjunto discreto pertencente ao eixo imaginário do plano complexo de energia, é problemática e sujeita a ambigüidades. Por exemplo, sempre podemos multiplicar uma tal função por e βω , cujo valor em ω = 2inπ β é a unidade. No convergentes assegura que portanto, fica formalismos. caso, porém, em que aquelas funções são bem-comportadas e para argumentos infinitos, um teorema da Análise Complexa a continuação analítica, feita dessa forma, é única. Nestas condições, bem estabelecida a conexão entre as funções de Green em ambos os VI.5. O Propagador a Um Laço Veremos agora o propagador, a um laço, para uma teoria auto-interagente φ 4 a temperatura finita. Como já foi visto, a ação completa para este caso é dada por S = ∫ d 4 x ( L ( φ + ) − L (φ − ) ) , onde L (φ ) = 1 m2 2 λ 4 ∂ µφ∂ µφ − φ − φ . 2 2 4! Da mesma maneira que antes, podemos raciocinar como se φ+ e φ− correspondessem aos valores dos campos nos dois ramos do contorno CTP, ou simplesmente como duas componentes de um dupleto térmico de campos escalares. 172 O propagador térmico para a teoria livre já foi calculado anteriormente, falta calcular os vértices de interação, representados como Fica patente que agora temos duas espécies de vértices na teoria, um vértice envolvendo apenas φ+ , o outro envolvendo apenas φ− . A intensidade da interação é a mesma em ambos os casos, diferindo apenas nos sinais. Isto posto, podemos imediatamente calcular as correções a um laço para a teoria, que se resume somente a uma correção de massa: Podemos escrever então que −i∆m+2 = ( −iλ ) 2 d4 p ∫ ( 2π ) iG++ ( p ) = 4 λ ( ) d4 p 1 − 2iπ nB p 0 δ ( p 2 − m 2 ) 4 2 3 ∫ 2 ( 2π ) p − m + iε = −i ( ∆m02 + ∆mT2 ) . Ficam claras assim as contribuições a temperatura zero e a temperatura finita para a correção de massa, assim como a divergência UV apenas na integral independente da temperatura, que pode ser tratada de forma usual pela adição de um contratermo correspondente ao caso de temperatura zero. Efetuando a integral em p 0 pelo método de resíduos, a integral a temperatura zero toma a forma −i∆m02 = − iλ d 3 p 1 , 4 ∫ ( 2π )3 ω p 173 enquanto que a integral em p 0 da parte dependente da temperatura pode ser efetuada trivialmente usando-se a definição da função δ , e vem a ser igual a −i∆mT2 = − i λ d 3 p nB ( ω p ) . 2 ∫ ( 2π )3 ω p A correção total de massa a temperatura finita é dada, portanto, pela expressão ∆m+2 = ∆m02 + ∆mT2 = λ βω p coth ωp 2 d3p 1 4 ∫ ( 2π ) 3 , que vem a ser, como era esperado, a mesma expressão já anteriormente encontrada e exatamente calculada no formalismo de tempo imaginário. De maneira similar, podemos calcular a correção de massa para o campo φ− , e mostrar que ∆m−2 = iλ d 4 p G−− ( p ) = ∆m+2 . 4 ∫ 2 ( 2π ) De posse desses resultados, podemos finalmente calcular a correção a um laço do propagador, que envolverá ambos os tipos, + e − , de vértices de interação: e fica claro que a expressão resultante será () iG++ ( p ) = iG++ + ( −i∆m+2 ) ( iG++ ) + ( i∆m−2 ) ( iG+− )( iG−+ ) 1 2 2 (1) ∴ G++ ( p ) = G++ ( p ) + ∆m+2 ( G++ ( p ) ) − G+− ( p ) G−+ ( p ) . Apesar de cada função de Green conter uma função delta, cujo quadrado é uma quantidade que não é bem definida, uma simples substituição mostra que essas quantidades se cancelam mutuamente, dando como resultado a possibilidade de uma expansão perturbativa da expressão acima. O que é mais uma forma de comprovar que a 174 duplicação dos graus de liberdade é realmente necessária à consistência de uma descrição diagramática válida. Usando uma expressão regularizada para a função delta, como aquela já apresentada, podemos também escrever que 1 1 1 − ε → 0 2iπ x − iε x + iε δ ( x ) = lim (1) 2 ∂G++ ( p ) → G++ = G++ ( p ) + ∆m+ ∂m 2 o que mostra que a correção de massa tem apenas o efeito de deslocar a posição do polo no propagador, de modo semelhante ao que ocorre à temperatura zero. 175 VII. Formalismo de Tempo Real com Campos Térmicos VII.1. Introdução A teoria de Campos Térmicos Dinâmicos (TFD – Thermofield Dynamics) foi desenvolvida a partir de 1974 (L. Leplae, F. Mancini, and H. Umezawa, Phys. Rep. C 10, 154), e começou a ser definitivamente estabelecida em 1982 (H. Umezawa, H. Matsumoto, e M Tachiki, “Thermo Field Dynamics and Condensed States (NorthHolland, Amsterdam), como uma extensão para temperatura finita da teoria quântica de campos à temperatura zero (TQC). A TFD preserva muitas das propriedades da TQC, e, em particular, o formalismo de operadores e a formulação ordenada no tempo das funções de Green (ou seja, a técnica diagramática de Feynman em tempo real). De acordo com o teorema da reconstrução de Wightman (Arthur S. Wightman, Phys. Rev. 101, 860 (1957)), o espaço de Hilbert de uma TQC pode ser sempre reconstruído a partir de um conjunto completo, axiomaticamente definido, de valores esperados no vácuo (VEV) 0 , à temperatura zero, de operadores da teoria. Logo, uma forma possível de se construir a TQC com tempo real, à temperatura finita β , independente de situações de equilíbrio termodinâmico, é considerar as médias estatísticas de operadores associados a um sistema quântico imerso num meio externo macroscópico (banho térmico, ou reservatório de calor) como sendo os VEV’s correspondentes a um estado de vácuo apropriadamente definido, o vácuo térmico 0, β . A TFD tem a vantagem de ser capaz de incluir informação referente a estados em relação a este vácuo 0, β , de forma a permitir que vários resultados provenientes de relações entre operadores – tais como as relações de Ward-Takahashi – possam ser tratados de modo consistente, mesmo quando a transição de fase induz uma quebra espontânea de simetria. E também, uma vez que a TFD é formulada em tempo real, todas as quantidades calculadas estão diretamente relacionadas a observáveis dependentes da freqüência e do momento linear, além de permitir, de forma natural, o tratamento das condições de contorno de transformações de simetria, como ocorre, por exemplo, em supersimetria. A duplicação de graus de liberdade, necessária a uma TQC a temperatura finita, já havia sido reconhecida dez anos antes (H. Araki e E. J. Woods, J. Math. Phys. 4, 637 (1963)), a partir da TQC axiomática de Wightman et al., resultando mais tarde (I. Ojima, Ann. Phys. (NY) 137, 1 (1981)) numa versão axiomática da mecânica estatística baseada na C ∗ − álgebra , onde a condição KMS é incluída como um dos axiomas. Na TFD, a condição KMS decorre naturalmente de estados térmicos, e as regras de Feynman da TFD garantem que essa condição seja satisfeita em cada ordem da expansão perturbativa. Comparativamente com o formalismo de Schwinger-Keldysh, mesmo após a inclusão neste de dupletos de campos e fontes – o que equivale a duplicar os graus de liberdade da teoria, e, logo, o espaço de Hilbert de estados -, que é a única possibilidade de se obter uma métrica unitária, a TFD corresponde a uma escolha bem definida de um contorno aberto apropriado para a definição dos propagadores, o que torna essa teoria 176 mais conveniente também para o formalismo global de integração funcional. E com a vantagem intrínseca de responder a questões tais como a estrutura do vácuo térmico, a natureza dos estados de Goldstone, e a evolução no tempo de quantidades físicas nas proximidades do equilíbrio e em transições da fase, o que não é possível se obter no formalismo de Schwinger-Keldysh. VII.2. Formalismo TFD VII.2.1. Transformação de Bogoliubov e Vácuos Térmicos VII.2.1.1. Correlação no Vácuo VII.2.1.1.1. Representação de Número (de Osciladores) Consideraremos inicialmente a MQ para um número finito de variáveis canônicas, a partir da relação entre operadores canônicos e operadores de criação e destruição, usuais no estudo de osciladores após a introdução dos mesmos por Dirac. Quando temos um operador de oscilador a satisfazendo a relação de comutação a, a † = 1 , os operadores q= 1 a + a† ) , ( 2 p= 1 a − a† ) ( 2 satisfazem a relação de comutação canônica [ q, p ] = i , o que significa que um sistema com uma variável canônica atua como um oscilador. Vamos definir o operador número N em função de a e a † como sendo N = a†a , com autovetores normalizados n que satisfazem N n =n n , n m = δ nm . 177 Como n não pode ser negativo, deve ter forçosamente um valor mínimo. Seja então 0 o autovetor de N com esse autovalor mínimo. Decorre daí, uma vez que a é um operador de destruição cuja ação é fazer N decrescer, que a 0 = 0, e, logo, por definição, N 0 =0, o que mostra que o valor mínimo dos autovalores de N é nulo. Este fato justifica a com n = 0 . O estado 0 notação 0 , que nada mais é do que n será identificado com o estado de vácuo a temperatura zero. Desta forma, uma ação de a † sobre 0 repetida m vezes cria um estado em que n = m . Isto prova que n pode assumir todos os valores inteiros não-negativos, e explica porque n é frequentemente interpretado como o número de partículas. O nome vácuo para o estado 0 se deve ao fato de que o seu número de partículas é zero. E, uma vez que a † sempre faz n crescer de uma unidade, é chamado de operador de criação. O operador a decresce n sempre de uma unidade, agindo como um operador de destruição de partícula. O estado n , portanto, é criado por n ações de a † sobre o estado de vácuo 0 , segundo a expressão normalizada n = n 1 a† ) 0 . ( n! O espaço vetorial de estados H é formado por todas as superposições { n } : H = {∑ c n | ∑ c < ∞} . Este espaço H é chamado de espaço de Fock. Logo, o conjunto { n } nada mais é do que a base do 2 normalizáveis dos vetores de estado n n espaço de Fock H . E, desde que n assume os valores de todos os inteiros nãonegativos, a representação nesta base também é chamada de representação de número. Definindo A = j A j , onde j representa um vetor qualquer de H , e introduzindo a notação ∆A = A − A , resulta do princípio da incerteza que ( ∆p ) 2 ( ∆q ) 2 ≥1 4 . 178 VII.2.1.1.2. Estados Coerentes Consideremos um oscilador único com o respectivo operador a . Mesmo após introduzirmos o estado de vácuo 0 , não necessariamente simplificamos o problema, pois a escolha de um vácuo não afasta o fato de que podem existir várias classes de vácuo. Para tentar entender este problema, analisemos o caso da eletrodinâmica quântica, na qual não trabalhamos apenas com estados de fótons, mas também com uma quantidade de formas de radiações macroscópicas clássicas. Mas como obter radiação ondulatória macroscópica a partir da eletrodinâmica quântica, onde delimitar a fronteira entre as duas escalas, de forma consistente? Pode-se suspeitar, intuitivamente, que as radiações macroscópicas podem ser formadas a partir da condensação de muitos fótons – o que sugere que os estados desses objetos macroscópicos não sejam auto-estados de número de partículas, mas, ao contrário, estados com grande incerteza no número de partículas. Isto remete ao mesmo antigo problema que fez supor que, talvez, a fase e o número de fótons pudessem ser variáveis canonicamente conjugadas, como, por exemplo, faz crer a fórmula e − iθ N ae iθ N = eiθ a . Desta forma, N seria o gerador da mudança de fase, e, portanto, o número poderia ser o conjugado canônico da fase, resultando, por analogia com o momento linear e a posição, na relação de incerteza ∆θ ∆n ≥ , 2 que traduziria o fato de que, se a fase é especificada, o número de fótons é totalmente incerto, e, para criar uma onda de radiação, como, por exemplo, em um laser, precisaríamos ter um grande e indeterminado número de fótons. Infelizmente, como não se consegue definir a fase como um operador, porque o número de partículas, ou o espectro de energia, são não-negativos, e, logo, possuem um limite inferior, a definição matemática deste argumento é muito difícil. Na verdade, vamos ver aqui um estado 0 que representa uma radiação macroscópica constituída de uma certa quantidade de fótons, através do mecanismo de condensação de bósons. Ressalta obviamente que este não é o mesmo estado de vácuo 0 do operador a , uma vez que a 0 ≠ 0 . Vamos buscar a definição então de um operador α , que satisfaça ao mesmo tempo as condições α 0 = 0 e α , α † = 1 . Caso exista, o estado 0 será o estado de vácuo associado a este operador α , mesmo que 179 esse estado contenha muitos osciladores quânticos associados a a . Este exemplo mostra como podem existir várias espécies de vácuo, uma vez que o vácuo apropriado para uma onda com uma fase específica, como a gerada em um laser, é um novo vácuo que contém muitos fótons condensados em um mesmo estado comum. Uma forma bem estudada de vácuo com condensação de partículas é o estado coerente, que será descrito a seguir. A transformação a → α (θ ) = a + θ , onde θ é um múltiplo da identidade, ou seja, um c − número , é chamada de translação de bóson, ou transformação de Bogoliubov para estados coerentes. O vácuo para α (θ ) será referido como 0, β , e temos então as relações α (θ ) 0, β = 0 a 0, β = −θ 0, β . O estado de vácuo 0 (θ ) é chamado de estado coerente de a , com autovalor −θ . Definindo um gerador Gc (θ ) = −i (θ ∗ a − θ a † ) tal que U c (θ ) = exp iGc (θ ) obtemos que α (θ ) = U c (θ ) aU c−1 (θ ) 0, β = U c (θ ) 0 . Podemos reescrever a transformação U c (θ ) como 1 2 U c (θ ) = exp − θ exp ( −θ a † ) exp (θ ∗ a ) , 2 o que nos dá, finalmente, que 1 2 0 (θ ) = exp − θ exp ( −θ a † ) 0 . 2 180 Isto indica que o estado 0, β de α -vácuo é uma superposição de estados com muitas α -partículas. Este é um exemplo de condensação de α -partículas. Agora, do mesmo jeito que construímos o a -espaço de Fock H ( a ) pela operação iterativa de potências de a † sobre 0 , podemos construir o espaço de Fock H (θ ) pela ação cíclica de α † sobre 0, β . Podemos ver também que H ( a ) é equivalente a H (θ ) , no sentido de que qualquer vetor em H ( a ) é uma superposição de vetores em H (θ ) , e vice-versa. Obtemos assim um espaço de Fock parametrizado, de tal forma que quaisquer dois espaços com θ ’s diferentes são mutuamente equivalentes. O estado coerente tem a propriedade de saturar a relação de incerteza: ( ∆p ) 2 ( ∆q ) 2 =1 4 . VII.2.1.1.3. Estados Comprimidos (squeezed states) Um estado comprimido é aquele definido por uma amplitude de probabilidade que obedece a uma das duas relações ( ∆p ) 2 ≤1 2 ou ( ∆q ) 2 ≤1 2. Em MQ é usual chamar esses estados de “pacote de onda com incerteza mínima”. Investigaremos agora a estrutura do estado de vácuo para esses estados comprimidos. Vamos considerar os seguintes geradores bilineares construídos a partir de a 2 e (a ) † 2 : 2 1 Gs = i a 2 − ( a † ) 2 usados para definir a transformação (onde θ ∈ ) U s (θ ) = exp iGs (θ ) que nos dará as relações entre a e α α (θ ) = U s (θ ) aU s−1 (θ ) α † (θ ) = U s (θ ) a †U s−1 (θ ) , que podem ser reescritas como 181 α (θ ) = ca − da † α † (θ ) = ca † − da , onde os parâmetros reais c e d são dados por c = cosh θ e d = senh θ . Esta é a chamada transformação de Bogoliubov para o estado comprimido. As relações de comutação não são alteradas por esta transformação. O vácuo de α (θ ) é representado por 0, β : α (θ ) 0, β = 0 . Resulta daí que 0, β = U s (θ ) 0 , ou, de forma explícita: 2 1 1 0, β = exp − ln cosh θ exp ( a † ) tanh θ 0 . 2 2 Esta relação indica que o estado de α -vácuo 0, β é uma superposição de estados com número par de α -partículas, isto é, este é mais um exemplo de condensação de a - partículas. Observa-se mais uma vez que H ( a ) é equivalente a H (θ ) , no sentido de que qualquer vetor em H ( a ) é uma superposição de vetores em H (θ ) , e vice-versa. Aqui H (θ ) é o espaço de Fock criado por operações de potências de α † (θ ) sobre 0, β , e observamos novamente que o mesmo é parametrizado de forma a que dois espaços quaisquer com diferentes θ são mutuamente equivalentes. Calculando as incertezas dos operadores ( q, p ) acima definidos, e considerando o estado j como sendo o estado comprimido 0, β , obtemos as relações ( ∆q ) ( ∆p ) 2 = (c + d ) 2 2 = (c − d ) 2 . 2 2 É imediato observar que o estado comprimido satura a relação de incerteza: ( ∆p ) 2 ( ∆q ) 2 =1 4 . Como c e d crescem para infinito junto com θ , podemos sempre fazer ( ∆p ) 2 tão pequeno quanto se queira, escolhendo θ com valores positivos muito grandes. Para fazer o mesmo com ( ∆q ) 2 , basta escolher θ com valores negativos e módulos muito grandes, daí o nome de “estado comprimido”. 182 VII.2.1.1.4. Estados comprimidos com dois modos Consideremos agora um gerador constituído por dois conjuntos comutáveis de osciladores, a e a , da seguinte forma: a, a † = a , a † = 1 [ a, a ] = a, a † = 0 GB = i aa − a † a † . Definindo agora a matriz U B (θ ) = exp [iθ GB ] , com θ ∈ , a transformação α (θ ) = U B (θ ) aU B−1 (θ ) B−1 (θ ) α (θ ) = U B (θ ) aU nos dá que α (θ ) = ca − da † α (θ ) = ca − da † , onde os parâmetros reais são dados por c = cosh θ e d = senh θ (logo, c 2 − d 2 = 1 ). Esta transformação é chamada de transformação de Bogoliubov de estados comprimido de dois modos, também mantém inalteradas as relações de comutação, e pode ser escrita em termos da matriz de Bogoliubov B (θ ) , que terá a forma c B (θ ) = −d −d c ; B −1 (θ ) = c d d , c correspondente à relação B −1 (θ ) = τ 3 B (θ )τ 3 , sendo τ 3 uma das matrizes de Pauli: 1 0 , 0 −1 τ3 = Representando os estados como dupletos, e empregando a notação a µ : a1 = a, a 2 = a † 183 a µ : a1 = a † , a 2 = − a α (θ ) : α (θ ) = α (θ ) , α (θ ) = α † (θ ) µ 1 2 α (θ ) : α (θ ) = α † (θ ) , α (θ ) = −α (θ ) , µ 1 2 a transformação entre os estados acima pode ser escrita como a µ = B −1 (θ ) α (θ ) µν ν a µ = α (θ ) B (θ ) . ν O vácuo de ( a, a ) νµ é representado como (α (θ ) ,α (θ ) ) é representado por 0 (θ ) 0 , enquanto o vácuo de , e temos as seguintes relações: a 0 = a 0 = 0 α (θ ) 0 (θ ) = α (θ ) 0 (θ ) = 0 . Ou seja, podemos dizer que 0 (θ ) = U B (θ ) 0 = exp [ − ln cosh θ ] exp a † a † tanh θ 0 . Esta última expressão indica que os pares ( a, a ) estão condensados. O estado 0 (θ ) é chamado de estado comprimido com dois modos de ( a, a ) . Podemos construir o espaço de Fock H ( a, a ) por operações de potências de a † e a † sobre o vácuo 0 , ao passo que o espaço de Fock H (θ ) é gerado por operações de potências de α † (θ ) e α † (θ ) sobre 0 (θ ) . Observa-se também que H ( a, a ) é equivalente ao espaço de Fock parametrizado H (θ ) . Uma vez que os α (θ ) -vácuos correspondem aos estados nos quais os pares ( a, a ) se apresentam condensados, estes vácuos são invariantes quanto à permutação de a por a . Esta operação de permutação que deixa os vácuos invariantes é chamada de (~)-conjugação, e tem as seguintes propriedades: 0 (θ ) = 0 (θ ) , 0 (θ ) = 0 (θ ) . Introduzindo a seguir os parâmetros de número como sendo 184 n ≡ 0 (θ ) a † a 0 (θ ) e n ≡ 0 (θ ) a † a 0 (θ ) obtemos a identidade n = n = d 2 = senh 2 θ , o que mostra que a matriz de Bogoliubov B (θ ) é caracterizada pelo parâmetro de número n . Uma análise detalhada das relações de incerteza revela que a correlação entre os dois osciladores é induzida por um mecanismo bastante complexo. Os estados comprimidos com dois modos exibem um aspecto particular, fortemente vinculado ao efeito térmico, dos vários possíveis efeitos de vácuo quântico. Devido a esta característica, a transformação de Bogoliubov para os estados compridos com dois modos é chamada de transformação de Bogoliubov térmica, e cumpre um papel fundamental na construção da teoria TFD. VII.2.2. Abordagem por Operadores: Duplicação do Espaço de Hilbert Consideremos mais uma vez o fato de que a média sobre um ensemble estatístico de qualquer operador em equilíbrio é dada pela expressão A β = Z −1 ( β ) Tr e − β H A = Z −1 ( β ) ∑ e − β En n A n , n onde Z ( β ) = Tr exp ( − β H ) é a função de partição do sistema e, para simplificar, levamos em conta apenas os autovalores discretos do hamiltoniano, obedecendo às relações H n =E n ; n m = δ nm . A forma da função de partição é semelhante à da amplitude de transição vácuo-vácuo (o funcional gerador) da teoria de campos a temperatura zero, mas não coincide com ela. Entretanto, podemos aproveitar toda a maquinaria da teoria de campos a temperatura zero, se pudermos expressar a média sobre um ensemble, qualquer que seja o operador, como um valor esperado em um vácuo (no caso que nos interessa, um vácuo térmico). Portanto, se conseguirmos definir, para um operador arbitrário A , um estado 0, β de tal modo que A β = 0, β A 0, β = Z −1 ( β ) ∑ e− β En n A n , n poderemos esperar que o formalismo da teoria a temperatura finita seja inteiramente paralelo ao da teoria a temperatura zero. 185 Supondo que se pode escrever o estado 0, β como uma superposição linear de estados em H , e usando a relação de completeza do espaço de Hilbert, obtemos que 0, β = ∑ n n 0, β = ∑ f n ( β ) n . n n Logo, 0, β A 0, β = ∑ f n∗ ( β ) f m ( β ) n A m , n ,m e poderíamos definir a média de A no ensemble conforme desejado, desde que seja válida a relação f n∗ ( β ) f m ( β ) = Z −1 ( β ) e − β En δ nm . Ocorre, porém, que os f n∗ ( β ) são simples coeficientes numéricos dos autovetores do espaço de Hilbert, e, portanto, são incapazes de satisfazer esta relação funcional. Podemos considerar que este resultado representa uma demonstração ab absurdo de que, apenas com o espaço de Hilbert original, não é possível construir um vácuo a temperatura finita como o proposto. É imediato perceber, por outro lado, que, embora os f n ( β ) não sejam vetores de estado, essa última relação é em tudo análoga a uma relação de ortonormalidade entre vetores de estado. O passo seguinte é, seguindo o objetivo inicial, introduzir um sistema fictício que seja uma cópia idêntica do sistema original em estudo, e apresentálo como um sistema (~), no qual o estado n possui o autovalor número n . Vamos então considerar o espaço produto dos dois sistemas, dado por n, m = n ⊗ m , e expandir o vácuo térmico naturalmente como 0, β = ∑ f n ( β ) n, n = ∑ f n ( β ) n ⊗ n . n n Neste caso, obtemos que 0, β A 0, β = ∑ f n∗ ( β ) f m ( β ) n, n A m, m = ∑ f n∗ ( β ) f m ( β ) n A n . n ,m n Foi usado o fato de que um operador do sistema físico original não atua sobre o espaço de Hilbert do sistema (~), e vice-versa, o que se traduz nas relações de ortonormalidade entre estados 186 n, m A n′, m ′ = n A n′ m m ′ = δ mm′ n A n′ n, m A n′, m ′ = n n′ m A m ′ = δ nn′ m A m ′ . Resulta dessa duplicação do espaço de Hilbert que a média de um operador arbitrário no ensemble descrito pela função de partição Z ( β ) poderá ter a forma procurada, desde que seja satisfeita a relação f n∗ ( β ) f n ( β ) = Z −1 ( β ) e − β En , que possui a solução real f n ( β ) = f n∗ ( β ) = Z −1 2 ( β ) e − β En 2 . Vemos assim que a duplicação do espaço de Hilbert possibilita a definição de um estado de vácuo dependente da temperatura, construído de tal maneira que a média estatística de qualquer operador no ensemble pode ser identificada com o valor esperado do operador em relação a este vácuo, numa expansão para temperatura finita do teorema de Wightman que possibilita o uso de todas as técnicas conhecidas das teorias de campos a temperatura zero. Comparando com o formalismo em tempo real de SchwingerKeldysh, observa-se que a solução acima corresponderá a um determinado contorno aberto de integração dos propagadores da TFD, conforme já foi antecipado. VII.2.3. Osciladores Bosônicos e Fermiônicos VII.2.3.1. Oscilador Bosônico O hamiltoniano de um oscilador bosônico com frequência ω tem a forma H = ωa†a onde os operadores de destruição e criação satisfazem as relações de comutação [ a, a ] = a † , a† = 0 . a, a † = 1 ; O espaço de Hilbert tem dimensão infinita, e os auto-estados do hamiltoniano satisfazem H n = nω n n = 0,1, 2,… Na teoria TFD, introduz-se o sistema (~) descrito pelo hamiltoniano H = ω a † a , 187 Onde os operadores (~) de destruição e criação obedecem a relações de comutação idênticas às acima, além de comutarem com os operadores originais. A representação de um estado padrão normalizado no espaço produto será n, m = n ⊗ m n, m = 0,1, 2,… Pode-se mostrar que o vácuo térmico bosônico é dado pela expressão 12 ∞ 0, β = (1 − e − βω ) ∑e − n βω 2 n, n . n =0 Podemos então definir um operador hermitiano − a † a † ) Q (θ ) = −iθ ( β ) ( aa e mostrar que o operador formalmente unitário U (θ ) = e − iQ (θ ) =e ( − a† a † −θ ( β ) aa ) nos dá o vácuo térmico através de uma transformação de Bogoliubov da forma 0, β = U (θ ) 0, 0 = e ( − a †a † −θ ( β ) aa ) , desde que façamos as identificações cosh θ ( β ) = 1 1 − e − βω ; senh θ ( β ) = e − βω 2 1 − e − βω . Os operadores térmicos também podem ser obtidos da maneira usual. Definindo o dupleto a Db = † a podemos escrever que a (β ) † Db ( β ) = † = U (θ ) DbU (θ ) = Bb (θ ) Db , a ( β ) onde Bb (θ ) é a matriz de Bogoliubov para o oscilador bosônico cosh θ ( β ) − senh θ ( β ) Bb (θ ) = . − senh cosh θ β θ β ( ) ( ) 188 Resulta da definição dos operadores térmicos de destruição e criação que o vácuo térmico satisfaz as relações a ( β ) 0, β = ( a cosh θ ( β ) − a † senh θ ( β ) ) 0, β = 0 a ( β ) 0, β = ( a cosh θ ( β ) − a † senh θ ( β ) ) 0, β = 0 . Verificamos assim, mais uma vez, que o estado 0, β é destruído pelos operadores térmicos de destruição, e pode ser considerado, neste sentido, como o vácuo térmico. É importante notar também que a destruição de um quantum de partícula no vácuo térmico equivale à criação de um (~)-quantum. Da forma usual, podemos construir o espaço de Hilbert térmico pela aplicação das potências dos operadores térmicos de criação sobre o estado de vácuo térmico 0, β . Entretanto, os estados neste espaço não serão auto-estados do hamiltoniano original H , nem do (~)-hamiltoniano H , mas sim do operador H − H , que pode ser considerado como o hamiltoniano total, com métrica indefinida, que governa a dinâmica do sistema combinado. Desta forma, podemos escrever a seguinte equação: ( H − H ) 0, β =0, assim como podemos adotar a prescrição, para sistemas livres ou interagentes, para a expressão da densidade lagrangiana total, dada por LTotal = L − L . 0 ≡ L0 − L0 e sua Se separarmos a lagrangiana total LTot em sua parte livre bilinear LTot I ≡ LI − LI , podemos usar as fórmulas de Gell-Mann-Low e, parte interativa LTot portanto, também o método usual dos diagramas de Feynman, ao VEV ( β ) de produtos de operadores ordenados no tempo, que não são nada mais do que funções de Green causais/ propagadores, em tempo real e a temperatura finita. VII.2.3.2. Oscilador Fermiônico Mudando a notação dos operadores de destruição e criação fermiônicos para b e b , respectivamente, partimos da mesma forma de hamiltoniano para um oscilador bosônico † H = ω b †b , onde agora as relações válidas são as de anticomutação 189 {b, b } = 1 ; {b, b} = {b , b } = 0 , † † † e o espaço de Hilbert bidimensional se compõe dos dois estados 0 e 1 = b† 0 . Define-se então um sistema (~), idêntico ao sistema original, com o hamiltoniano H = ωb †b e dotado das relações de anticomutação entre os operadores {b, b } = 1 ; {b, b} = {b , b } = 0 . † † † Desta vez, vamos assumir que os operadores de destruição e criação do sistema original e do sistema (~) anticomutam. Agora, o espaço produto de estados para os dois sistemas quadridimensional, com uma base definida, por exemplo, pelos estados será 0, 0 ; 0,1 ; 1, 0 ; 1,1 . Assumindo também, como usual, que os auto-estados são ortonormais, podemos fazer a expansão 0, β = f 0 ( β ) 0 ⊗ 0 + f1 ( β ) 1 ⊗ 1 . A normalização do estado 0, β acarreta uma das relações entre os coeficientes de expansão 0, β 0, β = f 0 ( β ) + f1 ( β ) = 1 , 2 2 enquanto uma segunda condição é extraída a partir da exigência de que o estado 0, β forneça a função de distribuição térmica correta, no caso, a de Fermi-Dirac: 0, β N 0, β = 0, β b†b 0, β = f1 ( β ) = 1 2 e βω +1 . Podemos então extrair dessas duas condições que f 0 ( β ) = f 0∗ ( β ) = f1 ( β ) = f1∗ ( β ) = 1 1 + e − βω e− βω 2 1 + e − βω . O vácuo térmico do oscilador fermiônico, portanto, pode ser escrito como 190 0, β = 1 1+ e − βω ( 0, 0 + e ) − βω 2 1,1 , e também obtemos de forma trivial, a partir das relações de anticomutação, que ( bb − b b ) † † ( bb − b b ) † † 2n 2 n +1 0, 0 = ( −1) 0, 0 n 0, 0 = ( −1) n +1 0, 0 . Logo, podemos definir um operador hermitiano ( ) − b†b † , Q (θ ) = −iθ ( β ) bb sendo θ ( β ) um parâmetro real tal que torna formalmente unitário o operador U (θ ) = e − iQ (θ ) =e ( −b†b † −θ ( β ) bb ) , o qual, por sua vez, tem a propriedade de, a partir do vácuo do espaço duplicado, gerar o vácuo térmico, de acordo com a expressão U (θ ) 0, 0 = cos θ ( β ) 0, 0 + sen θ ( β ) 1,1 = 0, β , desde que se façam as identificações cos θ ( β ) = 1 1 + e − βω ; sen θ ( β ) = e − βω 2 1 + e − βω . Desta forma, podemos concluir que a transformação formalmente unitária U (θ ) relaciona o vácuo térmico com o vácuo do espaço duplicado. Podemos também calcular as transformações induzidas por U (θ ) nos operadores de destruição e criação, a partir da definição A ( β ) = U (θ ) AU † (θ ) , válida para um operador arbitrário A . Obtemos então as relações térmicas de transformação b ( β ) = b cos θ ( β ) − b † sen θ ( β ) b ( β ) = b cos θ ( β ) + b† sen θ ( β ) b† ( β ) = b† cos θ ( β ) − b sen θ ( β ) 191 b † ( β ) = b † cos θ ( β ) + b sen θ ( β ) , as quais, se definirmos uma notação de dupleto fermiônico b Df = † , b podem ser escritas na forma b(β ) cos θ ( β ) − sen θ ( β ) b Df = † = U (θ ) D f U † (θ ) = B f D f = † . b ( β ) sen θ ( β ) cos θ ( β ) b Segue-se, de forma trivial, que ( ) b ( β ) 0, β = b cos θ ( β ) − b † sen θ ( β ) 0, β )( ( = b cos θ ( β ) − b † sen θ ( β ) cos θ ( β ) 0, 0 + sen θ ( β ) 1,1 ( ) ) = cos θ ( β ) sen θ ( β ) b 1,1 − b † 0, 0 = 0 ; ( ) b ( β ) 0, β = b cos θ ( β ) − b† sen θ ( β ) 0, β ( )( = b cos θ ( β ) − b† sen θ ( β ) cos θ ( β ) 0, 0 + sen θ ( β ) 1,1 ( ) ) = cos θ ( β ) sen θ ( β ) b 1,1 − b† 0, 0 = 0 , onde foi usado o fato de que os operadores (~) e não-(~) anticomutam. Isto mostra que, efetivamente, o vácuo térmico é o estado de vácuo dos operadores de destruição e criação. É fácil também mostrar que os operadores de criação e destruição satisfazem as mesmas relações de anticomutação, uma vez que a relação entre eles é unitária, ao menos quando o espaço de Hilbert tem dimensão finita. Podemos assim construir o espaço de Hilbert fermiônico, térmico e quadridimensional, contendo os estados 0, β ; b† ( β ) 0, β ; b † ( β ) 0, β ; b† ( β ) b † ( β ) 0, β . Deve-se observar, a partir da definição do vácuo térmico, que o mesmo se assemelha a um estado comprimido, embora entre ambos exista uma diferença essencial: quando o espaço é constituído por um número infinito de modos, o espaço de Hilbert térmico e o espaço de Hilbert original não serão isomorfos. Em outras palavras, a transformação U (θ ) , mesmo sendo formalmente unitária, deixa de sê-lo, efetivamente, no caso de dimensões infinitas, assemelhando-se mais a uma transformação de Bogoliubov. Outra 192 observação importante, agora do ponto de vista físico, é que a destruição de um quantum de partícula no vácuo térmico é inteiramente equivalente à criação de uma (~)partícula, e vice-versa. Isto nos leva naturalmente a imaginar uma (~)-partícula como uma espécie de estado “buraco” das partículas quânticas, ou como um estado de partícula no interior do banho térmico, provendo assim um significado intuitivo, na dinâmica dos campos térmicos, ou teoria TFD, para a necessidade de duplicação dos graus de liberdade. E mesmo, levando em conta a complexidade do sistema total, que combina um sistema quântico microscópico, descrito por meio de operadores sujeitos à sua álgebra específica, a um sistema termodinâmico macroscópico que descreve um banho térmico, pode-se dizer que é simplesmente espantoso que seja suficiente, apenas, duplicar o espaço de Hilbert original, para que sejam obtidos resultados quantificáveis e verificáveis por experimentação, como na verdade ocorre. Da mesma forma que no caso dos osciladores bosônicos, pela constatação de que b† ( β ) b ( β ) − b † ( β ) b ( β ) = b†b − b †b resulta que, se definirmos um hamiltoniano total como sendo H Total = H − H , os estados térmicos serão auto-estados deste operador total. Deve-se a Ojima (Izumi Ojima, Ann. Phys. 137, 1-32 (1981)) a formulação alternativa de uma transformação equivalente para o oscilador fermiônico, a partir do contexto da Mecânica Estatística Axiomática, usando a estrutura matemática da C ∗ álgebra usada pelo formalismo HHW (Haag-Hugenholtz-Winnink), onde a condição KMS não é derivada, e sim postulada. Neste contexto próprio, são identificadas relações de comutação anormais geradas pela operação de (~)-conjugação, às quais se aplica uma transformação de Klein apropriada. Em resultado dessas considerações, as relações entre os operadores fermiônicos no espaço original e no espaço (~) passam a ser b ( β ) = b cos θ ( β ) + ib † sen θ ( β ) b ( β ) = b cos θ ( β ) − ib† sen θ ( β ) . Segundo Ojima, estas relações modificadas poderão ser de importância, por exemplo, na extensão da TFD às teorias de calibre, para um tratamento adequado, por exemplo, dos campos fantasmas (ghost fields) de Fadeev-Popov, enquanto férmions escalares com propriedades de variáveis grassmannianas. 193 VII.2.4. Teoria Livre do Campo de Schrödinger: Operadores Térmicos Passaremos agora de sistemas simples da MQ, como osciladores a temperatura finita, para teorias de campos a temperatura finita, enfocadas pelo mesmo formalismo da TFD. Inicialmente, vamos considerar a teoria do campo livre de Schrödinger, em 3+1 dimensões, com a lagrangiana dada por L = iψ †ψ − 1 † ∇ψ ⋅ ∇ψ . 2m De acordo com a TFD, devemos introduzir um sistema (~), cuja lagrangiana, por analogia, será dada por 1 † L = −iψ †ψ − ∇ψ ⋅ ∇ψ . 2m A explicação para o sinal negativo no primeiro termo logo ficará clara, quando forem estabelecidas as regras de conjugação ((~)-conjugação) entre os dois espaços de Hilbert. A densidade lagrangiana total para o sistema será, como já foi visto, Lˆ = L − L . Os momentos lineares conjugados de cada uma das variáveis de campo ψ e ψ serão Π ( x, t ) = ∂Lˆ = iψ † ( x, t ) ∂ψ ( x, t ) ( x, t ) = Π ∂Lˆ = iψ † ( x, t ) ∂ψ ( x, t ) O motivo do sinal negativo escolhido anteriormente foi obrigar os momentos conjugados e as variáveis de campo a assumir formas idênticas no sistema (~) e no não(~), pois assim as relações de comutação serão idênticas, e dadas por ψ ( x, t ) ,ψ † ( x, t ) = δ 3 ( x − y ) ψ ( x, t ) ,ψ ( y , t ) = 0 = ψ † ( x, t ) ,ψ † ( y , t ) ψ ( x, t ) ,ψ † ( x, t ) = δ 3 ( x − y ) ψ ( x, t ) ,ψ ( y , t ) = 0 = ψ † ( x, t ) ,ψ † ( y , t ) , 194 e, logo, os sistemas serão idênticos, assim como a forma das densidades hamiltonianas. Assumiremos também que os campos (~) comutam com os campos não-(~). Manifestase aí uma das regras para a (~)-conjugação, qual seja, a lagrangiana para o sistema (~) é obtida da lagrangiana do sistema original simplesmente pela substituição das variáveis de campo pelas variáveis (~), e pela conjugação complexa de todos os coeficientes da densidade lagrangiana original. Usualmente, esta regra é representada através da identidade c ψ = c∗ψ . Esta operação é crucial, mesmo quando a densidade lagrangiana não contém nenhum parâmetro complexo, porque implica a estrutura analítica correta das funções de Green a temperatura finita. È importante enfatizar que, no contexto da TFD, as regras de (~)conjugação são postuladas, e não derivam logicamente de outras considerações. As densidades hamiltonianas para ambos os sistemas são dadas, portanto, por H= 1 † ∇ψ ( x, t ) ⋅∇ψ ( x, t ) 2m 1 † H = ∇ψ ( x, t ) ⋅∇ψ ( x, t ) , 2m o que resultará num hamiltoniano total para o sistema combinado dado pela relação Ĥ = H − H . As equações dinâmicas do sistema, extraídas das relações de comutação já encontradas, podem ser escritas, como equações na representação de Heisenberg, como 1 2 iψ ( x, t ) = ψ ( x, t ) , Hˆ = − ∇ ψ ( x, t ) 2m 1 2 iψ ( x, t ) = ψ ( x, t ) , Hˆ = ∇ ψ ( x, t ) . 2m Estas equações confirmam que, de fato, podemos considerar Ĥ como sendo o gerador de evolução temporal para o sistema combinado, correspondendo efetivamente, portanto, ao papel de hamiltoniano total. Agora, façamos a expansão dos campos de Schrödinger numa base de ondas planas: ψ ( x, t ) = ψ ( x, t ) = 1 V 1 V ∑e ψ k (t ) = ik ⋅x k ∑e k ψ k ( t ) = − ik ⋅x 1 V ∑e 1 V ∑e − iωk t + ik ⋅x ak k − iωk t − ik ⋅ x ak . k 195 Devem ser observadas duas coisas nesta expansão. Em primeiro lugar, para simplificar, o sistema foi quantizado numa caixa finita, cúbica, de volume V , o que leva a valores discretos para k , e a energia corresponderá ao valor de ωk = k2 . 2m A expansão para ψ é obtida a partir da expansão de ψ pela simples aplicação da regra de (~)-conjugação. E, à primeira inspeção, poderíamos pensar em ak e ak como representações, respectivamente, dos operadores de destruição para os sistemas original e (~). Porém as estruturas dos fatores exponenciais que multiplicam cada um deles nos deixam claro que ak é, na verdade, um operador de criação. Em termos desses operadores, podemos escrever finalmente o hamiltoniano, e teremos que H = ∑ ωk a †k ak k H = ∑ ωk a †k ak k Hˆ = H − H = ∑ ωk ( a †k ak − a †k ak ) . k A partir daí, o espaço de Hilbert para o sistema combinado pode ser construído diretamente, e o vácuo térmico pode ser definido como sendo 0, β = Z −1 2 ( β ) ∑∑ e − βωk nk k 2 nk , nk , nk sendo a função de partição dada pela expressão Z (β ) = ∑ k 1 . 1 − e − βωk Podemos também definir, mais uma vez, um gerador da transformação de Bogoliubov Q (θ ) = −i ∑ θ k ( β ) ( ak ak − ak† ak† ) , k que conduz a um operador formalmente unitário U (θ ) = e − iQ (θ ) = exp −∑θ k ( β ) ( ak ak − ak† ak† ) . k Este operador formalmente unitário irá relacionar o vácuo térmico com o vácuo a temperatura zero na forma padrão, ou seja, 0, β = U (θ ) 0, 0 , 196 desde que sejam feitas as identificações cosh θ k ( β ) = 1 1 − e− βωk senh θ k ( β ) = e − βωk 2 1 − e − βωk . Isto posto, os operadores térmicos podem, da mesma forma, ser calculados diretamente, e terão as formas ak ( β ) ak cosh θ k ( β ) − senh θ k ( β ) ak † = B (θ k ) † = † . ak − senh θ k ( β ) cosh θ k ( β ) ak ak ( β ) Ou, alternativamente, em termos das variáveis de campo, ψ k ( t , β ) ψ k cosh θ k ( β ) − senh θ k ( β ) ψ k † = B (θ k ) † = † . t , ψ − senh cosh ψ β θ β θ β ( ) ( ) ( ) k k k k ψ k De posse dessas relações, é imediato verificar que o vácuo térmico satisfaz as identidades já nossas conhecidas, ak ( β ) 0, β = ( ak cosh θ k ( β ) − ak† senh θ k ( β ) ) 0, β = 0 ak ( β ) 0, β = ( ak cosh θ k ( β ) − ak† senh θ k ( β ) ) 0, β = 0 . Uma vez mais, verificamos que o vácuo térmico é de fato destruído pelos operadores térmicos de destruição. E, mais uma vez também, isto sugere que um quantum de uma (~)-partícula se comporta como um buraco no sistema original, e que o vácuo térmico contém um igual número de partículas e buracos, o que pode ser visto pelas identidades Nˆ 0, β = 0 Hˆ 0, β = 0 . Cabe aqui ressaltar que, usualmente, uma transformação de Bogoliubov ocorre associada a uma quebra espontânea de simetria. Logo, é natural, e igualmente importante, que se questione qual seria a simetria quebrada espontaneamente a temperatura finita. Para responder a isso, observe-se que o hamiltoniano considerado anteriormente é invariante com relação às transformações ak → ak cosh α k − ak† senh α k ak → ak cosh α k − ak† senh α k , nas quais α k é um parâmetro global arbitrário. Eis aí uma simetria que não estava presente no sistema original, e somente se manifesta no sistema combinado em que os graus de liberdade foram duplicados. E pode ser verificado, com facilidade, usando as 197 relações de comutação padrão, que o gerador da forma infinitesimal das transformações desta simetria é dado pela expressão Q (α ) = −i ∑ α k ( ak ak − ak† ak† ) . k E, de qualquer maneira, está claro que decorre da própria estrutura do vácuo térmico que Q (α ) 0, β ≠ 0 . Isto é, o gerador desta simetria não destrói o vácuo térmico, o que só aconteceria se este mesmo vácuo térmico coincidisse com o vácuo da teoria original, depois que esta tivesse os seus graus de liberdade duplicados. O que não ocorre, como já foi visto mais de uma vez. Resumindo, a simetria existente entre o sistema original e o sistema (~), a qual está presente no hamiltoniano a temperatura finita, é quebrada espontaneamente pelo vácuo térmico. Contudo, não podemos esperar o surgimento de bósons de Goldstone com massa nula, uma vez que, a temperatura finita, a invariância de Lorentz não é manifesta, e, também porque o espectro do hamiltoniano total Ĥ é composto por vetores de estado que têm norma indefinida, ou seja, a norma, e, logo, a métrica do espaço desses vetores, não é positivo-definida. VII.2.5. O Propagador da Teoria Livre do Campo de Klein-Gordon Como segundo exemplo da aplicação do formalismo TFD a teorias de campos, consideremos agora a teoria livre de Klein-Gordon para campos reais a temperatura finita, mantendo as dimensões 3+1, e com a densidade lagrangiana usual L= 1 m2 2 ∂ µφ ∂ µφ − φ . 2 2 A (~)-densidade lagrangiana pode ser diretamente extraída daí como sendo igual a 2 1 m 2 L = ∂ µφ ∂ µ φ − φ , 2 2 e a lagrangiana total para o sistema combinado será, como sempre, Lˆ = L − L . Observe-se que, como neste caso os campos são reais, a regra de (~)-conjugação não produz nenhum efeito aparente. Mas isto não é verdade, porém, se lembrarmos que a condição de contorno, ou prescrição, de Feynman, é equivalente a se adicionar um termo imaginário infinitesimal iε à parte quadrática da densidade lagrangiana. O sinal desse termo será alterado de acordo com a (~)-conjugação, acarretando, portanto, que a 198 prescrição iε vai ser diferente para os campos (~), quando comparados ao sistema original, o que se evidenciará na formulação integral funcional, que será usada a seguir na construção do propagador térmico da teoria. Vamos começar introduzindo o dupleto de campos reais φ Φ = . φ O propagador do sistema combinado, a temperatura zero, será extraído, como usualmente, da função de Green causal de dois pontos, da seguinte forma: iG ( x − y ) = 0, 0 T Φ ( x ) Φ ( y ) 0, 0 No presente caso, porém, o objeto G é uma matriz 2 × 2 , cuja transformada de Fourier, observando-se a prescrição iε de Feynman discutida acima, será 1 k 2 − m2 + iε G (k ) = 0 . 1 − 2 k − m 2 − iε 0 Calculando agora o propagador em relação ao vácuo térmico, temos, pelas definições anteriores da teoria TFD, que iGβ ( x − y ) = 0, β T Φ ( x ) Φ ( y ) 0, β = iG ( x − y ) = 0, 0 T U † (θ ) Φ ( x ) Φ ( y ) U (θ ) 0, 0 = 0, 0 T U ( −θ ) Φ ( x ) U † ( −θ ) U ( −θ ) Φ ( y ) U † ( −θ ) 0, 0 = 0, 0 T B ( −θ ) Φ ( x ) Φ ( y ) BT ( −θ ) 0, 0 = B ( −θ ) 0, 0 T Φ ( x ) Φ ( y ) 0, 0 BT ( −θ ) = B ( −θ ) iG ( x − y ) BT ( −θ ) . Explicitando a matriz de Bogoliubov e a função de dois pontos, obtemos a expressão do propagador térmico para o campo de Klein-Gordon no formalismo TFD, como sendo iGβ ( k ) = B ( −θ ) iG ( k ) BT ( −θ ) cosh θ k ( β ) = senh θ k ( β ) 1 2 senh θ k ( β ) k − m 2 + iε cosh θ k ( β ) 0 cosh θ k ( β ) senh θ k ( β ) 1 senh θ k ( β ) cosh θ k ( β ) − 2 k − m 2 − iε 0 Ou simplesmente, aplicando a forma usual de θ k ( β ) para teorias bosônicas: 199 1 k 2 − m 2 + iε Gβ ( k ) = 0 1 − 2iπ nB k 0 δ ( k 2 − m 2 ) 0 βk 1 − 2 e 2 k − m − iε 0 ( ) e 2 β k0 2 1 Podemos extrair várias observações deste resultado. Em primeiro lugar, as funções de Green/ propagadores a temperatura finita dividem-se naturalmente em dois termos – um correspondendo à temperatura zero, e o outro dependendo explicitamente da temperatura – não surpreendentemente, tal como no caso do formalismo CTP já estudado. Em segundo lugar, o propagador também apresenta uma estrutura matricial 2 × 2 muito similar à do formalismo CTP, porém com diferenças essenciais entre os elementos da matriz TFD acima e os propagadores iG±± da matriz CTP. Uma delas é a β k0 2 diferença entre os termos não-diagonais, que diferem pelo fator e acima. A identificação entre os propagadores se manifesta, porém, se fizermos, nos propagadores do formalismo CTP, σ = β 2 , como já havia sido adiantado. Isto significa que podemos descrever a TFD através de uma formulação integral funcional, desde que o contorno de integração no plano complexo de tempo tenha a seguinte forma, já nossa conhecida: Os campos (~) podem ser identificados como aqueles que se situam no ramo de tempo real inferior deste contorno, justificando assim a estrutura matricial do propagador. Observe-se que em TFD os elementos da matriz do propagador não guardam entre si nenhuma relação natural como os iG±± no formalismo CTP. Além disso, mesmo que imaginemos os campos (~) como os campos originais do ramo de tempo real inferior do contorno, a significação física é bastante diferente da que ocorre no formalismo CTP, principalmente no que se refere às relações de comutação/ anticomutação características da TFD, dinamicamente distintas das relações de comutação entre os dois ramos de tempo real da teoria CTP. Portanto, há semelhanças entre os dois formalismos, mas as analogias não podem ser levadas muito longe, como não poderia deixar de ser, uma vez que a CTP trabalha com apenas uma cópia do espaço vetorial de estados. E, finalmente, o formalismo TFD permite que se tratem os casos em que há interações, que podem ser naturalmente introduzidas nos campos (~) através das 200 relações de (~)-conjugação. A densidade lagrangiana completa de interação, neste caso, dará origem a vértices de interação, e os vértices que envolvam os campos (~) terão, em geral, fatores com sinal contrário aos dos vértices relativos aos campos do sistema original. Desta forma, usando-se a forma matricial do propagador, os cálculos perturbativos podem ser efetuados da maneira usual, com auxílio dos respectivos diagramas de Feynman, e um efeito importante da duplicação dos campos é o de possibilitar o cancelamento de termos singulares no cálculo de laços. Por último, porém não menos importante: mais uma vez os contratermos originais da temperatura zero serão suficientes para a renormalização da teoria. VII.2.6. A Condição KMS Como já foi visto, as condições KMS estão no centro da mecânica estatística no equilíbrio, e surgem naturalmente das propriedades cíclicas do traço empregado no cálculo da uma média em um ensemble. No caso da TFD, as condições KMS surgem a partir da condição térmica, que pode ser resumida pelas duas expressões ˆ A ( t ) 0, β = e β H 2 A † ( t ) 0, β 0, β A ( t ) = ( −1) A ˆ 0, β A † ( t ) e β H 2 , onde A representa a paridade de Grassmann do operador A , que é a mesma que a de A , e é igual a 0 para bósons e 1 para férmions. Calculando agora a média no ensemble da função térmica de correlação entre dois operadores arbitrários, temos que 0, β A ( t ) B ( t ′ ) 0, β = ( −1) = ( −1) A = ( −1) A ˆ 0, β A † ( t ) e β H 2 B ( t ′ ) 0, β A (1+ B ) 0, β A † ( t + iβ 2 ) B ( t ′) 0, β = ( −1) 0, β B ( t ′ ) A † ( t + iβ 2 ) 0, β A (1+ B ) 0, β B ( t ′ ) e − β H 2 A ( t + iβ 2 ) 0, β = 0, β B ( t ′ ) A ( t + i β ) 0, β . ˆ No último passo do cálculo foi usado o fato de que, quando ambos os operadores não possuem a mesma paridade grassmanniana, VEV ( β ) = 0 . Está claro que a relação acima (como a própria condição KMS) é válida tanto para bósons como para férmions. 201 VII.2.7. Relações de Dispersão para Propagadores Arbitrários Vamos fazer agora o cálculo das relações de dispersão para operadores arbitrários A ( t ) e B ( t ) com a mesma paridade grassmanniana, isto é, ambos bosônicos ou ambos fermiônicos. Sem perda de generalidade, e para simplificar, serão omitidas as coordenadas espaciais. A transformada de Fourier da função térmica de correlação entre esses operadores será representada por I AB ( p 0 ) na expressão dp 0 − ip0 ( t −t ′) e I AB ( p 0 ) . −∞ 2π 0, β A ( t ) B ( t ′ ) 0, β = ∫ ∞ Aplicando a essa expressão a condição KMS encontrada acima, obtemos que dp 0 − ip0 ( t −t ′) − β p0 e e I AB ( p 0 ) . −∞ 2π 0, β A ( t ) B ( t ′ ) 0, β = 0, β A ( t − i β ) B ( t ′ ) 0, β = ∫ ∞ A partir desta identidade, e usando a definição padrão, podemos calcular as funções térmicas retardadas de correlação iRAB ( t − t ′ ) = θ ( t − t ′ ) 0, β A ( t ) B ( t ′) ∓ 0, β . O subscrito ∓ no comutador indica se os operadores são bosônicos ( − ) ou fermiônicos (+). Definindo a transformada de Fourier da forma usual dp 0 − ip0 ( t −t′) e RAB ( p 0 ) , −∞ 2π RAB ( t − t ′ ) = ∫ ∞ substituindo a função degrau de Heaviside pela representação integral dp 0 e ( ) , θ (t − t′) = ∫ −∞ 2iπ p 0 − iε ip 0 t − t ′ ∞ e juntando tudo isso, resulta que dp 0 RAB ( t − t ′ ) = ( −i ) ∫ −∞ 2iπ ∞ dp 0 = ( −i ) ∫ −∞ 2iπ ∞ ( ) − i p ′0 − p 0 ( t −t ′ ) dp′0 e ∫−∞ 2π p 0 − iε ∞ (1 ∓ e ) I ( p′ ) − β p ′0 0 AB dp′0 e ( ) − β p ′0 I AB ( p′0 ) ∫−∞ 2π p′0 − p 0 − iε 1 ∓ e ∞ − ip 0 t −t ′ ( ) 0 0 dp 0 − ip0 ( t −t ′) ∞ dp′0 I AB ( p′ ) =∫ e 1 ∓ e − β p′ . 0 0 ∫ −∞ 2iπ −∞ 2π p − p′ + iε ∞ ( ) 202 Comparando com a expressão da transformada de Fourier acima, tiramos finalmente que 0 0 dp′0 I AB ( p′ ) 1 ∓ e − β p′ . RAB ( p ) = ∫ −∞ 2π p 0 − p ′0 + iε 0 ( ∞ ) As funções térmicas causais de correlação podem ser calculadas de forma similar, a partir das definições iG AB ( t − t ′ ) = 0, β T A ( t ) B ( t ′ ) 0, β dp 0 − ip0 (t −t ′) e G AB ( p 0 ) , −∞ 2π G AB ( t − t ′ ) = ∫ ∞ onde a ordenação temporal está definida da forma T A ( t ) B ( t ′ ) = θ ( t − t ′ ) A ( t ) B ( t ′ ) ± θ ( t ′ − t ) B ( t ′ ) A ( t ) , desta vez com + para os operadores bosônicos e − para os fermiônicos. Um cálculo a partir dos resultados anteriores resulta em dp 0 − ip0 ( t −t ′) ∞ dp′0 1 e − β p′ 0 ′ e I p ∓ ∫−∞ 2π AB ( ) p 0 − p′0 + iε p 0 − p′0 − iε −∞ 2π GAB ( t − t ′ ) = ∫ 0 ∞ dp′0 1 e − β p′ ∴ GAB ( p ) = ∫ I AB ( p′0 ) 0 ∓ p − p′0 + iε p 0 − p′0 − iε −∞ 2π 0 ∞ 0 . Desses últimos resultados segue-se diretamente que Re RAB ( p 0 ) = Re G AB ( p 0 ) tanh ( β p 0 2 ) Im G AB ( p 0 ) → ( bósons ) Im RAB ( p ) = 0 0 coth ( β p 2 ) Im G AB ( p ) → ( férmions ) 0 Estes resultados são generalizações das relações de dispersão encontradas no formalismo CTP para operadores arbitrários. Cabe enfatizar mais uma vez que a generalidade da obtenção dessas relações permite que continuem válidas mesmo em uma teoria interativa. Escolhendo os operadores A e B entre as variáveis de campos fundamentais, é possível obter, a partir dessas relações, condições para a representação espectral das funções de Green de dois pontos. E é também a partir delas que se pode estender para a teoria a temperatura finita as fórmulas de redução e de LehmannSymanzik-Zimmermann (LSZ) da teoria à temperatura zero. Estes resultados, e outros obtidos na abordagem integral funcional aplicado à TFD, serão apresentados em mais detalhe na Seção VIII, a parte seguinte e última do presente mini-curso. 203 VII.2.7. O Teorema de Goldstone na TFD As teorias de campos térmicos são de particular interesse do ponto de vista do estudo dos processos de quebra espontânea e restauração de simetrias, processos esses que, no contexto do Modelo Padrão, devem apresentar uma dependência manifesta da escala de energia, e, por conseguinte, da temperatura. Entretanto, uma aplicação simplista das idéias envolvidas na quebra de simetria a temperatura finita pode levar a inconsistências, como veremos. Consideremos um sistema cuja dinâmica é governada por um hamiltoniano H e que apresente uma simetria unitária associada a um operador U . Por definição, UHU † = H . Se escrevermos o operador unitário em termos de um certo Q , gerador infinitesimal da simetria, sendo α o parâmetro constante da transformação, teremos que U = e − iα Q . Num caso desses, a invariância do hamiltoniano pode ser descrita pela relação de comutação [ Q, H ] = 0 . Diz-se que uma simetria é quebrada espontaneamente quando o vácuo não é invariante em relação às transformações da simetria, mesmo que o hamiltoniano e a densidade lagrangiana clássica o sejam. Expressando o conceito explicitamente, uma simetria é quebrada espontaneamente quando Q 0 ≠ 0. Uma forma alternativa de caracterizar uma quebra espontânea de simetria é dizer que, quando a mesma ocorre e é contínua, sempre existe um operador A tal que 0 [Q, A] 0 ≠ 0 . Este campo A representa o que se convencionou chamar de campo de Goldstone (J. Goldstone, A. Salam e S. Weinberg, Phys. Rev. 127, 965 (1962)), o qual, para teorias manifestamente invariantes de Lorentz, e com espaço de Hilbert H com produto interno semi-positivo-definido (isto é: H : Aψ ψ ≥ 0, ∀ψ ∈ H, ∀ ψ ψ ∈ ) cuja dimensão seja d > 1 + 1 (“There are no Goldstone Bosons in Two Dimensions”, S. Coleman, Comm. Math. Phys 31, 259-264 (1973)), gera a ocorrência de campos com 204 massa nula. É bem conhecida importância do campo de Goldstone no processo de geração de massa pelo campo de Higgs, através do chamado fenômeno de GoldstoneHiggs. Em temperatura finita, porém, precisamos lidar com médias sobre ensembles. Aplicando o formalismo TFD ingenuamente à última expressão envolvendo o operador arbitrário A , teríamos que 0, β [Q, A] 0β = Tr e − β H [Q, A] = 0 , resultado que decorre imediatamente da propriedade cíclica do traço. E que sugere, erroneamente, que a temperatura finita nunca poderá existir qualquer quebra espontânea de simetria, uma vez que A é arbitrário. A falha nesse argumento reside em que, para operadores que atuam sobre infinitas dimensões – como é o caso da TFD, herdado da TQC a temperatura zero -, a propriedade cíclica do traço não é necessariamente válida. Talvez o exemplo mais simples desta peculiaridade venha da MQ, onde temos a relação [ x, p ] = 1 , da qual, após aplicar cegamente a propriedade cíclica do traço, tiramos os resultados inconsistentes Tr [ x, p ] = 0 Tr (1) ≠ 0 . A propriedade cíclica do traço também não é aplicável no caso de operadores com singularidades, e, logo, o estudo da quebra espontânea de simetria deve ser feita com as precauções adequadas. Assim como no caso da temperatura zero, só existem duas possibilidades a temperatura finita: 1. Para todos os operadores possíveis, temos que 0, β [Q, A] 0, β = 0 . Neste caso, se diz que a simetria do sistema é verdadeira, e que Q 0, β = 0 . 2. Existe um operador A para o qual 0, β [Q, A] 0, β ≠ 0 . Neste caso, se diz que a simetria é quebrada espontaneamente, e que o vácuo térmico não é destruído pelo gerador Q da simetria. Para analisar as consequências da quebra de simetria, observe-se o seguinte: se a simetria é uma simetria global contínua, quando a matéria está suficientemente localizada (ou seja, quando o operador de massa pode ser restrito a um suporte ∆x > 0 tão pequeno quanto se queira) e não existem forças de 205 longo alcance (ou seja, cujo potencial efetivo tenda a zero mais rapidamente que 1 x ), existe uma corrente conservada, e sua equação de continuidade é dada pelo teorema de Nöther, com a forma ∂ µ J µ ( x, t ) = 0 . O gerador da simetria infinitesimal está relacionado com a corrente conservada através da seguinte relação, que define uma carga constante Q = ∫ d 3 x J 0 ( x, t ) , na qual se observa que, de fato, a carga Q independe do tempo, como garante a equação de continuidade. A partir dessas considerações, observa-se também que 0, β J 0 ( y ) , A ( x ) 0, β = ∫ d4 p ( 2π ) 4 e − ip⋅( y − x ) ( ) I ( p 0 , p ) 1 − e− β p . 0 Efetuando a integração sobre d 3 y , obtemos a expressão relativa à carga 0, β [ Q, A] 0, β = ∫ ( ) 0 dp 0 − ip0 ( y 0 − x0 ) e I ( p0 , 0 ) 1 − e− β p . 2π Se, para algum operador A , ocorre que 0, β [Q, A] 0, β ≠ 0 , da mesma forma a integral acima não pode ser nula. Observe-se também que o lado esquerdo da expressão independe de y 0 , uma vez que a carga Q é uma constante. Portanto, derivando a equação inteira em relação a y 0 , obtemos que ( ) 0 dp 0 − ip0 ( y0 − x0 ) 0 p I ( p0 , 0 ) 1 − e− β p = 0 . ∫ 2π e Isto significa afirmar que, para satisfazer a hipótese 0, β [Q, A] 0, β ≠ 0 , devemos ter ( ) I ( p 0 , 0 ) 1 − e− β p = aδ ( p 0 ) , 0 onde a é uma constante. O que mostra que, de fato, existem funções de correlação que estão representadas por singularidades do tipo δ - invalidando, portanto, a possibilidade de uso da ciclicidade do traço. Pode-se então enunciar o teorema de Goldstone a temperatura finita de uma forma específica, como se segue: 206 - Se ocorre que, na ausência de forças de longo alcance, uma teoria com campos suficientemente localizados possui uma quebra espontânea de uma simetria global contínua, deverão ser gerados quanta de energia nula. Estes quanta não terão necessariamente massa nula, uma vez que, a temperatura finita, não existe invariância de Lorentz, ou covariância, de forma manifesta, e, que também, como já foi visto, o conceito de massa não possui uma definição única a temperatura finita (conforme já foi visto, a correção de massa a um laço pode depender quadraticamente da temperatura). Podemos então considerar esses quanta de energia nula como estados de quasepartícula, ou, como se pode mostrar mais precisamente, podemos associar os estados de Goldstone – ou, como também são chamados, estados de Nambu-Goldstone - a superposições, ou estados compostos, de estados (~) e não-(~). 207 VIII. Aplicabilidade da Integração Funcional à TFD – Alguns Resultados VIII.1. Teorias de Calibre Teorias de calibre são teorias com invariâncias locais. Em sua apresentação mais simples, podem descrever teorias invariantes em relação a transformações locais de fase das variáveis de campo, mas podem também possuir estruturas de simetria muito mais complicadas. Tal como entendemos hoje, as teorias de calibre são absolutamente essenciais à descrição das forças da natureza. Portanto, o estudo das estruturas destas teorias é crucial, tanto a temperatura zero quanto a temperatura finita VIII.1.1. Teorias de Calibre para T=0 A teoria de calibre mais simples remonta ao século XIX, e foi construída por James Maxwell, ao unificar em um só conjunto as equações do eletromagnetismo. A versão quântica da teoria de Maxwell é fundada em uma invariância local de fase dos campos de matéria, com simetria U (1) . Como o grupo de simetria U (1) possui somente um gerador, a álgebra da simetria é abeliana, ou comutativa, o que acarreta que a teoria de Maxwell descreva uma teoria de calibre abeliana, que descreve com grande precisão as interações entre elétrons e fótons. O caráter abeliano da teoria quântica resultante – a eletrodinâmica quântica (QED) -, entretanto, faz com que sua estrutura seja muito mais simples que outras teorias de calibre que também descrevem interações que ocorrem na natureza. Para extrair o máximo possível da riqueza estrutural pertinente às teorias de calibre de um modo geral, vamos focalizar de modo especial as teorias de calibre não-abelianas, ou teorias de Yang-Mills, assim chamadas por terem sido descobertas em 1954 por Robert Mills e Chen Ning Yang, num trabalho em que investigavam a invariância de calibre do spin isotópico (R. L. Mills e C. N. Yang, Phys. Rev. 96, 191-195, 1/10/1954), que corresponde a uma teoria com simetria (aproximada) SU ( 2 ) . Vamos considerar um grupo simples, mas não tanto quanto o U (1) , o SU ( n ) . Este grupo é um grupo de Lie com n 2 − 1 geradores hermitianos, T a , a = 1, 2,3, , n 2 − 1 , que satisfazem a álgebra de Lie definida pelo comutador T a , T b = if abcT c , onde a, b, c = 1, 2, , n 2 − 1 , e as constantes f abc , completamente antissimétricas nos três índices, são chamadas de constantes de estrutura. Logo se observa que, 208 diferentemente do grupo U (1) , os geradores do grupo SU ( n ) não comutam, e, consequentemente, esta álgebra é conhecida como uma álgebra não-abeliana. Na verdade, essas constantes de estrutura, multiplicadas pelo fator i , produzem uma representação dos geradores da álgebra de Lie conhecida como representação adjunta. A maneira mais simples de se introduzir a teoria de Yang-Mills é considerar uma teoria de férmion livre que contém n férmions pertencentes à representação fundamental do grupo de Lie SU ( n ) , cuja densidade lagrangiana é escrita como L0 = ψ i ( x ) ( iγ µ ∂ µ − m )ψ i ( x ) , onde afirmamos que os férmions possuem uma massa m , e i = 1, 2, , n . É fácil mostrar que esta lagrangiana é invariante quanto a uma transformação infinitesimal global SU ( n ) que tenha a forma δψ i = iε a ( t a ) ψ ij δψ i = −iε aψ j (t ) j a ij , onde se assume que os parâmetros infinitesimais da transformação, ε a , são independentes do espaço-tempo, e que os t a correspondem aos geradores de SU ( n ) na representação fundamental, diferentes dos geradores T a da transformação adjunta. Cabe aqui ressaltar que, na verdade, a invariância global dessa lagrangiana se dá com respeito ao grupo U ( n ) , do qual SU ( n ) é um subgrupo – mas, para simplificar, subentende-se que estaremos trabalhando com a parte SU ( n ) da simetria total da teoria livre. Como se faz usualmente em QED , agora podemos buscar as condições para transformar essa simetria global em uma simetria local. Observamos que, se os parâmetros da transformação acima fossem locais, isto é, se ε a = ε a ( x ) , a lagrangiana anterior não mais seria invariante quanto à nova transformação, e passaria a se escrever L0 → L0 + δ L0 = δψ i ( iγ µ ∂ µ − m )ψ i + ψ i ( iγ µ ∂ µ − m ) δψ i = L0 − ( ∂ µ ε a ( x ) )ψ iγ µ ( t a ) ψ j . ij Vemos também que a corrente SU ( n ) - a corrente de Nöther – associada com a invariância global da teoria livre tem a forma J µ a = ψ iγ µ ( t a ) ψ j . ij 209 Logo, se introduzirmos uma interação de calibre, inteiramente em paralelo com o que fazemos na QED , ela terá a forma Lint = J µ a Aµa = ψ iγ µ ( t a ) ψ j Aµa . ij Podemos pensar nos Aµa como sendo os campos de calibre apropriados para o presente caso, notando porém que, diferentemente da QED , teremos agora a = 1, 2, , n 2 − 1 campos de calibre. A variação na lagrangiana de interação Lint motivada pela nova transformação local pode ser facilmente calculada: δ Lint = δψ iγ µ ( t a ) ψ j Aµa + ψ iγ µ ( t a ) δψ j Aµa + ψ iγ µ ( t a ) ψ jδ Aµa ij ij ij = − f abc Aµb ε cψ iγ µ ( t a ) ψ j + ψ iγ µ ( t a ) ψ jδ Aµa , ij ij onde foram usadas na última linha as relações de comutação definidas anteriormente para os geradores t a . Verificamos assim que a densidade lagrangiana total, incluindo a interação, LTot = L0 + Lint , varia sob as transformações locais (com parâmetros ε a ( x ) locais) como δ LTot = δ Aµa − ( ∂ µ ε a ( x ) + f abc Aµb ε c ( x ) ) ψ iγ µ ( t a ) ψ j . ij E fica claro que a densidade lagrangiana total será invariante perante as transformações locais definidas acima se escolhermos os campos de calibre tais que também se transformem como δ Aµa ( x ) = ( ∂ µ ε a + f abc Aµb ε c ) . Como bônus, percebemos de que forma, precisamente, os campos de calibre da QED se transformam sob uma transformação local, considerando que, para a simetria abeliana U (1) , as constantes de estrutura são iguais a zero. Podemos definir uma derivada covariante com os geradores do grupo, assim como com os campos de calibre (em geometria diferencial, estes recebem o nome de conexões), para um campo qualquer, pertencente a uma representação particular de SU ( n ) . Por exemplo, a derivada covariante para os férmions, na representação fundamental apresentada acima, será definida como (D ψ ) µ i ( = ∂ µψ i − i ( t a ) Aµaψ ij j ). 210 A verificação de que esta derivada é transformada de forma covariante sob as transformações locais acima é feita diretamente, com facilidade. Podemos ainda escrever a densidade lagrangiana total fermiônica de forma compacta como LTot = iψ iγ µ ( Dµψ ) , i deixando óbvia a invariância local da lagrangiana total. Note-se também, como já foi dito antes, que o fator if abc leva a uma outra representação dos geradores de SU ( n ) - a representação adjunta. É fácil verificar, usando a identidade de Jacobi, que a identificação exata entre as duas representações é dada por (T ) a bc = −if abc . Juntando esse resultado com a definição de derivada covariante, vemos que a variação nos campos de calibre sob as transformações locais será dada por δ Aµa = ( Dµ ε ( x ) ) = ∂ µ ε a ( x ) + f abc Aµbε c ( x ) , a onde a expressão da derivada covariante no lado direito da equação corresponde à representação adjunta. Isto mostra que os campos de calibre Aµa residem na representação adjunta de SU ( n ) . Existem, na verdade, n 2 − 1 componentes dos campos de calibre, o que nos permite associar estes campos aos geradores T a da representação adjunta, através de uma matriz Aµ = AµaT a . Para atribuir dinâmica aos campos de calibre, faz-se exatamente como na QED : define-se uma intensidade de campo associada aos campos de calibre (que podem ser considerados análogos ao potencial vetor da eletrodinâmica), pela expressão Fµνa = ∂ µ Aνa − ∂ν Aµa + f abc Aµb Aνc . Vê-se imediatamente que nas teorias abelianas, como as constantes de estrutura são nulas, esta forma se reduz à intensidade de campo de Maxwell. Podemos também fazer uma modificação de escala nos campos de calibre, para inserir uma dependência da constante de acoplamento no último termo, que é a forma de apresentação padrão das teorias interativas físicas. Fazendo isso, teríamos claramente exposta a diferença essencial entre os tensores de intensidade de campo abeliano e não-abeliano, que é o fato de que, como os campos de calibre em SU ( n ) são os portadores de números quânticos internos (carga generalizada, ou cores, no caso dos glúons), esses campos se acoplam entre si. O fóton, por outro lado, por ser desprovido de carga, não possui essa propriedade de auto-acoplamento. No entanto, sem perda de generalidade, por 211 simplificação, vamos considerar a constante de acoplamento de SU ( n ) como unitária, mantendo a escala acima para os campos de calibre. Resulta das últimas equações que podemos escrever, para qualquer quantidade α a ( x ) pertencente à representação adjunta, que ( D , D α ( x )) µ ν a = f abc Fµνb α c , o que resulta, juntando tudo, que a variação do tensor intensidade de campo será dada por δ Fµνa = ( Dµδ Aν ) − ( Dν δ Aµ ) = ( Dµ Dν ε ( x ) ) − ( Dν Dµ ε ( x ) ) a ( a = Dµ , Dν ε ( x ) a ) a a = f abc Fµνb ε c ( x ) . Temos então que a densidade lagrangiana para os campos de calibre, no máximo quadrática nas derivadas, e invariante de calibre, será dada, a menos de uma constante de normalização, por a 1 LG = − Fµνa ( F µν ) . 4 A invariância de calibre dessa lagrangiana decorre imediatamente da antissimetria total das constantes de estrutura f abc quanto aos seus índices a, b, c : δ LG = − a 1 µν a 1 F ) δ Fµνa = − ( F µν ) f abc Fµνb ε c ( x ) = 0 . ( 2 2 E, finalmente, a densidade lagrangiana completa que descreve as interações entre férmions e os campos de calibre não-abelianos dinâmicos será dada por a i 1 L = LG + LTot = − Fµνa ( F µν ) + iψ iγ µ ( Dµψ ) . 4 Pode-se observar a semelhança entre essa densidade lagrangiana e a correspondente à teoria de Maxwell, embora ressaltem as diferenças essenciais. Para os campos de calibre não-abelianos, LG representa uma teoria interativa completa, uma vez que os campos de calibre acoplam-se entre si, o que conduz a propriedades características dessas teorias, como, por exemplo, a liberdade assintótica. Por outro lado, a quantização dessas teorias mostra-se fortemente não-trivial, e novas técnicas foram criadas para isso, como veremos a seguir. 212 VIII.1.2. Invariância BRST a Temperatura Zero A parte de campos de matéria (férmions) não é relevante para o entendimento da quantização de uma teoria de calibre não-abeliana, e em vista disso, será considerada aqui apenas a quantização da teoria de Yang-Mills pura – ou seja, a parte de campos de calibre da lagrangiana. Conforme já é sabido a partir do estudo da QED , a invariância de calibre se reflete em fortes restrições à estrutura da lagrangiana de campos de calibre. Em particular, a matriz dos coeficientes dos termos quadráticos da densidade lagrangiana é singular, e, portanto, não-inversível. A consequência é que, se tomarmos LG como a teoria dinâmica, ficamos impossibilitados de definir propagadores, e toda a filosofia de efetuar cálculos perturbativos a partir dos diagramas de Feynman vai por água a baixo. Para contornar essa dificuldade, normalmente acrescentamos um termo à densidade lagrangiana de calibre de forma a quebrar a invariância de calibre, permitindo assim que se definam os propagadores para os campos de calibre. Chama-se a esse termo de “termo de fixação de calibre”, e pode ser qualquer termo que remova as singularidades dos coeficientes da matriz dos termos quadráticos, mantendo ao mesmo tempo as várias invariâncias globais da teoria. Por exemplo, podemos adicionar à densidade lagrangiana o termo LGF = − 2 1 ∂ µ Aµ a ) , ( 2ξ conhecido na literatura como o termo padrão covariante de fixação de calibre, onde ξ representa uma constante arbitrária, chamada de parâmetro de fixação de calibre, cuja natureza já nos foi parcialmente revelada na QED . Será mais conveniente considerarmos aqui a densidade lagrangiana acrescida, não de uma constante, mas de um campo auxiliar F a , tomando então a forma LGF = ∂ µ F a Aµa + ξ 2 F aF a . Com esta expressão para a lagrangiana, é imediato que a equação de movimento do campo auxiliar será ξ F a = ∂ µ Aµa , o que significa que, quando eliminarmos F a na lagrangiana, recuperaremos a densidade lagrangiana padrão com fixação covariante de calibre, a menos de um termo de divergência total que não afeta a lagrangiana. Da mesma forma que na QED , esta forma da lagrangiana permite a escolha de calibres variados, como o de Landau para ξ = 0 , e o de Feynman para ξ = 1 . 213 É claro que, ao adicionarmos um termo de fixação de calibre à densidade lagrangiana de calibre, alteramos a teoria, e, portanto, precisamos compensar este fato. Convencionalmente, o que se faz é acrescentar à densidade lagrangiana ainda mais um termo, chamado de densidade lagrangiana fantasma, com o seguinte procedimento: vamos supor que f a ( x ) = ∂ µ Aµa ( x ) − ξ F a ( x ) = 0 seja a condição que corresponda à situação descrita pela densidade lagrangiana de fixação de calibre. Neste caso, acrescentamos à lagrangiana um termo LFant δ f a ( x) b = − ∫ dy c ( x ) b Dc y , δ A ( y ) ( µ ( ) ) µ a onde os novos campos c a e c a são conhecidos como os campos fantasma e antifantasma, respectivamente, ambos com spin zero, escalares e anticomutáveis – portanto, não são campos físicos, e sim variáveis grassmannianas auxiliares, que já foram descritas anteriormente, com o nome de seus descobridores: campos de FadeevPopov. Em geral, quando a condição de fixação de calibre envolve outros campos além dos campos de calibre, a ação fantasma pode ser escrita como S Fant = ∫ dx LFant δ f ( g )a ( x ) b = − ∫ dxdy c ( x ) c ( y), δε b ( y ) a onde f ( g )a representa a transformada de calibre da condição de fixação de calibre, e ε a ( x ) corresponde ao parâmetro local da transformação de calibre. Por exemplo, no calibre covariante que estamos usando, já escolhemos f a = ∂ µ Aµa − ξ F a = 0 , e, logo, a lagrangiana fantasma, para esta escolha de fixação de calibre, será LFant = − ∫ dy c a ( x ) ( ∂ µx δ ( x − y ) δ ab ) ( Dµ c ( y ) ) = −c a ( x ) ∂ µ ( Dµ c ( x ) ) b a = ∂ µ c a ( x ) ( Dµ c ( x ) ) + ∂ µ () , a onde o último termo é uma derivada total, que pode ser descartada. Com todas essas modificações, a densidade lagrangiana total para uma teoria de puro calibre não-abeliana tem a forma LTot = LG + LGF + LFant . Para o calibre covariante que estamos usando, a lagrangiana total será então, explicitamente, dada por 214 a 1 ξ LTot = − Fµνa F µν a + ∂ µ F a Aµa + F a F a + ∂ µ c a ( Dµ c ) . 4 2 Como já foi dito antes, a fixação de calibre e a lagrangiana fantasma modificam a teoria original de forma a se compensarem, permitindo que os diagramas e as regras de Feynman sejam definidos, e, assim, os cálculos perturbativos possam ser efetuados. Num sentido mais profundo, a fixação de calibre e as lagrangianas fantasmas correspondem, no formalismo integral funcional, a simplesmente um fator multiplicativo unitário, que não modifica o conteúdo físico da teoria. Este cancelamento pode ser resumidamente representado pelos determinantes de operadores que resultam da integração funcional da lagrangiana de Fadeev-Popov, que, no caso simples do calibre de Feynman sem acoplamento, numa dimensão geral d , se apresentam como um produto ( det −∂ ) ( det −∂ ) −d 2 2 2 +1 , onde o expoente negativo do primeiro determinante é próprio aos campos bosônicos, e o expoente positivo do segundo determinante é característico de campos fermiônicos (variáveis grassmannianas), Vê-se assim que o determinante dos campos fantasmas anticomutáveis sempre cancela, para cada valor do índice a , duas componentes (uma do tipo tempo e a outra de polarização longitudinal) do campo de calibre Aµa . Veremos a seguir como, de fato, e num sentido que ficará claro, aqueles termos adicionados à densidade lagrangiana não possuem conteúdo físico. A última expressão acima da lagrangiana teve o seu calibre fixado, e, portanto, não possui a invariância de calibre da teoria original. Entretanto, podemos verificar que a densidade lagrangiana total, após ter o calibre fixado, desenvolveu uma simetria fermiônica global que, de certa forma, lembra a invariância de calibre da teoria original. É fácil mostrar que a densidade lagrangiana total é invariante quanto às transformações globais δ Aµa = ω ( Dµ c ) ; δ c a = − a ω 2 f abc cb c c ; δ c a = −ω F a ; δ F a = 0 , sendo ω o parâmetro constante anticomutável, ou grassmanniano, da transformação global. Em outras palavras, o cancelamento de termos singulares obtido para a teoria pura de Yang-Mills com a introdução dos campos de Fadeev-Popov se estende, após a introdução deste novo parâmetro e desta nova simetria, também à teoria interativa completa. Antes de mostrar a invariância da densidade lagrangiana total quanto a essas transformações, é importante ressaltar que cada uma dessas transformações é nilpotente – uma propriedade das variáveis de Grassmann – para qualquer variável de campo φ a , isto é, δ ( i )δ ( j )φ a = 0, ∀i, j , φ a . Sabendo disso, é fácil agora mostrar a invariância da densidade lagrangiana LTot . Em primeiro lugar, note-se que a transformação de Aµa é na 215 verdade uma transformação de calibre com parâmetro ε a = ω c a , e, portanto, a densidade lagrangiana é invariante de forma trivial sob essa transformação, como se vê: δ LG = 0 . Consequentemente, precisamos nos preocupar apenas com as densidades lagrangianas fantasma e de fixação de calibre, o que se mostra também trivial, porque o campo auxiliar F a não se transforma ( δ F a = 0 ), e teremos então δ ( LGF + LFant ) = ∂ µ F aδ Aµa + ∂ µδ c a ( Dµ c ) + ∂ µ c aδ ( Dµ c ) a = ω∂ µ F aδ ( Dµ c ) − ω∂ µ F aδ ( Dµ c ) = 0 , a a onde foi usado que δ ( Dµ c ) = 0 , o que se segue da nilpotência das transformações. a Cabe observar paralelamente que essa nilpotência, quando os campos fantasmas estão presentes, é off-shell, e somente existe sem eles quando são usadas as equações de movimento. Essas transformações, que definem uma simetria residual da teoria completa e, em certo sentido, substituem a invariância de calibre original, são chamadas de transformações BRST (C. Becchi, A. Rouet, e R. Stora, Comm. Math. Phys 42,127 (1975); I. V. Tyutin, Lebedev Institute preprint, 1975), e cumprem um papel basilar no estudo das teorias de calibre. As transformações BRST foram desenvolvidas originalmente como uma extensão do método de Fadeev-Popov ( L. D. Fadeev e V. N. Popov, Phys. Lett. 25B, 29 (1967)), mas podem também ser consideradas como a substituição mais geral desse método. Apenas como informação, uma vez que não acrescentam nada de novo, cabe dizer que as transformações anti-BRST, envolvendo os campos antifantasmas, também deixam invariante a densidade lagrangiana completa, e são dadas por um segundo conjunto de condições: δ Aµa = ω ( Dµ c ) ; δ c a = − a ω 2 f abc c b c c ; δ c a = ω ( F a − f abc cb c c ) ; δ F a = ω f abc F b c c . Além dessas duas simetrias com variáveis grassmannianas, a densidade lagrangiana total também é invariante quanto à transformação de simetria bosônica global δ ca = θ ca ; δ c a = −θ c a , mantendo invariantes todos os outros campos, e onde θ é um parâmetro bosônico infinitesimal constante. Depois dessa adição de campos auxiliares, fica claro que o espaço de Hilbert da teoria completa contém muito mais estados do que apenas os estados físicos, e somente através da discussão de questões fisicamente orientadas é que será possível recuperar, ou pelo menos identificar, o espaço de Hilbert físico. Uma dessas questões diz respeito 216 ao fato de que o espaço de Hilbert físico deve permanecer invariante em relação à evolução temporal do sistema. Por exemplo, no nosso calibre covariante, o espaço físico é selecionado de modo a satisfazer a condição ∂ µ Aµ( +) fís = 0 , onde o sobrescrito + indica que se trata da parte do campo com frequência positiva. Na QED essa prescrição dá certo, porque ∂ µ Aµ satisfaz a equação de Klein-Gordon no calibre covariante, e, consequentemente, o espaço físico selecionado dessa forma permanece invariante quanto à evolução temporal. Numa teoria não-abeliana, por outro lado, o operador correspondente não satisfaz uma equação livre, e, logo, não é apropriado para identificar o espaço físico. Em compensação, os geradores QBRST da simetria BRST e a simetria de escala dos campos fantasmas, Qc , são conservados, e, portanto, podem ser usados para definir um espaço de Hilbert físico que se mantenha invariante em relação à evolução temporal do sistema - QBRST e Qc , na verdade, representam as cargas de Nöther associadas às duas correntes de Nöther conservadas pelas ações das duas transformações de simetria. Assim, identificamos o espaço físico da teoria como aquele que satisfaz as condições QBRST fís = 0 ; e Qc fís = 0 . Pode ser diretamente mostrado que essas condições se reduzem, no caso abeliano, à condição de quantização de Gupta-Bleuler para o campo eletromagnético. Detalhando 2 = 0 ) que comuta com o um pouco mais: um operador QBRST nilpotente ( QBRST hamiltoniano H divide os auto-estados de H em três subespaços. Uma certa quantidade de estados de H deve ser destruída por QBRST para que as relações que definem a simetria BRST sejam satisfeitas. Seja então H1 o subespaço dos estados que não são destruídos por QBRST . E seja H2 o subespaço dos espaços tais que ψ 2 = QBRST ψ 1 , ∀ ψ 1 ∈ H1 . Devido à nilpotência de QBRST , se aplicarmos outra vez o operador sobre H2 , o resultado será mais uma vez nulo. E, finalmente, seja H0 o subespaço dos estados ψ 0 tais que QBRST ψ 0 = 0 , mas que não podem ser escritos como QBRST ψ 1 . O subespaço H2 é muito peculiar, se observarmos que quaisquer dois estados pertencentes a ele possuem produto interno nulo, devido à nilpotência de QBRST : ψ 2 a ψ 2b = ψ 1a QBRST ψ 2b = 0 . Pelo mesmo motivo, os estados de H2 também possuem produto interno nulo com os estados de H0 . Após uma breve análise dos estados de partículas simples, verifica-se que os bósons de calibre avançados e os campos antifantasmas povoam o espaço H1 ; bósons de calibre retardados e campos fantasmas pertencem a H2 ; e, finalmente, os 217 bósons de calibre transversais estão todos em H0 . Pode ser mostrado, de forma mais geral, que estados assintóticos que contenham campos fantasmas, antifantasmas, ou bósons de calibre com polarização não-física, distribuem-se por H1 ou H2 , enquanto que os estados assintóticos em H0 são todos os bósons de calibre transversalmente polarizados. O operador QBRST da simetria BRST fornece assim uma relação precisa, traduzida em graus de liberdade positivos ou negativos, entre os estados de bóson de calibre com polarização não-física e os campos fantasma e antifantasma. Resta mostrar que as densidades lagrangianas fantasma e de fixação de calibre não acarretam de fato nenhuma consequência à física do sistema. Basta agora notar que ambos os termos extras acrescentados à densidade lagrangiana original podem ser escritos como uma variação BRST não-parametrizada, ou seja: ξ ξ LGF + LFant = δ −∂ µ c a Aµa − c a F a = QBRST , −∂ µ c a Aµa − c a F a . 2 2 Podemos agora, usando esse anticomutador, calcular o elemento de matriz de transição da teoria física, que será dado por fís ( LGF + LFant ) fís′ = 0 . Este resultado demonstra que os termos adicionados à densidade lagrangiana original não contribuem para os elementos físicos de matriz da teoria, e também que todos esses elementos de matriz independem tanto da escolha do calibre quanto do parâmetro ξ de fixação de calibre. VIII.1.3. Identidades de Ward-Takahashi e Slavnov-Taylor a Temperatura Zero Já sabemos que as funções de correlação teóricas, de campos quânticos escalares, vetoriais e espinoriais, podem ser calculadas a partir da integral funcional, contornando completamente a necessidade de se construir o hamiltoniano, o espaço de Hilbert de estados e as equações de movimento. O formalismo de integração funcional torna manifestas as simetrias do problema, uma vez que toda invariância da lagrangiana será uma invariância da dinâmica quântica (com poucas e sutis exceções). Entretanto, também seria interessante que fosse possível recorrer, se necessário, às leis de conservação que resultam das equações quânticas de movimento, ou mesmo a essas próprias equações. Por exemplo, a identidade de Ward (J. C. Ward, Phys. Ver 78,182 (1950)), que tem um papel importante na discussão sobre os fótons na QED, representa essencialmente a lei de conservação da corrente de carga elétrica. E, uma vez que, pelo teorema de Nöther, as leis de conservação decorrem de simetrias da lagrangiana, podese esperar que não seja muito difícil a derivação dessas leis de conservação no 218 formalismo de integração funcional. Ocorre que, na verdade, a abordagem funcional fornece, de forma até mais direta que a abordagem por operadores, uma generalização quântica do teorema de Nöther, que resultará numa identidade análoga à de WardTakahashi (Nuovo Cimento, 6, 370 (1957)) para qualquer simetria de uma teoria quântica de campos genérica. No caso das teorias não-abelianas, a relação correspondente à simetria BRST costuma ser referida como identidade de SlavnovTaylor (A. A. Slavnov, Theor. Math. Phys. 10, 99 (1972); J. C. Taylor, Nucl. Phys B33, 436 (1971)). Para começar, devemos determinar como as equações quânticas de movimento surgem no formalismo funcional, por exemplo, a partir das funções de Green do campo escalar livre. Consideremos então a função de três pontos i d 4 x L[φ ] Ω Tφ ( x1 ) φ ( x2 ) φ ( x3 ) Ω = WJ−=10 ∫ Dφ e ∫ φ ( x1 ) φ ( x2 ) φ ( x3 ) , onde L = ( ∂ µφ ) 2 − ( m 2φ 2 ) 2 , WJ é o funcional gerador das funções de Green na 2 presença de uma fonte externa J ( x ) , e Ω é o estado fundamental do sistema interagente, e não necessariamente o vácuo 0 . Na mecânica clássica, extrairíamos as equações de movimento fazendo com que a ação seja estacionária na presença de uma variação infinitesimal φ ( x) → φ′( x) = φ ( x) + ε ( x) . A generalização apropriada será considerar essa variação como uma mudança infinitesimal de variáveis, que não irá alterar o valor da integral, assim como uma simples translação – que resulta num jacobiano unitário - não irá alterar a medida, portanto, Dφ ′ = Dφ . Assim, podemos escrever que i d 4 x L[φ ] ∫ ∫ Dφ e i d 4 x L[φ ′] φ ( x1 ) φ ( x2 ) φ ( x3 ) = ∫ Dφ e ∫ φ ′ ( x1 ) φ ′ ( x2 ) φ ′ ( x3 ) , onde φ ′ = φ + ε . Expandindo esta equação até a primeira ordem em ε , encontramos que 0 = ∫ Dφ e ∫ i d 4x L {(i ∫ d xε ( x ) ( −∂ − m )φ ( x ) φ ( x )φ ( x )φ ( x )) 4 2 2 1 2 3 +ε ( x1 ) φ ( x2 ) φ ( x3 ) + φ ( x1 ) ε ( x2 ) φ ( x3 ) + φ ( x1 ) φ ( x2 ) ε ( x3 )} . Os três últimos termos podem ser combinados com o primeiro, se usarmos a identidade ε ( x1 ) = ∫ d 4 x ε ( x ) δ ( x − x1 ) . Observando que o lado direito da equação acima deve ser nulo para qualquer variação de ε ( x ) , obtemos então que 0 = ∫ Dφ e ∫ i d4x L 2 2 ( ∂ + m ) φ ( x ) φ ( x1 ) φ ( x2 ) φ ( x3 ) 219 +iδ ( x − x1 ) φ ( x2 ) φ ( x3 ) + iφ ( x1 ) δ ( x − x2 ) φ ( x3 ) + iφ ( x1 ) φ ( x2 ) δ ( x − x3 )} . Uma equação similar a essa é válida para uma quantidade qualquer de campos φ ( xi ) . Para analisar as implicações deste último resultado, vamos considerar apenas um campo φ ( x1 ) na função de correlação inicial. Observando que as derivadas de φ ( x ) podem ser extraídas da integral, ao dividirmos a equação acima por W obteremos a identidade (∂ 2 + m 2 ) Ω T φ ( x ) φ ( x1 ) Ω = −iδ ( x − x1 ) . O lado esquerdo desta equação representa o operador de Klein-Gordon atuando sobre uma função de correlação de φ ( x ) . O lado direito será nulo, exceto para x = x . Em outras palavras, a função de correlação satisfaz a equação de Klein-Gordon, exceto no ponto em que os argumentos dos dois campos φ coincidem. A modificação da equação de Klein-Gordon neste ponto é chamada de termo de contato. Neste exemplo simplificado, a modificação quer dizer somente que o propagador de Feynman é uma função de Green do operador de Klein-Gordon, como já foi mostrado antes. E vemos aqui que a função delta surge quando a derivada temporal contida em ∂ 2 age sobre o símbolo de ordenação temporal T . Verificaremos que, em teoria quântica dos campos, de uma forma geral, as equações clássicas de movimento para os campos são satisfeitas por todas as funções de correlação desses campos, a menos dos termos de contato. Consideremos agora a generalização da equação encontrada acima para o caso de uma função de correlação com n + 1 campos escalares: (∂ + m 2 ) Ω T φ ( x ) φ ( x1 )φ ( xn ) Ω = ∑ Ω T φ ( x1 ) ( −iδ ( x − xi ) )φ ( xn ) Ω . n 2 i =1 Esta identidade diz que a equação de Klein-Gordon é obedecida por φ ( x ) no interior de qualquer valor esperado, a menos de termos de contato associados com a ordenação temporal. O mesmo resultado pode ser obtido pelo formalismo hamiltoniano, ou, usando as propriedades particulares da teoria de campo livre, pelo cálculo de ambos os lados da equação através do teorema de Wick. Além do mais, uma vez que a medida funcional é invariante quanto a uma translação da variável de integração, podemos repetir o mesmo argumento e obter as equações de movimento para funções de Green pertencentes a qualquer teoria de campos escalares, vetoriais ou espinoriais. Esta é a razão principal pela qual consideramos como fundamental a invariância translacional da integral de Grassmann, expressa pela definição de Berezin (F. A. Berezin, The Method of Second Quantization, Ed. Academic Press, NY, 1966) ∫ dθ ( A + Bθ ) = B . 220 Para uma teoria geral de um campo ϕ ( x ) , governada pela lagrangiana L [φ ] , os mesmos procedimentos conduzem à identidade 0 = ∫ Dϕ e ∫ i d4x L δ 4 i ∫ d x ε ( x ) δϕ ( x ) ( ∫ d x′L )ϕ ( x )ϕ ( x ) + ε ( x )ϕ ( x ) + ϕ ( x ) ε ( x ) , 4 1 2 1 2 1 2 e a identidades similares para as funções de correlação de n campos. Aplicando as regras de derivação funcional, a derivada da ação será dada por δ δϕ ( x ) ( ) 4 ∫ d x′L = ∂L ∂L , − ∂µ ∂ ( ∂ µϕ ) ∂ϕ a qual é precisamente a quantidade que, pela equação de movimento de Euler-Lagrange para ϕ ( x ) , se iguala a zero. Mais uma vez generalizando a identidade acima para n campos, obtemos o conjunto de identidades n δ 4 ′ d x L x x = ϕ ϕ ϕ ( x1 ) ( iδ ( x − xi ) )ϕ ( xn ) . ( ) ( ) ∑ 1 n ∫ i =1 δϕ ( x ) Nesta equação, os colchetes angulados denotam uma função de correlação temporalmente ordenada, na qual as derivadas de ϕ ( x ) estão localizadas externamente ao símbolo de ordenação T . Esta relação determina que as equações clássicas de EulerLagrange para o campo ϕ são obedecidas por todas as funções de Green de ϕ , a menos de termos de contato que se originem de relações de comutação não-triviais entre operadores de campo. Estas equações de movimento para as funções de Green, incluindo os próprios termos de contato, são chamadas de equações de SchwingerDyson. Na teoria clássica de campos, o teorema de Nöther diz que a cada simetria de uma lagrangiana local corresponde uma corrente conservada. Prosseguindo na discussão das equações de movimento, buscaremos o análogo quântico desse teorema, submetendo o funcional a uma mudança de variáveis infinitesimal ao longo da direção da simetria. Começaremos com o exemplo de uma teoria de um campo escalar e complexo, com a lagrangiana L = ∂ µφ 2 − m 2 φ . 2 Esta lagrangiana é invariante em relação à transformação φ → eiα φ , correspondente ao grupo de simetria U (1) , e de consequências já conhecidas e estudadas na teoria 221 clássica. Para encontrar as fórmulas quânticas, vamos considerar a mudança infinitesimal de variáveis φ ( x ) → φ ′ ( x ) = φ ( x ) + iα ( x ) φ ( x ) . Observe-se que aqui o ângulo infinitesimal de rotação é uma função de x . Como o jacobiano dessa transformação das variáveis φ ( x ) é unitário, a medida da integral funcional não é alterada. Assim, no caso de dois campos: i d 4 x L[φ ] ∫ ∫ Dφ e i d 4 x L[φ ′] φ ( x1 ) φ ∗ ( x2 ) = ∫ Dφ e ∫ φ ′ ( x1 ) φ ′∗ ( x2 ) φ ′=(1+ iα )φ . Expandindo esta equação até a primeira ordem em α , encontramos que 0 = ∫ Dφ e ∫ i d 4x L {i ∫ d x ( ∂ α ) ⋅ i (φ∂ φ 4 µ µ ∗ − φ ∗∂ µφ ) φ ( x1 ) φ ∗ ( x2 ) } + iα ( x1 ) φ ( x1 ) φ ∗ ( x2 ) + φ ( x1 ) −iα ( x2 ) φ ∗ ( x2 ) . Observe-se que a variação da lagrangiana somente contém termos proporcionais a ∂ µα , devido ao fato de que a transformação infinitesimal mantém a lagrangiana invariante. Para escrever essa relação num formato familiar, basta integrar por partes o termo que envolve ∂ µα , coletar o coeficiente de α ( x ) e dividi-lo por W , e obtemos ∂ µ j µ ( x ) φ ( x1 ) φ ∗ ( x2 ) = ( −i ) ( iφ ( x1 ) δ ( x − x1 ) ) φ ∗ ( x2 ) + φ ( x1 ) ( −iφ ∗ ( x2 ) δ ( x − x2 ) ) , onde j µ = i (φ∂ µφ ∗ − φ ∗∂ µφ ) é a corrente de Nöther. Aqui, da mesma forma que antes, a função de correlação denota um produto ordenado no tempo onde a derivada de j µ ( x ) está fora da ação do símbolo de ordenação T . Esta última relação é a lei clássica de conservação acrescida dos termos de contato, isto é, é a equação de Schwinger-Dyson associada com a conservação da corrente. A discussão de conservação da corrente pode ser estendida a situações mais gerais sem maiores dificuldades. Vamos considerar uma teoria de campos local, onde um conjunto de campos ϕa ( x ) é governado por uma lagrangiana L [ϕ ] . Uma transformação infinitesimal de simetria sobre os campos ϕa ( x ) terá a forma geral ϕa ( x ) → ϕa ( x ) + ε∆ϕa ( x ) . 222 Vamos assumir que a ação é invariante em relação a essa transformação. Se o parâmetro ε for uma constante, a lagrangiana deve ser invariante a menos de uma divergência total: L [ϕ ] → L [ϕ ] + ε ∂ µ J µ . Se o parâmetro de simetria ε depende de x , como na análise do parágrafo anterior, a variação da lagrangiana será ligeiramente mais complicada: L [ϕ ] → L [ϕ ] + ( ∂ µ ε ) ∆ϕ a ∂L + ε ∂µJ µ , ∂ ( ∂ µϕ a ) onde está subentendida a soma sobre o índice a . Decorre daí que δ d 4 xL [ϕ + ε∆ϕ ] = −∂ µ j µ ( x ) , δε ( x ) ∫ onde j µ é a corrente de Nöther jµ = ∂L ∆ϕ a − J µ . ∂ ( ∂ µϕ a ) Repetindo todos os procedimentos anteriores, obtemos a equação de Schwinger-Dyson ∂ µ j µ ( x ) ϕ a ( x1 ) ϕb ( x2 ) = ( −i ) ( ∆ϕ a ( x1 ) δ ( x − x1 ) ) ϕb ( x2 ) + ϕ a ( x1 ) ( ∆ϕb ( x2 ) δ ( x − x2 ) ) Esta equação costuma ser referida como a identidade de Ward-Takahashi associada com a simetria da transformação infinitesimal que a originou e a correspondente corrente de Nöther. Uma equação similar pode ser obtida para a função de correlação entre ∂ µ j µ e n campos ϕ ( x ) . E assim temos o conjunto completo das equações de Schwinger-Dyson associadas com o teorema de Nöther clássico. Como um exemplo da utilização deste método variacional para se obter a corrente de Nöther, consideremos a simetria da lagrangiana com respeito às translações do espaço-tempo. Sob a transformação ϕ a → ϕ a + a µ ( x ) ∂ µϕ a a lagrangiana se transforma como L → ∂ν a µ ∂ µϕa ∂L + aµ ∂µL . ∂ ( ∂ν ϕ a ) 223 A variação de ∫ d 4 xL com respeito a a µ fornece nesse caso a equação de conservação para o tensor de energia-momento ∂ν T µν = 0 , com T µν = ∂L ∂ µϕ a − g µν L . ∂ ( ∂ν ϕa ) Os procedimentos usados aqui estão na base das discussões das teorias de campos com simetrias locais, como é o caso das teorias não-abelianas. Vamos agora derivar as equações de Schwinger-Dyson associadas com a simetria global da QED, usando o formalismo integral funcional. Consideremos as consequências sobre a integral funcional da QED da mudança de variáveis ψ ( x ) → (1 + iεα ( x ) )ψ ( x ) , sem o termo correspondente à lei de transformação de Aµ - o que acarretaria a invariância da lagrangiana com respeito à transformação. A lagrangiana da QED LQED L = Dirac + LMaxwell + LInt = ψ ( i ∂ − m )ψ − 2 1 Fµν ) − eψγ µψ Aµ ( 4 será então transformada segundo a expressão L → L − ε ∂ µαψγ µψ , seguindo-se daí a identidade para a integral funcional sobre dois campos fermiônicos, representando uma função de correlação de vértice com três pontos: 0 = ∫ Dψ Dψ DA ⋅ e ∫ i d 4 xL {−i ∫ d x∂ α ( x ) j 4 µ µ ( x )ψ ( x1 )ψ ( x2 ) } + ( ieα ( x1 )ψ ( x1 ) )ψ ( x2 ) + ψ ( x1 ) ( −ieα ( x2 )ψ ( x2 ) ) , com j µ = eψγ µ . Uma equação análoga poderá ser obtida, por generalização, para um número qualquer de campos fermiônicos. Para compreendermos as implicações deste conjunto de equações, vamos começar dividindo tudo por W , e encontraremos que i∂ µ 0 T j µ ( x )ψ ( x1 )ψ ( x2 ) 0 = −ieδ ( x − x1 ) 0 Tψ ( x1 )ψ ( x2 ) 0 +ieδ ( x − x2 ) 0 Tψ ( x1 )ψ ( x2 ) 0 . 224 Integrando ambos os termos da equação para obter as respectivas transformadas de Fourier: ∫d 4 xe − ik ⋅ x ∫ d 4 x1e + iq⋅ x1 ∫ d 4 x2 e − ip⋅ x2 [] , obtemos a identidade de Ward-Takahashi para dois férmions externos (um confluente – in – com momento p , outro efluente – out – com momento q ) e um fóton externo como momento k : −ikµ Mµ ( k ; p; q ) = −ieM0 ( p; q − k ) + ieM0 ( p + k ; q ) . Esta identidade corresponde a uma interação ( ee γ ) com amplitudes Mµ ( k ) = ∫ d 4 x eik ⋅x fin j µ ( x ) in , tais que os estados iniciais e finais incluem todas as partículas, exceto o fóton, cada uma delas com amplitude M0 , e é claro que pode ser também obtida diagramaticamente no formalismo de operadores, a partir de um diagrama de vértice, embora de forma um tanto menos elegante e direta. Uma forma mais geral da identidade para a QED, para n férmions confluentes e efluentes é obtida pela soma sobre todos os diagramas, e é dada por k µ Mµ ( k ; p1 pn ; q1 qn ) = e∑ M0 ( p1 pn ; q1 ( qi − k )) i −M0 ( p1 ( pi + k ); q1 qn ) . A identidade de Ward-Takahashi na QED carrega em si, implicitamente, a lei de conservação da corrente – originada pela invariância de calibre da teoria - e a ortogonalidade do vetor de polarização do fóton em relação aos momentos k , o que, no caso da QED, elimina os fótons longitudinais e do tipo tempo (estes últimos foram considerados recentemente como um estado mesônico quark-glúon, mas, de qualquer maneira, se existirem, estarão associados a certas interações em QCD ainda não observadas). Estas características serão generalizadas e realçadas na extensão das identidades de Ward-Takahashi às teorias de calibre não-abelianas, realizada por John Clayton Taylor e Andrei Alexeievich Slavnov a partir da descoberta da renormalização das teorias de Yang-Mills por ‘t Hooft e Veltman, em 1971. A invariância BRST da teoria não-abeliana completa resulta em várias relações entre amplitudes de espalhamento da teoria, chamadas de Identidades de SlavnovTaylor, essenciais para se estabelecer a renormalização das teorias de calibre. A melhor maneira de se descrever essas identidades é usando o formalismo integral funcional, como será feito a seguir. 225 Vamos considerar uma densidade lagrangiana efetiva que consiste de LTot e mais termos de fontes, como descrito abaixo: a 1 Lefet = LTot + J µ a Aµa + J a F a + i (η a c a − c aη a ) + K µ a ( Dµ c ) + K a − f abc cb c c . 2 Observe-se que, não apenas foram incluídas fontes para todos os campos da teoria, como também foram adicionadas fontes para as variações compostas sob uma transformação BRST, e logo se saberá a razão disso. Abreviando todos os campos por A e todas as fontes por J , podemos escrever o gerador funcional da teoria como W [J ] = e = ∫ DAe ∫ iZ [ J ] i d 4 xLefet . Os VEV dos operadores, na presença das fontes, serão dados agora por Aµa = Aµ( ) = δZ δ J µa Fa = F( δZ δJa c a ca = c( c)a ca = c( ( D c) µ c )a c )a a = = −i δZ δη a = −i δZ δη a = δZ δ K µa δZ 1 abc b c , − f c c = δ Ka 2 onde, para os campos anticomutáveis, foi assumida a derivada à esquerda. Os campos A( c ) são identificados com campos clássicos, e podemos ignorar o índice ( c ) , para simplificar a notação. Quando as fontes externas são mantidas fixas, a densidade lagrangiana efetiva deixa de ser invariante sob as transformações BRST. Lembrando, porém, que LTot é BRST-invariante, e que essas transformações são nilpotentes, calculamos a variação de Lefet (sem o parâmetro anticomutável) como sendo 1 δ Lefet = J µ aδ Aµa + J aδ F a + i (η aδ c a − δ c aη a ) = J µ a ( Dµ c ) + i f abcη a cb c c + F aη a . 2 a 226 Por outro lado, o funcional gerador é definido pela integração sobre todas as possíveis configurações de campo. Logo, se a redefinição dos campos por uma transformação BRST é realizada dentro da integral funcional, o funcional gerador terá que ser invariante, o que leva de imediato ao resultado ∫d 4 δZ δZ δZ x J µ a ( x ) − iη a ( x ) + iη a ( x ) a = 0 µa a δ δ δ K x K x J x ( ) ( ) ( ) Esta é a equação Master, da qual podem ser derivadas todas as funções de Green conexas da teoria. É justamente aqui que a escolha de introduzir fontes também para os operadores compostos da transformação se torna óbvia. Mais frequentemente, porém, estamos interessados em obter os vértices próprios do diagrama 1PI da teoria. Estes podem ser obtidos pela passagem do funcional gerador das funções de Green conexas, Z [ J ] , para o funcional gerador Γ ( A) dos vértices próprios 1PI, através de uma transformação de Legendre. Portanto, definindo uma transformação de Legendre que envolva somente as variáveis de campo da teoria, que são na verdade os campos clássicos dos quais estamos ignorando o sobrescrito ( c ) , para simplificar a notação, obteremos a expressão ( ) Γ [ A, K ] = Z [ J ] − ∫ d 4 x J µ a Aµa + J a F a + i (η a c a − c aη a ) , onde K simboliza, de forma genérica, as fontes para as variações compostas. Desta última expressão extraímos então as relações δΓ = − J µa a δ Aµ δΓ = −J a a δF δΓ = iη a δ ca δΓ = iη a a δc δΓ δZ = a δ K µ δ K µa δΓ δZ , = a δK δ Ka que nos permitem escrever a equação Master em termos de Γ : 227 ∫d 4 δΓ δΓ δΓ δΓ δΓ x a + − F a ( x) a =0 δ A ( x ) δ K µa ( x ) δ c a ( x ) δ K a ( x ) δ c ( x ) µ Esta é a equação Master a partir da qual podemos derivar todas as relações entre os vários vértices próprios 1PI resultantes da invariância BRST da teoria. É um resultado essencial para se provar a renormalizabilidade das teorias de calibre. Note-se, por exemplo, que esta última equação pode ser escrita no espaço dos momentos como ∫d 4 δΓ δΓ δΓ δΓ δΓ k a + a − F a (k ) a = 0 . µ a a δ A ( −k ) δ K ( k ) δ c ( −k ) δ K ( k ) δ c k ( ) µ Tomando-se as derivadas com respeito a δ 2 (δ F b ( p ) δ cb ( − p ) ) e depois fazendo as variáveis de campo irem a zero, obtemos finalmente a identidade δ 2Γ δ 2Γ δ 2Γ + − = 0. δ F b ( p ) δ Aµa ( − p ) δ c b ( − p ) δ K µ a ( p ) δ c a ( − p ) δ c a ( p ) Uma análise simples mostra que esta identidade relaciona a função de dois pontos mista, envolvendo F e Aµ , com a função de dois pontos para os campos fantasmas, e, por consequência, os contratermos que normalizam a teoria deverão também obedecer a essa relação. Desta maneira se vê que a invariância BRST é fundamental para o estudo, em uma teoria de calibre, de sua renormalização e de sua independência de calibre VIII.1.4. Condições de Contorno Fermiônicas Com já foi visto, a função de partição que envolve variáveis fermiônicas é definida com uma condição de contorno antiperiódica para essas variáveis. Veremos como isto se manifesta no exemplo simples do oscilador fermiônico, e em seguida o sistema será descrito na representação de estado coerente, que é naturalmente generalizável para a descrição integral funcional de teorias de campo. Vamos considerar um oscilador fermiônico descrito pelos operadores de criação e destruição, a † e a , respectivamente, satisfazendo as relações de anticomutação {a, a} = 0 = {a † , a † } ; {a , a } = 1 . † O espaço de Hilbert, nesse caso, será bidimensional, tendo como vetores de base os estados 0 e 1 = a † 0 , que satisfazem por sua vez as relações de ortonormalidade e completeza n m = δ nm , n, m = 0,1 ; 0 0 + 1 1 = 1. 228 Tomemos agora um parâmetro ψ , com paridade grassmanniana ímpar, para definir um estado da teoria como ψ = e−ψ a 0 = 0 −ψ 1 . † Foi usado o fato de que, como ψ tem paridade grassmanniana ímpar, suas potências maiores que 2 são nulas. Segue-se daí que ∗ ψ = 0 e − aψ = 0 + ψ ∗ 1 , uma vez que ψ , ou ψ ∗ , anticomutam com os operadores da teoria, e também que (ψ a ) † † = aψ ∗ , o que é essencial para mostrar que, para quaisquer dois estados φ e ψ , definidos como acima, φ ψ =( ψ φ ) ∗ . Esses estados ψ são chamados de estados fermiônicos coerentes, e são autoestados do operador fermiônico de destruição: a ψ = a ( 0 −ψ 1 ) = ψ ( 0 ) = ψ ψ . Estados coerentes são um método alternativo para descrever o espaço de Hilbert do oscilador fermiônico, e, como já foi dito, conduzem naturalmente a uma descrição integral funcional de teorias de campo. O produto interno de dois estados coerentes fermiônicos pode ser facilmente obtido. Para dois estados φ e ψ com paridade de Grassmann ímpar, resulta do exposto acima que ψ φ = ( 0 +ψ ∗ 1 ) ( 0 − φ 1 ) = 0 0 +ψ ∗φ 1 1 = 1 +ψ ∗φ = eψ φ . ∗ Mais uma vez foi usado o fato de que parâmetros de Grassmann com paridade ímpar anticomutam com operadores fermiônicos. Obtém-se a relação de completeza para os estados fermiônicos coerentes depois de notar, pelas relações acima, que ψ ψ = 0 0 −ψ 1 0 +ψ ∗ 0 1 −ψ ∗ψ 1 1 . Podemos agora efetuar o cálculo ∫ dψ ∗ dψ e−ψ ψ ψ ψ = ∫ dψ ∗dψ (1 −ψ ∗ψ )( 0 0 −ψ 1 0 +ψ ∗ 0 1 −ψ ∗ψ 1 1 ) ∗ 229 = ∫ dψ ∗ dψ ( −ψ ∗ψ ) ( 0 0 + 1 1 ) = 1 . Para chegar a esse resultado, foram usadas a nilpotência dos parâmetros grassmannianos ímpares e as regras de integração grassmanniana de Berezin para tais parâmetros, dadas por ∫ dψ 1 = 0 ∫ dψ e ψ = 1. Pode ser verificado, então, que ∫ dψ ∗ ∗ ∗ ∗ dψ e−ψ ψ ψ ψ ψ ′ = ∫ dψ ∗dψ e −ψ ψ eψ ψ ′ ψ = ∫ dψ ∗dψ e −ψ ∗ (ψ −ψ ′) ψ = ∫ dψ ∗δ (ψ −ψ ′ ) ψ = ψ ′ . ∗ Fica claro também que, na descrição de estado coerente, o fator gaussiano e −ψ ψ atua como um fator de peso no cálculo de várias quantidades. Por exemplo, podemos calcular o traço de um operador bosônico A da seguinte forma: ∗ ∗ Tr A = Tr1A = Tr ∫ dψ ∗dψ e −ψ ψ ψ ψ A = ∫ dψ ∗dψ e−ψ ψ ψ A −ψ . Esta relação é importante porque significa que o traço de um operador bosônico em uma teoria fermiônica se define sobre estados antiperiódicos. Daí a razão para a definição de antiperiodicidade na função de partição para uma teoria fermiônica. Das relações de anticomutatividade também decorre que o operador número para férmions é idempotente, isto é, N = a†a = N 2 . Em consequência disso, e − iπ N = 1 − 2 N , o que faz com que a definição dos estados coerentes possa ser escrita como e− iπ N ψ = (1 − 2 N ) ( 0 −ψ 1 ) = 0 + ψ 1 = −ψ . Resulta que o traço de um operador bosônico da forma e − iπ N A seria dado pela expressão ∫ dψ ∗ ∗ ∗ dψ e −ψ ψ ψ e − iπ N A −ψ = ∫ dψ ∗ dψ e −ψ ψ −ψ A −ψ . Ou, em outras palavras, o operador e − iπ N corresponde a um potencial químico µ = iπ para os férmions, e sua presença em um traço modifica as condições de contorno dos férmions de tal forma que estes terminam por obedecer às condições periódicas de uma forma análoga à dos bósons. 230 VIII.1.5. Função de Partição de uma Teoria de Calibre Não-abeliana Podemos finalmente tentar definir a função de partição para uma teoria de calibre não-abeliana. De um ponto de vista prático, se pudermos obter uma função de partição em uma representação integral funcional, seria de grande utilidade para os cálculos posteriores, embora um enfoque simplista vá certamente criar um problema imediato. Como já foi visto, a teoria completa para um sistema de calibre envolve partículas/ campos não-físicos, e a invariância BRST é essencial para o estudo das teorias de calibre. Entretanto, como também já foi visto, os campos fantasma e antifantasma, c e c , que se comportam efetivamente como os parâmetros da transformação BRST, são campos de Grassmann anticomutativos, e ao mesmo tempo campos escalares com spin nulo, o que são propriedades conflitantes. Diversamente do que afirmam alguns autores (A. Das, Finite Temperature Field Theory, seção 4.6), já foi demonstrado que os campos fantasmas não obedecem à estatística de Fermi-Dirac, a qual só se aplica a campos com significado físico. Mas a necessidade, tanto para a validade do método de Fadeev-Popov quanto do método BRST, de que esses campos obedeçam, também a temperatura finita, às propriedades antiperiódicas de uma variável de Grassmann, diferentemente dos campos de calibre bosônicos, que possuem propriedades periódicas, trazem uma nova dificuldade para esses métodos. Cuja solução – que surge naturalmente da definição de um estado físico na teoria, como será visto a seguir - é admitir, como condição necessária para preservar a invariância BRST, que os campos fantasmas não-físicos também devam admitir condições de contorno periódicas, mesmo sendo variáveis grassmannianas. Trabalhando em temperatura finita com uma teoria de campos, já percebemos que a mesma contém partículas não-físicas, e, portanto, sem conteúdo termodinâmico. Portanto, não faz sentido definir uma função de partição como um simples traço sobre todo o espaço completo da teoria. Uma função de partição, por definição, tem por meta a medição de observáveis físicos, e, logo, deveria ser definida apenas sobre o espaço físico da teoria, cujo espaço completo é H . Seguindo este último argumento, parece bem apropriado definir a função de partição para uma teoria de calibre como Z ( β ) = Tr e − β H , onde a barra sobre o traço restringiria o espaço completo. Definindo, para simplificar a notação, um operador P ( 0) que projeta vetores sobre o subespaço físico de estados, e lembrando que tais estados carregam um número nulo de fantasmas, podemos reescrever a função de partição como Z ( β ) = Tr P ( ) e− β H = Tr P ( ) eπ Qc e − β H . 0 0 231 O fato de que os estados físicos possuem número de fantasmas nulo foi usado no segundo passo acima. Usando vários resultados da unitariedade da teoria de calibre nãoabeliana com invariância BRST, quando restrita apenas aos estados físicos do sistema, chegamos a uma expressão simples para a função de partição térmica, dada por Z ( β ) = Tr eπ Qc e − β H . Se notarmos agora que iQc corresponde, na verdade, ao operador número fantesma, vemos que o efeito da primeira exponencial acima é mudar a periodicidade dos campos fantasmas, e, assim, podemos escrever que Z ( β ) = Tr e− β H , onde os campos fantasmas devem obedecer a condições de contorno periódicas. Do ponto de vista da invariância BRST, este é, sem dúvida, um resultado consistente. De início, vemos que a função de partição pode ser definida sobre o espaço completo de estados, o que significa que a representação integral funcional está resolvida, uma vez que os campos fantasmas obedeçam a condições de contorno periódicas. Resumindo, que os campos fantasmas sigam as prescrições de condições de contorno periódicas é crucial para a representação integral funcional, independente de calibre, da função de partição. E esta prescrição é válida mesmo para as teorias abelianas, nas quais os campos de calibre não interagem entre si. Para comprovar isso, com a sumária eliminação dos campos auxiliares, no caso abeliano, teremos que 2 1 1 LTot = − Fµν F µν − ∂ µ Aµ ) + ∂ µ c ∂ µ c ( 4 2ξ = 1 µν Aµ η 2 − ξ −1 µ ν ∂ ∂ Aν + ∂ µ c ∂ µ c . ξ Logo, se escrevemos a função de partição como uma integral funcional, assumindo que os campos fantasmas satisfazem condições de contorno periódicas, teremos que −1 2 β ξ −1 µ ν Z ( β ) = N ∫ DAµ Dc Dc exp − ∫ dt ∫ d 3 x LTot = N det η µν − ∂ ∂ det ( − ) 0 ξ onde N é uma constante de normalização irrelevante, e o primeiro determinante é tomado sobre o espaço dimensional finito de Minkowski ( µ ,ν ) , assim como também sobre o espaço de coordenadas de infinitas dimensões. O segundo determinante vem da integração das variáveis fantasmas, e a potência positiva é fruto da natureza anticomutável desses campos. Devido à escolha das condições de contorno periódicas para os campos fantasmas, ambos os determinantes estão definidos sobre o espaço das funções periódicas. O primeiro determinante, depois de algumas contas trabalhosas, pode ser calculado sobre o espaço de Minkowski finito, como o escalar de Lorentz que 232 de fato é, e pode ser escrito como det ( 4 ξ ) . A constante ξ independe da temperatura, e pode ser absorvida na constante de normalização, de modo que a função de partição pode ser escrita como ( Z ( β ) = N det ( 4 ) ) −1 2 ( det ( − ) = N ( det ( − ) ) ). −1 2 2 Logo se vê que essa função de partição é exatamente idêntica à de dois campos escalares, o que implica que a teoria de calibre possui somente dois graus de liberdade transversos – como pode ser verificado explicitamente em outro calibre, o calibre unitário de Feynman. O que é realmente importante é que, como já foi mostrado antes, o determinante fantasma cancela exatamente os dois graus de liberdade não-físicos ( o longitudinal e o tipo-espaço), só restando o grau transversal, e o que permitiu isso foram as condições de contorno periódicas atribuídas aos campos fantasmas, embora, de forma óbvia, as contribuições desses campos não sejam interativas. Cabe assinalar que essas conclusões independem do calibre no qual foram obtidas. VIII.1.6. Identidades de Ward-Takahashi a Temperatura Finita Como já ficou claro, para se definir a função de partição de uma teoria de calibre deve-se ter em conta a preservação da simetria BRST da teoria a temperatura zero, que tem consequências físicas importantes. Por exemplo, é a invariância BRST da teoria completa de calibre fixado que leva às identidades de Ward-Takahashi, relacionando amplitudes 1PI. É claro, então, que as identidades de Ward-Takahashi permanecem válidas em temperatura finita, bastando ilustrar este fato com um exemplo simples. Vamos analisar a correção, em temperatura finita e a um laço, do tensor de polarização, a temperatura zero, de um campo bosônico de calibre em 1+1 dimensões, univocamente associado, pela bosonização característica desse espaço bidimensional, ao laço fermiônico. À temperatura zero, sabe-se que esse tensor é completamente transversal, se usarmos, por exemplo, a regularização dimensional – que é um produto formal das identidades de Ward-Takahashi. Vejamos, então, se as correções a temperatura finita produzem componentes longitudinais, violando assim as bemfundamentadas identidades de Ward-Takahashi; o que negaria, por absurdo, a hipótese. As identidades de Ward-Takahashi são muito melhor estudadas no formalismo de tempo real. Para construir o propagador dos campos fermiônicos físicos, basta recorrer à função de Green S++ , encontrada quando foi analisada, no formalismo de Schwinger-Keldysh, a estrutura matricial dos propagadores a temperatura finita, mesmo porque as demais componentes do propagador não contribuem para o tensor físico de polarização. 233 Podemos escrever então que S ++ → iS ( p ) = iS ( 0) ( p ) + iS ( β ) ( p ) = 1 = i ( p + m) 2 + 2iπ nF ( p ) δ ( p 2 − m 2 ) , 2 p − m + iε onde nF ( p ) representa a função de distribuição fermiônica definida na notação covariante como sendo nF ( p ) = 1 e β u⋅ p +1 , e u µ representa a quadrivelocidade do banho térmico. A contribuição do laço fermiônico, dependente da temperatura, ao tensor de polarização pode agora ser facilmente calculada (η µν é a métrica de Minkowski com assinatura ( +, −, −, − ) ): iΠ (µν) = −e 2 ∫ β d 2k ( 2π ) =− Tr γ µ S ( 2 ie 2 π ∫d 2 0) ( k + p ) γν S ( β ) ( k ) + γ µ S ( β ) ( k + p ) γν S ( 0) ( k ) + γ µ S ( β ) ( k + p ) γν S ( β ) ( k ) k ( k + p ) µ kν + ( k + p )ν k µ − η µν ( k ⋅ ( k + p ) − m 2 ) nF ( k ) δ ( k 2 − m2 ) n ( k + p ) δ ( k + p )2 − m 2 2 F 2 2 2 π δ δ × + + 2 i n k n k + p k − m k + p − m ( ) ( ) ( ) ( ) F F 2 k 2 − m 2 + iε ( k + p ) − m 2 + iε Usamos neste cálculo o fato de que os termos dependentes da temperatura são finitos, e, em vista disso, o traço de Dirac foi realizado em 1 + 1 dimensões. A maior simplicidade de cálculo em 1 + 1 dimensões nos permite fatorar a estrutura tensorial para fora da integral. Vamos definir as seguintes representações na notação covariante: Ω = k ⋅u ; ω = p ⋅u ; k µ = Ωu µ − ∈µν uν k ′ ; p µ = ω u µ − ∈µν uν p′ , 234 onde ∈µν representa a densidade tensorial antissimétrica de Levi-Civita, e, na nossa notação, ∈01 = 1 . Também resulta dessas definições que ∈µν pµ uν = p′ . Fazendo as substituições correspondentes na expressão encontrada acima para iΠ (µν) , β usando as propriedades da função delta e as propriedades de simetria da integral, assim como o fato de que o Jacobiano da transformação é unitário, obtemos que iΠ (µν) = −e2uµ uν ( 2 I + I ′ ) , β onde a velocidade u , transversa ao momento p , foi definida como sendo igual a u µ = uµ − ω p′ ∈µν uν , e onde I e I ′ representam as integrais δ ( Ω 2 − k ′2 − m 2 ) k ′ (ω + Ω ) + Ω ( k ′ + p′ ) I= d Ωdk ′ βΩ ω ∫ ω ( ω + 2Ω ) − p′ ( p′ + 2k ′ ) + iε e +1 ip′ I′ = − ( 2 p′ ω ∫ d Ωdk ′ k ′ (ω + Ω ) + Ω ( k ′ + p′ ) (e βΩ )( +1 e β ω +Ω ) +1 ) ( δ ( Ω 2 − k ′2 − m 2 ) δ ( Ω + ω ) − ( k ′ + p ′ ) − m 2 2 2 ) Isto evidencia que, independente dos valores das integrais finitas I e I ′ , a parte do tensor de polarização dependente da temperatura é transversa ao momento linear, como requerido pelas identidades de Ward-Takahashi. Observe-se que, apesar de ter sido realizada em dimensões 1 + 1 , a mesma análise pode ser estendida às dimensões 3 + 1 , mostrando mais uma vez que o tensor de polarização dependente da temperatura é transverso. Este é um exemplo bem simples, apenas para mostrar como as identidades de Ward-Takahashi são preservadas a temperatura finita, desde que se tomem as devidas precauções ao definir as funções de partição, zelando para que as mesmas preservem a invariância BRST. Por outro lado, à temperatura zero existem várias maneiras de escrever identidades semelhantes, usando os inversos de propagadores. A temperatura finita, porém, ocorre que o inverso de um propagador não é único, simplesmente porque a parte dependente da temperatura é destruída – no caso de um campo escalar, por exemplo, por ( p 2 − m 2 ) . Logo, a definição do que se entende por identidades de Ward-Takahashi, a temperatura finita, deve ser feita sempre com muito cuidado, sempre levando em conta que as identidades corretas são aquelas obtidas a partir do funcional gerador das funções de Green 1PI, como foi feito aqui. 235 VIII.2. Modificações no Cálculo a Temperatura Finita VIII.2.1. ε -regularização Os cálculos nas teorias a temperatura finita apresentam sutilezas no formalismo de tempo real, advindas da ocorrência natural de produtos de quantidades que não possuem propriedades de analiticidade bem-definidas. Para exemplificar como devem ser contornadas essas dificuldades, será usado um exemplo a temperatura zero, mas que envolve algumas características de cálculo que também ocorrem a temperatura finita. Será analisado um sistema de gás degenerado de elétrons, não-relativístico, a temperatura zero, que tem a vantagem adicional de acumular resultados experimentais medidos com precisão. O propagador para esse sistema é bem estudado, e tem a forma iS ( p ) = 1 1 , = 0 p − ω p + µ + iε sgn (ωp − µ ) p − ω p + µ + iε sgn ( p 0 ) 0 onde µ representa o potencial químico, que pode ser identificado com a energia de Fermi, e ω p = p 2 2m . A segunda forma do propagador é mais adequada para os cálculos, e, de um modo que lembra a estrutura dos propagadores a temperatura finita, não apresenta uma analiticidade bem-comportada, uma vez que, para p 0 > 0 , tem um polo no semiplano inferior, ao passo que, para p 0 < 0 , a localização do polo é na metade superior do plano complexo p 0 . Singularidades da mesma natureza destas obrigam a que, a temperatura finita, se use uma ε -regularização, que corresponde simplesmente à prescrição para que usemos as representações seguintes: P 1 x 1 1 1 = lim+ 2 = lim+ + 2 ε → 0 ε → 0 x x +ε 2 x + iε x − iε δ ( x ) = lim ε →0 + ε i 1 1 = lim − 2 ε → 0 2π x + iε π x +ε x − iε 1 2 + , onde subentende-se que o limite só deve ser tomado ao final dos cálculos. Vamos agora calcular a auto-energia do gás degenerado de elétrons, sendo que, para simplificar, o cálculo será concentrado na parte real da auto-energia do gás. 236 d 4k Re Π ( p ) = Re ( −2i ) ∫ S k S k − p = ( ) ( ) 4 π 2 ( ) d 4k 1 1 , = Re ( −2i ) ∫ 4 0 0 0 0 0 0 k i sgn k k p i sgn k p − ω + µ + ε − ω + µ + ε − 2 π ( ) ( ) ( ) k k − p onde a constante de acoplamento foi normalizada na unidade, e o fator 2 veio de um traço efetuado sobre o índice de spin. Os propagadores podem ser expandidos usando-se a representação padrão (sendo P o valor principal de Cauchy) lim+ ε →0 1 1 = P − iπ sgn (α ) δ ( x ) . x + iαε x Desta forma, a parte real da auto-energia será dada, após substiuirmos as prescrições, por Re Π ( p ) = − i d 4k 1 1 + 0 + ( p0 → − p0 ) 4 0 0 0 ∫ 2 ( 2π ) k + p − ωk + p + µ + iε k + p − ωk +p + µ − iε 1 1 × sgn ( k 0 ) 0 − 0 k − ωk + µ + iε k − ωk + µ − iε =− i d 4k sgn ( k 0 ) 4 ∫ 2 ( 2π ) 1 1 × 0 ⋅ 0 0 k + p − ωk +p + µ + iε k − ωk + µ + iε 1 1 − 0 ⋅ 0 0 k + p − ω + µ + iε k − ω + µ − iε k +p k 1 1 ⋅ 0 − 0 0 k + p − ωk +p + µ − iε k − ωk + µ − iε 1 1 ⋅ 0 + 0 0 k + p − ωk +p + µ − iε k − ωk + µ + iε } + ( p0 → − p0 ) = I1 + I 2 , onde os primeiros dois termos dentro dos colchetes, que têm comportamento analítico similar, foram agrupados em I1 , e os outros dois termos, com comportamento analítico oposto, juntam-se em I 2 . Observa-se que os integrandos acima são funções não-analíticas, devido ao fator sgn ( k 0 ) . Para efetuar as integrações, portanto, iremos primeiramente reescrever as expressões acima como 237 I1 = − i d 3k 2 ∫ ( 2π ) 4 ∫ ∞ 0 dk 0 1 1 1 1 × 0 ⋅ 0 − 0 ⋅ 0 0 0 k + p − ωk +p + µ + iε k − ωk + µ + iε k − p + ωk +p − µ − iε k + ωk − µ − iε 1 1 1 1 − 0 ⋅ 0 + 0 ⋅ 0 0 0 k + p − ω + µ − iε k − ω + µ − iε k − p + ω − µ + iε k + ω − µ + iε k +p k k +p k } + ( pµ → − pµ ) Agora a integral interior pode ser calculada pelo método de resíduos, escolhendo-se um contorno no quadrante superior direito, e obtemos que θ ( µ + p 0 − ωk + p ) θ ( µ − ωk ) i d 3k π I1 = − ∫ 2 i − − ωk +p − p 0 − ωk 2 ( 2π )4 p 0 + ω k − ωk + p − =− θ (ωk + p − p 0 − µ ) ωk + p − p − ω k 0 − θ ( ωk − µ ) + ( pµ → − pµ ) 0 ωk − ωk + p + p 1 d 3k 1 sgn (ωk − µ ) − sgn (ωk + p − p 0 − µ ) + ( p µ → − p µ ) 3 0 ∫ 2 ( 2π ) p + ωk − ωk + p ( ) A segunda integral pode ser calculada exatamente da mesma maneira, e será I2 = − 1 d 3k 1 0 µ µ sgn ω − µ + sgn ω − p − µ + p → − p ( ) ( ) ( ) k k+ p 2 ∫ ( 2π )3 p 0 + ωk − ωk + p ( ) Logo, Re Π ( p ) = I1 + I 2 == − ∫ d 3k ( 2π ) 3 1 sgn (ωk − µ ) 0 + ( pµ → − pµ ) p +ω −ω k k+ p VIII.2.2. Parametrização de Feynman Se fossemos usar nos cálculos de I1 e I 2 a fórmula de produto combinado de Feynman, juntamente com a ε -regularização, sem as devidas modificações, obteríamos um resultado diferente para I 2 , o que faz supor que, para fatores com analiticidade oposta, a fórmula original de Feynman não funciona. A fórmula de Feynman diz que 238 1 1 1 dx =∫ . 2 0 A + iαε B + i βε x ( A + iαε ) + (1 − x )( B + i βε ) Aplicando diretamente esta fórmula no cálculo de I 2 , vamos obter a expressão 1 d 3k I2 = − ∫ 2 ( 2π )3 p 0 − ωk − ω k + p 2sgn + µ + sgn (ωk − µ ) + sgn (ωk + p − p 0 − µ ) ` 2 × 1 p + ωk − ωk + p 0 + ( p 0 → − p 0 ) , que é diferente da expressão correta obtida anteriormente. Logo, alguma modificação tem que ser feita na fórmula de Feynman, quando os fatores possuem analiticidades opostas. VIII.2.3. Modificação da Fórmula de Feynman Analisando a fórmula de Feynman, verificamos que, de fato, se o integrando do lado direito não tem pólos no eixo real dos x , temos que 1 1 1 ∫0 x ( A + iαε ) + (1 − x )( B + iβε ) 2 = − A − B + i (α − β ) ε x ( A − B + i (α − β ) ε ) + B + iβε 1 dx = 1 1 , A + iαε B + i βε isto é, o produto original é recuperado sem problemas. Vamos admitir, porém, que os parâmetros α e β sejam tais que o integrando possui um polo no eixo real dos x , entre 0 e 1 (podemos fazer, sem perda de generalidade, α = β = 1 ). Para que isto ocorra num ponto x0 , devemos ter que x0 ( A − B ) + B = 0 = ( β + x0 (α − β ) ) . A solução desse sistema de equações dá as relações x0 = β (β −α ) e β A =αB . O que significa que existirá um polo entre 0 e 1 se e somente se α e β tiverem sinais contrários. Isto é, o polo no eixo real irá contribuir não-trivialmente à integral somente 239 0 quando os dois fatores possuírem comportamento analítico oposto. Vamos impor então a condição 0 ≤ x0 = β ( β − α ) ≤ 1 , e calcular a integral, usando o valor principal: β ∫0 x ( A + iαε ) + (1 − x )( B + iβε ) 2 = ηlim → 0+ ∫0 1 dx +∫ 1 β = ( β −α ) −η dx x ( A − B + iε (α − β ) ) + B + i βε 2 2 ( β −α ) +η x ( A − B + iε (α − β ) ) + B + i βε dx (α − β ) δ ( β A − α B ) . 1 1 − 2iπ A + iαε B + i βε A − B + i (α − β ) ε Em outras palavras, quando os dois fatores possuem propriedades analíticas opostas, a fórmula de Feynman é modificada, e teremos como resultado geral que 1 1 1 dx (α − β ) δ ( β A − α B ) =∫ + 2iπ 2 0 A + iαε B + i βε A − B + i (α − β ) ε x ( A + iαε ) + (1 − x )( B + i βε ) Portanto, a temperatura finita, o propagador contém termos com comportamento analítico oposto, o que torna necessário o uso da fórmula modificada de Feynman, sempre que necessário. VIII.3. Quebra Dinâmica de Simetria Quando a quebra de simetria de um sistema quântico se dá quando é verificada a condição VEV ≠ 0 para um campo escalar fundamental, diz-se que ocorre uma quebra espontânea de simetria. Há situações, porém, em que a condição VEV ≠ 0 se verifica para um operador composto (em geral, por um produto de operadores), e não para um operador escalar fundamental, levando igualmente a uma quebra de simetria. Neste caso, diz-se que ocorreu uma quebra dinâmica de simetria. O operador composto mais estudado, cujo VEV está associado a uma quebra de simetria, é o que representa um par de férmions, como, por exemplo, o par de Cooper da teoria BCS da supercondutividade, a condensação de férmions associada a uma quebra dinâmica de simetria quiral, e assim por diante. É importante ressaltar uma diferença característica entre as quebras de simetria espontânea e dinâmica, no sentido de que, na quebra dinâmica, em geral, existe uma anomalia – como a anomalia quiral, ou a anomalia ABJ (J. S. Bell e R. Jackiw, Nuovo Cimento 60ª, 47 (1969); S. Adler, Phys. Ver. 177, 2426 (1969)), que ocorrem quando uma corrente de Nöther não é conservada, e essa anomalia está associada ao valor não-nulo do parâmetro de ordem VEV ≠ 0 . Por outro lado, essas anomalias são notáveis por causa da impossibilidade de se regularizarem, mantendo certas simetrias, 240 as divergências UV de uma teoria de campos, e, na verdade, uma anomalia representa o comportamento UV de sua teoria. Entretanto, como já foi visto, os efeitos a temperatura finita não modificam o comportamento UV de uma teoria. Assim, intuitivamente, espera-se que uma anomalia não seja modificada pelos efeitos da temperatura, e, logo, espera-se da mesma forma que a quebra dinâmica de simetria associada à anomalia também não sofra alterações. Em particular, diferentemente do que ocorre no caso da quebra espontânea de simetria, não é esperado que uma quebra dinâmica de simetria seja anulada, ou seja, que a simetria quebrada dinamicamente seja restaurada, a altas temperaturas. Para mostrar que isto é o que realmente ocorre, usaremos o modelo QED2 de Schwinger, uma teoria eletrodinâmica quântica de férmions sem massa, com solução exata em dimensões 1+1. A densidade lagrangiana do modelo de Schwinger é dada por 1 LSch = − Fµν F µν + iψγ µ ( ∂ µ − ieAµ )ψ . 4 Esta densidade lagrangiana com férmions de massa nula é invariante de calibre, e, em 1+1 dimensões, a constante eletromagnética de acoplamento tem dimensões de massa. Além da invariância de calibre, a teoria também é invariante sob uma transformação quiral, uma vez que os férmions têm massa nula. Contudo, como é sabido, a simetria quiral é anômala na teoria quântica, o que faz com que o fóton adquira massa na teoria completa. Será mostrada a seguir a independência da anomalia quiral, e, consequentemente, a independência da geração dinâmica de massa do fóton, em relação à temperatura. Nesta teoria, a equação da anomalia pode ser escrita como ∂ µ T ( j5µ ( x ) jν ( 0 ) ) = Gν ( x ) . A forma explícita de Gν é irrelevante para o exemplo, exceto pelo fato de que está relacionada com a anomalia quiral da teoria. Fica claro que a questão de dependência da anomalia em relação à temperatura é melhor estudada no âmbito do formalismo de tempo real, onde os propagadores se separam naturalmente em uma parte independente e outra dependente da temperatura. Diagramaticamente, o termo da anomalia sai de um grafo de auto-energia a um laço, com um vértice γ 5γ µ : 241 Portanto, podemos ver que, a temperatura finita, a anomalia terá quatro contribuições: I 0 = −e 2 ∫ I1 = −2π e 2 I 2 = −2π e 2 ∫ I 3 = − ( 2π ) e 2 ∫ 2 ( 2π ) d 2k ∫ ( 2π ) d 2k ( 2π ) d 2k ( 2π ) d 2k 2 2 2 2 Tr γ 5 pk γ ν ( k + p ) Tr γ 5 pk γ ν ( k + p ) Tr γ 5 pk γ ν ( k + p ) Tr γ 5 pk γ ν ( k + p ) 1 k 2 (k + p) 1 1 (k + p) 2 e 1 e β k0 +1 1 1 δ 2 β k 0 + p0 k e +1 β k +p 0 +1 e β k +p 0 0 δ (k 2 ) (( k + p ) ) 2 1 0 2 +1 ( δ ( k 2 )δ ( k + p ) 2 ) È fácil mostrar, usando a identidade do traço de Dirac, que I1 e I 2 dão as mesmas contribuições. Em primeiro lugar, note-se que, se fizermos k ↔ − ( k + p ) em I 2 , como as integrais são finitas e, portanto, não há problemas com mudança de variáveis, I 2 coincide com I1 , a menos da parte do traço. Mas, calculando o traço das matrizes γ : Tr γ 5 p ( k + p ) γ ν k = Tr γ 5 p k γ ν ( k + p ) − k γ ν p + p γ ν k = Tr γ 5 pk γ ν ( k + p ) + 2 pkν γ 5 = Tr γ 5 pk γ ν ( k + p ) , que é idêntico ao traço em I1 . As contribuições que dependem da temperatura vêm de I1 , I 2 e I 3 . Usando agora a identidade, válida para dimensões 1+1, γ 5γ ν =∈νλ γ λ , podemos escrever que I1 + I 2 = −4π e ∈ 2 νλ d 2k ∫ ( 2π ) 2 ( Tr pk γ λ ( k + p ) ) 1 (k + p) 1 2 e β k0 +1 δ (k2 ) 242 (k d 2k = −8π e 2 ∈νλ ∫ ( 2π ) = −8π e 2 ∈νλ 2 λ (k + p) d 2k ∫ ( 2π ) 2 2 ) ( k +1 p ) 1 kλ e β k0 +1 1 2 e β k0 +1 δ (k2 ) δ (k2 ) = 0 . Usamos aqui o fato de que, nos passos intermediários, a função delta anula k 2 , e no último passo, a integral é nula porque o integrando é uma função ímpar. Segue-se trivialmente do resultado acima, porque o integrando em I 3 envolve um termo adicional ( ) δ ( k + p ) , que I 3 = 0 . Isto mostra que os termos na anomalia que são dependentes da 2 temperatura são nulos, e o único termo que resta é I 0 , que corresponde ao modelo de Schwinger à temperatura zero. Consequentemente, como no modelo de Schwinger a anomalia é mantida, independentemente da temperatura, a geração dinâmica de massa para o fóton também permanecerá inalterada. VIII.4. A Fórmula de Redução LSZ A teoria do espalhamento nos diz que podemos relacionar a probabilidade de espalhamento em um experimento real com um conjunto idealizado de amplitudes de transição entre os estados assintóticos in e out com momento definido da forma seguinte: out p1p 2 p Ap B in Para calcular a interdependência entre os estados in e out, usa-se o fato de que as definições de ambos os conjuntos de estados estão relacionadas por translação temporal: out p1p 2 p Ap B in = lim T p1p 2 p Ap B T →∞ −T = lim p1p 2 e− iH ( 2T ) p Ap B . T →∞ Na última expressão, os estados estão definidos em algum tempo comum de referência, e, portanto, os estados in e out estão relacionados pelo limite de uma sequência de operadores unitários. Este operador unitário no limite é chamado de matriz S : p1p 2 p Ap B out in ≡ p1p 2 S p Ap B . Os elementos da matriz S são identificados como M na expressão ( S = I + iTs ) out p1p 2 p Ap B = ( 2π ) δ ( 4 in 4) (p A + pB − ∑ p f ) ⋅ iM ( p A , pB → p f ) . 243 Também sabemos que a transformada de Fourier da função de correlação de dois pontos, considerada como uma função analítica de p 2 , possui um polo simples na massa do estado de uma partícula ( Z é o fator de renormalização de intensidade de campo, que dá a probabilidade de φ ( 0 ) criar um estado a partir do vácuo 0 ): ∫d 4 xeip⋅x 0 T φ ( x ) φ ( 0 ) 0 → p 2 → m2 iZ . p − m 2 + iε 2 Pode-se generalizar este resultado para funções de correlação de ordem mais alta, através de uma relação geral existente entre funções de correlação e elementos da matriz S , conhecida como a fórmula de redução LSZ (H. Lehmann, K. Symanzik, e W. Zimmermann, Nuovo Cimento 1, 1425 (1955)) VIII.4.1. LSZ a Temperatura Zero Uma das maneiras de obtermos o resultado desejado é através da linha de raciocínio apresentada a seguir. Para calcular o elemento da matriz S para um processo de espalhamento do tipo 2-partículas n -partículas, iniciamos com a função de correlação correspondente a n + 2 campos de Heisenberg. Calculando a transformada de Fourier com respeito às coordenadas de qualquer um dos campos, encontraremos um polo como o descrito acima, na variável p 2 da transformada. Vamos afirmar que os estados de uma partícula associados com esses pólos são na verdade estados assintóticos, isto é, estados formados no limite de pacotes de onda bem afastados, quando se tornam concentrados no entorno de momentos definidos. Tomando o limite no qual todas as n + 2 partículas se tornam on-shell, então podemos interpretar o coeficiente do polo múltiplo como sendo um elemento da matriz S . Para dar início à análise, vamos achar a transformada de Fourier da função de correlação n + 2 em relação a um argumento x : ∫d 4 xeip⋅ x 0 T {φ ( x ) φ ( z1 ) φ ( z2 )} 0 . Para acharmos os pólos da variável p 0 , vamos dividir a integral sobre x 0 em três regiões, I , II e III : ∞ T+ 0 0 0 ∫ dx = ∫ dx + ∫ dx + T+ T− T− ∫ dx 0 , −∞ onde T+ é muito maior do que todos os zi0 , e T− é muito menor do que todos os zi0 . Uma vez que a região do centro, II , é limitada, e o integrando depende de p 0 através da função analítica exp ( ip 0 x 0 ) , a contribuição dessa região será analítica em p 0 . 244 Entretanto, as regiões I e II , que não são limitadas, podem desenvolver singularidades em p 0 . Consideremos primeiramente a região I . Nesta, x 0 é o tempo mais recente, logo, φ ( x ) aparece primeiro na ordenação temporal. Façamos Eq ( λ ) ≡ q + mλ2 , 2 onde mλ é a energia de repouso do estado λ0 com momento zero, e os estados λq com momento q são relativisticamente normalizados e geram todo o espaço de Hilbert. Podemos usar então a seguinte relação de completeza e inseri-la na integral: I = ∑∫ λ d 3q ( 2π ) 1 3 2 Eq ( λ ) λq λq . A integral sobre a região I será escrita então como ∞ 0 3 ip x − ip .x ∫ dx ∫ d xe e ∑ ∫ 0 0 λ T+ d 3q ( 2π ) 0 φ ( x ) λq λq T {φ ( z1 ) φ ( z2 )} 0 . 1 3 2 Eq ( λ ) Mas temos que 0 φ ( x ) λq = 0 eip⋅xφ ( 0 ) e− ip⋅ x λq = 0 φ ( 0 ) λq e− ip⋅ x q 0 = Eq = 0 φ ( 0 ) λ0 e− ip⋅ x q 0 = Eq ( λ ) , e, depois de incluir, como de praxe, um fator de amortecimento exp ( −ε x 0 ) , para assegurar a convergência da integral, esta assume a forma ∞ ∑ ∫ dx 0 ∫ λ T+ d 3q ( 2π ) 1 3 2 Eq ( λ ) eip x e − iq x 0 φ ( 0 ) λ0 ( 2π ) δ ( 0 0 3 0 0 ( 3) ( p − q ) λq T {φ ( z1 ) φ ( z2 )} 0 ) i p 0 − E + iε T p + e =∑ 0 φ ( 0 ) λ0 λp T {φ ( z1 ) φ ( z2 )} 0 . 0 λ 2 Ep ( λ ) p − Ep ( λ ) + iε 1 O denominador é exatamente igual a p 2 − mλ2 , e existe uma singularidade analítica em p 0 , que poderá ser um polo ou um corte de ramificação, dependendo de ser a energia de repouso mλ um ponto isolado ou não. O estado de uma partícula corresponde a um valor isolado de energia p 0 = Ep = p + m2 , e neste ponto a expressão no somatório possui 2 um polo: ∫d 4 e o fator xeip⋅ x 0 T {φ ( x ) φ ( z1 )} 0 → p 0 →+ E p i p − m 2 + iε 2 Z p T {φ ( z1 )} 0 , Z é o fator de renormalização da intensidade de campo, já definido. 245 Para calcular a contribuição da região III , repetimos o mesmo procedimento, desta vez colocando φ ( x ) por último na ordenação temporal, novamente inserindo um conjunto completo de estados entre T {φ ( z1 )} e φ ( x ) , e encontraremos um polo em p 0 → − Ep : ∫d 4 xeip⋅ x 0 T {φ ( x ) φ ( z1 )} 0 → p 0 →− E p i p − m 2 + iε 2 Z 0 T {φ ( z1 )} −p . Agora temos que achar a transformada de Fourier referente às demais coordenadas de campo. Para evitar a interferência de várias partículas externas, precisamos isolá-las umas das outras, espacialmente. Vamos então repetir os mesmos cálculos, usando agora, em vez de uma simples transformada pontual, um pacote de ondas. Em outras palavras, vamos transformar cada coordenada pontual em uma “mancha” (smear) cujo suporte será dado por uma distribuição estreita ϕ ( k ) , centrada em k = p , e substituir o seguinte termo nos cálculos referentes à região I : ∫ d xe 4 ip0 x0 e − ip . x →∫ d 3k ( 2π ) 4 ip x − ik ⋅x ∫ d xe e ϕ ( k ) . 0 0 3 Essa distribuição restringe x a uma faixa, cuja extensão espacial é a mesma do pacote, em torno da trajetória de uma partícula com momento p . Após essa modificação, o somatório encontrado anteriormente apresentará uma estrutura de singularidade mais complicada: ∑λ ∫ d 3k ( 2π ) 3 ϕ (k ) i 2 Ek ( λ ) p − Ek ( λ ) + iε →∫ p 0 →+ E p 1 0 d 3k ( 2π ) 3 ϕ (k ) 0 φ ( 0 ) λ0 λk T {φ ( z1 ) φ ( z2 )} 0 i p − m2 + iε 2 Z k T {φ ( z1 ) φ ( z2 )} 0 , onde, na segunda linha, p = ( p 0 , k ) . A singularidade que havia no caso de uma partícula pontual agora se transformou num corte de ramificação, cujo comprimento é a largura, no espaço dos momentos, do pacote de ondas ϕ ( k ) . Contudo, se ϕ ( k ) define o momento estreitamente, o corte de ramificação é muito curto, e a expressão acima tem 3 um limite bem-definido, no qual ϕ ( k ) tende a ( 2π ) δ ( ) ( k − p ) , e a singularidade se 3 reduz ao polo anterior. A singularidade devida aos estados de uma partícula no passado remoto, correspondente à região III , é modificada da mesma maneira. Consideremos agora a integração sobre cada uma das coordenadas de uma função de correlação de ( n + 2 ) pontos no interior de um pacote de ondas, na forma 246 d 3k i p i ⋅x i 4 i d x e ϕ k ( ) ∏i ∫ ( 2π )3 ∫ i i i 0 T {φ ( x1 ) φ ( x2 ) } 0 . Os pacotes de onda são adequadamente escolhidos de tal forma que se superponham numa região em torno de x = 0 e se separem no passado e futuro remotos. Para estudar essa integral, vamos escolher um tempo T+ , grande e positivo, tal que todos os pacotes estejam bem separados para xi0 > T+ , e outro tempo T− , negativo e de módulo grande, tal que todos os pacotes estejam bem separados para xi0 < T− . Desta maneira, podemos novamente separar a integral em três regiões distintas, como anteriormente. A integral sobre qualquer xi0 pertencente à região limitada II conduz a uma expressão analítica em relação à energia correspondente p0i , logo, podemos nos concentrar nos casos em que todos os xi0 ocorrem no passado e no futuro, ambos remotos. Consideremos inicialmente a contribuição em que somente duas das coordenadas, x10 e x20 , estão no futuro remoto. Neste caso, os campos φ ( x1 ) e φ ( x2 ) se dispõem à esquerda dos outros campos, na ordenação temporal. Inserindo um conjunto completo de estados λk , as integrações sobre as coordenadas desses dois campos terão a forma ∑λ ∫ d 3K ( 2π ) 3 1 2 EK d 3 ki ip i ⋅ x i 4 d x e ϕ k λK T {φ ( x3 )} 0 ∏ ∫ ( ) i i 0 T {φ ( x1 ) φ ( x2 )} λK i =1,2 ( 2π )3 ∫ O estado λK será destruído por dois operadores de campo restritos a pacotes de onda distantes, e, portanto, deve consistir em apenas duas excitações distintas do vácuo, com duas localizações distintas. Se essas excitações estão bem separadas, devem ser independentes entre si, e podemos fazer a aproximação ∑λ ∫ = ∑∫ λ1 , λ2 d 3q1 ( 2π ) 3 d 3K ( 2π ) 3 1 0 T {φ ( x1 ) φ ( x2 )} λK λK 2 EK 1 d 3q2 1 0 φ ( x1 ) λq1 2 Eq1 ( 2π )3 2 Eq1 λq 0 φ ( x2 ) λq 1 2 λq , λq . 1 2 As somas sobre λ1 e λ2 nesta equação abrangem todos os estados com momento zero, mas somente estados de uma partícula contribuirão para os pólos que estamos buscando. Neste caso, as integrais sobre x10 ( x20 ) e q1 ( q 2 ) produzem uma singularidade concentrada em p10 ( p20 ). O termo na integral que expressa ambas as singularidades é dado por 247 d 3 q1 i Z ϕ k ⋅ ∏ ∫ k1k 2 T {φ ( x3 )} 0 . ( ) i =1,2 ( 2π )3 i i p i2 − m 2 + iε No limite em que o pacote de ondas tende para as funções delta concentradas nos momentos definidos p1 e p 2 , esta expressão tenderá para i ⋅ Z out p1p 2 T {φ ( x3 )} 0 . ∏ 2 2 i =1,2 pi − m + iε O estado p1p 2 é precisamente um estado out, uma vez que é o limite com momento definido de um estado de partículas restritas a pacotes de onda bem separados. Aplicando a mesma análise aos tempos xi0 no passado remoto, chegaremos ao resultado de que o coeficiente do termo maximamente singular no momento correspondente pi0 é um elemento de matriz no estado in. Este termo terá então a forma i i ⋅ Z ∏ 2 ⋅ Z out p1p 2 −p3 in . ∏ 2 2 2 i =1,2 pi − m + iε i =3,… p i − m + iε O último fator nada mais é do que um elemento da matriz de espalhamento S . Foi mostrado aqui então como podemos obter o valor de um elemento da matriz S , construindo envoltórios de pacotes de ondas para cada um dos VEV dos campos correspondentes, extraindo as singularidades principais nas energias pi0 , e tomando o limite quando esses pacotes se tornam funções delta dos momentos. Entretanto, o cálculo pode ser muito simplificado se essas operações forem feitas na ordem inversa – fazendo em primeiro lugar com que os pacotes de onda se tornem funções delta, retornando à transformada de Fourier correspondente, e só então extraindo as singularidades. E, de fato, o resultado da singularidade principal não é afetado por essa inversão de ordem nas operações. Por outro lado, a justificativa matemática deste procedimento não é trivial, mas pode ser exposta, resumidamente, assim: na terminologia usada até aqui, novas singularidades poderiam surgir porque, na transformada de Fourier, x1 e x2 se aproximariam novamente no futuro remoto. Porém, nessa região, o fator exponencial é próximo de exp i ( p1 + p2 ) ⋅ x1 , e, logo, as novas singularidades vão ser pólos simples na variável ( p10 + p20 ) , ao invés de produtos de pólos nas duas variáveis separadas de energia. Um argumento mais rigoroso pode ser encontrado no artigo original já citado no final da seção anterior. Devido a essa possibilidade de fazer a inversão de operações descrita, podemos obter uma relação precisa entre as transformadas de Fourier de funções de correlação e elementos da matriz S . Essa relação é a fórmula de redução LSZ: 248 n m i =1 j =1 ∏ ∫ d 4 xi eipi ⋅xi ∏ d 4 y j e − ik j ⋅ y j 0 T {φ ( x1 )φ ( xn ) φ ( y1 )φ ( ym )} 0 m i Z ∏ 2 2 j =1 k j − m + iε n i Z → 0 ∏ 2 2 cada pi →+ E p i =1 pi − m + iε cada k 0i →+ Ek p1 p n S k 1 k m . A quantidade Z que aparece nesta fórmula é a mesma constante de renormalização de intensidade de campo, já introduzida anteriormente, e aqui definida como o resíduo do polo de uma partícula para a função de dois pontos de um campo. Cada partícula de per si terá um fator de renormalização Z próprio, obtido de sua própria função de dois pontos. Para campos com spin, cada fator de de polarização, como, por exemplo, u s Z deverá ser acompanhado de um fator ( p ) , que deverá ser somado dentro da fórmula que multiplica o elemento de matriz S . Resumindo, a fórmula LSZ diz que um elemento de matriz S pode ser calculado seguindo os seguintes passos: a) calcular a transformada de Fourier da função de correlação apropriada; b) identificar o coeficiente do polo multipartícula na região do espaço dos momentos em que as partículas externas estão próximas se tornarem onshell; c) para campos com spin, deve-se, além disso, multiplicar cada estado por um espinor u s ( p ) , ou vetor ∈r ( k ) , de polarização, para fazer a projeção do estado de spin desejado. VIII.4.2. LSZ a Temperatura Finita A fórmula LSZ pode ser escrita, alternativamente, como ( ) Sψ ( x ) =: T ψ ( x ) exp −i ∫ d 4ξ {ϕ 0 (ξ ) φ (ξ ) + φ ( ξ ) ϕ 0 (ξ )} :, c onde a notação indica o VEV do produto, ordenado no tempo, dos campos de Heisenberg ψ , φ e φ , a notação de produto normal : : indica os produtos normais (produtos de campos em cujas expansões os operadores de destruição se colocam sempre à direita dos operadores de criação) dos campos físicos livres ϕ 0 e ϕ 0 , e o subscrito c indica que a expressão envolve apenas funções de Green associadas a diagramas 1PI. No caso bosônico, podemos escrever ϕ 0 como ϕ0 ( x) = 1 d k u ( k , x ) α ( k ) + u ( k , x ) α ( k ) , ( 2π ) ∫ 3 ∗ † 32 249 onde u ( k , x ) = u ( k ) exp ik ⋅ x − iω ( k ) t . A extensão da fórmula LSZ para temperatura finita resulta da simples substituição da densidade lagrangiana a temperatura zero pela densidade lagrangiana a temperatura finita, definida no espaço produto ψ ⊗ ψ : { ( ( ) ( ))} c { ( ( ) ( ))} c Sψ ( x, β ) =: T ψ ( x, β ) exp −i ∫ d 4ξ Lϕ0 ξ , ξ − Lϕ0 ξ , ξ Sψ ( x, β ) =: T ψ ( x, β ) exp −i ∫ d 4ξ Lϕ0 ξ , ξ − Lϕ0 ξ , ξ : :, onde ( ( ( ) ( S =: T exp −i ∫ d 4ξ Lϕ0 ξ , ξ − Lϕ0 ξ , ξ ) ) ) :. c IX.1. Campo escalar com massa na teoria TFD em dimensões 1+1 Os campos térmicos escalares livres são dados em duas dimensões (1+1) por ( p0 = (p ) 1 2 + m 2 ): Σ ( x; β ) = U −1 (θ ( β ) ) Σ ( x ) U (θ ( β ) ) = ∞ 1 2 π {e dp1 ∫ p −∞ +e 0 ip µ xµ − ip µ xµ a ( p1 ) cosh θ ( p 0 , β ) − a † ( p1 ) senh ( p 0 , β ) } a † ( p1 ) cosh θ ( p 0 , β ) − a ( p1 ) senh ( p 0 , β ) ; Σ ( x; β ) = U −1 (θ ( β ) ) Σ ( x ) U (θ ( β ) ) = ∞ 1 2 π ∫ −∞ +e dp1 p − ip µ xµ 0 {e ip µ xµ a ( p1 ) cosh θ ( p 0 , β ) − a† ( p1 ) senh ( p 0 , β ) } a † ( p1 ) cosh θ ( p 0 , β ) − a ( p1 ) senh ( p 0 , β ) . As funções de dois pontos diagonal e não-diagonal são dadas, respectivamente, por ( p = p1 ): 250 0, 0 Σ ( x; β ) Σ ( y; β ) 0, 0 = 1 4π { p +m ∞ dp ∫ 2 0 e 2 − ip µ ( x − y )µ } cosh 2 θ ( p, β ) + senh 2 ( p 0 , β ) ; 0, 0 Σ ( x; β ) Σ ( y; β ) 0, 0 =− 1 4π { p +m ∞ dp ∫ 2 0 e 2 − ip µ ( x − y ) µ cosh θ ( p, β ) + e − ip µ ( x − y ) µ } senh ( p 0 , β ) cosh θ ( p, β ) . A função de dois pontos diagonal pode ser escrita como 0, 0 Σ ( x; β ) Σ ( y; β ) 0, 0 = ∆ (0 +) ( x; m ) + I ( x; m, β ) , onde ∆ (0 ) é a contribuição à temperatura zero ( Kν ( z ) é a função de Bessel modificada + de ordem ν ) ∆ (0 ) ( x; m ) = + ( ) 1 K0 m − x2 , 2π e a contribuição a temperatura finita é dada por I ( x; m, β ) = 1 ∞ π∫ 0 dp p +m 2 2 ( ) cos x 0 p 2 + m2 cos ( px1 ) senh 2 (θ ( p, β ) ) . Escrevendo a distribuição estatística de Bose-Einstein como senh θ = 1 2 eβ p 2 + m2 1 − β2 = e −1 2 p 2 + m2 β csch 2 ∞ p 2 + m 2 = ∑ e − nβ n=1 p 2 + m2 resulta que I ( x; m, β ) = 1 2π ∞ ∞ ∑∫ n =1 0 −( nβ −ix0 ) cos ( px1 ) e p 2 + m2 dp p2 + m2 +e ( − n β −ix 0 ) p 2 + m2 . Introduzindo a notação x ± = x 0 ± x1 , obtemos a forma de I ( x; m, β ) em termos de uma série de funções modificadas de Bessel: I ( x; m, β ) = 1 2π ∑ {K ∞ n =1 0 (m ) ( )} − ( x + + inβ )( x − + inβ ) + K 0 m − ( x + − inβ )( x − − inβ ) . 251 IX.2. Número médio (no ensemble) de partículas com massa em 1+1 dimensões Para o número médio zΣ ( β m ) , no ensemble, de partículas com massa, temos que zΣ ( β m ) = I ( 0; β m ) = 1 π ∞ ∑ K ( nβ m ) . 0 n =1 Usando que π ∞ 1 x ∑ K ( kx ) cos ( kxt ) = 2 γ + ln 4π + k =1 0 2x 1+ t 2 1 1 π ∞ 1 1 + ∑ − − + ∑ 2 t =1 x 2 + ( 2π − tx )2 2π 2 t =1 x 2 + ( 2π + tx ) 2 2π π ∞ obtemos finalmente que zΣ ( β m ) = 1 π ∞ ∫ 0 dp 1 p 2 + m2 eβ p 2 + m2 ∞ 1 meγ β 1 = ln + ∑ + 2π 4π 2β m t =1 −1 = 1 π ∞ ∑ K ( kβ m) k =1 0 1 ( β m ) + ( 2 π ) 2 2 1 − , 2 π que, para altas temperaturas, apresenta como termos mais significativos zΣ ( β m ) → T 0 1 meγ β ln 2π 4π 1 . + 2β m 252 Lista de exercícios do Módulo B Prof. Armando F. Rodrigues - 24/11/09 Ex. B-1. - Mostre que a expressão do propagador térmico para a teoria de Klein-Gordon iGβ ( k ) = B ( −θ ) iG ( k ) BT ( −θ ) pode ser escrita como 1 k 2 − m 2 + iε Gβ ( k ) = 0 1 − 2iπ nB k 0 δ ( k 2 − m 2 ) 0 βk 1 − 2 e k − m2 − iε 0 ( ) e 2 β k0 2 1 Ex. B-2. - A partir das definições dp 0 − ip0 ( t −t ′) e I AB ( p 0 ) −∞ 2π 0, β A ( t ) B ( t ′ ) 0, β = ∫ ∞ iRAB ( t − t ′ ) = θ ( t − t ′ ) 0, β A ( t ) B ( t ′) ∓ 0, β - (-) para bósons, (+) para férmions dp 0 − ip0 ( t −t ′) RAB ( t − t ′ ) = ∫ e RAB ( p 0 ) −∞ 2π ∞ iG AB ( t − t ′ ) = 0, β T A ( t ) B ( t ′ ) 0, β dp 0 − ip0 (t −t ′) e G AB ( p 0 ) −∞ 2π G AB ( t − t ′ ) = ∫ ∞ T A ( t ) B ( t ′ ) = θ ( t − t ′ ) A ( t ) B ( t ′ ) ± θ ( t ′ − t ) B ( t ′ ) A ( t ) - (+) para bósons, (-) para férmions dp 0 e ( ) θ (t − t′) = ∫ −∞ 2iπ p 0 − iε ∞ ip 0 t − t ′ e usando a condição KMS, calcule as funções térmicas de correlação entre dois operadores arbitrários (ambos bosônicos ou ambos fermiônicos) A(t) e B(t). 253 Ex. B-3. - Mostre que a integral da auto-energia parcial do gás degenerado de elétrons i d 3k ∞ 0 I1 = − ∫ dk 2 ( 2π ) 4 ∫0 1 1 × 0 ⋅ k + p 0 − ω + µ + iε k 0 − ω + µ + iε k +p k 1 1 − 0 ⋅ 0 0 k + p − ω + µ − iε k − ω + µ − iε k +p k 1 1 ⋅ 0 − 0 0 k − p + ωk +p − µ − iε k + ωk − µ − iε 1 1 ⋅ 0 + 0 0 k − p + ωk +p − µ + iε k + ωk − µ + iε } + ( pµ → − pµ ) resulta em I1 = − 1 d 3k 1 sgn (ωk − µ ) − sgn (ωk + p − p 0 − µ ) + ( p µ → − p µ ) 3 0 ∫ 2 ( 2π ) p + ωk − ωk + p ( ) se for aplicada a fórmula de combinação de produto de Feynman 1 1 1 dx =∫ 2 0 A + iαε B + i βε x ( A + iαε ) + (1 − x )( B + i βε ) ============================================================== 254 X. Referências Em vista do grande número de fontes pesquisadas para a elaboração do presente trabalho, serão indicadas as principais referências organizadas por grandes tópicos, complementares àquelas já explicitamente citadas no corpo do texto. X.1. Origens do Cálculo Integral Dirk J. Struik, “A Concise History of Mathematics”, 2 vol., ed. Dover, 1948 X.2. Processo de Wiener (Movimento Browniano) Lawrence S. Schulman, “Techniques and Applications of Path Integration”, ed. John Wiley, 1981 Norbert Wiener, “The Homogeneous Chaos”, 1938; “Generalized Harmonic Analysis”, 1930 Aubrey Truman, “Feynman Maps and the Wiener Integral”, J. Math. Phys. 19(8), 17421750 X.3. Teoria da Medida Vladimir I. Bogachev, “Measure Theory”, ed. Springer, 2006 Donald L. Cohn, “Measure Theory”, ed. Birkhäuser, 1980 Paul Richard Halmos, “Measure Theory”, ed. Springer, 1974 Edwin Hewitt e Kenneth A. Ross, “Abstract Harmonic Analysis”, 2v.,2ª ed., Springer, 1979 Lars Hörmander, “The Analysis of Linear Partial Differential Operators, v.1 – Distribution Theory and Fourier Analysis, 2ª ed. Springer, 1990 Heinz König, “Measure and Integration”, ed. Springer, 2009 Michael Reed e Barry Simon, “Methods of Modern Mathematical Physics”, 4 v., ed. Academic Press, 1980 Laurent Schwartz, “Théorie des Distributions”, ed. Hermann Paris, 1998 Robert G. Bartle, “The Elements of Integration and Wiley_Interscience, 1995 Lebesgue Measure”, ed. Michael Creutz, “Quarks, Gluons and Lattices”, cap. 8, ed. Cambridge UP, 1983 255 X.4. Teoria da Integração e Cálculo de Feynman Richard Phillips Feynman e Albert R. Hibbs, “Quantum Mechanics and Path Integrals”, ed. McGraw-Hill, 1965 Paul Adrian Maurice Dirac, Proc. Roy. Soc. London. A, 114, 243 (1927) Lawrence S. Schulman, “Techniques and Applications of Path Integration”, ed. John Wiley, 1981 James Glimm e Arthur Jaffe, “Quantum Mechanics – A Functional Integral Point of View”, 2ª ed. Springer, 1987 Michael L. Lapidus e G. W. Johnson, “The Feynman Integral and Feynman’s Operational Calculus”, Oxford Mathematical Monographs, 2000 Cécile DeWitt-Morette e Paul Cartier, “Functional Integration: Action and Symmetries”, Cambridge, 2007 Ashok Das, “Field Theory: A Path Integral Approach”, ed. World Scientific, 2006 Pierre Ramond, “Field Theory: A Modern Primer”, 2ª ed. Perseus Books, 2001 Mark Sredinicki, “Quantum Field Theory”, ed. Cambridge UP, 2007 Michael Edward Peskin e Daniel V. Schroeder, “An Introduction to Quantum Field Theory”, ed. Perseus Books, 1995 Taizo Muta, “Foundations of Quantum Chromodynamics”, ed. World Scientific, 2009 Ramamurti Shankar, “Principles of Quantum Mechanics”, 2ª ed. Springer, 1994 X.5. Teorias de Campos a Temperaturas Finitas Ashok Das, “Finite Temperature Field Theory”, ed. World Scientific, 1997 Joseph L. Kapusta e Charles Gale, “Finite-Temperature Field Theory Principles and Applications”, ed. Cambridge UP, 2006 Hiroomi Umezawa, H. Matsumoto e M. Tachiki, “Thermo Field Dynamics and Condensed States”, ed. North-Holland, Amsterdam, 1982 Michel Le Bellac, “Thermal Field Theory”, ed. Cambridge UP, 1996 Edward V. Shuryak, “The QCD Vacuum, Hadrons and Superdense Matter”, ed. World Scientific, 2004 Kohsuke Yagi, Tetsuo Hatsuda e Yasuo Miake, “Quark-Gluon Plasma”, ed. Cambrige UP, 2008 256