Acevedosanchez Oa DR Ift

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 252

TESE DE DOUTORAMENTO IFT–T.

003/22

Teoria de perturbação causal no plano nulo

Oscar Adán Acevedo Sánchez

Orientador

Prof. Dr. Bruto Max Pimentel Escobar

Julho de 2022
Acevedo Sánchez, Oscar Adán.
A174t Teoria de perturbação causal no plano nulo / Oscar Adán Acevedo
Sánchez. – São Paulo, 2022
244 f.

Tese (doutorado) – Universidade Estadual Paulista (Unesp), Instituto de


Física Teórica (IFT), São Paulo
Orientador: Bruto Max Pimentel Escobar

1. Teoria quântica de campos. 2. Causalidade (Física). 3. Campos de


calibre (Física). I. Título

Sistema de geração automática de fichas catalográficas da Unesp. Biblioteca


do Instituto de Física Teórica (IFT), São Paulo. Dados fornecidos pelo
autor(a).
Agradecimentos

«Gratidão», do latim gratitūdo, é o «sentimento que obriga uma pessoa a estimar o benefício
ou favor que outra lhe tem feito ou tem querido fazer, e a lhe corresponder de alguma maneira».
Há, como não?, muitas pessoas por quem sinto gratidão. Esta pagina tem a missão –é claro que
incumprível– de lhes «corresponder de alguma maneira».
As primeiras dessas pessoas se encontram em minha família. Meus pais, Diego e Erika, que
orientaram minha vida para o bem, me inculcaram a disciplina ademais de valores cruciais como
a responsabilidade e o respeito, e me apoiaram sempre. Jamais poderei lhes agradecer o suficiente.
Meu irmão, Diego, e a bela família que começou formar durante este tempo. Meu avô, Alberto, que
partiu no decorrer destes meus estudos.
Gostaria de agradecer muito especialmente a meu orientador, o professor Dr. Bruto Pimentel,
quem me deu a oportunidade de fazer pesquisa, me ensinou bastante de física, e se tornou um muito
apreciado amigo.
Estes anos, sem dúvida, não teriam sido tão felizes e inspirados sem a presença de quem agora é
minha amada esposa, Evelyn, cuja luz, paciência e carinho foram essenciais para meu crescimento
espiritual.
Ainda desejo fazer menção a essas pessoas que, sem conhecê-las pessoalmente, tiveram um
grande impacto em minha vida. Entre eles se destacam Aristocles, chamado Platão, Leibniz e
Kierkegaard. Muito obrigado por falar conosco, através dos séculos, por meio de suas grandes obras.
Finalmente, agradeço ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
e à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) pelo financiamento, e ao
Instituto de Física Teórica pelo acolhimento.

i
«Fazer contabilidade com uma grandeza infinita é impossível,
pois calcular é exatamente tornar finito.»

Søren Aabye Kierkegaard, «As obras do amor»

ii
Resumo

A teoria do campo quantizado na dinâmica do plano nulo é uma ferramenta amplamente


usada na física hadrônica por permitir a aplicação de técnicas e aproximações cuja imple-
mentação prática na dinâmica instantânea é inviável. Contudo, ela não está isenta de dificul-
dades: Questões relativas à regularização e renormalização das amplitudes que envolvem os
termos instantâneos que aparecem tipicamente nesta forma dinâmica permanecem sem res-
posta definitiva, o que se manifesta já no regime perturbativo. A tese que agora se submete à
consideração visa esclarecer estes pontos a partir da perspectiva da teoria de perturbação
causal. Essa é uma teoria para a construção perturbativa do operador de espalhamento, en-
tendido como um mapa no espaço de Fock dos estados assintoticamente livres e que, por
isso, utiliza somente os bem definidos campos livres. Ela foi originalmente formulada na
dinâmica instantânea e se assenta sobre a teoria das distribuições, devido ao qual os resulta-
dos a que leva são todos finitos, livres das divergências ultra-violetas, não requerendo, por
isto, processos de regularização.
Nesta tese, a teoria de perturbação causal é formulada na dinâmica da frente de luz, tendo
em mente os pontos acima referidos e permitindo, como outrora na dinâmica instantânea,
resolver as ambiguidades decorrentes da multiplicidade dos procedimentos de regularização,
frequentemente apontadas na literatura do plano nulo. A teoria assim obtida é aplicada
ao modelo de Yukawa e, após um estudo ao redor da implementação da invariância de
gauge quântica, à eletrodinâmica fermiônica. Estudamos estes modelos à segunda ordem
na constante de acoplamento, estabelecendo suas densidades lagrangianas de interação e
calculando as correções radiativas; provamos, também, a normalizabilidade do operador de
espalhamento físico que lhes corresponde. Por último, no caso da eletrodinâmica provamos
que é possível satisfazer às identidades de Ward-Takahashi em todas as ordens da série
perturbativa.

Palavras Chaves: Teoria quântica do campo; Teoria de perturbação causal; Dinâmica da


frente de luz.

Áreas do conhecimento: Física; Teoria quântica do campo.

iii
Abstract

The theory of quantized fields on the null-plane is a commonly used tool for the study of
hadron physics, as it allows the application of techniques and approximations whose usage in
instant dynamics is almost impracticable. Nonetheless, it is not free of difficulties: Questions
about the regularization and renormalization of the amplitudes involving the instantaneous
terms that typically appear in this dynamical form stay without a definitive answer, which is
already manifest at the perturbative regime. The thesis now being submitted to consideration
intends to shed light on these points from the perspective of causal perturbation theory. It is
a perturbation theory for the construction of the scattering operator, understood as a map
between Fock’s spaces of the asymptotically free states, and which, as a consequence, uses
the well-defined free fields only. It was originally formulated in instant form dynamics and
rests on distribution theory, because of which it leads to finite results free of ultra-violet
divergences, requiring no regularization procedure.
In this thesis, causal perturbation theory is formulated in light-front dynamics, keeping
in mind the above points and allowing, as erstwhile in instant dynamics, to clarify the
ambiguities that come from the diversity of regularization procedures, frequently pointed out
in the null-plane literature. The theory so obtained is applied to Yukawa’s model and, after a
study around the implementation of quantum gauge invariance, to the fermion quantum
electrodynamics. We study these models at the second order in the coupling constant,
establishing their interaction Lagrangian densities and calculating their radiative corrections;
we also prove the normalizability of their corresponding physical scattering operators. At
last, for the electrodynamics we show that it is possible to satisfy Ward-Takahashi’s identities
at all orders of perturbation theory.

Key-words: Quantum field theory; Causal perturbation theory; Light-front dynamics.

Areas of knowledge: Physics; Quantum field theory.

iv
Índice

1 Introdução 1
1.1 Forma dinâmica da frente de luz (do plano nulo) . . . . . . . . . . . . . . . . . 1
1.2 Teoria de perturbação causal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Dinâmica da frente de luz na teoria clássica 9


2.1 Problema dos valores iniciais para a equação de Klein-Gordon-Fock . . . . . . 9
2.2 Formas dinâmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3 «Coordinalização» invariante no plano nulo . . . . . . . . . . . . . . . . . . . . 25
2.4 Teoria lagrangiana do campo clássico no plano nulo . . . . . . . . . . . . . . . 28
2.5 Campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6 Campo de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.7 Campo eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3 Quantização do campo no plano nulo 45


3.1 Espaço de Fock dos estados quânticos e definição do campo quantizado . . . 45
3.2 Quantização do campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3 Quantização do campo de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.4 Quantização do campo vetorial sem massa . . . . . . . . . . . . . . . . . . . . 72

4 Teoria de perturbação causal no plano nulo 75


4.1 Axiomas de Bogoliubov, Medvedev e Polivanov . . . . . . . . . . . . . . . . . 76
4.2 Teoria perturbativa do operador de espalhamento . . . . . . . . . . . . . . . . 79
4.3 Construção indutiva das distribuições de transição . . . . . . . . . . . . . . . . 83
4.4 Teoremas de causalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.5 Divisão da distribuição causal no espaço real . . . . . . . . . . . . . . . . . . . 94
4.6 Divisão da distribuição causal no espaço dos momentos . . . . . . . . . . . . . 102
4.7 Normalização das soluções ao problema da divisão . . . . . . . . . . . . . . . 108
4.8 Unitariedade do operador de espalhamento . . . . . . . . . . . . . . . . . . . . 112
4.9 Fatorização de polinômios na distribuição causal . . . . . . . . . . . . . . . . . 114
4.10 Propagadores de Feynman dos campos quantizados livres . . . . . . . . . . . 117

5 Modelo de Yukawa 122


5.1 Distribuição causal da segunda ordem . . . . . . . . . . . . . . . . . . . . . . . 124
5.2 Espalhamento de um férmion por um bóson . . . . . . . . . . . . . . . . . . . 126
5.3 Auto-energia do méson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.4 Auto-energia do núcleon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.5 Normalizabilidade e termos de auto-interação . . . . . . . . . . . . . . . . . . 143

v
6 Invariância de gauge quântica para campos de gauge sem massa 149
6.1 Extensão do espaço de Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
6.2 Prova da invariância de Poincaré do subespaço físico . . . . . . . . . . . . . . 152
6.3 Pseudo-unitariedade da transformação de Poincaré
no espaço de Fock estendido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
6.4 Definição da transformação de gauge quântica . . . . . . . . . . . . . . . . . . 159
6.5 Invariância de gauge quântica do operador de espalhamento . . . . . . . . . . 166
6.6 Unitariedade do operador de espalhamento no subespaço físico . . . . . . . . 173

7 Eletrodinâmica quântica fermiônica 175


7.1 Construção do primeiro termo pela invariância de gauge quântica . . . . . . . 175
7.2 Distribuição causal da segunda ordem . . . . . . . . . . . . . . . . . . . . . . . 179
7.3 Processos de espalhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
7.4 Polarização do vácuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
7.5 Auto-energia do férmion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
7.6 Interação luz-luz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7.7 Normalizabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
7.8 Identidades de Ward-Takahashi . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

8 Epílogo 211

A Definição algébrica das formas dinâmicas 218

B Matrizes de Dirac no plano nulo 228

C Causalidade e valores limite de funções analíticas 229

Referências 232

vi
Capítulo 1

Introdução

A teoria quântica do campo –doravante QFT por suas siglas em inglês– é uma das teo-
rias mais precisas já criadas para a descrição dos fenômenos que têm lugar nas microescalas:
Desde seu início, os cientistas descrevem com ela o espalhamento das partículas fundamen-
tais como das compostas, calculam a razão giromagnética dos léptons, reproduzem os desdo-
bramentos no espectro de energia do átomo, et cetera. Muitos desses problemas são soluciona-
dos com o uso da denominada «forma instantânea» da QFT, na qual o parâmetro de evolução
dinâmica é a coordenada x0 . Alguns outros, como o estudo do laser e da estrutura interna dos
hádrons, têm se mostrado mais simples na chamada «forma da frente de luz» ou do «plano
nulo», na qual o parâmetro de evolução é a coordenada x + ∼ x0 + x3 . Por outro lado, a for-
mulação mais conhecida e utilizada da QFT, aquela devida a Tomonaga, Schwinger, Feynman
e Dyson, entre outros, exibe divergências ultra-violetas nas amplitudes correspondentes aos
diagramas em que estão presentes loops; embora essas divergências possam ser removidas
com o uso das técnicas de regularização e de renormalização, resulta insatisfatório desenvol-
ver uma teoria que está mal definida desde o início, e que, por isso, leva ao aparecimento de
determinadas ambiguidades. Uma alternativa a essa formulação é a «teoria de perturbação
causal» –doravante TPC–, cuja forma quase-final na dinâmica instantânea é devida a Epstein
e Glaser. A tese que agora iniciamos tem como primeiríssimo objetivo reformular essa teoria
axiomática do operador de espalhamento na dinâmica do plano nulo. Com o intuito de sali-
entar a importância de semelhante tarefa, oferecemos nesta Introdução um breve resumo da
história e do trabalho que tem sido desenvolvido, tanto na QFT no plano nulo quanto na TPC.

1.1 Forma dinâmica da frente de luz (do plano nulo)


No ano 1949, Dirac [1] começou o estudo das possíveis formas dinâmicas compatíveis
com a teoria da relatividade [2, 3, 4] no contexto da formulação hamiltoniana –vide também
as Refs. [5, 6]–. Ele encontrou três possibilidades: (a) Forma instantânea: aquela em que as
superfícies isocrônicas são as superfícies com valor constante da variável x0 ; (b) forma-ponto:
com superfícies isocrônicas os ramos superiores dos hiperbolóides a2 = x2 , com o tempo
definido pelo parâmetro a2 ; (c) forma da frente de luz: as superfícies isocrônicas são planos
nulos de valor constante da coordenada x + . Além delas, em 1978 Leutwyler e Stern [7]
encontraram mais duas, com as seguintes superfícies isocrônicas: (d) os ramos superiores
dos hiperbolóides ( x0 )2 − ( x1 )2 − ( x2 )2 = a2 , e (e) os ramos superiores dos hiperbolóides
( x0 )2 − ( x3 )2 = a2 ; nos dois casos, o tempo é definido pelo valor de a2 . Estes autores
mostraram também, se apoiando na classificação dos subgrupos do grupo de Poincaré então

1
2 Capítulo 1. Introdução

recentemente feita [8, 9, 10, 11], que essas cinco formas dinâmicas são as únicas possíveis uma
vez que seja imposta a transitividade do grupo de estabilidade das superfícies isocrônicas1 ,
e nenhuma outra pode existir. Impera fazer notar que no limite newtoniano em que a
velocidade da luz adota o valor infinito, c → +∞, as cinco formas dinâmicas relativísticas
degeneram na dinâmica instantânea, motivo pelo qual o limite newtoniano não é motivo de
preferência da forma instantânea na teoria relativísitica: A finitude da velocidade da luz não
faz aparecer novas formas dinâmicas, mas levanta sua degenerescência.
É justo dizer que as cinco formas dinâmicas merecem atenção, pois é bem possível que
sejam adequadas para a resolução de determinados problemas específicos. Quanto à forma
do plano nulo, ela é especial: Dirac [1] mostrou que nela o número de geradores do grupo de
Poincaré independentes da interação é máximo; também, os planos nulos são as superfícies
características da equação de Klein-Gordon-Fock [12, 13]. Há ainda uma vantagem prática
na quantização do campo no plano nulo, que foi apontada por Brodsky, Pauli e Pinsky [14]:
Especificar a função de onda inicial de um átomo composto por n elétrons na dinâmica
instantânea requer a medição simultânea das posições de todos os elétrons; para determinar
tal função de onda inicial a tempo x + constante, por outro lado, requer-se apenas um
experimento de espalhamento de uma onda plana de laser. Quer dizer, a especificação
experimental das condições iniciais se simplifica na adoção da forma dinâmica do plano nulo.
Após o referido artigo de Dirac, muito pouco trabalho foi feito em relação às recém
descobertas formas dinâmicas. A dinâmica da frente de luz, nada obstante, re-apareceu
independentemente na física como uma ferramenta útil para o estudo de dois problemas.
Primeiro, em 1965 nos trabalhos de Fubini e Furlan [15] na área da álgebra de correntes, como
o limite de um sistema inercial de referência movendo-se com velocidade próxima à da luz;
eles chamaram tal referencial «sistema de referência de momento infinito»; nessa linha de
pesquisa se encontram, por exemplo, os trabalhos de Weinberg [16] e de Bebié e Leutwyler
[17]. Mais tarde, porém independentemente, a dinâmica do plano nulo se mostrou vantajosa
no estudo dos campos de laser em 1967 durante os estudos de doutorado de Neville sob
a orientação de Rohrlich –essa história é relatada nas Refs. [13, 18, 19]–. Como vemos, a
dinâmica do plano nulo, sem referência alguma ao trabalho de Dirac, renasceu na física
como uma ferramenta fenomenológica. Mas a relação com o estudo de Dirac não tardou em
ser reconhecido: Chang e Ma [20], em 1969, publicaram um artigo devotado ao estudo do
modelo com interação φ3 e ao da eletrodinâmica quântica –doravante QED por suas siglas
em inglês– nas novas variáveis da frente de luz. Além de mostrar que a utilização dessas
variáveis facilita o cálculo das auto-energias em segunda ordem e do momento magnético
do elétron, estabeleceram pela primeira vez, se bem que de forma um tanto imprecisa, a
relação entre o sistema de referência de momento infinito e a forma da frente de luz de Dirac.
Em 1970, também, Kogut e Soper [21] estabeleceram que o limite de momento infinito pode
ser reinterpretado como uma mudança de variáveis, identificando essa abordagem com a
quantização no plano nulo de Rohrlich e Neville. É interessante notar que Kogut e Soper, o

1 Isto é, que todo ponto da superfície possa ser mapeado em qualquer outro pela aplicação de algum elemento

do grupo de estabilidade.
Capítulo 1. Introdução 3

mesmo que muitos dos artigos que vieram à luz nos anos seguintes, não citaram o artigo
de Dirac, mas o de Chang e Ma, de forma que é bem possível que já estivessem cientes do
trabalho de Dirac. Concluindo, podemos dizer com justiça que a dinâmica do plano nulo foi
independentemente descoberta três vezes: Em 1949 por Dirac, em 1965 por Fubini e Furlan,
e em 1967 por Neville e Rohrlich, e que as diversas abordagens foram identificadas como
correspondentes a uma e a mesma teoria por Chang e Ma e por Kogut e Soper. Semelhante
situação não é incomum na história intelectual.
Com o renascimento do estudo das formas dinâmicas impulsionado pela física no plano
nulo e a correspondente re-descoberta das idéias de Dirac, advieram igualmente trabalhos de
pesquisa na forma dinâmica da forma-ponto –uma revisão relativamente recente pode ser en-
contrada na Ref. [22]–. Desde então o trabalho na forma dinâmica do plano nulo intensificou-
se. O problema dos valores iniciais sobre o plano nulo, para os campos escalar, de Dirac e
eletromagnético foi estudado por Rohrlich e Neville [13, 23], que estabeleceram teoremas de
existência e unicidade das soluções; em particular, para o campo eletromagnético introduzi-
ram a condição de gauge do plano nulo, A+ = 0, que então tornou-se a escolha natural nessa
forma dinâmica. Uma contribuição importante para a quantização do campo no plano nulo
foi dada por Leutwyler, Klauder e Streit [24]; entre os diversos resultados teóricos que estes
pesquisadores obtiveram, foi estabelecido de forma precisa o significado da independência
da massa nessa forma dinâmica: Dois espaços de Fock correspondentes a partículas com mas-
sas diferentes são unitariamente equivalentes. A propósito de equivalências, Ten Eyck e Rohr-
lich [25, 26], por um lado, e Chang, Root e Yan [27, 28, 29, 30] pelo outro, estudaram a equi-
valência entre a QFT no plano nulo e a QFT na forma instantânea comumente usada. Na Ref.
[31], Brodsky, Roskies e Suaya consideraram a renormalização da QED no plano nulo. Na
área fenomenológica, Drell, Levy e Yan [32, 33, 34, 35] usaram a QFT na frente de luz como a
linguagem natural para formular o modelo a pártons. Uma ferramenta importante para o cál-
culo das funções de onda e o espectro dos hádrons é a «quantização discreta no cone de luz»,
inventada por Maskawa e Yamawaki2 [39] e explorada na prática por Pauli e Brodsky [40, 41].
No regime não-perturbativo, um método muito relevante é a «abordagem hamiltoniana no
cone de luz» (light-cone Hamiltonian approach) [14], amplamente usado nos estudos da física ha-
drônica e que explora as propriedades únicas da dinâmica da frente de luz, as quais permitem
usar técnicas computacionais cuja implementação prática na dinâmica instantânea é inviável,
exempli gratia, basis light-front quantization [42, 43], a aproximação de Tamm-Dancoff [44], et
cetera. Um compêndio das importantes contribuições e perspectivas da cromodinâmica quân-
tica –doravante QCD por suas siglas em inglês– no plano nulo pode ser lido na Ref. [45].
Voltando à área teórica, a formulação das teorias de gauge não-abelianas no plano
nulo foi feita pela primeira vez por Tomboulis [46] na ausência de matéria, e por Casher
[47] na presença de férmions. Contudo, as amplitudes de Feynman a um loop exibiam

2 Estes autores introduziram a mencionada técnica para solucionar o assim chamado «problema dos modos

zero». Uma importante revisão do problema e sua solução mediante a discretização do momento encontra-se
na Ref. [36]. O problema, contudo, pode também ser solucionado na formulação contínua; quando o caráter
distribucional dos campos é levado em consideração, os modos zero podem ser removidos por simples restrição
do espaço das funções de teste [37, 38].
4 Capítulo 1. Introdução

singularidades de pólo duplo como consequência de um tratamento inconsistente dos pólos


do propagador do campo de gauge; este problema foi solucionado por Pimentel e Suzuki
[48], que propuseram uma prescrição de deslocamento dos pólos apoiada no princípio da
causalidade. Também, a estrutura de vínculos da teoria de gauge não-abeliana na forma
dinâmica da frente de luz, sob a condição de gauge do plano nulo, foi estudada por Pimentel,
Suzuki e Zambrano na Ref. [49].
Apesar dos resultados antes referidos, há ainda alguns aspectos da QFT no plano nulo
que esperam esclarecimento. Por exemplo, até agora a equivalência entre a QFT no plano
nulo e a convencional é assunto de discussão –exempli gratia, vide as Refs. [50, 51] a respeito
da QED–. Isto está relacionado ao ponto, também ainda obscuro, da importância e efeitos do
termo instantâneo do propagador do campo de Dirac e os do campo eletromagnético; o status
quo do propagador do campo de gauge é revisado nas Refs. [52, 53]. Ainda, o cumprimento
das identidades de Ward-Takahashi a um loop na QED no plano nulo é estudado na Ref.
[54]. Ocorre que esses assuntos têm sido abordados sempre desde a ótica da formulação
hamiltoniana da QFT –em particular, fazendo uso da assim chamada «teoria de perturbações
old-fashioned», como na Ref. [55]–, e algumas poucas vezes desde a abordagem funcional;
pretendemos dar respostas a estas questões a partir de uma nova perspectiva.

1.2 Teoria de perturbação causal

A história da QFT é bem conhecida. Ela foi inventada por Born e Jordan em 1925 [56] sob
o nome «eletrodinâmica matricial» no espírito da mecânica matricial de Heisenberg. Nesse
trabalho foi feita a quantização do campo eletromagnético como um conjunto de osciladores
desacoplados. Artigos muito importantes foram publicados naqueles anos, mostrando, além
de promissores resultados, os primeiros grandes problemas da teoria; por exemplo, em 1928
Jordan e Pauli [57] reconsideraram a quantização do campo eletromagnético, introduzindo a
agora chamada «distribuição de Jordan-Pauli», e colocando pela primeira vez o problema
da energia infinita do ponto zero. No mesmo ano, Jordan e Wigner [58] mostraram que
o princípio de exclusão de Pauli requer a quantização com anti-comutadores. Também, o
método geral de quantização canônica foi desenvolvido por Heinseberg e Pauli em 1929 [59].
Todos esses resultados –e muitos outros, concernentes, por exemplo, à teoria do campo de
Dirac e sua quantização, história que pode ser encontrada, por exemplo, na Ref. [60]– deram
origem às duas famosas contribuições de Pauli: Seu artigo de 1940 sobre a relação entre spin
e estatística [61] e sua excelente revisão, publicada em 1941, da quantização dos campos [62].
O seguinte tópico na história da QFT foi a construção da teoria em interação. A tentativa
mais difundida foi aquela devida a Tomonaga, Koba, Tati e Kanesawa [63, 64, 65, 66, 67], que
publicaram uma série de artigos entre 1946 e 1948, Schwinger [68, 69, 70] entre os anos 1948 e
1949, e Feynman [71] em 1949; a equivalência entre estes trabalhos foi provada por Dyson [72]
em 1949. Foi o mesmo Dyson, e no mesmo ano, o primeiro a regularizar as integrais da QED
e a renormalizar a teoria mediante a absorção dos infinitos nos termos de carga e massa [73].
Por esses anos, a noção de campo quantizado como um operador agindo sobre um es-
Capítulo 1. Introdução 5

paço de Hilbert estava sendo questionado. Especialmente importante é a contribuição de


Friedrichs em 1951 [74], que estabeleceu que os campos quantizados devem ser funcionais
lineares, definidos sobre funções de alguma classe a ser determinada, com a finalidade de
poderem ter uma representação espectral. Este autor já nomeia tais campos como «distribui-
ções», citando o trabalho de Schwartz, as primeiras edições das Refs. [75, 76], publicadas
nos anos 1950 a primeira parte e 1951 a segunda –embora Friedrichs apenas menciona a pri-
meira parte, sem dúvida devido à novidade do trabalho–. A respeito dos primeiros anos da
história do desenvolvimento da teoria das distribuições pode-se consultar, por exemplo, a
Ref. [77]. Esta noção foi rapidamente aeita pela comunidade axiomática e originou impor-
tantíssimas contribuições: Permitiu a Cook [78] formalizar, em 1953, a construção do espaço
de Fock, recentemente proposto por este [79], como o espaço de Hilbert sobre o que age o
operador de campo livre. Tal construção evita o aparecimento do problema da energia do
ponto zero, que então pode considerar-se apenas um efeito indesejado do uso, não rigoroso,
da correspondência clássico-quântica. Também, foi utilizado por Haag [80] em 1955 ao esta-
belecer o famoso teorema que leva seu nome, e segundo o qual todo campo quantificado
local e covariante relativístico, conectado unitariamente com um campo quantificado livre, é
livre também –uma exposição das diversas variantes desse teorema, assim como suas inter-
pretações, se encontra na Ref. [81]–. Disto conclui-se que, contrariamente ao que ocorre na
mecânica quântica de finitos graus de liberdade, a descrição de interação não existe, pois
não existe operador unitário que a realize. Este ponto crucial é motivo suficiente para que a
comunidade axiomática frequentemente faça uso da descrição de Heisenberg –nesta direção
apontam, por exemplo, as abordagens de Källén [82] e de Nakanishi e Ojima [83]–. Por outro
lado, já em 1956, Wightman [84] estudava as propriedades dos campos quantizados como
distribuições. No ano seguinte, em 1957, Bogoliubov e Parasiuk [85] identificavam a fonte
das divergências ultra-violetas que apareciam usualmente nas teorias quânticas do campo
no produto de distribuições no mesmo ponto, ou de uma distribuição por uma função des-
contínua. Mais tarde, em 1964, Wightman [86] provou definitivamente que os campos não
podem ser definidos nos pontos do espaço-tempo, mas apenas como distribuições.

Essas discussões originaram as assim chamadas «abordagens axiomáticas». Uma de-


las foi iniciada por Garding, Streater e Wightman [87, 88], considerando como objetos bási-
cos os campos quantizados na descrição de Heisenberg e seus valores esperados no vácuo
–chamadas funções de Wightman ou funções de correlação–; embora matematicamente con-
sistente, somente têm sido construídos modelos não-triviais satisfazendo aos axiomas de
Wightman em baixas dimensões [89] –vide também a Ref. [90]–. Outra abordagem axiomá-
tica é aquela de Lehmann, Symanzik e Zimmermann –comumente denominada «formalismo
LSZ»– [91], em que os objetos básicos são os produtos cronológicos dos campos e seus valo-
res esperados no vácuo (funções de Green). Essa abordagem não é bem definida do ponto
de vista matemático, pois contém produtos dos campos com as funções descontínuas de He-
aviside, levando a divergências semelhantes àquelas presentes na abordagem hamiltoniana.
Mencionamos também a abordagem algébrica de Haag, Araki e Kastler [92, 93], baseada
na observação, feita por Segal em 1947 [94], de que é a álgebra dos observáveis limitados,
6 Capítulo 1. Introdução

e não sua representação explícita, o principal objeto matemático da teoria quântica –uma
importante referência para esta proposta axiomática é o já clássico livro de Haag [95]–.
A abordagem que seguir-se-á nessa tese, chamada «programa da matriz S», foi iniciada
por Heisenberg [96] em 1943 como uma tentativa de ir além da teoria lagrangiana, e em boa
medida motivou as abordagens axiomáticas que antes comentamos, as quais consideraram
a proposta de Heisenberg de uma forma não tão radical. Heisenberg compreendeu que
o objeto observável básico na física das partículas é a matriz S, propondo por isso que
a teoria seja diretamente construída em função de seus elementos. A ideia foi adotada
por Stückelberg, cujo desenvolvimento é exposto em detalhe no capítulo 7 da Ref. [97].
Particularmente, foi em 1946 que Stückelberg anunciou que uma condição de causalidade
é necessária para determinar univocamente a matriz S perturbativamente, para o qual a
unitariedade e a invariância relativística não são suficientes. Ele trabalhou nessa ideia com
seu estudante Rivier [98] e obteve uma teoria em que as integrais infinitas são substituídas
por termos finitos indeterminados. Adicionalmente, estes pesquisadores argumentaram que,
como a matriz de espalhamento é um mapa entre espaços de estados livres, ela só deveria
ser construída utilizando os operadores de campo livre.
Estes resultados foram o ponto de partida no esquema axiomático de Bogoliubov, Med-
vedev e Polivanov [99, 100, 101]. Usando da linguagem da teoria das distribuições, simplifi-
caram a condição de causalidade de Stückelberg e Rivier pela introdução de uma «função de
comutação» g (switching function), da qual o operador de espalhamento torna-se um funcio-
nal, S = S( g), que pode então ser construído só com os bem definidos campos livres.
Sobre esta base axiomática trabalhou Stepanov3 [102], que em 1965 estabeleceu um mé-
todo indutivo para construir a matriz S perturbativamente, baseado principalmente no axi-
oma da causalidade. Ele levou em consideração o caráter distribucional do campo ao estudar
cuidadosamente o espaço das funções de teste em que estão definidas as diversas distribui-
ções numéricas que aparecem nos termos perturbativos da matriz S, usando posteriormente
o teorema de Hahn-Banach para estender as ditas distribuições a um espaço de funções mais
geral. Contudo, Stepanov utilizou uma formulação do axioma da causalidade em que a fun-
ção de comutação de Bogoliubov não aparece, do qual é possível inferir que seu trabalho
ainda teria problemas de divergências infra-vermelhas. O trabalho de Stepanov, finalmente,
não encontrou resposta da comunidade.
A solução perturbativa completa dos axiomas de Bogoliubov, Medvedev e Polivanov foi
detalhadamente desenvolvida em 1973 por Epstein e Glaser [103], que evitaram o uso dos
mal definidos produtos cronológicos, e assim o aparecimento das divergências ultra-violetas,
substituindo os produtos mencionados por um processo indutivo baseado na causalidade
semelhante ao utilizado por Stepanov, e que, diferentemente deste, fazia uso tanto da função
de comutação de Bogoliubov, permitindo controlar adequadamente as divergências infra-
vermelhas, como de uma cuidadosa divisão da distribuição causal em suas partes retardada
e avançada, este último possível graças à teoria de divisão de distribuições desenvolvida por
Łojasiewicz e Malgrange [104, 105, 106]. Nessa teoria é extremamente importante determinar

3 Um resumo do trabalho de Stepanov se encontra também na Seç. 29.2 da Ref. [100].


Capítulo 1. Introdução 7

corretamente a ordem singular da distribuição causal a ser dividida; Epstein e Glaser


introduziram complexas definições dela no espaço real como no espaço dos momentos, que
resultaram ser não completamente equivalentes. Apesar dessa complicação, Scharf aplicou
satisfatoriamente o processo indutivo de Epstein e Glaser à QED –numa monografia que é a
primeira edição da Ref. [107], publicada em 1989–, na qual garante que as ordens singulares
no espaço real e no espaço dos momentos são equivalentes para as distribuições causais
da QED. Em 1991, Fassari e Scharf [108] solucionaram definitivamente as dificuldades
envolvidas no cálculo da ordem singular das distribuições aplicando o conceito de quasi-
assíntotas de Vladimirov, Drozzinov e Zavialov [109].
Essa é a teoria que agora se chama «teoria de perturbação causal», e que tem sido apli-
cada a uma variedade de problemas: Dütsch, Krahe e Scharf [110] a aplicaram à QED escalar
(que chamaremos SQED), mostrando que na TPC é bastante começar o procedimento indu-
tivo com o mero conhecimento do termo de interação da primeira ordem na constante de
acoplamento, e que o «vértice» da segunda ordem da abordagem convencional é automatica-
mente gerada como um termo de normalização no seguinte passo do procedimento indutivo
pela imposição da invariância de gauge. Dütsch, Hurth, Krahe e Scharf [111, 112, 113, 114]
desenvolveram também a técnica de construção das teorias de gauge quânticas, formalismo
esse que foi então usado por Dütsch, Scharf e Aste [115, 116, 117] para a construção de teo-
rias de gauge não-abelianas, incluindo à teoria eletro-fraca, e mostrando que nessa teoria a
quebra espontânea de simetria não cumpre rôle algum –veja também a Ref. [118]–. Adicio-
nalmente, Dütsch [119] provou as identidades de Slavnov e Taylor como produto da invari-
ância de gauge quântica. Em relação à unicidade das teorias de Yang-Mills que decorrem
do princípio de invariância de gauge quântica encontram-se os trabalhos de Dütsch [120] e
Grigore [121]. Este último estudou também os aspectos co-homológicos da invariância de
gauge quântica [122], assim como a estrutura das anomalias nessas teorias [123]. Há também
um resultado de impossibilidade para teorias super-simétricas devido a Grigore e Scharf
[124]. A TPC foi usada para estudar a QED tridimensional por Scharf, Wreszinski, Pimen-
tel e Tomazelli [125], que ressaltaram a importância da subtração mínima para obter sem
ambiguidade a massa dinâmicamente gerada do fóton, assim como ao modelo de Thirring
por Manzoni, Pimentel e Tomazelli [126, 127]. Lunardi, Pimentel, Valverde, Manzoni, Bel-
trán e Soto [128, 129] usam a TPC para estudar a equivalência entre as teorias escalares de
Klein-Gordon-Fock e de Duffin-Kemmer-Petiau em acoplamento com o campo eletromagné-
tico. Também a eletrodinâmica da segunda ordem de Podolsky foi considerada desse ponto
de vista por Bufalo, Pimentel e Soto [130, 131], estabelecendo sua super-normalizabilidade.
Mais recentemente, Acevedo, Beltrán, Pimentel e Soto estudaram o modelo de Yukawa à
la TPC [132]. Finalmente, as modificações necessárias para a extensão desse formalismo
ao estudo do campo quantizado no espaço-tempo curvo (globalmente hiperbólico) foram
determinadas por Brunetti, Dütsch, Fredenhagen e Rejzner [133, 134, 135, 136, 137, 138], e
trabalhadas também por Hollands e Wald [139, 140].
Quanto à formulação da TPC na forma dinâmica do plano nulo, os únicos trabalhos
prévios ao desenvolvimento dessa tese foram referentes a Bufalo, Pimentel e Soto [141, 142].
8 Capítulo 1. Introdução

Há, contudo, diferenças importantes entre o enfoque que aqui seguiremos e aquele adotado
nos trabalhos recém citados4 : Na filosofia da forma dinâmica da frente de luz, escreveremos
o axioma da causalidade de forma mais fraca, envolvendo apenas à coordenada temporal
x + ; nos trabalhos prévios dito axioma era referido ainda à coordenada x0 , levando a uma
teoria diferente daquela na dinâmica instantânea apenas por uma mudança de coordenadas,
sem haver uma verdadeira mudança da forma dinâmica. A escolha que aqui fizemos é a que
comumente se adota na QFT no plano nulo, em que os produtos cronológicos são escritos
com o uso da função de Heaviside da coordenada x + ; desejamos obter um ordenamento
cronológico matematicamente bem definido segundo essa variável5 . Uma consequência
notável dessa escolha é o aparecimento dos «termos instantâneos» dos propagadores de
Feynman do campo de Dirac e do eletromagnético, cuja regularização é motivo de frequentes
esforços na comunidade de pesquisadores na área da QFT no plano nulo [145, 146].
A tese que agora se lê organiza-se da forma seguinte. No Cap. 2 –que deu origem ao
artigo da Ref. [147]– apresentamos a teoria do campo clássico na forma dinâmica do plano
nulo, cuja quantização é objeto de estudo do Cap. 3. O marco teórico em que se assentam os
seguintes capítulos, isto é, o desenvolvimento da TPC no plano nulo, é exposto no Cap. 4
[148, 149]. A primeira aplicação dessa formulação é mostrada no Cap. 5, em que estudamos
o modelo de Yukawa neutro [150]. Com a finalidade de continuar o estudo das teorias de
gauge, formulamos no Cap. 6 a teoria invariante de gauge quântica [151], que permite a
construção das teorias de gauge com ajuda dos assim chamados «campos fantasma». Em
seguida aplicamos estes resultados à QED fermiônica no Cap. 7 [152, 151]. Nossas conclusões
e perspectivas são finalmente apresentadas no Cap. 8.

4 Há diferença também quanto ao método de quantização do campo: Nas Refs. [141, 142] ela é substituída
pela representação analítica dos propagadores, que no caso eletromagnético usa do formalismo lagrangiano com
a introdução de fatores indeterminados (multiplicadores de Lagrange). Isto leva a algumas diferenças entre a
distribuição de comutação desse campo obtida na referência anterior e a que obtivemos nessa tese. Contudo, tal
diferença não é essencial, devido à invariância de gauge quântica que desenvolvemos no Cap. 6.
5A construção indutiva da TPC pode ser considerada uma definição rigorosa do ordenamento cronológico

de Wick, conceito este introduzido por Sukhanov nas Refs. [143, 144].
Capítulo 2

Dinâmica da frente de luz na teoria clássica

Neste capítulo será introduzida a dinâmica da frente de luz, as ferramentas que serão
necessárias para nela trabalhar e será estudada a teoria lagrangiana do campo clássico nessa
forma dinâmica. Dirac a introduziu em 1949 [1] a partir do formalismo hamiltoniano, mas
como estamos interessados em definir a teoria do campo nela para logo prosseguir a sua
quantização –o que será feito no seguinte capítulo–, necessitaremos apenas as equações do
movimento dos campos e a definição algébrica de Dirac não aparecerá; contudo, oferece-
mos uma breve revisão das idéias de Dirac, acrescentadas com as duas formas dinâmicas
descobertas por Leutwyler e Stern, no Ap. A.

2.1 Problema dos valores iniciais para a equação


de Klein-Gordon-Fock

É bem sabido que a imposição dos princípios da relatividade1 leva ao resultado de que
todos os campos, e ainda mais explicitamente, todas as componentes de todos os campos,
que denotaremos por u A , devem satisfazer à equação de Klein-Gordon-Fock:

□ + m2 u A = 0 ,

(2.1)

com algum valor do parâmetro m2 , associado à massa da partícula cujo movimento é descrito
ondulatoriamente pelo campo. Lembramos que a obtenção dessa equação obedece ao fato
de que os campos se transformam segundo determinadas representações irredutíveis do
grupo de Poincaré, sendo que um dos operadores de Casimir é o quadrado do operador de
momento, P2 , que é então proporcional à identidade (com fator de proporcionalidade que
tem-se denotado por m2 ), como o garante o lema de Schur.
Porém, a teoria da relatividade é uma teoria causal no seguinte sentido: Como a veloci-
dade da propagação da informação não pode nunca superar à da luz no vazio, o valor que o
campo adota num dado ponto P do espaço-tempo é determinado por um certo conjunto de
dados dele e, possivelmente, de suas derivadas, contidos no cone de luz passado em relação
ao ponto P e em seu interior. Vê-se claramente, assim, que a impossibilidade de superar à

1 Usar-se-á a palavra «relatividade» no sentido em que usualmente se diz «relatividade restrita» ou «especial»,

atendendo ao fato de que, como tem sido devidamente elucidado por Fock, uma «relatividade geral» não pode
ser definida no espaço-tempo tetradimensional, visto que um espaço dessa dimensionalidade já é máximamente
uniforme quando é invariante sob um grupo de dez parâmetros, como o é o grupo de Poincaré: A uniformidade
–e então tampouco a relatividade– desse espaço podem ser «generalizados». A este respeito, consultar a
Introdução da Ref. [154].

9
10 Capítulo 2. Dinâmica da frente de luz na teoria clássica

velocidade da luz é consequência dos axiomas da relatividade, mas a direção de propagação


da informação do passado para o futuro não o é; ela tem de ser introduzida como um novo
axioma [153]:

Axioma (da invariância da causalidade): O sentido de «futuro» ao longo de qualquer trajetória


de mundo é a mesma em todos os sistemas de referência.

Determinar quais dados precisa-se conhecer para poder antecipar o valor do campo em
um ponto futuro é o problema dos valores iniciais, que para as equações diferenciais da se-
gunda ordem pode ser precisamente formulado da seguinte forma [155]:

Problema dos valores iniciais: Seja

∂u ∂2 u ∂2 u
 
ϕ u; xi ; ; ; = 0 (i = 1, · · · , m) (2.2)
∂xi ∂xi2 ∂xi ∂xk

uma equação diferencial parcial da segunda ordem, linear em u e em suas derivadas com coeficientes
que são funções quaisquer das variáveis xi . Quer-se encontrar uma solução tal que na «superfície
inicial» xm = 0:

∂u
u ( x 1 ; · · · ; x m −1 ; 0 ) = u 0 ( x 1 ; · · · ; x m −1 ) e ( x 1 ; · · · ; x m −1 ; 0 ) = u 1 ( x 1 ; · · · ; x m −1 ) .
∂xm
(2.3)
Esse é o problema dos valores iniciais (de Cauchy) com respeito à superficie inicial xm = 0 e com «da-
dos de Cauchy» ou «condições iniciais» u0 e u1 .

Sabe-se que toda equação diferencial, quer ordinária, quer parcial, admite um número
infinito de soluções, que são escritas como uma «integral geral» contendo um determinado
número de parâmetros ou funções desconhecidas. O problema dos valores iniciais inclui em
seu enunciado um conjunto de condições adicionais –os dados de Cauchy– que visam deter-
minar os elementos arbitrários da integral geral, mas não é, em princípio, claro que seja possí-
vel com elas encontrar uma, e só uma, solução, pois pode acontecer que os dados de Cauchy
sejam incompatíveis com a integral geral ou que não sejam suficientes para fixar todos os ele-
mentos arbitrários. Assim, dir-se-á que o problema dos valores iniciais está bem definido se
ele (i) tem solução, e (ii) dita solução é única. As condições sob as quais isto acontece são esta-
belecidas no seguinte teorema, que apresenta-se aqui para o caso de duas variáveis indepen-
dentes x e y –o que é suficiente para ilustrar o procedimento de solução e suas dificuldades–:

Teorema 2.1 (de Cauchy-Kovalevskaya): Seja o problema de Cauchy para a equação diferencial
parcial da segunda ordem e de duas variáveis

∂u ∂u ∂2 u ∂2 u ∂2 u
 
ϕ u; x; y; ; ; 2 ; 2 ; =0 , (2.4)
∂x ∂y ∂x ∂y ∂x∂y
Capítulo 2. Dinâmica da frente de luz na teoria clássica 11

com dados de Cauchy


∂u
u(0; y) = u0 (y) e (0; y) = u1 (y) . (2.5)
∂x
O problema de Cauchy está bem definido se:

∂ϕ
̸= 0 , (2.6)
∂ (∂2 u/∂x2 )

de tal forma que pode-se escrever a Eq. (2.4) na forma:

∂2 u ∂u ∂u ∂2 u ∂2 u
 
= f u; x; y; ; ; 2 ; , (2.7)
∂x2 ∂x ∂y ∂y ∂x∂y

com f uma função holomórfica na vizinhança de x = 0.

Caso haja interesse nos detalhes técnicos desse teorema, pode-se consultar as Refs.
[155, 156]. O que aqui exporemos é a construção da solução, que tem como consequência
direta a unicidade da mesma. Escrevamos a função incógnita u( x; y) como série de potências
na variável x, ao redor do ponto x = 0 em que são definidos os dados de Cauchy:

∂h u

u
u = u0 + u1 x + · · · + h x h + · · · ; uh = uh (y) ≡ . (2.8)
h! ∂x h x=0

Nesta série, os dados de Cauchy já estão introduzidos como os elementos u0 e u1 ; portanto,


o objetivo é encontrar uh para h ≥ 2 em função deles. Notando que, em geral:

∂h+k u ∂k uh

= , (2.9)
∂x h ∂yk x=0
∂yk

pode-se obter a solução desejada mediante o seguinte conjunto de passos: Tomando x = 0


na Eq. (2.7), obtém-se:

∂u0 ∂2 u0 ∂u1
 
u2 = f u0 ; 0; y; u1 ; ; ; , (2.10)
∂y ∂y2 ∂y

de forma que u2 está determinado pelo conhecimento de u0 e u1 . Que apareçam também


suas derivadas na Eq. (2.10) não é motivo de preocupação, pois elas estão tomadas em
relação à variável y com x = 0, e portanto podem ser obtidas a partir dos dados de Cauchy.
Derivemos agora a Eq. (2.7) em relação a x, então coloquemos x = 0; obteremos:

∂f ∂f ∂f ∂f ∂u1 ∂f ∂u2
u3 = u1 + + u2 + +···+ 2
. (2.11)
∂u ∂x ∂ (∂u/∂x ) ∂ (∂u/∂y) ∂y ∂ (∂ u/∂x∂y) ∂y

Todas as derivadas nessa equação estão avaliadas nos argumentos de f na Eq. (2.10). A
Eq. (2.11) indica que a função u3 está determinada pelos dados de Cauchy e a função u2
previamente obtida. Também, a condição de f ser holomórfica na vizinhança de x = 0 tem
sido usada para tomar sua derivada e avaliá-la nesse ponto. E é da mesma forma que os
12 Capítulo 2. Dinâmica da frente de luz na teoria clássica

seguintes termos na seqüência da Eq. (2.8) são obtidos por derivação sucessiva da Eq. (2.7) e
posterior avaliação em x = 0: o resultado será sempre que a função uh é um polinômio de u0 ,
u1 , ..., uh−1 e suas derivadas, assim como de f e suas derivadas avaliadas nos argumentos da
Eq. (2.10).
Uma vez que se conhece as funções uh , pode-se expressá-las como séries de potências na
variável y ao redor do ponto y0 fixo:

uhk
uh (y) = ∑ k!
( y − y0 ) k , (2.12)
k

e então a solução completa ao problema dos valores iniciais é:

u
u( x; y) = ∑ h!k!
hk h
x ( y − y0 ) k , (2.13)
h,k

com todos os coeficientes uhk determinados pelos dados de Cauchy. Como aqueles são
únicos, o problema dos valores iniciais não admite mais de uma solução holomórfica,
representada pela série da Eq. (2.13). Essa é a unicidade da solução. Sua existência depende
do fato da série da Eq. (2.13) ser convergente para | x | e |y − y0 | limitados por certos valores
apropriados. Mas, em síntese, o que temos aprendido é que uma equação diferencial parcial
da segunda ordem tem problema dos valores iniciais bem definido se se especifica a função e
sua primeira derivada em relação a uma de suas variáveis numa superfície em que a mesma
adota um valor fixo e que, além disso, se a solução existe, então ela é única.
Apliquemos então este conhecimento à equação de Klein-Gordon-Fock [Eq. (2.1)]. Como
estamos interessados na evolução temporal da solução, escolheremos a variável t para
enunciar o problema dos valores iniciais: Seja u( x ) = u(t; x) uma função que satisfaz à
equação da segunda ordem:

∂2 u
( x ) = (∇2 − m2 )u( x ) , (2.14)
∂t2

sujeita aos seguintes dados de Cauchy na superfície espacial tridimensional t = 0:

u(0; x) = u0 ( x) e ∂t u(0; x) = u1 ( x) . (2.15)

Logo se vê que a Eq. (2.14) tem a forma da Eq. (2.7) e, portanto, a tese do teorema de
Cauchy-Kovalevskaya lhe é aplicável. Para solucionar tal equação, passamos ao espaço dos
momentos por meio da transformação de Fourier aplicada à função u. Exigindo que satisfaça
à Eq. (2.14), passa a ter a forma:
Z
−2
u( x ) = (2π ) d4 pδ( p2 − m2 )u( p)e−ipx (2.16)
d4 p 
Z
= (2π )−2 δ( p0 − ω p ) + δ( p0 + ω p ) u( p)e−ipx

, (2.17)
|2p0 |
p
com: ω p ≡ p2 + m2 . Integrando na variável p0 com o uso das distribuições delta de Dirac,
Capítulo 2. Dinâmica da frente de luz na teoria clássica 13

obtém-se a separação em partes de frequência positiva e de frequência negativa:

d3 p
Z  
u( x ) = (2π )−2 u+ ( p) e−ipx + u− ( p) e−ipx . (2.18)

2ω p p0 = ω p p0 =−ω p

Coloquemos aqui os dados de Cauchy da Eq. (2.15). Primeiro:

d3 p
Z
u0 ( x) = u(0; x) = (2π )−2 [u+ ( p) + u− ( p)]eip · x . (2.19)
2ω p

Mas é possível escrever:


Z Z Z 
−ip · y
u0 ( x ) = 3
d yu0 (y)δ( x − y) = (2π ) −3 3
d p 3
d yu0 (y)e eip · x , (2.20)

obtendo-se, via uma comparação das Eqs. (2.19) e (2.20) e a independência linear das funções
exponenciais eip · x , que:
Z
u+ ( p) + u− ( p) = 2ω p (2π )−1 d3 yu0 (y)e−ip · y . (2.21)

Em segundo lugar, dos dados de Cauchy referidos à derivada de u,

d3 p
Z
u1 ( x) = ∂t u(0; x) = (2π )−2 (−iω p )[u+ ( p) − u− ( p)]eip · x , (2.22)
2ω p

e novamente reescrevendo o lado esquerdo com o auxílio da distribuição delta de Dirac


tridimensional e comparando com a Eq. (2.22), encontra-se que:
Z
u+ ( p) − u− ( p) = 2i (2π )−1 d3 yu1 (y)e−ip · y . (2.23)

As Eqs. (2.21) e (2.23) permitem encontrar explicitamente as funções u± ( p) em dependência


com os dados de Cauchy u0 e u1 :
Z
u± ( p) = (2π ) −1
d3 y[ω p u0 (y) ± iu1 (y)]e−ip · y . (2.24)

Substituindo-as na Eq. (2.18) e completando p · y = py|y0 =0 , o que serve para escrever a


integração com medida d3 y explicitamente na superfície y0 = 0 onde são dados os dados de
Cauchy:

d3 p
Z Z 
−3
u( x ) = (2π ) 3
d y (ω p u0 (y) + iu1 (y)) e−ip(x−y)

2ω p p0 = ω p
y0 =0

−ip( x −y)
+(ω p u0 (y) − iu1 (y)) e
p0 =−ω p
Z Z
= (2π )−3 d4 pδ( p2 − m2 ) d3 y ω p u0 (y) + isgn( p0 )u1 (y) e−ip(x−y)
 
. (2.25)
y0 =0
14 Capítulo 2. Dinâmica da frente de luz na teoria clássica

Nada obstante, é possível escrever:

ω p e−ip(x−y) = p0 sgn( p0 )e−ip(x−y) = isgn( p0 )∂0x e−ip(x−y) , (2.26)

com o qual: Z
u( x ) = d3 y [u0 (y)∂0x D ( x − y) + D ( x − y)u1 (y)] . (2.27)
y0 =0

Tem-se introduzido aqui a «distribuição de Jordan-Pauli»:


Z
D ( x ) := i (2π )−3 d4 pδ( p2 − m2 )sgn( p0 )e−ipx . (2.28)

Essa distribuição tem duas propriedades imediatas: Por causa da distribuição delta de Dirac
que aparece em seu integrando, ela satisfaz à equação de Klein-Gordon-Fock com massa m,
isto é, à mesma equação diferencial que rege a evolução do campo u:

(□ + m2 ) D ( x ) = 0 . (2.29)

Também, de sua forma integral explícita dada na Eq. (2.28) segue a propriedade de antissi-
metria:
D ( x ) = − D (− x ) . (2.30)

Fazendo uso, precisamente, desta última propriedade, pode-se escrever a Eq. (2.27) com a
derivada que age sobre D ( x − y) não sendo já em relação à variável x0 , mas em relação à y0 :
Z
y
d3 y u0 ( y ) ∂0 D ( y − x ) − D ( y − x ) u1 ( y )
 
u( x ) = . (2.31)
y0 =0

y
Essa mudança é útil porque, lembremos: u1 (y) = ∂0 u(0; y); mas o fato de ser y0 = 0 já está
y
indicado na integral. Daí que é possível escrever, dentro dela, u1 (y) = ∂0 u(y) e u0 (y) = u(y).
Assim, usando mais uma vez a Eq. (2.30), obtém-se finalmente:

←→y
Z
u( x ) = d3 yD ( x − y) ∂ 0 u(y) . (2.32)
y0 =0

Essa é a solução da equação de Klein-Gordon-Fock com dados de Cauchy na superfície


y0 = 0, que, existindo, é única, como o demonstra a construção anteriormente exposta. A
causalidade relativística se reflete no fato de ser, explicitamente –vide, por exemplo, as Refs.
[100] e [107]–:

1

m √ 
D(x) = sgn( x0 ) δ( x2 ) − Θ( x2 ) √ J1 (m x2 ) , (2.33)
2π 2 x2

com J1 a função de Bessel da primeira ordem, o que implica que:

supp( D ( x )) = V + (0) ∪ V − (0) , (2.34)


Capítulo 2. Dinâmica da frente de luz na teoria clássica 15

com:
V + ( x ) : = y ∈ M | ( y − x )2 ≥ 0 ∧ y0 ≥ x 0

(2.35)

o «cone de luz futuro em relação ao ponto x», e

V − ( x ) : = y ∈ M | ( y − x )2 ≥ 0 ∧ y0 ≤ x 0

(2.36)

o «cone de luz passado em relação ao ponto x». Para finalizar a introdução da nomenclatura,
a união V + ( x ) ∪ V − ( x ) é o «cone de luz com vértice no ponto x». Isto é: D ( x ) tem suporte
causal em relação à origem do sistema de coordenadas. À luz da Eq. (2.32), a Eq. (2.34)
implica que, transladando a origem até o ponto x em que se quer conhecer o valor do campo
u, como D ( x − y) tem suporte no cone de luz com vértice em x, u( x ) não é afetado pelos
valores que no passado o campo adotou fora do cone de luz de x, nem afetará aos valores
que adotará fora dele no futuro.
Consideremos agora o assunto que segue. A solução obtida, embora satisfatória, não é
geral como gostaríamos, pois precisa do conhecimento dos dados de Cauchy numa superfície
de tempo constante. Mas, o que aconteceria se os dados nos fossem conhecidos numa
superfície diferente? Voltando ao problema dos valores iniciais como enunciado na Eq. (2.2),
suponhamos que o espaço m-dimensional é submetido à transformação de coordenadas:

X1 = G1 ( x1 ; · · · ; xm ) , ··· , Xm = Gm ( x1 ; · · · ; xm ) , (2.37)

de tal forma que Xm = Gm ( x1 ; · · · ; xm ) = 0 seja a superfície onde são conhecidos os dados


iniciais. A equação diferencial é substituída por uma análoga para as novas coordenadas,
com u( x1 ; · · · ; xm ) = U ( G1 ( x1 ; · · · ; xm ); · · · ; Gm ( x1 ; · · · ; xm )):

∂U ∂2 U ∂2 U
 
Φ U; Xi ; ; ; =0 . (2.38)
∂Xi ∂Xi2 ∂Xi ∂Xk

Esta simples transformação de coordenadas, poderia parecer, não tem maiores implicações
na teoria, pois, aparentemente, poder-se-ia aplicar o teorema de Cauchy-Kovalevskaya à
nova equação diferencial. Suponhamos, contudo, que a Eq. (2.4) é linear, isto é, que tem a
seguinte forma geral:
∂2 u ∂u
∑ Aik ∂xi ∂xk
+ ∑ Bi
∂xi
+ Cu = f , (2.39)
i,k i

com Aik = Aki , Bi , C e f funções das variáveis xi . Uma vez que as transformações da Eq.
(2.37) sejam feitas, usando a regra de derivação em cadeia obtém-se que a Eq. (2.39) é, em
relação às variáveis Xi :
! !
∂Gj ∂G ∂2 U ∂G ∂U
∑ ∑ Aik ∂xi ∂xkl ∂X j ∂Xl ∑
+ ∑ Bi ∂xil ∂Xl
+ CU = f . (2.40)
j,l i,k l i

Como temos aprendido, o teorema de Cauchy-Kovalevskaya tem por hipótese o cumpri-


mento da Eq. (2.6), isto é, ele será aplicável só se ∂2 U/∂Xm
2 aparecer na Eq. (2.40). Isto coloca
16 Capítulo 2. Dinâmica da frente de luz na teoria clássica

em primeiro plano a «forma característica» A definida como2 :

A(γ1 ; · · · ; γm ) := ∑ γi Aik γk . (2.41)


i,k

Da Eq. (2.40) observamos que a hipótese do teorema de Cauchy-Kovalevskaya não se satisfaz


se:
∂Gm ∂Gm
∑ Aik ∂xi ∂xk
=0 . (2.42)
i,k

Este é o único caso em que a generalização para superfícies iniciais quaisquer não pode
ser feita trivialmente. As superfícies Gm ( x1 ; · · · ; xm ) = 0 para as que isto acontece são
nomeadas «superfícies características» da equação diferencial. O estudo do problema dos
valores iniciais com superfície inicial uma superfície característica, chamado «problema de
Goursat» [157], é tema de consideração da seguinte subseção.

2.1.1 Problema de Goursat

Consideremos uma equação diferencial em que a segunda derivada em relação à variável


xm não pode ser isolada, pois não aparece. Especificamente, seja uma equação diferencial
escrita em função de coordenadas tais que a superfície xm = 0 é uma superfície característica:

m −1
∂2 u ∂2 u ∂u
∑ Aik ∂xi ∂xk
+ ∑ Aii 2 + ∑ Bi
∂xi ∂xi
+ cu = f ; Amm = 0 . (2.43)
i ̸=k i =1 i

O primeiro propósito desta discussão será ver se os dados de Cauchy que são suficientes
no problema fora de superfícies características o são também nesse caso. Suponhamos, pois,
que sejam conhecidos:

∂u
u ( x 1 ; · · · ; x m −1 ; 0 ) = u 0 ( x 1 ; · · · ; x m −1 ) ; ( x 1 ; · · · ; x m −1 ; 0 ) = u 1 ( x 1 ; · · · ; x m −1 ) .
∂xm
(2.44)
Façamos, como anteriormente, a expansão ao redor do ponto xm = 0:

∂h u

uh h
u = u0 + u1 x m + · · · + x +··· ; u h = u h ( x1 ; · · · ; x m ) ≡ . (2.45)
h! m ∂xmh
x m =0

Colocando essa expansão na Eq. (2.43), então pondo xm = 0, obtém-se já não uma expressão

2 Recordemos, en passant, que a forma característica define o tipo da equação diferencial parcial [157]: (i) Se

ela contém m autovalores diferentes não nulos do mesmo sinal, como acontece, por exemplo, com a equação de
Laplace ∇2 φ = 0, se denomina «elíptica»; (ii) se tem menos de m autovalores não nulos, como acontece com a
equação de Schrödinger ∂t ψ + ∇2 ψ = 0, «parabólica»; (iii) se ela tem m autovalores não nulos, não todos do
mesmo sinal, como acontece com a equação de Klein-Gordon-Fock [Eq. (2.14)], então a equação diferencial
recebe o nome de «hiperbólica». Particularmente, se na equação hiperbólica a forma característica tem todos os
autovalores do mesmo sinal, exceto um, então ela é denominada «hiperbólica normal»; é a esse tipo que pertence
a equação de Klein-Gordon-Fock.
Capítulo 2. Dinâmica da frente de luz na teoria clássica 17

para u2 , senão uma equação diferencial para u1 :

∂u1
2 ∑ Aim ∂xi + Bm u1 + H1 = 0 , (2.46)
i ̸=m

com H1 dependendo somente de u0 e suas derivadas:

∂2 u0 ∂2 u0 ∂u0
H1 = ∑ Aik + ∑ Aii 2 + ∑ Bi
∂xi ∂xk i̸=m ∂xi ∂xi
+ Cu0 − f . (2.47)
i ̸=m,k ̸=m,i ̸=k i ̸=m

Vê-se, dessarte, que se u1 não fosse dado de forma a satisfazer a essa equação diferencial,
então o problema dos valores iniciais com os dados iniciais da Eq. (2.44) não teria solução.
Isto já é diferente do que ocorre quando os dados iniciais são dados fora das superfícies
características: naquele caso o problema com valores iniciais da função e sua primeira
derivada tem solução quaisquer que sejam estes. Portanto, é preciso oferecer outros dados
iniciais, a saber, os necessários para que as equações diferenciais que se obtém para as
funções uh possam ser univocamente solucionadas.

A Eq. (2.46) é uma equação diferencial parcial da primeira ordem para u1 . Que as
equações para os outros uh são também desse tipo o demonstra a seguinte análise. Derivando
a Eq. (2.43) em relação a xm e colocando depois xm = 0, encontra-se a seguinte equação
diferencial para u2 :
∂u2
2 ∑ Aim ∂xi + Bm u2 + H2 = 0 , (2.48)
i ̸=m

com:
∂2 u1 ∂2 u ∂u ∂f
H2 = ∑ Aik + ∑ Aii 21 + ∑ Bi 1 + Cu1 −
∂xi ∂xk i̸=m ∂xi ∂xi ∂xm
. (2.49)
i ̸=m,k ̸=m,i ̸=k i ̸=m

E, em geral, derivando a Eq. (2.43) h − 1 vezes em relação a xm , então tomando xm = 0,


obtém-se a equação diferencial para uh :

∂u
2 ∑ Aim ∂xhi + Bm uh + Hh = 0 , (2.50)
i ̸=m

com:

∂ 2 u h −1 ∂ 2 u h −1 ∂uh−1 ∂ h −1 f
Hh = ∑ Aik + ∑ Aii
∂xi ∂xk i̸=m ∂xi2
+ ∑ Bi
∂xi
+ Cu h − 1 −
∂xm h −1
. (2.51)
i ̸=m,k ̸=m,i ̸=k i ̸=m

Assim, todas as equações diferenciais que regem o comportamento das funções uh são da
primeira ordem. Para solucioná-las, estudaremos o método das características para esse
tipo de equações, e com o intuito de simplificar a exposição, consideremos o problema de
resolver a equação diferencial de duas variáveis:

∂u ∂u
A( x; y) + B( x; y) − C ( x; y; u) = 0 . (2.52)
∂x ∂y
18 Capítulo 2. Dinâmica da frente de luz na teoria clássica

As Eqs. (2.50) são todas desse tipo, com a particularidade de ser A( x; y) = 0; colocaremos
ao final essa condição para examinar suas consequências. Solucionar a Eq. (2.52) significa,
geométricamente falando, encontrar uma superfície solução u = z( x; y), a qual tem vetor
normal n = (∂z/∂x; ∂z/∂y; −1); portanto, definindo o campo vetorial F = ( A; B; C ), a Eq.
(2.52) pode ser escrita como:
F·n = 0 . (2.53)

Isto é, F é tangente à superfície solução u = z( x; y), o que tem como consequência que essa é
constituída por curvas integrais daquela; ditas curvas integrais são denominadas «curvas
características». Isto leva imediatamente à seguinte estratégia de solução: Sejam dados os
valores de u( x; y) numa curva γ no plano x − y; o uso deles permite estabelecer a curva Γ
sobre a superfície z( x; y) que lhe corresponde. Então a partir de cada ponto de Γ pode ser
gerada uma curva integral de F, construindo assim a superfície z( x; y). Levando a ideia à
prática, pode-se parametrizar, para a em algum domínio de variação:

Γ( a) = ( x = x0 ( a); y = y0 ( a); z = z0 ( a)) . (2.54)

Encontrar para cada valor de a uma curva integral de F que passe por Γ( a) significa resolver,
para cada valor de a, o sistema de equações diferenciais de Lagrange-Charpit: Para um
parâmetro s:

dx
= A( x; y) ; x (0) = x0 ( a) , (2.55)
ds
dy
= B( x; y) ; y(0) = y0 ( a) , (2.56)
ds
dz
= C ( x; y; z) ; z(0) = z0 ( a) . (2.57)
ds

As soluções desse sistema,

x = X ( a; s) , y = Y ( a; s) , z = Z ( a; s) , (2.58)

são já uma representação paramétrica da superfície solução. Para obtê-la na forma u =


z( x; y), precisa-se inverter:

a = Λ( x; y) e s = S( x; y) , (2.59)

com o qual a solução buscada será:

u( x; y) = Z (Λ( x; y); S( x; y)) . (2.60)

Um comentário é imprescindível: Para que possa ser gerada a superfície solução a partir
da curva Γ por ação do campo vetorial F, é necessário que a curva Γ não seja já uma curva
característica (uma curva integral de F), pois então ela seria invariante pela ação de F. No
caso em estudo, as Eqs. (2.50) dão lugar a equações de Lagrange-Charpit com o lado direito
Capítulo 2. Dinâmica da frente de luz na teoria clássica 19

da Eq. (2.55) nulo:


dx
=0 ; x (0) = x0 ( a ) . (2.61)
ds
Isto é, x é independente do parâmetro s. Se os dados de Cauchy fossem dados numa linha de
x = constante, então x seria também independente de a; logo não poderia obter-se a solução
do sistema senão únicamente para o valor constante de x. Conclui-se: Os dados iniciais
que são necessários para solucionar univocamente as Eqs. (2.50) não podem ser dados na
superfície xm = 0, mas têm de ser dados em uma outra superfície. Por exemplo, os valores
iniciais podem ser dados na linha de y constante:

Γ = ( x = x0 ( a); y = y0 ; z = z0 ( a)) , (2.62)

com y0 independente de a. A Eq. (2.61) tem a solução: x = x0 ( a). Subsituindo-a na Eq.


(2.56), como x é independente de s, a integração torna-se elementar:

Zy
dy
s= . (2.63)
B ( x0 ( a ); y )
y0

Finalmente, a Eq. (2.57) será:

dz
= C ( x0 ( a); y( a; s); z) ; z (0) = z0 ( a ) , (2.64)
ds

que é uma equação bem definida e com condições iniciais, portanto solúvel e com solução
única.
A análise recém feita demonstra que as Eqs. (2.50) que determinam as funções uh poderão
ser resolvidas univocamente se são fornecidos dados iniciais para u numa superfície, por
exemplo, com xk =constante, k ̸= m. Em conclusão, quando o problema dos valores iniciais
está definido sobre uma superfície característica da equação diferencial, os dados iniciais não
podem ser os valores da função e de sua primeira derivada normal à superfície característica,
pois em tal caso o problema pode, ou não ter solução, ou ter infinitas soluções; em seu lugar,
devem ser fornecidos os valores da função na superfície característica e numa superfície
diferente.

2.1.2 Superfícies características da equação de Klein-Gordon-Fock:


Coordenadas no plano nulo

Uma vez que temos visto que o problema dos valores iniciais pode ser bem definido sobre
superfícies características, apliquemos o conhecimento adquirido ao estudo da equação de
Klein-Gordon-Fock com que iniciamos essa discussão [Eq. (2.1)]:

∂2 u ∂2 u ∂2 u ∂2 u
− 2 − 2 − 2 + m2 u = 0 . (2.65)
∂t2 ∂x ∂y ∂z
20 Capítulo 2. Dinâmica da frente de luz na teoria clássica

Comparando com a Eq. (2.39), reconhece-se que para essa equação são3 :

Aµν = ηeµν , Bµ = 0 , C = m2 e f =0 . (2.66)

Aqui, ηeµν são as componentes cartesianas do tensor métrico do espaço-tempo de Minkowski:



ηeµν = diag(+1; −1; −1; −1). A forma característica [vide a Eq. (2.41)] é ηeµν γµ γν , que se
anula para γµ um vetor do tipo-luz:

( γ0 )2 = γ2 . (2.67)

Assim sendo, a transformação de coordenadas Xµ = Gµ (t; x; y; z) será tal que X0 = cons-


tante é uma superfície característica se –vide a Eq. (2.42)– a função G0 satisfaz à equação
diferencial:  2  2  2  2
∂G0 ∂G0 ∂G0 ∂G0
− − − =0 , (2.68)
∂t ∂x ∂y ∂z
cuja solução é:
p
G0 = at + bx + cy + dz ; a=± b2 + c2 + d2 . (2.69)

Quer dizer, as superfícies características da equação de Klein-Gordon-Fock são as superfícies


X0 = 0, com:
bx + cy + dz
X0 ∼ t ± √ , (2.70)
b2 + c2 + d2
ou seja, planos nulos, com as constantes b, c e d, assim como o fator de proporcionalidade
com a coordenada X0 , números reais arbitrários. Façamos uma escolha:

Definição: Sejam ( x0 ; x1 ; x2 ; x3 ) coordenadas cartesianas no espaço-tempo de Minkowski tais


que o tensor métrico adota sua forma diagonal normalizada ηeµν . O conjunto de coordenadas
( x + ; x1 ; x2 ; x − ), com:

1 1
x + := √ ( x0 + x3 ) , x − := √ ( x0 − x3 ) , (2.71)
2 2

é chamado conjunto de coordenadas do plano nulo.

A eleição da superfície característica em que os dados iniciais serão dados, quer x + = 0,


quer x − = 0, é um assunto puramente convencional, mas importante por causa de ser,
implicitamente, uma escolha do parâmetro de evolução dos campos, ao que doravante
chamar-se-á «tempo». Escolhemos x + como coordenada temporal; a seguinte nomenclatura é
usada: x − é a coordenada «longitudinal» e x ⊥ = ( x1 ; x2 ), as coordenadas «transversais». As
coordenadas cartesianas ( x0 ; x1 ; x2 ; x3 ) passarão a ser chamadas «coordenadas instantâneas»
por óbvias razões. O fator de proporcionalidade escolhido na definição de x ± na Eq. (2.71)
tem a virtude de que, com ele, o determinante jacobiano da transformação de coordenadas é

3 Colocamos agora índices gregos por se tratar de índices do espaço-tempo.


Capítulo 2. Dinâmica da frente de luz na teoria clássica 21

igual à unidade, de forma que o elemento de volume não muda:

d4 x = dx + dx − d2 x ⊥ . (2.72)

Também, chamando ηab a métrica nas coordenadas do plano nulo, ela tem a seguinte repre-
sentação matricial:  
0 0 0 1
 
0 −1 0 0
[ηab ] = 
  = [η ab ] . (2.73)
0 0 −1 0

1 0 0 0

Estabelecer-se-á agora a solução ao problema dos valores iniciais no plano nulo. Para
isso, lembremos a Eq. (2.32): Em coordenadas instantâneas:

←→y
Z
u( x ) = d3 yD ( x − y) ∂ 0 u(y) . (2.74)
y0 =0

Denotemos por N µ ( x; y) à generalização covariante do integrando:


←→µ
N µ ( x; y) = D ( x − y) ∂ y u(y) . (2.75)

Tomando a divergência dele em relação à variável y, vê-se que:

y
∂µ N µ ( x; y) = D ( x − y)□y u(y) − □y D ( x − y)u(y) = 0 , (2.76)

pois tanto u como D satisfazem à equação de Klein-Gordon-Fock com massa m [vide a Eq.
(2.29)]. Portanto, sendo de divergência nula, pode-se usar o teorema de Gauss no volume Ω
limitado pelo sólido A − B − C − D na Fig. 2.1, em que o ponto P, vértice do cone de luz,
representa ao ponto x em que se deseja conhecer o valor do campo u. Então ter-se-á que:
Z Z
y
0= ∂µ N µ ( x; y) = dσµ (y) Nµ ( x; y)
Ω ∂Ω
 
←→
Z Z Z Z
= + + +  D ( x − y) ∂ µy u(y)dσµ (y) . (2.77)
A− B B−C C−D D− A

Porém, B − C está fora do cone de luz do ponto P, e a integral nessa superfície se anula,
pois D ( x − y) tem suporte causal. Assim sendo e identificando a integral sobre A − B como
a solução da Eq. (2.74), bem como que os vetores normais às superfícies C − D e D − A são,
respectivamente, nas coordenadas do plano nulo, (0; 0; 0; −1) e (−1; 0; 0; 0), obter-se-á que:

←→y ←→y
Z Z
u( x ) = D ( x − y) ∂ − u(y)d2 y⊥ dy− + D ( x − y) ∂ + u(y)d2 y⊥ dy+ , (2.78)
D− A C−D

visto que a superfície D − A é de x + = constante e a C − D é de x − = constante. Isto


22 Capítulo 2. Dinâmica da frente de luz na teoria clássica

Figura 2.1: Volume de integração para a obtenção da solução do problema de Goursat da


equação de Klein-Gordon-Fock.

concorda com nossos estudos prévios: A solução ao problema dos valores iniciais é única
e bem definida se os dados iniciais são os valores do campo na superfície característica e
numa superfície diferente dela. Em outras palavras, tem-se substituído o valor de u e ∂0 u
em um plano do tipo-espaço pelo conhecimento de u em dois planos nulos. Em particular,
podemos tomar o limite em que a superfície C − D encontra-se em x − → −∞, e os dados
iniciais nessa superfície são substituídos pela «condição assintótica»:

lim u( x ) = 0 . (2.79)
x − →−∞

Nessas condições, a solução da Eq. (2.78) se simplifica a:

←→y
Z
u( x ) = D ( x − y) ∂ − u(y)d2 y⊥ dy− , (2.80)
y+ =y0+

que precisa do conhecimento só do valor do campo na superfície isocrônica x + = x0+ .


O estudo da equação de Klein-Gordon-Fock apresentado indica a possibilidade real de
construir uma física sobre o plano nulo. Até aqui, uma tal física seria equivalente à física
instantânea, mas, é claro, tal equivalência, encontrada no caso particular estudado, não pode
ser simplesmente extrapolada para outros fenômenos físicos, senão que tem de ser provada.

2.2 Formas dinâmicas

Quando se fala da descrição física de um fenômeno entendemos o conhecimento da


evolução das grandezas observáveis do sistema. Evolução em relação a algum parâmetro
ao que se dá o nome de «tempo». Mas, para que essa descrição seja bem determinada, a
cada tempo só pode corresponder um único valor dos observáveis, ou, em outras palavras,
a trajetória de evolução –«linha de mundo» no caso da mecânica do ponto material– do
sistema só pode atravessar uma superfície isocrônica uma única vez [1]. Deseja-se ver quais
formas dinâmicas são possíveis atendendo a essa restrição.
Capítulo 2. Dinâmica da frente de luz na teoria clássica 23

2.2.1 Regime não-relativístico

O regime não-relativístico tem a peculiaridade de que as partículas podem ter velocida-


des quaisquer. Logo, num diagrama t versus x, a linha de mundo da partícula pode adotar
coeficiente angular (inclinação) não negativa qualquer –o fato dela ter de ser não negativa
tem origem no axioma da invariância da causalidade: seu sentido de futuro não pode mu-
dar qualquer que seja sua velocidade–. Portanto, é possível que uma partícula atravesse
uma superfície inclinada no espaço t − x mais de uma vez caso fosse acelerada suficiente-
mente, como se mostra na Fig. 2.2-(b), e isto acontecerá sem importar quão pequena seja a
inclinação do plano. Concluindo, no regime não-relativístico a única forma dinâmica possí-
vel é a «dinâmica instantânea», na qual as superfícies isocrônicas são superfícies de tempo
(newtoniano) constante, como mostrado na Fig. 2.2-(a).

Figura 2.2: (a) Superfície de tempo constante. (b) Superfície inclinada.

2.2.2 Regime relativístico

No regime relativístico não aparece o problema das velocidades infinitas que limitava
as possíveis descrições no caso não-relativístico. Com efeito, agora a linha de mundo das
partículas está restrita pela causalidade a se encontrar sempre dentro do cone de luz, em cada
ponto dela; ou seja, num diagrama t − x, o coeficiente angular da linha de mundo, em cada
ponto, não pode ser menor do que a unidade –ou menor do que 1/c, onde c é a velocidade
da luz no espaço vazio–. O problema de determinar as possíveis formas dinâmicas no regime
relativístico foi estudado pela primeira vez por Dirac em 1949 [1], que colocou o problema do
ponto de vista da compatibilidade da formulação hamiltoniana da mecânica quântica com o
axioma de relatividade; este enfoque tem sido detalhadamente estudado nas Refs. [5, 6] –
vide também o Ap. A–, e pode se resumir no problema de encontrar soluções inequivalentes
para os generadores das transformações infinitesimais, que obedecem à algebra do grupo de
Poincaré. Dirac conseguiu encontrar três formas dinâmicas relativísticas, a saber:

(a) Dinâmica instantânea: Aquela em que as superfícies isocrônicas são superfícies de


coordenada x0 constante, essa coordenada sendo o tempo. Esta é a mesma forma
24 Capítulo 2. Dinâmica da frente de luz na teoria clássica

dinâmica que a do regime não-relativístico, e é aquela na qual a física tem sido mais
estudada. Ela se mostra na Fig. 2.3-(a).

(b) Dinâmica forma-ponto: Nessa forma dinâmica, cujo nome lhe é dado por apresentar
superfícies isocrônicas invariantes sob transformações de rotação em torno a um ponto
fixo (a origem, por exemplo), ditas superfícies são os ramos superiores do hiperbolóide
a2 = x2 , o parâmetro a2 sendo então o tempo da teoria, que se mostra na Fig. 2.3-(b).
A dificuldade especial nessa forma dinâmica se apresenta quando quer-se descrever
uma partícula cuja linha de mundo se encontra precisamente sobre o cone de luz,
então não atravessando nunca os hiperbolóides isocrônicos. Esta dificuldade pode ser
parcialmente superada tomando, por exemplo, a2 = 0, caso no qual os hiperbolóides
degeneram no cone de luz.

(c) Dinâmica da frente de luz: Aqui as superfícies isocrônicas são planos nulos de coordenada
x + constante, essa coordenada sendo o tempo da teoria, como se mostra na Fig. 2.3-
(c). A dificuldade nessa teoria acontece na descrição de linhas de mundo ao longo
de, exatamente, o eixo x − , pois tal linha de mundo encontra-se sobre a superfície
isocrônica, «atravessándo-a» em todos os pontos.

Figura 2.3: (a) Dinâmica instantânea. (b) Dinâmica forma-ponto. (c) Dinâmica da frente de
luz.

Retornando ao estudo feito na Sec. 2.1, vimos que a dinâmica dos campos, atendendo
pelo menos ao fato de obedecerem à equação de Klein-Gordon-Fock, apresenta verdadeira
dificuldade –no sentido de que a equivalência com a dinâmica instantânea não é trivial–
somente no caso em que as superfícies onde são fornecidos os dados iniciais são superfícies
características. Com a definição dada das coordenadas no plano nulo, identifica-se o que se
corresponde ao problema de se definir uma física na dinâmica da frente de luz.
Alguns comentários são requeridos. Em primeiro lugar, além das três formas dinâmicas
encontradas por Dirac, encontrou-se posteriormente mais duas formas dinâmicas possíveis
[7], que têm superfícies isocrônicas: (d) os ramos superiores do hiperbolóide ( x0 )2 − ( x1 )2 −
( x2 )2 = a2 , e (e) os do hiperbolóide ( x0 )2 − ( x3 )2 = a2 ; nos dois casos, sendo o parâmetro a2
o tempo. Em segundo lugar, a discussão recém feita a respeito da possibilidade de definir
novas formas dinâmicas baseia-se na descrição unívoca da linha de mundo da partícula.
Capítulo 2. Dinâmica da frente de luz na teoria clássica 25

No entanto, na teoria do campo isto não é suficiente, pois é necessário também estabelecer
a unicidade da descrição da evolução do campo, isto é, do problema dos valores iniciais
para as diferentes equações de campo. Em terceiro lugar, o limite não-relativístico das
novas formas dinâmicas é a dinâmica instantânea, pois as superfícies isocrônicas, quer os
hiperbolóides, quer as frentes de luz, se aproximam às superficies de x0 constante no limite
c → +∞, visto que o próprio cone de luz se abre infinitamente, fazendo os hiperbolóides
perderem sua curvatura na dinâmica forma-ponto e os planos nulos perderem sua inclinação
na dinâmica da frente de luz; por isso, o limite não-relativístico não constitui um motivo
de preferência da dinâmica instantânea sobre as outras formas dinâmicas: No regime não-
relativístico é impossível diferenciar uma da outra; a finitude de c não «faz aparecer» novas
formas dinâmicas, mas levanta a degenerescência entre elas.

2.3 «Coordinalização» invariante no plano nulo

Como temos estabelecido, a relação entre uma forma dinâmica e outra vai além de uma
simples transformação de coordenadas4 : A verdadeira diferença fundamental é que com
essa mudança tem-se um novo conjunto de dados iniciais, que evoluem causalmente de uma
superfície para outra segundo os geradores dinâmicos da forma particular.
Assim, é possível usar, em qualquer forma dinâmica, qualquer conjunto de coordenadas.
Por exemplo, é perfeitamente possível usar coordenadas no plano nulo e ainda assim estar
na dinâmica instantânea, caso os dados iniciais fossem dados numa superfície de x0 cons-
tante. Isto porque uma transformação das coordenadas não implica uma transformação da
superfície inicial. Por isso, para recuperar a covariância da teoria e assim explicitar que o
sistema de coordenadas nada tem a ver com a forma dinâmica, Rohrlich [12, 13] introduziu
um conjunto de campos vetoriais tais que seja sempre possível levar as quantidades covari-
antes à forma «própria» do plano nulo. Consideremos um sistema inercial de referência, o
qual define sua origem O e seus eixos cartesianos instantâneos segundo a escolha de quatro
campos vetoriais ee (0) , e
e (1) , e
e (2) e e
e(3) , de modo que as coordenadas cartesianas instantâneas
de um ponto P qualquer são obtidas por projeção5 :

ZP
( a) ( a) µ
x ( P) =: e
e µ dx ; ( a ) = (0), (1), (2), (3) , (2.81)
O

expressão esta que é invariante frente a qualquer substituição das coordenadas. Portanto,
( a)
uma transformação de coordenadas muda a x µ , e, claro, às componentes e
e µ , mas o campo
e(a) , assim como as coordenadas x (a) , se mantêm as mesmas. Uma transformação de
vetorial e

4 Uma
transformação de coordenadas não oferece nenhuma diferença importante, pois as equações do
movimento na teoria da relatividade tem caráter tensorial e são, portanto, covariantes frente a toda e qualquer
substituição.
5A forma integral aqui é devida a que, no caso geral de se utilizar coordenadas curvas, o simples produto
( a)
e µ x µ pode não fornecer a informação desejada. Tal produto será suficiente, por outro lado, se as coordenadas
e
x µ estão definidas ao longo de eixos retos.
26 Capítulo 2. Dinâmica da frente de luz na teoria clássica

e(a) e, como consequência,


sistema de referência, por outro lado, muda aos campos vetoriais e
às coordenadas x (a) . Os campos ee(a) são chamados «campos de tétradas», e as coordenadas
x (a) , «coordenadas invariantes». Mais em geral, também outras grandezas podem ser
projetadas com o campo de tétradas para obter sua forma invariante. Em particular, a métrica
gµν se relaciona com a métrica invariante ηe(a)(b) por:

µ
gµν ( x )e e(b)ν ( x ) = ηe(a)(b)
e( a) ( x )e , (2.82)

ou, inversamente:
( a) (b)
ηe(a)(b) ( x )e
e µ ( x )e
e ν (x) = gµν . (2.83)

Agora, como mencionado (vide a Ref. [161]): «[...] a eleição da base de tétradas depende das
simetrias subjacentes do espaço-tempo e é, em boa medida, parte do problema». É claro, quando
o autor se refere às «simetrias do espaço-tempo», deve-se entender que entre elas estão
também as simetrias do problema a se resolver. E como temos insistido em que alguns
problemas se simplificam com o uso da forma dinâmica do plano nulo, algumas vezes será
vantajoso escolher a base de tétradas exigindo que a métrica invariante dessa dinâmica seja
igual à métrica nesse conjunto de coordenadas [vide a Eq. (2.73)]:
 
0 0 0 1
 
0 −1 0 0
[η(a)(b) ] = 
  . (2.84)
 0 0 − 1 0 

1 0 0 0

Porém, as componentes do tensor métrico gµν dependem unicamente do sistema de coor-


denadas, e não da base de tétradas, de forma que, denotando por e(+) , e(1) , e(2) e e(−) os
campos de tétradas correspondentes ao plano nulo, ter-se-á a relação:

(0) (0) (1) (1) (2) (2) (3) (3)


e
e e ν
µe −e
e e ν
µe −e
e e ν
µe −e
e e ν
µe = gµν
(+) (−) (−) (+) (1) (1) (2) (2)
=e µe ν +e µe ν −e µe ν −e µe ν , (2.85)

da qual uma solução é6 :

1  (0)  1  (0) 
e(+) = √ ee +e e(3) , e(−) = √ ee −e e (3) , e (1) = e
e (1) , e (2) = e
e (2) . (2.86)
2 2

E, correspondentemente:

1   1  
e(+) = √ e e(3) , e(−) = √ e
e (0) + e e (0) − e
e (3) , e (1) = e
e (1) , e (2) = e
e (2) . (2.87)
2 2

Os campos de tétradas da dinâmica da frente de luz, por sua definição, apresentam as

6A
solução escolhida reflete a eleição feita das coordenadas no plano nulo dada na Eq. (2.71), com a qual é
compatível.
Capítulo 2. Dinâmica da frente de luz na teoria clássica 27

seguintes propriedades –usar-se-á doravante α, β ∈ {1; 2}–:

e(+) · e(+) = 0 = e(−) · e(−) , e(+) · e(−) = 1 ,

e(α) · e( β) = −δαβ , e(+) · e(α) = 0 = e(−) · e(α) . (2.88)

Particularmente, é fácil verificar que quando as tétradas assumem seus valores canônicos,
isto é, com componentes e(+) = (1; 0; 0; 0), e(1) = (0; 1; 0; 0), e(2) = (0; 0; 1; 0) e e(−) =
(0; 0; 0; 1), a métrica gµν se iguala com a métrica invariante dada na Eq. (2.84), [ gµν ] = [η(a)(b) ],
o que significa que as coordenadas invariantes coincidem com as coordenadas no plano nulo,
como deve ser por consistência.
n o
Sendo o conjunto e(a) , a ∈ {+; 1; 2; −}, uma base do espaço-tempo de Minkowski,
pode-se decompor qualquer vetor A como combinação linear de seus elementos. Escrevamos:
A = ∑ A(a) e(a) . Multiplicando por um elemento da base dual –base de co-tétradas– e(b) :
( a)

∑ A( a) e (b) · e( a) = ∑ A( a) δ
(b)
e(b) · A = ( a)
= A(b) .
( a) ( a)

Portanto, o vetor A tem componentes invariantes:

A(+) := A · e(+) , A(α) := A · e(α) , A(−) := A · e(−) , (2.89)

e decomposição na base de tétradas:

2
A = A(+) e(+) + A(⊥) e(⊥) + A(−) e(−) , A(⊥) e(⊥) ≡ ∑ A(α) e(α) . (2.90)
α =1

O produto escalar de dois vetores A e B pode agora ser escrito em função de suas componen-
tes invariantes no plano nulo:

A · B = A(+) B(−) + A(−) B(+) − A(⊥) B(⊥) . (2.91)

Em particular, o vetor posição7 , x, tem decomposição: x = x (+) e(+) + x (−) e(−) + x (⊥) e(⊥) ,
e também o operador derivada: ∂ = e(+) ∂(−) + e(−) ∂(+) − e(⊥) ∂(⊥) , cujas componentes
invariantes são dadas pela definição de derivadas direcionais:

∂ ∂ ∂
∂(+) = e(+) · ∂ = , ∂(−) = e(−) · ∂ = , ∂(⊥) = e(⊥) · ∂ = . (2.92)
∂x (+) ∂x (−) ∂x (⊥)

Finalmente, como escolhemos a coordenada x (+) como sendo o tempo, ∂(+) será a derivada
temporal. Cada plano nulo de x (+) constante é gerado pelos vetores e(⊥) e e(−) , e tem
elemento de volume que denotar-se-á por d3 x := dx (1) dx (2) dx (−) ≡ d2 x (⊥) dx (−) .

7 Este
é um vetor no espaço-tempo de Minkowski uma vez que a origem –por exemplo, a posição do
observador ou um evento particularmente escolhido– tem sido fixado. Isso é devido a seu caráter afim e não
simplesmente linear. A respeito deste ponto, consultar a Ref. [158].
28 Capítulo 2. Dinâmica da frente de luz na teoria clássica

2.4 Teoria lagrangiana do campo clássico no plano nulo

Fixaremos agora a consideração na teoria do campo clássico, ou seja, na descrição ondu-


latória da partícula individual por suas equações do movimento, sem sujeitar ainda suas
soluções aos axiomas da teoria quântica –isto é, desconsiderando as exigências da interpreta-
ção probabilística, a possibilidade de mudança do número e identidade das partículas, et
cetera–. Para tal fim, aproveitar-se-á a possibilidade introduzida pela «coordinalização» inva-
riante para trabalhar com equações e grandezas escritas em linguagem covariante; os objetos
correspondentes no plano nulo serão então obtidos por projeção com a base de tétradas. A
abordagem que utilizaremos, quiçá a mais habitual para o estudo dos campos, é a lagrangi-
ana. Como ela é bem conhecida e, por outro lado, existem excelentes referências para seu
estudo –por exemplo, as Refs. [100, 162, 160]–, nos limitaremos aqui apenas a oferecer um
brevíssimo resumo com o intuito de fixar a notação.
Seja u A ( x ) ( A = 1, · · · , N ) a componente A-ésima de um conjunto de campos. Estas
componentes são genéricas, quer dizer, podem pertencer a campos de diferente natureza. A
integral de ação definida na região espaço-temporal Ω ⊆ M é definida como:
Z
A [u] := d4 xL [u; ∂u]( x ) , (2.93)

com L a densidade lagrangiana da primeira ordem –isto é, que depende da derivada dos
campos de até primeira ordem–. Aplicando uma transformação cujos efeitos nas coordenadas
e campos são dados, infinitesimalmente, pelas equações:

x ′µ = x µ + δx µ , u′ A ( x ′ ) = u A ( x ) + δu A ( x ) , (2.94)

a integral de ação tem variação:


Z Z Z
4 ′ ′ ′ ′ ′
d x L [u ; ∂ u ]( x ) − 4
d4 x δL + L ∂µ δx µ

δA [u] := d xL [u; ∂u]( x ) = . (2.95)
Ω′ Ω Ω

Essa expressão pode ser escrita em forma conveniente definindo a derivada de Euler da
densidade lagrangiana,
δL ∂L ∂L
:= − ∂µ , (2.96)
δu A ∂u A ∂(∂µ u A )
e a quantidade:
∂L
Θ ∂ν u A − δ ν L
µ µ
ν := . (2.97)
∂(∂µ u A )
Então a Eq. (2.95) é equivalente a:
Z   
δL  A  ∂L
4
δu − ∂µ u δx − ∂µ Θ ν δx −
A A
µ µ ν
δA [u] = d x δu . (2.98)
δu A ∂(∂µ u A )

Escrita nessa forma, é possível a aplicação direta de princípios variacionais à integral de ação.
Capítulo 2. Dinâmica da frente de luz na teoria clássica 29

Princípio de ação estacionária de Ostrogradskii-Hamilton: Campo físico é aquele cuja forma fun-
cional (δx µ = 0) é de tal sorte que, entre duas configurações fixas do sistema ( δu A ( x ) = 0), a

∂Ω
integral de ação adota um valor estacionário (δA [u] = 0) qualquer que seja a região Ω.

As equações de Euler-Lagrange são consequência do princípio de ação estacionária, pois


na Eq. (2.98) ele implica que:

δL
=0 ; A = 1, · · · , N . (2.99)
δu A

Teorema 2.2 (Primeiro teorema de Nöther): Se a integral de ação de um dado sistema físico é in-
variante, módulo termos de superfície, em relação a um determinado grupo de Lie Gr de r parâmetros,
então r combinações linearmente independentes de certas derivadas de Euler da densidade lagrangi-
ana são iguais a divergências.

Prova: Denotemos por ϵ a (a = 1, · · · , r) os parâmetros do grupo Gr , e consideremos que


a transformação age sobre as coordenadas e campos mediante as representações Xa e Ia ,
respectivamente:
δx µ = ϵ a [ Xa x ]µ , δu A = ϵ a [ Ia u] A . (2.100)

Por hipótese do teorema, a ação é invariante, módulo termos de superfície, frente às transfor-
mações da Eq. (2.100): d4 x∂µ (ϵ a δa Ωµ ). Portanto, na Eq. (2.98):
R
∂Ω

Z  
δL  
4
[ Ia u ] − ∂ µ u [ X a x ] − ∂ µ J a ϵ a = 0
A A µ µ
d x , (2.101)
δu A

com:
∂L
:= Θ ν [ Xa x ]ν − [ Ia u] A − δa Ωµ
µ µ
J a . (2.102)
∂(∂µ u A )
Logo, a independência linear dos parâmetros do grupo Gr , ϵ a , permite escrever a tese do
teorema:
δL  A A

µ
[ I a u ] − ∂ µ u [ X a x ] µ
= ∂µ J a ; a = 1, · · · , r , (2.103)
δu A
quod erat demonstrandum. ■

Para os campos físicos, que satisfazem às equações de Euler-Lagrange, as identidades


µ
da Eq. (2.103) se tornam r leis de conservação das densidades de corrente J a , pois o lado
esquerdo das mencionadas identidades se anula. Nesse caso, as correspondentes cargas
conservadas, chamadas «cargas de Nöther», são obtidas por integração da densidade de
corrente sobre uma superfície Σ com elemento de área d3 σµ = d3 σnµ , com nµ o vetor normal
a Σ: Z
d3 σ ( x ) n µ J a ( x )
µ
Q a := . (2.104)
Σ

(+)
Na dinâmica da frente de luz a superfície Σ é o plano nulo x (+) = x0 constante, com vetor
30 Capítulo 2. Dinâmica da frente de luz na teoria clássica

normal8 n = e(−) . Assim:

dQ a
Z Z
(+)
d3 xe(−)µ J a ( x ) = d3 xJ
µ
Qa = a (x) ; =0 . (2.105)
dx (+)
(+) (+)
x (+) = x0 x (+) = x0

Típicamente, as densidades de corrente são formas bilineares dos campos, então as cargas de
Nöther existirão (a integral que as define converge) se os campos, assim como suas derivadas
transversais e longitudinal, são de quadrado integrável no plano nulo. Essas condições
incluem naturalmente à condição assintótica da Eq. (2.79) que substitui aos dados iniciais na
superfície de x (−) constante.
Consideremos, particularmente, o gerador das translações temporais no plano nulo, isto
é, o hamiltoniano. Para a translação por um vetor constante ϵµ , ou seja, para a transformação
x ′µ = x µ + ϵµ , u′ A ( x ′ ) = u A ( x ), ter-se-á que:

[ Iν u] A = 0 .
µ
[ Xν x ] µ = δ ν , (2.106)

Como a densidade lagrangiana é escalar frente às transformações do grupo de Poincaré,


deverá ser δL = 0, o que na Eq. (2.95) implica que a integral de ação é invariante sob
translações, pois os parâmetros ϵµ são constantes, e assim δν Ωµ = 0. Substituindo a Eq.
(2.106) na (2.102), obtém-se a densidade de corrente conservada:

= Θ σ [ Xν x ] σ = Θ
µ µ µ
J ν ν , (2.107)

que é chamado «tensor de energia-momento». A carga de Nöther que lhe corresponde,


com respeito ao plano nulo, é o «vetor de energia-momento», com componentes [vide a Eq.
(2.105)]: Z
(+)
Pν = d3 xΘ ν . (2.108)
(+)
x (+) = x0

As componentes invariantes desse vetor são obtidas projetando seu índice ν com o campo
de tétradas da dinâmica da frente de luz:
Z Z
(+) (+)
ν
P(a) = e(a) Pν = d xe(a) Θ
3 ν
ν = d3 xΘ ( a)
. (2.109)

Assim, o momento invariante no plano nulo possui as componentes:


Z Z
3 (+) (+)
P(⊥) = d xΘ (⊥)
, P(−) = d3 xΘ (−)
, (2.110)

enquanto que o hamiltoniano invariante tem expressão:


Z Z Z
3 (+) 3 (+)(−)
P(+) = d xΘ (+)
= d xΘ = d3 xΘ(−)(+) . (2.111)

8 Note-seque o vetor e(+) , que poder-se-ia pensar inicialmente que seja o vetor normal, falha, pois não é
ortogonal a e(−) , localizado sobre o plano nulo, segundo a Eq. (2.88).
Capítulo 2. Dinâmica da frente de luz na teoria clássica 31

E sobre a teoria lagrangiana geral do campo clássico basta o que foi dito. A partir desse
ponto, estudar-se-á os diversos campos particulares usados na modelagem da matéria. E
uma vez clara a ideia subjacente às coordenadas invariantes, não escreveremos mais os
índices entre parênteses.

2.5 Campo escalar


Seja φ um campo escalar complexo, cujas equações do movimento são as de Klein-
Gordon-Fock:
(□ + m2 ) φ( x ) = 0 ; (□ + m2 ) φ∗ ( x ) = 0 . (2.112)

Como não há outras equações além dessas, o problema de Goursat para o campo escalar é
simplesmente aquele que já estudou-se na seção 2.1. A densidade lagrangiana que deriva
nessas equações é:
L φ = ∂ µ φ ∗ ∂ µ φ − m2 φ ∗ φ . (2.113)

Com ela pode-se obter o tensor de energia-momento desse campo:

∂L φ ∂L φ
Θ ∂ν φ∗ − δ ν L φ
µ µ
ν = ∂ν φ + ∗
∂(∂µ φ) ∂(∂µ φ )
= ∂ µ φ ∗ ∂ ν φ + ∂ ν φ ∗ ∂ µ φ − δ ν ∂ σ φ ∗ ∂ σ φ + m2 δ ν φ ∗ φ .
µ µ
(2.114)

O hamiltoniano invariante do plano nulo será, portanto:


Z
d3 x ∂ ⊥ φ ∗ ∂ ⊥ φ + m2 φ ∗ φ .
 
P+ = (2.115)

Consideremos agora a equação de Klein-Gordon-Fock [Eq. (2.112)] à que o campo escalar


obedece. Nas coordenadas do plano nulo:

□ = 2∂+ ∂− − (∂⊥ )2 ; (∂⊥ )2 = ∂21 + ∂22 . (2.116)

A solução dela será facilmente encontrada tomando a transformada de Fourier do campo:


Z
++p −+p ⊥
φ( x ) = (2π )−3/2 dp+ dp− d2 p⊥ φ̂( p)e−i( p+ x −x ⊥x ) , (2.117)

do qual:
Z  
(□ + m2 ) φ( x ) = −(2π )−3/2 dp+ dp− d2 p⊥ 2p+ p− − ω 2p φ̂( p)e−ipx = 0 , (2.118)

com: ω 2p := m2 + ( p⊥ )2 . Logo, deve ser satisfeita a relação distribucional 2p+ p− −


ω 2p φ̂( p) = 0, cuja solução é dada por [159]:


!
  1 ω 2p
φ̂( p) = δ 2p+ p− − ω 2p φ( p) = δ p+ − φ( p) , (2.119)
|2p− | 2p−
32 Capítulo 2. Dinâmica da frente de luz na teoria clássica

com φ( p) uma função arbitrária. Substituindo na Eq. (2.117) e separando a região de


integração da variável p+ no domínio positivo e no negativo:

+∞

 Z0 dp
!
Z Z
+ ω 2p
φ( x ) = (2π )−3/2 d2 p ⊥ dp− δ p+ − φ( p)e−ipx
 |2p− | 2p−
−∞ −∞
+∞ ! 
Z
dp+ ω 2p 
+ δ p+ − φ( p)e−ipx . (2.120)
|2p− | 2p− 
0

Façamos na primeira integral a substituição p → − p; usando então a propriedade de simetria


da distribuição delta de Dirac, isto é, que δ( x ) = δ(− x ), obtém-se que:

+∞ +∞ !
−3/2
Z Z Z
dp+ ω 2p h i
φ( x ) =(2π ) 2
d p⊥ dp− δ p+ − φ(− p)eipx + φ( p)e−ipx .
|2p− | 2p−
−∞ 0
(2.121)

Como é indicado pelos limites de integração, aqui é p+ > 0. Mas o suporte da distribuição
delta de Dirac exige que seja p+ = ω 2p /2p− , e como ω 2p > 0, é forçoso que seja p− > 0.
Assim é que deve-se introduzir a função de Heaviside Θ ( p− ), e então escrever:

+∞ !
−3/2
Z Z Z
dp+ ω 2p h
−ipx
i
φ( x ) =(2π ) d p⊥2
dp− Θ ( p− ) δ p+ − φ(− p)e ipx
+ φ( p)e .
|2p− | |2p− |
0
(2.122)

Integrando finalmente na variável p+ :

−3/2
Z
d3 p h i
−ipx
ω 2p
φ( x ) =(2π ) Θ ( p− ) φ(− p)e + φ( p)e
ipx
, E := > 0 , (2.123)
|2p− | |2p− |

p+ = E

em que escrevemos: d3 p := d2 p⊥ dp− . Note-se que essa expressão é relativísticamente


correta, pois a medida de integração é invariante sob transformações de Poincaré:

d2 p⊥ dp− d4 p
Z Z
Θ ( p− ) = Θ ( p− ) δ ( p+ − E)
|2p− | |2p− |
Z
= d4 pΘ ( p− ) δ( p2 − m2 ) . (2.124)

É habitual realizar a normalização seguinte9 [100]:

φ( p) φ(− p)
φ ( p) := p , φ (− p) := p , (2.125)
|2p− | |2p− |

9O motivo é a simplificação dos geradores do grupo de Poincaré quando escritos em função das amplitudes
φ( p); tal normalização se torna importante na teoria ondulatória, pois determina as relações de comutação dos
operadores de emissão e absorção, como se verá no seguinte capítulo.
Capítulo 2. Dinâmica da frente de luz na teoria clássica 33

com a qual:

d3 p
Z h i
φ( x ) =(2π )−3/2 Θ ( p− ) φ ( p) e−ipx + φ (− p) eipx . (2.126)

p
|2p− | p+ = E

Finalmente, se o campo clássico é real, isto é, se φ( x ) = φ∗ ( x ), então às amplitudes dos


diferentes modos deve ser imposta a condição:

φ(− p)∗ = φ( p) , φ( p)∗ = φ(− p) . (2.127)

Assim, a expansão como integral de Fourier do campo escalar real é:

d3 p
Z h i
φ( x ) =(2π )−3/2 Θ ( p− ) φ ( p) e−ipx + φ ( p)∗ eipx . (2.128)

p
|2p− | p+ = E

2.6 Campo de Dirac

Seja ψ o campo fermiônico de Dirac. As equações de Dirac são10 :


←−
∂ − m)ψ( x ) = 0 ,
(i / ψ( x )(i /
∂ + m) = 0 , (2.129)

as quais provêm da densidade lagrangiana:

i←→
 
Lψ = ψ ∂ −m ψ.
/ (2.130)
2

O tensor de energia-momento desse campo é:

i←→
 
i
Θ
µ  µ
ν = ψγµ ∂ν ψ − ∂ν ψγµ ψ − δ ν ψ ∂ −m ψ,
/ (2.131)
2 2

e, particularmente, o hamiltoniano invariante do plano nulo é:

i  −←
→ ⊥←
→ 
Z  
3
P+ = d x − ψ γ ∂ − + γ ∂ ⊥ ψ + mψψ . (2.132)
2

10A definição do adjunto de Dirac ψ é obtida da forma que segue: A equação de Dirac nas coordenadas do
plano nulo é:
[i ( γ+ ∂+ + γ− ∂− + γ⊥ ∂⊥ ) − m ] ψ ( x ) = 0 .
Tomando o adjunto no espaço das matrizes (isto é, tomando o complexo conjugado seguido pela transposição),
as derivadas, sendo reais as coordenadas, não mudam, enquanto que: (γ a )† = γ0 γ a γ0 , de forma que a equação
muda para (fatorando o sinal negativo, então removendo-o):

ψ ( x ) † [ i ( γ0 γ + γ0 ∂ + + γ0 γ − γ0 ∂ − + γ0 γ ⊥ γ0 ∂ ⊥ ) + m ] = 0 .

Multiplicando pela direita por γ0 e usando que (γ0 )2 = 1:

ψ ( x ) † γ0 [ i ( γ + ∂ + + γ − ∂ − + γ ⊥ ∂ ⊥ ) + m ] = 0 ,

do qual concluímos que o espinor adjunto de Dirac na dinâmica da frente de luz continúa a ser ψ( x ) := ψ( x )† γ0 .
34 Capítulo 2. Dinâmica da frente de luz na teoria clássica

2.6.1 Componentes dinâmicas e não-dinâmicas

Investiguemos em detalhe a equação de Dirac [Eq. (2.129)]. Nas coordenadas do plano


nulo, separando a derivada temporal ∂+ :
 
iγ+ ∂+ ψ = m − iγ− ∂− − iγ⊥ ∂⊥ ψ . (2.133)

A matriz γ+ não pode ser invertida11 , pois ela tem determinante nulo –o qual pode ser visto
diretamente pelo fato de que seu quadrado é nulo devido à relação de anti-comutação a que
as matrizes de Dirac satisfazem (o que indica também que a matriz γ− é não invertível)–.
Portanto, poder-se-á isolar a derivada temporal, com a finalidade de escrever a Eq. (2.133)
na forma da equação de Schrödinger, somente pela definição dos projetores:

1 1
Λ± := 1 ± γ0 γ3 = √ γ0 γ ±

, (2.134)
2 2

os quais exibem as propriedades seguintes:

Λ2± = Λ± ; Λ± Λ∓ = 0 ; Λ+ + Λ− = 1 , (2.135)

como é possível provar por cálculo direto. Da mesma forma podem ser mostradas as
igualdades que seguem:

Λ ± γ0 = γ0 Λ ∓ , Λ + γ0 γ − = 0 , Λ − γ0 γ − = γ0 γ − Λ − , Λ ± γ0 γ ⊥ = γ0 γ ⊥ Λ ∓ .
(2.136)
Finalmente, definimos as duas projeções do campo de Dirac segundo:

ψ± := Λ± ψ ; ψ = ψ+ + ψ− . (2.137)

Com isto, multiplicando a Eq. (2.133) por γ0 pela esquerda e usando a definição de Λ+ ,
obtém-se:
√  
i 2∂+ ψ+ = γ0 m − iγ− ∂− − i∂⊥ ∂⊥ ψ . (2.138)

Multiplicando pela esquerda por Λ+ e usando as propriedades mostradas na Eq. (2.136),


chega-se a:
√  
i 2∂+ ψ+ = γ0 m − iγ⊥ ∂⊥ ψ− . (2.139)

Analogamente, multiplicando a Eq. (2.138) por Λ− pela esquerda e usando a Eq. (2.136):
√  
i 2∂− ψ− = γ0 m − iγ⊥ ∂⊥ ψ+ . (2.140)

A Eq. (2.139) é uma equação dinâmica para a componente ψ+ , a qual é, portanto, chamada
«componente dinâmica» do campo de Dirac. A Eq. (2.140), por outro lado, não é uma equação
dinâmica para ψ− , visto que nenhuma derivada temporal aparece nela; ψ− é chamada, por

11A expressão das matrizes de Dirac no plano nulo e na representação de Weyl é mostrada no Ap. B.
Capítulo 2. Dinâmica da frente de luz na teoria clássica 35

esse motivo, «componente não-dinâmica», e a Eq. (2.140) é uma equação de vínculo, a qual
pode ser invertida da seguinte forma, explicitando o fato de que ψ− é automaticamente
conhecida uma vez que o é ψ+ :

1  
ψ− = √ γ0 m − iγ⊥ ∂⊥ ψ+ . (2.141)
i 2∂−

Este vínculo pode ser usado para eliminar ψ− na Eq. (2.139). Encontra-se que a equação do
movimento da componente dinâmica do campo de Dirac não é outra senão a equação de
Klein-Gordon-Fock:
□ + m2 ψ+ = 0 .

(2.142)

2.6.2 Problema de Goursat

O problema de Goursat para o campo de Dirac pode ser abordado da mesma forma
que na Seç. 2.1: Solucionando primeiro o problema de Cauchy (na dinâmica instantânea) e
passando depois à dinâmica do plano nulo por aplicação do teorema de Gauss num volume
convenientemente escolhido. Como, no entanto, este caminho já foi percorrido anteriormente
–e não há dificuldades em percorrê-lo para o caso presente se assim for desejado–, é mais
instrutivo oferecer uma outra forma de obter a desejada solução. Tal será feito explorando
a divisão recém feita entre as componentes dinâmicas e as não-dinâmicas. Devido a que
as componentes dinâmicas satisfazem à equação de Klein-Gordon-Fock [Eq. (2.142)], o
problema de Goursat tem a solução dada na Eq. (2.80), que por uma integração por partes
pode ser escrita da seguinte forma:
Z
x
ψ+ ( x ) = d3 y2∂− D ( x − y)ψ+ (y) . (2.143)
y+ =y0+

As componentes não-dinâmicas são então determinadas pela substituição da Eq. (2.143) na


(2.141), da qual obtém-se:
√ Z  
ψ− ( x ) = −i 2 d3 yγ0 m − iγ⊥ ∂⊥
x
D ( x − y)ψ+ (y) . (2.144)
y+ =y0+

E pelo uso das definições mostradas na Eq. (2.137):


Z h √  i
ψ( x ) = x
d3 y 2∂− − i 2γ0 m − iγ⊥ ∂⊥
x
D ( x − y)Λ+ ψ(y) . (2.145)
y+ =y0+

2
Usando então as Eqs. (2.134)-(2.136), assim como o fato já mencionado de ser (γ+ ) = 0,
vê-se que é possível escrever a Eq. (2.145) na forma sucinta:
Z
ψ ( x ) = −i d3 yS( x − y)γ+ ψ(y) , (2.146)
y+ =y0+
36 Capítulo 2. Dinâmica da frente de luz na teoria clássica

com a distribuição S( x ) definida como:

S ( x ) : = (i /
∂ + m) D ( x ) . (2.147)

Tendo encontrado a solução, o que implica que ela é única, pode-se afirmar que o problema
de Goursat para o campo de Dirac está bem definido. Por outro lado, no problema de Cauchy
é necessário conhecer o campo ψ(0; x), ou seja, quatro funções –suas derivadas não são
necessárias porque a equação de Dirac é da primeira ordem–; o mesmo número de dados é
indispensável na solução apresentada: a Eq. (2.143) requer o conhecimento de ψ+ em x + = 0
e x − = x0− , fazendo igualmente um total de quatro funções –ter substituído essa última por
uma condição assintótica não muda o número de dados iniciais–.

2.6.3 Espinores de polarização

Como cada uma das componentes do campo de Dirac, ψa ( x ), satisfaz à equação de Klein-
Gordon-Fock,
(□ + m2 )ψa ( x ) = 0 , (2.148)

cada uma dessas componentes irá ter uma expressão semelhante àquela da Eq. (2.126):

d3 p
Z h i
ψa ( x ) =(2π )−3/2 Θ( p− ) ψa ( p) e−ipx + ψa (− p) eipx . (2.149)

p
|2p− | p+ = E

As amplitudes espinoriais ψa ( p) que aqui aparecem devem ser tais que ψa ( x ) satisfaçam
à equação de Dirac [Eq. (2.129)]: Elas carregam a informação «adicional» não contida na
equação de Klein-Gordon-Fock, isto é, a informação dos vínculos, definindo os possíveis
estados de polarização do campo de Dirac. Substituindo a Eq. (2.149) na (2.129):

d3 p
Z h i
0 = (2π )−3/2 p − m)ψ ( p) e−ipx − (/
Θ( p− ) (/ p + m)ψ (− p) eipx , (2.150)

p
|2p− | p+ = E

do qual conclui-se que, uma vez que a solução de frequência positiva e a de frequência
negativa são linearmente independentes, deverão ser verificadas as equações:

p − m)ψ ( p) = 0 ;
(/ p + m)ψ (− p) = 0 .
(/ (2.151)

Apresentamos à continuação, inspirados na Ref. [21], suas soluções. Partimos de:

p − m)u ( p) = 0 .
(/ (2.152)

De forma semelhante a como foram obtidas as Eqs. (2.139) e (2.140), encontra-se que:
√  
2p+ u+ = γ0 m − γ⊥ p⊥ u− , (2.153)
√  
2p− u− = γ0 m − γ⊥ p⊥ u+ , (2.154)
Capítulo 2. Dinâmica da frente de luz na teoria clássica 37

lembrando que é p+ = E [vide a Eq. (2.150)]. A estratégia para solucionar essas equações
será escrever uma base para uma das projeções do espinor e usar então a Eq. (2.153) ou a
Eq. (2.154) para encontrar a outra. No Ap. B se mostra a forma explícita dos projetores [Eq.
(B.5)]; dela observa-se que uma base para u− será:
   
0 0
   
(1) 1 (−1) 0
u− =
0
 , u− =
1
 . (2.155)
   
0 0

Os espinores u+ correspondentes são obtidos usando a Eq. (2.153):


   
− p1 + ip2 m
   
(1) 1  0  (−1) 1  0 
u+ =√    , u+ =√   . (2.156)
2E  0 
 2E 
 0 

m p1 + ip2

Ora a Eq. (2.137) revela que a solução completa é obtida somando as componentes u− e u+ ,
o que leva a obter:
   
− p1 + ip2 m
 √   
a0  2E  a0 
 √ 0 
u1 = √   , u −1 =√  . (2.157)
2E 
 0 
 2E 
 2E  
m p1 + ip2

Escolhemos, convenientemente, o fator de normalização a0 como sendo12 :


s
E
a0 = √ . (2.158)
2 | p− |

Com isto:
   
− p1 + ip2 m
 √   
1  2E  1 
 √ 0 
u1 = √ q √   , u −1 = √ q√  . (2.159)
2E

2 | p− |  0 
 2E

2 | p− |  2E  
m p1 + ip2

12 O mesmo que na normalização das amplitudes do campo escalar na Eq. (2.125), essa escolha é livre. Seu
valor se refletirá, por exemplo, nas regras de soma que estamos prestes a obter [vide as Eqs. (2.161) e (2.166)].
38 Capítulo 2. Dinâmica da frente de luz na teoria clássica

Assim, é possível calcular diretamente:

u1 u1† + u−1 u†−1 =


 √ √ 
p2⊥ + m2
− 2E ( p1 − ip2 ) 2mE 0
 √ 2
√ 
1 − 2E ( p1 + ip2 ) 2E 0 2mE 
√  √ √  .
2E 2 | p− | 
 2mE 0 2E2 2E ( p1 − ip2 )
√ √ 2 2

0 2mE 2E ( p1 + ip2 ) p⊥ + m

Multiplicando pela direita por γ0 :


 √ 
m 0 − ( p1 − ip2 )
2 | p− |
 √ 
1  √0
 m − ( p1 + ip2 ) 2E 
u 1 u 1 + u −1 u −1 = . (2.160)
|2p− |  2E p1 − ip2 m 0 
 √ 
p1 + ip2 2 | p− | 0 m

Daí que, lembrando da representação de Weyl das matrizes de Dirac –vide o Ap. B–,
reconhece-se que a equação anterior se iguala a:

Eγ+ + | p− | γ− + p⊥ γ⊥ + m
∑ us us =
|2p− |
. (2.161)
s=±1

Dar-se-á agora, por método análogo, solução à segunda das Eqs. (2.151), quer dizer:

(/
p + m)v = 0 , (2.162)

da qual se segue, após projeção com Λ± , que as componentes do espinor v se relacionam por:

γ0 m + p ⊥ γ ⊥

v+ = − √ v− . (2.163)
2E

Usando a mesma base apresentada na Eq. (2.155) e usando a relação da Eq. (2.163), obtém-se:
   
p1 − ip2 m
   
(1) 1  0  (−1) 1  0 
v+ = −√   , v+ = −√   . (2.164)
2E 
 0 
 2E 
 0 

m − p1 − ip2

A Eq. (2.137) implica por sua vez que a solução completa é:


  

− p1 + ip2 −m
 √   
1  2E  1  √0
 
v1 = √ q √   , v −1 = √ q√  . (2.165)
2E 2 | p− |

 0 
 2E 2 | p− |

 2E 

−m p1 + ip2

O cálculo direto mostra também que a seguinte regra de soma rege para os espinores de
Capítulo 2. Dinâmica da frente de luz na teoria clássica 39

polarização vs :
Eγ+ + | p− | γ− + p⊥ γ⊥ − m
∑ vs vs =
|2p− |
. (2.166)
s=±1

2.7 Campo eletromagnético


As equações do campo eletromagnético são as equações de Maxwell, que no espaço vazio
se leem [160] (em unidades com c = 1, como tem sido determinado de início):

∂B ∂E
∇·E = 0 ; ∇·B = 0 ; ∇×E+ =0 ; ∇×B− =0. (2.167)
∂t ∂t

Em função do «tensor de Faraday» Fµν , definido da forma seguinte:


 
0 Ex Ey Ez
 
 − Ex 0 − Bz By 
[ Fµν ] :=   = −[ Fνµ ] , (2.168)
−E Bz 0 − Bx 
 y 
− Ez − By Bx 0

as equações de Maxwell no vácuo se escrevem:

∂µ F µν = 0 , ∂ρ Fµν + ∂µ Fνρ + ∂ν Fρµ = 0 , (2.169)

essa última conhecida como «identidade de Bianchi». Essas equações permitem a introdução
do «potencial eletromagnético», Aµ ( x ), segundo:

Fµν =: ∂µ Aν − ∂ν Aµ . (2.170)

A esse campo chamar-se-á doravante «campo eletromagnético», ou às vezes –para explicitar


que ele será considerado livre– «campo da radiação». Enquanto que a identidade de Bian-
chi se mantém idênticamente satisfeita pela introdução do potencial eletromagnético, sua
equação do movimento [primeira das Eqs. (2.169)] se reescreve:

□ Aν ( x ) − ∂ν ∂µ Aµ ( x ) = 0 . (2.171)

E essa pode ser obtida da densidade lagrangiana:

1
L A = − Fµν F µν . (2.172)
4

2.7.1 Componentes dinâmicas e não-dinâmicas. Condição de gauge


do plano nulo
Poderia parecer, da Eq. (2.171), que o campo da radiação não é obrigado a satisfazer
à equação de Klein-Gordon-Fock. No entanto, o termo adicional pode ser removido pela
imposição de uma condição subsidiária (condição de gauge ou de calibre) cuja possibilidade
40 Capítulo 2. Dinâmica da frente de luz na teoria clássica

se manifesta pela não unicidade da relação entre o potencial e os campos E e B: Estes


não são modificados se o potencial é re-definido pela adição de um termo de divergência,
Aµ → Aµ + ∂µ f 13 . Para tal remoção bastará exigir que seja ∂ν ∂µ Aµ = 0, que é o mesmo


que dizer ∂µ Aµ = constante; impondo então que o campo se anula no infinito, a anterior
constante deve por força ser nula e, assim, a equação de Klein-Gordon-Fock é satisfeita sob a
«condição de gauge de Lorenz»14 :

∂µ Aµ ( x ) = ∂+ A+ + ∂⊥ A⊥ + ∂− A− = 0 . (2.173)

Essa condição de gauge elimina um grau de liberdade da teoria, mas não elimina por
completo a liberdade de gauge, pois a equação de Klein-Gordon-Fock e a condição de gauge
de Lorenz ainda são satisfeitas se se opera uma transformação de gauge adicional com
uma função harmônica15 , □ f = 0. Essa última liberdade pode ser suprimida impondo
uma condição adicional; a simplificação máxima na dinâmica da frente de luz consiste em
tornar a condição de gauge de Lorenz numa relação puramente cinemática, eliminando nela
toda dependência temporal; para o que é suficiente exigir que seja ∂+ A+ = 0, mas então
a equação □ A+ = 0 será igual a ∂2⊥ A+ = 0, cuja solução, sob as condições assintóticas de
desvanecimento no infinito, é a nula. A essa se chama a «condição de gauge do plano nulo»16 :

A+ ( x ) = 0 . (2.174)

Isto elimina toda a liberdade de gauge, mostrando, além do mais, que o campo eletromag-
nético possui dois graus de liberdade. Efetivamente, toda a informação está contida nas
equações dinâmicas para as componentes transversais:

□ Aα ( x ) = 0 , (2.175)

e nas equações de vínculo que provêm das condições de gauge [Eqs. (2.173) e (2.174)]:

1
A+ = 0 , A− = − ∂α Aα . (2.176)
∂−

As componentes transversais Aα são chamadas as «componentes dinâmicas» do campo da


radiação, enquanto que A+ e A− são as «não-dinâmicas», por estarem totalmente determina-
das pelos vínculos.

É útil mencionar, adicionalmente, que, como afirmado nas Refs. [12, 13, 23], a análise
feita do problema de Goursat [vide a Seç. 2.1] pode ser fácilmente estendida para um campo

13 Mais detalhes podem ser encontrados, por exemplo, na Seç. 18 da Ref. [160].
14 Essa condição de gauge é sempre atingível: Seja g( x ) = ∂µ Aµ ( x ). O campo A′µ = Aµ + ∂µ f satisfará à
condição de gauge de Lorenz se a função f ( x ) é escolhida de forma a satisfazer a equação: □ f ( x ) = − g( x ).
15 Na nota de rodapé anterior, a função f ( x ) está determinada módulo soluções à equação homogênea

□ f ( x ) = 0.
16 É mister mencionar também que ela é sempre atingível: Se o campo A a ( x ) não a satisfaz, operamos a

transformação A′ a ( x ) = A a ( x ) + ∂ a f ( x ), com: f ( x ) = − ∂1− A+ ( x ). Então a Eq. (2.174) rege para o campo A′ a ( x ).


Capítulo 2. Dinâmica da frente de luz na teoria clássica 41

Φ( x ) que obedece a equações do tipo:

∂+ ∂− Φ( x ) = LΦ( x ) + Ψ( x ) , (2.177)

com L um operador diferencial linear que não contém derivadas temporais, ∂+ , e Ψ( x )


um campo diferente do Φ( x ). As Eqs. (2.171) são desse tipo para ν = 1, 2 somente sob a
condição de gauge do plano nulo. A equação para ν = + equivale então à condição de
gauge de Lorenz com A+ = 0 –sob as condições assintóticas empregadas–, e esta torna uma
identidade a equação para ν = −. As duas condições de gauge, de qualquer forma, são
compatíveis –no caso livre– e devem ser usadas simultaneamente.
No gauge do plano nulo, a densidade lagrangiana da Eq. (2.172) se simplifica a:

1 2 1 2
L A =∂+ A⊥ ∂− A⊥ + ∂− A⊥ ∂⊥ A− − ∂1 A2 − ∂2 A1 + ∂− A− . (2.178)
2 2

Ou ainda, em função das componentes dinâmicas só:


  1 2 1  2
L A =∂+ A⊥ ∂− A⊥ + ( Aα ∂α ) ∂ β A β + ∂⊥ A⊥ − ∂1 A2 − ∂2 A1 . (2.179)
2 2

O tensor de energia-momento é:

∂L A 1 µ
Θ ∂ν Aσ − δν L A = Fσ ∂ν Aσ + δ ν Fστ F στ
µ µ µ
ν = . (2.180)
∂(∂µ A )
σ 4

Particulamente, o hamiltoniano invariante no gauge do plano nulo é, escrito somente em


função das componentes dinâmicas:
  2 
1 2 1 
Z
3 2 1 ⊥
P+ = d x ∂1 A − ∂2 A + ∂⊥ A . (2.181)
2 2

2.7.2 Problema de Goursat

O problema de Goursat para o campo eletromagnético sujeito à condição de gauge


do plano nulo possui uma consequência notável (ao mesmo tempo que essencial): Ele
garante a preservação no tempo das condições de gauge. Com efeito, dada a Eq. (2.175), as
componentes transversais têm a solução:

←→y
Z
Aα ( x ) = d3 yD0 ( x − y) ∂ − Aα (y) , (2.182)
y+ =y0+

com o subíndice «0» sob a distribuição de Jordan-Pauli indicando que nela a massa é nula:
m = 0. Escrevamos a solução completa da forma:

←→y
Z
a
A (x) = d3 yD ab ( x − y) ∂ − Ab (y) . (2.183)
y+ =y0+
42 Capítulo 2. Dinâmica da frente de luz na teoria clássica

A Eq. (2.182) é recuperada sob a condição de ser:

D αβ = δβα D0 , D α− = 0 , (2.184)

enquanto que as condições de vínculo da Eq. (2.176) são satisfeitas, uma vez impostas no
plano nulo y+ = y0+ , se:

1
D +α = 0 , D +− = 0 , D −− = 0 , D −α = − ∂α D0 . (2.185)
∂−

Nota-se que não é preciso exigirmos valores particulares de D a+ , uma vez que impor-se-á
que seja A+ = 0 no plano nulo inicial. Todas essas condições são satisfeitas com a escolha:

η a ∂ b + ηb ∂ a
   

D ab = δba − D0 ( x ) , a
(η ) = 0; 0 ; 1 . (2.186)
∂−

Assim, se no plano y+ = y0+ são exigidas as condições de gauge de Lorenz e do plano nulo,
então elas se manterão vigentes na evolução dinâmica do campo.

2.7.3 Vetores de polarização

Já dissemos repetidamente que sob a condição de gauge de Lorenz cada componente do


campo da radiação satisfaz à equação de Klein-Gordon-Fock:

□ Aa (x) = 0 . (2.187)

Conseqüentemente, cada uma dessas componentes poderá ser expandida como uma integral
de Fourier como na Eq. (2.123):

d3 p
Z 
A a ( x ) =(2π )−3/2 p Θ ( p− ) ∑ ε λ ( p) a∗ A (λ; p) e−ipx
|2p− | λ

a ∗ ipx
+ε λ ( p) A (λ; p) e , (2.188)
p+ = E

com ε λ ( p) a os vetores de polarização do campo (λ = +, ⊥, −). Se eles são escolhidos reais,


então a equação anterior se reduz à:

Z d3 p  
A a ( x ) =(2π )−3/2 Θ ( p− ) ∑ ε λ ( p) a A (λ; p) e−ipx + A (λ; p)∗ eipx .

p
|2p− | λ
p+ = E

(2.189)

O caráter vetorial do campo eletromagnético está então contido nos vetores de polarização
e, portanto, da mesma forma que acontecia com os espinores de polarização do campo de
Dirac, eles devem carregar também a informação relativa aos vínculos impostos. Ora, como
somente dois graus de liberdade possui este campo, também serão só dois os vetores de
polarização dinâmicos; diremos que estes são aqueles com λ = 1, 2. As duas condições de
Capítulo 2. Dinâmica da frente de luz na teoria clássica 43

gauge explicitadas na Eq. (2.176) são obtidas pelo uso dos vetores de polarização:
   
a p1 a p2
ε 1 ( p) = 0; 1; 0; − , ε 2 ( p) = 0; 0; 1; − , (2.190)
p− p−

cuja norma é:
ηab ε α ( p) a ε β ( p)b = −δβα , (2.191)

o que indica que eles estão normalizados e são do tipo-espaço. O cálculo direto mostra que
estes vetores de polarização físicos seguem a regra de soma:

p a η b + η a pb p2
∑ ε λ ( p) a ε λ ( p)b = −η ab +
p−
− 2 ηa ηb .
p−
(2.192)
λ=1,2

Isto estabelece uma relação importante com o problema de Goursat: Devido à igualdade
p2 δ( p2 ) = 0 [159], as Eqs. (2.192) e (2.186) implicam que, no espaço dos momentos:

b ab ( p) = −
D ∑ ε λ ( p) a ε λ ( p)b D
b 0 ( p) . (2.193)
λ=1,2

Devemos finalmente nos ocupar da definição dos outros dois vetores de polarização,
embora eles não se manifestem fisicamente. Como os quatro vetores hão de formar uma
base para o espaço-tempo de Minkowski, requereremos sua ortonormalidade –que é uma
extensão da Eq. (2.191)–:
ηab ε λ ( p) a ε λ′ ( p)b = ηλλ′ , (2.194)

equivalente à relação de completeza:

∑′ ηλλ′ ε λ ( p)a ε λ′ ( p)b = η ab . (2.195)


λλ

Digamos que sejam, de forma genérica:

ε + ( p) a = ( a; b; c; d) , ε − ( p) a = (e; f ; g; h) . (2.196)

As condições ε + ( p) a ε + ( p) a = 0, ε 1 ( p) a ε + ( p) a = 0 e ε 2 ( p) a ε + ( p) a = 0 levam a que, ou


a ̸= 0 e !
a p1 p2 p2
ε + ( p) = a 1; − ; − ; ⊥2 , (2.197)
p− p− 2p−

ou a = 0 e
ε + ( p) a = (0; 0; 0; d) . (2.198)

Analogamente, as condições ε − ( p) a ε − ( p) a = 0, ε 1 ( p) a ε − ( p) a = 0 e ε 2 ( p) a ε − ( p) a = 0
implicam que, ou e ̸= 0 e
!
a p1 p2 p2
ε − ( p) = e 1; − ; − ; ⊥2 , (2.199)
p− p− 2p−
44 Capítulo 2. Dinâmica da frente de luz na teoria clássica

ou e = 0 e
ε − ( p) a = (0; 0; 0; h) . (2.200)

Evidentemente, somente poderá ser a ̸= 0 e e = 0, ou a = 0 e e ̸= 0, pois de outra forma os


vetores serão proporcionais um ao outro. Qual dessas duas possibilidades deve ser usada é
impossível dizê-lo; é matéria de escolha. Optar-se-á pela primeira. Então a condição de ser
ε + ( p) a ε − ( p) a = 1 implica que ah = 1, cuja mais simples solução é: a = 1 = h. Os vetores
de polarização não-dinâmicos serão, portanto:
!
a p1 p2 p2
ε + ( p) = 1; − ; − ; ⊥2 , (2.201)
p− p− 2p−

ε − ( p) a = (0; 0; 0; 1) . (2.202)
Capítulo 3

Quantização do campo no plano nulo

Uma vez que temos estabelecido detalhadamente a teoria clássica do campo no plano
nulo, é preciso lidar com as modificações que a teoria quântica apresenta nessa forma
dinâmica. O primeiro passo nesse estudo será o próprio procedimento da quantização
do campo, focando nossa atenção nos campos escalar, fermiônico e vetorial sem massa.
Ademais, a quantização do campo pode ser inicialmente definida somente quando ele é
livre, pois o próprio conceito da partícula, no qual se baseia a construção do espaço dos
estados assintóticos, existe somente quando ela é livre, como se evidencia do fato de que,
num processo de interação, as partículas podem mudar sua identidade e número de uma
forma a que não temos acesso. Outro ponto: Geralmente, quando se trabalha na mecânica
quântica com partículas em interação, usa-se a descrição de interação; mas isto não é possível
de se fazer agora, pois um teorema devido a Haag, que pode ser consultado, por exemplo,
na Seç. 4-5 da Ref. [88], estabelece que a descrição de interação na teoria do campo quântico
relativístico existe somente quando o campo é livre, caso em que a dita descrição se equivale
com a de Heisenberg. Assim sendo, todos os campos considerados nesse capítulo –e também
nos seguintes– serão campos livres.

3.1 Espaço de Fock dos estados quânticos e definição


do campo quantizado
Consideremos inicialmente, por simplicidade, a existência de um único tipo de partícula,
e denotemos por H1 o espaço de Hilbert que a esta lhe corresponde. Seus estados são repre-
sentados por funções de onda, φ1 , que são os campos clássicos estudados no Cap. 2. Mas
nem todos os campos clássicos serão adequados para a descrição da partícula, pois estão
restringidos pelo:

Axioma (de não-negatividade da energia): Os estados do espaço de Hilbert H1 são caracteriza-


dos por funções de onda cuja energia é não negativa; elas são dadas pela parte de frequência positiva
do campo clássico.

A necessidade de impor este axioma é evidente: Se existissem partículas com energía


negativa, seria energeticamente favorável uma configuração na qual se gerassem um número
infinito delas; porém, não se observa na natureza configurações semelhantes. Prosseguindo,
como estamos construindo a teoria livre, isto é, de partículas não interagentes, o espaço de
estados de um número finito n de partículas é obtido pelo produto tensorial de n espaços de

45
46 Capítulo 3. Quantização do campo no plano nulo

Hilbert de uma partícula1 :

n
z }| {
Hn := H1⊗n ≡ H1 ⊗ · · · ⊗ H1 . (3.1)

Os estados que correspondem a esse espaço de Hilbert são da forma –considera-se-os


independentes do tempo, pois trabalhar-se-á na descrição de Heisenberg–:

φ n ( x1 ; · · · ; x n ) ; x ≡ (x⊥ ; x− ) , (3.2)

e são combinações lineares gerais de produtos tensoriais de estados de uma partícula. Mas,
como as partículas são idênticas, uma permutação de duas quaisquer delas não se manifesta
no significado físico do estado; logo, a aplicação de um operador de permutação de duas
partículas só pode mudar a fase do estado, a qual apenas pode tomar um dos valores 0 ou π
para que uma nova aplicação da permutação leve o estado de volta a sua expressão original.
Dessa asseveração decorre que a troca de duas partículas só pode mudar um estado físico
pela multiplicação de um fator que pode ser, ou +1, ou −1. Denotando por π jk o operador
de permutação das partículas j e k, suponhamos que o estado φn satisfaz, simultâneamente:

π jk φn = φn e πrs φn = − φn , (3.3)

isto é, que o estado φn é simétrico em relação à troca das partículas j e k, e antissimétrico em


relação à troca das r e s. Como pode-se escrever πrs = π jr πsk π jk πsk π jr , ter-se-á que:

− φn = πrs φn = (−1)π jr (−1)πsk (−1)π jk (−1)πsk (−1) pi jr φn = φn ⇒ φn = 0 . (3.4)

Logo, as funções de onda dos estados físicos podem ser, ou completamente simétricas, ou
completamente antissimétricas2 . Este tipo de estados pode ser obtido a partir de estados
gerais φn , não necessariamente físicos, por meio dos operadores de simetrização e antissime-
trização de n partículas:

1  
Sn± φn ( x1 ; · · · ; xn ) := ∑

(± 1 ) π
φ n x π (1) ; · · · ; x π (n) . (3.5)
n! π

Estes operadores satisfazem às seguintes propriedades:

(1) Ortogonalidade: Usando o fato de que o grupo de permutações de n elementos é igual


a qualquer uma de suas classes laterais, assim como o fato de que os números de

1 Mais propriamente [163, 166, 164], o completamento (topológico) do mencionado produto, em relação

à norma induzida pelo produto interno. De outro modo, o espaço não será completo, e então não será um
espaço de Hilbert, como exigido pelos axiomas da teoria quântica. Algumas vezes, o produto tensorial cuja
completamento não tem sido realizado chama-se «produto tensorial algébrico» para diferenciá-lo do «produto
tensorial de Hilbert», em que o completamento é efetuado [163].
2 Sublinhamos o fato de que esse resultado é consequência de estarmos considerando um único tipo de

partícula, isto é, que todas as partículas do estado φn são idênticas. No caso mais geral, é claro, a completa
simetrização ou a completa antissimetrização é imposta às coordenadas que descrevem os conjuntos de partículas
idênticas.
Capítulo 3. Quantização do campo no plano nulo 47

permutações pares e de permutações ímpares no grupo são iguais –e iguais a n!/2,


embora esse número particular não seja relevante–, pode-se provar que:

Sn+ Sn− = 0 = Sn− Sn+ . (3.6)

(2) Nilpotência: Outra vez usa-se o fato de que o grupo é igual a suas classes laterais, assim
como que o número total de permutações de n pontos é n! Disto decorre a nilpotência
dos operadores Sn± :
(Sn± )2 = Sn± . (3.7)

(3) Auto-adjuntez: Como as permutações de dois elementos têm autovalores reais (±1),
elas são auto-adjuntas, e têm quadrado a identidade; disto pode-se provar que uma
permutação geral π de n pontos é um operador unitário: π † = π −1 , assim como que
−1
(−1)π = (−1)π . Com este conhecimento é possível estabelecer a auto-adjuntez dos
operadores de simetrização e antissimetrização:

Sn± φn ; ψn = φn ; Sn± ψn
 
n n
. (3.8)

Aqui, (•; •)n é o produto interno em Hn , cuja definição é consequência direta da


definição de Hn dada na Eq. (3.1) pela construção usual do espaço produto tensorial.

Introduziremos agora o seguinte axioma, que generaliza a independência do estado físico


com a ordem em que aparecem as coordenadas das partículas idênticas nas funções de onda3 :

Axioma (das partículas idênticas): Se o operador de n partículas O está associado a um observá-


vel físico, então ele comuta com todos os operadores de permutação de n pontos:

[O ; π ] = 0 . (3.9)

Por definição dos operadores Sn± dada na Eq. (3.5), a Eq. (3.9) implica que:

O ; Sn± = 0 .
 
(3.10)

Assim sendo, usando a Eq. (3.9) e depois a (3.7), pode-se observar que os elementos de
matriz dos operadores O entre estados simétricos e antissimétricos são nulos:

Sn± φn ; O Sn∓ ψn = φn ; Sn± O Sn∓ ψn = φn ; O Sn± Sn∓ ψn


  
n n n
=0 . (3.11)

Disso conclui-se que os espaços de Hilbert de n partículas são redutíveis aos espaços Hn+ e
Hn− de estados simétricos e antissimétricos, respectivamente: Eles descrevem sistemas físicos

3 Este axioma tem sido relacionado com o princípio da identidade dos indiscerníveis enunciado por Leibniz

em seu Discurso de metafísica, e que estabelece que duas coisas diferentes não podem ter todas suas propriedades
iguais, ou equivalentemente, que duas coisas com todas suas propriedades iguais devem ser idênticas. Uma
discussão interessante a este respeito pode ser encontrada na Ref. [167].
48 Capítulo 3. Quantização do campo no plano nulo

diferentes, ou seja, de partículas instrinsecamente diferentes. Partículas descritas no espaço


Hn+ se denominam «bósons», enquanto partículas descritas no espaço Hn− recebem o nome de
«férmions». Um vetor de Hn que seja superposição de um elemento do subespaço Hn+ e outro
do Hn− não pode descrever um estado físico; esta é uma regra de super-seleção conhecida com
o nome de «univalência» [88, 101]. Como, para mais, os subespaços Hn+ e Hn− são ortogonais
–vide a Eq. (3.6)–, eles são «subespaços coerentes», e assim haverá operadores auto-adjuntos
em H que não sejam observáveis –verbi gratia, o projetor sobre o vetor não-físico antes
descrito–. Por esses motivos, na construção do espaço de estados físicos é mister restringir a
consideração a um dos subespaços coerentes Hn± só, como faremos a seguir. Claramente,
na construção de operadores agindo sobre tais espaços coerentes, é preciso garantir que
eles se mantenham invariantes; isto se obtém utilizando o produto tensorial simétrico dos
operadores de uma partícula [163]; doravante assumiremos implícita esta operação.
Se finalmente introduz-se o espaço de Hilbert unidimensional de zero partículas,

H0 : = C , (3.12)

então já é possível definir o espaço de Fock4 :

Definição: O espaço de Fock F ± dos bósons e férmions, respectivamente, é a soma direta dos
espaços de Hilbert Hn± estendida a todos os valores não negativos de n:

+∞
F ± := Hn±
M
. (3.13)
n =0

Seus elementos são:


Φ ≡ ( φ0 ; φ1 ; · · · ; φ n ; · · · ) ; φn ∈ Hn± . (3.14)

Particularmente, o estado de vazio (de zero partículas) é:

Ω := (1; 0; · · · ) . (3.15)

O espaço de Fock F ± está dotado do produto interno (•; •) definido como:

+∞
(Φ; Ψ) := ∑ ( φn ; ψn )n , (3.16)
n =0

e norma induzida por ele:

+∞ +∞
∥ Φ ∥2 : = ∑ ∥ φn ∥2n = ∑ ( φn ; φn )n , (3.17)
n =0 n =0

com a restrição –sobre os estados– de que seu valor seja finito.

4 Introduzido pela primeira vez por Fock em 1932 na Ref. [79] e desenvolvido em todo detalhe matemático
por Cook [78].
Capítulo 3. Quantização do campo no plano nulo 49

Neste ponto, acreditamos conveniente trazer à memória os seguintes fatos: Se o espaço


de Hilbert H1 é separável, então, para todo n ∈ N, o produto tensorial finito Hn é separável
também. Como, além do mais, a soma direta contável de espaços de Hilbert separáveis é ele
mesmo um espaço de Hilbert separável, conclui-se que o espaço de Fock é um espaço de
Hilbert separável. Como todos estes fatos são demonstráveis, a definição anterior é, a um
tempo, um teorema; os detalhes das provas correspondentes encontram-se, por exemplo, na
Ref. [163].
Introduziremos agora os operadores no espaço de Fock. Eles serão diferenciados pelo
estilo da fonte, por exemplo: A.

Definição: O operador de número, N : Dom(N) ⊆ F ± → F ± é definido no domínio


( )

Dom(N) := Φ ∈ F± ∥NΦ∥2 = ∑ n2 ∥ φn ∥2n ∈ R (3.18)

n

pela seguinte regra:

(NΦ)n := nφn ⇔ NΦ := (0; φ1 ; 2φ2 ; · · · ; nφn ; · · · ) . (3.19)

Dessa definição decorrem as seguintes propriedades:

(1) Positividade: Para todo Φ ∈ Dom(N):

(NΦ; Φ) = ∑ n∥ φn ∥2n ≥ 0 . (3.20)


n

(2) Auto-adjuntez: Para todos Φ, Ψ ∈ Dom(N):

(Φ; NΨ) = ∑( φn ; nψn )n = ∑(nφn ; ψn )n = (NΦ; Ψ) . (3.21)


n n

(3) Seja A : Dom(A) ⊆ F ± → F ± . Se [A; N] = 0, então A preserva o número de partículas.


Com efeito, seja Φ(n) ∈ Dom(A) ∩ Dom(N) um estado de n partículas, isto é, da
forma: Φ(n) = (0; · · · ; 0; φn ; 0; · · · ). Por definição [Eq. (3.19)]: NΦ(n) = nΦ(n). Então:
N(AΦ(n)) = A(NΦ(n)) = A(nΦ(n)) = n(AΦ(n)), isto é: AΦ(n) ainda é autovetor
de N com autovalor n.

Definição: O operador de emissão de uma partícula com função de onda f ∈ H1 é o operador


a∗ ( f ) : Dom( a∗ ( f )) ⊆ F ± → F ± definido segundo:

( a ∗ ( f ) Φ )0 : = 0 ; ( a∗ ( f )Φ)n := nSn± ( f ⊗ φn−1 ) ( n ∈ N) . (3.22)

Aqui, os operadores de simetrização ou antissimetrização têm sido incluídos com o obje-


tivo de manter o estado a∗ ( f )Φ no espaço de Fock dos bósons ou férmions, respectivamente.
50 Capítulo 3. Quantização do campo no plano nulo

Também, mencionaremos sem provar5 que a∗ ( f ) é ilimitado em F + , então seu domínio não
cobre todo o espaço de Fock dos bósons; porém, ele é limitado em F − , então o operador de
emissão é definido na totalidade do espaço de Fock dos férmions. Analogamente:

Definição: O operador de absorção de uma partícula com função de onda f ∈ H1 é o operador


a( f ) : F ± → F ± definido segundo:

a( f )Ω := 0 ; ( a ( f ) Φ ) n ( x1 ; · · · ; x n ) : = n + 1 ( f ( x); φn+1 ( x; x1 ; · · · ; xn ))1,x . (3.23)

Nota-se que nessa definição é explícito que o domínio do operador de absorção a( f ) é o


espaço de Fock completo; isto é consequência de que f ∈ H1 e φn ∈ Hn , assim como que
Φ ∈ F ± –quer dizer, de que os produtos interiores estão bem definidos, com resultado finito,
e também sua soma [vide a Eq. (3.17)]–. Também, observa-se que, por ter sido definido
em relação ao produto interno, que é anti-linear no primeiro argumento, a( f ) é anti-linear
em seu argumento: a(α f ) = α∗ a( f ). A relação entre os operadores de emissão e absorção é
encontrada da seguinte maneira: Como φn+1 ∈ Hn±+1 , pode-se escrever φn+1 = Sn±+1 φn+1 ,
então usar a auto-adjuntez de Sn±+1 [Eq. (3.8)]. Calculando o operador adjunto de a( f ),
usando as definições das Eqs. (3.22) e (3.23):
√ 
(Ψ; a( f )Φ) = ∑ n + 1Sn±+1 ( f ⊗ ψn ); φn+1 = ( a∗ ( f )Ψ; Φ) , (3.24)
n n

sempre que seja Ψ ∈ Dom( a∗ ( f )), do qual se deduz que:

a∗ ( f ) = a( f )† ≡ a† ( f ) , (3.25)

notação essa última que usar-se-á doravante.


As relações de comutação ou anti-comutação dos operadores de emissão e absorção
são derivadas usando as definições destes operadores dadas nas Eqs. (3.22) e (3.23). Sejam
f , g ∈ H1 , Φ ∈ Dom [ a( f ); a† ( g)]∓ ⊂ F ± . O cálculo direto mostra que:


h i
a ( f ); a † ( g ) Φ = ( f ; g )1 Φ . (3.26)

Também por cálculo direto pode-se provar que:


h i
[ a( f ); a( g)]∓ Φ = 0 ; a † ( f ); a † ( g ) Φ=0 . (3.27)

Vê-se que nestas relações deve-se usar o comutador em F + (espaço dos bósons) e o anti-
comutador em F − (espaço dos férmions). O teorema que à continuação apresentaremos
prova que as relações das Eqs. (3.26) e (3.27) são as que permitem a construção do espaço de
Fock de forma única.

5 Pode-se consultar, a esse respeito, a Seção 2.1 da Ref. [107].


Capítulo 3. Quantização do campo no plano nulo 51

Teorema 3.1: Todas as representações irredutíveis das relações de (anti-)comutação das Eqs.
(3.26) e (3.27), com estado de vazio Ω, são equivalentes à representação de Fock.

Prova: Seja f ∈ H1 . Das relações de (anti-)comutação que são hipóteses do teorema tem-
se que:
     
a† ( f )Ω; a† ( g)Ω = Ω; a( f ) a† ( g)Ω = ( f ; g)1 ± Ω; a† ( g) a( f )Ω = ( f ; g)1 , (3.28)

donde decorre que o espaço de vetores a† ( f )Ω é unitariamente equivalente ao setor de uma


partícula da representação de Fock, de estados da forma (0; f ; 0; · · · ). Das mesmas relações
de (anti-)comutação, e pelo mesmo procedimento:

1  † 
a ( f 1 ) a† ( f 2 )Ω; a† ( g1 ) a† ( g2 )Ω = S2± ( f 1 ⊗ f 2 ); S2± ( g1 ⊗ g2 ) 2 ,

(3.29)
2!

e o espaço de vetores a† ( f 1 ) a† ( f 2 )Ω/ 2! é unitariamente equivalente ao setor de duas partí-
culas da representação de Fock, que contém aos estados da forma 0; 0; S2± ( f 1 ⊗ f 2 ); 0; · · · .


Claramente, o argumento pode ser generalizado, então o espaço de vetores gerados pela

aplicação de n operadores de emissão no estado de vazio, a† ( f 1 ) · · · a† ( f n )Ω/ n!, é unitari-
amente equivalente ao setor de n partículas da representação de Fock. Como isto é válido
para todo n ∈ N, a equivalência das representações está provada.
Demonstraremos agora a irredutibilidade das representações construídas. Do exposto se
deriva que, se f j é base6 de H1 , então o conjunto:


( )
n
1
F0± = {Ω} ∪ √ ∏ a†j Ω n ∈ N (3.30)

n! j =1

é uma base de F ± . A introdução desta base é possível devido a que o espaço de Fock é
separável7 , o que se deve ao fato de que o espaço de Hilbert de uma partícula o é –vide a
Eq. (3.60) embaixo, e lembre que, como foi provado por von Neumann, o espaço L2 (Rn ) é
um espaço de Hilbert separável [168] (a prova pode ser encontrada também na Ref. [163]),
enquanto que a construção subseqüente do espaço de Fock não muda essa característica,
como já o dissemos8 –. Provaremos, para começar, que todo estado Φ ∈ F ± tal que, para
todo f ∈ H1 : a( f )Φ = 0, é proporcional ao estado de vazio. Com efeito, a( f )Φ = 0 significa

6 Certamente, estamos nos referindo a uma base no sentido de Schauder, pois a base no sentido de Hamel de

um espaço vetorial de dimensão infinita é em geral não contável [165].


7 De fato, a separabilidade e a possibilidade de introduzir tal base se equivalem –vide, por exemplo, o Ap. B

da Ref. [166]–.
8 Por outro lado, se, como comumente se faz, fosse feita a quantização do campo como uma infinitude de

osciladores harmônicos, então o espaço de Hilbert de uma partícula seria um produto tensorial infinito dos
espaços de Hilbert do oscilador em cada ponto, e, como consequência, seria não-separável, segundo argumentado
na Seç. 2-6 da Ref. [88]. Entretando, uma recente revisão das possibilidades e dificuldades de trabalhar em
espaços de Hilbert não-separáveis pode ser encontrada na Ref. [169].
52 Capítulo 3. Quantização do campo no plano nulo

que para todo n ∈ N ∪ {0} ≡ N0 :



( a( f )Φ)n = n + 1 ( f ( x); φn+1 ( x; x1 ; · · · ; xn ))1,x = 0 ; (3.31)

mas como isto é válido para todo f ∈ H1 , só pode ser: φn = 0 para n ∈ N. Assim, só φ0
poderia ser não nulo, e então: Φ = cΩ, c ∈ C. Como irredutibilidade significa que não existe
subespaço de F ± que seja invariante sob a( f ) e a† ( f ) para todo f ∈ H1 , suponhamos que
existe um operador A, fechado em F ± –que seria o projetor sobre o subespaço invariante,
caso ele existisse–, tal que:

∀ f ∈ H1 : [A; a( f )] = 0 = [A; a† ( f )] . (3.32)

Da comutatividade de A com a( f ): a( f )(AΩ) = A( a( f )Ω) = 0; o enunciado recém provado


implica que AΩ é proporcional ao estado de vazio: AΩ = αΩ, α ∈ C. Usando este resultado
e a comutatividade de A com a† ( f ): A( a† ( f )Ω) = a† ( f )(AΩ) = αa† Ω. E assim por diante,
A = α1 no conjunto F0± . Mas, como F0± é base e A é fechado, o mesmo é válido para todos
os estados de F ± . Decorre disto que A = α1 em todo F ± , então as representações construí-
das são irredutíveis. ■

Como corolário do Teorema 3.1 tem-se o seguinte resultado, cuja importância é evidente:

Corolário 3.1-1: Todo operador limitado no espaço de Fock F ± pode ser expresso em função dos
operadores de emissão e absorção a† ( f ) e a( f ).

Prova: Na prova do Teorema 3.1 vimos que um operador fechado em F ± que satisfaz à
Eq. (3.32) é proporcional à identidade. Portanto, o comutante A′ da álgebra A gerada por
a( f ) e a† ( f ) é trivial: A′ = α1. O duplo comutante A′′ , então, é a álgebra de todos os opera-
dores limitados que agem em F ± . Mas [95] A′′ = A, do qual segue a tese do corolário. ■

Vejamos como levar à prática a tese do Corolário 3.1-1, para o qual precisamos introduzir
uma base numerável e ortonormal de funções f j para o espaço de Hilbert, H1 , novamente na
hipótese, já justificada, de que ele é separável:

( f j ; f k )1 = δjk , (3.33)

na qual qualquer função f ∈ H1 expande-se como:

f ( x) = ∑ ( f j ; f )1 f j ( x ) . (3.34)
j

Assim, definindo os operadores de emissão e absorção nas funções dessa base,

a†j := a† ( f j ) , a j := a( f j ) , (3.35)
Capítulo 3. Quantização do campo no plano nulo 53

obter-se-á que a j e a†k satisfazem às seguintes relações de (anti-)comutação [vide as Eqs. (3.26),
(3.27) e (3.33)]: h i
[ a j ; a†k ]∓ = δjk , [ a j ; ak ]∓ = 0 = a†j ; a†k . (3.36)

Em virtude do Corolário 3.1-1, expressemos o operador número de partículas em função


dos a j e a†j . Usando as Eqs. (3.19) e (3.34) e as definições dos operadores de emissão e
absorção, ter-se-á que, para qualquer Φ ∈ Dom(N):

(NΦ)n = nSn± { φn ( x1 ; · · · ; xn )}
√ n √  o
= ∑ nSn± f j ( x1 ) n f j ( x); φn ( x; x2 ; · · · ; xn ) 1,x
j
!
= ∑ a†j a j Φ , (3.37)
j n

a partir do qual obtém-se a expressão desejada:

N= ∑ a†j a j . (3.38)
j

Consideremos agora um operador definido no espaço de Hilbert H1 e que representa


uma grandeza aditiva quando é aplicado a partículas livres; por exemplo, a energia de um
conjunto de partículas livres é igual à soma das energias das partículas individuais (mas não
assim quando as partículas interagem, pois a própria interação possue uma energia, situa-
ção que fica fora da presente discussão), et cetera. A extensão mais natural desse operador
corresponde a aplicá-lo a cada partícula independentemente e então somar os resultados.

Definição: Seja A = A( x) um operador aditivo que atúa no espaço de Hilbert de uma partícula,
H1 . A elevação ao espaço de Fock, A, é definida tal que, para Φ ∈ F ± :

n
(AΦ)0 := 0 , (AΦ)n := ∑ A ( x m ) φ n ( x1 ; · · · ; x n ) ( n ∈ N) , (3.39)
m =1

em que A( xm ) age sobre a coordenada xm da função de onda φn ( x1 ; · · · ; xn ).

Por um procedimento idêntico ao da Eq. (3.37) é possível provar que a definição da Eq.
(3.39) é equivalente a escrever:

A= ∑( f k ; A f j )1 a†k a j , (3.40)
j,k

então todo operador que provém da elevação de um operador que age em H1 é expressível
em função dos operadores de emissão e absorção, como clamado pelo Corolário 3.1-1. Mais
em geral:
54 Capítulo 3. Quantização do campo no plano nulo

Definição: Seja A = A( x1 ; · · · ; xs ) um operador aditivo que atua no espaço de Hilbert de s


partículas, Hs . A elevação ao espaço de Fock, A, é definida tal que, para Φ ∈ F ± :

(AΦ)0,··· ,s−1 := 0 , (AΦ)n := ∑ A( x j ; · · · ; xk ) φn ( x1 ; · · · ; xn ) (n ∈ {s; s + 1; · · · }) ,


j<···<k
(3.41)

em que A( x j ; · · · ; xk ) age sobre as coordenadas x j , · · · , xk contidas na função de onda φn ( x1 ; · · · ; xn ).

Em função dos operadores de emissão e absorção, encontra-se:

1
A=
s! ∑′ ( f j ⊗ · · · ⊗ f k ; A f j′ ⊗ · · · ⊗ f k′ )s a†j · · · a†k ak′ · · · a j′ . (3.42)
j,··· ,k,j ,··· ,k′

Como pode-se ver, o ordenamento normal dos operadores que agem no espaço de Fock
decorre naturalmente das definições dadas, o que implica, em particular, que o valor de
qualquer observável físico no estado de vazio é nulo.
Finalmente, uma palavra a respeito do domínio de aplicação dos operadores elevados
ao espaço de Fock. Suponhamos que A é um operador limitado em Hs ; isto significa que
existe ∥ A∥s tal que, para todo φs ∈ Hs : ∥ Aφs ∥s ≤ ∥ A∥s . Então sua elevação ao espaço de
Fock está limitado por:
 2
n
∥AΦ∥ ≤ 2
∥ A∥2s ∑ s ∥ φn ∥2n ∼ ∥ A∥2s ∑ n2s ∥ φn ∥2n , (3.43)
n n

donde decorre que Dom(A) é tanto mais restrito quando maior for o valor de s. Em particular,
quando s = 1, o lado direito da Eq. (3.43) é igual a: ∥ A∥21 ∥NΦ∥2 , então:

s=1 : Dom(N) ⊆ Dom(A) . (3.44)

Entre os operadores da mecânica quântica que não são aditivos encontram-se aqueles
que correspondem a «transformações», verbi gratia, as transformações de Poincaré, transfor-
mações discretas, conformes, et cetera. Elas têm de ser aplicadas a todas as funções de onda
que compõem φn simultaneamente. Sua elevação ao espaço de Fock, portanto, tem de ser
feita da seguinte forma.

Definição: Seja U uma transformação no espaço de Hilbert de uma partícula, H1 . Sua


elevação ao espaço de Fock F ± é o operador U tal que:
!
n n
UΩ := Ω
O O
, (UΦ)n := Uk φn ( x1 ; · · · ; xn ) = U φn , (3.45)
k =1 k =1

com Uk significando que a transformação age sobre a coordenada xk .


Capítulo 3. Quantização do campo no plano nulo 55

Uma transformação de especial importância é a evolução temporal, gerada pelo hamil-


toniano P+ . É sabido que na mecânica quântica não relativística a equação do movimento
da função de onda é sempre um axioma [163, 166], quer seja ela a equação de Schrödinger,
quer a de Heisenberg. E o mesmo acontece na teoria do campo quantizado. A alternativa
que seguiremos aqui será «supor» que exista uma equação de Schrödinger para a função
de onda de uma partícula e então elevar o operador de evolução temporal seguindo a Eq.
(3.45). Veremos que esta suposição está bem fundamentada, e poder-se-á sempre encontrar
uma equação de Schrödinger no plano nulo, embora o hamiltoniano seja não local; isto não é
possível na dinâmica instantânea, em que a equação de Klein-Gordon-Fock, por exemplo,
não pode ser colocada na forma hamiltoniana na classe dos operadores diferenciais. Supo-
nhamos que existe um hamiltoniano de uma partícula, P+ , auto-adjunto, que determina a
evolução temporal das funções de onda por meio da «equação de Schrödinger»9 :

i∂+ f ( x ) = P+ f ( x ) . (3.46)

Como as partículas são livres –elas constituem, cada uma, um sistema isolado–, considera-se
P+ independente do tempo x + . Digamos, ainda, que existe a possibilidade de que seja P+
dependente da posição x = ( x ⊥ ; x − ) se considerarmos a quantização do campo em presença
de um campo clássico exterior estático; isto não altera de forma alguma os resultados que
seguem caso o campo externo seja um «campo regular»10 , pois só tem relevância na escolha
da base de funções do espaço de Hilbert de uma partícula; quando o campo externo é
dependente do tempo, por outro lado, a elevação ao espaço de Fock do operador de evolução
temporal em geral não existe [170, 107] –no caso dos campos quantizados em interação isto
último se relaciona com o teorema de Haag: Não é possível usar o espaço de Fock como o
espaço de Hilbert da teoria em interação (o que constitui uma outra forma de expressar a
afirmação mais comum de que a descrição de interação não existe)–. A Eq. (3.46) tem solução:

f ( x + ; x) = U ( x + ; x0+ ) f ( x0+ ; x) , (3.47)

com
+ − x+ )
U ( x + ; x0+ ) := e−iP+ (x 0 , U ( x + ; x0+ )−1 = U ( x + ; x0+ )† = U ( x0+ ; x + ) (3.48)

o operador unitário de evolução temporal. Elevando-o ao espaço de Fock segundo a Eq.


9 Ocorre costumeiramente que o operador hamiltoniano é ilimitado, o que implica que Dom( P ) é um
+
subespaço próprio de H1 . Este é um problema porque o teorema de Hellinger-Toeplitz proíbe que um operador
auto-adjunto definido sobre todo H1 seja ilimitado, donde decorre que o operador hamiltoniano não pode ser
estendido de Dom( P+ ) para H1 como um operador auto-adjunto [166]. Como consequência, a equação de
Schrödinger somente é capaz de descrever a evolução temporal das funções de onda em Dom( P+ ), enquanto
que a evolução temporal do restante delas permanece desconhecido pela mencionada equação. Semelhante
dificuldade é superada passando à descrição pelo operador de evolução temporal, que é unitário e reproduz a
equação de Schrödinger para todo f ∈ Dom( P+ ) [163].
10 Esta nomenclatura provém da eletrodinâmica, estudada por Nenciu e Scharf [170] em que um campo

externo é regular se a quantização do campo de Dirac em sua presença pode ser feita no espaço de Fock. É
notável o resultado, obtido por estes autores, de que um campo magnético estático não pode ser regular, mas
somente um campo elétrico estático.
56 Capítulo 3. Quantização do campo no plano nulo

(3.45) e derivando em relação ao tempo x + :


!
n
∂+ U( x + ; x0+ )Φ ∑ U (x+ ; x0+ ) ⊗ · · · ⊗ ∂+ Uj (x+ ; x0+ ) ⊗ · · · ⊗ U (x+ ; x0+ ) φn ( x0+ )

n
=
j =1
!
n n
+
; x0+ ) ∑ P+ (x j ) φn (x+ ; x1 ; · · · ; xn )
O
= −i U (x . (3.49)
k =1 j =1

Reconhece-se aqui a elevação do hamiltoniano de uma partícula. Usando o fato que P+ e


U ( x + ; x0+ ) comutam devido à forma explícita deste último, a Eq. (3.49) é igual a:

i∂+ U( x + ; x0+ ) = U( x + ; x0+ )P+ = P+ U( x + ; x0+ ) . (3.50)

Na passagem à descrição de Heisenberg, consideraremos x0+ = 0 o tempo no qual as


representações de Heisenberg e de Schrödinger se igualam, escrevendo, portanto: A( x0+ ) ≡
A. Então os operadores A que agem no espaço de Fock seguem à «equação do movimento
de Heisenberg»:
i∂+ A( x + ) = A( x + ); P+
 
, (3.51)

cuja solução é:
A( x + ) = U( x + )−1 AU( x + ) , (3.52)

com U( x + ) o «operador de evolução temporal», que é unitário, e que tem expressão:

+P
U( x + ) := e−ix +
. (3.53)

Em, particular, da Eq. (3.52), os operadores de emissão e absorção evoluem segundo:

a† ( f )( x + ) = U( x + )−1 a† ( f )U( x + ) , a( f )( x + ) = U( x + )−1 a( f )U( x + ) . (3.54)

Uma consequência direta disto é que as relações de (anti-)comutação dos operadores de


emissão e absorção são preservadas na evolução temporal:
h i h i
a( f )( x + ); a† ( g)( x + ) = U ( x + ) −1 a ( f ); a † ( g ) U ( x + ) = ( f ; g )1 . (3.55)
∓ ∓

Assim sendo, e pelo Teorema 3.1, as representações irredutíveis da álgebra de (anti-)comutação


desses operadores são equivalentes à representação de Fock para todo tempo x + . Em ou-
tras palavras, a base F0± da Eq. (3.30) pode ser usada em qualquer tempo x + . Calculando
explicitamente a ação no estado Φ:
   
a† ( f )( x + )Φ = U ( x + ) −1 a † ( f )U ( x + ) Φ
n n
√ ±
   
+ −1 + −1
= nSn U ( x ) f ⊗ U( x ) U( x )Φ +
n −1
√ ±n o
= nSn U ( x + )−1 f ⊗ φn−1 .
Capítulo 3. Quantização do campo no plano nulo 57

E analogamente para o operador a( f )( x + ). Como resultado tem-se:


   
a† ( f )( x + ) = a† U ( x + )−1 f , a( f )( x + ) = a U ( x + )−1 f . (3.56)

Esse resultado pareceria contradizer à Eq. (3.47), porém a justifica: Como f evolui com
U ( x + ), a criação do estado com função de onda f no tempo x + se equivale com a criação da
função de onda U ( x + )−1 f em x + = 0. Também esse resultado concorda com a Eq. (3.55),
pois U ( x + ) é unitário.
Consideremos agora a seguinte questão: Como poder-se-á saber se a evolução temporal
é concordante com a covariância relativística? Responderemos a essa pergunta em duas
etapas. (1) De volta ao Teorema 3.1, já que a representação de Fock dos estados quânticos é
construído a partir das regras de (anti-)comutação das Eqs. (3.26) e (3.27), ela terá caráter
relativístico se o produto interno do qual elas dependem é invariante relativístico, uma vez
que a dependência temporal das funções de onda é introduzida. Pareceria que esta operação
é irrelevante, pois já vimos que a representação de Fock independe do produto interno: Com
efeito, mas especificar o produto interno significa especificar a forma explícita da ação dos
operadores de emissão e absorção, a† ( f ) e a( f ), e portanto especificar a forma dos estados
emitidos na aplicação de a† ( f ) ao estado de vazio.
Como já conhecemos, da análise clássica feita no Cap. 2, a medida invariante no espaço
dos momentos, definiremos o produto interno do espaço de Hilbert de uma partícula nesse
espaço:

Definição: Seja H1 o espaço de Hilbert de uma partícula de funções de onda dependentes do tempo,
como na Eq. (3.47). Sejam f , g ∈ H1 , e sejam fˆ e ĝ suas transformadas de Fourier tetradimensionais.
O produto interno delas é definido por:
Z
( f ; g )1 : = dµm ( p) fˆ( p)∗ ĝ( p) , (3.57)

com µm ( p) a medida invariante relativística:

d3 p ω 2p p2⊥ + m2

dµm ( p) := δ( p − m )Θ( p− )d p = Θ( p− )
2 2 4
; E : = = . (3.58)
2p− p+ =E |2p− | |2p− |

A medida µm ( p) está definida na «camada de massa superior»


n o
M+ := p ∈ R4 p2 = m2 ∧ p− > 0

, (3.59)

então identifica-se o espaço de Hilbert H1 com o espaço de (classes de equivalência das) funções (iguais
quase-em-todas-partes) de quadrado integrável11 em M+ segundo a medida µm :

H1 := L2 (M+ ; µm ) . (3.60)

11 Claramente,a integração é no sentido de Lebesgue [163, 166], o que explica as precisões feitas interparenté-
ticamente no texto principal.
58 Capítulo 3. Quantização do campo no plano nulo

O espaço de Hilbert assim definido é separável porque o espaço R4 , que contém à camada
de massa superior, M+ , é σ-finito segundo a medida µm , condição que é suficiente [163].
Vejamos mais de perto o produto interno da Eq. (3.57). Integrando na variável p+ e
denotando fˆ( E; p) ≡ fˆ( p), tem-se que:

d3 p
Z
( f ; g )1 = Θ( p− ) fˆ( p)∗ ĝ( p) . (3.61)
2p−

Em particular, esta equação prova a concordância com a unitariedade do operador de


evolução temporal, pois o produto interno definido é independente do tempo. Assim sendo,
pode-se definir a medida:
d3 p
dµ( p) := Θ( p− ) , (3.62)
2p−
e expressar o produto interno das funções de onda independentes do tempo como:
Z
( f ; g )1 = dµ( p) fˆ( p)∗ ĝ( p) . (3.63)

Chega-se assim ao seguinte resultado [24]:

Teorema 3.2: Sejam Fν± (ν = 1, 2) dois espaços de Fock correspondentes a partículas de massas
mν , com m1 ̸= m2 . Os espaços de Fock F1± e F2± são unitariamente equivalentes.

Prova: A tese do Teorema 3.2 equivale a dizer que existe um operador unitário V : F1± →
F2± . Com efeito, como o produto interno da Eq. (3.63) independe da massa [vide a medida
na Eq. (3.62)], então:
   
a1† ( f )Ω; a1† ( g)Ω = ( f ; g)1 = a2† ( f )Ω; a2† ( g)Ω , (3.64)

donde decorre a existência do operador V tal que:

Va1† ( f )V† = a2† ( f ) . (3.65)

Isto é suficiente, pois os estados de maior número de partículas são gerados por aplicação
sucessiva dos operadores de emissão, como o afirma o Teorema 3.1. ■

Este resultado formaliza a observação intuitiva de que na dinâmica da frente de luz a


massa das partículas é pouco relevante [13], e é um resultado que não pode –em princípio–
ser atingido na dinâmica instantânea, na qual a medida do produto interno depende ex-
plicitamente da massa da partícula. É inevitável lembrar agora do teorema de Haag e nos
perguntarmos se o teorema que leva seu nome é violado na teoria do campo quântico no
plano nulo, como o resultado anterior pareceria sugerir –com efeito, o próprio Haag conside-
rou o exemplo da interação do tipo (m22 − m21 ) φ2 para mostrar um caso explícito em que a
descrição de interação não existe na teoria do campo quantizado [80] (vide também a exposi-
Capítulo 3. Quantização do campo no plano nulo 59

ção de Duncan na Seç. 10.5 da Ref. [171])–. Este ponto tem sido devidamente esclarecido por
Schlieder e Seiler na Ref. [172]. Como estes autores mostraram, também na dinâmica instan-
tânea seria possível construir um operador unitário relacionando os espaços de Hilbert de
partículas de massas diferentes se o espaço das funções de teste for restringido o suficiente;
contudo, semelhante restrição impede a caracterização completa das propriedades locais
dos operadores de campo quântico12 , a menos que as equações do movimento sejam utiliza-
das para estender o espaço ao S R4 . Semelhantemente, não há dificuldade em reconhecer


que a medida da Eq. (3.62) não está bem definida sobre o espaço S (R3 ) completo, senão
somente sobre o subconjunto deste caracterizado pelo anulamento da função para p− = 0
[159]. Desta forma, a restrição do campo ao plano nulo tampouco permite a caracterização
completa das propriedades locais dos operadores de campo quantizado, mas somente sua
extensão, via as equações do movimento, ao espaço S R4 , em que a medida é a da Eq.


(3.58), bem definida e dependente da massa. Nestas circunstâncias, na dinâmica da frente de


luz como na instantânea, o teorema de Haag ainda rege. Schlieder e Seiler mostraram isto
definitivamente usando da formulação baseada nas distribuições de Wightman [172].
(2) O segundo passo para garantir a covariância relativística da teoria quântica construída

é a escolha adequada da base de funções de onda de uma partícula: f j ⊂ H1 . Se a base é
escolhida de forma a satisfazer às equações e vínculos da teoria do campo clássico, então não
haverá dificuldade nenhuma em reconhecer que a evolução das funções de onda segundo o
hamiltoniano P+ é relativística. Vê-se, pois, que é essencial para isto estabelecer primeiro a
base de funções de onda dependentes do tempo. Lembrando do axioma da positividade da
energia, poderia parecer apropriado assumir a base de ondas planas de frequência positiva:

1
f p (x) = Θ( p− )eipx . (3.66)
(2π )3/2

Contudo, se as ondas planas da Eq. (3.66) fossem tomadas como baseZ–a qual seria, além
do mais, não numerável–, então chegar-se-ia à relação de completeza: f p ( x ) f p∗ ( x1 )d4 p =
δ( x − x1 ). Porém, esta não seria uma boa base, pois não satisfaz à condição assintótica da Eq.
(2.79); o espaço gerado pelas ondas planas é grande demais para os fins presentes. Veremos
que uma eleição adequada da base leva a uma relação de completeza diferente. Lembre-
mos agora das soluções que obtivemos para o problema de Goursat dos campos clássicos,
pois essas soluções serão, sim, boas funções de onda. Obtiveram-se, nos diferentes casos,
distribuições –por exemplo, a de Jordan-Pauli D ( x ), ou a S( x ) para os campos fermiônicos,
et cetera– descrevendo a propagação causal do campo; denotaremos genéricamente essas
distribuições por ∆( x ). E como em H1 estão somente as partes de frequência positiva, elas
são propagadas pela parte de frequência positiva de ∆: ∆+ , pois sendo P+ auto-adjunto, os
subespaços de frequência positiva e de frequência negativa são ortogonais. Vimos que toda

12 Com efeito, a possibilidade de se usar o espaço de Schwartz como espaço das funções de teste, sendo que

os argumentos das distribuições de emissão e absorção pertencem ao espaço H1 = L2 , é devida a que S é denso
em L2 [163]. Mas se o espaço de Schwartz for restringido com alguma condição adicional, nem toda função em
H1 poderá ser aproximada por uma sucessão de funções do espaço restrito, o que se identifica com a perda de
informação sobre as propriedades do campo.
60 Capítulo 3. Quantização do campo no plano nulo

função de onda (campo clássico de frequência positiva) satisfaz [vide o Cap. 2]:

f ( x ) = ⟨−i∆+ ( x − y); f (y)⟩y , (3.67)

com ⟨•; •⟩ significando que a distribuição é aplicada à função segundo a regra formal dada
pelo produto interno (•; •)1 , diferenciando a notação para explicitar que ⟨•; •⟩ não é um
produto interno, mas a aplicação de uma distribuição a uma função13 . A expansão da função

f na base f j –semelhante àquela da Eq. (3.34), mas agora dependente do tempo– implica
então a relação de completeza:

∑ f j (x) f j (y)∗ = −i∆+ (x − y) . (3.68)


j

As funções de onda independentes do tempo são então geradas pelas funções f j ( x )| x+ =0 .


Claro, existe uma ambiguidade na definição da distribuição ∆: Conhece-se somente a
expressão (3.67) em forma explícita, mas não se sabe que parte dessa expressão corresponde
à definição de ∆ e qual outra à definição do produto interno; a decomposição deve ser tal
que, uma vez no espaço dos momentos, o produto interno no espaço real seja compatível
com a Eq. (3.57), pois é essa que garante a covariância das relações de (anti-)comutação.
Que esta compatibilidade pode sempre ser atingida não tem sido provado, mas dever-se-á
constatá-lo em cada caso. Veremos que bastará fazê-lo para o caso escalar, pois como vimos
no Cap. 2, todos os outros campos podem ser decompostos em componentes dinâmicas e
não-dinâmicas, as primeiras satisfazendo únicamente à equação de Klein-Gordon-Fock, as
segundas, obtidas delas pelo uso das equações de vínculo.
O mapeamento da função f para os operadores a( f ) e a† ( f ) é feito por:

Definição: Seja f ∈ H1 uma função de onda. Os operadores de campo de emissão e absorção no


espaço real, a† ( x) e a( x), respectivamente, são as distribuições operador-valuadas que levam f aos
operadores a† ( f ) e a( f ), respectivamente, por meio das regras formais:
D E
a† ( f ) := f ; a† ( x) ; a( f ) := ⟨ f ∗ ; a( x)⟩ , (3.69)

Os operadores de campo de emissão e absorção no espaço dos momentos, a† ( p) e a( p), respectiva-


mente, são definidos como as transformadas de Fourier distribuicionais dos correspondentes operado-
res de campo no espaço real.

Estes operadores de campo são bem definidos: Sem perda de generalidade, a( x) e


podem ser consideradas distribuições agindo no espaço de Schwartz S R3 , pois
a† ( x)


este espaço é denso em L2 R3 . Particularmente, em virtude desta propriedade, todos os




elementos da base { f j } podem ser escolhidos em S R3 . Como elementos de S ′ R3 ,


 

as transformadas de Fourier distribucionais existem. Finalmente, como a transformação


13Além disto, na notação distribucional é dispensado o complexo conjugado que na regra do produto interno
se aplica a seu primeiro argumento.
Capítulo 3. Quantização do campo no plano nulo 61

de Fourier em S R3 é uma isometria nesse espaço e esse é denso em L2 R3 , aquela


 

pode ser estendida de forma única a um operador unitário e limitado agindo no espaço
L2 R3 –algumas vezes chamada «transformação de Fourier-Plancherel» para indicar que,


propriamente, se trata da extensão da transformação de Fourier [163]–.


As Eqs. (3.34) e (3.69) implicam que é possível escrever os operadores de campo de
emissão e absorção como:

a† ( x) = ∑ a†j f j (x)∗ , a( x) = ∑ a j f j ( x) , (3.70)


j j

e no espaço dos momentos:

a† ( p) = ∑ â†j fˆj ( p)∗ , a( p) = ∑ â j fˆj ( p) . (3.71)


j j

E destas relações, junto com as expansões da Eq. (3.36) e a relação de completeza da base

f j mostrada na Eq. (3.68):
h i h i
a ( x ); a † ( y ) = −i∆+ (0; x − y) , [ a( x); a(y)]∓ = 0 = a† ( x); a† (y) . (3.72)
∓ ∓

Se evidencia assim a grande importância da relação de completeza da base de H1 : O


(anti-)comutador dos operadores de campo de absorção e emissão adota sua forma usual
[ a( x); a† (y)] = δ( x − y) somente se ∆+ se reduz a essa distribuição no plano nulo x + = 0.
Ocorrerá, no entanto, que em geral não será isso o que aconteça, senão que ∆+ será não local
na coordenada x − , como esperaríamos: O campo a tempo nulo está ainda causalmente cone-
tado com o eixo x − .

Definição: O operador de campo quantizado é a distribuição operador-valuada u( x ) definida


como:
u( x ) := a( x ) + a† ( x ) . (3.73)

A parte correspondente ao operador de campo de absorção se denomina sua «parte de frequência ne-
gativa», denotada u− ; a correspondente ao operador de campo de emissão, sua «parte de frequência
positiva», denotada u+ .

A definição recém dada pode parecer arbitrária, mas existe uma razão de fundo de
absoluta importância para a natureza manifestar suas leis por meio da peculiar combinação
da Eq. (3.73). Essa é a causalidade –o digamos já, protagonista dessa tese–. Com efeito,
as relações de (anti-)comutação das partes de frequência positiva e de frequência negativa
do operador de campo quantizado levam sempre ao aparecimento da parte de frequência
positiva, ou a de frequência negativa, da distribuição ∆ –vide a Eq. (3.78) embaixo–. Mas
estas não podem, por si só, descrever leis causais, pois seu suporte não é causal. Somente a
combinação u( x ) = a( x ) + a† ( x ) leva a relações de (anti-)comutação cujo suporte é causal;
por isso, uma das partes não pode ter predominância sobre a outra, mas devem sempre
62 Capítulo 3. Quantização do campo no plano nulo

aparecer na combinação mencionada, o que justifica a introdução do operador de campo


quantizado.
A essa definição podem ser dadas diversas formas. Apresentar-se-á três delas. A primeira
se obtém pela expansão da Eq. (3.70):
 
u( x ) = ∑ a j f j ( x ) + a†j f j ( x )∗ . (3.74)
j

Aqui, a dependência com as coordenadas está contida nas funções f j ( x ). Logo, como { f k }
é base do espaço de Hilbert de uma partícula, H1 , a Eq. (3.74) implica que o operador de
campo quantizado satisfaz à equação do movimento do campo clássico.
Também, escrevendo as funções f j ( x ) que aparecem na Eq. (3.74) em função de suas
transformadas de Fourier,
Z
−3/2
f j ( x ) = (2π ) dµ( p) fˆj ( p)e−ipx , (3.75)

obtém-se a seguinte expressão para o operador de campo quantizado:


Z   ωp
u( x ) = (2π )−3/2 ∑ dµ( p) a j fˆj ( p)e−ipx + a†j fˆj ( p)∗ eipx ; p+ = . (3.76)
j
|2p− |

Essa é, explicitamente, uma expansão em pacotes de onda. Ela deriva na expansão em


ondas planas como as da Eq. (3.66) quando o momento dos pacotes está bem definido:
fˆj ( p) → p− δ( p − p j ), mas já foi dito que tais funções não são apropriadas.
Finalmente, a forma mais usual de apresentar o operador do campo quantizado é obtida
aplicando a transformação de Fourier diretamente aos operadores de campo a( x ) e a† ( x ) na
Eq. (3.73): Z  
−3/2
u( x ) = (2π ) dµ( p) a( p)e−ipx + a† ( p)eipx . (3.77)

E também aqui os operadores de campo a† ( p) e a( p) podem ser expandidos segundo a Eq.


(3.71), com o mesmo resultado que a Eq. (3.76), o que prova que, em geral: â j = a j e â†j = a†j ;
isto não é surpreendente, pois a j e a†j são operadores que independem das coordenadas e
momentos. Em qualquer caso, as formas dadas nas Eqs. (3.73), (3.74), (3.76) e (3.77) são
todas equivalentes.
A propriedade mais importante dos operadores de campo quantizado é a relação de
(anti-)comutação de sua parte de frequência negativa com sua parte de frequência positiva.
Ela é mais fácilmente obtida usando a expressão da Eq. (3.74) em conjunto com as Eqs. (3.36)
e (3.68), das quais é imediato ver que:

[u− ( x ); u+ (y)]∓ = −i∆+ ( x − y) . (3.78)

Este (anti-)comutador aparecerá em uma função central na teoria de perturbação causal com
o nome de «contração de Wick». O que tem sido provado aqui é que ele provém, qualquer
que seja o campo de que se trate, da solução do problema de Goursat na teoria do campo
Capítulo 3. Quantização do campo no plano nulo 63

clássico. Se o mesmo fosse calculado a partir da Eq. (3.77), então obter-se-ia:


Z h i
−3
[u− ( x ); u+ (y)]∓ = (2π ) dµ( p)dµ(q) a( p); a† (q) e−i( px−qy) . (3.79)

∓ p+ = E p ,q+ = Eq

A comparação das Eqs. (3.78) e (3.79) permite obter a( p); a† (q) ∓ .


 

Finalmente, mencionaremos que o operador de campo quantizado pode ser testado bem
por integração sobre o plano nulo, caso em que usa-se a notação:
Z
+
u( x ; f ) := u ( x ) f ( x ) ∗ d3 x , (3.80)
x + =const.

bem por integração no espaço-tempo tetradimensional, em cujo caso utiliza-se a notação:


Z
u( f ) := u ( x ) f ( x ) ∗ d4 x . (3.81)

Cada uma dessas formas tem uma utilidade. A primeira delas permite a construção de
operadores de emissão e absorção de pacotes de onda modulados pela função fˆ( p) evoluindo
no tempo:
Z  
+ +
+
u( x ; f ) = dµ( p) a( p) fˆ( p)∗ e−iEp x + a† ( p) fˆ(− p)∗ eiEp x . (3.82)

A segunda tem relevância na análise da covariância de Poincaré do operador de campo


quantizado, como veremos mais adiante.
Veremos, finalmente, qual é a expressão do operador hamiltoniano P+ no espaço de Fock.
Devido a que, como já foi dito, o operador P+ existe sempre em H1 no plano nulo no sentido
de cumprir a equação de Schrödinger, P+ pode ser obtido por elevação. Segundo a Eq. (3.40):

P+ = ∑( f j ; P+ f k )1 a†j ak . (3.83)
j,k

Usando a Eq. (3.46), então o produto interno em H1 dado na Eq. (3.63):


Z
( f j ; P+ f k )1 = ( f j ; i∂+ f k )1 = dµ( p) p+ fˆj ( p)∗ fˆk ( p) . (3.84)

Substituindo na Eq. (3.83) e usando a Eq. (3.71), chega-se finalmente a:


Z
P+ = dµ( p) p+ a† ( p) a( p) , (3.85)

que é definido não-negativo.


Concluímos esta primeira seção do capítulo com o seguinte comentário: A teoria desen-
volvida é válida, como mencionado de início, para uma única partícula. Quando estiverem
presentes na teoria mais tipos de partículas tereamos de introduzir correspondentes opera-
dores de emissão e absorção para cada um deles, e o espaço de Fock completo será igual
ao produto tensorial dos espaços de Fock de cada tipo de partícula [100]. A generalização
64 Capítulo 3. Quantização do campo no plano nulo

dos procedimentos aqui descritos é conceitualmente óbvia, mas não o é assim sua aplica-
ção explícita. Veremos portanto em detalhe a construção dos campos quantizados escalar,
fermiônico e vetorial sem massa.

3.2 Quantização do campo escalar

3.2.1 Campo escalar neutro

Façamos primeiro o estudo do campo escalar neutro; esse é o único caso em que existe
na teoria um único tipo de partícula, e é, portanto, aquele em que a teoria desenvolvida é
mais facilmente implementável; ainda mais, todos os outros campos podem ser quantizados
a partir do caso presente, como veremos nas próximas subseções.
Um único tipo de partícula significa que deve introduzir-se apenas um par de operadores
de emissão e absorção, a† ( f ) e a( f ). O operador de campo quantizado será então:
Z  
φ( x ) = (2π )−3/2 dµ( p) a( p)e−ipx + a† ( p)eipx . (3.86)

Ele terá distribuição de comutação igual à distribuição de Jordan-Pauli, pois é ela que
soluciona o problema de Goursat na teoria clássica, suficiente, portanto, para a relação de
completeza da base de funções de onda de uma partícula. Assim:

[ φ− ( x ); φ+ (y)] = −iD+ ( x − y) . (3.87)

Esta escolha implica, segundo as Eqs. (2.80) e (3.67), que o produto interno no espaço real seja:

←→
Z
( f ; g )1 = i d3 x f ( x ) ∗ ∂ − g ( x ) , (3.88)
x+

que é compatível com o da Eq. (3.63), pois aplicando a transformação de Fourier:


Z
( f ; g)1 = i (2π )−3 d3 xdµ( p)dµ(q) fˆ( p)∗ ĝ(q)ei( p−q)x (−i )( p− + q− )
Z
= dµ( p) fˆ( p)∗ ĝ( p) ,

que é o resultado desejado. Como:


Z
−3
D ( x ) = i (2π ) d4 pδ( p2 − m2 )sgn( p− )e−ipx , (3.89)

ter-se-á sua parte de frequência positiva e a de frequência negativa iguais, respectivamente, a:


Z
D+ ( x ) = i (2π )−3 dµm ( p)e−ipx , D− ( x ) = − D+ (− x ) , (3.90)

de forma que:
[ φ( x ); φ(y)] = −iD ( x − y) . (3.91)
Capítulo 3. Quantização do campo no plano nulo 65

Das Eqs. (3.87), (3.90) e (3.79) obtém-se a relação:


Z Z h i
−ip( x −y)
dµ( p) e = dµ( p)dµ(q) a( p); a† (q) e−i( px−qy) , (3.92)


p+ = E p p+ = E p ,q+ = Eq

que é satisfeita se os operadores de campo de emissão e absorção no espaço dos momentos


seguirem à relação de comutação:
h i
a( p); a† (q) = 2p− δ( p − q) . (3.93)

Particularmente, da Eq. (3.91) pode-se obter a relação de comutação a tempos iguais. Da


Eq. (3.89) tem-se, integrando nas variáveis p+ e p⊥ , que:

+∞
1 sin( p− x − ) 1
Z
D (0; x) = δ( x⊥ ) dp− = sgn( x − )δ( x ⊥ ) , (3.94)
2π p− 4
0

portanto:
i
φ( x + ; x); φ( x + ; y) = − sgn( x − − y− )δ( x ⊥ − y⊥ )
 
. (3.95)
4
Esta é uma expressão evidente da não comutatividade do campo na direção do eixo x − que
haviamos antecipado. Adicionalmente, tomando a derivada em relação à coordenada y− na
Eq. (3.95), obtém-se:
i
φ ( x + ; x ); ∂ − φ ( x + ; y ) = − δ ( x − y )
 
. (3.96)
2
Numa análise hamiltoniana, o momento conjugado ao campo φ é π = ∂− φ, o que significa
que a Eq. (3.96) é a relação de comutação canônica a tempos iguais. Mas ela não é a relação
de comutação canônica a tempos iguais usual, senão que está multiplicada por um fator de
1/2. O aparecimento deste fator deve-se a que φ e π não são dinamicamente independentes
no plano nulo, pois π independe de ∂+ φ. A relação aqui obtida é a mesma que a que se
encontra numa análise canônica por meio do procedimento de Dirac-Bergmann para os
sistemas vinculados, como pode ser verificado, por exemplo, na Ref. [198]. O procedimento
desenvolvido reproduz este resultado porque o espaço de Fock tem sido construído a partir
de uma base apropriada de funções de onda de uma partícula: Ela já respeita aos vínculos da
teoria, o que se reflete na relação de completeza da base do espaço H1 . Da mesma equação
pode-se notar que as relações de comutação a tempos iguais estão definidas apenas com
o conhecimento do campo no plano nulo, tal como acontecia no problema de Goursat na
teoria clássica; isto, outra vez, é diferente do que acontece na dinâmica instantânea, em que
as relações canônicas de comutação requerem o conhecimento não só de φ mas também de
∂0 φ no plano x0 = constante, este último não podendo ser deduzido do primeiro.

A equação de Klein-Gordon-Fock no plano nulo pode ser colocada na forma hamiltoniana


de Schrödinger:
i∂+ φ( x ) = P+ φ( x ) , (3.97)
66 Capítulo 3. Quantização do campo no plano nulo

com o hamiltoniano14 :

i −1 2 i
Z
P+ = ∂ ( ∂ − m2 ) = dvsgn( x − − v)(∂2⊥ − m2 ) , (3.98)
2 − ⊥ 4

que é não local na variável x − . Em qualquer caso, a mera existência deste operador já torna
válida a Eq. (3.85): Z
P+ = dµ( p) p+ a† ( p) a( p) . (3.99)

Com a relação de comutação da Eq. (3.93), o operador de campo quantizado da Eq. (3.86)
satisfaz à equação do movimento de Heisenberg [Eq. (3.51)].

3.2.2 Campo escalar carregado

Introduziremos agora um outro tipo de partícula, também escalar, na teoria anterior.


Precisa-se para isto introduzir um outro conjunto de operadores de emissão e absorção,
b† ( f ) e b( f ). Os dois campos escalares, φ a e φb , terão correspondentes operadores de campo
quantizado: Z  
φ a ( x ) = (2π )−3/2 dµ( p) a( p)e−ipx + a† ( p)eipx , (3.100)
Z  
−3/2
φb ( x ) = (2π ) dµ( p) b( p)e−ipx + b† ( p)eipx . (3.101)

O espaço de Fock da teoria que contém esses dois tipos de partículas é:

+∞  
F + = F a+ ⊗ Fb+ = Hna+ ⊗ Hnb+
M
1 2
. (3.102)
n1 ,n2 =0

E o hamiltoniano, a soma dos hamiltonianos dos dois tipos de partículas. No caso em que a
massa dos dois campos é a mesma –caso ao qual essa discussão será restringida–:
Z  
P+ = dµ( p) p+ a† ( p) a( p) + b† ( p)b( p) . (3.103)

Os operadores de campo escalar quantizado φ a ( x ) e φb ( x ) satisfazem a todas as proprie-


dades recém estudadas para o campo escalar neutro; em particular, às relações de comutação
das Eqs. (3.91) e (3.93).
Resulta conveniente definir a combinação complexa15 :

1 1  
φ := √ ( φ a + iφb ) , φ† := √ φ†a − iφ†b . (3.104)
2 2

14A definição do hamiltoniano P da Eq. (3.98) não é válida no caso bi-dimensional –em que não existem
+
coordenadas x ⊥ – para campos sem massa, pois a mencionada equação levaria ao resultado de ser P+ = 0. O
referido caso deve ser tratado separadamente; nele, o hamiltoniano é P+ = i∂− 1
− . O caso bidimensional, contudo,
não será abordado nessa tese.
15 Lembremos que a combinação aqui apresentada é obtida na teoria clássica ao exigir que o conjunto de

campos escalares φ a e φb se transforme por uma representação diagonal do grupo de gauge U (1), isto para que
as combinações lineares obtidas representem campos associados a partículas de cargas elétricas opostas.
Capítulo 3. Quantização do campo no plano nulo 67

Usando as Eqs. (3.100) e (3.101), encontra-se os correspondentes operadores de campo:


Z  
−3/2
φ( x ) = (2π ) dµ( p) c( p)e−ipx + d† ( p)eipx , (3.105)

Z  
−3/2

φ ( x ) = (2π ) dµ( p) d( p)e−ipx + c† ( p)eipx , (3.106)

com:
1 1
c( p) := √ ( a( p) + ib( p)) , d( p) := √ ( a( p) − ib( p)) . (3.107)
2 2
Com as relações de comutação dadas na Eq. (3.93) para a( p) e b( p) e as definições da Eq.
(3.107), encontra-se que os novos operadores de campo seguem às mesmas relações que os
anteriores:
h i h i
c( p); c† (q) = 2p− δ( p − q) e d( p); d† (q) = 2p− δ( p − q) . (3.108)

E também, da Eq. (3.91), válida para os campos φ a e φb , assim como da Eq. (3.104), obtém-se
que o campo carregado satisfaz:
h i

φ( x ); φ (y) = −iD ( x − y) . (3.109)

Em particular, este resultado implica a seguinte relação de comutação canônica a tempos


iguais:
h i i
φ ( x + ; x ); ∂ − φ † ( x + ; y ) = − δ ( x − y ) , (3.110)
2
lembrando que o momento conjugado ao campo escalar carregado é π = ∂− φ† . Como no
caso neutro [Eq. (3.96)], esta é diferente daquela na dinâmica instantânea por um fator de
1/2, como resultado da teoria ser vinculada no plano nulo.
Finalmente, usando as Eqs. (3.103) e (3.107), o hamiltoniano é:
Z  
P+ = dµ( p) p+ c† ( p)c( p) + d† ( p)d( p) . (3.111)

3.2.3 Campo escalar fermiônico

Consideremos, por último, a possibilidade de que um campo escalar tenha caráter fermi-
ônico. Este ponto terá importância imediata na seção seguinte, e também a terá no Cap. 6. É
mister examinar o seguinte teorema, enunciado, por exemplo, na Ref. [88]:

Teorema (de spin-estatística): Seja u( x ) um operador de campo quantizado espinorial geral


irredutível. Se a conexão entre spin e estatística dele é dado pelas regras de (anti-)comutação:
n o
u( x ); u† (y) = 0 para spin inteiro, ou ,
h i
u( x ); u† (y) = 0 para spin semi-inteiro ,
68 Capítulo 3. Quantização do campo no plano nulo

para todos os intervalos tipo-espaço –isto é: ( x − y)2 < 0–, então u( x ) é idênticamente nulo.

Como o spin do campo escalar é zero (inteiro), segundo o teorema, este só poderá ter
caráter fermiônico se seu anti-comutador com o campo adjunto for diferente de zero para
alguns intervalos do tipo-espaço. Suponhamos, então, que um campo escalar neutro, com
expressão Z  
u( x ) = (2π )−3/2 dµ( p) c( p)e−ipx + c† ( p)eipx , (3.112)

apresenta caráter fermiônico, de forma que seus operadores de campo de emissão e absorção
verificam às relações de anti-comutação:
n o
c( p); c† (q) = 2p− δ( p − q) . (3.113)

Como u† ( x ) = u( x ), deve-se calcular, pelo teorema:


Z  
{u( x ); u(y)} = (2π )−3 dµ( p)dµ(q)2q− δ( p − q) e−i( px−qy) + ei( px−qy) (3.114)

= −iD+ ( x − y) + iD− ( x − y)
= −iD ( x − y) + 2iD− ( x − y) .

A distribuição de Jordan-Pauli, D ( x − y), tem suporte causal, e é nulo para todo intervalo
espacial ( x − y)2 < 0; mas não o é sua parte de frequência negativa, D− ( x − y), que pode
ser não nulo para os mesmos intervalos. Assim, a hipótese do teorema de spin-estatística
não se satisfaz, e sua tese não se aplica. O teorema não impede a existência de campos
escalares fermiônicos, senão o uso do adjunto «†», pois ao usá-lo se perde a causalidade das
relações de anti-comutação –ou, melhor dizendo, os campos escalares fermiônicos precisam
de uma modificação da definição da Eq. (3.73) para a obtenção de leis causais–. Qual seja a
combinação dos operadores de campo de emissão e absorção que deve-se definir como o
campo quantizado adjunto, para recuperar a causalidade das relações de anti-comutação, é
sugerido pela Eq. (3.114); a distribuição de Jordan-Pauli é obtida trocando o sinal de c( p) no
campo adjunto, então definimos:
Z  
ue( x ) := (2π )−3/2 dµ( p) −c( p)e−ipx + c† ( p)eipx . (3.115)

Com ele:
{u( x ); ue(y)} = −iD ( x − y) . (3.116)

Finalmente, com o hamiltoniano definido não-negativo


Z
P+ = dµ( p) p+ c† ( p)c( p) (3.117)

se satisfazem as equações do movimento dos campos:

i∂+ u( x ) = [u( x ); P+ ] e i∂+ ue( x ) = [ue( x ); P+ ] . (3.118)


Capítulo 3. Quantização do campo no plano nulo 69

A partir desse ponto é fácil escrever também o operador de campo do campo escalar
carregado fermiônico:
Z  
−3/2
u( x ) = (2π ) dµ( p) c2 ( p)e−ipx + c1† ( p)eipx , (3.119)

e seu adjunto:
Z  
ue( x ) = (2π )−3/2 dµ( p) −c1 ( p)e−ipx + c2† ( p)eipx . (3.120)

Eles satisfazem à regra de anticomutação da Eq. (3.116), e seus operadores de campo de


emissão e absorção associados às partículas «1» e «2», as das Eqs. (3.113). O hamiltoniano
para este conjunto de campos quantizados é:
Z  
P+ = dµ( p) p+ c1† ( p)c1 ( p) + c2† ( p)c2 ( p) . (3.121)

3.3 Quantização do campo de Dirac

Consideremos à continuação o campo fermiônico de Dirac. Por ser fermiônico, segundo


aprendemos, as relações entre os operadores de campo serão de anti-comutação, e os estados,
antissimétricos; e por ser de Dirac, ele descreve a duas partículas, por exemplo, o elétron e o
pósitron, cada uma das quais, por ter spin 1/2, tem duas possíveis polarizações, em razão do
qual se prevê que será preciso usar quatro conjuntos de operadores de emissão e absorção:
um conjunto para cada polarização de cada partícula16 . É útil lembrar, para começar, que o
campo de Dirac clássico é decomposto em duas partes pelos operadores de projeção Λ(±) 17 :

1
ψ( x ) = ψ(+) ( x ) + ψ(−) ( x ) ; ψ(±) := Λ(±) ψ , Λ(±) := √ γ0 γ± . (3.122)
2

Dessas duas partes, somente a ψ(+) é dinâmica, e segue à equação de Schrödinger:

i∂+ ψ(+) = P+ ψ(+) , (3.123)

com hamiltoniano não local18 :

i i 2
P+ = −(m + iγ⊥ ∂⊥ ) (m − iγ⊥ ∂⊥ ) = ∂ ⊥ − m2 ∂ −
 1
− , (3.124)
2∂− 2

16 O campo fermiônico de uma só partícula é o campo fermiônico de Majorana. Em tal caso, precisar-se-ia
apenas introduzir dois conjuntos de operadores de emissão e absorção, um conjunto para cada polarização da
partícula.
17 Não se confunda a estes índices com os que denotam às partes de frequência positiva e de frequência

negativa, denotadas por subíndices sem parênteses: ψ± ( x ). Por exemplo, a parte de frequências negativa da
parte Λ(+) ψ é denotada por ψ(+)− .
18 Também aqui se apresentam as dificuldades que antes se apresentaram para o campo escalar não massivo

no espaço-tempo bidimensional –vide a nota de rodapé 14–; esse caso deve ser tratado separadamente.
70 Capítulo 3. Quantização do campo no plano nulo

que é o hamiltoniano da equação de Klein-Gordon-Fock [compare com a Eq. (3.98)]. A


projeção ψ(−) , por outro lado, é obtida da ψ(+) por meio da relação vinculante:

1
ψ(−) = √ γ0 (m − iγ⊥ ∂⊥ )ψ(+) . (3.125)
i 2∂−

Como anteriormente dissemos, as componentes da projeção ψ(+) ( x ) estão sujeitas a


satisfazer unicamente à equação de Klein-Gordon-Fock, de forma que, expandindo-a na base
do espaço projetado por Λ(+) :
   
0 0
   
1 0
ψ(+) ( x ) = 
0 α ( x ) + 1 β ( x )
   , (3.126)
   
0 0

poder-se-á considerar aos campos α( x ) e β( x ) como sendos campos escalares carregados


fermiônicos, em virtude do qual os correspondentes operadores de campo quantizado terão
a expressão:
Z  
α( x ) = (2π )−3/2 dµ( p) b1 ( p)e−ipx + d1† ( p)eipx , (3.127)
Z  
β( x ) = (2π )−3/2 dµ( p) b−1 ( p)e−ipx + d†−1 ( p)eipx . (3.128)

Estes estão sujeitos às relações de anti-comutação:


n o
α(y)} = −iD ( x − y) ,
{ α ( x ); e β( x ); βe(y) = −iD ( x − y) , (3.129)

e, consequentemente, também o estão seus correspondentes operadores de campo de emissão


e absorção (s = ±1):
n o n o
bs ( p); bs† (q) = 2p− δ( p − q) , ds ( p); d†s (q) = 2p− δ( p − q) . (3.130)

A evolução temporal destes campos é definida pelo operador hamiltoniano:


Z  
P+ = ∑ dµ( p) p+ bs† ( p)bs ( p) + d†s ( p)ds ( p) . (3.131)
s=±1

O campo fermiônico de Dirac então já está quantizado. Contudo, é conveniente usar o


vínculo da Eq. (3.125) para reconstruir o campo ψ( x ) completo, e escrever a relação de
anti-comutação em função dele. Este procedimento é semelhante àquele seguido no estudo
clássico: Substituindo as Eqs. (3.127) e (3.128) na Eq. (3.126), obtém-se o operador de
campo quantizado ψ(+) . Depois, usa-se a Eq. (3.125) para encontrar o operador de campo
quantizado ψ(−) ; a soma deles –como na Eq. (3.122)– é o operador de campo quantizado
ψ( x ). Como pode-se ver, neste procedimento nenhum grau de liberdade adicional tem
sido introduzido, e o campo inteiro está implicitamente escrito só em função dos graus de
Capítulo 3. Quantização do campo no plano nulo 71

liberdade dinâmicos da teoria, isto é, em função de α( x ) e β( x ). Obtém-se:


Z  
−3/2
∑ 2p− us ( p)bs ( p)e−ipx + vs ( p)d†s ( p)eipx
p
ψ( x ) = (2π ) dµ( p) . (3.132)
s

E o campo adjunto de Dirac:


Z  
ψ( x ) = (2π )−3/2 ∑ 2p− vs ( p)ds ( p)e−ipx + us ( p)bs† ( p)eipx
p
dµ( p) , (3.133)
s

com as funções u, u e v, v normalizadas como no caso clássico, isto é, tais que satisfaçam às
regras de soma:
Eγ+ + | p− |γ− + p⊥ γ⊥ + m
∑ us ( p)us ( p) = |2p− |
, (3.134)
s

Eγ+ + | p− |γ− + p⊥ γ⊥ − m
∑ vs ( p)vs ( p) = |2p− |
. (3.135)
s

Com as expressões das Eqs. (3.132) e (3.133) e usando as regras de anti-comutação da Eq.
(3.130), encontra-se que o anti-comutador da parte de frequência negativa do campo de
Dirac, ψ− ( x ), com a parte de frequência positiva de seu adjunto de Dirac, ψ+ (y), é:
Z
−3
dµ( p)2| p− | ∑ us ( p) a us ( p)b e−ip(x−y)

ψ− ( x ) a ; ψ+ (y)b = (2π )
s
Z
= (2π )−3 p + m)e−ip(x−y)
d4 pΘ( p− )δ( p2 − m2 )(/ , (3.136)

e, analogamente:
Z
ψ+ ( x ) a ; ψ− (y)b = (2π )−3 dµ( p)2| p− | ∑ vs ( p) a vs ( p)b eip(x−y)

s
Z
−3
= −(2π ) p + m)e−ip(x−y)
d pΘ(− p− )δ( p2 − m2 )(/
4
. (3.137)

Assim, desde que Θ( p− ) − Θ(− p− ) = sgn( p− ), o anti-comutador do campo de Dirac com


seu adjunto de Dirac é:
Z
ψ( x ); ψ(y) = (2π )−3 d4 p(/
p + m)sgn( p− )δ( p2 − m2 )e−ip(x−y)

. (3.138)

Identificando a distribuição S( x ) que no caso clássico soluciona o problema de Goursat da


equação de Dirac,
Z
−3
S( x ) = i (2π ) p + m)sgn( p− )δ( p2 − m2 )e−ipx = (i /
d4 p ( / ∂ + m) D ( x ) , (3.139)

escrever-se-á, finalmente:

ψ( x ); ψ(y) = −iS( x − y) . (3.140)
72 Capítulo 3. Quantização do campo no plano nulo

3.4 Quantização do campo vetorial sem massa

Estudaremos por último ao campo vetorial sem massa, A a . Como estabelecido no estudo
clássico efetuado no Cap. 2, este campo só tem dois graus de liberdade, correspondentes às
componentes transversais Aα (α = 1, 2), que estão sujeitas à equação de Klein-Gordon-Fock:

□ Aα = 0 . (3.141)

A componente A+ é nula –essa é a condição de gauge do plano nulo, imposta para que o
problema de Goursat esteja bem definido–, enquanto que a componente A− pode ser obtida
da condição de gauge de Lorenz, implicada pela condição de gauge do plano nulo no caso
livre:
A+ = 0 , A− = −∂− 1
− ∂α A
α
. (3.142)

Por construção, o espaço de Fock inclui somente aos estados físicos, de forma que só os
potenciais A a que satisfaçam às Eqs. (3.141) e (3.142) poderão ser funções de onda de uma
partícula. Sem embargo, uma vez que a condição de gauge do plano nulo não é invariante
de Poincaré, poder-se-ia pôr em dúvida a invariância do procedimento de quantização
perante essas transformações. Este problema pode ser colocado na seguinte forma: Será
que o espaço de Fock dos estados físicos é o mesmo para todos os sistemas inerciais de
referência? Nesta seção responderemos a essa pergunta só de forma qualitativa: Quando
é aplicada uma transformação de sistema de referência, a condição de gauge de Lorenz
se mantém válida, pois ela é covariante, mas a condição de gauge do plano nulo já não
é satisfeita. Contudo, ainda é possível fazer uma transformação de gauge de forma que
dita condição seja recuperada. Este procedimento implica que o vetor inicial tem um vetor
correspondente no novo sistema de referência, mas ainda é possível que ele não seja único.
Acontece que esse não é o caso e a correspondência entre estados nos diferentes sistemas de
referência é biunívoca, pois o gauge do plano nulo é único. Com efeito, a condição de gauge
do plano nulo e a de Lorenz, respectivamente, são mantidas na transformação de gauge
A′a = A a + ∂ a f se, e só se, a função f satisfaz às equações:

∂− f = 0 e □f = 0 . (3.143)

Da substituição da primeira dessas condições na segunda, obtém-se que, necessáriamente,


deve ser: ∂2⊥ f = 0. A condição assintótica de que f seja nula no infinito espacial então
implica que f = 0, isto é, que não existe nenhum outro potencial que seja, a um tempo,
físicamente equivalente e que satisfaça às mesmas condições de gauge. Em outras palavras,
as transformações de gauge e as de Poincaré podem se combinar de forma tal que os espaços
de estados físicos observados em diferentes sistemas de referência sejam os mesmos. Uma
prova completa disto será dada no Cap. 6, onde estenderemos o espaço de Fock para
incluir também estados não físicos com o objetivo de obter uma formulação explicitamente
covariante das teorias de gauge, o que simplificará considerávelmente os cálculos.
Capítulo 3. Quantização do campo no plano nulo 73

De acordo com o programa de quantização desenvolvido, os operadores de campo das


componentes A1 e A2 do campo vetorial sem massa são:
Z  
−3/2
A1 ( x ) = (2π ) dµ( p) a1 ( p)e−ipx + a1† ( p)eipx , (3.144)

Z  
−3/2
A2 ( x ) = (2π ) dµ( p) a2 ( p)e−ipx + a2† ( p)eipx . (3.145)

Como eles só estão sujeitos a obedecer à equação de Klein-Gordon-Fock, satisfarão às regras


de comutação:

[ A1− ( x ); A1+ (y)] = −iD+ ( x − y) , [ A2− ( x ); A2+ (y)] = −iD+ ( x − y) . (3.146)

Aqui tem-se usado regras de comutação, e não de anti-comutação, porque estamos interessa-
dos em descrever partículas bosônicas, por exemplo, o fóton. Da Eq. (3.146) decorrem as
relações de comutação dos operadores de campo completos:

[ A1 ( x ); A1 (y)] = −iD ( x − y) , [ A2 ( x ); A2 (y)] = −iD ( x − y) , (3.147)

e as dos operadores de campo de emissão e absorção no espaço dos momentos:


h i h i
a1 ( p); a1† (q) = 2p− δ( p − q) , a2 ( p); a2† (q) = 2p− δ( p − q) . (3.148)

Finalmente, o hamiltoniano do campo vetorial não massivo será a soma dos hamiltonianos
associados a estas componentes dinâmicas:
Z  
P+ = dµ( p) p+ a1† ( p) a1 ( p) + a2† ( p) a2 ( p) . (3.149)

Como no caso do campo fermiônico de Dirac, embora o já dito seja, própriamente,


suficiente, resulta conveniente escrever uma expressão para o campo vetorial completo.
Para tal tarefa, usa-se a segunda das Eqs. (3.142), que permite encontrar a componente
longitudinal A− ( x ):

dµ( p) h
Z   i
A− ( x ) = − (2π )−3/2 ( p1 a1 ( p) + p2 a2 ( p)) e−ipx + p1 a1† ( p) + p2 a2† ( p) eipx ,
p−
(3.150)

na qual identifica-se a componente longitudinal dos vetores de polarização, ε 1,2 ( p)− . Desta
sorte, pode-se escrever o operador de campo quantizado em forma compacta como:
Z  
a
A ( x ) = (2π ) −3/2
∑ dµ( p)ε λ ( p) a aλ ( p)e−ipx + a†λ ( p)eipx . (3.151)
λ=1,2

Mediante o uso das relações de comutação da Eq. (3.148) e a soma dos vetores de
polarização transversais encontrada na análise clássica, já é uma tarefa fácil calcular a relação
74 Capítulo 3. Quantização do campo no plano nulo

de comutação do operador de campo quantizado da Eq. (3.151):


h i Z  
a b
A ( x ); A (y) = (2π ) −3
dµ( p) ∑ ε λ ( p) a ε λ ( p)b e−ip(x−y) − eip(x−y)

p+ = E
λ=1,2

pa η b + η a p b
Z   
= (2π )−3 d4 pδ( p2 )Θ ( p− ) − g ab + e−ip(x−y) − eip(x−y)
p−
p a η b + η a pb
Z  
= −(2π )−3 d4 psgn ( p− ) δ( p2 ) g ab − e−ip(x−y) . (3.152)
p−

Ou seja, definindo a distribuição D ab ( x ) por:

p a η b + η a pb
Z  
−3
ab
D ( x ) = i (2π ) 4 2
d psgn ( p− ) δ( p ) g − ab
e−ipx . (3.153)
p−

ter-se-á que ela é: h i


A a ( x ); Ab (y) =: iD ab ( x − y) , (3.154)

Terminamos mencionando que, caso tenhamos interesse no campo vetorial carregado, a


generalização dos resultados obtidos é imediata seguindo os mesmos passos percorridos
para ir do campo escalar neutro ao carregado, e o próprio é válido para a construção do
campo vetorial fermiônico sem massa. Contudo, como estes campos não aparecerão nesta
tese, não os escreveremos explicitamente.
Capítulo 4

Teoria de perturbação causal no plano nulo

Definida a dinâmica da frente de luz e os campos quantizados nela, precisamos desenvol-


ver uma forma de utilizar o conhecimento adquirido para fazer predições físicas. Note-se que
tudo que é observado e medido só pode sê-lo devido à existência das interações, donde de-
corre a necessidade de formular uma teoria dos campos quantizados interagentes. Contudo,
já o dissemos, a definição do campo quantizado em interação é um assunto muito longe de ser
trivial, e, de fato, o ponto de partida para uma tal formulação ainda é a «teoria da matriz S».
Com o intuito de exemplificar o acima dito, reproduzimos aqui as seguintes palavras
proferidas por Scharf, que constam no Prefácio da Ref. [107], a respeito das dificuldades da
teoria em interação e como elas são solucionadas na TPC, e que em tradução livre afirmam:
«O fato de que a teoria causal seja perturbativa não é somente uma questão técnica, mas
tem uma origem física profunda. Em qualquer teoria quântica do campo deve ser feita uma
distinção precisa entre os campos fundamentais que aparecem na interação elementar e os
estados assintóticos que descrevem as partículas reais incidentes e resultantes. Isto é bem
conhecido atualmente na teoria das interações fortes (QCD), em que os campos de quark
são os campos fermiônicos fundamentais, enquanto que os mésons e núcleons são estados
ligados complicados. Mas também o elétron, que carrega consigo o campo de Coulomb,
pode ser considerado um estado ligado em que fótons escalares estão confinados ao campo
de Dirac. Os estados ligados são o normal. Somente o fóton e os neutrinos parecem ser
elementares no sentido de serem gerados pelos campos fundamentais. Na teoria causal
o difícil problema dos estados assintóticos é claramente separado do resto da teoria pelo
método de “comutação adiabática”: A interação é multiplicada por uma função g( x ), e o
limite adiabático g → 1 é tomado no final nas quantidades observáveis. Isto significa que o
confinamento é desligado na região assintótica num experimento mental, de forma que são
os campos livres os que interagem, e não as complicadas partículas físicas reais. A comutação
então é removida no limite adiabático. Do estudo desse limite podemos aprender algumas
coisas da estrutura dos estados assintóticos reais: Acontece que o limite não sempre existe,
senão que ele é finito e único somente quando seções de choque inclusivas específicas são
consideradas. Nesse sentido, a própria matriz S determina a estrutura das partículas físicas,
como deve ser.»
Neste capítulo formularemos a teoria de perturbação causal de forma consistente com a
dinâmica da frente de luz. Esta será a ferramenta que nos permitirá calcular amplitudes de
transição nos processos de espalhamento, assim como as correções radiativas aos propaga-
dores do campo livre; sua importância é central na presente tese.

75
76 Capítulo 4. Teoria de perturbação causal no plano nulo

4.1 Axiomas de Bogoliubov, Medvedev e Polivanov

O ponto de partida para qualquer teoria da matriz S é estabelecer as propriedades gerais


deste operador. No caso da TPC, elas estão inseparavelmente ligadas à operação de comuta-
ção adiabática, cuja definição é como segue [100]:

Definição: Seja g ∈ S (R4 ) : R4 → R uma função com valores no intervalo [0; 1]. A operação
de comutação adiabática da interação consiste em multiplicar a constante de acoplamento1 da teoria
de interação pela função g, então chamada função de comutação.

A função de comutação regula a intensidade da interação: Nas regiões em que g( x ) = 0


a interação está ausente, nas regiões em que g( x ) = 1, adota sua completa intensidade, e
naquelas em que 0 < g( x ) < 1, manifesta-se com uma intensidade parcial. Assim, a comuta-
ção adiabática da interação elimina toda influência desta nos confins do espaço e possibilita
a escrituração da teoria em função dos bem definidos campos livres: os estados assintóti-
cos são gerados pelos campos quantizados livres, isto é, são vetores do espaço de Fock em
que se representam as relações de (anti-)comutação dos operadores de campo livre. Uma
primeira e imediata consequência disto é que na TPC os parâmetros que caracterizam aos
campos livres, como sua massa, são os parâmetros físicos (reais).

Definição: Seja uma teoria de interação na qual se opera a comutação adiabática com a função de
comutação g. O operador de espalhamento S( g) é a forma quadrática cujo elemento de matriz entre
os estados Φ, Ψ ∈ F ,
⟨Ψ; S( g)Φ⟩ , (4.1)

é igual à amplitude de probabilidade de que, num processo de espalhamento, o estado inicial Φ no


infinito passado –no sentido do tempo x + do plano nulo– se torne o estado final Ψ no infinito futuro.

A interação real, é claro, corresponde a considerar o «limite adiabático» g → 1. O


valor funcional ao qual se faz tender a função de comutação neste procedimento de limite
não se encontra em S (R4 ); sua existência, portanto, não é trivial, senão que tem de ser
provada em cada teoria estudada. Em mais de um caso, ainda, a existência do mencionado
limite considera-se uma condição segundo a qual termos indeterminados são fixados2 .
Porém, o limite adiabático só tem de ser tomado no final de todas as contas, razão pela
qual, na construção da teoria e em um primeiro estudo, como este que faremos no capítulo
presente, não precisaremos nos preocupar com ele. Por outro lado, da definição decorre
que, se considerarmos a função de comutação nula, g ≡ 0, isto é, na ausência de interação,

1 Na
concepção de Epstein e Glaser (Ref. [103]), de fato, a função de comutação «é» a constante de acopla-
mento da teoria.
2Vide, por exemplo, a Sec. 3.11 da Ref. [107], em que se utiliza a imposição de existência do limite adiabático

para normalizar a auto-energia do elétron na QED na dinâmica instantânea.


Capítulo 4. Teoria de perturbação causal no plano nulo 77

chegaremos à conclusão de que o operador S( g) está sujeito à seguinte «condição inicial»:

S (0) = 1 . (4.2)

Definidos os elementos primários da teoria, passaremos a indicar as propriedades às


quais o operador de espalhamento S( g) tem de respeitar. Elas constituem o conjunto de
axiomas de Bogoliubov, Medvedev e Polivanov3 ; porém, seguindo a Epstein e Glaser [103],
somente consideraremos aqueles axiomas que servem de primórdios para a TPC.

Axioma (da invariância sob translações): Seja U( a; 1) o operador unitário que realiza as transla-
ções x → x + a, a ∈ R4 , no espaço de Fock F . O operador de espalhamento se transforma segundo:

U( a; 1)S( g)U( a; 1)−1 = S( ga ) ; ga ( x ) := g( x − a) . (4.3)

A seguir, introduziremos a causalidade na dinâmica da frente de luz. Para isso, come-


çaremos estabelecendo, como em toda dinâmica, que «dois pointos x, y ∈ M estão causal-
mente conectados se o vetor que os une, x − y, é um vetor do tipo-tempo ou do tipo-luz». A
ordem cronológica no plano nulo, contudo, não é tão simples de se estabelecer. Da definição
das coordenadas invariantes no plano nulo tem-se que dentro do cone de luz é satisfeita
a igualdade: sgn ( x + ) = sgn( x0 ). Portanto, nessa região adotar-se-á a definição de ordem
cronológica: «Sejam x, y ∈ M dois pontos tais que x encontra-se no interior do cone de luz
com origem em y; se x + < y+ , então x é um ponto no passado de y; se x + > y+ , então x é
um ponto no futuro de y». Tenha-se cuidado, pois as coordenadas invariantes, por serem
tais, não podem ser mudadas por transformações de coordenadas, nem sequer por transfor-
mações de reversão do eixo coordenado temporal: O sinal de x + , assim como seu valor, é
fixo. Esta é uma consequência do fato de que o sistema de referência é fixado uma vez que a
base de tétradas é escolhida, como já foi explicado no Cap. 2.
Em relação aos comentários recém feitos, lembramos da definição do cone de luz futuro
do ponto x ∈ M, assim como o cone de luz passado dele, como os conjuntos:
n o
V ± ( x ) : = y ∈ M ( y − x )2 > 0 ; y + ≷ x + , (4.4)

respectivamente. Essa definição traz consigo a seguinte dificuldade: Na superfície isocrônica


x + = 0 existem pontos com diferente coordenada longitudinal x − que estão causalmente
conectados; eles são os pontos 0; 0⊥ ; x − que cuja união é o eixo x − . A existência dessa


região, instantânea mas causalmente conectada, diferencia a dinâmica da frente de luz da


instantânea: Naturalmente, desde que a causalidade o permite, as interações bem podem se
propagar no eixo x − .
Estendamos a definição dada da ordem cronológica para subconjuntos de pontos no
espaço-tempo de Minkowski. Sejam X, Y ⊂ M dois conjuntos de pontos. Definimos as

3O trabalho original é a Ref. [99]; sem embargo, os axiomas também são expostos no capítulo 10 da Ref.
[100] e no capítulo 14 da Ref. [101], de mais fácil acesso. Eles são recopilados também na Ref. [173].
78 Capítulo 4. Teoria de perturbação causal no plano nulo

seguintes relações entre eles:

X < Y :⇔ ∀ x ∈ X, y ∈ Y : x + < y+ ; (4.5)

X ∼ Y :⇔ ∀ x ∈ X, y ∈ Y : ( x − y)2 < 0 . (4.6)

O significado dos simbolos «<» e «∼» é claro: X < Y significa que os conjuntos X e Y po-
dem ser separados por um plano nulo de tempo constante, com os pontos de X no passado
dos pontos de Y; X ∼ Y quer dizer que os pontos de X estão espacialmente separados da-
queles de Y. A causalidade é implementada por meio do seguinte enunciado.

Axioma (da causalidade): Sejam g1 , g2 ∈ S (R4 ) duas funções de comutação cujos suportes
satisfazem: supp( g1 ) < supp( g2 ). Cumpre-se a igualdade:

S ( g1 + g2 ) = S ( g2 ) S ( g1 ) . (4.7)

Se, por outro lado, se satisfaz a relação: supp( g1 ) ∼ supp( g2 ), então a decomposição da Eq. (4.7)
ainda é válida, e os operadores S( g1 ) e S( g2 ) comutam.

O sistema axiomático de Bogoliubov, Medvedev e Polivanov inclui também aos seguin-


tes axiomas, os quais não se usarão na construção da TPC no plano nulo.

Axioma (da unitariedade): Para toda função de comutação g ∈ S (R4 ) o operador de espalha-
mento é unitário:
S( g)† S( g) = 1 = S( g)S( g)† . (4.8)

Este axioma está claramente ligado à interpretação probabilística dos elementos de ma-
triz do operador de espalhamento. É útil mencionar, ademais, que ele se refere ao espaço de
Fock construído com os estados físicos, como até agora temos feito. No Cap. 6 estenderemos
o espaço de Fock para conter estados não-físicos; naquela circunstância, o axioma da unitari-
edade se satisfaz somente no subespaço físico, e tem de ser substituído por uma condição de
pseudo-unitariedade no espaço de Fock completo.

Axioma (da invariância de Lorentz): Seja U(0; Λ) o operador unitário que realiza as transform-
ções de Lorentz x → Λx, Λ ∈ L↑+ , no espaço de Fock F . O operador de espalhamento se transforma
segundo:  
U(0; Λ)S( g)U(0; Λ)−1 = S( gΛ ) ; g Λ ( x ) : = g Λ −1 x . (4.9)

Este axioma não é necessário para a construção da TPC, embora seu uso simplificaria a
prova dos teoremas de causalidade que apresentaremos mais adiante neste capítulo4 . Nós
não o utilizaremos, precisamente, para mostrar explicitamente que também na dinâmica da
frente de luz tal axioma não é requerido pela TPC.

4A dispensabilidade da invariância de Lorentz na dinâmica instantânea é afirmada por Epstein e Glaser na


Ref. [103], não obstante o qual, eles mesmos, e também Scharf na Ref. [107], a usam para simplificar as provas.
Capítulo 4. Teoria de perturbação causal no plano nulo 79

Axioma (da estabilidade do vazio e do setor de uma partícula): Para toda função de comutação
adiabática g ∈ S (R4 ), o operador de espalhamento deixa invariantes aos estados de vazio e de uma
partícula:
Φ = Ω ∨ Φ = (0; φ; 0; · · · ) ⇒ S( g)Φ = Φ . (4.10)

Embora este seja um requisito razoável, não constitui um elemento fundamental para
a TPC. Ademais, a análise da estabilidade do setor de uma partícula no limite adiabático
permite extrair resultados em relação a se, em uma dada teoria, os campos fundamentais
podem também ser os estados assintóticos reais.

4.2 Teoria perturbativa do operador de espalhamento


A teoria perturbativa do operador de espalhamento consiste em construir uma série
formal em potências do parâmetro de acoplamento da interação compatível com a condição
inicial da Eq. (4.2) e os axiomas recém estabelecidos. Formalmente, o operador S( g) é
expresso então como a seguinte série perturbativa:

1
Z
S( g) =: 1 + ∑ d4 x1 · · · d4 xn Tn ( x1 ; · · · ; xn ) g( x1 ) · · · g( xn ) . (4.11)
n ∈N
n!

A Eq. (4.11) define às distribuições operador-valuadas Tn ( x1 ; · · · ; xn ) ∈ S ′ (R4n ), denomi-


nadas «distribuições de transição da ordem n» ou, também, «distribuições de n pontos».
Note-se, adicionalmente, que essa definição utiliza já do «teorema nuclear» de Schwartz [75]
–vide também a Ref. [88]–, que diz:

Teorema (nuclear de Schwartz): Seja U um funcional de argumentos f 1 , · · · , f k ∈ S , con-


tínua em cada um deles. Existe uma única distribuição V ∈ S ′ , nas mesmas variáveis, tal que:
U ( f 1 ; f 2 ; · · · ; f k ) = V ( f 1 f 2 · · · f k ).

Evidentemente, a definição da Eq. (4.11) está escrita já em função da distribuição depen-


dente não das diversas funções, mas do produto delas. Mas, porque o produto de funções
g( x1 ) · · · g( xn ) é simétrico em seus argumentos x1 , · · · , xn , as distribuições de transição, cu-
jas funções de teste são g⊗n , têm também de ser simétricas em seus argumentos. Assim
sendo, pode-se definir um conjunto de n pontos no espaço-tempo de Minkowski, M, por
X := x j ∈ M | j = 1, · · · , n , e introduzir a notação seguinte:


Tn ( X ) ≡ Tn ( x1 ; · · · ; xn ) , g ( X ) ≡ g ( x1 ) · · · g ( x n ) , dX ≡ d4 x1 · · · d4 xn , (4.12)

com a qual o operador S( g) se escreve sucintamente:

1
Z
S( g) = 1 + ∑ n! dXTn ( X ) g( X ) . (4.13)
n ∈N

O operador inverso de S( g), S( g)−1 , cuja interpretação é a de conectar os estados finais


80 Capítulo 4. Teoria de perturbação causal no plano nulo

do processo de espalhamento com os iniciais, em sentido contrário ao operador S( g), é


também formalmente expresso como uma série perturbativa:

1
Z
S ( g ) −1 = 1 + ∑ n! en ( X ) g( X )
dX T . (4.14)
n ∈N

As distribuições T
en estão relacionadas com as distribuições de transição; tal relação se obtém
comparando a série da Eq. (4.14) que define a S( g)−1 com a inversa formal da série da Eq.
(4.13), que é:
Z
S ( g ) −1 = 1 + ∑ ∑ (−1)r ∑ dXTn1 ( X1 ) · · · Tnr ( Xr ) g( X ) . (4.15)
n∈N r ∈ In X1 ,··· ,Xr ̸=∅
X1 ∪···∪ Xr = X
X j ∩ Xk =∅,∀ j̸=k

Introduzimos aqui a notação In := {k ∈ N|k ≤ n}. Da comparação das Eqs. (4.14) e (4.15)
decorre a desejada expressão:

en ( X ) =
T ∑ (−1)r ∑ Tn1 ( X1 ) · · · Tnr ( Xr ) . (4.16)
r ∈ In X1 ,··· ,Xr ̸=∅
X1 ∪···∪ Xr = X
X j ∩ Xk =∅,∀ j̸=k

em podem obter-se usando o fato de que S( g)−1 é


Outras relações entre as distribuições Tn e T
a inversa de S( g). Definindo as distribuições

T0 (∅) = 1 = T
e0 (∅) , (4.17)

ter-se-á que:

1
Z
1 = S ( g ) S ( g ) −1 = 1 + ∑ n! ∑ dZTn1 ( X ) T
en−n (Y ) g( Z )
1
. (4.18)
n ∈N X ∪Y = Z
X ∩Y = ∅

Como a Eq. (4.18) é satisfeita qualquer que seja a função de comutação g, dela se segue que:

∀ Z ̸= ∅ : ∑ Tn1 ( X ) T
en−n (Y ) = 0
1
. (4.19)
X ∪Y = Z
X ∩Y = ∅

Analogamente, se na Eq. (4.18) se escrevesse 1 = S( g)−1 S( g) em lugar de S( g)S( g)−1 , obter-


se-ia a relação:
∑ en−n ( X ) Tn (Y ) = 0
T 1 1
. (4.20)
X ∪Y = Z
X ∩Y = ∅

As Eqs. (4.19) e (4.20) serão importantes na prova dos teoremas de causalidade.


Passemos a derivar a expressão dos axiomas de Bogoliubov, Medvedev e Polivanov na
teoria perturbativa do operador de espalhamento, e, assim, as restrições que eles impõem
sobre as distribuições de transição.
Capítulo 4. Teoria de perturbação causal no plano nulo 81

(1) Invariância sob translações: Inserindo a série perturbativa da Eq. (4.13) em ambos os
lados da Eq. (4.3), chega-se à relação:

U( a; 1) Tn ( x1 ; · · · ; xn )U( a; 1)−1 = Tn ( x1 + a; · · · ; xn + a) . (4.21)

(2) Causalidade: Consideremos duas funções de comutação g1 e g2 , cujos suportes satis-


fazem à relação de ordem supp( g1 ) < supp( g2 ), de tal forma que a Eq. (4.7) é satisfeita. O
lado esquerdo dessa equação tem a seguinte série perturbativa:

1
Z
S ( g1 + g2 ) = 1 + ∑ dXTn ( X )( g1 + g2 )( X ) , (4.22)
n ∈N
n!

em que, lembremos: ( g1 + g2 )( X ) ≡ ( g1 ( x1 ) + g2 ( x2 )) · · · ( g1 ( xn ) + g2 ( xn )), então –denotamos


In,0 := In ∪ {0}–:
n!
( g1 + g2 )( X ) = ∑ m!(n − m)!
g2 ( X2 ) g1 ( X1 ) ; (4.23)
mIn,0

| X2 | = m , X = X1 ∪ X2 , X1 ∩ X2 = ∅ , g j (∅) := 1 .

Aqui, a notação «| • |» significa o «cardinal do conjunto •», isto é, o número de elementos


contidos nele. Assim:

1
Z
S ( g1 + g2 ) = 1 + ∑ ∑ m!(n − m)!
dXTn ( X ) g2 ( X2 ) g1 ( X1 ) . (4.24)
n∈N m∈ In,0

Por outro lado, o lado direito da Eq. (4.7) possui a seguinte expressão perturbativa:

1
Z
S ( g2 ) S ( g1 ) = 1 + ∑ ∑ m!(n − m)!
dXTm ( X2 ) Tn−m ( X1 ) g2 ( X2 ) g1 ( X1 ) . (4.25)
n∈N m∈ In,0

Da comparação das Eqs. (4.24) e (4.25), e lembrando que supp( g1 ) < supp( g2 ), deduz-se
que o axioma da causalidade do operador S( g) se traduz na condição de que as distribuições
de transição sejam «cronologicamente ordenadas»:

Tn ( X ) = Tm ( X2 ) Tn−m ( X1 ) ; X1 < X2 . (4.26)

Aplicando repetidamente a mesma fórmula encontra-se que, quando todos os pontos podem
ser temporalmente ordenados –ou seja, quando não existam pontos com iguais coordenadas
temporais x + –, pode-se escrever a distribuição de n pontos como o «produto temporalmente
ordenado» ou «produto cronológico» de n distribuições de um ponto:

Tn ( x1 ; · · · ; xn ) = T+ { T1 ( x1 ) · · · T1 ( xn )} . (4.27)

Este já é um primeiro indício de que a série perturbativa completa poderia ser gerada
com o mero conhecimento do termo da primeira ordem, T1 ( x ), se um procedimento de
ordenamento cronológico adequado pudesse ser definido.
82 Capítulo 4. Teoria de perturbação causal no plano nulo

Caso seja supp( g1 ) ∼ supp( g2 ), o mesmo procedimento é válido, com a conclusão:

Tn ( X ) = Tm ( X2 ) Tn−m ( X1 ) = Tn−m ( X1 ) Tm ( X2 ) ; X1 ∼ X2 . (4.28)

Em outras palavras, as distribuições de transição correspondentes a conjuntos de pontos


espacialmente separados comutam:

[ Tn ( X ); Tm (Y )] = 0 ; X∼Y . (4.29)

A Eq. (4.28) estende a validade da Eq. (4.27) para pontos isocrônicos sempre que eles não
estejam causalmente conectados. Assim, se houver alguma indeterminação na construção
de Tn à partir de T1 , ela estará restrita à região instantânea mas causalmente conectada do
eixo x − . Tais indeterminações não podem ser fixadas pela condição de causalidade, como
daqui decorre. Outrossim, a Eq. (4.29) aponta para um fato crucial: A distribuição de um
ponto, T1 , deve ser construída de forma a respeitar à mencionada equação. Ora, ela poderia
ser, em princípio, um polinômio de Wick geral dos operadores de campo de emissão e
absorção; porém, como os (anti-)comutadores destes são as partes de frequência positiva
ou de frequência negativa das distribuições de (anti-)comutação dos operadores de campo
quantizado, e como essas não têm suporte no cone de luz, eles não podem aparecer em T1
em combinações arbitrárias, mas em combinações muito específicas. As combinações que,
já o sabemos, levam a (anti-)comutadores com suporte no cone de luz são os operadores
de campo quantizado. Donde a distribuição de um ponto, T1 , e assim também, como
consequência da Eq. (4.27), as de maior número de pontos, serão geralmente funções dos
operadores de campo quantizado.
Finalmente, extraíndo a inversa da Eq. (4.7) obtém-se uma condição de causalidade para
o operador S( g)−1 : Se supp( g1 ) < supp( g2 ), então:

S ( g1 + g2 ) − 1 = S ( g1 ) − 1 S ( g2 ) − 1 , (4.30)

donde, por um procedimento idêntico ao mostrado para o operador S( g), conclui-se que as
distribuições T
en são «anti-cronológicamente ordenadas»:

en ( X ) = T
T em ( X1 ) T
en−m ( X2 ) ; X1 < X2 . (4.31)

(3) Unitariedade: Como a função de comutação é real, a substituição das Eqs. (4.13) e
(4.14) na Eq. (4.8) leva diretamente à condição:

en ( X ) = Tn ( X )†
T . (4.32)

Repetimos que este axioma não será utilizado na construção da TPC, mas como uma condição
para o estabelecimento da forma explícita do primeiro termo da série perturbativa em cada
teoria de interação particular, propriedade que poderá então ser mantida na construção das
seguintes ordens da série perturbativa, como mostraremos na Seç. 4.8.
Capítulo 4. Teoria de perturbação causal no plano nulo 83

(4) Invariância de Lorentz: Introduzindo a série da Eq. (4.13) nos dois membros da Eq. (4.9)
chega-se à relação:

U(0; Λ) Tn ( x1 ; · · · ; xn )U(0; Λ)−1 = Tn (Λx1 ; · · · ; Λxn ) . (4.33)

(5) Estabilidade do vazio e do setor de uma partícula: Colocando a Eq. (4.13) na Eq. (4.10)
obtém-se que:
Z
Φ = Ω ∨ Φ = (0; φ; 0; · · · ) ⇒ dXTn ( X ) g( X )Φ = 0 . (4.34)

4.3 Construção indutiva das distribuições de transição

Nesta seção apresentaremos brevemente a ideia da construção indutiva das distribuições


de transição. A prova de que ela pode ser efetivamente implementada será tema da seção
seguinte.
A Eq. (4.26), isto é, a condição de causalidade, implica que a expressão

Tn1 ( X1 ∪ X2 ) − Tm ( X2 ) Tn1 −m ( X1 )

é nula quando X2 está no futuro de X1 ou quando está causalmente desconectado dele. Em


outras palavras, a expressão recém escrita é «avançada» em relação aos pontos do conjunto
X1 . Pelo mesmo motivo, também a expressão

T ( X3 ∪ X2 ∪ X1 ) − T ( X3 ∪ X2 ) T ( X1 ) + T ( X3 ) T ( X2 ) T ( X1 )
− T ( X3 ) T ( X2 ∪ X1 ) + T ( X2 ) T ( X3 ) T ( X1 ) − T ( X2 ) T ( X3 ∪ X1 )

é avançada em relação a X1 , qualquer que seja a relação entre X2 e X3 , e assim por diante
pode-se escrever uma vasta coleção de distribuições avançadas em relação a um determinado
conjunto. Vê-se que a regra para essas construções é que o conjunto ou ponto a respeito do
qual se quer construir a distribuição avançada esteja na distribuição à direita, e que o sinal na
frente de cada produto de distribuições seja alternado toda vez que uma partição segundo a
Eq. (4.26) seja feita; este último, em particular, significa que o sinal de cada termo pode ser
relacionado com o número de fatores contidos nele. Daqui é claro que a distribuição mais
geral, módulo um fator global, que pode ser construída com as distribuições de transição até
de ordem n, tal que seja avançada em relação ao ponto xn , é –usamos Y = { x1 ; · · · ; xn−1 }–:

An (Y; xn ) := ∑ (−1)r−1 ∑ Tn1 ( X1 ) · · · Tnr ( Xr ) . (4.35)


r ∈ In X1 ,··· ,Xr ̸=∅
X1 ∪···∪ Xr =Y ∪{ xn }
X j ∩ Xk =∅,∀ j̸=k
x n ∈ Xr

Essa distribuição é denominada «distribuição avançada da ordem n». A essa definição pode
ser dada uma forma mais simples usando a Eq. (4.16): Fixando o conjunto Xr , o resto da
84 Capítulo 4. Teoria de perturbação causal no plano nulo

en +···+n ( X1 ∪ · · · ∪ Xr−1 ); assim:


soma é igual à distribuição de transição inversa T 1 r −1

An (Y; xn ) = ∑′ em ( X ) Tn−m ( X ′ ∪ { xn })
T . (4.36)
X ∪ X =Y
X ∩ X ′ =∅

De forma análoga, pode-se procurar por distribuições «retardadas» em relação a um dado


ponto, isto é, que se anulem quando os outros pontos estejam em seu passado. Encontra-se
que a definição apropriada para a «distribuição retardada da ordem n» é:

Rn (Y; xn ) := ∑ (−1)r−1 ∑ Tn1 ( X1 ) · · · Tnr ( Xr ) . (4.37)


r ∈ In X1 ,··· ,Xr ̸=∅
X1 ∪···∪ Xr =Y ∪{ xn }
X j ∩ Xk =∅,∀ j̸=k
x n ∈ X1

Desta vez, fixando o conjunto X1 , identifica-se o resto da soma como uma distribuição de
transição inversa:
Rn (Y; xn ) = ∑′ Tn−m ( X ′ ∪ { xn }) T
em ( X ) . (4.38)
X ∪ X =Y
X ∩ X ′ =∅

Nas somas das Eqs. (4.36) e (4.38) a distribuição de n pontos aparece uma única vez.
Separando-a do resto de termos:

An (Y; xn ) = Tn (Y ∪ { xn }) + A′n (Y; xn ) , Rn (Y; xn ) = Tn (Y ∪ { xn }) + R′n (Y; xn ) , (4.39)

com a «distribuição subsidiária avançada» e a «distribuição subsidiária retardada» definidas


como:
A′n (Y; xn ) := ∑′ em ( X ) Tn−m ( X ′ ∪ { xn })
T , (4.40)
X ∪ X =Y
X ∩ X ′ =∅
X ̸=∅

R′n (Y; xn ) := ∑′ Tn−m ( X ′ ∪ { xn }) T


em ( X ) , (4.41)
X ∪ X =Y
X ∩ X ′ =∅
X ̸=∅

respectivamente. As distribuições subsidiárias não contêm a Tn , mas somente às distribuições


de transição Tm com m ≤ n − 1. A distribuição de transição da ordem n é portanto igual a:

Tn (Y ∪ { xn }) = An (Y; xn ) − A′n (Y; xn ) = Rn (Y; xn ) − R′n (Y; xn ) . (4.42)

Assim, a distribuição de n pontos pode ser determinada se se conhecem: (1) As distribuições


Tm com m ≤ n − 1, o que permite construir as distribuições subsidiárias, e (2) a distribuição
avançada ou a retardada da ordem n. O ponto (1) é hipótese do procedimento indutivo da
TPC. Para resolver o ponto (2), define-se a «distribuição causal»:

Dn (Y; xn ) := Rn (Y; xn ) − An (Y; xn ) = R′n (Y; xn ) − A′n (Y; xn ) , (4.43)

que é conhecida uma vez que o são as distribuições subsidiárias [a segunda igualdade da
Capítulo 4. Teoria de perturbação causal no plano nulo 85

Eq. (4.43) decorre da Eq. (4.39)]. Logo, como An é avançada enquanto que Rn , retardada, a
obtenção delas pode ser feita pelo método de divisão da distribuição causal, método cuja
formulação geral foi desenvolvida por Łojasiewicz e Malgrange [104, 105, 106]5 .

4.4 Teoremas de causalidade


Os seguintes teoremas fundamentam rigorosamente o uso da ideia apresentada na se-
ção prévia. É assumido como hipótese indutiva que as distribuições de transição Tm , com
m ≤ n − 1, são conhecidas, sendo o alvo do método determinar a distribuição Tn .

Teorema 4.1: Seja Y ⊂ M um conjunto de n1 ≤ n − 1 pontos, e sejam P, Q ⊆ Y dois


subconjuntos disjuntos de Y: P ∩ Q = ∅, com P ̸= ∅, | Q| = n2 , tais que P ∪ Q = Y. Seja x ∈
/ Y.

(i) Se P < Q ∪ { x }, então:

R′n1 +1 (Y; x ) = − Tn2 +1 ( Q ∪ { x }) Tn1 −n2 ( P) . (4.44)

(ii) Se P > Q ∪ { x }, então:

A′n1 +1 (Y; x ) = − Tn1 −n2 ( P) Tn2 +1 ( Q ∪ { x }) . (4.45)

Prova: Apresentaremos aqui a prova de (i), então assumindo que se satisfaz: P < Q ∪ { x };
a prova do ponto (ii) segue com modificações óbvias. Por definição [vide a Eq. (4.41)]:

R′n1 +1 (Y; x ) = ∑′ Tn1 +1−m X ′ ∪ { x } T



em ( X ) . (4.46)
X ∪ X =Y
X ∩ X ′ =∅
X ̸=∅

Mas, por hipótese, as seguintes relações de ordem cronológica são satisfeitas:

X∩P < X∩Q , X ′ ∩ P < ( X ′ ∩ Q) ∪ { x } .

Portanto, usando a causalidade –como expressa nas Eqs. (4.26) e (4.31)– na Eq. (4.46):

R′n1 +1 (Y; x ) = ∑′ T ( X ′ ∩ Q) ∪ { x } T ( X ′ ∩ P) T

e( X ∩ P) T
e( X ∩ Q) . (4.47)
X ∪ X =Y
X ∩ X ′ =∅
X ̸=∅

5 Contudo, o nosso problema não é exatamente do tipo estudado por Łojasiewicz e Malgrange. Com efeito,
estes autores estudaram o problema da divisão de distribuições com suportes «regularmente separáveis», com a
definição seguinte: Os conjuntos fechados A e B são regularmente separáveis pelo conjunto compacto Λ se: (1) Λ = ∅ e
A ∩ B = ∅, ou (2) ∃C > 0, ρ > 0: ∀ x ∈ A: d( x; B) ≥ Cd( x; Λ)ρ . Segundo essa definição, o suporte da distribuição
avançada e o da retardada, na dinâmica da frente de luz, não são regularmente separáveis –como o são, sim, na
dinâmica instantânea–, uma vez que eles são separados pela reta do eixo x − , que não é um conjunto compacto;
este é o único motivo pelo qual a definição dada não se aplica, pois todos os outros requerimentos são satisfeitos.
Veremos, porém, que isto não impede fazer a divisão da distribuição causal e implementar o procedimento
indutivo da TPC, embora será formalmente necessário, para tal fim, restringir o suporte da distribuição causal
de forma a fazê-lo compacto na variável x − ; isto o veremos na Seç. 4.5.
86 Capítulo 4. Teoria de perturbação causal no plano nulo

Isto pode também ser escrito em função de partições dos conjuntos P e Q, como:

R′n1 +1 (Y; x ) = ∑ T (K ′ ∪ { x }) T ( J ′ ) T
e( J ) T
e(K ) . (4.48)
K ∪K ′ = Q, K ∩K ′ =∅
J ∪ J ′ = P, J ∩ J ′ =∅
J ∪K ̸=∅

Nos adendos em que K ̸= ∅, J poderá ser o conjunto vazío e a Eq. (4.19) é aplicável, levando
a que esses adendos tenham uma contribuição nula a R′n1 +1 (Y; x ). Por isto, é suficiente
manter, na Eq. (4.48), aqueles adendos com K = ∅, J ̸= ∅, e em consequência K ′ = Q. Desta
forma, usando a Eq. (4.17):

R′n1 +1 (Y; x ) = T ( Q ∪ { x }) ∑′ T ( J ′ )T
e( J ) . (4.49)
J ∪ J =P
J ∩ J ′ =∅
J ̸=∅

Mas a Eq. (4.19) implica também que:

∑′ T ( J ′ )T
e( J ) = ∑′ T ( J ′ )T e(∅) = − T ( P)
e( J ) − T ( P) T . (4.50)
J ∪ J =P J ∪ J =P
J ∩ J ′ =∅ J ∩ J ′ =∅
J ̸=∅

A substituição da Eq. (4.50) na (4.49) tem como resultado a Eq. (4.44). ■

Para estabelecer os seguintes resultados, recordamos as definições de V ± ( x ) dadas na


Eq. (4.4). Definimos também os conjuntos:
n o
V ( x ) : = y ∈ M ( y − x )2 ≥ 0 ∧ y + ≥ x +
+
, (4.51)
e

n o
e − ( x ) := y ∈ M (y − x )2 ≥ 0 ∧ y+ ≤ x +
V . (4.52)

e ± ( x ) não são iguais às fechaduras V ± ( x ) de V ± ( x ), mas que


É claro que os conjuntos V
relacionam-se com eles da forma seguinte:

e ± ( x ) = V ± ( x ) ∪ x + Re−

V . (4.53)

e ± ( x ) é a união da fechadura V ± ( x ) com a região instantânea e causalmente conectada


Isto é, V
que é o eixo x − = { x + Re− } –na dinâmica instantânea esses dois conjuntos são iguais, pois
a região instantânea e causalmente conectada contém somente à origem x = 0, já contida na
fechadura V ± ( x )–. Finalmente, definimos os conjuntos de n pontos:
n
Γ+ := ( x1 ; · · · ; xn ) ∈ M ∀ j = 1, · · · , n − 1 :
n

n
 o
x+
j ≥ x +
n ∧ ∃ x k ∈ V n j
e + ( xk )
+ ( x )( k ̸ = j ) : x ∈ V . (4.54)

e + ( xn ), quer no
Esse é conjunto de n pontos, cada um dos quais se encontra, quer em V
Capítulo 4. Teoria de perturbação causal no plano nulo 87

eixo x − correspondente a um outro ponto em V + ( xn ) que também pertence a Γ+


n . Uma
formulação equivalente é:
n
Γ+
n = ( x 1 ; · · · ; x n ) ∈ M n
∀ j = 1, · · · , n − 1 :
 o
xj ∈ V e + ( xn ) ∨ ∃ xk ∈ V e + ( xn )(k ̸= j) : x j ∈ { xk + Re− } .

Analogamente definimos:
n
Γ−
n : = ( x 1 ; · · · ; x n ) ∈ M n
∀ j = 1, · · · , n − 1 :
 o

x+j ≤ x +
n ∧ ∃ x k ∈ V − ( x )( k ̸ = j ) : x ∈ V
n j
e ( x k ) . (4.55)

O seguinte teorema garante que a distribuição R é, efetivamente, retardada, e a A, avan-


çada.

Teorema 4.2: Seja Y ⊂ M um conjunto de n1 pontos. Se n1 ≤ n − 2, então:

supp ( Rn1 +1 ) ⊆ Γ+
n1 +1 , supp ( An1 +1 ) ⊆ Γ−
n1 +1 . (4.56)

Prova: Apresentaremos, como no Teorema 4.1, a prova concernente à distribuição retar-


dada, pois a prova para a avançada segue com modificações evidentes. Dividiremos a prova
em três partes, atendendo às regiões em que os pontos de Y podem encontrar-se em relação
/ Γ+
ao ponto x ≡ xn de tal forma que (Y; x ) ∈ n1 +1 , mostrando então que Rn1 +1 (Y; x ) = 0.

(I) Suponhamos que haja em Y pelo menos um ponto no passado de x. Y pode então ser
particionado como Y = P ∪ Q, com P ∩ Q = ∅, P < Q ∪ { x } e P ̸= ∅. Pelo Teorema 4.1:

R′n1 +1 (Y; x ) = − Tn2 +1 ( Q ∪ { x }) Tn1 −n2 ( P) . (4.57)

Também, aplicando a condição de causalidade da Eq. (4.26) à distribuição Tn1 +1 –note-


se que é nesse ponto que precisamos que seja n1 ≤ n − 2, pois não pode usar-se a
causalidade sobre Tn , a qual deve ser uma consequência do procedimento indutivo–:

Tn1 +1 (Y ∪ { x }) = Tn2 +1 ( Q ∪ { x }) Tn1 −n2 ( P) . (4.58)

Substituindo as Eqs. (4.57) e (4.58) na Eq. (4.39), isto é, na relação: Rn1 +1 = R′n1 +1 +
Tn1 +1 , chega-se à conclusão de que: Rn1 +1 (Y; x ) = 0. Ora, o suporte de Rn1 +1 (Y; x )
somente pode conter pontos no futuro de x ou simultâneos com ele.

(II) Suponhamos agora que haja em Y ao menos um ponto espacialmente separado de


x e em seu futuro. Executamos a seguinte partição de Y em quatro subconjuntos.
Definimos:
n o
P = y ∈ Y y ∼ x ∧ ∀y′ ∈ Y , y′ ∼ x : y+ ≤ y′+ ,

88 Capítulo 4. Teoria de perturbação causal no plano nulo

que é o conjunto de pontos em Y, espacialmente separados de x, com o menor valor da


coordenada temporal. O plano nulo em que se encontra P é completado com
n o
O′ = y ∈ Y (y − x )2 ≥ 0 ∧ y ∼ P ∧ ∀y′ ∈ P : y+ = y′+ ,

que é o conjunto de pontos em Y, causalmente conetados a x, simultâneos a P mas


espacialmente separados dele –note-se que, como consideramos conjuntos (Y; x ) ∈
/
Γ+
n1 +1 , não pode haver pontos em Y simultâneos e causalmente conectados a P–. Os
conjuntos de pontos em Y anteriores a P e posteriores a ele são, respectivamente:
n o
O = y ∈ Y ( y − x )2 ≥ 0 ∧ y < P ,

n o
Q= y∈Y y>P .

Como estes quatro conjuntos esgotam todas as possibilidades, eles constituem uma
partição de Y. Note-se, em particular, que, já que se está assumindo a existência de pelo
menos um ponto espacialmente separado de x, necessáriamente ter-se-á que P ̸= ∅.
Com essas definições, as seguintes relações cronológicas são satisfeitas:

O ∪ { x } < P < Q , O′ ∼ P , O′ < Q , O < O′ , O ∪ { x } ∼ P . (4.59)

Elas são necessárias para poder aplicar o axioma da causalidade. Por definição:

R′n1 +1 (Y; x ) = ∑′ T ( X ′ ∪ { x }) T
e( X ) . (4.60)
X ∪ X =Y
X ∩ X ′ =∅
X ̸=∅

Usando as relações da Eq. (4.59), o axioma da causalidade implica que:

T ( X ′ ∪ { x }) = T ( X ′ ∩ Q) T ( X ′ ∩ P) T ( X ′ ∩ O′ ) T (( X ′ ∩ O) ∪ { x }) , (4.61)

e também:
e( X ) = T
T e( X ∩ O′ ) T
e( X ∩ O) T e( X ∩ P) T
e( X ∩ Q) . (4.62)

Efetuando as comutações necessárias para ter T ( X ′ ∩ P) à direita na expressão para


T ( X ′ ∪ { x }) e T
e( X ∩ P) à esquerda naquela para T
e( X ), e substituindo na Eq. (4.60):

R′n1 +1 (Y; x ) = ∑′ T ( X ′ ∩ Q) T ( X ′ ∩ O′ ) T (( X ′ ∩ O) ∪ { x })
X ∪ X =Y
X ∩ X ′ =∅
X ̸=∅

× T ( X ′ ∩ P) T
e( X ∩ P) T e( X ∩ O′ ) T
e( X ∩ O) T e( X ∩ Q) . (4.63)

Para efeito de clareza na exposição, é conveniente reescrever a Eq. (4.63) em função de


Capítulo 4. Teoria de perturbação causal no plano nulo 89

partições dos conjuntos Q, O′ , O e P:


n o
R′n1 +1 (Y; x ) = ∑ T ( J ′ ) T (K ′ ) T ( E′ ∪ { x }) T ( F ′ ) T
e( F ) Te( E) T
e(K ) T
e( J ) .
J ∪ J ′ = Q, J ∩ J ′ =∅
K ∪K ′ =O′ , K ∩K ′ =∅
E∪ E′ =O, E∩ E′ =∅
F ∪ F ′ = P′ , F ∩ F ′ =∅
F ∪ E∪K ∪ J ̸=∅
(4.64)

Essas partições são todas independentes, uma vez que todos os subconjuntos são dis-
juntos por definição. Assim sendo, a expressão entre chaves na Eq. (4.64) remete de
volta à Eq. (4.19) e força a considerar somente aqueles termos nos quais, necessaria-
mente, F ̸= ∅, pois os termos em que seja possível adotar F = ∅ são nulos, como o in-
dica a citada equação. Daí deve-se escrever E = K = J = ∅, ou seja: E′ = O, K ′ = O′ e
J ′ = Q. A Eq. (4.64) é assim igual a:

R′n1 +1 (Y; x ) = T ( Q) T (O′ ) T (O ∪ { x }) ∑′ T ( F′ )T


e( F )
F∪ F =P
F ∩ F′ =∅
F ̸=∅

= − T ( Q) T (O′ ) T (O ∪ { x }) T ( P)
= − T ( Q) T (O′ ) T ( P) T (O ∪ { x }) . (4.65)

Aqui, a passagem da primeira à segunda linha é feita em virtude da Eq. (4.19); para ir
da segunda à terceira usa-se a comutatividade das distribuições de transição avaliadas
em conjuntos de pontos espacialmente separados.

Por outro lado, do axioma da causalidade –vide a Eq. (4.59)–:

Tn1 +1 (Y ∪ { x }) = T ( Q) T (O′ ) T ( P) T (O ∪ { x }) . (4.66)

As Eqs. (4.65) e (4.66) implicam o resultado desejado:

Rn1 +1 (Y; x ) = R′n1 +1 (Y; x ) + Tn1 +1 (Y ∪ { x }) = 0 . (4.67)

(III) A última possibilidade é aquela na qual Y contém pelo menos um ponto espacialmente
separado de x e simultâneo com ele, constituindo tais pontos o conjunto P. Neste
caso o argumento é semelhante àquele utilizado na parte (II), com O = ∅; também,
P ∼ { x }, de forma que a decomposição por causalidade continua a ser válida, e deve-
se reter O′ ∪ { x } da mesma forma em que outrora se tinha O ∪ { x }.

Nas partes (I) a (III) tem-se considerado todos os casos em que (Y; x ) está fora de Γ+
n1 +1 .
Conclui-se, portanto, que supp( Rn1 +1 ) ⊆ Γ+
n1 +1 . ■

Note-se, em particular, que se a covariância de Lorentz fosse requerida, na prova do


Teorema 4.2 somente a parte (I) seria necessária, pois qualquer ponto espacialmente separado
90 Capítulo 4. Teoria de perturbação causal no plano nulo

poderia ser colocado no passado de x por alguma transformação de Lorentz. E não só, mas
também qualquer ponto no semi-eixo x − negativo poderia ser colocado no passado de x e
então removido do suporte da distribuição retardada. Essa é a base sobre a qual se assenta a
normalização pela covariância de Lorentz, como será discutido na Sec. 4.7.
Do Teorema 4.2 decorre imediatamente o seguinte resultado.

Corolário 4.2-1: Se n1 ≤ n − 2, então:


supp ( Dn1 +1 ) ⊆ Γ+
n1 +1 ∪ Γ n1 +1 . (4.68)

Na base destes resultados pode já estabelecer-se o seguinte enunciado.

Teorema 4.3: Se n ≥ 3, então:


supp ( Dn ) ⊆ Γ+
n ∪ Γn . (4.69)

Ainda mais, Dn ( X ) pode ser não nula somente se X ∈ Γ+


n ou X ∈ Γn .

Prova: Como na prova do teorema anterior, para considerar todos os casos proceder-se-á
por partes.

(I) Suponhamos que o conjunto X = { x1 ; · · · ; xn } pode ser particionado nos conjuntos


disjuntos e não vazios P′ , S e Q′ –três conjuntos não vazios implicam a existência de
pelo menos três pontos; daí a condição n ≥ 3 no enunciado do teorema– tais que S é
simultâneo com o ponto xn e Q′ < S < P′ . Sob essas condições, o Teorema 4.1 pode ser
usado, com n1 = n − 1, donde:

R′n ( x1 ; · · · ; xn ) = − T ( P′ ∪ S) T ( Q′ ) , A′n ( X ) = − T ( P′ ) T ( Q′ ∪ S) . (4.70)

Mas, como P′ , Q′ ̸= ∅, as distribuições de transição que aparecem na Eq. (4.70) são de


menos de n pontos, e, portanto, satisfazem às condições de causalidade por hipótese.
Assim, usando a Eq. (4.26):

R′n ( x1 ; · · · ; xn ) = − T ( P′ ) T (S) T ( Q′ ) = A′n ( x1 ; · · · ; xn ) , (4.71)

e a distribuição causal, sendo a diferença entre essas duas distribuições, se anula:


Dn ( x1 ; · · · ; xn ) = R′n ( x1 ; · · · ; xn ) − A′n ( x1 ; · · · ; xn ) = 0. Em outras palavras, a distri-
buição causal se anula se existem em X alguns pontos no passado de xn e outros no
futuro de xn .

(II) Suponhamos agora que nenhum dos pontos contidos em X está no passado de xn .
Existem duas formas em que isto pode acontecer; nessa parte suporemos que X contém
pontos espacialmente separados de xn e no futuro dele –a outra possibilidade será
examinada na parte (III)–. Então, como foi provado na parte (II) da prova do Teorema
Capítulo 4. Teoria de perturbação causal no plano nulo 91

4.2 –vide a Eq. (4.65)–:

R′n ( x1 ; · · · ; xn ) = − T ( Q) T (O′ ) T ( P) T (O ∪ { xn }) . (4.72)

Também, do Teorema 4.1 decorre que:

A′n ( x1 ; · · · ; xn ) = − T ( Q ∪ P ∪ O′ ) T (O ∪ { xn }) . (4.73)

À vista disso, e usando o axioma da causalidade para escrever T ( Q ∪ P ∪ O′ ) =


T ( Q) T (O′ ) T ( P) na distribuição subsidiária avançada, chega-se, novamente, a que
A′n ( X ) = R′n ( X ), e também no caso aqui considerado a distribuição causal é nula:
Dn ( x1 ; · · · ; xn ) = 0.

(III) Nesta parte far-se-á a suposição de que X contém alguns pontos simultâneos com xn ,
mas espacialmente separados dele. Como foi encontrado na parte (III) da prova do
Teorema 4.2 [vide a Eq. (4.65) sob a igualdade O = ∅]:

R′n ( x1 ; · · · ; xn ) = − T ( Q) T (O′ ) T ( P) T ({ xn }) . (4.74)

Por outro lado, a definição da distribuição subsidiária avançada dada na Eq. (4.40)
permite escrever:

A′n ( x1 ; · · · ; xn ) = ∑ e( X1 ) T ( X2 ∪ { xn })
T . (4.75)
X1 ∪ X2 = X \{ xn }
X1 ∩ X2 = ∅
X1 ̸ = ∅

Mais uma vez, o fato de ser X1 ̸= ∅ significa que as distribuições de transição que aqui
aparecem são de menos de n pontos, e a condição de causalidade pode usar-se por
hipótese. Fazendo-o:

A′n ( x1 ; · · · ; xn ) = ∑ e ( X1 ∩ O ′ ) T
T e ( X1 ∩ P ) T
e ( X1 ∩ Q ) T ( X2 ∩ Q )
X1 ∪ X2 = X \{ xn }
X1 ∩ X2 = ∅
X1 ̸ = ∅

× T ( X2 ∩ P) T ( X2 ∩ O′ ) T ({ xn }) . (4.76)

Reescrevendo essa mesma equação em função de partições dos conjuntos O′ , P e Q:


n o
A′n ( x1 ; · · · ; xn ) = ∑ e( J ) T
T e(K ) Te( L) T ( L′ ) T (K ′ ) T ( J ′ ) T ({ xn }) . (4.77)
J ∪ J ′ =O , J ∩ J ′ =∅

K ∪K ′ = P, K ∩K ′ =∅
L∪ L′ = Q, L∩ L′ =∅
J ∪K ∪ L̸=∅

A parte entre chaves na Eq. (4.77) leva à Eq. (4.20), da qual observa-se que os termos
no somatório da Eq. (4.77) não nulos são aqueles em que L ̸= ∅; isto é garantido se
K = J = ∅, ou seja, se K ′ = P e L′ = Q. Comutando então T (O′ ) com T ( P), o que é
92 Capítulo 4. Teoria de perturbação causal no plano nulo

possível porque O′ e P estão espacialmente separados, obtém-se o seguinte resultado:

A′n ( x1 ; · · · ; xn ) = − T ( Q) T (O′ ) T ( P) T ({ xn }) . (4.78)

Comparando as Eqs. (4.74) e (4.78) observa-se que também nesse caso se cumpre a
igualdade: R′n ( x1 ; · · · ; xn ) = A′n ( x1 ; · · · ; xn ), e a distribuição causal é nula.

Em suma, provamos que se o conjunto X não tem pontos no passado de xn , então Dn pode ser
não nula somente se X ∈ Γ+
n . A prova para X contendo pontos no futuro de xn é análoga, e
tem por resultado que Dn pode ser não nula somente se X ∈ Γ−
n . Isto prova o Teorema 4.3. ■

A importância do Teorema 4.3 não pode ser subestimada, pois é ele o que diz que a
distribuição causal Dn pode ser dividida em sua parte retardada, Rn , e sua parte avançada,
An , com supp( Rn ) ⊆ Γ+
n e supp( An ) ⊆ Γn , sempre que seja n ≥ 3. Quando n = 2, no

entanto, o suporte causal de D2 ( x1 ; x2 ) deve ser provado explicitamente, se bem que os


argumentos apresentados na Seç. 4.3 já adiantam que sempre o será.
Finalmente, deve-se verificar que o procedimento proposto para a construção indutiva
da distribuição de n pontos é consistente, ou seja, que a distribuição assim obtida mantém as
virtudes requeridas pelo axioma da causalidade. Esse resultado está contido no seguinte
enunciado.

Teorema 4.4: Seja Dn ( x1 ; · · · ; xn ) uma distribuição causal com suporte causal, então divisível
em suas partes retardada, Rn ( x1 ; · · · ; xn ), e avançada, An ( x1 ; · · · ; xn ), com suportes em Γ+
n e Γn ,

respectivamente. A distribuição Tn ( x1 ; · · · ; xn ) construída com ela pelo procedimento indutivo satis-


faz às condições de causalidade, Eqs. (4.26) e (4.29).

Prova: Em primeiro lugar, note-se que estabelecemos como hipótese do teorema que
a distribuição Dn ( x1 ; · · · ; xn ) tem suporte causal. Isto é asegurado pelo Teorema 4.3 para
n ≥ 3; está-se assumindo aqui, adicionalmente, que tal asseveração foi provada válida
também para n = 2. A estratégia para a prova do Teorema 4.4 será usar os suportes das
distribuições Rn ( x1 ; · · · ; xn ) e An ( x1 ; · · · ; xn ), assim como as seguintes expressões para a
distribuição de transição Tn ( x1 ; · · · ; xn ) –vide a Eq. (4.42)–:

Tn ( x1 ; · · · ; xn ) = Rn ( x1 ; · · · ; xn ) − R′n ( x1 ; · · · ; xn )
= An ( x1 ; · · · ; xn ) − A′n ( x1 ; · · · ; xn ) . (4.79)

Usar-se-á também algumas expressões para R′n ( x1 ; · · · ; xn ) e A′n ( x1 ; · · · ; xn ) encontradas


nas provas dos Teoremas 4.1, 4.2 e 4.3 nos diferentes casos analisados. Denotando por X
o conjunto { x1 ; · · · ; xn } de argumentos em consideração, mais uma vez proceder-se-á por
partes:

(I) Seja que o conjunto X pode ser particionado segundo X = P ∪ Q, com P < Q e
xn ∈ Q. Nesse caso, An ( x1 ; · · · ; xn ) = 0, pois ele tem suporte avançado; daí que:
Capítulo 4. Teoria de perturbação causal no plano nulo 93

Tn ( x1 ; · · · ; xn ) = − A′n ( x1 ; · · · ; xn ). O Teorema 4.1 então implica a fatorização da


distribuição de transição: Tn ( x1 ; · · · ; xn ) = T ( P) T ( Q).

(II) Seja agora que X = P ∪ Q, com P > Q e xn ∈ Q. Então Rn ( x1 ; · · · ; xn ) = 0, pois ela


tem suporte retardado, e em consequência: Tn ( x1 ; · · · ; xn ) = − R′n ( x1 ; · · · ; xn ). Do
Teorema 4.1 se segue que também neste caso a distribuição de transição é fatorizável:
Tn ( x1 ; · · · ; xn ) = T ( Q) T ( P).

(III) Suponhamos desta vez que X = P ∪ Q, com P ∼ Q e xn ∈ Q. Pelo Teorema 4.3:


Dn ( x1 ; · · · ; xn ) = 0, então Rn ( x1 ; · · · ; xn ) = 0 e Tn ( x1 ; · · · ; xn ) = − R′n ( x1 ; · · · ; xn ).
Usando primeiro a definição da distribuição subsidiária retardada, então a propriedade
de causalidade das distribuições de transição de menos de n pontos:

R′n ( x1 ; · · · ; xn ) = ∑ T ( X2 ∪ { xn }) T
e ( X1 )
X1 ∪ X2 = X \{ xn }
X1 ∩ X2 = ∅
X1 ̸ = ∅
n o
= ∑ e ( X1 ∩ P ) T
T ( X2 ∩ Q ) T ( X2 ∩ P ) T e ( X2 ∩ P ) . (4.80)
X1 ∪ X2 = X \{ xn }
X1 ∩ X2 = ∅
X1 ̸ = ∅

Devido ao termo entre chaves, a única contribuição na soma anterior provém do termo
em que X2 ∩ P = ∅, o que implica que X2 ∩ Q = Q, e, portanto:

R′n ( x1 ; · · · ; xn ) = − T ( Q) T ( P) = − T ( P) T ( Q) . (4.81)

Na última igualdade usamos a Eq. (4.29) nas distribuições de transição de menos


de n pontos T ( P) e T ( Q), o que é válido por hipótese . Assim: Tn ( x1 ; · · · ; xn ) =
T ( P ) T ( Q ) = T ( Q ) T ( P ).

(IV) Finalmente, consideremos o produto Tn ( x1 ; · · · ; xn ) Tm (Y ), com X ∼ Y e m ≤ n. Os


conjuntos X e Y podem ser particionados em qualquer um dos casos estudados [partes
(I) a (III) da prova]; suponhamos que as partições são: X = P ∪ Q e Y = P′ ∪ Q′ , tais
que: Tn ( x1 ; · · · ; xn ) = T ( Q) T ( P) e Tm (Y ) = T ( Q′ ) T ( P′ ). Como X ∼ Y, as seguintes
relações são válidas: P ∼ P′ , Q′ , Q ∼ P′ , Q′ . Portanto, usando a propriedade de
causalidade nessas distribuições de menos de n pontos, obtém-se que:

Tn ( x1 ; · · · ; xn ) Tm (Y ) = T ( Q) T ( P) T ( Q′ ) T ( P′ )
= T ( Q′ ) T ( P′ ) T ( Q) T ( P)
= Tm (Y ) Tn ( x1 ; · · · ; xn ) . (4.82)

Isto é, Tn ( x1 ; · · · ; xn ) comuta com Tm (Y ) (m ≤ n) para X ∼ Y. Há, entretanto, um caso


em que a prova geral recém dada não se aplica; este é aquele em que x1 , · · · , xn−1 ∈
{ xn + Re− }, pois então a decomposição causal não é possível. Nessas circunstâncias é
necessário incluir mais formalismo: A comutatividade para conjuntos espacialmente
94 Capítulo 4. Teoria de perturbação causal no plano nulo

separados rege como consequência da expansão das distribuições de transição em


produtos de Wick –vide a Eq. (4.84)– e devido à comutatividade dos produtos destes
para pontos espacialmente separados. Isto é, em parte, originado no fato de que as
distribuições de transição são construídas com os operadores de campo quantizado, o
que se deduz da condição de causalidade –vide a discussão após a Eq. (4.29)–.

Pelos motivos assim expostos, conclui-se que a distribuição Tn ( x1 ; · · · ; xn ) construída pelo


método indutivo satisfaz a todas as condições requeridas para ser chamada causal. ■

Note-se que na prova do Teorema 4.4 escrevemos a distribuição de n pontos como


Tn ( x1 ; · · · ; xn ), e não como Tn ( X ). Isto é assim porque o procedimento indutivo não garante
que a distribuição de transição construída seja simétrica em seus argumentos. Não obstante,
isto não representa problema algum, pois seja qual for a propriedade de simetria da distri-
buição obtida, uma vez que ela é colocada na expressão da série perturbativa do operador
de espalhamento, Eq. (4.11), somente sua parte simétrica contribuirá para tal. É assim que,
se denotarmos por Tn′ ( x1 ; · · · ; xn ) a distribuição obtida pelo método indutivo, sempre pode-
remos definir sua correspondente parte simétrica como a desejada distribuição de n pontos:

1
Tn ( X ) := Sn+ Tn′ ( x1 ; · · · ; xn ) =
n! ∑ Tn′ (xπ(1) ; · · · ; xπ(n) ) . (4.83)
π

É essa distribuição simetrizada a que deve ser usada na construção dos seguintes termos
perturbativos.
Os teoremas apresentados estabelecem a possibilidade real da construção indutiva do
operador de espalhamento S( g), se for possível efetuar a divisão da distribuição causal
em sua parte retardada e sua parte avançada. Na seção que segue passaremos a fixar a
consideração no desenvolvimento prático desse ponto crucial. Finalmente, pode-se ver que
nenhuma transformação de Lorentz foi realizada nas provas dos teoremas de causalidade;
isto constitui, por si mesmo, uma prova explícita de que a invariância de Lorentz não é
necessária na construção da TPC, e que poderá, portanto, ser usada a posteriori como uma
condição adicional para a fixação das distribuições de transição na região instantânea –vide
o comentário que segue à Eq. (4.29)–.

4.5 Divisão da distribuição causal no espaço real


Suponhamos que a distribuição causal da ordem n, Dn ( x1 ; · · · ; xn ), já tenha sido cons-
truída como parte do procedimento indutivo, e que o suporte dela é causal. Em geral, ela
terá a forma:
Dn ( x 1 ; · · · ; x n ) = ∑ dkn (x1 ; · · · ; xn ) : Ck (u A ) : , (4.84)
k

com dkn ( x1 ; · · · ; xn ) uma distribuição numérica e : Ck (u A ) : um monômio de Wick dos


operadores de campo quantizado u A , livres, presentes na teoria. Tal expansão em produtos
de Wick é explicada na Seç. 4 da Ref. [103] –vide também a Seç. 1.9 da Ref. [118]–, e é baseada
Capítulo 4. Teoria de perturbação causal no plano nulo 95

no teorema de Wick em conjunto com o procedimento indutivo causal. Seja k um quadri-


índice 6 ; uma função com contradomínio no conjunto dos números inteiros, r : k → r (k) com
r (k ) ≥ 0 para todo k e r (k ) = 0 para k suficientemente grande é chamada um «super-quadri-
índice» [103]. Então denotamos:
 r (k )
: u ( x )r : = : ∏ D k u ( x ) : . (4.85)
k

O primeiro termo, T1 ( x ), cujo conhecimento é hipótese do procedimento7 , é «definido» como


uma expansão em produtos de Wick da forma:

s!
F0 ( x ) =
r
∑ cr : u ( x )r : , Fr ( x ) =
s
∑ :
(s − r )!
c s u ( x ) s −r : . (4.86)
|r |≤ M s ≥r
|s|≤ M

O teorema de Wick então implica a seguinte fórmula para os produtos gerais desses termos:

: u ( x 1 ) s1 · · · u ( x n ) s n :
F r1 ( x 1 ) · · · F r n ( x n ) = ∑ Ω; Fr1 +s1 ( x1 ) · · · Frn +sn ( xn )Ω

. (4.87)
s1 ,··· ,sn s1 ! · · · s n !

Como o procedimento indutivo causal baseia-se em produtos da distribuição T1 , as distribui-


ções subsidiárias R′ e A′ manterão a mesma forma da Eq. (4.87), o mesmo que a distribuição
causal. Por outro lado, os operadores de campo não restringem o suporte da distribuição
completa –eles são definidos no espaço-tempo de Minkowski completo–, donde é suficiente
considerar a divisão da distribuição numérica dkn , cujo suporte é assim causal por hipótese
–pois ela é o valor esperado no vácuo da distribuição causal–. Portanto, a distribuição avan-
çada e também a retardada manterão a estrutura dos operadores de campo quantizado da
distribuição causal:

A n ( x1 ; · · · ; x n ) = ∑ akn (x1 ; · · · ; xn ) : Ck (u A ) : , (4.88)


k

R n ( x1 ; · · · ; x n ) = ∑ rnk (x1 ; · · · ; xn ) : Ck (u A ) : , (4.89)


k

com akn e rnk as partes avançada e retardada, respectivamente, da distribuição numérica dkn :

dkn ( x1 ; · · · ; xn ) = rnk ( x1 ; · · · ; xn ) − akn ( x1 ; · · · ; xn ) ; (4.90)

6 Osmulti-índices de Schwartz são definidos, por exemplo, na Ref. [159]: Um multi-índice k ∈ R N é uma
sequência de números inteiros não-negativos, k = (k1 ; · · · ; k N ), k j ≥ 0, sobre as quais regem as seguintes
notações:
N N N N
kj kj
|k| ≡ ∑ kj , xk ≡ ∏ xj , k! ≡ ∏ kj! , Dk f (x) ≡ ∏ ∂x j
f (x) .
j =1 j =1 j =1 j =1

7 Ele deve ser construído fenomenologicamente da mesma forma que o é a densidade lagrangiana da teoria

convencional: Pela imposição das simetrias da teoria; porém, devemos nos restringir nela aos termos lineares na
constante de acoplamento só. Por exemplo, a construção baseada na invariância de gauge quântica abordar-se-á
no Cap. 6.
96 Capítulo 4. Teoria de perturbação causal no plano nulo

supp(rnk ) ⊆ Γ+
n , supp( akn ) ⊆ Γ−
n . (4.91)

Ou bem, usando a invariância sob translações, definimos a distribuição numérica d ∈


S ′ (R4n−4 ) como:


d( x ) := dkn ( x1 − xn ; · · · ; xn−1 − xn ; 0) ; supp(d) ⊆ Γ+
n −1 (0 ) ∪ Γ n −1 (0 ) , (4.92)

a qual será dividida segundo:

d =r−a ; supp(r ) ⊆ Γ+
n −1 (0 ) , supp( a) ⊆ Γ−
n −1 (0 ) . (4.93)

Estamos denotando aqui, e o faremos doravante:


n
Γ+
n ( 0 ) : = ( x 1 ; · · · ; x n ) ∈ M n
∀ j = 1, · · · , n :
 o
x+j ≥ 0 ∧ ∃ x k ∈ V + (0)( k ̸ = j ) : x ∈ V
j
e +
( x k ) ,

e analogamente para Γ−
n (0). Na Eq. (4.92) escrevemos d ( x ); x significa: ( x1 − xn ; · · · ; xn−1 −
xn ), em que está em uso a notação de Schwartz dos multi-índices. Usaremos também a
notação: x a ≡ ( x1a − xna ; · · · ; xna −1 − xna ).

Passemos a considerar o problema da divisão da distribuição d( x ). Devido aos suportes


das distribuições procuradas, uma primeira proposta para efetuar a divisão de d seria tomar
o produto dela com a função de Heaviside; por exemplo, para obter a distribuição retardada:

n −1  
r ( x ) = χ( x )d( x ) , com χ( x ) := ∏Θ x+ +
j − xn ≡ Θ( x+ ) . (4.94)
j =1

Duas observações a respeito dessa proposta: (1) Ela pode garantir a igualdade de r ( x ) e d( x )
somente para x + > 0, mas os valores que r adota no eixo x − não são especificados; (2) a fun-
ção χ( x ), como definida na Eq. (4.94), é descontínua em x + = 0, motivo esse pelo qual, por
regra geral, a distribuição r ( x ) obtida da maneira proposta não seria uma distribuição bem
definida. Em ambos os casos (1) e (2), vê-se, as dificuldades surgem no eixo x − , que é a in-
tersecção entre a superfície de descontinuidade de χ( x ) e supp(d). Logo, o comportamento
da distribuição d( x ) na vizinhança do eixo x − é essencial para o procedimento de divisão.
Tal comportamento será estudado à luz da seguinte definição, que é um caso particular da
«quase-assíntota por variável selecionada» de Vladimirov, Drozzinov e Zavialov [109]:

Definição: Seja d ∈ S ′ (Rm ) uma distribuição, e seja ρ uma função contínua definida positiva.
Se o limite  
lim ρ(s)s3m/4 d sx + ; sx ⊥ ; x − = d− ( x ) (4.95)
s → 0+

existe em S ′ (Rm ) e é não nulo, então a distribuição d− é chamada a quase-assíntota de d no eixo x − ,


em relação à função ρ.
Capítulo 4. Teoria de perturbação causal no plano nulo 97

É claro, o limite na Eq. (4.95) deve ser entendido no sentido distribucional. Com essa
definição, a função ρ(s), pode ser provado, é uma «função regularmente variável na origem»,
também chamada «função de auto-modelo» (auto-model function) [109, 107], o que significa
que para todo a > 0:
ρ( as)
lim = aα , (4.96)
s → 0+ ρ(s)
para algum número α ∈ R, chamado «ordem de auto-modelamento» da função ρ. Em parti-
cular, é possível usar ρ(s) = sα ρ0 (s), com ρ0 uma função lentamente variável em zero –ou
seja, que tem ordem de auto-modelamento nula–, na definição de quase-assíntota, então o
auto-modelamento de ρ serve como um parâmetro característico da distribuição. Comu-
mente, ademais, será possível usar simplesmente a função de auto-modelo ρ(s) = sω− . Isto
posto, sob as mesmas hipóteses da definição anterior:

Definição: Se a quase-assíntota da distribuição d ∈ S ′ (Rm ) no eixo x − é obtida com a função


ρ(s) = sω− ρ0 (s), então o número ω− é a ordem singular da distribuição d no eixo x − .

Salientamos que o valor da ordem singular ω− [d] de uma determinada distribuição


causal d é tal que a quase-assíntota d− ( x ) é não nula «como distribuição», quer dizer:
D   E
∀ φ ∈ S (Rm ) : lim sω− s3m/4 d sx + ; sx ⊥ ; x − ; φ( x ) = ⟨d− ; φ⟩ . (4.97)
s → 0+

Desta sorte, a ordem singular ω− [d] é um número único caracterizando o comportamento


da distribuição causal nas proximidades do eixo x − . Neste sentido, a ordem singular no eixo
x − é independente da coordenada x − .
Atendendo às dificuldades apontadas, uma nova proposta, mais cuidadosa, para efetuar
a divisão da distribuição numérica d( x ), é a seguinte:

(i) Devido ao Teorema 4.3, d( x ) é não nulo somente se os pontos de x estão quer todos

em Γ+
n−1 (0), quer todos em Γn−1 (0). Consideremos, portanto, a (n − 1)-upla de vetores
tipo-luz: v := (e+ ; · · · ; e+ ) e definamos o plano v · x = 0, x ∈ Mn−1 . Explicitamente, a
equação do plano é:

v · x = ( x1+ − xn+ ) + · · · + ( xn+−1 − xn+ ) = 0 . (4.98)

Como v · x > 0 para x tais que x j − xn ∈ V + (0), enquanto que v · x < 0 para x tais que
x j − xn ∈ V − (0), o plano recém definido pode ser usado para dividir a distribuição
causal em suas partes avançada e retardada, deixando sem especificar seus valores no
eixo x − 8 .

(ii) O produto v · x definido na parte (i) usar-se-á como argumento de uma função contínua
8A respeito disto, na dinâmica instantânea o plano pode ser qualquer plano tipo-espaço. Aqui tal ambigüi-

dade não é possível: O plano deve ser o definido na Eq. (4.98); um outro plano, cuja interseção com o cone de
luz não fosse o eixo x − , não respeitaria o fato de que, na dinâmica da frente de luz, as distribuições retardada e
avançada estão definidas em relação à coordenada x + , e por isso podem assumir valores também no eixo x − .
98 Capítulo 4. Teoria de perturbação causal no plano nulo

e monótona não-decrescente tal que:



 0 ;
 t≤0
χ(t) := < 1 ; 0 < t < 1 . (4.99)

1 ; t≥1

Essa função substituirá à função descontínua de Heaviside, permitindo que as distri-


buições obtidas por multiplicação com ela estejam bem definidas.

(iii) Introduzimos uma função b ∈ D Rm/4 tal que ∀ x − ∈ Rm/4 : b( x − ) ∈ [0; 1], e


definimos a distribuição causal auxiliar com suporte compacto na variável x − :

db ( x ) : = d ( x )b( x − ) . (4.100)

Claramente, a distribuição causal original (real) se corresponde com a auxiliar no limite


em que b → 1.

(iv) A distribuição auxiliar retardada e a avançada, respectivamente, são definidas pelos


limites:
v · x  v· x
rb ( x ) := lim χ db ( x ) , ab ( x ) := − lim χ − db ( x ) . (4.101)
s → 0+ s s → 0+ s

Com essas definições, os suportes das distribuições rb e ab são consequência do suporte


de χ [vide a Eq. (4.99)] e do Teorema 4.3.

(v) A distribuição retardada e a avançada são respectivamente definidas pelos limites:

r ( x ) := lim rb ( x ) , a( x ) := lim ab ( x ) . (4.102)


b→1 b→1

Incontestável que as definições dadas na Eq. (4.101) somente podem ser consideradas
satisfatórias se tais limites de fato existem. Para examinar a mesma usar-se-á a condição
de Cauchy para a convergência de uma família de distribuições, que pode ser consultada,
por exemplo, nas Refs. [159, 174]: A família de distribuições { f λ } ⊂ S ′ é convergente no limite
λ → 0 se e somente se:

∀ φ ∈ S : ∀ε > 0 : ∃δ > 0 : 0 < |λ1 |, |λ2 | < δ ⇒ |( f λ1 ; φ) − ( f λ2 ; φ)| < ε . (4.103)

Consideremos um dado número pequeno ε; podemos fixar λ2 = λ2 (ε) e escolher λ1 = λ2 /k


para algum número k > 0 arbitrário mas fixo. Ainda mais, é possível restringir a análise ao
caso de k ≥ 1, pois se 0 < k < 1 bem poder-se-ia fixar λ1 e escrever λ2 = λ1 /k com k > 1. A
condição de Cauchy pode então ser escrita como:

∀ φ ∈ S : ∀k ≥ 1 : ∀ε > 0 : ∃δ > 0 : λ ∈ ]−δ; δ[ ⇒ |( f λ/k − f λ ; φ)| < ε . (4.104)

Ou seja, a convergência da família de distribuições está garantida se se satisfaz ao seguinte


Capítulo 4. Teoria de perturbação causal no plano nulo 99

limite:
∀k ≥ 1 : lim ( f λ/k − f λ ) = 0 . (4.105)
λ →0

Aplicando esse critério aos limites de nosso interesse [Eq. (4.101)], o que devemos
examinar é a validade do enunciado:
v · x
∀k ≥ 1 : lim ψ db ( x ) = 0 ; ψ (t) := χ (kt) − χ (t) , (4.106)
s → 0+ s

no sentido distribucional. Por sua definição, a função ψ é suave e tem suporte compacto
na variável x + . Consideremos agora uma função ψ1 ∈ C +∞ (Rm ) tal que é igual a 1 numa

vizinhança de Γ+ n−1 (0) ∪ Γn−1 (0), e igual a 0 fora dela. Pelas propriedades geométricas

de Γ+n−1 (0) ∪ Γn−1 (0), e como b ∈ D R
m/4 , o produto ψψ b terá suporte compacto, e

1
pertencerá então ao espaço D (Rm ), isto é, será uma função de teste num sub-espaço denso
de S (Rm ) –este é o motivo fundamental pelo qual é imprescindível incluir a função b–. Seja
φ ∈ S (Rm ) uma função de teste; tem-se que:
D v · x E D v · x x E
ψ db ( x ); φ ( x ) = ψ db ( x ); ψ1 φ( x )
s D v · x s x Es

= φ ( x ) d ( x ); ψ ψ1 b( x )
D  s  s  E
= s3m/4 φ sx + ; sx ⊥ ; x − d sx + ; sx ⊥ ; x − ; ψ (v · x ) ψ1 ( x )b( x − ) . (4.107)

Assumir-se-á agora que a distribuição causal d tem quase-assíntota d− no eixo x − , de forma


que o seguinte limite existe –vide a Eq. (4.95)–:
   
lim sω− s3m/4 φ sx + ; sx ⊥ ; x − d sx + ; sx ⊥ ; x − = φ− ( x − )d− ( x ) , (4.108)
s → 0+

com φ− ( x − ) := φ(0; 0⊥ ; x − ). Sendo dessa maneira, pode-se reformular a condição de


existência dos limites da Eq. (4.101) como –vide as Eqs. (4.106), (4.107) e (4.108)–:
D v · x E ⟨ φ− d− ; ψψ1 b⟩
∀ φ ∈ S (Rm ) : lim ψ db ( x ); φ( x ) = lim =0 . (4.109)
s →0 + s s →0 + s ω−

Então se observa com claridade que essa condição é sempre satisfeita quando ω− < 0, mas
que poderia não sê-lo quando ω− ≥ 0; logo, é mister estudar essas duas possibilidades
separadamente.

Antes de passar aos ditos casos, desejamos reforçar a necessidade de introduzir a função
b, que fica clara ao considerarmos a Eq. (4.109). Como mostrado na Fig. 4.1, se a função b
não tivesse sido introduzida, então o segundo argumento do «produto interno» que aparece
na mencionada equação não seria uma função de teste, pois não se anularia no infinito.
Quando a função auxiliar é introduzida, em câmbio, o suporte do segundo argumento
torna-se compacto e a expressão é bem definida; isto corresponde à segunda imagem na Fig.
4.1. Por comparação, mostramos, na terceira imagem, o caso da dinâmica instantânea, em
que as características geométricas do cone de luz fazem com que o produto ψ1 ψ já tenha
100 Capítulo 4. Teoria de perturbação causal no plano nulo

suporte compacto e nenhuma função auxiliar seja requerida. Finalmente, a função b não
leva a mudança alguma caso se considere apenas funções de teste com suporte compacto na
variável x − : Efetivamente, se restringirmos a classe de funções de teste àquelas com suporte
em determinado intervalo I finito na variável x − , sempre podemos escrevê-la como φ = φb,
com b = 1 numa vizinhança de I e b = 0 fora dela. Há modifição, sem embargo, quando
não restringimos a classe de funções de teste permitidas, modificação essa que é removida
no final ao tomar o limite b → 1. Consideramos esta segunda opção porque desejaremos
utilizar a transformação de Fourier posteriormente, cujo tratamento é simples ao se utilizar
o espaço de Schwartz completo.

Figura 4.1: Necessidade da função b na dinâmica do plano nulo.

4.5.1 Distribuição causal com ordem singular negativa

Como vimos na Eq. (4.109), neste caso a divisão é «trivial», pois os limites da Eq. (4.101)
existem, então dita definição é admissível:
v · x
rb ( x ) = lim χ db ( x ) ≡ Θ ( v · x ) db ( x ) ; (4.110)
s →0 s
 v· x
ab ( x ) = − lim χ − db ( x ) ≡ −Θ (−v · x ) db ( x ) = (Θ (v · x ) − 1) db ( x ) . (4.111)
s →0 s
Portanto, a aplicação dessas distribuições à função de teste φ ∈ S (Rm ) tem resultado:

⟨rb ; φ⟩ = ⟨Θdb ; φ⟩ = ⟨db ; Θφ⟩ ; ⟨ ab ; φ⟩ = ⟨(Θ − 1)db ; φ⟩ = ⟨db ; (Θ − 1) φ⟩ . (4.112)

4.5.2 Distribuição causal com ordem singular não-negativa

No caso de ser ω− ≥ 0, o limite da Eq. (4.109) em geral não existe, então em princípio
a definição dada na Eq. (4.101) não é apropriada para tratar com esse tipo de distribuições
causais. Entretanto, ele existe, sim, sob determinadas condições impostas à função de teste
b b
φ ∈ S (Rm ): Suponhamos que ela é do tipo φ( x ) = ( x + ) 1 x ⊥ 2 φ e( x ) ∈ S (Rm )
e( x ), com φ
Capítulo 4. Teoria de perturbação causal no plano nulo 101

e b1 + b2 = |b|:
  
v· x   ⊥ b2
+ b1
ψ db ( x ); x x e( x )
φ
s
  
3m/4+|b| + ⊥ −
 
+ ⊥ −
   ⊥ b2
+ b1 −
=s e sx ; sx ; x d sx ; sx ; x ; x
φ x ψ (v · x ) ψ1 ( x )b( x ) .

(4.113)

Sob a condição de existência da quase-assíntota da distribuição causal no eixo x − –vide a Eq.


(4.108)–, quando s → 0+ a Eq. (4.113) se comporta como:
D b2 E
b1
e− d− ; ( x + )
φ x⊥ ψψ1 b   b2 
3m/4+|b| |b|−ω− + b1 ⊥

s =s e− d− ; x
φ x ψψ1 b . (4.114)
s3m/4 sω−

E esse limite é nulo, como o requer a Eq. (4.109), quando |b| > ω− , caso no qual, então, a
definição da Eq. (4.101) ainda é aplicável. O maior espaço de funções de teste no qual a
divisão da distribuição causal é trivial é assim aquele constituído pelas funções da forma:
 b
φ ( x ) = x +,⊥ φ e ∈ S (Rm )
e( x ) ; |b| = ⌊ω− ⌋ + 1 , φ . (4.115)

Nessa equação, o símbolo «⌊•⌋» significa «o maior número inteiro menor ou igual a •». Uma
função de teste é da forma definida na Eq. (4.115) se e somente se ela satisfizer à condição de
anulamento de suas primeiras ⌊ω− ⌋ derivadas em relação às variáves x + e x ⊥ , no eixo x − :
 
b ⊥ −
D+ ,⊥ φ 0; 0 ; x =0 para | b | ≤ ⌊ ω− ⌋ . (4.116)

Esse resultado aponta o caminho que deve ser seguido para estender a definição da distri-
buição retardada e a da avançada a todo o espaço S (Rm ) –possibilidade esta que existe em
virtude to teorema de Hahn-Banach9 –: Deve-se subtrair às funções de teste gerais seus pri-
meiros ⌊ω− ⌋ termos da série de Taylor nas variáveis x + e x ⊥ ao redor do ponto (0; 0⊥ ; x − ).
Porém, devemos ser cuidadosos ao fazer tal subtração, pois o polinômio diverge no infinito,
donde a simples subtração de um polinômio faria a função sair do espaço S (Rm ). Antes,
devemos multiplicar o polinômio a ser subtraído por uma função auxiliar w ∈ S R3m/4 ,


de forma que este produto seja ainda uma função de teste. A subtração é portanto feita por
meio do operador de projeção W definido segundo:

  ⌊ω− ⌋ ( x +,α )b  
(W φ)( x ) := φ( x ) − w x + ; x ⊥ ∑ b
D+ ,α φ 0; 0 ⊥ −
; x . (4.117)
|b|=0
b!

9Oteorema de Hahn-Banach afirma que [199] toda funcional linear contínua f definida num subespaço m de
um espaço linear normado M pode ser estendida por uma funcional linear contínua F em M tal que, para toda função
φ ∈ m: ⟨ F; φ⟩ = ⟨ f ; φ⟩, e ∥ F ∥ M = ∥ f ∥m . Este teorema pode ser aplicado no caso em estudo porque as funções
que satifazem à Eq. (4.116) constituem um subespaço do espaço de Schwartz, que é um espaço linear normado.
A este respeito, lembre-se que a norma no espaço de Schwartz pode ser definida, entre outras possibilidades, por
∥ φ∥n := supx,|α|≤n (1 + | x |)n | D α φ( x )|, com n ∈ N0 .
102 Capítulo 4. Teoria de perturbação causal no plano nulo

A função auxiliar não é qualquer uma, mas está restrita de forma que W φ satisfaça à Eq.
(4.116); calculando as primeiras ⌊ω− ⌋ derivadas de W φ:
   
c ⊥ − c ⊥ −
D+ ,α ( W φ ) 0; 0 ; x = D +,α φ 0; 0 ; x
c
c!    
−∑ D+c− a
,α w 0; 0 ⊥
D a
+,α φ 0; 0 ⊥ −
; x ; | c | ≤ ⌊ ω− ⌋ , (4.118)
a=0 a! ( c − a ) !

e W é o projetor requerido se a função w é escolhida tal que:


   
w 0; 0⊥ = 1 , c
D+ ,α w 0; 0

= 0 para 1 ≤ |c| ≤ ⌊ω− ⌋ . (4.119)

Evidentemente, a segunda condição deve ser imposta apenas quando ⌊ω− ⌋ ≥ 1; se ⌊ω− ⌋ = 0,
então a primeira condição é suficiente.
Com essas considerações, a distribuição retardada é (bem) definida pela fórmula:
 v · x 
⟨rb ; φ ⟩ : = lim χ db ( x ); (W φ)( x ) ≡ ⟨db ; ΘW φ⟩ . (4.120)
s → 0+ s

E a distribuição avançada o é pela equação:


 v · x 
⟨ ab ; φ ⟩ : = − lim+ χ db ( x ); (W φ)( x ) = ⟨ d b ; ( Θ − 1 )W φ ⟩ . (4.121)
s →0 s

É importante perceber que a introdução do operador W não destrói a igualdade da


×(n−1)
distribuição retardada com a causal na região Γ+
n−1 (0) \ (Re )
− . Para verificar isto,
considere uma função φ com suporte naquela região; tanto a função quanto suas derivadas
b1 b2
são nulas no eixo x − : D+ Dα φ 0; 0⊥ ; x − = 0, para quaisquer números não-negativos


b1 , b2 , e as correções introduzidas pelo projetor W são todas nulas [vide a Eq. (4.117)]:
Os termos adicionais permitem a aplicação da distribuição retardada a funções de teste
arbitrárias, sem por isso modificar o resultado que se obteria com o uso de uma função
de teste apropriadamente escolhida. Um argumento semelhante rege para a distribuição
avançada.

4.6 Divisão da distribuição causal no espaço dos momentos


De forma geral, os cálculos na teoria do campo quantizado são mais simples no espaço
dos momentos, motivo pelo qual é conveniente, para a aplicação futura da teoria, obter fór-
mulas para a divisão da distribuição causal nesse espaço. Como é bem conhecido, o passar
do espaço real ao dos momentos é levado a cabo mediante a transformação de Fourier; a
aplicação dela à Eq. (4.95) permite escrever a definição de quase-assíntota na seguinte forma:

Definição: Seja dˆ ∈ S ′ (Rm ) uma distribuição, e seja ρ uma função contínua definida positiva.
Se o limite D p p  E D E
; ⊥ ; p− ; φ̌( p) = dˆ− ; φ̌
+
lim ρ(s) dˆ (4.122)
s → 0+ s s
Capítulo 4. Teoria de perturbação causal no plano nulo 103

existe para toda função de teste φ̌ ∈ S (Rm ), então dˆ− é a quase-assíntota da distribuição dˆ em
p+ , p⊥ → +∞, em relação à função ρ.

Como a definição recém escrita obtém-se daquela oferecida no espaço real, a função ρ(s)
em ambas as definições pode ser considerada a mesma, donde decorre que a ordem singular
da distribuição, ω− , bem pode ser calculada no espaço dos momentos como no espaço real,
obtendo-se sempre o mesmo valor.

4.6.1 Distribuição causal com ordem singular negativa

Pela própria definição da transformada de Fourier de uma distribuição, da Eq. (4.112)


tem-se que: D E
⟨rb ; φ⟩ = ⟨r̂b ; φ̌⟩ = (2π )−m/2 Θb ∗ dˆb ; φ̌ , (4.123)

a partir do qual identifica-se que a distribuição retardada no espaço dos momentos é:


D E
r̂b ( p) = (2π )−m/2 Θ
b ∗ dˆb ( p) = (2π )−m/2 Θb (q); dˆb ( p − q) . (4.124)
q

Como pode-se ver, precisar-se-á conhecer a transformada de Fourier da função de Heaviside


Θ(v · x ), com v · x dado na Eq. (4.98). Simplificando a notação, consideremos que precisamos
obter a transformada de Fourier da função Θ( x + y + · · · + z), com l variáveis x, y, · · · , z.
Por definição ela é:
Z
b ( p; q; · · · ; r ) = (2π )−l/2
Θ dxdy · · · dzeipx+iqy+···+irz Θ( x + y + · · · + z) . (4.125)

Seja feita a mudança de variável w = x + y + · · · + z em substituição da x. Como o jacobiano


dessa transformação é a unidade, tem-se:
Z
b ( p; q; · · · ; r ) = (2π )−l/2
Θ dwdy · · · dzeipw+i(q− p)y+···+i(r− p)z Θ(w)
Z
= (2π )l/2−1 δ(q − p) · · · δ(r − p) dweipw Θ(w) , (4.126)

e o problema foi reduzido ao cálculo da transformada de Fourier da função de Heaviside


unidimensional. Como é sabido, ela não existe stricto sensu, mas segundo o teorema de
Titchmarsh [178, 179], existe, sim, no sentido do limite seguinte:

+∞ +∞
i
Z Z
lim dwe i ( p+iϵ)w
Θ(w) = lim dwe(ip−ϵ)w = . (4.127)
ϵ → 0+ ϵ → 0+ p + i0+
−∞ 0

Com as Eqs. (4.126) e (4.127), e voltando à notação de multi-índices, obtém-se o resultado


procurado:

b (q) = (2π )m/2−1 δ(q1 )δ(q2+ − q1+ )δ(q2 ) · · · δ(qn−1+ − q1+ )δ(qn−1 ) i
Θ . (4.128)
q1+ + i0+
104 Capítulo 4. Teoria de perturbação causal no plano nulo

Substituindo esse resultado na Eq. (4.124):

i dqδ(q1 )δ(q2+ − q1+ )δ(q2 ) · · · δ(qn−1+ − q1+ )δ(qn−1 ) ˆ


Z
r̂b ( p) = db ( p − q ) . (4.129)
2π q1+ + i0+

Integrando nas variáveis qia , exceto em q1+ , e renomeando essa variável como k, obtém-se a
fórmula de divisão:
+∞
i dˆb (( p1+ − k; p1 ); · · · ; ( pn−1+ − k; pn−1 ))
Z
r̂b ( p) = dk
2π k + i0+
−∞
+∞
i dˆb ( p+ − k; p)
Z
≡ dk . (4.130)
2π k + i0+
−∞

Finalmente, pelo teorema da convolução, a transformada de Fourier de db é dada por:


Z
dˆb ( p) = (2π )−m/8 dˆ( p+ ; p⊥ ; q)b̂( p− − q)dm/4 q . (4.131)

O limite b( x − ) → 1 deve agora ser tomado segundo: b̂( p− ) → (2π )m/8 δ( p− ).

4.6.2 Distribuição causal com ordem singular não-negativa

Passemos a considerar o caso não trivial da distribuição causal com ordem singular não-
negativa. Da Eq. (4.120) tem-se que:
D dE
⟨rb ; φ⟩ = ⟨r̂b ; φ̌⟩ = (2π )−m/2 Θ
b ∗ dˆb ; W φ . (4.132)

b ∗ dˆb , é a mesma
O primeiro argumento dentro do «produto interno» da última igualdade, Θ
que já calculou-se no caso de ordem singular negativa. Precisa-se agora calcular o segundo
argumento:
d ⌊ ω− ⌋
1 n  + ⊥  +,α b b  o b
W φ( p) = φ̌( p) − ∑ b! w x ; x x D +,α φ 0; 0 ⊥ −
; x ( p) . (4.133)
|b|=0

O termo entre as chaves é:


n   b b  o b
w x + ; x ⊥ x +,α D+ ,α φ 0; 0 ⊥ −
; x ( p)
Z  
= (2π )−m/2 dm xe−ipx w x + ; x ⊥ ( x +,α )b D+ b ⊥ −
,α φ (0; 0 ; x )
n   ob
= (2π )−m/2 (iD p )b+,α w x + ; x ⊥ D+ b
,α φ ( 0; 0 ⊥ −
; x ) ( p)
b n ob
= (2π )−m/2 (iD p )b+,α w ∗ D+ b ⊥ −
,α φ (0; 0 ; x ) ( p)
Z b n ob
−m/2 b m b ⊥ −
= (2π ) (iD p )+,α d qw( p − q) D+,α φ(0; 0 ; x ) (q) . (4.134)
Capítulo 4. Teoria de perturbação causal no plano nulo 105

Tem-se que, desde que w não depende de x − :


b b
w( p − q) = (2π )−m/4 δ( p− − q− )w( p+ − q+ ; p⊥ − q⊥ ) . (4.135)

E o termo entre chaves na última linha da Eq. (4.134) é igual a:


n ob
b ⊥ −
D+ ,α φ (0; 0 ; x ) (q)
Z Z
= (2π )−m/2 dm xe−iqx d3m/4 y+,⊥ δ(y+,⊥ ) D+
b + ⊥ −
,α φ ( y ; y ; x )
Z

= (2π ) m/4
δ ( q +,⊥ ) dm ye−iq− y δ(y+,⊥ ) D+
b
,α φ ( y )
Z
= (2π )m/4 δ(q+,⊥ ) dm ye−iqy δ(y+,⊥ ) D+b
,α φ ( y )
Z  
−iqy
= (−1)b (2π )m/4 δ(q+,⊥ ) dm yD+ b
,α e δ ( y +,⊥ ) φ ( y ) . (4.136)

Mas essa quantidade será integrada na variável q [vide a Eq. (4.134)], de forma que pode-
se usar o suporte da distribuição δ(q+,⊥ ). Particularmente, quando algumas das derivadas
b
contidas em D+ −iqy , aparecerá sempre pelo menos um fator
,α afetam à função exponencial e
q+,⊥ , que será nulo por causa do referido suporte. Assim, será suficiente considerar a ação
b +,⊥ ):
de D+ ,α sobre δ ( y

n ob  Z 
⊥ −
b
D+ ,α φ (0; 0 ; x ) δ(q+,⊥ ) dm ye−iqy D+
(q) = (−1) (2π ) b m/4 b
,α δ ( y
+,⊥
) φ(y)
Z h ib
= (−1)b (2π )m/4 δ(q+,⊥ ) dm p′ D+ b
,α δ ( y +,⊥
) (q − p′ ) φ̌( p′ ) . (4.137)

Aqui tem de ser calculado:


h ib Z
+,⊥ ′
b
D+ ,α δ ( y ) (q − p′ ) = (2π )−m/2 dm ye−i(q− p )y D+
b
,α δ ( y
+,⊥
)
Z
−m/4 ′ +,⊥
b
= (−1) (2π ) δ(q− − p′− ) b
d3m/4 D+ ,α e
− i ( q − p ) +,⊥ y
δ ( y +,⊥ )

= ib (2π )−m/4 δ(q− − p′− )(q − p′ )b+,α . (4.138)

Substituindo a Eq. (4.138) na (4.137), então na Eq. (4.134):


n   b b  o b
w x + ; x ⊥ x +,α D+ ,α φ 0; 0 ⊥ −
; x ( p)
Z b
−3m/4
= (2π ) ( D p )b+,α m
d qδ( p− − q− )w( p+ − q+ ; p⊥ − q⊥ )δ(q+,⊥ )
Z
× dm p′ δ(q− − p′− )(q − p′ )b+,α φ̌( p′ )
Z b b
−3m/4
= (2π ) m ′ ′ b
d p (− p )+,α ( D p )+,α w( p+ ; p⊥ )δ( p− − p− ) φ( p′ )
b ′
. (4.139)
106 Capítulo 4. Teoria de perturbação causal no plano nulo

Dessa forma, substituindo a Eq. (4.139) na (4.133), obtém-se finalmente a transformada de


Fourier inversa de W φ:
d ⌊ ω− ⌋
1
Z b b
W φ( p) = φ̌( p) − ∑ b! (2π )−3m/4 dm p′ (− p′ )b+,α δ( p′− − p− )( D p )b+,α w( p+ ; p⊥ ) φ( p′ ) .
|b|=0
(4.140)

Com as Eqs. (4.130) e (4.140) substituídas na Eq. (4.132):

+∞ (
⌊ ω− ⌋
i dˆb ( p+ − k; p) 1
Z Z
⟨r̂b ; φ̌⟩ = dm p

dk
k + i0+ b!
(2π )−3m/4
φ̌( p) − ∑
−∞ |b|=0
Z b b 
m ′ ′ b ′ b ′
× d p (− p )+,α δ( p− − p− )( D p )+,α w( p+ ; p⊥ ) φ( p )
( +∞ ⌊ ω− ⌋
i dˆb ( p+ − k; p) 1
Z Z
= d p m

dk
k + i0 +
− ( 2π ) −3m/4
∑ b!
(− p)b+,α
−∞ |b|=0
+∞ )
i dˆb ( p′+ − k; p′ )
Z Z b
× dm p′ dk δ( p′− − p− )( D p′ )b+,α w( p′+ ; p′⊥ ) φ̌( p) . (4.141)
2π k + i0+
−∞

Daí decorre que a distribuição retardada auxiliária é dada pela expressão:

+∞ ⌊ ω− ⌋
i dˆb ( p+ − k; p) 1
Z
r̂b ( p) =

dk
k + i0 +
− ( 2π ) −3m/4
∑ b!
(− p)b+,α
−∞ |b|=0
+∞
i dˆb ( p′+ − k; p′ )
Z Z b
m ′
× d p dk ′
δ( p− − p− )( D p′ )+,α w( p′+ ; p′⊥ )
b
. (4.142)
2π k + i0+
−∞

Ou, ainda, fazendo uma integração por partes na integral da variável p′ :

+∞ ⌊ ω− ⌋
i dˆb ( p+ − k; p) 1 b
Z
r̂b ( p) =

dk
k + i0 +
− ( 2π ) −3m/4
∑ p
b! +,α
−∞ |b|=0
+∞
Z
m ′ i
Z
( D p′ )b+,α dˆb ( p′+ − k; p′ ) b
× d p dk ′
δ( p− − p− )w( p′+ ; p′⊥ ) . (4.143)
2π k + i0+
−∞

Integrando por fim na variável p′− :

+∞ (
⌊ ω− ⌋
i dk 1 b
Z
r̂b ( p) =
2π k + i0+
dˆb ( p+ − k; p) − (2π )−3m/4 p
b! +,α∑
−∞ |b|=0
Z b 
3m/4 ′ b ˆ ′ ′ ′ ′
× d p+,⊥ ( D p′ )+,α db ( p+ − k; p⊥ ; p− )w( p+ ; p⊥ ) . (4.144)
Capítulo 4. Teoria de perturbação causal no plano nulo 107

Essa é uma solução ao problema da divisão, e é finita porb construção. Inobstante ela ainda
exibir uma dependência explícita com a função auxliar w, note-se que a segunda linha na
Eq. (4.144) é uma distribuição da variável p− só, e está multiplicada por fatores p+,α ; isto
significa que os termos de subtração, que são aqueles que dependem da função w, são
termos instantâneos. Como por enquanto somente é possível afirmar a igualdade de rb e db
no cone de luz futuro, exceto, precisamente, no eixo x − , estes termos instantâneos podem
modificar-se sem isto trazer implicações físicas, pois em qualquer caso os termos instantâneos
fixar-se-ão por condições diferentes da causalidade. Porém, os termos instantâneos na Eq.
(4.144) não podem ser simplesmente desconsiderados, pois sua função, já o dissemos, é
remover as divergências que aparecem quando a ordem singular é não-negativa. Isto nos
leva à seguinte conclusão: Com a finalidade de evitar precisar definir sempre uma função w
apropriada para cada ordem singular da distribuição causal e efetuar os cálculos explícitos
com ela, tentaremos eliminar a dependência com ela da Eq. (4.144), sem destruir a finitude
do resultado, adicionando para isso somente termos instantâneos finitos.

Assumindo que exista um ponto q ∈ Rm em que as derivadas D+


c r̂ ( q ) existem para
,α b
todo |c| ≤ ⌊ω− ⌋, da Eq. (4.144) tem-se que:

+∞ c dˆ ( q − k; q ) ⌊ ω− ⌋
i D+ 1 c b
Z
,α b +
c
D+ ,α r̂b ( q ) =

dk
k + i0 +
− ( 2π ) −3m/4
∑ D q
b! +,α +,α
−∞ |b|=0
+∞
Z
i
Z
( D p′ )b+,α dˆb ( p′+ − k; p′⊥ ; q− ) b ′ ′
× d3m/4 p′+,⊥ dk w( p+ ; p⊥ ) . (4.145)
2π k + i0+
−∞

Mas:
b!
c
D+ b
,α q+,α = qb−c (c ≤ b) ; c
D+ b
,α q+,α = 0 (c > b) , (4.146)
(b − c)! +,α
em que as relações de ordem «≤» e «>» entre multi-índices são definidas como:

c ≤ b : ⇔ ∀ i : c i ≤ bi ; c > b : ⇔ ∃ i : c i > bi . (4.147)

Por outro lado, sempre é possível escrever:

1 b 1 ( p+,α − q+,α )c qb+−,αc


p = [q+,α + ( p+,α − q+,α )] = ∑
b
. (4.148)
b! +,α b! c≤b
c!(b − c)!

Substituindo a Eq. (4.146) na (4.145) e usando a Eq. (4.148):

⌊ ω− ⌋ +∞ ⌊ ω− ⌋ c dˆ ( q − k; q )
( p+,α − q+,α )c c i ( p+,α − q+,α )c D+
Z
,α b +
∑ c!
D+,α r̂b (q) =

dk ∑ c! k + i0+
|c|=0 −∞ |c|=0
+∞
⌊ ω− ⌋
1
Z
i
Z
( D p′ )b+,α dˆb ( p′+ − k; p′⊥ ; q− ) b ′ ′
− (2π ) −3m/4
∑ b! pb+,α d3m/4 p′+,⊥

dk
k + i0+
w( p+ ; p⊥ ) .
|b|=0 −∞
(4.149)
108 Capítulo 4. Teoria de perturbação causal no plano nulo

A comparação das Eqs. (4.144) e (4.149) revela que os termos nelas contendo a dependência
explícita com a função auxiliar w são os mesmos se q− = p− . Ademais, a Eq. (4.149)
somente contém termos instantâneos, pelo qual a «distribuição retardada auxiliar com linha
de normalização (q+ ; q⊥ ; p− )», definida como:

⌊ ω− ⌋
( p+,α − q+,α )c c
r̂b,q ( p) := r̂b ( p) − ∑ c!
D+,α r̂b (q+ ; q⊥ ; p− ) , (4.150)
|c|=0

é também uma solução ao problema da divisão. Ela é muito conveniente porque a dependên-
cia com a função w tem desaparecido explicitamente, como é possível ver pela substituição
das Eqs. (4.144) e (4.149) na Eq. (4.150):

+∞ (
⌊ ω− ⌋
)
i dk 1
Z
r̂b,q ( p) =
2π k + i0+
dˆb ( p+ − k; p) − ∑ c!
( p+,α − q+,α )c D+
c ˆ
,α db ( q+ − k; q⊥ ; p− ) .
−∞ |c|=0

(4.151)

Claramente, esta nova distribuição retardada auxiliar satisfaz à seguinte «condição de


normalização»:
b
D+ ,α r̂b,q ( q+ ; q⊥ ; p− ) = 0 ; | b | ≤ ⌊ ω− ⌋ . (4.152)

A distribuição da Eq. (4.151) é a solução geral ao problema da divisão da distribuição causal,


válida para qualquer momento p, módulo a adição de termos instantâneos finitos. Um caso
particular –e de também particular importância– de linha de normalização é (0; 0⊥ ; p− ); a
solução normalizada nela é denominada «solução central», e é dada por:

+∞ (
⌊ ω− ⌋
)
i dk 1 c
Z
r̂b,0 ( p) =
2π k + i0+
dˆb ( p+ − k; p) − ∑ p D c dˆb (−k; 0⊥ ; p− )
c! +,α +,α
. (4.153)
−∞ |c|=0

A solução central, contudo, nem sempre existe, e em alguns casos somos forçados a utilizar
de uma linha de normalização diferente.
Finalmente, como no caso da ordem singular negativa, nessas equações deve-se colocar a
Eq. (4.131), e no final dos cálculos o limite b̂( p− ) → (2π )m/8 δ( p− ) deve ser considerado.

4.7 Normalização das soluções ao problema da divisão


Que a igualdade entre a distribuição causal e a retardada que se obtém do procedimento
×(n−1)
indutivo pode apenas ser afirmada na região Γ+
n−1 (0) \ (Re )
− , já o dissemos, e também
a igualdade entre a distribuição avançada e a causal pode apenas ser afirmada em Γ−
n −1 (0 ) \
×(n−1)
(Re− ) . É mister considerar agora o problema da definição dessas distribuições no eixo

x . Em primeiro lugar, deve-se notar que é impossível que ambas as distribuições retardada
e avançada sejam iguais à causal em tal eixo; certamente, se fosse r |eixo x− = d|eixo x− , então
forçosamente seria a|eixo x− = 0, uma vez que d = r − a; isto ocorre em cada ponto do
conjunto supp(r ) ∩ supp( a), enquanto que fora dele é, sim, possível que as distribuições
Capítulo 4. Teoria de perturbação causal no plano nulo 109

retardada e avançada sejam iguais à causal. Suponhamos agora que (r1 ; a1 ) e (r2 ; a2 ) são
duas soluções ao problema da divisão, i.e., são verificadas: r1 − a1 = d = r2 − a2 . Dessas
igualdades tem-se que:
r1 − r2 = a1 − a2 . (4.154)

Mas o suporte do lado esquerdo dessa equação está contido em Γ+


n−1 (0), enquanto que
o suporte do seu lado direito o está em Γ−
n−1 (0): A igualdade da Eq. (4.154) só pode ser
verdadeira se:

− −
×(n−1)
supp(r1 − r2 ) , supp( a1 − a2 ) ⊆ Γ+
n−1 (0) ∩ Γn−1 (0) = Re . (4.155)

Isto é evidente: Se r1 e r2 são iguais a d em todo seu suporte, exceto pelo eixo x − , então eles
podem ser diferentes somente no mencionado eixo; e outro tanto vale para a distribuição
avançada. Destarte, as distribuições retardadas r1 e r2 podem diferir por «termos de norma-
lização» que são distribuições com suporte no eixo x − :

M  
∑ Cb x − D+ +,⊥
 b
r1 ( x ) − r2 ( x ) = ,⊥ δ x , (4.156)
|b|=0

com Cb ( x − ) certas distribuições da variável x − . A ordem singular de cada um desses ter-


mos é |b|, independentemente de qual seja a distribuição Cb ( x − ), pois a variável x − não é
escalada no cálculo da ordem singular. Estes termos de normalização afetam também à dis-
tribuição avançada, como estabelecido pela Eq. (4.154): Os mesmos termos de normalização
adicionados à distribuição retardada devem ser adicionados também à avançada. No espaço
dos momentos, estes termos de normalização são:

M
r̂1 ( p) − r̂2 ( p) = ∑ bb ( p− ) pb
C +,⊥ . (4.157)
|b|=0

Quanto ao limite superior, M, nas somas das Eqs. (4.156) e (4.157), pode-se apenas dizer o
seguinte: Que o processo indutivo causal não o determina, pois, como dissemos alhures,
estes termos não modificam o fato das distribuições retardada e avançada serem uma (outra)
solução ao problema da divisão. Os termos de normalização devem ser fixados pela imposi-
ção de condições físicas adicionais, como a covariância de Lorentz, as propriedades da teoria
em relação às transformações discretas, a invariância de calibre, et cetera, e pela imposição de
que a ordem singular da distribuição retardada seja menor ou igual à da distribuição causal:
ω− [r ] ≤ ω− [d]. A este respeito enunciamos o seguinte:

Teorema 4.5: Se a distribuição causal é covariante de Lorentz e sua ordem singular no eixo x − é
maior ou igual a sua ordem singular na origem10 , ω− [d] ≥ ω0 [d], então as condições de normaliza-
ção de covariância de Lorentz da distribuição retardada e de preservação da ordem singular podem ser

x − , exceto pelo fato de que no primeiro


10A definição da ordem singular na origem é similar à daquela no eixo

caso são as quatro variáveis que são escaladas. No espaço dos momentos [107]: Seja dˆ ∈ S ′ (Rm ) uma distribuição,
110 Capítulo 4. Teoria de perturbação causal no plano nulo

atingidas simultâneamente.

×(n−1)
Prova: Desde que r = d em Γ+
n−1 (0) \ (Re )
− , para qualquer função de teste φ ∈
S( Rm Γ+ − ×(n−1)
) com supp( φ) ⊆ n−1 (0) \ (Re ) ter-se-á que:

⟨r; φ⟩ = ⟨d; ΘW φ⟩ = ⟨d; φ⟩ (4.158)

(o projector W, é claro, é igual à unidade se ω− [d] < 0). Daí que, como, por hipótese, d é
covariante de Lorentz, qualquer possível não-covariância de r deve estar contida em termos
×(n−1)
instantâneos, isto é, com suporte em (Re− ) . Adicionalmente, efetuando o escalamento
da Eq. (4.158) vê-se que a ordem singular no eixo x − de r e de d são as mesmas para as
funções de teste consideradas; logo ω− [r ] = ω− [d] exceto, outra vez, pelo possível apare-
×(n−1)
cimento de termos com suporte em (Re− ) . Dessa forma, a covariância de Lorentz e
a preservação da ordem singular são, verdadeiramente, condições de normalização, pois
afetam à escolha dos termos de normalização apenas. Que estas duas condições podem
ser simultâneamente atingidas pode ver-se da seguinte forma: Desde que d é covariante
de Lorentz, ele não pode conter termos instantâneos; eis que todos os termos instantâneos
contidos em r têm origem no procedimento de divisão da distribuição causal; porém, eles
não podem ser covariantes de Lorentz a menos que seu suporte esteja na origem das coorde-
nadas. Aplique-se então a seguinte prescrição: Remova-se da distribuição r obtida todos
os termos instantâneos não-covariantes –isto pode ser facilmente realizado no espaço dos
momentos: Remova-se [porque a normalização o permite, vide a Eq. (4.157)] todos os ter-
mos em r̂ da forma P( p+ ; p⊥ ) R( p− ), com P um polinômio e R uma distribuição qualquer,
de forma que a distribuição retardada remanescente não possua termos que possam ser es-
critos daquela forma–. Agora a distribuição retardada não contém termos instantâneos e sua
ordem singular é a mesma que a da distribuição causal: ω− [r ] = ω− [d]. Para obter a covari-
ância de Lorentz de r, resta apenas realizar uma normalização na origem, x = 0. Semelhante
normalização é feita com as derivadas de δ( x ) de ordem até a ordem singular na origem
da distribuição causal, ω0 , como é mostrado, por exemplo, na Seç. 4.5 da Ref. [107] –vide
também a Ref. [176]–. Conclui-se que, se ω− [d] ≥ ω0 [d], então a covariância de Lorentz e a
preservação da ordem singular no eixo x − podem ser simultâneamente atingidas. ■

A desigualdade ω− [d] ≥ ω0 [d] requerida para a aplicação do Teorema 4.5 rege como
uma igualdade para qualquer distribuição causal covariante de Lorentz. Com efeito, pelo
procedimento indutivo se constrói a distribuição causal como o produto das partes de
frequência positiva ou de frequência negativa das distribuições de comutação dos campos.
No espaço dos momentos, tal produto (tensorial) vira uma convolução, de forma que, como

e seja ρ uma função contínua e positiva. Se o limite


D  p E D E
lim ρ(s) dˆ ; φ̌( p) = dˆ0 ; φ̌
s → 0+ s

existe qualquer que seja a função de teste φ̌ ∈ S (Rm ), então dˆ0 é a quasi-assíntota da distribuição dˆ em p → +∞, em
relação à função ρ. A ordem de auto-modelamento da função ρ é então a ordem singular da distribuição d na origem.
Capítulo 4. Teoria de perturbação causal no plano nulo 111

toda distribuição de comutação, da variável de momento p j , diga-se, tem em geral uma


estrutura da forma σj ( p j− ) Pj ( p ja )d1j ( p j ), com σj ( p j− ) = Θ(± p j− ), Pj ( p ja ) um polinômio
de p ja e d1j ( p j ) uma distribuição invariante de Lorentz construída com p2j , /
p j , então a
convolução de n de tais distribuições terá a seguinte forma geral:

dˆ( p) = σ( p− ) P( p a )d1 ( p) , (4.159)

com P( p a ) um polinômio de p a = ( p1a ; · · · ; pna ) e d1 uma distribuição invariante de Lorentz,


construída com termos invariantes da forma p2j , pi · p j , e /p j . Pelas definições das ordens

singulares no eixo x e na origem, é fácil ver que: ω− [σ ( p− )] = 0 = ω0 [σ( p− )]; ω− [ pi · p j ] =
ω− [ p2j ] = 2 = ω0 [ pi · p j ] = ω0 [ p2j ] e ω− [/
p j ] = 1 = ω0 [ /
p j ], pelo que teremos por regra geral
que ω− [d1 ] = ω0 [d1 ]. Tem-se também que ω− [ P( p a )] = deg( P) = ω0 [ P( p a )], com deg( P)
o grau do polinômio P. Finalmente, uma vez que a ordem singular de um produto de
distribuições é igual à soma das ordens singulares dos termos individuais, enquanto que a
ordem singular de uma soma de distribuições é igual à maior ordem singular dos adendos,
será válido em geral que ω− [d] = ω0 [d] e o Teorema 4.5 será aplicável.
É justo indicar, a despeito disto, que nem todas as distribuições causais são covariantes
de Lorentz –vide, por exemplo, o caso (3) na Seç. 4.10–. Em tais distribuições um termo
da forma 1/prj− está presente. Embora para tais termos tem-se que ω− = 0 > −r = ω0 , e
será sempre válido que ω− [d] > ω0 [d], não deve-se pensar por isto que o Teorema 4.5 possa
ser-lhes aplicado, pois em tais circunstâncias a covariância de Lorentz não pode ser uma
condição de normalização para as distribuições de transição, uma vez que ela não poderá
ser atingida. Nesses casos, a condição de normalização anterior deve ser substituída pela
condição de invariância (perturbativa) do operador S físico, isto é, dos elementos de matriz
do operador S entre estados físicos. Um exemplo de teoria com este comportamento é a QED
no gauge do plano nulo, em que as distribuições causais não são covariantes de Lorentz; a
matriz S física, sem embargo, é invariante de Lorentz devido à invariância de gauge quântica.
À sustentação do proferido dedicaremos o Cap. 6.
Finalmente, o problema da normalizabilidade de uma teoria particular significa examinar
a conexão entre a ordem singular das distribuições de transição e a ordem do termo pertur-
bativo a que pertencem. Para tal basta, certamente, considerar a ordem singular da distribui-
ção causal no lugar da da distribuição de transição, pois todos os termos com ω− [r ] > ω− [d]
são removidos com a única condição de preservação da ordem singular (que é uma condição
técnica mais bem que física). Assim, precisar-se-á de condições físicas para fixar os termos
Cb ( x − ) até a ordem ω− [d] só. A seguinte classificação é aplicada [100, 107, 180]:

(i) Não-normalizãvel: Se um número infinito de condições físicas é requerido para fixar por
completo o operador de espalhamento. Isto ocorre se a ordem singular da distribuição
causal se incrementa sem limite com a ordem perturbativa n.

(ii) Normalizável: Se um número finito de condições físicas basta para fixar todos os termos
de normalização, isto é, se a ordem singular da distribuição causal é uma função
limitada da ordem n do termo perturbativo. Isto pode acontecer de duas formas:
112 Capítulo 4. Teoria de perturbação causal no plano nulo

(ii-1) Se ω− [d] não depende da ordem perturbativa n, então a teoria se chama simples-
mente normalizável.
(ii-2) Se somente um número finito de distribuições causais de baixa ordem têm ordem
singular não-negativa, id est, se ω− [dn ] é uma função decrescente de n, então a
teoria se denomina super-normalizável.

4.8 Unitariedade do operador de espalhamento


Prosseguimos este capítulo centrando nossa atenção no axioma da unitariedade do opera-
dor de espalhamento, cuja versão não-perturbativa está enunciada na Eq. (4.8), e a perturba-
tiva, na Eq. (4.32). Essa última forma será a que adotaremos na filosofia da TPC. O que deseja-
mos averiguar é se o processo indutivo descrito nas seções prévias respeita este axioma, isto é,
se a distribuição de transição Tn construída pelo procedimento indutivo satisfaz à Eq. (4.32).

Teorema 4.6: Seja T1 ( x ) a distribuição de um ponto de uma teoria de interação. Se T1 satisfaz à


condição de unitariedade perturbativa, Eq. (4.32), então as distribuições de n pontos podem ser cons-
truídas pelo procedimento indutivo da TPC de forma a satisfazer à mesma condição de unitariedade.

Prova: A prova desse teorema será dada pelo método da indução matemática completa.
Como o primeiro passo do procedimento indutivo é hipótese, suponhamos agora que, para
todo m ≤ n − 1:
em = Tm†
T . (4.160)

Queremos provar a mesma tese como válida para n. Denotaremos os conjuntos X =


{ x1 ; · · · ; xn } e Y = { x1 ; · · · ; xn−1 }. A distribuição avançada da ordem n é definida na Eq.
(4.36), e pode também escrever-se da seguinte forma:

An (Y; xn ) = ∑ e( I ) T ( J )
T
I ∪ J =X
I ∩ J =∅
xn ∈ J

= ∑ e( I ) T ( J ) −
T ∑ e( I ) T ( J )
T
I ∪ J =X I ∪ J =X
I ∩ J =∅ I ∩ J =∅
xn ∈ I

=− ∑ e( I ) T ( J )
T
I ∪ J =X
I ∩ J =∅

= −T
en ( X ) − ∑ e( I ) T ( J )
T . (4.161)
I ∪ J =X
I ∩ J =∅
xn ∈ I
J ̸=∅

Aqui, para passar da segunda igualdade à terceira tem-se usado a Eq. (4.20), e na separação
do termo Ten ( X ) para passar da terceira à quarta linha, a Eq. (4.17). No último termo da Eq.
(4.161) somente aparecem distribuições de menos de n pontos, nas quais a hipótese da Eq.
Capítulo 4. Teoria de perturbação causal no plano nulo 113

(4.160) é válida; aplicando-a e comparando com a Eq. (4.40), vê-se que a citada soma é igual
ao adjunto da distribuição avançada subsidiária, A′n (Y; xn )† . Portanto, obteve-se que:

en ( X ) − A′n (Y; xn )†
An (Y; xn ) = − T . (4.162)

Analogamente, obtém-se para a distribuição retardada:

en ( X ) − R′n (Y; xn )†
Rn (Y; xn ) = − T . (4.163)

Essas duas equações são completadas com as Eqs. (4.39), repetidas aqui por claridade:

An (Y; xn ) = Tn ( X ) + A′n (Y; xn ) , Rn (Y; xn ) = Tn ( X ) + R′n (Y; xn ) . (4.164)

Das Eqs. (4.162)-(4.164) obtém-se:

Dn (Y; xn ) = R′n (Y; xn ) − A′n (Y; xn ) = − R′n (Y; xn )† + A′n (Y; xn )† = − Dn (Y; xn )† , (4.165)

e a distribuição causal é antissimétrica. Essa propriedade pode ser mantida após o procedi-
mento de divisão. Com efeito, seja ( Rn,1 ; An,1 ) uma solução qualquer ao problema da divi-
são, suas partes antissimétricas,

1 1
Rn,2 := ( Rn,1 − R†n,1 ) = − R†n,2 e An,2 := ( An,1 − A†n,1 ) = − A†n,2 , (4.166)
2 2

constituem também uma solução, pois devido à Eq. (4.165):

1 1 1 1
Rn,2 − An,2 = ( Rn,1 − An,1 ) − ( R†n,1 − A†n,1 ) = Dn − Dn† = Dn . (4.167)
2 2 2 2

Assim, se for usada a solução antissimétrica, da Eq. (4.162) decorre que:

en ( X )† = − An,2 (Y; xn )† − A′n (Y; xn ) = An,2 (Y; xn ) − A′n (Y; xn ) = Tn ( X )


T , (4.168)

que é a tese do teorema. ■

Devido ao Teorema 4.6, poder-se-ia relegar a condição da unitariedade a uma consequên-


cia do procedimento indutivo. Porém, se assim fosse feito, não teriamos motivos para exigir
que o primeiro termo satisfaça à Eq. (4.32), nem para considerar especialmente a solução
antissimétrica ao problema da divisão: O axioma da unitariedade tem importância per se na
construção de uma teoria com significado físico. Adicionalmente, o fato de que a parte antis-
simétrica das soluções gerais ao problema da divisão seja também uma solução significa que
a dita antissimetria somente pode ser destruída por termos instantâneos; em outras palavras,
o procedimento de levar a solução arbitrária à solução antissimétrica é um procedimento de
normalização em que a unitariedade é exigida como condição física adicional.

Mais ainda, pela construção mostrada na prova do Teorema 4.6, a unitariedade é compa-
114 Capítulo 4. Teoria de perturbação causal no plano nulo

tível com as condições de covariância de Lorentz e preservação da ordem singular, o que


pode ser compreendido simplesmente tomando, no procedimento anterior, Rn,1 e An,1 como
as distribuições obtidas após a imposição das outras condições, as quais, evidentemente, não
são perdidas no procedimento subsequente.
Como resultado da análise até aqui feita, pode-se afirmar que na dinâmica da frente de
luz existe uma solução bem definida aos axiomas de Bogoliubov, Medvedev e Polivanov.

4.9 Fatorização de polinômios na distribuição causal


Embora as fórmulas de divisão da distribuição causal possam parecer de difícil imple-
mentação prática, uma simplificação muito importante dos cálculos pode obter-se de um
resultado geral que se segue das mesmas, e que será motivo de discussão na presente se-
ção, estabelecendo de passo o método de cálculo que usaremos nos capítulos seguintes. O
mencionado resultado, inspirado na técnica conhecida como «regularização diferencial» –
introduzida por Freedman na Ref. [181]–, é o seguinte.

Teorema 4.7: Para qualquer polinômio P( p), se r̂1 ( p) é uma distribuição retardada correspon-
dente à distribuição causal dˆ1 ( p), então P( p)r̂1 ( p) o é em relação à distribuição dˆ( p) = P( p)dˆ1 ( p).

Prova: Sem perda de generalidade, pode-se considerar o caso em que P( p) é um monômio,


pois as fórmulas de divisão da distribuição causal são lineares nessa. Seja, pois:

dˆ( p) = ( p2 )n dˆ1 ( p) ; n∈N . (4.169)

A prova do teorema recém enunciado se simplifica notavelmente realizando uma rotação


no espaço Rm de tal sorte que se tenha p = (( p+ ; 0⊥ ; p− ); 0 · · · ; 0). Nestas coordenadas, a
distribuição da Eq. (4.169) adota a forma:

dˆ( p+ ; 0⊥ ; p− ) = 2n pn− pn+ dˆ1 ( p+ ; 0⊥ ; p− ) . (4.170)

Mas no processo de divisão a variável p− não intervém, então para essa operação pode
considerar-se o fator pn− como uma constante; como consequência, não leva a nenhuma
perda de generalidade considerar distribuições causais da forma:

dˆ( p+ ) = pn+ dˆ1 ( p+ ) , (4.171)

em que usa-se a notação dˆ( p+ ) ≡ dˆ( p+ ; 0⊥ ; p− ). Suponhamos agora que a ordem singular
de dˆ1 ( p+ ) é ω 1 , então a ordem singular da distribuição completa dˆ( p+ ) é:

1
ω− = ω− +n . (4.172)

Tem de ser distinguidos três casos, pois as fórmulas de divisão para ordem singular negativa
e não-negativa são diferentes.
Capítulo 4. Teoria de perturbação causal no plano nulo 115

1 < 0 e ω < 0: Nesse caso a distribuição retardada é dada por:


(1) ω− −

i dk
Z
r̂ ( p+ ) = ( p+ − k)n dˆ1 ( p+ − k)
2π k + i0+
n
1 dk n!(−1)l n−l l ˆ
Z
=
2π ∑ p k d1 ( p + − k )
k + i0+ l =0 l!(n − l )! +
. (4.173)

Separando na soma o termo com l = 0:

n
i dk ˆ n!(−1)l n−l i
Z Z
r̂ ( p+ ) = pn+
2π k + i0+
d 1 ( p + − k ) + ∑ l!(n − l )! p+ 2π dkkl −1 dˆ1 ( p+ − k ) . (4.174)
l =1

O primeiro termo nessa equação é pn+ r̂1 ( p+ ). Efetuando, nas integrais dentro da soma, a
mudança de variável p+ − k = −q:

l −1
( l − 1) !
k l −1 = ∑ u! ( l − 1 − u ) !
l −1− u u
p+ q , (4.175)
u =0

com o qual, finalmente:

n l −1
n!(l − 1)!(−1)l i
Z
r̂ ( p+ ) = pn+ r̂1 ( p+ ) + ∑ ∑ l!(n − l )!u!(l − 1 − u)! p+n−1−u 2π dqqu dˆ1 (−q) . (4.176)
l =1 u =0

Agora todas as integrais dentro da soma são independentes de p+ –elas são, ao máximo,
distribuições da variável p− –. Portanto, todos os termos na soma têm a forma de termos de
normalização, os quais, então, podem ser escolhidos de forma a cancelá-los, do qual segue
que pn r̂1 ( p+ ) é uma solução ao problema da divisão de dˆ( p+ ).
+

(2) ω11 < 0 e ω− ≥ 0: Nesse caso a divisão é feita segundo a fórmula:


( )
⌊ω− ⌋+n
i dk (−1)l l l h
Z i
r̂ ( p) =
2π k + i0+
( p+ − k) dˆ1 ( p+ − k) −
n
∑ l!
p+ Dk (−k )n dˆ1 (−k ) .
l =0
(4.177)

No primeiro termo usa-se a fórmula do binômio de Newton para escrever:

n
n!
( p+ − k )n = ∑ u! ( n − u ) !
pu+ (−k )n−u , (4.178)
u =0

enquanto que a fórmula de Leibniz pode ser usada para calcular a derivada requerida:

l
h i l!(−1)n  
Dkl (−k )n dˆ1 (−k ) = ∑ ( D u n
k ) D l −u ˆ
k d 1 (− k ) . (4.179)
u=0 u! ( l − u ) !

Entretanto:

n!
Du kn = k a−u para u≤n ; Du kn = 0 para u>n . (4.180)
( a − u)!
116 Capítulo 4. Teoria de perturbação causal no plano nulo

Substituindo as Eqs. (4.178)-(4.180) na (4.177) chega-se a:


(
n
i dk n!
Z
r̂ ( p+ ) =
2π k + i0+ ∑ u! ( n − u ) !
pu+ (−k )n−u dˆ1 ( p+ − k )
u =0
1 ⌋+ n
⌊ ω−
)
min{l;n}
n!
− ∑ (−1)n+l pl+ ∑ u!(l − u)!(n − u)!
kn−u Dkl −u dˆ1 (−k ) . (4.181)
l =0 u =0

1 < 0, a soma sobre l termina em ⌊ ω 1 ⌋ + n < n, então min l; n = l; também,


Desde que ω− − { }
separando o termo com u = n na primeira soma da Eq. (4.181):

i dk ˆ
Z
r̂ ( p+ ) = pn+ d1 ( p + − k )
2π k + i0+
(
n −1
i dk n!
Z
+
2π k + i0 + ∑ u! ( n − u ) !
pu+ (−k )n−u dˆ1 ( p+ − k )
u =0
1 ⌋+ n
⌊ ω−
)
l
n!
− ∑ (−1)n+l pl+ ∑
u! ( l − u ) ! ( n − u ) !
kn−u Dkl −u dˆ1 (−k) . (4.182)
l =0 u =0

O primeiro termo é reconhecido como sendo pn+ r̂1 ( p+ ), pois ω−


1 < 0. Por outro lado, nas

somas entre as chaves todos os termos contêm potências não nulas de k, pois nessas somas é
u < n; assim, o denominador k + i0+ é cancelado na integral da segunda linha:
(
n −1
i n!(−1)n−u u n−u−1 ˆ
Z
r̂ ( p+ ) = pn+ r̂1 ( p+ ) + dk ∑ p+ k d1 ( p + − k )
2π u=0 u! ( n − u ) !
1 ⌋+ n
⌊ ω−
)
l
n!
− ∑ (−1)n+l pl+ ∑
u! ( l − u ) ! ( n − u ) !
kn−u−1 Dkl −u dˆ1 (−k ) . (4.183)
l =0 u =0

Fazendo a mudança de variável k = p+ + q na primeira soma, pode-se escrever:

n − u −1
( n − u − 1) !
k n − u −1 = ∑ p n − u −1− l q l
l!(n − u − 1 − l )! +
, (4.184)
l =0

de modo que obtemos, finalmente:

n −1 n − u −1
n!(n − u − 1)!(−1)n−u n −1− l i
Z
r̂ ( p+ ) = pn+ r̂1 ( p+ ) + ∑ ∑ u!(n − u)!l!(n − u − 1 − l )!
p+

dqql dˆ1 (−q)
u =0 l =0
1 ⌋+ n
⌊ ω− l
n! i
Z
− ∑ (−1)n+l pl+ ∑ u!(l − u)!(n − u)! 2π dkkn−u−1 Dkl −u dˆ1 (−k ) . (4.185)
l =0 u =0

Como no caso (1), todas as integrais nas somas são distribuições da variável p− só, e têm,
como consequência, a forma de termos de normalização: A distribuição pn+ r̂1 ( p+ ) é uma
distribuição retardada para dˆ( p+ ).

1 ≥ 0 e ω ≥ 0: Para estudar esse último caso, voltemos à Eq. (4.181). Agora é


(3) ω− −
Capítulo 4. Teoria de perturbação causal no plano nulo 117

1 ⌋ + n ≥ n, de forma que pode-se separar a soma sobre l em duas partes, a uma desde
⌊ ω−
l = 0 até l = n − 1, em que min {l; n} = l, e a outra desde l = n até l = ⌊ω−1 ⌋ + n, em que

min {l; n} = n; nessa última parte, além disso, é útil redefinir o índice da soma segundo:
l → l − n. Se adicionalmente separa-se o termo com u = n na primeira soma da Eq. (4.181),
chegar-se-á à seguinte expressão:
(
n −1
i dk n!(−1)n−u u n−u ˆ
Z
r̂ ( p+ ) =
k + i0+
pn+ dˆ1 ( p+ − k ) + ∑ p+ k d1 ( p + − k )
2π u=0 u! ( n − u ) !
1 ⌋
⌊ ω− n
n!
− ∑ (−1)l pl++n ∑
u! ( l + n − u ) ! ( n − u ) !
kn−u Dkl +n−u dˆ1 (−k )
l =0 u =0
)
n −1 l
n!
− ∑ (−1)n−l pl+ ∑ kn−u Dkl −u dˆ1 (−k ) . (4.186)
l =0 u =0 u! ( l − u ) ! ( n − u ) !

Na soma da primeira linha aplicamos a mudança de variável k = p+ + q e usamos a fórmula


do binômio de Newton como o temos feito nos casos anteriores. Também, na soma da
segunda linha separamos o termo com u = n e o agrupamos com o primeiro termo da
primeira linha. Obtemos:
 
⌊ ω−1 ⌋
p l
i dk  ˆ
Z 
r̂ ( p+ ) = pn+
2π k + i0+ 
d (
1 +p − k ) − ∑ (− 1 ) l + l ˆ
D
l! k
d 1 (− k )
l =0

n −1 n − u −1
n!(n − u − 1)!(−1)n−u i
Z
+ ∑ ∑ u!l!(n − u)!(n − u − 1 − l )!
pn+−l −1

dqql dˆ1 (−q)
u =0 l =0
1 ⌋
⌊ ω− n −1
n! i
Z
− ∑ (−1)l pl++n ∑ u!(l + n − u)!(n − u)! 2π dkkn−u Dkl +n−u dˆ1 (−k )
l =0 u =0
)
n −1 l
n! i
Z
− ∑ (−1)n−l pl+ ∑ dkkn−u Dkl −u dˆ1 (−k ) . (4.187)
l =0 u=0 u! ( l − u ) ! ( n − u ) ! 2π

Na primeira linha da Eq. (4.187) reconhece-se a fórmula de divisão de dˆ1 ( p+ ), a qual tem
1 ≥ 0, então dita linha é exatamente pn r̂ ( p ). As outras linhas contêm so-
ordem singular ω− + 1 +
mente termos de normalização. Sendo este o último caso, concluímos que uma distribuição re-
tardada de dˆ( p+ ) pode sempre ser obtida por divisão de dˆ1 ( p+ ), quod erat demonstrandum. ■

O Teorema 4.7 é conveniente para propósitos práticos porque, sendo suficiente efetuar a
divisão de dˆ1 ( p+ ) –menos singular que dˆ( p+ ), segundo a Eq. (4.172)–, um menor número
de subtrações precisa ser calculado.

4.10 Propagadores de Feynman dos campos quantizados livres

Finalizamos este capítulo com a aplicação das fórmulas de divisão obtidas para a ob-
tenção da parte retardada das distribuições de (anti-)comutação dos operadores de campo
118 Capítulo 4. Teoria de perturbação causal no plano nulo

quantizado escalar, fermiônico e vetorial sem massa, primeiro, e os correspondentes propa-


gadores de Feynman depois. Essas distribuições de (anti-)comutação foram obtidas no Cap.
3 [vide as Eqs. (3.89), (3.139) e (3.153), respectivamente], e serão de utilidade nas aplicações
que estudaremos nos seguintes capítulos.

(1) Campo escalar. A distribuição de comutação do operador de campo escalar quantizado


livre é:
b ( p) = i sgn ( p− ) δ( p2 − m2 )
D . (4.188)

Utilizando a definição que contém à Eq. (4.122) é fácil corroborar que a ordem singular dessa
distribuição é ω− = −2 < 0, então a fórmula da Eq. (4.130) deve ser usada para obter sua
parte retardada; considerando também a Eq. (4.131):

dkdq
Z  
b bret ( p) = −(2π )−5/2
D b̂ ( p − − q ) sgn ( q ) δ 2p + q − 2kq − ω 2
p . (4.189)
k + i0+

Efetuando a mudança s = −2kq, encontra-se:

b̂( p− − q)
Z
b bret ( p) = (2π )−5/2
D δ(s + 2p+ q − ω 2p )dsdq
s − iq0+
b̂( p− − q)dq
Z
= −(2π )−5/2
2p+ q − p2⊥ − m2 + iq0+
b→1 1
−−−→ −(2π )−2 2 . (4.190)
p − m + ip− 0+
2

Por outro lado, a parte de frequência negativa da distribuição de comutação do campo


escalar é, no espaço dos momentos:

b − ( p) = − i Θ (− p− ) δ( p2 − m2 )
D , (4.191)

de forma que, usando a formula de Sokhotskiy [175], o propagador de Feynman do campo


escalar será:
b F ( p) := D b − ( p) = −(2π )−2
b ret ( p) − D 1
D . (4.192)
p2 − m2 + i0+
Esse resultado é igual àquele obtido na dinâmica instantânea.

(2) Campo fermiônico. A distribuição de anti-comutação do campo fermiônico tem a


expressão seguinte:
i
Sb( p) = ( p + m)sgn ( p− ) δ( p2 − m2 ) . (4.193)
2π /
Essa distribuição tem a ordem singular ω− = −1 < 0. Para sua divisão a substituímos pela
distribuição causal auxiliar:
Z
Sbb ( p) = i (2π )−3/2 dqb̂( p− − q)( p+ γ+ + qγ− + p⊥ γ⊥ + m)sgn(q)δ(2p+ q − ω 2p ) ,
(4.194)
Capítulo 4. Teoria de perturbação causal no plano nulo 119

cuja parte retardada é dada por:

dkdq
Z h i
Sbbret ( p) = − (2π )−5/2 b̂ ( p − − q ) ( p + − k ) γ +
+ p ⊥ γ ⊥
+ qγ −
+ m
k + i0+
× sgn(q)δ(2p+ q − 2kq − ω 2p ) . (4.195)

Como outrora, usar-se-á a variável s = −2kq, em função da qual a integral anterior é igual a:

dsdq
Z
Sbbret ( p) = (2π )−5/2 b̂( p− − q)δ(s + 2p+ q − ω 2p )
s − iq0+
 
+ ⊥ − s +
× p+ γ + p⊥ γ + qγ + m + γ
2q
2p+ q − ω 2p
p − ( p−
/ − q)γ− +m− γ+
2q
Z
−5/2
= −(2π ) dqb̂( p− − q)
2p+ q − ω 2p + iq0+

p − ( p− − q)γ− + m γ+
Z  
−5/2 /
= −(2π ) dqb̂( p− − q) −
p2 − m2 − 2p+ ( p− − q) + iq0+ 2q

p+m + 
b→1 / γ
−−−→ −(2π )−2 2 2 +
− . (4.196)
p − m + ip− 0 2p−

Finalmente, desde que a parte de frequência negativa da distribuição de anti-comutação do


campo de Dirac é igual a

i
Sb− ( p) = − Θ (− p− ) (/
p + m ) δ ( p2 − m2 ) , (4.197)

o propagador de Feynman fermiônico será:

γ+
 
bF bret −2 p+m
/
S ( p) := Sb− ( p) − S ( p) = (2π ) − . (4.198)
p2 − m2 + i0+ 2p−

Observa-se que no processo de divisão da distribuição causal, a distribuição retardada ad-


quire um termo instantâneo, que é herdado pelo propagador de Feynman, e que é conhecido
na literatura do plano nulo já desde o trabalho de Kogut e Soper [21].

(3) Campo vetorial sem massa. A distribuição de comutação a ser dividida é:


 
i 2 p a ηb + η a p b
Dab ( p) =
b sgn ( p− ) δ( p ) gab − . (4.199)
2π p−

Algumas de suas componentes têm ordem singular ω− = −2, enquanto que outras, ω− =
−1. Em qualquer caso, a ordem singular é negativa, e a distribuição retardada deve ser obtida
pelo uso da Eq. (4.130). Para fazer a divisão é conveniente definir as seguintes distribuições:

i i pa
dˆ1 ( p) := sgn ( p− ) δ( p2 ) , dˆ2a ( p) := sgn ( p− ) δ( p2 ) ; (4.200)
2π 2π p−
120 Capítulo 4. Teoria de perturbação causal no plano nulo

em função das quais a distribuição de comutação do campo vetorial sem massa se escreve:
h i
b ab ( p) = gab dˆ1 ( p) − dˆ2a ( p)ηb + ηa dˆ2b ( p)
D . (4.201)

b ab se reduz a calcular as partes retardadas de dˆ1 e dˆ2a , com


Então obter a parte retardada de D
o uso da Eq. (4.130). Encontra-se –como nos outros casos, usa-se a variável s = −2kq–:

dkdq
Z
−5/2
r̂1,b ( p) = −(2π ) b̂( p− − q)sgn(q)δ(2p+ q − 2kq − p2⊥ )
k + i0+
dsdq
Z
= (2π )−5/2 b̂( p− − q)δ(s + 2p+ q − p2⊥ )
s − iq0+
dqb̂( p− − q)
Z
= −(2π )−5/2
2p+ q − p2⊥ + iq0+
b→1 1
−−−→ −(2π )−2 2 . (4.202)
p + ip− 0+

Analogamente:

dkdq 1
Z
r̂2{+;α;−},b ( p) = −(2π )−5/2 b̂( p− − q)sgn(q)δ(2p+ q − 2kq − p2⊥ ) { p+ − k; pα ; q}
k + i0+ q
 
dsdq 2 1 s
Z
−5/2
= (2π ) b̂( p− − q)δ(s + 2p+ q − p⊥ ) p+ + ; pα ; q
s − iq0+ q 2q
( )
2
dqb̂( p− − q) p+ 2p+ q − p⊥ pα
Z
−5/2
= −(2π ) − ; ;1
2p+ q − p2⊥ + iq0+ q 2q2 q
p2 p α
 
b→1 1 p+
−−−→ −(2π )−2 2 − ; ;1 . (4.203)
p + ip− 0+ p− 2p2− p−

As Eqs. (4.201)-(4.203) implicam que a parte retardada da distribuição de comutação do


campo vetorial sem massa é [vide a Eq. (4.201)]:

(2π )−2 p2
 
b ret ( p) = − p a ηb + η a p b
D ab gab − + 2 [δa+ ηb + ηa δb+ ] . (4.204)
p2 + ip− 0+ p− 2p−

Mas δa+ são precisamente as componentes de ηa , donde:

(2π )−2 p2
 
b ret ( p) = − p a ηb + η a p b
D ab gab − + 2 η a ηb . (4.205)
p2 + ip− 0+ p− p−

Subtraindo a parte de frequência negativa da distribuição de comutação, que no caso é


 
i p a ηb + η a p b
Dab− ( p) = − Θ(− p− )δ( p ) gab −
b 2
, (4.206)
2π p−

obtém-se o propagador de Feynman do campo da radiação:

−2 
p2

b F ( p) = − (2π )
D gab −
p a ηb + η a p b
+ 2 η a ηb . (4.207)
ab
p2 + i0+ p− p−
Capítulo 4. Teoria de perturbação causal no plano nulo 121

Outra vez, obtivemos uma parte instantânea no processo da divisão da distribuição causal.
O resultado encontrado é conhecido na literatura como o «propagador de gauge duplamente
transversal», nome esse dado porque Db F ( p) é transversal tanto a p a como a η a [25, 26, 182],
ab
e ao que chegamos aqui de forma natural.
Observamos, finalmente, que as ordens singulares das distribuições retardadas obtidas
são as mesmas que as correspondentes às distribuições causais das quais elas provêm, exceto
pelos termos instantâneos obtidos nos casos fermiônico e vetorial, que em ambos casos têm
ordem singular nula. Presentemente, não existem argumentos para modificar esses termos
instantâneos, pois as condições físicas do processo de normalização devem ser impostas às
distribuições de transição T; os propagadores não são observáveis físicos. É mister então
voltar-nos ao estudo de processos reais.
Capítulo 5

Modelo de Yukawa

O primeiro modelo a que aplicaremos nossas conclusões no que se refere à TPC no plano
nulo será o modelo de Yukawa. Este foi inicialmente proposto para descrever a interação
entre mésons (partículas bosônicas, quer escalares, quer pseudo-escalares) e núcleons (férmi-
ons considerados «elementais» para os fins dessa teoria), os quais experimentam as forças
nucleares de curto alcance que mantêm os prótons e néutrons juntos no núcleo do átomo. A
história do seu desenvolvimento é narrada nas Refs. [183, 184, 185, 186]. O primeiro passo
foi dado por Heisenberg, que propôs considerar prótons e néutrons como dois estados de
uma mesma e só partícula, chamada «núcleon»; tais estados se diferenciavam em sua teoria
por uma propriedade interna a que se deu o nome de «iso-spin». Clássicamente, em 1935
Yukawa [189] observou que um potencial de curto alcance, da forma

e−κ r
φ∼ , (5.1)
r

pode ser obtido como a solução estática e esféricamente simétrica da equação (□ + κ 2 ) φ = 0.


Ainda mais, da informação experimental ele conseguiu estimar o valor do parâmetro κ ∼
5 × 10−12 cm−1 . A equação de potencial de Yukawa, reconhece-se, não é senão a equação de
Klein-Gordon-Fock em que o parâmetro κ identifica-se com a massa da partícula por ela
descrita: κ = mc/h̄, donde a partícula de Yukawa, a que ele deu o nome de «U-quantum»
ou também «heavy quantum», teria massa aproximada de m ≈ 200 me , com me a massa do
elétron. Analogamente à interação eletromagnética, cuja origem quântica se encontra no
«intercâmbio» de fótons entre partículas carregadas, Yukawa propôs que a interação entre
núcleons fosse o resultado de certas combinações dos processos virtuais N ↔ N ′ + π, com
N, N ′ núcleons e π o méson de Yukawa. Ele propôs o acoplamento:

Hint ∼ NNπ . (5.2)

Assumindo este como válido, a conservação do momento angular implica que o spin do
U-quantum deve ser inteiro, e a partícula, portanto, bosônica, mas não estava claro se o spin
seria zero ou um. O seguinte passo no desenvolvimento do modelo foi dado por Kemmer
em 1938 [190], que estabeleceu a independência da carga das interações nucleares, isto é, que
o potencial nuclear é independente dos tipos de núcleon considerados: Vpp = Vnn = Vnp . O
argumento de Wick [191] para estimar o alcance dessa interação usando as desigualdades de
Heisenberg implica que não há somente mésons carregados –necessários para a explicação
da desintegração nuclear–, mas também há um méson neutro, pois sem ele o alcance do

122
Capítulo 5. Modelo de Yukawa 123

potencial entre dois núcleons iguais seria por volta da metade daquele existente entre
núcleons diferentes, violando a independência da carga. Semelhante teoria com três mésons
recebeu o nome de «teoria simétrica». Foi também Kemmer [192] que apontou para a
possibilidade dos mésons de Yukawa serem pseudo-escalares; a teoria assim construída se
mostrava mais simples para o tratamento do momento magnético anômalo dos núcleons
[183]. Experimentalmente, as partículas de Yukawa foram primeiro procuradas nos raios
cósmicos. Após uma confusão com o assim chamado «méson µ» –que posteriormente
identificou-se como sendo um férmion–, foi finalmente descoberto que os U-quanta são as
partículas às que hoje se denomina píons: π + , π − e π 0 .
O modelo de Yukawa assim completado pode já ser matematicamente inscrito no forma-
lismo do iso-spin [100, 183]: Os núcleons constituem um dubleto de espinores sob rotações
no espaço de iso-spin, Ψ, enquanto que os píons formam um tripleto no mesmo, π. As rota-
ções no espaço de iso-spin no caso bi-dimensional são geradas pelas matrizes de Pauli τ1 , τ2
e τ3 . Portanto, a densidade lagrangiana de interação, invariante sob rotações no espaço de
iso-spin, é1
L = ig : Ψγ5 τΨ · π : . (5.3)

Por simplicidade, considerar-se-á neste trabalho o denominado «modelo neutro»2 :

L = ig : ψγ5 ψφ : , (5.4)

com ψ e ψ espinores de quatro componentes, e φ um campo pseudo-escalar real de uma


só componente. Como dito na Ref. [100], este modelo simplificado mantém os elementos
principais daquele mais geral.
É útil mencionar, por outro lado, que na literatura na dinâmica da frente de luz é comum
encontrar análises do modelo neutro em que a matriz γ5 é substituída pela matriz unidade,
1, sob o mesmo nome de «modelo de Yukawa»; obviamente, em tais estudos o méson é
escalar mais bem que pseudo-escalar –vide, por exemplo, as Refs. [14, 145, 146]–. Semelhante
escolha se justifica pelo aparecimento do acoplamento de Yukawa no modelo padrão da física
das partículas como a interação responsável pelas massas dos férmions. Além disso, ela vem
sendo estudada nos laboratórios: o acoplamento de Yukawa entre o lépton lτ e o bóson de
Higgs H é estudado na busca por violações CP no acoplamento entre as partículas de Higgs
e os férmions, acessíveis ao experimento por colisões próton-próton [193]. Este acoplamento
é decomposto em duas partes, uma delas par frente à transformação CP, a outra ímpar:

L ∼ H (κlτ lτ lτ + κelτ lτ iγ5 lτ ) ;

e o «ângulo de mistura efetivo» ϕlτ lτ = tan−1 (κelτ /κlτ ) é medido, com resultado ao redor
de 4 ± 17◦ . Adicionalmente, acoplamentos de Yukawa tri-dimensionais não-massivos a
temperatura finita têm sido estudados recentemente por Benghi [194]; particularmente, os

1 Usamos como definição: γ5 := iγ0 γ1 γ2 γ3


2 Este tem sido estudado também por Chang e Yan nas Refs. [27, 28] usando o método funcional de Schwinger.
124 Capítulo 5. Modelo de Yukawa

modelos de Gross-Neveau-Yukawa e Nambu–Jona-Lasinio–Yukawa.


No capítulo presente estudaremos o modelo de Yukawa neutro com densidade lagrangi-
ana de interação:
(
1 ; se φ é escalar
Lψφ = −g : ψΓψ : φ ; Γ= , (5.5)
iγ5 ; se φ é pseudo-escalar

com g a constante de acoplamento da teoria. A teoria assim construída, é claro, é invariante


sob as transformações discretas de paridade3 e conjugação de carga4 –e, de acordo ao teorema
CPT (vide, por exemplo, a Ref. [88]), também o é sob transformações de reversão temporal–.

5.1 Distribuição causal da segunda ordem


Na linha com o exposto, estudaremos a interação entre o campo neutro de spin zero φ
com massa m2 e o campo fermiônico ψ com massa m1 , tomando a distribuição de transição
da primeira ordem, T1 ( x ), como sendo:

T1 ( x ) = −ig : ψ( x )Γψ( x ) : φ( x ) . (5.8)

A condição da unitariedade do operador de espalhamento à primeira ordem implica que a


constante g seja real.
Como estabelecido na exposição da teoria geral, a construção dos seguintes termos na
série perturbativa é indutiva. Para a distribuição de dois pontos (da segunda ordem) precisa-
se encontrar a distribuição causal da segunda ordem, que é igual a:

D2 ( x1 ; x2 ) = R2′ ( x1 ; x2 ) − A2′ ( x1 ; x2 ) , (5.9)

com:
A2′ ( x1 ; x2 ) = T
e1 ( x1 ) T1 ( x2 ) e R2′ ( x1 ; x2 ) = T1 ( x2 ) T
e1 ( x1 ) . (5.10)

e1 ( x ) = − T1 ( x ) e a Eq. (5.8) chega-se a:


Usando que T

A2′ ( x1 ; x2 ) = g2 : ψ( x1 )Γψ( x1 ) : : ψ( x2 )Γψ( x2 ) : φ( x1 ) φ( x2 ) ; R2′ ( x1 ; x2 ) = A2′ ( x2 ; x1 ) .


(5.11)

3 No caso quântico, a transformação de paridade é implementada através de um operador linear e unitário


UP que age sobre os operadores de campo dos campos quantizados segundo [107]:

U P ψ ( x ′ )U− 1 0 ′ −1 † ′ −1
P = iγ ψ ( x ) , U P ψ ( x )U P = −iψ ( x ) , U P φ ( x )U P = ϵφ ( x ) . (5.6)

Aqui, ϵ = +1 se φ é um campo escalar e ϵ = −1 se ele é pseudo-escalar. Ademais, x ′ = Px, com P denotando a


transformação de paridade.
4 Esta transformação é realizada pelo operador linear e unitário U , que age nos operadores de campo
C
segundo:
−1
UC ψ ( x ) UC = Cψ( x )T , UC ψ( x )UC−1 = −ψ( x )T C −1 , UC φ( x )UC−1 = φ( x ) . (5.7)
Nessas equações, C é uma matriz unitária (C † C = 1) com as seguintes propriedades: C T = −C, C −1 γµ C =
−γµT .
Capítulo 5. Modelo de Yukawa 125

Estas distribuições são levadas a sua forma normalmente ordenada por aplicação do teorema
de Wick, com as seguintes contrações de Wick:

ψ a ( x )ψb (y) = −iSab+ ( x − y) , ψ a ( x )ψb (y) = −iSba− (y − x ) , (5.12)

φ( x ) φ(y) = −iD+ ( x − y) . (5.13)

Recordamos que as distribuições D e S estão associadas às massas m2 e m1 , respectivamente.


Encontra-se que (usamos a coordenada relativa y := x1 − x2 ):

A2′ ( x1 ; x2 ) = g2: ψ( x1 )Γψ( x1 )ψ( x2 )Γψ( x2 ) : +i : ψ( x2 )ΓS− (−y)Γψ( x1 ) :




−i : ψ( x1 )ΓS+ (y)Γψ( x2 ) : −Tr [S− (−y)ΓS+ (y)Γ] [ : φ( x1 ) φ( x2 ) : −iD+ (y)]



, (5.14)

R2′ ( x1 ; x2 ) = g2
: ψ( x1 )Γψ( x1 )ψ( x2 )Γψ( x2 ) : +i : ψ( x1 )ΓS− (y)Γψ( x2 ) :


−i : ψ( x2 )ΓS+ (−y)Γψ( x1 ) : −Tr [S− (y)ΓS+ (−y)Γ] [ : φ( x1 ) φ( x2 ) : −iD+ (−y)]



.
(5.15)

Portanto, substituindo na Eq. (5.9), agrupando termos e usando que D+ (−y) = − D− (y),
obtém-se a distribuição causal da segunda ordem:
 
( NN ) ( MN ) ( M) (N) (V )
D2 ( x1 ; x2 ) = D2 + D2 + D2 + D2 + D2 ( x1 ; x2 ) , (5.16)

com
( NN )
D2 ( x1 ; x2 ) = ig2 : ψ( x1 )Γψ( x1 )ψ( x2 )Γψ( x2 ) : D (y) (5.17)

que descreve o espalhamento de dois núcleons,

( MN )
( x1 ; x2 ) =ig2 : ψ( x1 )ΓS(y)Γψ( x2 ) : − : ψ( x2 )ΓS(−y)Γψ( x1 ) :

D2 : φ ( x1 ) φ ( x2 ) :
(5.18)

que descreve o espalhamento de um méson por um núcleon, e

( M)
D2 ( x1 ; x2 ) = −g2 : φ( x1 ) φ( x2 ) : Tr [S− (y)ΓS+ (−y)Γ − S− (−y)ΓS+ (y)Γ] , (5.19)

(N)
D2 ( x1 ; x2 ) =g2 : ψ( x1 )Γ (S+ (y) D+ (y) − S− (y) D− (y)) Γψ( x2 ) :
− g2 : ψ( x2 )Γ (S+ (−y) D+ (−y) − S− (−y) D− (−y)) Γψ( x1 ) : (5.20)

descrevendo a auto-energia do méson e a do núcleon, respectivamente. Finalmente,

(V )
D2 ( x1 ; x2 ) = −ig2 Tr [S− (y)ΓS+ (−y)ΓD− (y) + S− (−y)ΓS+ (y)ΓD+ (y)] (5.21)

não representa processo físico nenhum, pois não contém em sua expressão operadores de
campo assintoticamente livres.
126 Capítulo 5. Modelo de Yukawa

5.2 Espalhamento de um férmion por um bóson

O espalhamento de um férmion por um bóson à segunda ordem é representada pela


distribuição causal da Eq. (5.18):

( MN )
( x1 ; x2 ) =ig2 : ψ( x1 )ΓS(y)Γψ( x2 ) : − : ψ( x2 )ΓS(−y)Γψ( x1 ) :

D2 : φ ( x1 ) φ ( x2 ) : .
(5.22)

As distribuições numéricas que aqui aparecem são, no espaço real:

d(y) := ig2 ΓS(y)Γ e − d(−y) , (5.23)

e no espaço dos momentos:

dˆ( p) := ig2 ΓSb( p)Γ e − dˆ(− p) , (5.24)

com Sb( p) dado na Eq. (4.193). Essa distribuição tem a ordem singular ω− = −1 < 0, a qual
não é alterada pela multiplicação pela matriz constante Γ. Em consequência, a distribuição
retardada é simplesmente Sbret ( p), e a distribuição numérica da segunda ordem é:

t̂( p) = r̂ ( p) − r̂ ′ ( p) = −ig2 ΓSbF ( p)Γ , (5.25)

com SbF ( p) dado pela Eq. (4.198):

γ+
 
p+m
/
SbF ( p) = (2π )−2 − . (5.26)
p2 − m2 + i0+ 2p−

Introduzindo a Eq. (5.26) na Eq. (5.25) e usando que Γγ+ = ϵγ+ Γ, com ϵ = 1 se Γ = 1 (φ
escalar) e ϵ = −1 se Γ = γ5 (φ pseudo-escalar), assim como que Γ2 = ϵ:

p+m +
/ −2 2 γ
t̂( p) = −i (2π )−2 g2 Γ Γ + i ( 2π ) g + Cb ( p− ) , (5.27)
p2 − m2 + i0+ 2p−

b ( p− ) uma distribuição de normalização com ordem singular ω− = 0 no eixo x − . A


com C
exigência da invariância de Lorentz requer a seguinte escolha:

+
b ( p− ) = −i (2π )−2 g2 γ
C , (5.28)
2p−

pois com ela o termo instantâneo da distribuição de transição cancela-se. A contribuição


deste termo ao operador de espalhamento da segunda ordem é, no limite adiabático:

1 γ+
Z
d 4 x 1 d 4 x 2 : φ ( x 1 ) ψ ( x 1 ) g2 δ ( y ) φ ( x2 ) ψ ( x2 ) :
2 2∂−
γ+
Z
= d 4 x 1 : φ ( x 1 ) ψ ( x 1 ) g2 φ ( x1 ) ψ ( x1 ) : , (5.29)
4∂−
Capítulo 5. Modelo de Yukawa 127

com a derivada inversa definida segundo [13]:

1 1
Z
f ( x− ) := dy− sgn( x − − y− ) f (y− ) .
∂− 2

Isto é, o termo de interação instantânea na densidade lagrangiana do formalismo padrão


–vide as Refs. [28, 195]– é gerado como um termo de normalização na TPC no plano nulo
após exigir a invariância de Lorentz. O mesmo acontece quando se considera o termo com
−t̂(− p), de forma que a contribuição total dos termos de normalização é:

γ+
Z
d 4 x 1 : φ ( x 1 ) ψ ( x 1 ) g2 φ ( x1 ) ψ ( x1 ) : . (5.30)
2∂−

Substituindo a Eq. (5.28) na (5.27), também, observa-se que a parte numérica da distribuição
( MN )
de dois pontos T2 é a mesma que a da dinâmica instantânea [132], o que estabelece a
equivalência das duas formas dinâmicas para este processo.

5.3 Auto-energia do méson


Nesta seção estudaremos a auto-energia do méson, focando a atenção na teoria em que
este é pseudo-escalar. Assim sendo, Γ = iγ5 , e a distribuição de um ponto é:

T1 ( x ) = g : ψ( x )γ5 ψ( x ) : φ( x ) . (5.31)

A distribuição causal da segunda ordem correspondente pode-se escrever como –vide a Eq.
(5.19)–:
( M)
D2 ( x1 ; x2 ) = : φ ( x1 ) d ( y ) φ ( x2 ) : , (5.32)

com as seguintes definições:

P(y) := −g2 Tr S+ (y)γ5 S− (−y)γ5


 
d(y) := P(y) − P(−y) e . (5.33)

Para ir ao espaço dos momentos, aplica-se a P(y) a transformação de Fourier; obtém-se:


Z h i
Pb(q) = −(2π )−2 g2 d4 pTr Sb+ ( p)γ5 Sb− ( p − q)γ5
Z
−2 2
d4 pTr (/
p + m1 ) γ5 ( / q + m1 ) γ5 D
 
= −(2π ) g p−/ b − ( p − q)
b + ( p) D . (5.34)

Usando que γµ γ5 = −γ5 γµ , o traço na Eq. (5.34) é:

p + m1 ) γ5 ( / q + m1 )γ5 = 4 m21 − p2 + pq
  
Tr (/ p−/ , (5.35)

b ± ( p) = ±i (2π )−1 Θ (± p− ) δ( p2 − m2 ):
de forma que, lembrando que D 1

−4g 2 Z
d4 p m21 − p2 + pq Θ ( p− ) Θ (q− − p− ) δ( p2 − m21 )δ ( p − q)2 − m21 .
 
Pb(q) =
(2π )4
128 Capítulo 5. Modelo de Yukawa

Os suportes das distribuições delta de Dirac que aparecem no integrando da equação anterior
implicam as igualdades:
p2 = m21 e q2 = 2pq . (5.36)

Assim, a Eq. (5.34) é igual a:

Pb(q) = −2(2π )−4 g2 q2 I (q) , (5.37)

com: Z
I (q) = d4 pΘ ( p− ) Θ (q− − p− ) δ( p2 − m21 )δ(q2 − 2pq) . (5.38)

Calcular-se-á essa integral em um sistema inercial de referência conveniente. Como p, q − p ∈


V + , também será: q = p + (q − p) ∈ V + , donde decorre a existência de um sistema inercial
de referência no qual q = (q+ ; 0⊥ ; q− ). Nele:
!
Z
1 ω 2p
I (q) = d pΘ ( p− ) Θ (q− − p− )
4
δ p+ −
× δ (2q+ q− − 2q− p+ − 2q+ p− )
| −|
2p 2p−
 
1 q − 2
Z
= dp− d p⊥ Θ ( p− ) Θ (q− − p− )
2
δ p− −A 2
, (5.39)
|4q+ | 2

com: s
q2− q− ω 2p
A := − . (5.40)
4 2q+
Realizando a integração:

Θ ( p− ) Θ (q− − p− ) n  hq hq
Z i  io
− −
I (q) = dp− d2 p⊥ δ p− − − A + δ p− − +A
|4q+ ||2A| 2 2
q+Zq− /2
π d(ω 2p )
= Θ(q− )Θ(2q+ q− − 4m21 )
|4q+ |
s
q2− q− ω 2p
m21 −
4 2q+
s
π 4m21
= Θ(q− )Θ(2q+ q− − 4m21 ) 1− . (5.41)
2 2q+ q−

Em forma covariante de Lorentz essa integral é:


s
π 4m21
I (q) = Θ (q− ) Θ(q2 − 4m21 ) 1− , (5.42)
2 q2

e substituindo na Eq. (5.37):


s
1 4m21
Pb(q) = − (2π )−3 g2 q2 Θ (q− ) Θ(q2 − 4m21 ) 1− . (5.43)
2 q2
Capítulo 5. Modelo de Yukawa 129

Logo, a transformada de Fourier da parte numérica da distribuição causal é [vide a Eq.


(5.33)]: s
1 4m21
dˆ(q) = − (2π )−3 g2 q2 sgn (q− ) Θ(q2 − 4m21 ) 1− . (5.44)
2 q2
Essa é a distribuição cuja parte retardada precisa-se encontrar. Porém, graças ao teorema
de fatorização de polinômios (Teorema 4.7 na Seç. 4.9), será suficiente realizar a divisão da
distribuição –retornando ao sistema de referência com q = (q+ ; 0⊥ ; q− )–:
s
4m21
dˆ1 (q) = sgn (q− ) Θ(2q+ q− − 4m21 ) 1− , (5.45)
2q+ q−

cuja ordem singular no eixo x − é:


1
ω− =0 , (5.46)

facilitando grandemente o cálculo –a ordem singular da distribuição causal completa é +2, e


sua divisão requeriria um número maior de subtrações–. A parte retardada de dˆ1 é então:

i dk n ˆ
Z o
r̂1 (q) = d 1 ( q + − k; 0 ;
⊥ −q ) − dˆ1 (− k; 0 ;
⊥ −q ) . (5.47)
2π k + i0+

Substituindo a Eq. (5.45) na (5.47) ter-se-á, usando a variável s = −2q− k:


 s
i ds 4m21
Z 
r̂1 (q) = − Θ(s + 2q+ q− − 4m21 ) 1−
2π s − iq− 0+  s + 2q+ q−
s 
2
4m1 
−Θ(s − 4m1 ) 1 −
2
. (5.48)
s 

Aplicando a fórmula de Sokhotskiy [199] na primeira integral e então fazendo nela a substi-
tuição s + 2q+ q− → s, o que permite juntá-la com o segundo termo da Eq. (5.48), obtém-se:

+∞
s
i ds 4m21
Z
r̂1 (q) = − 2q+ q− V.p. 1−
2π s(s − 2q+ q− ) s
4m21
s
1 4m21
+ sgn (q− ) Θ(2q+ q− − 4m21 ) 1− , (5.49)
2 2q+ q−

em que «V.p.» denota ao «valor principal de Cauchy» da integral escrita à sua direita. Logo,
re-inserindo o termo imaginário pelo uso da fórmula de Sokhotskiy e escrevendo já em
forma covariante de Lorentz –a qual é obtida pela troca de 2q+ q− por q2 –:

+∞
s
i 2 ds 4m21
Z
r̂1 (q) = − q 1− . (5.50)
2π s(s − q + iq− 0+ )
2 s
4m21
130 Capítulo 5. Modelo de Yukawa

Como é provado no Ap. C, esta distribuição retardada pode obter-se como o valor limite
da função analítica definida pela substituição do impulso q pela variável complexa q̃ =
q + iεη ∈ R4 + iR0+ e− , com ε > 0 e η o vetor definido na Eq. (2.186). Isto é:

+∞
s
i ds 4m21
Z
r̂1 (q̃) = − q̃2 1− . (5.51)
2π s(s − q̃2 ) s
4m21

A distribuição retardada correspondente a dˆ(q) na Eq. (5.44) é portanto o valor limite da


função analítica:
+∞
s
ig2 ds 4m21
Z
r̂ (q̃) = q̃4 1− . (5.52)
2(2π )4 s(s − q̃2 ) s
4m21

A integral restante pode-se calcular utilizando a seguinte substituição de Euler [196]:


s
s (1 + x )2 ds 1− x2 4m21 1−x
2
= (0 < x < 1) ; 2
=− 2 dx ; 1− = . (5.53)
m1 x m1 x s 1+x

Definimos também o parâmetro ξ̃ como:


q
q̃2 (1 − ξ̃ )2 1 − 4m21 /q̃2 − 1
=− ; ξ̃ = q . (5.54)
m21 ξ̃ 1 − 4m21 /q̃2 + 1

Portanto:
+∞
s
Z1
ds 4m21 1 dx (1 − x )2
Z
1− = 2 . (5.55)
s(s − q̃2 ) s m1 (1 + x )2 ( x + ξ̃ )( x + 1/ξ̃ )
4m21 0

Como ξ̃ é um número complexo, o integrando não apresenta pólos sobre o eixo real. Ademais,
ele é racional, de maneira que pode ser calculada pela técnica de decomposição em frações
parciais. Com tal técnica encontra-se que a Eq. (5.55) é igual a:

1 1  
− 2 3
ξ̃ (1 + ξ̃ ) log(ξ̃ ) + 2ξ̃ (1 − ξ̃ ) , (5.56)
m1 (1 − ξ̃ )

cuja substituição na Eq. (5.52) leva a:

ig2
 
2 1 + ξ̃
r̂ (q̃) = q̃ log(ξ̃ ) + 2 . (5.57)
2(2π )4 1 − ξ̃

A partir deste ponto, tomar-se-á o valor limite de r̂ (q̃) para ε → 0+ (isto é, para q̃ = q + iεη →
q) de forma a obter a distribuição retardada. Como tal limite depende do valor assumido
pelo quadrado do momento, q2 , é mister considerarmos as seguintes três regiões de variação
dele separadamente:

(I) q2 < 0: Para q do tipo-espaço, a variável ξ := lim ξ̃ é real e positiva, de forma que o
ε →0
Capítulo 5. Modelo de Yukawa 131

limite na Eq. (5.57) pode ser tomado sem complicação nenhuma:

ig2
 
2 1+ξ
r̂ (q) = q log ( ξ ) + 2 . (5.58)
2(2π )4 1−ξ

(II) 0 < q2 < 4m21 : Neste caso, o parâmetro ξ é um número complexo com módulo unidade,
e pode então ser representado na forma:
 2
θ
ξ = eiθ , q2 = 4m21 sin . (5.59)
2

Portanto: s s 
1+ξ 4m21 4m 2
log(ξ ) = 2 − 1 cot−1  1
− 1 , (5.60)
1−ξ q2 q2

e a distribuição retardada adota a forma:


 s s  
2 2
ig2
2
 4m1 −1  4m1 
r̂ (q) = q 2 − 1 cot −1 +2 .
 (5.61)
2(2π )4  q2 q2 

(III) q2 > 4m21 : Agora ξ ∈ R, mas ξ < 0. Por isto, nesta região aparece um termo imaginário
que provém do logaritmo. Para conhecer sua fase, é preciso ver que, para ε ≪ 1:
ξ̃ ≈ ξ + iεsgn(q− ). Assim:
s  q  s 
ig2  4m21 1 − 1 − 4m21 /q2 2
4m1 
r̂ (q) = q2 1− log  q  + 2 + iπsgn(q− ) 1 − .
2(2π )4  q2 1 − 4m21 /q2 + 1 q2 

(5.62)

A distribuição de transição obtém-se da subtração r̂ (q) − r̂ ′ (q), com r̂ ′ (q) a parte numérica
da distribuição subsidiária retardada no espaço dos momentos. Das Eqs. (5.15) e (5.33) vê-se
que esta última é:
( M)
R′ 2 ( x1 ; x2 ) = − P(−y) : φ( x1 ) φ( x2 ) : . (5.63)

Junto com a Eq. (5.43), o anterior implica que:


s
4m21
r̂ ′ (q) = −(2π )−4 πg2 q2 Θ(−q− )Θ(q2 − 4m21 ) 1− . (5.64)
q2

Logo, ela somente modifica à distribuição retardada quando q2 > 4m21 . Seu efeito, o vemos
das Eqs. (5.62) e (5.64), é o de modificar a parte imaginária da distribuição retardada,
trocando o sgn(q− ) pela unidade, pois sgn(q− ) + 2Θ(−q− ) = Θ(q− ) + Θ(−q− ) = 1. Desta
forma, definindo a «auto-energia do méson» como a distribuição Π tal que:

( M)
r̂ (q) − r̂ ′ (q) := −i Π
b (q) , T2 ( x1 ; x2 ) = − i : φ ( x1 ) Π ( x1 − x2 ) φ ( x2 ) : , (5.65)
132 Capítulo 5. Modelo de Yukawa

obtém-se:

(I) Para q2 < 0:


g2
 
2 1+ξ
Π
b (q) = − q log ( ξ ) + 2 . (5.66)
2(2π )4 1−ξ

(II) Para 0 < q2 < 4m21 :


 s s  
2 4m 2 4m 2
g 
−1 

Π
b (q) = − q 2
2 1
− 1 cot 1
− 1 +2 . (5.67)
2(2π )4  q2 q2 

(III) Para q2 > 4m21 :


s  q  s 
g2  4m21 1 − 1 − 4m21 /q2 2
4m1 
Π
b (q) = − q2 1− log   + 2 − iπ 1 − 2 .
2(2π )4 q2
q
 1 − 4m21 /q2 + 1 q 

(5.68)

Mas a distribuição Π
b (q) tem a ordem singular ω− = +2, o que significa que sua forma
mais geral é:
Π
e (q) = Π
b (q) + C0 + c a q a + C2 q2 ; C0 , c a , C2 ∈ R . (5.69)

Entretanto, o modelo de Yukawa é invariante sob transformações de paridade, o que proíbe


a existência do termo linear proporcional a q a . Assim sendo:

Π
e (q) = Π
b (q) + C0 + C2 q2 ≡ Π̂(q) + b + C2 (q2 − m22 ) . (5.70)

A fixação dos coeficientes indeterminados b e C2 far-se-á pela imposição de condições físicas


adicionais. Com este objetivo, estudar-se-á a dispersão de dois núcleons com inserções de
auto-energia do méson. Escrevamos a distribuição de dois pontos desse processo como:

( NN ) ( NN )
T2 ( x1 ; x2 ) = ig2 : j( x1 )t2 ( x1 − x2 ) j ( x2 ) : ; j( x ) = ψ( x )iγ5 ψ( x ) . (5.71)

Pelo procedimento indutivo da TPC constrói-se a contribuição a esse processo na quarta


ordem da série perturbativa, que resulta ser:

( NN ) ( NN ) ( NN ) ( NN ) ( NN )
D4 ( x1 ; x2 ; x3 ; x4 ) = T2 ( x1 ; x3 ) T2 ( x4 ; x2 ) − T2 ( x2 ; x4 ) T2 ( x1 ; x3 )
( NN ) ( NN )
= g2 : j ( x 1 ) t 2 ( x1 − x3 ) d ( x3 − x4 ) t2 ( x4 − x2 ) j ( x2 ) : , (5.72)

com d(y) a distribuição causal da auto-energia do méson dada na Eq. (5.33). Desde que
( NN )
t2 tem ordem singular negativa, será suficiente efetuar a divisão de d(y) e não por isso
surgirão divergências. Assim:

( NN ) ( NN ) ( NN )
T4 ( x1 ; x2 ; x3 ; x4 ) = −ig2 : j( x1 )t2 ( x1 − x3 ) Π ( x3 − x4 ) t2 ( x4 − x2 ) j( x2 ) : . (5.73)
Capítulo 5. Modelo de Yukawa 133

Uma análise semelhante é válida para as seguintes ordens da série. Em consequência,


definindo o «propagador total do méson» Dtot como a soma dessa série:

T ( NN ) ( x1 ; x2 ) = ig2 : j( x1 ) Dtot ( x1 − x2 ) j( x2 ) : , (5.74)

ter-se-á que no espaço dos momentos sua expressão é:

b tot = t̂( NN ) − (2π )4 t̂( NN ) Π


D e t̂( NN ) + (2π )8 t̂( NN ) Π
e t̂( NN ) Π
e t̂( NN ) − · · ·
2 2 2 2 2 2
 
( NN )
= t̂2 1 − (2π )4 ΠeD b tot . (5.75)

Mas a distribuição de transição de dois pontos é dada por:

( NN ) 1
t̂2 ( p) = −(2π )−2 b F ( p)
=D , (5.76)
p2 − m22 + i0+

de forma que a solução da Eq. (5.75) é:

b tot (q) = −(2π )−2 1


D   . (5.77)
q2 − m22 + (2π )2 Π
e (q) + i0+

As condições físicas que se requererá são as seguintes: (1) A massa física do méson é m2 , o
b tot (q) tem um pólo nesse valor de q2 . Isto acontece se:
que significa que D

lim Π
e (q) = 0 ; (5.78)
q2 →m22

(2) o valor físico da constante de acoplamento é g. Como D b tot (q) aparece multiplicando à
corrente gψiγ5 ψ, o coeficiente de q2 em D
b tot (q) dividirá efetivamente o valor de g; a segunda
condição de normalização é destarte:


e (q)
lim =0 . (5.79)
q2 →m22 dq2

Para simplificar a implementação dessas condições de normalização, consideraremos o


modelo de Yukawa como uma descrição fenomenológica da interação entre núcleons e píons,
de modo que a massa m2 é a massa dos píons, cujo valor é muito menor àquela dos núcleons,
m1 –com efeito: m N ≈ 940 MeV/c2 , e mπ ≈ 140 MeV/c2 –. Por essa razão, as condições
de normalização devem ser estudadas com a Eq. (5.67). Como não há divergências infra-
vermelhas no modelo de Yukawa, os limites nas Eqs. (5.78) e (5.79) são iguais à simples
avaliação em q2 = m22 . Obtém-se:
( s s ! )
g2 m22 4m21 4m21
b= 2 − 1 cot−1 −1 +2 , (5.80)
2(2π )4 m22 m22
134 Capítulo 5. Modelo de Yukawa

( s s ! )
g2 m22 4m21 4m21
C2 = 1− − 1 cot−1 −1 +3 . (5.81)
2(2π )4 4m21 − m22 m22 m22

Com essa normalização, os resultados obtidos são idênticos àqueles encontrados na dinâmica
instantânea –compare-se com a Ref. [132]–.

5.4 Auto-energia do núcleon

Estudemos agora a auto-energia do núcleon, a qual é descrita pela distribuição causal da


Eq. (5.20) –colocando, novamente, Γ = iγ5 –:

(N)
D2 ( x1 ; x2 ) = −g2 : ψ( x1 )γ5 (S+ (y) D+ (y) − S− (y) D− (y)) γ5 ψ( x2 ) :
+ g2 : ψ( x2 )γ5 (S+ (−y) D+ (−y) − S− (−y) D− (−y)) γ5 ψ( x1 ) : . (5.82)

Definindo as distribuições:

d(y) := −g2 γ5 (d+ (y) + d− (y)) γ5 , d ± ( y ) : = ± S ± ( y ) D± ( y ) , (5.83)

a Eq. (5.82) pode escrever-se como:

(N)
D2 ( x1 ; x2 ) = : ψ( x1 )d(y)ψ( x2 ) : − : ψ( x2 )d(−y)ψ( x1 ) : . (5.84)

Como pode-se ver, o segundo termo obtém-se do primeiro pela troca de x1 e x2 . Porém, no
operador de espalhamento aparece a soma das distribuições de transição correspondentes
aos dois termos da Eq. (5.84) integradas nas variáveis x1 e x2 em conjunto com o produto
g( x1 ) g( x2 ); desde que dentro da integral é sempre possível renomear as variáveis x1 e x2 , um
com o nome do outro, sem isso trazer nenhuma consequência, a contribuição ao operador
de espalhamento dos dois termos é idêntico. Por isto, apenas nos ocuparemos em estudar o
primeiro termo.
A passagem ao espaço dos momentos é efetuada por meio da transformação de Fourier.
Começando com d− :
Z
dˆ− ( p) = −(2π )−2 d4 yeipy S− (y) D− (y)
Z
= −(2π )−6 d4 yd4 qd4 kei( p−q−k)y Sb− (q) D
b − (k) . (5.85)

Integrando na variável y, então na variável k:


Z
dˆ− ( p) = −(2π )−2 d4 qSb− (q) D
b − ( p − q) . (5.86)

Mas:

Sb− (q) = (/
q + m1 ) D
b −,m (q) , b −,m (q) = − i Θ (−q− ) δ(q2 − m2 )
D , (5.87)
1

Capítulo 5. Modelo de Yukawa 135

o que substituído na Eq. (5.86) leva à seguinte expressão:

dˆ− ( p) = (2π )−4 [γ a I2a ( p) + m1 I1 ( p)] , (5.88)

com as integrais:
Z
d4 qΘ (−q− ) Θ (q− − p− ) δ(q2 − m21 )δ ( p − q)2 − m22

I1 ( p) := , (5.89)
Z
d4 qq a Θ (−q− ) Θ (q− − p− ) δ(q2 − m21 )δ ( p − q)2 − m22

I2a ( p) := . (5.90)

Como é usual, a avaliação dessas integrais simplificar-se-á pela escolha conveniente do


sistema de referência, tal que ( p a ) = ( p+ ; 0⊥ ; p− ); este existe devido a que, como implicado
pelos supportes das distribuições delta de Dirac e funções de Heaviside nas Eqs. (5.89) e
(5.90), ( p − q) ∈ V − (0) e q ∈ V − (0), então também p = ( p − q) + q ∈ V − (0). Claramente,
isto implica que p+ , p− < 0. Nesse sistema de referência, as Eqs. (5.89) e (5.90) são:
Z
d4 qΘ (−q− ) Θ (q− − p− ) δ(q2 − m21 )δ 2p+ p− − 2p− q+ − 2p+ q− + (m21 − m22 )

I1 = ,
(5.91)
Z
d4 qq± Θ (−q− ) Θ (q− − p− ) δ(q2 − m21 )δ 2p+ p− − 2p− q+ − 2p+ q− + (m21 − m22 ) ,

I2± =
(5.92)
I2⊥ = 0 . (5.93)

Particularmente, a Eq. (5.93) provém do fato de que o integrando na Eq. (5.90) é ímpar nas
variáveis q a = q⊥ no sistema de referência escolhido. Também, o produto das distribuições
delta de Dirac que aparecem nessas integrais pode ser colocado na seguinte forma:
! !
1 p+ ωq2 ωq2
Θ 2
A − δ q− − F (q+ ; q⊥ ) , (5.94)
|8p− | 2p− 2q+

com as quantidades F (q+ ; q⊥ ) e A definidas como:

1
F (q+ ; q⊥ ) := s
p+ ωq2
A2 −
2p−
   s    s 
 p+ ωq2 p+ ωq2 
× δ  q + −  A + A2 −   + δ  q + −  A − A2 −  , (5.95)
 2p− 2p− 

2p+ p− + (m21 − m22 )


A= . (5.96)
4p−
Essa última se mantém constante no processo de integração. Agora, desde que ωq2 = q2⊥ +
m21 > m21 , a função de Heaviside na Eq. (5.94) implica que: 2p− A2 /p+ > m21 . Colocando o
136 Capítulo 5. Modelo de Yukawa

valor de A nessa desigualdade, chega-se a:


2
2p+ p− − (m21 + m22 ) − 4m21 m22 > 0 . (5.97)

Com essas manipulações, as integrais nas Eqs. (5.91) e (5.92) são:

π  2 
I1 = Θ(− p− )Θ 2p+ p− − (m21 + m22 ) − 4m21 m22
8| p − |
2p−ZA2 /p+ Z0
× d(ωq2 ) dq+ F (q+ ; q⊥ ) , (5.98)
m21 ωq2 /2p−
π  2 
I2+ = Θ(− p− )Θ 2p+ p− − (m21 + m22 ) − 4m21 m22
8| p − |
2p−ZA2 /p+ Z0
× d(ωq2 ) dq+ q+ F (q+ ; q⊥ ) , (5.99)
m21 ωq2 /2p−
π  2 
I2− = Θ(− p− )Θ 2p+ p− − (m21 + m22 ) − 4m21 m22
8| p − |
2p−ZA2 /p+ Z0 ωq2
× d(ωq2 ) dq+ F (q+ ; q⊥ ) , (5.100)
2q+
m21 ωq2 /2p−

em que tem-se usado que d2 q⊥ = πd(ωq2 ). Para realizar a integração na variável q+ , precisa-
se ver sob quais condições as distribuições delta de Dirac têm suporte na região de integração.
Já que q+ < 0, tem de ser A < 0, o que significa que [vide a Eq. (5.96) e lembre que p− < 0]:

2p+ p− > m21 − m22 . (5.101)

Adicionalmente, o argumento das funções de Heaviside nas Eqs. (5.98)-(5.100) pode escrever-
se como:
2
2p+ p− − (m21 − m22 ) − 8p+ p− m22 > 0 , (5.102)

que em conjunto com a Eq. (5.101) leva à desigualdade: 2p+ p− − 2m2 2p+ p− − (m21 −
p

m22 ) > 0, cujas raízes são 2p+ p− = m2 ± m1 . Sob a suposição de ser m1 > m2 –o que
p

se justifica, por exemplo, para os núcleons e píons, como antes dito–, observa-se que a
integração na variável q+ tem de ser proporcional a:

Θ 2p+ p− − (m1 + m2 )2
 
. (5.103)

Para a integração na variável ωq2 usa-se o seguinte resultado:

2p−ZA2 /p+ s s
d(ωq2 ) p− p − A2 m2 2(m21 + m22 ) (m21 − m22 )2
r
=4 − 1 = 2| p − | 1− + .
(2p+ p− )2
s
p+ ωq2 p+ p+ 2 2p+ p−
m21 A2 −
2p−
Capítulo 5. Modelo de Yukawa 137

As integrais requeridas são portanto, já em suas formas covariantes de Lorentz:


s
π 2(m21 + m22 ) (m21 − m22 )2
Θ (− p− ) Θ p2 − (m1 + m2 ) 2
 
I1 = 1− + , (5.104)
2 p2 p4
m21 − m22
 
pa
I2a = 1+ I1 . (5.105)
2 p2
2
Substituindo as Eqs. (5.104) e (5.105) na Eq. (5.88) e usando que γ5 = 1, assim como que
γ5 γ a γ5 = −γ a :

g2
g2 γ5 dˆ− ( p)γ5 = (2π )−3 Θ (− p− ) Θ p2 − (m1 + m2 )2
 
s 4
2(m21 + m22 ) (m21 − m22 )2 m21 − m22
  
p
/
× 1− + m1 − 1+ . (5.106)
p2 p4 2 p2

O cálculo da distribuição d+ –vide a definição dada na Eq. (5.83)– leva-se a cabo per-
correndo os mesmos passos e realizando apenas modificações menores; o resultado de tal
procedimento é:

g2
g2 γ5 dˆ+ ( p)γ5 = − (2π )−3 Θ ( p− ) Θ p2 − (m1 + m2 )2
 
s 4
2(m1 + m22 ) (m21 − m22 )2
2 m21 − m22
  
p
/
× 1− + m1 − 1+ . (5.107)
p2 p4 2 p2

Daqui, a parte numérica da distribuição causal que descreve à auto-energia do núcleon será,
no espaço dos momentos –vide a Eq. (5.83)–:

g2
dˆ( p) = (2π )−3 sgn ( p− ) Θ p2 − (m1 + m2 )2
 
4 s
2(m21 + m22 ) (m21 − m22 )2 m21 − m22
  
p
/
× 1− + m1 − 1+ . (5.108)
p2 p4 2 p2

Com o intuito de obter a distribuição retardada reescreve-se a distribuição causal fatorizando


nela um polinômio do terceiro grau:

g2 n p 2
/ o
dˆ( p) = (2π )−3 m1 p2 − p + (m21 − m22 ) dˆ1 ( p) , (5.109)
4 2

com:
s
 1 2(m21 + m22 ) (m21 − m22 )2
dˆ1 ( p) =sgn( p− )Θ p2 − (m1 + m2 )2 2

1− + . (5.110)
p p2 p4

Graças ao Teorema 4.7, será suficiente obter a parte retardada da distribuição dˆ1 ( p). Isto é
mais facilmente feito passando a um sistema de referência no qual ( p a ) = ( p+ ; 0⊥ ; p− ), o
que é possível desde que p ∈ V + , como se implica das distribuições delta de Dirac e funções
138 Capítulo 5. Modelo de Yukawa

de Heaviside contidas na Eq. (5.110). Nele:


s
1 2(m21 + m22 ) (m21 − m22 )2
dˆ1 ( p) =sgn( p− )Θ 2p+ p− − (m1 + m2 ) 2
 
1− + .
2p+ p− 2p+ p− (2p+ p− )2
(5.111)

1 = −1 < 0, então sua parte retardada é dada pela


Essa distribuição tem a ordem singular ω−
expressão:

i dk
Z
sgn( p− )Θ −2kp− + 2p+ p− − (m1 + m2 )2
 
r̂1 ( p) = +
2π k + i0
s
1 2(m21 + m22 ) (m21 − m22 )2
× 1− + . (5.112)
−2kp− + 2p+ p− −2kp− + 2p+ p− (−2kp− + 2p+ p− )2

Usando a fórmula de Sokhotskiy para tratar o pólo e fazendo a mudança de variável


s = −2kp− + 2p+ p− :

+∞
s
i ds 2(m21 + m22 ) (m21 − m22 )2
Z
r̂1 ( p) = V.p. 1− +
2π s(2p+ p− − s) s s2
( m1 + m2 )2
s
1 1 2(m21 + m22 ) (m21 − m22 )2
+ sgn ( p− ) Θ(2p+ p− − (m1 + m2 )2 ) 1− + .
2 2p+ p− 2p+ p− (2p+ p− )2
(5.113)

Esta distribuição retardada é o valor limite da função analítica definida no tubo R4 + iR0+ e−
–escrita em forma covariante de Lorentz–:
+∞
s
i ds 2(m21 + m22 ) (m21 − m22 )2
Z
r̂1 ( p̃) = − 1 − +
2π s(s − p̃2 ) s s2
( m1 + m2 )2
+∞
i ds
Z q
=− [s − (m1 + m2 )2 ][s − (m1 − m2 )2 ] . (5.114)
2π s (s − p̃2 )
2
( m1 + m2 )2

Como o pólo do integrando não se encontra mais no eixo real (para pe = p + iεη, ε > 0),
essa integral pode ser resolvida por meio da terceira substituição de Euler [196]: Efetua-se a
seguinte mudança de variável:

( m1 + m2 )2 − ( m1 − m2 )2 x 2
s= ; 0<x<1 , (5.115)
1 − x2

com a qual:

x 8m1 m2 xdx
q
[s − (m1 + m2 )2 ][s − (m1 − m2 )2 ] = 4m1 m2 2
, ds = . (5.116)
1−x (1 + x )2 (1 − x )2
Capítulo 5. Modelo de Yukawa 139

Definimos também os parâmetros a e b̃ segundo:


1/2
p̃2 − (m1 + m2 )2

m1 + m2
a := > 1 , b̃ := ∈C . (5.117)
m1 − m2 p̃2 − (m1 − m2 )2

Com estas relações, a função analítica r̂1 ( p̃) se expressa como:

Z1
i 32m21 m22 x2 dx
r̂1 ( p̃) = − , (5.118)
2π (m1 − m2 )4 [ p̃2 − (m1 − m2 )2 ] ( a + x )2 ( a − x )2 ( x − b̃)( x + b̃)
0

a qual já pode ser avaliada pela técnica de decomposição em frações parciais. O resultado de
semelhante operação é:

i p̃2 − (m1 − m2 )2 b̃ − 1 b̃2 + a2 b̃2 − a2


     
a+1
r̂1 ( p̃) = − b̃ log + log − 2 .
2π p̃4 b̃ + 1 2a a−1 a −1
(5.119)
Assim, utilizando a Eq. (5.109), conclui-se que a parte retardada da distribuição numérica
causal dˆ( p) é o valor limite da função analítica:

ig2 m21 − m22


  
p

r̂ ( p̃) = m1 − 1+
4(2π )4 2 p̃2
 2
p̃ − (m1 − m2 )2 b̃2 + a2
     
b̃ + 1 m1
× b̃ log − log − 1 . (5.120)
p̃2 b̃ − 1 2a m2

Com a finalidade de se obter o valor limite desta função, é preciso dividir a análise em
três regiões que determinam o comportamento da quantidade b := lim b̃. Elas são:
ε →0

(I) p2 < (m1 − m2 Neste caso, b ∈ R e b > 1, de forma que o limite para ε → 0 da Eq.
)2 :
(5.120) pode ser obtido diretamente:

ig2 m21 − m22


  
p
/
r̂ ( p) = m1 − 1+
4(2π )4 2 p2
( m1 − m2 )2 b2 + a2
       
b+1 m1
× 1− b log − log − 1 . (5.121)
p2 b−1 2a m2

(II) (m1 − m2 )2 < p2 < (m1 + m2 )2 : Nesta região de variação do impulso, b ∈ iR, de modo
que pode-se escrever:
s
( m1 + m2 )2 − p2
b = ic , c := ∈R . (5.122)
p2 − ( m1 − m2 )2

Definindo o argumento da função logaritmo na Eq. (5.120) como

b+1 ic + 1
ξ := = , (5.123)
b−1 ic − 1

ocorre que ela tem, evidentemente, o módulo unidade: |ξ | = 1, e por isso este número
140 Capítulo 5. Modelo de Yukawa

pode ser representado na forma:


 2
iθ 2 2 θ
ξ=e , p = (m1 − m2 ) + 4m1 m2 sin . (5.124)
2

Assim, s 
p2 − ( m1 − m2 )2 
log(ξ ) = iθ = 2i sin−1  . (5.125)
4m1 m2

A distribuição retardada para os valores do quadrado do momento em consideração é


portanto –oferecemos todos os detalhes para este importante caso porque nele encontra-
se a camada de massa; no problema da normalização faremos uso dessa expressão–:
(
2 − m2 
ig2 ( m1 − m2 )2
  
p
/ m 1 2
r̂ ( p) = m1 − 1+ 1−
4(2π )4 2 p2 p2
" s s 
( m1 + m2 )2 − p2 p 2 − ( m − m )2
1 2 
× −2 sin−1 
p2 − ( m1 − m2 )2 4m1 m2
 # )
(m21 + m22 ) p2 − 2(m21 − m22 )2 m1
− log −1 . (5.126)
2(m21 − m22 )[ p2 − (m1 − m2 )2 ] m2

(III) p2 > (m1 + m2 )2 : Nesta região se cumpre que b ∈ R, mas 0 < b < 1, e por isso ξ < 0. É
preciso, pois, observar qual é a fase que irá adquirir log(ξ ). Da definição de b̃ dada na
Eq. (5.117) é possível ver que para ε ≪ 1: b̃ ≈ b + iεp− , e portanto ξ̃ ≈ ξ − iεp− ; daqui
decorre que log(ξ ) = log(|ξ |) − iπsgn( p− ). A distribuição retardada é neste caso:
 ( 
ig2 m21 − m22 ( m1 − m2 )2
  
p
/
r̂ ( p) = m 1 − 1 + 1 −
4(2π )4 2 p2 p2
" # )
b2 + a2
   
1+b m1
× b log − log − iπsgn( p− )b − 1 . (5.127)
1−b 2a m2

Ainda precisamos da distribuição subsidiária retardada. Das Eqs. (5.15) e (5.83), vê-se que
ao termo da distribuição causal em consideração –primeiro termo da Eq. (5.84)– corresponde:

(N)
R ′ 2 ( x 1 ; x 2 ) = − g2 : ψ ( x 1 ) γ 5 d − ( y ) ψ ( x 2 ) : . (5.128)

A parte numérica da distribuição subsidiária retardada pode portanto ser imediatamente


lida da Eq. (5.106):

g2 m21 − m22
  
′ p
/
Θ(− p− )Θ p − (m1 + m2 )
2 2

r̂ ( p) = − m1 − 1+
4(2π )3 2 p2
s
2(m21 + m22 ) (m21 − m22 )2
× 1− + , (5.129)
p2 p4
Capítulo 5. Modelo de Yukawa 141

e por seu suporte só modifica à distribuição retardada no intervalo p2 > (m1 + m2 )2 .


Por conseguinte, definindo a «auto-energia do férmion» como a distribuição Σ tal que:

(N)
r̂ ( p) − r̂ ′ ( p) =: −i Σ̂( p) ; T2 ( x1 ; x2 ) = − i : ψ ( x1 ) Σ ( x1 − x2 ) ψ ( x2 ) : , (5.130)

da análise recém feita segue que:

(I) Para p2 < (m1 − m2 )2 :

2

p

m 2 − m2 
g /
Σ
b ( p) = − m1 − 1+ 1 2 2
4(2π )4 2 p
( m1 − m2 ) 2 b2 + a2
      
b+1 m1
× 1− b log − log − 1 . (5.131)
p2 b−1 2a m2

(II) Para (m1 − m2 )2 < p2 < (m1 + m2 )2 :


(
2 2 − m2 
( m1 − m2 )2
  
g /p m
Σ( p) = −
b m1 − 1+ 1 2
1−
4(2π )4 2 p2 p2
" s s 
( m1 + m2 )2 − p2 p 2 − ( m − m )2
1 2 
× −2 sin−1 
p2 − ( m1 − m2 )2 4m1 m2
 # )
(m21 + m22 ) p2 − 2(m21 − m22 )2 m1
− log −1 . (5.132)
2(m21 − m22 )[ p2 − (m1 − m2 )2 ] m2

(III) Para p2 > (m1 + m2 )2 :


(
2 2 − m2  2

  
g p
/ m ( m 1 m 2 )
Σ
b ( p) = − m1 − 1+ 1 2
1−
4(2π )4 2 p2 p2
" # )
b2 + a2
   
1+b m1
× b log − log − iπb − 1 . (5.133)
1−b 2a m2

Finalmente, a ordem singular de Σ


b ( p) no eixo x − é ω− = +1 e, portanto, esta distribuição
tem a forma geral:

Σ
e ( p) = Σ p≡Σ
b ( p) + C0 + C1 / p − m1 )
b ( p) + c + C1 (/ , c, C1 ∈ R . (5.134)

Como no caso da auto-energia do méson, as constantes c e C1 fixar-se-ão pela imposição de


condições físicas adicionais. Essas impor-se-ão ao propagador total do núcleon, definido
como a parte numérica da distribuição completa que descreve o espalhamento de um núcleon
por um méson:

T ( MN ) ( x1 ; x2 ) = ig2 : ψ( x1 )γ5 Stot ( x1 − x2 )γ5 ψ( x2 ) : : φ( x1 ) φ( x2 ) : . (5.135)

Para calcular a contribuição da quarta ordem à serie, começa-se, no processo indutivo, por
142 Capítulo 5. Modelo de Yukawa

construir a distribuição causal:

( MN ) ( MN ) ( MN ) ( MN ) ( MN )
D4 ( x1 ; x2 ; x3 ; x4 ) = T2 ( x1 ; x3 ) T2 ( x4 ; x2 ) − T2 ( x2 ; x4 ) T2 ( x1 ; x3 ) . (5.136)

Escrevendo a distribuição de transição da segunda ordem para o espalhamento méson-


núcleon como:

( MN ) ( MN )
T2 ( x1 ; x2 ) = −ig2 : ψ( x1 )γ5 t2 ( x1 − x2 ) γ5 ψ ( x2 ) : : φ ( x1 ) φ ( x2 ) : , (5.137)

obtém-se por aplicação do teorema de Wick:

( MN )
D4 ( x1 ; x2 ; x3 ; x4 )
( MN ) ( MN )
= − g2 : ψ ( x 1 ) γ 5 t 2 ( x1 − x3 ) d ( x3 − x4 ) t2 ( x4 − x2 )ψ( x2 ) : : φ( x1 ) φ( x2 ) : , (5.138)

e a correspondente distribuição de transição achar-se-á pela simples divisão de d( x3 − x4 ),


( MN )
que é a mostrada na Eq. (5.83), pois as distribuições t2 têm ordem singular negativa:

( MN )
T4 ( x1 ; x2 ; x3 ; x4 ) = ig2 : φ( x1 ) φ( x2 ) :
( MN ) ( MN )
× : ψ ( x1 ) γ5 t1 ( x1 − x3 ) Σ ( x3 − x4 ) t2 ( x4 − x2 ) ψ ( x2 ) : , (5.139)

e similarmente para as seguintes ordens da série perturbativa. Como consequência, o


propagador nucleônico total no espaço dos momentos é dado pela série:

( MN ) ( MN ) e ( MN ) ( MN ) e ( MN ) e ( MN )
Sbtot = −t̂2 + (2π )4 t̂2 Σt̂2 − (2π )8 t̂2 Σt̂2 Σt̂2 +···
 
( MN )
= −t̂2 1 + (2π )4 Σe Sbtot . (5.140)

Na Seç. 5.2 foi mostrado que a distribuição de transição da segunda ordem para o espalha-
mento de um méson por um núcleon é:

( MN ) /p + m1 1
t̂2 ( p) = −(2π )−2 2
= −(2π )−2 . (5.141)
p2 − m1 + i0 + p − m1 + i0+
/

Assim, da Eq. (5.140) segue que:

1
Sbtot ( p) = (2π )−2   . (5.142)
p − m + ( 2π ) 2Σ ( p ) + i0+
/ 1
e

As condições físicas que esse propagador completo tem de satisfazer são: (1) A massa física
do férmion é m1 , de modo que Sbtot ( p) deve ter um pólo em /
p = m1 ; (2) o valor físico da
p no denominador de Sbtot ( p) deve ser
constante de acoplamento é g, então o coeficiente de /
igual à unidade. Estas condições traduzem-se operacionalmente em:


e ( p)
lim Σ
e ( p) = 0 e lim =0 , (5.143)
p → m1
/ p → m1
/ d/p
Capítulo 5. Modelo de Yukawa 143

e são satisfeitas pela escolha:




b ( p)
c=−Σ
b ( p) , C1 = − . (5.144)
d/p

p = m1
/
p = m1
/

em que deve ser usada a expressão da auto-energia do núcleon apresentada na Eq. (5.132),
pois é na sua região de validade que se encontra a camada de massa p2 = m21 . Como no caso
mesônico, também a auto-energia do férmion na dinâmica da frente de luz se iguala àquela
obtida na dinâmica instantânea [132].

5.5 Normalizabilidade e termos de auto-interação

Nesta seção analisaremos o problema da normalizabilidade do modelo de Yukawa.


Comecemos por lembrar que a construção da distribuição causal da ordem n, Dn , é feita
indutivamente pelo produto das distribuições de transição de menor ordem, com as quais se
constroem a distribuição subsidiária retardada e a avançada. Um dado termo da distribuição
causal obtém-se então por aplicação do teorema de Wick e define-se pelos operadores de
campo quantizado externo que apresenta. Suponhamos, assim, que o desejado termo de Dn
é obtido por aplicação do teorema de Wick ao produto Tr1 Ts2 , e que está definido pela feitura
de ls contrações bosônicas e l f fermiônicas. Logo, se t1 e t2 são, respectivamente, as partes
numéricas de Tr1 e Ts2 , então a parte numérica do produto anterior com as mencionadas
contrações terá a forma:

ls lf
d ( x 1 ; · · · ; x r ; y 1 ; · · · ; y s ) : = t 1 ( x 1 ; · · · ; x r ) ∏ D+ ( x r j − y s j ) ∏ S+ ( xr m − y sm ) t2 ( y1 ; · · · ; y s ) .
j =1 m =1
(5.145)
n o n o
Aqui, xr j ⊆ { x1 ; · · · ; xr } e y s j ⊆ {y1 ; · · · ; ys } são os pontos em que uma con-
j∈ Ils j∈ Ils
tração bosônica tem tido lugar, enquanto que { xrm }m∈ Il ⊆ { x1 ; · · · ; xr } e {ysm }m∈ Il ⊆
f f
{y1 ; · · · ; ys } são aqueles em que foi feita uma contração fermiônica. Em virtude da invariân-
cia translacional das distribuições numéricas t1,2 , definimos as coordenadas relativas:

ξ j := x j − xr ( j = 1, · · · , r − 1) , η j := y j − ys ( j = 1, · · · , s − 1) , η := xr − ys , (5.146)

assim como os vetores:

ξ : = ( ξ 1 ; · · · ; ξ r −1 ) , η : = ( η1 ; · · · ; η s − 1 ) , (5.147)

com os quais a Eq. (5.145) pode escrever-se na forma:

ls lf
d(ξ; η; η ) = t1 (ξ ) ∏ D+ (ξ r j − ηs j + η ) ∏ S+ ( ξ r m − ηsm + η )t2 (η) . (5.148)
j =1 m =1
144 Capítulo 5. Modelo de Yukawa

Numa análise ingênua pretender-se-ia usar a Eq. (4.95) para determinar a ordem singular
diretamente no espaço real. Para simplificar a notação, escrevamos, por exemplo:
 
s∗ ξ := sξ + ; sξ ⊥ ; ξ − , (5.149)

e similarmente para as outras coordenadas. A suposição de que as ordens singulares das


f
1 , ω 2 , ω s e ω , respectivamente, significa que as
distribuições t1 , t2 , D+ e S+ são ω− − − −
seguintes quantidades são finitas e não nulas no limite s → 0 –note-se que já está fixando-se
a dimensionalidade do espaço-tempo como sendo igual a quatro–:

1 2
s 3(r −1) s ω − t 1 ( s ∗ ξ ) , s3(s−1) sω− t2 (s∗ η) ,

s f
s3 sω− D+ (s∗ [ξ r j − ηs j + η ]) , s3 sω− S+ (s∗ [ξ rm − ηsm + η ]) . (5.150)

Portanto, formando essas expressões na Eq. (5.148) chegar-se-ia a que a quantidade


n 1
h 1
io
s3(r+s−1) sω− d(s∗ ξ; s∗ η; s∗ η ) = s3(r+s−1) sω− s−3(r−1) s−ω− s3(r−1) sω− t1 (s∗ ξ )
( " #)
n h io ls
s−3ls s−ω− ls ∏ s3 sω− D+ (s∗ [ξ r j − ηs j + η ])
2 2 s s
× s−3(s−1) s−ω− s3(s−1) sω− t2 (s∗ η)
j =1
  
lf
f f
 
× s−3l f s−ω− l f  ∏ s3 sω− S+ (s∗ [ξ rm − ηsm + η ]) , (5.151)
m =1
 

na qual todas as expressões entre chaves são finitas quando s → 0, será finita e não nula em
tal limite se:
1 2 s f
ω− = ω− + ω− + (3 + ω − ) l s + (3 + ω − ) l f − 3 . (5.152)

Entretanto, esse resultado é o que esperaríamos numa teoria em três dimensões, o que deve
levar ao questionamento da existência do limite s → 0 na Eq. (5.151), isto é, se o produto das
quase-assíntotas das diferentes distribuições contidas nela, é uma distribuição bem definida.
Para responder a essa pergunta, volte-se à Eq. (5.148) e aplique-se a transformação de Fourier
para ir ao espaço dos momentos:
Z
dˆ( p; q; q) = (2π )−2(r+s−1) d4(r−1) ξd4(s−1) ηd4 ηt(ξ; η; η )eipξ +iqη+iqη . (5.153)

Aqui substitui-se a Eq. (5.148) e troca-se as distribuições de (anti-)comutação por suas


respectivas transformadas de Fourier,
Z Z
S+ ( x ) = (2π )−2 d4 k Sb+ (k )e−ikx , D+ ( x ) = (2π )−2 b + (h)e−ihx
d4 h D , (5.154)

com o qual obtém-se, após o agrupamento conveniente dos termos:


Z  Z 
dˆ( p; q; q) =(2π )−2(ls +l f −1) ∏ d km d h j D+ (h j )S+ (km ) (2π )
4 b 4 b −4 4 i (q−∑m k m −∑ j h j )
d ηe
j,m
Capítulo 5. Modelo de Yukawa 145

 Z  
−2(r −1) 4(r −1) ipξ −i ∑m k m ξ rm +∑ j h j ξ r j
× (2π ) d ξt1 (ξ )e
 Z  
−2( s −1) 4( s −1) iqη+i ∑m k m ηsm +∑ j h j ηs j
× (2π ) d ηt2 (η)e . (5.155)

Nesta expressão pode identificar-se a transformada de Fourier das distribuições numéricas


t1,2 e a representação integral da distribuição delta de Dirac na primeira linha da Eq. (5.155).
Definindo o vetor p − kr − hr como sendo aquele com componentes pi − kri − hri se ξ ri é um
ponto de contração, e pi se não o é, e analogamente para o vetor q + ks + hs , a Eq. (5.155)
escreve-se:
Z
" !#
dˆ( p; q; q) =(2π )−2(ls +l f −1) ∏ d4 km d4 h j Db + (h j )Sb+ (km )δ q− ∑ hj + ∑ km
j,m j m

× t̂1 ( p − kr − hr )t̂2 (q + ks + hs ) . (5.156)

Para determinar a ordem singular da distribuição dˆ precisa-se avaliar o limite:


 
p
lim ρ(s)dˆ . (5.157)
s → 0+ s∗

Aqui, analogamente à Eq. (5.149), estamos usando a seguinte notação simplificadora:

p p p 
; ⊥ ; p−
+
:= , (5.158)
s∗ s s

e similarmente para as outras variáveis de momento. Consideremos, para maior clareza, um


caso particular. Suponhamos que t̂1 = 1 = t̂2 e ls = 1 = l f . A distribuição causal é –esse caso
é um dos termos que contribuem para a auto-energia do férmion [vide a Eq. (5.20)]–:

q − k̃
     
q k̃
Z Z
−3
dˆ(q) = d kD4
b + (k )Sb+ (q − k ) ; dˆ =s 4
d k̃ D
b+ Sb+ , (5.159)
s∗ s∗ s∗

com k̃ = s∗ k. Se assumirmos que o limite s → 0+ comuta com a integral, então teriamos que
a quase-assíntota de dˆ no eixo x − é:
Z
dˆ− (q) ∼ d4 k̃ (q+ − k̃ + )γ+ + (qα − k̃ α )γα Θ(k̃ − )Θ(q− − k̃ − )δ k̃2⊥ δ q2⊥ − k̃2⊥
   
.

Mas a integração dessa expressão na variável k̃ + é divergente, e por isso a quase-assíntota


dˆ− (q) não pode ser encontrada aplicando primeiro o limite e a integração depois, pois somos
forçados a concluir que o produto de quase-assíntotas no eixo x − das distribuições D
b + e Sb+
não é bem definido. Em uma palavra, o procedimento de limite e a integração não comutam:
A ordem singular da distribuição dˆ somente pode ser calculada uma vez que a integração
esteja feita.

Existe ainda uma outra possibilidade. Desde que k m e h j são somente variáveis de
integração, seu scaling não passa de uma simples mudança de variáveis. Assim, podemos
146 Capítulo 5. Modelo de Yukawa

definir k̃ m = sk m e h̃ j = sh j –afetando às quatro componentes–, e a distribuição na Eq. (5.156)


é igual a:
!
h̃ j
 
k̃ m
Z
dˆ( p; q; q) =(2π )−2(ls +l f −1) s−4(ls +l f ) ∏d 4 4
k̃ m d h̃ j D
b+
s
Sb+
s
j,m
    " !#
k̃r + h̃r k̃s + h̃s 1
× t̂1 p−
s
t̂2 q+
s
δ q−
s ∑ h̃ j + ∑ k̃m . (5.160)
j m

Agora, no limite s → 0+ , as distribuições D


b + e Sb+ tornam-se suas respectivas versões de
massa nula, cuja convolução é, sim, bem definida. Nesse ponto, deseja-se avaliar o limite
para s → 0+ da quantidade:
!

   
p q q k̃ m
Z

ˆ −2( l s + l f −1) −4( l s + l f ) 4 4 b j
d ; ; = (2π ) s d k̃ m d h̃ j D+ S+
b
s∗ s∗ s∗ j,m
s s
    " !#
p k̃r + h̃r q k̃s + h̃s q 1
s ∑
× t̂1 − t̂2 + δ − h̃ j + ∑ k̃ m . (5.161)
s∗ s s∗ s s∗ j m

Nessa equação aparecem distribuições tais como

p+ − k̃+ p⊥ − k̃⊥
   
p k̃ k̃−
t̂1 − = t̂1 ; ; p− − , (5.162)
s∗ s s s s

então no limite em que s → 0+ obter-se-á quase-assíntotas «mistas»: no eixo x − nas variá-


veis em que seja (k̃ j )− = 0, e na origem nas variáveis em que (k̃ j )− ̸= 0. A Eq. (5.161) leva
diretamente ao seguinte lema.

Lema 5.1: No modelo de Yukawa, a ordem singular no eixo x − de cada distribuição de transição é
igual a sua ordem singular na origem x = 0.

Prova: Procederemos por indução matemática completa. (i) A base indutiva é que para
n = 1: ω− [ T1 ] = 0 = ω0 [ T1 ], o que é trivial, pois a parte numérica de T1 é uma constante. (ii)
A hipótese indutiva é que para qualquer m ∈ In−1 : ω− [ Tm ] = ω0 [ Tm ]. (iii) O passo indutivo
é dado usando a Eq. (5.161) para a distribuição causal da n-ésima ordem: Como r, s ≤ n − 1,
pode-se rearranjar essa equação da seguinte forma:
 
p q q s f 1 2
dˆ ; ; = (2π )−2(ls +l f −1) s−4(ls +l f −1)−ω0 ls −ω0 l f −ω− −ω−
s∗ s∗ s∗
( !)    " !#
Z
h̃ f k̃
× ∏ d4 k̃ m d4 h̃ j sω0 D δ q+,⊥ − ∑ h̃ j+,⊥ + ∑ k̃ m+,⊥
s j m
b+ sω0 Sb+
j,m
s s j m
" !#      
p k̃r + h̃r q k̃s + h̃s
× δ sq− − ∑ h̃ j− + ∑ k̃ m−
1 s
sω− t̂1 − sω− t̂2 + .
j m s∗ s s∗ s
(5.163)
Capítulo 5. Modelo de Yukawa 147

1 = ω 1 e ω 2 = ω 2 por hipótese indutiva, de forma que é indiferente onde tenha


Mas ω− 0 − 0
de ser tomada a quase-assíntota de t̂1 e t̂2 : Quer seja no eixo x − , quer seja na origem, as
expressões entre chaves na Eq. (5.163) são finitas. Aqui está-se supondo que as distribuições
de comutação do bóson e do férmion, D b + e Sb+ , têm ordem singular ω s e ω f , respectivamente,
0 0
na origem x = 0. Portanto, ao multiplicar a Eq. (5.163) por ρ(s) = sω− para avaliar a ordem
singular de dˆ no eixo x − , obter-se-á que:

f
1
ω− = ω− 2
+ ω− + (4 + ω0s )ls + (4 + ω0 )l f − 4 . (5.164)

f
Ou, colocando já os valores ω0s = −2 e ω0 = −1:

1 2
ω− = ω− + ω− + 2ls + 3l f − 4 . (5.165)

1 = ω 1 e ω 2 = ω 2 por hipótese indutiva, esse resultado implica que a


Novamente, como ω− 0 − 0
distribuição causal da ordem n tem a mesma ordem singular no eixo x − e na origem –com
efeito, a Eq. (5.165) é a mesma equação que se obtém pela análise na origem [132]–. Dessa
distribuição causal é obtida sua parte retardada, a qual, uma vez normalizada de acordo com
a condição de covariância de Lorentz, terá a mesma ordem singular que a distribuição causal
–um termo instantâneo com maior ordem singular é proibido, como explicado no final da Seç.
4.7, e deve ser cancelado pela escolha adequada dos termos de normalização–. Concluíndo, a
ordem singular no eixo x − da distribuição de transição de n pontos é dada pela Eq. (5.165). ■

A Eq. (5.165) é a que permite determinar, começando com as duas distribuições Tr1 e Ts2 ,
a ordem singular de um dado termo resultante na distribuição de transição Tn , n = r + s.
Como ela tem dependência linear com o número de contrações, propõe-se que a ordem
singular da distribuição causal da ordem n tenha a forma:

ω− [d] = A + BM + CN + Fn , (5.166)

com M o número de campos mesônicos assintoticamente livres (exteriores), N o número


de campos nucleônicos exteriores. A Eq. (5.165) deve ser usada para a determinação das
constantes A, B, C e F na Eq. (5.166), uma vez que conhece-se a estrutura do termo da
primeira ordem, T1 . Procederemos, mais uma vez, pelo método de indução matemática
completa sobre a ordem da distribuição Tn :

(i) Base indutiva: A distribuição da primeira ordem T1 tem ordem singular ω− = 0 e


n = 1. Ela tem M = 1 e N = 2; a base indutiva é obtida exigindo o cumprimento da
Eq. (5.166) para esses valores particulares:

0 = A + B + 2C + F . (5.167)

(ii) Hipótese indutiva: Assumir-se-á, de acordo com o princípio da indução matemática


completa, que todas as distribuições Tm com m ≤ n − 1 satisfazem à Eq. (5.166).
148 Capítulo 5. Modelo de Yukawa

(iii) Passo indutivo: O passo indutivo será dado impondo a Eq. (5.166) sobre a distribuição
Tn e procurando pelos valores das constantes A, B, C e F que sejam compatíveis com
a Eq. (5.165) e, a um tempo, satisfaçam à Eq. (5.167). Se tais constantes podem ser
identificadas, então a prova estará completa.
Suponhamos que estejamos interessados por um termo particular de Tn gerado por Tr1
(Mr , Nr ) e Ts2 (Ms , Ns ) por meio de ls contrações bosônicas e l f contrações fermiônicas.
Então a Eq. (5.166) implica que:

ω− = A + B( Mr + Ms − 2ls ) + C ( Nr + Ns − 2l f ) + F (r + s) . (5.168)

Por outro lado, devido à hipótese indutiva:

1 2
ω− = A + BMr + CNr + Fr , ω− = A + BMs + CNs + Fs ,

de forma que a Eq. (5.165) estabelece a seguinte igualdade:

ω− = 2A + B( Mr + Ms ) + C ( Nr + Ns ) + F (r + s) + 2ls + 3l f − 4 . (5.169)

Comparando as Eqs. (5.168) e (5.169), chega-se a:


 
3
A + 2( B + 1) l s + 2 C + lf − 4 = 0 . (5.170)
2

Essa equação deve ser válida para todos os valores de ls , le –compatíveis com a ordem
da distribuição, isto é, ls , l f ≤ n/2 para n par, e ls , l f ≤ (n − 1)/2 para n ímpar–.
Tomando ls = 0 = l f : A = 4. Se em câmbio é ls = 0, l f ̸= 0: C = −3/2. E finalmente,
se l f = 0, ls ̸= 0: B = −1. Com esses valores, a Eq. (5.167) implica que seja: F = 0. O
resultado final é portanto:
3
ω− = 4 − M − N . (5.171)
2
Como consequência, o modelo de Yukawa é normalizável na dinâmica da frente de luz, pois
a ordem singular das distribuições de transição independe da ordem perturbativa delas.
Também, para essa teoria, em que o méson é uma partícula pseudo-escalar, o único termo de
auto-interação que pode ser gerado em ordens superiores é o : φ4 : , para o qual é ω− = 0.
Termos de auto-interação com potências maiores do campo do méson, ou termos de auto-
interação para o núcleon, não são possíveis, pois para eles a ordem singular seria negativa.
Além disso, no modelo de Yukawa as condições de normalização de covariância de
Lorentz e de preservação da ordem singular no eixo x − podem, as duas, ser simultâneamente
atingidas em toda distribuição de transição de qualquer ordem. Isto pode ser provado
por indução matemática completa: Como a distribuição T1 é invariante de Lorentz e as
distribuições de (anti-)comutação dos campos fermiônico e escalar são covariantes de Lorentz,
a distribuição causal será sempre covariante de Lorentz e o Teorema 4.5 da Seç. 4.7 se lhe
aplica.
Capítulo 6

Invariância de gauge quântica


para campos de gauge sem massa

No presente capítulo estabeleceremos uma metodologia de trabalho para as teorias de


gauge que nos permitirá estudá-las de forma manifestamente covariante. Ainda mais, o
procedimento que apresentaremos revelar-se-á fundamental no mesmo sentido em que o
é a prescrição do acoplamento mínimo [200] na teoria do campo clássico –vide também
a Ref. [201]–: Ele definirá a forma da interação quântica ao permitir deduzir o termo da
primeira ordem, T1 , para as teorias de gauge. Ademais, serão estabelecidas identidades cujo
cumprimento deve ser exigido aos termos de ordem superior. Como resultado da construção
concluir-se-á que os termos de gauge da distribuição de comutação do campo de gauge
não contribuem para o cálculo dos elementos de matriz do operador de espalhamento entre
estados físicos.

6.1 Extensão do espaço de Fock

A quantização do campo no Cap. 3 significou a construção do espaço de Fock e dos


operadores, assim como das distribuições operador-valuadas, que agem no referido espaço.
Este consistia somente de estados físicos, cujas funções de onda eram as partes de frequência
positiva das soluções clássicas às equações do movimento do campo. Essa abordagem não
apresentava problema algum, como pode-se ver no Cap. 5, em que foi usada para estudar a
interação de Yukawa. Porém, quando se trata das teorias de gauge, em que o campo vetorial
sem massa deve ser quantizado, por exemplo, no gauge do plano nulo, duas dificuldades
práticas –e somente práticas– surgem: A primeira se refere à covariância não manifesta do
processo de quantização; a segunda, à dificuldade de implementar a invariância de gauge
nos termos de ordem superior, precisando de cálculos longos. Estes motivos são suficientes
para buscar uma formulação alternativa das teorias de gauge em que as quantidades sejam
todas covariantes e em que a invariância de gauge possa ser implementada de forma simples.
Como para semelhante tarefa é preciso incluir, na formulação, estados não físicos em que o
gauge não tenha sido fixado, os objetivos acima descritos precisam da ampliação do espaço
de Fock para caber nele os mencionados estados adicionais.
Consideremos o campo de gauge vetorial neutro sem massa; ele descreverá o fóton na
teoria eletromagnética e os glúons na cromodinâmica quântica. Este tipo de campo, o temos
visto, possui unicamente dois graus de liberdade, que identificam-se com suas componentes
transversais Aα ( x )(α ∈ I2 ), então a expressão do campo quantizado completo era obtida

149
150 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

solucionando as equações de vínculos. O espaço de Fock que correspondia a este processo


de quantização será doravante denotado por Ffís , e chamado «subespaço físico» do espaço
de Fock completo, F . Isto porque os potenciais de gauge físicos serão aqueles que satisfazem
à condição de gauge do plano nulo –e, implicada por ela, lembrando que tratamos somente
com campos livres, à condição de gauge de Lorenz–. Os setores do espaço de Fock F
distintos do subespaço físico são inacessíveis à observação experimental, portanto neles não
aplicam as considerações físicas feitas no Cap. 3; particularmente, não é esperado que a
expressão do campo quantizado seja a mesma que a do seu correspondente campo clássico:
A extensão do espaço de Fock é um procedimento eminentemente matemático.

Se as condições de gauge não se impõem ao operador de campo quantizado, então se tem


de quantizar os quatro estados de polarização λ ∈ {+; 1; 2; −}, e introduzir não dois, senão
quatro conjuntos de operadores de emissão e absorção a†λ ( f ) e aλ ( f ). Para que o produto
interno do espaço de Fock completo seja definido positivo, impor-se-á que eles satisfaçam:
h i
aλ ( p); a†λ (q) = 2p− δ( p − q) . (6.1)

A extensão mais natural da expressão do operador de campo quantizado da Eq. (3.151) é:


Z  
A a ( x ) = (2π )−3/2 ∑ dµ( p)ε λ ( p) a aλ ( p)e−ipx + a†λ ( p)eipx , (6.2)
λ

com a soma agora estendida a todas as polarizações, incluindo as não físicas λ ∈ {+; −}. No
entanto, o operador de campo da Eq. (6.2) não tem uma relação de comutação apropriada:
h i Z  
ip( x −y)
A a ( x ); Ab (y) =(2π )−3 d4 pδ( p2 )Θ( p− ) e−ip(x−y)−e

p a η b + η a pb
 
ab a b b
× −g + + ε + ( p) ε + ( p) + ε − ( p)ε − ( p) .
p−

Para obter uma relação de comutação covariante, como nossos fins reclamam, dever-se-ia ter
somente o termo − g ab entre os parênteses da segunda linha dessa equação, o que é possível
de se conseguir com uma redefinição apropriada dos operadores de campo associados às
polarizações não físicas –isto, já o dissemos, é absolutamente admissível, pois tal modificação
não tem nenhuma influência nos resultados físicos–. Escrevamos o operador de campo
quantizado como: Z
a
A ( x ) = (2π ) −3/2
∑ dµ( p)ε λ ( p) a Aλ ( p) . (6.3)
λ

Para que este coincida com o campo quantizado real para os estados de polarização físicos:

A1,2 ( p) = a1,2 ( p)e−ipx + a1,2



( p)eipx . (6.4)

O comutador é então:
h i Z
A a ( x ); Ab (y) = (2π )−3 dµ( p)dµ(q) ∑′ ε λ ( p)a ε λ′ (q)b [ Aλ ( p); Aλ′ (q)] . (6.5)
λ,λ
Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 151

Levando em conta a relação de completeza dos vetores de polarização, isto é:

∑ gλλ′ ε λ ( p)a ε λ′ ( p)b = gab , (6.6)


λ,λ′

a relação de comutação desejada se obtém sempre que seja:


 
[ Aλ ( p); Aλ′ (q)] = −2p− δ( p − q) gλλ′ e−i( px−qy) − ei( px−qy) . (6.7)

Essa relação é efetivamente a que se tem para λ ∈ {1; 2} com A1,2 ( p) da Eq. (6.4). As outras
componentes são também obtidas mediante a redefinição:

A± ( p) := a± ( p)e−ipx − a†∓ ( p)eipx . (6.8)

Assim sendo, definiremos o operador de campo do campo vetorial sem massa como:

Z
!
a
A ( x ) := (2π ) −3/2
∑ dµ( p)ε λ ( p) a
aλ ( p)e −ipx
−∑ gλτ a†τ ( p)eipx , (6.9)
λ τ

e este, sim, satisfaz a uma regra de comutação covariante:


h i
A a ( x ); Ab (y) = ig ab D ( x − y) , (6.10)

com D ( x ) a distribuição de Jordan-Pauli de massa nula. Também será de utilidade ter o


comutador da parte de frequência negativa com a de frequência positiva desse campo1 :
h i Z
A a− ( x ); Ab+ (y) = −(2π )−3 ∑′ dµ( p)dµ(q)ε λ ( p) a ε λ′ (q)b
λ,λ
h i
× ∑ gλ′ τ ′ aλ ( p); a†τ ′ (q) e−i( px−qy)
τ′
Z
= −(2π )−3 dµ( p) ∑ gλλ′ ε λ ( p) a ε λ′ ( p)b e−ip(x−y)
λλ′
ab
= ig D+ ( x − y) . (6.11)

E, analogamente: h i
A a+ ( x ); Ab− (y) = ig ab D− ( x − y) . (6.12)

O espaço de Fock agora contém estados de partículas com as quatro polarizações, dentre
as quais somente as transversais podem manifestar-se na natureza. Nesse espaço estendido,
o operador hamiltoniano é:
Z
P+ = dµ( p) p+ ∑ a†λ ( p) aλ ( p) , (6.13)
λ

1O subíndice indicando o sinal das frequências escrever-se-á sempre à direita do índice da componente do
operador de campo. Por exemplo, a parte de frequência positiva da componente longitudinal do operador de
campo será: A−+ ( x ) = A++ ( x ), e assim por diante.
152 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

pois com ele o operador de campo quantizado da Eq. (6.9) satisfaz à equação do movimento
de Heisenberg:

Z
!
i∂+ A a ( x ) = (2π )−3 ∑ dµ( p) p+ ε λ ( p) a aλ ( p)e−ipx + ∑ gλτ a†τ ( p)eipx
λ τ
a
= [ A ( x ); P+ ] . (6.14)

Como este hamiltoniano é definido não-negativo, o procedimento de extensão do espaço de


Fock feito é satisfatório.

6.2 Prova da invariância de Poincaré do subespaço físico

Vejamos em primeiro lugar o que as condições de gauge do plano nulo e de Lorenz


significam quando são aplicadas ao operador de campo quantizado. Como definido, a
componente «+» de todos os vetores de polarização, exceto a do ε + ( p) a , é nula, motivo pelo
qual o operador de campo quantizado A+ ( x ) só tem contribuição dessa polarização:
Z  
A+ ( x ) = (2π )−3/2 dµ( p)ε + ( p)+ a+ ( p)e−ipx − a†− ( p)eipx . (6.15)

Também, a divergência do operador de campo quantizado é:

Z
!
∂ a A a ( x ) = −i (2π )−3/2 ∑ dµ( p) p a ε λ ( p) a aλ ( p)e−ipx + ∑ gλτ a†τ ( p)eipx . (6.16)
λ τ

Sem embargo, como viu-se no Cap. 2:

pα ε 1,2 ( p)α
ε 1,2 ( p)− = 0 e ε 1,2 ( p)+ = − , (6.17)
p−

o que implica que eles são vetores de polarização ortogonais ao momento p a : p a ε 1,2 ( p) a = 0.
Portanto, na soma da Eq. (6.16) somente os estados de polarização «+» e «−» entram:

Z
!
a
∂ a A ( x ) = −i (2π ) −3/2
∑ dµ( p) p a ε λ ( p) a
aλ ( p)e −ipx
+∑ gλτ a†τ ( p)eipx , (6.18)
λ=+,− τ

de forma que só os operadores de campo de emissão e absorção a†± ( p) e a± ( p) estão inclusos.


Como o subespaço físico do espaço de Fock, Ffís , é aquele em que as partículas só têm as
polarizações transversais, os resultados das Eqs. (6.15) e (6.18) significam que este subespaço
pode ser caracterizado pelo cumprimento das condições de gauge como elementos de matriz:

∀Φ, Ψ ∈ Ffís : Φ; A+ ( x )Ψ = 0 (Φ; ∂ a A a ( x )Ψ) = 0 .



∧ (6.19)

Seja f = ( f a ) uma função de onda no espaço de Hilbert estendido de uma partícula; ela
muda, quando submetida a uma transformação de Poincaré, segundo a lei de câmbio do
Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 153

campo vetorial clássico:


 
(U ( a; Λ) f ) ( x ) = Λ−1 f Λ−1 ( x − a) . (6.20)

Sobre o espaço dessas funções definimos o operador A( f ) como a aplicação do operador de


campo quantizado A a ( x ) –que assim manifesta seu caráter distribucional– sobre a função de
teste f a : Z
A( f ) := d4 x f a ( x ) A a ( x ) . (6.21)

Definição: O operador de transformação de Poincaré que age no espaço de Fock estendido é o


operador U( a; Λ) tal que:

U( a; Λ) A( f )U( a; Λ)−1 = A (U ( a; Λ) f ) . (6.22)

Usando as Eqs. (6.20) e (6.21), a definição recém dada leva à lei de transformação do
operador de campo quantizado. Como:
Z Z
d4 x f a ( x )U( a; Λ) A a ( x )U( a; Λ)−1 = d4 x (U ( a; Λ) f ) a A a ( x )
Z  
= d4 xΛ ab f b Λ−1 ( x − a) A a ( x )
Z  a
= d 4 x f a ( x ) Λ −1 Ab (Λx + a) ,
b

obtém-se que:  a
U( a; Λ) A a ( x )U( a; Λ)−1 = Λ−1 Ab (Λx + a) . (6.23)
b

A aplicação da involução «†» a essa equação permite notar que o operador U( a; Λ) só poderia
ser unitário se o operador de campo quantizado fosse auto-adjunto; mas de sua expressão
dada na Eq. (6.9) é claro que somente as componentes A1,2 ( x ) o são, enquanto que as A+,− ( x ),
não. Donde as transformações de Poincaré não são unitárias no espaço de Fock estendido.
Isto não viola ao teorema de Wigner, pois as transformações de Poincaré não têm por que
ser uma simetria do espaço completo: a experiência pode apenas provar que elas o são do
subespaço físico. Que é possível, como de fato o assegura o teorema de Wigner, escrever uma
representação unitária dessas transformações no subespaço físico, o provaremos a seguir.

Denotemos por F L o supespaço do espaço de Fock dos estados que satisfazem à condição
de gauge de Lorenz. Como essa é compatível com a condição de gauge do plano nulo, a qual
é única, como foi provado no Cap. 3, pode-se afirmar:

∀Φ′ ∈ F L : ∃!Φ ∈ Ffís : Φ′a ( x ) = Φ a ( x ) + ∂ a Λ( x ) , □Λ ( x ) = 0 . (6.24)

O projetor sobre o subespaço físico, que age por meio da transformação de gauge apropriada
e única, denotar-se-á P; assim:
Φ = PΦ′ . (6.25)
154 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

Por outro lado, o produto interno no espaço de uma partícula é:

∗←

Z Z
( f ; g )1 = ∑ i f a (x) ∂ − ga ( x )d
3
x= ∑ dµ( p) fˆa ( p)∗ ĝa ( p) . (6.26)
a a

Consideremos então dois estados de uma partícula, Φ, Ψ ∈ Ffís , com funções de onda Φ a e
Ψ a , respectivamente. Como estes estão no subespaço físico, satisfazem à condição de gauge
do plano nulo, Φ+ = 0 = Ψ+ , e então seu produto interno pode ser colocado de forma
invariante de Poincaré –abusando da notação, embora o significado seja claro–:

←→ ←→
Z Z
(Φ; Ψ) = ∑ i Φ α ( x ) ∗ ∂ − Ψ α ( x ) d3 x = − ∑ i Φα ( x )∗ ∂ − Ψα ( x )d3 x = −(Φ a ; Ψ a ) .
α α
(6.27)
Aplique-se agora uma transformação de Poincaré (de sistema de referência). Se a transfor-
mação é a identidade, ou se ela é uma rotação espacial ou uma promoção de Lorentz2 na
direção x3 , então o valor Φ+ = 0 não muda, e o vetor ainda se encontra no subespaço físico.
Porém, no caso geral o valor da componente temporal do potencial mudará de valor, e os
estados transformados Φ′ e Ψ′ já não se encontram em Ffís . Como a condição de gauge de
Lorenz é covariante, entretanto, ainda se terá que Φ′ , Ψ′ ∈ F L . Assim sendo, pode-se aplicar
o projetor P aos estados transformados para obter estados outra vez em Ffís :

Φ
e = PU( a; Λ)Φ =: U
e ( a; Λ)Φ , Ψ e ( a; Λ)Ψ
e =U . (6.28)

Portanto, o operador que realiza as transformações de Poincaré em Ffís , e que tem de ser
unitário neste subespaço, não é o U( a; Λ), mas o U
e ( a; Λ). Efetivamente, ele o é: Como Φ
ee
Φ′ estão relacionados por uma transformação de gauge, assim como Ψ
e e Ψ′ , escreveremos:

Φ′a = Φ
e a + ∂a χ , Ψ′a = Ψ
e a + ∂a Λ . (6.29)

Substituindo estes no produto interno, que na Eq. (6.27) foi escrito de forma covariante, e
que portanto não muda com a transformação de Poincaré aplicada, obtém-se a igualdade:
     
(Φ; Ψ) = −(Φ′a ; Ψ′a ) = Φ;
e Ψ
e − ∂ a χ; Ψ
ea − Φe a ; ∂ a Λ − (∂ a χ; ∂ a Λ) . (6.30)

É fácil verificar que os termos segundo e terceiro da última igualdade são nulos, devido a
que Φe eΨ e satisfazem às condições de gauge impostas e devido às condições assintóticas.
Usando também as condições assintóticas, o último termo adota a forma:

(∂ a χ; ∂ a Λ) = (∂+ χ; ∂− Λ) + (∂− χ; ∂+ Λ) − (∂α χ; ∂α Λ)


1 1
= −(∂+ ∂− χ; Λ) − (χ; ∂+ ∂− Λ) + (∂2⊥ χ; Λ) + (χ; ∂2⊥ Λ)
2 2
1 1
= − (□χ; Λ) − (χ; □Λ) ,
2 2

2 No idioma inglês, um boost.


Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 155

e estes dois adendos são ambos nulos devido à Eq. (6.24). Concluindo:
   
(Φ; Ψ) = Φ;
e Ψ
e = U e ( a; Λ)Φ; U
e ( a; Λ)Ψ , (6.31)

e ( a; Λ) é um operador unitário. Dessarte, o subespaço físico do espaço de Fock


e o operador U
é invariante sob transformações do sistema de referência.

6.3 Pseudo-unitariedade da transformação de Poincaré


no espaço de Fock estendido
Observando novamente a Eq. (6.23), ainda existe a possibilidade de que o operador
U( a; Λ) seja pseudo-unitário no espaço de Fock estendido segundo alguma involução «K»,
isto é,
U( a; Λ)K = U( a; Λ)−1 , (6.32)

se o operador de campo quantizado estendido é pseudo-auto-adjunto segundo a mesma:


A a ( x )K = A a ( x ). Isto será possível se ele tem a seguinte expressão:
Z  
a
A ( x ) = (2π ) −3/2
∑ dµ( p)ε λ ( p) a aλ ( p)e−ipx + aλK ( p)eipx . (6.33)
λ

A comparação com a Eq. (6.9) permite estabelecer que:

aλK ( p) = − ∑ gλτ a†τ ( p) ⇒ K


a1,2 †
( p) = a1,2 ( p) , K
a± ( p) = − a†∓ ( p) . (6.34)
τ

Essas equações já poderiam ser consideradas a definição da involução «K». Contudo, para
mostrar que esta operação está de fato bem definida –ou ainda, que ela existe e tem as pro-
priedades de uma involução–, fixaremos a atenção no seguinte teorema [163]:

Teorema: Seja (•; •)K uma forma bilinear no espaço de Hilbert H. Se ela é limitada, isto é:

∃ C ∈ R+ : ∀ f , g ∈ H : |( f ; g)K | ≤ C ∥ f ∥∥ g∥ , (6.35)

então existe um operador linear limitado η : H → H, com ∥η ∥ ≤ C e Dom(η ) = H, tal que:

( f ; g)K = ( f ; ηg) . (6.36)

Ademais, (•; •)K é hermitiana3 se e só se o operador η é auto-adjunto, η † = η.

Comecemos por definir os seguintes operadores, para funções de teste f ∈ S (R3 ):


Z Z
aλa ( f ) := dµ( p) fˆ( p)∗ ε λ ( p) a aλ ( p) , aλa ( f )† := dµ( p) fˆ( p)ε λ ( p) a a†λ ( p) . (6.37)

3 Isto é, para todos f , g ∈ H: ( f ; g)K = ( g; f )∗K .


156 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

Eles geram os estados de multi-partículas:

Φλa11··· an a1 an
···λn ( f 1 ; · · · ; f n ) : = aλ1 ( f 1 ) · · · aλn ( f n ) Ω
† †
. (6.38)

Semelhantemente, e tendo a Eq. (6.34) como inspiração, definimos os operadores:


Z
aλa ( f )K := − dµ( p) fˆ( p)ε λ ( p) a ∑ gτλ a†τ ( p) , (6.39)
τ

e os estados gerados por eles:

e a1 ···an ( f 1 ; · · · ; f n ) := a a1 ( f 1 )K · · · a an ( f n )K Ω
Φ . (6.40)
λ1 ···λn λ1 λn

Definimos agora a forma bilinear (•; •)K : Sobre os estados de multi-partículas:


   
Φλa11··· an b1 ···bm
···λn ( f 1 ; · · · ; f n ); Φσ1 ···σm ( g1 ; · · · ; gm ) := Φλa11··· an
···λn 1( f ; · · · ; f n ) ; Φ
e b1 ···bm
(
σ1 ···σm 1 g ; · · · ; g m ) ,
K
(6.41)

e sobre estados mais gerais, por continuação linear da definição recém dada. Esta, oferecida
apenas sobre os estados de multi-partículas, é suficiente porque os estados Φλa11··· an
···λn ( f 1 ; · · · ; f n )
geram o espaço de Fock –uma vez escolhida uma base de funções no espaço de Schwartz–,
segundo se provou no Cap. 3 [vide em particular a Eq. (3.30)], e porque a forma bilinear
é definida em relação ao produto interno, o qual é contínuo. Além disso, será suficiente
limitar nossa atenção aos estados de uma partícula, pois os estados mais gerais podem ser
considerados combinações lineares de seus produtos tensoriais.

O cálculo direto mostra que:

Z
!
 
Φλa ( f ); Φbσ ( g)
K
= − gλσ dµ( p) fˆ( p) ĝ( p)∗
∑ ε λ ( p) a
ε σ ( p) a
. (6.42)
a

Por comparação, o produto interno entre os mesmos estados é:

Z
!
 
Φλa ( f ); Φbσ ( g) = δλσ dµ( p) fˆ( p) ĝ( p)∗
∑ ε λ ( p) a
ε σ ( p) a
. (6.43)
a

Para as polarizações físicas (transversais) a forma bilinear (•; •)K se reduz ao produto interno,
que satisfaz à Eq. (6.35) com C = 1 como consequência da desigualdade de Cauchy-Schwarz.
O outro caso em que a forma bilinear (•; •)K é não nula é –também Φ− a ( f ); Φ b ( g )

+ K
é não
nulo, mas este pode ser obtido por simetria do caso que estudaremos–:

Z
!
 
Φ+
a
( f ); Φb− ( g)
K
=− dµ( p) fˆ( p)∗ ĝ( p) ∑ ε + ( p)a ε − ( p)a
a

p2
Z
=− dµ( p) ⊥2 fˆ( p)∗ ĝ( p) , (6.44)
2p−
Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 157

em que usamos a expressão explícita dos vetores de polarização envolvidos para obter o
resultado da segunda linha. Por outro lado, usando a Eq. (6.43) e a forma explícita dos
vetores de polarização, encontra-se que:
!2
p2 ˆ 2
2 Z
Z
2 2
∥Φ+
a
dµ( p) 1 + ⊥2 Φ− ( g) = dµ( p) | ĝ( p)|
b
( f )∥ = f ( p) , . (6.45)

2p−

As Eqs. (6.44) e (6.45), junto com a aplicação da desigualdade de Cauchy-Schwarz no espaço


L2 (M, µ), permite obter finalmente:
!∗
  Z p 2
⊥ ˆ
Φ+ ( f ); Φb− ( g) = dµ( p)
a
f ( p ) ĝ ( p )

2p2−

K
!
p2
⊥ ˆ
= f ( p ) ; ĝ ( p )

2p2−


L2
2
p⊥
≤ ˆ
2p2 f ∥ ĝ∥


≤ ∥Φ+a
( f )∥ Φb− ( g) . (6.46)

De forma que também para este caso a Eq. (6.35) se satisfaz com C = 1. Este estudo dos casos
particulares pode agora ser estendido para combinações lineares de diferentes polarizações.
Note-se, em primeiro lugar, que Φλa ( f 1 ) + Φλa ( f 2 ) = Φλa ( f 1 + f 2 ), de forma que só estaremos
interessados no caso em que a soma inclua estados de polarização diferentes. Assim sendo, e
como cada polarização só tem uma outra polarização correspondente tal que a forma bilinear
não se anula, segundo o indica a Eq. (6.42), ter-se-á, por exemplo:
     
Φλ1 + Φλa 2 ; Φbσ1 + Φbσ2 = Φλa 1 ; Φbσ1 + Φλa 2 ; Φbσ2
a
K
 K  K

≤ Φλ1 ; Φσ1 + Φλ2 ; Φσ2
a b a b
K K
≤ Φλa 1 Φσa1 + Φλa 2 Φσa2

 2 2 1/2  a 2 a 2 1/2
≤ Φ a + Φ a λ1
Φσ + Φσ
λ2 1 2
.

E estas últimas quantidades são as normas dos estados Φλa 1 + Φλa 2 e Φbσ1 + Φbσ2 , pois os vetores
de polarização –e assim então os estados que lhes correspondem– são ortogonais entre si,
como o evidencia a Eq. (6.43). O mesmo raciocínio se aplica quando estejam presentes
mais outras polarizações, de forma que ainda na combinação linear mais geral possível se
cumprirá que:
|(Φ; Ψ)K | ≤ ∥Φ∥∥Ψ∥ . (6.47)

Assim, como a constante é C = 1, seu valor não se modificará ao considerar produtos


tensoriais, e a Eq. (6.47) será válida para quaisquer Φ, Ψ ∈ F . Decorre disto e do teorema
158 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

antes citado que existe um operador η definido sobre o espaço de Fock completo, tal que:

(Φ; Ψ)K = (Φ; ηΨ) , ∥η ∥ ≤ 1 . (6.48)

Ainda mais, da Eq. (6.42) é claro que a forma bilinear (•; •)K é hermitiana:
 ∗  
Φλa ( f ); Φbσ ( g) = Φbσ ( g); Φλa ( f ) , (6.49)
K K

donde o operador η será, o diz o teorema, auto-adjunto:

η† = η . (6.50)

À continuação, usando as Eqs. (6.38) e (6.40) é possível provar que:


   
Φ
e λa ( f ); Φ
e bσ ( g) = Φλa ( f ); Φbσ ( g) . (6.51)

Por outro lado, usando as Eqs. (6.48)-(6.50):


     
Φ
e λa ( f ); Φ
e bσ ( g) = Φe λa ( f ); Φbσ ( g) = Φ e λa ( f ); ηΦbσ ( g)
K
  ∗  ∗
= ηΦσ ( g); Φλ ( f ) = ηΦbσ ( g); Φλa ( f )
b e a
K
 ∗  
= ηΦσ ( g); ηΦλ ( f ) = Φλ ( f ); η Φσ ( g)
b a a 2 b
. (6.52)

A comparação das Eqs. (6.51) e (6.52) leva a estabelecer que:

η2 = 1 . (6.53)

Outras propriedades importantes são as seguintes: como a forma bilinear (•; •)K se reduz ao
produto interno para estados físicos –polarizações transversais–, ter-se-á que:

∀Φ ∈ Ffís : ηΦ = Φ . (6.54)

Isto é válido, em particular, para o estado de vazio: ηΩ = Ω. Também, das Eqs. (6.41) e (6.48):
   
Φ; ηa†λ1 ( f 1 ) · · · a†λn ( f n )Ω = Φ; aλK1 ( f 1 ) · · · aλKn ( f n )Ω . (6.55)

Mas do lado esquerdo dessa equação, entre cada par de operadores de emissão, podemos
introduzir a unidade 1 = η 2 . A comparação com o lado direito leva a estabelecer a definição
rigorosa da involução «K»: Seja B um operador:

BK := ηB† η . (6.56)

Esta definição e as propriedades do operador η acima encontradas permitem provar que a


Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 159

involução «K» satisfaz a todas as propriedades desejáveis:

( A + B)K = AK + BK , ( AB)K = BK AK , ( BK )K = B , (cB)K = c∗ BK (c ∈ C) . (6.57)

Podemos, pois, afirmar com total certeza a existência de uma involução «K» segundo a qual
o campo quantizado da radiação estendido é pseudo-auto-adjunto, e, desta maneira, que o
operador U( a; Λ) é pseudo-unitário segundo «K» no espaço de Fock completo (estendido).

6.4 Definição da transformação de gauge quântica

Já repetimos várias vezes que o subespaço físico é aquele constituído por estados nos
quais regem as condições de gauge do plano nulo e de Lorenz, simultâneamente, e que es-
sas fixam completamente o gauge. Assim, já não são permitidas mais «transformações de
gauge clássicas», isto é, transformações de gauge das funções de onda. Por outro lado, te-
mos estendido o espaço de Fock do campo de gauge por meio da definição do operador de
campo quantizado da Eq. (6.9). Contudo, já dissemos que essa extensão não é um procedi-
mento físico, mas matemático, e, como tal, goza de certa liberdade: O operador de campo
quantizado que definimos anteriormente bem poderia não ser o único a satisfazer as con-
dições pelas quais foi introduzido, a saber, que as modificações deixem invariante a ação
do operador de campo sobre os vetores do subespaço físico e que satisfaça a uma relação
de comutação covariante. A possibilidade de uma tal simetria residual leva diretamente à
definição da transformação de gauge quântica.

Definição: Uma transformação de gauge quântica é uma transformação do campo quantizado,


ou equivalentemente, do operador de campo quantizado, que depende continuamente de um parâmetro
λ constante, e que tem a forma

A′ ( f ) = e−iλQ A( f )eiλQ ⇔ A′a ( x ) = e−iλQ A a ( x )eiλQ , (6.58)

forma essa que garante (1) que a distribuição de comutação do campo transformado seja igual àquela
do campo original (covariante), e (2) que o operador de campo transformado ainda satisfaça à equação
do movimento □ A′a ( x ) = 0. Ademais, impomos a condição de que eiλQ é um operador que deixa
invariantes os estados de Ffís . O operador Q, gerador das transformações de gauge quânticas, é cha-
mado operador de carga de gauge.

A consequência mais direta dessa definição é que os estados físicos são aniquilados pelo
operador de carga de gauge, donde decorre que:

Ffís ⊆ Ker( Q) . (6.59)

Mas não sabemos ainda se se cumpre a igualdade entre os dois conjuntos. Para averiguá-lo,
comecemos por estabelecer o seguinte resultado:
160 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

Lema 6.1: O operador de carga de gauge Q é construído só com operadores de emissão e absorção
de partículas não físicas.

Prova: Em primeiro lugar, vejamos que os estados de partículas não físicas são ortogonais
† e a† operadores de emissão de partículas físicas e
aos estados físicos; com efeito, sejam afís nf
não físicas, respectivamente. Como eles comutam:
     

afís Ω; anf

Ω = Ω; afís anf

Ω = Ω; anf

afís Ω = 0 , (6.60)

o que prova nosso enunciado. Consideremos então dois estados Φ, Ψ ∈ Ffís :


 

0 = (Φ; QΨ) = Q† Φ; Ψ ⇒ Q† Φ ∈ Ffís . (6.61)

De acordo com o Corolário 3.1-1 (vide a Seç. 3.1), todo operador que age no espaço de Fock
pode ser escrito em função dos operadores de emissão e absorção. Em particular, apliquemos
este resultado ao operador de carga de gauge, Q. Para que ele aniquile todos os estados
físicos, necessariamente todos seus termos devem ter um operador de absorção de partícula
não física à sua direita. Suponhamos agora que um dos seus termos tem um operador de
partícula física à esquerda:

Q ∼ afís anf + · · · (6.62)

Então, aplicando o operador adjunto a um estado físico Φ:

Q† Φ ∼ anf

afís Φ + · · · , (6.63)

que em geral ainda contém partículas físicas, contradizendo o resultado da Eq. (6.61). Assim,
Q não pode conter operadores de emissão de partículas físicas. Um argumento semelhante
prova que o mesmo é válido para os operadores de absorção. ■

Como consequência do Lema 6.1, também Q† só pode conter operadores de emissão e


absorção de partículas não físicas. Este fato, junto com a Eq. (6.61), implica que Q† só pode
eliminar as partículas físicas contidas em Φ ∈ Ffís se aniquila ele por completo: Q† Φ = 0.
Vemos assim que os estados físicos se encontram não só no núcleo de Q, mas também no de
Q† , e a Eq. (6.59) deve ser substituída por:
  n o
Ffís ⊆ Ker( Q) ∩ Ker Q† = Ker Q; Q† . (6.64)

Essa última igualdade pode ser provada considerando que

† 2
 n o 
2
Φ; Q; Q †
Φ = ∥ QΦ∥ + Q Φ = 0 ⇔ QΦ = 0 ∧ Q† Φ = 0 . (6.65)

Se expandirmos as exponenciais da Eq. (6.58) em série de potências do parâmetro λ,


Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 161

obteremos que:

λ2
A′a ( x ) = A a ( x ) − iλ [ Q; A a ( x )] − [ Q; [ Q; A a ( x )]] + O (λ3 ) . (6.66)
2

Segundo o Lema 6.1, o operador Q contém apenas operadores associados a partículas não
físicas, donde decorre que os comutadores que aparecem na Eq. (6.66) são não nulos somente
para as partes não físicas do operador de campo quantizado A a ( x ); ou seja, a transformação
de gauge quântica não modifica a parte dinâmica –física– do operador de campo quantizado,
como era requerido, e todos os observáveis construídos a partir de A a ( x ) terão os mesmos
valores médios no subespaço físico: Essa é a invariância de gauge quântica.

Agora, a carga de gauge Q é qualquer operador construído com os operadores de emissão


e absorção das partículas não físicas, sempre que tenha em todos seus termos, pelo menos,
um operador de emissão à esquerda e um de absorção à direita, pois também Q† deve ter
sempre um operador de absorção à direita:


Q ∼ anf · · · anf + · · · (6.67)

É claro, um termo tão geral assim originaria que o operador de campo A′a ( x ) tenha uma
expansão em operadores compostos. Por simplicidade, desejaremos mantê-lo como um
operador simples, e por isso exigiremos adicionalmente que Q seja quadrático nos operadores
de campo de emissão e absorção.

Para esses operadores gerais, a Eq. (6.64) se satisfaz com o símbolo «⊂»; a igualdade nela
será satisfeita se Q; Q† é um operador que tem todos os operadores de absorção de todas


as partículas não físicas à direita. Busquemos esse operador que permitirá a caracterização
unívoca do subespaço físico, examinando em primeiro lugar a forma geral que o operador
de carga de gauge tem. Para isso, notemos já que o operador Q é sempre quadrático nos
operadores de emissão e absorção –isto é, não pode ter um termo só com um operador–,
de forma que o comutador [ Q; A a ( x )] será sempre uma expressão linear nos operadores de
emissão e absorção de partículas não físicas. Assim sendo, fixemos nossa consideração na
Eq. (6.66). Definimos o operador de campo u( x ) mediante:

i∂ a u( x ) := [ Q; A a ( x )] . (6.68)

Então a Eq. (6.66) adota a forma:

iλ2
A′a ( x ) = A a ( x ) + λ∂ a u( x ) − [ Q; ∂ a u( x )] + O (λ3 ) . (6.69)
2

Segundo a definição dada da transformação de gauge quântica, também o campo transfor-


mado, A′a ( x ), deve satisfazer à equação de Klein-Gordon-Fock. Tendo em vista à Eq. (6.69),
isto só será possível se o operador de campo u( x ) satisfaz à mesma equação:

□u ( x ) = 0 . (6.70)
162 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

Logo, este operador de campo tem a seguinte solução:

←→y
Z
u( x ) = u ( y ) ∂ − D ( y − x ) d3 y . (6.71)
y+ =y0+

A partir dessa equação:


Z
y y
i∂ a u( x ) = i∂ ax u ( y ) ∂ − D ( y − x ) − ∂ − u ( y ) D ( y − x ) d3 y


y+ =y0+
Z  
y y
= ∂by (igab D (y − x )) ∂− u(y) − u(y)∂by ∂− (igab D (y − x )) d3 y , (6.72)
y+ =y0+

expressão na qual identifica-se a relação de comutação do operador de campo quantizado


estendido dado na Eq. (6.10); substituindo-a:
 
←→
Z
i∂ a u( x ) =  ∂b Ab (y) ∂ − u(y)d3 y; A a ( x ) . (6.73)
 

y+ =y0+

Reconhecemos assim, por comparação com a Eq. (6.68), que o operador de carga de gauge
tem a seguinte expressão:

←→
Z
Q= ∂ a A a ( x ) ∂ − u ( x ) d3 x . (6.74)
x + = x0+

Por outro lado, segundo a Eq. (6.70), o operador de campo u( x ) tem a seguinte solução:
Z  
−3/2
u( x ) = (2π ) dµ( p) c2 ( p)e−ipx + c1† ( p)eipx . (6.75)

Os operadores de campo de emissão e absorção c1 ( p) e c2 ( p) são, por enquanto, desconheci-


dos. Somente sabemos que eles correspondem a partículas não físicas, pois formam parte do
operador de carga de gauge. Reunindo as Eqs. (6.18) e (6.75) na Eq. (6.74) e efetuando uma
integração elementar, obtemos a seguinte expressão para o operador de carga de gauge:

Z
!
Q= ∑ dµ( p) p a ε λ ( p) a aλ ( p)c1† ( p) − ∑ gλτ a†τ ( p)c2 ( p) . (6.76)
λ=+,− τ

Por construção, essa é a expressão quadrática mais geral que pode ter o operador de carga
de gauge. A fórmula recém obtida é crucial, pois nos revela o seguinte: Lembramos que Q
deve ter sempre operadores de absorção à direita. Como isto não acontece no primeiro termo
da Eq. (6.76), devemos comutar aλ ( p) com c1† ( p); mas, ao fazer isso, se c1 ( p) fosse algum
dos a+ ( p) ou a− ( p), então, ao aplicar o comutador, no operador de carga Q apareceria
um termo constante e o dito operador não aniquilaria os estados físicos. Isto é impossível.
Portanto, é preciso estender ainda mais o espaço de Fock para incluir novos operadores
Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 163

c1 ( p) e c2 ( p) e seus adjuntos, associados a partículas não físicas e que são diferentes dos
operadores a+ ( p) e a− ( p). O operador de campo quantizado u( x ), por ser um novo campo
não físico, é chamado «campo fantasma». Como vemos, o campo fantasma é indispensável
para a simetria de gauge quântica.

Uma vez que c1† ( p) corresponde a uma nova partícula, este pode ser simplesmente
comutado com aλ ( p). Disto na Eq. (6.76) decorre que:

Z
!
Q= ∑ dµ( p) p a ε λ ( p) a c1† ( p) aλ ( p) − ∑ gλτ a†τ ( p)c2 ( p) . (6.77)
λ=+,− τ

Coloquemos agora a forma explícita, obtida no Cap. 2, dos vetores de polarização do campo
vetorial sem massa, que repetimos aqui:
!
p2 p2⊥
 
a p1 a p1
ε + ( p) = 1; − ; − ; 2 , ε 1 ( p) = 0; 1; 0; − , (6.78)
p− p− 2p− p−
 
p2
ε 2 ( p) a = 0; 0; 1; − , ε − ( p) a = (0; 0; 0; 1) . (6.79)
p−

Ter-se-á que:
p2⊥ p2
p a ε + ( p) a = p+ − = , p a ε − ( p) a = p− . (6.80)
2p− 2p−
Introduzindo isto na Eq. (6.77) e levando em conta que na expressão do operador de campo
quantizado do campo vetorial sem massa se satisfaz p2 = 0, obtemos a expressão final:
Z  
Q= dµ( p) p− c1† ( p) a− ( p) − a†+ ( p)c2 ( p) . (6.81)

O operador adjunto é portanto:


Z  

Q = dµ( p) p− a†− ( p)c1 ( p) − c2† ( p) a+ ( p) . (6.82)

Para caracterizar o subespaço físico estamos interessados no anticomutador de Q e Q† ,


como se depreende da Eq. (6.64). Usando as Eqs. (6.81) e (6.82):
n o Z n o n o
Q; Q† dµ( p)dµ(q) p− q−
= c1† ( p) a− ( p); a†− (q)c1 (q) + a†+ ( p)c2 ( p); a†− (q)c1 (q)
Z  n o h i
= dµ( p)dµ(q) p− q− a†− (q) c1 (q); c1† ( p) a− ( p) + c1† ( p) a†− (q); a− ( p) c1 (q)
n o h i 
+ a†+ ( p) c2 ( p); c2† (q) a+ (q) + c2† (q) a†+ ( p); a− (q) c2 ( p)
Z 
= dµ( p)dµ(q) p− q− 2p− δ( p − q)c1† ( p)c1 ( p) + 2p− δ( p − q)c2† ( p)c2 ( p)
n o n o 
+ a†− (q) c1 (q); c1† ( p) a− ( p) + a†+ ( p) c2 ( p); c2† (q) a+ (q) . (6.83)

Os dois primeiros termos dessa expressão têm a forma desejada. Para os dois últimos, se
c1 ( p) e c2 ( p) fossem operadores bosónicos, então o anti-comutador Q; Q† apresentaria

164 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

termos do tipo a†− (q)c1† ( p)c1 (q) a− ( p), e então haveria estados não físicos aniquilados por
este anti-comutador –por exemplo, o estado de uma partícula de polarização ε − –. Em
princípio, então, não existe motivo para desconsiderar os campos fantasma bosónicos, pois
eles geram transformações de gauge quânticas perfeitamente admissíveis. Todavia, uma
transformação de gauge semelhante, por deixar invariantes alguns estados não físicos, não
exprime por completo a invariância da teoria. É assim que é mais conveniente que o campo
quantizado u seja um campo fermiônico, cujos operadores de campo de emissão e absorção
estão sujeitos às regras de anti-comutação:
n o n o
c1 ( p); c1† (q) = 2p− δ( p − q) , c2 ( p); c2† (q) = 2p− δ( p − q) . (6.84)

E o operador do campo quantizado satisfaz [vide a Eq. (3.120)]:

{u( x ); ue(y)} = −iD ( x − y) . (6.85)

O campo ue( x ) é chamado campo «anti-fantasma». Assim sendo, a Eq. (6.83) adota a forma
final:
n o Z  
Q; Q† = dµ( p) p2− a†− ( p) a− ( p) + a†+ ( p) a+ ( p) + c1† ( p)c1 ( p) + c2† ( p)c2 ( p) . (6.86)

Então, agora sim, podemos afirmar:


n o
Ffís = Ker Q; Q† . (6.87)

Também, como resultado da Eq. (6.81), por cálculo direto, é imediato observar que o operador
de carga de gauge é nilpotente:

1
Q2 = { Q; Q} = 0 . (6.88)
2

Recapitulando os resultados até agora obtidos, a imposição de que o operador de carga


de gauge aniquile todos os estados físicos implicou a necessidade de expandir o espaço de
Fock para conter um novo tipo de partículas, chamadas fantasma, e que elas devem ter a
estatística fermiônica com a finalidade de que as transformações de gauge afetem ao setor
não físico inteiro, exprimindo assim a simetria completa da teoria. Voltando à Eq. (6.69),
isto tem como consequência que o parâmetro λ da transformação de gauge quântica seja
um número de Grassmann4 , e então a série acaba no termo linear em λ: A transformação de
gauge quântica do operador F ( x ), contendo operadores de campo de gauge, fantasmas e
anti-fantasmas, é exatamente:

F ′ ( x ) = e−iλQ F ( x )eiλQ = F ( x ) − iλQF ( x ) + iF ( x )λQ . (6.89)

4 Essanomenclatura, evidentemente, é inexata, pois é a operação de multiplicação que se define como não-
comutativa, e não os números em si mesmos. O nome «número de Grassmann», contudo, é usado para indicar
que seu produto segue tal regra.
Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 165

Como λ é um número de Grassmann, não podemos simplesmente comutá-lo com F ( x ) no


último termo da Eq. (6.89); para colocá-lo à esquerda de F ( x ) teremos de colocar um sinal
(−1)nF , com n F o chamado «número fantasma» do operador F ( x ), igual à diferença entre
o número de campos fantasma e o de campos anti-fantasma nele contidos. Assim sendo,
definimos a «variação de gauge» do operador F ( x ) como:

dQ F ( x ) := [ Q; F ( x )](−1)nF +1 . (6.90)

Da Eq. (6.89) decorre assim que o operador transformado é exatamente:

F ′ ( x ) = F ( x ) − iλdQ F ( x ) . (6.91)

E dessa equação observamos que, necessariamente, dQ muda a estatística do operador F ( x ),


de forma que λdQ F ( x ) mantenha a estatística de F ( x ).

Estudemos finalmente algumas propriedades da variação de gauge dQ . Primeiramente,


por cálculo direto, estudando as diferentes estatísticas que podem ter os operadores F e G,
prova-se que a variação de gauge satisfaz à seguinte regra:

dQ ( F ( x ) G (y)) = (dQ F ( x )) G (y) + (−1)nF F ( x )(dQ G (y)) . (6.92)

Em segundo lugar, como dQ muda a estatística do operador ao qual se aplica, seu quadrado
pode ter uma das seguintes formas:

d2Q = [ Q; { Q; •}] = Q2 • + • Q2 ou d2Q = { Q; [ Q; •]} = Q2 • − • Q2 . (6.93)

Em qualquer caso, a nilpotência do operador de carga de gauge [Eq. (6.88)] implica a


nilpotência da variação de gauge:
d2Q = 0 . (6.94)

Em terceiro lugar, encontramos as variações de gauge dos operadores de campo quantizado.


Da definição da Eq. (6.68):
dQ A a± = i∂ a u± . (6.95)

Da Eq. (6.96) e usando que {u; u} = 0:

dQ u = 0 . (6.96)

E da Eq. (6.74) em conjunto com a regra de anticomutação da Eq. (6.85):

dQ ue± = −i∂ a A a± . (6.97)

E, por último, com a ajuda das variações de gauge explícitas recém encontradas, estabelece-
remos o seguinte resultado [118]:
166 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

Lema 6.2: Seja G um monômio de Wick que contém campos de gauge, A, fantasmas, u, e anti-
fantasmas, ue. A variação de gauge do monômio G comuta com seu ordenamento normal:

dQ : G : = : dQ G : . (6.98)

Prova: A prova será por indução matemática. Para G contendo um único campo, o
resultado é trivial, pois, nesse caso, : G : = G. Suponhamos agora o resultado válido para
um monômio G constituído por n operadores de campo quantizado, e suponhamos que
para ele o lema é válido. Vejamos se ele ainda se satifaz quando é adicionado mais um
campo quantizado, que pode ser A a , u ou ue. Em qualquer caso, denotemos por F o campo
quantizado adicionado, e por n F seu número fantasma. Usando a definição de produto
normalmente ordenado:

: FG : = F+ : G : +(−1)nF nG : G : F− . (6.99)

Logo, da Eq. (6.92) e usando a hipótese indutiva, teremos que:

dQ : FG : =(dQ F+ ) : G : +(−1)nG (nF +1) : G : dQ F−


+ (−1)nF F+ : dQ G : +(−1)nF nG : dQ G : F− . (6.100)

Mas, como dQ preserva a estrutura de frequência positiva e a de frequência negativa, como


pode-se ver nas Eqs. (6.95)-(6.97):
 
dQ : FG : = : (dQ F+ ) G : +(−1)nG (nF +1) : G (dQ F− ) :
 
+ (−1)nF : F+ (dQ G ) : +(−1)(nG +1)nF : (dQ G ) F− : . (6.101)

E já que a variação de gauge dQ muda a estatística do operador sobre o qual age, reconhece-
mos que cada um dos parênteses acima é um dos seguintes termos:

dQ : FG : = : (dQ F ) G : +(−1)nF : F (dQ G ) : = : dQ ( FG ) : . ■ (6.102)

6.5 Invariância de gauge quântica do operador de espalhamento


Nessa seção precisaremos o conceito da invariância de gauge quântica, já sugerido nos
comentários após a Eq. (6.66), e que se refere à independência das grandezas físicas em re-
lação ao processo de extensão do espaço de Fock5 . No caso particular da TPC, a grandeza
física que se deseja construir é a amplitude de transição entre dois vetores do subespaço fí-
sico. Assim, devemos admitir como definição [118]:

5 Este tipo de simetrias aparece com frequência na física; exemplos disto são o princípio da covariância geral

e o princípio da invariância de gauge clássico. Em todas essas versões, o que prima é a independência da física
em relação aos métodos artificiais que o homem inventa para seu estudo –nos casos supracitados, os sistemas de
coordenadas no espaço-tempo, no espaço das variáveis internas, et cetera–.
Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 167

Definição: Seja P o operador de projeção sobre o subespaço físico Ffís do espaço de Fock. Duas
funcionais operador-valuadas de espalhamento S( g) e S′ ( g) são chamadas fisicamente equivalentes se:

∀ Φ, Ψ ∈ F : lim (Φ; PS( g) PΨ) = lim Φ; PS′ ( g) PΨ



, (6.103)
g →1 g →1

sempre que o limite adiabático exista.

Nesta definição, o operador de espalhamento é entendido como um funcional operador-


valuado da função de comutação adiabática porque a equivalência física, em primeira ins-
tância, só pode ser estabelecida entre grandezas físicas, de forma que a igualdade deve
ser exigida no limite adiabático; com efeito, somente no limite adiabático a forma bilinear
(Φ; PS( g) PΨ) tem significado físico. A definição oferecida pressume que tal limite existe,
ao menos, fracamente. Embora o problema da existência do limite adiabático está longe de
ser trivial6 , os diversos resultados existentes na literatura permitem pressumir sua existên-
cia, pelo menos, em uma grande variedade de casos de interesse, de forma que doravante
será possível eliminar a dependência com a função de comutação adiabática e formular a
equivalência física como uma condição diretamente aplicada às distribuições de transição.
Isto, além do mais, evita a necessidade de conhecer os operadores de espalhamento com-
pletos: numa teoria como a TPC, é preferível ter uma versão perturbativa da equivalência
física. Com esse fim, coloquemos na Eq. (6.103) a série formal que define o operador de
espalhamento, que, lembremos, é:

+∞
1
Z
S( g) = 1 + ∑ n! dXTn ( X ) g( X ) . (6.104)
n =1

Então a equivalência dos operadores S( g) e S′ ( g) significa que a seguinte equação é válida


–o limite é fraco no sentido da Eq. (6.103)–:

+∞
1
Z
∑ n! w- glim dX PTn ( X ) P − PTn′ ( X ) P g( X ) = 0

. (6.105)
n =1
→1

Definição: Os operadores de espalhamento S( g) e S′ ( g) são (perturbativamente) fisicamente


equivalentes na ordem n se suas correspondentes distribuições de transição Tn da ordem n satisfazem:
Z
dX PTn ( X ) P − PTn′ ( X ) P g( X ) = 0

w- lim , (6.106)
g →1

sempre que o limite adiabático exista na ordem n da série perturbativa.

6É justo mencionar aqui alguns resultados referentes à existência do limite adiabático. Epstein e Glaser
provaram que ele existe fracamente [103] e ainda fortemente [202] no caso de teorias em que todos os campos
possuem massa não nula (esse é o caso, por exemplo, do modelo de Yukawa antes estudado, em que o limite
adiabático é trivial), enquanto que Blanchard e Seneor provaram que ele existe fracamente para as funções de
Green para teorias em que alguns dos campos são não massivos (particularmente, para a QED e para teorias do
tipo λ : φ2n : ) [203]. Recentemente, Duch provou que o limite adiabático fraco existe para as funções de Green e
de Wightman para teorias gerais com termos de interação de dimensão canônica igual a quatro [204].
168 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

A Eq. (6.106) tem a solução geral PTn ( X ) P = PTn′ ( X ) P + ∂(· · · ), com ∂(· · · ) significando
«a divergência da quantidade (· · · )». Com efeito, a integração por partes implica que, em
tais circunstâncias, o lado esquerdo da Eq. (6.106) é igual a:
Z
w- lim dX (· · · )∂g( X ) , (6.107)
g →1

o qual é nulo no limite adiabático em que g se torna constante. Por outro lado, na construção
PTn ( X ) P, Tn ( X ) está definido módulo uma variação de gauge, pois devido à Eq. (6.87):
PQ = 0 = QP, e, como consequência: PdQ XP = PQX − XQP = 0. Como resultado, temos
que as distribuições Tn e Tn′ são fisicamente equivalentes se elas se diferenciam por termos
que são divergências ou variações de gauge. Isto o denotamos com o símbolo «∼»:

Tn′ ∼ Tn :⇔ Tn′ = Tn + dQ (· · · ) + ∂(· · · ) . (6.108)

Assim sendo, os elementos de matriz do operador S( g) no subespaço físico, em qualquer


ordem, são trivialmente invariantes de gauge quânticos, pois a variação de gauge dQ Tn é fisi-
camente equivalente à distribuição nula: 0 ∼ dQ Tn . A invariância de gauge da distribuição
T1 ( x ), portanto, está garantida qualquer que ela seja. Mas isso não é suficiente: A constru-
ção de T1 ( x ) deve ser feita de tal forma que a distribuição T2 ( x1 ; x2 ) construída com ele seja
fisicamente equivalente à T2′ ( x1 ; x2 ) construída com T1′ ( x ) = T1 ( x ) − iλdQ T1 ( x ). Essa é uma
condição de consistência. E o mesmo deve ser válido para as ordens superiores. Em uma
palavra, devemos impor que a invariância de gauge quântica não seja destruída no processo
indutivo da TPC –isto é, que nenhuma anomalia irremovível apareça nas ordens superiores–.

Definição: Uma teoria de interação com primeiro termo T1 ( x ) é uma teoria de gauge quântica
se ela é fisicamente equivalente à teoria com primeiro termo T1 ( x ) − iλdQ T1 ( x ), em todas as ordens
da série perturbativa.

Comecemos por estudar a distribuição de transição da segunda ordem, T2 ( x1 ; x2 ). Intro-


duzamos a seguinte notação: T1 ( x ) = T10 ( x ) − iλdQ T10 ( x ); T20 ( x1 ; x2 ) é a distribuição de dois
pontos que provém de T10 ( x ); T2 ( x1 ; x2 ) a que provém de T1 ( x ), e assim por diante. Como já
sabemos, sua construção inicia com as distribuições:

A2′ ( x1 ; x2 ) = − T1 ( x1 ) T1 ( x2 ) , R2′ ( x1 ; x2 ) = − T1 ( x2 ) T1 ( x1 ) . (6.109)

Substituindo nelas a expressão de T1 ( x ) e formando a distribuição causal da segunda ordem,


D2 = R2′ − A2′ , obtemos que:

D2 ( x1 ; x2 ) = D20 ( x1 ; x2 ) − iλdQ D20 ( x1 ; x2 ) + 2iλT10 ( x1 )dQ T10 ( x2 ) − 2iλT10 ( x2 )dQ T1 ( x1 ) .


(6.110)

Dessa distribuição se obtém a parte retardada, R2 ( x1 ; x2 ), por meio do procedimento de


Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 169

divisão exposto no Cap. 4. Obtemos:

R2 ( x1 ; x2 ) = R02 ( x1 ; x2 ) − iλdQ R02 ( x1 ; x2 ) + 2iλret T10 ( x1 )dQ T10 ( x2 ) − T10 ( x2 )dQ T10 ( x1 ) ,


(6.111)

com ret {· · · } significando «a parte retardada de {· · · }». A distribuição de dois pontos,


T2 = R2 − R2′ , é assim:

T2 ( x1 ; x2 ) = T20 ( x1 ; x2 ) − iλdQ T20 ( x1 ; x2 )


+ 2iλ ret T10 ( x1 )dQ T10 ( x2 ) − T10 ( x2 )dQ T10 ( x1 ) − T10 ( x2 )dQ T10 ( x1 ) .
 
(6.112)

Daqui decorre que T2 será fisicamente equivalente a T20 se e somente se a segunda linha da
Eq. (6.112) é igual a uma variação de gauge ou a uma divergência. A primeira possibilidade
se realiza se T10 ( x ) é uma variação de gauge, T10 ( x ) = dQ (· · · ), o que leva à anulação da
segunda linha; esse caso não tem interesse físico, pois então T10 se equivale fisicamente com
a distribuição nula. A segunda possibilidade ocorre quando a variação de gauge de T10 ( x ) é
igual a uma divergência:
a
dQ T10 ( x ) = i∂ a T1/1 (x) , (6.113)
a ( x ) será dado o nome «vértice-Q». Destarte, a teoria se mantém
em que à distribuição T1/1
invariante de gauge na segunda ordem: T2 ∼ T20 . Pelo exposto, a Eq. (6.113) é uma condição
necessária em toda teoria de gauge quântica. Ela implica, também, que T1 ( x ) é invariante de
gauge como forma bilinear não só no subespaço físico, senão em todo o espaço de Fock.

Para determinar se a Eq. (6.113) é também uma condição suficiente para que a teoria seja
invariante de gauge quântica, devemos examinar as seguintes ordens na série perturbativa,
o que será mais fácil se primeiro estudarmos suas consequências. Como foi provado no Cap.
4, as distribuições de n pontos são, sempre que as coordenadas x1 , · · · , xn correspondam
a tempos todos diferentes, produtos cronológicos –temporalmente ordenados segundo a
coordenada x + –:
Tn ( x1 ; · · · ; xn ) = T+ { T1 ( x1 ) · · · T1 ( xn )} . (6.114)

Como cada T1 tem caráter bosónico, ao aplicar o operador de variação de gauge a Tn


obteremos:
dQ Tn = ∑ T+ {T1 (x1 ) · · · dQ T1 (xl ) · · · T1 (xn )} . (6.115)
l ∈ In

E com a Eq. (6.113):

∑ ∂a Tn/l
a xl a
 a

dQ Tn = i ( x1 ; · · · ; x n ) ; Tn/l := T+ T1 ( x1 ) · · · T1/1 ( xl ) · · · T1 ( xn ) . (6.116)
l ∈ In

De forma geral, a distribuição T1 ( x ) um polinômio de Wick:

p
T1 ( x ) = T10 ( x ) + T11 ( x ) + · · · + T1 ( x ) , (6.117)
170 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

j
com cada T1 ( x ) um monômio de Wick. Levando em consideração a Eq. (6.114), então, a
distribuição Tn ( x1 ; · · · ; xn ) tem em geral a seguinte forma:

Tn ( x1 ; · · · ; xn ) = ∑ Tni1 ···in ( x1 ; · · · ; xn ) ; (6.118)


i1 ,··· ,in ∈ I p,0

i
com o superíndice i j indicando a distribuição de um ponto T1j que corresponde ao ponto x j ,
isto é:
i
n o
Tni1 ···in ( x1 ; · · · ; x n ) : = T+ T1i1 ( x1 ) · · · T1j ( x j ) · · · T1in ( xn ) . (6.119)

Sendo assim, já podemos estabelecer os seguintes resultados, dados em forma geral e que
conterão, como um caso particular, a desejada suficiência da Eq. (6.113) para que a teoria
seja invariante de gauge quântica. Estes resultados são uma generalização do nosso estudo à
segunda ordem para ordens superiores. Eles foram dados pela primeira vez por Dütsch na
Ref. [120], e podem também ser consultados na Ref. [118].

Teorema 6.3: Seja T1 ( x ) uma distribuição da forma:

T1 ( x ) = T10 ( x ) + T12 ( x ) ; T12 ( x ) = ∂ a T14a ( x ) . (6.120)

Se a variação de gauge de T10 ( x ) é uma divergência,

dQ T10 ( x ) = i∂ a T11a ( x ) , (6.121)

então, na notação da Eq. (6.119):

Tn ( x1 ; · · · ; xn ) = Tn0···0 ( x1 ; · · · ; xn ) + ∂(· · · ) . (6.122)

Prova: Com a distribuição T1 ( x ) da Eq. (6.120), na Eq. (6.118) os índices i j só podem


tomar os valores 0, 2. O teorema estará provado, então, se demonstrarmos que todo termo
de Tn contendo r distribuições T12 e n − r distribuições T10 é uma divergência:

Tn2···20···0 = ∂ ax11 · · · ∂ axrr Tn4···40···0 . (6.123)

Usaremos o método de indução matemática completa. O caso n = 1 é a própria definição do


problema, Eq. (6.120). Suponhamos agora que a Eq. (6.123) é válida para todo m ≤ n − 1.
Para estudar a ordem n, construímos as distribuições –escrevemos X = { x1 ; · · · ; xn }–:

i ···in
A′ n1 ( x1 ; · · · ; x n ) = ∑ eni1 ···in1 ( I ) Tnin−1 +n1 ···in ( J; xn )
T , (6.124)
1 1
I ∪ J =X
I ∩ J =∅
I ̸=∅

i ···in in +1 ···in i ···in1


R′ n1 ( x1 ; · · · ; x n ) = ∑ Tn−1 n1 en1
( J; xn ) T 1
(I) . (6.125)
I ∪ J =X
I ∩ J =∅
I ̸=∅
Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 171

Por hipótese indutiva, as distribuições Tm que aparecem nessas equações são da forma da
Eq. (6.123). E como as T
em são construídas com elas segundo a equação

em ( X ) =
T ∑ (−1)r ∑ Tm1 ( X1 ) · · · Tmr ( Xr ) , (6.126)
r ∈ Im X1 ∪···∪ Xr = X
Xi ∩ X j =∅, ∀i ̸= j
X j ̸=∅, ∀i

também possuirão essa forma. O fato de que as partições que aparecem nessas expressões
sejam disjuntas permite, ademais, extrair a divergência e colocar o sinal de derivada na
frente do produto inteiro. Daqui se obtém:

2···20···0 4···40···0 2···20···0 4···40···0


A′ n = ∂ ax11 · · · ∂ axrr A′ n , R′ n = ∂ ax11 · · · ∂ axrr R′ n . (6.127)

E em consequência o mesmo é válido para a distribuição causal:

Dn2···20···0 = ∂ ax11 · · · ∂ axrr Dn4···40···0 . (6.128)

A divisão dessa distribuição causal pode ser feita assim: Seja R4n···40···0 a parte retardada de
Dn4···40···0 . Como a derivação não muda o suporte causal da distribuição –ou, se se prefere,
por virtude do Teorema 4.7–, então uma solução ao problema da divisão de Dn2···20···0 será:

R2n···20···0 = ∂ ax11 · · · ∂ axrr R4n···40···0 . (6.129)

Das Eqs. (6.127) e (6.129) segue que a distribuição de n pontos tem a forma desejada:

2···20···0
Tn2···20···0 = R2n···20···0 − R′ n
 
4···40···0
= ∂ ax11 · · · ∂ axrr R4n···40···0 − R′ n
= ∂ ax11 · · · ∂ axrr Tn4···40···0 . ■ (6.130)

O Teorema 6.3 diz que qualquer termo de divergência na distribuição inicial T1 ( x ) pode
ser desconsiderado, pois ao se fazer isso o resultado é fisicamente equivalente, em todas as
ordens da série perturbativa, àquele obtido ao considerar dita divergência7 . Em particular,
isto é válido para a divergência do vértice-Q, o que significa que a condição da Eq. (6.113) é
suficiente para a invariância de gauge quântica em todas as ordens.

Teorema 6.4: Seja T1 ( x ) uma distribuição da forma:

T1 ( x ) = T10 ( x ) + T13 ( x ) ; T13 ( x ) = dQ T15 ( x ) . (6.131)

7 Este resultado poder-se-ia considerar a contraparte quântica correspondente àquela observação na teoria
clássica segundo a qual os termos de superfície na densidade lagrangiana podem ser desconsiderados, sempre
que as condições assintóticas de desaparecimento dos campos no infinito estejam em vigor.
172 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

Se para todo n ∈ N a variação de gauge de Tn0···0 é uma divergência,

dQ Tn0···0 = ∂(· · · ) , (6.132)

então Tn e Tn0···0 são fisicamente equivalentes:

Tn ( x1 ; · · · ; xn ) = Tn0···0 ( x1 ; · · · ; xn ) + ∂(· · · ) + dQ (· · · ) . (6.133)

Prova: A prova do Teorema 6.4 segue o mesmo roteiro que a do 6.3. Com a distribuição
T1 ( x ) da Eq. (6.131), na Eq. (6.118) os índices i j só podem tomar os valores 0, 3. Provaremos
desta vez que todo termo de Tn contendo r distribuições T13 e n − r distribuições T10 é da
forma:
Tn3···30···0 = ∂(· · · ) + dQ (· · · ) . (6.134)

Usaremos para isto o método de indução matemática completa. O caso n = 1 está contido
na Eq. (6.131). Nossa hipótese indutiva é que a Eq. (6.134) é válida para todo m ≤ n − 1.
Comecemos por estudar as distribuições subsidiárias da ordem n quando está presente só
uma distribuição T13 no ponto x1 –denotamos X ′ = { x2 ; · · · ; xn−1 }–:

30···0
A′ n ( x1 ; · · · ; x n ) = ∑ en30···0 ( x1 ; I ) Tn0−
T 1
···0
n1 ( J; xn ) + ∑′ en0···0 ( I ′ ) Tn30−···n 0 ( x1 ; J ′ ; xn ) ,
T 1 1
I ∪ J =X′ I ′ ∪ J =X′
I ∩ J =∅ I ′ ∩ J ′ =∅
I ′ ̸=∅
(6.135)
30···0
R ′ n ( x1 ; · · · ; xn ) = ∑ ···0
Tn0− e30···0 ( x1 ;
n1 ( J; xn ) Tn1 I) + ∑ Tn30−···n10 ( x1 ; J ′ ; xn ) T
en0···0 ( I ′ )
1
.
I ∪ J =X′ I ′ ∪ J ′ =X′
I ∩ J =∅ I ′ ∩ J ′ =∅
I ′ ̸=∅
(6.136)
Por hipótese indutiva, as distribuições Tm30···0 e as em30···0
T [vide a Eq. (6.126)] que aparecem
nessas equações são da forma da Eq. (6.134). Novamente, como as partições que aparecem
nessas expressões são disjuntas, podemos extrair a divergência e colocá-la na frente da
expressão. Assim fazendo e usando a regra de variação de gauge de um produto dada na Eq.
(6.92):
h  
30···0
A′ n = ∑ dQ Z en Tn0−···0 0···0

n1 + Zn1 d Q Tn−n1
e
1
    i
+dQ Ten0···0 Zn−n − dQ T en0···0 Zn−n + ∂(· · · ) . (6.137)
1 1 1 1

Usando a Eq. (6.132) vemos que todos os termos são, quer divergências, quer variações de
gauge, então podemos escrever:

30···0
A′ n = dQ Z1 + ∂Z2 . (6.138)

Analogamente, tem-se que:


30···0
R′ n = dQ Z3 + ∂Z4 , (6.139)
Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa 173

e portanto o mesmo acontece com a distribuição causal:

30···0 30···0
Dn30···0 = R′ n − A′ n = dQ Z5 + ∂Z6 . (6.140)

Daqui se obtém que Tn30···0 tem a forma desejada, pois a divisão da distribuição causal pode
ser feita dividindo Z5 e Z6 . O mesmo processo é válido se se tem mais de uma distribuição
T13 . Por exemplo, consideremos o caso com duas distribuições; seguindo os mesmos passos
dados na análise anterior:
h i
330···0
A′ n =∑ T e330···0 T 0···0 + T
e30···0 T 30···0 + T
e0···0 T 330···0
h    i
= ∑ dQ Z
e T 0···0 + dQ Z e (dQ Z ) + T e0···0 (dQ Z ) + ∂(· · · )
h          i
= ∑ dQ ZT
e 0···0 + dQ ZZ e + dQ T e0···0 Z + Z e dQ T 0···0 − dQ T
e0···0 Z + ∂(· · · )

= dQ (· · · ) + ∂(· · · ) .

330···0
É patente que o mesmo acontece com a distribuição R′ n , e então com a correspondente
distribuição causal. Finalmente, outro tanto ocorre à distribuição Tn330···0 que se obtém com
as anteriores. É já evidente que este procedimento é válido em geral. ■

Note-se que a condição da Eq. (6.132) é sempre respeitada uma vez que T1 ( x ) seja
apropriadamente escolhida [vide a Eq. (6.116)], caso as coordenadas corresponderem a
tempos diferentes. Mas, o que acontecerá quando dois pontos ou mais corresponderem a
tempos iguais? Nesse caso a Eq. (6.116) já não é válida, o que nos obriga a estabelecer o
seguinte enunciado: Em uma teoria de gauge quântica, os termos de T1 ( x ) que são variações
de gauge podem ser desconsideradas, sem isso trazer consequências nos resultados físicos,
se e somente se os termos instantâneos que alteram o cumprimento da Eq. (6.116) a tempos
iguais podem ser compensados no processo de normalização. Eis que a invariância de gauge
quântica é uma condição física adicional para a normalização das soluções ao problema de
divisão da distribuição causal.

6.6 Unitariedade do operador de espalhamento


no subespaço físico

Existe ainda um ponto a ser esclarecido, e é o fato de que a extensão do espaço de


Fock e a invariância de gauge quântica sejam compatíveis com o axioma da unitariedade
do operador de espalhamento. Essa unitariedade, sendo uma propriedade física, apenas
precisa ser mantida no subespaço físico Ffís . No espaço de Fock completo, no entanto, ainda
é possível exigir a pseudo-unitariedade segundo a involução «K» definida na Seç. 6.3, e
segundo a qual o campo de gauge é pseudo-auto-adjunto: A a ( x )K = A a ( x ). Essa operação
deve ainda ser estendida de tal forma que a referida propriedade seja mantida pelo campo
de gauge uma vez que ele seja transformado por alguma transformação de gauge quântica
174 Capítulo 6. Invariância de gauge quântica para campos de gauge sem massa

como na Eq. (6.69); isso é possível se o campo fantasma u( x ), cuja expressão é dada na Eq.
(6.75), é também pseudo-auto-adjunto segundo «K», o que é verdade se:

c1K ( p) = c2† ( p) e c2K ( p) = c1† ( p) . (6.141)

Adotando essas expressões, a Eq. (3.120) implica que o campo anti-fantasma é anti-pseudo-
auto-adjunto segundo «K»: ue( x )K = −ue( x ). Ademais, os campos em questão agora podem
ser escritos na seguinte forma:
Z  
−3/2
u( x ) = (2π ) dµ( p) c2 ( p)e−ipx + c2K ( p)eipx ; (6.142)

Z  
−3/2
ue( x ) = (2π ) dµ( p) −c1 ( p)e−ipx + c1K ( p)eipx . (6.143)

Ora, é possível imediatamente enunciar o teorema a seguir, pois sua prova é idêntica
àquela mostrada na Seç. 4.8.

Teorema 6.5: Seja T1 ( x ) a distribuição de um ponto de uma teoria de gauge quântica. Se T1


satisfaz à condição de pseudo-unitariedade perturbativa:

e1 ( x ) = T1 ( x )K
T , (6.144)

então as distribuições de n pontos podem ser construídas, pelo procedimento indutivo da TPC, de
forma a satisfazer à mesma condição de pseudo-unitariedade.

Concluímos que o procedimento de extensão do espaço de Fock para facilitar o trata-


mento das teorias com campos vetoriais sem massa e a implementação da correspondente
invariância de gauge quântica que semelhante extensão produz são satisfatórios.
Capítulo 7

Eletrodinâmica quântica fermiônica

Neste capítulo estudaremos a teoria de gauge do campo eletromagnético. Nela existe


apenas um campo de gauge, A a , associado aos fótons, e em consequência deveremos con-
siderar um só campo fantasma, u, e seu correspondente anti-fantasma, ue. A constante de
acoplamento será denotada por e em referência à carga elétrica. O campo de matéria a ser
acoplado ao campo da radiação será o campo de Dirac, descrevendo algum par lépton–anti-
lépton (por exemplo, o elétron e o pósitron).

7.1 Construção do primeiro termo pela invariância


de gauge quântica
Começaremos examinando a possibilidade da existência de termos de auto-interação
entre os fótons, isto é, queremos ver se existe uma distribuição T1 ( x ) para a teoria eletro-
magnética sem matéria, construída com os operadores de campo A a ( x ), u( x ) e ue( x ), e que
satisfaça às condições de (1) invariância de Lorentz, (2) número fantasma nulo, (3) pseudo-
unitariedade e (4) variação de gauge igual a uma divergência. As condições (1), (3) e (4) não
requerem uma explicação. Quanto à condição (2), ela implica que os campos fantasma e anti-
fantasma apareçam sempre em pares. Isto é necessário porque, como foi mostrado no Cap.
3, somente a combinação destes dois campos pode dar lugar a leis causais, o que não seria
possível prevalecendo um campo sobre o outro. Além disto, a distribuição T1 ( x ) deve ter ca-
ráter bosónico, propriedade essa que se extrapola do caso clássico: Quantidades observáveis,
como o tensor de energia-momento, se constroem a partir da densidade lagrangiana1 .
Considerando acoplamentos trilineares –acoplamentos de maior número de campos,
proporcionais a potências maiores da constante de acoplamento, devem ser gerados no
processo indutivo–, como todos os índices de Lorentz devem estar contraídos devido à
condição (1), somente poderá estar presente, no máximo, uma derivada em cada termo.
Assim, a expressão mais geral que respeita aos requerimentos anteriores é:
n
T1 ( x ) =ie f 1 : A a Ab ∂b A a : + f 2 : A a A a ∂b Ab : + f 3 : A a u∂ a ue :
o
+ f 4 : ∂ a A a uue : + f 5 : A a ∂ a uue : . (7.1)

Sendo que a constante de acoplamento e é real, a condição (3) implica que também os

1 Isto
pode também ser justificado no âmbito quântico sem recorrer ao clássico. Com efeito, as variáveis
dinâmicas locais podem ser construídas a partir do operador de espalhamento estendido [100]; em particular, o
hamiltoniano generalizado de interação, cujo primeiro termo é a distribuição T1 ( x ).

175
176 Capítulo 7. Eletrodinâmica quântica fermiônica

coeficientes f j o sejam, uma vez que a pseudo-unitariedade perturbativa à primeira ordem


implica que T1 ( x )K = T e1 ( x ) = − T1 ( x ). Usando as Eqs. (6.95)-(6.97), assim como a regra
da Eq. (6.92) e o fato já provado de que a variação de gauge comuta com o ordenamento
normal (Lema 6.2), calculamos a variação de gauge de T1 ( x ), que, após o uso da equação do
movimento do operador de campo fantasma, □u = 0, resulta ser igual a:
n
dQ T1 = −e f 1 : ∂ a uAb ∂b A a + A a ∂b u∂b A a + A a Ab ∂b ∂ a u : + f 2 : 2∂ a uA a ∂b Ab :
o
+ f 3 : ∂ a uu∂ a ue + A a u∂ a ∂b Ab : + f 4 : ∂ a A a u∂b Ab : + f 5 : A a ∂ a u∂b Ab + ∂ a u∂ a uue : . (7.2)

O último termo nessa equação é nulo, pois contém ao operador nulo ∂ a u∂ a u (lembrando que
o campo fantasma possui caráter fermiônico). Desconsiderando-o e agrupando termos:
n
dQ T1 = −e f 1 : ∂ a uAb ∂ a Ab : + f 1 : ∂ a uAb ∂b A a : + f 1 : ∂ a ∂b uA a Ab : + f 3 : ∂ a uu∂ a ue :
o
+ f 3 : uA a ∂ a ∂b Ab : +(2 f 2 + f 5 ) : ∂ a uA a ∂b Ab : + f 4 : u∂ a A a ∂b Ab : . (7.3)

Como foi estabelecido no Cap. 6, essa variação de gauge tem de ser igual à divergência do
vértice-Q [vide a Eq. (6.113)]. Como na Eq. (7.3) todos os termos são trilineares, contendo,
quer um campo fantasma e dois campos de radiação, quer dois campos fantasma e um anti-
fantasma, e sempre duas derivadas, o vértice-Q deve também estar constituído por esse
tipo de combinações dos campos e conter apenas uma derivada em cada um deles, então
oferecendo à vista a seguinte forma geral:
n
a
iT1/1 =e g1 : ∂ a uAb Ab : + g2 : uAb ∂ a Ab : + g3 : ∂b uAb A a : + g4 : u∂b Ab A a :
o
b a a
: :
+ g5 uA ∂b A + g6 ∂ uuu : e : . (7.4)

Aplicando a divergência e agrupando os termos convenientemente, obtemos:


n
a
i∂ a T1/1 =e (2g1 + g2 ) : ∂ a uAb ∂ a Ab : + g2 : u∂ a Ab ∂ a Ab : + g3 : ∂ a ∂b uA a Ab :

+ ( g3 + g5 ) : ∂ a uAb ∂b A a : +( g3 + g4 ) : ∂ a uA a ∂b Ab : +( g4 + g5 ) : uA a ∂ a ∂b Ab :
o
+ g4 : u∂ a A a ∂b Ab : + g5 : u∂ a Ab ∂b A a : + g6 : ∂ a uu∂ a ue : . (7.5)

Substituindo as Eqs. (7.3) e (7.5) na Eq. (6.113) encontra-se o seguinte conjunto de relações
entre os coeficientes f j e g j :

− f 1 = 2g1 + g2 , − f 1 = g3 + g5 , − f 1 = g3 , − 2 f 2 − f 5 = g3 + g4 ,

− f 3 = g6 , − f 3 = g4 + g5 , − f 4 = g4 , 0 = g2 , 0 = g5 . (7.6)

Desse sistema tem-se que:

f 1 = −2g1 , 2 f 2 + f 5 = −2g1 − g4 , f 3 = − g4 , f 4 = − g4 , (7.7)


Capítulo 7. Eletrodinâmica quântica fermiônica 177

assim como que:


g2 = 0 , g3 = 2g1 , g5 = 0 , g6 = g4 . (7.8)
a
Ou seja, os únicos coeficientes independentes de i∂ a T1/1 são g1 e g4 , e em função deles
podem ser expressados todos os coeficientes de dQ T1 . Para obter seus valores, apliquemos a
variação de gauge à Eq. (6.113) e usemos o fato de que ela é nilpotente [Eq. (6.94)]; obtém-se
dessa forma a equação:
a
idQ ∂ a T1/1 = d2Q T1 = 0 . (7.9)

Substituindo a Eq. (7.8) na (7.5) e aplicando a variação de gauge, obtém-se:


n o
a
idQ ∂ a T1/1 = ie 4g1 : ∂ a uAb ∂ a ∂b u : +4g1 : ∂ a ∂b u∂ a uAb : +2g4 : u∂ a u∂ a ∂b Ab : . (7.10)

A Eq. (7.9) então implica que g1 = 0 = g4 , e o vértice-Q é nulo:

a
iT1/1 =0 . (7.11)

Também, na Eq. (7.7), nosso resultado implica que f 1 , f 3 , f 4 = 0, e que f 5 = −2 f 2 , o qual,


substituído na Eq. (7.1), leva a estabelecer que:
 
T1 ( x ) = ie f 2 : A a A a ∂b Ab − 2A a ∂ a uue : . (7.12)

Sem embargo, essa forma particular de T1 ( x ) é uma variação de gauge exata, então física-
mente equivalente à distribuição nula:

T1 ( x ) = −ie f 2 dQ : A a A a ue : ∼ 0 . (7.13)

Conclui-se que a teoria de um só campo de gauge não tem termos de auto-interação. Sendo
assim, a distribuição de um ponto completa é aquela que contém o acoplamento do campo
de gauge com a matéria:
T1 ( x ) = iej a ( x ) A a ( x ) , (7.14)

com j a ( x ) a corrente dos campos de matéria. Em tal caso, a variação de gauge da distribuição
T1 é igual a

dQ T1 ( x ) = −ej a ( x )∂ a u( x ) = ∂ a (−ej a ( x )u( x )) + e (∂ a j a ( x )) u( x ) , (7.15)

que se reduz a uma divergência sempre que a corrente de matéria seja conservada. Ora, na
TPC todos os operadores de campo quantizado são livres, do que se infere que o acoplamento
corrente-campo de gauge na TPC ocorre com a corrente conservada dos campos de matéria
livres2 . No caso do campo fermiônico, que estudaremos nesse capítulo, a corrente que se

2 Por isso, no caso da SQED, em que a corrente dos campos de matéria livres (campo escalar complexo) é
←→ ←→
−i : φ† ( x ) ∂ a φ( x ) : , a distribuição de transição da primeira ordem é T1 ( x ) = e : φ† ( x ) ∂ a φ( x ) : A a ( x ). Esta
distribuição, vemos, possue apenas a parte linear em e da densidade lagrangiana invariante de gauge usada na
teoria convencional. Do ponto de vista quântico, no entanto, a distribuição T1 é de fato invariante de gauge, pois
178 Capítulo 7. Eletrodinâmica quântica fermiônica

conserva como consequência das equações do movimento dos campos ψ( x ) e ψ( x ) livres


(equações de Dirac) é:
j a ( x ) = : ψ( x )γ a ψ( x ) : . (7.16)

O vértice-Q da QED, portanto, será:

a
T1/1 ( x ) = iej a ( x )u( x ) = ie : ψ( x )γ a ψ( x ) : u( x ) . (7.17)

Antes de começar a realizar cálculos explícitos na QED, vejamos genericamente o que


a invariância de gauge das distribuições de ordem superior, Tn , implica nessa teoria sem
autointeração do campo de gauge. Devido a essa característica, precisamente, em cada ponto
só pode estar presente um único operador de campo de radiação, isto é, a distribuição de
ordem n tem a seguinte forma geral:

Tn ( x1 ; · · · ; xn ) = : Tla ( x1 ; · · · ; xn ) A a ( xl ) : + · · · , (7.18)

em que, nem Tla , nem os pontos suspensivos incluem um outro operador de campo de gauge
no ponto xl , A a ( xl ). Assim sendo, a variação de gauge da distribuição Tn será:

dQ Tn ( x1 ; · · · ; xn ) = i : Tla ( x1 ; · · · ; xn )∂ axl u( xl ) : + · · · , (7.19)

e dessa vez os pontos suspensivos não incluem um outro campo fantasma no ponto xl , u( xl ).
Segundo a Eq. (6.116), que é a condição geral da invariância de gauge da distribuição de
transição da ordem n, a variação de gauge dada na Eq. (7.19) tem de reduzir-se a uma
divergência. A regra de Leibniz das derivadas implica que isto será possível –note-se que o
procedimento segue o mesmo roteiro que na Eq. (7.15)–, e

dQ Tn ( x1 ; · · · ; xn ) = i∂ axl ( : Tla ( x1 ; · · · ; xn )u( xl ) : ) + · · · , (7.20)

sempre que sejam satisfeitas as «identidades-Cg» –do inglês C-number identities for gauge
invariance– da QED:
∂ axl : Tla ( x1 ; · · · ; xn ) : = 0 . (7.21)

Essas equações são válidas em todo ponto xl em que esteja presente um operador de campo
da radiação. Onde não o esteja, a variação de gauge será automaticamente nula, e o termo
correspondente, invariante de gauge. Um estudo detalhado das consequências que se
derivam das identidades-Cg será apresentado na Seç. 7.8, em que provaremos que elas se
equivalem às identidades de Ward-Takahashi.

a ( x ) = e : φ† ( x )←
sua variação de gauge se iguala à divergência do vértice-Q T1/1
→a
∂ φ( x ) : u( x ). A possibilidade
de se encontrar os termos adicionais da teoria lagrangiana como termos de normalização na segunda ordem da
série perturbativa pela invariância de gauge (clássica) foi apontada por Sukhanov na Ref. [143], no contexto da
teoria perturbativa da matriz de espalhamento de Bogoliubov e Shirkov. O tratamento deste problema na TPC
instantânea encontra-se na Ref. [110], e na TPC no plano nulo, na Ref. [148].
Capítulo 7. Eletrodinâmica quântica fermiônica 179

7.2 Distribuição causal da segunda ordem

Como tem sido estabelecido, o primeiro termo na série perturbativa do operador S( g) é


dado pela distribuição de um ponto:

T1 ( x ) = ie : ψ( x )γ a ψ( x ) : A a ( x ) . (7.22)

A construção da distribuição causal da segunda ordem começa com a definição das distri-
buições subsidiárias:

A2′ ( x1 ; x2 ) = T
e1 ( x1 ) T1 ( x2 ) = − T1 ( x1 ) T1 ( x2 ) , (7.23)

R2′ ( x1 ; x2 ) = T1 ( x2 ) T
e1 ( x1 ) = − T1 ( x2 ) T1 ( x1 ) , (7.24)

com as quais:

D2 ( x1 ; x2 ) = R2′ ( x1 ; x2 ) − A2′ ( x1 ; x2 ) = T1 ( x1 ) T1 ( x2 ) − T1 ( x2 ) T1 ( x1 ) . (7.25)

Explicitamente, as distribuições A2′ e R2′ podem-se encontrar por aplicação do teorema de


Wick, com o uso das seguintes contrações:

 1
ψ a ( x )ψb (y) = ψa− ( x ); ψb+ (y) = Sab+ ( x − y) , (7.26)
i
 1
ψ a ( x )ψb (y) = ψ a− ( x ); ψb+ (y) = Sba− (y − x ) , (7.27)
i
A a ( x ) Ab (y) = [ A a− ( x ); Ab+ (y)] = iDab+ ( x − y) . (7.28)

Ter-se-á:

A2′ ( x1 ; x2 ) = e2 : ψ( x1 )γ a ψ( x1 ) : : ψ( x2 )γb ψ( x2 ) : A a ( x1 ) Ab ( x2 )
a b
= e2 γab γcd : ψ a ( x1 )ψb ( x1 ) : : ψc ( x2 )ψd ( x2 ) : A a ( x1 ) Ab ( x2 )

a b
= e2 γab γcd : ψ a ( x1 )ψb ( x1 )ψc ( x2 )ψd ( x2 ) : +ψ a ( x1 )ψd ( x2 ) : ψb ( x1 )ψc ( x2 ) :

+ψb ( x1 )ψc ( x2 ) : ψ a ( x1 )ψd ( x2 ) : +ψ a ( x1 )ψd ( x2 )ψb ( x1 )ψc ( x2 )
 
× : A a ( x1 ) A b ( x2 ) : + A a ( x1 ) A b ( x2 )

2 a b 1
= e γab γcd : ψ a ( x1 )ψb ( x1 )ψc ( x2 )ψd ( x2 ) : + Sda− ( x2 − x1 ) : ψb ( x1 )ψc ( x2 ) :
i

1
+ Sbc+ ( x1 − x2 ) ψ a ( x1 )ψd ( x2 ) −Sda− ( x2 − x1 )Sbc+ ( x1 − x2 )
: :
i
× [ : A a ( x1 ) Ab ( x2 ) : +iDab+ ( x1 − x2 )] . (7.29)

E, da Eq. (7.24), a distribuição R2′ é igual à A2′ com os pontos x1 e x2 trocados. Trocando
também os índices vetoriais a e b, e os espinoriais a e c e b e d por motivos de conveniência
180 Capítulo 7. Eletrodinâmica quântica fermiônica

–já que ambas distribuições serão subtraídas para obter a distribuição causal–, obtém-se:

1
R2′ ( x1 ; x2 ) = a b
e2 γab γcd: ψ a ( x1 )ψb ( x1 )ψc ( x2 )ψd ( x2 ) : − Sbc− ( x1 − x2 ) : ψ a ( x1 )ψd ( x2 ) :
i

1
− Sda+ ( x2 − x1 ) : ψb ( x1 )ψc ( x2 ) : −Sbc− ( x1 − x2 )Sda+ ( x2 − x1 )
i
× [ : A a ( x1 ) Ab ( x2 ) : +iDab+ ( x2 − x1 )] . (7.30)

Logo, substituindo as Eqs. (7.29) e (7.30) na Eq. (7.25), obtém-se a distribuição causal da
segunda ordem:
 
( M) (C ) (VP) (SE) (VG )
D2 ( x1 ; x2 ) = D2 + D2 + D2 + D2 + D2 ( x1 ; x2 ) , (7.31)

com (usamos a coordenada relativa y ≡ x1 − x2 ):

( M)
D2 ( x1 ; x2 ) = − ie2 : ψ( x1 )γ a ψ( x1 )ψ( x2 )γb ψ( x2 ) : Dab (y) ; (7.32)

(C )
D2 ( x1 ; x2 ) =ie2 : ψ( x1 )γ a S(y)γb ψ( x2 ) : : A a ( x1 ) Ab ( x2 ) :
− ie2 : ψ( x2 )γb S(−y)γ a ψ( x1 ) : : A a ( x1 ) Ab ( x2 ) : ; (7.33)

h i
(VP)
D2 ( x1 ; x2 ) = − e2 Tr γ a S− (y)γb S+ (−y) − γ a S+ (y)γb S− (−y)
× : A a ( x1 ) A b ( x2 ) : ; (7.34)

(SE)
D2 ( x1 ; x2 ) = − e2 : ψ( x1 )γ a [S− (y) Dab+ (−y) + S+ (y) Dab+ (y)] γb ψ( x2 ) :
+ e2 : ψ( x2 )γ a [S+ (−y) Dab+ (−y) + S− (−y) Dab+ (y)] γb ψ( x1 ) : ; (7.35)

h i
(V )
D2 ( x1 ; x2 ) = − ie2 Tr γ a S− (y)γb S+ (−y) Dab+ (−y)
h i
+ ie2 Tr γ a S− (−y)γb S+ (y) Dab+ (−y) . (7.36)

Esta equação, assim escrita, resulta ser conveniente para ver quais termos contribuem a cada
processo, pois isto depende dos operadores de campo não-contraídos que aparecem neles:
os operadores de campo que aparecem determinam quais estados iniciais e finais darão um
( M)
resultado não nulo à amplitude de probabilidade ⟨Ψ; S( g)Φ⟩. Assim, a distribuição D2 dá
conta do espalhamento de dois férmions, a D (C ) , do espalhamento de um férmion por um
(VP) (SE)
fóton; as distribuições D2 e D2 representam a polarização do vácuo e a auto-energia do
(V )
férmion, respectivamente; já a distribuição D2 não descreve processo físico nenhum, pois
não há nele operadores de campo sem contrair.
Capítulo 7. Eletrodinâmica quântica fermiônica 181

7.3 Processos de espalhamento

Nesta seção estudaremos os processos de espalhamento que aparecem na QED à segunda


ordem e estabeleceremos a densidade lagrangiana de interação que lhe corresponde.

7.3.1 Espalhamento de Møller

O espalhamento mútuo de dois elétrons (espalhamento de Møller), é descrito pela


distribuição causal da Eq. (7.32), cuja parte numérica é a distribuição de comutação do
fóton, a parte retardada da qual já foi derivada na Seç. 4.10. A distribuição de transição que
corresponde a este processo é, portanto:

( M)
T2 ( x1 ; x2 ) = −ie2 : ψ( x1 )γ a ψ( x1 )ψ( x2 )γb ψ( x2 ) : Dab
F
(y) , (7.37)

com:
−2 
k2

b F (k ) = − (2π )
D gab −
k a ηb + η a k b
+ 2 η a ηb . (7.38)
ab
k2 + i0+ k− k−
Note-se que estamos usando aqui a distribuição de comutação do campo da radiação
incluindo seus termos de gauge (não-covariantes); isto é feito para mostrar explicitamente
que eles não têm contribuição aos elementos de matriz do operador de espalhamento,
reforçando a análise feita no Cap. 6. Por outro lado, o assim proceder nos permitirá
estabelecer alguns resultados em relação com a abordagem lagrangiana (vide a Subseç.
 F
7.3.3). Continuando, a distribuição da Eq. (7.38) tem a ordem singular ω− Dab = 0, e,
como consequência, permite a introdução de um termo de normalização da forma Cb ( k − ).
Escolhendo:
b (k − ) = (2π )−2 ηa ηb
C , (7.39)
k2−
o propagador de Feynman do campo da radiação se modifica segundo:

−2  
dˆab (k ) ≡ D b (k − ) = − (2π )
b F (k) + C gab −
k a ηb + η a k b
. (7.40)
ab
k2 + i0+ k−

Consideremos agora os seguintes estados iniciais e finais, respectivamente:

b† ( p1 ) br†1 (q1 ) b† ( p2 ) br†2 (q2 )


ps1 p Ω , ps2 p Ω . (7.41)
2p1− 2q1− 2p2− 2q2−

Para estes estados, o operador de espalhamento no limite adiabático g → 1 é:

( M) 1 
( M)

S12 = p Ω; br2 (q2 )bs2 ( p2 )S2 bs1 ( p1 )† br1 (q1 )† Ω
2p1− 2q1− 2p2− 2q2−
1 ie2
Z
= −p 2
d4 kd4 x1 d4 x2 e−iky dˆab (k )
2p1− 2q1− 2p2− 2q2− 2 ( 2π )
 
× Ω; br2 (q2 )bs2 ( p2 ) : ψ( x1 )γ a ψ( x1 )ψ( x2 )γb ψ( x2 ) : bs1 ( p1 )† br1 (q1 )† Ω . (7.42)
182 Capítulo 7. Eletrodinâmica quântica fermiônica

O produto de operadores que aparece dentro do produto interno é reduzido com o uso do
teorema de Wick com o uso das contrações seguintes:

bs ( p)ψ( x ) = (2π )−3/2 Θ ( p− ) 2p− us ( p)eipx ,


p

ψ( x )bs ( p)† = (2π )−3/2 Θ ( p− ) 2p− us ( p)e−ipx .


p
(7.43)

Como os vetores a ambos os lados do produto interno são estados de vazio, são quatro as
contribuições não nulas, correspondentes às contrações completas. Assim:

ie2
Z
( M)
S12 = d4 kd4 x1 d4 x2 e−iky dˆab (k )Θ ( p1− ) Θ (q1− ) Θ ( p2− ) Θ (q2− )
2(2π )8
n
× u s2 ( p 2 ) γ a u r1 ( q 1 ) u r2 ( q 2 ) γ b u s1 ( p 1 ) e i ( p2 − q1 ) x1 + i ( q2 − p1 ) x2
− u s2 ( p 2 ) γ a u s1 ( p 1 ) u r2 ( q 2 ) γ b u r1 ( q 1 ) e i ( p2 − p1 ) x1 + i ( q2 − q1 ) x2
− u r2 ( q 2 ) γ a u r1 ( q 1 ) u s2 ( p 2 ) γ b u s1 ( p 1 ) e i ( q2 − q1 ) x1 + i ( p2 − p1 ) x2
o
+ u r2 ( q 2 ) γ a u s1 ( p 1 ) u s2 ( p 2 ) γ b u r1 ( q 1 ) e i ( q2 − p1 ) x1 + i ( p2 − q1 ) x2 . (7.44)

Em todos os termos aparece a seguinte integral:


Z
d4 x1 d4 x2 e−iky eiPx1 +iQx2 = (2π )8 δ(k − P)δ( P + Q) , (7.45)

de forma que, integrando na variável k e usando as propriedades de simetria da distribuição


dˆab [vide Eq. (7.40)], isto é, que

dˆab (k ) = dˆab (−k) e dˆab (k ) = dˆba (k ) , (7.46)

obtém-se finalmente:

( M)
S12 =ie2 δ( p2 + q2 − p1 − q1 )Θ ( p1− ) Θ (q1− ) Θ ( p2− ) Θ (q2− )
n
× us2 ( p2 )γ a ur1 (q1 )ur2 (q2 )γb us1 ( p1 )dˆab ( p2 − q1 )
o
a b ˆ
−us2 ( p2 )γ us1 ( p1 )ur2 (q2 )γ ur1 (q1 )d ab ( p2 − p1 ) . (7.47)

Além do mais, as funções de onda u( p) e u( p) satisfazem às equações de Dirac no espaço


dos momentos:
pu( p) = mu( p)
/ , u( p)/
p = mu( p) , (7.48)

donde decorre que:

us2 ( p2 )γ a ur1 (q1 ) ( p2a − q1a ) = us2 ( p2 ) /



p2 − /
q 1 ur1 (q1 ) ( p2a − q1a ) = 0 , (7.49)

( M)
e os termos não covariantes da distribuição dˆab não têm contribuição alguma a S12 [vide as
Eqs. (7.40) e (7.47)]. Conclui-se que todos os termos não locais podem ser desconsiderados,
pois o resultado será sempre o mesmo a considerar simplesmente a parte covariante da
Capítulo 7. Eletrodinâmica quântica fermiônica 183

distribuição de comutação do fóton:

(2π )−2
− g , (7.50)
k2 + i0+ ab

estabelecendo este resultado a equivalência com a dinâmica instantânea para o espalha-


mento de dois elétrons. O fato de termos usado, nessa derivação, estados com momento
definido –os quais, evidentemente, não formam parte do espaço de Fock por não poderem
ser normalizados–, não afeta o resultado, pois é fácil verificar que nenhum dos procedimen-
tos efetuados se invalida ao se utilizar pacotes de onda, bastando para isso apenas integrar
os estados da Eq. (7.41) com certas funções apropriadas do momento.

7.3.2 Espalhamento de Compton

Passamos a estudar agora o espalhamento de Compton, quer dizer, o espalhamento


de um elétron por um fóton. Ele é descrito pela distribuição causal da Eq. (7.33), a qual
reescrevemos definindo a distribuição numérica:

d ab (y) = ie2 γ a S(y)γb , (7.51)

com a qual ter-se-á que:


 
(C )
D2 ( x1 ; x2 ) = : ψ( x1 )d ab (y)ψ( x2 ) : − : ψ( x2 )dba (−y)ψ( x1 ) : : A a ( x1 ) Ab ( x2 ) : . (7.52)

O tratamento deste processo de espalhamento é muito semelhante ao do espalhamento de


um férmion por um bóson no modelo de Yukawa estudado no Cap. 5. Como as matrizes
de Dirac são constantes, a distribuição d ab (y) tem a ordem singular ω− = −1, determinada
apenas pela distribuição S(y), cuja divisão já foi feita na Seç. 4.10. Como resultado:

r̂ ab (y) = ie2 γ a Sret (y)γb . (7.53)

Subtraindo a correspondente distribuição subsidiária retardada r̂ ′ab (y), obtém-se a corres-


pondente distribuição de transição:

t ab (y) = ie2 γ a S F (y)γb . (7.54)

Usando a expressão para o propagador de Feynman do férmion no espaço dos momentos e


introduzindo já o termo de normalização permitido devido a ser ω− S F = 0:
 

ie2 a γ+
 
ab p+m
/
t̂ ( p) = γ − γb + C
b ( p− ) . (7.55)
(2π )2 p2 − m2 + i0+ 2p−

Para obter a invariância de Lorentz, escolhemos:

b ( p− ) = ie2 γ a γ+ γb
C , (7.56)
(2π )2 2p−
184 Capítulo 7. Eletrodinâmica quântica fermiônica

com o qual obtemos finalmente:

ie2 a p+m
/
t̂ ab ( p) = γ γb , (7.57)
(2π )2 p2 − m2 + i0+

provando isto, também para este processo, a equivalência com a dinâmica instantânea.

7.3.3 Densidade lagrangiana de interação

No estudo dos processos de espalhamento vimos que a covariância de Lorentz requer


a introdução de termos de normalização muito específicos. No caso do espalhamento de
Møller, a contribuição do termo de normalização da Eq. (7.39) ao operador S( g) no limite
adiabático g → 1 é:

ie2 1 +
Z Z
ηa η
+ d x1 d x2 : j ( x1 )δ(y) 2 b jb ( x2 ) : = ie2
4 4 a
d4 x1 : j + ( x1 ) j ( x1 ) : . (7.58)
2 ∂− 2∂2−

Este é precisamente o termo de interação instantânea que aparece na densidade lagrangiana


na abordagem convencional ao solucionar as equações de vínculo do campo da radiação em
interação, no gauge do plano nulo [25, 26]. Um outro termo de normalização foi requerido
para obter uma distribuição de transição covariante para o espalhamento de Compton –vide
a Eq. (7.57)–; sua contribuição ao operador de espalhamento no limite adiabático g → 1 é
–levando em conta os dois termos na Eq. (7.52)–:

γ+  b

1
Z 
4 4
: ψ ( x1 ) γ a A a ( x1 ) δ ( y )
2

+ d x1 d x2 e γ A b ( x2 ) ψ ( x2 ) :
2 2∂−
  γ + 
b a
+ : ψ ( x2 ) γ A b ( x2 ) δ ( y ) (γ A a ( x1 )ψ( x1 )) :
2∂−
Z  γ+  b 
= d4 x1 e2 : ψ ( x1 ) γ a A a ( x1 ) γ A b ( x1 ) ψ ( x1 ) : . (7.59)
2∂−

Este termo corresponde, na abordagem lagrangiana, ao termo de interação instantânea que


aparece como resultado de solucionar as equações de vínculos do campo fermiônico na
teoria em interação [25, 26].
Juntando as Eqs. (7.22), (7.58) e (7.59) podemos então identificar a «densidade lagrangi-
ana de interação», definida como −i vezes a distribuição de transição de um ponto mais
−i vezes as contribuições dos termos de normalização das distribuições de transição nas
seguintes ordens da série perturbativa ao operador de espalhamento no limite adiabático:
2
e2 e2  γ+  b

1 + 
L = : ja (x) Aa (x) : − : j (x) : + : ψ( x )γ a A a ( x ) γ Ab ( x )ψ( x ) : .
2 ∂− 2 i∂−
(7.60)
Lembramos que a densidade lagrangiana da Eq. (7.60) é da primeira ordem na constante
de acoplamento e quando escrita em função dos campos interagentes; sua estrutura de
segunda ordem aparece quando as equações de vínculos em interação são solucionadas
Capítulo 7. Eletrodinâmica quântica fermiônica 185

e reintroduzidas nela. De modo que, o fato destes termos aparecerem na segunda ordem
na TPC no plano nulo está dentro da filosofia do método causal, que trabalha apenas com
campos livres.
Diremos de passagem que o cancelamento ou não dos termos instantâneos da densidade
lagrangiana pelos termos instantâneos dos propagadores de Feynman dos campos, a qual-
quer ordem, foi tema de debate na comunidade por alguns anos. A TPC no plano nulo oferece
uma resposta imediata: Como tais interações instantâneas correspondem aos termos de nor-
malização das distribuições de transição da segunda ordem, numa série perturbativa baseada
na densidade lagrangiana L , estes se cancelarão em todas as ordens, pois toda distribuição
causal em cada ordem se constrói com as distribuições de transição anteriores já normaliza-
das (já covariantes). Essa é uma das grandes vantagens de se trabalhar numa teoria indutiva.

7.4 Polarização do vácuo

Consideremos agora a correção radiativa conhecida como «polarização do vácuo», que


será precisamente definida mais adiante, e que provêm do estudo da distribuição causal da
Eq. (7.34), que repetimos aqui:
 
(VP)
D2 ( x1 ; x2 ) = P ab (y) − Pba (−y) : A a ( x1 ) Ab ( x2 ) : , (7.61)

com: h i
P ab (y) = e2 Tr γ a S+ (y)γb S− (−y) . (7.62)

A transformada de Fourier da distribuição P ab é:


Z h i
Pbab (k ) = e2 (2π )−2d4 pTr γ a S+ ( p)γb S− ( p − k )
Z h i
= e2 (2π )−2 d4 pTr γ a (/p + m)γb (/ p−/ k + m) D b − ( p − k)
b + ( p) D . (7.63)

O traço que aqui se apresenta é calculado pelas fórmulas usuais:


h i h i h i
Tr γ a (/
p + m)γb (/ k + m) = Tr γ a /
p−/ pγb (/p−/ k ) + m2 Tr γ a γb
h   i
= 4 p a pb − kb + pb ( p a − k a ) − g ab p( p − k) − m2 . (7.64)

Também, como:
b ± ( p) = ± i Θ (± p− ) δ( p2 − m2 )
D , (7.65)

aparecerão no integrando da Eq. (7.63) as distribuições delta de Dirac δ( p2 − m2 ) e δ(( p −
k )2 − m2 ), que têm, em conjunto, suporte em p2 = m2 e k2 = 2pk. Portanto:

4e2
Z h i
Pbab (k ) = d4 p 2p a pb − p a kb − k a pb + g ab pk
(2π )4
× Θ ( p− ) δ( p2 − m2 )Θ (k − − p− ) δ(k2 − 2pk) . (7.66)
186 Capítulo 7. Eletrodinâmica quântica fermiônica

Pode-se observar da Eq. (7.66) que a distribuição Pbab (k ) é simétrica em seus dois índices. E,
além disso, ela é ortogonal ao vetor k, pois ao multiplicá-la por dito vetor, ter-se-á que:

k a Pbab (k ) ∼ (2pk − k2 ) pb , (7.67)

que é nulo por causa do suporte da distribuição δ(k2 − 2pk). Sendo, como é, simétrico e
ortogonal ao vetor k, Pbab (k ) tem de ser proporcional ao projetor k a kb − k2 g ab :
 
Pbab (k ) = k a kb − k2 g ab B(k2 ) . (7.68)

Calculando o traço dessa equação e também o da Eq. (7.66), obtém-se a seguinte fórmula
para B(k2 ):
4e2 2m2
 
1
B(k ) = − 2 P̂ aa (k ) = −
2
1+ 2 I (k) , (7.69)
3k 3(2π )4 k
com I (k ) a integral da Eq. (5.38), e cujo valor é dado na Eq. (5.42). Da substituição dessas
equações na Eq. (7.69), e então na Eq. (7.68):
r
e2 k a kb 4m2
 
bab ab
(k + 2m )Θ (k − ) Θ k − 4m
2 2 2 2

P (k) = g − 2 1− . (7.70)
3(2π )3 k k2

Então a distribuição numérica associada à polarização do vácuo [vide a Eq. (7.61)] é:


r
e2 k a kb 4m2
 
ˆab ab
(k + 2m )sgn (k − ) Θ k − 4m
2 2 2 2

d (k) = g − 2 1− . (7.71)
3(2π )3 k k2

Para extrair dela a parte retardada, fatoramos nela um polinômio do segundo grau:

e2  2 ab 
dˆab (k ) = k g − k k dˆ1 (k )
a b
, (7.72)
3(2π )3

com dˆ1 (k) a seguinte distribuição:


r
2m2 4m2
 
dˆ1 (k ) = sgn (k − ) Θ k − 4m
2 2

1+ 2 1− . (7.73)
k k2

Pelo Teorema 4.7, será suficiente encontrar a parte retardada da distribuição dˆ1 (k ), cuja
ordem singular no eixo x − é: h i
ω− dˆ1 = 0 . (7.74)

Tal parte retardada é (usamos a variável s = −2k − q):



2
s
4m2

i ds 2m
Z 
r̂1 (k ) = − +
Θ(s + k2 − 4m2 ) 1 + 2
1−
2π s − ik − 0  s+k s + k2
r )
2 2

2m 4m
−Θ(s − 4m2 ) 1 + 1− . (7.75)
s s
Capítulo 7. Eletrodinâmica quântica fermiônica 187

Fazendo uso da fórmula de Sokhotskiy e, depois, a mudança de variável s + k2 → s na


primeira integral, resulta:
r
+∞ ( s + 2m2 ) 4m2
ik2 1−  2
r
4m2
s ds + 1 sgn (k ) Θ(k2 − 4m2 ) 1 + 2m
Z
r̂1 (k ) = V.p. − 1 − .
2π s2 ( k 2 − s ) 2 k2 k2
4m2
(7.76)

Essa distribuição é o valor limite da seguinte função analítica, regular no tubo R4 + iR0+ e− ,
em que tem-se introduzido a variável complexa de momento k̃ = k + iεη:
r
+∞ ( s + 2m2 ) 4m2
i 2
Z 1−
r̂1 (k̃ ) = k̃ s ds , (7.77)
2π s2 (k̃2 − s)
4m2

Seu valor explícito pode ser obtido pela mesma substituição de Euler das Eqs. (5.53) e (5.54),
com a qual ela adota a forma seguinte:

Z1
im2 (1 − ξ̃ )4 (1 − x )2 ( x2 + 4x + 1)dx
r̂1 (k̃ ) = , (7.78)
(2π )k̃4 ξ̃ 2 ( x + ξ̃ )(− x − 1/ξ̃ )(1 + x )4
0

e que, após a aplicação da técnica de decomposição em frações parciais, que permite a


integração elementar, revela seu valor:

im2
     
1 + ξ̃ 1 5 1 22
r̂1 (k̃ ) = ξ̃ − 4 + log ( ξ̃ ) + ξ̃ + − . (7.79)
(2π )k̃4 1 − ξ̃ ξ̃ 3 ξ̃ 3

Notemos ainda que, segundo a Eq. (5.54), no limite em que ε → 0,

1 k2
ξ+ = 2− 2 , (7.80)
ξ m

e os termos além do logaritmo na primeira linha da Eq. (7.79) estão sujeitos a normalização.
Finalmente, colocando esse resultado na Eq. (7.72) para obter r̂ ab (k ), subtraindo a distribuição
subsidiária r̂ ′ab (k ) e definindo o «tensor de polarização do vácuo» Π ab segundo:

(VP)
t̂ ab (k ) =: −i Π
b ab (k) ; T2 ( x1 ; x2 ) = −i : A a ( x1 )Π ab ( x1 − x2 ) Ab ( x2 ) : (7.81)

obtém-se finalmente:
k a kb
 
b ab (k ) =: (2π )−4
Π −g ab
Π
b (k) , (7.82)
k2

com o «escalar de polarização do vácuo» Π


b (k ) tendo as seguintes expressões, dependendo
do valor do quadrado do momento –elas se obtém tomando o valor limite da função analítica
da Eq. (7.79), de modo análogo ao realizado para o modelo de Yukawa–:
188 Capítulo 7. Eletrodinâmica quântica fermiônica

(I) k2 < 0:

2 m2 1 + ξ
     
e 1 5 1 22
Π
b (k) = ξ −4+ log(ξ ) + ξ+ − . (7.83)
3 1−ξ ξ 3 ξ 3

(II) 0 < k2 < 4m2 :


"  r 2 r ! #
e 2 m2 k2 4m 4m2 5k2
Π(k) =
b 4 1+ 2
− 1 cot−1 −1 − −4 . (7.84)
3 2m k2 k2 3m2

(III) k2 > 4m2 :

2 2
     
b (k) = e m 1+ξ 1 5 1 22
Π ξ −4+ log(|ξ |) + ξ+ −
3 1−ξ ξ 3 ξ 3
r )
4m2
−iπ (k2 + 2m2 ) 1 − 2 . (7.85)
k

Mas Π
b ab (k ) tem a ordem singular ω− = 2, donde ainda existe uma indeterminação que
no espaço dos momentos é da forma:

Π b ab (k ) − C0 gab + c′a k b − C2 k2 gab − C3 k a k b


e ab (k ) = Π , C0 , c′a , C2 , C3 ∈ R . (7.86)

É claro que o termo linear no momento deve ser nulo devido à invariância da interação
eletromagnética sob transformações de paridade. Quanto aos outros, a identidade-Cg [Eq.
(7.21)] indica que a distribuição completa deve ser transversal ao momento, o que implica
que o polinômio −C0 gab − C2 k2 gab − C3 k a k b a ser adicionado a Π
b ab (k ) deve ser ele mesmo
transversal ao momento, pois Π
b ab (k ) já o é [Eq. (7.82)]. Portanto, multiplicando o polinômio
de normalização por k a e igualando a zero, se deve cumprir que: C2 + C3 = −C0 /k2 , e o
polinômio mencionado se reduz a:
 
k a kb
− gab (C0 + C2 k2 ) .
k2

Isto significa que a normalização deve ser feita diretamente no escalar da polarização do
vácuo:
Π
e (k) = Π
b (k ) + C0 + C2 k2 , C0 , C2 ∈ R . (7.87)

Para fixar as constantes C0 e C2 , estudar-se-á a dispersão de Møller com inserções de polariza-


ção do vácuo. Por um procedimento idêntico ao realizado no estudo do espalhamento de dois
férmions com inserções de auto-energia do méson no modelo de Yukawa –vide o Cap. 5–,
observa-se que o propagador completo do fóton é a distribuição D ab que soluciona à equação:
b tot

D ab
b tot = dˆab + (2π )4 dˆac Π
e cd dˆdb + (2π )8 dˆac Π
e cd dˆde Π
e e f dˆf b + · · ·
 
= dˆac δcb + (2π )4 Π e cd D db
b tot , (7.88)
Capítulo 7. Eletrodinâmica quântica fermiônica 189

com dˆab a parte numérica da distribuição de transição da segunda ordem correspondente


à dispersão de Møller, dada na Eq. (7.40). A Eq. (7.88) pode ainda ser escrita na seguinte
forma, em que o propagador completo do fóton aparece uma única vez:
 
δda − (2π )4 dˆac Π
e cd D db
b tot = dˆab . (7.89)

Usualmente [107] esta equação é solucionada por meio da inversão de dˆab . No entanto,
no caso particular que estamos estudando, tal distribuição não possui inversa devido aos
termos não covariantes contidos nela3 . Porém, com as Eqs. (7.40) e (7.82) podemos ainda
calcular a expressão inter-parentética da Eq. (7.89), que resulta ser:

k2 − (2π )−2 Π
e + i0+ (2π )−2 Π
L ad = π1 δda + π2 k a ηd
e
; π1 = , π2 = . (7.90)
k2 + i0+ k − (k2 + i0+ )

Acontece que este tensor tem, ele sim, uma inversa, que chamaremos Eca e que terá a seguinte
forma geral:
Eca = σ1 δac + σ2 kc k a + σ3 kc ηa + σ4 η c k a + σ5 η c ηa , (7.91)

com σi coeficientes a serem determinados. Tal é feito solucionando o sistema de equações


Eca L ad = δdc ; a solução é:

1 σ1 π2
σ1 = , σ2 = 0 , σ3 = − , σ4 = 0 = σ5 . (7.92)
π1 π1 + k − π2

Substituindo a Eq. (7.92), com os valores de πi dados na Eq. (7.90), na Eq. (7.91) encontra-se
que: ( )
c 1 (2π )−2 Π
k2 δac
e c
E a = − k ηa . (7.93)
k2 − (2π )−2 Π
e + i0+ k−

Agora podemos solucionar a Eq. (7.89) multiplicando-a por Eca . Obtemos assim que o
propagador completo do fóton é:

(2π )−2 kc η b + η c kb
 
cb cb
D
b tot (k) = − g − . (7.94)
k2 − (2π )−2 Π
e (k ) + i0+ k−

Como podemos ver, o propagador completo preserva a estrutura tensorial da distribuição


dˆab (k ). Isto não acontece com o propagador completo numa abordagem covariante na
dinâmica instantânea, em que ele pode ser dividido em duas partes: Uma transversal ao
momento k a , que é modificada pela presença de Π;
e uma longitudinal (paralela ao momento),
que se mantém independente de Π
e –isto pode ser comprovado, por exemplo, na Ref. [107]–.
Contudo, os dois propagadores totais são iguais entre si, e iguais à parte covariante apenas,
uma vez que a conservação da corrente elétrica é levada em consideração, eliminando ela
todas as contribuições proporcionais ao momento k a ; essa é uma expressão da invariância de

pode ser provado da seguinte forma: Suponhamos que a distribuição inversa dˆ−1 existe. Escrevendo-a
3 Isto

como αgab + βk b k c + γ(ηb k c + ηc k b ) + δηb ηc , o conjunto de equações para os coeficientes α, · · · , δ obtidos por
meio da condição dˆ−1 dˆ = 1 é inconsistente.
190 Capítulo 7. Eletrodinâmica quântica fermiônica

gauge. Voltando à Eq. (7.94), o escalar de polarização do vácuo Π e aparece no denominador


de D ab ( k ), então é possível impor as seguintes condições físicas para sua normalização: (1)
b tot
O fóton é uma partícula sem massa, dessarte, o propagador deve ter um pólo em k2 = 0; (2)
o valor físico da carga elétrica é a constante de acoplamento e da distribuição de um ponto
T1 . Esses dois requerimentos são traduzidos, respectivamente, nas condições:


e (k)
lim Π
e (k) = 0 e lim =0 . (7.95)
k 2 →0 k 2 →0 d ( k 2 )

Estas já são satisfeitas por Π


b (k ) das Eqs. (7.83) e (7.84) –cujos limites laterais contêm à
camada de massa do fóton–, donde decorre que na Eq. (7.87) devem ser: C0 = 0 = C2 , e a
solução normalizada para a polarização do vácuo é precisamente a solução central.

7.5 Auto-energia do férmion

A partir desse ponto, e para simplificar considerávelmente os cálculos, faremos uso do


resultado crucial do Cap. 6, isto é, desconsideraremos os termos de gauge da distribuição
de comutação do campo de radiação, por eles não contribuírem para a matriz física de
espalhamento.
A auto-energia do elétron é descrita pela distribuição causal da Eq. (7.35). A escreveremos
como:
(SE)
D2 ( x1 ; x2 ) = : ψ( x1 )d(y)ψ( x2 ) : − : ψ( x2 )d(−y)ψ( x1 ) : , (7.96)

com:
d ( y ) : = − e2 γ a d + ( y ) + d − ( y ) γ a d± (y) := S± (y) D0+ (±y)
 
; . (7.97)

Para ir ao espaço dos momentos, começaremos por calcular a transformada de Fourier


de d− , que é a seguinte:
Z
dˆ− ( p) = (2π )−2 d4 qSb− ( p − q) D
b 0+ (−q)

= (2π )−4 [(/


p + m) I1 − γ a I2a ] , (7.98)

com as seguintes definições das várias integrais:


Z
d4 qΘ(−q− )Θ(q− − p− )δ(q2 )δ ( p − q)2 − m2

I1 = , (7.99)

Z
d4 qΘ(−q− )Θ(q− − p− )δ(q2 )δ ( p − q)2 − m2 q a

I2a = . (7.100)

O seu cálculo se simplifica no sistema inercial de referência em que p = ( p+ ; 0⊥ ; p− ), o qual


existe porque q ∈ V − e p − q ∈ V − , de forma que p = q + ( p − q) ∈ V − ; isto implica, em
particular, que p+ , p− < 0. Em tal sistema inercial de referência:

( p − q)2 − m2 q2 =0 = 2p+ p− − 2p+ q− − 2p− q+ − m2



. (7.101)
Capítulo 7. Eletrodinâmica quântica fermiônica 191

Logo, usando as propriedades da distribuição delta de Dirac:

1
Θ(−q− )δ(q2 )δ ( p − q)2 − m2 = Θ(−q− )Θ(q− − A)Θ(2p+ p− − m2 )

|2p− |
! 
q2⊥

2p+
× δ q+ − δ q2⊥ − ( A − q− )q− , (7.102)
2q− p−

com:
2p+ p− − m2
A= . (7.103)
2p+
Desde que p+ < 0, é trivial ver que A > p− , e a função de Heaviside Θ(q− − p− ) que
aparece nas integrais das Eqs. (7.99) e (7.100) é redundante. Além disso, é claro que, por
argumentos de simetria, no sistema de referência escolhido serão:

I2α = 0 (α ∈ I2 ) . (7.104)

Decorre disto que somente precisamos calcular as integrais I1 , I2+ e I2− . A integração nas
variáveis q+ e q2⊥ é imediata usando as propriedades das distribuições delta de Dirac contidas
na Eq. (7.102); obtém-se:

Z0
π
I1 = Θ(− p− )Θ(2p+ p− − m2 ) dq− , (7.105)
|2p− |
A

Z0
π p+
I2+ = Θ(− p− )Θ(2p+ p− − m2 ) dq− ( A − q− ) , (7.106)
|2p− | p−
A

Z0
π
I2− = Θ(− p− )Θ(2p+ p− − m2 ) dq− q− . (7.107)
|2p− |
A

A integração na variável q− é agora elementar:

m2
 
π
I1 = Θ(− p− )Θ(2p+ p− − m ) 1 −
2
, (7.108)
2 2p+ p−

m2
 

I2± = 1− I1 . (7.109)
2 2p+ p−
Substituindo estes resultados na Eq. (7.98) e multiplicando-a por γ a pela esquerda e por γa
pela direita e realizando a soma no índice «a»:

m2 m2
   
a ˆ− −3 p
/
γ d ( p)γa =(2π ) Θ(− p− )Θ(2p+ p− − m ) 1 − 2
m− 1+ .
2p+ p− 4 2p+ p−
(7.110)
192 Capítulo 7. Eletrodinâmica quântica fermiônica

De forma análoga, calcula-se a transformada de Fourier da distribuição d+ :

m2 m2
   
p
/
γ a dˆ+ ( p)γa = − (2π )−3 Θ( p− )Θ(2p+ p− − m2 ) 1 − m− 1+ .
2p+ p− 4 2p+ p−
(7.111)

Substituindo as Eqs. (7.110) e (7.111) na Eq. (7.97) obtemos finalmente a distribuição causal
no espaço dos momentos:

m2 m2
   
ˆ −3 p
/
d( p) =e (2π ) sgn( p− )Θ(2p+ p− − m ) 1 −
2 2
m− 1+ .
2p+ p− 4 2p+ p−
(7.112)

Para obter a parte retardada da distribuição recém encontrada, faremos uso do Teorema
4.7 e escreveremos, fatorando dela um polinômio:
n p
/
o
dˆ( p) = e2 (2π )−3 (2p+ p− − m2 ) 2p+ p− m − (2p+ p− + m2 ) dˆ1 ( p) , (7.113)
4

com:
1
dˆ1 ( p) = sgn( p− )Θ(2p+ p− − m2 ) , (7.114)
(2p+ p− )2
e só esta distribuição deverá ser dividida. Sua ordem singular no eixo x − é negativa:
h i
ω− dˆ1 = −1 . (7.115)

O motivo para esse valor da ordem singular no eixo x − é a integral

p  s2 +∞
dq
Z Z
ρ(s)Θ ˆ
− a 2 f ( p)dp = sρ(s) fˆ(sq) 2 ,
s p q
a

que tende a fˆ(0)/a para s → 0 caso seja escolhida a função de auto-modelo ρ(s) = s−1 –
definindo assim ω− = −1–. Em tal caso, no limite s → 0:
p  s2 δ( p)
ρ(s)Θ −a 2
→ .
s p a

Este valor da ordem singular é diferente do valor −2 para o grau de divergência de d1


por contagem de potências. Tal diferença é, no entanto, irrelevante neste caso, pois a
fórmula para se obter a distribuição retardada é a mesma para todos os valores negativos
da ordem singular. Contudo, deve-se sempre lembrar que calcular corretamente a ordem
singular é extremamente importante, pois pode levar a diferenças nas características físicas
da solução quando a ordem singular é não-negativa4 . Voltando à divisão da distribuição

4 Isto ocorre, por exemplo, no modelo de Schwinger, em que a ordem singular para a polarização do vácuo
é igual a zero, enquanto que, por contagem de potências, é −1; o termo de normalização admissível leva ao
aparecimento da massa do fóton [205].
Capítulo 7. Eletrodinâmica quântica fermiônica 193

dˆ1 , ela então será feita por aplicação da Eq. (4.130). Realizando a mudança de variável
s = −2kp− + 2p+ p− :

i dk 1
Z
r̂1 ( p) = +
sgn( p− )Θ(−2kp− + 2p+ p− − m2 )
2π k + i0 (−2kp− + 2p+ p− )2
+∞
 
i ds 1
 Z 
= V.p. − iπsgn ( p − ) Θ ( 2p p
+ − − m 2
)
2π  s2 (2p+ p− − s) (2p+ p− )2 
m 2

2p+ p− − m2
   
i 1 2p+ p−
+ m2 − iπsgn( p− )Θ(2p+ p− − m ) .
2
= log
2π (2p+ p− )2 m2
(7.116)

A distribuição retardada completa será portanto:


(
ie2 m2 m2
2p+ p− − m2
  
 
p
/
r̂ ( p) = 1− m− log 1+
(2π )4 2p+ p− 4 m2
2p+ p−
)
m2 /
p 2p+ p−
−iπsgn( p− )Θ(2p+ p− − m ) +
2

−m− p − m) .
(/ (7.117)
4(2p+ p− ) m

Nesta expressão, os últimos dois termos da segunda linha têm a forma de termos de nor-
malização e podem, portanto, ser substituídos por valores arbitrários, levando em consi-

h i que a ordem singular no eixo x da distribuição causal completa na Eq. (7.112) é
deração
ω− dˆ = +1. Além disso, a distribuição subsidiária retardada para a auto-energia do fér-
mion é r̂ ′ ( p) = −e2 γ a dˆ− ( p)γa , como pode ser visto na Eq. (7.30); seu valor é então dado na
Eq. (7.110). Destarte, se definirmos a auto-energia do férmion Σ de tal forma que a distribui-
ção de transição seja:

(SE)
T2 ( x1 ; x2 ) = i : ψ ( x1 ) Σ ( x1 − x2 ) ψ ( x2 ) : + i : ψ ( x2 ) Σ ( x2 − x1 ) ψ ( x1 ) : , (7.118)

b ( p) = −i r̂ ( p) − r̂ ′ ( p)
Σ

, (7.119)

então em forma covariante de Lorentz ter-se-á:


(
2 m2 m2
 2
p − m2
     
e p
/
Σ( p) =
b 1− 2 m− 1+ 2 log
2 2
− iπΘ( p − m )
(2π )4 p 4 p m2
)
m2 /p
+ + C0 + C1 /
p , (7.120)
4p2

com C0 , C1 ∈ R constantes de normalização. Essa distribuição é a mesma que a da dinâ-


mica instantânea [107]. Com a finalidade de fixar as constantes de normalização C0 e C1 ,
estudamos as inserções da auto-energia do férmion no espalhamento de Compton, seme-
lhantemente a como foi feito para o espalhamento de um méson e um núcleon com inserções
da auto-energia do núcleon no modelo de Yukawa no Cap. 5; encontra-se que o propagador
194 Capítulo 7. Eletrodinâmica quântica fermiônica

total do férmion é o que soluciona à equação:


 
(C )
Sbtot = t̂2 1 + (2π )4 Σ
e Sbtot , (7.121)

(C )
com t̂2 o propagador de Feynman normalizado (sem termo instantâneo) do férmion, que é
o que aparece na distribuição de transição do espalhamento de Compton à segunda ordem
[Eq. (7.57)]:
(C ) 1
t̂2 ( p) = (2π )−2 . (7.122)
p − m + i0+
/
Obtém-se:
1
Sbtot ( p) = (2π )−2   . (7.123)
p − m + (2π )2 Σ
/ e ( p) + i0+

Devemos então considerar, como alhures, as condições de normalização: (1) A massa m é a


massa física do férmion; (2) o valor de e é o da carga elétrica física. Essas duas condições,
respectivamente, se traduzem operacionalmente em:


e ( p)
lim Σ
e ( p) = 0 , lim =0 . (7.124)
p →m
/ p →m d /
/ p

A primeira dessas condições pode ser avaliada diretamente, pois Σ


e na Eq. (7.120) não é
divergente na camada de massa; ela leva à relação:
 
1
C0 = −m C1 + . (7.125)
4

A segunda condição de normalização, no entanto, não pode ser diretamente avaliada, pois a
derivada de Σ
e é singular na camada de massa5 . A solução deste problema são as identidades
de Ward-Takahashi: A normalização da auto-energia do férmion e a da função de vértice
não são independentes, mas se relacionam de tal forma que os valores particulares de suas
respectivas constantes de normalização não mudam o valor da carga elétrica; qualquer
mudança na constante de normalização C1 leva, pelas identidades de Ward-Takahashi, a uma
mudança na constante de normalização da função de vértice de modo que a carga elétrica
se mantém a mesma. Por este motivo, a constante C1 pode ser escolhida com o uso de uma
outra condição de normalização em que não se apresentem divergências infra-vermelhas,
por exemplo:

e ( p) 1
lim =0 ⇒ C1 = . (7.126)
p →0 d /
/ p 8
A verificação do recém proferido requer uma análise mais profunda das identidades de
Ward-Takahashi, a qual será feita na Seç. 7.8.

5 Este problema de divergência infra-vermelha se apresenta em todo formalismo: a não analiticidade é uma

propriedade geral da auto-energia quando uma das distribuições que intervém na convolução tem massa nula
(quando uma das «linhas internas» corresponde a uma partícula sem massa) [100]. Uma «solução» comumente
usada é a de introduzir uma massa para o fóton [100, 206]. Semelhante regularização, no entanto, não pode ser
removida posteriormente. O mesmo ocorre quando é usada a regularização de Pauli-Villars [207].
Capítulo 7. Eletrodinâmica quântica fermiônica 195

7.6 Interação luz-luz


Um dos novos efeitos que a eletrodinâmica quântica permitiu predizer é a interação luz-
luz [206]. Este aparece apenas a partir da quarta ordem da série perturbativa e, portanto, sua
magnitude é extremamente pequena, ao ponto que nenhuma medição direta dela tem sido
realizada até hoje. Para sua descrição na TPC, como o procedimento é indutivo, precisa-se
em primeiro lugar calcular a distribuição causal da terceira ordem6 :

D3 (1; 2; 3) =[ T (1); T (2; 3)] + [ T (2); T (1; 3)] + [ T (1); T (2; 3)]
+ { T (1); D2 (2; 3)} + { T (2); D2 (3; 1)} . (7.127)

A partir dessa expressão, a distribuição de transição da terceira ordem, T3 , tem de ser


determinada por divisão e subtração da distribuição subsidiária retardada. Então já podemos
obter a distribuição causal da quarta ordem:

D4 (1; 2; 3; 4) = −[ T (1; 2; 4); T (3)] − [ T (1; 3; 4); T (2)] − [ T (2; 3; 4); T (1)] − [ T (1; 4); T (2; 3)]
+ {[ T (1; 4); T (2)]; T (3)} + {[ T (1; 4); T (3)]; T (2)} + {[ T (2; 4); T (1)]; T (3)}
+ {[ T (2; 4); T (3)]; T (1)} + {[ T (3; 4); T (1)]; T (2)} + {[ T (3; 4); T (2)]; T (1)}
− [ T (2; 4); T (1; 3)] − [ T (3; 4); T (1; 2)] − [ T (4); T (1; 2; 3)] + {[ T (4); T (1)]; T (2; 3)}
+ { T (1); [ T (4); T (2; 3)]} + {[ T (4); T (2)]; T (1; 3)} + { T (2); [ T (4); T (1; 3)]}
+ {[ T (4); T (3)]; T (1; 2)} + { T (3); [ T (4); T (1; 2)]} + T (1){ T (2); T (3)} T (4)
+ T (2){ T (1); T (3)} T (4) + T (3){ T (1); T (2)} T (4) − T (4){ T (1); T (2)} T (3)
− T (4){ T (1); T (3)} T (2) − T (4){ T (2); T (3)} T (1) . (7.128)

Nessa expressão, só contribuirão à interação luz-luz aquelas partes de T2 que correspondem


ao espalhamento de Compton e aquelas de T3 com três campos de radiação e dois campos
fermiônicos externos. Ademais, as contrações de Wick deverão ser feitas de forma a deixar
quatro campos eletromagnéticos externos só. Quanto ao produto de quatro distribuições T1 ,
eles irão contribuir sempre que as contrações sejam feitas respeitando o que agora dissemos.
Deveria então proceder-se a obter sua parte retardada, e, com ela, a distribuição de transição.
Embora este esboço do procedimento possa desalentar qualquer tentativa de realizar
explicitamente o cálculo, ainda é possível dizer algumas coisas a respeito da interação luz-
luz. Em particular, ver-se-á na Seç. 7.7 que a ordem singular no eixo x − das distribuições
com quatro campos de radiação externos e nenhum fermiônico é ω− = 0, e portanto um
termo de normalização é possível para eles. Assim, a distribuição de transição da interação
luz-luz será da forma:

T ( LL) (1; 2; 3; 4) = t̃( LL) (1; 2; 3; 4) abcd : A a (1) Ab (2) Ac (3) Ad (4) : , (7.129)

6 Para simplificar a notação, não estamos escrevendo o sub-índice indicando a ordem das distribuições de
transição; ele se evidencia pelo número de argumentos das distribuições mencionadas. Também, denotamos as
coordenadas x j fazendo referência apenas ao seu índice j.
196 Capítulo 7. Eletrodinâmica quântica fermiônica

com:

t̃( LL) (1; 2; 3; 4) abcd = t( LL) (1; 2; 3; 4) abcd + C abcd δ(1 − 4)δ(2 − 4)δ(3 − 4) . (7.130)

No espaço dos momentos, definindo os momentos p1 , p2 e p3 conjugados, respectivamente,


às coordenadas relativas x1 − x4 , x2 − x4 e x3 − x4 , a distribuição de transição é:

t̂( LL) ( p1 ; p2 ; p3 ) abcd + C abcd . (7.131)

Além disso, como as distribuições de transição hão de ser simétricas em seus argumentos,
C abcd deve ser simétrico em seus índices, e ter portanto a estrutura:

C abcd = C ( g ab gcd + g ac gbd + g ad gbc ) , C∈R . (7.132)

A substituição dessa expressão na Eq. (7.131) leva, via as identidades-Cg mostradas na Eq.
(7.21), à condição:

p1a t̂( LL) ( p1 ; p2 ; p3 ) abcd + C ( p1b gcd + p1c gbd + p1d gbc ) = 0 . (7.133)

Derivando em relação a p1r :

∂ ( LL)
t̂( LL) ( p1 ; p2 ; p3 )rbcd + p1a t̂ ( p1 ; p2 ; p3 ) abcd + C ( gbr gcd + gcr gbd + gdr gbc ) = 0 . (7.134)
∂p1r

Tomando então o limite p1 → 0 na Eq. (7.134), e supondo que t̂( LL) corresponda à solução
central, satisfazendo portanto à Eq. (4.152) com q+,⊥ = 0, ter-se-á que os dois primeiros
termos da referida equação se anulam, sendo forçoso concluir que seja C = 0. Decorre
disto que a constante de normalização na interação luz-luz é nula, ou seja, que o termo
de auto-interação dos fótons : A4 : é proibido pela invariância de gauge quântica. É
importante salientar que o limite considerado não é perigoso na quarta ordem, pois todas as
distribuições numéricas («linhas internas») correspondem ao férmion massivo, caso em que
não há divergências infra-vermelhas [202]. O argumento, contudo, é válido para qualquer
ordem se assumirmos que tal limite pode ser efetuado sem dificuldades.

7.7 Normalizabilidade

Para o estudo da normalizabilidade da QED no plano nulo, limitaremos nossa atenção


somente àquelas distribuições obtidas com a parte covariante da distribuição de comutação
do campo da radiação; em outras palavras, o estudo que aqui fazemos diz respeito à
normalizabilidade da matriz de espalhamento física. Para encontrar, pois, a ordem singular
de uma distribuição de transição geral, consideremos, como na Seç. 5.5, uma distribuição
causal da ordem n = r + s, obtida pelo produto das distribuições de transição Tr1 ( x1 ; . . . ; xr )
e Ts2 (y1 ; . . . ; ys ), e no qual se há efetuado l p contrações de fóton e l f contrações de férmion. A
Capítulo 7. Eletrodinâmica quântica fermiônica 197

parte numérica de uma tal distribuição será:

lp lf
d( x1 ; . . . ; xr ; y1 ; . . . ; ys ) ∼ t1 ( x1 ; . . . ; xr ) ∏ Dab+ ( xr j − ys j ) ∏ S+ ( xr m − y sm ) t2 ( y1 ; . . . ; y s ) .
j =1 m =1
(7.135)
A notação é a mesma que definimos na Seç. 5.5. O símbolo «∼», por outro lado, é colocado
em lugar do símbolo da igualdade devido a que desconsideraremos fatores numéricos
irrelevantes. Introduzindo as coordenadas relativas

ξ j : = x j − xr ( j = 1, . . . , r − 1) , λ j := y j − ys ( j = 1, . . . , s − 1) , λ : = xr − y s ,
(7.136)
e os vetores ξ = (ξ 1 ; . . . ; ξ r−1 ) e λ = (λ1 ; . . . ; λs−1 ), a Eq. (7.135) se reescreve:

lp lf
d(ξ; λ; λ) ∼ t1 (ξ ) ∏ Dab+ (ξ r j − λs j + λ) ∏ S+ ( ξ r m − λrm + λ ) t2 ( λ ) . (7.137)
j =1 m =1

A transformação de Fourier leva essa distribuição ao espaço dos momentos:


Z
dˆ( p; q; q) ∼ d4(r−1) ξd4(s−1) λd4 λd(ξ; λ; λ)eipξ +iqλ+iqλ . (7.138)

Substituindo a Eq. (7.137) e escrevendo


Z Z
Dab+ ( x ) ∼ b ab+ (h)e−ihx
d4 h D , S+ ( x ) ∼ d4 k Sb+ (k )e−ikx , (7.139)

obtém-se:
Z Z  
ipξ −i ∑m k m ξ rm +∑ j h j ξ r j
dˆ( p; q; q) ∼ ∏ d km d h j Db ab+ (h j )Sb+ (km )
4 4
d 4(r −1)
ξt1 (ξ )e
j,m
Z    Z 
4( s −1) iqλ−i ∑m k m λsm +∑ j h j λs j 4 i (q−∑m k m −∑ j h j )
× d λt2 (λ)e d λe
Z
" !#
∼ ∏ d4 km d4 h j Db ab+ (h j )Sb+ (km )t̂1 ( p − kr − hr )t̂2 (q + ks + hs )δ q− ∑ hj + ∑ km ,
j,m j m

(7.140)

com:
(
p j − k r j − hr j se ξ r j é um ponto de contração
( p − kr − hr ) j = ,
pj se ξ r j não é um ponto de contração

e semelhantemente para q + ks + hs . Redefinindo as variáveis de integração por escalamento


k m = sk m e e
de suas quatro componentes: e h j = sh j , a Eq. (7.140) torna-se:
! !
Z
hj km
∏ d4ekm d4eh j Db ab+
e
dˆ( p; q; q) ∼s−4(l p +l f )
e
Sb+
j,m
s s
198 Capítulo 7. Eletrodinâmica quântica fermiônica

! ! " !#
ker + her kes + hes 1
× t̂1 p−
s
t̂2 q+
s
δ 1−
s ∑ eh j + ∑ ekm . (7.141)
j m

Como já adiantamos, de acordo com o Cap. 5, para todos os propósitos físicos a distribuição
de comutação do campo de radiação na Eq. (7.141) pode ser tomada como sendo:

b ab ( p) = gab D
D b 0 ( p) , (7.142)

b 0 ( p) a distribuição de Jordan-Pauli de massa nula. Com essa substituição, a Eq. (7.141)


com D
é:
! !
Z
k hj
dˆ0 ( p; q; q) ∼s−4(l p +l f ) ∏ d4e
e m
e
k m d4 e
hj D
b 0+ Sb+
j,m
s s
! ! " !#
ker + her kes + hes 1
× t̂1 p −
s
t̂2 q +
s
δ q−
s ∑ eh j + ∑ ekm . (7.143)
j m

Para obter a ordem singular no eixo x − dessa distribuição causal, temos de avaliar o limite:
 
p q q p p p 
; ⊥ ; p−
+
lim s ω−
dˆ0 ; ; ; ≡ . (7.144)
s →0 s∗ s∗ s∗ s∗ s s

Com a Eq. (7.143):


! !
hj
 
p q q km
Z

e
−4( l p + l f )
e
dˆ0 ; ; ∼s d 4e
k m d4 e
hj D
b 0+ Sb+
s∗ s∗ s∗ j,m
s s
! ! " !#
p ker + her q kes + hes q 1
× t̂1
s∗

s
t̂2
s∗
+
s
δ
s∗

s ∑ eh j + ∑ ekm . (7.145)
j m

Assim, realizando exatamente o mesmo procedimento utilizado na prova do Lema 5.1, é


possível provar que:

Lema 7.1: A ordem singular no eixo x − de uma distribuição causal geral da QED, sem levar em
conta os termos de gauge da distribuição de comutação do campo da radiação, é:

3
ω− = 4 − N − M , (7.146)
2

com N o número de operadores de campo de radiação externos e M o de operadores de campo fermiônico.

Concluímos que o operador de espalhamento físico da QED no plano nulo é normalizável.


E ainda mais: O operador de espalhamento físico da QED no plano nulo é invariante de
Lorentz. A essa conclusão é possível chegar pelo seguinte argumento: Uma vez que os termos
de gauge na distribuição de comutação do campo da radiação não contribuem ao operador
de espalhamento físico, as distribuições causais que o determinam serão sempre covariantes
Capítulo 7. Eletrodinâmica quântica fermiônica 199

de Lorentz e o Teorema 4.5 se aplica. Este fato se relaciona com o que encontramos na Seç.
6.2: A invariância de gauge é uma propriedade crucial para que a invariância relativísitica
seja uma simetria no subespaço físico.
Mencionaremos finalmente que, em concordância com a Eq. (7.146), as únicas possibili-
dades para ter-se a ordem singular ω− ≥ 0 são as que se mostram na Tab. 7.1. Como pode-se
observar, qualquer termo de auto-interação fermiônica é impossível, enquanto que, como
vimos na Seç. 7.6, um termo de auto-interação para o fóton é igualmente inadmissível, pois
o termo de normalização no espalhamento luz-luz (última linha da tabela) deve ser tomado
nulo para obedecer à invariância de gauge quântica. Como isto esgota todas as possibili-
dades, não haverá outros termos de interação gerados a nenhuma ordem. Finalmente, na
terceira e sexta linha afirmamos que as correspondentes distribuições são nulas devido ao
teorema de Furry [208]; este teorema estabelece que todas as distribuições contendo um
número ímpar de campos fotônicos externos e nenhum fermiônico são nulas, e pode ser pro-
vado de forma simples como consequência da invariância da QED sob transformações de
conjugação da carga elétrica [107].

N M ω− Processo
0 0 4 Transição vazio-vazio
0 2 1 Auto-energia do elétron
1 0 3 = 0 por teorema de Furry
1 2 0 Função de vértice
2 0 2 Polarização do vácuo
3 0 1 = 0 por teorema de Furry
4 0 0 Espalhamento luz-luz

Tabela 7.1: Distribuições com ordem singular não-negativa.

7.8 Identidades de Ward-Takahashi


Nesta última seção, faremos um estudo aprofundado das identidades de Ward-Takahashi,
e veremos que elas se derivam das identidades-Cg da QED apresentadas na Eq. (7.21). Dessa
forma, desejamos generalizar alguns resultados obtidos nas seções precedentes, assim como
formalizar alguns comentários nelas introduzidos.
Em primeiro lugar, provaremos que as identidades-Cg podem de fato ser satisfeitas
com uma escolha adequada dos termos de normalização. Note-se, para começar, que a
distribuição de um ponto, T1 , satisfaz trivialmente à Eq. (7.21), pois foi construída de forma
a fazê-lo [vide a Seç. 7.1]. Assumamos, então, com a finalidade de aplicar o princípio de
indução matemática completa, que:

∀m ∈ In−1 : ∀l ∈ Im : ∂ axl Tla ( x1 ; · · · ; xm ) = 0 . (7.147)

No procedimento indutivo, para calcular a distribuição de transição da ordem n, precisamos


200 Capítulo 7. Eletrodinâmica quântica fermiônica

primeiramente construir as distribuições subsidiárias:

R′n (Y; xn ) = ∑′ T ( X ′ ; xn ) T
e( X ) , A′n (Y; xn ) = ∑′ e( X ) T ( X ′ ; xn )
T . (7.148)
X ∪ X =Y X ∪ X =Y
X ∩ X ′ =∅ X ∩ X ′ =∅
X ̸=∅ X ̸=∅

em correspondente à funcional inversa S( g)−1 é dada pela


Lembrando que a distribuição T
fórmula
m
em ( X ) =
T ∑ (−1)r ∑ T ( X1 ) · · · T ( X r ) , (7.149)
r =1 X1 ∪···∪ Xr = X
X j ∩ Xk =∅,∀ j̸=k
X1 ,··· ,Xr ̸=∅

podemos reconhecer que as distribuições subsidiárias somente contêm distribuições Tm com


m ∈ In−1 tais que os argumentos de todas elas são disjuntos. Por esse motivo, se escrevermos,
seguindo a Eq. (7.18),

a
R′n ( x1 ; · · · ; xn ) = : R′ l ( x1 ; · · · ; xn ) A a ( xl ) : + · · · , (7.150)

a
em que, nem R′ l , nem os pontos suspensivos incluem um outro operador de campo de
gauge no ponto xl , A a ( xl ), a derivação só afetará a uma distribuição Tm por vez (àquela
que, na partição particular de (Y; xn ), contenha ao ponto xl ), e então a hipótese indutiva da
Eq. (7.147) implica imediatamente que –escrevemos já o resultado igualmente válido para a
distribuição subsidiária avançada–:

a a
∀l ∈ In : ∂ axl R′ l ( x1 ; · · · ; xn ) = 0 ∧ ∂ axl A′ l ( x1 ; · · · ; xn ) = 0 , (7.151)

donde decorre que o mesmo pode ser afirmado da distribuição causal da ordem n:

∀l ∈ In : ∂ axl Dla ( x1 ; · · · ; xn ) = 0 . (7.152)

Assim, como Tn = Rn − R′n , devido à Eq. (7.151) ter-se-á que, como desejado, ∂ axl Tla = 0
se e somente se ∂ axl Rla = 0, isto é, se a propriedade da Eq. (7.152) é mantida na divisão da
distribuição causal. Ora, por sua própria definição, a distribuição retardada é Rla = Dla em
Γ+ −
n \ En , em que estamos denotando:

En− := ( x1 ; · · · ; xn−1 ; xn ) ∈ Γ+
n | ∀ j ∈ In−1 : x j ∈ xn + Re

 
, (7.153)

e Rla = 0 em R4n \ Γ+
n . Devido à Eq. (7.152), portanto:

∀( x1 ; · · · ; xn ) ∈ R4n \ En− : ∂ axl Rla ( x1 ; · · · ; xn ) = 0 . (7.154)

E disto:
supp ∂ axl Rla ⊆ En− supp ∂ axl Tla ⊆ En−
 
⇒ . (7.155)

Este resultado ainda pode ser mais especializado escrevendo as distribuições Tla como a
Capítulo 7. Eletrodinâmica quântica fermiônica 201

a contendo M operadores de campo fermiônico externos:


soma das distribuições Tl,M

Tla = ∑ a
∀ M ∈ {0; 2; · · · ; 2n} : supp ∂ axl Tl,M
a
⊆ En−

Tl,M ⇒ . (7.156)
M ∈ I2n,0
M par

É preciso, para continuar, nos determos em estudar se em ∂ axl Tl,M


a haverá ou não alguma

derivada agindo sobre um operador de campo fermiônico. Em primeiro lugar, caso houvesse
um operador de campo fermiônico no ponto xl , quer ψ( xl ), quer ψ( xl ), necessariamente
deveria haver também uma distribuição S• ( xl − x j ), com • ∈ {ret; av; F }; efetivamente,
como o ponto xl é um ponto em que está presente um campo de fóton externo [vide a Eq.
(7.18)], se ao menos um dos campos fermiônicos não estivesse contraído, então a distribuição
seria desconectada. Mas o suporte do produto tensorial de duas distribuições é o produto
cartesiano dos seus suportes individuais, ou seja, os suportes das partes desconectadas
são independentes, contrariando ao Teorema 4.3, segundo o qual o suporte da distribuição
causal Dn está contido no cone de luz do ponto xn ; logo, se a distribuição causal não pode
ser desconectada, tampouco a distribuição retardada pode sê-lo, e então as distribuições
de transição que correspondem a tais casos se reduzem apenas a − R′n , que já satisfaz às
identidades de Ward-Takahashi [vide Eq. (7.151)]. Segue disso que os casos que requerem
atenção são aqueles que correspondem a distribuições conectadas. Como as distribuições
S• ( xl − x j ) podem conter termos instantâneos, dividimo-as da seguinte forma:

S• ( xl − x j ) = Sc• ( xl − x j ) + Si• ( xl − x j ) , (7.157)

em que Sc denota a parte covariante e Si , a instantânea. Assim sendo, e como as distribuições


Sc• são funções de Green para a equação de Dirac, ter-se-á sempre que:

∂ axl ψ( xl )γ a Sc• ( xl − x j ) = iψ( xl )δ( xl − x j ) ,




∂ axl Sc• ( x j − xl )γ a ψ( xl ) = −iδ( xl − x j )ψ( xl ) .



(7.158)

Dessa forma, as equações satisfeitas pelo operador de campo de Dirac e pelas distribuições
covariantes que lhe são associadas permitem sempre eliminar as derivadas que agem sobre
o campo de Dirac. Ademais, no processo indutivo da TPC, a distribuição causal da ordem n
é construída com as distribuições Tm com m ∈ In−1 , as quais já são normalizadas. Portanto, a
parte instantânea Si• ( xl − x j ) só pode estar presente se é gerada no procedimento de divisão
em relação ao novo ponto adicionado na ordem n, xn , ou seja, se o próprio ponto xl é xn ,
ou se está diretamente conectado a ele. Isto é verdade quer haja um operador de campo
fermiônico no ponto xn ou não; em qualquer caso, todos os termos instantâneos em Tn podem
ser gerados apenas na divisão da distribuição causal Dn em relação ao ponto xn . Temos
visto, no entanto, que os termos instantâneos que se geram em S• podem ser cancelados por
uma escolha adequada dos termos de normalização. O mesmo não ocorre com os termos de
gauge da distribuição de comutação do campo de radiação no gauge do plano nulo, mas
isso é irrelevante no presente caso, pois desde que as identidades-Cg se aplicam sempre
202 Capítulo 7. Eletrodinâmica quântica fermiônica

que haja um campo de fóton externo, A a ( xl ), é absolutamente impossível que haja alguma
distribuição associada ao fóton conetando o ponto xl com o resto da distribuição: Todas as
distribuições que conectam o ponto xl são associadas ao férmion.

Por esses motivos, uma vez considerados os termos de normalização que eliminam Si•
quando xl seja xn ou esteja conectado a ele, já não será possível o surgimento de nenhuma
derivada de campo fermiônico externo, de forma que, pela Eq. (7.156), a forma geral para a
a é, sem escrever os possíveis campos externos de fóton:
divergência de Tl,2 f

∂ axl Tl,2
a
f ( x1 ; · · · ; x n ) =
⌊ω− ( G )⌋+1
!
∑ : ψ ( x i1 ) · · · ψ ( x i f ) ∑ CbG ( x − ) D+
b
,⊥ δ ( x
+,⊥
) ψ( x j1 ) · · · ψ( x j f ) : , (7.159)
G |b|=0

G ( n −1)
com as distribuições numéricas CbG ( x − ) ≡ CbG1 ( x1− − xn− ) · · · Cb ( xn−−1 − xn− ) e δ( x +,⊥ ) ≡
δ( x1+,⊥ − xn+,⊥ ) · · · δ( xn+−,⊥1 − xn+,⊥ ), e b um multi-índice. A soma é estendida a todas as
distribuições G com M = 2 f férmions externos e N fótons, um deles no ponto xl . Porém,
exatamente pelo fato de já termos eliminado Si• ( x j − xn ) (l = j ou l = n), em Tl,2 a não pode
f
haver mais termos não covariantes provindo de distribuições fermiônicas, mas todos os
possíveis, já o dissemos, serão os termos de gauge caso seja usado o gauge do plano nulo –e
nenhum deles incluirá o ponto xl –.

Neste ponto, o comentário feito acima adota uma relevância capital: Como o ponto xl só
pode estar conectado com o resto da distribuição por distribuições associadas ao férmion, na
derivação em relação a xl não tem importância qual seja a distribuição considerada para o
fóton, pois o ponto xl nunca será seu argumento. É claro, ∂ axl Tl,2
a pode em geral ter diferente
f
expressão no gauge do plano nulo ou na construção covariante, mas se é igual a zero em
um caso, também o será no outro, pois a parte da distribuição que depende de xl é igual em
ambos os casos. Podemos, portanto, concluir que, embora as anomalias, caso existissem,
seriam diferentes, as identidades-Cg são satisfeitas no gauge do plano nulo se, e somente se,
também o são na construção covariante. Claro, não devemos entender isto senão literalmente:
Ainda com a equivalência da regência das identidades-Cg, não podemos afirmar por este
argumento a igualdade das diversas distribuições de transição da QED no plano nulo e as
da dinâmica instantânea.

Logo, bastará verificar a validade das identidades de Ward-Takahashi para a teoria com
distribuição de comutação covariante do campo da radiação. É mister lembrar que somente
elas sendo satisfeitas é que podemos afirmar com total certeza que a QED é uma teoria
de gauge quântica, e assim poderemos concluir que, caso desejássemos usar o campo de
radiação quantizado sob a condição de gauge do plano nulo, embora as distribuições de
transição possam ser não covariantes devido à possível presença de termos de gauge, os
elementos de matriz do operador de espalhamento no subespaço físico serão covariantes
pela construção feita no Cap. 6. Dessarte, na Eq. (7.159) devemos considerar apenas termos
Capítulo 7. Eletrodinâmica quântica fermiônica 203

covariantes, e portanto ela deve ser reduzida a:

⌊ω− ( G )⌋+1
!
∂ axl Tl,2
a
f ( x1 ; · · · ; xn ) = ∑ : ψ ( x i1 ) · · · ψ ( x i f ) ∑ CbG D b δ( x ) ψ( x j1 ) · · · ψ( x j f ) : .
G |b|=0
(7.160)

Por outro lado, vimos no Cap. 4 que os únicos termos na distribuição de transição cuja ordem
singular pode ser maior que a da distribuição causal têm suporte em En− , e são portanto
termos de normalização que podem ser imediatamente eliminados. Donde basta considerar
Ga , dada na Eq. (7.146). Daí
na Eq. (7.160) ω− ( G ) correspondente à distribuição causal Dl,2 f
vemos que os casos que precisam de análise, isto é, aqueles com ω− ≥ −1, são os mostrados
na Tabela 7.2.

N M ω− Processo
2 2 -1 Espalhamento de Compton
2 0 2 Polarização do vácuo
4 0 0 Espalhamento luz-luz
1 2 0 Função de vértice e auto-energia

Tabela 7.2: Distribuições com ordem singular ω− ≥ −1.

A partir desse ponto o percurso da análise é o mesmo que o mostrado na Ref. [107]. Por
completeza, o comentamos brevemente.

Espalhamento de Compton. Seja t(C) ( xi ; x j ; xn−1 ; xn ; · · · ) ab a distribuição numérica corres-


pondente ao espalhamento de Compton para o caso em que os campos fermiônicos estão
nos pontos xi e x j , e os campos de radiação, nos xn−1 e xn . A Eq. (7.160) se lê:
!
∂ xn a ∑ : ψ( xi )t(C) ( xi ; x j ; xn−1 ; xn ; · · · ) ab ψ( x j ) : = ∑ Cij : ψ( xi )γb ψ( x j ) : δ . (7.161)
i,j i,j

No entanto, na distribuição de transição, cada termo entre os parênteses do lado esquerdo da


Eq. (7.161) está multiplicado pelo produto de Wick : A a ( xn ) Ab ( xn−1 ) : . Como esse último
produto é par perante a transformação de conjugação da carga elétrica, enquanto que a
distribuição de transição completa deve sê-lo também –pois ela é uma simetria experimental
da QED–, também o lado esquerdo da Eq. (7.161) tem de sê-lo. No lado direito, por outro
lado, o suporte da distribuição delta de Dirac implica que os argumentos xi e x j sejam os
mesmos, do qual reconhecemos que ele é uma corrente elétrica, ímpar frente à conjugação
de carga. Vê-se daqui que a única possibilidade é que todos os coeficientes Cij sejam nulos, e
a identidade de Ward-Takahashi é satisfeita sem requerer normalização –que, digamos de
passo, só seria possível com o indesejável efeito de aumentar a ordem singular da distribuição
de transição, pois esta tem ω− = −1–.
Um exemplo explícito pode ser visto na Seç.7.3.2: Embora a distribuição da Eq. (7.57)
204 Capítulo 7. Eletrodinâmica quântica fermiônica

pareceria não satisfazer à identidade-Cg, como de fato não o faz por si só, é necessário
lembrar que há um segundo termo, correspondente à corrente elétrica na direção oposta
[vide a Eq. (7.52)]; a soma das duas distribuições, invariante por conjugação de carga elétrica,
já satisfaz à identidade desejada.

Polarização do vácuo. A denotamos por Πba ( x1 ; x2 ; · · · ; xn ), em que os campos da radiação


externos estão nas coordenadas x1 e x2 com índices b e a, respectivamente. A forma mais
geral que pode ter sua divergência na teoria covariante é, segundo a Eq. (7.160):
!
∂ x1 b Πba ( x1 ; x2 ; · · · ) = ∑ Cijk ∂cx ∂x c ∂axi j k
+ ∑ Lk ∂ axk δ . (7.162)
i,j,k k

Essa forma geral deve ser restrita pelas simetrias da distribuição Πba . Em primeiro lugar,
o fato de que, tomando a divergência da Eq. (7.162) em relação à coordenada x2 , o re-
sultado há de ser simétrico em relação às coordenadas x1 e x2 : ∂ x2 a ∂ x1 b Πba ( x1 ; x2 ; · · · ) =
∂ x2 a ∂ x1 b Π ab ( x2 ; x1 ; · · · ). Em segundo lugar, o fato de que, por se tratar de uma distribuição
de transição, deve ser simétrica em todos seus pontos internos x3 , . . . , xn . Mantendo na Eq.
(7.162) somente os termos que respeitam a essas simetrias, obtemos que a forma geral antes
dada deve ser reduzida a:

n n
∂ x1 b Πba ( x1 ; x2 ; · · · ) = C1 ∑ ∂cxi ∂ xi c ∂ ax1 + C2 ∑ ∂cxi ∂ x1 c ∂ axi + C3 ∂cx1 ∂ x2 c ∂ ax2 + C4 ∂cx2 ∂ x2 c ∂ ax1
i =3 i =3
!
+ (C3 + C4 )∂cx1 ∂ x1 c ∂ ax1 + C5 ∂cx1 ∂ x1 c ∂ ax2 + C6 ∂cx1 ∂ x2 c ∂ ax1 + C7 ∂ ax1 δ

n n
= ∂ x1 b g ab C1 ∑ ∂cxi ∂ xi c + C2 ∑ ∂bxi ∂ axi + C3 (∂bx1 ∂ ax1 + ∂bx2 ∂ ax2 ) + C4 g ab (□x1 + □x2 )
i =3 i =3
!
+ C5 ∂bx1 ∂ ax2 + C6 ∂bx2 ∂ ax1 + C7 g ab
δ . (7.163)

Dessa forma, vemos que ∂ x1 b Πba − (· · · ) = 0, em que «(· · · )» denota a expressão entre


parênteses na equação anterior. Como (· · · ) tem suporte na origem das coordenadas, este
tem a forma de um termo de normalização. Segue disto que os termos de normalização da
polarização do vácuo podem sempre ser escolhidos de forma a satisfazer à identidade-Cg,
que reconhecemos como sendo uma das identidades de Ward-Takahashi, a qual, no caso,
exprime a transversalidade dessa distribuição em relação ao impulso do fóton externo.

Espalhamento luz-luz. Seja t( LL) ( x1 ; x2 ; x3 ; x4 ; · · · ) abcd a distribuição numérica desse pro-


cesso, em que os campos de fóton externos se localizam nos pontos x1 , x2 , x3 e x4 . Segundo
a Eq. (7.160), ter-se-á em geral que:

n  
∂ x1 a t( LL) ( x1 ; x2 ; x3 ; x4 ) abcd = ∑ Ck1 gcd ∂bxk + Ck2 gbd ∂cxk + Ck3 gbc ∂dxk δ . (7.164)
i =1
Capítulo 7. Eletrodinâmica quântica fermiônica 205

Dessa vez os termos do lado direito têm de ser restringidos pelo fato de que a distribuição
∂ x1 a ∂ x2 b ∂ x3 c ∂ x4 d t( LL) ( x1 ; x2 ; x3 ; x4 ; · · · ) abcd tem de ser simétrica em relação às coordenadas
x1 , x2 , x3 e x4 , assim como que t( LL) ( x1 ; x2 ; x3 ; x4 ; · · · ) abcd é simétrica em relação aos pontos
internos x5 , . . . , xn . Isto leva a reduzir a Eq. (7.164) à forma mais simples:
 
∂ x1 a t( LL) ( x1 ; x2 ; x3 ; x4 ) abcd = C gcd ∂bx1 + gbd ∂ x1c + gbc ∂dx1 δ
 
= C∂ x1 a g ab gcd + g ac gbd + g ad gbc δ , (7.165)
 
do que ter-se-á que ∂ x1 a t( LL)abcd − (· · · ) abcd = 0, e como (· · · ) abcd tem suporte na origem,
concluímos que a identidade-Cg (de Ward-Takahashi) para o espalhamento luz-luz pode
sempre ser satisfeita. Como provamos na Seç. 7.6, essa identidade implica que não há termos
de auto-interação de fótons.

Função de vértice e auto-energia. A quarta linha da Tabela 7.2 inclui aquelas distribuições
de transição em que estão presentes dois operadores de campo fermiônico externos e um
do campo de radiação. Assumiremos convencionalmente –e, evidentemente, sem perda
de generalidade– que o campo de fóton se encontra no ponto xn . Há então três tipos de
distribuições que devem ser somadas no lado esquerdo da Eq. (7.160):

1) Aquelas em que os campos fermiônicos se encontram em pontos diferentes de xn e


diferentes entre si. Elas definem a distribuição chamada «função de vértice»:

: ψ ( xi ) Λ a ( x n ; xi ; x j ; · · · ) ψ ( x j ) A a ( x n ) : . (7.166)

2) Aquelas em que os campos fermiônicos se encontram em pontos diferentes de xn , mas


iguais entre si. Elas contêm a já estudada polarização do vácuo:

: ψ( xi )Π ac ( xn ; x j ; · · · ) Dcb
F
( x j − xi ) γ b ψ ( xi ) A a ( x n ) : . (7.167)

3) Aquelas em que um dos campos fermiônicos –quer ψ, quer ψ, e os dois casos devem
ser levados em conta– se encontra no ponto xn , enquanto que o outro em um ponto
diferente. Nesse tipo de distribuições aparece a auto-energia do férmion:

: ψ ( x n ) γ a S F ( x n − xi ) Σ ( xi ; x j ; · · · ) ψ ( x j ) A a ( x n ) :
+ : ψ ( xi ) Σ ( xi ; x j ; · · · ) S F ( x j − x n ) γ a ψ ( x n ) A a ( x n ) : . (7.168)

A expressão entre os parênteses do lado esquerdo da Eq. (7.160) é então constituída pela
soma sobre todos os i, j ∈ In−1 com i ̸= j das distribuições anteriores –sem o operador de
campo de radiação–. Porém, quando a derivação agir nas distribuições do tipo da Eq.(7.167),
como ela é feita em relação à variável xn , apenas o tensor de polarização do vácuo será
afetado. Assim, se assumirmos que ele já foi normalizado de forma a ser transversal ao
momento do fóton (como já mostramos possível), tal termo se anula. Note-se que essa
206 Capítulo 7. Eletrodinâmica quântica fermiônica

anulação nada tem a ver com que o gauge do plano nulo esteja ou não sendo usado: A
F na Eq. (7.167) pode conter termos de gauge ou não; como ela não tem ao
distribuição Dcb
ponto xn por argumento, sua forma explícita é completamente irrelevante nessa discussão.
Donde esta identidade-Cg se tornará a identidade de Ward-Takahashi que envolve à função
de vértice e a auto-energia do férmion. A Eq. (7.160) é, no caso em questão, e já levando em
conta a simetria em relação às variáveis xi , x j com i, j ∈ In−1 :

∑ ∂ xn a : ψ ( xi ) Λ a ( x n ; xi ; x j ; · · · ) ψ ( x j ) : + : ψ ( x n ) γ a S F ( x n − xi ) Σ ( xi ; x j ; · · · ) ψ ( x j ) :
i,j∈ In−1
i̸= j

+ ψ ( xi ) Σ ( xi ; x j ; · · · ) S ( x j − x n ) γ ψ ( x n )
: F a
:
 
= ∑ : ψ( xi ) C0 + C1 / ∂ xi + C2 / ∂ x j + Cn / ∂ xn δ ψ ( x j ) : . (7.169)
i,j∈ In−1
i̸= j

Vejamos com detalhes o lado direito dessa equação. Como tratamos com a derivada da
distribuição delta de Dirac, é conveniente estudar sua ação sobre uma função de teste f ,
que assumimos –e bem que não poderia ser de outra forma, pois a teoria causal tem tal
propriedade como axioma– invariante sob translações. Temos então que:
Z
∑ ∂ x i δ ψ ( x j ) : f ( x 1 − x n ; · · · ; x n −1 − x n ) d 4 x 1 · · · d 4 x n
: ψ ( xi ) /
i ∈ In−1

=− ∑ : ψ( xn )γ a ψ( xn ) : (∂ xi a f )(0) + im(n − 1) : ψ( xn )ψ( xn ) : f (0) , (7.170)


i ∈ In−1

em que, para obter o segundo termo da segunda linha, usamos a equação de Dirac satisfeita
pelo operador de campo ψ quando a derivada age sobre ele. Adicionalmente, o primeiro
termo da segunda linha pode ser simplificado usando da invariância sob translações:

∑ (∂ xi a f )( x1 − xn ; · · · ; xn−1 − xn ) = −(n − 1)∂ xn a f ( x1 − xn ; · · · ; xn−1 − xn ) .


i ∈ In−1

Por estes motivos, e como a soma estendida a i, j ∈ In−1 com i ̸= j que aparece no lado direito
da Eq. (7.169) pode ser escrito como a soma sobre i, j ∈ In−1 menos a soma sobre i, j ∈ In−1
com i = j, ter-se-á que o lado direito da equação mencionada é, no sentido distribucional,
igual a:
∑ : ψ( xi ) C0′ + C /

∂ xn δ ψ ( x j ) : , (7.171)
i,j∈ In−1
i̸= j

em que C0′ inclui todos os termos de massa como os da Eq. (7.170). Finalmente, como o
lado esquerdo da Eq. (7.169) é multiplicado por uma campo de radiação na distribuição de
transição, ele deve ser ímpar diante da conjugação de carga. Na Eq. (7.169) esta propriedade
é satisfeita pelo termo com constante C, mas não o é pelo termo com constante C0′ ; é preciso
Capítulo 7. Eletrodinâmica quântica fermiônica 207

então que seja C0′ = 0. Desta forma, a Eq. (7.171) pode ser escrita como:

∑ ∂ xn a : ψ( xi )Cδγ a ψ( x j ) :

, (7.172)
i,j∈ In−1
i̸= j

que tem a forma de um termo de normalização e pode, portanto, ser absorvida por uma
normalização da função de vértice na Eq. (7.169). Se além disto levamos em conta as Eqs.
(7.158) para simplificar o lado esquerdo da Eq. (7.169), concluímos que a seguinte identidade
pode sempre ser satisfeita:
h
∑ : ψ ( xi ) ∂ xn a Λ a ( x n ; xi ; x j ; · · · )
i,j∈ In−1
i̸= j
i
+ iδ( xi − xn )Σ( xi ; x j ; · · · ) − iδ( x j − xn )Σ( xi ; x j ; · · · ) ψ( x j ) : = 0 . (7.173)

Aplicando essa identidade distribucional a uma função de teste, então avaliando os elemen-
tos de matriz do operador obtido entre pacotes de onda do campo de Dirac, observamos
que, como estes últimos são arbitrários (dentro das óbvias restrições), é necessário que a
identidade seja satisfeita na forma: ∀i, j ∈ In−1 , i ̸= j:

∂ xn a Λ a ( xn ; xi ; x j ; · · · ) + iδ( xi − xn )Σ( xi ; x j ; · · · ) − iδ( x j − xn )Σ( xi ; x j ; · · · ) = 0 . (7.174)

Particularmente –o que é suficiente devido à simetria das distribuições de transição em


seus argumentos–, colocando i = 1 e j = 2, e usando a invariância sob translações para
fazer em Λ a uma translação de todos seus argumentos pela quantidade − xn (ponto em que,
lembremos, o fóton se localiza), e em Σ uma pelo valor − x2 , obtém-se a seguinte identidade
de Ward-Takahashi:

∂ xn a Λ a ( x1 − x n ; x2 − x n ; · · · )
+ iδ( x1 − xn )Σ( x1 − x2 ; · · · ) − iδ( x2 − xn )Σ( x1 − x2 ; · · · ) = 0 . (7.175)

Ou ainda, mais conveniente para a posterior aplicação da transformação de Fourier, introdu-


zindo as coordenadas relativas y j := x j − xn :

− ∑ ∂y j a Λ a (y1 ; y2 ; · · · ) + iδ(y1 )Σ(y1 − y2 ; · · · ) − iδ(y2 )Σ(y1 − y2 ; · · · ) = 0 . (7.176)


j∈ In−1

Assim, definindo os momentos p j conjugados a y j , j ∈ In−1 , a transformação de Fourier


permite escrever a identidade de Ward-Takahashi no espaço dos momentos:

∑ p ja Λ̂ a ( p1 ; p2 ; · · · ; pn−1 )
j∈ In−1
h i
+ (2π )−2 Σb (− p2 − · · · − pn−1 ; p3 ; · · · ; pn−1 ) − Σ
b ( p 1 ; p 3 ; · · · ; p n −1 ) = 0 . (7.177)
208 Capítulo 7. Eletrodinâmica quântica fermiônica

Desta forma, encontramos de forma explícita todas as restrições que as identidades


de Ward-Takahashi impõem sobre as diversas distribuições de transição. Como, o temos
provado, todas elas podem ser satisfeitas, podemos concluir finalmente que a QED é uma
teoria de gauge quântica7 .

Condições de normalização da auto-energia e da função de vértice. Há ainda um ponto


que desejamos estabelecer. Como comentamos no final da Seç. 7.5, a identidade de Ward-
Takahashi que relaciona a função de vértice com a auto-energia, faz com que suas normaliza-
ções sejam, em certa medida, arbitrárias. Desejamos elaborar esse enunciado. Comecemos
por especializar a Eq. (7.177) para n = 3:
h i
( p1 + p2 ) a Λ̂ a ( p1 ; p2 ) = (2π )−2 Σb ( p1 ) − Σ
b (− p2 ) . (7.178)

Como a ordem singular da função de vértice é ω− = 0 [vide a Tabela 7.1], ela pode ser
normalizada segundo:
Λ̃ a ( p1 ; p2 ) = Λ̂ a ( p1 ; p2 ) + Cγ a , (7.179)

enquanto que a auto-energia, já o sabemos, admite a normalização:

Σ
e ( p) = Σ
b ( p) + C0 + C1 /
p . (7.180)

A identidade de Ward-Takahashi implica que, se Λ̂ a e Σ


b já a satisfazem, há ainda a liberdade
de re-normalizá-las sempre que as constantes C e C1 se relacionem por:

C = (2π )−2 C1 . (7.181)

A suposição de que existam Λ̂ a e Σ


b já satisfazendo à identidade de Ward-Takahashi pode ser
fácilmente justificada: Tomando na Eq. (7.178) o limite em que p2 → − p1 , a dita equação
torna-se:
∂Σ
b ( p)
= (2π )2 Λ̂ a ( p; p) . (7.182)
∂p a
Logo vemos que se colocarmos, por exemplo, a condição de normalização da Eq. (7.126),
então a equação anterior é verificada escolhendo para a função de vértice a solução central,
em que Λ̂ a (0; 0) = 0. Nela também, como está avaliada fora da camada de massa, não haverá
problemas de divergências infra-vermelhas.
Por outro lado, como tínhamos visto, a eleição de C1 na normalização da auto-energia é
complicada, pois embora pareceria influenciar o valor da carga elétrica, é impossível dizê-lo
com certeza pelo estudo do propagador completo do elétron, uma vez que a auto-energia
possui primeira derivada divergente na camada de massa. Em seu lugar, portanto, devemos
lembrar que a carga elétrica é definida em processos de espalhamento de elétrons em um

7 Em linguagem convencional, diria-se que a QED é uma teoria «sem anomalias», porém o leitor concordará
em que, caso existissem anomalias, não haveria certamente motivo para dizer que a teoria é de gauge, como fica
implícito pela definição da teoria de gauge que oferecemos no Cap. 6.
Capítulo 7. Eletrodinâmica quântica fermiônica 209

campo eletromagnético estático externo (clássico). Formalmente, o problema do campo


externo se formula por meio da substituição [209]: A a = Arad ext
a + A a , em que, explicitamente,
se separa o operador de campo quantizado de radiação Arad ext
a do campo externo clássico A a .
Semelhante separação permite obter os termos com campo externo clássico, sem por isso
perder os processos nos quais o fóton (quântico) aparece intermediariamente. Do ponto de
vista pragmático, por isto, basta efetuar os procedimentos usuais e colocar, no final, o campo
eletromagnético sem contrair igual ao campo clássico externo.

Prosseguindo, na terceira ordem as mesmas distribuições de transição das Eqs. (7.166),


(7.167) e (7.168) aparecem, com a única diferença de que o operador de campo A a ( x3 ) é
substituído pelo campo clássico Aext
a ( x3 ). Vemos, desta forma, que a normalização da
polarização do vácuo efetivamente afeta ao valor da carga elétrica; mas como já tínhamos
escolhido para ela a solução central, não precisamos mais considerá-la. Ficamos assim com o
vértice e a auto-energia do elétron. A distribuição de transição da terceira ordem será:
h
: ψ ( x1 ) Λ a ( x1 ; x2 ; x3 ) ψ ( x2 ) : + : ψ ( x3 ) γ a S F ( x3 − x1 ) Σ ( x1 − x2 ) ψ ( x2 ) :
i
+ : ψ( x1 )Σ( x1 − x2 )S F ( x2 − x3 )γ a ψ( x3 ) : Aext a ( x3 ) . (7.183)

O correspondente termo do operador de espalhamento é obtido integrando nas variáveis


x1 , x2 e x3 com as funções de comutação adiabática. Para este fim, escolhemos –como na Ref.
[107]– uma função g0 ∈ S (R4 ) tal que g0 (0) = 1, e consideramos g( x ) = g0 (ϵx ); o limite
adiabático consiste então em fazer o parâmetro ϵ tender para zero. Note-se, ademais, que o
fato de ser g0 (0) = 1 implica que:
Z
d4 k ĝ0 (k ) = (2π )2 . (7.184)

Se, além do mais, avaliamos o operador assim obtido entre estados de impulso definido p e
q, obter-se-á, após a escrituração das diversas distribuições em função de suas transformadas
de Fourier e posterior integração nas variáveis x1 , x2 e x3 –desconsideramos fatores de 2π
por simplicidade–:
Z h
u( p) d4 k1 d4 k2 d4 k3 ĝ0 (k1 ) ĝ0 (k2 ) ĝ0 (k3 ) Λ̂ a ( p − ϵk1 ; −q − ϵk2 )
i
+ γ a SbF (q + ϵ(k1 + k2 ))Σ
b (q + ϵk2 ) + Σ
b ( p − ϵk1 )SbF ( p − ϵ(k1 + k2 ))γ a u(q)

× Âext
a ( p − q − ϵ ( k 1 + k 2 + k 3 )) . (7.185)

Independentemente do valor dessa integral, no que estamos interessados é em ver o que


ocorre quando uma re-normalização é feita. Das Eqs. (7.179) e (7.185) observa-se que a
contribuição do termo de normalização da função de vértice é:
Z
u( p) d4 k1 d4 k2 d4 k3 ĝ0 (k1 ) ĝ0 (k2 ) ĝ0 (k3 )Cγ a u(q) Âext
a ( p − q − ϵ ( k 1 + k 2 + k 3 ))

= (2π )6 Cu( p)γ a u(q) Âext


a ( p − q) , (7.186)
210 Capítulo 7. Eletrodinâmica quântica fermiônica

em que temos usado a Eq. (7.184) e tomado o limite adiabático ϵ → 0. Quanto à contribuição
dos termos contendo à auto-energia, nota-se que, devido à relação entre as constantes C0 e C1
mostrada na Eq. (7.125), uma re-normalização compatível com a condição de normalização
relativa à massa física é dada por:

Σ
e ( p) = Σ p − m)
b ( p) + C1 (/ . (7.187)

Escrevendo, ademais, a forma explícita do propagador de Feynman do elétron, ter-se-á:


Z
−2
C1 (2π ) u( p) d4 k1 d4 k2 d4 k3 ĝ0 (k1 ) ĝ0 (k2 ) ĝ0 (k3 ) Âext
a ( p − q − ϵ ( k 1 + k 2 + k 3 ))
"
q + ϵ(/
/ k1 + /k 2) + m
× γa k 2 − m)
( q + ϵ/
(q + ϵ(k1 + k2 )) − m2 + i0+ /
2
#
p − ϵ(/
/ k1 + /k 2) + m a
p − ϵ/
+ (/ k 1 − m) γ u(q) . (7.188)
( p − ϵ(k1 + k2 ))2 − m2 + i0+

Usando as equações de Dirac satisfeitas por u( p) e u(q) para simplificar essa expressão, e
tomando o limite adiabático trivial em k3 , o que permite a integração nessa variável:

2ϵp(k1 + k2 )
Z
− C1 u( p) d4 k1 d4 k2 ĝ0 (k1 ) ĝ0 (k2 ) a ( p − q) + O (ϵ)
γ a u(q) Âext
2ϵp(k1 + k2 ) − i0+
= −(2π )4 C1 u( p)γ a u(q) Âext
a ( p − q) . (7.189)

A última linha, evidentemente, é o resultado no limite adiabático, em que os termos O (ϵ)


se anulam. Com os resultados (7.186) e (7.189) verificamos que, se C e C1 se relacionam
como o determina a Eq. (7.181), então a contribuição destes termos de normalização para o
espalhamento do elétron por um campo externo é nula: Eles não afetam ao valor da carga
elétrica, e podem, portanto, ser escolhidos arbitráriamente sem nenhuma consequência física.
Isto justifica por completo o uso da condição de normalização da Eq. (7.126).
Capítulo 8

Epílogo

Na tese a que agora damos conclusão apresentamos um estudo detalhado da teoria


do campo quantizado na forma dinâmica do plano nulo a partir da perspectiva da teoria
de perturbação causal. Neste último capítulo, resumiremos e comentaremos os pontos
mais relevantes do desenvolvimento feito, e exporemos também nossas perspectivas para o
trabalho futuro.
Começamos estudando a teoria do campo clássico na forma dinâmica da frente de luz
(Cap. 2), à qual, vimos, é possível chegar não somente pelo método algébrico de Dirac (Ap.
A) –que, por outro lado, permite salientar fatos importantes desta forma dinâmica, como o
de ser aquela em que o grupo de estabilidade é maior–, mas também do próprio estudo do
problema dos valores iniciais da equação de Klein-Gordon-Fock. A teoria do campo no plano
nulo, neste sentido, se relaciona com o estudo das soluções à susodita equação quando os
valores iniciais são dados em suas superfícies características (problema de Goursat). A boa
definição deste problema foi explicitamente mostrada para todos os campos de que fizemos
uso nesta tese: O escalar, o fermiônico e o vetorial não-massivo. Este estudo no regime
clássico possui importância capital, ao ponto que não acreditamos ser exagerado dizer que,
sem ele, nenhum desenvolvimento posterior teria sido possível. Com efeito, a decomposição
dos campos clássicos em suas componentes dinâmicas e não-dinâmicas apontou o caminho
para o método de quantização do campo livre por construção direta do espaço de Fock (Cap.
3), e permitiu reduzir o programa de quantização de todo campo ao da do campo escalar
(quer bosônico, quer fermiônico) aplicado a suas componentes dinâmicas; ademais, nestas
deduções apareceram pela primeira vez as distribuições que, mais tarde, por construção,
corresponderam aos (anti-)comutadores dos respectivos operadores de campo quantizado.
Isto mostra a estreitíssima relação existente entre a teoria do campo clássico e a do quântico,
e a necessidade de estudar detalhadamente aquela antes de formular esta.
A parte central desta tese foi a formulação da TPC no plano nulo (Cap. 4). Ela foi baseada
nos axiomas de Bogoliubov, Medvedev e Polivanov para o operador de espalhamento e
faz uso, também, do método de comutação adiabática da interação. Na dinâmica da frente
de luz, no entanto, o axioma da causalidade precisou ser modificado para ser compatível
com a nova escolha do parâmetro de evolução temporal –coordenada x + –, modificação esta
cujo principal efeito é a possibilidade de que o suporte das distribuições retardadas e o das
avançadas contenham ao eixo x − . Não obstante isto, provamos que a construção indutiva
das distribuições de transição ainda é possível; porém, as distribuições de normalização das
soluções ao problema de divisão da distribuição causal têm suporte no eixo x − , diferente
à dinâmica instantânea, em que o têm só na origem das coordenadas. Mostramos que tal

211
212 Capítulo 8. Epílogo

modificação não evita a possibilidade de encontrar soluções covariantes de Lorentz sempre


que as distribuições causais sejam covariantes.
Quanto à implementação prática do método indutivo causal na forma dinâmica do
plano nulo, para poder efetuar a divisão da distribuição causal em suas partes retardada e
avançada foi necessário introduzir o conceito de quase-assíntota por variável selecionada,
pois devido a que a interseção do plano nulo x + = 0 com o cone de luz com vértice na
origem das coordenadas (relativas) é o eixo x − , não é suficiente cuidar do comportamento
singular da distribuição na origem, senão que é preciso fazê-lo em todo o eixo x − . Outrossim,
com a finalidade de obter expressões bem definidas para a obtenção das distribuições
retardada e avançada, a distribuição causal precisa ser multiplicada por uma função b( x − )
com suporte compacto antes da divisão ser efetuada. As distribuições «reais» são finalmente
obtidas no limite b → 1. Neste sentido, oferecemos motivos matematicamente claros para a
necessidade de limitar o alcance de variação da coordenada longitudinal. Por outro lado, a
função auxiliar b introduzida não leva a modificação alguma quando as distribuições são
entendidas como sendo definidas sobre o espaço das funções de teste com algum suporte
compacto preestabelecido na variável x − . Provamos, ademais, que a ordem singular no
eixo x − determina o espaço de funções de teste no qual a distribuição retardada existe
univocamente: Para ω− < 0, ele é o espaço de Schwartz completo, para ω− ≥ 0, ele é restrito
pela condição de anulamento das primeiras ⌊ω− ⌋ derivadas em relação às coordenadas x + e
x ⊥ , avaliadas no eixo x − . A extensão ao espaço de Schwartz completo, contudo, é possível,
porém não é única, senão ambígua, pois distribuições com suporte no eixo x − podem ser
adicionadas (problema da normalização); estas são fixadas atendendo a condições físicas
adicionais: Os axiomas de Bogoliubov, Medvedev e Polivanov que não foram utilizados na
construção da TPC –a saber, a covariância de Lorentz, a unitariedade e a estabilidade do
vazio e do setor de uma partícula–, simetrias discretas ou de gauge, valores das constantes
de acoplamento, et cetera.
As fórmulas de divisão foram levadas ao espaço dos momentos, onde assumem uma
forma mais prática, e no qual provamos um teorema de fatorização de polinômios que facilita
notavelmente os cálculos explícitos. Ainda mais, embora em nossos cálculos tenhamos
feito sempre a transformação de Fourier em todas as variáveis (x + , x ⊥ e também x − ),
verdadeiramente a transformação na variável x − é absolutamente opcional, pois nem o
cálculo da ordem singular nem as fórmulas de divisão dependem dela. Esta observação é
importante, pois, o dissemos no Cap. 3, a medida µ( p), obtida por restrição da µm ( p) ao
plano nulo, não é uma medida bem definida sobre o espaço de Schwartz completo, mas
somente sobre aquele subespaço seu caracterizado pelo anulamento da função em p− = 0.
Esta restrição não traz consequência nenhuma aos resultados que obtivemos devido à supra-
mencionada independência das fórmulas de divisão em relação à variável p− . No entanto,
é bem sabido que o espaço de distribuições definidas sobre um determinado espaço de
funções de teste é tanto maior quanto mais restrito é este, e por isso é possível que em
algumas circunstâncias a transformação de Fourier de uma dada distribuição definida no
espaço restrito não exista. Quando isto ocorrer, há duas opções possíveis para realizar o
Capítulo 8. Epílogo 213

estudo: Transformar apenas as variáveis x + e x ⊥ para as p+ e p⊥ , ou então deve-se estender


a distribuição ao espaço de Schwartz completo –por exemplo, com o uso das pseudo-funções
[159]–, caso em que a transformação de Fourier estará bem definida e os cálculos seguem
como no caso padrão. Tal modificação, é claro, não afeta os resultados uma vez que a
distribuição finalmente obtida seja restrita ao espaço inicial.
A primeira aplicação de nossos resultados foi realizada ainda no Cap. 4 para a obtenção
dos propagadores de Feynman dos operadores de campo quantizados livres. Verificamos
que o propagador de Feynman para o campo escalar se mantém igual ao da dinâmica
instantânea, enquanto que os dos campos fermiônico e vetorial sem massa adquirem termos
instantâneos, conhecidos na literatura. Em particular, o propagador para o campo vetorial
sem massa que obtivemos corresponde ao conhecido propagador duplamente transversal.
Os termos instantâneos que aparecem no procedimento de divisão, contudo, possuem a
ordem singular ω− = 0 no eixo x − , e, portanto, estão sujeitos a normalização; este resultado
prova que os tais termos não possuem informação física genuína, pois ainda devem ser
fixados atendendo a outras considerações; em particular, a imposição da covariância de
Lorentz às distribuições de transição dos modelos específicos considerados (Caps. 5 e 7) os
elimina por completo, o que indica que eles são nada mais que consequências do fato de que a
causalidade, entendida segundo a variável temporal x + , não pode fixar seu valor no eixo x − .
Precisamente, vimos nos diversos modelos de interação que as distribuições de normalização
requeridas para semelhante tarefa correspondem aos termos instantâneos que na abordagem
lagrangiana da teoria do campo aparecem como consequência de solucionar os vínculos da
teoria interagente, re-inserindo depois os mesmos na densidade lagrangiana de interação –e
que, se prova por uma análise combinatória, cancelam efetivamente os termos instantâneos
dos propagadores dos campos–; estes termos são sempre da segunda ordem na constante de
acoplamento, de forma que é natural, na filosofia da TPC, que tenham aparecido como termos
de normalização às distribuições de transição de dois pontos. Com esta correspondência, foi
possível encontrar as densidades lagrangianas efetivas no plano nulo dos modelos estudados.
No estudo particular do modelo de Yukawa (Cap. 5), além dos resultados já comentados,
calculamos as correções radiativas à segunda ordem, isto é, a auto-energia do méson e a do
núcleon. Particularmente, a divisão das distribuições causais foi facilitada pelo uso da téc-
nica de continuação analítica da distribuição retardada no espaço dos momentos ao tubo
R4 + iR0+ e− (Ap. C), permitindo obter claramente, a partir de expressões únicas, os resulta-
dos para todos os intervalos de variação do momento. Estes, se vê por comparação direta, se
equivalem aos resultados obtidos na dinâmica instantânea. No estudo da normalizabilidade
do modelo, provamos por um contra-exemplo que a ordem singular de uma dada distri-
buição causal não pode ser calculada a não ser que ela tenha sido obtida de forma fechada,
pois as convoluções de quase-assíntotas no eixo x − não existem em geral. Não está claro o
motivo de tal comportamento. Contudo, foi possível estabelecer indiretamente uma fórmula
geral para a ordem singular de uma distribuição qualquer, dependente do número de cam-
pos exteriores mesônicos e nucleônicos. Com isso, concluímos que o modelo de Yukawa no
plano nulo é, como na dinâmica instantânea, normalizável.
214 Capítulo 8. Epílogo

A quantização do campo vetorial sem massa levou ao aparecimento de termos não


covariantes na parte de frequência positiva e a de frequência negativa da distribuição de
comutação do referido campo. Como eles aparecem na construção das distribuições causais
na TPC, e para evitar as dificuldades de cálculo que seu uso originaria, foi desenvolvida
a teoria invariante de gauge quântica (Cap. 6). A ideia central desse método consiste em
estender o espaço de Fock para permitir a existência nele de estados não físicos; no caso
em questão, das polarizações escalar e longitudinal do campo vetorial sem massa. Esta
extensão, é claro, tem de ser feita de forma tal que os elementos de matriz do operador de
espalhamento entre vetores do subespaço físico se mantenham os mesmos da teoria inicial.
Provamos por isso que o subespaço físico é o mesmo para todos os observadores inerciais, e
que, nele, os operadores que representam às transformações de Poincaré são unitárias, em
concordância com o teorema de Wigner. Por outro lado, mostramos que existe um operador
de Krein, η, definindo uma forma bilinear segundo a qual as transformações de Poincaré
são pseudo-unitárias no espaço de Fock estendido, e segundo a qual, também, o campo
quantizado vetorial sem massa é pseudo-auto-adjunto. Esta forma bilinear corresponde ao
«produto interno indefinido» introduzido no método de quantização de Gupta e Bleuler. O
referido operador de Krein é facilmente encontrado na dinâmica instantânea como sendo
(−1)N0 , com N0 o operador de número de fótons escalares; na dinâmica no plano nulo,
todavia, como não conseguimos encontrar sua forma explícita, a prova de sua existência foi,
por assim dizer, indireta.
A exigência de que o subespaço físico seja invariante em relação ao processo de extensão
do espaço de Fock e às transformações de gauge quânticas do operador de campo quan-
tizado vetorial não-massivo levou à necessidade de introduzir, simultaneamente, campos
escalares fermiônicos (fantasma) de massa nula. Eles permitiram escrever expressões para a
variação de gauge de monômios de Wick gerais contendo campos quantizados de gauge,
fantasmas e anti-fantasmas. Assim nos encontramos em posição de definir a teoria de gauge
quântica perturbativa como aquela em que a transformação de gauge da distribuição de
transição da primeira ordem não leva ao aparecimento de anomalias nas ordens superiores.
Provamos que termos que são variação de gauge exata ou divergência de outras quantidades
podem ser desconsiderados da distribuição de transição em qualquer ordem, sem isso trazer
modificação alguma aos elementos de matriz do operador de espalhamento no subespaço
físico. Mostramos, finalmente, que a condição necessária e suficiente para que uma dada teo-
ria de interação seja uma teoria de gauge quântica é que a variação de gauge da distribuição
de transição da primeira ordem seja igual à divergência do vértice-Q, e que as distribuições
de ordem superior possam ser normalizadas de tal forma a satisfazer às identidades-Cg.
Assim, a teoria invariante de gauge quântica pode ser considerada uma expressão parti-
cular da técnica geral de Becchi, Rouet, Stora e Tyutin (técnica BRST) [214] para os sistemas
vinculados, que consiste em estender apropriadamente a superfície dos vínculos do sistema
adicionando novos graus de liberdade, com a finalidade de simplificar o tratamento do pro-
blema ou explicitar alguma simetria de interesse. Como expusemos construtivamente, desde
sua base conceitual, a implementação dessa técnica geral ao caso particular da interação do
Capítulo 8. Epílogo 215

campo vetorial sem massa, justificando cada passo dado, o apresentado permite modifica-
ções, exempli gratia, para a quantização invariante de gauge do campo vetorial massivo, do
campo tensorial, e outras possibilidades a serem exploradas.
Em nosso estudo da QED (Cap. 7), vimos que no processo de espalhamento de Møller
a liberdade de normalização permite cancelar o termo que surge no propagador do fóton
no processo de divisão. Contudo, isso não é suficiente, pois ainda permanecem os termos
de gauge que provêm da distribuição de comutação do campo, os quais não podem ser
eliminados por normalização. Mostramos de forma explícita que eles, sem embargo, não
contribuem para os elementos de matriz do operador de espalhamento como consequência
dos campos de Dirac serem físicos (satisfazerem à condição de camada de massa). Dessarte,
confirmamos mediante este exemplo o que havíamos adiantado anteriormente: Embora a
condição de covariância de Lorentz não possa ser exigida na normalização quando a distri-
buição causal não possua essa propriedade, no caso do campo vetorial sem massa os termos
não covariantes não contribuem aos elementos de matriz do operador de espalhamento no
subespaço físico devido à invariância de gauge quântica. Ainda nos mantendo no uso da
distribuição de comutação obtida sob a condição de gauge do plano nulo, estudamos a po-
larização do vácuo. A forma do tensor que a representa, é claro, independe de qual seja
a distribuição de comutação, mas não o propagador completo do fóton, o qual, o verifica-
mos, mantém a mesma estrutura tensorial que o propagador no caso livre: A polarização do
vácuo modifica tanto a parte covariante como os termos de gauge da mesma forma, e não
leva ao aparecimento de nenhum termo adicional. Este resultado só pode ser considerado
equivalente à formulação covariante uma vez que a conservação da corrente elétrica seja
considerada; em uma palavra, é novamente a invariância de gauge quântica a que estabelece
a equivalência física dos diversos resultados.
Nosso estudo da auto-energia do férmion foi substancialmente simplificado pelo uso dos
resultados do Cap. 6, considerando apenas a parte covariante da distribuição de comutação
do campo eletromagnético. O resultado foi, como também o foi o tensor de polarização
do vácuo, o mesmo que se obtém na dinâmica instantânea. A mesma simplificação foi
considerada em nosso estudo do problema da normalizabilidade da QED no plano nulo:
Estudamos a normalizabilidade do operador de espalhamento físico, isto é, a de aqueles
termos cujos elementos de matriz no subespaço físico não se anulam. Obtivemos que ele
é normalizável, e ainda concluímos, em base a nossos resultados prévios, que ele pode ser
normalizado de forma a ser invariante de Lorentz. Verificamos que nenhum termo de auto-
interação pode ser gerado em ordens superiores nessa teoria: Para os férmions, devido a que
a ordem singular das distribuições que lhes dariam origem é sempre negativa; para os fótons,
embora seria possível uma auto-interação do tipo : A4 : , a mesma é proibida pela invariância
de gauge quântica. Mostramos, para mais, que as identidades-Cg da QED se equivalem
com as identidades de Ward-Takahashi e que elas podem sempre ser satisfeitas por uma
escolha conveniente dos termos de normalização das diversas distribuições. Finalmente,
provamos que por virtude da identidade de Ward-Takahashi que relaciona a função de
vértice com a auto-energia do férmion, a normalização dessas duas distribuições se vincula
216 Capítulo 8. Epílogo

de tal forma que o valor físico da carga elétrica não muda se elas se modificam; logo o
problema de divergência infra-vermelha na camada de massa na primeira derivada da
distribuição de auto-energia pode ser evitado, sem consequências físicas, escolhendo um
ponto de normalização diferente.
Pelos resultados assim referidos, acreditamos que a presente tese proporciona um firme
primeiro passo para o estabelecimento da QFT perturbativa no plano nulo sobre sólidas bases,
pois mostra a inexistência de problemas que são, então, só aparentes em outras formulações.
Estas últimas, por outro lado, possuem a virtude da simplicidade, e, por isso mesmo,
continuam sendo os melhores caminhos para a obtenção de resultados fenomenológicos. A
TPC no plano nulo, finalizamos, lhes dá o suporte teórico necessário.

Perspectivas. É claro que muito trabalho deve ainda ser feito em relação à TPC no plano
nulo. A obtenção de resultados como a razão giromagnética do elétron, que consta como
uma das previsões mais importantes da QED, deve ser reproduzida. Igualmente, a técnica do
grupo de renormalização, como introduzido por Stückelberg e Petermann e desenvolvido por
Bogoliubov e Shirkov, precisa ser detalhadamente estudada e implementada no formalismo.
A dita técnica, junto com o cálculo das correções radiativas da QCD, permitirão estabelecer
firmemente a liberdade assintótica dessa teoria.
No âmbito mais teórico, ainda é preciso aprofundar o estudo da normalizabilidade dos
diversos modelos. Assim, o motivo da não existência das convoluções de quase-assíntotas
no eixo x − deve ser esclarecido, e suas consequências, estudadas. Por outro lado, como
mencionamos no estudo da auto-energia do elétron na QED, existem regras de soma que
podem modificar o valor da ordem singular de uma dada distribuição. Consideramos um
problema em aberto, embora pareça difícil, reconhecer de forma geral quando uma de tais
regras de soma aparecerá, ou ainda se elas são mais comuns na dinâmica da frente de luz
do que na instantânea, pois as consequências de tais aparecimentos podem ser importantes.
Nossas fórmulas para a ordem singular e a normalizabilidade dos modelos estudados não
as levam em consideração.
Por outro lado, na construção da teoria invariante de gauge quântica impusemos a
hipótese simplificadora de que o operador de carga de gauge seja quadrático nos operadores
de emissão e absorção. Uma formulação completa requer, evidentemente, examinar as
consequências de relaxar semelhante restrição.
Finalmente, o estudo da SQED e da QCD no plano nulo está em progresso, assim como
a construção geral das variáveis dinâmicas locais em interação [210, 100]. Esse último
tópico, em particular, abre as portas a uma variedade de possíveis direções de estudo, por
exemplo, à aplicação do método causal para o cálculo perturbativo finito de fatores de forma
hadrônicos [213] e ao estudo dos operadores de criação hadrônicos em interação. Também, os
campos em interação podem ser definidos como as variáveis dinâmicas locais cujo primeiro
termo da série perturbativa é igual ao correspondente operador de campo quantizado livre,
estabelecendo um vínculo direto com a teoria de Källén para a QFT perturbativa na descrição
de Heisenberg [82], e relacionando, também, o operador de espalhamento da TPC com o
Capítulo 8. Epílogo 217

de Källén-Yang-Feldman [211, 212]. Além disso, se espera obter equações para as funções
de Green dos campos em interação (análogas às de Schwinger-Dyson), por meio das quais
se estudaria estados ligados, como o átomo de hidrogênio e os hádrons. Finalmente, a
possibilidade de estabelecer outros resultados, como fórmulas de redução ou a decomposição
espectral de Källén-Lehmann, deve também ser estudada.
Apêndice A

Definição algébrica das formas dinâmicas

Nesse apêndice introduziremos as diversas formas dinâmicas seguindo as idéias apresen-


tadas por Dirac [1], que colocou o problema da seguinte forma: Duas teorias, a relatividade
de Poincaré-Einstein, que exige a invariância da física perante as transformações do grupo
de Poincaré, e a mecânica quântica, cuja estrutura é hamiltoniana1 , passaram por importan-
tes provas experimentais. Quais serão as condições gerais que permitem a descrição de um
sistema físico compatível com esses dois requerimentos simultaneamente?
Começaremos com a imposição da possibilidade da formulação hamiltoniana. Essa
formulação se equivale com o formalismo dos colchetes de Poisson [215], segundo o qual
variáveis dinâmicas quaisquer, ξ, η e ζ, devem ter colchetes de Poisson regidos pelas leis:

{ξ; η } = −{η; ξ } , (A.1)


{ξ; η + ζ } = {ξ; η } + {ξ; ζ } , (A.2)
{ξ; ηζ } = {ξ; η }ζ + η {ξ; ζ } , (A.3)
{{ξ; η }; ζ } + {{η; ζ }; ξ } + {{ζ; ξ }; η } = 0 . (A.4)

Mas as variáveis dinâmicas estão definidas em relação ao sistema de coordenadas –exemplo


disto são as próprias coordenadas e os momentos–, de forma que aquelas mudam quando
essas são submetidas a uma transformação. Sob a transformação infinitesimal das coordena-
das, cada variável dinâmica ξ transforma-se segundo:

ξ ′ = ξ + {ξ; F } , (A.5)

com F alguma variável dinâmica infinitesimal, dependente apenas do sistema envolvido e


da transformação de coordenadas, e ao que se dá o nome de «gerador da transformação».
Essa forma da variação garante que as relações entre os colchetes de Poisson das diversas
variáveis dinâmicas permaneçam inalteradas, o que permite cumprir a exigência da teoria
da relatividade: «Sob as transformações do grupo de Poincaré, as variações das variáveis
dinâmicas devem ser tais que os colchetes de Poisson entre elas permaneçam inalterados».
Assim, faz-se necessário examinar os geradores das transformações de Poincaré. Uma

1 Naquela época, é mister dizê-lo, a formulação hamiltoniana era imprescindível para a transição da teoria

clássica para a quântica –assim o apontou Dirac explicitamente–; na atualidade tal restrição não rege mais, e
é perfeitamente possível formular a teoria ondulatória desde a abordagem lagrangiana ou ainda diretamente
desde as equações do movimento dos campos.

218
Apêndice A. Definição algébrica das formas dinâmicas 219

transformação infinitesimal de Poincaré muda as coordenadas segundo:

x ′µ = x µ + aµ + b ν x ν
µ
, (A.6)

com aµ os parâmetros infinitesimais da translação e bµν = −bνµ os parâmetros infinitesimais


associados à transformação de Lorentz. Mantendo a discussão no regime infinitesimal, o
gerador F deverá também ser linear nestes parâmetros:

1
F = − Pµ aµ + Mµν bµν ; Mµν = − Mνµ . (A.7)
2

A dependência com a transformação está inclusa nos parâmetros a e b; logo as variáveis


dinâmicas P e M caracterizam o sistema em estudo. A elas se chama «quantidades funda-
mentais». Com a finalidade de determinar a álgebra a que elas seguem, consideremos em
primeiro lugar a ação de duas transformações consecutivas, caracterizadas pelos geradores
F1 e F2 . A variável dinâmica ξ muda então para –mantendo termos até da ordem F1 F2 , mas
desconsiderando os da ordem F12 e F22 –:

ξ ′′ = ξ + {ξ; F1 } + {ξ; F2 } + {{ξ; F2 }; F1 } . (A.8)

Se as transformações forem aplicadas na ordem inversa, isto é, primeiro F2 e depois F1 , a


variável dinâmica teria-se tornado:

ξ ∗∗ = ξ + {ξ; F1 } + {ξ; F2 } + {{ξ; F1 }; F2 } . (A.9)

Dessas equações, a identidade de Jacobi expressa na Eq. (A.4) leva a estabelecer que a
diferença entre a aplicação das transformações em uma ordem e em outra é igual a:

ξ ∗∗ − ξ ′′ = {ξ; { F1 ; F2 }} . (A.10)

De sorte que o comutador das pequenas variações da variável dinâmica se relaciona com
o colchete de Poisson dos geradores das transformações correspondentes. Assim é que
poder-se-á estabelecer a álgebra de colchetes de Poisson entre os geradores P e M das
transformações de Poincaré, uma vez que seja conhecida a ação deles nas coordenadas.
Inicialmente se observa que, segundo as Eqs. (A.5), (A.6) e (A.7):

1
aµ + bµν xν = − aρ { x µ ; Pρ } + bρσ { x µ ; Mρσ } , (A.11)
2

cuja solução é:
µ µ µ
{ x µ ; Pρ } = −δρ , { x µ ; Mρσ } = δρ xσ − δσ xρ . (A.12)

Definamos agora os geradores:

1 1
F1 = − Pµ aµ + Mµν bµν , F2 = − Pρ a′ρ + Mρσ b′ρσ ,
2 2
220 Apêndice A. Definição algébrica das formas dinâmicas

cujo comutador é:

1 1 1
{ F1 ; F2 } = aµ aρ { Pµ ; Pρ } − aµ b′ρσ { Pµ ; Mρσ } − a′ρ bµν { Mµν ; Pρ } + bµν b′ρσ { Mµν ; Mρσ } .
2 2 4
(A.13)

Por outro lado, as transformações de coordenadas correspondentes, aplicadas sucessiva-


mente, levam, via a Eq. (A.6), a:
  
x ′′τ = x τ + a′τ + aτ + b′τη aη + bτλ + b′τλ + b′ η bηλ xλ ,
τ

   
x ∗∗τ = x τ + aτ + a′τ + bτη a′η + b′τλ + bτλ + bτη b′ηλ xλ ,

do qual obtém-se:
 
x ∗∗τ − x ′′τ = bτη a′η − b′τη aη + bτη b′ηλ − b′ η bηλ xλ
τ
. (A.14)

Como o ditam as Eqs. (A.10) e (A.13), o lado direito dessa equação deverá igualarse a:

1 1
aµ aρ x τ ; { Pµ ; Pρ } − aµ b′ρσ x τ ; { Pµ ; Mρσ } − a′ρ bµν x τ ; { Mµν ; Pρ }
  
2 2
1 µν ′ρσ  τ
+ b b x ; { Mµν ; Mρσ } . (A.15)
4

E dessa igualdade, por meio da Eq. (A.12), obtém-se a álgebra de colchetes de Poisson das
quantidades fundamentais, que não é outra senão a dos geradores das transformações de
Poincaré:

{ Pµ ; Pν } = 0 , { Mµν ; Pρ } = − gµρ Pν + gνρ Pµ , (A.16)


{ Mµν ; Mρσ } = − gµρ Mνσ + gνρ Mµσ − gµσ Mρν + gνσ Mρµ . (A.17)

Neste ponto, Dirac introduziu a noção das formas dinâmicas: Elas são as soluções para as
relações algébricas recém escritas. Para entender o que isto quer dizer, lembremos que nem
todas as transformações do grupo de simetrias do espaço-tempo levam à evolução dinâmica
das superfícies isocrônicas; na teoria newtoniana, por exemplo, em que o grupo de simetrias
é o grupo de Galilei, uma translação espacial ou uma rotação não mudam a superfície de
tempo constante, apenas a transformam em si mesma, são «transformações cinemáticas» e
a superfície isocrônica é estável em relação a elas. O mesmo ocorre na teoria relativística:
Alguns dos geradores o serão de transformações cinemáticas e constituirão o «grupo de
estabilidade» das superfícies isocrônicas, mapeando essas em si mesmas; os outros geradores
mudam a superfície, a fazem evoluir, e assim devem ser identificados com as transformações
dinâmicas; a esses geradores Dirac dá o nome de «hamiltonianos».

Já é evidente daqui que o grupo de estabilidade e os hamiltonianos dependerão de qual


seja a superfície isocrônica escolhida, e daí o interesse nas diversas formas dinâmicas: Pode
acontecer, como de fato acontece, que para alguns problemas a descrição da dinâmica seja
Apêndice A. Definição algébrica das formas dinâmicas 221

simplificada em uma determinada forma dinâmica, pois os hamiltonianos podem ser mais
simples ou mais complicados segundo a escolha da superfície isocrônica. Se tais grupos
de estabilidade não são isomórficos, então as formas dinâmicas que lhes correspondem
não poderão ser deformadas uma na outra por uma simples transformação de Poincaré;
em tais situações, que são precisamente as que definem formas dinâmicas «diferentes», a
equivalência física da descrição não se deriva do axioma da relatividade: Esse é o problema
da equivalência.
Para relacionar as superfícies isocrônicas com seu grupo de estabilidade, se as descreverá
por meio de uma função Σ = Σ( x ) cujo valor é constante nas superfícies; ele é a expressão
do «tempo» da forma dinâmica. Os geradores do grupo de estabilidade serão aqueles que
satisfaçam:
{ Σ ( x ); F } = 0 , (A.18)

pois assim sendo, como o dita a Eq. (A.5), a transformação gerada por F deixa invariante
o valor do tempo Σ. Os geradores que não satisfazem à Eq. (A.18), por outro lado, serão
os geradores da dinâmica. O colchete da Eq. (A.18) pode ser calculado uma vez que seja
conhecida a função Σ( x ) pelo uso das Eqs. (A.12).

Forma instantânea. Nessa forma dinâmica, as superfícies isocrônicas são aquelas em que a
coordenada x0 se mantém constante:

Σ( x ) = x0 . (A.19)

Usando as Eqs. (A.12), vê-se que:

x0 ; Pρ = −δρ0 x0 ; Mρσ = δρ0 xσ − δσ0 xρ


 
, . (A.20)

O grupo de estabilidade dessas superfícies espaciais contém, como na física newtoniana, às


translações e rotações espaciais, correspondentes aos geradores P1 , P2 , P3 , M12 , M23 e M31 ,
que são então os geradores cinemáticos da forma instantânea. Que eles constituem uma sub-
álbegra do grupo de Poincaré –e então dão origem a um subgrupo dele– pode ser diretamente
verificado com o uso das Eqs. (A.16)-(A.17): Todos os colchetes de Poisson desses geradores
têm por resultado uma expressão que contém a eles mesmos só. Os outros geradores, a
saber, P0 , M10 , M20 e M30 , são os geradores dinâmicos ou hamiltonianos. Assim, o grupo de
estabilidade da forma instantânea tem dimensão sêis, e possui quatro hamiltonianos.

Forma-ponto. Na forma-ponto, o tempo é dado pela função:

Σ( x ) = x µ xµ . (A.21)

Calculando a ação dos geradores das transformações de Poincaré sobre ela, encontra-se que:
 
x µ xµ ; Pρ = −2xρ , x µ xµ ; Mρσ = 0 . (A.22)
222 Apêndice A. Definição algébrica das formas dinâmicas

Portanto, o grupo de estabilidade é constituído pelas transformações geradas por Mµν e


tem dimensão seis, ao passo que os geradores Pµ serão os quatro hamiltonianos da forma
dinâmica. Embora sejam eles em número igual que na forma instantânea, a forma-ponto
possui a vantagem de apresentar hamiltonianos que compõem um tetra-vetor, podendo eles
ser tratados como uma única entidade covariante. A nomeação de «forma-ponto» dada a
essa dinâmica é, de fato, devida a essa propriedade: Que seu grupo de estabilidade é o grupo
de rotações tetradimensionais ao redor de um ponto fixo.

Forma da frente de luz. Nessa forma dinâmica, a superfície isocrônica é a superfície de


valor constante do tempo
1
Σ( x ) = x + = √ x0 + x3

. (A.23)
2
Para ela obtém-se que:

x + ; Pρ = −δρ+ x + ; Mρσ = δρ+ xσ − δσ+ xρ


 
, . (A.24)

Ocorre aqui algo curioso: Somente se a superfície for a x + = 0, o colchete de Poisson


{ x + ; M+− } se anula, como se observa da Eq. (A.24). M+− , portanto, forma parte do grupo
de estabilidade da superfície x + = 0, mas não das superfícies correspondentes a outros
tempos. Restringindo a atenção a essa superfície particular, que sempre pode ser usada como
a superfície inicial no problema dos valores iniciais, ter-se-á que o grupo de estabilidade tem
dimensão sete e é formada pelos geradores P1 , P2 , P− , M12 , M1− , M2− e M+− ; o número de
hamiltonianos é três, e eles são P+ , M1+ e M2+ .

Forma de Leutwyler-Stern 1. Na primeira forma de Leutwyler e Stern, a superfície isocrô-


nica é definida pelo tempo:

2  2 2 2
Σ( x ) = x0 − x1 − x2 = x µ xµ + x3 . (A.25)

A ação sobre ele dos geradores do grupo de Poincaré é:


n 2 o n 2 o  
x µ xµ + x3 ; Pρ = −2xρ − 2x3 δρ3 , x µ xµ + x3 ; Mρσ = 2x3 δρ3 xσ − δσ3 xρ .
(A.26)

Destarte, o grupo de estabilidade tem apenas dimensão quatro, e a ele correspondem os


geradores P3 , M01 , M02 e M12 . Os hamiltonianos dessa forma dinâmica são seis: P0 , P1 , P2 ,
M03 , M13 e M23 .

Forma de Leutwyler-Stern 2. A segunda forma introduzida por Leutwyler e Stern possui


o tempo definido segundo a função:
2 2
Σ( x ) = x0 − x3 . (A.27)
Apêndice A. Definição algébrica das formas dinâmicas 223

Com o uso das Eqs. (A.12) obtém-se que:


n 2 2 o
x0 − x3
= −2x0 δρ0 + 2x3 δρ3 ,
; Pρ
n 2 2 o    
x0 − x3 ; Mρσ = 2x0 δρ0 xσ − δσ0 xρ − 2x3 δρ3 xσ − δσ3 xρ . (A.28)

Com esses resultados pode-se estabelecer que o grupo de estabilidade dessa forma dinâmica
é aquele correspondente aos geradores P1 , P2 , M12 e M03 , e portanto tem dimensão quatro.
Os seis hamiltonianos dessa forma dinâmica serão os geradores P0 , P3 , M01 , M02 , M13 e M23 .
Isso esgota as possibilidades, pois não há outro subgrupo transitivo do grupo de Poincaré
para ser o grupo de estabilidade de uma outra forma dinâmica [8, 9, 10, 11, 7]. Os resultados
obtidos resumem-se na Tab. A.1. Como pode-se ver, a forma dinâmica da frente de luz ocupa
um lugar destacado por ser aquela com o maior grupo de estabilidade e, consequentemente,
com menor número de hamiltonianos.

F. dinâmica Σ( x ) D(GΣ ) N. de H’s


Instantânea x0 6 4
Forma-ponto x µ xµ 6 4
Frente de luz x+ 7 3
L-S 1 x µ x µ + ( x 3 )2 4 6
L-S 2 ( x 0 )2 − ( x 3 )2 4 6

Tabela A.1: Resumo das cinco formas dinâmicas da teoria relativística. D( GΣ ): Dimensão do grupo
de estabilidade GΣ ; N. de H’s: Número de hamiltonianos.

Mecânica do ponto material


A solução mais simples às Eqs. (A.16)-(A.17) é obtida na mecânica do ponto material:

Pµ = pµ , Mµν = qµ pν − qν pµ , (A.29)

com as coordenadas qµ e momentos pµ da partícula sujeitos às relações:

{qµ ; qν } = 0 , { pµ ; pν } = 0 , { pµ ; qν } = gµν . (A.30)

Para escrever expressões para os geradores sobre a superfície inicial em cada forma dinâmica,
introduzir-se-á as equações que as determinam como equações subsidiárias do tipo:

A≈0 . (A.31)

Mas as condições subsidiárias devem permanecer tais frente a qualquer mudança do sistema
de coordenadas, o que implica que devam também ser condições subsidiárias:

{ A; Pρ } ≈ 0 , { A; Mρσ } ≈ 0 . (A.32)
224 Apêndice A. Definição algébrica das formas dinâmicas

Para eliminar as variáveis cujo significado é perdido ao fixar a superfície inicial, usar-se-á
a condição de camada de massa, p2 − m2 = 0, mas essa introduzir-se-á nos geradores do
grupo de Poincaré usando de coeficientes indeterminados (multiplicadores de Lagrange); as
Eqs. (A.29) serão substituídas por:

Pµ = pµ + λµ ( p2 − m2 ) , Mµν = qµ pν − qν pµ + λµν ( p2 − m2 ) , (A.33)

com λµν = −λνµ . Tais coeficientes serão determinados pela imposição da Eq. (A.32).

Forma instantânea. Tem-se a condição subsidiária:

q0 ≈ 0 . (A.34)

A anulação do colchete de Poisson dela com o gerador Pµ somente acontece se:

{q0 ; Pσ } = −δσ0 − 2λσ p0 ≈ 0 , (A.35)

enquanto que a equação correspondente às transformações de Lorentz é:

{q0 ; Mρσ } = −qρ δσ0 + qσ δρ0 − λρσ 2p0 ≈ 0 . (A.36)

Das Eqs. (A.35) e (A.36) decorrem os valores:

1 qr
λ0 = − , λr = 0 , λr0 = − , λrs = 0 , (A.37)
2p0 2p0

r, s = 1, 2, 3. Os geradores na superfície inicial são portanto:


q q
P0 = p2 + m2 , Pr = pr , Mr0 = qr p2 + m2 , Mrs = qr ps − qs pr . (A.38)

Tem-se usado aqui a notação p2 = p21 + p22 + p23 .

Forma-ponto. A condição subsidiária nessa forma dinâmica é:

qµ qµ ≈ κ 2 = constante . (A.39)

Essa constante em geral será não nula; porém, ela pode também ser nula, caso em que o
hiperbolóide degenera no cone de luz. As condições da Eq. (A.32) são, assim:

qµ qµ ; Pρ = −2qρ − 4λρ q · p ≈ 0 , (A.40)
 µ
q qµ ; Mρσ = −4λµν q · p ≈ 0 . (A.41)

Dessas equações obtém-se o valor dos coeficientes indeterminados:


λρ = − , λµν = 0 , (A.42)
2q · p
Apêndice A. Definição algébrica das formas dinâmicas 225

bem como os geradores do grupo de Poincaré:

q µ ( p2 − m2 )
Pµ = pµ − , Mµν = qµ pν − qν pµ . (A.43)
2q · p

Forma da frente de luz. A condição subsidiária consiste dessa vez na especificação do


plano nulo inicial:
q+ ≈ 0 . (A.44)

Tem-se agora as restrições:

q+ ; Pρ = −δρ+ − 2λρ p− ≈ 0 ,

(A.45)
 +
q ; Mρσ = δρ+ qσ − δσ+ qρ − 2λρσ p− ≈ 0

. (A.46)

Delas decorrem os multiplicadores –usa-se i, j = 1, 2–:

1 qi
λ+ = − , λi = 0 = λ− , λ+− = 0 , λi+ = − , λij = 0 , λi− = 0 . (A.47)
2p− 2p−

E daqui os geradores do grupo de Poincaré no plano nulo x + = 0 são:

p2⊥ + m2 p2 + m2
P+ = , P− = p− , Pi = pi , Mi+ = qi ⊥ − q + pi , (A.48)
2p− 2p−
M+− = q+ p− , M12 = q1 p2 − q2 p1 , Mi− = qi p− . (A.49)

Nessas expressões: p2⊥ = p21 + p22 .

Forma de Leutwyler-Stern 1. Na primeira forma de Leutwyler-Stern, a condição subsidiá-


ria imposta às coordenadas da partícula é:
2
q µ q µ + q3 ≈ κ 2 = constante . (A.50)

Encontra-se as seguintes condições adicionais:


n 2 o
q µ q µ + q3 = −2qρ − 2q3 δρ3 − 4λρ qµ pµ + q3 p3 ≈ 0 ,

; Pρ (A.51)
n 2 o  
qµ qµ + q3 ; Mρσ = 2q3 δρ3 qσ − δσ3 qρ − 4λµν qµ pµ + q3 p3 ≈ 0 ,

(A.52)

das quais é possível isolar os coeficientes indeterminados:

q0,1,2
λ0,1,2 = −  , λ3 = 0 ,
2 q µ p µ + q3 p3
q0,1,2 q3
λ01 = λ02 = λ12 = 0 , λ(0,1,2)3 = − .
2 q µ p µ + q3 p3
226 Apêndice A. Definição algébrica das formas dinâmicas

As quantidades fundamentais nessa forma dinâmica são, portanto:

q0,1,2 ( p2 − m2 )
P0,1,2 = p0,1,2 −  , P3 = p3 , (A.53)
2 q µ p µ + q3 p3
M01 = q0 p1 − q1 p0 , M02 = q0 p2 − q2 p0 , M12 = q1 p2 − q2 p1 ,
q0,1,2 q3 ( p2 − m2 )
M(0,1,2)3 = q0,1,2 p3 − q3 p0,1,2 −  . (A.54)
2 q µ p µ + q3 p3

Forma de Leutwyler-Stern 2. Nessa última forma dinâmica, a condição subsidiária adota a


forma:
2 2
q0 − q3 ≈ κ 2 = constante . (A.55)

As condições que tal restrição implica são as que seguem:


n 2 2 o
q0 − q3
= −2q0 δρ0 + 2q3 δρ3 − 4λρ q0 p0 − q3 p3 ≈ 0 ,

; Pρ (A.56)
n 2 2
o    
q0 − q3 ; Mρσ = 2q0 δρ0 qσ − δσ0 qρ − 2q3 δρ3 qσ − δσ3 qρ − 4λρσ q0 p0 − q3 p3 ≈ 0 .
 

(A.57)

Desse sistema obtém-se os valores dos multiplicadores de Lagrange:

q0 q3
λ0 = − , λ 1,2 = 0 , λ 3 = ,
2 ( q0 p0 − q3 p3 ) 2 ( q0 p0 − q3 p3 )
q0 q1,2 q3 q1,2
λ0(1,2) = , λ 03 = 0 , λ 12 = 0 , λ ( 1,2 ) 3 = .
2 ( q0 p0 − q3 p3 ) 2 ( q0 p0 − q3 p3 )

Os geradores, finalmente, são estes:

q0 ( p2 − m2 ) q3 ( p2 − m2 )
P0 = p0 − 0 0 3 3
, P1,2 = p1,2 , P3 = p3 + , (A.58)
2 (q p − q p ) 2 ( q0 p0 − q3 p3 )
q0 q1,2 ( p2 − m2 )
M0(1,2) = q0 p1,2 − q1,2 p0 + , M03 = q0 p3 − q3 p0 ,
2 ( q0 p0 − q3 p3 )
q3 q1,2 ( p2 − m2 )
M12 = q1 p2 − q2 p1 , M(1,2)3 = q1,2 p3 − q3 p1,2 + . (A.59)
2 ( q0 p0 − q3 p3 )

Como pode-se observar, em todas as formas dinâmicas os geradores do grupo de estabi-


lidade da superfície inicial não são modificados pela restrição a ela, mas somente os hamil-
tonianos o são, em correspondência com a ação deles. Poder-se-ia perguntar agora, nessa
situação que é ainda a mais simples possível, que é a do ponto material livre: Qual é a forma
dinâmica que se apresenta mais vantajosa? Olhando para as expressões acima escritas para
os hamiltonianos, é claro que as formas de Leutwyler e Stern não o serão, não já somente
pela complexidade de seus hamiltonianos, mas também pelo fato de serem seis deles. A
forma instantânea, muito usada, apresenta a dificuldade de uma raíz quadrada; em relação
a este ponto, lembre-se a impossibilidade de escrever a equação de Klein-Gordon-Fock na
forma hamiltoniana na classe dos operadores diferenciais; isto último somente é possível ao
Apêndice A. Definição algébrica das formas dinâmicas 227

ampliar a dita classe e considerar os operadores pseudo-diferenciais –vide, por exemplo, a


Ref. [216]–. Semelhante dificuldade é evitada na forma-ponto e na forma da frente de luz,
que se mostram assim muito convenientes.
Já indicamos anteriormente uma vantagem importante da forma-ponto, que é o fato de
seus hamiltonianos constituirem um tetra-vetor: A covariância é fácilmente implementada
nessa forma dinâmica. Entretanto, na expressão de seus hamiltonianos aparece sempre o
produto q · p no denominador, o que faz com que eles sejam complicados. Comparativamente,
na forma dinâmica do plano nulo, além de ser aquela em que o número de hamiltonianos
é menor, eles têm também uma forma bastante simples; e em adição seu hamiltoniano
P+ , associado às translações temporais, depende única e exclusivamente dos momentos; a
posição não aparece nele, diferentemente da forma-ponto. Estes motivos fazem da forma
dinâmica da frente de luz um tópico de estudo bastante interessante.
Apêndice B

Matrizes de Dirac no plano nulo

Na representação de Weyl, as matrizes de Dirac são:


! !
0 02 12 k 02 −σk
γ = , γ = , (B.1)
12 02 σk 02

com σk as matrizes de Pauli:


! ! !
0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = . (B.2)
1 0 i 0 0 −1

Assim, tem-se que as matrizes γ± , definidas segundo:

1
γ ± : = √ γ0 ± γ3 ,

(B.3)
2

têm a seguinte forma explícita, na representação em uso:


   √ 
0 0 0 0 0 0 2 0
 √   
+
 0 0 0 2  −
0 0 0 0 
 √2 0 0 0  , γ = 0 0
γ =    . (B.4)
   √ 0 0 
0 0 0 0 0 2 0 0

Os projetores Λ± definidos na equação (2.134) são, portanto:


   
1 0 0 0 0 0 0 0
   
0 0 0 0 0 1 0 0
Λ+ = 

 , Λ − = 0 0 1 0 .
   (B.5)
0 0 0 0  
0 0 0 1 0 0 0 0

228
Apêndice C

Causalidade e valores limite de funções analíticas

Mostrou-se no Cap. 4 que a condição da causalidade implica que a distribuição retardada


da ordem n, Rn ( x1 ; · · · ; xn ), tem suporte no conjunto:

supp ( Rn ) ⊆ Γ+
n . (C.1)

Particularmente, após a utilização da invariância sob translações do operador de espalha-


mento, sua parte numérica, rn ( x1 ; · · · ; xn−1 ), tem suporte em Γ+
n−1 (0). A transformada de
Fourier (distribucional) dela vem dada pela fórmula:
Z
r̂ ( p) = (2π )−m/2 eipx r ( x )dm x . (C.2)

Acontece, no entanto, que, de forma geral, a obtenção da distribuição retardada pela aplicação
da fórmula de divisão da distribuição causal requer da integração de uma determinada
distribuição ao longo do eixo real –ou uma parte dele–, sobre o qual se localizam pólos para
determinados intervalos de variação do momento. Esta operação se simplifica notóriamente
se os tais pólos são deslocados do eixo real, o que se equivale com a complexificação do
momento. Se bem existem na literatura teoremas que garantem a existência da continuação
analítica das distribuições com suporte num cone –vide, por exemplo, as Refs. [179, 197]–,
é mister examinar sua validez no caso particular da dinâmica do plano nulo, visto que a
condição usual da causalidade há sido modificada. Isto se reflete, em primeiríssimo lugar,
no fato de que o conjunto Γ+ −
n (0) não é um cone, devido à presença nele do eixo x .

Seja p̃ = p + iλ ∈ Rm + iRm , e consideremos a extensão da Eq. (C.2):


Z
r̂ ( p̃) = (2π )−m/2 ei( p+iλ)x r ( x )dm x . (C.3)

É evidente que o termo que inclui ao vetor λ modifica as propriedades de convergência


da integral. Estamos interessados em determinar em qual conjunto de variação de λ ela é
convergente, propriedade essa que está assegurada pela condição:

λx ≥ 0 . (C.4)

Em particular, o caso com λx = 0 se corresponde com a Eq. (C.2), existente por hipótese.
Como supp(r ) ⊆ Γ+
n−1 (0), é claro que λ ∈ Γn−1 (0), pois de outra forma seria λx < 0.
+

Ademais, como λx = λ1 x1 + · · · λn−1 xn−1 , bastará assegurar que seja λ j x j ≥ 0 para λ j , x j ∈


f+ . Desejamos estabelecer o seguinte resultado.
V

229
230 Apêndice C. Causalidade e valores limite de funções analíticas

f+ . Cumpre-se que:
Proposição C.1: Sejam x, λ ∈ V
 
∀ x ∈ Vf+ : λx ≥ 0 ⇔ λ ∈ R0+ e− . (C.5)

f+ , se satisfazem:
Prova: Como os dois vetores pertencem a V

λ2 ≥ 0 , λ+ ≥ 0 ; x2 ≥ 0 , x+ ≥ 0 . (C.6)

Consideremos as desigualdades estritas e as igualdades, referentes às coordenadas x + e λ+ ,


separadamente.

(I) x + > 0 e λ+ > 0: Da desigualdade de Cauchy-Schwarz em R2 :


q q √ √ p p
−λα x ≤α
( λ ⊥ )2 ( x ⊥ )2 ≤ 2λ+ λ− 2x + x − = 2 λ+ x + λ− x − . (C.7)

Portanto:
p 2
λx = λ+ x + + λ− x − + λα x α ≥
p
λ+ x + − λ− x − ≥0 , (C.8)

e a desigualdade desejada se satisfaz sempre.

(II) x + > 0 e λ+ = 0: Neste caso, forçosamente, λα = 0, e por isso:

λx = λ+ x + ≥ 0 ⇔ λ+ ≥ 0 . (C.9)

(III) x + = 0 e λ+ > 0: Agora é, necessáriamente, x α = 0, de forma que:

λx = λ− x − . (C.10)

Como x − ∈ R pode variar livremente, quando seja x − < 0, λx ≥ 0 somente se λ+ ≤ 0,


o que contradiz a hipótese de ser λ+ > 0.

(IV) x + = 0 e λ+ = 0: As componentes transversais dos dois vetores, x α e λα , devem ser


nulas. Assim sendo:
λx = 0 ≥ 0 . (C.11)

Em conclusão, o caso (III) impede a possibilidade de ser λ+ > 0, de forma que, por força,
será λ+ = 0. Logo o caso (I) não ocorrerá, o caso (IV) se satisfaz sempre, e o caso (II) impõe a
restrição de ser λ+ ≥ 0. Em suma, λ ∈ R0+ e− . ■

Desta sorte, a distribuição retardada numérica no espaço dos momentos pode ser conti-
×(n−1)
nuada analíticamente ao tubo R4(n−1) + i R0+ e− . Esta região é muito mais restrita
que na dinâmica instantânea, em que a parte complexa do momento é livre de variar em
todo o cone de luz futuro.
Apêndice C. Causalidade e valores limite de funções analíticas 231

Em particular, podemos utilizar λ = εη, com ε ∈ R0+ e η o vetor definido na Eq. (2.186).
Então a distribuição retardada obtém-se como o valor limite da função analítica da variável
p− , regular na região descrita:

r̂ ( p) = lim r̂ ( p + iεη ) . (C.12)


ε → 0+

Esta última é mais fácil de calcular que a distribuição retardada, pois o quadrado do mo-
mento, que por regra geral determina a existência de pólos ou sua inexistência no integrando
que dá lugar à dita distribuição, torna-se complexo: p̃2 = p2 + 2iεp− , de forma que os pólos
não se encontram mais no eixo real. O fato de que, quando p− = 0, seja p̃2 ∈ R, não é pro-
blema, pois em tal cenário p̃2 = p2 < 0 é do tipo-espaço, região em que não há pólos, como
se pode ver de forma geral mediante o estudo das relações de dispersão [100].
Referências

[1] P.A.M. Dirac. Forms of Relativistic Dynamics. Rev. Mod. Phys. 21, 3: 392-399 (1949).

[2] A. Einstein. Zur Elektrodynamik bewegter Körper. Annalen der Physik 17: 891–921 (1905).
Tradução à língua portuguesa em: H. Lorentz, A. Einstein e H. Minkowski. Textos
Fundamentais da Física Moderna. I Volume: O Princípio da Relatividade. 5a ed. Fundação
Calouste Gulbenkian, Lisboa (2001).

[3] H. Poincaré. La Science et l’Hypothèse (1902). Tradução ao inglês: Science and Hypothesis.
The Walter Scott publishing Co. (1905).

[4] A.A. Logunov. Henri Poincaré and Relativity Theory. arXiv:physics/0408077 (2004).

[5] G.E. Ramos. Teoria de Campos no Plano Nulo: Um estudo. Dissertação de Mestrado, IFT-
UNESP (2005).

[6] G.E. Ramos. Formulação Canônica no Plano Nulo. Tese de Doutoramento, IFT-UNESP
(2009).

[7] H. Leutwyler and J. Stern. Relativistic Dynamics on a Null Plane. Ann. Phys. 112: 94-164
(1978).

[8] H. Bacry, P. Combe e P. Sorba. Connected subgroups of the Poincaré group. I. Rep. Math.
Phys. 5, 2: 145-186 (1974).

[9] H. Bacry, P. Combe e P. Sorba. Connected subgroups of the Poincaré group. II. Rep. Math.
Phys. 5, 3: 361-392 (1974).

[10] J. Patera, P. Winternitz e H. Zassenhaus. Continuous subgroups of the fundamental groups


of physics. I. General method and the Poincaré group. J. Math. Phys. 16, 8: 1597-1624 (1975).

[11] J. Patera, R. Sharp, P. Winternitz e H. Zassenhaus. Subgroups of the Poincaré group and
their invariants. J. Mark Phys. 17, 6: 977-985 (1976).

[12] F. Rohrlich. Theory of Photons and Electrons on Null Planes. Acta Phys. Austriaca 32: 87-
106 (1970).

[13] F. Rohrlich. Null Plane Field Theory. Acta Phys. Austriaca, Suppl. VIII: 277-322 (1971).

[14] S.J. Brodsky, H.-C. Pauli e S.S. Pinsky. Quantum chromodynamics and other field theories on
the light cone. Phys. Rep. 301: 299-486 (1998).

[15] S. Fubini e G. Furlan. Renormalization effects for partially conserved currents. Physics
Physique Fizika 1: 299-247 (1965).

232
REFERÊNCIAS 233

[16] S. Weinberg. Dynamics at Infinite Momentum. Phys. Rev. 150: 1313-1318, (1966).
Erratum: Phys. Rev. 158: 1638 (1967).

[17] H. Bebié e H. Leutwyler. Relativistically Invariant Solutions of Current Algebras at Infinite


Momentum. Phys. Rev. Lett. 19: 618-621 (1967).

[18] R.A. Neville. Quantum Electrodynamics in a Laser Pulse. Tese de doutoramento. Syracuse
University (1968).

[19] R.A. Neville e F. Rohrlich. Quantum Electrodynamics on Null Planes and Applications to
Lasers. Phys. Rev. D 3, 8: 1692-1707 (1971).

[20] S.-J. Chang e S. Ma. Feynman Rules and Quantum Electrodynamics at Infinite Momentum.
Phys. Rev. 180: 1506-1513 (1969).

[21] J.B. Kogut e D.E. Soper. Quantum Electrodynamics in the Infinite-Momentum Frame. Phys.
Rev. D 1, 10: 2901-2914 (1970).

[22] E.P. Biernat, W.H. Klink e W. Schweiger. Point-Form Hamiltonian Dynamics and Applicati-
ons. Few-Body Syst. 49: 149–161 (2011).

[23] R.A. Neville e F. Rohrlich. Quantum Field Theory off Null Planes. Nuovo Cimento, 1, 4:
625-644 (1971).

[24] H. Leutwyler, J.R. Klauder e L. Streit. Quantum Field Theory on Lightlike Slabs. Nuovo
Cimento LXVI A, 3: 536-554 (1970).

[25] J.H. Ten Eyck. Problems in Null-Plane Quantum-Electrodynamics. Tese de doutoramento.


Syracuse University (1973).

[26] J.H. Ten Eyck e F. Rohrlich. Equivalence of null-plane and conventional quantum electrodyna-
mics. Phys. Rev. D 9, 8: 2237-2245 (1974).

[27] S.-J. Chang, R.G. Root e T.-M. Yan. Quantum Field Theories in the Infinite-Momentum
Frame. I. Quantization of Scalar and Dirac Fields. Phys. Rev. D 7: 1133-1146 (1973).

[28] S.-J. Chang e T.-M. Yan. Quantum Field Theories in the Infinite-Momentum Frame. II.
Scattering Matrices of Scalar and Dirac Fields. Phys. Rev. D 7: 1147-1161 (1973).

[29] T.-M. Yan. Quantum Field Theories in the Infinite-Momentum Frame. III. Quantization of
Coupled Spin-One Fields. Phys. Rev. D 7: 1760-1780 (1973).

[30] T.-M. Yan. Quantum Field Theories in the Infinite-Momentum Frame. IV. Scattering Matrix of
Vector and Dirac Fields and Perturbation Theory. Phys. Rev. D 7: 1780-1800 (1973).

[31] S.J. Brodsky, R. Roskies e R. Suaya. Quantum Electrodynamics and Renormalization Theory
in the Infinite-Momentum Frame. Phys. Rev. D 8: 4574-4594 (1973).
234 REFERÊNCIAS

[32] S.D. Drell, D. Levy e T.-M. Yan. Theory of Deep-Inelastic Lepton-Nucleon Scattering and
Lepton-Pair Annihilation Processes. I. Phys. Rev. 187: 2159-2171 (1969).

[33] S.D. Drell, D. Levy e T.-M. Yan. Theory of Deep-Inelastic Lepton-Nucleon Scattering and
Lepton Pair Annihilation Processes. II. Deep-Inelastic Electron Scattering. Phys. Rev. D 1:
1035-1068 (1970).

[34] S.D. Drell, D. Levy e T.-M. Yan. Theory of Deep-Inelastic Lepton-Nucleon Scattering and
Lepton-Pair Annihilation Processes. III. Deep-Inelastic Electron-Positron Annihilation. Phys.
Rev. D 1: 1617-1639 (1970).

[35] S.D. Drell e T.-M. Yan. Connection of Elastic Electromagnetic Nucleon Form Factors at Large
Q2 and Deep Inelastic Structure Functions Near Threshold. Phys. Rev. Lett. 24: 181-186
(1970).

[36] K. Yamawaki. Zero-Mode Problem on the Light Front.arXiv:hep-th/9802037 (1998).

[37] P. Ullrich. On the restriction of quantum fields to a lightlike surface. J. Math. Phys. 45, 8:
3109-3145 (2004).

[38] W. Polyzou e M. Herrmann. Tho Light-Front Vacuum. Few-Body Syst. 57: 479-484 (2016).

[39] T. Maskawa e K. Yamawaki. The Problem of P+ = 0 Mode in the Null-Plane Field Theory
and Dirac’s Method of Quantization. Progr. Theor. Phys. 56: 270-283 (1976).

[40] H.-C. Pauli e S.J. Brodsky. Solving field theory in one space and one time dimension. Phys.
Rev. D 32: 1993-2000 (1985).

[41] H.-C. Pauli e S.J. Brodsky. Discretized light-cone quantization: Solution to a field theory in
one space and one time dimension. Phys. Rev. D 32: 2001-2013 (1985).

[42] J.P. Vary, X. Zhao, A. Ilderton, H. Honkanen, P. Maris e S.J. Brodsky. Applications of Basis
Light-Front Quantization to QED. Nuc. Phys. B (Proc. Suppl.) 251-252: 10-15 (2014).

[43] X. Zhao, H. Honkanen, P. Maris, J.P. Vary e S.J. Brodsky. Electron g-2 in Light-front
Quantization. Phys. Lett. B 737: 65-69 (2014).

[44] R.J. Perry, A. Harindranath e K.G. Wilson. Light-Front Tamm-Dancoff Field Theory. Phys.
Rev. Lett. 65, 24: 2959-2962 (1990).

[45] B.L.G. Bakker, A. Bassetto, S.J. Brodsky, W. Broniowski, S. Dalley, T. Frederico, ... e
T. Heinzl. Light-Front Quantum Chromodynamics. A framework for the analysis of hadron
physics. Nuclear Phys. B (Proc. Suppl.) 251-252: 165-174 (2014).

[46] E. Tomboulis. Quantization of the Yang-Mills Field in the Null-Plane Frame. Phys. Rev. D 8:
2736-2740 (1973).

[47] A. Casher. Gauge fields on the null plane. Phys. Rev. D 14: 452-464 (1976).
REFERÊNCIAS 235

[48] B.M. Pimentel e A.T. Suzuki. Light-cone gauge and the (causal) principal value prescription.
Phys. Rev. D 42: 2115-2119 (1990).

[49] B.M. Pimentel, A.T. Suzuki e G.E.R. Zambrano. Functional Analysis for Gauge Fields on
the Front-Form and the Light-Cone Gauge. Few-Body Syst. 52: 437-442 (2012).

[50] D. Bhamre, A. Misra e V.K. Singh. Equivalence of One Loop Diagrams in Covariant and
Light Front QED Revisited. Few Body Syst. 59: 107 (2018).

[51] D. Bhamre e A. Misra. Equivalence of Light-Front and Covariant Electrodynamics at One


Loop Level and the form of the Gauge Boson Propagator. arXiv:2003.10881 (2020).

[52] A.T. Suzuki e T.H.O. Sales. The Light-Front Gauge Propagator: The Status Quo. arXiv:hep-
th/0408135 (2004).

[53] L. Mantovani, A. Bacchetta, B. Pasquini e X. Xiong. The Gauge-Field Propagator in Light-


Cone Gauge: Which is the Correct One? Few-Body Syst. 58: 84 (2017).

[54] A.T. Suzuki e C.-R. Ji. Ward-Takahashi Identity in QED4 at the One-loop Level on the Light-
Front. PoS LC2019: 082 (2020).

[55] D. Mustaki, S. Pinsky, J. Shigemitsu e K. Wilson. Perturbative renormalization of null-plane


QED. Phys. Rev. D 43, 10: 3411-3427 (1991).

[56] M. Born e P. Jordan. Zur Quantenmechanik. Z. Phys. 34: 858-888 (1925).

[57] P. Jordan e W. Pauli. Zur Quantenelektrodynamik ladungsfreier Felder. Z. Phys. 47: 151-173
(1928).

[58] P. Jordan e E. Wigner. Über das Paulische Äquivalenzverbot. Z. Phys. 47: 631-651 (1928).

[59] W. Heisenberg e W. Pauli. Zur Quantendynamik der Wellenfelder. Z. Phys. 56: 1-61 (1929).

[60] A.S. Wightman. The Dirac equation. Em: A. Salam e E.P. Wigner (Eds.). Aspects of Quantum
Theory. Cambridge University Press (1972).

[61] W. Pauli. The Connection Between Spin and Statistics. Phys. Rev. 58: 716-722 (1940).

[62] W. Pauli. Relativistic Field Theories of Elementary Particles. Rev. Mod. Phys. 13: 203-232
(1941).

[63] S. Tomonaga. On a Relativistically Invariant Formulation of the Quantum Theory of Wave


Fields. Prog. Theor. Phys. 1: 27–42 (1946).

[64] Z. Koba, T. Tati e S. Tomonaga. On a Relativistically Invariant Formulation of the Quantum


Theory of Wave Fields. II. Prog. Theor. Phys. 2: 101–116 (1947).

[65] Z. Koba, T. Tati e S. Tomonaga. On a Relativistically Invariant Formulation of the Quantum


Theory of Wave Fields. III. Prog. Theor. Phys. 2: 198–208 (1947).
236 REFERÊNCIAS

[66] S. Kanesawa e S. Tomonaga. On a Relativistically Invariant Formulation of the Quantum


Theory of Wave Fields. IV. Prog. Theor. Phys. 3: 1–13 (1948).

[67] S. Kanesawa e S. Tomonaga. On a Relativistically Invariant Formulation of the Quantum


Theory of Wave Fields. V. Prog. Theor. Phys. 3: 101–113 (1948).

[68] J. Schwinger. Quantum Electrodynamics. I. A Covariant Formulation. Phys. Rev. 74: 1439-
1461 (1948).

[69] J. Schwinger. Quantum Electrodynamics. II. Vacuum Polarization and Self-Energy. Phys. Rev.
75: 651-679 (1949).

[70] J. Schwinger. Quantum Electrodynamics. III. The electromagnetic properties of the electron:
Radiative corrections to scattering. Phys. Rev. 76: 790-817 (1949).

[71] R.P. Feynman. Space-Time Approach to Quantum Electro Dynamics. Phys. Rev. 76: 769-789
(1949).

[72] F.J. Dyson. The Radiation Theories of Tomonaga, Schwinger, and Feynman. Phys. Rev. 75:
486-582 (1949).

[73] F.J. Dyson. The S matrix in quantum electrodynamics. Phys. Rev. 75: 1736-1755 (1949).

[74] K.O. Friedrichs. Mathematical aspects of the quantum theory of fields. Interscience Publishers
(1953).

[75] L. Schwartz. Théorie des distributions. Parte I. Hermann (1957).

[76] L. Schwartz. Théorie des distributions. Parte II. Hermann (1959).

[77] J. Lützen. The Prehistory of the Theory of Distributions. Springer (1982).

[78] J.M. Cook. The mathematics of second quantization. Trans. Am. Math. Soc. 74: 222-245
(1953).

[79] V. Fock. Konfigurationsraum und Zweite Quantelung. Z. Phys. 75: 622-647 (1950).

[80] R. Haag. On Quantum Field Theories. Dan. Mat. Fys. Medd. 29, 12 (1955).

[81] D.L. Fraser. Haag’s theorem and the interpretation of quantum field theories with interactions.
Tese de doutoramento. University of Pittsburgh (2006).

[82] G. Källén. Quantum Electrodynamics. Springer (1972).

[83] N. Nakanishi e I. Ojima. Covariant operator formalism of gauge theories and quantum gravity.
World Scientific (1990).

[84] A.S. Wightman. Quantum Field Theory in Terms of Vacuum Expectation Values. Phys. Rev.
101, 2: 860-866 (1956).
REFERÊNCIAS 237

[85] N.N. Bogoliubow e O.S. Parasiuk, Über die multiplikation der kausalfunktionen in der
quantentheorie der felder. Acta Math. 97: 227-266 (1957).

[86] A.S. Wightman. La théorie quantique locale et la théorie quantique des champs. Ann. Inst. H.
Poincaré A 1: 403-420 (1964).

[87] A.S. Wightman e L. Garding. Fields as operator-valued distributions in relativistic quantum


theory. Ark. Fys. 28: 129-189 (1964).

[88] R.F. Streater e A.S. Wightman. PCT, Spin and Statistics, and all that. The Benja-
min/Cummings Publishing Company (1964).

[89] J. Glimm e A. Jaffe. Quantum Physics. Springer-Verlag (1981).

[90] A. Jaffe e E. Witten. Quantum Yang-Mills Theory. https://www.claymath.org/


sites/default/files/yangmills.pdf

[91] H. Lehmann, K. Symanzik e W. Zimmermann. Zur Furmulierung quantisierter Feldtheorien.


Nuovo Cim. 1: 205-225 (1955).
Traduzido ao inglês por C.F. Barger: On the formulation of quantized field theories. CBF
Scientific Translations.

[92] H. Araki. Von Neumann Algebras of Local Observables for Free Scalar Field. J. Math. Phys. 5:
1-13 (1964).

[93] R. Haag e D. Kastler. An algebraic approach to quantum field theory. J. Math. Phys. 5: 848-
861 (1964).

[94] I.E. Segal. Postulates for General Quantum Mechanics. Ann. Math. 48, 4: 930-948 (1947).

[95] R. Haag. Local Quantum Physics. Fields, Particles, Algebras. 2 ed., Springer (1996).

[96] W. Heisenberg. Die ’Beobachtbaren Grössen’ in der Theorie der Elementarteilchen. Z. Phys.
120: 513-538 (1943).
Este artigo pode ser encontrado em: W. Blum, H.-P. Dürr e H. Rechenberg (Eds.). Werner
Heisenberg. Gesammelte Werke / Collected Works. Series A / Part II. Original Scientific Papers.
Springer-Verlag (1989), em que excelentes comentários a respeito das motivações de
Heisenberg para a definição da matriz S são dados por R. Oehme.

[97] J. Lacki, H. Ruegg e G. Wanders (Eds.). E.C.G. Stueckelberg, An Unconventional Figure of


Twentieth Century Physics. Selected Scientific Papers with Commentaries. Birkhauser (2009).

[98] E. Stueckelberg e D. Rivier. Causalité et structure de la matrice S. Helv. Phys. Acta 23: 215-
222 (1950).
Este artigo é reproduzido também na Ref. [97].
238 REFERÊNCIAS

[99] N.N. Bogoliubov, B.V. Medvedev e M.K. Polivanov. Voprossy Teorii Dispersionnykh Soot-
noshenii. Moscow, Fizmatgiz (1958).
Tradução ao inglês em: N.N. Bogoliubov, B.V. Medvedev and M.K. Polivanov. Problems
in the Theory of Dispersion Relations. Institute for Advanced Study, Princeton (1958).

[100] N.N. Bogoliubov e D. Shirkov. Introduction to the theory of Quantized Fields. 3 ed., John
Wiley & Sons - Interscience Publishers (1979).

[101] N.N. Bogolubov, A.A. Logunov, A.I. Oksak e I.T. Todorov. General Principles of Quantum
Field Theory. Kluwer Acad. Publ. (1990).

[102] B.M. Stepanov. On the construction of an S-matrix in accordance with the theory of perturba-
tions (em russo). Izv. Akad. Nauk SSSR Ser. Mat. 29: 1037-1054 (1965).
Tradução ao inglês em: Eighteen papers on analysis and quantum mechanics. American
Mathematical Society Translations, Series 2, Volume 91, American Mathematical Society
(1970).

[103] H. Epstein e V. Glaser. The role of locality in perturbation theory. Ann. Inst. H. Poincaré A
19: 211-295 (1973).

[104] S. Łojasiewicz. Sur le problème de la division. Studia Mathematica T. XVIII: 87-136 (1959).

[105] B. Malgrange. Division des distributions. I: Distributions prolongeables. Séminaire


Schwartz T. 4, exp. No. 21: 1-5 (1959-1960).

[106] B. Malgrange. Division des distributions. II: L’Inégalité de Łojasiewicz. Séminaire Schwartz
T. 4, exp. No. 22: 1-8 (1959-1960).

[107] G. Scharf. Finite Quantum Electrodynamics. The Causal Approach. 3 ed., Dover (2014).

[108] S. Fassari e G. Scharf. Borel Summability in Finite QED I: Outline and Results. Em: S.
Albeverio, U. Cattaneo e D. Merlini (Eds.). Stochastic processes, physics and geometry II.
World Scientific: 278-288 (1991).

[109] V.S. Vladimirov, Y.N. Drozzinov e B.I. Zavialov. Tauberian Theorems for Generalized
Functions. Kluwer Acad. Publ. (1988).

[110] M. Dütsch, F. Krahe e G. Scharf. Scalar QED Revisited. Nuovo Cim. 106 A, 3: 277-307
(1993).

[111] M. Dütsch, T. Hurth, F. Krahe e G. Scharf. Causal Construction of Yang-Mills Theories. I.


Nuovo Cim. A 106: 1029-1041 (1993).

[112] M. Dütsch, T. Hurth, F. Krahe e G. Scharf. Causal Construction of Yang-Mills Theories. II.
Nuovo Cim. A 107: 375-406 (1994).

[113] M. Dütsch, T. Hurth e G. Scharf. Causal Construction of Yang-Mills Theories. III. Nuovo
Cim. A 108: 679-708 (1995).
REFERÊNCIAS 239

[114] M. Dütsch, T. Hurth e G. Scharf. Causal Construction of Yang-Mills Theories. IV. Unitarity.
Nuovo Cim. A 108: 737-773 (1995).

[115] M. Dütsch e G. Scharf. Electroweak theory without spontaneous symmetry breaking. e-Print:
hep-th/9612091 (1996).

[116] A.W. Aste, G. Scharf e M. Dütsch. Perturbative gauge invariance: Electroweak theory II.
Ann. Phys. 8: 389-404 (1999).

[117] A.W. Aste e G. Scharf. NonAbelian gauge theories as a consequence of perturbative quantum
gauge invariance. Int. J. Mod. Phys. A 14: 3421-3434 (1998).

[118] G. Scharf. Gauge Field Theories: Spin One and Spin Two. 100 Years After General Relativity.
Dover (2016).

[119] M. Dütsch. Slavnov-Taylor Identities From the Causal Point of View. Int. J. Mod. Phys. A
12: 3205-3248 (1997).

[120] M. Dütsch. Non-uniqueness of quantized Yang-Mills theories. J. Phys. A: Math. Gen. 29:
7597-7617 (1996).

[121] D.R. Grigore. Trivial Lagrangians in the Causal Approach. Rom. J. Phys. 61: 320-332 (2016).

[122] D.R. Grigore. Cohomological Aspects of Gauge Invariance in the Causal Approach. Rom. J.
Phys. 55: 386-438 (2010).

[123] D.R. Grigore. The Structure of the Anomalies of Gauge Theories in the Causal Approach.
Journ. Phys. A 35: 1665-1689 (2002).

[124] D.R. Grigore e G. Scharf. No-go result for supersymmetric gauge theories in the causal
approach. Ann. Phys. 17: 864-880 (1997).

[125] G. Scharf, W.F. Wreszinski, B.M. Pimentel e J.L. Tomazelli. Causal Approach to (2+1)-
Dimensional QED. Annals of Physics 231: 185-208 (1994).

[126] L.A. Manzoni, B.M. Pimentel e J.L. Tomazelli. Causal theory for the gauged Thirring model.
Eur. J. Phys. C 8: 353-361 (1999).

[127] L.A. Manzoni, B.M. Pimentel e J.L. Tomazelli. Radiative corrections to the causal Thirring
model. Eur. J. Phys. C 12: 701-705 (2000).

[128] J.T. Lunardi, B.M. Pimentel, J.S. Valverde e L.A. Manzoni. Duffin–Kemmer–Petiau Theory
in the Causal Approach. Int. J. Mod. Phys. A 17, 2: 205-227 (2002).

[129] J. Beltrán, B.M. Pimentel e D.E. Soto. The causal approach proof for the equivalence of
SDKP4 and SQED4 at tree-level. Int. J. Mod. Phys. A 35, 9: 2050042 (2020).

[130] R. Bufalo, B.M. Pimentel e D.E. Soto. Causal approach for the electron-positron scattering
in generalized quantum electrodynamics. Phys. Rev. D 90: 085012 (2014).
240 REFERÊNCIAS

[131] R. Bufalo, B.M. Pimentel e D.E. Soto. Normalizability analysis of the generalized quantum
electrodynamics from the causal point of view. Int. J. Mod. Phys. A 32: 1750165 (2017).

[132] O.A. Acevedo, J.V. Beltrán, B.M. Pimentel e D.E. Soto. Causal perturbation theory approach
to Yukawa’s model. Eur. Phys. J. Plus 136: 895 (2021).

[133] M. Dütsch e K. Fredenhagen. A local (perturbative) construction of observables in gauge


theories: The example of QED. Commun. Math. Phys. 203: 71–105 (1999).

[134] R. Brunetti e K. Fredenhagen. Microlocal Analysis and Interacting Quantum Field Theories:
Renormalization on Physical Backgrounds. Commun. Math. Phys. 208: 623-661 (2000).

[135] M. Dütsch e K. Fredenhagen. Causal perturbation theory in terms of retarded products, and
a proof of the Action Ward Identity. Rev. Math. Phys. 16: 1291–1348 (2004).

[136] R. Brunetti, M. Dütsch e K. Fredenhagen. Perturbative algebraic quantum field theory and
the renormalization groups. Adv. Theor. Math. Phys. 13: 1541–1599 (2009).

[137] K. Fredenhagen e K. Rejzner. Batalin–Vilkoviski formalism in perturbative algebraic quan-


tum field theory. Commun. Math. Phys. 317: 697-725 (2013).

[138] M. Dütsch. From Classical Field Theory to Perturbative Quantum Field Theory. Birkkhäuser
(2019).

[139] S. Hollands e R. Wald. Local Wick Polynomials and Time Ordered Products of Quantum
Fields in Curved Spacetime. Commun. Math. Phys. 223: 289-326 (2001).

[140] S. Hollands e R.M. Wald. Existence of local covariant time-ordered products of quantum
fields in curved spacetime. Commun. Math. Phys. 231: 309–345 (2002).

[141] R. Bufalo, B.M. Pimentel e D.E. Soto. The Epstein-Glaser causal approach to the light-front
QED4 . I: Free theory. Ann. Phys. 351: 1034-1061 (2014).

[142] R. Bufalo, B.M. Pimentel e D.E. Soto. The Epstein-Glaser causal approach to the light-front
QED4 . II: Vacuum polarization tensor. Ann. Phys. 351: 1062-1084 (2014).

[143] A.D. Sukhanov. On the interaction Hamiltonian in quantum field theory. J. Exptl. Theoret.
Phys. 41: 1915-1928 (1961).

[144] A.D. Sukhanov. The connection between operators in the Heisenberg and interaction repre-
sentations in local quantum field theory. J. Exptl. Theoret. Phys. 47: 1303-1314 (1964).

[145] V.A. Karmanov, J.-F. Mathiot e A.V. Smirnov. Regularization of the fermion self-energy and
the electromagnetic vertex in the Yukawa model within light-front dynamics. Phys. Rev. D 75:
045012 (2007).

[146] B.L.G. Bakker e C.-R. Ji. Light-front singularities in the Yukawa model. Nuc. Phys. B (Proc.
Suppl.) 161: 15-20 (2006).
REFERÊNCIAS 241

[147] O.A. Acevedo, K.P. Gallo, B.M. Pimentel e G.E.R. Zambrano. Campos clássicos no plano
nulo. Rev. Bras. Ens. Fís. 43: e20210200 (2021).

[148] O.A. Acevedo, B.M. Pimentel e D.E. Soto. Epstein-Glaser’s Causal Light-Front Field
Theory. Proc. Sci. LC2019: 021 (2020).

[149] O.A. Acevedo e B.M. Pimentel. Null-plane causal perturbation theory. Eur. Phys. J. Plus
137: 287 (2022).

[150] O.A. Acevedo e B.M. Pimentel. Radiative corrections in the Yukawa model within the null-
plane causal perturbation theory framework. Phys. Rev. D 103: 076022 (2021).

[151] O.A. Acevedo e B.M. Pimentel. Quantum electrodynamics in the null-plane causal pertur-
bation theory II. Em preparação.

[152] O.A. Acevedo e B.M. Pimentel. Quantum electrodynamics in the null-plane causal pertur-
bation theory I. Submetido.

[153] W. Rindler. Relativity. Special, General and Cosmological. 2a ed. Oxford University Press
(2006).

[154] V. Fock. The Theory of Space, Time and Gravitation. Pergamon Press (1964).

[155] J. Hadamard. Lectures on Cauchy’s Problem in Linear Partial Differential Equations. Yale
University Press. (1923).

[156] E. Goursat. A Course in Mathematical Analysis. Vol. I. Ginn and Company (1904).

[157] A.N. Tíjonov e A.A. Samarsky. Ecuaciones de la física matemática. Mir Moscú (1972).

[158] E. Gourgoulhon. Special Relativity in General Frames. From Particles to Astrophysics.


Springer-Verlag (2013).

[159] L. Schwartz. Méthodes mathématiques pour les sciences physiques. 2a ed. Hermann (1979).

[160] L. Landau e E. Lifchitz. Théorie du champ. La Paix (1966).

[161] S. Chandrasekhar. The Mathematical Theory of Black Holes. Oxford Classic Texts in the
Physical Sciences, Clarendon Press (2006).

[162] N.P. Konopleva e V.N. Popov. Gauge Fields. Harwood academic publishers, (1981).

[163] E. Prugovečki. Quantum Mechanics in Hilbert Space. 2a ed. Dover (2006).

[164] G.G. Emch. Algebraic Methods in Statistical Mechanics and Quantum Field Theory. Dover
(2009).

[165] C.R. de Oliveira. Introdução à análise funcional. IMPA (2012).

[166] N.P. Landsman. Foundations of Quantum Theory. From Classical Concepts to Operator
Algebras. Springer (2017).
242 REFERÊNCIAS

[167] S. French. Identity and Individuality in Quantum Theory. Em: E.N. Zalta (Ed.). The Stand-
ford Encyclopedia on Philosophy (Winter 2019 Edition), https://plato.stanford.
edu/archives/win2019/entries/qt-idind/

[168] J. von Neumann. Mathematical Foundations of Quantum Mechanics. Pinceton University


Press (1955).

[169] J. Earman. Quantum Physics in Non-Separable Hilbert Spaces. Preprint (2020).

[170] G. Nenciu e G. Scharf. On regular external fields in quantum electrodynamics. Helv. Phys.
Acta 51, 3: 412-424 (1978).

[171] A. Duncan. The Conceptual Framework of Quantum Field Theory. Oxford University Press
(2012).

[172] S. Schlieder e E. Seiler. Some Remarks on the “Null Plane Development” of a Relativistic
Quantum Field Theory. Commun. Math. Phys. 25: 62-72 (1972).

[173] O.I. Zavialov. Renormalized Quantum Field Theory. Kluwer Academic Publishers (1990).

[174] F.G. Friedlander e M. Joshi. Introduction to the theory of distributions. 2a ed. Cambridge
University Press (1998).

[175] A.G. Sveshnikov e A.N. Tikhonov. The Theory of Functions of a Complex Variable. Mir
Publishers (1971).

[176] D. Prange. Lorentz covariance in Epstein-Glaser renormalization. arXiv:hep-th/9904136


(1999).

[177] P.P. Srivastava. Perspectives of Light-Front Quantized Field Theory: Some New Results.
arXiv:hep-ph/9908492v1 (1999).

[178] J. Hilgevoord. Dispersion Relations and Causal Description. North Holland (1960).

[179] H.M. Nussenzveig. Causality and Dispersion Relations. Academic Press (1972).

[180] T. Hurth and K. Skenderis. Quantum Noether method. Nuc. Phys. B 541: 566-614 (1999).

[181] D.Z. Freedman, K. Johnson e J. Latorre. Differential regularization and renormalization: a


new method of calculation in quantum field theory. Nuc. Phys. B 371(1-2): 353–414 (1992).

[182] P.P. Srivastava e S.J. Brodsky. Light-front quantized QCD in the light-cone gauge: The
doubly transverse gauge propagator. Phys. Rev. D 64: 045006 (2001).

[183] K. Nishijima. Fundamental Particles. W.A. Benjamin (1963).

[184] V. Mukherji. A History of the Meson Theory of Nuclear Forces from 1935 to 1952. Archive
for History of Exact Sciences, 13, 1: 27-102 (1974).
REFERÊNCIAS 243

[185] L.M. Brown e H. Rechenberg. The Origin of the Concept of Nuclear Forces. CRC Press.
(1996).

[186] L.M. Brown e H. Rechenberg. Quantum field theories, nuclear forces, and the cosmic rays
(1934-1938). Am. J. Phys. 59, 7: 595-605 (1991).

[187] W. Heisenberg. Über den Bau der Atomkeme Z. Phys. 77: 1-11 (1932); ibid. 78: 156-164
(1932); ibid. 80: 587-596 (1933). Tradução ao inglês da parte I e um trecho da parte III em:
D.M. Brink. Nuclear Forces. Oxford (1965).

[188] A.I. Miller. Werner Heisenberg and the beginning of nuclear physics. Physics Today 38, 11:
60-68 (1985).

[189] H. Yukawa. On the interaction of elementary particles I. Proc. Physico-Math. Soc. of Jpn.
17: 48-57 (1935).

[190] N. Kemmer. The charge-dependence of nuclear forces. Proc. Cambridge Phil. Soc. 34: 354-
364 (1938).

[191] G.C. Wick. Range of Nuclear Forces in Yukawa’s Theory. Nature 142: 993-994 (1938).

[192] N. Kemmer. Quantum theory of Einstein-Bose particles and nuclear interaction. Proc. Roy.
Soc. (London) A 166: 127-153 (1938).

[193] CMS Collaboration. Analysis of the CP structure of the Yukawa coupling between the Higgs

boson and τ leptons in proton-proton collisions at s = 13 TeV. CMS-PAS-HIG-20-006
(2020).

[194] M. Benghi. Three dimensional Yukawa models and CFTs at strong and weak couplings.
arXiv:2007.03784v1 (2020).

[195] S. Glazek, A. Harindranath, S. Pinsky, J. Shigemitsu e K. Wilson. Relativistic bound-state


problem in the light-front Yukawa model. Phys. Rev. D 47: 1599-1619 (1993).

[196] N. Piskunov. Differential and Integral Calculus. MIR Publishers Moscow (1969).

[197] M. Reed e B. Simon. Methods of Modern Mathematical Physics. Vol. II: Fourier Analysis,
Self-adjointness. Academic Press (1975).

[198] R. Casana, B.M. Pimentel e G.E.R. Zambrano. SQED2 on the null-plane. Revista Colom-
biana de Física 41, 1: 220-222 (2009).

[199] V.S. Vladimirov. Methods of the Theory of Functions of Many Complex Variables. Dover
(2007).

[200] R. Utiyama. Invariant Theoretical Interpretation of Interaction. Phys. Rev. 101, 5: 1597-1607
(1956).
244 REFERÊNCIAS

[201] O.A. Acevedo, R.R. Cuzinatto, B.M. Pimentel e P.J. Pompeia. Teorias de gauge a la
Utiyama. Rev. Bras. Ens. Fís. 40, 4: e4302 (2018).

[202] H. Epstein e V. Glaser. Adiabatic limit in perturbation theory. Em: G. Velo e A.S. Wightman
(eds.), Renormalization Theory: 193-254 (1976).

[203] P. Blanchard e R. Seneor. Green’s functions for theories with massless particles (in perturba-
tion theory). Ann. Inst. H. Poincaré A XXIII, 2: 147-209 (1975).

[204] P. Duch. Weak Adiabatic Limit in Quantum Field Theories with Massless Particles. Ann. H.
Poincaré 19: 875-935 (2018).

[205] A. Aste, G. Scharf e U. Walther. Power counting versus singular order in the Schwinger
model. Nuovo Cim. A 111: 323-327 (1998).

[206] C. Itzykson e J.-B. Zuber. Quantum Field Theory. Dover (2005).

[207] S. Weinberg. The Quantum Theory of Fields. Volume I. Foundations. Cambridge University
Press (1995).

[208] W.H. Furry. A Symmetry Theorem in the Positron Theory. Phys. Rev. 51: 125-129 (1937).

[209] E.S. Fradkin, D.M. Gitman e Sh.M. Shvartsman. Quantum Electrodynamics with Unstable
Vacuum. Springer-Verlag (1991).

[210] B.M. Stepanov. On the problem of introduction of dynamic variables in the quantum theory of
fields (em russo). Dokl. Akad. Nauk S.S.S.R. 100: 889 (1955).

[211] G. Källén. Formal integration of the equations of quantum theory in the Heisenberg represen-
tation. Arkiv Fysik 2: 371-410 (1951).

[212] C.N. Yang e D. Feldman. The S-Matrix in the Heisenberg Representation. Phys. Rev. 79, 6:
972-978 (1950).

[213] A. Khodjamirian. Hadron Form Factors. From Basic Phenomenology to QCD Sum Rules.
CRC Press, Taylor & Francis Group (2020).

[214] M. Henneaux e C. Teitelboim. Quantization of Gauge Systems. Princeton University


Press (1994).

[215] L. Landau e E. Lifchitz. Mécanique. La Paix (1969).

[216] C. Lämmerzahl. The pseudodifferential operator square root of the Klein–Gordon equation. J.
Math. Phys. 34, 9: 3918–3932 (1993).

Você também pode gostar