Teoría Cinemática de Partículas Elementales

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 318

Teoría cinemática de

partículas elementales con espín

Martín Rivas

e-mail: [email protected]
http://tp.lc.ehu.es/martin.htm

Departamento de Física Teórica


e Historia de la Ciencia

UPV/EHU Bilbao, Septiembre 2019


Estas notas son una version actualizada del libro:
Kinematical Theory of Spinning Particles. Classical and Quantum Mechanical
Formalism of Elementary Particles.
Fundamental Theories of Physics Series, vol 116 Kluwer, Dordrecht 2001.
i

If I can't picture it, I can't understand it.


You know, it would be sucient to really understand the electron.

A. Einstein 1

Everything should be as simple as possible, but not simpler.

A. Einstein?, William of Ockham? 2

If a spinning particle is not quite a point particle, nor a solid three dimensional top, what
can it be? What is the structure which can appear under probing with electromagnetic
elds as a point charge, yet as far as spin and wave properties are concerned exhibits a
size of the order of the Compton wavelength?

A.O. Barut 3

La gura de la portada representa el movimiento, a la velocidad de la luz, del centro de


carga del electrón para el observador del centro de masa. Este movimiento relativo no
es modicado por ninguna interacción. El centro de masa es siempre un punto distinto
del centro de carga. El radio de este movimiento es R = ~/2mc ≈ 2 × 10−13 m, la
mitad de la longitud de onda Compton, lo que sugiere el tamaño aparente que menciona
Barut. La frecuencia de este movimiento, cuando el centro de masa está en reposo, es
ν = 2mc2 /h ≈ 2,5 × 1020 s−1 . El período es de T ≈ 4 × 10−21 s. Esta frecuencia, doble que
la que postula De Broglie, disminuye cuando el centro de masa se desplaza. El reloj local
va más despacio cuando está en movimiento. La materia elemental posee una estructura
periódica, como las ondas, desde el punto de vista temporal. El espín total S tiene dos
partes: Una Z debida a este movimiento relativo y otra W en sentido contrario y debida
a la rotación con velocidad angular ω , de un sistema cartesiano local ligado al centro de
carga, y que no ha sido dibujado en la gura. Como el momento magnético del electrón
es producido por el movimiento de la carga, entonces está relacionado con la parte Z del
espín, por lo que es esta doble estructura del espín la que produce el concepto de relación
giromagnética g = 2.

La física de partículas, al usar de forma exhaustiva el modelo de partícula puntual para


describir experimentos hechos con partículas con espín, está simplicando en exceso el
modelo, contrario al espíritu de la segunda de las citas anteriores. Hay que utilizar modelos
de partículas con espín para analizar experimentos reales, porque en la naturaleza no
existen partículas elementales sin espín.
En este orden de cosas, la Relatividad General como teoría de la gravitación, también hace
una simplicación excesiva al asumir que el espacio-tiempo tiene una métrica Riemaniana,
cuando debería mantener que la métrica es necesariamente Finsleriana, como analizaremos
en la sección 1.6.

1
H. Dehmelt, Proc. Natl. Acad. Sci. USA, 86, 861819 (1989).
2
Ver la discución en http://quoteinvestigator.com/2011/05/13/einstein-simple/#more-2363, sobre la autoría
de esta frase.
3
A.O. Barut, Brief History and recent developments in electron theory and Quantumelectrodynamics, in The
electron, New Theory and Experiment, D. Hestenes and A. Weingartshofer (ed.), Kluwer Academic Publishers,
Dordrecht (1991).
ii

c Martín Rivas, 2019


DOI:10.13140/RG.2.1.1900.3284
Índice general

Prefacio 1
Preámbulo 5
El centro de carga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
El centro de carga de una partícula elemental . . . . . . . . . . . . . . . . . . . . . . 6
Argumentos de sólido rígido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Argumentos de invariancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Argumentos geométricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Movimiento libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Dos centros, dos espines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Tres constantes universales en una sola . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Teoría de partículas elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Predicciones del formalismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Apéndice: Partículas elementales (Modelo Estándar) . . . . . . . . . . . . . . . . . . 21

1. Formalismo Lagrangiano 23
1.1. Formulación de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2. Principios Fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.1. Principio de Relatividad Restringido . . . . . . . . . . . . . . . . . . . . 25
1.2.2. Principio Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.3. Principio Atómico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.4. Principio de Cuantización . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.3. Principio variacional: Formalismo Lagrangiano . . . . . . . . . . . . . . . . . . 29
1.3.1. Ecuaciones de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . . . . 30
1.3.2. Espacio Cinemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.3.3. Cambio del tiempo por otro parámetro de evolución . . . . . . . . . . . 33
1.3.4. Homogeneidad de la Lagrangiana . . . . . . . . . . . . . . . . . . . . . . 34
1.3.5. Obtención de la Lagrangiana a partir de la función Acción . . . . . . . . 35
1.3.6. Simetría de un sistema dinámico . . . . . . . . . . . . . . . . . . . . . . 35
1.3.7. Funciones gauge de la Lagrangiana . . . . . . . . . . . . . . . . . . . . . 36
1.4. Teorema de Noether generalizado . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.5. Principio atómico: Partículas elementales . . . . . . . . . . . . . . . . . . . . . . 44
1.5.1. Aplicación del formalismo a grupos cinemáticos sencillos . . . . . . . . . 46
1.6. Estructura métrica del espacio cinemático . . . . . . . . . . . . . . . . . . . . . 47
1.6.1. Geodésicas en un espacio de Finsler . . . . . . . . . . . . . . . . . . . . 49
1.6.2. Ejemplo: partícula puntual en un campo electromagnético . . . . . . . . 51
1.6.3. Otros ejemplos de espacios de Finsler . . . . . . . . . . . . . . . . . . . . 53
1.7. Principio de Causalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.8. Formalismo canónico generalizado . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.8.1. Ecuaciones de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . . . . 60

iii
iv ÍNDICE GENERAL

1.8.2. Sobre la equivalencia entre la formulación variacional y la canónica . . . 63


1.9. Apéndice: Grupos de Lie de transformaciones . . . . . . . . . . . . . . . . . . . 64
1.9.1. Operadores de Casimir . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
1.9.2. Espacios homogéneos de un grupo . . . . . . . . . . . . . . . . . . . . . 66
1.9.3. Ejemplos de grupos continuos . . . . . . . . . . . . . . . . . . . . . . . . 67
1.10. Apéndice: Sumario de Mecánica Clásica . . . . . . . . . . . . . . . . . . . . . . 69
1.10.1. Cinemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.10.2. Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.10.3. Principio Variacional: Formulación Lagrangiana . . . . . . . . . . . . . . 69
1.10.4. Principio de Relatividad Restringido: Grupo cinemático . . . . . . . . . 71
1.10.5. Principio Atómico: Existencia de partículas elementales . . . . . . . . . 71
1.10.6. Resumen del formalismo . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

2. Ejemplos de partículas con espín 75


PARTÍCULAS NO RELATIVISTAS . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.1. Partícula puntual no relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.1.1. Partícula puntual libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.1.2. Observador del centro de masa . . . . . . . . . . . . . . . . . . . . . . . 78
2.1.3. Interacción con el exterior . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.2. Partícula Galileana con espín . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
2.2.1. Partícula libre con espín . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.2.2. Constantes del movimiento Noetherianas . . . . . . . . . . . . . . . . . . 85
2.2.3. Espín respecto del centro de masa . . . . . . . . . . . . . . . . . . . . . 88
2.2.4. Dinámica del espín . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
2.2.5. Transformación de diversos observables . . . . . . . . . . . . . . . . . . . 90
2.2.6. Partícula Galileana con espín (anti)orbital . . . . . . . . . . . . . . . . . 91
2.2.7. Interacción con un campo electromagnético externo . . . . . . . . . . . . 94
2.2.8. Interacción con un campo magnético uniforme externo . . . . . . . . . . 96
2.2.9. Partícula Galileana con orientación . . . . . . . . . . . . . . . . . . . . . 104
PARTÍCULAS RELATIVISTAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
2.3. Partícula puntual relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
2.3.1. Partícula puntual libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
2.4. Partículas relativistas con espín . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
2.5. Luxones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.5.1. Partículas sin masa. (El fotón) . . . . . . . . . . . . . . . . . . . . . . . 110
2.5.2. Partículas con masa. (el electrón) . . . . . . . . . . . . . . . . . . . . . . 115
2.5.3. Movimiento del electrón para el observador del CM . . . . . . . . . . . . 117
2.5.4. El espín y el centro de masa para un observador arbitrario . . . . . . . . 119
2.5.5. Invariancia Poincaré del Hamiltoniano de Dirac . . . . . . . . . . . . . . 121
2.5.6. Análisis de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
2.6. La ecuación dinámica del electrón con espín . . . . . . . . . . . . . . . . . . . . 122
2.6.1. El electrón relativista con espín . . . . . . . . . . . . . . . . . . . . . . . 123
2.6.2. El centro de masa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
2.6.3. Interacción con un campo externo . . . . . . . . . . . . . . . . . . . . . 131
2.6.4. Condiciones de contorno . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
2.6.5. Unidades naturales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
2.6.6. Propiedades invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
2.7. Partículas y antipartículas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
2.7.1. Detección de antimateria cósmica . . . . . . . . . . . . . . . . . . . . . . 140
2.8. Apéndice: Grupo de Rotaciones SO(3) . . . . . . . . . . . . . . . . . . . . . . . 141
ÍNDICE GENERAL v

2.8.1. Parametrización normal o canónica del grupo SO(3) . . . . . . . . . . . 143


2.8.2. Ley de composición de las rotaciones . . . . . . . . . . . . . . . . . . . . 145
2.8.3. Cinemática de la rotación . . . . . . . . . . . . . . . . . . . . . . . . . . 147
2.8.4. Dinámica de la rotación . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
2.9. Apéndice: Grupo de Galileo G . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
2.10. Apéndice: Grupo de Poincaré P . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
2.10.1. Grupo de Lorentz L . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

3. Cuantización de los modelos 163


3.1. Cuantización Feynman de los sistemas Lagrangianos . . . . . . . . . . . . . . . 164
3.1.1. Transformación de la función de onda . . . . . . . . . . . . . . . . . . . 166
3.1.2. Espacio de Hilbert de las amplitudes de probabilidad . . . . . . . . . . . 168
3.1.3. Representación de los Observables . . . . . . . . . . . . . . . . . . . . . 168
3.2. Partículas no relativistas con espín . . . . . . . . . . . . . . . . . . . . . . . . . 172
3.2.1. Partículas no relativistas con espín. Bosones . . . . . . . . . . . . . . . . 172
3.2.2. Partículas no relativistas con espín. Fermiones . . . . . . . . . . . . . . . 174
3.3. Cuantización del fotón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
3.4. Apéndice: Estados de polarización de la luz . . . . . . . . . . . . . . . . . . . . 178
3.4.1. Parámetros de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
3.4.2. Superposición coherente . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
3.4.3. Superposición incoherente . . . . . . . . . . . . . . . . . . . . . . . . . . 182
3.4.4. Filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
3.5. Apéndice: Espinores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
3.5.1. Vectores unidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
3.5.2. Proyección del espín en los vectores unidad . . . . . . . . . . . . . . . . 185
3.5.3. Funciones de onda espinoriales . . . . . . . . . . . . . . . . . . . . . . . 186
3.5.4. Representaciones sobre la esfera unidad. Armónicos esféricos . . . . . . . 187
3.5.5. Representaciones espinoriales sobre SU(2) . . . . . . . . . . . . . . . . . 188
3.5.6. Representación matricial de los observables internos . . . . . . . . . . . 193
3.5.7. Teorema de Peter-Weyl para grupos compactos . . . . . . . . . . . . . . 194
3.5.8. Espinores generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
3.6. Resumen de Mecánica Clásica y Cuántica . . . . . . . . . . . . . . . . . . . . . 200

4. Partícula de Dirac 203


4.1. Cuantización del modelo u = c . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
4.2. Ecuación de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
4.2.1. Operador de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
4.2.2. Transformación gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
4.2.3. Dinámica de los observables . . . . . . . . . . . . . . . . . . . . . . . . . 214
4.2.4. Conservación de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . 216
4.2.5. Invariancia PCT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
4.2.6. Dos experimentos plausibles . . . . . . . . . . . . . . . . . . . . . . . . . 220
4.2.7. Quiralidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
4.3. Álgebra de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
4.4. Simetrías espacio-temporales adicionales . . . . . . . . . . . . . . . . . . . . . . 224
4.4.1. Análisis del grupo de simetrías ampliado . . . . . . . . . . . . . . . . . . 225
4.4.2. Ampliación del espacio cinemático . . . . . . . . . . . . . . . . . . . . . 227
4.4.3. Relación con el modelo estándar . . . . . . . . . . . . . . . . . . . . . . 228
4.5. Una Lagrangiana de interacción de dos partículas de Dirac . . . . . . . . . . . . 229
4.5.1. Descripción síncrona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
4.6. Apéndice: El grupo S = W ⊗ SU (2)T ⊗ U (1)Q . . . . . . . . . . . . . . . . . . 234
vi ÍNDICE GENERAL

5. Estructura electromagnética del electrón 241


5.1. Estructura del electrón con espín . . . . . . . . . . . . . . . . . . . . . . . . . . 241
5.1.1. Formulación covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
5.1.2. Campo de radiación según Dirac . . . . . . . . . . . . . . . . . . . . . . 245
5.1.3. El campo instantáneo de una partícula de Dirac . . . . . . . . . . . . . . 246
5.1.4. El campo promedio temporal de una partícula de Dirac . . . . . . . . . 250
5.1.5. Energía y momento angular electromagnético . . . . . . . . . . . . . . . 258

6. Propiedades y efectos asociados con el espín 263


6.1. Relación giromagnética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
6.2. El reloj del electrón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
6.2.1. Midiendo el reloj del electrón . . . . . . . . . . . . . . . . . . . . . . . . 266
6.3. Dipolo eléctrico instantáneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
6.4. Efecto Compton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273
6.4.1. Contribución del espín . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
6.4.2. Modelo de electrón con espín . . . . . . . . . . . . . . . . . . . . . . . . 279
6.5. Efecto túnel clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
6.5.1. Efecto túnel de polarización del espín . . . . . . . . . . . . . . . . . . . . 288
6.6. Formación de pares de electrones ligados . . . . . . . . . . . . . . . . . . . . . . 289
6.6.1. El Positronium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
6.7. Efecto Hall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
6.7.1. Efecto Hall cuántico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
6.7.2. Efecto Hall de espín . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
6.8. Enfriamiento de un gas por láser . . . . . . . . . . . . . . . . . . . . . . . . . . 299
6.9. El espín del protón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
6.10. El grupo cinemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
6.10.1. El espacio cinemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
6.10.2. Grupo de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
6.10.3. Transformaciones pasivas y activas . . . . . . . . . . . . . . . . . . . . . 306
6.10.4. Descripción cuántica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307

Referencias 309
Prefacio

Estas notas contienen materiales de naturaleza matemática y física del formalismo general
que bajo el título de Teoría Cinemática de Partículas Elementales con Espín he venido
trabajando en los últimos años. El adjetivo cinemática hace referencia a la íntima relación
del formalismo con el grupo cinemático de transformaciones espacio-temporales asociado al
Principio de Relatividad Restringido, que como toda teoría con un cierto carácter universal,
debe necesariamente satisfacer.
Son una revisión de principios fundamentales, como el formalismo Lagrangiano que conduce
a las ecuaciones de Euler-Lagrange, teorema de Noether, etc., pero buscando soluciones de las
correspondientes ecuaciones diferenciales que pasen por los puntos inicial y nal de la evolución.
El formalismo no es equivalente a la formulación canónica. De ahí que las soluciones contendrán,
desde el punto de vista clásico, información no de los datos de un único punto inicial, sino de
los puntos extremos de la evolución. Esto nos produce un formalismo clásico más próximo,
formalmente, a la dinámica cuántica la cual se expresa también en términos de los estados
inicial y nal de la evolución. Veremos que es a través del método de cuantización de Feynman
de Integrales de Caminos, donde las similitudes de ambos formalismos, clásico y cuántico, se
complementan.
A las variables clásicas que denen los puntos extremos de la evolución en la formulación
variacional, propongo denominarlas variables cinemáticas, y, veremos, que en el caso de las
partículas elementales, necesariamente forman un espacio homogéneo del grupo cinemático. De
esta forma, el grupo cinemático no solamente nos suministra las simetrías espacio-temporales
del formalismo, sino que también suministra las variables clásicas de las que debe depender un
sistema material para ser considerado como una partícula elemental. Es por lo tanto crucial,
desde un punto de vista teórico, precisar convenientemente cuál es este grupo cinemático. En
estas notas trabajaremos principalmente con los grupos de Galileo y de Poincaré, dependientes
de diez parámetros, que nos suministrarán respectivamente, modelos no relativistas y relativis-
tas de partículas elementales con espín, pero el formalismo es lo sucientemente general para
que funcione con cualquier otro grupo cinemático que consideremos. Veremos que el grupo cine-
mático de transformaciones espacio-temporales más general, que describa la cinemática de un
punto en un espacio tridimensional depende como máximo de doce parámetros. Si la partícula
elemental posee un centro de carga y un centro de masa como puntos diferentes, entonces nece-
sariamente el grupo cinemático es el grupo de Weyl, que consiste en el grupo de Poincaré junto
con las dilataciones espacio-temporales que conservan la velocidad de la luz.
Además, al expresar el formalismo variacional en términos de las variables cinemáticas, nos
convierte el propio formalismo variacional en un formalismo geodésico sobre este espacio cine-
mático. El espacio cinemático es siempre un espacio métrico Finsleriano, lo que nos orienta
sobre la posibilidad de que cuando establecemos una interacción sobre el sistema material, la
nueva métrica tiene que seguir siendo Finsleriana. En este sentido, si analizamos la partícula
puntual, cuyo espacio cinemático es el espacio-tiempo, cualquier interacción nos modica la
métrica Minkowskiana de la partícula libre y nos producirá, en general, una métrica Finsleria-
na y no pseudo-Riemanniana como postula la teoría general de la relatividad. En este sentido

1
2 PREFACIO

consideramos que la Relatividad General es una teoría demasiado restrictiva.


El formalismo es por lo tanto muy general, pero al mismo tiempo es muy restrictivo, porque
una vez que quede inicialmente jado el grupo cinemático, las variables clásicas que pueden
denir los estados inicial y nal de una partícula elemental en su formulación variacional, deben
formar una variedad que sea un espacio homogéneo de este grupo. Este grupo cinemático es el
objeto fundamental del formalismo y debe quedar jado como un postulado inicial.
Para los grupos de Galileo y de Poincaré, vamos a ver que una partícula elemental con espín
es un sistema material localizado y orientado, es decir, que se desplaza y rota. Por localizado
queremos decir que para analizar su evolución nos basta con seguir el desplazamiento de un
sólo punto r , que representará la localización del centro de carga, y donde los diferentes campos
externos estarán denidos a la hora de calcular sobre la partícula las fuerzas externas. Este
punto r también representará la localización del centro de masa q para partículas sin espín,
mientras que ambos puntos serán necesariamente distintos para objetos con espín, como el
electrón. El centro de masa q , quedará unívocamente determinado en términos de la posición
r del centro de carga y su movimiento. Es precisamente el movimiento del centro de carga
alrededor del centro de masa el que nos dará una idea clásica del denominado zitterbewegung,
o movimiento tembloroso del electrón, en palabras de Schroedinger, y también de la estructura
dipolar eléctrica y magnética de la partícula.
Por orientado queremos signicar que también deberemos describir los cambios de orien-
tación de la partícula, además de la evolución de su centro de carga, mediante el análisis de la
evolución y rotación de un sistema cartesiano local, con su origen en el centro de carga. Este
sistema local de ejes no posee realidad física, por lo que podemos escogerlo de forma arbitraria
en cualquier instante, lo que va a dar lugar a un grupo adicional de simetrías pasivas.
Si consideramos que el grupo cinemático es el grupo de Weyl, W , entonces toda partícula
elemental, además de ser un objeto localizable y orientable, debe ser un objeto reescalable. Es
decir, contiene otro grado de libertad que da cuenta de un posible cambio de escala. Por lo tanto,
el grupo de simetrías más general de la dinámica de una partícula, además del grupo cinemático
que afecta a las variables espacio-temporales, debe incluir las transformaciones especícas de
los otros grados de libertad, es decir rotaciones locales y cambios de escala local. Veremos que
es posible encontrar una Lagrangiana que es invariante bajo el grupo W ⊗ SU (2) ⊗ U (1).
Estas notas pretenden ser autocontenidas por lo que hemos incluido al nal de cada capítulo
algunos apéndices matemáticos que contienen materiales que no suelen aparecer en libros de
texto. Están organizadas de la siguiente forma: Comenzamos con un Preámbulo que podría
haberse escrito a nales del siglo XIX, en el que se da una denición plausible de centro de
carga de una partícula elemental y se demuestra que este centro de carga se mueve siguiendo
un movimiento helicoidal a la velocidad de la luz, de tal manera que este punto satisface, en
general, ecuaciones diferenciales de cuarto orden. Efectivamente, la geometría nos muestra que
la trayectoria más general de un punto en el espacio tridimensional, satisface un sistema de
ecuaciones diferenciales ordinarias de cuarto orden. Si pretendemos hacer una descripción La-
grangiana de esta partícula, la Lagrangiana debe depender, al menos, hasta la derivada segunda
de la posición de este punto. Estamos en el marco de sistemas Lagrangianos generalizados con
dependencia de las derivadas hasta segundo orden. En este Preámbulo, la consideración más
importante es que una partícula elemental puede tener un centro de masa CM y un centro de
carga CC, que son dos puntos distintos. Si esto es así, entonces necesariamente debe existir un
límite máximo para la velocidad del CM de las partículas elementales masivas, y por extensión,
para el centro de masa de cualquier cuerpo masivo.
En vez de postular un modelo de partícula con un centro de carga como el mencionado an-
teriormente, comenzaremos en el primer capítulo con el análisis de los principios fundamentales
que una teoría de partículas elementales debe satisfacer. Entre estos principios está un principio
variacional por lo que dedicaremos este primer capítulo al análisis de los sistemas Lagrangianos
PREFACIO 3

generalizados, sobre todo para realzar el papel que van a jugar las variables de contorno, que
denominaremos variables cinemáticas, en la denición de partícula elemental. En el capítulo dos
se analizarán diferentes modelos Lagrangianos de partículas relativistas y no relativistas para
mostrar cómo los métodos estándar del análisis de las simetrías nos conducen a la denición
de los observables relevantes. En particular, prestaremos atención a la denición del espín, a
través de la invariancia de las ecuaciones dinámicas bajo el grupo de rotaciones. El espín, como
cualquier otro observable, estará ligado con los diferentes grados de libertad y sus derivadas,
y analizaremos su estructura matemática. Aunque partimos de un formalismo Lagrangiano,
veremos que es innecesario transformarlo al formalismo Hamiltoniano equivalente, ya que aquí
estamos interesados no solo en obtener las ecuaciones dinámicas, sino también exigir que se
cumplan las condiciones de contorno de la formulación variacional en los extremos de la evolu-
ción. Con estas condiciones de contorno, el formalismo canónico y el formalismo variacional no
son formalismos equivalentes.
Los dos capítulos siguientes contienen la cuantización del formalismo y el análisis de algunos
ejemplos relativistas y no relativistas. En particular, el cuarto capítulo se dedica al modelo
relativista que satisface la ecuación de Dirac y que nos brinda la descripción pictórica de la
cubierta. Prestaremos especial atención al análisis cuántico del álgebra de observables de Dirac y
su relación con los correspondientes observables clásicos. Veremos una interpretación geométrica
de la diferencia en la quiralidad entre materia y antimateria. Se podría decir, remedando
a Asimov4 , que el electrón es zurdo y el positrón es diestro, o bien, que la materia, es de
izquierdas y solamente la antimateria es de derechas. Este capítulo acaba con el análisis de la
ampliación del grupo cinemático de la partícula de Dirac, pasando del grupo de Poincaré
a una extensión del grupo de Weyl, ya que este modelo posee un grupo de simetrías espacio-
temporales más amplio que el grupo de Poincaré. Encontraremos una Lagrangiana de interacción
invariante bajo este grupo, que nos describiría la interacción entre dos partículas de Dirac. Esta
interación presenta un comportamiento Coulombiano entre las dos cargas cuando el espín de
las partículas desaparece, y muestra, entre otras cosas, que es posible la existencia de estados
ligados metaestables entre electrones, cuando se cumplen ciertas condiciones. La intensidad de
esta interacción viene controlada por el valor de la constante de estructura na, cuando el
análisis se reduce a variables sin dimensiones.
En el capítulo 5 se analiza la estructura del campo electromagnético de una partícula de
Dirac, que, claramente no es un campo estático para el observador del centro de masa, pero
produce campo eléctrico y campo magnético. Veremos que el campo eléctrico promedio temporal
a una vuelta de la carga tiene un comportamiento Coulombiano en cualquier dirección y su
campo magnético es el campo de un dipolo, pero a diferencia de los de una partícula puntual,
estos campos no se hacen innitos en el origen. Presentan singularidades en puntos del plano
del movimiento de la carga que no hemos sido capaces de renormalizar.
Finalmente, en el último capítulo, se analizan algunos efectos físicos relacionados con el es-
pín. El electrón, al tener una frecuencia interna, resulta ser un reloj. ¾Puede medirse de forma
indirecta esta frecuencia? Se analizará la estructura de dipolo eléctrico del electrón, que en el
caso cuántico nos lleva al término de Darwin del Hamiltoniano de Dirac. Veremos cómo la es-
tructura del espín permite justicar, incluso a nivel clásico, el denominado efecto túnel, el cual
sería responsable de la magnetorresistencia colosal de ciertos materiales. Estamos entrando en
los albores de la manipulación de corrientes de electrones mediante el control de su espín, lo
que en la tecnología actual se empieza a denominar como espintrónica. El efecto Compton
analiza la dispersión de fotones por electrones libres y en su análisis utiliza simplemente la
ley de conservación de la energía y del momento lineal. Pero la interacción electromagnética
también conserva el momento angular. Esta nueva conservación implica considerar los espines
tanto del fotón como del electrón, lo que conduce a que si controlamos la orientación del espín
4
Isaac Asimov, El electrón es zurdo, Alianza Editorial, 1980
4 PREFACIO

del electrón libre, podremos determinar la frecuencia del fotón dispersado. Para terminar con
esta exposición, analizaremos la posibilidad de que dos electrones con sus espines paralelos,
bajo ciertas condiciones de proximidad y de velocidad relativa, puedan formar un estado ligado
de carga 2e y espín 1, por lo que tendríamos un mecanismo clásico de formación de bosones
a temperatura nita, que podría ser la base de la formación de condensados de Bose-Einstein
conducentes a la fase superconductora del material a esta temperatura. Consecuencia de este
apareamiento puede estar ligado el efecto Hall cuántico. Como último análisis consideramos la
formación de un protón como un estado ligado de tres partículas de Dirac, los tres quarks. En
el estado actual de este tema vemos que falta un término en el cálculo del espín del protón.

En denitiva hay que hacer las cosas sencillas pero no más sencillas. No conviene simplicar
en exceso en el arranque del formalismo. Las simplicaciones se deben hacer en los análisis de
fenómenos particulares y dependiendo de los valores de los parámetros físicos que intervienen. Y
si, de acuerdo con la primera de las frases de la contraportada, lo que queremos es al menos llegar
a entender al electrón deberíamos ser capaces de poner un electrón, por ejemplo en una jaula
de Penning, someterlo a campos electromagnéticos externos y lograr que emitiera un fotón de
energía determinada, en una dirección de salida prejada y con su espín orientado hacia adelante
o hacia atrás a nuestra elección. Como la descripción precisa de una partícula elemental debe
hacerse en un marco cuántico, los anteriores valores estarían sometidos a las imprecisiones del
principio de incertidumbre. Todavía estamos lejos de lograr este objetivo.

Martín Rivas
Bilbao, Septiembre 2019.
Preámbulo: Movimiento helicoidal del

centro de carga

En este capítulo preliminar vamos a dar tres clases diferentes de argumentos, para que
supuestos el centro de masa y el centro de carga de una partícula elemental puntos diferentes,
mostrar que el centro de carga se mueve en un movimiento helicoidal a la velocidad de la luz y
su ecuación diferencial más general es de cuarto orden. Por una parte nos va a singularizar la
formulación relativista frente a la no relativista, y el hecho de que las ecuaciones dinámicas de
un punto en el espacio tridimensional, no son ecuaciones diferenciales de segundo orden, como
algunos libros de mecánica parecen sugerir, sino de cuarto orden como demuestra la geometría
diferencial. Por otra parte, va a sugerir desde el punto de vista mecánico, que debe existir un
límite superior a la velocidad del centro de masa de cualquier cuerpo masivo.
Esto signica que un formalismo Lagrangiano que describa partículas elementales deberá
depender por lo menos hasta la aceleración del centro de carga, para poder obtener ecuaciones
dinámicas de cuarto orden. Es por esto que comenzaremos repasando en el primer capítulo la
forma en que un formalismo Lagrangiano generalizado produce los resultados generales de las
ecuaciones de Euler-lagrange, análisis de simetrías y teorema de Noether, el formalismo canónico
generalizado, y, sobre todo, el papel que van a jugar las variables cinemáticas.
Comenzaremos este Preámbulo con una denición física, y por lo tanto restringida, de un
concepto de centro de carga de una partícula elemental.

El centro de carga de un sistema material arbitrario

En mecánica está bien denido el concepto de centro de masa de una distribución de masas,
de valores mi , localizadas en los puntos correspondientes r i , de tal manera que admitiendo la
tercera ley de Newton, el centro de masa se mueve bajo la acción de la suma de todas las fuerzas
externas. La denición es ∑
mi r i
RCM = ∑
mi
Desde el punto de vista electromagnético, si tenemos una distribución arbitraria de cargas y
corrientes, el campo electromagnético que generan se puede expresar como el producido a partir
de un punto concreto, pero arbitrario, en el que localizaríamos como fuentes de ese campo, la
carga total y un número, en principio innito, de los diferentes momentos multipolares eléctrico
y magnético asociados a esa distribución y denidos adecuadamente con respecto a ese punto. Si
cambiamos de punto, la carga total asociada al nuevo punto es la misma, pero no así los diferentes
momentos multipolares. Podríamos intentar denir un centro de carga de forma similar a como
denimos el centro de masa, pero existe una dicultad. La distribución de masa es siempre
positiva, en tanto que la distribución de carga eléctrica contiene ambos signos y una denición
del tipo anterior ∑
qi r i
RCC = ∑
qi

5
6 PREÁMBULO: Dos Centros


podría resultar que el denominador qi resultase cero. Se podría subsanar deniendo por
(+)
separado el centro de cargas positivas por un lado RCC , y el centro de cargas negativas por
(−)
otro RCC , determinando los campos que generan por separado las diferentes distribuciones
positivas y negativas. Como las ecuaciones de Maxwell son lineales, su superposición lineal nos
dará el resultado, pero ahora tendríamos dos puntos, junto con los correspondientes momentos
multipolares, como localización de las fuentes del campo.
Otra cuestión es calcular, dada una distribución de cargas y corrientes, la fuerza que actúa
sobre ellas, debido a un campo electromagnético externo, que es generado por fuentes diferentes
de las de esta distribución. ¾Se podría escribir esta fuerza en términos de los valores de la carga
total y de los diferentes multipolos asociados a un cierto punto, juntamente con los valores que
los campos externos y sus derivadas toman en ese punto?
Supongamos para jar ideas, que tenemos una distribución esférica de carga positiva. Si la
distribución es estática en un cierto sistema de referencia inercial, el campo electrostático que
genera es el campo Coulombiano de una carga puntual, la carga total de la distribución, localiza-
da en el centro de simetría esférica. Si sobre esta distribución esférica actúa un campo eléctrico
externo, y el sistema es un conductor, el campo modicará en general la propia distribución
de las cargas al producir movimientos de éstas, apareciendo con respecto al centro de simetría
anterior momentos multipolares que antes no existían. Si la distribución estuviera asociada con
un aislante, este desplazamiento de cargas no se produciría. En este último caso, al no existir
momentos multipolares, el valor del campo eléctrico externo en el centro de simetría por el valor
total de la carga nos produce el valor de la fuerza total externa sobre esta distribución, si es
que la variación del campo externo es suave. En Jackson, 5 se demuestra que el valor medio de
un campo electrostático denido en una región esférica en la que no existen cargas que generen
ese campo, es el valor que el campo toma en el centro de la esfera.

El centro de carga de una partícula elemental

En el apartado anterior hemos hablado de distribuciones arbitrarias de cargas, las cuales para
ciertos efectos se pueden reducir a un punto y respecto del cual los dipolos eléctrico y magnético
se pueden anular. No sabemos si la materia es divisible de forma indenida, pero si no lo es y
llegamos a un último objeto indivisible, a éste le llamamos partícula elemental. Desconocemos si
una partícula elemental se comporta como un conductor o un aislante, si es o no un sólido rígido
desde el punto de vista mecánico, pero en el apartado de principios fundamentales haremos la
hipótesis de que es un sistema mecánico indeformable (Principio atómico). Si su distribución de
cargas y corrientes posee una distribución esférica con respecto a cierto punto, de tal manera
que tomando ese punto como referencia, el campo electromagnético que la partícula elemental
produce fuera como si toda la carga estuviera concentrada en él, entonces denominamos a ese
punto el centro de carga. La supuesta indeformabilidad de una partícula elemental frente a
un campo externo nos lleva a postular que la fuerza externa que actúa sobre ella es la fuerza
de Lorentz denida en el centro de carga. Estamos haciendo la hipótesis de que desde el punto
de vista electromagnético se comporta como una única carga puntual localizada en el centro
de carga, sin ningún otro multipolo. Debido a su estructura mecánica, una partícula elemental
tendrá otro punto característico, su centro de masa. Solo existen dos posibilidades: que ambos
centros sean el mismo punto o que sean distintos. La hipótesis de la existencia de un centro de
carga también se hace en el modelo de partícula puntual, pero en ese modelo se admite que
el punto representa también la localización del centro de masa, hipótesis que aquí no vamos
a aceptar. El modelo debe ser simple, pero admitir que ambos centros son el mismo punto es
hacer el modelo más simple, demasiado simple, en contra de la segunda de las sentencias de la
contraportada.
5
J.D. Jackson, Classical Electrodynamics, John Wiley, NY 199, p. 148-149.
PREÁMBULO: Dos Centros 7

Argumentos de sólido rígido

Supongamos que una partícula elemental se pudiera describir como un sólido rígido. Sería
por lo tanto un sistema de seis grados de libertad, de los que tres representarían la posición de un
punto y los otros tres la orientación de un sistema cartesiano ligado a ese punto. Habitualmente,
se toma el punto como el centro de masa q , y la orientación como los ejes principales de inercia
localizados alrededor de q . El centro de masa satisface ecuaciones Newtonianas de segundo orden
y se mueve como un punto de masa m, la masa total del sistema, bajo la acción de la fuerza
total externa. El cambio de orientación se produce por el momento de las fuerzas externas. Un
sólido rígido se desplaza y rota.

Si en vez de considerar la descripción del centro de masa consideramos otro punto cualquiera
r , éste seguirá, en general, una trayectoria helicoidal alrededor del centro de masa, del estilo de
la dibujada en la gura.
Si una partícula elemental fuese un sólido rígido cargado, necesitaríamos conocer también su
estructura electromagnética. Ésta se reduce al conocimiento del centro de carga y los diferentes
multipolos. Si el campo que genera tiene simetría esférica, entonces nos quedamos solamente
con el centro de carga, para calcular desde ahí el campo que la partícula crea y las fuerzas que
los campos externos hacen sobre ella.
En general, dependiendo de cómo esté distribuida la masa y la carga, el centro de masa y
el centro carga serán en general puntos diferentes, que es lo que vamos a suponer aquí. Por lo
tanto, para determinar el movimiento del centro de masa necesito conocer en todo instante la
localización del centro de carga para conocer las fuerzas externas en él denidas. Las ecuaciones
de Newton del centro de masa se escriben
( )
d2 q dr
m 2 = e E(t, r) + × B(t, r) = F (t, r, dr/dt). (1)
dt dt

La fuerza electromagnética F depende, en general, del campo eléctrico y magnético externos


denidos en la posición del centro de carga r y de la velocidad de este punto dr/dt, que es la
que aparece en el término magnético.
Para el movimiento relativo del centro de carga alrededor del centro de masa, si el sistema
es indeformable, efectuará un movimiento circular, por ejemplo en el caso libre. Si denimos el
vector unidad n en la dirección de la aceleración del centro de carga d2 r/dt2

1 d2 r
n= ,
ω 2 R dt2
8 PREÁMBULO: Dos Centros

donde R es el radio del movimiento circular y ω su velocidad angular. De esta forma, conocido
el centro de carga, podemos determinar el centro de masa mediante

1 d2 r
q(t) = r(t) + . (2)
ω 2 dt2

Es por lo tanto más simple, desde el punto de vista teórico, describir la evolución de un solo
punto, el centro de carga r , en vez del centro de masa q , ya que éste queda determinado en
función del anterior mediante (2) una vez que se conoce la trayectoria de r .
Si eliminamos d2 q/dt2 entre las ecuaciones (1) y (2) obtendremos, en general, una ecuación
diferencial de cuarto orden en la variable vectorial r . Además, como la velocidad angular es
perpendicular al plano que contiene a la velocidad y a la aceleración del punto r ,

1 dr d2 r
ω= × 2 (3)
u2 dt dt

hemos resuelto también el problema de la rotación del sólido rígido cargado, habiendo analizado
solamente la evolución del centro de carga.

Una denición de la velocidad angular como ésta (3) implica que la u ̸= 0, es decir la velocidad del

punto r debe ser inalcanzable para todo observador inercial. De hecho, en el modelo relativista el

centro de carga se mueve con u = c.

Las ecuaciones dinámicas de segundo orden de la partícula libre, para la posición del centro de
masa q y la orientación de los ejes principales de inercia α, quedan

q̈ = 0, ω̇ = 0,

han sido reemplazadas por las ecuaciones dinámicas de cuarto orden del centro de carga,

d4 r 2
2d r
+ ω = 0.
dt4 dt2

De esta forma, un sólido rígido puede ser interpretado como un sistema de tres grados de libertad,
la posición del centro de carga r , que satisface ecuaciones diferenciales de cuarto orden, y por
lo tanto descrito por una Lagrangiana dependiente de la aceleración. La trayectoria del centro
de masa del sólido queda determinada por la trayectoria del centro de carga mediante (2).
Las ecuaciones dinámicas en interacción quedan:
( )
m d4 r d2 r dr
+ m 2 = e E(t, r) + × B(t, r) , (4)
ω 2 dt4 dt dt

en términos de los tres grados de libertad r que es donde están denidos los campos externos.
Una formulación Lagrangiana dependiente de la aceleración del punto r , podría dar lugar a
la obtención de estas ecuaciones dinámicas. Por ejemplo, la Lagrangiana no relativista
( )2 ( )2
m dr m d2 r dr
L= − 2 − eϕ(t, r) + eA(t, r) ·
2 dt 2ω dt2 dt

nos reproduciría las anteriores ecuaciones dinámicas (4), donde el sólido rígido giraría a la
velocidad constante ω , que aquí aparecería como una propiedad intrínseca e inmodicable.
PREÁMBULO: Dos Centros 9

Argumentos de invariancia

Consideremos que r(t), t ∈ [t1 , t2 ] es la trayectoria que sigue un punto de un sistema me-
cánico en el espacio tridimensional y para un cierto observador inercial arbitrario O. Cualquier
otro observador inercial O′ , está relacionado con O mediante una transformación g del grupo
cinemático G, de tal manera que las medidas relativas de espacio y tiempo vienen relacionadas
por
t′ = T (t, r; g1 , . . . , gα ), r ′ = R(t, r; g1 , . . . , gα ),
donde las funciones T y R denen las correspondientes leyes de transformación del grupo
cinemático G, de parámetros (g1 , . . . , gα ), entre ambos observadores. Por lo tanto, la descripción
de esa trayectoria para el observador O′ se obtiene de

t′ (t) = T (t, r(t); g1 , . . . , gα ), r ′ (t) = R(t, r(t); g1 , . . . , gα ), ∀t ∈ [t1 , t2 ].

que si logramos eliminar t como función de t′ de la primera y lo sustituimos en la segunda,


obtendremos
r ′ (t′ ) = r ′ (t′ ; g1 , . . . , gα ). (5)
Como O′ es un observador arbitrario, la ecuación (5) representa el conjunto completo o familia de
trayectorias del punto para todos los observadores inerciales. Por eliminación de los α parámetros
del grupo entre la función r ′ (t′ ) y sus sucesivas derivadas temporales obtendremos la ecuación
diferencial que satisface esta familia de trayectorias. Vamos a suponer que la trayectoria es
completamente arbitraria y que los parámetros del grupo cinemático son esenciales, en el sentido
de que no podemos obtener la misma familia de soluciones con un número menor de parámetros.
Esta ecuación diferencial es invariante bajo las transformaciones del grupo cinemático por
construcción, ya que es independiente de todos los parámetros del grupo, y por lo tanto inde-
pendiente de cualquier observador inercial. Como (5) es una expresión vectorial en el espacio
tridimensional, cada vez que hacemos una derivada temporal establecemos tres nuevas condi-
ciones. Si G es bien el grupo de Galileo o de Poincaré, como es un grupo dependiente de diez
parámetros deberemos derivar hasta el orden cuatro para obtener sucientes ecuaciones para
eliminar todos los parámetros. Por lo tanto el orden de la ecuación diferencial invariante depende
del número de parámetros esenciales del grupo cinemático. Si el punto r representa la posición
del centro de carga de una partícula elemental, satisface, en general una ecuación diferencial de
cuarto orden. Pero al mismo tiempo estos argumentos nos dicen que para obtener la ecuación
diferencial invariante que satisface el centro de carga de una partícula elemental, nos basta con
conocer su evolución para un observador particular, transformarla a cualquier otro observador
inercial y seguir este procedimiento de eliminación de los parámetros. Utilizaremos este método
en la sección 2.6 para obtener la ecuación diferencial que satisface el centro de carga del electrón
con espín.

Argumentos geométricos

Como es bien conocido en geometría diferencial en el espacio tridimensional, las ecuaciones


de Frenet-Serret (1847) de la evolución de un punto r(s), viene dadas por la variación, por
unidad de longitud de arco, de los tres vectores unidad t, tangente, n, normal y b binormal
asociados al punto:
ṫ = κn, ṅ = −κt + τ b, ḃ = −τ n
donde κ es la curvatura y τ la torsión, y las derivadas se efectúan con respecto al elemento de
longitud de arco s. El conocimiento de la curvatura κ(s) y de la torsión τ (s), juntamente con
los valores iniciales r(0), t(0), n(0) and b(0), determinan completamente la curva, puesto que
10 PREÁMBULO: Dos Centros

estas ecuaciones son integrables. Si se dene el vector ω = τ t + κb, conocido como vector de
Darboux, las ecuaciones de Frenet-Serret se pueden reescribir

ṫ = ω × t, ṅ = ω × n, ḃ = ω × b,

de tal manera que, en unidades de la longitud del arco, el vector de Darboux representa la
velocidad angular instantánea del triedro local y referida a este mismo triedro.
Llamando r (k) = dk r/dsk ,

r (1) = t, r (2) = ṫ = κn, r (3) = κ̇n + κ(−κt + τ b),

podemos despejar entre estas tres ecuaciones los vectores unidad de la terna de Frenet-Serret
en términos de las tres primeras derivadas del vector de posición
1 (2) κ (1) κ̇ 1 (3)
t = r (1) , n= r , b= r − 2 r (2) + r
κ τ κ τ κτ
De esta forma
1 (1)
κ = |r (2) |, τ=(r × r (2) ) · r (3)
κ2
y se expresan a su vez en términos de las tres primeras derivadas de la posición del punto.
Volviendo a derivar r (3) y sustituyendo las expresiones de los vectores unidad, la ecuación
diferencial más general de un punto en el espacio tridimensional es
( ) ( ) ( )
2κ̇ τ̇ κ̇τ̇ 2κ̇2 − κκ̈ 2 κ̇ τ̇
r −
(4)
+ (3)
r + κ +τ +2 2
+ (2)
r +κ − r (1) = 0, (6)
κ τ κτ κ2 κ τ
donde todos los coecientes se expresan a su vez en términos de las diferentes derivadas de la
posición del punto hasta el orden 4.
Si una partícula elemental es un sistema localizado, y al menos la describimos por la evolución
de un punto, éste, en general, deberá satisfacer una ecuación de cuarto orden de este tipo.

Movimiento libre
Supongamos que este punto r es el centro de carga de una partícula elemental. Este punto
debe satisfacer en general una ecuación del tipo (6). La curvatura κ(s) y la torsión τ (s) en cada
momento s, dependerán de las fuerzas y pares externos que se ejercen sobre la partícula en
ese momento. Supongamos ahora que la evolución es libre. Eso quiere decir que no es posible
distinguir un instante de la evolución de cualquier otro. Como la anterior ecuación diferencial
se expresa en términos del triedro local, esto signica que el desplazamiento del triedro, en la
dirección del vector tangente t, y la rotación del triedro, deben ser independientes del instante
en el que lo analizamos, y jado un observador inercial, deben ser independientes de su tiempo.
Esto signica que se debe mover con velocidad de módulo constante y el vector de Darboux
debe ser también constante. Si la velocidad es constante en módulo, el parámetro s y el tiempo
t dieren en un factor multiplicativo. La curvatura y la torsión son constantes y la curva es,
por lo tanto, una hélice. Para un observador inercial el triedro se desplaza con velocidad en
valor absoluto constante y rota respecto de sí mismo con velocidad angular constante. Como
κ̇ = τ̇ = 0, lo que es constante para el observador inercial es ds/dt = u y el valor ω 2 = κ2 + τ 2
y la ecuación diferencial se puede factorizar en la forma
( ) d2 ( )
r (4) + κ2 + τ 2 r (2) = 2 r (2) + ω 2 r = 0.
ds
El término entre paréntesis va denir el centro de la hélice q , mediante
1 (2) d2 q
q=r+ r , =0
ω2 ds2
PREÁMBULO: Dos Centros 11

y la ecuación anterior corresponde a un punto q que se mueve de forma libre, en línea recta, y
el punto r que satisface
r (2) + ω 2 (r − q) = 0,

efectúa un movimiento armónico de pulsación constante ω = κ2 + τ 2 alrededor de q , quedando
las anteriores ecuaciones acopladas en la forma

q (2) = 0, r (2) + ω 2 (r − q) = 0.

Esta descripción del movimiento libre debe ser válida para todo observador inercial.
Una primera conclusión es que la velocidad del centro de carga debe ser una velocidad
inalcanzable para cualquier observador inercial. Como su movimiento es acelerado y de velocidad
en módulo constante, no es posible encontrar un observador inercial que esté en un instante en
reposo respecto de la carga, porque en el instante siguiente vería moverse la carga con una
velocidad distinta de cero y por lo tanto contradictorio con el hecho de que mide un movimiento
con velocidad de módulo constante.
En un análisis no relativista, la relación de la medida de las velocidades entre dos obser-
vadores inerciales O y O′ , está dada por u′ = u + v , donde v es la velocidad constante de O
medida por O′ . Así,
u′ = u2 + v 2 + 2v · u.
2

Si u′ tiene que ser también constante para el observador O′ , independientemente de los valores
del vector v , esto implica que v · u̇ = 0, y el vector u debe ser constante. El centro de carga se
debe mover necesariamente a lo largo de una recta con velocidad constante para todo observador
inercial. De esta forma, la hélice general degenera en una línea recta y q = r , el centro de masa
y el centro de carga son necesariamente el mismo punto. Esta es la descripción habitual de la
partícula puntual o partícula sin espín.
En el caso relativista tenemos igualmente que
γ2
u + γ(v)v + (1+γ)c2
(v · u)v u2 − c2

u′ =
2
u = , + c2 .
γ(1 + v · u/c )
2
γ 2 (1 + v · u/c2 )2

donde γ = (1 − v 2 /c2 )−1/2 , y tomando la derivada temporal de ambos miembros llegamos a


v · u̇ = 0, independientemente de los valores de v y por lo tanto u tiene que ser un vector
constante.
Sin embargo en este análisis relativista existe otra alternativa no contemplada en el caso
no relativista. La posibilidad de que el centro de carga de una partícula elemental se esté
moviendo a la velocidad de la luz c, y en ese caso, u = u′ = c, para todo observador inercial.
Esto signica que el centro de la hélice se mueve siempre con una velocidad |dq/dt| < c, y, si
representa el movimiento del centro de masa, la partícula es una partícula con masa. En una
descripción variacional la Lagrangiana deberá depender hasta la aceleración del punto r para
obtener ecuaciones diferenciales de cuarto orden. El movimiento del centro de carga alrededor
del centro de masa va a producir el momento magnético de la partícula.
Vemos que hay solo dos posibilidades para el movimiento libre del centro de carga de una
partícula elemental: Una que la carga se mueva en línea recta a velocidad constante, la misma
que la del centro de masa y además sin ningún límite superior a su velocidad. El observador del
centro de masa no ve que la partícula rote. La partícula no posee momento magnético ni espín.
En la otra, la carga se mueve a lo largo de una hélice a la velocidad de la luz. El centro de la
hélice representa al centro de masa y es siempre un punto diferente y que se mueve con una
velocidad inferior a la del centro de carga. Posee espín y momento magnético, pero el formalismo
debe ser necesariamente relativista. Como todas las partículas elementales conocidas, quarks y
leptones, tienen espín 1/2, solamente nos queda esta segunda posibilidad. Esto vamos a ver que
12 PREÁMBULO: Dos Centros

es consistente con la teoría de Dirac del electrón ya que el operador velocidad de Dirac posee
como valores propios ±c. Esto signica que la función de onda, o espinor de Dirac ψ(t, r), se
expresa en términos de la posición del centro de carga r , que se mueve a la velocidad de la luz,
y que es donde los campos externos están denidos.
En resumen, si una partícula elemental tiene dos centros diferentes, este análisis produce
una solución tan restrictiva, que es única. En efecto:

1. Si describe una hélice, el movimiento de la carga es acelerado, de tal manera que si cam-
biamos de observador inercial, las velocidades no pueden sumarse como vectores, porque
si el vector velocidad u es distinto en dos instantes t1 y t2 , al añadirle un vector constante,
no produce necesariamente dos vectores del mismo módulo en el nuevo referencial. La ley
no relativista de adición de velocidades no se mantiene. Deberá existir otra ley de com-
posición de velocidades que dé lugar, al añadir un vector constante al vector velocidad u,
otro vector velocidad de módulo constante, cualquiera que sea la orientación del vector
velocidad del punto u.

2. Como el movimiento de la carga es acelerado, la velocidad de ésta es necesariamente


inalcanzable para cualquier observador inercial. En efecto, si en el instante t el observador
inercial se situa en reposo con respecto a la carga, en el instante posterior t+dt la velocidad
que mide no es cero, y por lo tanto contradictorio con el hecho de que la descripción que
hace del movimiento es con velocidad de valor absoluto constante.

La física no relativista excluye la posibilidad de que una partícula elemental pudiera tener
un centro de carga y un centro de masa como puntos diferentes, si admitimos que la descripción
de su movimiento libre debe ser independiente del observador inercial.
La física relativista suministra una única solución. El centro de carga describe necesaria-
mente una hélice a la velocidad de la luz. 6
En este último caso, el centro de masa se mueve con una velocidad inferior a la del centro
de carga, por lo que existe una velocidad límite para el desplazamiento del centro de masa de
cualquier cuerpo masivo. Si la partícula no es libre, la condición de que es una partícula elemental
nos va a llevar, al admitir el principio atómico, que su estructura interna no es modicada por
una interacción, con lo que el centro de carga de un electrón en interacción se sigue moviendo
a la velocidad de la luz.

Dos centros, dos espines


Se suele denominar espín al momento angular de una partícula elemental. Pero un momento
angular es una propiedad mecánica que está denida siempre con respecto a un punto prejado.
Si una partícula elemental posee dos puntos característicos, podemos determinar el momento
angular de la misma con respecto de ambos. Sea un sistema material como un electrón que
viene caracterizado por la localización de su centro de masa (CM) q , su centro de carga (CC) r ,
y sea k un punto del electrón, distinto de los dos anteriores, en un cierto sistema de referencia
inercial con origen en el punto O (ver gura 1).
Llamemos S al momento angular de la partícula con respecto al centro de carga(CC) r .
Si es p el momento lineal de la partícula, su momento angular S CM con respecto al centro de
masa(CM) q es
S CM = (r − q) × p + S.
Llamemos v = dq/dt y u = dr/dt, a las velocidades del CM y del CC, respectivamente. Sea
S k el momento angular con respecto al punto k. El momento angular total de la partícula con
6
H. Fizeau, realiza en 1851 un experimento que mide con precisión la velocidad de la luz.
PREÁMBULO: Dos Centros 13

Figura 1: Diferentes momentos angulares S , S CM , S k y J del electrón denidos con respecto


a diferentes puntos en un sistema de referencia inercial, con origen en el punto O. El punto
r representa la localización del Centro de Carga, q la localización del Centro de Masa
y k otro punto del electrón distinto de los anteriores, en los que hemos dibujado sus
correspondientes momentos angulares. Se ha dibujado también, la fuerza electromagnética
externa F denida en el Centro de Carga. La línea de puntos pretende sugerir un cierto
tamaño arbitrario del electrón.

respecto al origen del sistema de referencia de cualquier observador inercial se puede escribir

J = r × p + S, o bien J = q × p + S CM , o bien J = k × p + S k .

Si la partícula es libre, p se conserva y también J . Como dJ /dt = 0, esto nos lleva a


dS dS CM
= p × u, = 0,
dt dt
ya que p tiene la dirección de la v , pero no la de u.
El espín con respecto al centro de masa S CM es una magnitud conservada para la partícula
libre, pero su espín con respecto al centro de carga no. Satisface una ecuación dinámica que
implica que su variación temporal es ortogonal al momento lineal constante. De alguna manera
está sugiriendo que S precesa u oscila alrededor de p. Además, para una partícula libre u no
puede ser un vector constante, ya que entonces el espín con respecto al centro de carga, crecería
continuamente.
Sea F la fuerza electromagnética externa aplicada en el centro de carga r . Ahora J no es
una magnitud conservada, ni tampoco p. Pero el momento de la fuerza con respecto al origen
nos produce un par, tal que
dp dJ
= F, = r × F,
dt dt
lo que nos lleva a
dS dS CM dS k dk
= p × u, = (r − q) × F , =p× + (r − k) × F .
dt dt dt dt
Podemos distinguir entre estos espines por su diferente comportamiento dinámico. La dinámica
del espín no solamente nos da información sobre cómo evoluciona dicho espín sino que también
nos indica respecto de qué punto está denido ese espín. Está claro que si r = q , el espín con
respecto al centro de masa se debe conservar siempre. Recíprocamente, si S CM no es conservado
14 PREÁMBULO: Dos Centros

eso implica que r ̸= q y por lo tanto la partícula elemental posee un CC y un CM que son
puntos distintos, como aquí estamos suponiendo.
En la literatura encontramos ya ejemplos de los dos primeros espines. El observable espín
de Bargmann, Michel y Telegdi 7 , satisface una ecuación dinámica que es la generalización
covariante sobre el espacio-tiempo, de la ecuación dinámica del S CM . Es lineal en los campos
externos y se conserva para la partícula libre. Este simple argumento de su no conservación y
el análisis anterior de la dinámica del espín es suciente para llegar a la conclusión de que los
dos centros son puntos necesariamente distintos. El espín con respecto al centro de carga S ,
satisface la misma ecuación dinámica que el operador espín de Dirac en el caso cuántico, tanto
en el caso libre como en interacción, como veremos a lo largo del curso.
En este curso vamos a postular una denición de partícula elemental que produce modelos
relativistas y no relativistas de partículas con espín una de cuyas características es que son
modelos en los que los centros de masa y de carga son puntos diferentes. Finalmente, solo aquel
modelo relativista cuyo centro de carga se mueve a la velocidad de la luz, va a satisfacer la
ecuación de Dirac al ser cuantizado.

Tres constantes universales en una sola

Las tres constantes universales ~, c y e forman parte de propiedades básicas del electrón.
La primera ~, está ligada con una propiedad mecánica, el valor único del espín s = ~/2, de
esta partícula. La segunda c, está ligada con la velocidad límite a la que se tiene que mover
su centro de carga si es que es un punto diferente de su centro de masa. Finalmente la tercera
e, es su característica de interacción. Es el valor de la carga eléctrica, que resulta ser un valor
único para las partículas que solamente interaccionan de forma electromagnética. Estas tres
constantes universales conguran una constante universal adimensional α, la denominada por
Arnold Sommerfeld constante de estructura na, denida en el sistema internacional de
unidades mediante
1 e2 1
α= ≈ ,
4πϵ0 ~c 137
y que toma ese valor numérico en cualquier sistema de unidades. Es una característica inde-
pendiente de la masa de las partículas cargadas con espín. Si demostramos que el valor de esta
constante es único para las partículas que solamente interaccionan de forma electromagnética,
entonces resulta que estas tres constantes universales no son independientes. Según Pauli8 una
teoría que no sea capaz de determinar esta constante, es una teoría incompleta.

Teoría de partículas elementales

Vamos a desarrollar en estas notas un formalismo general que describa partículas elementales
desde el punto de vista clásico y cuántico. La mecánica clásica es un formalismo que describe las
leyes de la dinámica de los sistemas materiales, leyes que, en general, se traducen en ecuaciones
diferenciales ordinarias para las variables que denen los diferentes grados de libertad del sistema
material. Desde un punto de vista reduccionista hoy en día sabemos que los diferentes sistemas
materiales están compuestos por sistemas materiales indivisibles, que denominamos partículas
elementales. Es por eso necesario que el propio formalismo contenga la posibilidad de distinguir
cuándo un sistema mecánico es elemental o no lo es. Esto lo vamos a reducir a postular un
principio fundamental, que lo denominamos principio atómico, el cual establecerá la forma
7
V. Bargmann,L. Michel y V.L. Telegdi, Precession of the polarization of particles moving in a homogeneous
electromagnetic eld, Phys. Rev. Lett. 2, 435 (1959).
8
W. Pauli, Nobel Lectures, vol 13, 1942-1962, Elsevier, Amsterdam (1964)
PREÁMBULO: Dos Centros 15

física, y su traducción matemática, de distinguir entre sistemas elementales y no elementales


o compuestos. Se nos jarán cuáles son los grados de libertad que distinguen a una partícula
elemental de otro sistema material que no lo es.
En este preámbulo hemos analizado qué implicaría si el centro de carga de una partícula
elemental fuera distinto de su centro de masa. Estamos sugiriendo que las partículas elementa-
les son sistemas dinámicos localizables, localización que viene determinada por el conocimiento
de tres grados de libertad, la posición de un punto, el centro de carga. Los argumentos dados
en los apartados anteriores indican que el centro de carga debe satisfacer un sistema de ecua-
ciones diferenciales ordinarias de cuarto orden. Este análisis sugiere que conocida la evolución
del centro de carga se determinaría la evolución del centro de masa. ¾Son sucientes estos tres
grados de libertad para describir una partícula elemental? Claramente no. Los diferentes siste-
mas materiales, elementales o no, están localizados en ciertas regiones espaciales, pero además
poseen propiedades y grados de libertad de orientación, como momentos magnéticos, momentos
angulares, etc., es decir los sistemas materiales conocidos se mueven y rotan. Poseen grados de
libertad que describen, al menos, su localización y su orientación en el espacio tridimensional.
Las partículas elementales también poseen las propiedades orientables anteriores y por lo tanto
se mueven y rotan, por lo que además de ser objetos materiales localizables son también orienta-
bles. Tendremos que utilizar variables clásicas para describir su orientación, como por ejemplo,
asociar al punto donde la carga de la partícula está localizada, un sistema cartesiano de tres
vectores unidad ortogonales, cuya orientación va cambiando a medida que la partícula evolu-
ciona. Esto implica que, al menos, una partícula elemental tendrá seis grados de libertad, cuya
dinámica hay que determinar. Surge una pregunta: ¾Pueden existir más grados de libertad que
la posición de un punto y la orientación de un sistema cartesiano comóvil? Esto va a depender
de otro de los principios fundamentales que postularemos en el siguiente capítulo, pero en este
preámbulo lo que queremos remarcar es que, al menos, una partícula elemental parece ser un
sistema mecánico localizable y orientable.

Predicciones del formalismo

El formalismo que vamos a desarrollar en este curso no es completo. No hemos sido capaces
de obtener el valor de la constante de estructura na α. Sin embargo produce un conjunto de
predicciones que son consistentes con los planteamientos del modelo estándar y la formulación
relativista y otras que habría que vericar de forma experimental. Muchas de estas predicciones
no aparecen en la descripción habitual de las partículas elementales consideradas como partículas
puntuales. Están desarrolladas a lo largo de las notas en las secciones y capítulos que se indican
y que aquí, simplemente, las pasamos a enumerar:

1. Para una partícula elemental masiva, con dos centros CC y CM distintos, la velocidad
del CC es inalcanzable para todo observador inercial. Como la velocidad de su centro de
masa no puede superar la velocidad del centro de carga, existe para todo cuerpo masivo
un límite superior de la velocidad de desplazamiento de su centro de masa. (Preámbulo)

2. Si una partícula elemental fuera una partícula puntual, no existiría límite a la velocidad
de su centro de masa, y podría alcanzar cualquier velocidad. Este criterio por sí solo,
contradictorio con la experiencia, descarta la posibilidad de que una partícula elemental
se pueda describir como el modelo de partícula puntual. (Preámbulo)

3. El centro de carga y el centro de masa de una partícula elemental masiva que satisface
la ecuación de Dirac, son dos puntos distintos, separados por una distancia R0 = ~/2mc,
para el observador del centro de masa. (Sec. 2.5.2)
16 PREÁMBULO: Dos Centros

4. La separación entre estos dos puntos no es constante para un observador arbitrario, y


depende de la velocidad con que se mueve el centro de masa con respecto al observador y
su orientación con respecto al espín. (Sec. 2.6.2)

5. Si la partícula se mueve en línea recta a la velocidad de la luz, es una partícula sin masa,
y si representa un cuanto de energía electromagnética, entonces necesariamente su espín,
que tiene necesariamente la dirección del movimiento hacia adelante o hacia atrás, solo
puede tomar los valores Sz = ±~, por lo que se trata de un bosón. (Sec. 3.3)

6. La dirección del espín del fotón coincide con la velocidad angular de éste, aunque no están
relacionados. El espín del fotón es invariante, es el mismo para todos los observadores
inerciales, mientras que la velocidad angular transforma entre observadores de acuerdo
con las prescripciones del efecto Doppler. (Sec: 2.5.1)

7. Los fotones son partículas sin masa que van rotando con una velocidad angular en la
dirección del movimiento, hacia adelante o hacia atrás, y cuya frecuencia es la misma que
la de la radiación electromagnética de la que son sus cuantos de energía. (Sec: 2.5.1)

8. La formulación relativista impide que exista una partícula puntual masiva sin espín mo-
viéndose a la velocidad de la luz. Su Lagrangiana sería idénticamente nula. Necesariamente
tiene que tener más de tres grados de libertad y tiene espín. Los fotones tienen orientación
y rotan alrededor de un eje que tiene la dirección de la velocidad. El espín del fotón tiene
la dirección de la velocidad angular pero no está relacionado con ella. (Sec. 3.3)

9. Para una partícula elemental masiva, el centro de carga se mueve alrededor del centro
de masa a la velocidad de la luz, en un movimiento circular de frecuencia ν0 = 2mc2 /h,
o período T0 = 1/ν0 = h/2mc2 , para el observador del centro de masa. Existe un reloj
natural asociado a este movimiento interno del electrón. (Sec. 2.5.2)

10. Desde el punto de vista clásico, el punto donde se localizan las propiedades interactivas de
una partícula elemental, se mueve con una velocidad inalcanzable para todo observador
inercial. La constante universal c representa tanto la velocidad del punto donde está loca-
lizado un fotón como la velocidad del centro de carga de una partícula masiva con espín.
Al cuantizar estos sistemas resulta que tanto la materia fermiónica como los bosones con
espín no nulo que median en su interacción se mueven a la velocidad de la luz. (Sec. 2.5)

11. Para un observador que ve moverse el centro de masa del electrón con velocidad v , el
reloj del electrón va más despacio, con un período mayor T = γ(v)T0 , donde γ(v) =
(1 − v 2 /c2 )−1/2 . (Sec. 6.2.1)

12. Para el observador del centro de masa, una partícula elemental posee además de carga,
un momento magnético, con respecto al centro de masa, perpendicular al plano de la
trayectoria del centro de carga y un momento dipolar eléctrico perpendicular al anterior
y contenido en ese plano. (Sec. 2.5.6)

13. El momento magnético de la materia elemental es producido por este movimiento relativo
del centro de carga, que no es modicado por las interacciones. (Sec. 2.5.6)

14. El electrón, además de un momento magnético creado por el movimiento del centro de
carga, posee un momento dipolar eléctrico con respecto al centro de masa, ya predicho
por la ecuación de Dirac, aunque considerado como no relevante por él, y que rota con la
frecuencia interna del electrón. (Sec. 2.5.6)
PREÁMBULO: Dos Centros 17

15. La relación giromagnética cuántica g = 2, está ligada con que el espín, desde el punto
de vista clásico y cuántico tiene dos partes S = W + Z , una ligada con la rotación de
la partícula W , que no produce momento magnético, y otra Z ligada con el movimiento
relativo entre el centro de masa y el centro de carga (Zitterbewegung). (Sec. 6.1)

16. Si admitimos que la materia elemental son partículas de Dirac, entonces desde el punto de
vista cuántico su espín es necesariamente S = ~/2, independiente de la masa o de la carga
de las mismas. Es decir, los leptones y quarks son fermiones masivos de espín S = ~/2.
(Cap. 4)

17. El formalismo desarrollado es independiente del grupo cinemático de simetrías espacio-


temporales que dene la relación entre observadores inerciales, asociado al Principio de
Relatividad Restringido. Produce por lo tanto modelos de partículas con espín relativistas
y no relativistas. (Sec. 1.5)

18. En el espacio tridimensional, si el centro de carga de una partícula elemental se mueve a


la velocidad de la luz, entonces el grupo cinemático de simetrías espacio-temporales debe
ser, como máximo, un grupo de dimensión 11. Esta extensión del grupo de Poincaré puede
ser el grupo de Weyl, que incluye además de rotaciones, traslaciones y transformaciones
cinemáticas a velocidad constante, cambios de escala espacio-temporales que conservan la
velocidad c. (Sec. 6.10)

19. Si admitimos que el grupo de simetrías espacio-temporales es el grupo de Weyl, entonces


toda partícula elemental tiene masa no nula y espín ~/2. En el modelo estándar de las
partículas elementales, los leptones y quarks se postulan como objetos masivos de espín
~/2 y cargas diferentes. (Sec. 4.4)

20. Si la partícula no interacciona de forma fuerte (leptones), su carga eléctrica es única e


independiente de su masa. Su valor sería la carga del electrón e, pero este valor no se
predice, de momento. Los tres leptones electrón, muón y tau tienen distintas masas pero
la misma carga eléctrica y el mismo espín. (Sec. 5.1.5)

21. Si la partícula interacciona de forma electromagnética y además de forma fuerte (quarks),


entonces su carga eléctrica es necesariamente menor que el valor e. El formalismo no
predice que sea una fracción e/3 o 2e/3 como postula el modelo estándar. (Sec. 5.1.5)

22. La orientación relativa entre el espín y el momento magnético, de las partículas eléctri-
camente cargadas, es la misma para la partícula que para su antipartícula. Depende del
signo de la carga de la partícula. Si consideramos que el electrón, de carga negativa, es
la partícula, entonces electrones y positrones tienen su espín y momento magnético en
la misma dirección. Esta orientación relativa no se ha medido experimentalmente. (Sec.
4.2.6)
23. Una medida de la orientación relativa entre el espín y el momento magnético de un electrón
ligado a un átomo se podría realizar produciendo la transición hiperna de átomos de
Rb87 en un campo magnético externo, con un haz de luz polarizada circular. No tenemos
constancia de que este experimento se haya realizado. (Sec. 4.2.6)

24. El efecto túnel no es un efecto puramente cuántico. Se puede producir en el caso cl ásico
y está ligado con la separación entre el centro de carga y el centro de masa. (Sec. 6.5)

25. Controlando la orientación del espín de un electrón podemos modicar la probabilidad


de cruce de una barrera de potencial. Si el espín está orientado perpendicularmente a la
dirección de la corriente, la probabilidad aumenta mientras que si está orientado en la
18 PREÁMBULO: Dos Centros

dirección de la corriente, disminuye. Es lo que se denomina efecto túnel de polarización


del espín. (Sec. 6.5.1)

26. Dos electrones, desde el punto de vista clásico, pueden formar un estado ligado metaestable
de carga 2e y de espín 1, es decir un bosón desde el punto de vista cuántico, si se cumplen
ciertas condiciones de que sus espines sean paralelos, la velocidad relativa de sus centros
de masa sea inferior 0.01c y las fases de sus movimientos relativos internos sean opuestas.
Este estado ligado es estable frente a campos eléctricos externos pero no frente a campos
magnéticos transversales al espín. (Sec. 6.6)

27. En un conductor, en presencia de un campo magnético externo, si el número de electro-


nes de conducción es suciente, y la temperatura no es muy elevada, pueden producirse
apareamientos de electrones, formándose un gas de bosones, por lo que los electrones apa-
reados pueden estar en fase superconductora. Esto es posible desde un punto de vista
clásico hasta una temperatura alta. Falta determinar hasta qué temperatura es posible
desde un punto de vista cuántico. (Sec. 6.6)

28. Para campos magnéticos superiores a 1 T, el análisis del efecto Hall cuántico entero
sugiere que la conducción longitudinal se realiza mediante electrones apareados en fase
superconductora. Un experimento consistente en extraer portadores de carga tanto de la
corriente principal como de la zona negativamente cargada del potencial de Hall, podría
mostrar que efectivamente la conducción se realiza mediante portadores de carga de valor
2e y espín 1. No tenemos constancia de que este experimento se haya realizado. (Sec.6.7)

29. El campo electromagnético clásico generado por un electrón en reposo no es estático. El


valor promedio temporal del campo eléctrico retardado, a una vuelta del centro de carga,
es Coulombiano en cualquier dirección a partir del centro de masa y se anula en el centro
de masa. El valor promedio temporal del campo magnético retardado, a una vuelta del
centro de carga, es el de un momento dipolar magnético constante situado en el centro
de masa. Si realizamos el mismo promedio temporal de los campos avanzados, estos no
producen el anterior comportamiento Coulombiano y dipolar magnético. (Cap. 5)

30. En el estado fundamental del átomo de Hidrógeno, el electrón está en un estado S, de


momento angular orbital L = 0. Esto implica, desde el punto de vista clásico que el centro
de masa del electrón se está moviendo en la dirección del centro de masa del protón. Esto
es imposible para partículas puntuales. Sin embargo esto se puede justicar clásicamente al
estar el centro de masa y el centro de carga separados, con lo que en el estado fundamental
el centro de masa del electrón describirá una trayectoria rectilínea que pasa por el centro
de masa del protón.

31. El análisis habitual del efecto Compton como interacción de dos partículas puntuales, un
fotón y un electrón, solamente considera la conservación del momento lineal y la energía.
Sin embargo también se conserva el momento angular. El análisis de esta nueva conser-
vación nos lleva a que si somos capaces de controlar la orientación del espín del electrón
dispersor, se determina de forma unívoca la energía y la dirección del fotón dispersado.
(Sec. 6.4)

32. Desde el punto de vista teórico clásico, la Lagrangiana que describe a una partícula
elemental en interacción con agentes externos, se escribe como L e = L e0 + Le I , donde
e
L0 es la Lagrangiana de la partícula libre, que describe sus propiedades mecánicas, y
e I = −eϕ(t, r)ṫ + eA(t, r)ṙ , es la Lagrangiana de la interacción, que predice solamente
L
una interacción electromagnética. (Sec. 2.5.2)
PREÁMBULO: Dos Centros 19

33. El análisis de la interacción de dos partículas de Dirac nos lleva a que la Lagrangiana de
la interacción puede ser invariante bajo un grupo más amplio que el grupo de Poincaré,
que contiene además cambios de escala y rotaciones locales. Todo el análisis se puede
realizar en términos de variables adimensionales. La constante de acoplamiento es 2α,
siendo α la constante de estructura na. La L e I va como 1/r, siendo r la separación entre
los centros de carga de ambas partículas. Así, la parte libre L e 0 puede describir partículas
e
libres de masas arbitrarias, pero la interacción entre ellas LI es independiente de las masas
de las partículas. Tiene la particularidad de que necesariamente, para que la interacción
no sea nula, las velocidades u1 y u2 de los centros de carga de ambas partículas deben
ser diferentes. Dos electrones, que en un instante tuvieran u1 = u2 , no interaccionarían,
independientemente de la distancia que los separara. (Sec. 4.5)

34. Si llamamos variables cinemáticas x de cualquier sistema mecánico a las variables de


contorno en su formulación variacional, entonces la Lagrangiana de cualquier sistema
e ẋ) es siempre una función homogénea de grado 1 de las derivadas ẋ de las
mecánico L(x,
variables cinemáticas, en una descripción paramétrica de la evolución. (Sec. 1.3.4)

35. Si excluimos el tiempo de las variables cinemáticas, x ≡ (t, qi ), las restantes variables qi
son las variables generalizadas de la formulación variacional y del formalismo canónico. Si
alguna de estas variables representa la derivada temporal de otra de ellas, necesariamente
la Lagrangiana depende de derivadas de orden superior, ya que la Lagrangiana es siempre
una función de las variables cinemáticas y de su siguiente derivada temporal. (Secs. 1.4,
1.3.2)
36. El espacio cinemático X es siempre un espacio métrico Finsleriano. Es un espacio métrico
en el que los coecientes de la métrica no son solamente funciones del punto x, sino
también de su derivada ẋ, gij (x, ẋ). Resulta entonces que la formulación variacional es
equivalente a un problema geodésico sobre X , cuya métrica viene condicionada por el
tipo de interacción a que se somete al sistema. Para una partícula elemental, cualquier
interacción modica la métrica de su espacio cinemático. (Sec. 1.6)
e ẋ),
37. La métrica del espacio cinemático se construye por derivación de la Lagrangiana L(x,
en la forma (Sec. 1.6)
1 ∂2L e2
gij (x, ẋ) = = gji (x, ẋ).
2 ∂ ẋi ∂ x˙j

38. La partícula puntual es un posible modelo de partícula elemental en este formalismo, pero
corresponde a una partícula sin espín. El uso de este modelo debe ser descartado para
el análisis del comportamiento de la materia elemental real, ya que no parecen existir
partículas elementales sin espín. Todas las propiedades físicas asociadas a la participación
del espín en la interacción, quedarían sin ser decritas. (Sec. 2.1)

39. El espacio cinemático de la partícula puntual es el espacio de Minkowski con una métrica
constante gµν = ηµν = diag(1, −1, −1, −1). Al ser constante, es también una métrica
Riemanniana, pero esta consideración es restrictiva. La gravedad, considerada como otra
interacción y en el espíritu de unicación de todas las interacciones, aplicada a la partícula
puntual, deberá modicar la métrica Minkowskiana del espacio-tiempo y dar lugar, en
general, a una métrica Finsleriana gµν (x, ẋ), y no solamente Riemanniana gµν (x), como
postula la Relatividad General. (Sec. 1.6)

40. La gravedad, como cualquier otra interacción, aplicada a la partícula elemental con espín,
modicaría la métrica de su espacio cinemático y produciría, en general, una métrica
Finsleriana de esta variedad y no solo de la subvariedad espacio-temporal. Pasaríamos de
20 PREÁMBULO: Dos Centros

una geometrización del espacio-tiempo, como espacio cinemático de la partícula puntual,


a la geometrización del espacio cinemático más general del grupo cinemático asociado al
Principio de Relatividad Restringido. Hay que revisar los fundamentos de la Relatividad
General a la luz de estos argumentos. (Sec. 1.6)

41. Una consecuencia de admitir una descripción variacional de la dinámica, como formulación
geodésica en el espacio cinemático, es que la propia formulación contiene en su seno al
Principio de Causalidad. Cuando la distancia métrica al cuadrado recorrida entre los
estados inicial y nal es denida positiva, es posible la evolución entre estos estados,
mientras que es imposible cuando la distancia al cuadrado entre ellos no sea denida
positiva, usando la métrica Finsleriana del espacio cinemático. (Sec. 1.7)

42. Una consecuencia, que no una predicción de este formalismo, es que no es equivalente
a la formulación canónica. Es decir, las ecuaciones de Euler-Lagrange son equivalentes
a las ecuaciones de Hamilton si es que el problema variacional de buscar soluciones lo
redujéramos a soluciones con condiciones de contorno en el instante inicial t1 . Sin embargo,
este formalismo está planteado con la condición de que las soluciones de los sistemas
dinámicos deben poder expresarse en términos de las condiciones de contorno en los puntos
extremos de la evolución. Y aquí el formalismo canónico con condiciones de contorno en el
instante inicial t1 ya no es equivalente a las ecuaciones de Euler-Lagrange con condiciones
de contorno en los instantes t1 y t2 . De hecho, la formulación canónica no es necesaria ni
para cuantizar este formalismo ni para la descripción de las partículas con espín que en él
van a aparecer. (Sec. 1.8)

43. Si el centro de carga de una partícula con espín se mueve en círculos, de acuerdo con
la teoría de la radiación de partículas puntuales, la partícula libre con espín debería
estar radiando continuamente. Esto es incompatible con el principio de conservación de
la energía. Hay que desarrollar una teoría de la radiación de partículas con espín, que
contemple la posibilidad de radiación cuando el centro de masa esté acelerado, es decir
cuando la partícula esté sometida a una fuerza externa. En este caso, parte de la energía
recibida por la partícula sería transformada en radiación. Esta teoría de la radiación está
sin hacer. (Cap. 5)

44. El requerimiento de que la energía de cualquier sistema material debe ser un observable
denido positivo, podría estar ligado con la diferencia entre la interpretación pasiva o
activa de las traslaciones temporales. Traslaciones temporales pasivas se corresponden
con un cambio hacia adelante o hacia atrás en el punto cero del reloj que mide el tiempo.
Desde el punto de vista activo solamente podemos realizar traslaciones temporales hacia
el futuro. La magnitud conservada asociada a la invariancia de las leyes de la física bajo
traslaciones temporales solamente puede tener un signo. El concepto de energía negativa
no tendría sentido físico. (Sec: 6.10.3)

45. El anterior comentario implicaría que el Principio de Relatividad Restringido no estaría


asociado a un grupo completo de simetrías sino que por lo que respecta a las traslaciones
temporales activas estaría restringido al semigrupo de traslaciones hacia el futuro. (Sec:
6.10.3)
46. Se suele postular la Ley de Inercia de la siguiente manera: En un sistema de referencia
inercial un cuerpo libre o bien está en reposo o se mueve con velocidad constante. Esta
formulación hace referencia al movimiento del centro de masa de un cuerpo libre. Sin
embargo, la materia elemental se desplaza y rota y si es libre, se mueve con momento
lineal constante (velocidad constante del CM) y con momento angular constante. Hay que
reformular la Ley de Inercia para incluir el movimiento libre de rotación.
PREÁMBULO: Dos Centros 21

Apéndice: Partículas elementales (Modelo Estándar)


Listamos a continuación las partículas elementales empezando por los bosones intermedios,
de espín 1 (gluón g , fotón γ y los bosones masivos W ± y Z ), los 6 leptones (electrón e, muón µ
y tau τ y los correspondientes neutrinos) y los 6 quarks de espín 1/2. Se incluyen como números
cuánticos, además de la masa y de la carga, el isospín, el espín, la paridad, el número leptónico
L, bariónico B , la extrañeza S y el color. No se incluye información del hipotético gravitón que
sería una partícula sin masa y de espín 2. Se ha añadido la información sobre el recién medido
bosón de Higgs. El número leptónico es característico de cada uno de los tres leptones, es decir
existen tres números leptónicos, Le , Lµ y Lτ . Existen las antipartículas de todas ellas, de la
misma masa y espín, pero con el resto de sus números cuánticos de signo contrario.

masa·c2 carga Isospín Espín Par. L B S Color Vida


g 0 0 0 1 − 0 0
γ < 1 × 10−18 eV 0 0, 1 1 − 0 0
W 80.379 GeV ±e 1 0 0
Z 91.187 GeV 0 1 0 0
e 0.511 MeV −e 1/2 1 0 0 estable
µ 105.658 MeV −e 1/2 1 0 0 10−6 s
τ 1.7768 GeV −e 1/2 1 0 0 10−15 s
νe <2.2 eV 0 1/2 1 0 0
νµ <1.7 MeV 0 1/2 1 0 0
ντ <15.5 MeV 0 1/2 1 0 0
u (up) 1.5 ∼ 3.3 MeV 2e/3 1/2 1/2 + 0 1/3 0 1
d (down) 3.5 ∼ 6.0 MeV −e/3 1/2 1/2 + 0 1/3 0 1
c (charm) 1.27 GeV 2e/3 0 1/2 + 0 1/3 0 1
s (strange) 95 MeV −e/3 0 1/2 + 0 1/3 -1 1
t (top) 172.44 GeV 2e/3 0 1/2 + 0 1/3 0 1
b (bottom) 4.18 GeV −e/3 0 1/2 + 0 1/3 0 1
Higgs 125.3 GeV 0 0 0 0 0 0

Intensidad de las Interacciones


Los quarks tienen carga de color con tres posibles valores, carga eléctrica y masa y pueden
interaccionar de las cuatro formas: fuerte, electromagnética, débil y gravitatoria. Los leptones
no tienen color y no interaccionan de forma fuerte, es decir, no intercambian gluones. Pueden
interaccionar de las otras tres maneras, salvo los neutrinos que no interaccionan de forma elec-
tromagnética. El intercambio de gluones entre los quark conlleva el cambio de su carga de color.
Las materia ordinaria, formada por agregados de quarks y leptones, no tiene color por lo que los
quark y antiquark solo pueden formar estados ligados de color neutro. Es lo que se denomina
connamiento.
Si la intensidad de la interacción fuerte entre los quarks es 1 y de alcance del orden de 10−15 m,
la intensidad de la interacción electromagnética, que intercambia fotones γ , es del orden de la
constante de estructura na α = 1/137 y de alcance innito. La fuerza débil es también de muy
corto alcance, alrededor de 10−18 m debido al intercambio de partículas masivas W y Z (m>80
GeV) y de intensidad 10−6 mientras que la gravitatoria, de alcance innito es de una intensidad
de 6 × 10−39 . Esta intensidad depende de la energía de las partículas que interaccionan. Lo que
parece ocurrir es que cuanto mayor es la energía, las tres interacciones (excluida la gravitatoria)
tienden a tener la misma intensidad y el comportamiento es como si las partículas fueran libres.
Es lo que se denomina libertad asintótica. A altísima energía los quarks se comportan como
partículas libres. Salvo la interacción débil, las otras fuerzas pueden producir estados ligados.
22 PREÁMBULO: Dos Centros

Valores de distintos observables para el electrón


para diferentes velocidades

v/c v 2 /c2 γ(v) p (MeV/c) E (MeV) T (K)


0 0 1 0 0.511003 0
0.0001 10−8 1. 0.0000511003 0.511003 8.475
0.001 10−6 1. 0.000511004 0.511004 847.54
0.01 10−4 1.00005 0.00511029 0.511029 8.47·104
0.1 0.01 1.00504 0.0513578 0.513578 8.47·106
0.5 0.25 1.1547 0.295028 0.590056 2.11·108
0.86603 0.750 2.00003 0.885103 1.02202 ···
0.9 0.81 2.29416 1.05509 1.17232 ···
0.99 0.9801 7.08881 3.58618 3.62241 ···
0.999 0.99800 22.3663 11.4178 11.4292 ···
0.9999 0.99980 70.7124 36.1307 36.1343 ···
0.99995 0.99990 100.001 80.874 80.875 ···
0.99999 0.99998 223.607 114.263 114.264 ···
0.999999 0.999998 707.107 361.334 361.334 ···
0.9999999 0.9999998 2236.07 1142.64 1142.64 ···

Los observables que analizamos en la tabla son


( )−1/2
v2
γ(v) = 1 − 2 , p = γ(v)mv, E = γ(v)mc2 .
c

1 v2 3 v4 5 v6
γ(v) ≈ 1 + + + + ···
2 c2 8 c4 16 c6
El factor γ alcanza el valor 2 para v/c =0.86603. Obsérvese que hay que llegar a una velocidad
v/c = 0,999 999 999 999 87 (doce nueves) con un factor γ = 2 · 106 , para que la energía del
electrón alcance 1.00213 TeV. Los aceleradores actuales (Tevatrón (FermiLab), LHC (Cern))
alcanzan energías del orden de 4 a 8 TeV. Un electrón con una energía de 1 TeV, su centro de
carga da una vuelta alrededor del centro de masa en un tiempo T ≈ 8 × 10−15 s, mientras éste
recorre una distancia de λ ≈ 2400 nm. Un fotón rojo de 680 nm de longitud de onda posee una
energía de 1.82 eV y da una vuelta mientras recorre esa distancia.
La última columna corresponde a la temperatura en grados Kelvin de un gas de electrones
no relativista cuya velocidad media sea la indicada, y supuesto un sistema de siete grados de
libertad. Los puntos suspensivos de algunos apartados implican que para esas velocidades no es
aplicable el razonamiento de la mecánica estadística no relativista.
7 1
κT = mv 2 , κ = 1.38 · 10−23 J/K (Constante de Boltzmann).
2 2
La primera línea roja en negrita, correspondiente a v/c =0.01, representa la velocidad máxima
a la que los centros de masa de dos electrones con sus espines paralelos puedan formar un estado
ligado, como se analizará en la sección 6.6.
La segunda línea roja en negrita corresponde al experimento, no de muy alta energía, de 80
MeV, que analizaremos en la sección 6.2 al analizar la medida del reloj del electrón.
Capítulo 1

Formalismo Lagrangiano

1.1. Formulación de Newton


El primer planteamiento de una teoría de partículas elementales se lo debemos a Newton.
Por denición, el sistema material más simple es el punto. Para Newton (1687), la materia
está formada por agregados de puntos de masa m, de valor arbitrario pero jo. Cada partícula
elemental puntual se mueve con una ley dinámica tal que

d2 r
m =F
dt2
siendo r la localización del punto y F la fuerza total externa que actúa sobre él.
Admitiendo que las fuerzas entre partículas satisfacen la tercera ley de Newton, entonces
llegamos a que cualquier agregado material posee un punto característico, el centro de masa q ,
denido mediante ∑
mi r i ∑
q= ∑ , m= mi
mi
y que satisface
∑ d2 q
F ext = m ,
dt2
que se conoce como teorema del centro de masa: El centro de masa de cualquier agregado
material se comporta como una partícula puntual de masa la suma de todas las masas del
sistema, sometido únicamente a la suma de todas la fuerzas externas.
Newton postula que toda la materia se atrae con la ley de la gravitación universal, que
satisface la tercera ley de Newton. Según esto, si intentamos separar un folio en dos partes, la
fuerza que deberemos hacer sería, supuestas las dos partes separadas 10 cm y de 1 g de masa
cada una,
m2
F = G 2 = 6,672 × 10−11 × 0,0012 /0,12 = 6,672 × 10−15 N,
d
muy inferior a la que tenemos que hacer. Es claro que las fuerzas de cohesión de la materia
no son de naturaleza gravitatoria, por lo que entre las partículas elementales deben existir otro
tipo de fuerzas. La teoría Newtoniana deja total libertad al tipo de fuerzas que puedan existir.
Si la partícula puntual posee una propiedad llamada carga, ésta está localizada en el mismo
punto r . Tenemos por lo tanto que toda la materia está construida a partir de puntos materiales
de masas arbitrarias, y por supuesto, cargas arbitrarias, que además de interaccionar de forma
gravitatoria, se atraen, y a veces se repelen, con otro tipo de fuerza más intensa.
Si pudiéramos viajar a tiempos Newtonianos, ir a Cambridge, pedirle audiencia y decirle:
Sir, en el futuro del que venimos se sabe que la materia a nivel elemental, además de masa
posee otra propiedad inmodicable que es su espín. Es posible que Sir Isaac, lo pensara un rato

23
24 CAPÍTULO 1. FORMALISMO LAGRANGIANO

y modicara su segunda ley, para tener en cuenta también la variación del momento angular en
términos de los pares externos. Lo importante es que en el momento en que entra en escena la
mecánica cuántica en la década de 1920, se cuantizaría un formalismo diferente.
El formalismo Newtoniano es poco restrictivo y para las fuerzas F entre partículas no
establece ninguna condición, por lo que todo tipo de interacciones son permitidas. Es la teoría
gauge la que limitará el tipo de interacciones en la formulación cuántica y el principio atómico en
el caso clásico. Tampoco establece ningún criterio mediante el cual las cargas, masas y momentos
angulares de las partículas elementales tengan los valores que tienen. Es la teoría cuántica la
que predecirá estos valores. Sin embargo, hasta el momento, la teoría cuántica solo ha predicho
los valores del espín de las partículas elementales dejando total libertad para los valores de las
masas y cargas.
De todas formas, Newton ya era consciente de la posibilidad de fuerzas internas de corto y
largo alcance, como lo pone de maniesto en su disertación en el libro III de Opticks: 1
Now the smallest particles of matter may cohere by strongest attractions, and compose bigger
particles of weaker virtue; and many of these may cohere and compose bigger particles whose
virtue is still weaker, and so on for diverse successions, until the progression ends in the biggest
particles on which the operations in chemistry, and the colors of natural bodies depend, and
which by cohering compose bodies of a sensible magnitude.
For we must learn from the phenomena of nature what bodies attract one another, and what are
the laws and properties of the attraction, before we inquire the cause by which the attraction is
perform'd. The attractions of gravity, magnetism, and electricity, reach to very sensible distan-
ces, and so have been observed by vulgar eyes, and there may be others which reach to so small
distances as to escape observation.

1.2. Principios Fundamentales

Como de acuerdo con el modelo estándar todas las partículas elementales conocidas, quarks
y leptones, juntamente con los bosones que median en sus interacciones son partículas con espín,
y además no parecen existir partículas elementales sin espín, es razonable intentar obtener un
formalismo para la descripción clásica del espín. El interés de una descripción clásica del espín
es que puede suministrar modelos razonables cuyo comportamiento se aproxime a los resultados
experimentales, mucho mejor que utilizando el modelo de partícula puntual sin espín. De todas
formas no hay que olvidar que la materia a nivel elemental se comporta con más precisión de
acuerdo con las leyes de la mecánica cuántica. Pero una descripción clásica menos simple, nos
va a permitir desarrollar un formalismo cuántico más detallado, en términos de más variables
que den cuenta de su estructura, y por lo tanto, se intuye, que la cuantización de modelos con
espín será algo más detallada y completa que la cuantización de partículas sin espín.
Feynman, en el primer capítulo de sus Lectures on Physics 2 , plantea que If, in some ca-
taclysm, all of scientic knowledge were to be destroyed, and only one sentence passed on to
the next generations of creatures, what statement would contain the most information in the
fewest words? I believe it is the atomic hypothesis (or the atomic fact or whatever you wish to
call it) that all things are made of atoms-little particles that move around in perpetual motion,
attracting each other when they are a little distance apart, but repelling upon being squeezed into
one another.
Si la hipótesis atómica parece ser un principio fundamental, la física tiene que explotar este
hecho y convenientemente denido debe formar parte de los principios fundamentales de una
1
I. Newton, Opticks, A treatise of the Reections, Refractions, Inections and Colours of Light, Dover, NY
1952, p.394.
2
Feynman RP, Leighton RB and Sands M 1968 The Feynman Lectures on Physics, (NY: Addison Wesley)
Vol 1, Sec 1-2.
1.2. PRINCIPIOS FUNDAMENTALES 25

física de partículas, que es lo que haremos en seguida. Los libros de física, al tratar la idea del
atomismo, se contentan con mencionar a Leucipo y a Demócrito de Abdera, como los defensores
de la idea de que la materia es al nal, un conjunto discreto de unidades indivisibles (los átomos).
Demócrito añade, además, que estos objetos últimos son inmutables. Es difícil saber qué es lo
que Demócrito quería decir con inmutabilidad hace 2500 años. Pero esta idea lo que contiene
es que un sistema compuesto es modicable y una partícula elemental no. A una molécula la
podremos excitar, rotar con una cierta velocidad angular, deformar, modicar su masa, pero a
un electrón ni le podemos modicar su masa ni le podemos hacer rotar con cualquier velocidad.
A lo sumo lo que podemos es cambiar la orientación de su velocidad angular. La masa y el valor
absoluto del espín de un electrón son propiedades inmutables. El principio atómico nos va a llevar
a que el número y tipo de variables clásicas que caracterizan los estados de cualquier sistema
material, no están restringidos, pero sí lo están para una partícula elemental. Es un principio
tan restrictivo que nos va a conducir, entre otras cosas al llamado acoplamiento mínimo cuando
analicemos la interacción de sistemas compuestos por partículas elementales y por lo tanto a
restringir el tipo de interacciones permitidas.
El formalismo cinemático que vamos a desarrollar, aunque en sus orígenes se planteó para
dar cuenta de la descripción clásica del espín, ha demostrado ser un método potente para la
descripción de partículas elementales también desde el punto de vista cuántico, ya que sumi-
nistra una denición muy precisa de partícula elemental que tiene como contrapartida cuando
se cuantiza el formalismo, la denición de Wigner: Todos los sistemas elementales que se van a
describir poseen la característica de que al cuantizarlos, su espacio de Hilbert de estados puros
genera una representación proyectiva, unitaria e irreducible del grupo cinemático correspon-
diente. Es precisamente a través del formalismo de cuantización de Feynman que la descripción
clásica y cuántica se complementan entre sí.
El formalismo que vamos a desarrollar se basa en los siguientes cuatro principios fundamen-
tales:

Principio de Relatividad Restringido,

Principio Variacional,

Principio Atómico,

Principio de Cuantización.

1.2.1. Principio de Relatividad Restringido

El Principio de Relatividad Restringido establece que, en ausencia de gravitación,


debe existir una clase de observadores equivalentes, que históricamente reciben el nombre de
observadores inerciales, para los cuales las leyes de la física deben ser las mismas. Usando el
mismo tipo de variables, las ecuaciones fundamentales se deben escribir de la misma forma en los
diferentes sistemas de referencia equivalentes. Esta clase de observadores queda denida sabiendo
cómo relacionan entre sí las medidas de acontecimientos espacio-temporales. Esta forma de
transformar las variables temporal t y espacial r de un mismo acontecimiento viene dada por
un grupo de transformaciones, que recibe el nombre de grupo cinemático del formalismo.
Aquí trataremos principlamente con los grupos de Galileo y Poincaré pero en el capítulo 4
analizaremos una extensión del grupo de Poincaré, como el grupo cinemático más amplio de una
partícula de Dirac. Además de las transformaciones del grupo de Poincaré, este grupo contiene
dilataciones espacio-temporales y rotaciones locales.
Como ejemplo de este principio, el denominado formalismo no relativista admite que si
el observador O mide un acontecimiento espacio-temporal dado por las medidas t y r y el
26 CAPÍTULO 1. FORMALISMO LAGRANGIANO

observador O′ mide t′ y r ′ del mismo acontecimiento, estos valores están relacionados por

t′ = t + b, r ′ = R(α)r + vt + a,

donde los diez números reales (b, a, v, α) son jos para esos dos observadores, y donde por α
queremos representar los tres parámetros que denen la orientación relativa entre los sistemas
cartesianos de ambos observadores. Estas relaciones se dicen que son el grupo de Galileo de
transformaciones del espacio-tiempo, que es por lo tanto, el grupo cinemático de un formalis-
mo no relativista. Si en vez de estas transformaciones utilizamos las del grupo de Poincaré,
analizadas en el apéndice al nal del segundo capítulo, estaremos en un formalismo relativista.
Este principio no es solamente una declaración de universalidad restringida de las leyes
de la física, es también el establecimiento de que las medidas relativas de cualquier magnitud
física entre diferentes observadores inerciales, dependen de cómo se relacionan las medidas de
acontecimientos espacio-temporales entre ellos. Por universalidad restringida queremos decir que
las leyes de la física no son las mismas para todos los observadores, sino para una clase restringida
de ellos, los denominados observadores inerciales a los que queda restringido el formalismo.
Si un observador está describiendo un fenómeno electromagnético y cambiamos a un sistema
de referencia acelerado, en este sistema, además del fenómeno electromagnético, detectaremos
la presencia de un campo de inercia, indistinguible de un campo gravitatorio, y por lo tanto este
nuevo observador describe fenómenos no descritos por el otro. No son observadores equivalentes.
Vamos a restringirnos a observadores que describen los mismos fenómenos, por lo que se trata
de plantear un principio restringido.
Es el Principio de Relatividad General el que admite la invariancia general bajo cualquier
cambio de observadores, pero si incluimos la gravitación entre las posibles interacciones, ya que
no es posible distinguir físicamente entre un cambio a un sistema de referencia acelerado, de
la presencia de un campo gravitatorio local. También se suele admitir que las leyes de la física
deben ser invariantes bajo cualquier cambio de variables lo que lleva a postularlo de forma
matemática con el nombre de Principio de Covariancia General.
Admitir este Principio de Relatividad Restringido es jar el correspondiente grupo cine-
mático en el arranque del formalismo que proponemos, ya que, como veremos, jados dos
observadores cualesquiera, las medidas relativas de cualquier otra magnitud física dependen
exclusivamente de este grupo. Y por otra parte, que entre las posibles interacciones que se pue-
dan describir en este formalismo, no está incluida la gravedad, la cual vendrá descrita en un
contexto diferente.

El uso del término relatividad en la denominación de Principio de Relatividad y su relación


con la Teoría de la Relatividad, por lo que respecta a este término es algo confusa. En la litera-
tura anglosajona se denomina Teoría de la Relatividad Especial (Special Relativity Theory) para
distinguirla de la Teoría de la Relatividad General (General Relativity Theory). En francés la de-
nominación se aproxima más a la que estamos usando aquí, Teoría de la Relatividad Restringida
(Théorie de la Relativité Restreinte). En ambos casos se trata de hacer un formalismo matemático
en el que el grupo que dene la relación entre observadores inerciales es el grupo de Poincaré. El
adjetivo especial tiene poco de especial y más bien debe ser tomado en el sentido restringido de
la denominación francesa. Aquí estamos deniendo un principio fundamental con el que construir
una teoría, la Teoría Cinemática de Partículas Elementales, por lo que propiamente este principio
fundamental se debería denominar Principio de Universalidad Restringida de las leyes de la
física, sin especicar, en principio, cuál es el grupo cinemático que relaciona a los observadores
equivalentes. Este grupo debe claramente respetar un fenómeno físico como es la propagación de
la luz y que su velocidad debe ser la misma para todos los observadores equivalentes. Si el término
relatividad hace mención a que las leyes de la física están siempre formuladas relativas a cada
observador, podría ser evitado.
1.2. PRINCIPIOS FUNDAMENTALES 27

1.2.2. Principio Variacional

El Principio Variacional reconoce que la magnitud acción durante la evolución de cual-


quier sistema mecánico, entre dos estados inicial y nal prejados, debe ser estacionaria. La
acción se calcula en términos de una función Lagrangiana, la cual es una función explícita
del tiempo t, de los grados de libertad independientes y de sus derivadas temporales hasta un
cierto orden nito. Habitualmente, para sistemas materiales construídos a partir de partículas
sin espín, se restringe a que la Lagrangiana dependa solamente hasta las primeras derivadas
temporales de los grados de libertad. Esto lleva a que las ecuaciones dinámicas de cualquier
grado de libertad sean a lo sumo de segundo orden. Esto es una herencia de la mecánica New-
toniana basada en la construcción de la materia a partir de puntos materiales masivos. Pero
como resulta que la ecuación diferencial más general de un punto en el espacio tridimensional
es de cuarto orden, y, por otra parte, no sabemos todavía qué tipo de variables deberemos usar
para describir una partícula con espín, ¾por qué restringir a que estas variables desconocidas
satisfagan necesariamente ecuaciones de segundo orden?
De acuerdo con este principio, existirá una función Lagrangiana que dependerá del tiempo,
de un número nito de grados de libertad y de sus derivadas temporales hasta un orden nito,
para cualquier sistema mecánico formado a partir de un número nito de partículas elementales.
Será el principio atómico el que limitará qué variables son las que caracterizan a una partícula
elemental.
Este principio es tan fuerte que cuando lo apliquemos a sistemas materiales que verican el
principio atómico, vamos a llegar a la conclusión de que la única interacción entre partículas
elementales, desde el punto de vista clásico, es la interacción electromagnética, tanto si las
partículas elementales tienen o no tienen espín. La ecuación de la dinámica de una partícula
elemental de carga e, queda reducida en su formulación variacional a

dp
= e (E + u × B) ,
dt
donde p es el momento lineal de la partícula, u la velocidad del centro de carga y E y B el
campo electromagnético externo. Y esta ecuación de la dinámica va a depender del tipo de
variables que describen a la partícula elemental y no del contexto, es decir que vale tanto en
el caso relativista como en el no relativista. En este contexto clásico no hemos sido capaces
de describir otro tipo de interacciones. La interacción débil y fuerte se obtienen en el contexto
cuántico bajo la hipótesis de la invariancia gauge local.

1.2.3. Principio Atómico

El Principio Atómico admite que la materia no puede ser dividida indenidamente. La


materia no es un continuo. Después de un número nito de pasos en la división de una porción
de materia deberemos alcanzar un último objeto indivisible, una partícula elemental. Si una
teoría física pretende describir la realidad material, debe contener en su formalismo la aceptación
de que existen esos objetos elementales, y además, la posibilidad de distinguir cuándo un sistema
mecánico es elemental o no lo es. La distinción entre una partícula elemental y cualquier otro
objeto material nito, es que la partícula elemental, además de ser indivisible, no puede tener
estados excitados y, salvo que sea destruida con su antipartícula o en una colisión de alta
energía, su estructura no puede ser modicada. Cuando tomamos un trozo de materia y tratamos
de romperlo, lo primero que resulta es que se deforma y, si la energía utilizada es suciente
para romper el enlace, se parte en dos o más porciones. Supongamos un objeto compuesto de
dos partículas, por ejemplo el átomo de Hidrógeno. Si actuamos sobre el protón y el electrón
intentando separarlos, al principio deformaremos el átomo y con energía suciente lo llegaremos
a separar. Si el objeto es una partícula elemental, como no tiene partes diferenciadas sobre las
28 CAPÍTULO 1. FORMALISMO LAGRANGIANO

que actuar, no puede dividirse ni tampoco se deformará. No puede poseer estados excitados.
De alguna manera, si la estructura de una partícula elemental no puede ser modicada, esto
implica que los posibles estados en los que podemos encontrarla son simplemente modicaciones
cinemáticas de uno cualquiera de ellos. Como en el proceso de aislar una partícula elemental
necesitamos un número nito de etapas, esto signica que en la descripción de la partícula
elemental necesitamos un número nito de variables para describir sus estados. Si el estado de
una partícula elemental cambia, siempre podremos encontrar algún otro observador inercial que
la describa en el mismo estado que antes de la modicación, es decir con los mismos valores de
todas las variables esenciales que caracterizan su estado. Un electrón sigue siendo un electrón
aunque se le someta a una interacción. Esto va a implicar una restricción en el tipo de variables
clásicas que podemos usar para describir sus estados en una descripción variacional.
Es esta distinción explícita, entre los sistemas materiales compuestos y las partículas ele-
mentales, formando parte del formalismo, y la aceptación de la existencia de las partículas
elementales como un hecho destacado, lo que da contenido a este principio atómico, como prin-
cipio fundamental.
Estos tres principios enunciados, completan el marco clásico del formalismo. Para su cuan-
tización deberemos sustituir este último principio variacional por el siguiente cuarto principio.

1.2.4. Principio de Cuantización

Para la descripción cuántica de un sistema mecánico, vamos a sustituir el anterior principio


variacional por el Principio de Cuantización en la forma propuesta por Feynman 3 : Todos
los caminos de la evolución de un sistema mecánico entre dos estados inicial y nal jos son
igualmente probables. En mecánica clásica, jados los puntos extremos de la evolución, se sin-
gulariza algún camino que los une, como aquél que hace mínima a la acción del sistema. En el
caso cuántico, se relaja esta prescripción, y como no es experimentalmente posible determinar
con precisión si una partícula sigue o no un determinado camino, hemos de admitir que todos
los caminos son posibles. Para cada camino posible que una dichos puntos extremos, se dene
una amplitud de probabilidad, la cual es un número complejo de la misma magnitud para cada
camino, y cuya fase es la acción del sistema a lo largo del camino, en unidades de la constante de
Planck ~. La probabilidad de que siga uno de esos caminos se calcula como el valor absoluto al
cuadrado de la correspondiente amplitud de probabilidad. Como todos los caminos alternativos
son independientes, la estadística interriente de Feynman postula que la amplitud de
probabilidad de un sistema que parte de un punto inicial y llega a otro nal, jos, es la suma
de todas las amplitudes de probabilidad de los diferentes caminos alternativos.
Frente a la estadística convencional en la que las probabilidades de alternativas independien-
tes se suman, y por lo tanto la probabilidad de un proceso en el que hay numerosas posibilidades
es siempre mayor que cualquiera de ellas, aquí lo que se suman son las amplitudes de proba-
bilidad, cuyo valor absoluto al cuadrado es la probabilidad nal del proceso. Pero como lo que
sumamos son números complejos, el valor absoluto del resultado puede incluso, ser menor que
el valor absoluto de cada uno de los sumandos. De ahí el nombre de estadística interriente, ya
que aunque para ir de a a b por algunos caminos pueda existir una probabilidad no nula, puede
resultar que en el proceso global la probabilidad nal sea cero, el resultado es un proceso de
interferencia que anula toda probabilidad de que el mismo se produzca. Al pasar fotones por
unas rendijas, la probabilidad de que lleguen a algún punto de la pantalla puede no ser nula,
sin embargo cuando se analiza el proceso global, incluyendo todas las diferentes alternativas,
existen puntos a los que no llega ningún fotón. La amplitud de probabilidad de llegada a ese
punto es cero. Se ha producido una interferencia.
Si en el proceso de ir de a a b, efectuamos la suma de las correspondientes amplitudes de
3
R.P. Feynman and A.R. Hibbs, Quantum Mechanics and Path Integrals, MacGraw Hill, N.Y., (1965).
1.3. PRINCIPIO VARIACIONAL: FORMALISMO LAGRANGIANO 29

probabilidad sobre diferentes puntos iniciales, lo que obtenemos es la amplitud de probabilidad


de encontrar nuestro sistema en un cierto punto, a partir de una preparación concreta. Pero
esto es lo que en la mecánica cuántica convencional denominamos la función de onda. Por lo
tanto, esta amplitud de probabilidad debe ser una función compleja, de cuadrado integrable y
de norma unidad, ya que sumadas las probabilidades para todos los posibles puntos nales, esta
probabilidad debe ser 1. Las diferentes funciones de onda, alrededor de cada punto, representan
las diferentes formas de preparar o de llegar al mismo, partiendo de condiciones iniciales y
caminos diferentes.
Pero lo importante de esta forma de proceder, es que la función de onda va a ser una
función de cuadrado integrable de precisamente las variables que denen los puntos extremos
de la formulación variacional, las que vamos a denominar variables cinemáticas.
El método de integrales de caminos de Feynman parece haberse inspirado en un artículo de
Dirac 4 . En este artículo, Dirac apunta, al comparar el formalismo Lagrangiano con el formalis-
mo canónico, que: los dos formalismos están por supuesto íntimamente relacionados, pero hay
razones para creer que el formalismo Lagrangiano es más fundamental. Más adelante expresa
que, debemos considerar la Lagrangiana clásica no como una función de las coordenadas y ve-
locidades, sino como función de las coordenadas en los instantes consecutivos t y t + dt. Aquí,
claramente, está sugiriendo el uso de las variables cinemáticas y el expresar la Lagrangiana en
términos de las mismas.
En el Prefacio del libro de Feynman y Hibbs, se menciona que Feynman, en una conversación
privada con un colega europeo, se da cuenta de que en ese trabajo, Dirac sugiere que la función
de onda en el instante t + ϵ debe estar relacionada con la función de onda en el instante t,
mediante
ψ(t + ϵ) ∼ eiϵL/~ ψ(t).
Lo que Feynman hace es postular que efectivamente la relación anterior es una identidad. O lo
que es lo mismo, el término exponencial es el propagador de la dinámica. En el libro 5 se cita
que el colega europeo fue Herbert Jehle, que visitó Princeton en 1941.
Vamos a construir un formalismo clásico basado en los tres primeros principios, y al nal
del formalismo vamos a ver que para describir una partícula de Dirac, no va a ser necesario
postular ninguna Lagrangiana particular. Solamente va a ser importante el determinar cuáles
son las variables que denen los puntos inicial y nal del formalismo variacional, es decir,
las variables cinemáticas. El teorema de Noether, las leyes de conservación y los invariantes del
grupo cinemático serán sucientes para la descripción de la dinámica de una partícula elemental
y de sus propiedades.

1.3. Principio variacional: Formalismo Lagrangiano

El formalismo Lagrangiano generalizado, dependiente de derivadas de orden superior, fue


desarrollado por Ostrogradsky (1850) 6 . Vamos a ver que si la Lagrangiana depende del tiempo t,
de los n grados de libertad qi (t) y de sus primeras derivadas temporales L(t, qi , q̇i ), las ecuaciones
dinámicas de Euler-Lagrange son
( )
∂L d ∂L
− = 0, i = 1, . . . , n,
∂qi dt ∂ q̇i
P.A.M. Dirac, The Lagrangian in quantum mechanics, Phys. Zeitsch. der Sowjetunion, 3, 6472 (1933), . . .
4

the two formulations are, of course, closely related, but there are reasons for believing that the Lagrangian one
is more fundamental.
5
L.M. Brown (editor), Feynman's thesis: A new approach to quantum theory, (World Scientic 2005)
6
M. Ostrogradsky, Mémoire sur les équations diérentielles relatives au problème des isopérimètres, Mem.
Acad. St. Petersburg, 6(4), 385-517 (1850).
30 CAPÍTULO 1. FORMALISMO LAGRANGIANO

en cambio si la Lagrangiana depende hasta las derivadas de orden k de los grados de libertad,
estas ecuaciones resultan ser
( ) ( )
∂L d ∂L k
k d ∂L
− + · · · + (−1) k = 0, i = 1, . . . , n, (1.1)
∂qi dt ∂q (1) dt ∂q
(k)
i i

donde el orden de derivación temporal de los grados de libertad, en vez de un punto, lo hemos
escrito en forma de un superíndice entre paréntesis. Vamos a llegar a estas ecuaciones, como
condición necesaria de que la solución haga a la acción extremal. Pero también es importante
el resaltar, que en el formalismo variacional que nos lleva a estas ecuaciones (1.1), debemos
imponer condiciones de contorno en los dos extremos de la evolución, que se mantienen jas.
Además de construir las ecuaciones de Euler-Lagrange, vamos a ver cuáles son estas variables
independientes y esenciales que nos denen los estados inicial y nal de la evolución, y que
denominaremos variables cinemáticas. En particular el principio atómico nos limitará cuáles
son estas variables para las partículas elementales.
Finalmente, analizaremos la estructura del espacio de las variables cinemáticas y veremos
que para cualquier sistema mecánico es siempre un espacio métrico, pero no Riemanniano sino
Finsleriano. De esta manera, si un mismo sistema mecánico caracterizado por un conjunto de
variables cinemáticas, se analiza bajo dos interacciones diferentes, desde el punto de vista geomé-
trico implica que la métrica del mismo espacio cinemático en las dos situaciones de interacción,
es una métrica Finsleriana diferente. Así, la gravedad, se estudiará como una modicación de la
métrica generada por los contenidos materiales de todos los objetos, incluido el propio sistema
mecánico, pero sin exigir la invariancia frente a un grupo cinemático.

1.3.1. Ecuaciones de Euler-Lagrange


Consideremos pues un sistema mecánico de n grados de libertad, que viene caracterizado
por el conocimiento de una función Lagrangiana que depende del tiempo t, de los n grados de
libertad independientes qi (t), y de sus derivadas temporales hasta un orden nito k , y que las
representamos por qi (t) = dk qi (t)/dtk . El funcional acción se dene mediante:
(k)

∫ t2
(1) (k)
A[q] = L(t, qi (t), qi (t), . . . , qi (t))dt, (1.2)
t1

donde i = 1, . . . , n. Para cada posible trayectoria qi (t) introducida en (1.2), nos suministra un
número real, la acción sobre esa trayectoria.

Principio variacional: La trayectoria que va a seguir el sistema dinámico entre dos


estados extremos jos, denidos en los instantes t1 y t2 , en los que jamos los valores
de las variables y sus derivadas qi(s) (t1 ) y qi(s) (t2 ), i = 1, ..., n, s = 0, 1, ..., k − 1,
es aquél camino que hace extremal al funcional acción (1.2), es decir el valor de la
acción a lo largo de ese camino es máximo o mínimo.
Observar que necesitaremos jar en los extremos, además del valor del tiempo t unos valores
particulares de los n grados de libertad qi y de sus derivadas temporales hasta el orden k − 1, es
decir, un orden inferior al máximo orden de derivación que el correspondiente grado de libertad
aparece en la Lagrangiana. Aunque como condiciones de contorno jamos valores de los grados
de libertad y de sus derivadas, los valores que escogemos son totalmente independientes unos
de otros, es decir, caracterizan de forma unívoca los estados inicial y nal de la evolución.
Recíprocamente, podríamos decir que si conocemos el tipo de variables que denen los
estados extremos, la Lagrangiana es una función explícita de estas variables, y de su siguiente
derivada temporal.
1.3. PRINCIPIO VARIACIONAL: FORMALISMO LAGRANGIANO 31

Una vez que tenemos denido el funcional acción (1.2) para un determinado camino arbitrario
qi (t), para analizar su variación, producimos una modicación innitesimal del mismo qi′ (t), que
′ (s)′ (s) (s)
lo escribimos qi (t) = qi (t) + δqi (t) y de todas sus derivadas temporales qi (t) = qi (t) + δqi (t),
manteniendo jos los extremos de la evolución, es decir, que en t1 y t2 la modicación de las variables
(s) (s)
generalizadas y sus derivadas hasta el orden k−1, se anulen, y por lo tanto, δqi (t1 ) = δqi (t2 ) = 0,
para i = 1, . . . , n y s = 0, 1, . . . , k − 1 (ver gura 1.1).

Figura 1.1: Caminos q(t) y q ′ (t) modicado pasando por los mismos estados extremos 1 y 2
(s) (s) (s)
La variación de las diferentes derivadas de qi (t) viene dada por qi (t) → qi (t) + δqi (t) =
(s) s s
qi (t) + d δqi (t)/dt , puesto que la modicación de la derivada de orden s es precisamente la
derivada de orden s de la modicación de la función. Esto lleva a que el funcional acción sufre una
modicación entre ambos caminos, δA = A[q + δq] − A[q], dada por:
∫ t2 ∫ t2
(s) (s) (s)
δA = L(t, qi (t) + δqi (t))dt − L(t, qi (t))dt
t1 t1

∫ [ ]
t2 ∑n
∂L ∂L (1) ∂L (k)
= dt δqi + (1) δqi + · · · + (k) δqi , (1.3)
t1 i=1
∂qi ∂qi ∂qi
después de desarrollar a orden más bajo la primera integral y restarle la segunda. El término
( ) ( )
∂L (1) ∂L d d ∂L d ∂L
(1)
δqi = (1)
δqi = (1)
δqi − (1)
δqi ,
∂qi ∂qi dt dt ∂qi dt ∂qi

que integrando entre t1 y t2 , nos da:

∫ ∫ ( )
t2 t2
∂L (1) ∂L ∂L d ∂L
(1)
δqi dt = (1)
δqi (t2 ) − (1)
δqi (t1 ) − (1)
δqi dt
t1 ∂qi ∂qi ∂qi t1 dt ∂qi
∫ ( )
t2
d ∂L
=− (1)
δqi dt,
t1 dt ∂qi
ya que las variaciones δqi (t1 ) y δqi (t2 ), se anulan. Lo mismo para el siguiente término:

( ) ( )
∂L (2) ∂L d (1) d ∂L (1) d ∂L (1)
(2)
δqi = (2) dt
δqi = (2)
δqi − (2)
δqi ,
∂qi ∂qi dt ∂qi dt ∂qi
∫ ∫ ( ) ∫ ( )
t2 t2 t2
∂L (2) d ∂L (1) d2 ∂L
δqi dt =− δqi dt = δqi dt,
t1
(2)
∂qi t1 dt ∂qi
(2)
t1 dt2 ∂qi
(2)

(1)
ya que δqi y δqi se anulan en t1 y t2 , y nalmente para el último término

∫ ∫ ( )
t2 t2
∂L (k) dk ∂L
δqi dt = (−1)k δqi dt,
t1 ∂qi
(k)
t1 dtk ∂qi
(k)
32 CAPÍTULO 1. FORMALISMO LAGRANGIANO

de tal manera que cada término de (1.3) se escribe solamente en términos de las variaciones de
los grados de libertad δqi
y no de sus derivadas de orden superior. Observar de nuevo que para
(s)
llegar hasta aquí ha sido necesario suponer la anulación de las variaciones de todas las δqi , para
s = 0, . . . , k − 1, en los instantes t1 y t2 . Recolectando todos los términos, obtenemos
∫ [ ( ) ( )]
t2 ∑n
∂L d ∂L k d
k
∂L
δA = dt − + · · · + (−1) δqi (t).
t1 i=1
∂qi dt ∂qi(1) dtk ∂qi(k)

Si el funcional acción es extremal sobre el camino qi (t), su variación debe ser nula, δA = 0. Como
las modicaciones del camino δqi (t) son arbitrarias, todos los términos entre paréntesis cuadrados
deben anularse de forma idéntica. Obtenemos así, un sistema de ecuaciones diferenciales ordinarias

( ) ( )
∂L d ∂L dk ∂L
− (1)
+ · · · + (−1)k k (k)
= 0, i = 1, . . . , n, (1.4)
∂qi dt ∂qi dt ∂qi
las denominadas ecuaciones de Euler-Lagrange (1755). 7 8

1.3.2. Espacio Cinemático


En general, el sistema (1.4) es un sistema de n ecuaciones diferenciales ordinarias de orden
2k , y, por lo tanto, los teoremas de existencia y unicidad nos garantizan la existencia de una
(s)
solución para las 2kn condiciones de contorno qi (t1 ), i = 1, . . . , n y s = 0, 1, . . . , 2k − 1, en el
(0)
instante inicial t1 , donde qi ≡ qi . Sin embargo, la formulación variacional ha sido planteada
con la condición de que la solución pasara por los dos estados extremales jos. Esto no garantiza
ni la existencia de solución ni siquiera su unicidad. De alguna forma está sugiriendo que dados
dos estados extremales de la evolución no siempre tiene que existir solución, es decir que dado un
estado inicial no todos los estados nales posibles pueden ser alcanzados durante la evolución.
Se está pregurando un principio de causalidad, como analizaremos en la sección 1.7.
Sin embargo, supongamos que el sistema anterior (1.4) posee solución, no necesariamente
(s)
única, con los valores prejados de los estados extremos del problema variacional qi (t1 ) y
(s)
qi (t2 ), i = 1, . . . , n and s = 0, 1, . . . , k − 1, en los instantes t1 y t2 , respectivamente. Esto
supone, de alguna manera, que las 2kn condiciones de contorno en el instante t1 , como requieren
los teoremas de existencia y unicidad, pueden ser expresadas, tal vez de forma no única, como
funciones de las kn condiciones en cada uno de los extremos. Como estamos analizando sistemas
físicos que sabemos poseen solución física partiendo de 1 y llegando a 2, resulta entonces que,
una solución particular que pasa por los extremos se podrá expresar como una función del
tiempo y de las variables que denen los puntos extremos
(r) (r)
qei (t) ≡ qi (t; qj (t1 ), ql (t2 )), (1.5)
7
Leonard Euler Nace el 15 de Abril 1707 en Basilea, Suiza y fallece el 18 de Septiembre
de 1783 en San Petersburgo, Rusia. Ha sido uno de los matemáticos más prolícos de la historia.
Aunque empezó a estudiar teología por deseo paterno, fue debido a Bernouilli que convenció a
su padre, que se dedicó al estudio de las matemáticas. Catalina I le ofrece un puesto de director
investigador en la academia de Ciencias de San Petersburgo. Publica el libro Mechanica, en la que
se presenta, por primera vez, la mecánica Newtoniana haciendo uso del análisis matemático. Escribió libros sobre
calculo variacional, sobre las órbitas planetarias, artillería y balística, análisis, construcción naval y navegación
marítima, el movimiento de la luna y sobre cálculo diferencial.
8
Joseph-Louis Lagrange nace en Turín el 25 de enero de 1736, entonces perteneciente al
Piamonte y muere en París el 10 de abril de 1813. Además del desarrollo de la mecánica analítica
que lleva su nombre, se dedicó a la mecánica celeste y a diversos campos del análisis. Durante la
revolución francesa fue un rme partidario de la implantación del sistema métrico decimal. En 1788
publica su Mécanique Analytique, que es una puesta al día de toda la mecánica desde los tiempos
de Newton. En 1808, Napoleón le nombra miembro de la Legión de Honor y conde del imperio. Está enterrado
en el Panteón de París.
1.3. PRINCIPIO VARIACIONAL: FORMALISMO LAGRANGIANO 33

i, j, l = 1, . . . , n, r = 0, 1, . . . , k − 1, que al particularizar t = t1 o t = t2 , nos produzca para la


función y sus derivadas hata el orden k − 1, los correspondientes valores en los extremos.

Denición: La Función Acción de un sistema, es el valor del funcional Acción


(1.2) a lo largo del camino clásico (1.5) que satisface las ecuaciones de Euler-
Lagrange (1.4) y que pasa por los puntos extremos: 9
∫ t2 ( )
(r) (r)
L (t, qei (t)) dt = A t1 , qi (t1 ); t2 , qi (t2 ) . (1.6)
t1

Una vez que la integral temporal se calcula, el resultado será una función explícita de las kn + 1
(r)
variables en el instante inicial, qj (t1 ), r = 0, . . . , k − 1, incluyendo el tiempo t1 , y de las
correspondientes kn + 1 variables en el instante nal t2 . También será función de los parámetros
y constantes intrínsecas del sistema material. Lo escribimos como
( )
(r) (r)
A t1 , qi (t1 ); t2 , qi (t2 ) ≡ A(x1 , x2 ).

Y llegamos a la siguiente

Denición: Las variables cinemáticas del sistema son el tiempo t y los n grados
de libertad qi y sus derivadas hasta el orden k − 1. La variedad que generan X recibe
el nombre de espacio cinemático o espacio de los estados del sistema.

El espacio cinemático de las Lagrangianas ordinarias es el espacio de conguración generado


por las variables qi , juntamente con la variable tiempo t. Se le suele denominar espacio de
conguración ampliado. Pero para Lagrangianas generalizadas de orden superior incluye
también las derivadas de los grados de libertad hasta un orden una unidad inferior al máximo
orden del que aparece en la Lagrangiana. Por lo tanto, La función acción de cualquier
sistema dinámico es una función de los valores de las variables cinemáticas en los
extremos de la trayectoria, x1 y x2 , es decir una función de los estados inicial y nal. De
ahora en adelante consideraremos sistemas para los cuales la función acción está denida y es
una función continua y derivable de las variables cinemáticas en los extremos de la evolución.
Claramente satisface la propiedad A(x, x) = 0.

1.3.3. Cambio del tiempo por otro parámetro de evolución


En la relatividad restringida, el tiempo es relativo a cada observador, por lo que usar el
tiempo como variable de evolución sirve para cada observador particular, pero eso no produce
un formalismo que sea independiente del observador. Por eso, el interés de una formulación
variacional más general es construirla en términos de un parámetro de evolución invariante,
el mismo para todos los observadores inerciales. Supongamos entonces, que la trayectoria del
sistema se puede expresar en forma paramétrica, en términos de cierto parámetro de evolución
arbitrario τ , {t(τ ), qi (τ )}, el mismo para todo observador inercial. El funcional (1.2) se puede
reescribir en términos de las variables cinemáticas y sus derivadas en la forma:
∫ τ2 ( (k−1)
)
q̇i (τ ) q̇i (τ )
A[q] = L t(τ ), qi (τ ), ,..., ṫ(τ )dτ
τ1 ṫ(τ ) ṫ(τ )
9
Observar que estamos usando la misma letra mayúscula A( ) para la función acción que para el funcional
acción A[ ], aunque ésta en cursiva. La primera está seguida de paréntesis normales en los que se contienen las
variables de las que depende esta función, en tanto que en el funcional aparece seguido de paréntesis cuadrados,
para realzar que no es una función de varias variables, sino un funcional que depende de caminos completos entre
los puntos extremos.
34 CAPÍTULO 1. FORMALISMO LAGRANGIANO

∫ τ2
= e (x(τ ), ẋ(τ )) dτ,
L (1.7)
τ1
donde ahora el punto signica tomar la derivada con respecto al parámetro de evolución τ , que
e ≡ L(t, qi , q̇ (s) /ṫ) ṫ(τ ),
sin pérdida de generalidad se puede escoger adimensional. Por lo tanto L i
s = 1, . . . , k − 1, tiene dimensiones de acción.

1.3.4. Homogeneidad de la Lagrangiana


e , de cualquier sistema dinámico, es siempre una
Podemos ver que la Lagrangiana L función
homogénea de primer grado como función de las derivadas con respecto a τ de to-
das las variables cinemáticas. En efecto, cada derivada temporal qi(s) (t) ha sido reemplazada
(s−1)
por el cociente q̇i (τ )/ṫ(τ ) de dos derivadas con respecto a τ . Incluso la derivada de mayor
(k) (k−1)
orden k , qi = q̇i /ṫ, se expresa en términos de las derivadas de la variables cinemáticas
(k−1)
qi y t. Por lo tanto la función original L es una función homogéna de grado cero en las
derivadas de las variables cinemáticas. Finalmente el término ṫ(τ ), da lugar a que la nueva fun-
e sea una función homogénea de primer grado. Si reemplazamos cada ẋi por λẋi , entonces
ción L
e
L(x(τ e
), λẋ(τ )) = λL(x(τ ), ẋ(τ )). Por lo tanto, el teorema de Euler sobre funciones homogéneas
implica, derivando ambos miembros con respecto a λ, llamando y j = λẋj , y haciendo luego
λ=1
∑ ∂L ∑ ∂L ∑
e e
e
L(x(τ ), ẋ(τ )) = j
ẋ = ẋj = Fj (x, ẋ)ẋj . (1.8)
∂y j ∂ ẋj
j j j
λ=1
El desarrollo (1.8) nos indica que la Lagrangiana de cualquier sistema dinámico puede siempre
escribirse como una suma de funciones Fi (x, ẋ) multiplicadas por la correspondiente ẋi , derivada
con respecto a τ de la variable cinemática xi , es decir en tantos sumandos como variables
cinemáticas.
Esta posibilidad de expresar la Lagrangiana como función homogénea de primer grado de las
derivadas ya fue considerada por Dirac en 1933 10 pero como una consideración estética. Es esta
homogeneidad la que que nos permitirá transformar el formalismo variacional en un formalismo
geodésico pero no sobre cualquier variedad, sino precisamente sobre el espacio cinemático X , y
donde la métrica gij (x, ẋ) será un tensor dependiente de la dirección, y por lo tanto la trayectoria
de la partícula es una geodésica, no en una variedad Riemaniana sino en un espacio de Finsler.11
La función L e no es función explícita del parámetro de evolución τ y por lo tanto el problema
variacional (1.7), es invariante con respecto a cualquier cambio arbitrario de parámetro de
evolución τ , lo que nos permite tomarlo como adimensional. 12
En efecto, si cambiamos el parámetro de evolución τ = τ (θ), entonces ṫ(τ ) = (dt/dθ)(dθ/dτ ) y
(s) (s)
q̇i (τ ) = (dqi (θ)/dθ)(dθ/dτ )
de tal forma que los cocientes

(s) (s) (s)


q̇i (τ ) (dqi (θ)/dθ) θ̇(τ ) q̇ (θ)
= ≡ i ,
ṫ(τ ) (dt(θ)/dθ) θ̇(τ ) ṫ(θ)
donde de nuevo el punto signica ahora derivación con respecto a θ. Resulta que (1.7) se puede
poner como: ∫ τ2
(k−1) dt(θ)
A[q] = L(t(θ), qi (θ), . . . , q̇i (θ)/ṫ(θ)) dθ
τ1 dθ
∫ θ2
= e
L(x(θ), ẋ(θ))dθ. (1.9)
θ1

10
P.A.M. Dirac, Proc. Cam. Phil. Soc. 29, 389 (1933): a greater elegance is obtained, a symmetrical treat-
ment suitable for relativity.
11
Finsler geometry, Relativity and Gauge theories, Reidel Pub. Co, Dordrecht (1985).
G.S. Asanov,
12
Methods of Mathematical Physics, Vol. 1, Interscience, N.Y. (1970); I.M. Gelfand,
R. Courant, D. Hilbert,
S.V. Fomin, Calculus of Variations Prentice Hall, Englewood Clis, N.J. (1963).
1.3. PRINCIPIO VARIACIONAL: FORMALISMO LAGRANGIANO 35

1.3.5. Obtención de la Lagrangiana a partir de la función Acción

El formalismo así planteado tiene la ventaja de que es independiente del parámetro de


evolución, y si queremos volver a utilizar el tiempo concreto de un cierto observador, para hacer
un análisis temporal, reemplazamos τ = t y por lo tanto ṫ = 1. A partir de ahora vamos a
considerar aquellos sistemas para los que es posible una descripción paramétrica de la evolución
y, utilizaremos el símbolo e sobre la Lagrangiana, la cual debe siempre ser entendida como
escrita en términos de las variables cinemáticas y sus primeras derivadas con respecto a este
parámetro arbitrario τ . De esta forma, distinguiremos las Lagrangianas L e de las Lagrangianas
L, sin el símbolo e, que hacen el análisis de la evolución temporal del sistema material para
algún observador. El paso de Le a L se hace tomando t = τ , y ṫ = 1.
Si conocemos la función acción A(x1 , x2 ), como función de los puntos extremos de la evolu-
ción, podemos recuperar esta Lagrangiana L(x, e ẋ) mediante un proceso de límite:

e ẋ) = lı́m ∂A(x, y) ẋj ,


L(x, (1.10)
y→x ∂y j

donde hemos usado el criterio habitual de suma sobre el índice mudo j , extendido al conjunto
de todas las variables cinemáticas.

Si en (1.7) consideramos dos puntos muy próximos x1 ≡ x y x2 ≡ x + dx, y hacemos un


desarrollo de la función acción a primer orden e ẋ)dτ con la
A(x, x + dx) = A(x, x + ẋdτ ) = L(x,
condición A(x, x) = 0, obtenemos (1.10).

De alguna forma el conocimiento de la función acción A(x1 , x2 ) caracteriza de forma global a


e y por lo tanto las ecuaciones dinámicas.
la dinámica, ya que mediante (1.10) se determina L

1.3.6. Simetría de un sistema dinámico

Se dene una simetría de un sistema dinámico, como aquella transformación matemá-


tica de las variables que lo describen que deja invariantes las ecuaciones dinámicas.
Como la composición de simetrías, produce nuevas simetrías, y esta ley de composición es aso-
ciativa y existe la transformación unidad, resulta que el conjunto de todas las simetrías de un
sistema dinámico forma un grupo, el grupo de simetrías del sistema. Si admitimos que se
satisface el principio de Relatividad Restringido, entonces el grupo cinemático que dene la
relación entre observadores equivalentes, es un subgrupo del grupo general de simetrías, ya que
las ecuaciones dinámicas son las mismas para todos estos obervadores.
Si una transformación deja invariante a la Lagrangiana de un sistema dinámico, entonces es
una simetría. El recíproco no es cierto, es decir pueden existir simetrías que no dejen invariante
a la Lagrangiana. Sin embargo, si bajo una transformación, la Lagrangiana queda multiplicada
por un factor constante o cambia a otra que diere de la anterior en una función que es una
derivada total, con respecto al parámetro de evolución τ , de una función arbitraria de las
variables cinemáticas, entonces esa transformación es también una simetría.
Las transformaciones de simetría pueden ser discretas o continuas. Una transformación es
discreta si forma parte de un grupo discreto o nito, por ejemplo la transformación t′ = −t,
representa una inversión temporal, es una transformación discreta y si es una simetría, decimos
que el sistema dinámico es invariante por inversión temporal. Transformaciones continuas son
aquellas que son transformaciones de un grupo continuo, como por ejemplo, traslaciones y
rotaciones. En el caso de los grupos continuos, el análisis de las simetrías basta con hacerlo con
las transformaciones innitesimales, con el análisis del álgebra de Lie del grupo. En el apéndice
1.9, se hace una pequeña introducción a los grupos continuos, o grupos de Lie, para jar la
notación y el ver cómo se representan los generadores de las transformaciones innitesimales.
36 CAPÍTULO 1. FORMALISMO LAGRANGIANO

1.3.7. Funciones gauge de la Lagrangiana


En la formulación variacional de la mecánica clásica
∫ t2 ∫ τ2
A[ q ] =
(s)
L(t, qi (t))dt ≡ e ẋ)dτ,
L(x, (1.11)
t1 τ1

A[ q ] es un funcional sobre los posibles caminos, es decir, toma en general valores diferentes
para los diferentes caminos que unen cada par de puntos jos x1 y x2 . Entonces, para que se
produzcan en general, valores diferentes, es necesario que Ldτ e no sea una diferencial exacta.
En caso contrario, si Ldt = dλ, entonces A[ q ] = λ(x2 ) − λ(x1 ) y el funcional no distingue con
valores diferentes entre los diferentes caminos, y la función acción del sistema entre x1 y x2 ,
es esa única integral A(x1 , x2 ) = λ(x2 ) − λ(x1 ), que queda expresada en función de la función
λ(x), siendo por lo tanto, independiente del camino.
Si λ(x) es una función real denida sobre el espacio cinemático X de un sistema Lagrangiano
cuya función acción sea A(x1 , x2 ), entonces la función A′ (x1 , x2 ) = A(x1 , x2 ) + λ(x2 ) − λ(x1 ) es
otra función acción equivalente a A(x1 , x2 ) en el sentido de que produce las mismas ecuaciones
dinámicas. En efecto, por (1.10) da lugar a una Lagrangiana Le′ que diere de L e en una derivada
total con respecto a τ . 13

Usando (1.10), obtenemos

e ẋ) + dλ(x) ,
Le′ (x, ẋ) = L(x, (1.12)

e y Le′ producen las mismas ecuaciones dinámicas y A(x1 , x2 ) y A′ (x1 , x2 ) se dice
y por lo tanto L
que son funciones acción equivalentes.
Supongamos una Lagrangiana de un sistema de un grado de libertad L(t, q, q̇) y la modicamos a
L′ = L + dλ(t, q)/dt. ′
Las ecuaciones dinámicas a partir de L son:

∂λ ∂λ ∂L′ ∂L ∂2λ ∂2λ


L′ = L + + q̇, = + + q̇,
∂t ∂q ∂q ∂q ∂q∂t ∂q 2
( ) ( ) ( ) ( )
∂L′ ∂L ∂λ d ∂L′ d ∂L d ∂λ d ∂L ∂2λ ∂2λ
= + , = + = + + q̇,
∂ q̇ ∂ q̇ ∂q dt ∂ q̇ dt ∂ q̇ dt ∂q dt ∂ q̇ ∂t∂q ∂q 2
por lo que
( ) ( )
∂L′ d ∂L′ ∂L d ∂L
− = −
∂q dt ∂ q̇ ∂q dt ∂ q̇
y L′ y L producen las mismas ecuaciones dinámicas. El resultado es general si L depende de más

grados de libertad o de derivadas de orden superior. La única condición es que λ sea función de las

variables cinemáticas.

Sea G un grupo continuo de transformaciones del espacio de conguración ampliado (t, qi ),


que puede extenderse a un grupo de transformaciones del espacio cinemático X . Sea g ∈ G
un elemento arbitrario de G y x′ = gx, el transformado de x. Consideremos un sistema me-
cánico caracterizado por la función acción A(x1 , x2 ) que bajo la transformación g se cambia
en A(x′1 , x′2 ). Si G es un grupo de simetrías del sistema, es decir, las ecuaciones dinámicas en
términos de las variables x′ son las mismas que en términos de las variables x, esto implica que
A(x′1 , x′2 ) y A(x1 , x2 ) son necesariamente funciones acción equivalentes, y estarán relacionadas
por:
A(gx1 , gx2 ) = A(x1 , x2 ) + α(g; x2 ) − α(g; x1 ). (1.13)
La función α, será en general una función continua de g y de x. Esta función α(g; x) denida
sobre G × X recibe el nombre de función gauge del grupo G para el espacio cinemático
13
J.M. Levy-Leblond, Comm. Math. Phys. 12, 64 (1969).
1.3. PRINCIPIO VARIACIONAL: FORMALISMO LAGRANGIANO 37

X . Como el grupo es un grupo continuo, satisface α(e; x) = 0, siendo e el elemento neutro


de G. Si la transformación g es innitesimal, representada por sus coordenadas δg σ , entonces
α(δg; x) = δg σ λσ (x) a primer orden en los parámetros del grupo. La transformación de la
función acción toma la forma

A(δgx1 , δgx2 ) = A(x1 , x2 ) + λσ (x2 )δg σ − λσ (x1 )δg σ ,

es decir, en la forma que va a requerir el teorema de Noether de la sección siguiente, a la hora


de determinar las magnitudes conservadas. En general, las funciones λσ para Lagrangianas que
poseen funciones gauge se obtienen de

∂α(g; x)
λσ (x) = . (1.14)
∂g σ g=0

Debido a la propiedad asociativa de la ley de composición de todo grupo, cualquier función


gauge satisface la identidad

α(g ′ ; gx) + α(g; x) − α(g ′ g; x) = ξ(g ′ , g), (1.15)

donde la función ξ , denida sobre G × G, es independiente de x y es un exponente del grupo G.


Se puede ver esto a partir de la mencionada ley asociativa. A partir de (1.13) tenemos:

A(g ′ gx1 , g ′ gx2 ) = A(x1 , x2 ) + α(g ′ g; x2 ) − α(g ′ g; x1 ), (1.16)

y también
A(g ′ gx1 , g ′ gx2 ) = A(gx1 , gx2 ) + α(g ′ ; gx2 ) − α(g ′ ; gx1 )
= A(x1 , x2 ) + α(g; x2 ) − α(g; x1 ) + α(g ′ ; gx2 ) − α(g ′ ; gx1 ),
y por lo tanto, por identicación con el anterior (1.16), recolectando los términos con el mismo
argumento x, se llega a

α(g ′ ; gx2 ) + α(g; x2 ) − α(g ′ g; x2 ) = α(g ′ ; gx1 ) + α(g; x1 ) − α(g ′ g; x1 ),

y como x1 y x2 son dos puntos arbitrarios de X, esta expresión es (1.15) y dene una función
ξ(g ′ , g), independiente de x.

Levy-Leblond demuestra en la referencia previa que si X es un espacio homogéneo de G, es


decir, si existe un subgrupo H de G tal que X = G/H , entonces, el exponente ξ es equivalente
a cero sobre el subgrupo H , y las funciones gauge para espacios homogéneos resultan ser:

α(g; x) = ξ(g, hx ), (1.17)

done hx es cualquier elemento del conjunto representado por x ∈ G/H .


Para el grupo de Poincaré P todos sus exponentes son equivalentes a cero y las funciones
gauge cuando X sea un espacio homogéneo de P son idénticamente nulas. Las Lagrangianas
de los sistemas relativistas cuyos espacios cinemáticos sean espacios homogéneos de P , son
invariantes.
Sin embargo, en la formulación no relativista, el grupo de Galileo G posee exponentes no
triviales, que vienen caracterizados por un parámetro m que se interpreta como la masa total
del sistema. Las Lagrangianas Galileanas para sistemas masivos no son en general invariantes
bajo G . En el formalismo cuántico, el espacio de Hilbert de los estados de un sistema masivo no
relativista, es el espacio de una representación proyectiva unitaria del grupo de Galileo, en vez
de una verdadera representación unitaria. 14
14
ver ref.7 y también J.M. Levy-Leblond, Galilei Group and Galilean Invariance, en E.M. Loebl, Group Theory
and its applications, Acad. Press, NY (1971), vol. 2, p. 221.
38 CAPÍTULO 1. FORMALISMO LAGRANGIANO

1.4. Teorema de Noether generalizado

El análisis de Noether(1915) 15 para sistemas Lagrangianos generalizados, demuestra que

Teorema: A cada grupo uniparamétrico de transformaciones continuas de las va-


riables t y qi , i = 1, . . . , n, que dejando las ecuaciones dinámicas invariantes, trans-
forman la función acción del sistema, bajo una transformación innitesimal δg, en
la forma
A(δgx1 , δgx2 ) = A(x1 , x2 ) + λ(x2 )δg − λ(x1 )δg,
donde λ(x) es una función denida sobre el espacio cinemático, hay asociado un
obervable clásico N , el cual es una constante del movimiento.

Este observable N se construye, como veremos en (1.37), en función de λ(x), de


la función Hamiltoniana H y los momentos canónicos pi(s) y de la acción innitesi-
mal del grupo sobre las variables cinemáticas.
Además de λ(x) puede contener tantos términos como variables cinemáticas.

La condición que requiere el teorema de Noether para la transformación de la función acción es equivalente a
que la Lagrangiana transforme bajo una transformación innitesimal de la forma:

e
L(δgx, e ẋ) + dλ(x) δg,
δg ẋ) = L(x,

es decir que sea invariante salvo una derivada total de una función de las variables cinemáticas.

Demostración:
Supongamos que tenemos un grupo continuo uniparamétrico de transformaciones G, del espacio
de conguración ampliado (t, qi ), que puede extenderse a un grupo de transformaciones de todo
el espacio cinemático X . Sea δg un elemento innitesimal de G, y su acción sobre estas variables
viene dada por:

t → t′ = t + δt = t + M0 (t, q)δg, (1.18)


qi (t) → qi′ (t′ ) = qi (t) + δqi (t) = qi (t) +
(0)
Mi (t, q)δg, (1.19)

y su extensión al resto de las variables derivadas por

q ′ i (t′ ) = qi (t) + δqi (t) = qi (t) + Mi (t, q, q (1) )δg,


(1) (1) (1) (1) (1)
(1.20)

y en general

q ′ i (t′ ) = qi (t) + δqi (t) = qi (t) + Mi (t, q, . . . , q (s) )δg,


(s) (s) (s) (s) (s)
s = 0, 1, . . . , k, (1.21)

(0) (s)
donde M0 y Mi son únicamente funciones de qi y de t mientras que las funciones Mi con
s ≥ 1, se obtienen a partir de las derivadas de aquellas, y serán funciones del tiempo t y de las
variables qi y sus derivadas hasta el orden s.
15
Emmy Amalie Noether Nace en Erlangen, Baviera, Alemania, el 23 de marzo de 1882 y
fallece en Bryn Mawr, Pennsylvania, USA, el 14 de abril de 1935. Sus mayores contribuciones en
matemáticas son en el campo del álgebra abstracta, anillos y módulos. Sin embargo su inuencia
en la física teórica es importante con el teorema que aquí se presenta y su teoría de invariantes, que
condujo a Einstein a formular distintos conceptos en su teoría de la relatividad general.
1.4. TEOREMA DE NOETHER GENERALIZADO 39

Por ejemplo,

dq ′ i (t′ )
(0)
d(qi (t) + Mi δg) dt
q ′ i (t′ ) ≡
(1)
= ,
dt′ dt dt′
pero a primer orden en δg

dt′ dM0 (t, q) dt dM0 (t, q)


=1+ δg, ≈1− δg,
dt dt dt′ dt
y por lo tanto
( )
(0)
dMi (t, q) (1) dM0 (t, q)
q ′ i (t′ )
(1) (1)
= qi (t) + − qi δg,
dt dt
que al comparar con (1.20) obtenemos

(0)
(1) dMi (t, q) (1) dM0 (t, q)
Mi (t, q, q (1) ) = − qi ,
dt dt
donde las derivadas totales

∂M0 ∑ ∂M0 (1) ∑ ∂M (0) (1)


(0) (0)
dM0 (t, q) dMi (t, q) ∂Mi i
= + q , = + qj .
dt ∂t j
∂qj j dt ∂t j
∂qj

(s) (s−1)
Las demás Mi para s > 1, se obtienen de la misma forma a partir de la funciones Mi .

Bajo δg el funcional acción del sistema cambia:


∫ t′2 ∫ t2
L(t′ , q ′ i (t′ ))dt′ −
(s) (s)
δA[ q ] = L(t, qi (t))dt
t′1 t1
∫ t′2 ∫ t2
δqi (t))dt′
(s) (s) (s)
= L(t + δt, qi (t) + − L(t, qi (t))dt.
t′1 t1

Si reemplazamos en la primera integral el intervalo de integración (t′1 , t′2 ) por (t1 , t2 ) sabiendo
que el Jacobiano de t′ en términos de t implica que el diferencial dt′ = (1 + d(δt)/dt)dt, y por
lo tanto:
∫ t2 ( ) ∫ t2
(s) (s) d(δt) (s)
δA[ q ] = L(t + δt, qi + δqi ) 1 + dt − L(t, qi )dt
t1 dt t1
∫ t2 ( )
d(δt) ∂L ∂L (s)
= L + δt + (s) δqi (t) dt,
t1 dt ∂t ∂q i

habiendo reemplazado la Lagrangiana L(t + δt, q (s) + δq (s) ), por su desarrollo Taylor a primer
orden en las variaciones δt y δq (s) .
En la variación de δqi (t) = q ′ i (t′ ) − qi (t) está contenida una variación en la forma de la
(s) (s) (s)

(s)
función qi (t), y una variación de su argumento t, (ver gura 1.2), el cual también es afectado
por la transformación del grupo, y por lo tanto,

= q ′ i (t + δt) − qi (t) = q ′ i (t) − qi (t) + (dqi (t)/dt)δt


(s) (s) (s) (s) (s) (s)
δqi
(s) (s+1)
= δ̄qi (t) + qi (t)δt,

(s) (s)
donde δ̄qi (t) es la variación en la forma de la función qi (t) en el instante t. Sabiendo que
para la variación de forma a t constante
(s) (s−1)
δ̄qi (t) = ds (δ̄qi (t))/dts = d(δ̄qi (t))/dt,
40 CAPÍTULO 1. FORMALISMO LAGRANGIANO

Figura 1.2: Transformación del punto A en el A′ , y de la curva q(t) en la q ′ (t′ ) bajo una
transformación innitesimal. La variación δq = q′ (t′ ) − q(t) = BA′ es la suma de la parte
BC = q (1) δt y la parte CA′ = δ̄q , que es la variación a t constante de la función q , y que aquí
la denominamos la variación en forma de la función.

resulta que
∫ ( )
t2
d(δt) ∂L ∂L (s) ∂L (s+1)
δA[ q ] = L + δt + (s) δ̄qi (t) + (s) qi δt dt
t1 dt ∂t ∂qi ∂qi
∫ ( )
t2
d(Lδt) ∂L (s)
= + (s) δ̄qi (t) dt. (1.22)
t1 dt ∂qi
donde el primer término es la suma del primero, segundo y cuarto de la integral anterior.
Si reemplazamos en los últimos términos

∂L ∂L
δ̄qi = δ̄qi ,
∂qi ∂qi
( ) ( )
∂L (1) ∂L d(δ̄qi ) d ∂L d ∂L
δ̄q
(1) i
= (1) dt
= δ̄qi − δ̄qi ,
∂qi ∂qi dt ∂q (1) dt ∂q (1)
( ) (
i
) i
∂L (2) d ∂L (1) d ∂L (1)
(2)
δ̄qi = (2)
δ̄qi − (2)
δ̄qi
∂qi dt ∂q dt ∂q
i i
( ) ( ( ( ) ) )
d ∂L (1) d d ∂L d2 ∂L
= δ̄q − δ̄qi + 2 δ̄qi ,
dt ∂q (2) i dt dt ∂q (2) dt ∂q
(2)
i i i
( ) ( ( ) ) ( )
∂L d ∂L d d ∂L k
(k) (k−1) (k−2) k d ∂L
δ̄qi = δ̄q − δ̄qi + · · · + (−1) k δ̄qi ,
(k)
∂qi dt ∂q (k) i dt dt ∂q (k) dt ∂q
(k)
i i i
y juntando términos, obtenemos
∫ t2 {
d(Lδt)
δA[ q ] = dt +
t1 dt
1.4. TEOREMA DE NOETHER GENERALIZADO 41
[ ( ) ( )]
∂L d ∂L d k ∂L
+δ̄qi − + · · · + (−1)k k (1.23)
∂qi dt ∂q (1) dt (k)
∂qi
( [ i
( ) ( )])
d ∂L d ∂L dk−1 ∂L
+ δ̄qi (1)
− (2)
+ · · · + (−1)k−1 k−1 (k)
(1.24)
dt ∂qi dt ∂q dt ∂q
( [ (i ) (i )])
d ∂L d ∂L dk−2 ∂L
(1)
+ δ̄qi (2)
− (3)
+ · · · + (−1)k−2 k−2 (k)
(1.25)
dt ∂qi dt ∂qi dt ∂qi
( [ ])}
d (k−1) ∂L
+ ··· + δ̄qi (k)
. (1.26)
dt ∂q i

Los términos entre paréntesis cuadrados [ . . . ], (1.24-1.26) reciben el nombre de momentos


canónico-conjugados pi(s) , excepto el primero (1.23), que es el miembro de la izquierda de las
ecuaciones de Euler-lagrange (1.4) y que se anula idénticamente si las funciones qi satisfacen las
ecuaciones dinámicas. El integrando de la variación del funcional acción queda escrito, salvo el
término (1.23), en una suma de términos que son derivadas totales con respecto a t.

Momentos canónico-conjugados: Para sistemas Lagrangianos ordinarios que dependen única-


mente de derivadas de primer orden, el momento canónico-conjugado de la variable generalizada
qi es una variable dinámica pi , denida por

∂L
pi = .
∂ q̇i

Como generalización de esto, para sistemas Lagrangianos con derivadas de orden superior, el for-
malismo canónico generalizado se obtiene deniendo como variables generalizadas los grados de
(s)
libertad qi y sus derivadas temporales qi hasta el orden k − 1, es decir las variables generalizadas
son todas las variables cinemáticas excluído el tiempo. Entonces cada variable generalizada posee
16
un momento canónico conjugado denido de acuerdo con los paréntesis cuadrados anteriores:
( ) ( )
∂L d ∂L dk−1 ∂L
pi(1) = − + · · · + (−1) k−1
(1.27)
(1)
∂qi dt ∂qi
(2) dtk−1 (k)
∂qi
( ) ( )
∂L d ∂L dk−2 ∂L
pi(2) = − + · · · + (−1) k−2
(1.28)
(2)
∂qi dt ∂qi
(3) dtk−2 (k)
∂qi
...
∂L
pi(k) = (k)
(1.29)
∂qi
(s−1)
Se dice que pi(s) es el momento conjugado de la variable qi
y como regla general se ve que en
(s)
su denición, el primer término contiene la derivada parcial de L
con respecto a qi , es decir a la
(s−1)
primera derivada temporal de la correspondiente variable generalizada canónico conjugada qi .
Se puede ver de su denición que estos momentos satisfacen

∂L dpi(s+1)
pi(s) − (s)
=− , i = 1, . . . , n, s = 1, . . . , k − 1. (1.30)
∂qi dt

Con esta denición de los momentos canónicos, las ecuaciones de Euler-Lagrange (1.4) se escriben:

dpi(1) ∂L
= , i = 1, . . . , n. (1.31)
dt ∂qi
De esta manera, si la Lagrangiana no es función explícita de algún grado de libertad qi , entonces
el correspondiente momento canónico conjugado pi(1) , es una constante del movimiento.

Si introducimos en el integrando las variables qi que satisfacen las ecuaciones de Euler-


Lagrange, el término (1.23) es idénticamente nulo y la variación del funcional acción (1.22) se
16
E.T.Whittaker, Analytical Dynamics, Cambridge University Press, Cambridge (1927), p. 265.
42 CAPÍTULO 1. FORMALISMO LAGRANGIANO

transforma en la variación de la función acción a lo largo de la trayectoria clásica, y por lo tanto,


la variación de la función acción queda escrita como la integral de una derivada total,
∫ t2
d { (
(1) (k−1)
)}
δA(x1 , x2 ) = Lδt + δ̄qi pi(1) + δ̄qi pi(2) + · · · + δ̄qi pi(k) dt, (1.32)
t1 dt

donde los pi(s) están dados en (1.27-1.29). Si reemplazamos en (1.32) la variación en forma
(s) (s) (s+1)
δ̄qi = δqi − qi δt, entonces
∫ t2
d { (s−1) (s)
}
δA(x1 , x2 ) = Lδt + δqi pi(s) − qi pi(s) δt dt (1.33)
t1 dt

con el criterio habitual de suma sobre índices repetidos. Si sustituimos las variaciones δt = M0 δg
(s) (s)
y δqi = Mi δg , en términos del elemento innitesimal del grupo δg , (1.18-1.21), obtenemos:
∫ t2
d {( (s)
)
(s−1)
}
δA(x1 , x2 ) = L − pi(s) qi M0 + pi(s) Mi δgdt, (1.34)
t1 dt

donde el rango de suma para cada índice repetido es, i = 1, . . . , n, s = 1, . . . , k , y donde el


parámetro innitesimal del grupo δg se puede sacar fuera de la integral.
Como en la integral anterior estamos usando una solución de las ecuaciones dinámicas, las
cuales son invariantes bajo la transformación, la variación de la función acción

δA(x1 , x2 ) = A(δgx1 , δgx2 ) − A(x1 , x2 ),

es tal que a primer orden en el parámetro innitesimal del grupo la podemos poner como

δA(x1 , x2 ) = λ(x2 )δg − λ(x1 )δg, (1.35)

que es equivalente a que la Lagrangiana transforme bajo una transformación innitesimal como

e
L(δgx, e ẋ) + δg dλ(x) ,
δg ẋ) = L(x,

que implica que las ecuaciones dinámicas son invariantes. Igualando (1.35) a (1.34) podemos
realizar la integral temporal de (1.34) que se reduce al término entre corchetes evaluado en
t2 menos él mismo evaluado en t1 . El valor del parámetro δg del grupo se cancela en ambos
miembros, y reagrupando los términos que dependen de t1 a la izquierda y los de t2 derecha,
obtenemos un observable que toma los mismos valores en los dos instantes arbitrarios t1 y t2 .
Es, por lo tanto, una constante del movimiento y representa la magnitud física conservada
( )
(s) (s−1)
N = λ(x) − L − pi(s) qi M0 (t, q) − pi(s) Mi (t, q, . . . , q (s) ). (1.36)

(s)
El término entre paréntesis H = pi(s) qi − L, suma de los productos de cada momento por
la derivada temporal de la correspondiente variable generalizada canónico conjugada menos la
Lagrangiana, recibe el nombre de Hamiltoniano generalizado, de tal manera que nalmente

(s−1)
N = λ(x) + HM0 (t, q) − pi(s) Mi (t, q, . . . , q (s) ). (1.37)

Si el grupo de simetrías tiene r parámetros, existen r constantes del movimiento relacionadas


con las transformaciones innitesimales (1.35) de la función acción bajo el correspondiente grupo
de Lie de r parámetros.
La expresión (1.37) es una función lineal en el Hamiltoniano y los momentos canónicos
donde los coecientes, además de la función λ(x) asociada a la no invariancia de la Lagrangiana,
1.4. TEOREMA DE NOETHER GENERALIZADO 43

son funciones de las variables cinemáticas. Si consideramos que el Hamiltoniano fuera el mo-
mento conjugado de la variable tiempo, aparece en cada término el correspondiente momento
multiplicado por la forma innitesimal de transformar la correspondiente variable cinemática
(s) (s) (k−1)
canónico conjugada, δt = δgM0 , δqi = δgMi , s = 0, 1, . . . , k − 1, desde t hasta la qi .
La única diferencia es que el término del Hamiltoniano aparece afectado por el signo +, en
tanto que el resto de los pi aparecen con signo −. Tendríamos tantos momentos canónicos como
variables cinemáticas.
Como λ(x)δg tiene dimensiones de acción, todos los términos de (1.37) tienen las mismas
dimensiones que λ(x) y por lo tanto las constantes del movimiento Noetherianas tienen
la dimensión complementaria frente a la acción, de la dimensión del parámetro δg
del grupo de simetrías.
El Hamiltoniano y los diferentes momentos se escriben en términos de las funciones Fi (x, ẋ)
del desarrollo (1.8) de la Lagrangiana y de sus derivadas temporales, como vemos en este ejemplo.

Por ejemplo, si tenemos una Lagrangiana que depende hasta la derivada segunda de un grado
de libertad e r, u, ṫ, ṙ, u̇). La Lagrangiana L
r, L(t, r, dr/dt, d2 r/dt2 ) ≡ L(t, r, u, a), y la L(t, e se puede
escribir
e
e = ∂ L x˙i = Fi (x, ẋ)x˙i = T ṫ + Rṙ + U u̇,
L
∂ x˙i
donde las funciones T = ∂ L/∂e ṫ, R = ∂ L/∂
e ṙ y U = ∂ L/∂
e u̇, son funciones homogéneas de grado
cero de las derivadas ẋi , y por lo tanto son funciones de (t, r, u, a). Las variables cinemáticas son,
x ≡ {t, r, u} y las variables generalizadas son q ≡ {r, u} por lo que hay un momento canónico
conjugado de r , pr y otro pu el canónico conjugado de u. Vemos que:

∂L e ṫ) ∂ ṙ
∂(L/ 1 ∂L e ∂Le
= = ṫ = =R
∂u ∂ ṙ ∂u ṫ ∂ ṙ ∂ ṙ

ya que ṙ = uṫ. Análogamente

∂L e ṫ) ∂ u̇
∂(L/ 1 ∂L e ∂Le
= = ṫ = =U
∂a ∂ u̇ ∂a ṫ ∂ u̇ ∂ u̇

pues u̇ = aṫ.
El momento pr se dene de acuerdo con (1.27-1.29)como

( ) ( )
∂L d ∂L ∂Le d ∂Le dU
pr = − = − =R− ,
∂u dt ∂a ∂ ṙ dt ∂ u̇ dt

y el momento pu
∂L ∂Le
pu = = = U,
∂a ∂ u̇
que han quedado expresados en términos de las funciones Fi (x, ẋ) y de sus derivadas temporales.
La Lagrangiana
e ṫ = T + Ru + U a,
L = L/
y el Hamiltoniano generalizado

dU dU
H = pr u + pu a − L = Ru − u + U a − T − Ru − U a = −T − u.
dt dt

Los observables H y pi(s) son funciones homogéneas de grado cero en las derivadas de las
(s)
variables cinemáticas ẋi . Las funciones λ(x) y Mi (x) dependen únicamente de las variables
cinemáticas. En consecuencia, las constantes del movimiento Noetherianas son funciones homo-
géneas de grado cero en las derivadas de las variables cinemáticas y por lo tanto invariantes
bajo cambios arbitrarios del parámetro de evolución. Son funciones de las derivadas temporales
de los grados de libertad.
44 CAPÍTULO 1. FORMALISMO LAGRANGIANO

1.5. Principio atómico: Partículas elementales


En mecánica Newtoniana el sistema más simple es un punto de masa m. A partir de puntos
masivos se pueden construir sistemas arbitrarios de cualquier forma y masa, y por lo tanto cual-
quier distribución arbitraria de materia. El punto masivo se puede considerar como la partícula
elemental de la mecánica Newtoniana. Desde el punto de vista actual de la física de partículas
corresponde a la descripción clásica de una partícula sin espín. Sabemos que existen objetos
como electrones, muones, fotones, neutrinos, quarks y muchos otros, que pueden ser conside-
rados como partículas elementales en el sentido de que no parecen estar compuestos de otros
objetos. Más aún, no se ha encontrado en la naturaleza ninguna partícula elemental sin espín.
Es claro que el punto Newtoniano no da cuenta de la estructura clásica del espín y la existencia
del espín es un atributo fundamental de una partícula elemental, que no aparece en los objetos
elementales de la mecánica Newtoniana, por lo que es necesario describirlo adecuadamente.
En mecánica cuántica, el trabajo de Wigner 17 sobre las representaciones del grupo de Lo-
rentz inhomogéneo suministra una denición matemática muy precisa del concepto de partícula
elemental. Una partícula elemental es un sistema cuántico cuyo espacio de Hilbert de es-
tados puros, es el espacio de una representación unitaria, proyectiva e irreducible del grupo
de Poincaré. Las representaciones irreducibles del grupo de Poincaré se caracterizan por dos
parámetros invariantes m y S , la masa y el espín del sistema, respectivamente. Analizando las
diferentes representaciones irreducibles, podremos obtener la descripción de partículas con o sin
masa y de cualquier valor del espín.
La idea de irreducibilidad de Wigner lo que viene a decir es que todos los posibles estados
vectoriales puros se pueden construir, dentro del formalismo cuántico, a partir de uno cualquiera
de ellos. Comenzando en un estado cualquiera descrito por un observador inercial y añadiéndole
las descripciones que de ese estado hacen el resto de los observadores inerciales, y efectuando
las operaciones habituales de suma de vectores y de límites de sucesiones, se completa todo el
espacio de Hilbert. Aquí está patente la idea del principio atómico. No hay más estados que
las modicaciones cinemáticas de uno cualquiera de ellos. Si la partícula elemental cambia de
estado, siempre es posible encontrar otro observador inercial que la describa en el mismo estado
que anteriormente.
En la formulación Lagrangiana, si preparamos a la partícula elemental en el estado x1 para
evolucionar hasta el estado x2 , aceptado el Principio de Relatividad Restringido, el estado nal
y cualquier estado intermedio, se puede siempre obtener del estado inicial mediante un cambio
de observador inercial, es decir x2 = gx1 , para algún elemento g del grupo cinemático G. Esto no
es posible en un sistema arbitrario. Esto es lo que distingue a un sistema elemental de uno que
no lo es, que la variedad X , el espacio cinemático debe cumplir esta restricción, que, dados dos
puntos cualesquiera del mismo, siempre es posible encontrar alguna transformación cinemática
que los ligue. Llegamos pues al18

Principio atómico:Una partícula elemental clásica es un sistema Lagrangiano


cuyo espacio cinemático X es un espacio homogéneo del grupo cinemático G.

Los grupos de Galileo y de Poincaré son grupos de Lie de diez parámetros y por lo tanto los
espacios homogéneos más amplios que podemos encontrar en ellos son de dimensión 10. Además,
las variables que denen a los espacios homogéneos comparten con los parámetros del grupo
sus mismos dominios, su dimensionalidad y su signicación geométrica. Ambos grupos, como
veremos más adelante, se pueden parametrizar en términos de 10 variables (b, a, v, α) con los
siguientes dominios y dimensiones, b ∈ R representa un parámetro con dimensiones de tiempo
17
E.P. Wigner, Ann. Math. 40, 149 (1939)
18
M. Rivas, J. Phys. A 18, 1971 (1985); J. Math. Phys. 30, 318 (1989); J. Math. Phys. 35, 3380 (1994).
1.5. PRINCIPIO ATÓMICO: PARTÍCULAS ELEMENTALES 45

que nos caracteriza la traslación temporal, a ∈ R3 , 3 variables espaciales que caracterizan a


las traslaciones espaciales. El parámetro v ∈ R3 con dimensiones de velocidad y que representa
la velocidad relativa entre observadores, restringida a v < c en el caso Poincaré. Finalmente
α ∈ SO(3) son tres parámetros adimensionales que caracterizan la orientación relativa entre los
correspondientes sistemas cartesianos de referencia y que pertenecen a un dominio compacto,
que es una parametrización del grupo de rotaciones.
De esta forma, el máximo número de variables cinemáticas, para caracterizar el estado
cinemático de una partícula elemental, será 10. Representamos estas variables cinemáticas por
x ≡ (t, r, u, α) con los mismos dominios y dimensiones que los anteriores parámetros, y que
los interpretamos geométricamente como tiempo t, posición r , velocidad u del punto r y
orientación α de la partícula.
Como la Lagrangiana debe depender también de las siguientes derivadas temporales, llega-
mos a la conclusión de que L debe depender de la aceleración del punto r y de la velocidad
angular de la partícula. Es por lo tanto, un sistema de 6 grados de libertad. Tres r , representan
la posición de un punto y los otros tres α, su orientación en el espacio. Podemos visualizarlo me-
diante tres vectores unidad ortogonales ligados al punto r , como un sistema cartesiano comóvil.
Pero la Lagrangiana debe depender hasta la derivada segunda de r , es decir de la aceleración del
punto, y hasta la primera derivada de α, es decir, la velocidad angular. Los grupos de Galileo y
Poincaré conducen a Lagrangianas generalizadas que dependen de derivadas de segundo orden
de la posición de un punto.
Debido a esta denición, es el grupo cinemático G, asociado al Principio de Relatividad
Restringido el que determina completamente el espacio cinemático de una partícula elemental,
sobre el que se van a denir las posibles Lagrangianas. Las partículas puntuales son casos
particulares de esta denición ya que su espacio cinemático es el generado por las variables
(t, r), tiempo y posición. Dados dos puntos cualesquiera (t1 , r 1 ) y (t2 , r 2 ), con t2 > t1 , una
traslación espacio-temporal los liga, por lo que esta variedad es un espacio homogéneo tanto
del grupo de Galileo como del grupo de Poincaré, ya que las traslaciones son un subgrupo de
ambos grupos.
Cuanto más amplio sea el grupo cinemático, mayor número de variables tendremos para
caracterizar las posibles variables clásicas que denen el espacio cinemático de una partícula
elemental. De esta manera, el formalismo que se propone se puede acomodar a cualquier grupo
de simetrías. Solamente hace falta dar con el grupo adecuado, que no solamente dene las
simetrías sino que suministra las variables clásicas de los sistemas elementales. Este grupo está
todavía sin ser desvelado.

Ejemplo: Partícula puntual Galileana. Es un sistema mecánico de 3 grados de libertad, r, la


posición del punto. Posee por lo tanto 4 variables cinemáticas, x ≡ {t, r}. Si denimos el estado
inicial por x1 ≡ {t1 , r 1 } y el estado nal por x2 ≡ {t2 , r 2 }, vemos que una traslación espacio-
temporal transforma uno de los puntos en el otro, por lo que el espacio cinemático es un espacio
homogéneo del grupo de Galileo. Describe por lo tanto a una partícula elemental. Por supuesto
que el grupo de traslaciones también es subgrupo del grupo de Poincaré, por lo que la partícula
puntual también es una partícula elemental desde el punto de vista relativista. Obtendremos en el
capítulo siguiente que si la evolución es libre, esto es que las leyes dinámicas son invariantes bajo
G, la Lagrangiana resulta ser

( )2 2
1 dr e 0 = 1 m ṙ
L0 = m , L
2 dt 2 ṫ
en términos de los grados de libertad y también como función homogénea de grado 1 en términos de
las derivadas de las variables cinemáticas. Podemos ver que e0
L depende de las derivadas de todas las
variables cinemáticas. Las ecuaciones de Euler-Lagrange a partir de L0 se reducen a d2 r/dt2 = 0,
e imponemos como condiciones de contorno que la solución pase por los estados inicial y nal x1 y
x2 , respectivamente,
r2 − r1
r(t) = r 1 + (t − t1 ), t ∈ [t1 , t2 ]
t2 − t1
46 CAPÍTULO 1. FORMALISMO LAGRANGIANO

y que si hacemos la descripción en términos de un parámetro arbitrario τ, la solución queda:

t(τ ) = t1 + (t2 − t1 )(τ − τ1 )/(τ2 − τ1 ), r(τ ) = r 1 + (r 2 − r 1 )(τ − τ1 )/(τ2 − τ1 ), τ ∈ [τ1 , τ2 ].

Si redenimos el parámetro de evolución mediante θ = (τ − τ1 )/(τ2 − τ1 ), podemos tener un


parámetro de evolución adimensional tal que los instantes inicial y nal se corresponden con θ1 = 0
y θ2 = 1, con lo que

t(θ) = t1 + (t2 − t1 )θ, r(θ) = r 1 + (r 2 − r 1 )θ, θ ∈ [0, 1].

La función acción, es decir la integral de la Lagrangiana a lo largo del camino clásico vale

∫ ( )2
m t2
r2 − r1 m (r 2 − r 1 )2
A(x1 , x2 ) = dt = ,
2 t1 t2 − t1 2 t2 − t1

que nalmente se expresa en términos de las variables cinemáticas de los estados inicial y nal y
del único parámetro característico de la partícula elemental sin espín, que es la masa m.
La Lagrangiana e0
L se puede obtener de la función acción mediante el proceso de límite (1.10)
derivándola con respecto a las variables t2 y r 2 y haciendo el límite 2 → 1,
[ ] [ ]
∂A ∂A m (r 2 − r)2 (r 2 − r) · ṙ m ṙ 2 e0 .
lı́m ṫ + ṙ2i = lı́m − ṫ + 2 = =L
2→1 ∂t2 ∂r2i 2 2→1 (t2 − t)2 t2 − t 2 ṫ
El teorema de Noether nos va a llevar a que la energía y el momento lineal se expresen en términos
de las derivadas de la e0 ,
L en la forma:
( )2
∂Le0 1 ṙ 2 m dr e0
∂L ṙ dr
H=− = m 2 = , p= =m =m ,
∂ ṫ 2 ṫ 2 dt ∂ ṙ ṫ dt
funciones homogéneas de grado cero en términos de las derivadas de las variables cinemáticas, y
por lo tanto dependientes de las derivadas temporales de los grados de libertad. El resultado es
que las magnitudes conservadas son independientes del parámetro arbitrario de evolución τ.
Esta Lagrangiana es una función homogénea de grado 1 en las derivadas ṫ y ṙ , lo que nos permite
ponerla como una suma de tantos términos como variables cinemáticas:

e e
e 0 = ∂ L0 ṫ + ∂ L0 ṙi = −H ṫ + p · ṙ.
L
∂ ṫ ∂ ṙi

Ejemplo: Sistema no elemental. Supongamos un sistema material que viene caracterizado por
las siguientes variables cinemáticas: (t, r 1 , r 2 ), es decir el tiempo y la posición de dos puntos. Si doy
dos conjuntos de esos valores en los puntos extremos de la evolución x1 ≡ (t(τ1 ), r 1 (τ1 ), r 2 (τ1 )) y

x2 ≡ (t(τ2 ), r 1 (τ2 ), r 2 (τ2 )), no es posible encontrar un cambio de sistema de referencia inercial que

los ligue, ya que si la traslación temporal nos lleva t(τ1 ) a t(τ2 ) y la traslación espacial desplaza

r 1 (τ1 ) a r 1 (τ2 ), es imposible, en general, que traslade r 2 (τ1 ) a r 2 (τ2 ), salvo que estuvieran rígi-

damente ligados con r1 . El espacio cinemático no es un espacio homogéneo ni siquiera del grupo

de traslaciones. Este sistema de 6 grados de libertad no puede ser considerado como una partícula

elemental.

1.5.1. Aplicación del formalismo a grupos cinemáticos sencillos


Supongamos que admitimos que las leyes de la física son solamente invariantes por traslación
espacio-temporal. Esto equivale a que el grupo cinemático asociado al Principio de Relatividad
Restringido G, es el grupo de traslaciones espacio-temporales {R4 , +}, dependiente de cuatro
parámetros:
t′ = t + b, r ′ = r + a.
En este caso, el espacio homogéneo más amplio de G que podemos establecer es el propio G, por
lo que las posibles variables cinemáticas son (t, r), tantas como los parámetros b y a del grupo y
con sus mismas dimensiones y dominios. Estamos describiendo la partícula puntual localizada en
r . Como solamente poseemos como simetrías las traslaciones, el teorema de Noether solamente
nos produce la denición de los observables H y P , momento temporal y momento lineal,
1.6. ESTRUCTURA MÉTRICA DEL ESPACIO CINEMÁTICO 47

respectivamente, y la conservación del momento angular no queda descrita para esta partícula.
La Lagrangiana que describa este sistema será función de (t, r, u), siendo u = dr/dt la velocidad
del punto r .
Compliquemos un poco el grupo y admitamos que las leyes de la física son también inva-
riantes por rotación de los sistemas de referencia. Entonces el grupo G viene dado por

t′ = t + b, r ′ = R(α)r + a,

dependiente de siete parámetros. El espacio homogéneo más amplio será el propio grupo y ten-
dremos como variables cinemáticas a (t, r, α), tantas como los parámetros del grupo y diremos
que la partícula elemental, además de estar localizada en el punto r , posee una orientación des-
crita por las variables α. La Lagrangiana que describa este sistema será función de (t, r, u, α, ω),
dependerá, además de la velocidad del punto r , u = dr/dt, de la velocidad de cambio de la
orientación, o velocidad angular ω . Para este tipo de partícula, el teorema de Noether ya nos
brinda la denición de momento angular, al tener un grupo cinemático más amplio. Estamos
describiendo algo formalmente equivalente a un sólido rígido, pero sin especicar ni forma ni
tamaño.
El siguiente paso, que vamos a desarrollar en más detalle, es considerar que el grupo ci-
nemático también contiene transformaciones inerciales puras con desplazamiento relativo entre
observadores con velocidad constante (boosts). Introducimos en el grupo tres nuevos parámetros
de velocidad v , y por lo tanto podremos usar tres variables de velocidad como variables cinemá-
ticas. La Lagrangiana dependerá también de la derivada de la velocidad. Además, el teorema de
Noether nos producirá la denición de otro observable, el momento cinemático. Analizaremos
más adelante las dos posibilidades de usar bien el grupo de Galileo G o el de Poincaré P .

1.6. Estructura métrica del espacio cinemático


La variedad X , el espacio cinemático o espacio de estados de los sistemas dinámicos La-
grangianos, posee una estructura métrica. Es un espacio de Finsler en el que la métrica no
solamente es función del punto x sino que depende también de la derivada ẋ. En efecto, como
e ẋ) es una función homogénea de grado 1 en términos de las variables ẋi , resulta que L
L(x, e2
es una función homogénea de grado 2 de las variables ẋ . Si reemplazamos ẋ por λẋ ≡ y i ,
i i i
e 2 (x, λẋ) = L
L e 2 (x, y) = λ2 L
e 2 (x, ẋ). Si derivamos dos veces con respecto a λ y hacemos luego
λ = 1,
e2 e2
2L
e 2 ∂ L i e 2 ∂ i j
2λL = ẋ , 2L = i j ẋ ẋ
∂y i ∂y ∂y
λ=1
Por lo tanto puede escribirse como

1 ∂2L e2
e 2 = gij (x, ẋ)ẋi ẋj ,
L gij (x, ẋ) = = gji
2 ∂ ẋi ∂ ẋj
donde las funciones gij (x, ẋ) son homogéneas de grado cero en las ẋi y por lo tanto involucran
solamente derivadas temporales. Pero además de depender del punto x, son funciones de las ẋ.
Un espacio métrico en el que la métrica es también función de las derivadas de las variables del
espacio recibe el nombre de espacio de Finsler(1934)19 20 .
19
P. Finsler, Über Kurven und Flächen in allgemeinen Räumen. Disertation, Götingen 1918.; G.S. Asanov,
Finsler geometry, Relativity and Gauge theories, (Reidel Pub. Co, Dordrecht 1985); H. Rund, The Hamilton-
Jacobi theory in the calculus of variations, (Krieger Pub. Co., N.Y 1973). H. Rund, The dierential geometry of
Finsler spaces, (Springer, Berlin, 1959).
20
Paul Finsler Nacido el 11 Abril 1894 en Heilbronn, Neckar, Alemania, y fallecido en Zurich,
Suiza, el 29 de Abril de 1970. Se dedicó a la geometría diferencial y a la teoría de conjuntos.
48 CAPÍTULO 1. FORMALISMO LAGRANGIANO


e=±
Como ±L e 2 , el problema variacional en el espacio cinemático X se reescribe
L
∫ τ2 ∫ τ2 √ ∫ τ2 √
e ẋ)dτ =
L(x, e 2 (x, ẋ)dτ =
L gij (x, ẋ)ẋi ẋj dτ =
τ1 τ1 τ1

∫ x2 √ ∫ x2
= gij (x, ẋ)dxi dxj = ds,
x1 x1

pudiendo interpretar ds como el diferencial de arco de la curva que une los puntos extremos
de la evolución en el espacio cinemático X . Al postular que la distancia que recorre el sistema
dinámico en el espacio X entre x1 y x2 debe ser mínima, estamos transformando el problema
variacional de hacer extremal la acción del sistema mecánico en un problema geodésico en un
espacio métrico. La evolución de todo sistema dinámico entre los estados inicial x1 y nal x2 ,
sigue una geodésica del espacio X . Y esto es independiente de que el sistema dinámico sea un
sistema arbitrario o sea una partícula elemental. Incluso en este caso, es independiente de que la
partícula sea libre o esté sometida a una interacción. Lo que sucede es que entre una partícula
libre y otra en interacción, la Lagrangiana, y por lo tanto la métrica, son distintas, es decir,
toda interacción modica la métrica del espacio cinemático de la partícula libre.
Si utilizamos transformaciones del espacio cinemático que dejan invariante a la Lagrangiana,
entonces, bajo estas transformaciones, las magnitudes gij transforman como las componentes
covariantes de un tensor simétrico de dos índices.
Dadas las ecuaciones de Euler-Lagrange de un sistema dinámico, el problema variacional
implica que debemos buscar soluciones de estas ecuaciones que pasen por los puntos extremos
x1 y x2 . Esto, en general, no tiene por qué poseer solución para puntos arbitrarios. Si preparamos
al sistema en el punto x1 , diremos que el punto x2 está causalmente conectado con x1 , si las
ecuaciones de Euler-Lagrange entre esos puntos poseen solución. En caso contrario diremos que
están causalmente desconectados y no podemos llevar, por evolución dinámica, el sistema del
estado x1 al estado x2 . Como L e 2 > 0, la métrica del espacio es denida positiva entre los estados
causalmente conectados, por lo que en la variedad X si entre dos puntos innitesimalmente
próximos y para velocidades adecuadas no se satisface que entre ellos gij (x, ẋ)dxi dxj > 0,
entonces no es posible que estén conectados causalmente y por lo tanto la evolución entre ellos
no está permitida.

Para la partícula puntual relativista libre de masa m, la Lagrangiana se escribe


e 0 = ±mc
L ẋ20 − ṙ 2 , x0 = ct.

Si reescalamos e0
L dividiéndola por la constante mc, la Lagrangiana tiene ahora dimensiones de
(0)
longitud donde claramente se ve que la métrica resulta ser gµν = ηµν , la métrica de Minkowski,
e
con ηµν = diag(1, −1, −1, −1). Como L > 0 eso implica que para todo τ se tiene que cumplir que
2

e 2 = gµν
L ẋ ẋ = c2 ṫ2 − ṙ 2 > 0,
(0) µ ν

por lo que los puntos causalmente conectados son aquellos que se alcanzan a partir de uno dado

con la condición de que la partícula se mueva con u2 = ṙ 2 /ṫ2 < c2 , es decir u < c. Dado x1 los

puntos causalmente conectados con él son los del interior de su cono de luz del futuro. El resto de

los puntos del espacio cinemático (que en este caso se reduce al espacio-tiempo) están causalmente

desconectados. Son los puntos del pasado, los de su cono de luz y aquellos que quedan fuera de

éste. En esos casos ηµν ẋµ ẋν ≤ 0, y las ecuaciones de Euler-Lagrange no suministran solución física.

Consideraba que los conjuntos eran como números generalizados con los que se podían establecer
técnicas aritméticas. Fue Elie Cartan quien en 1934, publica un libro titulado Les espaces de Finsler,
donde denomina espacios de Finsler a los espacios métricos que estamos estudiando.
1.6. ESTRUCTURA MÉTRICA DEL ESPACIO CINEMÁTICO 49

Dada la estructura general de la L e = Fi (x, ẋ)ẋi , con Fi = ∂ L/∂


e ẋi , es fácil ver que los
coecientes de la métrica se escriben como
( )
1 ∂2L e2 ∂ ∂ e
L 2e
gij = = e
L = F i Fj + e ∂ L = Fi Fj + L
L e ∂Fi , (1.38)
i
2 ∂ ẋ ∂ ẋ j ∂ ẋ i ∂ ẋj i
∂ ẋ ∂ ẋj ∂ ẋj

coecientes que son simétricos en sus índices pues ∂Fi /∂ ẋj = ∂Fj /∂ ẋi .
Para la partícula puntual libre reescalada,

∂Le0 ẋµ ∂Fµ ηµν ẋµ ẋν


Fµ = = , = −
∂ ẋµ e0
L ∂ ẋν e
L0 e3
L 0
( )
e0 ∂F µ ẋ µ ẋν e0 η µν ẋµ ẋ ν
gµν = Fµ Fν + L = +L − = ηµν
∂ ẋν Le2 e0
L Le3
0 0

tanto para e0
L como para e0 .
−L

En general, el espacio cinemático tendrá una métrica que será función de punto x si es que la
Lagrangiana lo es, pero lo que siempre resultará es que es ineludible que sea función de las ẋi .
En el caso de la partícula puntual relativista libre, la métrica no depende ni de x ni de ẋ como
corresponde a un sistema libre en el que todos los puntos del espacio y todas las velocidades son
equivalentes. Pero si introducimos una interacción, y la intensidad de la interacción depende de
la velocidad, como en el caso de un campo magnético, la métrica va a dejar de ser constante y
en general dependerá de la velocidad del punto.

1.6.1. Geodésicas en un espacio de Finsler


Las magnitudes ẋi transforman como las componentes contravariantes de un vector sobre
X . Son las componentes del vector tangente a la trayectoria que sigue el punto característico
del sistema dinámico en el espacio cinemático X . Si la Lagrangiana L e es invariante bajo la
′ e ′ ′ e e ẋi , transforman
transformación x → x , L(x , ẋ ) = L(x, ẋ), entonces las magnitudes Fi = ∂ L/∂
como las componentes covariantes de un vector sobre X .

e ẋ)
∂ L(x, e ′ , ẋ′ ) ∂ ẋ′ j
∂ L(x

∂ ẋ j
Fi (x, ẋ) = = = Fj (x′ , ẋ′ ).
∂ ẋi ∂ ẋ′ j ∂ ẋi ∂ ẋi

Podemos denir las componentes covariantes del vector tangente con el uso del tensor métrico

ẋi = gij ẋj .

Como
e e e ẋ)
e = ∂ L(x, ẋ) ẋi ,
L L e ∂ L(x, ẋ) ẋi = gij ẋi ẋj = ẋi ẋi ,
e2 = L e
⇒ ẋi = gij ẋi = L
∂ L(x, e i
= LF
∂ ẋi ∂ ẋi ∂ ẋi
e 2 representa el valor absoluto al cuadrado del vector tangente a la trayectoria, y el
con lo que L
vector
e ẋ)
∂ L(x, ẋi
Fi = = , Fi F i = 1,
∂ ẋ i
Le
representa al vector unidad tangente.
Si derivamos ẋi con respecto a ẋj , tenemos
( ) ( )
∂ ẋi ∂ ∂ Le ∂ 1 ∂ e2
L 1 ∂2L e2
= Le = = = gij .
∂ ẋj ∂ ẋj ∂ ẋi ∂ ẋj 2 ∂ ẋi 2 ∂ ẋi ∂ ẋj
50 CAPÍTULO 1. FORMALISMO LAGRANGIANO

Las ecuaciones geodésicas, son las ecuaciones de Euler-Lagrange, es decir


( )
e
∂L d ∂Le
− = 0.
∂xi dτ ∂ ẋi

e
∂L 1 ∂Le2 1 ∂(gjk ẋj ẋk ) ẋj ẋk ∂gjk
= = = ,
∂xi 2Le ∂xi 2Le ∂xi 2L e ∂xi
y
∂L e ẋi 1
= Fi = = gij ẋj .
∂ ẋ i
Le e
L
( )
d e
∂L 1 dLe 1 dgij j 1
= − gij ẋj + ẋ + gij ẍj .
dτ ∂ ẋ i e
L dτ
2 e
L dτ e
L
Por otra parte
dgij ∂gij k ∂gij k 1 dL e 1 d(log L) e
= ẋ + ẍ , = ,
dτ ∂xk ∂ ẋk e 2 dτ
L e dτ
L
con lo que podemos eliminar las L e de todos los denominadores, y si escogemos el parámetro
de evolución como la longitud del arco, L e = 1 y log L e = 0, nos quedan las ecuaciones de las
geodésicas
1 ∂gjk j k ∂gij j k ∂gij j k
gij ẍj = ẋ ẋ − ẋ ẋ − ẋ ẍ . (1.39)
2 ∂xi ∂xk ∂ ẋk
Sin embargo el último término es nulo debido a la simetría del tensor métrico, pues
( )
∂gij 1 ∂3L e2 ∂gik
= = ,
∂ ẋk i j
2 ∂ ẋ ∂ ẋ ∂ ẋ k ∂ ẋj

y al contraer con ẋj , resulta ∂gik /∂ ẋj ẋj = 0, pues el tensor gij es función homogénea de grado
cero en las ẋ. Por otra parte, en el segundo término los índices j, k son mudos por lo que lo
podemos escribir como ( )
∂gij j k 1 ∂gij ∂gik
ẋ ẋ = + ẋj ẋk .
∂xk 2 ∂xk ∂xj
Las componentes contravariantes del tensor métrico se denen como habitualmente g li gij = δil .
Si usamos este tensor, contrayendo en (1.39) con g li , nos quedan en la forma

ẍl + Γljk ẋj ẋk = 0, (1.40)

con ( )
1 ∂gij ∂gik ∂gjk
Γljk = g li k
+ j
− = Γlkj ,
2 ∂x ∂x ∂xi
donde los símbolos de Christoel Finslerianos se denen de la misma forma que en el caso
Riemanniano en términos de las derivadas con respecto a las x, del tensor métrico. A diferencia
del caso Riemanniano, son funciones de x y también de ẋ.
Una expresión alternativa de las ecuaciones de las geodésicas es
( )
1 ∂gkl ∂gik ∂gil
j k l
gij ẍ = Ψikl ẋ ẋ , Ψikl = − − k = Ψilk . (1.41)
2 ∂xi ∂xl ∂x
El espacio cinemático X es, en general, un espacio de Finsler con torsión. El tensor de torsión
de Cartan, es un tensor simétrico
( )
1 ∂gij 1 ∂3L e2
Cijk = = ,
2 ∂ ẋk 4 ∂ ẋi ∂ ẋj ∂ ẋk
1.6. ESTRUCTURA MÉTRICA DEL ESPACIO CINEMÁTICO 51

en todos sus índices. Los espacios de Riemann son espacios sin torsión de Cartan, porque la
métrica es independiente de las derivadas de las ẋ.
Postular, como hace la Relatividad General, que la gravedad produce una modicación de
la métrica del espacio cinemático de la partícula puntual, esto es, del espacio-tiempo, en la que
los coecientes gij (x) resultan ser solamente funciones de punto, es establecer una restricción
matemática fuerte sobre las posibles métricas, ya que éstas pueden, en general, ser funciones
también de las ẋ. Por eso consideramos que en su estatus actual la Relatividad General es una
especie de límite de baja velocidad de una teoría de la gravitación más general. La segunda
restricción es que en la naturaleza no existen partículas elementales sin espín, por lo que la
gravedad, lo que modicaría sería la métrica del espacio cinemático de la partícula elemental
con espín, que resulta ser una variedad más amplia que el espacio-tiempo, como veremos a lo
largo de este curso.
Como conclusión nal, diríamos que la Relatividad General parece ser una teoría de la
gravedad de materia sin espín, moviéndose a baja velocidad. 21

1.6.2. Ejemplo: partícula puntual en un campo electromagnético

La partícula puntual de masa m y de carga e en presencia de un campo electromagnético


externo viene descrita por L e=L e0 + Le I , con L
e 0 = −pµ (ẋ)ẋµ = −H ṫ + p · ṙ , L
e I = −eAµ (x)ẋµ ,
de manera que el problema variacional en el mismo espacio cinemático que la partícula libre,
esto es el espacio-tiempo, es un problema geodésico con una métrica, en el caso relativista, dada
por
∂pµ
gµν (x, ẋ) = m2 c2 ηµν + e2 Aµ Aν + e(pµ Aν + pν Aµ ) + eAσ ẋσ ν . (1.42)
∂ ẋ
La modicación de la métrica se anula cuando e → 0. Como el tetramomento lineal mecánico
pµ no depende explícitamente de las x, la dependencia de la métrica de las x, lo es a través de
los campos externos Aµ (x). Pero depende de las variables ẋ a través de su dependencia de las
pµ y de sus derivadas. En el límite de baja velocidad, cuando u/c → 0, p0 = mc y pi = 0, por lo
que nos resulta una métrica Riemaniana, que reescalando L e por un factor global mc y llamando
k = e/mc, L e I = −kAµ (x)ẋ , µ

g00 (x) = 1 + k 2 A20 + 2kA0 = (1 + kA0 (x))2 , gii (x) = −1 − kA0 (x) + k 2 A2i (x), i = 1, 2, 3,

g0i (x) = kAi (x) + k 2 A0 (x)Ai (x), gij (x) = k 2 Ai (x)Aj (x), i ̸= j = 1, 2, 3.
Así, en el caso de un campo eléctrico uniforme, A0 = E·r/c, A = 0, los coecientes no nulos de la
aproximación Riemaniana son g00 = (1+eE ·r/mc2 )2 , gii = −(1+eE ·r/mc2 ). Si lo que tenemos
es un campo magnético uniforme, A0 = 0, A = (r × B)/2, g00 = 1, gii = −1 + (e(r × B)/2mc)2i ,
g0i = e(r × B)i /2mc y nalmente gij = (e(r × B)/2mc)i (e(r × B)/2mc)j , con i ̸= j . En una
interacción en la que solamente tuviéramos una energía potencial, como en el caso habitual
gravitatorio, mA0 = mV (x)/c, y el g00 = (1 + V (x)/c2 )2 , gii = −(1 + V (x)/c2 ), como veremos
en los ejemplos analizados más adelante.
Las ecuaciones dinámicas las podemos determinar como las ecuaciones de Euler-Lagrange
obtenidas a partir de la Lagrangiana reescalada Le . En el ejemplo de la partícula puntual cargada

ẋµ ∂Le ∂Aµ ∂L e


e = −pµ ẋµ − kAµ ẋµ ,
L pµ = , = −k σ ẋµ , = −pσ − kAσ ,
(ẋ · ẋ)1/2 ∂x σ ∂x ∂ ẋσ
21
M. Rivas, Is General Relativity a simplied theory? J. Phys:Conference Series 437 (2013) 012008.(Ar-
Xiv:1203.4076); Is General Relativity a v/c ->0 limit of a Finsler geometry? (Contribution to the Spanish
Relativity Meeting 2012), Progress in Mathematical Relativity, Gravitation and Cosmology Guimaraes, Portu-
gal Sept 3-7, 2012 Springer ISBN 978-3-642-40156-5.
52 CAPÍTULO 1. FORMALISMO LAGRANGIANO

( )
d ∂L e ∂Aσ µ
= −ṗσ − k Ȧσ = −ṗσ − k ẋ , Fσµ (x) = ∂σ Aµ − ∂µ Aσ = −Fµσ (x),
dτ ∂ ẋσ ∂xµ
ẍσ (ẋ · ẍ)ẋσ
ṗσ = kFσµ (x)ẋµ , o bien− = kFσµ (x)ẋµ
(ẋ · ẋ)1/2 (ẋ · ẋ)3/2
Si en un sistema de referencia inercial el observador ja el parámetro de evolución como el
tiempo τ = t, las ecuaciones dinámicas son
dH dp
= eE · u, = e (E + u × B) .
dt dt
La primera de estas ecuaciones es consecuencia de la segunda y de que para una partícula
elemental puntual H 2 − p2 c2 = m2 c4 , es un invariante. La segunda de las ecuaciones, para la
posición del punto, se transforma en
d2 r e [ u ]
= E + u × B − (u · E)
dt2 mγ(u) c2
Otra forma alternativa es construir las ecuaciones de las geodésicas a partir de la métrica
que se obtiene derivando dos veces la L e 2 . La métrica es
( )
k k(A · ẋ) ẋµ ẋν
2
gµν = ηµν + k Aµ Aν + (ẋµ Aν + ẋν Aµ ) + ηµν −
(ẋ · ẋ)1/2 (ẋ · ẋ)1/2 (ẋ · ẋ)
g00 = 1 + k 2 A20 + 2kγ(u)A0 + kγ(1 − γ 2 )(A0 − u · A/c),

gii = −1 + k 2 A2i + 2kγ(u)ui Ai /c − kγ(u)(A0 − u · A/c)(1 + γ 2 u2i /c2 )


g0i = k 2 A0 Ai − kγ(u)(Ai + A0 ui /c) + kγ 3 (A0 − u · A/c)ui /c,
gij = k 2 Ai Aj + kγ(u)(ui Aj + uj Ai )/c − kγ(u)3 (A0 − u · A)ui uj /c2 , i ̸= j.
Las ecuaciones geodésicas son (1.41), que para el espacio-tiempo quedan
gµν ẍν = Ψµλσ ẋλ ẋσ .
que a diferencia del caso Riemanniano, estos coecientes Ψµλσ son funciones de x y de ẋ, pero
funciones homogéneas de grado cero de las ẋ.
Si como antes, en un sistema de referencia inercial, jamos que el parámetro de evolución
es τ = t, como ṫ = 1 la primera de las ecuaciones resulta ser trivialmente ẗ = 0, por lo que
solamente deberemos plantear las otras tres
d2 ri µ
i dx dx
ν
+ Γ µν = 0,
dt2 dt dt
por lo que solo es necesario calcular los coecientes Γiµν .
El tensor de Cartan del espacio-tiempo en presencia de un campo electromagnético externo
no es en general nulo, por lo que el espacio-tiempo posee torsión, dada por
∂gµν ∂pµ ∂pµ 2
∂pν σ ∂ pµ
2Cµνλ = = eA µ + eAν + eA λ + eAσ ẋ .
∂ ẋλ ∂ ẋλ ∂ ẋλ ∂ ẋν ∂ ẋν ∂ ẋλ
Para este sistema de partícula puntual de Lagrangiana L e = −(ẋ · ẋ)1/2 − k(A · ẋ), el tensor de
torsión simétrico en sus índices, y que es lineal en los potenciales Aµ , toma la forma:
k k(A · ẋ)
2Cµνλ = (ηµλ Aν + ηµν Aλ + ηνλ Aµ ) − (ηµλ ẋν + ηµν ẋλ + ηνλ ẋµ )
(ẋ · ẋ)1/2 (ẋ · ẋ)3/2
k 3k(A · ẋ)
− (ẋµ ẋλ Aν + ẋµ ẋν Aλ + ẋν ẋλ Aµ ) − ẋµ ẋν ẋλ .
(ẋ · ẋ)3/2 (ẋ · ẋ)5/2
1.6. ESTRUCTURA MÉTRICA DEL ESPACIO CINEMÁTICO 53

1.6.3. Otros ejemplos de espacios de Finsler

En la gura 1.3 se muestran posibles movimientos de una partícula puntual cargada en su


espacio cinemático, que en este caso es el espacio-tiempo, en cuatro situaciones dinámicas. 22

Figura 1.3: Cuatro movimientos de una partícula puntual en su espacio cinemático, entre
los puntos x1 y x2 , (a) en el caso libre, (b) en presencia de un campo magnético B , (c)
movimiento libre visto desde un observador acelerado o movimiento en presencia de un
campo gravitatorio uniforme g. El ejemplo (d) es el análisis gravitatorio en presencia de
una masa M situada en el origen del sistema de referencia que crea un campo Newtoniano.
En los cuatro casos el espacio cinemático es el mismo, el espacio-tiempo, pero con métricas
Finslerianas diferentes que producen trayectorias que en el espacio tridimensional son, en
el caso (a) una recta sin torsión ni curvatura, en (b) con torsión y curvatura, y en (c) y
(d) una trayectoria plana con curvatura.

Las cuatro trayectorias son geodésicas del espacio-tiempo pero con respecto a cuatro métri-
cas diferentes. En la parte (a) el movimiento es libre, la trayectoria es una recta; en (b) está
sometida a un campo magnético uniforme, y su trayectoria espacial tiene curvatura y torsión.
En este caso la métrica Finsleriana del espacio-tiempo es diferente de la métrica del caso libre.
El campo magnético externo la modica. En (c) es la misma trayectoria libre pero vista desde
un observador acelerado. De acuerdo con el principio de equivalencia esto equivale a la presen-
cia de un campo gravitatorio constante. También en este caso la métrica ha sido modicada.
Finalmente, en (d) analizamos el movimiento de la partícula puntual en un campo gravitatorio
Newtoniano producido por una masa M localizada en el origen del sistema de referencia inercial
que hace el análisis.
Los ejemplos que siguen, relativos al movimiento de una partícula de masa m, vamos a
reescalar la Lagrangiana dividiéndola por el factor mc, con lo que Le tendrá ahora dimensiones
de longitud. Conviene recordar, que si la evolución se expresa en términos de un parámetro
adimensional τ , los coecientes de la métrica gµν son adimensionales, ya que las coordenadas
de los puntos del espacio-tiempo tienen dimensiones de longitud.

22
Este tema corresponde a una charla impartida en castellano por el autor en el IAC en Noviembre
de 2014. (http://iactalks.iac.es/talks/view/703) y a una videoconferencia, impartida en inglés en el VIA,
(http://viavca.in2p3.fr/site.html) en Enero de 2015.
54 CAPÍTULO 1. FORMALISMO LAGRANGIANO

(a) En el caso (a) la Lagrangiana reescalada de la partícula libre es



e0 = ±
L ẋ20 − ṙ 2 = Fµ ẋµ , e 20 = gµν ẋµ ẋν = c2 ṫ2 − ṙ 2 > 0,
L

la métrica es gµν = ηµν con ηµν = diag(1, −1, −1, −1). Es constante y corresponde a la métrica
de Minkowski.

(b) En el caso (b), supongamos un campo magnético uniforme en la dirección OZ , de inten-


sidad B . Podemos tomar como potencial vector A = (0, Bx, 0) y potencial escalar A0 = 0. La
Lagrangiana de la partícula puntual reescalada en este campo es

e B = − ẋ2 − ṙ 2 + eB xẏ = Fµ ẋµ ,
L F0 = −p0 , F1 = −p1 , F2 = −p2 +(eB/mc)x, F3 = −p3 .
0
mc
que conduce a la ecuación dinámica regida por la fuerza de Lorentz en un campo magnético

dp
= eu × B.
dt
ẋ0 c −ẋi −ui
p0 = √ =√ , pi = √ =√
ẋ20 − ṙ 2 c − u2
2
ẋ20 − ṙ 2 c2 − u2

De acuerdo con (1.42) con A0 = A1 = A3 = 0, A2 = Bx, llamando k = eB/mc, la formulación


variacional nos lleva a que el espacio-tiempo tiene la métrica

kxu2 uy kxuy ( 2 )
g00 = 1 + , g11 = −1 + c − u2y − u2z ,
(c2 − u2 )3/2 (c2 −u )
2 3/2

kxuy ( 2 )
g22 = −1 + k 2 x2 + 3c − 3u2x − 2u2y − 3u2z ,
(c2 −u )
2 3/2

kxuy ( 2 )
g33 = −1 + c − u2x − u2y ,
(c2 −u )
2 3/2

kxcux uy kxc kxcuy uz


g01 = − , g02 = − (c2 − u2x − u2z ), g03 = −
(c2 − u2 )3/2 (c2 − u2 )3/2 (c2 − u2 )3/2
kxux ( 2 ) kx kxuz ( 2 )
g12 = c − u2
x − u 2
z , g13 = ux uy uz , g23 = c − u2
x − u 2
z ,
(c2 − u2 )3/2 (c − u2 )3/2
2 (c2 − u2 )3/2
Como vemos, los coecientes son funciones de punto, es decir de la variable x, pero son función
además, de las tres componentes de la velocidad de la partícula ux , uy , uz , es decir gµν (x, ẋ). Si
la velocidad del punto es despreciable frente a c, los coecientes de la métrica quedan:

g00 = 1, g02 = −kx, g11 = −1, g22 = −1 + k 2 x2 , g33 = −1,

siendo nulos los demás, donde la dependencia de las velocidades ha desaparecido y se ha transfor-
mado en una métrica Riemanniana. Con esta métrica restringida obtendremos una Lagrangiana
eR
restringida L
Le 2R = c2 ṫ2 − ṙ 2 + k 2 x2 ẏ 2 − 2kxcṫẏ,

que diere de la Lagrangiana original en un término extra


(√ )
e 2B = L
L e 2R − 2kxẏ c2 ṫ2 − ṙ 2 − cṫ ,
1.6. ESTRUCTURA MÉTRICA DEL ESPACIO CINEMÁTICO 55

y por lo tanto la fuerza sobre la partícula no es la fuerza de Lorentz. Esta métrica no es solución
de vacío de las ecuaciones de Einstein, sino que produce un escalar de curvatura y tensor de
Einstein, que valen
−k 2 3k 2 3k 3 x k2 1 −k 2
R= , Gtt = , Gty = − , Gxx = , Gyy = (k 2 + 3k 4 x2 ), Gzz = ,
2 4 4 4 4 4
y los símbolos de Christoel no nulos son
1
Γttx = k 2 x/2, Γtxy = − k(1+k 2 x2 ), Γxty = −k/2, Γxyy = k 2 x, Γytx = k/2, Γyxy = −k 2 x/2.
2
e B , son
Con la fuerza de Lorentz las ecuaciones dinámicas que se obtienen de la Lagrangiana L
dux eB 1 duy eB 1 duz
= uy = kcuy , =− ux = − kcux , = 0,
dt mγ(u) γ(u) dt mγ(u) γ(u) dt
que nos lleva a que ux dux /dt + uy duy /dt + uz duz /dt = u · du/dt = 0, por lo que el movimiento
es con velocidad de módulo constante, el factor γ(u) es constante y la partícula se desplaza en
la dirección OZ con velocidad constante y rota a la vez que se desplaza con velocidad constante
en el plano XOY , con velocidad angular ω = eB/γ(u)m. Sin embargo las ecuaciones de las
geodésicas debidas a la métrica restringida que se deriva de L e R son

dux duy duz


= kcuy (1 − kxuy /c), = −kcux (1 − kxuy /c), = 0,
dt dt dt
que también conducen a que el movimiento sea con velocidad u constante. Siendo consecuentes
con el límite de baja velocidad, deberemos tomar en estas ecuaciones el límite cuando u/c → 0,
γ(u) → 1, y se reducen a las anteriores. Para la Lagrangiana restringida Le R , la fuerza sobre la
partícula es la fuerza de Lorentz en el límite de baja velocidad.

(c) En el ejemplo (c) de un campo gravitatorio uniforme, la dinámica vendría descrita por la
Lagrangiana
eg = L
L e 0 + g · r cṫ,
c2
que conduce a las ecuaciones dinámicas dp/dt = g , con p = γ(u)u, independientes de la masa
de la partícula. Esta Lagrangiana reescalada, desde el punto de vista geodésico corresponde a
una evolución en el espacio-tiempo con una métrica Finsleriana dada por:
( g · r )2 (g · r)
g00 = 1 + 2
− (3γ − γ 3 ) 2 ,
c c
u2i (g · r)
gii = −1 + γ(1 + γ 2 ) 2 , i = 1, 2, 3
c2 c
u i (g · r)
g0i = −(γ 3 − γ) , i = 1, 2, 3
c c2
ui uj (g · r)
gij = γ 3 2 , i ̸= j = 1, 2, 3
c c2
El término g · r tiene dimensiones de velocidad al cuadrado. Si la velocidad del punto es des-
preciable frente a c, los coecientes no nulos son los
( g · r )2
g00 = 1 + − 2(g · r)/c2 , gii = −1 + (g · r)/c2 , i = 1, 2, 3
c2
es decir ( g · r )2 ( g · r)
g00 = 1 − 2 , gii = − 1 − 2 , i = 1, 2, 3,
c c
56 CAPÍTULO 1. FORMALISMO LAGRANGIANO

donde la componente g00 es idéntica a la de la métrica de Rindler correspondiente a un obser-


vador uniformemente acelerado o a la presencia de un campo gravitatorio global constante.

(d) El último ejemplo el (d) es el de la partícula puntual en el potencial gravitatorio Newtoniano


de una masa puntual M situada en el origen del sistema de referencia. La Lagrangiana reescalada
es
eN = L
L e 0 + GM cṫ.
c2 r
A partir de aquí, y teniendo en cuenta (1.38) se obtiene la métrica de la partícula puntual en
un espacio con un potencial central. La métrica que resulta, es
( )
GM 2 GM
g00 = 1 + 2
− (3γ − γ 3 ) 2 ,
c r c r
u2i GM
gii = −1 + γ(1 + γ 2 ) , i = 1, 2, 3
c2 c2 r
ui GM
g0i = −(γ 3 − γ) , i = 1, 2, 3,
c c2 r
ui uj GM
gij = γ 3 2 2 , i ̸= j = 1, 2, 3.
c c r
Es una métrica Finsleriana que, en el caso de velocidades pequeñas frente a c, los únicos términos
que sobreviven son los términos diagonales,
( ) ( )
2GM G2 M 2 GM 2
g00 = 1 − 2 + 4 2 = 1− 2 ,
c r c r c r
que si el último término que va con G2 /c4 se considera despreciable, es el coeciente de la
métrica de Schwarzschild. Para los
( )
GM
gii = − 1 − 2 ,
c r
que de ser Schwarzschild tendría que salir −(1 − 2GM/c2 r)−1 . Vemos que los coecientes en el
caso de bajas velocidades se reducen al potencial gravitatorio de una masa central en el origen
M , dividido por c2 .
Este límite de baja velocidad de la métrica Finsleriana de la partícula en un potencial
Newtoniano, aparece como
( ) ( )
GM 2 2 2 GM
ds2 = 1 − 2 c dt − 1 − 2 (dr2 + r2 (dθ2 + sin2 θdϕ2 ))
c r c r
que es una métrica Riemanniana, estática, invariante por rotación. Si llamamos Rs = 2GM/c2
al radio de Schwarzschild, el escalar de curvatura y el tensor de Einstein aparecen como
Rs2
R= ,
r(2r − Rs )3
3Rs2 (24r − 7Rs )Rs (Rs − 3r)Rs (Rs − 3r)Rs sin2 θ
Gtt = , Grr = , Gθθ = , Gϕϕ = ,
8r3 (2r − Rs ) 4r2 (2r − Rs )2 (2r − Rs )2 (2r − Rs )2
por lo que no es solución de vacío de las ecuaciones de Einstein de la Relatividad General.
En los dos ejemplos gravitatorios, la aproximación Riemaniana de la métrica se ha traducido
en que el g00 Minkowskiano de la partícula libre se modica en la interacción gravitatoria en
′ = g (1 + V (r)/c2 )2 y los g en la forma g ′ = g (1 + V (r)/c2 ), siendo en ambos
la forma g00 00 ii ii ii
casos V (r) el potencial gravitatorio.
1.7. PRINCIPIO DE CAUSALIDAD 57

1.7. Principio de Causalidad

Entre los principios fundamentales enunciados no está incluido el Principio de Causa-


lidad. El contenido de este principio, que de forma coloquial viene a expresar que las cosas
no suceden porque sí, sino que cualquier efecto viene precedido por una causa que lo produce,
vamos a ver que está de alguna manera contenido en el Principio Variacional.
Podríamos considerar el Principio de Causalidad como la restricción impuesta al espacio
cinemático X por la condición de que la métrica Finsleriana debe ser denida positiva. Eso nos
dene en el espacio X , jado un punto, dos subvariedades, una desconectada causalmente con ese
punto y otra conectada, es decir, que si establezcemos un punto inicial para el planteamiento
variacional no se puede escoger en X cualquier otro punto para caracterizar el estado nal.
Solamente aquellos que pertenecen a la subvariedad causalmente conectada con él. Por una
parte está la echa del tiempo, lo que hace que ṫ(τ ) > 0, es decir que t2 > t1 , y por otra que
gij dxi dxj > 0. Si el Principio Atómico nos lleva a que X , para una partícula elemental, debe
ser necesariamente un espacio homogéneo de G, el Principio de Causalidad, una vez jado el
punto inicial de la evolución, nos restringe este espacio a una subvariedad del mismo. En el caso
particular de la partícula puntual se reduce al interior del cono de luz del futuro del punto inicial
de la evolución x1 . En general, con la métrica dada, si damos dos puntos arbitrarios x1 y x2 del
espacio cinemático X , el que exista un g ∈ G que los ligue no signica que causalmente puedan
estar conectados. Por ejemplo, para una partícula puntual si x1 ≡ (t1 , r 1 ) es el estado inicial,
lo podemos llevar a x2 ≡ (t1 , r 2 ), en el mismo instante t1 , mediante una traslación espacial,
pero este punto de X no podría ser el nal de la evolución ya que se ∫movería con velocidad
innita. Entre estos dos puntos, como puntos del espacio de Minkowski, ηµν dxµ dxν < 0. Esto
viene a conrmar que solamente entre aquellos puntos en los que gij dxi dxj > 0 sea claramente
denida positiva se va a dar una posible evolución, ya que los demás puntos estarían causalmente
desconectados. Si lo que evoluciona es una partícula puntual sin masa, entonces la variedad
causalmente conectada es la supercie del cono de luz, entre cuyos puntos la métrica espacio-
temporal es nula.
Las propias ecuaciones de Euler-Lagrange poseen solución única con condiciones de contorno
en el instante inicial, pero si damos como condiciones de contorno las variables cinemáticas en
los extremos de la evolución, que es como se plantea estrictamente el problema variacional, no
siempre existirá solución. Si existe solución se satisface el principio de causalidad y si no existe,
puede estar sugiriendo la imposibilidad de evolución entre esos puntos. Estos puntos no estarían
causalmente conectados.
La homogeneidad de X implica que todos los estados son equivalentes, y que jado uno de
ellos, el resto son los posibles estados en que pueden encontrar a la partícula elemental el resto
de los observadores equivalentes. Es el carácter denido positivo de la acción al cuadrado entre
dos puntos el que justica qué puntos pueden estar causalmente conectados.

1.8. Formalismo canónico generalizado

Las ecuaciones de Euler-Lagrange para los n grados de libertad qi , (1.4) forman un sistema
de n ecuaciones diferenciales ordinarias de orden 2k , por lo que para singularizar una solución, de
acuerdo con los teoremas de existencia y unicidad, nos basta con suministrar las 2kn condiciones
(s)
de contorno en el instante inicial t1 , qi (t1 ), i = 1, . . . , n, s = 0, 1, 2, . . . 2k − 1.
Ahora bien, redeniendo unas variables intermedias, toda ecuación diferencial de orden m se
puede reducir a un sistema de m ecuaciones diferenciales ordinarias de primer orden. En nuestro
(s)
caso a un sistema de 2kn ecuaciones de primer orden. Deniendo, como nuevas variables qi ,
58 CAPÍTULO 1. FORMALISMO LAGRANGIANO

s = 1, . . . , 2k − 1:
(1) (2) (2k−2)
dqi (1) dqi (2) dqi (3) dqi (2k−1)
= qi , = qi , = qi , ..., = qi
dt dt dt dt
hasta llegar a las n ecuaciones diferenciales nales (1.4), que aparecerían como en (1.31)
∂L d (1) (2k−1)
− pi(1) (t, qi , qi , . . . , qi ) = 0,
∂qi dt
a las cuales les suministraríamos como condiciones de contorno las 2kn condiciones en el instante
t1 , mencionadas anteriormente.
El formalismo canónico se basa en utilizar como variables intermedias las kn variables gene-
(s)
ralizadas qi , i = 1, . . . , n, s = 0, 1, 2, . . . , k − 1, es decir las variables cinemáticas con el tiempo
excluido y los kn momentos canónicos conjugados pi(s) . A las ecuaciones de primer orden que
se obtendrán se les denominará ecuaciones canónicas de Hamilton.
Como el Hamiltoniano generalizado está denido por


k
(s) (k)
H= pi(s) qi − L(t, qi , . . . , qi ), (1.43)
s=1

(k)
si de la dención del momento de orden k , pi(k) = ∂L/∂qi pudiéramos despejar las n derivadas
(k)
de orden máximo qi en términos de los n pi(k) , entonces la Lagrangiana quedaría escrita en
(s)
términos del tiempo t, de las kn variables canónicas qi , s = 0, . . . , k − 1 y de los n momentos
pi(k) . De esta forma el Hamiltoniano resultaría ser una función H(t, q, p), del tiempo, de las
variables canónicas y de sus momentos canónico conjugados. Entonces,


k−1
∂H (s)

k
∂H ∂H
dH = dqi + dp + dt, (1.44)
(s) ∂pi(r) i(r) ∂t
s=0 ∂qi r=1

Pero de su denición (1.43)


k
(s)

k
(s) ∂L ∑ ∂L k
(s)
dH = qi dpi(s) + pi(s) dqi − dt − (s)
dqi ,
∂t ∂q
s=1 s=1 s=0 i

El primero de los términos lo escribimos:


k
(s)

k
dq
(r−1)
i
qi dpi(s) = dpi(r) ,
dt
s=1 r=1

(r−1)
donde los coecientes de las dpi(r) son derivadas temporales de sus variables generalizadas qi ,
r = 1, . . . , k , canónico conjugadas. El segundo de los términos lo escribimos


k
(s)

k−1
(s) (k)
pi(s) dqi = pi(s) dqi + pi(k) dqi .
s=1 s=1

(s)
con lo que en los primeros sumandos solo hay diferenciales dqi de las variables generalizadas,
con s ≤ k − 1. Hacemos lo mismo con el último sumatorio


k
∂L (s) ∂L ∑ ∂L k−1
(s) ∂L (k)
(s)
dqi = dqi + (s)
dqi + (k) dqi ,
∂qi
s=0 ∂qi s=1 ∂qi ∂qi
1.8. FORMALISMO CANÓNICO GENERALIZADO 59

(k)
donde hemos destacado el último sumando que contiene la dqi . Pues bien, este último sumando
se cancela con el último de la expresión anterior, con lo que esos dos términos se condensan en
( )
∑k
(s)
∑ k
∂L (s) ∂L ∑
k−1
∂L (s)
pi(s) dqi − (s)
dqi = − dqi + pi(s) − (s) dqi ,
∂q ∂q i ∂q
s=1 s=0 i s=1 i

Pero de la denición de los momentos canónicos, tenemos las expresiones (1.30) y (1.31) que
nos llevan a que esta expresión quede:


k
(s)

k
∂L (s) dpi(1) ∑
k−1
dpi(s+1) (s) ∑
k−1
dpi(s+1) (s)
pi(s) dqi − (s)
dqi =− dqi − dqi = − dqi ,
dt dt dt
s=1 s=0 ∂qi s=1 s=0

(s)
donde las diferenciales dqi se extienden a todas las variables generalizadas. De esta forma,
recolectando términos, tenemos


k−1
dpi(s+1) (s)

k
dq
(r−1)
∂L
dH = − dqi + i
dpi(r) − dt, s = 0, 1, . . . , k − 1
dt dt ∂t
s=0 r=1

que si lo identicamos con (1.44) resulta ∂H/∂t = −∂L/∂t, y

∂H dpi(s+1)
(s)
=− , s = 0, 1, . . . , k − 1, i = 1, . . . , n,
∂qi dt

(r−1)
∂H dq
= i , r = 1, . . . , k, i = 1, . . . , n,
∂pi(r) dt
con lo que llegamos al sistema de 2kn ecuaciones de primer orden para las variables canónicas
q ′ s y p′ s, donde qi es la canónica conjugada de la pi(s+1) , s = 0, 1, . . . , k − 1,
(s)

(s)
dqi ∂H dpi(s+1) ∂H
= , = − (s) , i = 1, . . . , n, s = 0, 1, . . . , k − 1. (1.45)
dt ∂pi(s+1) dt ∂q i

que reciben el nombre de ecuaciones canónicas de Hamilton (1833).


La derivada temporal de cada variable canónica es la derivada parcial del Hamiltoniano con
respecto a la correspondiente variable canónico-conjugada. Si nos referimos a las variables q ′ s
la derivada parcial del Hamiltoniano aparece con un signo +, mientras que para las derivadas
de las p′ s la derivada parcial del Hamiltoniano aparece con un signo −. El conocimiento del Ha-
miltoniano, en vez del conocimiento de la Lagrangiana, nos suministra las ecuaciones dinámicas
del sistema material como ecuaciones de primer orden.
Se dene el corchete de Poisson de dos funciones A(q, p) y B(q, p) de las variables
canónico-conjugadas como
( )

n ∑k−1
∂A ∂B ∂A ∂B
{A(q, p), B(q, p)} = (s)
− (s)
∂q ∂pi(s+1) ∂pi(s+1) ∂q
i=1 s=0 i i

Esta operación corchete es antisimétrica {A, B} = −{B, A} y satisface las propiedades distri-
butivas
{A, B + C} = {A, B} + {A, C}, {A, BC} = {A, B}C + B{A, C}.
Para cualesquiera tres variables dinámicas A, B, C se cumplen las identidades de Jacobi:

{A, {B, C}} + {B, {C, A}} + {C, {A, B}} = 0.


60 CAPÍTULO 1. FORMALISMO LAGRANGIANO

Con esta notación, las ecuaciones canónicas de Hamilton se escriben:


(s)
dpi(s) (s) dqi
{pi(s) , H} = , {qi , H} = .
dt dt
La dinámica de cada variable canónica es el corchete de Poisson de esa variable con el Hamil-
toniano. No hay distinción entre variables generalizadas y momentos conjugados.
Si tenemos un observable arbitrario que pudiera ser también función del tiempo A(t, q, p), su
derivada temporal se escribiría como:
(s)
dA ∂A ∂A dq ∂A dpi(s+1)
= + (s) i + ,
dt ∂t ∂qi dt ∂pi(s+1) dt

∂A ∂A ∂H ∂A ∂H ∂A
= + (s) − (s)
= + {A, H}.
∂t ∂qi ∂p i(s+1) ∂p i(s+1) ∂q ∂t
i

Al espacio de dimensión 2kn generado por las q ′ s y las p′ s se le denomina espacio de


fases del sistema dinámico, de tal manera que jado un punto en este espacio, las ecuaciones
dinámicas suministran una única solución que pasa por él. En este sentido, las ecuaciones de
Euler-Lagrange con condiciones de contorno en el instante t1 son equivalentes a las ecuaciones
canónicas de Hamilton.
Aunque hemos incluido este apartado de la formulación canónica generalizada es simple-
mente por consistencia, de que también con Lagrangianas generalizadas es posible hacer el
formalismo Hamiltoniano de reducir el sistema de ecuaciones de Euler-Lagrange a un sistema
de ecuaciones de primer orden en las variables generalizadas q ′ s y p′ s. Sin embargo, no va a ser
necesaria para lo que sigue en este formalismo, ni siquiera para la cuantización del mismo. Los
momentos los utilizaremos para la construcción de las constantes del movimiento Noetherianas,
pero hay que resaltar que no estamos interesados en resolver las ecuaciones de la dinámica a
partir de condiciones iniciales en el instante t1 , sino buscar soluciones que pasen por los puntos
inicial y nal prejados de la formulación variacional y realzar el papel de las variables cinemá-
ticas como las que caracterizan en todo instante τ el estado de cualquier sistema dinámico.

1.8.1. Ecuaciones de Hamilton-Jacobi

La función principal de Hamilton es una función sobre el espacio cinemático del sistema
mecánico que se dene como la función acción del punto nal de la evolución. Históricamente
se la representa por S(x), y aunque aquí vamos a usar la letra S para representar al observable
espín, vamos a mantener esta notación en esta sección complementaria. Según esta denición:

S(x) ≡ A(x1 , x),

donde el punto inicial x1 es jo, pero arbitrario. La función principal de Hamilton resulta ser
una función del tiempo t y de las variables generalizadas q 's. Vamos a hacer la demostración
en el caso de una Lagrangiana ordinaria dependiente hasta las derivadas primeras de los grados
de libertad qi , L(t, q, q̇), pero su demostración se puede extender a Lagrangianas generalizadas.
Si en el instante nal de la evolución t, las condiciones de contorno q(t) cambiaran de forma
innitesimal q + δq , ¾cómo cambiaría esta función?
La variación del funcional acción a lo largo del camino q(t) y q(t) + δq(t) es
∫ t [ ]
∂L ∂L
A(q + δq) − A(q) = δA = dt δq + δ q̇
t1 ∂q ∂ q̇
1.8. FORMALISMO CANÓNICO GENERALIZADO 61

Figura 1.4: Modicación del punto nal de la evolución en el instante t y por lo tanto del
camino q(t). La variación de la δq es su variación en forma δ̄q , a t constante.

pero la variación de la δq es su variación de forma a t constante


( ) ( )
∂L ∂L d d ∂L d ∂L
δ q̇ = δq = δq − δq,
∂ q̇ ∂ q̇ dt dt ∂ q̇ dt ∂ q̇

con lo que nos queda


∫ t {[ ( )] ( )}
∂L d ∂L d ∂L
δA = dt − δq + δq
t1 ∂q dt ∂ q̇ dt ∂ q̇

Si la trayectoria q(t) es la que hace extremal al funcional acción entonces se anula el término
entre corchetes cuadrados y la variación del funcional acción se reduce a la variación de la
función acción
∂L ∂L ∂L
δA = δq − δq = (t) δq(t),
∂ q̇ t ∂ q̇ t1 ∂ q̇
pues δq(t1 ) = 0. Pero esto es la variación de la función principal de Hamilton δS cuando dejando
jo t, cambiamos el resto de las variables cinemáticas q ,

∂L ∂S
S(t, q + δq) − S(t, q) = δS(t, q) = δqi = pi δqi , ⇒ = pi . (1.46)
∂ q̇i ∂qi
donde pi es el momento conjugado de la variable qi en el instante t. Nos falta saber cómo cambia
la función principal de Hamilton, cuando modicamos el tiempo del punto nal, manteniendo
constantes los valores de las variables q en el instante nal y, por supuesto, en el instante inicial
t1 . La variación del funcional acción es
∫ t+δt ∫ t
′ ′ ′
A(q ) − A(q) = δA = L(t, q , q̇ )dt − L(t, q, q̇)dt.
t1 t1

En un instante intermedio de la evolución δq = δ̄q + q̇δt y δ q̇ = δ̄ q̇ + q̈δt, donde δ̄ representa la


variacion en forma, a t constante, de la correspondiente función. Pero

d
δ̄ q̇ = δ̄q.
dt
62 CAPÍTULO 1. FORMALISMO LAGRANGIANO

Figura 1.5: Modicación del punto nal de la evolución del instante t al instante t + δt,
manteniendo constantes en ese instante los valores de las variables q.

El desarrollo sigue la misma metodología que cuando demostramos el teorema de Noether,


incluyendo el cambio del intervalo de integración de (t1 , t + δt) a (t1 , t) y llegamos nalmente a
la expresión (1.22) que transcribimos de nuevo con el índice s = 0, 1:
∫ t( )
d(Lδt) ∂L ∂L
δA = + δ̄qi (t) + δ̄ q̇i (t) dt.
t1 dt ∂qi ∂ q̇i
Si el último término lo ponemos
( ) ( )
∂L ∂L d d ∂L d ∂L
δ̄ q̇i (t) = δ̄qi = δ̄qi − δ̄qi ,
∂ q̇i ∂ q̇i dt dt ∂ q̇i dt ∂ q̇i
nos queda ∫ { [ ( )] ( )}
t
d(Lδt) ∂L d ∂L d ∂L
δA = dt + δ̄qi − + δ̄qi .
t1 dt ∂qi dt ∂ q̇i dt ∂ q̇i
Restituyendo las variaciones totales δ̄qi = δqi − q̇i δt, y si q(t) es el camino 1 → 2 que hace
extremal a la acción, el término entre corchetes cuadrados se anula idénticamente, lo que nos
queda es la variación de la función acción con el punto inicial jo, esto es la variación de la
función principal de Hamilton
∫ t { ( )}
d(Lδt) d ∂L ∂L
δS = δA(x1 , x) = dt + δqi − q̇i δt .
t1 dt dt ∂ q̇i ∂ q̇i
Se trata de la integral de una derivada total, por lo que el resultado es el valor del integrando
en el instante t menos él mismo en el instante inicial t1 , pero δt(t1 ) = 0, δt(t) = δt, δqi (t1 ) =
δqi (t) = 0, por lo que
∂S
S(t + δt, q) − S(t, q) = δS(t, q) = (L − pi q̇i ) δt = −Hδt, ⇒ = −H.
∂t
Como el Hamiltoniano es función de los momentos pi que a su vez se expresan por (1.46) en
términos de las derivadas parciales pi = ∂S/∂qi , la función principal de Hamilton satisface la
ecuación diferencial en derivadas parciales, con respecto a las variables cinemáticas:
( )
∂S(t, q) ∂S
= −H t, q, , (1.47)
∂t ∂qi
1.8. FORMALISMO CANÓNICO GENERALIZADO 63

que recibe el nombre de ecuación de Hamilton-Jacobi (1834).


La función principal de Hamilton satisface una ecuación de ondas, en general no lineal, en el
espacio cinemático X , pues la anterior equación lo que establece es cómo cambia en el tiempo
el valor de S en el punto x ≡ {t, q}, en función de sus cambios en las direcciones de las variables
generalizadas qi .

1.8.2. Sobre la equivalencia entre la formulación variacional y la canónica


Muchos libros de texto arman que ambas formulaciones son equivalentes23 . Sin embargo
esto no es así. Dadas las ecuaciones de Euler-Lagrange la formulación variacional pretende buscar
la solución con las condiciones de contorno qi (t1 ) y qi (t2 ), en los instantes t1 y t2 , mientras que
en la formulación canónica las condiciones de contorno son qi (t1 ) y pi (t1 ), en el mismo instante
inicial. Para sistemas de ecuaciones diferenciales regulares, jar en el instante inicial t1 un punto
del espacio de fases (qi , pj )(t1 ) nos singulariza una única solución que pasa por él, mientras que
jar dos puntos del espacio cinemático x1 ≡ (t1 , qi (t1 )) y x2 ≡ (t2 , qi (t2 )) no nos garantiza que
haya solución, compatible con el principio de causalidad mencionado en la sección 1.7, y en el
caso de existir, no nos garantiza que sea única.
Veámoslo con un ejemplo: el movimiento de un sólido rígido. Desde el punto de vista varia-
cional se debería jar en el instante t1 la posición del centro de masa r 1 y la orientación α1
del triedro principal de inercia y otro tanto en el instante t2 . Desde el punto de vista canónico
deberíamos jar en el instante t1 la posición del centro de masa r 1 y su velocidad v 1 = p1 /m, y
la orientación α1 y su velocidad angular ω 1 . Si el movimiento es libre v 1 = (r 2 − r 1 )/(t2 − t1 ),
pero la velocidad angular no puede ser expresada en términos de las dos orientaciones en los
extremos, puesto que no sabemos cuántas vueltas ha dado el sólido ni con respecto a qué eje.
En la formulación canónica la solución es única, pero en la formulación variacional tenemos in-
nitas soluciones en las que la posible velocidad angular queda indeterminada. La presencia de
variables compactas hace que los dos sistemas de condiciones de contorno no sean equivalentes.

23
D.A. Wells, Theory and Problems of Lagrangian dynamics, Schaum McGraw Hill, NY (1967) p.1:...the basic
laws of dynamics can be formulated in several ways other than that given by Newton. The most important of
these are referred to as: a)D'Alembert's principle, b) Lagrange's equations, c) Hamilton's equations, d) Hamilton's
principle. All are basically equivalent.
E.C.G. Sudarshan and N. Mukunda, Classical Dynamics: A modern perspective, John Willey NY (1974), p.24
... this completes the demonstration, in the standard case, of the complete equivalence of the Lagrangian and
Hamiltonian forms of dynamics.
64 CAPÍTULO 1. FORMALISMO LAGRANGIANO

1.9. Apéndice: Grupos de Lie de transformaciones


Vamos a introducir la notación y algunos elementos generales de la teoría de grupos de Lie
de transformaciones de una variedad. Se trata de analizar cómo las diferentes magnitudes físicas
transforman bajo la acción de cambios de sistemas de referencia y bajo grupos de simetrías.
Consideremos la transformación de una variedad de dimensión n, X , x′ = gx dada por n
funciones continuas y derivables, que dependen de un conjunto de r parámetros continuos, en
la forma:

x′i = f i (xj ; g σ ), ∀x ∈ X, ∀g ∈ G, i, j = 1, . . . , n, σ = 1, . . . , r.

Esta transformación se dice que es la acción de un grupo de Lie de transformaciones si cumple


las dos condiciones:
(i) G es un grupo de Lie, es decir, existe una ley de composición de grupo para los elementos
de G, c = ϕ(a, b) ∈ G, ∀a, b ∈ G, dada por r funciones continuas y derivables ϕσ (a, b) de las 2r
coordenadas de los elementos a y b.
(ii) Las ecuaciones de transformación satisfacen
x′′ = f (x′ ; b) = f (f (x; a); b) = f (x; c) = f (x; ϕ(a, b)).

La parametrización del grupo se puede siempre tomar de tal manera que las coordenadas
del elemento neutro e del grupo son e ≡ (0, . . . , 0), de tal manera que un elemento innitesimal
del grupo es uno cuyas coordenadas δg σ , σ = 1, . . . , r, son innitesimales.
Bajo la acción de un elemento innitesimal δg del grupo G, el cambio en las coordenadas
x del punto x ∈ X está dada por
i


i i i i ∂f i (x; g)
x + dx = f (x; δg) = x + δg σ = xi + uiσ (x)δg σ ,
∂g σ g=e

después de un desarrollo Taylor a primer orden en los parámetros del grupo y sabiendo que
xi = f i (x; 0). Hay nr funciones auxiliares del grupo que se denen por

∂f i (x; g)
i
uσ (x) = , (1.48)
∂g σ g=e

y por lo tanto a primer orden en los parámetros, dxi = uiσ (x)δg σ .


La acción del grupo sobre la variedad X se puede extender a la acción del grupo sobre el
conjunto F(X) de funciones continuas y derivables denidas sobre X , mediante:

g : h(x) → h′ (x) ≡ h(gx). (1.49)

Si el elemento del grupo es innitesimal, entonces


∂h(x) i
h′ (x) = h(xi + dxi ) = h(xi + uiσ (x)δg σ ) = h(x) + uσ (x)δg σ ,
∂xi
después de un desarrollo Taylor a primer orden en los parámetros innitesimales del grupo. La
transformación innitesimal sobre F(X) se puede representar mediante la acción de un operador
diferencial en la forma
( )
′ ∂
h (x) = I + δg uσ (x) i h(x) = (I + δg σ Xσ ) h(x) = U (δg)h(x),
σ i
∂x
donde I es el operador unidad y los operadores diferenciales

Xσ = uiσ (x) . (1.50)
∂xi
1.9. APÉNDICE: GRUPOS DE LIE DE TRANSFORMACIONES 65

En particular, cuando actuamos con el operador U (δg) ≡ (I + δg σ Xσ ) sobre la coordenada xj


obtenemos xj + dxj = xj + ujσ (x)δg σ .
Los operadores Xσ se denominan los generadores de las transformaciones innitesimales.
Hay r operadores linealmente independientes que generan un espacio vectorial real r-dimensional
y tal que el conmutador de dos cualesquiera de ellos [Xσ , Xλ ] también pertenece a este espacio
vectorial, es decir,
[Xσ , Xλ ] = cασλ Xα , α, σ, λ = 1, . . . , r. (1.51)

Los coecientes cα σλ son un conjunto de constantes reales, llamadas las constantes de estruc-
tura del grupo y el espacio vectorial que construyen los generadores se le llama el álgebra de
Lie L(G), asociada al grupo de Lie G. Las constantes de estructura son antisimétricas en sus
σλ = −cλσ , y satisfacen las identidades de Jacobi:
índices inferiores cα α

cασλ cβµα + cαλµ cβσα + cαµσ cβλα = 0, ∀σ, λ, µ, β = 1, . . . , r.

Las ecuaciones (1.51) son las reglas de conmutación que caracterizan la estructura del álgebra
de Lie del grupo.
Si una transformación nita del grupo, de parámetros g σ , se puede hacer en n pasos más
pequeños de parámetros g σ /n, con n sucientemente grande, entonces una transformación nita
U (g)h(x) Se puede obtener como
( )n

U (g)h(x) ≡ lı́m I + Xσ h(x) = exp(g σ Xσ ) h(x).
n→∞ n

Esto dene la aplicación exponencial y en este caso se dice que los parámetros g σ son los
parámetros normales o canónicos. En la parametrización normal la ley de composición de
los subgrupos uniparamétricos se reduce a la suma de los correspondientes parámetros de los
elementos que intervienen en la operación.
Consideremos que F(X) es el espacio de Hilbert de los estados de un sistema cuántico;
(1.49) puede ser interpretada como la función de onda transformada bajo el elemento del grupo
g . Entonces, si el operador U (g) es unitario, habitualmente se escribe en la forma
( )
i σe
U (g) = exp g Xσ ,
~

en términos de la unidad imaginaria i y la constante de Planck ~, de tal manera que en este ca-
so los nuevos operadores X eσ son operadores autoadjuntos y representan ciertos observables del
sistema. Las dimensiones físicas de estos observables dependen de las dimensiones de los paráme-
tros del grupo g σ , puesto que el argumento de una exponencial es adimensional, y la presencia
de la constante de Planck implica que g σ X eσ tiene dimensiones de acción. Estos observables,
teniendo en cuenta (1.50), se representan en una representación unitaria por los operadores
diferenciales autoadjuntos
Xeσ = ~ uiσ (x) ∂ . (1.52)
i ∂xi
Sin embargo, (1.49) no es la forma más general de transformación de una función de onda
de un sistema cuántico, como veremos en el Capítulo 3. Pero una vez que conozcamos cómo
transforma, podremos otener las expresiones explícitas de los generadores del grupo por un
procedimiento similar. En general, la función de onda transforma bajo un grupo continuo con lo
que se denomina una representación unitaria proyectiva del grupo, la cual involucra en general,
alguna fase adicional.
66 CAPÍTULO 1. FORMALISMO LAGRANGIANO

1.9.1. Operadores de Casimir

Cuando tenemos una representación de un grupo de Lie, bien sea mediante operadores linea-
les o por matrices que actúan sobre un espacio vectorial, podemos denir lo que se denominan
operadores de Casimir. Son operadores C que pueden ser expresados como funciones de los ge-
neradores Xσ del álgebra de Lie, habitualmente en forma polinómica, y que tienen la propiedad
de que conmutan con todos los generadores, esto es, satisfacen [C, Xσ ] = 0, ∀σ = 1, . . . , r. En
general no se expresan como combinaciones lineales reales de los Xσ y por lo tanto no pertenecen
al álgebra de Lie del grupo. Pertenecen a lo que se denomina el álgebra del grupo, es decir,
el álgebra asociativa, pero en general no conmutativa construida a partir de todas las combina-
ciones lineales reales o complejas de productos de los Xσ , en la correspondiente representación
del grupo.
En aquellas representaciones en las que los Xσ sean operadores autoadjuntos, como en el
caso de un formalismo cuántico, los operadores de Casimir pueden también ser autoadjuntos y
representarán a aquellos observables que permanecen invariantes bajo cualquier transformación
del grupo. En particular, cuando consideremos los grupos cinemáticos que relacionan a los ob-
servadores inerciales, los operadores de Casimir de estos grupos representarán las propiedades
intrínsecas del sistema. Son aquellas propiedades que son independientes de qué observador iner-
cial las mida. Son aquellos observables cuyas medidas toman el mismo valor cuando cambiamos
de sistema de referencia
Para grupos semisimples, es decir, grupos que no poseen subgrupos invariantes Abelianos,
como el grupo de rotaciones SO(3), los grupos unitarios SU (n) y muchos otros, se demuestra
que los operadores de Casimir son polinomios reales homogéneos de los generadores Xσ , pero
esto no es el caso para grupos de Lie arbitrarios. Sin embargo, para la mayor parte de los grupos
con interés en física, como el grupo de Galileo, Poincaré, De Sitter, Weyl, SL(4, R), el grupo
inhomogéneo ISL(4, R) y el grupo Conforme SU (2, 2), los operadores de Casimir se pueden
tomar como polinomios de coecientes reales de los generadores.

1.9.2. Espacios homogéneos de un grupo

Una variedad X recibe el nombre de espacio homogéneo de un grupo G, si ∀ x1 , x2 ∈ X


existe al menos un elemento g ∈ G tal que x2 = gx1 . En ese caso se dice que G actúa sobre X
de una forma transitiva. El término homogéneo nos recuerda que las propiedades locales de la
variedad en el punto x se trasladan a cualquier otro punto de la variedad por medio de la acción
del grupo, y por lo tanto, todos los puntos de X comparten las mismas propiedades locales.
La órbita de un punto x es el conjunto de puntos de la forma gx, ∀g ∈ G, tal que si X es
un espacio homogéneo de G, entonces todo X es la órbita de cualquiera de sus puntos.
Dado un punto x0 ∈ X , el subgrupo estabilizador (little group) de x0 es el subgrupo Hx0
de G, que deja invariante al punto x0 , es decir, ∀h ∈ Hx0 , hx0 = x0 .
Si H es un subgrupo de G, entonces todo elemento g ∈ G se puede escribir como g = g ′ h,
donde h ∈ H , y g ′ es un elemento de G/H , el conjunto de cosets por la izquierda generados
por el subgrupo H . Si X es un espacio homogéneo de G, puede ser generado por la acción de
G sobre cualquier punto arbitrario x0 ∈ X . Entonces ∀x ∈ X , x = gx0 = g ′ hx0 = g ′ x0 , por lo
que el espacio homogéneo X es isomorfo a la variedad G/Hx0 .
Los espacios homogeneos de un grupo se pueden construir como estructuras cociente del
grupo por todos sus posibles subgrupos continuos. Recíprocamente, se puede demostrar que si
X es un espacio homogéneo de un grupo G, entonces existe un subgrupo H de G tal que X
es isomorfo a G/H . Por lo tanto, el espacio homogéneo más amplio de un grupo es el propio
grupo.
1.9. APÉNDICE: GRUPOS DE LIE DE TRANSFORMACIONES 67

1.9.3. Ejemplos de grupos continuos

1. Consideremos el grupo de traslaciones de la recta:


x′ = x + a.

Con a = 0 tenemos el elemento neutro del grupo y −a representa al elemento inverso. La


transformación es innitesimal si a lo es y la escribimos como x′ = x + δa. Si f (x) es una
función de x, la acción innitesimal del grupo sobre f la denimos como

∂f (x)
f ′ (x) = f (x + δa) = f (x) + δa = (I + δaP )f (x).
∂x
Al operador P = ∂/∂x le llamamos el generador de la transformación innitesimal y el elemento
innitesimal del grupo se convierte en el operador δg ≡ I + δaP al actuar sobre las variables
y funciones de estas variables. Si f (x) es una función invariante bajo la acción de este grupo,
entonces P f = ∂f /∂x = 0, y f no depende de x.
Para la transformación nita de parámetro a, se cumple la aplicación exponencial eaP , pues

aP (aP ) (aP )n a ∂ a2 ∂ 2
eaP ≡ I + + + ... + + ... = I + + + ...
1! 2! n! 1! ∂x 2! ∂x2
Al aplicarlo sobre la variable x
x′ = eaP x = x + a,
y al aplicarlo sobre cualquier función de x

a ∂f (x) a2 ∂ 2 f (x)
eaP f (x) = f (x) + + + . . . = f (x + a)
1! ∂x 2! ∂x2
ya que el primer miembro es el desarrollo Taylor de f (x) desde el punto x al punto x + a. El
parámetro a es el parámetro canónico del grupo.

2. Consideremos las rotaciones del plano


x′ = x cos α − y sin α, y ′ = x sin α + y cos α.

Con α = 0 tenemos el elemento neutro del grupo y −α es el inverso. Si α es innitesimal, de


valor δα, a primer orden en este parámetro las ecuaciones de transformación quedan:

x′ = x − yδα, y ′ = y + xδα.

Si f (x, y) es una función de estas variables, bajo el grupo transforma


( )
′ ′ ′ ∂ ∂
f (x, y) ≡ f (x , y ) = f (x−yδα, y+xδα) = f (x, y)+δα −y +x f (x, y) = (I+δαJ)f (x, y)
∂x ∂y

donde el operador diferencial


∂ ∂
J = −y +x ,
∂x ∂y
es el generador de las rotaciones innitesimales. Si f (x, y) es invariante bajo rotaciones, entonces
Jf = 0, es decir es solución de la ecuación diferencial

∂f ∂f dx dy
−y +x = 0, ⇒ = , xdx + ydy = 0
∂x ∂y −y x
68 CAPÍTULO 1. FORMALISMO LAGRANGIANO

ya que el elemento de arco de componentes (dx, dy) es ortogonal al gradiente de f y por lo tanto
f debe ser una función arbitraria de las curvas x2 + y 2 =cte, es decir f (x2 + y 2 ).
Si lo que queremos es analizar una rotación nita de valor α la aplicación exponencial nos
produce el correspondiente operador de rotación
( ) ( ) ( )
α ∂ ∂ α2 ∂ ∂ 2 αn ∂ ∂ n
e ≡I+
αJ
−y +x + −y +x + ... + −y +x + ...
1! ∂x ∂y 2! ∂x ∂y n! ∂x ∂y

que aplicado a la variable x nos produce:


( ) ( )
α α2 α3 α2 α4 α α3
e αJ
x=x− y− x+ y + ... = x 1 − + + ... + y − + + ...
1! 2! 3! 2! 4! 1! 3!

es decir
x′ = eαJ x = x cos α − y sin α.
Análogamente, si lo aplicamos a la variable y llegamos a

y ′ = eαJ y = x sin α + y cos α.

Al aplicarlo sobre cualquier función f (x, y) nos lleva a

f ′ (x, y) = eαJ f (x, y) = f (x cos α − y sin α, x sin α + y cos α).

El parámetro α es el parámetro canónico del grupo.

3. Consideremos un boost Galileano a lo largo del eje OX ,


t′ = t, x′ = x + vt.

Con v = 0 tenemos el elemento neutro del grupo y −v representa el elemento inverso. La


transformación innitesimal es con δv innitesimal y queda:

t′ = t, x′ = x + δvt.

La acción del elemento innitesimal sobre una función f (t, x) viene dada por

∂f (t, x)
f ′ (t, x) = f (t′ , x′ ) = f (t, x) + δvt = (I + δvK) f (t, x),
∂x
donde K = t∂/∂x es el generador de los boosts a lo largo del eje OX .
Si queremos analizar un boost nito entonces la aplicación exponencial nos lleva a
( ) ( )
v v2 2 v ∂ v2 ∂ 2
e = I + K + K + ... = I +
vK
t + t + ...,
1! 2! 1! ∂x 2! ∂x

que aplicado a la variable t


t′ = evK t = t,
y aplicado a la variable x
x′ = evK x = x + vt.
Aplicado a cualquier función f (t, x) nos lleva a

f ′ (t, x) = evK f (t, x) = f (t, x + vt).

El parámetro v es el parámetro canónico de este grupo.


1.10. APÉNDICE: SUMARIO DE MECÁNICA CLÁSICA 69

1.10. Apéndice: Sumario de Mecánica Clásica

1.10.1. Cinemática
Los sistemas materiales que evolucionan vienen descritos por un conjunto de variables, que
van cambiando a partir de unos valores iniciales. Denominamos variables cinemáticas a estas
variables que evolucionan y que describen de forma unívoca los estados por los que va pasando el
sistema material. Al espacio de todos los estados del sistema material le denominamos espacio
cinemático, y es una variedad X de dimensión n, siendo n el número de variables cinemáticas
xi que caracterizan de forma unívoca cada uno de los diferentes estados del sistema material.

1.10.2. Dinámica
Vamos a suponer que la evolución de los sistemas materiales se puede describir en términos
del conocimiento de un parámetro continuo τ del cual las variables cinemáticas son funciones
continuas y derivables xi (τ ). Denominamos descripción dinámica del sistema, entre dos estados
inicial x1 y nal x2 al conocimiento de las funciones x(τ ), que satisfacen las condiciones de
contorno x(τ1 ) ≡ x1 , x(τ2 ) ≡ x2 , es decir que pasa por los puntos extremos de la evolución, con
τ2 > τ 1 .
Entre las variables cinemáticas xi debe al menos existir una, x0 , la cual es una función
monótona creciente del parámetro de evolución τ , es decir ẋ0 > 0. Esto nos permite invertir
la función x0 = x0 (τ ) y obtener τ = τ (x0 ), y poder caracterizar la evolución en términos de
una de las variables cinemáticas. Estas variables que satisfacen durante la evolución que ẋi > 0,
se dice que son variables de tipo temporal, puesto que nos permiten analizar la evolución en
términos de su cambio monótono creciente. La echa del tiempo va a implicar que al denir
una magnitud conservada ligada a la invariancia por traslación temporal, la energía, sea una
magnitud denida positiva.
Se trata de calcular, conocidos los puntos extremos de la evolución de un sistema material,
cuál es esa función x(τ ) que nos determina la dinámica del sistema.

1.10.3. Principio Variacional: Formulación Lagrangiana


La trayectoria dinámica del sistema material es aquella que hace extremal al valor de la
acción del sistema material, entre esos puntos extremos prejados.

La acción del sistema material a lo largo de un camino cualquiera que une esos puntos
extremos se calcula en función del conocimiento de una función L(x,e ẋ), denominada función
Lagrangiana del sistema material, de tal manera que para cada camino x(τ ) nos dene un
número real ∫ τ2
A[x(τ )] = e
L(x(τ ), ẋ(τ ))dτ,
τ1
donde cada integral se calcula a lo largo del correspondiente camino x(τ ).
Estamos describiendo la dinámica mediante un formalismo variacional. Como las funciones
xi (τ ) son derivables con respecto a τ y suponemos que existe al menos una variable función
monótona de τ , de tipo temporal x0 ≡ t, las variables cinemáticas son también funciones deri-
vables con respecto a t. Al establecer el formalismo variacional es necesario conocer cuáles de
las variables cinemáticas son realmente independientes y de que no existen relaciones funcio-
nales entre ellas. Por ejemplo si tengo como variables cinemáticas la posición de un punto y la
velocidad de ese punto, tres de las variables cinemáticas denen las coordenadas ri del punto y
otras tres variables cinemáticas son las componentes de la velocidad del punto vi = dri /dt, por
lo que existe una relación funcional entre ellas.
70 CAPÍTULO 1. FORMALISMO LAGRANGIANO

Denominamos grados de libertad del sistema material a aquellas variables cinemáticas


esenciales, excluido el tiempo t ≡ x0 , de tal manera que el resto de las variables cinemáticas
son derivadas con respecto a t, hasta un orden nito k , de aquellas. Denotemos por qi a estos
grados de libertad esenciales. De esta manera, las variables cinemáticas son el tiempo t ≡ x0 ,
los grados de libertad qi y sus posibles derivadas temporales qir = dr qi /dtr , hasta un máximo
orden nito k .
En términos de variables esenciales, el problema variacional queda expresado como el fun-
cional ∫ t2
(1) (k)
A[q(t)] = L(t, qi , qi , . . . , qi )dt,
t1

donde al haber dependencia funcional entre algunas de las variables cinemáticas, ya que algunas
son derivadas temporales de otras, el elemento independiente que caracteriza globalmente a una
posible evolución es un camino q(t) en términos de los grados de libertad. Dado un camino qj (t),
éste conduce de forma unívoca a un camino x(τ ) entre los instantes τ1 y τ2 > τ1 .
La formulación variacional, reducida a su dependencia estricta de los grados de libertad esen-
ciales e independientes, nos lleva a que la trayectoria q(t) de los grados de libertad que, además
de hacer que las variables cinemáticas pasen por los extremos x1 y x2 , hace extremal al fun-
cional acción, debe satisfacer el sistema de ecuaciones diferenciales ordinarias, las denominadas
ecuaciones de Euler-Lagrange,
( ) ( )
∂L d ∂L d k ∂L
− + . . . + (−1)k k = 0,
∂qi dt ∂q (1) dt ∂q
(k)
i i

que es un sistema de ecuaciones diferenciales de orden 2k . Los teoremas de existencia y unicidad


de soluciones de este sistema, supuesto regular, nos singularizan una solución jados en el
instante inicial t1 = t(τ1 ), los valores de los grados de libertad qi (t1 ) y sus sucesivas derivadas
(r) (2k−1)
qi (t1 ), hasta la de orden 2k − 1, qi (t1 ).
Pero por otra parte, la solución debe pasar por los puntos extremos de la evolución, x1 y x2 .
Eso implica, que las anteriores condiciones iniciales en el instante t1 se podrán expresar (tal
vez de forma no unívoca) en términos de las variables cinemáticas x1 y x2 , en los extremos. Si
no existe esa solución, se dice que x1 y x2 están causalmente desconectados y por lo tanto la
evolución entre ellos no es posible.
La primitiva función Lagrangiana L(x,e ẋ) resulta ser una función homogénea de grado 1 de
las variables derivadas ẋi , por lo que admite la forma

e ẋ) = Fi (x, ẋ)ẋi ,


L(x,

e 2 (x, ẋ), es
donde las Fi son funciones homogéneas de grado cero de las ẋi . Esto implica que L
homogénea de grado 2 de las ẋi , y se puede escribir como

e 2 (x, ẋ) = gij (x, ẋ)ẋi ẋj > 0,


L

donde los coecientes gij son funciones homogéneas de grado cero de las ẋi .
Dos puntos próximos xi y xi +dxi , se dice que están causalmente conectados si gij dxi dxj > 0,
ya que la acción al cuadrado entre ellos es denida positiva. La acción entre dos puntos próxi-
mos no puede ser nunca nula, ya que implicaría que la L e se anula idénticamente en un instante,
con lo que dejaríamos de tener asociada una acción a un sistema material. La anulación de
la acción implicaría que el sistema deja de evolucionar. Esto conduce, por ejemplo, a que en
el caso relativista no es posible tener una partícula puntual moviéndose a la velocidad de la
luz, ya que la Lagrangiana se anularía idénticamente. Como L e 2 > 0, necesariamente tiene que
contener, además de las coordenadas del punto, otras variables cinemáticas que hagan que la
1.10. APÉNDICE: SUMARIO DE MECÁNICA CLÁSICA 71

acción al cuadrado sea siempre, en cualquier punto, denida positiva. Los fotones, son partículas
puntuales que además tienen orientación, es decir, rotan.

Principio de Causalidad
La evolución de un sistema material entre los puntos x1 y x2 a lo largo de un camino x(τ ) es
posible, si en cada momento de la evolución τ se cumple gij dxi dxj > 0.

Dados dos puntos arbitrarios x1 y x2 esto no será siempre posible, por lo que jado x1 existe
un subconjunto de puntos del espacio cinemático que están causalmente conectados con x1 . El
resto son inalcanzables desde él, y la evolución entre ellos es imposible.

Este principio no establece de forma unívoca el que dado un punto inicial se pueda predecir
hacia qué punto evoluciona. Más bien lo que establece es la posibilidad de que la evolución entre
dos puntos dados sea o no factible.
Métrica
El espacio cinemático X es un espacio métrico con un tensor métrico, simétrico, denido por

1 ∂2L e2
gij = = gji .
2 ∂ ẋi ∂ ẋj

No es, en general, denido positivo, por lo que a partir de cada punto (x, ẋ), solamente aquellos
puntos x + dx son alzanzables desde x si gij dxi dxj > 0. Es un espacio métrico de Finsler.

1.10.4. Principio de Relatividad Restringido: Grupo cinemático


El grupo de simetrías asociado al Principio de Relatividad Restringido no está jado a priori.
Bacry y Levy-Leblond en 1968 24 establecen bajo criterios estrictamente matemáticos relativos
a la estructura del álgebra de Lie del grupo, los posibles grupos cinemáticos. Parten de que el
grupo contiene como operaciones traslaciones espacio-temporales, rotaciones y transformaciones
cinemáticas puras, y por lo tanto el grupo es de dimensión 10. Las operaciones de inversión
espacial e inversión temporal no son, en principio, simetrías pero sí automorsmos del grupo.
El grupo más general que encuentran es el grupo de De Sitter. En el espacio-tiempo existen
dos parámetros universales, un factor de escala R, cuyo inverso sería la curvatura del espacio-
tiempo y otro una velocidad límite c, la velocidad relativa inalcanzable entre observadores.
Hay dos grupos de De Sitter, SO(3,2) y SO(4,1), uno de curvatura positiva y otro negativa,
respectivamente. Como límite de estos grupos se encuentra que si R → ∞ ambos grupos dan
lugar al grupo de Poincaré. El espacio-tiempo sería plano, pero existiría una velocidad límite.
Si tomamos en cambio c → ∞, dan lugar a los denominados grupos de Newton, en los que los
movimientos relativos entre observadores contienen o bien desplazamientos relativos indenidos,
con velocidad decreciente, o bien desplazamientos relativos oscilantes. Corresponderían a grupos
cosmológicos en los que el universo o bien está en continua expansión o bien su evolución es
oscilante.
Si en el grupo de Poincaré hacemos c → ∞ o en los grupos de Newton hacemos R → ∞, el
resultado es el grupo de Galileo.

1.10.5. Principio Atómico: Existencia de partículas elementales


Es asumir que nalmente cualquier sistema material está formado por unos objetos últimos
indivisibles que además son indeformables. Al ser indeformables esto implica que dado un estado
cualquiera del espacio cinemático de una partícula elemental, cualquier otro estado se puede
24
H. Bacry and J.M. Levy-Leblond, Possible Kinematics, J. Math. Phys. 9, 1605 (1968)
72 CAPÍTULO 1. FORMALISMO LAGRANGIANO

obtener del anterior mediante un simple cambio de sistema de referencia a otro observador
equivalente. Esto trae consigo que el espacio cinemático es necesariamente un espacio homogéneo
para el grupo cinemático asociado al Principio de Relatividad Restringido.

1.10.6. Resumen del formalismo


1. Para un sistema de n grados de libertad qi cuya Lagrangiana dependa hasta las deri-
(k) (1) (k)
vadas de orden k de los grados de libertad qi = dk qi /dtk , L(t, qi , qi , . . . , qi ), las
(1) (k−1)
variables cinemáticas son xj ≡ {t, qi , qi , . . . , qi }, es decir el tiempo, los grados de
libertad y sus derivadas temporales hasta el orden k − 1. Las variables generalizadas son
(1) (k−1)
{qi , qi , . . . , qi }, es decir, las variables cinemáticas con el tiempo excluído.
2. Cada variable generalizada posee un momento canónico conjugado, denido por
( ) ( )
∂L d ∂L d k−s ∂L
pi(s) = (s) − + · · · + (−1)k−s k−s , s = 1, . . . , k
∂q dt ∂q (s+1) dt ∂q
(k)
i i i
(1)
es decir pi(1) es el momento conjugado de las qi , pi(2) es el momento conjugado de las qi
(k−1)
y nalmente pi(k) es el momento conjugado de las qi .

3. En una descripción paramétrica de la evolución, t(τ ), qi (τ ), la Lagrangiana L e = Lṫ,


donde el punto ˙ representa a la derivada con respecto al parámetro τ , es una función de
e ẋ).
las variables cinemáticas x y de sus primeras derivadas con respecto de τ , ẋ, L(x,

4. La función acción es el valor del funcional acción para el camino que la hace extremal.

5. La función acción es una función explícita de todas las variables cinemáticas x1 y x2 en


los extremos de la trayectoria en el espacio cinemático X , A(x1 , x2 ).
e tiene
6. El parámetro de evolución arbitrario τ se puede elegir adimensional, y por lo tanto L
dimensiones de acción.
e se puede obtener de la función acción mediante el límite
7. La Lagrangiana L

e ẋ) = lı́m ∂A(x, y) ẋi .


L(x,
y→x ∂yi

8. La Lagrangiana L e no es función explícita de τ , pero es función homogénea de grado 1 de


las derivadas ẋi de todas las variables cinemáticas. Esto nos permite escribirla como una
suma de tantos términos como variables cinemáticas
e
e ẋ) = ∂ L(x, ẋ) ẋi = Fi (x, ẋ)ẋi .
L(x,
∂ ẋi

9. Las funciones Fi (x, ẋ) son funciones homogéneas de grado cero de las ẋi y por lo tanto
son funciones de las derivadas temporales de las variables generalizadas. Como cada su-
mando Fi ẋi tiene dimensiones de acción, cada Fi tiene la dimensión complementaria de
la correspondiente variable xi .
e 2 , que es denida positiva, se puede siempre escribir como
10. La función L

1 ∂2L e2
e 2 = gij (x, ẋ)ẋi x˙j ,
L gij (x, ẋ) = = gji ,
2 ∂ ẋi ∂ ẋj
donde los coecientes gij = gji , son funciones homogéneas de grado 0 de las derivadas ẋi .
1.10. APÉNDICE: SUMARIO DE MECÁNICA CLÁSICA 73
√ √
11. La Lagrangiana se puede escribir a partir de Le 2 como L
e= L e 2 o bien L
e=− L e 2 , ya que
e 2 denida positiva esta raíz cuadrada existe, luego o bien L
al ser L e es denida positiva
a lo largo de la trayectoria, o bien es denida negativa. Existen por lo tanto dos tipos
distintos de sistemas dinámicos con las mismas variables cinemáticas y que conducen a
trayectorias que hacen que la acción del sistema sea máxima o mínima. Para partículas
elementales si Le describe a la partícula, −L
e a la antipartícula. Partícula y antipartícula
conducen sobre el espacio cinemático a la misma denición de distancia métrica L e2 .

12. El espacio cinemático es siempre un espacio métrico Finsleriano. Como


∫ τ2 ∫ τ2 √ ∫ τ2 √ ∫ τ2 ∫

e =±
Ldτ e 2 dτ = ±
L gij (x, ẋ)ẋi x˙j dτ = ± gij dxi dxj = ± ds
τ1 τ1 τ1 τ1

y el problema variacional es equivalente a un problema geodésico sobre el espacio cinemá-


tico X , con una métrica gij (x, ẋ) que es función de punto x y de las derivadas ẋi .

13. Si consideramos dos puntos próximos del espacio cinemático x y x + dx tal que el valor
e 2 (x, dx) < 0, implica que la evolución entre esos puntos es causalmente imposible.
de L

14. Si el sistema mecánico es una partícula elemental, entonces es condición necesaria que
el espacio cinemático X sea un espacio homogéneo del grupo cinemático G asociado al
Principio de Relatividad Restringido.

15. El espacio cinemático de una partícula puntual es el espacio-tiempo. Esta variedad es


siempre un espacio métrico, con una métrica más general que una métrica Riemanniana.
El admitir, como hace la Relatividad General, que el espacio tiempo como variedad de
la partícula test, es un espacio métrico Riemanniano es una restricción sobre la posible
situación más general. El espacio cinemático de la partícula puntual relativista libre tiene
como métrica la métrica de Minkowski.

16. La invariancia de las ecuaciones dinámicas bajo un grupo de transformaciones no implica


que la Lagrangiana ni la función acción sean invariantes bajo este grupo. El teorema de
Noether establece la relación entre cómo se modica la función A(x1 , x2 ) bajo un grupo
y la construcción explícita de las constantes del movimiento asociadas a ese grupo que
deja invariantes las ecuaciones dinámicas. Las constantes del movimiento Noetherianas
se escriben en función del Hamiltoniano y de los momentos canónicos y de las funciones
(s) (s)
M (x) de cómo transforman las variables cinemáticas δt = M0 (x)δg , δqi = Mi (x)δg ,
bajo una transformación innitesimal del grupo de parámetro δg . Si

e
L(δgx, e ẋ) + δg dλ(x) ,
δg ẋ) = L(x,

entonces
(s−1)
N = λ(x) + HM0 − pi(s) Mi ,

que contiene, además de la función λ(x) tantos términos como variables cinemáticas,
donde el Hamiltoniano aparece multiplicando por la función M0 de cómo transforma la
variable cinemática x0 = t, y cada momento pi(s) canónico conjugado de la variable gene-
(s−1)
ralizada qi , cambiado de signo, por cómo transforma innitesimalmente esta variable
(s−1)
generalizada Mi . Las constantes del movimiento Noetherianas son funciones lineales
del Hamiltoniano y de los momentos canónicos, siendo los coecientes de esta expresión
lineal funciones de las variables cinemáticas.
74 CAPÍTULO 1. FORMALISMO LAGRANGIANO

17. Si el grupo de simetrías es un grupo dependiente de r parámetros, entonces existen hasta r


constantes del movimiento Nσ , σ = 1, . . . , r asociadas a cada transformación de parámetro
innitesimal δg σ , que produce las transformaciones

L(δg e ẋ) + δg σ dλσ (x) ,


e σ x, δg σ ẋ) = L(x, δt = M0σ (x)δg σ ,
(s)
δqi
(s)
= Miσ (x)δg σ ,

(s−1)
Nσ = λσ (x) + HM0σ − pi(s) Miσ .

18. Todas las constantes del movimiento asociadas a grupos de simetrías representan a obser-
vables físicos que no son denidos positivos.
Capítulo 2

Ejemplos de partículas con espín

PARTÍCULAS NO RELATIVISTAS

2.1. Partícula puntual no relativista

El grupo cinemático asociado al Principio de Relatividad Restringido es el grupo de Galileo


G . Ver el Apéndice al nal del capítulo sobre el grupo Galileo para la notación y propiedades
que vamos a usar en este capítulo.
Consideremos un espacio cinemático caracterizado por las variables (t, r) ≡ x, con dominios
t ∈ R, r ∈ R3 , similares a los parámetros del grupo b y a, respectivamente. Supondremos que
son funciones de un cierto parámetro de evolución τ y que en cualquier instante τ de la evolución
dos observadores inerciales cualesquiera relacionan sus medidas espacio-temporales mediante:

t′ (τ ) = t(τ ) + b, (2.1)

r (τ ) = R(µ)r(τ ) + vt(τ ) + a. (2.2)

Debido a cómo transforman estas variables, las interpretamos como el tiempo y la posición de
la partícula, respectivamente. Si suponemos que el parámetro de evolución τ es invariante para
todos los observadores inerciales, tomando la derivada τ de ambos miembros resulta que las
derivadas de las variables cinemáticas en cualquier instante τ , transforman:

ṫ′ (τ ) = ṫ(τ ), (2.3)



ṙ (τ ) = R(µ)ṙ(τ ) + v ṫ(τ ). (2.4)

Si denimos la velocidad de la partícula mediante u = dr/dt = ṙ/ṫ, entonces la velocidad de la


partícula transforma entre observadores inerciales en la forma:

u′ (τ ) = R(µ)u(τ ) + v.

De esta manera podríamos obtener la forma de transformar de las sucesivas derivadas. La La-
grangiana que describa a esta partícula será función L(t, r, u) y en la descripción paramétrica
e r, ṫ, ṙ) = L(x,
de la evolución L(t, e ẋ) y homogénea de grado 1 de las derivadas ẋi . Esta homo-
geneidad nos lleva a la forma general:

e = T ṫ + R · ṙ,
L (2.5)

e ṫ y Ri = ∂ L/∂
donde T = ∂ L/∂ e ṙi son todavía funciones desconocidas de las variables cinemáticas
y de sus derivadas. Además, son funciones homogénes de grado cero de las derivadas de las
variables cinemáticas, por lo que son funciones de (t, r, u). Esta homogeneidad es independiente

75
76 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

de que la partícula sea libre o esté sometida a alguna interacción. Además las funciones T y Ri
no son totalmente independientes. En efecto, si en la expresión (2.5) hacemos la derivada de
ambos miembros con respecto a ṙi , tenemos

∂L e ∂T ∂uj ∂Rj ∂uk ∂T ∂Rj


Ri = = ṫ + Ri + ṙj = + Ri + uj ,
∂ ṙi ∂uj ∂ ṙi ∂uk ∂ ṙi ∂ui ∂ui

pues ∂uj /∂ ṙi = δij /ṫ, lo que nos lleva a que

∂T ∂Rj
+ uj = 0. (2.6)
∂ui ∂ui

También sabemos que como T y Ri son derivadas parciales de L e y ésta es una función continua
y derivable de sus argumentos, se cumple la igualdad de derivadas cruzadas

∂2L e ∂2L e ∂Ri ∂T


= , = ,
∂ ṫ∂ ṙi ∂ ṙi ∂ ṫ ∂ ṫ ∂ ṙi

pero estas funciones dependen de estas derivadas a través de las variables ui = ṙi /ṫ, por lo que
( )
∂Ri ∂Ri ∂uj ∂Ri ṙj ∂T ∂T ∂uj ∂T δij ∂T ∂Ri
= = − 2 = = = ⇒ + uj = 0,
∂ ṫ ∂uj ∂ ṫ ∂uj ṫ ∂ ṙi ∂uj ∂ ṙi ∂uj ṫ ∂ui ∂uj

que es otra relación del tipo (2.6), que sugiere que ∂Ri /∂uj = ∂Rj /∂ui .

2.1.1. Partícula puntual libre

Si la partícula es libre, las ecuaciones dinámicas deben ser invariantes para el conjunto de
observadores inerciales, ya que tanto desde el punto de vista activo como pasivo, el cambio de
sistema de referencia o la transformación cinemática de la partícula no pueden alterar sus leyes
dinámicas. Si estuviera bajo una interacción, habría que desplazar también los mecanismos que
interaccionan con ella, por lo que en general las ecuaciones dinámicas no serán invariantes, ya
que los cambios que hacemos entre observadores inerciales afectan solamente a las variables
cinemáticas y sus derivadas, asociadas a la partícula y no a los mecanismos de interacción como
campos, imanes, etc.

Desde el punto de vista de las transformaciones innitesimales, como e 0 (t, r, ṫ, ṙ)
L depende de
estas variables que transforman según (2.1-2.4), los diferentes generadores del grupo de Galileo al
actuar sobre funciones de estas variables son:


H= , P = ∇, J = r × ∇ + ṙ × ∇ṙ , K = t∇ + ṫ∇ṙ .
∂t

Si la Lagrangiana es invariante bajo las traslaciones, entonces e0 = 0


HL y e 0 = 0, implica que L
PL e0
no es función de t ni de r. Bajo rotaciones e 0 = 0,
JL e implica que es función de ṙ 2 y también de
ṫ y debe ser homogénea de grado 1 en estas derivadas. Finalmente, si es invariante bajo los boosts
Galileanos e 0 = 0, lo que implica que ∂ L
KL e 0 /∂ ṙ = 0, y sería independiente de ṙ . Como esto no
puede ser, si KL e 0 = d(f (t, r))/dτ , con dimensiones de masa×distancia, es una derivada total y
las ecuaciones dinámicas resultan ser invariantes. De acuerdo con la estructura de la función gauge
(2.7), se tiene

2
e 0 = mṙ = d e 0 = mṙ, e 0 = 1 m ṙ + F (ṫ),
KL (mr). ṫ∇ṙ L ⇒ L
dτ 2 ṫ
siendo F (ṫ) una función arbitraria de ṫ que debe ser homogénea de grado 1, por lo que en general,

tiene la forma F = −H0 ṫ, con H0 una constante, que se interpreta como la energía interna.
2.1. PARTÍCULA PUNTUAL NO RELATIVISTA 77

Asociada a esta variedad X , la función gauge del grupo de Galileo es


( )
α(g; x) = ξ(g, x) = m v 2 t/2 + v · R(µ)r , (2.7)

donde el parámetro m se interpreta como la masa de la partícula y ξ(g, g ′ ) es el exponente del


grupo G . Si la transformación es innitesimal δg , a primer orden en los parámetros queda

α(δg; x) = mR(δµ)r · δv = λi (x)δvi ,

y α(δg; x) es distinta de cero si la transformación es un boost Galileano, por lo que la La-


grangiana es invariante bajo traslaciones y rotaciones. Bajo los boosts Galileanos la función
λi (x) = mri .
Si en vez del análisis innitesimal hacemos el análisis bajo transformaciones nitas, la trans-
formación de la Lagrangiana libre bajo una transformación nita general del grupo de Galileo
es ( )
e 0 (x′ , ẋ′ ) = L
L e 0 (x, ẋ) + m v 2 ṫ/2 + v · R(µ)ṙ . (2.8)
Por lo tanto
( ) ( )
′ ∂ Le′ 0 ∂Le0 1 ∂ ṫ e0
∂L ∂ ṙi
T = = + mv 2 + + mvj R(µ)ji , (2.9)
∂ ṫ′ ∂ ṫ 2 ∂ ṫ′ ∂ ṙi ∂ ṫ′

pero de (2.3) y (2.4) tenemos que ∂ ṫ/∂ ṫ′ = 1 y ∂ ṙi /∂ ṫ′ = −R−1 (µ)ik vk , respectivamente, por lo
que
1
T ′ = T − mv 2 − v · R(µ)R. (2.10)
2
Análogamente
R′ = R(µ)R + mv. (2.11)
Los momentos canónico conjugados de los tres grados de libertad independientes qi = ri , son
e 0 /∂ ṙi = Ri , y por lo tanto el teorema de Noether nos lleva a las siguientes constantes del
pi = ∂ L
movimiento, que vamos a denominar momentos, bajo los diferentes subgrupos de simetrías:
a) Bajo traslaciones temporales la función gauge (2.7) es nula, δt = δb, M = 1, mientras que
δri = 0 y la constante se reduce a la expresión H = R · dr/dt − L e 0 /ṫ = −T .
b) Bajo traslaciones espaciales también α(g; x) ≡ 0, δt = 0, M = 0, mientras que δri = δai ,
Mij = δij y el observable conservado es R.
c) Bajo transformaciones Galileanas puras con velocidad constante (boosts) δt = 0 y M = 0,
en tanto que δri = tδvi y Mij = tδij , pero ahora la función gauge a primer orden order en el
parámetro de velocidad es α(δv; x) = mr · δv , por lo que el observable conservado es mr − P t.
d) Bajo rotaciones α(g; x) ≡ 0, δt = 0 y M = 0, pero δri = εijk rj δαk y Mik = εijk rj y la
magnitud conservada es r × R.
Recolectando estas magnitudes, les podemos dar los siguientes nombres y símbolos:

Momento temporal H = −T, (2.12)


Momento lineal P = R = p, (2.13)
Momento cinemático K = mr − P t, (2.14)
Momento angular J = r × P. (2.15)

Les hemos reservado los mismos símbolos en mayúsculas que los de los correspondientes
generadores del grupo de simetrías, que dejan las ecuaciones dinámicas invariantes: Incluso sus
nombres hacen referencia al tipo de parámetro de la correspondiente transformación. Todos
ellos pueden tomar ambos signos, ya que si el parámetro de una transformación de un grupo
es positivo el de su inversa es negativo y los generadores de las transformaciones innitesimales
78 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

son vectores tangentes a las órbitas, y por lo tanto pueden tener componentes de cualquier
signo. Como la dimensionalidad de una constante Noetheriana es la complementaria con res-
pecto a la acción de la dimensión del parámetro del grupo, resulta que H tiene dimensiones de
acción/tiempo = energía, P dimensión de acción/distancia = masa×velocidad, K dimensión
de acción/velocidad = masa×distancia y nalmente como el parámetro de las rotaciones es
adimensional J tiene dimensión de acción.
En general, lo que hemos denido como el momento temporal, recibe habitualmente el nom-
bre de energía o bien de Hamiltoniano del sistema. Sin embargo, ninguno de los observables
asociados a los grupos uniparamétricos de simetrías es denido positivo. Por energía entendemos
un observable que es siempre denido positivo por lo que en realidad la energía se deniría como
E = |H|. Esto es importante a la hora de clasicar las diferentes partículas que vamos a encontrar,
sobre todo en la formulación relativista, en la que, por lo que respecta a H, el signo de H es
también una propiedad intrínseca, independiente del observador inercial que la mida. En la formu-
lación relativista llamamos partícula a aquél sistema para el que Hp > 0 y antipartícula cuando
Ha < 0. En ambos casos, si partícula y antipartícula poseen masa m y están en reposo, Hp = mc2
y Ha = −mc , y su energía es E = mc = |H|. Esta discusión entre partículas y antipartículas se
2 2

desarrollará con más detalle en la sección 2.7 lo que nos llevará a denominar al observable momento
temporal como energía, pero siendo siempre, para las partículas masivas, un observable denido
positivo, distinguiendo a la antipartícula por el signo opuesto de la carga.
Para el momento cinemático existen nombres alternativos en la literatura. Así, Levy-Leblond lo
denomina momento Galileano y en otros textos, escasos por cierto, se le suele denominar momento
estático, porque es un observable de dimensiones de masa × distancia. Siendo consistentes con
la propuesta primera le deberíamos denominar momento Poincaré en el caso relativista. En estas
notas usaremos el nombre de momento cinemático, incluso en la formulación relativista.

Si tomamos la derivada τ en (2.14) del momento cinemático K̇ = 0, por ser una constante
del movimiento, implica P = mṙ/ṫ = mu = R, donde u es la derivada temporal de la posición
de la partícula. Si tenemos en cuenta la relación (2.6), entonces
∂T ∂Rj 1
= −uj = −uj mδij = −mui ⇒ T (u) = − mu2 + T0 ,
∂ui ∂ui 2
siendo T0 una constante, ya que T no depende de más variables. Con estas funciones la Lagran-
giana de la partícula puntual libre queda
2
e 0 = T ṫ + R · ṙ = 1 m ṙ + T0 ṫ,
L ⇒
1
L0 = mu2 + T0 .
2 ṫ 2

2.1.2. Observador del centro de masa


Las seis condiciones P = 0 y K = 0, implican u = 0 y r = 0, de tal manera que la partícula
está en reposo y su posición localizada en el origen del sistema de referencia del observador.
Para denir de forma única un observador nos falta jar una rotación arbitraria y una traslación
temporal. Sin embargo, a falta de estas operaciones, decimos que la clase de observadores para
los que P = 0 y K = 0, representan el observador del centro de masa. Estas seis condiciones
las utilizaremos también para denir el observador del centro de masa, en el caso relativista.
A partir de (2.10) y (2.11) vemos que la energía (momento temporal) y el momento lineal
transforman como:
1
H ′ = H + v · R(µ)P + mv 2 , (2.16)
2
P ′ = R(µ)P + mv. (2.17)
Entonces, si H0 y P = 0 son la energía y el momento lineal medidos por el observador del
centro de masa, para un observador arbitrario que ve a la partícula moviéndose con velocidad
u, resulta de (2.16) y (2.17) que
1
H = H0 + mu2 = H0 + P 2 /2m, P = mu.
2
2.1. PARTÍCULA PUNTUAL NO RELATIVISTA 79

La Lagrangiana para la partícula puntual libre es


2
e 0 = T ṫ + R · ṙ = −H ṫ + P · ṙ = −H0 ṫ + m ṙ ,
L (2.18)
2 ṫ
donde H0 es la constante arbitraria −T0 , que no juega ningún papel en la dinámica ya que el
término que la contiene es una derivada total y puede tomarse como H0 = 0. Estará relacionada
con el término mc2 de la partícula puntual relativista.
Si denimos el espín como el momento angular con respecto al punto r , resulta
1
S =J −r×P =J − K × P = 0, (2.19)
m
es una constante del movimiento idénticamente nula, por lo que la partícula puntual es una
partícula sin espín.

2.1.3. Interacción con el exterior


La Lagrangiana más general de la partícula puntual es de la forma L e = T ṫ + R · ṙ , donde las
funciones T y R son funciones de t, ṫ, r, ṙ y homogéneas de grado cero en las derivadas ṫ y ṙ ,
por lo que son funciones de la variables u = ṙ/ṫ. En el caso libre, la Lagrangiana es invariante
por traslaciones y por lo tanto no son funciones ni de t ni de r , y toman la forma, en el caso
Galileano
1
T0 = − mu2 = −Hm , R0 = mu = P m
2
mientras que en el caso Poincaré, ésta resulta ser, como veremos en la sección 2.3,
−mc2 mu
T0 = √ = −Hm , R0 = √ = P m.
1 − u2 /c2 1 − u2 /c2
De ahí que la Lagrangiana libre tanto en el caso relativista como en el no relativista, se pueda
escribir como L e 0 = T0 ṫ + R0 · ṙ = −Hm ṫ + P m · ṙ . A estas magnitudes relacionadas con la
Lagrangiana libre, que da cuenta de la masa de la partícula, las hemos denotado con el subíndice
m , para indicar que son propiedades mecánicas. Vemos que son funciones de u y que en ambos
casos cumplen las condiciones (2.6).
En el caso general, si la Lagrangiana de la partícula puntual bajo una actuación exterior
es Le , las ecuaciones dinámicas no tienen por qué ser invariantes por traslación, ya que cuando
desplazamos las variables t y r , si no desplazamos también cuantos dispositivos interaccionan con
ella, la dinámica será diferente. Pero la homogeneidad de L e en términos de ṫ y ṙ se mantendrá.
Podemos denir la parte de interacción con el exterior como la diferencia de estas dos funciones
homogéneas L eI = Le−L e 0 , que sigue manteniendo la misma estructura homogénea en términos
de las derivadas de las variables cinemáticas. Entonces, L e I = A0 ṫ + A · ṙ , donde A0 = ∂ L
e I /∂ ṫ,
e
A = ∂ LI /∂ ṙ . Tanto A0 como A serán en general, funciones de t, r, u. Está claro que estos
términos modican las deniciones de la H y de la P de la partícula libre, y ahora H =
e ṫ = Hm − A0 y P = ∂ L/∂
−∂ L/∂ e ṙ = P m + A. La función −A0 es la modicación del momento
temporal mecánico Hm , y A la modicación del momento lineal mecánico P m , debidas a la
interacción. Además de los observables H y P , también K y J son modicados por los agentes
externos.
Vamos a ver que la dependencia en u, tanto de A0 como de A es innecesaria, por lo que la
interacción general, será dada por funciones (que denominaremos campos) solamente espacio-
temporales e independientes de la velocidad. En efecto, consideremos el caso Galileano. Las
ecuaciones dinámicas a partir de la Lagrangiana en su descripción temporal
( )
m dr 2
L= + A0 (t, r) + A(t, r) · u,
2 dt
80 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

son
∂A0 ∂Aj d
+ uj − (mui + Ai ) = 0, i = 1, 2, 3
∂ri ∂ri dt
es decir ( )
d2 r i ∂A0 ∂Ai ∂Aj ∂Ai
m 2 = − + uj −
dt ∂ri ∂t ∂ri ∂rj
el último término entre paréntesis es una función antisimétrica en i y j , por lo que puede ponerse
como ϵijk Bk uj , con lo que la variación del momento lineal mecánico de la partícula puntual

dP m d2 r
= m 2 = E + u × B, (2.20)
dt dt
con
∂A
E = ∇A0 − , B = ∇ × A,
∂t
es igual a la fuerza de Lorentz asociada a sendos campos E y B funciones solamente de t y de
r . En el caso relativista también obtendríamos que dP m /dt = E + u × B , pero la expresión de
P m = γ(u)mu en términos de la velocidad, es diferente. Si tanto A0 como A fueran funciones
de u, al plantear las ecuaciones dinámicas tendríamos:
( )
∂A0 ∂Aj d ∂A0 ∂Aj
+ uj − mui + + Ai + uj = 0.
∂ri ∂ri dt ∂ui ∂ui

e I = A0 ṫ + Aj ṙj , al derivar ambos miembros con respecto


Ahora bien, de la homogeneidad de la L
a ṙj , se obtiene:
∂A0 1 ∂Ai 1
Aj = ṫ + ṙi + Aj ,
∂uj ṫ ∂uj ṫ
por lo que el término adicional que aparece en las ecuaciones dinámicas

∂A0 ∂Aj
+ uj = 0,
∂ui ∂ui

que cumple las condiciones (2.6) que satisfacen respectivamente T y R, es idénticamente nulo
y no interviene en la dinámica, como si tanto A0 como A, fueran independientes de u como
habíamos supuesto. Lo mismo se puede aplicar al caso de la partícula puntual relativista, por
lo que la fuerza más general es una fuerza de tipo de Lorentz, con campos solamente espacio-
temporales. Respecto de la variación de la energía mecánica, solamente la parte de la fuerza de
interacción E realiza trabajo. En efecto, en el caso no relativista,
( )2
m dr dHm dr d2 r
Hm = , =m · = u · E.
2 dt dt dt dt2

En el caso relativista, Hm = γ(u)mc2 , P m = γ(u)mu, pero al ser una partícula elemental, el


invariante masa, denido por Hm2 /c2 − P 2 = m2 c2 , no cambia debido a la interacción, por lo
m
que derivando temporalmente esta expresión, tenemos:

2 dHm dP m dHm dP m
2
Hm − 2P m · = 0, =u· = u · E.
c dt dt dt dt
En ambos casos, la variación por unidad de tiempo de la energía mecánica de la partícula, es el
trabajo de la fuerza E debida a la interacción, a lo largo de la trayectoria que sigue el centro
de masa de la partícula. Como los campos externos están denidos en el punto r , este punto
también representa la localización del centro de carga de la partícula.
2.1. PARTÍCULA PUNTUAL NO RELATIVISTA 81

Como B = ∇ × A, satisface ∇ · B = 0, y se trata de un campo pseudovectorial sin fuentes,


de divergencia nula. Por otra parte, tomando el rotacional de E , se anula el ∇ × (∇A0 ), por lo
que unas ecuaciones que satisfacen estos campos son:
∂B
∇×E =− , ∇ · B = 0. (2.21)
∂t
que son parte de las ecuaciones de Maxwell del campo electromagnético. Como son campos
vectoriales, nos falta conocer, para que los campos queden denidos, cómo son las ∇ · E y
∇ × B y las correspondientes condiciones de contorno. En el caso de las ecuaciones de Maxwell,
éstas son:
1 1 1 ∂E
∇ · E = ρ, ∇ × B = j+ 2 (2.22)
ϵ0 ϵ0 c2 c ∂t
y no aparecen mientras no establezcamos la parte de la Lagrangiana que describa a los campos
libres y cómo éstos son modicados por la presencia de la partícula. Es decir nos falta establecer
la dinámica de los campos. En el caso del campo electromagnético ρ es la densidad de carga
eléctrica y j el vector densidad de corriente. Si tomamos la divergencia de la segunda ecuación
y usamos la primera, llegamos a
∂ρ
∇·j+ = 0,
∂t
que es la ley fundamental de conservación de la carga eléctrica.
Para una partícula puntual de carga e localizada en r en el instante t su densidad de carga
es ρ = eδ (3) (r − x)δ(t − T ) y j = eδ (3) (r − x)δ(t − T )u, siendo x cualquier punto del espacio, T
cualquier otro instante y δ(x − a) la función delta de Dirac. Las ecuaciones (2.21) no dependen
para nada del estado de la partícula, mientras que las (2.22) nos muestran cómo la presencia
de la partícula, y por lo tanto de la corriente a ella asociada, modica localmente a los campos
en el entorno de la misma. Hay que tener presente que lo que aquí aparecen son derivadas
espacio-temporales de los campos, es decir derivadas con respecto a las variables cinemáticas de
la partícula, por lo que se reeren desde el punto de vista local a cómo cambian estos campos
en puntos próximos a la trayectoria de la partícula. La ley de conservación de la carga eléctrica
nos pone de maniesto la existencia de una propiedad escalar ligada a la partícula y que viaja
con ella a lo largo de su trayectoria, por lo que se refuerza de nuevo el que el punto r es el
soporte o localización de la carga e.
Este formalismo no nos garantiza que los campos A0 y A, o bien sus campos derivados E
y B , satisfagan todas las ecuaciones de Maxwell, pero sí que la interacción es invariante bajo
(2.23), como veremos a continuación. Pero parece indicar que la posible interacción que una
partícula puntual pueda sufrir es mediante una fuerza de tipo Lorentz, expresada en términos
de unos campos E y B sin restricción en cuanto a su alcance. La gravedad como interacción,
ha quedado fuera del contexto de posibles interacciones, por la denición del Principio de Re-
latividad Restringido. De esta forma de proceder no se determinarían las otras interacciones
conocidas de corto alcance como las de tipo fuerte o débil, que están connadas a regiones del
orden de 10−15 a 10−18 m, distancias en las que los fenómenos cuánticos son relevantes. Estas
últimas interacciones se describen habitualmente en el contexto de la teoría cuántica de campos
y no son predichas en esta descripción variacional clásica.
Los campos A0 y A, no están unívocamente determinados, ya que lo que interviene en la
dinámica son sus derivadas espacio-temporales. Si los modicamos en la forma
∂λ(t, r) ∂λ(t, r)
A0 → A0 + , Ai → Ai + , (2.23)
∂t ∂ri
e I se mo-
donde λ(t, r) es una función arbitraria de las variables cinemáticas, la Lagrangiana L
dica en la forma
∂λ(t, r) ∂λ(t, r) dλ
ṫ + ṙi = ,
∂t ∂ri dτ
82 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

que resulta ser una derivada total y puede eliminarse por no intervenir en la dinámica. La
transformación (2.23), que deja invariantes las ecuaciones dinámicas, modicando los campos
externos en cada punto del espacio-tiempo, recibe el nombre de transformación gauge local.
Pudiera parecer que al dejar las ecuaciones dinámicas invariantes, nos produciría una ley
de conservación, utilizando el teorema de Noether. Pero no se trata de una transformación
de un grupo uniparamétrico, sino de una transformación de tipo general, generada por una
función arbitraria λ, que hace que la Lagrangiana no sea invariante, sino que transforme con
una derivada total. Parece entonces que si asociado a ese término existe algún parámetro del
sistema, éste puede ser la carga, lo mismo que en el caso no relativista el parámetro masa nos
caracterizaba a la función gauge cuya derivada total aparecía en la variación de la Lagrangiana.

2.2. Partícula Galileana con espín

La partícula elemental no relativista más general 1 es el sistema Lagrangiano cuyo espacio


cinemático X es todo el grupo de Galileo G . Describimos el estado de la partícula en cada
instante τ , mediante el conocimiento del tiempo t(τ ), la posición de un punto r(τ ), la velocidad
de este punto u(τ ) = dr/dt y la orientación de un sistema cartesiano de ejes unidad ei (τ ),
i = 1, 2, 3, ligados a ese punto. Estas nueve componentes (ei )j se pueden expresar en términos
de tres parámetros esenciales ρ(τ ), como se puede ver en el apéndice 2.8 y en la expresión:

1
(ei )j = R(ρ)ji = [(1 − ρ2 ) δji + 2ρj ρi + 2εikj ρk ] (2.24)
1 + ρ2

Sin embargo, esta asignación que hace un observador inercial de las variables de orientación de
la partícula, como un sistema de tres vectores unidad ortogonales ligados al punto es totalmente
arbitraria. Esto quiere decir que la Lagrangiana no va a ser una función explícita del valor actual de
estas variables, ya que cualquier otra asignación nos daría los mismos valores para la acción. Pero
lo que verdaderamente importa es que esta orientación va cambiando, por lo que la Lagrangiana
sí va a ser función de cómo la orientación cambia, es decir de la velocidad angular con que este
sistema de ejes rota, la cual es independiente de cual sea esa asignación inicial. Quiere esto decir
que si cualquier observador modica la orientación de los ejes unidad que asigna a la partícula,
esto no cambia el valor de la velocidad angular de los mismos, como veremos más adelante.

Tendremos por lo tanto otra simetría adicional a la del grupo cinemático, la de las rotaciones
locales de los sistemas de ejes unidad asociados al punto. Le llamaremos el grupo de rotaciones
Local, y lo designaremos por SO(3)L , el cual conmuta con todo el grupo de Galileo, por lo que al
menos el grupo de simetrías espacio-temporales es el e es función
G ⊗ SO(3)L . El resultado es que L
de las variables esenciales de orientación ρ y ρ̇ a través de su dependencia de la velocidad angular
ω, la cual se expresa en términos de ρ y ρ̇ en la forma (2.35), como veremos.

Entonces las variables cinemáticas son las diez variables reales x(τ ) ≡ (t(τ ), r(τ ), u(τ ), ρ(τ ))
con dominios t ∈ R, r ∈ R3 , u ∈ R3 y ρ ∈ R3c similarmente a los correspondientes parámetros
del grupo. La relación entre los valores x′ (τ ) y x(τ ) en cualquier instante τ para cualquier par
de observadores inerciales, y usando la representación pasiva de las rotaciones, está dado por:

t′ (τ ) = t(τ ) + b, (2.25)

r (τ ) = R(µ)r(τ ) + vt(τ ) + a, (2.26)

u (τ ) = R(µ)u(τ ) + v, (2.27)
µ + ρ(τ ) − µ × ρ(τ )
ρ′ (τ ) = . (2.28)
1 − µ · ρ(τ )
1
M. Rivas, Classical Particle Systems: I. Galilei free particles, J. Phys. A 18, 1971 (1985).
2.2. PARTÍCULA GALILEANA CON ESPÍN 83

Esta última expresión corresponde a que cada vector unidad transforma en la forma e′i = R(µ)ei ,
y formando con los tres vectores en forma de columna la matriz R(ρ), resulta R(ρ′ ) = R(µ)R(ρ)
y esta composición de matrices de rotación equivale a que entre los parámetros esenciales exista
la ley de transformación mencionada (2.28).
Entre estas variables cinemáticas existen las tres ligaduras diferenciales u(τ ) = ṙ(τ )/ṫ(τ ),
que junto con la homogeneidad de la Lagrangiana L e en términos de las derivadas de las variables
cinemáticas:
e ẋ) = (∂ L/∂
L(x, e ẋi )ẋi , (2.29)
nos reducen de diez a seis los grados de libertad esenciales de la partícula.
Estos grados de libertad son, la posición r(t) y la orientación ρ(t). La Lagrangiana depende
hasta la segunda derivada de r(t) y de la primera derivada de ρ(t). La expresión (2.29) está
dada explícitamente por:
Le = T ṫ + R · ṙ + U · u̇ + V · ρ̇, (2.30)
e ṫ, Ri = ∂ L/∂
donde las funciones T = ∂ L/∂ e ṙi , Ui = ∂ L/∂
e u̇i , Vi = ∂ L/∂
e ρ̇i serán, en general,
funciones de las variables cinemáticas (t, r, u, ρ) y funciones homogéneas de grado cero en
términos de las derivadas (ṫ, ṙ, u̇, ρ̇).
Las variables generalizadas son r , u y ρ, y sus momentos canónico conjugados son:
( ) ( )
∂L d ∂L ∂Le d ∂L e dU
pr = − 2 2
= − =R− ,
∂(dr/dt) dt ∂(d r/dt ) ∂ ṙ dt ∂ u̇ dt

∂L ∂Le
pu = = = U,
∂(du/dt) ∂ u̇

∂L ∂Le
pρ = = =V.
∂(dρ/dt) ∂ ρ̇
Como variables canónico-conjugadas, pr es el momento conjugado de r , pu es el momento
conjugado de u y pρ es el momento conjugado de las variables de orientación ρ.
Si suponemos que el parámetro de evolución τ es invariante, las variables derivadas trans-
forman bajo G :

ṫ′ (τ ) = ṫ(τ ), (2.31)



ṙ (τ ) = R(µ)ṙ(τ ) + v ṫ(τ ), (2.32)

u̇ (τ ) = R(µ)u̇(τ ), (2.33)
(ρ̇(τ ) − µ × ρ̇(τ ))(1 − µ · ρ(τ ))
ρ̇′ (τ ) = +
(1 − µ · ρ(τ ))2
µ · ρ̇(τ )(µ + ρ(τ ) − µ × ρ(τ ))
. (2.34)
(1 − µ · ρ(τ ))2

En vez de la derivada ρ̇(τ ) que transforma de una manera complicada, es mejor denir la
velocidad angular de la partícula ω como función de ella, en la representación pasiva, en la
forma
2
ω= (−ρ̇ + ρ × ρ̇), (2.35)
1 + ρ2
como veremos más adelante.
Es una función lineal de ρ̇, y transforma, como vemos más abajo, como:

ω ′ (τ ) = R(µ)ω(τ ). (2.36)
84 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

Dos observadores inerciales miden el mismo valor absoluto de la velocidad angular. La trans-
formación inversa de la (2.35) es la
1
ρ̇ = (−ω − ρ × ω + ρ(ρ · ω)) , (2.37)
2
Estamos interpretando la matriz de rotación que dene la orientación de la partícula R(ρ(τ ))
como una matriz cuyas tres columnas representan, en el instante τ , las componentes de los tres
vectores unidad ligados al punto. Entonces R(ρ(τ )) representaría la rotación que lleva el sistema
de ejes ligado a la partícula en el instante τ = 0 al sistema cartesiano en el instante τ .

Expresión de la velocidad angular.


Si tenemos en τ =0 los ejes ei (0), que denen por columnas la matriz de rotación R(ρ(0)), en el
instante τ serán
((e1 (τ ))(e2 (τ ))(e3 (τ ))) = R(ρ(τ ))R(ρ(0))
y su cambio por unidad de parámetro τ

((ė1 (τ ))(ė2 (τ ))(ė3 (τ ))) = Ṙ(ρ(τ ))R(ρ(0)) = Ṙ(ρ(τ ))R−1 (ρ(τ ))((e1 (τ ))(e2 (τ ))(e3 (τ )))

con lo que la velocidad de cambio de cada eje, considerado como vector columna, es la acción sobre
el propio eje en el instante τ de una matriz

dei
= Ṙ(ρ(τ ))R−1 (ρ(τ ))ei (τ ) = Ωei (τ ),

donde la matriz Ω = ṘR−1 = ṘRT es antisimétrica. En efecto, en cualquier instante τ se cumple,
R(ρ(τ ))R (ρ(τ )) = I, donde el superíndice T signica la matriz transpuesta, y I es la matriz unidad
T

3 × 3. Si tomamos la derivada con respecto a τ de esta expresión, ṘRT + RṘT = Ω + ΩT = 0, por


lo que las tres componentes esenciales de la matriz antisimétrica Ω denen un vector ω
 
0 −ωz ωy
Ω =  ωz 0 −ωx  ,
−ωy ωx 0
de tal manera que podemos escribir la dinámica de cada vector unidad como

dei
= ω × ei . (2.38)

y ω se interpreta como la velocidad angular con que rota el sistema cartesiano ligado al punto. Las
componentes de ω, expresadas como funciones de las variables ρ y ρ̇ vienen dadas en (2.35).

Si cada observador inercial cambia la matriz R(τ ) formada por los tres vectores unidad en el
instante τ , por otra cualquiera R′ (τ ) = R(τ )M , donde M es cualquier matriz ortogonal, entonces
′T
(τ ) = M T RT (τ ), y para este observador Ω′ = Ṙ′ R′ = ṘM M T RT = ṘRT = Ω, por lo que
T
R
cualquier asignación que este observador haga de la orientación, nos produce la misma expresión de
la velocidad angular como función de ρ y ρ̇, cualesquiera que sea la ρ, en este sistema de referencia
en cualquier instante. Esto justica que la Lagrangiana no dependa explícitamente de las variables
ρ y ρ̇, y sí lo sea a través de la expresión de la velocidad angular como función de ellas.

La expresión (2.28) corresponde a R(ρ′ (τ )) = R(µ)R(ρ(τ )). Por lo tanto

Ω′ = Ṙ(ρ′ (τ ))RT (ρ′ (τ )) = R(µ)Ṙ(ρ(τ ))RT (ρ(τ ))RT (µ)


= R(µ)ΩRT (µ),

que implica una relación lineal entre las componentes estrictas ωi′ en términos de las ωj , lo
que conduce a la ecuación (2.36) en términos de las componentes esenciales ω de la matriz
antisimétrica Ω. Ver el apéndice 2.8.3 para la descripción precisa de la orientación.
e ρ̇i )ρ̇i se pueda escribir como
Esto hace que la parte de la Lagrangiana (∂ L/∂

∂L e e ∂ω j
∂L
V · ρ̇ ≡ ρ̇ i
= ρ̇i = W · ω, (2.39)
∂ ρ̇i ∂ω j ∂ ρ̇i
2.2. PARTÍCULA GALILEANA CON ESPÍN 85

e
debido a la linealidad de ω en términos de ρ̇ y donde Wi = ∂ L/∂ω i . Por lo tanto, la forma más

general de la Lagrangiana de una partícula elemental no relativista, se escribe, en vez de (2.30),


como:
e = T ṫ + R · ṙ + U · u̇ + W · ω,
L (2.40)
y donde las funciones T , R, U y W son funciones, en principio desconocidas y a determinar
en cada caso, de las variables (t, r, u, a, Ω), donde a = u̇/ṫ = du/dt, es la aceleración del
punto (no confundirlo con el parámetro de la traslación espacial), y la variable Ω = ω/ṫ es la
velocidad angular en la descripción temporal. Pero no son funciones explícitas de las variables
de orientación ρ. Todo esto es independiente de si la partícula es libre o está en interacción.
Como estamos usando un parámetro arbitrario de evolución τ , el mismo para todo obser-
vador inercial, y que lo podemos tomar adimensional, la Lagrangiana L e tiene dimensiones de
acción, por lo que cada uno de los sumandos de su desarrollo (2.40) tiene también dimensiones
e ẋi posee co-
de acción. Esto trae consigo que cada una de las funciones desconocidas Fi = ∂ L/∂
mo dimensiones la de acción dividida por la dimensión de la correspondiente variable cinemática
xi , ya que al ser τ adimensional xi y ẋi , tienen la misma dimensión. Así, T tendrá dimensión
de (acción/tiempo)=energía, R dimensión de (acción/longitud)=masa×velocidad es decir mo-
mento lineal, U la de (acción/velocidad)=masa×distancia o momento estático, y nalmente W
dimensión de acción o momento angular porque ω es adimensional.

2.2.1. Partícula libre con espín


Puesto que X es la totalidad del grupo de Galileo G , la función gauge más general es
efectivamente el exponente del grupo:

α(g; x) = ξ(g, hx ) = m(v 2 t(τ )/2 + v · R(µ)r(τ )), (2.41)

similar a (2.7), lo que nos permite interpretar el parámetro m como la masa de la partícula. Bajo
la acción de un elemento arbitrario del grupo de Galileo, la Lagrangiana L e 0 , si las ecuaciones
dinámicas son invariantes bajo el grupo de Galileo, transforma de acuerdo con:
e 0 (gx(τ ), d(gx(τ ))/dτ ) = L
L e 0 (x(τ ), ẋ(τ )) + dα(g; x(τ ))/dτ. (2.42)

Esto nos conduce, a través de un cálculo similar al desarrollado en (2.9)-(2.11), a que estas
funciones transforman:

T ′ (τ ) = T (τ ) − v · R(µ)R(τ ) − mv 2 /2, (2.43)



R (τ ) = R(µ)R(τ ) + mv, (2.44)

U (τ ) = R(µ)U (τ ), (2.45)

W (τ ) = R(µ)W (τ ). (2.46)

2.2.2. Constantes del movimiento Noetherianas


Conocida la acción del grupo de Galileo sobre las variables cinemáticas dado en (2.25)-(2.28),
el teorema de Noether nos dene las siguientes constantes del movimiento para la partícula libre:

a) Bajo una traslación temporal la función acción es invariante, λ(x) = 0, y llamamos como
es habitual a la magnitud conservada el momento temporal total de la partícula, H . Como
(s) (s)
δt = δb y δqi = 0, M = 1 y Mi = 0, y aplicando (1.37), tenemos:
(s)
H = pi(s) qi − L0 = (R − dU /dt) · u + U · u̇/ṫ + V · ρ̇/ṫ

−T − R · u − U · u̇/ṫ − W · ω/ṫ
86 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

y como W · ω = V · ρ̇, resulta que


dU
H = −T − · u, (2.47)
dt
donde todos los términos tienen dimensiones de energía.
b) Bajo traslaciones espaciales, A(x1 , x2 ) es invariante, λi (x) = 0, y se nos denen las tres
componentes del momento lineal total de la partícula P . Ahora
(r) (u)
δt = 0, M = 0, δri = δai , Mij = δij , δui = 0, Mij = 0,

(ρ)
δρi = 0, Mij = 0,
y entonces
dU
P =R− = pr , (2.48)
dt
donde todos los términos tienen dimensiones de masa×velocidad.
c) Bajo transformaciones Galileanas puras de velocidad δv, A(x1 , x2 ) no es invariante sino que
teniendo en cuenta (1.13) y la función gauge (2.41) a primer orden en los parámetros δvi , la
acción transforma como δA = mr 2 · δv − mr 1 · δv y por lo tanto, λi (x) = mri , lo que nos dene
las componentes del momento cinemático total de la partícula, K , en la forma:
(r) (u)
δt = 0, M = 0, δri = δvi t, Mij = δij t, δui = δvi , Mij = δij ,

(ρ)
δρi = 0, Mij = 0,
y así
K = mr − P t − U , (2.49)
donde todos los sumandos tienen dimensiones de masa×distancia.
A partir de K̇ = 0, nos lleva a P = mu − dU /dt, por lo que identicándolo con (2.48),
la función R = mu independientemente de la Lagrangiana particular que escojamos. Observar
que el momento lineal total no tiene la dirección de la velocidad u = dr/dt, del punto r .

d) Finalmente, bajo rotaciones A(x1 , x2 ) permanece invariante, λi (x) = 0, y la correspondiente


constante del movimiento, el momento angular total de la partícula con respecto al origen
del sistema de referencia del observador J , proviene de la transformación innitesimal de valor
δαi , en tanto que el parámetro δµi = δαi /2, es la mitad del ángulo innitesimal rotado, por lo
que
(r)
δt = 0, Mi = 0, δri = ϵikj rk δαj , Mij = ϵikj rk ,
(u)
δui = ϵikj uk δαj , Mij = ϵikj uk ,
(ρ)
δρi = δαj (δij − ϵijk ρk + ρi ρj )/2, Mij = (δij − ϵijk ρk + ρi ρj )/2,
y como la constante del movimiento es
(r) (u) (ρ)
Jj = −pri Mij − pui Mij − pρi Mij

lo que nos lleva a


−Pi ϵikj rk = ϵjki rk Pi , −Ui ϵikj uk = ϵjki uk Ui ,
como de (2.35)
∂ωk 2
= (−δki + ϵkli ρl )
∂ ρ̇i 1 + ρ2
2.2. PARTÍCULA GALILEANA CON ESPÍN 87

(ρ)
e 0 ∂ωk (ρ)
∂L
−Vi Mij = − M = Wj ,
∂ωk ∂ ρ̇i ij
puesto que
∂ωk (ρ)
M = −δkj ,
∂ ρ̇i ij
y por lo tanto, en forma vectorial

J = r × P + u × U + W = L + Z + W = r × P + S, (2.50)

donde todos los sumandos tienen dimensiones de acción o momento angular. L = r × P repre-
senta al momento angular orbital, Z = u×U es el momento angular debido a la dependencia de
la Lagrangiana de la aceleración y que, como veremos, proviene del movimiento orbital relativo
del centro de carga alrededor del centro de masa (o Zitterbewegung) y W proviene de la depen-
dencia de la Lagrangiana de la velocidad angular y lo interpretamos como la parte rotativa del
momento angular.
Como J es el momento angular total de la partícula con respecto al origen del observador, S
representa el momento angular de la partícula o espín con respecto al punto r . Como dJ /dt = 0,
el espín S satisface dS/dt = P × u y no es una constante del movimiento ni siquiera para la
partícula libre. Es el momento angular clásico equivalente al operador espín de Dirac en el caso
cuántico, puesto que satisface exactamente su misma ecuación dinámica.

e) Hemos mencionado que además del grupo de Galileo como grupo de simetrías de la partícula
elemental libre tenemos el grupo de rotaciones locales SO(3)L . Este grupo solamente afecta a
las variables de orientación. Así, las variables cinemáticas transforman:

t′ = t, r ′ = r, u′ = u, R(ρ′ ) = R(ρ)M (α), ∀M (α) ∈ SO(3)L ,

Solamente se nos transforman las variables ρ, que corresponde en el caso innitesimal a

ρ + δα/2 − ρ × δα/2 1
ρ′ =
(L)
, δρi = δαj (δij + ρi ρj − ϵilj ρl ) = Mij δαj .
(1 − ρ · δα/2) 2

Las magnitudes conservadas solo provienen de los momentos pρ = V , y serán:

(L)
e 0 ∂ωk (L)
∂L
Tj = −Vi Mij = − M ,
∂ωk ∂ ρ̇i ij
pero
∂ωk (L) −1 ( )
Mij = 2
(1 − ρ2 )δkj + 2ρk ρj + 2ϵkjs ρs
∂ ρ̇i 1+ρ
con lo que este término es en realidad la componente k , cambiada de signo, del vector unidad
ej , (ej )k , dado en (2.24), con lo que estas constantes del movimiento son

Tj = −Wk (−ej )k = W · ej , (2.51)

laproyección, en los vectores unidad de la partícula, del momento angular ligado


con la rotación.
De estas constantes del movimiento, el momento lineal P proviene de la invariancia de L con
respecto a las variables de posición r , por lo que de las propias ecuaciones de Euler-Lagrange
para estos grados de libertad podríamos haber obtenido:
( ) ( ) [ ( )]
∂L0 d ∂L0 d2 ∂L0 d ∂L0 d ∂L0
− + 2 = 0, − = 0,
∂ri dt ∂(dri /dt) dt ∂(d2 ri /dt2 ) dt ∂(dri /dt) dt ∂(d2 ri /dt2 )
88 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

pues ∂L0 /∂ri = 0, con lo que obtenemos dP /dt = 0, donde P viene dado en (2.48).
La conservación de las proyecciones Ti se puede obtener también de las propias ecuaciones
dinámicas relativas a la orientación. Como L e depende de ρ y de ρ̇ a través de la velocidad
angular ω , estas ecuaciones dinámicas se reescriben como
( ) ( )
∂Le0 d ∂L e0 e 0 ∂ωj
∂L d ∂L e 0 ∂ωj e0
∂L
− = 0, − = 0, = Wj ,
∂ρi dτ ∂ ρ̇i ∂ωj ∂ρi dτ ∂ωj ∂ ρ̇i ∂ωj

que nos llevan a


dW
= ω × W, (2.52)

y la variación de los ejes del cuerpo ei , hemos visto que es en (2.38)

dei
= ω × ei ,

de donde con Ti = W · ei , derivando con respecto a τ ,

dTi
= (ω × W ) · ei + W · (ω × ei ) = 0.

Veremos la importancia que tienen estas componentes conservadas del espín en el caso
cuántico, para clasicar los estados básicos del espacio de Hilbert del electrón.

Ejercicio: Demostrar que si una Lagrangiana depende de las variables de orientación ρ y ρ̇ a


través de la expresión (2.35) de la velocidad angular ω(ρ, ρ̇), entonces las ecuaciones dinámicas
relacionadas con la orientación,
( )
e
∂L d ∂L e
− = 0,
∂ρi dτ ∂ ρ˙i
se transforman en
e
∂L
dW /dτ = ω × W , con Wi = .
∂ωi

2.2.3. Espín respecto del centro de masa


Podemos considerar también el momento angular de la partícula con respecto a su centro de
masa, una vez que éste, esté adecuadamente denido. El observador del centro de masa se dene
como aquel observador inercial para el que P = 0 y K = 0. Estas seis condiciones denen una
clase de observadores denidos salvo una rotación arbitraria y una traslación temporal, también
arbitraria. La condición P = 0 dene la clase de observadores para los que el centro de masa
está en reposo y K = 0 es la condición adicional de que el centro de masa esté situado en el
origen del sistema de referencia. Esto proviene de (2.49), que si ponemos k = U /m, éste es
un observable con dimensiones de longitud, y tomando la derivada con respecto a τ en ambos
lados, sabiendo que Ṗ = 0, obtenemos:

d(r − k)
K̇ = 0 = mṙ − P ṫ − mk̇, es decir, P =m . (2.53)
dt
Entonces el punto q = r − k se mueve a velocidad constante y vemos que representa la posición
del centro de masa de la partícula. Por lo tanto, el observable k = r − q es la posición relativa
del punto r con respecto al centro de masa, el cual queda denido por
1
q=r− U. (2.54)
m
2.2. PARTÍCULA GALILEANA CON ESPÍN 89

Vemos que P = 0 y K = 0 dan lugar efectivamente a dq/dt = 0, y r = k, es decir, q = 0,


como habíamos adelantado. Con esta denición, el momento cinemático se puede reescribir como
K = mq − P t, en términos de la posición del centro de masa q y del momento lineal total P .
Podemos denir el momento angular de la partícula con respecto a su centro de masa
S CM , como la diferencia entre el momento angular total J y el momento angular orbital del
movimiento del centro de masa q × P , por lo que
1 dk
S CM = J − q × P = J − K × P = S + k × P = −mk × + W. (2.55)
m dt
Vemos que también se escribe como el momento angular S con respecto al punto r , más el
momento angular orbital de este punto k × P con respecto al centro de masa. El espín S CM ,
queda expresado en términos de las constantes del movimiento J , K y P , y es por lo tanto
otra constante del movimiento. Alternativamente lo podemos describir de acuerdo con la última
expresión como la parte rotatoria del momento angular W y del término −k × mdk/dt que
sugiere una contribución de naturaleza (anti)orbital debida al movimiento relativo del punto r
alrededor del centro de masa. Esta parte está relacionada con el zitterbewegung, o más precisa-
mente con la función U = mk que reeja la dependencia de la Lagrangiana con la aceleración.
El otro término W proviene de la dependencia de los otros tres grados de libertad ρi , y, por lo
tanto, de la velocidad angular. Este zitterbewegung reeja el movimiento del centro de carga
alrededor del centro de masa. La consideración de que el punto r representa al centro de carga,
ha sido ya sugerido en trabajos previos sobre el electrón relativista 2 .
Debido a que para la partícula libre J̇ = 0, y que dW /dτ = ω ×W y a partir de la expresión
de P , (2.48), obtenemos una relación general entre diferentes observables para una partícula
libre:
ṙ × R + u̇ × U + ω × W = 0, (2.56)
lo cual reeja que la velocidad, aceleración y velocidad angular no son magnitudes totalmente
independientes. De alguna manera, podemos tomar como sistema de ejes ligados al punto r ,
la terna de vectores unidad de Frenet-Serret de la trayectoria del punto. Según esto, con ṙ y
r̈ , se determinan el vector tangente y la normal principal, su producto vectorial nos dene la
binormal, y por lo tanto la derivada de la terna nos produce la velocidad angular que será
también función de la tercera derivada.
Sabiendo que en el caso no relativista R y ṙ tienen la misma dirección, se reduce a
u̇ × U + ω × W = 0. (2.57)

2.2.4. Dinámica del espín


Como el momento angular es un observable que está denido con respecto a un punto con-
creto, y la partícula elemental posee dos puntos característicos r y el centro de masa q , podemos
analizar la dinámica del espín con respecto a esos dos puntos, S y S CM , respectivamente. En
cualquier caso, conocido el momento angular con respecto a un punto, nos permite calcular el
momento angular con respecto a cualquier otro sin más que añadirle r×P , siendo P el momento
lineal total del sistema y r el vector de posición del primer punto con respecto al segundo. Para
la partícula libre, el momento angular con respecto al origen del observador, se escribe:
J = r × P + S = q × P + S CM .
De aquí se deduce, derivando con respecto al tiempo que
dS dS CM
= P × u, = 0.
dt dt
2
A.O. Barut and A.J. Bracken, Zitterbewegung and the internal geometry of the electron, Phys. Rev. D 23,
2454 (1981).
90 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

Sin embargo, si sobre la partícula y en el punto r , tenemos localizada una fuerza F , el momento
de esta fuerza con respecto al origen, nos dará la variación de J ,

dJ dP dS
=r×F =u×P +r× +
dt dt dt
pero dP /dt = F , con lo que el espín S satisface exactamente la misma ecuación dinámica que
en el caso libre, es decir
dS
= P × u,
dt
solo que hora P no es una constante del movimiento. Para el otro

dJ dP dS CM
=r×F =v×P +q× +
dt dt dt
por lo que
dS CM
= (r − q) × F ,
dt
es el par externo, de la fuerza denida en r , con respecto al centro de masa. Si el espín con
respecto al centro de masa no se conserva, entonces r ̸= q y el centro de masa y el centro de
carga son necesariamente dos puntos distintos.

2.2.5. Transformación de diversos observables

Las diferentes funciones que componen la Lagrangiana L e , transforman bajo el grupo de


Galileo de acuerdo con (2.43)-(2.46). Si la tercera de estas ecuaciones la derivamos con respecto
a τ y la dividimos por ṫ′ = ṫ, resulta:

dU ′ dU dU ′ dU dU
= R(µ) , u′ · =u· + v · R(µ)
dt′ dt dt′ dt dt
Esto nos lleva a que el momento lineal P y el momento temporal H , transformen entre los
observadores Galileanos en la forma dada en (2.16-2.17) para estos mismos observables en el
caso de la partícula puntual.

1
H ′ = H + v · R(µ)P + mv 2 , (2.58)
2

P = R(µ)P + mv. (2.59)

De esta forma, si H0 y P 0 = 0, son los valores que toman estos observables para el observador
del centro de masa, entonces, para cualquier otro observador que ve moverse al centro de masa
con velocidad v
1 P2
H = H0 + mv 2 = H0 + , P = mv.
2 2m
Por lo tanto, cualquiera que sea el observador, la magnitud H − P 2 /2m = H0 es un número
constante y dene una propiedad intrínseca de la partícula elemental, ya que su medida es
e , es la que dene la parte
independiente del observador. Además, la parte espacio-temporal de L
variante gauge, y adopta la forma general

T ṫ + R · ṙ = −H ṫ + P · ṙ.

En efecto
1
−H ′ ṫ′ + P ′ · ṙ ′ = −H ṫ + P · ṙ + mv 2 ṫ + mv · R(µ)ṙ.
2
2.2. PARTÍCULA GALILEANA CON ESPÍN 91

De esta forma, la parte segunda de la Lagrangiana U · u̇ + W · ω , es necesariamente invariante


Galileana. El otro parámetro intrínseco de la partícula elemental, el espín o la velocidad de
rotación interna, aparecerá ligado a esta parte invariante. Si expresamos el Hamiltoniano en
términos de los invariantes H0 y m, la primera parte nos queda
( )
mṙ 2 1 dU 2
−H ṫ + P · ṙ = −H0 ṫ + − ṫ.
2ṫ 2m dt
El primer término es una derivada total y se puede suprimir, el segundo es el que da lugar a la
variación gauge de la Lagrangiana, y el tercero es necesariamente invariante Galileano.
La transformación del espín con respecto al centro de masa S CM denido en (2.55), proviene
de cómo transforman k = U /m y W ,

dk′ dk
k′ = R(µ)k, = R(µ) , W ′ = R(µ)W
dt′ dt
lo que nos lleva a que
S ′CM = R(µ)S CM
y por lo tanto S ′ 2CM = SCM
2 , es una propiedad invariante entre observadores. Para la partícula

libre es también constante es decir es un número o propiedad intrínseca de la partícula. La


Lagrangiana de una partícula con espín dependerá de forma explícita de estos dos invariantes
m y SCM .
No podemos decir lo mismo del espín con respecto al centro de carga S = u × U + W que
transforma en la forma:

S ′ = u′ × U ′ + W ′ = (R(µ)u + v) × R(µ)U + R(µ)W = R(µ)S + v × R(µ)U ,

y por lo tanto su módulo depende de v y no es por lo tanto una propiedad intrínseca.


El centro de masa transforma como r :

q ′ (τ ) = R(µ)q(τ ) + vt(τ ) + a.

Esto no va a ser así en el caso relativista y el centro de masa no transforma como la posición
del punto. Esto se debe a que si q y r son considerados con simultaneidad en un referencial,
sus transformados q ′ y r ′ no tienen por qué ser simultáneos en otro referencial relativista, cosa
que sí ocurre en el caso no relativista. También, en el caso relativista, la denición del centro
de masa q depende de la aceleración del punto r .

2.2.6. Partícula Galileana con espín (anti)orbital


Para analizar la estructura del espín de una partícula elemental vamos a ver ejemplos en los
que las dos contribuciones asociadas a las funciones U y W , aparecen por separado.
Consideremos una partícula elemental Galileana cuyo espacio cinemático sea X = G/SO(3),
de tal forma que cada punto x ∈ X está caracterizado por las siete variables x ≡ (t, r, u), u =
dr/dt, que se interpretan como tiempo, posición y velocidad de la partícula, respectivamente.
En este ejemplo no tenemos variables de orientación. Como la Lagrangiana depende de las
derivadas de estas variables, será también función de la aceleración.
Si la partícula es libre, debido a la invariancia por rotación y traslación, esto implica que L0
será función solamente de u2 , (du/dt)2 y u · du/dt = d(u2 /2)/dt. Este último término es una
derivada total, por lo que puede ser descartado.
A partir de la condición (2.57), U ∼ u̇, y por otra parte U = mk, pero k es la posición
relativa del punto r con respecto al centro de masa, con lo que en este vector k tiene que tener
dirección opuesta a la aceleración de r , porque si no el punto r se separaría del q , de ahí que el
92 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

término U · u̇ ∼ −u̇2 . Como por otra parte la expresión T ṫ + R · ṙ = −H ṫ + P · ṙ nos produce


el término gauge dependiente de la masa, esto sugiere que debe ser de la misma forma que en
el caso de la partícula puntual.
Supongamos pues que nuestra partícula elemental viene dada por la siguiente Lagrangiana,
que en términos de los tres grados de libertad r y sus derivadas, se escribe:
( ) ( )2
m dr 2 m d2 r
L0 = − 2 . (2.60)
2 dt 2ω dt2
El parámetro m es la masa de la partícula ya que el primer término es variante gauge con la
misma función gauge (2.41) que depende de esta constante m, mientras que el parámetro ω
de dimensiones de tiempo−1 representa una frecuencia interna constante e inmodicable. Es la
frecuencia del zitterbewegung. Los parámetros m y ω serían las propiedades intrínsecas de esta
partícula.
En términos de las variables cinemáticas y de sus derivadas, y en términos de un parámetro
de evolución τ arbitario, la Lagrangiana se reescribe
2 2
e 0 = m ṙ − m u̇ ,
L (2.61)
2 ṫ 2ω 2 ṫ
donde el punto signica derivada con respecto a τ . Si consideramos que el parámetro de evolución
es adimensional, entonces todos los términos en la Lagrangiana tienen dimensiones de acción.
Por ser la Lagrangiana una función homogénea de grado uno en términos de las derivadas de
e 0 puede escribirse como
las variables cinemáticas, L
e 0 = T ṫ + R · ṙ + U · u̇,
L (2.62)

donde las diferentes funciones que aparecen están denidas por


e0 ( ) ( )2
∂L m dr 2 m d2 r
T = =− + 2 ,
∂ ṫ 2 dt 2ω dt2
∂Le0 dr
R = =m , (2.63)
∂ ṙ dt
e
∂ L0 m d2 r
U = =− 2 2. (2.64)
∂ u̇ ω dt
Las ecuaciones dinámicas que se obtienen de la Lagrangiana (2.60) son:

1 d4 r d2 r
+ 2 = 0, (2.65)
ω 2 dt4 dt
cuya solución general es:

r(t) = A + Bt + C cos ωt + D sin ωt, (2.66)

en términos de 12 constantes de integración A, B , C y D .


Al aplicar el teorema de Noether al grupo de Galileo, las correspondientes constantes del
movimiento se pueden escribir en la forma:
dU
Momento temporal H = −T − u · , (2.67)
dt
dU dU
Momento lineal P = R−
= mu − , (2.68)
dt dt
Momento cinemático K = mr − P t − U , (2.69)
Momento angular J = r × P + u × U. (2.70)
2.2. PARTÍCULA GALILEANA CON ESPÍN 93

Al no tener la partícula variables de orientación no podemos denir la proyección Ti del momento


angular de rotación en los ejes del cuerpo.
Es precisamente la presencia de la función U lo que distingue a esta partícula de la partícula
puntual. La magnitud S = u × U representa el espín con respecto al punto r . Encontramos en
este ejemplo más simple que el momento lineal tampoco tiene la dirección de la velocidad u, y
la estructura del espín está ligada con la dependencia de la Lagrangiana de la aceleración.
Si sustituimos la solución general (2.66) en (2.67-2.70) vemos que las constantes del movi-
miento se pueden escribir en términos de las constantes de integración,

m 2 mω 2 2
H = B − (C + D 2 ), (2.71)
2 2
P = mB, (2.72)
K = mA, (2.73)
J = A × mB − mωC × D. (2.74)

El momento cinemático K en (2.69) diere del de la partícula puntual (2.14) en el término


−U , de tal manera que si denimos el vector k = U /m, con dimensiones de longitud, entonces
K̇ = 0 nos lleva de (2.69) a la ecuación:

d(r − k)
P =m ,
dt
y q = r − k, dene la posición del centro de masa de la partícula, que es un punto distinto de
r y que usando (2.64) viene dado por

1 1 d2 r
q=r− U =r+ 2 . (2.75)
m ω dt2
Tiene la forma (2) que poseía el centro de masa en términos del centro de carga en el análisis
hecho en el preámbulo de estas notas.
Las ecuaciones dinámicas (2.65) se pueden reescribir en la forma:

d2 q
= 0, (2.76)
dt2
d2 r
+ ω 2 (r − q) = 0, (2.77)
dt2
donde (2.76) es (2.65) después de derivar dos veces (2.75), y la ecuación (2.77) es (2.75) habiendo
puesto todos los términos en el lado izquierdo.
A partir de (2.76) vemos que el punto q se mueve en línea recta y a velocidad constante,
mientras que el movimiento de r , dado en (2.77), es un movimiento armónico isótropo de
pulsación constante ω , alrededor del punto q .
El espín de la partícula con respecto al centro de masa, S CM se dene como

1
S CM = J − q × P = J − K × P, (2.78)
m
que al quedar escrito en términos de constantes del movimiento, es claramente otra constante del
movimiento. Su magnitud S 2 es una propiedad constante e invariante para todos los observadores
inerciales, por lo que será una propiedad intrínseca que caracteriza a la partícula. En términos
de las constantes de integración se expresa como

S CM = −mω C × D. (2.79)
94 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

A partir de su denición, obtenemos


d dk
S CM = u × U + k × P = −m(r − q) × (r − q) = −k × m , (2.80)
dt dt
y aparece como un momento angular (anti)orbital del movimiento relativo del punto r alrededor
del centro de masa q en reposo, de tal manera que el momento angular total, se escribe
J = q × P + S CM = L + S CM . (2.81)
Es la suma del momento angular orbital L asociado al movimiento del centro de masa y de la
parte del espín S CM . Para una partícula libre, ambos L y S CM son separadamente constantes
del movimiento. Usamos el término (anti)orbital para sugerir que si el vector k representa la
posición de un punto de masa m, el momento angular de este movimiento tiene la dirección
opuesta a la del observable espín. Pero como veremos en seguida, k no representa la posición
de ninguna masa sino que se trata de la posición relativa del centro de carga de la partícula,
con respecto al centro de masa.
Ejercicio: Vericar que las soluciones de las ecuaciones de Euler-Lagrange de la partícula con
espín antiorbital (2.60) en términos de las condiciones de contorno en dos puntos (t1 , r 1 , u1 ) y
(t2 , r 2 , u2 ) conducen a que la función acción es
[
m 1
A(t1 , r 1 , u1 ; t2 , r 2 , u2 ) = (u2 − u1 )2 sin ω(t2 − t1 )+
2∆ ω
+ω(r 2 − r 1 )2 sin ω(t2 − t1 ) − (t − 2 − t1 )(u2 − u1 )2 cos ω(t2 − t1 )+
+2(t − 2 − t1 )(u2 · u1 )(1 − cos ω(t2 − t1 )) − 2(r 2 − r 1 ) · (u1 + u2 )(1 − cos ω(t2 − t1 ))] ,
donde ∆ = 2(1 − cos ω(t2 − t1 )) − ω(t2 − t1 ) sin ω(t2 − t1 ).

2.2.7. Interacción con un campo electromagnético externo


Si q representa la posición del centro de masa, entonces ¾qué posición representa el punto r ?
El punto r representa la posición de la carga de la partícula. Esto lo podemos ver considerando
una cierta interacción con un campo externo. La homogeneidad de la Lagrangiana en términos
de las derivadas de las variables cinemáticas sugiere una Lagrangiana de interacción de la forma:
e I = −eϕ(t, r)ṫ + eA(t, r) · ṙ,
L (2.82)
lineal en las derivadas de las variables t y r y donde los potenciales externos son solamente
funciones de t y r . Podríamos haber considerado otros términos de interacción de la forma
N (t, r, u) · u̇, y que también las funciones ϕ y A dependieran de u y u̇. Sin embargo, si la
Lagrangiana de interacción depende de u̇ esto implica que la interacción modica la denición
del observable U = mk el cual dene el espín. Pero si la partícula es elemental, sus propiedades
intrínsecas no pueden cambiar de tal manera que (2.82) es el término de interacción más general.
Es lo que se denomina el acoplamiento mínimo, entre la corriente asociada al movimiento de
la carga jµ con los potenciales externos en la forma jµ Aµ , donde la corriente jµ se reere al
movimiento de la carga asociada al punto r , como veremos a continuación. Por lo visto en la
sección 2.1.3, ni ϕ ni A serán funciones de u, por lo que (2.82) es la interacción más general.
Las ecuaciones dinámicas que se obtienen de L0 + LI son
1 d4 r d2 r e
2 4
+ 2 = (E(t, r) + u × B(t, r)) , (2.83)
ω dt dt m
donde el campo eléctrico E y el campo magnético B se expresan en términos de los potenciales
en la forma habitual, E = −∇ϕ − ∂A/∂t, B = ∇ × A. Las ecuaciones dinámicas (2.83) pueden
ser separadas en la forma
d2 q e
= (E(t, r) + u × B(t, r)) , (2.84)
dt2 m
d2 r
+ ω 2 (r − q) = 0. (2.85)
dt2
2.2. PARTÍCULA GALILEANA CON ESPÍN 95

El centro de masa q satisface ecuaciones Newtonianas bajo la acción de la fuerza de Lorentz


externa, mientras que el punto r sigue satisfaciendo el mismo movimiento armónico isótropo de
pulsación constante ω alrededor de q . Pero la fuerza externa y los campos están denidos en el
punto r y no en el punto q . Además, es la velocidad u del punto r la que aparece en el término
magnético de la fuerza de Lorentz. El punto r representa claramente la posición de la carga de
la partícula.

Figura 2.1: Movimiento de la carga e > 0 en el sistema del C.M. El momento magnético
tiene sentido contrario al espín y el momento dipolar eléctrico d = ek, es perpendicular al
espín.

Esta carga efectúa un movimiento oscilante de muy alta frecuencia ω , que para el electrón
relativista es, como veremos, ω = 2mc2 /~ ≃ 1,55 × 1021 s−1 . El valor medio de la posición de
la carga es el centro de masa pero este movimiento relativo da lugar al momento magnético
µ de la partícula, dibujado en la gura en sentido opuesto al espín, en el supuesto de que la
carga e > 0 y ortogonal al plano del zitterbewegung. Su valor es, de acuerdo con su denición
clásica: 3

1 e dk e
µ= r × j d3 r = k × =− S CM , (2.86)
2 2 dt 2m

donde j = eδ 3 (r − k)dk/dt es la corriente asociada al movimiento de la carga e localizada en


el punto k.
La partícula también posee un momento dipolar eléctrico oscilante d = ek, perpendicular a
µ y por lo tanto a S CM para el observador del centro de masa, tal que para tiempos superiores
a su período natural, su valor medio temporal es cero.
A pesar de ser éste un ejemplo no relativista, por (2.86) vemos que posee una relación
giromagnética g = 1. Para que g ̸= 1 es necesario que exista otra componente del espín no rela-
cionada con el movimiento de la carga. Sin embargo, es importante ver que contiene un número
importante de detalles que aparecen cuando Dirac hace el análisis del electrón relativista 4 ,
donde ambos momentos µ y d aparecen, dando lugar a dos posibles términos de interacción en
el Hamiltoniano de Dirac. Regresaremos a este análisis cuando analicemos el electrón relativista.

3
J.D. Jackson, Classical Electrodynamics, John Wiley & Sons, NY (1998), 3rd. ed. p.186.
4
P.A.M. Dirac, The Principles of Quantum mechanics, Oxford Univ. Press, 4th ed. (1967).
96 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

2.2.8. Interacción con un campo magnético uniforme externo


Consideremos la interacción de este modelo de partícula con espín (anti)orbital en un campo
magnético uniforme externo B . Es un ejemplo que puede resolverse de forma exacta. La ventaja
de un modelo Lagrangiano es que no necesitamos postular ninguna ecuación para la dinámica del
espín, la cual aparecerá como consecuencia de la dinámica de los diferentes grados de libertad.
El resultado es que para el espín con respecto al centro de masa obtendremos una ecuación
dinámica del tipo dS CM /dt = µ × B , donde el momento magnético µ se expresará de forma
adecuada en términos del movimiento relativo del centro de carga.
El sistema de ecuaciones (2.84-2.85) se reduce a
d2 q e d2 r
= u × B, + ω 2 (r − q) = 0.
dt2 m dt2
Con la denición de las variables v = dq/dt, es equivalente a un sistema lineal de doce ecuaciones
diferenciales de primer orden para las componentes cartesianas de r , u, q y v . Si denimos la
variable adimensional τ = ωt, entonces este sistema de ecuaciones depende únicamente del
parámetro adimensional a = eB/mω que es el cociente entre la frecuencia ciclotrónica |ωc | =
eB/m y ω , la frecuencia natural del movimiento interno.
Si tomamos el campo magnético a lo largo del eje OZ la fuerza externa es ortogonal a él. Si
llamamos q3 y r3 a las correspondientes coordenadas a lo largo de este eje, del centro de masa
y del centro de carga, respectivamente, satisfacen
d 2 q3 d2 r3
= 0, + ω 2 (r3 − q3 ) = 0 (2.87)
dt2 dt2
cuya solución general en términos de los valores iniciales q3 (0), r3 (0), v3 (0) y u3 (0) es
q3 (t) = q3 (0) + v3 (0)t, (2.88)
1
(u3 (0) − v3 (0)) sin ωt + q3 (0) + v3 (0)t.
r3 (t) = (r3 (0) − q3 (0)) cos ωt + (2.89)
ω
Análogamente, las otras componentes del centro de masa en términos de la nueva variable de
evolución
d 2 q1 dr2 d 2 q2 dr1
2
= a , 2
= −a ,
dτ dτ dτ dτ
que integradas una vez obtenemos
dq1 dq2
= ar2 + b1 , = −ar1 + b2 , (2.90)
dτ dτ
donde b1 y b2 son dos constantes de integración con dimensiones de longitud.
Nos queda integrar estas dos ecuaciones (2.90) y las ecuaciones de las otras dos componente
del centro de carga, que aparecen como
dr1 dr2
= u1 , = u2 , (2.91)
dτ dτ
du1 du2
= q1 − r1 , = q2 − r2 . (2.92)
dτ dτ
Como es un sistema lineal de primer orden, la matriz de este sistema en términos de las seis
variables q1 , q2 , r1 , r2 , u1 y u2 , tomadas en este orden es
 
0 0 0 a 0 0
 0 0 −a 0 0 0 
 
0 0 0 0 1 0
M =  ,
0 0 0 0 0 1 
 
 1 0 −1 0 0 0 
0 1 0 −1 0 0
2.2. PARTÍCULA GALILEANA CON ESPÍN 97

cuya ecuación característica es λ6 + 2λ4 + λ2 + a2 = 0. Posee seis raíces diferentes, que corres-
ponden a los seis modos normales del sistema. Si llamamos λ = iz , estas variables verican
z 2 (1 − z 2 )2 = a2 , por lo que si resolvemos la ecuación cúbica z(1 − z 2 ) = a, las seis soluciones
de la forma ±iz serán los seis valores propios del sistema. Si denimos
( √ )
1 3 3a
k = arcsin , (2.93)
3 2

los seis valores propios son ±iωj , j = 1, 2, 3, donde:


2 1 1
ω1 = √ sin k, ω2 = − cos k − √ sin k, ω3 = cos k − √ sin k. (2.94)
3 3 3

Si 3 3|a|/2 ≤ 1 entonces las seis raíces son imaginarias puras y el movimiento es un mo-
vimiento tri-periódico con esas tres frecuencias. En caso contrario, si existen raíces reales, la
solución tiene un comportamiento exponencial. En general, para el electrón, como veremos más
adelante, la frecuencia del zitterbewegung es ω = 2mc2 /~, y por lo tanto

a/B = e/mω = e~/2m2 c2 = 1,13 × 10−10 Tesla−1 ,

por lo que incluso con campos magéticos muy intensos, el parámetro a es muy pequeño y la
solución correspondiente es oscilatoria.
La solución general del sistema completo será una combinación lineal de estas tres oscilacio-
nes y dependerá de doce constantes de integración que se expresarán en términos de los doce
valores iniciales de la posición y velocidad del centro de masa y del centro de carga. La forma
de la solución para el centro de carga es:

r1 (τ ) = A cos ω1 τ + B sin ω1 τ + C cos ω2 τ + D sin ω2 τ + E cos ω3 τ


+ F sin ω3 τ + b2 /a,
r2 (τ ) = B cos ω1 τ − A sin ω1 τ + D cos ω2 τ − C sin ω2 τ
+ F cos ω3 τ − E sin ω3 τ − b1 /a,
r3 (t) = (r3 (0) − q3 (0)) cos ωt
1
+ (u3 (0) − v3 (0)) sin ωt + q3 (0) + v3 (0)t,
ω
donde
b1 /a = v1 (0)/aω − r2 (0), b2 /a = v2 (0)/aω + r1 (0).
Para las coordenadas del centro de masa, obtenemos:

q1 (τ ) = (1 − ω12 ) (A cos ω1 τ + B sin ω1 τ )


+ (1 − ω22 ) (C cos ω2 τ + D sin ω2 τ )
+ (1 − ω32 ) (E cos ω3 τ + F sin ω3 τ ) + b2 /a,
q2 (τ ) = (1 − ω12 ) (B cos ω1 τ − A sin ω1 τ )
+ (1 − ω22 ) (D cos ω2 τ − C sin ω2 τ )
+ (1 − ω32 ) (F cos ω3 τ − E sin ω3 τ ) − b1 /a,
q3 (t) = q3 (0) + v3 (0)t.

Las seis constantes A, B, C, D, E , y F , condimensiones de longitud, satisfacen el sistema lineal


    
1 1 1 A −v2 (0)/aω
 ω1 ω2 ω3   C  =  −u2 (0)/ω  ,
ω12 ω22 ω32 E r1 (0) − q1 (0)
98 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

y     
1 1 1 B v1 (0)/aω
 ω1 ω2 ω3   D  =  u1 (0)/ω  ,
ω12 ω22 ω32 F r2 (0) − q2 (0)
donde q(0), v(0) and r(0), u(0), son, respectivamente la posición y velocidad del centro de
masa y centro de carga en el instante t = 0.
Si llamamos N a la inversa de la matriz que contiene a las frecuencias, resulta ser:
 
ω ω (ω − ω2 ) ω22 − ω32 ω3 − ω2
1  2 3 3
N= ω1 ω3 (ω1 − ω3 ) ω32 − ω12 ω1 − ω3  ,

ω1 ω2 (ω2 − ω1 ) ω12 − ω22 ω2 − ω1
donde ∆ = (ω1 − ω2 )(ω2 − ω3 )(ω3 − ω1 ), de tal manera que obtenemos la expresión nal de las
constantes de integración en términos de las condiciones iniciales.

A orden más bajo en el parámetro a, puesto que k ≈ 3a/2, los modos normales son:
a 3a2 a 3a2
ω1 = a + O(a3 ), ω2 = −1 − + + O(a3 ), ω3 = 1 − − + O(a3 ). (2.95)
2 8 2 8
En términos de los parámetros físicos, y en la evolución temporal, estas frecuencias normales
son, a orden más bajo:
ωc 3ωc2 ωc 3ωc2
ω1 = ωc , ω2 = ω − − , ω2 = ω + − , (2.96)
2 8ω 2 8ω
donde ωc = eB/m y ω son la frecuencia ciclotrónica y la del zitterbewegung, respectivamente.
Para expresar estos valores iniciales en términos de parámetros físicos, como el radio del
movimiento interno R0 , el radio ciclotrónico Rc , la velocidad del centro de masa v o la frecuencia
del zitterbewegung ω , consideremos un electrón que se lanza con velocidad v , perpendicular al
campo magnético uniforme externo B . Tomamos el plano XOY de tal manera que la posición
inicial del centro de masa está en la coordenada Rc = −vm/eB sobre el eje OX , y la velocidad
inicial v es a lo largo de la dirección positiva del eje OY . Con este convenio, el centro de
masa efectúa una precesión alrededor del eje OZ con una velocidad angular |ωc | en la dirección
positiva. Para una partícula de carga positiva la posición inicial se habría tomado en −|Rc |
sobre el eje OX y la velocidad angular iría en sentido negativo del eje OZ .
La posición inicial del centro de carga se caracteriza por los tres parámetros ϕ, θ y ψ , donde
θ y ϕ representan la orientación inicial de la velocidad angular interna ω , y el parámetro ψ es la
fase inicial del centro de carga como se muestra en la Figura 2.2. Con todos estos valores nulos,
ω apunta a lo largo del eje OZ y la posición del centro de carga es el punto Rc + R0 sobre el
eje OX .
Estos valores iniciales, escritos en forma matricial son:
     
Rc Rc R0
q(0) =  0  , r(0) =  0  + Roz (ϕ)Roy (θ)Roz (ψ)  0  ,
0 0 0
     
0 0 0
v(0) =  v  , u(0) =  v  + Roz (ϕ)Roy (θ)Roz (ψ)  ωR0  ,
0 0 0
donde Roz (α) representa una rotación en sentido activo, de valor α alrededor del eje OZ . Como
el espín antiorbital tiene su orientación opuesta a la de la velocidad angular, su valor inicial es
 
0
S CM (0) = Roz (ϕ)Roy (θ)  0  , (2.97)
−S
2.2. PARTÍCULA GALILEANA CON ESPÍN 99

Figura 2.2: Fase inicial ψ del centro de carga y orientación inicial (θ, ϕ) de la velocidad
angular ω.

donde S = mωR02 . Entonces, las condiciones iniciales para determinar los coecientes de la
solución general son:
       
−v2 (0)/aω Rc v1 (0)/aω 0
 −u2 (0)/ω  =  aRc − αR0  ,  u1 (0)/ω  =  γR0  ,
r1 (0) − q1 (0) βR0 r2 (0) − q2 (0) δR0

donde Rc = −vm/eB , ωc = −eB/m = −aω , como anteriormente, y los parámetros constantes:

α = − sin ϕ cos θ sin ψ + cos ϕ cos ψ,


β = cos ϕ cos θ cos ψ − sin ϕ sin ψ,
γ = − cos ϕ cos θ sin ψ − sin ϕ cos ψ,
δ = sin ϕ cos θ cos ψ + cos ϕ sin ψ.

A orden más bajo en a, las frecuencias son:


3 3
ω1 − ω2 = 1 + a, ω2 − ω3 = −2, ω3 − ω1 = 1 − a,
2 2
a a
ω1 + ω2 = −1 + , ω2 + ω3 = −a, ω3 + ω1 = 1 + ,
2 2
( ) ( ) (
a a2 a)
ω1 ω2 = −a 1 + , ω2 ω3 = − 1 − , ω3 ω1 = a 1 − ,
2 4 2
y la inversa de la matriz N , a orden O(a2 ), es
 
1 + 2a2 −a −1 − 9a2 /4
N =  a/2 − a2 −1/2 + a/2 − 3a2 /4 1/2 − 3a/4 + 9a2 /8  .
−a/2 − a2 1/2 + a/2 + 3a2 /4 1/2 + 3a/4 + 9a2 /8

De esta forma, los coecientes de la solución general, a primer orden en a, son:

A = Rc − βR0 + aR0 α,
B = −R0 (aγ + δ),
R0 aR0
C = (α + β) − (2α + 3β),
2 4
100 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

R0 aR0
D = (δ − γ) + (2γ − 3δ),
2 4
R0 aR0
E = (β − α) + (3β − 2α),
2 4
R0 aR0
F = (δ + γ) + (2γ + 3δ),
2 4
y los coecientes
b1 /a = −δR0 , b2 /a = βR0 .
Este movimiento depende del radio ciclotrónico Rc , a través del parámetro A, y el resto de
los términos dependen del radio interno R0 .
La solución general, despreciando términos de orden aR0 , se puede escribir en forma vectorial
como:
   
Rc R0
r(t) = Roz (ωc t)  0  + (I − Roz (ωc t)) R(ϕ, θ, ψ)  0 
0 0
 
( ) R0
ωc t
+ Roz − R(ϕ, θ, ψ + ωt)  0  + O(aR0 ),
2
0

donde I es la matriz unidad 3 × 3 y R(ϕ, θ, ψ) ≡ Roz (ϕ)Roy (θ)Roz (ψ). Los dos primeros
términos representan el movimiento del centro de masa a este orden de aproximación, mientras
que el tercero es precísamente el movimiento relativo del centro de carga alrededor del centro
de masa. La contribución a orden aR0 , que hemos despreciado, se puede escribir como:

O(aR0 )
 
[ ( ) ] 0
ωc t
= −Jz Roz (ωc t)R(ϕ, θ, ψ) − Roz − R(ϕ, θ, ψ + ωt)  aR0 
2
0
  
( ) aR0
sin(ωt) ωc t
−Jz  Roz − R(ϕ, θ, ψ)  0  ,
2 2
0

donde  
0 −1 0
Jz =  1 0 0  ,
0 0 0
es la matriz 3 × 3, generadora de las rotaciones alrededor del eje OZ . Los dos primeros términos
representan la corrección a este orden, del movimiento del centro de masa, y el tercero es
la corrección del movimiento relativo interno. La presencia del generador Jz en este término,
implica que esta corrección no produce ninguna contribución al movimiento alrededor del eje
OZ . La solución alrededor de OZ es exactamente:

q3 (t) = 0, r3 (t) = −R0 sin θ cos(ωt + ψ), (2.98)

es decir, un movimiento armónico de amplitud R0 sin θ, y frecuencia ω .


La posición relativa del centro de carga con respecto al centro de masa verica:
 
( ) R0
ωc t
k(t) = Roz − R(ϕ, θ, ψ + ωt)  0 
2
0
2.2. PARTÍCULA GALILEANA CON ESPÍN 101
  
( ) aR0
sin(ωt) ωc t
−Jz  Roz − R(ϕ, θ, ψ)  0  , (2.99)
2 2
0
y si despreciamos las contribuciones al orden aR0 , se reduce al primer término
 
( ) R0
ωc t
k(t) ≈ Roz − R(ϕ, θ, ψ + ωt)  0  , (2.100)
2
0
que representa una oscilación con la frecuencia natural ω del zitterbewegung alrededor del eje
inicial del espín, y con una precesión hacia atrás con la velocidad angular ωc /2.

Figura 2.3: Movimiento del centro de masa y centro de carga (en rojo) de una partícula
negativamente cargada, en un campo magnético uniforme. El espín con respecto al centro
de masa precesa en sentido contrario del movimiento ciclotrónico y con la mitad de la
velocidad angular. La velocidad del centro de masa es perpendicular al campo.
La trayectoria de los centros de masa y carga se ha dibujado en la Figura 2.3, donde el
movimiento rizado representa la trayectoria del centro de carga.
Para el estudio de la dinámica del espín con respecto al centro de masa, sustituiremos la
solución general en su denición analítica
dk(t)
S CM (t) = −mk(t) × , (2.101)
dt
donde lo único que tenemos que calcular es la derivada (2.100). Para este cálculo, tenemos que
tener en cuenta que
Roz (ωt) = exp(Jz ωt),
y por lo tanto
Ṙoz (ωt) = exp(Jz ωt)Jz ω = Roz (ωt)Jz ω = Jz ω Roz (ωt).
Tomando la derivada de (2.100) obtenemos los siguientes términos:
 
( ) −ωc R0 /2
dk ωc t
= Roz − Jz R(ϕ, θ, ψ + ωt)  0 
dt 2
0
 
( ) 0
ωc t
+ Roz − R(ϕ, θ, ψ + ωt)  ωR0  , (2.102)
2
0
102 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

donde    
0 R0
 ωR0  = ωJz  0  . (2.103)
0 0
De todos estos términos, el primero es de orden ωc R0 = vR0 /Rc = aωR0 = ac, que incluso con
campos magnéticos intensos se puede despreciar.
La dinámica del espín con respecto al centro de masa se reduce a:
 
( ) 0 ( )
ωc t ω t
R(ϕ, θ, ψ + ωt)   = Roz − c
S CM (t) = Roz − 0 S CM (0), (2.104)
2 2
−mωR0 2

donde S CM (0) viene dado en (2.97). El espín con respecto al centro de masa precesa hacia
atrás con la mitad de la velocidad angular del movimiento ciclotrónico mientras que su valor
absoluto permanece constante a este orden de aproximación. En la Figura 2.4 representamos
esta evolución durante el mismo intervalo temporal que la de la Figura 2.3 con una orientación
inicial θ = 30◦ y ϕ = 90◦ , donde podemos observar, además de la precesión con velocidad
angular constante, una pequeña nutación, al siguiente orden de aproximación.

Figura 2.4: Precesión del espín con respecto al centro de masa S CM , alrededor del eje OZ .

La energía del sistema es


dU
H = −T − u · , (2.105)
dt
que sepuede expresar como:
( ) ( )2
m dr 2 m d2 r m dr d3 r
H= − 2 + · + eV (r, t),
2 dt 2ω dt2 ω 2 dt dt3
y, como V (r, t) = 0 en presencia de un campo magnético constante, resulta:
( ) ( )
m dq 2 m dk 2 mω 2 2 (P − eA)2
H= − − k = + H0 . (2.106)
2 dt 2 dt 2 2m
A orden más bajo, la contribución proviene de
   
Rc R0
q(t) = Roz (ωc t)  0  + (I − Roz (ωc t)) R(ϕ, θ, ψ)  0  .
0 0
2.2. PARTÍCULA GALILEANA CON ESPÍN 103

Por lo tanto    
0 ωc R0
dq
= Roz (ωc t)  v  − Roz (ωc t) Jz R(ϕ, θ, ψ)  0  ,
dt
0 0
de tal manera que teniendo en cuenta (2.99) y (2.102)
  2
( )2 ωc R0
dq
= v 2 + Jz R(ϕ, θ, ψ)  0 
dt
0
    
0 ωc R0
− 2  v  · Jz R(ϕ, θ, ψ)  0  ,
0 0
 
2
( )2 −ωc R0 /2
dk
= ω 2 R02 + Jz R(ϕ, θ, ψ + ωt)  0 
dt
0
     
−ωc R0 /2 0
+2 Jz R(ϕ, θ, ψ + ωt)  0  · R(ϕ, θ, ψ + ωt)  ωR0  .
0 0
Como  
β(t) γ(t) cos ϕ sin θ
R(ϕ, θ, ψ + ωt) =  δ(t) α(t) sin ϕ sin θ  ,
− sin θ cos(ωt + ψ) sin θ sin(ωt + ψ) cos θ
 
−δ(t) −α(t) − sin ϕ sin θ
Jz R(ϕ, θ, ψ + ωt) =  β(t) γ(t) cos ϕ sin θ  ,
0 0 0
donde

α(t) = − sin ϕ cos θ sin(ψ + ωt) + cos ϕ cos(ψ + ωt),


β(t) = cos ϕ cos θ cos(ψ + ωt) − sin ϕ sin(ψ + ωt),
γ(t) = − cos ϕ cos θ sin(ψ + ωt) − sin ϕ cos(ψ + ωt),
δ(t) = sin ϕ cos θ cos(ψ + ωt) + cos ϕ sin(ψ + ωt)

entonces   
ωc R0 −δ(t)
Jz R(ϕ, θ, ψ + ωt)  0  = ωc R0  β(t)  .
0 0
En consecuencia ( )2
dq
= v 2 + ωc2 R02 (δ(0)2 + β(0)2 ) − 2vωc R0 β(0),
dt
( )2
dk ωc2 R02
= ω 2 R02 + (δ(t)2 + β(t)2 ) + ωωc R02 (δ(t)γ(t) − β(t)α(t)).
dt 4
Como
δ(t)γ(t) − β(t)α(t) = − cos θ,
δ(0)2 + β(0)2 = 1 − sin2 θ cos2 ψ,
δ(t)2 + β(t)2 = 1 − sin2 θ cos2 (ψ + ωt),
104 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

si expresamos ωc en términos del parámetro a, ωc = −aω , en el caso del electrón ωR0 = c, la


energía a orden más bajo en a es:
( 2 )
mc cos θ
H = H0 − a − mvcβ(0)
2
2
( )
2 mc 1
+a δ(0) + β(0) − (δ(t) + β(t) ) .
2 2 2 2
2 4
Al orden más bajo, la energía de interacción se puede poner como:

1 eB mc2
HI = − amc2 cos θ = − cos θ = −µ · B, (2.107)
2 2m ω
y como S = mωR02 = mc2 /ω , Sz = −S cos θ, implica que

eS cos θ eSz
µz = =− , (2.108)
2m 2m
o bien
e
µ=− S CM . (2.109)
2m
La energía de interacción se puede también escribir como:
eB e −ω c
HI = − S cos θ = B · S CM = · S CM , (2.110)
2m 2m 2
, como el producto escalar del espín con respecto al centro de masa y la velocidad angular
i.e.

de precesión del espín.

Desde otro punto de vista, si suponemos que la relación entre el espín y el mo-
mento magnético viene dada por (2.109), y que la dinámica del momento angular
con respecto al centro de masa viene dada por la ecuación del momento
dS CM e
=µ×B =− S CM × B = Ω × S CM .
dt 2m
La velocidad angular constante de precesión del espín, es la frecuencia angular de
Larmor
eB ωc
Ω= =− ,
2m 2
ya que ω c = −eB/m, i.e., de valor mitad y dirección opuesta a la velocidad an-
gular ciclotrónica, como se pone de maniesto en la Figura 2.4. Esto produce la
contribución a primer orden, ya que a este orden el espín conserva su valor absoluto.
Sin embargo, esta hipótesis no contiene los términos adicionales de corrección a los
modos normales ωi , que pueden ser relevantes en procesos de alta energía, y que se
pueden obtener usando la solución general exacta.

2.2.9. Partícula Galileana con orientación


Otro ejemplo simple de partícula con espín es aquél en el que el espín está relacionado con
las variables de orientación.
Desde el punto de vista matemático, el espacio cinemático es el X = G/R3v , donde R3v ≡
{R , +} es el sugbrupo Abeliano de las transformaciones Galileanas puras con velocidad cons-
3

tante. De esta forma, las variables cinemáticas son x ≡ (t, r, ρ), que se interpretan como el
tiempo, la posición y la orientación, respectivamente.
2.3. PARTÍCULA PUNTUAL RELATIVISTA 105

Una Lagrangiana para este espacio cinemático tiene la forma general


e = T ṫ + R · ṙ + W · ω.
L

Debido a la estructura del exponente (2.240), la función gauge es la misma que en los ejemplos
anteriores. La relación general (2.57) nos lleva a que W × ω = 0, ya que la Lagrangiana
es independiente de u̇, y por lo tanto W y ω son colineales. De acuerdo con la forma de
transformar de la Lagrangiana, el término W · ω es invariante Galileano y como W y ω son
colineales, podemos tomar W ∼ ω y una posible Lagrangiana puede ser de la forma:
2 2
e = m ṙ + I ω .
L (2.111)
2 ṫ 2 ṫ
Las diferentes constantes del movimiento Noetherianas son
( )
m dr 2 I 2
H= + Ω , P = mu,
2 dt 2
K = mr − P t, J = r × P + W,
donde u = dr/dt es la velocidad del punto r , y Ω = ω/ṫ is la velocidad angular en términos de
la evolución temporal, frente a la ω que representa la velocidad angular pero no con respecto
al tiempo sino con respecto al parámetro de evolución arbitrario τ . El punto r se mueve con
velocidad constante y representa tanto la posición del centro de carga como la posición del
centro de masa. El espín con respecto al centro de masa es el observable S ≡ W que satisface
la ecuación dinámica dS/dt = ω × S = 0, y por lo tanto, el sistema cartesiano local asociado
al punto r rota con velocidad angular constante Ω.
El espín toma el valor constante S = IΩ, y cuyo valor absoluto es independiente del obser-
vador inercial. El parámetro I juega el papel de momento principal de inercia, lo que sugiere
una proporcionalidad directa entre el espín y la velocidad angular, lo que corresponde a un
sistema mecánico con simetría esférica. Podríamos asociar un cierto tamaño a la partícula ya
que sugiere que posee un radio de giro R0 , relacionado con los otros parámetros por I = mR02 .
Este modelo correspondería clásicamente a un sólido rígido con simetría esférica (los tres
momentos principales de inercia iguales) de tal manera que las variables de orientación ρ descri-
ben la orientación de sus ejes principales de inercia. Es una partícula de seis grados de libertad.
Tres representan la posición del centro de carga r y los otros tres ρ, la orientación de un siste-
ma cartesiano, comóvil, ligado al punto r . Como no hay dependencia de la Lagrangiana de la
aceleración los centros de carga y centro de masa, son el mismo punto.
Para el observador del centro de masa no existe corriente asociada la movimiento del centro
de carga, por lo que no es posible asociarle ni momento magnético ni momento dipolar eléctrico.
Por lo visto en los ejemplos anteriores, las propiedades magnéticas de la partícula están asociadas
con la parte del espín relacionada con el zitterbewegung, y están ausentes en este modelo de
tipo sólido rígido.

PARTÍCULAS RELATIVISTAS

2.3. Partícula puntual relativista


El grupo cinemático asociado al Principio de Relatividad Restringido es el grupo de Poincaré.
Ver el Apéndice al nal del capítulo sobre el grupo de Poincaré para la notación y propiedades
que vamos a usar en este capítulo.
Consideremos un espacio cinemático caracterizado por las variables (t, r) ≡ x, con dominios
t ∈ R, r ∈ R3 , similares a los parámetros del grupo b y a, respectivamente. Este espacio
106 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

cinemático es la estructura cociente X = P/L, donde P es el grupo de Poincaré y el subgrupo


L es el grupo de Lorentz. Supondremos que son funciones de un cierto parámetro de evolución τ
y que en cualquier instante τ de la evolución dos observadores inerciales cualesquiera relacionan
sus medidas espacio-temporales mediante la acción del elemento del grupo g ≡ (b, a, v, µ) ∈ P ,
dada por:

t′ (τ ) = γt(τ ) + γ(v · R(µ)r(τ ))/c2 + b, (2.112)


γ2
r ′ (τ ) = R(µ)r(τ ) + γvt(τ ) + (v · R(µ)r(τ ))v + a, (2.113)
(1 + γ)c2
Estas variables se interpretan como el tiempo y la posición de la partícula. Si el parámetro de
evolución τ es invariante bajo el grupo tomando las derivadas con respecto a τ de (2.112) y
(2.113) obtenemos la ley de transformación de las derivadas de las variables cinemáticas

ṫ′ (τ ) = γ ṫ(τ ) + γ(v · R(µ)ṙ(τ ))/c2 , (2.114)


γ2
ṙ ′ (τ ) = R(µ)ṙ(τ ) + γv ṫ(τ ) + (v · R(µ)ṙ(τ ))v. (2.115)
(1 + γ)c2
La velocidad del punto u = dr/dt transforma entre observadores inerciales como

γ2
′ R(µ)u(τ ) + γv + (v · R(µ)u(τ ))v
ṙ (1 + γ)c2
u′ (τ ) = = . (2.116)
ṫ′ γ(1 + v · R(µ) u(τ )/c2 )
De la misma manera obtendríamos la ley de transformación de las sucesivas derivadas tempo-
rales, como la aceleración, etc.
Si a partir de (2.116) calculamos el módulo de la velocidad, resulta:

u2 − c2
u′ =
2
+ c2 . (2.117)
γ 2 (1 + v · R(µ) u(τ )/c2 )2
En principio el valor de la velocidad del punto no está restringido, pero si u < c entonces u′ < c
para todo observador inercial, y lo mismo si u > c, u′ > c y también si u = c resulta que
u′ = c. La formulación relativista nos brinda la descripción de tres tipos diferentes de partículas
puntuales, según que su velocidad u sea u < c, u = c o u > c, para todo observador inercial.
Para los casos u = c y u > c no es posible encontrar un observador en reposo respecto de ellas,
ya que el parámetro v del grupo de Poincaré satisface v < c.
No existen ligaduras entre estas variables y solamente la homogeneidad de la Lagrangiana
en términos de las derivadas de las variables cinemáticas nos reducen de cuatro a tres el número
de grados de libertad de la partícula. Esta homogeneidad nos lleva a la forma general:
e = T ṫ + R · ṙ,
L (2.118)

donde T = ∂ L/∂e ṫ y Ri = ∂ L/∂


e ṙi son todavía funciones desconocidas de las variables cinemáticas
y de sus derivadas, tanto si la partícula es libre o está en interacción. Además, son funciones
homogéneas de grado cero de las derivadas de las variables cinemáticas, por lo que son funciones
de (t, r, u) y debido a esta homogeneidad no son totalmente independientes pues satisfacen como
en el caso Galileano las ecuaciones (2.6).

2.3.1. Partícula puntual libre


Si la partícula es libre, las ecuaciones dinámicas son invariantes bajo P , y también la La-
grangiana porque el grupo de Poincaré no posee exponentes no triviales y las posibles funciones
gauge asociadas a su transformación son nulas.
2.3. PARTÍCULA PUNTUAL RELATIVISTA 107

Desde el punto de vista de las transformaciones innitesimales, como e 0 (t, r, ṫ, ṙ)
L depende
de estas variables que transforman según (2.112-2.115), los diferentes generadores del grupo de
Poincaré al actuar sobre funciones de estas variables son:

∂ r ∂ ṙ ∂
H= , P = ∇, J = r × ∇ + ṙ × ∇ṙ , K= + t∇ + 2 + ṫ∇ṙ ,
∂t c2 ∂t c ∂ ṫ
como en el caso Galileano, salvo el generador de los boosts K, que tiene una estructura diferente
porque la transformación de velocidad v afecta no solo a las variables espaciales r y ṙ como en el
caso Galileano, sino que también a las variables temporales t y ṫ.
Si e0 = 0
HL PL
y e 0 = 0, implica que L e 0 no es función de t ni de r . Además J L
e 0 = 0 implica
que es función de ṙ 2 y también de ṫ para ser homogénea de grado 1. Finalmente, si es invariante
bajo los boosts Lorentzianos K L e 0 = 0, lo que implica que
( )
ṙ ∂ e 0 = 0,
+ ṫ∇ ṙ L
c2 ∂ ṫ

que nos lleva a que e0


L es una función arbitraria de c2 ṫ2 − ṙ 2 . Además hay que exigirle que sea

homogénea de grado 1 en estas derivadas y que tenga dimensiones de acción. Una posibilidad es que

sea de la forma s c2 ṫ2 − ṙ 2 , con s un parámetro de dimensiones de masa×velocidad, por ejemplo

mc.

Como la Lagrangiana es invariante bajo P , desde el punto de vista de transformaciones


nitas, las funciones T y R transforman bajo P en la forma:

T ′ = γT − γ(v · R(µ)R), (2.119)


γ2
R′ = R(µ)R − γvT /c2 + (v · R(µ)R)v/c2 . (2.120)
1+γ
Donde vemos que, al no depender estas ecuaciones de b y a, las funciones T y R son invariantes
bajo traslaciones y, por lo tanto, independientes de t y de r .
Los momentos conjugados de las variables generalizadas qi = ri son pi = ∂ L e 0 /∂ ṙi , y las
constantes del movimiento Noetherianas se calculan de forma similar al caso Galileano. La
única diferencia es que ahora la función gauge es nula, y para el cálculo del momento cinemático
tenemos que las transformaciones innitesimales son δt = r · δv/c2 , Mi = ri /c2 y δr = tδv ,
Mij = tδij por lo que obtenemos:

Momento temporal H = −T, (2.121)


Momento lineal P = R = p, (2.122)
Momento cinemático K = Hr/c − P t, 2
(2.123)
Momento angular J = r × P. (2.124)

La energía (momento temporal) y el momento lineal transforman como:

H ′ (τ ) = γH(τ ) + γ(v · R(µ)P (τ )), (2.125)


γv γ2
P ′ (τ ) = R(µ)P (τ ) + 2 H(τ ) + (v · R(µ)P (τ ))v. (2.126)
c (1 + γ)c2
Es decir, como las componentes de un tetravector contravariante P µ ≡ (H/c, P ). Los
observables cK y J son las componentes esenciales del tensor antisimétrico J µν = −J νµ =
xµ P ν − xν P µ , cKi = J i0 y Jk = ϵkil J il /2.
Tomando la derivada τ del momento cinemático, K̇ = 0, obtenemos que P = H ṙ/c2 ṫ =
Hu/c2 , donde u = ṙ/ṫ es la velocidad de la partícula y el punto r representa tanto la posición
de la carga como el centro de masa.
Las seis condiciones P = 0 y K = 0, implican u = 0 y r = 0, de manera que la partícula
está en reposo y localizada en el origen del sistema de referencia, como en el caso no relativista.
Denominamos a estos observadores la clase de observadores del centro de masa.
108 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

De (2.125) y (2.126) vemos que la magnitud (H ′ /c)2 − P ′ = (H/c)2 − P 2 es invariante


2

Poincaré y además una constante del movimiento. Como P 2 = (H/c)2 u2 /c2 , con u < c, esto
implica que este invariante sea denido positivo, de dimensiones masa×velocidad al cuadrado,
y lo escribamos como el cuadrado (mc)2 en términos de una magnitud constante, la masa
de la partícula que la tomamos como el número positivo m. Despejando H , obtenemos dos
posibilidades
H = ±mc2 (1 − u2 /c2 )−1/2 = ±γ(u)mc2 .
De aquí que P = ±γ(u)mu. Vamos a ver que el signo de H , que puede ser positivo o negativo,
es otra propiedad invariante Poincaré.
Para el observador del centro de masa, P = 0, por lo que H = ±mc2 . Si H > 0 para el
observador del centro de masa, entonces de (2.125) se tiene que para cualquier otro observador,
H ′ = γH ≥ H > 0, pues γ ≥ 1. Si H < 0, entonces también H ′ = γH ≤ H < 0. El signo de H es
otra propiedad invariante entre observadores.

La velocidad u < c, porque en caso contrario H sería imaginario. Si u > c el invariante (H/c)2 −
P 2 < 0 y no es posible denir la masa en reposo de la partícula. Si sustituímos las expresiones
de T y R en (2.118), obtenemos dos posibles Lagrangianas para una partícula puntual libre de
masa m, caracterizadas además, por el signo de H

e 0 = ∓mc c2 ṫ2 − ṙ 2 .
L (2.127)

La partícula que describe la Lagrangiana (2.127) con el signo +, posee un momento temporal
H < 0, y la de signo −, H > 0. Partículas y antipartículas aparecen de forma más simétrica en
la formulación relativista. Si desarrollamos la Lagrangiana al orden más bajo en u/c, en el caso
H > 0, obtenemos
2
e 0 = −mc2 ṫ + m ṙ ,
L
2 ṫ
por lo que el primer término −mc2 ṫ es equivalente al término Galileano −H0 ṫ de (2.18). La
Lagrangiana con H < 0 posee como límite de baja velocidad −(m/2)ṙ 2 /ṫ que no aparece
descrita como un posible ejemplo en el caso Galileano. Ver la sección 2.7 para la diferencia
entre partículas y antipartículas por lo que respecta a su interacción.
El espín con respecto al centro de masa se dene similarmente al caso no relativista

c2
S CM ≡ J − q × P = J − K × P = 0, (2.128)
H
es nulo, por lo que la partícula puntual relativista no posee espín.

2.4. Partículas relativistas con espín

Los espacios homogéneos de mayor dimensión de P , pueden ser parametrizados por las
variables (t, r, u, ρ), donde el parámetro velocidad u puede ser u < c, u = c, o bien u > c,
por lo que el grupo de Poincaré describe tres tipos maximales de partículas con espín. Las
denominaremos, de acuerdo con el valor de este parámetro, por los nombres siguientes: al primer
grupo, en el que la carga de la partícula se mueve con u < c, le llamaremos bradión, a partir del
griego βραδυς que signica lento. Los bradiones son por lo tanto aquellas partículas elementales
cuya posición de la carga r nunca alcanza la velocidad de la luz. A la segunda clase de partículas
con (u = c) las denominaremos luxones puesto que el punto r se mueve siempre a la velocidad
de la luz para todo observador, y nalmente, a las del tercer grupo que como u > c, las
llamaremos taquiones, a partir del griego τ αχυς , rápido.
2.5. LUXONES 109

Para el segundo grupo hemos usado el nombre latino de luxones en vez del griego fotones,
porque en este grupo, además de describir fotones clásicos con espín también vamos a encontrar
la descripción clásica del electrón. Esta clase de partículas relativistas y los taquiones no poseen
equivalentes no relativistas.
La primera clase corresponde a partículas cuyo espacio cinemático es todo el grupo de
Poincaré y produce modelos que van a tener correspondencia, en el caso de baja velocidad frente
a c, con los modelos que se analizan en el caso Galileano. De acuerdo con el análisis hecho en el
preámbulo sobre el movimiento del centro de carga, cuya velocidad debe ser inalcanzable para
todo observador inercial, es precisamente al grupo de luxones al que vamos a dedicar el estudio
que sigue. Quienes quieran analizar otros ejemplos relativistas, en particular los taquiones,
pueden consultar el libro del autor. En el caso de los taquiones no es posible encontrar modelos
que al ser cuantizados tengan espín 1/2.

2.5. Luxones
Consideremos aquellas partículas elementales cuyo espacio cinemático está formado por las
variables (t, r, u, ρ) de dominios t ∈ R, r ∈ R3 , ρ ∈ R3c , y u ∈ R3 pero con u = c. Como u = c
vamos a denominar a esta clase de partículas con el nombre de Luxones. Esta variedad es un
espacio homogéneo del grupo de Poincaré P . En efecto, consideremos el punto de esta variedad
x ≡ (0, 0, u, 0). El grupo que lo deja invariante (the little group) es el subgrupo uniparamétrico
Vu de transformaciones de Lorentz puras en la dirección del vector u. Entonces X ∼ P/Vu ,
resulta ser un espacio homogéneo de dimensión nueve.
Para estas partículas, las variables t, r transforman de acuerdo con (2.112) y (2.113), respec-
tivamente. Sus derivadas como en (2.114) y (2.115). Para la velocidad u la forma de transformar
(2.116) y de su módulo (2.117) por lo que si u = c para un observador, esto implica u′ = c, para
todos por lo que la variedad dada es un espacio homogéneo de P .
La forma general de transformación de las variables de orientación ρ, se obtiene de (2.252)
pero ahora las funciones F y G, que involucran factores γ(u), se hacen innitas en el límite
u → c, pero su cociente tiene un límite nito que nos lleva nalmente a
µ + ρ(τ ) − µ × ρ(τ ) + F c (v, µ; u(τ ), ρ(τ ))
ρ′ (τ ) = , (2.129)
1 − µ · ρ(τ ) + Gc (v, µ; u(τ ), ρ(τ ))
donde las funciones F c y Gc vienen dadas por:
γ(v)
F c (v, µ; u, ρ) = [u × v + u(v · µ) + v(u · ρ)
(1 + γ(v))c2
+ u × (v × µ) + (u × ρ) × v + (u · ρ)(v × µ)
+ (u × ρ)(v · µ) + (u × ρ) × (v × µ)] , (2.130)

γ(v)
Gc (v, µ; u, ρ) = [u · v + u · (v × µ) + v · (u × ρ)
(1 + γ(v))c2
− (u · ρ)(v · µ) + (u × ρ) · (v × µ)] . (2.131)
Como u′ = u = c, el valor absoluto de la velocidad es invariante lo cual signica que u′ puede
ser obtenido a partir de u mediante una rotación:
u′ = R(ϕ)u, (2.132)
donde el parámetro ϕ, que caracteriza a esta matriz de rotación, es
γ
µ + F c (v, µ; u(τ ), 0) µ+ (1+γ)c2
[u × v + u(v · µ) + u × (v × µ)]
ϕ= = γ . (2.133)
1 + Gc (v, µ; u(τ ), 0) 1+ (1+γ)c2
[u · v + u · (v × µ)]
110 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

La ecuación (2.129) corresponde a


ϕ+ρ−ϕ×ρ
R(ρ′ ) = R(ϕ)R(ρ), ρ′ = (2.134)
1−ϕ·ρ
y si son e′i los tres vectores unidad columna que conguran la matriz ortogonal R(ρ′ ), y ei los
tres vectores unidad columna que conguran la matriz ortogonal R(ρ), esta relación equivale a

e′i = R(ϕ)ei , i = 1, 2, 3,

con la misma ϕ en ambos casos, como en (2.133).


Puesto que la variable u(τ ) = c, durante toda la evolución y para cualquier observador,
podemos encontrar dos tipos distintos de partículas. En efecto, si derivamos con respecto a τ la
expresión de u2 = c2 , obtenemos que u̇(τ ) · u(τ ) = 0, es decir, partículas para las cuales siempre
u̇(τ ) = 0 que como veremos son partículas masa nula, y partículas para las que u̇(τ ) ̸= 0
pero es siempre ortogonal a u. Estas partículas corresponden a objetos con masa cuya carga
se está moviendo siempre a la velocidad constante c, y cuyo centro de masa se va a mover con
velocidad inferior a c. Este tipo de partículas son consistentes con lo analizado en el preámbulo,
para objetos elementales cuyo centro de carga y centro de masa son puntos diferentes.

2.5.1. Partículas sin masa. (El fotón)


Si u̇ = 0, u es constante y el punto r sigue una trayectoria rectilínea con velocidad constante.
Por lo tanto las variables cinemáticas se reducen a (t, r, ρ) con los mismos dominios y signicados
habituales de tiempo, posición y orientación, respectivamente. Las derivadas ṫ y ṙ transforman
como (2.114) y (2.115) y, en vez de la variable ρ̇ vamos a utilizar la variable ω denida en (2.35)
y que transforma bajo P :
ω ′ (τ ) = R(ϕ)ω(τ ), (2.135)
donde de nuevo, ϕ viene dada en (2.133).
En efecto, a partir de (2.134), como u̇ = 0, si tomamos la derivada τ de ambos miembros,


Ṙ(ρ ) = R(ϕ)Ṙ(ρ),
T
y la matriz antisimétrica Ω = Ṙ(ρ)R (ρ) posee por componentes esenciales las componentes del
vector velocidad angular ω,  
0 −ωz ωy
Ω =  ωz 0 −ωx  . (2.136)
−ωy ωx 0
Podemos ver que transforma

Ω′ = Ṙ(ρ′ )RT (ρ′ ) = R(ϕ)Ṙ(ρ)RT (ρ)RT (ϕ) = R(ϕ)ΩRT (ϕ),


y esta transformación de la matriz conduce a que sus componentes esenciales transformen de
acuerdo con (2.135).

Para esta partícula no existen ligaduras entre sus variables cinemáticas, y como u̇ = 0, la
forma más general de su Lagrangiana utilizando la homogeneidad, es
e = T ṫ + R · ṙ + W · ω.
L (2.137)
e ṫ, Ri = ∂ L/∂
Las funciones T = ∂ L/∂ e ṙi , Wi = ∂ L/∂ω
e i , serán funciones de (t, r, ρ) y funciones

homogéneas de grado cero de las derivadas de las variables cinemáticas (ṫ, ṙ, ω). Como ṫ ̸= 0 las
podremos expresar en términos de u = ṙ/ṫ y de Ω = ω/ṫ, que son efectivamente la velocidad y
velocidad angular de la partícula, respectivamente. Si la partícula es libre, la invariancia de la
Lagrangiana bajo P , nos lleva a que estas funciones transformen bajo P :

T ′ = γT − γ(v · R(µ)R), (2.138)


2.5. LUXONES 111

γ2
R′ = R(µ)R − γvT /c2 + (v · R(µ)R)v, (2.139)
(1 + γ)c2
W ′ = R(ϕ)W . (2.140)
Son invariantes por traslación y por lo tanto independientes de t y de r . Son por lo tanto
únicamente funciones de (u, Ω), con la ligadura u = c. La invariancia bajo rotación nos prohibe
la dependencia explícita de ρ, de tal manera que la dependencia en las variables ρ y ρ̇, lo es a
través de la velocidad angular ω , como hemos comentado en la sección 2.2.
El teorema de Noether nos da lugar, como anteriormente, a las siguientes constantes del
movimiento:

Momento temporal H = −T, (2.141)


Momento lineal P = R, (2.142)
Momento cinemático K = Hr/c − P t − W × u/c ,
2 2
(2.143)
Momento angular J = r × P + W. (2.144)

En este caso no existe en el momento angular el término del zitterbewegung u × U , porque la


Lagrangiana no depende de la u̇. La partícula, localizada en el punto r , se mueve en línea recta
a la velocidad de la luz, por lo que no es posible encontrar un observador inercial que la vea en
reposo. Para cualquier observador inercial P ̸= 0. A pesar de no existir el observador del centro
de masa, denimos el espín como el momento angular de la partícula con respecto al punto r ,
mediante la expresión: S = J − r × P = W .
Si tomamos en (2.144) la derivada con respecto a τ , obtenemos dS/dt = P × u. Como P y
u son dos constantes del movimiento, entonces el espín tiene una derivada temporal constante.
Representa a un sistema mecánico con un espín que crece continuamente. Esto no es lo que
entendemos por un sistema elemental salvo que esa constante sea cero y dS/dt = 0. Entonces
el espín es constante y como P y u son vectores no nulos, deben ser necesariamente vectores
colineales, aunque no sabemos todavía su orientación relativa, ni la expresión de P en términos
de u.
El momento temporal y el momento lineal son las componentes de un tetravector y junta-
mente con el espín transforman como

H ′ = γH + γ(v · R(µ)P ), (2.145)

γ2
P ′ = R(µ)P + γvH/c2 + (v · R(µ)P )v, (2.146)
(1 + γ)c2
S ′ = R(ϕ)S. (2.147)
La relación entre P y u se obtiene a partir de (2.143), tomando la derivada con respecto a τ y
con la condición de que el espín, que se reduce a W , es constante, K̇ = 0 = H ṙ/c2 − P ṫ, es
decir, P = Hu/c2 . Tomando ahora el producto escalar de esta expresión con u obtenemos que
H = P · u.
A partir de (2.145) y (2.146), la magnitud (H/c)2 − P 2 es una propiedad invariante y
constante del movimiento, que debido a la relación entre sus términos, es idénticamente nula.
La partícula es de masa nula. Para esta partícula, ambos observables H y P son siempre no
nulos para todo observador inercial. En caso contrario, si se anulan para un observador se anulan
para todos. Por (2.147), S 2 es otro invariante y constante del movimiento, por lo que juntamente
con la masa nula es otra propiedad intrínseca de la partícula.
La parte de la Lagrangiana T ṫ + R · ṙ = −H ṫ + P · ṙ , puede ponerse como −(H − P · u)ṫ = 0,
por lo que es idénticamente nula. La Lagrangiana se reduce solamente al tercer término que es
de la forma S · ω . Una partícula de masa nula que se mueve en línea recta a la velocidad
112 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

de la luz, necesariamente tiene que venir caracterizada por variables de orientación, pues en
caso contrario L e = 0, es decir, los fotones necesariamente van rotando. La formulación
relativista prohibe la existencia de partículas puntuales masivas que se mueven en línea recta a
la velocidad de la luz.
Vemos a partir de (2.132) y (2.147) que la magnitud adimensional ϵ = S · u/Sc, es otro
invariante y constante del movimiento, y lo que esperamos es que la Lagrangiana sea una función
explícita de él y de S . Teniendo en cuenta la forma de transformar bajo P de u, ω y S , dadas en
(2.132), (2.135) y (2.147) respectivamente, resulta que el espín debe ser necesariamente función
vectorial de u y ω . Por otra parte, la Lagrangiana debe ser función explícita y homogénea de
grado uno de todas las derivadas de las variables cinemáticas, luego S tiene que ser una función
homogénea de grado cero de ṫ y ṙ .
Si el espín no es transversal, como ocurre con los fotones reales, entonces S = ϵ Su/c con
ϵ = ±1, por lo que la Lagrangiana queda nalmente:
( )
e ϵ S ṙ · ω
L= . (2.148)
c ṫ

Para esta Lagrangiana, el momento temporal es H = −∂ L/∂ e ṫ = S · Ω, donde Ω = ω/ṫ es


e ṙ = ϵ S Ω/c, y como P y
la velocidad angular de la partícula. El momento lineal es P = ∂ L/∂
u son colineales, Ω y u deben ser también colineales. Si H es positivo, entonces Ω = ϵΩu/c.
Esto signica que la energía H = SΩ = S2πν . Para los fotones, según Planck H = hν , y
por lo tanto S = h/2π = ~ y el fotón es un bosón. De esta forma la frecuencia de un fotón es
la frecuencia de su movimiento de rotación alrededor de la dirección de su desplazamiento, en
el mismo sentido si ϵ = 1 y en sentido contrario si ϵ = −1. Vemos que el espín es constante
y no es nalmente función de la velocidad angular, aunque para partículas con H > 0 tiene
la misma dirección que ésta. Conviene observar que no hay dependencia entre ellos, porque S
es invariante bajo P mientras que Ω no lo es. Al cambiar de observador el espín permanece el
mismo, pero la frecuencia sufre el denominado efecto Doppler.
Si el observador del laboratorio OL ve moverse a otro observador inercial O con velocidadv y
tienen los ejes paralelizados, la relación entre ambos observadores viene dada por un boost L(v)
y tal vez sendas traslaciones temporal y espacial. Para la relación entre las medidas de energía y
momento lineal de un fotón solamente interviene el boost L(v), que es la matriz Jacobiana de la
transformación. Si el observador O emite fotones de frecuencia ν, las medidas realizadas en OL
vienen expresadas por

γ2
HL = γH + γv · p, pL = p + γHv/c2 + (v · p)v.
(1 + γ)c2
Como H = hν , p = Hu/c2 , para la frecuencia medida en OL llegamos a

νL = γν(1 + v · u/c )2

donde u es la velocidad del fotón medida por O. Supongamos en primer lugar que el origen de O
se aleja OL , por lo que los fotones que llegan al origen de OL son los que v · u = −vc, de ahí que
la frecuencia detectada vale

1 − v/c
νL = γν(1 − v/c) = ν , νL < ν.
1 + v/c
Sin embargo cuando OL ve a O acercarse, entonces los fotones que le llegan son los que v · u = vc,
por lo que la frecuencia que detecta es mayor y vale:

1 + v/c
νL = γν(1 + v/c) = ν , νL > ν.
1 − v/c

Decimos que la Lagrangiana (2.148) representa a un fotón de espín S y polarización ϵ. Un


conjunto de fotones de esta clase, todos de la misma polarización, corresponden a un haz de
luz polarizada circular, como se ha comprobado midiendo el momento angular que llevan estos
fotones.
2.5. LUXONES 113

Experimento de Beth
El experimento de Beth 5 , realizado en el año 1936, consiste en producir un haz de luz
monocromática polarizada circular de frecuencia ν , y hacerla incidir sobre una placa adherida a
un péndulo de torsión, para ser absorbidos los fotones por ella. Si la potencia del haz polarizado
es P el haz lleva n = P/hν fotones por segundo, todos con el espín en la misma dirección.
Entonces al ser absorbidos por la placa, ésta varía su momento angular J con respecto al punto
O, en la forma dJ/dt = n~ por segundo, lo que da lugar a que el momento M de las fuerzas
externas producidas por la torsión del péndulo debe igualar a esta variación.

Figura 2.5: Haz de luz monocromática polarizada circular de intensidad n fotones por
segundo, que son absorbidos por una placa que está en equilibrio mediante un hilo de
torsión. Al absorber los fotones, la placa gira un ángulo ϕ, a derechas o a izquierdas, según
que el haz de luz polarizada circular sea a derechas o a izquierdas, comprobándose que
todos los fotones del haz tienen el espín en la misma dirección.

Para un hilo de longitud L, radio a y módulo de torsión µ, el momento de las fuerzas externas
que lo hace rotar un ángulo ϕ, vale:
πa4
M =µ ϕ.
2L
Midiendo el ángulo ϕ que ha girado la placa, se comprueba en el experimento que M = n~, ya
que cada fotón absorbido lleva un momento angular de valor ~.
Pero el dispositivo del experimento de Beth es también un analizador de la polarización de
los fotones. Si al hacer incidir el haz de luz polarizada circular sobre el disco de la gura, éste
gira hacia la derecha, el haz contiene fotones con sus espines hacia adelante. Si el disco gira
hacia la izquierda, los fotones tienen su espín hacia atrás.

Fotones polarizados a izquierda o derecha corresponden a ϵ = −1 y ϵ = 1, respectivamente.


La energía está relacionada con la frecuencia angular H = ~Ω, y el momento lineal con el
número de onda P = ~k, que resulta estar relacionado con la velocidad angular por k = ϵΩ/c.
Si pudieramos hablar de la longitud de onda de un solo fotón, ésta sería la distancia recorrida
en el tiempo en que tarda en dar una vuelta.
5
R. A. Beth, Mechanical detection and measurement of the angular momentum of light, Phys. Rev. 50, 115
(1936).
114 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

Los antifotones, es decir partículas para las que H < 0, se corresponden con las que cumplen
H = S · Ω = p · u < 0 y por lo tanto el espín y la velocidad angular tienen sentidos opuestos
y lo mismo la velocidad y el momento lineal. En cualquier caso poseen la misma energía que
los fotones con H > 0. Para saber si un sistema material absorbe un fotón o un antifotón,
habría que medir por separado el espín del fotón absorbido, que es una medida mecánica,
y por otra la velocidad angular del fotón, de la cual solamente se conoce su valor absoluto,
la frecuencia. Pero también midiendo la dirección del momento lineal que debe ser opuesta
a la velocidad. Lo que parece es que las partículas producidas por radiación son fotones, ya
que la presión de radiación, y por lo tanto la dirección del momento lineal coinciden. Por
eso resulta difícil de determinar de forma experimental si lo que se absorbe es un fotón o
un antifotón. En la interacción electromagnética electrón-núcleo, si la interpretamos como un
intercambio de fotones, para que las partículas se aproximen y la órbita sea una trayectoria
ligada intercambiando una partícula fotónica, ésta tiene que ser un antifotón. En cambio, en
la interacción electrón-electrón, las partículas se separan, por lo que lo que intercambian es un
fotón. Ver la sección 2.7 para el análisis de partículas y antipartículas.

La relación entre los diversos observables para el fotón (H > 0) y el antifotón (H < 0) viene
representada en la gura 2.6

Figura 2.6: Relación entre los diferentes observables u, S , Ω y p, para el fotón H > 0 en la
columna izquierda y para el antifotón H < 0 en la columna derecha para las dos helicidades
ϵ = ±1. S = ϵSu/c, p = Hu/c2 = ϵSΩ/c, H = p · u = S · Ω.

Si los posibles estados del fotón los representamos de forma vectorial como | sign(H), ϵ >,
los estados de la izquierda de la gura son los |+, + > y |+, − >, y los de la derecha |−, + > y
|−, − >, respectivamente. Son estados independientes y ortogonales. Si el campo de radiación
solamente está compuesto de fotones (H > 0), es por lo que la descripción clásica de los estados
vectoriales de la luz monocromática, aparece descrita por vectores complejos del espacio de
Hilbert C2 y los estados de polarización por la esfera de Poincaré, como la combinación lineal
convexa de estados puros (Ver apéndice 3.4). Sobre la posible detección de antifotones ir a la
sección 2.7 y siguiente.
2.5. LUXONES 115

2.5.2. Partículas con masa. (el electrón)


Si consideramos ahora la otra posibilidad, u̇ ̸= 0 pero ortogonal a u, entonces las variables
ṫ y ṙ transforman como en el caso anterior (2.114) y (2.115), pero para u̇ y ω tenemos que:

u̇′ = R(ϕ)u̇ + Ṙ(ϕ)u, (2.149)



ω = R(ϕ)ω + ω ϕ , (2.150)

donde el parámetro de rotación ϕ es el mismo de (2.133) y el vector ω ϕ es:

γRu × v − (γ − 1)R(u × u̇) + 2γ 2 (v · R(u × u̇))v/(1 + γ)c2


ωϕ = . (2.151)
γ(c2 + v · Ru)

La expresión (2.149) es la derivada τ de (2.132) y se puede escribir en la forma:

R(ϕ)u̇
u̇′ = . (2.152)
γ(1 + v · R(µ)u/c2 )

la expresión (2.150) viene de R(ρ′ ) = R(ϕ)R(ρ), que tomando la derivada con respecto a τ ,
Ṙ(ρ′ ) = Ṙ(ϕ)R(ρ) + R(ϕ)Ṙ(ρ), debido a que el parámetro ϕ depende de τ a través de la
velocidad u(τ ), y por lo tanto

Ω′ = Ṙ(ρ′ )RT (ρ′ ) = R(ϕ)ΩRT (ϕ) + Ṙ(ϕ)RT (ϕ).

R(ϕ)ΩRT (ϕ) corresponde a R(ϕ)ω y la matriz antisimétrica Ωϕ = Ṙ(ϕ)RT (ϕ) tiene por com-
ponentes esenciales el vector ω ϕ , es decir, la ecuación (2.151).
La condición de homogeneidad de la Lagrangiana conduce a la forma general

e = T ṫ + R · ṙ + U · u̇ + W · ω,
L (2.153)

donde T = ∂ L/∂e ṫ, Ri = ∂ L/∂


e ṙi , Ui = ∂ L/∂
e u̇i y Wi = ∂ L/∂ω
e i , y en el caso de la partícula

libre el teorema de Noether, debido a la invariancia bajo el grupo de Poincaré, nos produce las
siguientes constantes del movimiento:

Momento temporal H = −T − (dU /dt) · u, (2.154)


Momento lineal P = R − (dU /dt), (2.155)
Momento cinemático K = Hr/c − P t − S × u/c ,
2 2
(2.156)
Momento angular J = r × P + S. (2.157)

En este caso el espín S , es decir el momento angular con respecto al punto r , viene dado como
en el caso Galileano, por
S = u × U + W = Z + W, (2.158)
no es una magnitud conservada sino que satisface la ecuación dinámica

dS
= P × u,
dt
que se anula solamente si P = 0.
Como en el caso Galileano, tenemos también la invariancia de las ecuaciones dinámicas bajo
el grupo de rotaciones locales SO(3)L que nos cambian las variables de orientación sin modicar
la velocidad angular por lo que como en (2.51) obtenemos las tres constantes del movimiento

Momento angular Local Ti = W · ei , (2.159)


116 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

proyección en los ejes del cuerpo de la parte rotativa del espín W .


Las expresiones (2.154, 2.155) implican que H/c y P transforman como las componentes
de un tetravector, como en (2.125-2.126), y denen un invariante y constante del movimiento
(H/c)2 −P 2 = m2 c2 , que lo expresamos en función de un parámetro positivo m, que se interpreta
como la masa de la partícula.
El observable S transforma como:
γ2 γ
S ′ (τ ) = γR(µ)S(τ ) − 2
(v · R(µ)S(τ ))v + 2 (v × R(µ)(S(τ ) × u)), (2.160)
(1 + γ)c c
una expresión que corresponde a la transformación de un tensor antisimétrico S µν con compo-
nentes estrictas S 0i = (S × u)i /c, y S ij = ϵijk Sk , bajo el grupo de Poincaré,
S ′µν = Λµσ (v, µ)Λνλ (v, µ)S σλ , Λ(v, µ) = L(v)R(µ)
Si denimos el vector, con dimensiones de longitud, k = S × u/H , el momento cinemático
(2.156) se puede reescribir como
K = Hq/c2 − P t,
donde q = r − k, representa la posición del centro de masa de la partícula. Si tomamos la
derivada temporal de esta expresión, podemos expresar la relación que existe entre H y P como
en el caso de la partícula puntual:
H dq
P = v, v=
c2 dt
en términos de la velocidad del centro de masa v . Esto nos lleva de nuevo a que H y P se
expresen en términos de la velocidad del centro de masa y del invariante m, como
H = γ(v)mc2 , P = γ(v)mv.
Si llamamos v CM a la velocidad del centro de masa, ésta transforma entre observadores
inerciales como:
γ2
R(µ)v CM (τ ) + γv + (v · R(µ)v CM (τ ))v
(1 + γ)c2
v ′CM (τ ) = . (2.161)
γ(1 + v · R(µ) v CM (τ )/c2 )
Aunque el transformado Poincaré de la posición del centro de masa para un observador no se
corresponde con el centro de masa del electrón en el nuevo sistema de referencia, la velocidad del
centro de masa es efectivamente la transformada de dicha velocidad. Si v CM = 0 es la velocidad
del centro de masa en el sistema de referencia del CM, entonces la velocidad en otro sistema de
referencia es v , siendo v la velocidad que un observador arbitrario ve moverse al observador del
centro de masa.
El espín con respecto al centro de masa se dene como es habitual mediante
c2
S CM = J − q × P = J − K × P, (2.162)
H
y es una constante del movimiento para la partícula libre por expresarse en términos de cons-
tantes del movimiento. Toma la forma
1
S CM = S + k × P = S + (S × u) × P . (2.163)
H
La helicidad S CM · P = S · P = J · P , es también una constante del movimiento para la
partícula libre. Podemos construir el tetravector de Pauli-Lubanski (2.260)
H
wµ ≡ (P · S CM , HS CM /c) = (P · S, HS/c + (S × u) × P /c) = (v · S CM , cS CM ), (2.164)
c2
2.5. LUXONES 117

que queda expresado para la partícula libre en términos de constantes del movimiento y por
lo tanto es otra constante del movimiento. Su módulo, −wµ wµ = m2 c2 SCM 2 , donde S
CM es el
espín medido por el observador del centro de masa, es también otra constante del movimiento
para la partícula libre, y si aceptamos el principio atómico, debe tomar el mismo valor incluso
bajo interacción. Queda expresado en términos de las propiedades invariantes y por lo tanto
intrínsecas m y SCM de la partícula, siendo SCM 2 el módulo al cuadrado de S CM , que en el
caso cuántico es 3~ /4. El módulo de este espín no es invariante y para un observador que ve
2

moverse el centro de masa con velocidad v , éste toma el valor


( )
′2 c2 − v 2 2
SCM = SCM ,
c2 − v 2 cos2 ϕ

siendo ϕ el ángulo que forma v con S CM .

2.5.3. Movimiento del electrón para el observador del CM


El observador del centro de masa se dene por las condiciones P = K = 0. Para este
observador q = 0 y v = 0, el centro de masa está en reposo y en el origen de sistema de
referencia. El espín S = S CM es constante, H = ±mc2 y de (2.156) obtenemos

1
r=± S × u. (2.165)
mc2
Esta ecuación es la dinámica del punto r para el observador del centro de masa y este movimiento
interno tiene lugar en un plano ortogonal al espín constante S . El producto escalar con u nos
lleva a r · dr/dt = 0, por lo que el radio de este movimiento (el zitterbewegung) es constante.
Tomando la derivada temporal de ambos miembros de (2.165), obtenemos mc2 u = ±(S ×
du/dt), debido a que el espín es constante en este referencial, con lo que u y S son ortogonales.
Si volvemos a derivar esta expresión concluímos que du/dt y S son también ortogonales. Si
introducimos en (2.165) esta expresión de u y tenemos presente la ortogonalidad entre el espín
y la aceleración, tanto para la partícula como la antipartícula, se llega a

d2 r mc2
+ ω 2 r = 0, ω= . (2.166)
dt2 S
que es exactamente la misma ecuación del preámbulo (2) y de la partícula no relativista (2.75)
cuando el centro de masa está en reposo. Haciendo en (2.165) el producto vectorial con u y
usando la ortogonalidad del espín con la velocidad se llega a

S = ±mu × r. (2.167)

Como S y u = c son constantes, el movimiento armónico es un círculo de radio R0 = S/mc. Para


el electrón veremos que al cuantizarlo S = ~/2, y el radio resulta ser ~/2me c = 1,93 × 10−13
m, la mitad de la longitud de onda Compton del electrón. La frecuencia de este movimiento
en el sistema de referencia del C.M. es ν = 2me c2 /h = 2,47 × 1020 s−1 , y la velocidad angular
ω = 2πν = 1,55 × 1021 rad s−1 . La relación de este radio con el denominado radio clásico del
electrón Rcl = e2 /8πε0 me c2 = 1,409 × 10−15 m, es precisamente Rcl /R0 = e2 /4πϵ0 ~c = α ≈
1/137, la constante de estructura na. El radio del electrón, estimado a partir de la colisión
e − e a alta energía en los experimentos desarrollados en el LEP del CERN, arrojan un valor
Re < 10−19 m. El análisis de la medida de la relación giromagnética g en una cavidad de Penning
arroja un límite todavía más pequeño, Re < 10−22 m.6 Si lo comparamos con el radio de Bohr,
6
H. Dehmelt, A single atomic particle forever oating at rest in free space: New value for Electron radius,
Physica Scripta T22, 102-110 (1988)
118 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

radio estimado de la trayectoria circular de un electrón con momento angular orbital L = 1, es


RB = 4πϵ0 ~2 /me e2 , RB /R0 = 2/α ≈ 274.
Lo que vemos es que hay dos tipos diferentes de partículas en cuanto al signo de H . En ambos,
la energía en reposo es mc2 . A la partícula con H > 0 se le denomina materia y antimateria a la
de H < 0. Ésta tiene un movimiento opuesto a la otra. Movimientos de este tipo de partículas
que se mueven a la velocidad de la luz, ya han sido considerados en la literatura posterior a la
publicación de la ecuación de Dirac, cuyo análisis de la cinemática del electrón sugería que éste se
movía precisamente a la velocidad de la luz. Sin embargo, en estos trabajos y en los de Dirac, la
distinción entre el movimiento del centro de carga y del centro de masa, no está sucientemente
clara 7 , 8 . Parte de la dicultad estriba en que cuando un punto se mueve a la velocidad de
la luz, a la partícula se le asocia una masa nula. Esto es correcto si el punto representa lo que
denominaríamos el centro de masa, pero no es el caso cuando el punto representa al centro de
carga.
En el modelo que estamos analizando, parece sugerir que el electrón tiene un tamaño del
orden del radio del zitterbewegung, o que la carga se mueve en una región del tamaño de la
longitud de onda Compton de la partícula, como sugiere el comentario de Barut en la contra-
portada. Sin embargo la idea de tamaño no es necesaria desde el punto de vista dinámico ya que
todo el interés se centra en describir la trayectoria de un punto, el centro de carga, a partir del
cual determinaremos el resto de las propiedades del electrón. La ecuación dinámica (2.165) para
el caso de la partícula (H > 0), se representa en la gura 2.7, que es la gura de la portada,
donde hemos separado las dos contribuciones al espín S = Z + W , que están relacionadas con
el movimiento orbital Z y el movimiento de rotación W . En el caso del positrón, (H < 0), lo
representamos en la gura 2.8.

Figura 2.7: Movimiento del centro de carga del electrón en el sistema de referencia del
centro de masa. La parte antiorbital Z = u × U del espín tiene la dirección de S y la parte
W tiene la dirección de ω. El espín es ortogonal a la velocidad del centro de carga y a la
separación entre CC y CM.

M. Mathisson, Neue mechanik materieller systeme, Acta Phys. Pol. 6, 163 (1937); Das zitternde elektron
7

und seine dynamik, 6, 218 (1937)


M.H.L. Weyssenhof,On two relativistic models of Dirac's electron, Acta Phys. Pol. 9, 46 (1947). M.H.L.
8

Weyssenhof and A. Raabe, Relativistic dynamics of spin-uids and spin-particles, Acta Phys. Pol. 9, 7 (1947);
Relativistic dynamics of spin-particles moving with the velocity of light, 9, 19 (1947).
2.5. LUXONES 119

2.5.4. El espín y el centro de masa para un observador arbitrario


Si tomamos en (2.156) la derivada con respecto a τ y el producto escalar con la velocidad
u obtenemos la expresión invariante Poincaré:
( )
1 du
H = P · u + 2S · ×u . (2.168)
c dt
De esta forma, el momento temporal o Hamiltoniano de Dirac, se escribe como la suma de dos
términos, uno de tipo traslacional asociado con P y que es nulo para el observador del centro
de masa, y otro rotacional relacionado con S y que no se anula nunca. En el caso cuántico va a
dar lugar a H = cP · α + βmc2 , en términos de las matrices hermíticas de Dirac, α y β . Puesto
que para Dirac cα se interpreta como el operador velocidad local u del electrón 9 , tenemos
H = P · u + βmc2 y esta relación sugiere que
( )
1 du
β= S · × u .
mc4 dt
Volveremos a esta relación cuando cuanticemos el sistema.
Vamos a encontrar la expresión general del espín y de la posición del centro de masa, en
términos de la cinemática del centro de carga. La ecuación de transformación del espín S ,
(2.160) se puede escribir también

S ′ = γ(1 + v · R(µ)u/c2 )R(ϕ)S, (2.169)

con lo que su módulo no es invariante Poincaré y teniendo presente cómo transforma u̇ dado
en (2.152), se tiene que S · u̇ = S ′ · u̇′ y de (2.132) S ′ · u′ = γ(1 + v · R(µ)u/c2 )S · u. Puesto
que el espín es ortogonal a u y u̇, para el observador del centro de masa, resulta ser siempre
ortogonal a u y u̇ para cualquier otro observador inercial.
Un método alternativo para ver esto es tomar la derivada temporal en (2.156) y (2.157), y de aquí

dS du
Hu − c2 P − ×u−S× = 0,
dt dt
como
dS
= P × u,
dt
es decir,
du
S× = (H − u · P )u.
dt
y un producto escalar con S , conduce a (H − u · P )u · S = 0. El factor entre paréntesis no se anula
puesto que el invariante H /c − P = m c es denido positivo y si resultase que H = u · P ,
2 2 2 2 2

entonces (u·P ) /c −P con u ≤ c sería negativo, lo que es una contradicción. Por lo tanto S·u = 0.
2 2 2

Si ahora tomamos la derivada temporal de esta expresión, sabiendo que dS/dt es ortogonal a u,
obtenemos S · u̇ = 0. El observable S tiene siempre la dirección del vector no nulo u̇ × u para las
partículas (H > 0) y en sentido contrario para las antipartículas (H < 0).

Si tomamos la derivada temporal del momento cinemático de la partícula libre (2.156),


obtenemos
dS du
Hu − c2 P − ×u−S× = 0.
dt dt
Teniendo presente que dS/dt = P × u y haciendo el producto vectorial con du/dt, obtenemos
( )
H − u · P du
S= × u, (2.170)
(du/dt)2 dt
y q = r − S × u/H conduce a que la posición del centro de masa se escribe
( )
c2 H − u · P du
q=r+ . (2.171)
H (du/dt)2 dt
120 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

Figura 2.8: Movimiento del centro de carga del positrón en el sistema de referencia del
centro de masa. La parte W de su espín tiene sentido contrario a la velocidad angular de
rotación del sistema cartesiano ligado al punto y que aquí no se ha dibujado. La parte Z
tiene el sentido orbital y por lo tanto la misma dirección que S .

La expresión (2.170) del espín con respecto al centro de carga se puede reescribir como

(H ṫ − P · ṙ)
S= u̇ × u.
u̇2
Como sabemos de (2.132) que u′ = R(ϕ)u y de (2.152) que u̇′ = R(ϕ)u̇/γ(1 + v · R(µ)u/c2 ),
′2
resulta que u̇ = u̇ /γ (1 + v · R(µ)u/c )
2 2 2 2
y el numerador (H ṫ − P · ṙ) es invariante Poincaré, de

donde obtenemos la expresión anteriormente planteada de la forma de transformar S, (2.169).

Desde el punto de vista geométrico, como el vector u es tangente a la trayectoria del centro
de carga y su derivada es perpendicular a él, resulta de (2.170) que el espín de la partícula
con respecto al centro de carga S tiene dirección opuesta a la binormal, y dirección según la
binormal para la antipartícula.
El centro de masa, con respecto al centro de carga, está en la dirección de la aceleración tanto
para la partícula como para la antipartícula. El punto r , como en el caso no relativista, efectúa
un movimiento central alrededor del centro de masa. Si de (2.171) expresamos la aceleración en
términos de r − q , el espín con respecto al punto r también puede ponerse como:

H
S=− (r − q) × u = ∓γ(v)m(r − q) × u, (2.172)
c2
que refuerza la idea de su carácter antiorbital con respecto al centro de masa para la partícula
(H > 0) y orbital para la antipartícula (H < 0). Queda expresado en términos de los dos puntos
característicos, r y q , de sus velocidades respectivas u y v , y del parámetro positivo m, la masa.
Como en cualquier caso se compone de dos términos S = Z + W , esto quiere decir que para la
antipartícula Z tiene también la dirección de S y por lo tanto la parte W en sentido contrario,
con lo que esta parte W tiene sentido opuesto a la velocidad angular. En esto coincide con los
fotones, en los que el espín que es únicamente rotativo tiene la dirección de la velocidad angular
para la partícula y sentido contrario a la velocidad angular para la antipartícula.
9
J.J. Sakurai, Advanced Quantum Mechanics, Addison-Wesley Reading, MA (1967).
2.5. LUXONES 121

Vemos que la partícula tiene masa y espín, el centro de carga se mueve en círculos a la velo-
cidad de la luz en un plano perpendicular al espín. Todas estas propiedades son independientes
del tipo de Lagrangiana de la forma (2.153) que consideremos. De la última expresión de (2.172)
y en el caso de la partícula libre (v = constante) se obtiene dS/dt = P × u.

2.5.5. Invariancia Poincaré del Hamiltoniano de Dirac


La expresión que va a dar lugar a la ecuación de Dirac vamos a ver que es invariante Poincaré
y por lo tanto se escribe de la misma forma en cualquier sistema de referencia. En efecto, si de
(2.168) pasamos todos los términos al primer miembro y multiplicamos por ṫ, tenemos
1
ṫH − ṙ · P − S · (u̇ × u) = 0.
c2

La primera parte ṫH − ṙ · P = ẋµ Pµ = ẋ µ Pµ′ , con ẋµ ≡ (cṫ, ṙ) y P µ ≡ (H/c, P ), es invariante
Poincaré. En cuanto al término del espín vemos que de (2.132), (2.152) y (2.169), la velocidad
u, aceleración u̇ y espín S , respectivamente, transforman:
( )
′ ′ R(ϕ)u̇ ′ v · R(µ)u
u = R(ϕ)u, u̇ = , S =γ 1+ R(ϕ)S,
γ(1 + v · R(µ)u/c2 ) c2
de donde se deduce que
S ′ · (u̇′ × u′ ) = S · (u̇ × u).

2.5.6. Análisis de Dirac


Para terminar esta sección, y teniendo en mente este modelo de electrón, vamos a repasar los
aspectos más salientes del análisis que hace Dirac 10 , cuando trata de determinar la cinemática
del electrón libre en su formulación cuántica. Para Dirac, si el punto r representa a las variables
espaciales de las que depende el espinor ψ(t, r), entonces cuando calcula la velocidad de este
punto r , Dirac llega a:
a) La velocidad u = i/~[H, r] = cα, queda expresada en términos de las matrices α, cuyos
valores propios son ±1 y escribe `. . . una medida de cualquier componente de la velocidad de
un electrón libre debe conducir de forma precisa al valor ±c'.

b) El momento lineal no tiene la misma dirección que la velocidad de este punto u, sino que
está relacionado con un cierto valor medio de la misma: . . . `la componente x1 de la velocidad,
cα1 , tiene dos partes, una parte constante de valor c2 p1 H −1 , y ligada con el momento lineal por
2
la expresión relativista habitual, y una parte oscilante, cuya frecuencia es por lo menos 2mc /h,

. . .'.
c) Acerca de las componentes del vector de posición r : `La parte oscilante de x1 es pequeña,
. . . , es del orden de magnitud de ~/mc, . . .'.
d) En el artículo original de 1928, 11 cuando analiza la interacción del electrón con un
campo electromagnético externo, después de hacer el cuadrado del operador de Dirac, obtiene
dos nuevos términos en el Hamiltoniano de interacción:
e~ ie~
Σ·B+ α · E, (2.173)
2m 2mc
y donde el espín del electrón aparece escrito como S = ~Σ/2,
( )
σ 0 e e
Σ= , µ= S=2 S, g = 2,
0 σ m 2m
10
P.A.M. Dirac, The Principles of Quantum mechanics, Oxford Univ. Press, 4th ed. Oxford (1967).
11
P.A.M. Dirac, The quantum theory of the electron, Proc. Roy. Soc. Lon. A117, 610 (1928). La traducción
que ofrecemos en las notas es del autor.
122 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

y la partícula de Dirac posee una relación giromagnética g = 2. Los campos E y B son los
campos eléctrico y magnético externos, respectivamente. Entonces dice, `El electrón se va a
comportar como si tuviera un momento magnético (e~/2m) Σ y un momento dipolar eléctrico

(ie~/2mc) α. El momento magnético es el mismo que el del modelo de electrón con espín'
(modelo de Pauli). `El momento dipolar eléctrico, como es imaginario puro, podemos esperar
que no aparezca en el modelo.'

Sin embargo, en nuestro modelo clásico, y para el observador del centro de masa, existe un
momento dipolar eléctrico instantáneo y un momento magnético, dados por

e e dk e
d = ek = S × u, µ= k× =− Z, (2.174)
mc2 2 dt 2m
donde S es el espín total y Z = −mk×dk/dt, la parte del espín que proviene del zitterbewegung,
o movimiento orbital de la carga. El valor medio de d es cero, y el valor medio de µ es el vector
constante µ.
e) En su libro12 analiza la dinámica del espín S = ~σ/2, y llega a la conclusión que

dS
= p × cα = p × u
dt
tanto para el electrón libre como en interacción, y que por lo tanto satisface la misma ecuación
dinámica que el momento angular de una partícula con respecto a su centro de carga. El operador
espín de Dirac representa al momento angular del electrón con respecto al centro de carga.
Este modelo clásico produce una predicción cinemática que es la misma que la del modelo
no relativista descrito en la Sec.2.2.7. Si la carga de la partícula es negativa, la corriente de
la misma Fig.2.7 produce un momento magnético que tiene la misma dirección que el espín.
Todos los experimentos realizados para medir de forma precisa la relación giromagnética, están
basados en la determinación de frecuencias de precesión del espín, las cuales son independientes
de la orientación del mismo. El hecho de que sea difícil separar a los electrones en dos haces en
un experimento de tipo Stern-Gerlach, está sugiriendo realizar experimentos de polarización a la
hora de determinar la orientación relativa entre el espín y el momento magnético. Hemos sugerido
recientemente, un par de experimentos para encontrar cómo es esta orientación relativa13 , y que
es analizado en la sección 4.2.6.
Otra consecuencia del modelo clásico es que refuerza el que la interacción con un campo
externo sea del tipo del denominado acoplamiento mínimo, de la forma jµ Aµ , entre la corrien-
te asociada al movimiento de la carga y los potenciales externos. Las propiedades magnéticas
del electrón provienen de esta corriente y no de ninguna distribución de momentos dipolares
magnéticos, de tal manera que la única interacción posible entre un punto cargado r , y un
campo externo, es el de la corriente j µ , asociada al movimiento del punto r , con los potenciales
externos.

2.6. La ecuación dinámica del electrón con espín

Hemos visto que las partículas relativistas que satisfacen u = c y u perpendicular a u̇,
el vector de posición r se mueve en círculos de acuerdo con la ecuación dinámica (2.165) y
para el observador del centro de masa el movimiento armónico (2.166), como vemos dibujado
en la gura 2.7. Pero esta solución es independiente del tipo de la Lagrangiana particular que
escojamos, como función invariante Poincaré de las variables cinemáticas y sus derivadas, y
12
P.A.M. Dirac, The principles of Quantum Mechanics, Oxford 4th edition 1958, p. 266
13
M. Rivas, Are the electron spin and magnetic moment parallel or antiparallel vectors?, Ar-
Xiv:physics/0112057.
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 123

que satisfaga la condición de ortogonalidad u · u̇ = 0. En esta sección vamos a ver en qué se


transforma esta ecuación dinámica de la evolución de la carga, para un observador arbitrario.14
Como se menciona en el Preámbulo, sea r(t), t ∈ [t1 , t2 ] la trayectoria que sigue el punto para
un observador arbitrario. Cualquier otro observador O′ , la describe mediante el correspondiente
cambio del grupo cinemático

t′ = T (t, r(t); g1 , . . . , gr ), r ′ = R(t, r(t); g1 , . . . , gr ),

donde las funciones T y R denen la acción sobre el espacio-tiempo del grupo cinemático G, de
parámetros (g1 , . . . , gr ). Entonces, eliminando t como función de t′ de la primera y sustituyendo
en la segunda, obtenemos
r ′ (t′ ) = r ′ (t′ ; g1 , . . . , gr ). (2.175)
Como O′ puede ser cualquier observador, la ecuación (2.175) representa a la familia completa
de todas las trayectorias del punto para todos los observadores inerciales. Esta familia está
parametrizada por los parámetros del grupo gi . Si eliminamos los parámetros gi entre la función
r ′ (t′ ) y sus sucesivas derivadas temporales, obtendremos la ecuación diferencial invariante que
satisface la trayectoria del punto, para cualquier observador inercial. Que es invariante se ve
por construcción ya que es independiente de los parámetros del grupo. Vamos a considerar a
continuación que G sea el grupo de Poincaré y obtendremos la ecuación diferencial invariante
relativista.

2.6.1. El electrón relativista con espín

Supongamos el modelo relativista de electrón. Para el observador O∗ del centro de masa,


la trayectoria del centro de carga del electrón está contenida en el plano XOY y expresada en
forma vectorial, y con unidades R0 = ~/2mc, ω0 = 2mc2 /~
   
cos ω0 t∗ ∗ − sin ω0 t∗
dr
r ∗ (t∗ ) = R0  sin ω0 t∗  , = c  cos ω0 t∗  ,
dt∗
0 0

Para el observador del centro de masa O∗ el punto satisface la ecuación diferencial

d2 r ∗ (t∗ )
= −ω02 r ∗ (t∗ ). (2.176)
dt∗ 2
Como la carga se mueve con la velocidad c para el observador del centro de masa O∗ , se
mueve también con c para cualquier otro observador O. La relación de sus medidas viene dada
por

t(t∗ ; g) = γ (t∗ + v · R(α)r ∗ (t∗ )) + b,


γ2
r(t∗ ; g) = R(α)r ∗ (t∗ ) + γvt∗ + (v · R(α)r ∗ (t∗ )) v + a.
1+γ

La velocidad del punto para el observador O

dr dr/dt∗
r (1) = = ,
dt dt/dt∗

y lo mismo para sus sucesivas derivadas.


14
M. Rivas, The dynamical equation of the spinning electron, J. Phys. A, 36, 4703, (2003), Ar-
Xiv:physics/0112005.
124 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

Si usamos las siguientes abreviaturas para las diversas expresiones, funciones de t∗ :

dr ∗ (t∗ ) dK dV
K(t∗ ) = R(α)r ∗ (t∗ ), V (t∗ ) = R(α) ∗
= ∗, = −ω02 K,
dt dt dt∗
dB dA
B(t∗ ) = v · K/c2 , A(t∗ ) = v · V /c2 =

, = −ω02 B,
dt dt∗
con A adimensional y B con dimensiones de tiempo. K tiene dimensiones de longitud y V de
velocidad. En particular
dt
= γ(1 + v · V /c2 ) = γ(1 + A),
dt∗
Por otra parte

K 2 = R02 , V 2 = c2 , K · V = 0, K · v = c2 B, V · v = c2 A.

Haciendo uso de la relación (2.176) y sus derivadas, obtenemos mediante derivación las siguientes
expresiones para las derivadas temporales del punto r en el sistema de referencia arbitrario O:
( )
1 γ
r (1)
= V + (1 + γ + γA) v (2.177)
γ(1 + A) 1+γ
( )
ω02 γ
r (2)
= −(1 + A)K + BV + Bv , (2.178)
γ 2 (1 + A)3 1+γ

ω02 (
r (3) = 3 5
−3ω02 B(1 + A)K − (1 + A − 3ω02 B 2 )V +
γ (1 + A)
)
γ 2 2
(A(1 + A) + 3ω0 B )v (2.179)
1+γ
ω04 (
r (4) = 4 7
(1 + A)(1 − 2A − 3A2 − 15ω02 B 2 )K−
γ (1 + A)
(7 + 4A − 3A2 − 15ω02 B 2 )BV −
)
γ
(1 − 8A − 9A2 − 15ω02 B 2 )Bv . (2.180)
1+γ
De éstas se obtiene
( ) ( )
r (1) · r (1) = ω02 R02 = c2 , r (1) · r (2) = 0, (2.181)
( ) ( ) ω 4 R2
r (2) · r (2) = − r (1) · r (3) = 4 0 0 4 , (2.182)
γ (1 + A)
( ) 1 ( ) ω 5 R2
r (2) · r (3) = − r (1) · r (4) = 5 0 0 6 (2ω0 B), (2.183)
3 γ (1 + A)
( ) 6
ω0 R0 2 ( )
r (3) · r (3) = 6 8
1 − A2 + 3ω02 B 2 , (2.184)
γ (1 + A)
( ) ω06 R02 ( )
r (2) · r (4) = 6 8
−1 + 2A + 3A2 + 9ω02 B 2 , (2.185)
γ (1 + A)
( ) 4ω07 R02 ( )
r (3) · r (4) = 1 + A + 3ω 2 2
0 B (ω0 B). (2.186)
γ 7 (1 + A)10

Como ω0 B es adimensional, las dimensiones de estos términos están en los coecientes ω0k R02 ,
es decir L2 T −k .
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 125

Por inspección de (2.177-2.180) vemos que las cuatro derivadas temporales de la posición
del centro de carga se expresan como combinación lineal de los tres vectores V , K y v , donde
los dos primeros son ortogonales y el tercero es un vector constante que, en general, no es
combinación lineal de los otros dos.
γ 2 (1 + A)3 (3)
v = r (1) − 3Bγ(1 + A)r (2) + r , (2.187)
ω02
γA (1) 3γ 2 B γ 3 (1 + A)3
V = r + (1 + γ + γA)(1 + A)r (2) − (1 + γ + γA) r (3)(2.188)
1+γ 1+γ (1 + γ)ω02
γB (1) γ 2 (1 + A) γ 4 B(1 + A)3 (3)
K = r + 2 [3ω02 B 2 γ − (1 + γ)(1 + A)]r (2) − r . (2.189)
1+γ (1 + γ)ω0 (1 + γ)ω02

Está claro que las tres derivadas r (i) , i = 2, 3, 4 se podrán expresar como una combinación
lineal. Si denimos
γ 2 (1 + A)3 (2) γ 3 (1 + A)5 (3) γ 4 (1 + A)7 (4)
d1 = γ(1 + A)r (1) , d2 = r , d3 = r , d4 = r ,
ω02 ω02 ω04

obtenemos la relación:

(1 − 2A − 3A2 + 3ω02 B 2 )d2 − 6Bd3 + d4 = 0,

que en términos de las derivadas r (i) , queda


1 2
(1 − 2A − 3A2 + 3ω02 B 2 )r (2) − 6Bγ(1 + A)2 r (3) + γ (1 + A)4 r (4) = 0, (2.190)
ω02

que representa la ecuación diferencial invariante que satisface la posición del centro de carga,
en cualquier sistema de referencia inercial.
A partir de las ecuaciones (2.182)-(2.184) podemos expresar las magnitudes A, B y γ en
términos de los productos escalares entre las diferentes derivadas temporales (r (i) · r (j) ), i, j =
2, 3. La ligadura de que la velocidad es c, implica que estos productos escalares y los sucesivos
para derivadas de orden superior, se pueden expresar solamente en términos de tres de ellos, ya
que todos se expresan como funciones de γ , A y B .

8(r (2) · r (2) )5/2 /R0


1+A = , (2.191)
4(r (2) · r (2) )5/2 /R0 + 4(r (2) · r (2) )(r (3) · r (3) ) − 3(r (2) · r (3) )2
1/2
4(r (2) · r (2) )5/4 (r (2) · r (3) )/R0
ω0 B = , (2.192)
4(r (2) · r (2) )5/2 /R0 + 4(r (2) · r (2) )(r (3) · r (3) ) − 3(r (2) · r (3) )2
4(r (2) · r (2) )5/2 /R0 + 4(r (2) · r (2) )(r (3) · r (3) ) − 3(r (2) · r (3) )2
γ = 1/2
. (2.193)
8(r (2) · r (2) )11/4 /(cR0 )

con R0 = c/ω0 y así todos los términos en numerador y denominador tienen las mismas dimen-
siones espacio-temporales. De esta forma
( )
3(r (2) · r (3) ) (3) 2(r (3) · r (3) ) 3(r (2) · r (3) )2 1 (2) (2) 1/2
r −
(4)
r + − − (r · r ) r (2) = 0.
(r · r )
(2) (2) (r · r )
(2) (2) 4(r · r )
(2) (2) 2 R 0
(2.194)
Es una ecuación diferencial de cuarto orden que contiene como soluciones trayectorias descritas
a la velocidad de la luz. En efecto, si (r (1) · r (1) ) = c2 , entonces por derivaciones sucesivas
obtenemos que (r (1) · r (2) ) = 0 y volviendo a derivar (r (2) · r (2) ) + (r (1) · r (3) ) = 0. Teniendo esto
presente y haciendo el producto escalar de (2.194) con r (1) , obtenemos (r (1) ·r (4) )+3(r (2) ·r (3) ) =
126 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

0, que es otra de las relaciones entre las derivadas como consecuencia de que |r (1) | = c. Vamos
a compararla con la ecuación diferencial más general de un punto en el espacio tridimensional
dada en el preámbulo (6),
( ) ( ) ( )
2κ̇ τ̇ κ̇τ̇ 2κ̇2 − κκ̈ 2 κ̇ τ̇
r (4)
− + r (3) 2 2
+ κ +τ + + (2)
r +κ − r (1) = 0,
κ τ κτ κ2 κ τ

donde los puntos sobre κ y τ representan derivadas temporales. La ecuación diferencial del
centro de carga describe un movimiento helicoidal ya que carece del término en la primera
derivada r (1) , que implica, de acuerdo con lo expresado en el preámbulo, que existe una relación
constante entre curvatura y torsión. En efecto, si el término en r (1) es cero, esto implica que
κ̇/κ = τ̇ /τ , y por lo tanto el coeciente de r (3) resulta ser −3κ̇/κ. En efecto como la curvatura
κ = |d2 r/ds2 | = (r (2) · r (2) )1/2 /c2 , en términos de derivadas temporales y derivando de nuevo
con respecto al tiempo, se deduce que

1 (r (2) · r (3) ) 3κ̇ 3(r (2) · r (3) )


κ̇ = , = ,
c2 (r (2) · r (2) )1/2 κ (r (2) · r (2) )

que es efectivamente el coeciente de r (3) en (2.194).


Como en términos del parámetro longitud de arco en términos de la terna de Frenet-Serret,

r (1) = t, r (2) = κn, r (3) = −κ2 t + κ̇n + κτ b,

resulta que
( )2
(r (3) · r (3) ) κ̇
= κ2 + τ 2 + ,
(r (2) · r (2) ) κ

el coeciente de r (2) , teniendo presente la relación entre curvatura y torsión es


( )2 ( )2
κ̇ κ̈ (r (3) · r (3) ) κ̇ κ̈
2
κ +τ +3 − = (2) (2) + 2
2
− ,
κ κ (r · r ) κ κ

y como
κ̈ (r (3) · r (3) ) + (r (2) · r (4) ) (r (2) · r (3) )2
= − (2) (2) 2 ,
κ (r (2) · r (2) ) (r · r )

y donde el producto escalar (r (2) · r (4) ) se podrá expresar en términos de los otros 3. Este
coeciente que se puede comprobar sumando los términos de (2.182)-(2.184), es

1 (2) (2) 3/2 15(r (2) · r (3) )2


(r (2) · r (4) ) = (r · r ) − 2(r (3) · r (3) ) +
R0 4(r (2) · r (2) )

( )2
κ̇ κ̈ (r (3) · r (3) ) 3(r (2) · r (3) )2 1 (2) (2) 1/2
2 − = (2) (2) − − (r · r ) ,
κ κ (r · r ) 4(r · r ) (2) (2) 2 R0

por lo que nalmente obtenemos el coeciente de la derivada r (2) .


Por supuesto, si escogemos como condiciones de contorno para resolver esta ecuación una
con la condición |r (1) (0)| ̸= c, esta ecuación diferencial contiene soluciones en las que el punto r
no se mueve con velocidad de valor absoluto constante. Pero si |r (1) (0)| = c, entonces la solución
satisface |r (1) (t)| = c, para todo t.
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 127

2.6.2. El centro de masa


La posición del centro de masa se dene por
1 2 2(r (2) · r (2) ) r (2)
q=r+ γ (1 + A)3 r (2) = r + . (2.195)
ω02 3(r (2) · r (3) )2
(r (2) · r (2) )3/2 /R 0 + (r (3) · r (3) ) −
4(r (2) · r (2) )
ya que si v representa la velocidad del origen de O∗ con respecto a O, de acuerdo con (2.161) es
también la velocidad del centro de masa medida por O. Podemos ver que la derivada temporal
de
1 2 1 2 1 3γ 2 (1 + A)2 (−ω02 B) (2)
q =r+ γ (1 + A)3 r (2) , q (1) = r (1) + γ (1 + A)3 (3)
r + r = v,
ω02 ω02 ω02 γ(1 + A)
es decir (2.187) pues dA/dt∗ = −ω02 B y hay que dividir por dt/dt∗ = γ(1+A). Podemos vericar
que tanto q como q (1) se anulan para el observador del centro de masa.
Si volvemos a derivar, obtenemos
1 ( ) 1
q (2) = 1 − 2A − 3A2 + 3ω02 B 2 r (2) − 6Bγ(1 + A)r (3) + 2 γ 2 (1 + A)3 r (4) = 0,
1+A ω0
que es otra forma de la ecuación dinámica de la partícula libre (2.190) y (2.194).
Como
1
(q − r)2 = 4 γ 4 (1 + A)6 (r (2) · r (2) ),
ω0
1 1
q (1) · r (1) = c2 + 2 γ 2 (1 + A)3 (r (3) · r (1) ) = c2 − 2 γ 2 (1 + A)3 (r (2) · r (2) )
ω0 ω0
por (2.182) con lo que
c2 − q (1) · r (1) ω02
= ,
(q − r)2 γ 2 (1 + A)3
que es el inverso del coeciente de r (2) en la denición de q . De esta forma, la ecuación de
cuarto orden para la posición del centro de carga (2.194) se puede reescribir como un sistema
acoplado de ecuaciones de segundo orden para las dos posiciones q y r ,
d2 q d2 r c2 − v · u
= 0, = (q − r) , (2.196)
dt2 dt2 (q − r)2
con v = q (1) y u = r (1) , un movimiento libre para el centro de masa y una especie de movimiento
central alrededor del centro de masa para el centro de carga.
Si consideramos la expresión general para el centro de masa en (2.171), como P = Hv/c2 ,
se puede reescribir como
( 2 )
c − v · u du du d2 r (du/dt)2
q=r+ , ⇒ = = (q − r)
(du/dt)2 dt dt dt2 c2 − v · u
que si la comparamos con (2.196) obtenemos la relación

du du du c2 − v · u c2
c − v · u = (q − r) ·
2
= |q − r| , o =
dt = ,
dt dt |q − r| R
ya que la aceleración es siempre normal y donde R es el radio de curvatura de la trayectoria
del centro de carga. Por lo tanto, la separación entre el centro de masa y el centro de carga y
la curvatura de la trayectoria satisface en cada instante:
( v · u)
|q − r| = R 1 − 2 .
c
128 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

6 6

5 5

4 4

3 3

2 2

1 1

0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0

Figura 2.9: Proyección en el plano XOY del movimiento del centro de carga (azul) y centro
de masa (rojo) de un electrón libre, que se ha lanzado con v/c =0.2 La trayectoria de la
izquierda, el electron es lanzado en el plano del zitterbewegung, el espín es perpendicular
a este plano y la separación entre CC y CM no es constante. La trayectoria de la derecha
corresponde a lanzar al electrón en una dirección perpendicular al plano del zitterbewe-
gung, con el espín en la dirección del movimiento. Aquí, la separación entre ambos puntos
es constante. Ambos movimientos tienen un período espacial de valor d = vγ(v)T0 =1.28255,
en estas unidades.

Esta separación no es constante. Si partimos de un electrón en reposo en el observador del centro


de masa y lo lanzamos perpendicularmente al plano del zitterbewegung, entonces v · u = v 2
y en este caso la trayectoria es una hélice de curvatura y torsión constante y la separación es
constante, R0 , que está relacionada con el radio de curvatura de la trayectoria R por

R = R0 γ(v)2 .

Corresponde con la trayectoria de la derecha de la gura 2.9. Si en otra situación v · u no es


constante, entonces la separación oscila. Por ejemplo, si lanzamos al electrón con una velocidad
v contenida en el plano del zitterbewegung, la trayectoria del centro de carga es plana y en
unidades de R0 = 1, y v/c = 0.2, obtenemos la descripción de la izquierda de la gura 2.9.
Vemos que la separación oscila entre |q − r| =0.8R0 y |q − r| =1.2R0 . De hecho, en estas
unidades, el período del movimiento interno es T0 = 2πR0 /c = 2π , para el observador del
centro de masa. Para el observador del laboratorio, este período es T = γ(v)T0 , y durante este
tiempo el centro de masa recorre una distancia d = vγ(v)T0 =1.28255 en estas unidades. Vemos
que es esta separación el período espacial de la gura mencionada en ambas trayectorias.
Para el caso del electrón no relativista, en el caso de bajas velocidades, v/c → 0, |q−r| = R0 ,
y obtenemos las ecuaciones del caso Galileano

d2 q d2 r
= 0, = ω02 (q − r). (2.197)
dt2 dt2
un movimiento libre para el centro de masa y un movimiento armónico isótropo alrededor de q
para el centro de carga, de pulsación constante ω0 = c/R0 .
En la gura 2.10 se representa el movimiento del CC y del CM en el plano XOY para
cuatro velocidades diferentes, en las que se aprecia que la separación relativa entre estos centros
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 129

6 6 6 6

5 5 5 5

4 4 4 4

3 3 3 3

2 2 2 2

1 1 1 1

0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0

Figura 2.10: Proyección en el plano XOY , del movimiento del CC y del CM, con velocidades
respectivas v/c=0.2,0.3,0.4 y 0.5. Obsérvese que la separación relativa del CM oscila entre
(1 − v/c)R0 y (1 + v/c)R0 , para esta orientación del espín.

oscila en el intervalo entre (1 − v/c)R0 y (1 + v/c)R0 . Las longitudes de onda (lo que recorre
el CM durante una vuelta del CC) de esos movimientos son, respectivamente 1.28255, 1.97597,
2.74221 y 3.6276. En la gura 2.11 los mismos movimientos pero con una velocidad del CM
perpendicular al plano del zitterbewegung. En este caso la separación entre centros es constante.

6 6 6 6

5 5 5 5

4 4 4 4

3 3 3 3

2 2 2 2

1 1 1 1

0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0

Figura 2.11: Proyección en el plano XOZ , del movimiento del CC y del CM, con velocidades
respectivas v/c=0.2,0.3,0.4 y 0.5. Obsérvese que la separación relativa entre el CC y el CM
es constante, pero lo que recorre el CM en cada vuelta del CC es lo mismo que en el caso
de la gura anterior.

En la gura 2.12 se ha hecho un dibujo en perspectiva, habiendo lanzado al electrón con


una velocidad v formando un ángulo de 30◦ con respecto al plano del zitterbewegung.
130 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

-1.0
-0.5
0.0
0.5 0.5
0.0 1.0
-0.5

Figura 2.12: Movimiento del CC y del CM en la que la velocidad del CM v/c =0.1 y posee
una orientación de 30◦ , con respecto al plano del zitterbewegung. La separación |q − r| no
es constante, pero este vector q − r es siempre ortogonal al vector velocidad u del centro
de carga.
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 131

2.6.3. Interacción con un campo externo


En la situación más general, la Lagrangiana que describe al electrón en interacción es de la
forma
e=L
L e 0 (u, ṫ, ṙ, u̇, ω) + L
e I (t, r, ṫ, ṙ), (2.198)
donde como hemos visto, la Lagrangiana libre L e0 ≡ Le m que da cuenta de las propiedades
mecánicas del electrón, su masa m y su espín SCM , es independiente de t y r y la dependencia
de la orientación ρ y ρ̇ lo es a través de su dependencia de ω . Para la Lagrangiana de interacción
e I , no puede haber dependencia de u̇ y de ω , porque de acuerdo con el principio atómico ni
L
m ni SCM se pueden modicar por una interacción con lo que las funciones que dan lugar
al espín U = ∂ L/∂e u̇, y W = ∂ L/∂ω e , deben provenir solamente de la parte mecánica L em .
e
Es en la parte LI donde están contenidas las propiedades interactivas de la partícula. En la
descripción temporal L0 = L0 (u, a, Ω) donde a es la aceleración del punto r , Ω = ω/ṫ y
LI = −eϕ(t, r) + eA(t, r) · u, que solamente depende de la carga de la partícula e y de los
potenciales externos. Las ecuaciones dinámicas de los tres grados de libertad r son
( ) ( ) ( )
d ∂Lm d2 ∂Lm ∂LI d ∂LI
− + 2 + − = 0.
dt ∂u dt ∂a ∂r dt ∂u

La parte relacionada con Lm se reduce a −dP m /dt, siendo P m el momento lineal mecánico,
mientras que la relacionada con LI suministra la fuerza de Lorentz sobre la carga localizada en
el punto r . Pasando al otro miembro la derivada del momento lineal se llega a

dP m
= F, (2.199)
dt
en tanto que la denición habitual del centro de masa permanece inalterada

d2 r c2 − v · u
= (q − r) . (2.200)
dt2 (q − r)2
Esta ecuación también procede de la denición del espín con respecto al centro de carga (2.172)

H
S=− (r − q) × u,
c2
y en la dención de S = u×U +W aparecen solamente las funciones U y W las cuales son
propiedades mecánicas que no son modicadas por la interacción ya que e I no depende ni de u̇ ni
L
deω . Si resulta que el espín S no es modicado por la interacción, esto implica que en su denición
anterior, laH que gura se reere al momento temporal mecánico Hm , que tampoco es modicado
e m , de ahí que la denición del centro de masa
por la interacción ya que su denición procede de la L

u×S
q−r = ,
Hm
que es la que conduce a la ecuación (2.200) permanezca inalterada cuando hay una interacción.

Pero el momento lineal mecánico se escribe en términos de la velocidad del centro de masa
como P m = mγ(v)v , de manera que las ecuaciones de la partícula libre (2.196) ha quedado
reemplazada en presencia de un campo externo por (2.199) y (2.200). Vamos a modicar (2.199),
( )
dP m dv dv v
= mγ(v) + mγ(v) v ·
3
= F,
dt dt dt c2

y si hacemos el producto escalar con v , resulta


( )
dv
mγ(v) v ·
3
=F ·v
dt
132 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

por lo que despejando la derivada de orden superior dv/dt en el primer miembro, obtenemos
las ecuaciones diferenciales que describen la evolución del centro de masa y del centro de carga
de un electrón relativista con espín en presencia de un campo electromagnético externo, en
cualquier sistema de referencia inercial:
[ ]
d2 q e 1
= E + u × B − 2 v ([E + u × B] · v) , (2.201)
dt2 mγ(v) c
d2 r c2 − v · u
= (q − r) . (2.202)
dt2 (q − r)2
donde
dq dr
v= , u= ,
dt dt
con la ligadura |u| = c. Podemos comparar estas ecuaciones relativistas con las no relativistas de
la partícula Galileana (2.84) y (2.85). Para los otros tres grados de libertad se sigue manteniendo
la misma ecuación dinámica (2.52)
( )
∂Lm d ∂Lm dW
− = 0, = Ω × W. (2.203)
∂ρ dt ∂(dρ/dt) dt
ya que la dependencia de estas variables lo es a través de Ω siendo LI independiente de ella.
De la ecuación (2.202), haciendo el producto escalar de ambos miembros por (q − r) resulta:
du
(q − r) · = c2 − v · u.
dt
Por otra parte
d du du
(q · u − r · u) = v · u + q · − c2 − r · = 0,
dt dt dt
por lo que la función (q − r) · u es una integral primera del sistema. Si volvemos a hacer el
producto escalar por u en ambos miembros de (2.202), vemos que esta integral primera es nula
pues u · du/dt = 0. El vector velocidad u es siempre ortogonal al vector q − r .

2.6.4. Condiciones de contorno


Las ecuaciones del centro de carga r de la partícula con espín (2.194) son ecuaciones dife-
renciales ordinarias de cuarto orden, por lo que para particularizar una solución tenemos dos
posibilidades. Desde el punto de vista variacional tendríamos que dar los valores de las varia-
bles cinemáticas r(t1 ) y u(t1 ) en el instante inicial t1 y otros tantos valores r(t2 ) y u(t2 ) en
el instante nal t2 . Desde el punto de vista de singularizar una solución con condiciones de
contorno solamente en el instante inicial, tendríamos que suministrar los valores r(t1 ), u(t1 ),
a(t1 ) y w(t1 ), de la posición, velocidad, aceleración y sacudida, respectivamente, en el instante
inicial t1 , es decir los valores de las variables ri y hasta su tercera derivada en ese instante.
Aparentemente son 12 valores iniciales, pero son menos pues u(t1 ) = c y u(t1 ) · a(t1 ) = 0 y
estas dos ligaduras nos reducen a 10 el número de parámetros iniciales independientes.
Sin embargo, de acuerdo con (2.201) y (2.202), las ecuaciones de cuarto orden para r se
han desacoplado en un sistema de ecuaciones de segundo orden para las posiciones q y r de los
centros de masa y centro de carga, respectivamente. Por lo tanto, si queremos obtener la solución
en términos de las condiciones de contorno en el instante inicial, tendríamos que suministrar los
valores r(t1 ), u(t1 ), q(t1 ) y v(t1 ), de las posiciones y velocidades de ambos puntos, evaluadas
en t1 . Esto tendría la ventaja de que utilizaríamos como condición de contorno la velocidad del
centro de masa del electrón, pues mediante un proceso de aceleración inicial en la preparación
del experimento podríamos estimar el valor de su momento lineal. También daríamos la posición
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 133

inicial de su centro de masa q y entonces los valores de r y de u los expresaríamos en función


de la orientación inicial del espín, que se podría controlar con un campo magnético externo.
Supongamos que para el observador del centro de masa el electrón se encuentra con el espín
a lo largo del eje OZ como aparece en la gura y su centro de masa en el origen. Inicialmente el
centro de carga se encuentra en el punto de coordenadas (R0 , 0, 0), sobre el eje OX . Para este
observador, en el instante inicial la posición, velocidad, aceleración y sacudida valen:
       
1 0 −1 0
r(0) = R0  0  , u(0) = cϵ  −1  , a(0) = cω0  0  , w(0) = cω 2 ϵ  1  , ϵ = ±1,
0 0 0 0

con ϵ = +1 para la partícula y ϵ = −1 para la antipartícula.

Figura 2.13: El electrón en el sistema de referencia del CM con el espín orientado en la


dirección del eje OZ . La posición del CC en el plano XOY queda jada por la fase ψ.

Si inicialmente localizamos el centro de carga con un desfase ψ y orientamos el espín según


el ángulo cenital θ y acimutal ϕ, como
 
cos ψ − sin ψ 0
ROZ (ψ) =  sin ψ cos ψ 0  ,
0 0 1
   
cos θ 0 sin θ cos ϕ − sin ϕ 0
ROY (θ) =  0 1 0 , ROZ (ϕ) =  sin ϕ cos ϕ 0 
− sin θ 0 cos θ 0 0 1
las variables iniciales rotadas son r 0 = ROZ (ϕ)ROY (θ)ROZ (ψ)r(0), y lo mismo para el resto, lo
que nos lleva a
   
cos θ cos ϕ cos ψ − sin ϕ sin ψ cos θ cos ϕ sin ψ + sin ϕ cos ψ
r 0 = R0  cos θ sin ϕ cos ψ + cos ϕ sin ψ  , u0 = cϵ  cos θ sin ϕ sin ψ − cos ϕ cos ψ  ,
− sin θ cos ψ − sin θ sin ψ
   (2.204)

cos θ cos ϕ cos ψ − sin ϕ sin ψ cos θ cos ϕ sin ψ + sin ϕ cos ψ
a0 = −cω0  cos θ sin ϕ cos ψ + cos ϕ sin ψ  , w0 = −cω02 ϵ  cos θ sin ϕ sin ψ − cos ϕ cos ψ  .
− sin θ cos ψ − sin θ sin ψ
134 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

La relación de estos valores con los que mide un observador inercial O′ que ve moverse a O con
una velocidad v viene dada por
v · r0 γ 2 (v · r 0 )v
t′0 = γ(t0 + ), r ′0 = r 0 + γvt0 + .
c2 1+γ c2
Si el instante inicial para proceder a la integración es el t′0 = 0 en este referencial, eso corresponde
a t0 = −v · r 0 /c2 , para el observador del centro de masa, por lo que la posición inicial del centro
de carga en el observador del laboratorio, en el instante t′0 = 0, es
γ (v · r 0 )v
r ′0 = r 0 − .
1+γ c2
Para el resto de variables resulta ser
γ2
u0 + γv + (1+γ)c2
(v · u0 )v
u′0 = ,
γ(1 + v · u0 /c2 )
γ
(1 + v · u0 /c2 )a0 − (v · a0 /c2 )u0 − (1+γ)c2
(v · a0 )v
a′0 = ,
γ 2 (1 + v · u0 /c2 )3
γ
(1 + v · u0 /c2 )w0 − (v · w0 /c2 )u0 − (1+γ)c2
(v · w0 )v
w′0 =
γ 3 (1 + v · u0 /c2 )4
[ ]
γ
3(v · a0 /c2 ) (1 + v · u0 /c2 )a0 − (v · a0 /c2 )u0 − (1+γ)c2
(v · a0 )v
− .
γ 3 (1 + v · u0 /c2 )5
Estas condiciones de contorno contienen información de la velocidad del centro de masa v del
electrón. Interpretadas como condiciones de contorno en el instante inicial t′0 = 0 del sistema
de ecuaciones (2.201) y (2.202) resulta que conocemos r ′0 , u′0 , v ′0 = v y nos faltaría por conocer
q ′0 , la posición inicial del centro de masa.
Si consideramos la denición de la posición del centro de masa (2.171) con H = γmc2 , y
P = γmv , nos queda que ( 2 )
c − v · u du
q=r+ ,
(du/dt)2 dt
con lo que la condición inicial para el centro de masa en el sistema de referencia del laboratorio
sería
c2 − v · u′0 ′
q ′0 = r ′0 + a0 ,
a′0 2
en términos de la posición, velocidad y aceleración del centro de carga. Conviene recordar que
en la expresión de la velocidad del centro de masa está la dependencia de la tercera derivada.
En resumen, para caracterizar las condiciones de contorno en el instante inicial t′0 = 0, en
el sistema de referencia del laboratorio debemos jar los valores
γ2
γ (v · r 0 )v u0 + γv + (1+γ)c2
(v · u0 )v
r ′0 = r0 − , u′0 = , (2.205)
1+γ c2 γ(1 + v · u0 /c2 )
c2 − v · u′0 ′
q ′0 = r ′0 + a0 , v ′0 = v, (2.206)
a′0 2
con γ
(1 + v · u0 /c2 )a0 − (v · a0 /c2 )u0 − (1+γ)c2
(v · a0 )v
a′0 = ,
+ v · u0
γ 2 (1 /c2 )3
y donde las magnitudes r 0 , u0 y a0 , son las magnitudes que aparecen para el observador del
centro de masa (2.204). No necesitamos incluir las correspondientes a la sacudida w0 porque
están ya contenidas en la denición de la velocidad del centro de masa v .
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 135

2.6.5. Unidades naturales


Tenemos una unidad natural de velocidad que es c y por otra parte tenemos un factor de
escala espacial que es el radio R0 del zitterbewegung para el observador del centro de masa. Si
denimos las magnitudes adimensionales r = R0 r e, e
t = ω0 t, con ω0 = c/R0 , resulta que

dr de
r de
r
u= = R0 ω0 = c ,
dt de
t de
t

du e
d2 r e
c2 d2 r
=c ω0 = .
dt e
dt 2 e
R0 dt2
por lo tanto la ecuación diferencial (2.202) en unidades naturales queda

e
d2 r 1−ve·u e
= (e e),
q−r
de
t 2 q−r
(e e )2

donde ahora 0 ≤ ve < 1 y u


e = 1. Para la ecuación (2.201) en unidades naturales, llegamos a la
expresión
e
c2 d2 q e
= [E + ue × Bc − ve (E + ue × Bc) · v
e]
R0 det 2 mγ
que utilizando la expresión de R0 = ~/2mc, nos queda:

e
d2 q e~
= e × Bc − v
[E + u e (E + u
e × Bc) · v
e]
e
dt 2 2m 2 c3 γ

donde los campos externos E y B están denidos en cada instante del laboratorio en la posición
del centro de carga r .

2.6.6. Propiedades invariantes


Si aceptamos el principio atómico las propiedades mecánicas intrínsecas del electrón no son
modicadas por una interacción. Si Hm y P m representan la energía (momento temporal) y
momento lineal mecánicos, respectivamente, (de ahí el subíndice m) satisfacen para la partícula
libre la propiedad
Hm2
− c2 P m = m2 c4 . (2.207)
Además sabemos que P m = Hm v/c2 , siendo v la velocidad del centro de masa. Esto implica
que podemos escribirlos como Hm = γ(v)mc2 , P m = γ(v)mv .
Para la partícula libre también satisfacen la ecuación (2.168) que dene el Hamiltoniano de
Dirac, que involucra al espín con respecto al centro de carga:
( )
1 du
Hm = u · P m + 2 S · ×u (2.208)
c dt

Sin embargo de la Lagrangiana de la partícula en interacción (2.198) el momento temporal y


lineal totales se denen como
dU dU
H = −T − u · = Hm + eϕ(t, r), P =R− = P m + eA(t, r).
dt dt
Por lo tanto para la partícula en interacción, en presencia de los potenciales externos, se satis-
facen las expresiones equivalentes a las (2.207) y (2.208).

(H − eϕ(t, r))2 − c2 (P − eA(t, r))2 = m2 c4 , (2.209)


136 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

( )
1 du
H − eϕ(t, r) = u · (P − eA(t, r)) + 2 S · ×u (2.210)
c dt
en términos de los momentos totales H y P y de los potenciales ϕ y A. En el caso cuántico,
(2.209) y (2.210) nos van a dar las ecuaciones de Klein-Gordon en interacción y la ecuación de
Dirac en interacción, respectivamente, que satisface la función de onda del electrón.
Conocida la ecuación dinámica del momento P m dada en (2.199), si derivamos con respecto
al tiempo en (2.207) se tiene
dHm dP m dHm
2Hm − 2c2 P m · = 0, = v · F (t, r),
dt dt dt
es decir dHm = F · dq , la variación de la energía mecánica es el trabajo de la fuerza externa,
denida en el centro de carga r , a lo largo de la trayectoria del centro de masa q .

2.7. Partículas y antipartículas


La Lagrangiana más general de una partícula elemental en interacción se escribe
e=L
L e0 + L
eI ,

donde Le 0 representa la Lagrangiana libre y L e I la parte que da cuenta de la interacción.


Las propiedades mecánicas invariantes de la partícula, que no son modicadas por la interac-
ción, proceden de la Lagrangiana libre L e 0 . Estas propiedades están relacionadas con el momento
temporal Hm y lineal P m y el espín con respecto al centro de carga S = u × U + W = Z + W .
Como la parte de la interacción L e I , no puede modicar la denición de las dos funciones U y
W , la estructura del espín permanece inalterada, de acuerdo con el Principio Atómico. En el
contexto relativista y para la partícula cuyo centro de carga se mueve a la velocidad c, entre
estos observables existe la relación, invariante entre observadores,
( )
1 du
Hm − P m · u = 2 S · ×u .
c dt
e 0 , se tiene también
Para los observables mecánicos Hm y P m , denidos a partir de la parte L
que para cualquier observador se verica

(Hm /c)2 − P 2m = m2 c2 ,

donde m es un observable positivo que se interpreta como la masa de la partícula. Entre estos
dos observables mecánicos hay la relación,

P m = Hm v/c2

donde v representa la velocidad del centro de masa de la partícula. Esto trae consigo que

Hm = ±γ(v)mc2 , P m = ±γ(v)mv.

El formalismo relativista predice que hay dos clases de sistemas materiales de la misma masa
positiva m, pero en los que Hm puede ser positivo o negativo y que el momento lineal mecánico
P m , tenga la dirección de la velocidad del centro de masa o en sentido contrario, respectiva-
mente. Al primero se le da el nombre de partícula, reservando el nombre de antipartícula para
el segundo. La diferencia entre ambos es que si la Lagrangiana libre del primero es L e 0 , entonces
e
la Lagrangiana libre del segundo es −L0 .
En cuanto a la estructura interna del movimiento de las variables cinemáticas, implica que
para la partícula, jada la dirección del espín S , el movimiento del centro de carga es antiorbital
2.7. PARTÍCULAS Y ANTIPARTÍCULAS 137

para la partícula y orbital para la antipartícula. Es claro que las propiedades mecánicas inmo-
dicables Hm , P m y S , provinientes de la Lagrangiana mecánica libre L e 0 , cambian de signo
cuando proceden de −L e 0 , pues todas las funciones T , R, U y W también cambian de signo.
e
Para la parte LI toma la forma general
e I = −eϕ(t, r)ṫ + eA(t, r) · ṙ,
L

donde la constante e representa la carga de la partícula y cuyo signo está indeterminado y


e ∗ = −e∗ ϕ(t, r)ṫ + e∗ A(t, r) · ṙ,
L I

para la antipartícula, siendo e∗ la carga de la antipartícula y ϕ y A los potenciales externos.


Para la partícula, de Lep = Le0 + Le I , se llega a que

dP m d(γ(v)mv)
= e (E + u × B) , P m = γ(v)mv, = e (E + u × B) ,
dt dt
e a = −L
mientras que para la antipartícula, de L e0 + L
e ∗ , se llega a
I

dP m d(γ(v)mv)
= e∗ (E + u × B) , P m = −γ(v)mv, = −e∗ (E + u × B) ,
dt dt
donde E = −∇ϕ − ∂A/∂t y B = ∇ × A. Si frente a un mismo campo electromagnético
externo, la aceleración del centro de masa de la partícula es opuesta a la de la antipartícula,
entonces −e∗ = −e, ambos objetos tendrían la misma carga, y esta última ecuación dinámica
se reescribiría,
d
(γ(v)mv) = −e (E + u × B) .
dt
Podríamos denir el momento lineal siempre en el sentido de la velocidad, con lo cual Hm
sería siempre un observable denido positivo, lo que nos daría lugar a dos posibles tipos de
partículas que a igualdad de masa solamente dieren en el signo de la carga, y que vendrían
descritas por las dos Lagrangianas
ep = L
L e 0 − eϕ(t, r)ṫ + eA(t, r) · ṙ,

ea = L
L e 0 + eϕ(t, r)ṫ − eA(t, r) · ṙ,

que corresponde simplemente a un cambio de e por −e, y donde la parte común L e 0 es la que
conduce a una Hm > 0 y P m = Hm v/c . En cualquier caso, el signo de la carga de la partícula
2

no está denido.
Como las ecuaciones dinámicas que se obtienen de L e a y de −L
e a son las mismas, conducen a
dos posibles interpretaciones equivalentes de las diferencias entre partícula y antipartícula. Una
es que ambos objetos elementales tienen la misma masa y carga eléctrica, pero sus propiedades
mecánicas Hm y P m son opuestas. La interpretación del convenio actual es que poseen cargas
opuestas, lo que nos lleva a adoptar la denición de que la energía es positiva y que el momento
lineal tiene la dirección de la velocidad del centro de masa para ambas. La exigencia de la
positividad de la energía puede tener que ver con la dirección de la echa del tiempo. Ver el
análisis que se hace en la sección 6.10.3 sobre transformaciones activas y pasivas del grupo
cinemático.
Este tratamiento es válido para el establecimiento de las ecuaciones dinámicas del centro
de masa de cada partícula. Para la parte del movimiento interno tendríamos para ambas la
ecuación
d2 r c2 − v · u
= (q − r),
dt2 (q − r)2
138 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

que no es otra que la denición de la posición del centro de masa


( )
c2 Hm − P m · u du
q=r+ .
Hm (du/dt)2 dt

La expresión del espín S en términos de estas variables sería para la partícula


( )
Hm − P m · u du
Sp = × u, o bien S p = −γ(v)m(r − q) × u
(du/dt)2 dt

en tanto que para la antipartícula


( )
Hm − P m · u du
Sa = 2
u× , o bien S a = γ(v)m(r − q) × u,
(du/dt) dt

con Hm = γ(v)mc2 y P m = γ(v)mv . Esto nos distingue en la estructura interna en el hecho


de que el espín S , tiene la dirección de la velocidad angular para la antipartícula y en sentido
opuesto para la partícula.
Experimentalmente sabemos que el par electrón-positrón, si su momento angular total es
cero, se desintegra en la emisión de dos fotones, con espines opuestos, de energía total 2mc2 .
En el proceso se conserva la energía, el momento lineal y el angular y la carga eléctrica. Si el
estado inicial es de espín 1, entonces la desintegración lo es con emisión de tres o más fotones. La
interpretación, para partículas masivas, de que la antipartícula es un objeto de carga opuesta,
es consistente con este resultado experimental.
En el caso de los fotones, al no tener carga podríamos suponer que son su propia antipartí-
cula. Esta es una interpretación que se suele hacer habitualmente. Pero eso mismo podríamos
hacer con los neutrinos, que al no tener carga eléctrica serían también sus propias antipartículas.
Sin embargo, los antineutrinos poseen número leptónico opuesto y son diferentes que los neu-
trinos. La conservación del número leptónico requiere que sean distintos. Sin embargo, desde el
punto de vista mecánico, S y ω tienen la misma dirección para el fotón y sentido contrario para
el antifotón. Su distinción física se podría determinar viendo cómo interaccionan con una red
cristalina. Si la óptica de los antifotones es la misma que la de los fotones no habría diferencia
entre ellos, pero es posible que al interaccionar con el medio cristalino, aunque no poseen carga,
su desviación podría tener que ver con la diferente orientación relativa del momento angular
con la velocidad angular.
Como los fotones no tienen carga, esta interpretación de que el momento lineal tiene la
dirección de la velocidad y la carga es opuesta, nos lleva a que fotones y antifotones son la misma
partícula. En cambio, en la primera de las interpretaciones no habría ambigüedad, ya que las
propiedades mecánicas H y p serían opuestas. Hoy en día sabemos que tanto en electrodinámica
como en cromodinámica, los mecanismos de interacción entre la materia (fermiones de espín 1/2)
es el intercambio de bosones virtuales de espín 1 (fotones, gluones, bosones masivos W ± , Z 0 ).
En el caso electromagnético, si solamente existiera el intercambio de fotones no se produciría el
fenómeno de la atracción.
Supongamos, como se describe en la gura 2.14, que un electrón y un positrón, ambos de
energía mecánica Hm positiva y momento lineal en la dirección de la velocidad de su centro de
masa, interaccionan intercambiando un fotón, que de forma virtual es emitido por el electrón
en 1 y absorbido por el positrón en 2. Debido al intercambio de momento lineal y energía, el
electrón adquiere un momento lineal p′1 = p1 − k, mientras que el positrón termina con un
momento lineal p′2 = p2 + k, y las dos partículas se repelen. El proceso hubiera sido el mismo
si quien hubiera emitido el fotón virtual fuera el positrón.
Como sabemos que partículas de carga opuesta se atraen, el mecanismo debería haber sido
el de la gura 2.15, con un intercambio de un antifotón, emitido desde 1 por el electrón, con
2.7. PARTÍCULAS Y ANTIPARTÍCULAS 139

Figura 2.14: Interacción de un electrón y un positrón intercambiando un fotón. Ambas


partículas se separan.

Figura 2.15: Interacción de un electrón y un positrón intercambiando un antifotón. Ambas


partículas se atraen.
140 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

momento lineal k, en sentido contrario a la velocidad, siendo absorbido en 2 por el positrón.


Ahora también p′1 = p1 − k, y el resultado es que el electrón se acerca al positrón. Lo mismo
le sucede a éste. También se podría interpretar este proceso al revés, siendo el positrón quien
emitiera el antifotón virtual.
En un átomo, la existencia de estados ligados de electrones con respecto a un núcleo positi-
vamente cargado, implica un proceso de atracción electromagnética. Si este proceso se interpreta
como el intercambio de bosones virtuales entre el núcleo y los electrones, estos bosones tienen
que ser necesariamente antifotones.

2.7.1. Detección de antimateria cósmica


Uno de los proyectos para detectar antimateria en el universo y vericar la existencia de
galaxias de antimateria consistiría en detectar átomos de antimateria en los rayos cósmicos.
Antiprotones y positrones ya se detectan, pero pueden haber sido producidos en el sol o en
estrellas de nuestra galaxia.

Figura 2.16: Medida de la relación positrón/electrón hecha por el detector de la AMS02.


La banda de color gris es la predicción de esta relación, hecha por astrofísicos y basada
en modelos de interacción y fenómenos de transporte en la Galaxia. La relación medida
(datos de color rojo), incrementa a partir de los 10 GeV.

La estructura compuesta más simple formada por antimateria sería el núcleo de antihelio
formado por dos antiprotones y dos antineutrones, es decir una partícula antialfa. Esto llevó
a desarrollar un espectrómetro para medir estas partículas. Se le denomina Alpha Magnetic
Spectrometer del cual la versión AMS02 fue instalada en la ISS (International Space Station)
en mayo de 2011, a una altura media de 350 Km. Hasta 2013 había detectado del orden de
25 × 109 medidas de electrones y positrones en el rango de 0.5 a 350 GeV, de los cuales 4 × 105
eran positrones, observando un aumento de la relación positrones/electrones en el rango de 10
a 250 GeV, no habiendo una diferencia signicativa a lo largo del tiempo ni en la dirección de
observación, pero conrmando an unexplained excess of high-energy positrons in Earth-bound
cosmic rays, en palabras de Samuel Ting, director del proyecto 15 . En diciembre de 2016 informa
que ha detectado una pequeña fracción de antihelio-3 entre unos 109 núcleos de helio detectados
durante un año.

15
S. Coutu, Physics 6, 40 (2013); AMS Collaboration Phys. Rev. Lett. 110, 141102 (2013)
2.8. APÉNDICE: GRUPO DE ROTACIONES SO(3) 141

2.8. Apéndice: Grupo de Rotaciones SO(3)


Vamos a describir geométricamente una rotación de valor α alrededor de un eje arbitrario,
descrito por el vector unitario u. Interpretamos que para α > 0 el giro se realiza el sentido
horario cuando miramos en la dirección del vector unitario u. Si α < 0, el sentido de giro es el
antihorario. Por lo tanto, según la gura 2.17, un punto cualquiera caracterizado por el vector
r , pasará a la posición dada por el vector r ′ ,

Figura 2.17: Rotación activa de valor α del vector r, alrededor del eje OA

Vectorialmente, r ′ = OA + AD + DC , siendo DC perpendicular al vector AB .

OA = (r · u)u

AD = AB cos α = (r − (r · u)u) cos α


DC = |AC| sin α n
siendo n un vector unitario perpendicular a u y r y por lo tanto
u×r
n=
|u × r|
pero |u × r| = |AC| = |AB|, |AD| = |AC| cos α, |DC| = |AC| sin α, con lo que

DC = u × r sin α

De esta manera el vector r ′ se expresa como:

r ′ = r cos α + (r · u)u(1 − cos α) + u × r sin α, (2.211)

que expresado por componentes:

x′ i = xi cos α + (xj uj )ui (1 − cos α) + εijk uj xk sin α =

= (δik cos α + ui uk (1 − cos α) + εijk uj sin α)xk = R(α, u)ik xk .


Si denimos el vector α = αu, entonces toda rotación queda parametrizada por un vector de
R3 ,
αi αk αj
R(α)ik = δik cos α + 2 (1 − cos α) + εijk sin α (2.212)
α α
142 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

donde el primer índice i es un índice de la y el segundo k de columna de la matriz que caracteriza
a esta rotación. Si jamos el vector u, entonces una rotación en el sentido positivo alrededor de
un eje de valor α produce el mismo efecto que una rotación de valor 2π − α tomada en sentido
contrario. Entonces, a la hora de singularizar cada rotación por un vector α, la variedad que
caracteriza al grupo se reduce al conjunto de puntos contenidos dentro y sobre la supercie de
una esfera de radio π , (ver gura 2.18) pero donde los puntos opuestos de la supercie de la
esfera, que representan rotaciones de valor π , corresponden a una misma rotación y por lo tanto
están identicados.

Figura 2.18: Variedad doblemente conexa del grupo SO(3)

Esta particularidad hace que si tratamos de unir dos puntos de la variedad mediante una
curva de puntos de la variedad, hay dos tipos de curvas que nos unen dichos puntos. Estos tipos
de curvas no pueden reducirse, por deformación, el uno al otro, ya que o pasan por la supercie
de la esfera y saltan a su punto opuesto, o bien unen directamente ambos puntos. La variedad
es un conjunto cerrado y acotado, es decir compacto. Y como la conexión mediante arcos de
dos puntos cualesquiera tiene dos posibilidades, pasando por el borde o sin pasar, resulta que
el grupo de rotaciones es también doblemente conexo. El det(R(α)) = 1, con lo que el grupo
de rotaciones se identica con SO(3), el grupo de matrices 3 × 3 ortogonales de determinante
unidad (Special Orthogonal group).
Otras parametrizaciones alternativas se obtienen deniendo el vector ϕ = sin(α/2)u y la
matriz de rotación se representa por:

R(ϕ)ik = (1 − 2ϕ2 ) δik + 2ϕi ϕk + 2 1 − ϕ2 εijk ϕj (2.213)

y la variedad es una esfera de radio unidad con identicación de puntos opuestos sobre la
supercie.
Si denimos el vector ρ = tan(α/2)u en esta parametrización una rotación se expresa
mediante:
1
R(ρ)ik = [(1 − ρ2 ) δik + 2ρi ρk + 2εijk ρj ] (2.214)
1 + ρ2

y la variedad es el espacio R3 compacto, donde la compacticación se ha obtenido añadiendo


los puntos del innito en cada dirección, y que además cada par de puntos opuestos se han
identicado. Denotaremos esta variedad por R3c .
2.8. APÉNDICE: GRUPO DE ROTACIONES SO(3) 143

Ejercicio: Dada la matriz ortogonal siguiente:


 
0 1 0
 0 0 1
−1 0 0

determinar qué tipo de transformación de coordenadas genera.


Solucion: Como el determinante es −1 resulta ser una rotación seguida de una inversión con
respecto al origen. La traza es cero, luego la rotación es de 0 = 1 + 2 cos α, α = 2π/3, alrededor de
un eje de cosenos directores proporcionales a u ∼ (1, −1, 1).

Ejercicio: Calcular, utilizando dos parametrizaciones distintas del grupo de rotaciones, la matriz
que representa una rotación, en el sentido pasivo, de valor α = 30◦ alrededor de un eje cuyos
cosenos directores son proporcionales a los números (−1, 2, 2).

2.8.1. Parametrización normal o canónica del grupo SO(3)


A partir de la relación RT R = 1, obtenemos nueve ecuaciones entre las nueve componentes
de la matriz de rotación R. Sin embargo sólo son en realidad seis ecuaciones independientes, ya
que considerada cada matriz como tres vectores la o columna, dichas relaciones lo que estable-
cen es que dichos vectores son ortogonales dos a dos y de norma unidad. El que el determinante
sea +1 representa que tomados consecutivamente, dichos vectores forman un triedro ortonormal
directo(antihorario), siendo un triedro inverso(horario) en el caso de que el determinante valga
−1. Quedan por lo tanto tres parámetros libres de ahí que la variedad que caracteriza al grupo
sea de dimensión 3. La parte conectada continuamente con la unidad SO(3) como grupo de Lie,
tendrá un álgebra de Lie de dimensión 3. Sea R = I + ϵM una rotación próxima a la unidad, con
ϵ innitesimal y M una matriz a determinar. Como RT = R−1 = I + ϵM T = I − ϵM , resulta
que M T = −M por lo que M es una matriz antisimétrica arbitraria 3 × 3, que se denomina
generador de la rotación.
El álgebra de Lie de los generadores de SO(3), que se suele representar por so(3), es el
espacio vectorial real de las matrices reales antisimétricas 3 × 3. Una base de dicho espacio viene
dada por las tres matrices linealmente independientes:
     
0 0 0 0 0 1 0 −1 0
J1 =  0 0 −1  , J2 =  0 0 0  , J3 =  1 0 0  ,
0 1 0 −1 0 0 0 0 0

con lo que comprobamos que generan un espacio vectorial de dimensión 3. Un álgebra de Lie,
además de ser espacio vectorial posee una ley de composición interna, que es distributiva res-
pecto de la suma vectorial, pero que no es en general conmutativa ni asociativa. Basta para
caracterizarla, el conocer dicha ley para los vectores de la base. Para matrices la ley [ , ] se
reduce a su conmutador. Los tres Ji cumplen las reglas de conmutación:

[Ji , Jk ] = εikl Jl , i, k, l = 1, 2, 3, (2.215)

es decir la tabla que dene la operación [ ., .] del álgebra de Lie so(3) es la

so(3) J1 J2 J3
J1 0 J3 −J2
J2 −J3 0 J1
J3 J2 −J1 0

Sea M = αi Ji una combinación lineal arbitraria de los elementos de la base
∑ Ji , con tres
números reales arbitrarios αi . Esa suma la vamos a escribir formalmente como αi Ji = αu · J ,
siendo αi = αui en términos de las tres componentes de un vector unidad u y donde mediante
144 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN


el `producto escalar' u · J ≡ U lo que queremos expresar es el sumatorio ui Ji en forma
compacta. Calculemos la matriz
  
( )  0 −u3 u2 
M n
exp(M ) ≡ lı́m I + ≡ exp(αU ) = exp α  u3 0 −u1  =
n→∞ n  
−u2 u1 0
     
1 0 0 0 −u3 u2 2 −(u22 + u23 ) u1 u2 u1 u3
 0 1 0  +  u3α α
0 −u1  +  u1 u2 −(u21 + u23 ) u2 u3 +
1! 2!
0 0 1 −u2 u1 0 u1 u3 u2 u3 −(u1 + u2 )
2 2
 
0 u3 −u2
α3 
+ −u3 0 u1  + · · ·
3!
u2 −u1 0
de tal manera que habiendo llamado
   
0 −u3 u2 −(u22 + u23 ) u1 u2 u1 u3
U = u · J =  u3 0 −u1  , U2 =  u1 u2 −(u21 + u23 ) u2 u3 ,
−u2 u1 0 u1 u3 u2 u3 −(u1 + u2 )
2 2

entonces U verica U 3 = −U , U 4 = −U 2 y así sucesivamente para todas sus potencias, con lo


que el desarrollo anterior se expresa en términos únicamente de las matrices I, U y U 2 , en la
forma ( ) ( 2 )
α α3 α α4
exp(αU ) ≡ exp(α · J ) = I + U − + · · · + U2 − + ··· ,
1! 3! 2! 4!
es decir la expresión obtenida anteriormente (2.212).
Si consideramos que dos de los parámetros αi son nulos y analizamos el subgrupo unipara-
métrico que genera el parámetro no nulo, por ejemplo α1 , entonces

exp(αJ1 ) exp(βJ1 ) = (I + sin αJ1 + (1 − cos α)J12 )(I + sin βJ1 + (1 − cos β)J12 ) =

I + sin(α + β)J1 + (1 − cos(α + β))J12 = exp((α + β)J1 ),


con lo que en esta parametrización la ley de composición de cada subgrupo uniparamétrico es la
suma de los parámetros de los elementos del grupo que intervienen en la operación. Al parámetro
que dene la aplicación exponencial se le denomina parámetro normal o canónico.
La parametrización normal del grupo de rotaciones, corresponde por lo tanto a aquella en
la que la variedad es la esfera de radio π , con lo que en la parametrización normal una rotación
se representa por:
αi αk αj
R(α)ik = (exp(α · J ))i k = δik cos α + (1 − cos α) + εijk sin α,
α2 α
que es la expresión (2.212).
De forma desarrollada R(α) resulta ser:
 
cos α + u21 (1 − cos α) −u3 sin α + u1 u2 (1 − cos α) u2 sin α + u1 u3 (1 − cos α)
 u3 sin α + u2 u1 (1 − cos α) cos α + u22 (1 − cos α) −u1 sin α + u2 u3 (1 − cos α) 
−u2 sin α + u3 u1 (1 − cos α) u1 sin α + u3 u2 (1 − cos α) cos α + u23 (1 − cos α)

Podemos ver que R(α)−1 = RT (α) = R(−α) y que la suma de los elementos diagonales
vale 1 + 2 cos α, en tanto que los cosenos directores del vector unitario u que dene el eje de giro
son proporcionales a los números (R32 − R23 , R13 − R31 , R21 − R12 ), salvo en el caso de que
la rotación sea de valor α = π , que al ser R simétrica, se obtendrán a partir de los elementos
2.8. APÉNDICE: GRUPO DE ROTACIONES SO(3) 145

diagonales que valen, respectivamente −1+2u21 , −1+2u22 y −1+2u23 y las dos posibles soluciones
para cada ui deben ser compatibles con el resto de los elementos Rij .

1
1 + 2 cos α = Rii , ui = ϵijk Rkj , α ̸= 0, π.
2 sin α
Si α = 0, los Rkj , k ̸= j son nulos y la anterior relación es indeterminada, como corresponde al
eje de una rotación nula.
Si calculamos los valores propios de toda matriz ortogonal que representa una rotación,
vemos que se reducen al valor real 1 con vectores propios en el subespacio vectorial de R3 de
dimensión 1 en la dirección del eje de giro, y otros dos valores propios en general complejos
conjugados, de la forma eiα y e−iα , sin vectores propios reales, que en el caso particular α = π
se reducen a −1 que es doble y los correspondientes vectores propios constituyen el espacio
vectorial bidimensional ortogonal al eje de giro.

Ejercicio: Las dos matrices siguientes representan sendas rotaciones. Determinarlas.


 √ √ √   √ √ 
− − 10
2 10 1
− 4+6 3 3−1
 √2 5√ √10 
6
 √3−4 √3 
A= 10 1+2 2 2−2
, B=  1 3+1

√5 √5 5√ √6 6√ 3
−1
10
10
2−2
5
8+ 2
10
− 3+1
3
1− 3
3 3

Solucion: αA = π/4, nA ∼ (0, −1, 2). αB = 2π/3, nB ∼ (−2, 2, 1).

El tratamiento que hemos hecho de las rotaciones se denomina representación activa, en el


sentido de que expresamos cómo cambian las coordenadas de un punto sometido a una rotación,
respecto de unos ejes coordenados que permanecen jos en el espacio. La interpretación pasiva
consiste en representar las coordenadas de un mismo punto del espacio referido a dos sistemas
de coordenadas, uno de los cuales ha sido girado respecto del otro. Pero al girar un sistema de
coordenadas mediante α las nuevas coordenadas del punto corresponde a una rotación activa en
la que hubiéramos girado al punto con la rotación inversa −α. De ahí que basta sustituir α por
−α para obtener la expresión de un cambio de coordenadas cuando cambiamos de sistema de
referencia. En este caso, las reglas de conmutación aparecen en la interpretación pasiva como:

[Ji , Jk ] = −εikl Jl , i, k, l = 1, 2, 3

2.8.2. Ley de composición de las rotaciones

Si cada rotación viene dada por un vector α ∈ SO(3) entonces es posible obtener el vec-
tor resultante de la composición de dos rotaciones arbitrarias. Sea R(γ) = R(α)R(β). Si los
vectores α = αu, β = βv y γ = γw, entonces haciendo el producto matricial e identicando
término a término obtenemos:
γ u tan α/2 + v tan β/2 + tan α/2 tan β/2(u × v)
w tan = (2.216)
2 1 − tan α/2 tan β/2(u · v)

Si en vez de utilizar la parametrización normal denimos los vectores

α β γ
ρ = tan u, µ = tan v, ν = tan w
2 2 2
entonces R(ν) = R(ρ)R(µ) resulta:

ρ+µ+ρ×µ
ν= (2.217)
1−ρ·µ
146 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

Podemos ver de la anterior relación, que si α = β = π , tan(α/2) = tan(β/2) = ∞ y por lo


tanto en este límite:
γ v×u
w tan =
2 u·v
con lo que la rotación resultante es alrededor de un eje ortogonal a los dos anteriores en el sentido
del producto vectorial del segundo al primero, que si están separados un ángulo ϕ se tiene que
tan(γ/2) = sin ϕ/ cos ϕ = tan ϕ, y el valor del ángulo es γ = 2ϕ, doble del que forman u y v .
Recíprocamente, toda rotación puede por lo tanto escribirse como producto de dos rotaciones
de valor π , alrededor de dos ejes ortogonales al primero y separados por un ángulo de valor
mitad al de la rotación a efectuar.

Si tenemos una pequeña tapa cilíndrica boca abajo y la damos la vuelta, esto es la giramos π
radianes alrededor de uno de sus diámetros quedando boca arriba, y a continuación la volvemos a
girar otros π radianes alrededor de otro diámetro, vuelve a quedar boca abajo, y sus puntos han
girado un ángulo doble del que forman estos dos ejes, y en el sentido en que se han tomado estos
ejes.

Figura 2.19: Composición de rotaciones mediante giros de valor π

Esto nos da pie para representar geométricamente la composición de dos rotaciones 16 a


base de descomponer cada una de ellas en dos de valor π . Sean en la gura 2.19, u y v los dos
vectores unitarios alrededor de los cuales vamos a girar sendos ángulos α y β . Si por O trazamos
los planos perpendiculares a ambos vectores, éstos se cortan según la recta caracterizada por
el vector unitario n. En el plano perpendicular a u, y en el sentido antihorario, colocamos el
vector unitario n1 , separado del n un ángulo α/2. Asímismo, en el plano perpendicular a v ,
y en sentido contrario al anterior, denimos el vector unitario n2 separado β/2 del n. Por lo
tanto:

R(β, v)R(α, u) = R(π, n2 )R(π, n)R(π, n)R(π, n1 ) = R(π, n2 )R(π, n1 ), (2.218)

por lo que la rotación compuesta lo es alrededor de un eje perpendicular a n1 y n2 en el sentido


n2 × n1 y de valor un ángulo igual al doble del que forman estos vectores.
El análisis anterior se presta a otra interpretación gráca de la ley de composición de dos
rotaciones. Supongamos que tenemos dada una esfera de radio unidad. Como una rotación viene
16
J.M. Aguirregabiria, A. Hernández, M. Rivas, Composition law of the rotation group, Eur. J. Phys., 13,
139-141 (1992).
2.8. APÉNDICE: GRUPO DE ROTACIONES SO(3) 147

caracterizada por el ángulo α y el vector unitario u que dene el eje de rotación, vamos a tratar
de representar ambos elementos sobre esta esfera. El vector u lo podemos denir por un punto
sobre ella que representa a su extremo o bien mediante un plano, ortogonal a u que pasando
por el centro corta a la esfera según un círculo máximo. Adoptaremos este segundo punto de
vista. En cuanto al ángulo α, asociado a este eje, deniremos sobre el círculo máximo anterior
un segmento orientado de longitud α/2.

Figura 2.20: Composición de rotaciones sobre la esfera unidad

La ley de composición esquematizada en la gura anterior nos lleva en la gura 2.20, a


denir dos círculos máximos asociados respectivamente a u y v que se cortan en el punto A, el
cual representaría el extremo del vector unitario n. Llevando sobre ellos en el sentido indicado
sendos segmentos circulares de valores α/2 y β/2 respectivamente se nos denen los puntos B y
C que se corresponden con los extremos de los dos vectores unitarios n2 y n1 . Como la rotación
resultante es ortogonal a éstos, entonces su eje queda denido por el círculo máximo que pasa
por B y C . Como la rotación compuesta lo es de valor doble a la separación angular entre n1
y n2 , entonces el segmento circular BC resulta ser de valor γ/2 y por lo tanto caracteriza a la
rotación compuesta.
Como la separación angular entre ambos planos es π − ϕ, siendo ϕ el ángulo que forman u
y v , sabemos por trigonometría esférica que en el triángulo esférico ABC se cumple:

cos γ/2 = cos α/2 cos β/2 + sin α/2 sin β/2 cos(π − ϕ) =
= cos α/2 cos β/2 − sin α/2 sin β/2 cos ϕ
relación que podemos obtener directamente a partir de la composición de las dos matrices que
representan dichas rotaciones.

2.8.3. Cinemática de la rotación


La descripción de un objeto con orientación, como por ejemplo un sólido rígido o una partí-
cula elemental se va a hacer describiendo la evolución de los tres vectores unidad ei , i = 1, 2, 3,
de los ejes ortogonales ligados al punto que evoluciona. En el caso del sólido rígido pueden ser las
tres direcciones principales de inercia alrededor del centro de masa y en el caso de una partícula
elemental el sistema cartesiano instantáneo ligado al centro de carga.
Si esos tres vectores los escribimos como vectores columna, uno a continuación del otro,
formarán una matriz ortogonal de determinante unidad, esto es, una matriz de rotación, y por lo
148 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

tanto, solamente tres parámetros αi , i = 1, 2, 3, la caracterizarán, como variables esenciales para


su descripción, que serán los tres grados de libertad asociados a la evolución de la orientación.

R(α) = ((e1 ), (e2 ), (e3 ))

Si inicialmente en t = 0, escogemos los ejes del laboratorio en coincidencia con los tres ejes
del cuerpo, entonces en el instante t, la matriz R(α(t)) representa la rotación activa que debo
someter a los ejes del laboratorio para llevarlos a coincidencia con los ejes del cuerpo.
Si ahora consideramos otro observador inercial Galileano O′ que está relacionado con O
mediante una transformación Galileana, esto es que nuestras medidas de acontecimientos espacio
temporales están relacionadas mediante

t′ = t + b, r ′ = R(µ)r + vt + a,

signica que la información sobre cualquier otra magnitud de tipo vectorial la relacionamos
con la matriz Jacobiana del cambio de coordenadas espaciales, esto es Rij (µ), siendo µ los
tres parámetros que caracterizan a nuestra orientación relativa. En particular, los tres vectores
unidad ligados al cuerpo transformarán con

e′i = R(µ)ei ,

y si en ambos miembros los agrupamos formando la correspondiente matriz ortogonal, resulta


para todo instante t:
( ′ )
(e1 ), (e′2 ), (e′3 ) ≡ R(α′ (t′ )) = (R(µ)(e1 ), R(µ)(e2 ), R(µ)(e3 )) = R(µ)R(α(t)) (2.219)

Para el observador O, R(α(t)) es la orientación del cuerpo en el instante t y R(α(t + dt)) su


orientación en el instante t + dt. Ésta se podrá poner como la rotación R(α(t)) seguida de una
rotación innitesimal I + Ωdt, esto es

R(α(t + dt)) = (I + Ωdt)R(α(t)) = R(α(t)) + ΩR(α(t))dt = R(α(t)) + Ṙ(α(t))dt,

por lo que la matriz Ω, resulta ser

Ω(t)R(α(t)) = Ṙ(α(t)), → Ω(t) = Ṙ(α(t))R−1 (α(t)) = Ṙ(α(t))RT (α(t))

y Ω es una matriz antisimétrica cuyas tres componentes esenciales denen el vector velocidad
angular instantánea ω(t), ωi = 12 ϵijk Ωjk .
En efecto, para toda matriz de rotación RRT = I, para todo instante t, R(t)RT (t) = I, luego
derivando con respecto al tiempo

ṘRT + RṘT = 0, Ω + ΩT = 0.

Además, la relación Ṙ(α(t)) = Ω(t)R(α(t)), si lo analizamos por columnas equivale a

dei
= Ωei ≡ ω × ei .
dt
La cinemática se corresponde con una rotación instantánea alrededor de un eje en la dirección
de ω .
Si expresamos las rotaciones en términos del vector α = αu, que representa el ángulo total
girado por el sistema, entonces la velocidad angular se expresa:
dα du du
ω=u + sin α + (1 − cos α)u × . (2.220)
dt dt dt
2.8. APÉNDICE: GRUPO DE ROTACIONES SO(3) 149

Ejercicio. Demostrar que si utilizamos como parametrización de la orientación el vector ρ =


tan(α/2)n, siendo n el vector unidad a lo largo del eje de giro y α el ángulo girado resulta que

2 2
ω= (ρ̇ + ρ × ρ̇), w = RT (ρ)ω = (ρ̇ − ρ × ρ̇).
1 + ρ2 1 + ρ2
siendo w el vector velocidad angular referido a los ejes del cuerpo.

Si en (2.219) derivamos ambos miembros con respecto a t′ , sabiendo que ∂t/∂t′ = 1, resulta

Ṙ(α′ (t′ )) = R(µ)Ṙ(α(t))

y tomando la traspuesta de (2.219)

RT (α′ (t′ )) = RT (α(t))RT (µ)

por lo que entre observadores las matrices Ω transforman

Ω′ (t′ ) = Ṙ(α′ (t′ ))RT (α′ (t′ )) = R(µ)Ṙ(α(t))RT (α(t))RT (µ) = R(µ) Ω(t) RT (µ)

que corresponde a la forma de transformar de un tensor con dos índices, y que para sus com-
ponentes esenciales se reduce a
ω ′ (t′ ) = R(µ)ω(t).
De la expresión (2.214) obtenemos que en la representación de las rotaciones en términos
del parámetro ρ, los ejes ligados al cuerpo ek poseen por componentes
1
(ek )i = [(1 − ρ2 ) δik + 2ρi ρk + 2εijk ρj ]. (2.221)
1 + ρ2

2.8.4. Dinámica de la rotación


Si quiero hacer una descripción Lagrangiana de un cuerpo con orientación α, como el grupo
de rotaciones no posee extensiones centrales, y las ecuaciones de la dinámica deben ser indepen-
dientes de los observadores inerciales, es decir deben ser invariantes bajo los cambios de sistemas
de referencia Galileanos, entonces la Lagrangiana debe ser una función invariante L(α, α̇), de
las variables que utilicemos para describir su orientación α y de sus derivadas temporales α̇,
lo que nos lleva a que su expresión general es una función arbitraria de las componentes de la
velocidad angular ωi , L(ωi ). De esta forma, las ecuaciones de Euler-Lagrange que se deducen
de ella son ( ) ( )
∂L d ∂L ∂L ∂ωj d ∂L ∂ωj
− = − = 0,
∂αi dt ∂ α̇i ∂ωj ∂αi dt ∂ωj ∂ α̇i
Si llamamos Wj = ∂L/∂ωj , se propone al lector (es relativamente más sencillo en la parametri-
zación ρ) que demuestre que las anteriores ecuaciones conducen a
dW ∂L
= ω × W, Wi = .
dt ∂ωi
Las componentes del momento angular con respecto a los ejes del cuerpo son constantes del
movimiento. En efecto, llamemos Ti = W · ei . Su derivada temporal
dTi dW dei
= · ei + W · = (ω × W ) · ei + W · (ω × ei ) = 0.
dt dt dt
En el caso de una partícula elemental, si fuese un sólido rígido y su espín es una constante
del movimiento, entonces necesariamente W ∼ ω y la expresión de la Lagrangiana debe ser una
función arbitraria de la ω 2 . Un caso simple corresponde a
1
L = Iω 2
2
150 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

que corresponde a un objeto con simetría de inercia esférica, es decir con los tres momentos
principales de inercia iguales y cuyo momento angular S = W = Iω . Como observación, un
objeto con los tres momentos principales de inercia iguales, no es necesariamente de forma
esférica, como sucede, por ejemplo, con un cubo. En el caso de que los momentos principales
fueran diferentes
1
L = (I1 ω12 + I2 ω22 + I3 ω32 ),
2
las ecuaciones de Euler-Lagrange se escriben, con Si = Ii ωi , (sin sumar sobre i)

dω1 dω2 dω3


I1 = (I3 − I2 )ω2 ω3 , I2 = (I1 − I3 )ω3 ω1 , I3 = (I2 − I1 )ω1 ω2 .
dt dt dt
La componente ω1 será una constante del movimiento si I3 = I2 , y el mismo tipo de criterio
para las demás.
2.9. APÉNDICE: GRUPO DE GALILEO G 151

2.9. Apéndice: Grupo de Galileo G


El grupo de Galileo es el grupo de transformaciones del espacio-tiempo caracterizadas por
los diez parámetros g ≡ (b, a, v, α). La acción de g sobre un punto del espacio-tiempo x ≡ (t, r)
viene dada por x′ = gx, y la vamos a considerar hecha de la siguiente forma:

x′ = exp(bH) exp(a · P ) exp(v · K) exp(α · J ) x

como la acción de una rotación, seguida de una transformación Galileana pura y nalmente
una traslación espacial y temporal. De esta forma, todos los parámetros que denen cada sub-
grupo uniparamétrico son parámetros normales, y se puede utilizar la aplicación exponencial.
Explícitamente,

t′ = t + b, (2.222)

r = R(α)r + vt + a, (2.223)

y la ley de composición del grupo g ′′ = g ′ g es:

b′′ = b′ + b, (2.224)
′′ ′ ′ ′
a = R(α )a + v b + a , (2.225)
′′ ′ ′
v = R(α )v + v , (2.226)
′′ ′
R(α ) = R(α )R(α). (2.227)

Para las rotaciones vamos a usar dos parametrizaciones diferentes. Una es la normal o
canónica en términos del vector α = αn, donde n es un vector unidad a lo largo del eje
de rotación, y el ángulo girado α ∈ [0, π] en radianes, se interpreta como positivo si tiene la
orientación de las agujas de un reloj, cuando miramos en la dirección que marca el vector n.
Otra parametrización, que tiene ventajas algebraicas, es expresar cada rotación por el vector
µ = n tan(α/2), con α y n como en el caso anterior.
La matriz de rotación R(α) = exp(α · J ) se expresa en términos de los parámetros normales
αi y de la representación matricial de los generadores Ji , que aparecen como
     
0 0 0 0 0 1 0 −1 0
J1 =  0 0 −1  , J2 =  0 0 0  , J3 =  1 0 0  ,
0 1 0 −1 0 0 0 0 0

y satisfacen las reglas de conmutación [Ji , Jk ] = ϵikl Jl , de tal manera que si denimos el vector
α = αn, se puede poner, en la representación activa,

R(α)ij = δij cos α + ni nj (1 − cos α) − ϵijk nk sin α, i, j, k = 1, 2, 3. (2.228)

En la parametrización µ = n tan(α/2), la matriz de rotación es


1 ( )
R(µ)ij = 2
(1 − µ2 )δij + 2µi µj − 2ϵijk µk , i, j, k = 1, 2, 3. (2.229)
1+µ
En esta parametrización es especialmente sencilla la ley de composición de rotaciones, y la
rotación compuesta R(µ′′ ) = R(µ′ )R(µ) es equivalente a

µ′ + µ + µ′ × µ
µ′′ = . (activa) (2.230)
1 − µ′ · µ
Esto se puede ver de forma sencilla usando el homomorsmo entre el grupo de rotaciones y el
grupo unitario SU (2). Los generadores matriciales de SU (2) son J = −iσ/2 en términos de las
152 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

matrices de Pauli σ , y en la representación activa verican las mismas reglas de conmutación


[Ji , Jk ] = ϵikl Jl . En la parametrización normal una matriz de SU (2), se puede poner en la forma
exp(α · J ) = exp(−iα · σ/2),

R(α) = cos(α/2)I − i(n · σ) sin(α/2).

Si denimos µ = n tan(α/2), en esta parametrización la matriz anterior queda

1
R(µ) = √ (I − iµ · σ) , (2.231)
1 + µ2

donde I es la matriz unidad 2 × 2, y a partir de esta representación, multiplicando matrices,


podemos encontrar la ley de composición (2.230) 17 .

Si la rotación es de valor π, entonces las ecuaciones (2.228) o (2.229) conducen a

R(n, π)ij = −δij + 2ni nj .

Si las dos rotaciones R(µ) y R(µ′ ) que aparecen en (2.230) fueran de valor π , aunque tan(π/2) = ∞,
esta expresión no es singular sino que posee como límite:

n × n′
n′′ tan(α′′ /2) = .
n · n′
′′ ′′
El valor absoluto de esta relación implica que tan(α /2) = tan θ , es decir, α = 2θ , donde θ es

el ángulo entre los dos vectores unidad n y n . Obtenemos el resultado conocido de que cualquier
rotación de valor α alrededor de un eje caracterizado por el vector unidad n puede obtenerse por
la composición de dos rotaciones de valor π alrededor de dos ejes perpendiculares a n y separados
por un ángulo α/2.

Como toda transformación Galileana la vamos a considerar un cambio de sistema de refe-


rencia, es necesario que para las rotaciones utilicemos la representación pasiva, tanto para la
modicación de las variables r y u como de las variables de orientación ρ. La diferencia entre
la representación activa y la pasiva corresponde a un simple cambio de signo en el parámetro,
o bien cambiar los generadores por sus opuestos. De esta forma, las reglas de conmutación de
los generadores son las opuestas y la ley de composición de las rotaciones en la representación
pasiva queda:
µ′ + µ − µ′ × µ
µ′′ = . (pasiva) (2.232)
1 − µ′ · µ
Vamos a usar como notación para las variables de orientación las primeras letras griegas, α, β, . . .
cuando utilicemos la parametrización normal, mientras que en la parametrización tan(α/2) usa-
remos letras griegas intermedias µ, ν, ρ, . . . . En esta notación, las ecuaciones de transformación
(2.224-2.227) deben ser reemplazadas por

b′′ = b′ + b, (2.233)
′′ ′ ′ ′
a = R(µ )a + v b + a , (2.234)
′′ ′ ′
v = R(µ )v + v , (2.235)
µ′ + µ − µ′ × µ
µ′′ = . (2.236)
1 − µ′ · µ

El elemento neutro del grupo de Galileo es el (0, 0, 0, 0) y el inverso de todo elemento es

(b, a, v, α)−1 = (−b, −R(−α)(a − bv), −R(−α)v, −α).


17
D. Hestenes, Space-time algebra, Gordon and Breach, NY (1966).
2.9. APÉNDICE: GRUPO DE GALILEO G 153

Los generadores del grupo en la realización (2.222, 2.223) son los operadores diferenciales

H = ∂/∂t, Pi = ∂/∂ri , Ki = t∂/∂ri , Jk = εkli rl ∂/∂ri (2.237)

y las reglas de conmutación del álgebra de Lie del grupo de Galileo en la representación pasiva
son
[J , J ] = −J , [J , P ] = −P , [J , K] = −K, [J , H] = 0, (2.238)
[H, P ] = 0, [H, K] = P , [P , P ] = 0, [K, K] = 0, [K, P ] = 0. (2.239)
Salvo que se indique de forma expresa, vamos a utilizar en estas notas, una notación abreviada
para los conmutadores de los diferentes operadores, considerados como escalares y trivectores,
que los representaremos en caracteres en negrita:

[A, B] = C, =⇒ [Ai , Bj ] = ϵijk Ck ,


[A, B] = C, =⇒ [Ai , Bj ] = δij C,
[A, B] = C, =⇒ [Ai , B] = Ci ,
[B, A] = C, =⇒ [B, Ai ] = Ci ,

donde δij = δji es la delta de Kronecker y ϵijk es el tensor completamente antisimétrico, de tal
forma que los índices latinos casen a ambos lados de los conmutadores.
La acción del grupo (2.222)-(2.223) representa la relación que existe entre las medidas de
las coordenadas (t, r) de un cierto acontecimiento espacio-temporal medido por un observador
inercial O y las correspondientes coordenadas (t′ , r ′ ) del mismo acontecimiento medidas por
otro observador inercial O′ . Los diez parámetros del grupo tienen el siguiente signicado: Si
consideramos el acontecimiento de coordenadas (0, 0) medidas por O, por ejemplo la emisión
de un haz de fotones desde su origen cuando su reloj marca t = 0, para O′ valen (b, a), donde
b es el parámetro que representa la traslación temporal y a la traslación espacial. El parámetro
v , con dimensiones de velocidad, representa la velocidad del origen del sistema cartesiano de O
medido por O′ , y nalmente los parámetros α, o R(α), representan la orientación del sistema
cartesiano de O medido por O′ . Los diez parámetros (b, a, v, α) representan la descripción del
sistema cartesiano de O, medido por O′ .
El grupo de Galileo posee exponentes no triviales dados por 18
( )
′ 1 2 ′ ′
ξ(g, g ) = m v b + v · R(α)a . (2.240)
2
Están caracterizados por el parámetro no nulo m.
La extensión central del grupo de Galileo 19 es un grupo de 11 parámetros con un generador
adicional I que conmuta con todos los otros diez

[I, H] = [I, P ] = [I, K] = [I, J ] = 0, (2.241)

y el resto de las reglas de conmutación son las mismas del propio grupo de Galileo (2.238, 2.239),
salvo la última que queda

[Ki , Pj ] = −mδij I, o [K, P ] = −mI, (2.242)

habiendo usado nuestra notación abreviada, y en términos del parámetro no nulo m. Si denimos
los siguientes operadores, funciones polinómicas de los generadores del álgebra de Lie,
1 1 2
W = IJ − K × P, U = IH − P , (2.243)
m 2m
18
V. Bargmann, On unitary ray representations of continuous groups, Ann. Math. 5, 1 (1954).
19
J.M. Levy-Leblond, Galilei Group and Galilean Invariance, in E.M. Loebl,Group Theory and its applica-
tions, Acad. Press, NY (1971), vol. 2, p. 221.
154 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

vemos que U conmuta con todos los generadores del grupo de Galileo extendido, y el W satisface
las reglas de conmutation:

[W , W ] = −IW , [J , W ] = −W , [W , P ] = [W , K] = [W , H] = 0.

De esta forma, W 2 también conmuta con todos los generadores. Resulta que el grupo de Galileo
extendido posee tres operadores de Casimir funcionalmente independientes. En aquellas repre-
sentaciones en las que el operador I resulte ser un múltiplo del operador unidad, por ejemplo en
las representaciones irreducibles, esos tres invariantes se interpretan como la masa, M = mI , la
energía interna H0 = H − P 2 /2m, y el valor absoluto del espín.
( )2
1
S = J − K ×P .
2
(2.244)
m

El operador espín S en aquellas representaciones en las que I = I, satisface las reglas deconmu-
tación:
[S, S] = −S, [J , S] = −S, [S, P ] = [S, H] = [S, K] = 0,
es decir, es un operador momento angular, transforma como un vector bajo rotaciones y es inva-
riante bajo traslaciones y transformaciones de Galileo puras, respectivamente. Queda reducido
al operador momento angular total J en aquellos sistemas de referencia en los que P = K = 0,
es decir, para los observadores del centro de masa.
2.10. APÉNDICE: GRUPO DE POINCARÉ P 155

2.10. Apéndice: Grupo de Poincaré P


El grupo de Poincaré es el grupo de transformaciones del espacio-tiempo de Minkows-
ki, que dejan invariante a la separación espacio-temporal entre dos acontecimientos próximos
ds2 = ηµν dxµ dxν = c2 dt2 − dr 2 . Consideremos un punto del espacio tiempo de componentes
contravariantes xµ ≡ (ct, r), y x′ = gx se expresa como x′ µ = Λµ ν xν + aµ , en términos de una
matriz constante 4 × 4, Λ y de un tetravector constante de traslación aµ ≡ (cb, a). Las compo-
nentes covariantes del tensor métrico del espacio de Minkowski son ηµν ≡ diag(1, −1, −1, −1).
Entonces dx′ µ = Λµ ν dxν y ds2 = ηµν dx′ µ dx′ ν = ησρ dxσ dxρ implica que la matriz constante Λ,
debe satisfacer
ηµν Λµ σ Λν ρ = ησρ . (2.245)
Las relaciones (2.245) representan diez condiciones entre las 16 componentes de la matriz Λ, de
tal manera que de las 16 componentes solamente seis son parámetros esenciales. En estas notas,
tres de esos parámetros representan la velocidad relativa v entre observadores inerciales y las
otras tres la orientación relativa α de sus ejes espaciales cartesianos, que lo expresaremos en
cualquiera de las parametrizaciones del grupo de rotaciones, como en el caso Galileano.
Entonces, todo elemento del grupo de Poincaré P , se representará, como en el caso Galileano,
por los diez parámetros g ≡ (b, a, v, α) y la acción del grupo sobre un punto del espacio-tiempo
x ≡ (t, r) se va a interpretar de la misma manera, es decir, x′ = gx:
x′ = exp(bH) exp(a · P ) exp(β · K) exp(α · J )x, (2.246)
como la acción de una rotación exp(α · J ), seguida de un boost Lorentziano exp(β · K), o
transformación de Lorentz pura, y nalmente una traslación espacial exp(a · P ) y temporal
exp(bH). Viene explícitamente dado por:
t′ = γt + γ(v · R(α)r)/c2 + b, (2.247)

r = R(α)r + γvt + γ (v · R(α)r)v/(1 + γ)c + a.
2 2
(2.248)
El parámetro β en (2.246) es el parámetro normal de las transformaciones de Lorentz puras
(boosts), el cual se expresa en términos de la velocidad relativa entre observadores v como
β/β tanh β = v/c, como veremos. Las dimensiones y dominios de los parámetros b, a y α son
las mismas que en el caso del grupo de Galileo, y para las rotaciones utilizaremos también el
parámetro µ. El parámetro v ∈ R3 , posee por límite superior v < c, tiene también dimensiones
de velocidad. El signicado físico de estos diez parámetros, es exactamente el mismo que en el
caso Galileano. El parámetro v es la velocidad del observador O, medida por O′ , y R(α) o bien
R(µ) representa la orientación del sistema cartesiano de O relativa a O′ , una vez que O′ ha sido
lanzado con velocidad v . El factor γ(v) = (1 − v 2 /c2 )−1/2 .
La ley de composición del grupo de Poincaré se obtiene a partir de la composición x′′ =
Λ x + a′ = Λ′ (Λx + a) + a′ que identicando con x′′ = Λ′′ x + a′′ se reduce a Λ′′ = Λ′ Λ y
′ ′

a′′ = Λ′ a + a′ , es decir, la ley de composición de las transformaciones de Lorentz, que la veremos


en la sección siguiente, 2.10.1, y una transformación Poincaré (Λ′ , a′ ) del tetravector aµ . En esta
parametrización g ′′ = g ′ g , resulta ser: 20
′′
b = γ ′ b + γ ′ (v ′ · R(µ′ )a)/c2 + b′ , (2.249)
′2
′′ γ
a = R(µ′ )a + γ ′ v ′ b + (v ′ · R(µ′ )a)v ′ + a′ , (2.250)
(1 + γ ′ )c2

γ2
R(µ′ )v + γ ′ v ′ + (v ′ · R(µ′ )v)v ′
′′ (1 + γ ′ )c2
v = , (2.251)
γ ′ (1 + v ′ · R(µ′ ) v/c2 )
20
M.Rivas, M.Valle and J.M.Aguirregabiria, Composition law and contractions of the Poincaré group, Eur.
J. Phys. 6, 128 (1986).
156 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

′′ µ′ + µ − µ′ × µ + F (v ′ , µ′ , v, µ)
µ = , (2.252)
1 − µ′ · µ + G(v ′ , µ′ , v, µ)

donde F (v ′ , µ′ , v, µ) y G(v ′ , µ′ , v, µ) son las funciones reales:

γγ ′ [
F (v ′ , µ′ , v, µ) = v × v ′ + v(v ′ · µ′ ) + v ′ (v · µ)
(1 + γ)(1 + γ ′ )c2
+ v × (v ′ × µ′ ) + (v × µ) × v ′ + (v · µ)(v ′ × µ′ )
]
+ (v × µ)(v ′ · µ′ ) + (v × µ) × (v ′ × µ′ ) , (2.253)

γγ ′ [
G(v ′ , µ′ , v, µ) = v · v ′ + v · (v ′ × µ′ ) + v ′ · (v × µ)
(1 + γ)(1 + γ ′ )c2
]
− (v · µ)(v ′ · µ′ ) + (v × µ) · (v ′ × µ′ ) . (2.254)

El elemento unidad del grupo es (0, 0, 0, 0) y el inverso de cualquier elemento (b, a, v, µ) es

γ2
(−γb + γv · a/c2 , −R(−µ)(a − γvb + (v · a)v), −R(−µ)v, −µ).
(1 + γ)c2
Los generadores del grupo en la realización (2.247, 2.248), y en términos de los parámetros
normales (b, a, β, α), son

H = ∂/∂t, Pi = ∂/∂ri , Ki = ct∂/∂ri + (ri /c)∂/∂t, Jk = εkli rl ∂/∂ri .

Por lo tanto, K y J son adimensionales y las reglas de conmutación resultan

[J , J ] = −J , [J , P ] = −P , [J , K] = −K, [J , H] = 0, [H, P ] = 0, (2.255)

[H, K] = cP , [P , P ] = 0, [K, K] = J , [K, P ] = −H/c. (2.256)


Si, como es habitual, llamamos = ct, x0= H/c, p0= Pi , Ki = J0i = −Ji0 y Jk =
pi
− 21 ϵklr Jlr ,
xµ = ηµν x , µ = 0, 1, 2, 3 y ∂ν ≡ ∂/∂x , ∂σ xν = ηνσ , entonces,
ν ν

pµ = ∂µ , Jµν = −Jνµ = xµ ∂ν − xν ∂µ .

En notación covariante las reglas de conmutación aparecen como:

[pµ , pν ] = 0,
[Jµν , pσ ] = −ηµσ pν + ηνσ pµ ,
[Jµν , Jρσ ] = −ηµρ Jνσ − ηνσ Jµρ + ηνρ Jµσ + ηµσ Jνρ .

El grupo de Poincaré tiene dos operadores de Casimir funcionalmente independientes. Uno


se interpreta como el cuadrado de la masa del sistema,

pµ pµ = (H/c)2 − P 2 = m2 c2 , (2.257)

y el otro es el cuadrado del tetravector de Pauli-Lubanski, wµ , denido mediante


1
wµ = εµνσλ pν Jσλ ≡ (P · J , HJ /c − K × P ) ≡ (P · S CM , HS CM /c), (2.258)
2
en términos de generadores que para la partícula libre serán constantes del movimiento, y el
cual es por construcción ortogonal a pµ , es decir, wµ pµ = 0.
Se relaciona con el espín con respecto al centro de masa S CM , a través de la relación:

S CM = J − q × P , HS CM /c = HJ /c − K × P , (2.259)
2.10. APÉNDICE: GRUPO DE POINCARÉ P 157

habiendo reescrito K = Hq/c − P t, de manera que su componente temporal w0 = P · S =


P · J = P · S CM , representará la helicidad de la partícula, y la parte espacial es el vector (6.44).
De esta forma, el otro operador de Casimir es

wµ wµ = (P · J )2 − (HJ /c − K × P )2 = (P · S CM )2 − H 2 S 2CM /c2 = −m2 c2 SCM


2
, (2.260)

el cual depende del valor SCM


2 , el valor absoluto al cuadrado del espín con respecto al centro

de masa, y de la masa de la partícula. Vemos que en el caso relativista, los dos parámetros
m y SCM son las propiedades intrínsecas de toda partícula elemental. En el caso cuántico,
las representaciones deben ser irreducibles, y SCM
2 = s(s + 1)~2 , para todo s = 0, 1/2, 1, . . .,
dependiendo del valor cuántico del espín de la partícula, pero en el caso clásico, el valor SCM
2

puede tomar cualquier valor.


Los operadores wµ satisfacen las reglas de conmutación:

[wµ , wν ] = ϵµνσρ wσ pρ , (2.261)

habiendo tomado el tensor ϵ0123 = +1, y

[pµ , wν ] = 0, [Jµν , wσ ] = −ηµσ wν + ηνσ wµ . (2.262)

El grupo de Poincaré no posee exponentes, de tal manera que las funciones gauge sobre sus
espacios homogéneos son nulas. Las Lagrangianas de los sistemas mecánicos cuyos espacios
cinemáticos sean espacios homogéneos de P , pueden tomarse estrictamente invariantes.
158 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

2.10.1. Grupo de Lorentz L


El grupo de Lorentz L es el subgrupo de P de transformaciones de la forma: (0, 0, v, µ),
y toda transformación de Lorentz Λ(v, µ) se va a interpretar siempre en la forma Λ(v, µ) =
L(v)R(µ), como se ha mencionado anteriormente, donde L(v) es un boost o transformación de
Lorentz pura y R(µ) una rotación espacial. Las expresiones (2.251, 2.252) vienen de Λ(v ′′ , µ′′ ) =
Λ(v ′ , µ′ )Λ(v, µ). La expresión (2.251) es la composición relativista de velocidades, ya que

L(v ′′ )R(µ′′ ) = L(v ′ )R(µ′ )L(v)R(µ)


{ }
= L(v ′ ) R(µ′ )L(v)R(−µ′ ) R(µ′ )R(µ),

pero el conjugado de un boost de velocidad v mediante una rotación R(µ′ )L(v)R(−µ′ ) =


L(R(µ′ )v) es otro boost de velocidad rotada R(µ′ )v

L(v ′′ )R(µ′′ ) = L(v ′ )L(R(µ′ )v)R(µ′ )R(µ).

El producto L(v ′ )L(R(µ′ )v) = L(v ′′ )R(w) donde v ′′ es la composición relativista de las velo-
cidades v ′ y R(µ′ )v , y R(w) es la rotación de Thomas-Wigner asociada a los boosts L(v ′ ) y
L(R(µ′ )v).
Por lo tanto, la expresión (2.251) es equivalente a

L(v ′′ ) = L(v ′ )L(R(µ′ )v)R(−w), (2.263)

y (2.252) es
R(µ′′ ) = R(w)R(µ′ )R(µ) ≡ R(ϕ)R(µ). (2.264)
La matriz de rotación de Thomas-Wigner, R(w) es:
( ( ) ( )
1 γ′2 1 − γ ′ ′ γ2 1 − γ′ ′ ′
R(w)ij = δij + vi vj + 2 Rik vk Rjl vl
1 + γ ′′ c2 1 + γ ′ c 1+γ
)
γ′γ 2γ ′ 2 γ 2 (vk′ Rkl
′ v)
+ 2 (vi′ Rjk

vk − vj′ Rik

v ′ R ′ vk
l
vk ) + ,
c (1 + γ ′ )(1 + γ)c2 i jk
y el factor ( )
′′ ′ v ′ · R(µ)v
γ =γ γ 1+ .
c2
La matriz R(w) se escribe en términos del parámetro vectorial w, el cual es función de v ′ , µ′
y v , dada por
F (v ′ , 0, R(µ′ )v, 0)
w= , (2.265)
1 + G(v ′ , 0, R(µ′ )v, 0)
y el parámetro ϕ, tal que R(ϕ) = R(w)R(µ′ ) es

µ′ + F (v ′ , µ′ , v, 0)
ϕ= . (2.266)
1 + G(v ′ , µ′ , v, 0)

Si cualquiera de las dos velocidades v o v ′ se anulara, R(w)ij = δij .


La ley de composición del grupo de Lorentz se obtiene del homomorsmo entre el grupo de
Lorentz L y el grupo SL(2, C) de matrices 2 × 2 complejas, de determinante +1. El álgebra de
Lie del grupo, posee por generadores J = −iσ/2 and K = σ/2, donde σi son las matrices de
Pauli, que satisfacen:

[J , J ] = −J , [J , K] = −K, [K, K] = J .
2.10. APÉNDICE: GRUPO DE POINCARÉ P 159

Una rotación de ángulo α alrededor de un eje caracterizado por el vector unidad n está dada
por la matriz unitaria 2 × 2, exp(α · J ),

R(α) = cos(α/2)σ0 − in · σ sin(α/2). (2.267)

En términos del vector µ = tan(α/2)n,


1
R(µ) = √ (σ0 − iµ · σ), (2.268)
1 + µ2

donde σ0 es la matriz unidad 2 × 2.


Una transformación de Lorentz pura de parámetros normales βi , se representa por la matriz
hermítica exp(β · K). Esta matriz es:
σ·β
L(β) = cosh(β/2)σ0 + sinh(β/2). (2.269)
β
En términos del parámetro velocidad, teniendo en cuenta las relaciones
√ entre ambos cosh β =
γ(v), sinh β = γv/c y las relaciones trigonométricas cosh(β/2) = (cosh β + 1)/2 y tanh(β/2) =
sinh β/(1 + cosh β), la matriz se puede reescribir como
√ ( )
1+γ γ σ·v
L(v) = σ0 + . (2.270)
2 1+γ c

Así, todo elemento de SL(2, C) queda parametrizado por seis números reales (v, µ), y lo
interpretamos en la forma
A(v, µ) = L(v)R(µ). (2.271)
Toda matriz compleja 2 × 2 de determinante unidad, A ∈ SL(2, C) puede ser escrita en
términos de un tetravector complejo aµ y de las cuatro matrices de Pauli σµ . Si ponemos
A = aµ σµ , como detA = 1 nos lleva a aµ aµ = 1 o (a0 )2 − a2 = 1. La forma general de (2.271) es
√ [ ( ) ( )]
1+γ µ·u u+u×µ
A(v, µ) = σ0 1 − i +σ· − iµ , (2.272)
2(1 + µ2 ) 1+γ 1+γ

done el vector adimensional u = γ(v)v/c.


Recíprocamente, como Tr (σµ σν ) = 2δµν , obtenemos aµ = (1/2)Tr (Aσµ ). Si expresamos
(2.272) en la forma A(v, µ) = aµ σµ podemos determinar µ y v , y por lo tanto u, a partir de
las componentes del tetravector complejo aµ como:
Im (a)
µ = − , (2.273)
Re (a0 )
[ ]
u = 2 Re (a0 )Re (a) + Im (a0 )Im (a) + Re (a) × Im (a) , (2.274)

done Re (aµ ) y Im (aµ ) son la parte real e imaginaria de las correspondientes componentes del
tetravector aµ . Cuando Re (a0 ) = 0 la expresión (2.273) está denida y representa una rotación
de valor π alrededor de un eje en la dirección del vector Im (a).
Si representamos toda transformación de Lorentz en términos de un boost seguido de una
rotación, es decir en la forma contraria, Λ(v, µ) = R(µ)L(v), entonces la expresión general de
A es la misma que en (2.272) pero con un cambio de signo en el producto vectorial u × µ. Por
lo tanto, la descomposición es también única. La rotación R(µ) es la misma que antes pero el
boost viene expresado en términos de las variables aµ por
[ ]
u = 2 Re (a0 )Re (a) + Im (a0 )Im (a) + Im (a) × Re (a) .
160 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN

Obsérvese la diferencia en el tercer término el cual es el opuesto cuando se compara con (2.274).
En la representación matricial 4 × 4 del grupo de Lorentz sobre el espacio-tiempo de Min-
kowski, un boost se expresa como L(β) = exp(β · K) en términos de los parámetros normales
y adimensionales βi y de los generadores de los boosts Ki , dados por las matrices 4 × 4,
     
0 1 0 0 0 0 1 0 0 0 0 1
1 0 0 0    
K1 =   , K2 =  0 0 0 0  , K 3 =  0 0 0 0  .
0 0 0 0 1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 1 0 0 0

Si llamamos B = β · K ≡ i βi Ki , tenemos
   2 
0 β1 β2 β3 β 0 0 0
 β1 0 0 0   0 β1 β1 β1 β2 β1 β3 
B=  2 
 β2 0 0 0  , B =  0 β2 β1 β2 β2 β2 β3  ,

β3 0 0 0 0 β3 β1 β3 β2 β3 β3
con β 2 = β12 + β22 + β32 y B 3 = β 2 B , de tal manera que las demás potencias de B se pueden
expresar en términos de éstas, obtenemos que la expresión nal de L(β) = exp(β · K) es
1 1 1 1 1 1 1
exp(β · K) = exp(B) = I + B + B2 + B3 + · · · = I + B + B2 + β2B + β2B2 + · · ·
1! 2! 3! 1! 2! 3! 4!
que sumando componente a componente, converge a
 
C (β1 /β)S (β2 /β)S (β3 /β)S
 (β /β)S 1 + β1 β1 (C − 1) β1 β2 β1 β3 
 1 2 2 (C − 1) 2 (C − 1) 
 β β β 
 β2 β1 β2 β2 β2 β3 
 (β2 /β)S (C − 1) 1 + (C − 1) (C − 1) 
 β 2
β 2
β 2 
 
β3 β1 β3 β2 β3 β3
(β3 /β)S (C − 1) (C − 1) 1 + (C − 1)
β2 β2 β2
donde se ha abreviado S = sinh β y C = cosh β .
¾Cuál es el signicado físico de los parámetros normales βi ? Supongamos dos observadores
O y O′ que relacionan sus medidas espacio-temporales x y x′ mediante x′ µ = L(β)µ ν xν . El
observador O emite en el instante t y en el instante posterior t + dt dos señales luminosas desde
el origen de su sistema cartesiano de referencia. Estas dos señales medidas por O′ tienen lugar
en los puntos r ′ y r ′ + dr ′ y en los instantes t′ y t′ + dt′ , respectivamente. Están dadas por
cdt′ = L0 0 cdt, dx′ = Li 0 cdt
i

ya que para O, dxi = 0. El cociente dx′ i /dt′ es precisamente la velocidad de la fuente emisora
v i , es decir la velocidad del origen del sistema de referencia de O medido por O′ . Esta velocidad
es v i = cLi 0 /L0 0 = c(βi /β)S/C , de tal manera que la relación entre los parámetros normales y
las componentes de la velocidad relativa entre observadores es
v β sinh2 β cosh2 β − 1 1
= tanh β, tanh2 β = = , = 1 − tanh2 β
c β cosh2 β cosh2 β cosh2 β
por lo que tanh β = v/c. La función cosh β ≡ γ(v) = (1 − v 2 /c2 )−1/2 y cuando la transformación
la expresamos en términos del parámetro velocidad toma la forma de la matriz simétrica
 
γ γvx /c γvy /c γvz /c
 2 2 vx vy γ 2 vx vz γ 2 
 γvx /c 1 + v2x γ 
 c γ + 1 c 2 γ+1
c 2 γ+1 
 
L(v) =  vy vx γ 2 vy2 γ 2 vy vz γ 2  . (2.275)
 γvy /c 1 + 
 c γ+1
2
c γ+1
2
c γ+1 
2
 
v z v x γ 2 v z v y γ 2 vz2 γ 2
γvz /c 1+ 2 γ+1
c2 γ + 1 c2 γ + 1 c
2.10. APÉNDICE: GRUPO DE POINCARÉ P 161

La transformación inversa es L−1 (v) = L(−v). Una matriz de rotación en la forma 4×4 aparece
escrita por bloques como ( )
1 0T
R(µ) = e , (2.276)
0 R(µ)
e
donde R(µ) es la matriz ortogonal 3 × 3 dada en (2.228). Podemos dar también una represen-
tación matricial de este tipo a los boosts Lorentzianos (2.275) en la forma
( )
γ γv T /c
L(v) = γ2 , (2.277)
γv/c I3 + (1+γ)c 2 vv
T

donde v T es el vector la transpuesto del vector columna tridimensional v , y I3 la matriz unidad
3 × 3. De esta forma, la componente de la matriz 3 × 3, (vv T )ij = vi vj . Es fácil ver en esta
representación que la transformación conjugada

R(µ)L(v)R(µ)−1 = L(R(µ)v).

En efecto ( )
γ γv T /c
R(µ)L(v) = γ2 ,
γR(µ)v/c R(µ) + (1+γ)c2
(R(µ)v)v T
y al actuar por la derecha con R(µ)−1 = R(µ)T , nos queda
( )
γ (R(µ)v)T /c
γ 2 = L(R(µ)v).
γR(µ)v/c I3 + (1+γ)c 2 (R(µ)v)(R(µ)v)
T

Cuando la transformación general de Lorentz se expresa en la forma Λ(v, µ) = L(v)R(µ),


entonces por construcción, la primera columna de Λ(v, µ) es precisamente la primera columna
de (2.275) donde están denidos los parámetros de velocidad v . Por lo tanto, a partir de una
transformación de Lorentz general Λ(v, µ), su primera columna nos suministra los valores de
los parámetros v y se puede construir la transformación L(v). Para calcular la rotación que
está contenida en ella, basta hacer L(−v)Λ(v, µ) = R(µ). Si se expresase en sentido contrario
Λ(v, µ) = R(µ)L(v), entonces es la primera la de Λ la que coincide con la primera la de
(2.275). En este caso cualquier transformación general de Lorentz Λ(v, µ), se puede siempre
escribir de forma única mediante las dos expresiones Λ(v, µ) = L(v)R(µ) = R(µ)L(v ′ ) donde
la rotación es la misma en ambos términos (2.273) y L(v ′ ) = R(−µ)L(v)R(µ) = L(R(−µ)v),
es decir, la velocidad v ′ = R(−µ)v es la rotada de la v .
La matriz Λ puede ser considerada como una tetrada, es decir, un conjunto de cuatro te-
travectores ortonormales, uno de ellos de carácter temporal (de norma +1) y los otros tres de
carácter espacial (de norma −1) asociados al observador inercial O por el observador O′ . De he-
cho, si la transformación la consideramos compuesta en la forma Λ(v, µ) = L(v)R(µ), entonces
la primera columna de Λ es precisamente la tetravelocidad del origen del sistema cartesiano de
O y las otras tres columnas son los tres vectores unidad del sistema de referencia de O, rotados
con la rotación R(µ) y luego 'boosteados' con la matriz L(v).
162 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
Capítulo 3

Cuantización de los modelos

La cuantización de los sistemas Lagrangianos generalizados conduce a que las funciones de


onda que describen los estados cuánticos de cualquier sistema mecánico y en particular de las
partículas elementales, deben ser funciones complejas, de cuadrado integrable, Φ(x), denidas
sobre todo el espacio cinemático X .
Vamos a usar el método de Feynman de cuantización, para encontrar cómo es la función de
onda de una partícula elemental y ver cómo transforma bajo el grupo cinemático. Una vez que
hayamos encontrado cómo es el espacio de Hilbert de los estados puros, encontraremos cómo se
representan los generadores de las transformaciones cinemáticas, como operadores autoadjuntos.
El resto del análisis se realiza por los medios habituales de la mecánica cuántica, es decir,
clasicando los estados mediante la correspondiente elección del adecuado conjunto completo
de observables que conmutan. Haremos especial énfasis en la estructura del operador de espín,
que aparece como un operador diferencial que deriva a la función de onda con respecto a las
variables cinemáticas compactas. Su estructura cuántica nos recuerda a su estructura clásica,
por lo que podremos plantear una especie de `receta' de correspondencia, entre los observables
clásicos y cuánticos.
La estructura del espín depende de las variables cinemáticas y de cómo éstas transforman
bajo rotaciones. Puesto que estas variables son la velocidad u y la orientación α, tanto en
el caso relativista como en el no relativista, la estructura del operador espín es la misma en
ambos formalismos. En realidad, el operador espín depende solamente de la parte compacta de
la variable velocidad u, que es su dirección, dada por los dos ángulos cenital θ y acimutal ϕ, y
sobre las tres variables que caracterizan a la orientación del sistema cartesiano local asociado al
punto, por lo que serán operadores diferenciales con respecto a estas cinco variables angulares.
La aparición de espines semienteros depende de que el operador espín contenga operadores
de derivación con respecto a las variables de orientación. La razón es que cuando los operadores
de momento angular actúan sobre una variedad de dimensión dos, como es la supercie de la
esfera unidad, no obtenemos todas las representaciones del grupo de rotaciones sino solamente
las correspondientes a los valores enteros. En este caso los vectores propios se reducen a los
armónicos esféricos. Es necesario que el grupo de rotaciones actúe sobre sí mismo, como variedad
tridimensional, para obtener todas las representaciones nitas, incluidas las de espín semientero.
Los modelos clásicos que poseen entre sus variables cinemáticas la velocidad u y la orien-
tación α, tienen la peculiaridad de que su centro de masa y su centro de carga son puntos
diferentes. Las propiedades magnéticas están relacionadas con la corriente, es decir con el mo-
vimiento de la carga y por lo tanto con la parte del momento angular debido al zitterbewegung.
Es la existencia de otro momento angular no ligado con el momento magnético, el que nos va a
producir el concepto de relación giromagnética.
La ecuación de Dirac la vamos a obtener al cuantizar el sistema clásico relativista, en el
que la carga se mueve en círculos a la velocidad de la luz alrededor de su centro de masa. En

163
164 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

este caso, los operadores que caracterizan a su orientación, completamente reproducen todo el
álgebra de observables internos, todo el álgebra de Dirac.

3.1. Cuantización Feynman de los sistemas Lagrangianos


Consideremos un sistema Lagrangiano generalizado, del tipo de los descritos en los capítulos
anteriores, cuya evolución tiene lugar entre los puntos x1 y x2 de su espacio cinemático.
La formulación variacional requiere que conozcamos con precisión estos valores extremos, y
la solución particular de las ecuaciones de Euler-Lagrange que pasa por ellos nos singulariza la
evolución del sistema. Pero si de forma experimental es imposible obtener la descripción precisa
de estos estados, dado que medir signica interaccionar y cuando medimos alguna propiedad
de un sistema algunas otras aumentan su incertidumbre, esto da lugar a que en realidad no
conocemos con precisión x1 , sino un conjunto de posibles estados iniciales, alrededor de x1 ,
con una cierta probabilidad. Lo mismo con respecto a x2 , por lo que intentar encontrar el
camino que describe el sistema es equivalente a discernir de entre todos los caminos que unen
los puntos de la región inicial R1 con la región nal R2 . Lo que tenemos es una especie de
tubo o camino grueso que une ambas regiones dentro del cual es imposible discernir un camino
especíco. La formulación variacional debe ser abandonada por una teoría que nos prediga con
qué probabilidad, si el sistema se encuentra inicialmente en R1 , llegará a R2 .
Para cuantizar este tipo de sistemas Lagrangianos generalizados, seguiremos el método de
cuantización de Feynman, de integrales sobre todos los caminos 1 . El principio de cuantización
de Feynman consiste en que frente a la idea clásica de que dados los puntos extremos x1 y x2 , la
trayectoria clásica entre ellos es el camino que hace extremal a la acción, como desde el punto
de vista cuántico no es posible medir qué camino sigue realmente el sistema, entonces todas las
trayectorias x(τ ) entre ambos puntos, son posibles. Además van a ser todas ellas igualmente
probables. Se trata por lo tanto de denir una probabilidad P [x(τ )], para cada posible camino.
El principio variacional ya no funciona y es sustituído por un principio de cuantización que
admite que todas las trayectorias son equiprobables.
Esta probabilidad se va a denir como el valor absoluto al cuadrado de un número complejo
ϕ[x(τ )] asociado a cada camino, llamado amplitud de probabilidad. De esta forma

P [x(τ )] = |ϕ[x(τ )]|2 , ∀x(τ ), 0 ≤ P [x(τ )] ≤ 1.

Si todos los caminos son igualmente probables, entonces estos complejos ϕ[x(τ )], son todos del
mismo valor absoluto distinguiéndose unos de otros solamente en su fase. La virtud de Feynman
es cómo dene esa fase. Esta fase va a ser el valor de la acción del sistema entre los puntos x1
y x2 , en unidades de ~, a lo largo del correspondiente camino x(τ ), es decir,
{ ∫ τ2 } { }
i e i
ϕ[x(τ )] = N exp L(x(τ ), ẋ(τ ))dτ = N exp A[x] (x1 , x2 ) , (3.1)
~ τ1 ~

siendo N un factor constante de normalización, el mismo para todos los caminos. La fase es la
acción a lo largo de ese camino, A[x] (x1 , x2 ), dividida por ~. La amplitud de probabilidad ϕ[x(τ )]
es un funcional sobre todos los caminos posibles, y por eso, la representamos con paréntesis
cuadrados, pero que una vez realizada la integral (3.1) en vez de ser un número complejo es una
función compleja de las variables extremas x1 y x2 .
En este método estadístico de Feynman, la existencia de alternativas o caminos indepen-
dientes no produce la suma de las correspondientes probabilidades. Este tipo de estadística la
vamos a denominar estadística interriente. La probabilidad de un proceso completo en el
que existen varias alternativas independientes, se determina calculando primero la amplitud de
1
R.P. Feynman and A.R. Hibbs, Quantum Mechanics and Path Integrals, MacGraw Hill, NY (1965), p. 36.
3.1. CUANTIZACIÓN FEYNMAN DE LOS SISTEMAS LAGRANGIANOS 165

probabilidad de todo el proceso sumando las amplitudes de probabilidad de las alternativas, y


después tomando su valor absoluto al cuadrado. Esto produce el efecto de que el valor absoluto
de una suma de números complejos puede ser menor que el valor absoluto de cualquiera de ellos,
por lo que se puede dar la situación de que la suma de procesos alternativos puede producir
una probabilidad nula para el proceso global. Se ha producido una interferencia. La mecánica
cuántica, según Feynman, es una teoría estadística de tipo interriente.

La idea que subyace en el método de cuantización de Feynman es el proceso de interferencia de las


dos rendijas. Formalmente tenemos un haz de luz monocromática que incide sobre dos rendijas,
se difracta y acaba en una pantalla. A cada punto de la pantalla han llegado fotones provinientes
de las dos rendijas y sin embargo hay puntos a los que no llega luz. En ellos se ha producido una
interferencia.
Como onda electromagnética podemos pensar que a lo largo de cada trayectoria fotónica va un
plano transversal que es el que contiene al campo eléctrico y magnético de la onda. Supongamos
que es luz polarizada circular y que el campo eléctrico de intensidad constante va rotando con
velocidad angular ω. Al progresar la onda lo que va cambiando es la fase de este campo, pero no
su intensidad. Podemos también imaginar que este plano transversal representa al plano complejo
en el que el campo eléctrico es el número complejo ϕ[x(τ )], de valor absoluto constante y cuya fase
va incrementando a lo largo de la trayectoria. Si a un punto de la pantalla llegan dos fotones, cada
uno pasando por una rendija diferente, el campo eléctrico en este punto será la suma de los campos
eléctricos de las dos ondas y la energía que llega a ese punto es proporcional al cuadrado de la
intensidad del campo. La probabilidad de llegada de luz a un punto es el módulo al cuadrado de la
suma de las amplitudes E 1 + E 2 , es decir |ϕ[x1 (τ )] + ϕ[x2 (τ )]| . Hay puntos a los que llegan fotones
2

desde una rendija, pero al superponer el efecto de las dos rendijas, el campo eléctrico resultante
puede ser cero. No se suman las probabilidades de llegada sino las amplitudes de probabilidad.

Si extendemos esta idea a un sistema arbitrario podemos imaginar que en cada punto de
la evolución del sistema en su espacio cinemático en vez del plano transversal que contiene
al campo electromagnético le asociamos un plano complejo en el que dibujamos la amplitud
ϕ[x(τ )], como en la gura 3.1,

Figura 3.1: Trayectoria del sistema material en su espacio cinemático en la que se ha


superpuesto un plano complejo en el punto x(τ ), que contiene a su amplitud de probabilidad
ϕ[x(τ )].
La fase α de este complejo es la acción del sistema, en unidades de ~, a lo largo de
esta trayectoria y hasta ese punto.

La amplitud de probabilidad total de que el sistema llegue al punto x2 saliendo de x1 , lo


que se denomina el Kernel de Feynman K(x1 , x2 ), se obtendrá como la suma, o más bien la
integración sobre todos los caminos posibles, de términos de la forma (3.1). Feynman lo escribe
166 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

como ∫ x2
K(x1 , x2 ) = ϕ[x(τ )]D(x(τ )),
x1

donde por D(x(τ )) quiere indicar una medida sobre la clase de caminos que unen x1 con x2 .
El kernel de Feynman K(x1 , x2 ), será en general una función compleja denida sobre la
variedad X × X . Más propiamente es una función generalizada o distribución, debido a la
forma especial de construirla sumando o integrando sobre una innidad de caminos. Si pudié-
ramos a su vez sumar (o integrar) diferentes kérneles K(x1 , x), todos ellos con el mismo punto
nal x, pero diferentes puntos iniciales x1 , lo que obtendríamos es la amplitud de probablidad
de que nuestro sistema mecánico estuviera en x, proviniente de algunos puntos iniciales, pero
desconocidos, es decir, la interpretación habitual de la función de onda Φ(x) de dicho sistema
al ser cuantizado. Las diferentes funciones de onda o estados, se obtendrían de las diferentes
formas de sumar los kérneles de Feynman sobre todas las posibilidades de sus puntos iniciales
y de los correspondientes caminos de llegada.
Por este razonamiento, llegamos a la conclusión de que al cuantizar por el método de Feyn-
man cualquier sistema Lagrangiano, los estados cuánticos del mismo quedan descritos por fun-
ciones complejas de las variables cinemáticas, y de cuadrado integrable. Solamente funciones
de las variables cinemáticas y no de otras variables ni siquiera del espacio de conguración, del
espacio de fase o del espacio de conguración ampliado. El espacio de Hilbert de los estados es
el espacio L2 (X). Lo que el formalismo no ja es cómo es la medida sobre X , para realizar las
integraciones.
Vemos que el método de Feynman realza el papel de las variables cinemáticas para carac-
terizar el estado cuántico del sistema, frente a otras variedades, como por ejemplo la de los
grados de libertad independientes. Consideramos que es ésta una de las razones del por qué las
variables cinemáticas debían jugar también un papel crucial en la formulación clásica. Queda
así justicado el que la denición de partícula clásica se haya hecho dotando de propiedades
exclusivas al espacio cinemático, haciendo que sea un espacio homogéneo del grupo cinemático.
En mecánica cuántica estamos acostumbrados a que la función de onda Φ(x), en vez de ser
una sola función compleja, sea una función multicomponente, es decir un conjunto de n funciones
complejas de las variables t y r , ψi (t, r), i = 1, . . . , n formando una especie de vector columna,
que puede ser considerado como un objeto de un espacio de Hilbert n−dimensional. En general,
esta descomposición nita en componentes, transforma con una representación irreducible del
grupo de rotaciones, con lo que cada una de las componentes ψi hace referencia a una posible
orientación del espín. La cuantización a lo Feynman hace que nuestra función de onda Φ(x), sea
solamente una función, pero del conjunto de variables cinemáticas, es decir de más variables que
tiempo y posición. Una vez que denamos el conjunto completo de observables que conmutan,
al encontrar una base del espacio de Hilbert de los estados, nos va a permitir buscar funciones
en variables separadas, de tal manera que Φ(x) se va a poder escribir en términos de una
parte espacio temporal ϕ(t, r), dependiente de las variables t y r , y de otra parte χ, que va
a depender del resto de las variables cinemáticas, invariantes por traslación. Diremos que la
función de onda ha quedado descompuesta en su parte espacio-temporal ϕ y en su parte interna
χ. Es esta descomposición la que va a dar lugar a la aparición de las diferentes componentes
de la función de onda. En el caso de las partículas elementales, las variables adicionales van a
ser la velocidad u y la orientación α, y los operadores de espín van a derivar solamente con
respecto a estas variables, por lo que pueden considerarse como observables internos.

3.1.1. Transformación de la función de onda

Para calcular cómo transforma la función de onda entre observadores inerciales, sean éstos
O y O′ de tal manera que las variables cinemáticas transforman con un elemento g ∈ G, del
3.1. CUANTIZACIÓN FEYNMAN DE LOS SISTEMAS LAGRANGIANOS 167

grupo cinemático G, en la forma:


x′ = f i (x, g).
i
(3.2)
Si para el observador O la partícula sigue el camino x̄(τ ), entonces para O′ sigue el ca-
mino x̄′ (τ ) = f (x̄(τ ), g). Como la Lagrangiana, si entre observadores transforman las variables
cinemáticas x′ = gx, transforma de acuerdo con,

e ẋ) + d α(g; x),


e ′ , ẋ′ ) = L(x,
L(x

la amplitud de probabilidad para el observador O′ es
{ ∫ τ2 }
′ ′ i e (τ ), x̄˙′ (τ ))dτ

ϕ [x̄ (τ )] = N exp L(x̄
~ τ1
{ ∫ τ2 } { ∫ τ2 }
i e i dα(g; x̄(τ ))
= N exp ˙
L(x̄(τ ), x̄(τ ))dτ exp dτ ,
~ τ1 ~ τ1 dτ
es decir, { }
′ ′ i
ϕ [x̄ (τ )] = ϕ[x̄(τ )] exp (α(g; x2 ) − α(g; x1 )) ,
~
donde el último factor de fase es independiente del camino de integración x̄(τ ). Si ahora sumamos
todas las amplitudes de probabilidad escritas en esta forma, para todos los posibles caminos,
resulta que el kernel de Feynman transforma como:
{ }
′ ′ ′ i
K (x1 , x2 ) = K(x1 , x2 ) exp (α(g; x2 ) − α(g; x1 )) . (3.3)
~
Si la información relativa al punto inicial x1 se pierde, por ejemplo si hacemos la correspondiente
suma sobre diferentes puntos iniciales, entonces la función de onda transforma como la parte
relacionada con las variables del punto x2 , hasta tal vez una función arbitraria sobre G,
{ }
′ ′ ′ i
Φ (x (x)) = Φ (gx) = Φ(x) exp (α(g; x) + θ(g)) , (3.4)
~
o en términos de las variables sin primar x,
{ }
′ −1 i( −1
)
Φ (x) = Φ(g x) exp α(g; g x) + θ(g) , (3.5)
~
donde θ(g) es una función arbitraria denida sobre G pero independiente de x.
Como nuestra partícula se encuentra en alguna parte del espacio cinemático X , la pro-
babilidad de encontrarla en alguna parte debe ser 1. Tenemos que denir la forma de sumar
probabilidades en puntos x ∈ X . Si denimos una medida sobre X , µ(x), tal que dµ(x) es el
elemento de volumen en el espacio X y |Φ(x)|2 dµ(x) se interpreta como la probabilidad de en-
contrar a la partícula dentro del volumen dµ(x) alrededor del punto x, entonces la probabilidad
de encontrarla en alguna parte, en cualquier instante t y para cada observador inercial, debe
ser uno, es decir ∫
|Φ(x)|2 dµ(x) = 1, (3.6)
X
donde la integral está tomada a t =constante. Como a partir de (3.5)

|Φ′ (x′ )|2 = |Φ(x)|2 , (3.7)

entonces para que la probabilidad se conserve entre observadores inerciales, es suciente admitir
que la medida µ(x) es invariante bajo las transformaciones del grupo. En ese caso, la ecuación
168 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

(3.7) implica también la conservación local de la probabilidad entre observadores inerciales.


Esto va a tener consecuencias fuertes en el formalismo, ya que va a poder denir otro tipo
de transformaciones de simetría: la invariancia del formalismo bajo cambios arbitrarios de fase
de la función de onda. Pero la fase es en general función de x y la podemos cambiar de forma
arbitraria en cada punto. Admitir una medida invariante nos lleva a que el formalismo es también
invariante bajo cambios de fase locales, es lo que se denomina la invariancia gauge local.
Conviene observar que el cambio arbitrario de fase β(x) que da lugar a esta nueva simetría, no
es solo una fase denida sobre el espacio-tiempo, sino sobre todo el espacio cinemático. Frente a
lo que se suele admitir en teoría cuántica de campos, tenemos la posibilidad de analizar simetrías
más generales que actúan sobre una variedad más amplia que el espacio-tiempo.

3.1.2. Espacio de Hilbert de las amplitudes de probabilidad


La función compleja Φ(x), si se interpreta como la amplitud de probabilidad de encontrar a
nuestra partícula en el punto x ∈ X , habiendo venido de alguna otra parte, satisface (3.6). Esto
signica que Φ(x) es una función compleja de cuadrado integrable denida sobre el espacio cine-
mático. Como las amplitudes de probabilidad se pueden sumar para denir nuevas amplitudes
de probabilidad, convenientemente normalizadas, el conjunto de la posibles funciones Φ(x) tiene
estructura de espacio vectorial complejo, ya que la suma y/o posterior producto por números
complejos, produce nuevas funciones complejas con el signicado de describir amplitudes de
probabilidad.
En consecuencia, el espacio de Hilbert H, cuyos rayos unidad representan los estados puros
del sistema es un espacio de funciones de cuadrado integrable L2 (X, µ) denidas sobre el espacio
cinemático X . La medida µ(x) es una medida invariante, de tal manera que el producto escalar
en H se dene mediante ∫
< Φ|Ψ >= Φ∗ (x)Ψ(x)dµ(x), (3.8)
X
donde Φ∗ (x) representa la función compleja conjugada de la Φ(x). Hay una arbitrariedad en
la elección de la medida invariante µ(x), pero a esta altura del formalismo esto se hará por
argumentos físicos. En general la integración se hace a tiempo constante en cada sistema de
referencia de tal manera que el resultado es independiente del tiempo y eso conduce a la con-
servación local de la probabilidad y a que la densidad de probabilidad satisfaga la ecuación de
continuidad. De todas formas, el exigir que la medida sea invariante restringe fuertemente el
tipo de medidas que pueden utilizarse.
El valor absoluto del anterior producto escalar (3.8), | < Φ|Ψ > |, representa la probabilidad
de que habiendo preparado al sistema en el estado Ψ(x), lo encontremos en el estado Φ(x), y
recíprocamente, ya que | < Φ|Ψ > | = | < Ψ|Φ > |.

3.1.3. Representación de los Observables


El teorema de Wigner 2 , 3 , sobre simetrías de un sistema cuántico, implica que para toda
simetría g ∈ G de un grupo continuo que transforma x′ = gx, existe una aplicación uno a uno
de los rayos unidad en los rayos unidad sobre H, que viene inducida en el espacio de Hilbert H
por un operador unitario U (g) denido salvo una fase. Este operador transforma una función
de onda denida en x en otra función de onda arbitraria del rayo unidad imagen denido en el
punto x′ .
El Principio de Relatividad Restringido es una simetría fuerte de los sistemas físicos. Dene
la equivalencia de un conjunto de observadores que están denidos por cómo relacionan entre
2
E.P. Wigner, Group theory and its application to the quantum mechanics of atomic spectra, Acad. Press,
NY (1959).
3
V. Bargmann, Note on Wigner's theorem on symmetry operations, J. Math. Phys. 5, 862 (1964).
3.1. CUANTIZACIÓN FEYNMAN DE LOS SISTEMAS LAGRANGIANOS 169

sí las medidas de acontecimientos espacio-temporales. Esta relación viene caracterizada por el


grupo cinemático G. Si interpretamos que Φ(x) es la función de onda que describe al estado de
la partícula para el observador O y que Φ′ (x) es cómo la describe O′ , entonces, el teorema de
Wigner implica
{ }
′ −1 i −1
U (g)Φ(x) = Φ (x) = Φ(g x) exp α(g; g x) + θ(g) . (3.9)
~
Como la función θ(g) da lugar a una fase constante, independiente de x, la podemos eliminar,
y tomar como denición de la representación unitaria del grupo G sobre el espacio de Hilbert
H { }
′ −1 i −1
Φ (x) = U (g)Φ(x) = Φ(g x) exp α(g; g x) . (3.10)
~
Las funciones gauge satisfacen (1.15), por lo que el término de fase se puede reemplazar por

α(g; g −1 x) = −α(g −1 ; x) + α(0; x) + ξ(g, g −1 ) = −α(g −1 ; x) + ζ(g), (3.11)

ya que las funciones gauge pueden escogerse de tal manera que α(0; x) = 0, y como la función
ζ(g) = ξ(g, g −1 ) da lugar a otra fase constante, la podemos suprimir. Denimos la transforma-
ción de la función de onda mediante:
{ }
i
Φ′ (x) = U (g)Φ(x) = Φ(g −1 x) exp − α(g −1 ; x) . (3.12)
~
Si el grupo G es el grupo cinemático, esta es la realización del Principio de Relatividad Res-
tringido en el caso cuántico, es decir, la expresión del cambio de la función de onda entre
observadores inerciales.
Si el operador unitario lo representamos en términos del generador intesimal autoadjunto
del álgebra de Lie en la forma
{ }
i σ
U (g) = exp − g Xσ , (3.13)
~
entonces, para una transformación innitesimal de parámetros δg σ , la transformación inversa
tiene por parámetros innitesimales −δg σ , por lo que a primer orden en δg σ
( )
i σ i
U (δg)Φ(x) = I − δg Xσ Φ(x) = Φ(x) − δg σ Xσ Φ(x),
~ ~
mientras que

−1 −1 ∂Φ(x) ∂f j (x, g)
Φ(δg x) ≡ Φ(f (x, δg )) = Φ(x) − δg σ uiσ (x) , ujσ (x) = ,
∂x i ∂g σ g=0
y { }
i i
exp − α(δg ; x) = 1 − α(δg −1 ; x).
−1
~ ~
Como α(0; x) = 0,
−1 ∂α(g; x)
α(δg ; x) = (−δg σ ) = −λσ (x)δg σ , (3.14)
∂g σ g=0
y sustituyendo en (3.12) los términos anteriores y después de identicar los términos de primer
orden en δg σ , resulta que los generadores Xσ , al actuar sobre las funciones de onda tienen la
representación diferencial
~ ∂
Xσ = ujσ (x) j − λσ (x), (3.15)
i ∂x
170 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

Si nos restringimos a transformaciones del espacio de conguración ampliado (t, qi ) que


(k−1)
pueden extenderse a la totalidad del espacio cinemático x ≡ (t, qi , . . . , qi ), entonces, usan-
do la misma notación que en (1.18)-(1.21), si la transformación innitesimal de las variables
cinemáticas la escribimos en la forma

t′ = t + Mσ δg σ , qi′ = qi + Miσ δg σ , q ′ i + Miσ δg σ , . . . , q ′ i


(0) (1) (1) (1) (k−1) (k−1) (k−1)
= qi = qi + Miσ δg σ ,

entonces la forma desarrollada en términos de las variables cinemáticas de la primera parte de


(3.15) es
∂ ∂ (0) ∂ (1) ∂ (k−1) ∂
ujσ (x) j = Mσ + Miσ + Miσ (1)
+ . . . + Miσ (k−1)
,
∂x ∂t ∂qi ∂q ∂q
i i
y los generadores Xσ , que por ser autoadjuntos representan obervables, toman la forma:
( )
~ ∂ (0) ∂ (1) ∂ (k−1) ∂
Xσ = Mσ + Miσ + +Miσ (1)
. . . + Miσ (k−1)
− λσ (x). (3.16)
i ∂t ∂qi ∂q ∂q
i i

Cuando los comparamos con las constantes del movimiento Noetherianas (1.36) escritas en la
forma
(0) (1) (k−1)
−Nσ = −H Mσ + pi(1) Miσ + pi(2) Miσ + . . . + pi(k) Miσ − λσ (x), (3.17)
vemos que podemos enunciar una especie de receta de correspondencia. Si nos restringimos
a grupos continuos, las funciones λσ (x) de (1.36), se obtienen a partir de las funciones gauge
Lagrangianas α(g; x), mediante (1.14), es decir, de la misma forma en que obtenemos las fun-
ciones λσ (x) en (3.14). Identicando el Hamiltoniano y los momentos generalizados en (3.17)
con los correspondientes operadores diferenciales en (3.16) que aparecen multiplicando a las
(s) (s)
correspondientes funciones Miσ , obtenemos: El Hamiltoniano generalizado H = pi(s) qi − L,
que multiplica en (3.17) a la función Mσ , se identica con el operador i~∂/∂t que multiplica a
su vez a la función Mσ en (3.16). Análogamente, el momento generalizado pi(s+1) , que multiplica
(s) (s)
a la función Miσ , se identica con el operador diferencial −i~∂/∂qi , for s = 0, . . . , k − 1, ya
que las funciones λσ (x), son las mismas. Al generador Xσ le daremos el mismo nombre que al
observable Nσ y lo representaremos con la misma notación.
Receta: Conviene recordar que como variables pi(s+1) y qi(s) son canónico-conjugadas. En-
tonces, cada momento generalizado pi(s+1) queda reemplazado por (~/i) multiplicado por el
operador diferencial que deriva con respecto a la variable canónico-conjugada de ese momento
(s)
qi , y el Hamiltoniano generalizado H , por el operador diferencial i~∂/∂t.
~ ∂ ∂
pi(s+1) −→ , H −→ i~ .
i ∂q (s) ∂t
i

En el caso de las partículas elementales, como las variables cinemáticas son t, r, u, ρ, como
coordenadas generalizadas solo tenemos las r, u y ρ y de momentos conjugados respectivos, los
P , U y V , éstos aparecerán representados por
~ ∂ ~ ∂ ~ ∂ ∂
P = , U= , V = , H = i~ . (3.18)
i ∂r i ∂u i ∂ρ ∂t

En vez del momento V = ∂ L/∂ e ρ̇, hemos utilizado la función W = ∂ L/∂ω


e , que da lugar a
la parte rotativa del espín, la cual se expresará nalmente en términos de las derivadas con
respecto a ρ, en la forma en que se describe en el apéndice sobre espinores 3.5, al nal de este
capítulo.
~
W = {∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )} , (3.19)
2i
3.1. CUANTIZACIÓN FEYNMAN DE LOS SISTEMAS LAGRANGIANOS 171

donde hemos puesto ∇ρ ≡ ∂/∂ρ. La representación de los momentos (3.18) de acuerdo con el
principio atómico, es válida incluso cuando la partícula elemental esté sometida a una interac-
ción.
Sabemos que e ρ̇i
Vi = ∂ L/∂ y e
Wj = ∂ L/∂ω e
j = ∂ L/∂ ρ̇i ∂ ρ̇i /∂ωj = Vi ∂ ρ̇i /∂ωj . Como en la
representación activa

2 1
ωi = (ρ̇i + ϵijk ρj ρ̇k ), ρ̇i = (ωi − ϵikj ρk ωj + ρi (ρ · ω)) ,
1 + ρ2 2
( )
∂ ρ̇i 1 ∂ ρ̇i ~ ∂ ∂ ∂
= (δij − ϵikj ρk + ρi ρj ) , Wj = Vi = + ϵjik ρi + ρj ρi ,
∂ωj 2 ∂ωj 2i ∂ρj ∂ρk ∂ρi
es decir (3.19).

La representación de Heisenberg es aquella representación en la que la dependencia temporal


de la función de onda ha sido eliminada haciendo en cada instante una transformación unitaria
dependiente del tiempo. Entonces, la nueva función de onda depende de las variables cinemáticas
(r)
pero con el tiempo excluido, es decir depende solamente de las coordenadas generalizadas qi ,
r = 0, . . . , k − 1. Por lo tanto, cuando actúan sobre la función de onda en la representación de
(1) (k−1) (r)
Heisenberg ψ(qi , qi , . . . , qi ), los observables qi y pj(s) satisfacen las relaciones canónicas
de conmutación
(r)
[qi , pj(s+1) ] = i~δij δsr .
Si las funciones λσ (x) en (3.15) fueran nulas, los generadores Xσ satisfacen las reglas de
conmutación del álgebra de Lie del grupo G. Pero si algunas de las funciones λσ (x) ̸= 0, entonces
los generadores Xσ no satisfacen las reglas de conmutación del álgebra de Lie de G, sino de una
extensión central de G. La representación del grupo no es una verdadera representación sino
una representación proyectiva de G, como ha demostrado Bargmann 4 .
En efecto, a partir de (3.10) obtenemos
i
U (g1 )Φ(x) = Φ(g1−1 x) exp{ α(g1 ; g1−1 x)},
~
y si actuamos ahora por la izquierda con U (g2 ),
i
U (g2 )U (g1 )Φ(x) = U (g2 )Φ(g1−1 x) exp{ α(g1 ; g1−1 x)}
~
i i
= Φ((g2 g1 )−1 x) exp{ α(g2 ; g2−1 x)} exp{ α(g1 ; (g2 g1 )−1 x)}, (3.20)
~ ~
mientras que si actuamos sobre Φ(x) con U (g2 g1 ),
i
U (g2 g1 )Φ(x) = Φ((g2 g1 )−1 x) exp{ α(g2 g1 ; (g2 g1 )−1 x)}. (3.21)
~
Si denimos (g2 g1 )−1 x = g1−1 g2−1 x = z , entonces g1 z = g2−1 x y debido a que las funciones
gauge satisfacen (1.15), podemos escribir

α(g2 ; g1 z) + α(g1 ; z) = α(g2 g1 ; z) + ξ(g2 , g1 ), (3.22)

que comparando (3.20) con (3.21), y teniendo presente (3.22), obtenemos


i
U (g2 )U (g1 )Φ(x) = U (g2 g1 )Φ(x) exp{ ξ(g2 ; g1 )}. (3.23)
~
Como la función Φ(x) es arbitraria, obtenemos una representación proyectiva unitaria del grupo
G, caracterizada por el exponente no trivial ξ(g, g ′ ).
4
V. Bargmann, On unitary ray representations of continuous groups, Ann. Math. 59, 1 (1954).
172 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

Para las partículas elementales Galileanas y Poincaré el espacio cinemático es la variedad de


dimensión diez, constituida por las variables (t, r, u, α), donde t es el tiempo, r la posición de
la carga, u la velocidad de ésta y α la orientación de la partícula. Por lo tanto, en el formalismo
cuántico, la función de onda más general que representa los estados de una partícula elemental
es una función de cuadrado integrable Φ(t, r, u, α) de estas variables cinemáticas. Para las
partículas puntuales el espacio cinemático es solamente el espacio-tiempo cuatridimensional,
de tal manera que las funciones de onda son solamente funciones del tiempo y de la posición,
pero para partículas con espín la función de onda debe depender de las variables cinemáticas
adicionales, como velocidad y orientación. La estructura cuántica del espín, lo mismo que en el
caso clásico, va a depender de estas nuevas variables.

3.2. Partículas no relativistas con espín

3.2.1. Partículas no relativistas con espín. Bosones


Vamos a aplicar este formalismo al caso interesante, pero sencillo, de partículas no relati-
vistas con espín de tipo (anti)orbital. Esto corresponde al ejemplo clásico en el que el espacio
cinemático es X = G/SO(3) y por lo tanto las variables cinemáticas son tiempo, posición y
velocidad. Un ejemplo particular es el descrito en el Capítulo 2, Sección 2.2 y dado por la
Lagrangiana libre
( ) ( )
m dr 2 m du 2
L= − 2 , (3.24)
2 dt 2ω dt
con u = dr/dt. Para la partícula libre, el centro de masa q = r − k se mueve en línea recta
mientras que el vector de posición relativa k describe una trayectoria, en general elíptica, de
pulsación ω alrededor del centro de masa. El espín con respecto al centro de masa se expresa
como S CM = −mk × dk/dt, como un momento angular (anti)orbital del movimiento del centro
de carga alrededor del centro de masa.
Las variables cinemáticas transforman bajo el grupo de Galileo G de la forma:

t′ (τ ) = t(τ ) + b, (3.25)
r ′ (τ ) = R(α)r(τ ) + vt(τ ) + a, (3.26)

u (τ ) = R(α)u(τ ) + v. (3.27)

las funciones de onda son funciones complejas sobre X y por lo tanto, funciones de las variables
(t, r, u). Sobre este espacio cinemático, la función gauge es la misma que en (2.41), donde m
dene la masa de la partícula. Si tomamos en cuenta la receta de correspondencia desarrollada
anteriormente, el Hamiltoniano es H → i~∂/∂t, y el momento generalizado pr ≡ P → −i~∇ y el
otro momento generalizado pu ≡ U → −i~∇u . Los generadores de la representación proyectiva
están dados por
∂ ~ ~ ~
H = i~ , P = ∇, K = mr − t ∇ − ∇u , (3.28)
∂t i i i
~ ~
J = r × ∇ + u × ∇u = L + Z, (3.29)
i i
donde ∇ es el operador gradiente con respecto a las variables generalizadas q 1 ≡ r y ∇u es el
operador gradiente con respecto a las variables generalizadas q 2 ≡ u. Conviene resaltar que esta
representación de los generadores es independiente de la Lagrangiana particular que hayamos
considerado. Solo depende de las variables cinemáticas (t, r, u), y de la función gauge habitual,
del grupo de Galileo.
El momento angular con respecto al centro de carga, relacionado con el Zitterbewegung,
Z = u × U y veremos más adelante que cuantiza solamente con valores enteros.
3.2. PARTÍCULAS NO RELATIVISTAS CON ESPÍN 173

Si denimos q = r − k = (K + P t)/m, satisface las reglas de conmutación con P ,

[qi , Pj ] = i~ δij ,

que resultan ser las reglas canónicas de conmutación entre el momento lineal y la posición de
una partícula puntual. Por lo tanto, las reglas canónicas de conmutación entre el momento lineal
total y la posición del centro de masa de una partícula con espín, están ya contenidas en las
reglas de conmutación del álgebra de Lie extendida del grupo cinemático. Es por eso que el
operador
~
q=r− ∇u , (3.30)
im
puede ser interpretado como el operador de posición del centro de masa. Una discusión general
sobre otras deniciones del operador de posición del centro de masa, pueden encontrarse en el
libro del autor.
En esta representación, un operador de Casimir es la energía interna H − P 2 /2m. Vemos
que el espín con respecto al centro de masa se dene como habitualmente
1 ~ ~ ~
S CM = J − K × P = u × U + k × P = u × ∇u + ∇u × ∇;
m i im i
que aparece escrito en términos de dos operadores que no conmutan, y que satisface

[S CM , S CM ] = i~S CM , [J , S CM ] = i~S CM , [S CM , P ] = [S CM , H] = [S CM , K] = 0,

es decir, es un operador momento angular, transforma como un vector bajo rotaciones y es


invariante bajo traslaciones espaciales y temporales y bajo boosts Galileanos, respectivamente.
La segunda parte del operador espín es del orden de ~2 por lo que únicamente produce una
corrección a la parte Z .
Los operadores Z satisfacen las reglas de conmutación

[Z, Z] = i~Z, [J , Z] = i~Z, [Z, P ] = [Z, H] = 0,

[Z, K] = −i~U = −~2 ∇u ,


lo que indica que Z es un operador momento angular, transforma como un vector bajo rota-
ciones, es invariante bajo traslaciones espaciales y temporales, pero no lo es bajo los boosts
Galileanos. Es un operador de espín, que representa al momento angular con respecto al centro
de carga, como se puede deducir de su dinámica.
Vemos pues que, el operador momento angular total J se descompone en dos términos que
conmutan r×P y Z . Ambos conmutan con H , pero el primero no es invariante bajo traslaciones.
Como los operadores Z son operadores de momento angular que únicamente derivan la función
de onda con respecto a las variables de velocidad, y en consecuencia conmutan con los operadores
H y P , aunque no representan al operador momento angular con respecto del centro de masa,
podemos usarlos para encontrar vectores propios comunes a los tres operadores que conmutan
H − P 2 /2m, Z 2 y Z3 . Como resulta que los operadores Z únicamente afectan a la función
de onda en su dependencia en las variables ∑ u, podemos escoger las funciones de onda con las
variables separadas en la forma Φ(t, r, u) = i ψi (t, r)χi (u) de tal manera que

(H − P 2 /2m)ψi (t, r) = Eψi (t, r), (3.31)

Z 2 χi (u) = z(z + 1)~2 χi (u), (3.32)


Z3 χi (u) = mz ~χi (u). (3.33)
Cada parte espacio-temporal de la función de onda ψi (t, r), satisface la ecuación de Schroedinger
y está desacoplada de la parte del espín χ(u).
174 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

Debido a la estructura de Z 2 en términos de las variables u, que resulta ser la misma que la
del momento angular orbital de una partícula puntual en términos de las variables de posición
r , la parte del espín de la función de onda es en realidad de la forma

χ(u) = f (u)Yzmz (θ, ϕ), (3.34)

donde f (u) es una función arbitraria del módulo de u y Yzmz (θ, ϕ) son los armónicos esféricos
en la dirección θ, ϕ del vector u.
Para el observador del centro de masa, S CM = Z y ambos momentos angulares son el mismo.
Pero para un observador arbitrario, los operadores Z no conmutan con los generadores de los
boosts K , por lo que el valor absoluto de Z 2 no es invariante Galileano, mientras que S 2CM sí lo
es. De todas formas, la descomposición de la función de onda en una función multicomponente
que reeja la estructura de su espín es una propiedad intrínseca que se puede poner de maniesto
en cualquier sistema de referencia.
Cuando la partícula interacciona con un campo electromagnético externo, de acuerdo con
el principio atómico su estructura mecánica interna no se modica por lo que las ecuaciones
(3.31-3.33) se deben satisfacer para las partes mecánicas Hm = H − eϕ y P m = P − eA, y para
las componentes del espín Z que quedan inalteradas, por lo que obtenemos la ecuación habitual
del acoplamiento mínimo
( )
(P − eA)2
H − eϕ − ψi (t, r) = Eψi (t, r), (3.35)
2m

donde los generadores H y P tienen la misma representación que en (3.28) por lo que cada
parte espacio-temporal ψi , satisface la ecuación de Schroedinger modicada.
En este formalismo, cuando el espín es de naturaleza (anti)orbital, no conduce al cuantizar
a espines semienteros. Estos modelos de partículas solamente sirven como modelos de bosones.

3.2.2. Partículas no relativistas con espín. Fermiones


Otro ejemplo de partícula no relativista con espín es aquél en el que las variables de orien-
tación son variables cinemáticas y la partícula clásica posee velocidad angular. Un ejemplo de
este tipo corresponde al modelo descrito por la Lagrangiana
( )2
m dr I 2
L= + ω . (3.36)
2 dt 2

La partícula libre viaja con velocidad constante y rota con velocidad angular constante. El
espín clásico es S = Iω , y el centro de carga y el centro de masa son el mismo punto.
Para describir la orientación de una partícula hagámoslo deniendo tres ejes unidad or-
togonales ei , i = 1, 2, 3 ligados al punto r , como formando un sistema cartesiano comóvil,
análogamente a como describimos la orientación de un sólido rígido. Si los tomamos inicialmen-
te paralelos a los correspondientes ejes cartesianos del observador inercial, entonces sus nueve
componentes nos denen una matriz ortogonal de rotación Rij (ρ) que describe cómo rotar el
sistema de referencia inercial para llevarlo a coincidencia con los ejes del cuerpo. Describe por
lo tanto la evolución de esta triada, con la condición inicial Rij (t = 0) = δij .
Las variables cinemáticas t, r y ρ transforman bajo G en la forma

t′ (τ ) = t(τ ) + b, (3.37)

r (τ ) = R(µ)r(τ ) + vt(τ ) + a, (3.38)
µ + ρ(τ ) + µ × ρ(τ )
ρ′ (τ ) = . (3.39)
1 − µ · ρ(τ )
3.2. PARTÍCULAS NO RELATIVISTAS CON ESPÍN 175

Sobre el correspondiente espacio de Hilbert, los generadores Galileanos están dados por:

∂ ~ ~
H = i~ , P = ∇, K = mr − t ∇, (3.40)
∂t i i
~ ~
J= r × ∇ + {∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )} = L + W , (3.41)
i 2i
donde ∇ρ representa al operador gradiente con respecto a las variables ρ y en la parametrización
ρ del grupo de rotaciones.
La parte W resulta del análisis general del grupo. Los generadores del grupo en esta pa-
rametrización Xi se obtienen a partir de (3.39) y de acuerdo con (1.48) y (1.50). Se obtiene
como ( )
∂ρ′ k ∂
Xi = ,
∂µ i ∂ρk
µ=0

que escritos en notación vectorial

X = ∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )

Satisfacen las reglas de conmutación

[Xi , Xk ] = −2ϵikl Xl

~ X , que en notación vectorial aparecen como


y por lo tanto los operadores Wk = 2i k

~
W = {∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )} , (3.42)
2i
satisfacen las reglas de conmutación del momento angular

[W , W ] = i~W . (3.43)

De esta manera, como L y W conmutan entre sí, obtenemos que [J , J ] = i~J .


En este ejemplo, el centro de masa y el centro de carga son el mismo punto, L = r × P
es el momento angular orbital del movimiento del centro de masa y W ≡ S es el operador
espín, tanto con respecto al centro de masa como al centro de carga. El operador espín conmuta
con H , P y∑K por lo que la función de onda puede escribirse en variables separadas como
Φ(t, r, ρ) = i ψi (t, r)χi (ρ) lo que nos lleva a las ecuaciones de valores propios

(H − P 2 /2m)ψi (t, r) = Eψi (t, r), (3.44)

S 2 χi (ρ) = s(s + 1)~2 χi (ρ), (3.45)

S3 χi (ρ) = ms ~χi (ρ). (3.46)


Bopp y Haag 5 encontraron soluciones con s = 1/2 para el sistema de ecuaciones (3.45) y
(3.46). Estas soluciones reciben el nombre de funciones de Wigner 6 . Las soluciones de (3.45)
para cualquier valor de s no son más que una coombinación lineal de las componentes de la
representación irreducible matricial de dimensión (2s + 1) × (2s + 1), del grupo de rotaciones,
resultado que se obtiene a partir del teorema de Peter-Weyl sobre representaciones nitas de
5
F. Bopp and R. Haag, Über die möglichkeit von spinmodellen,Z. Naturforschg. 5a, 644 (1950).
6
L.C. Biedenharn and J.D. Louck, Angular Momentum in Quantum Physics. Theory and Application, Cam-
bridge U. P., Cambridge, England (1989).
176 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

grupos compactos 7 , 8 , 9 . Analizaremos las soluciones correspondientes a las funciones de onda


de s = 1/2 en la Sección 3.5 del Apéndice, donde se van a obtener de forma explícita además
de analizar una introducción al teorema de Peter-Weyl.
Para describir fermiones, las partículas clásicas deben necesariamente tener como variables
cinemáticas, variables compactas del tipo de orientación. En caso contrario no es posible obtener
una descripción de objetos de espín 1/2 si solamente el espín está asociado con el zitterbewegung.
Las partículas de espín 1/2, desde el punto de vista clásico, poseen orientación y por lo tanto
rotan.

3.3. Cuantización del fotón

Si tomamos el eje OZ como la línea que describe el punto donde está localizado el fotón, las
variables cinemáticas se reducen a (t, z, α), siendo α la orientación de un triedro uno de cuyos
ejes es la propia dirección del movimiento OZ y α representa el ángulo girado por el triedro
en su desplazamiento y rotación. La Lagrangiana que describe de forma clásica a un fotón de
momento angular S y helicidad ϵ = ±1, es según la sección 2.5.1

e = ϵS ż α̇ .
L
cṫ
Las constantes del movimiento Noetherianas son
e
∂L ∂Le ∂Le
H=− = ϵSω, Pz = = ϵSω/c = ϵSk, Sz = = ϵS,
∂ ṫ ∂ ż ∂ α̇
con ω = dα/dt la velocidad angular de la partícula, k = ω/c el número de onda. Para el fotón
ϵω > 0 y ϵω < 0 para el antifotón. De esta forma H > 0 y Pz > 0 para el fotón y negativos
para el antifotón. Si de acuerdo con Planck esta partícula representa un cuanto de energía
electromagnética, tiene que tener una energía de valor hν , siendo ν la frecuencia de la radiación,
que si la identicamos con la frecuencia angular de la partícula, resulta H = S2πν = hν , por
lo que el valor S = ~. Desde el punto de vista cuántico el espín Sz solamente puede tomar los
valores enteros ±~, por lo que se trata de un bosón. Si el espín no tomara esos valores, tampoco
la energía de un fotón sería ~ω = hν . Para singularizar una solución entre los valores extremos
de las variables cinemáticas no basta jar t1 , z1 , α1 con 0 ≤ α1 ≤ 2π y lo mismo en el punto
2, sino que hay que indicar el número completo n de vueltas que la partícula ha dado, de tal
manera que la fase nal se exprese como 2πn + α2 , con 0 ≤ α2 ≤ 2π . De esta forma
2πn + α2 − α1
ω= , z2 − z1 = c(t2 − t1 ).
t2 − t1

En el caso cuántico, los generadores autoadjuntos de las traslaciones y rotaciones son

∂ ∂ ∂
H = i~ , Pz = −i~ , Sz = −i~ .
∂t ∂z ∂α
La función de onda que describe los estados del fotón será una función de cuadrado integrable
ψ(t, z, α), que al ser vector propio de esos tres generadores que conmutan se puede tomar en
variables separadas,

ψ(t, z, α) = e−iϵωt eiϵkz eiϵα = exp(−iϵ(ωt − kz − α)),


7
A.R. Edmonds, Angular Momentum in Quantum Mechanics, Princeton U. P., Princeton NJ (1957).
8
Fonctions spéciales et Théorie de la représentation des groups, Dunod, Paris (1969).
N. Ja. Vilenkin,
9
A.O. Barut and R. Raczka, Theory of group representations and applications, PWN, Warszawa (1980).
3.3. CUANTIZACIÓN DEL FOTÓN 177

que es vector propio de los anteriores generadores con los correspondientes valores propios. Se
corresponde con la descripción dada en (3.48) una vez que los dos estados de espín se han
reemplazado por las dos componentes del vector columna. La identicación de los dos estados
de polarización corresponde a
( ) ( )
1 −iα 0
e iα
−→ , e −→ .
0 1

En esta base la representación del operador del espín se reduce a


( )
1 0
Sz = ~ .
0 −1

Estos dos estados básicos corresponden a fotones de un haz de luz polarizada circular a derechas e
izquierdas, respectivamente. Si incluyéramos los estados del antifotón entonces el vector columna
sería de cuatro componentes.
De esta forma un fotón polarizado será una combinación lineal
( )
a
ψ(t, z) = e i(kz−ωt)
, |a|2 + |b|2 = 1
b

con lo que aparece como una onda plana que viaja en el sentido positivo del eje OZ . La función
acción entre dos estados inicial y nal, toma la forma

(z2 − z1 )(2πn + α2 − α1 )
A(x1 , x2 ) = ϵ~ = ϵ~(2πn + α2 − α1 ) = ϵ~ω(t2 − t1 ),
c(t2 − t1 )

si es que tenemos presente que (z2 − z1 )/(t2 − t1 ) = c. En unidades de ~ la función acción es la


fase de la función de onda o estado del fotón de acuerdo con Feynman.
Como los valores de H , Pz y Sz están denidos de forma precisa en estos estados que son
vectores propios de ellos, las variables conjugadas poseen una gran dispersión. En efecto, como
los conmutadores [t, H] = −i~, [z, Pz ] = i~, [α, Sz ] = i~, resulta

∆t∆H ≥ |[t, H]| = ~, ∆z∆Pz ≥ |[z, Pz ]| = ~, ∆α∆Sz ≥ |[α, Sz ]| = ~,

es decir que no sabemos donde se encuentra el fotón ni cual es su fase.


La medida para denir el producto escalar a t constante puede ser
∫ z2 ∫ 2πn+α2
1
< ψ|ϕ >= ψ ∗ ϕ dzdα,
(z2 − z1 )(2πn + α2 − α1 ) z1 α1

extendida a todo el rango de las variables cinemáticas en esta evolución. Así, el valor esperado
de la posición en uno de estos estados es
∫ z2 ∫ 2πn+α2
1 1
< z >=< ψ|z|ψ >= z dzdα = (z1 + z2 ),
(z2 − z1 )(2πn + α2 − α1 ) z1 α1 2

en el punto medio de la trayectoria, y su dispersión


1 1 1
(∆z)2 =< (z− < z >)2 >= (z12 + z1 z2 + z22 ) − (z1 + z2 )2 = (z2 − z1 )2 .
3 4 12
La incertidumbre ∆z = (z2 − z1 )/3.46, por lo que la probabilidad de encontrar al fotón en el
rango alrededor del punto medio ±∆z , es del 68 %.
178 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

3.4. Apéndice: Estados de polarización de la luz


Hemos visto que la parte interna que describe los estados de espín del fotón forma un
espacio de Hilbert bidimensional C2 . Por lo tanto cualquier estado puro viene descrito por el
conocimiento de un vector |Φ >∈ C2 de norma unidad, < Φ|Φ >= 1. Los estados no puros,
o mezclas estocásticas, vendrán caracterizados por operadores densidad ρ, es decir operadores
autoadjuntos sobre C2 de traza uno y por lo tanto se caracterizarán mediante matrices hermíticas
2 × 2 de traza unidad.
El conjunto de matrices hermíticas 2 × 2 es un espacio vectorial real de cuatro dimensiones,
una base del mismo puede venir dada por las cuatro matrices:
( ) ( ) ( ) ( )
1 0 0 1 0 −i 1 0
σ0 = , σ1 = , σ2 = , σ3 = (3.47)
0 1 1 0 i 0 0 −1
por lo que toda matriz hermítica se puede expresar en la forma ρ = aµ σµ con aµ ∈ R, cuatro
números reales. La condición de que ρ caracterice a un estado es que sea de traza uno, lo
que nos lleva a que a0 = 1/2. Si ρ es un estado puro, también denominado estado vectorial,
entonces ρ = |Φ >< Φ| en términos del vector estado |Φ >, por lo que resulta ser un proyector.
Los estados puros vienen caracterizados por la condición de que ρ2 = ρ, de donde resulta que
Trρ2 = Trρ = 1, en tanto que en general para un estado arbitrario la Trρ2 ≤ Trρ = 1.
2
Esta condición, teniendo presente que Trσµ σν = 2δµν , nos lleva a que 2(a0 ) + 2a2 ≤ 1, y
como a0 = 1/2, a2 ≤ 1/4, por lo que podemos caracterizar todo estado cuántico de este sistema
mediante un vector tridimensional real a, de norma igual o menor que 1/2, siendo igual a 1/2
en el caso de que el estado sea puro. Los estados de este sistema vendrán dados por los puntos
de una esfera en R3 de radio 1/2, denominada esfera de Poincaré, siendo los puntos de la
supercie los estados puros, en tanto que los del interior representan a los estados mezcla. Vemos
que el conjunto de estados es un conjunto convexo, de tal manera que todo estado mezcla se
puede construir como una combinación lineal convexa de estados puros.
Este tipo de descripción es general para sistemas cuánticos con dos estados internos. Aquí,
puede formar parte por ejemplo, de un sistema cuántico que describa fotones polarizados, cuyo
espacio de Hilbert lo podemos realizar como L2 (R3 ) ⊗ C2 , donde los dos posibles estados de
polarización vienen descritos por la parte C2 del espacio de Hilbert. Supongamos que en el
instante t tenemos dado el vector |Ψ >:
( )
α
|Ψ > = exp(i(kz − ωt)) (3.48)
β

donde α y β son dos complejos tales que |α|2 + |β|2 = 1, el cual es vector propio del operador
H = i~∂/∂t con valor propio ~ω , y del operador P = −i~∇ con valor propio (0, 0, ~k). Si
escribimos α = a exp(iδa ) y β = b exp(iδb ) y convenimos en representar el estado de tal manera
que saquemos fuera la fase de la primera componente, para que ésta sea real, entonces,
( ) ( )
α a
|Ψ > = exp(i(kz − ωt)) = exp(i(kz − ωt + δa )) (3.49)
β beiδ

siendo δ = δb − δa .
El proyector que caracteriza este estado es el |Ψ >< Ψ| que viene dado en la forma:
( 2 ) ( 0 )
a abe−iδ a + a3 a1 − ia2
|Ψ >< Ψ| = = (3.50)
abeiδ b2 a1 + ia2 a0 − a3

por lo que el tetravector a que da lugar es el:

[(a2 + b2 )/2, ab cos δ, ab sin δ, (a2 − b2 )/2], 2a0 ≡ a2 + b2 = 1. (3.51)


3.4. APÉNDICE: ESTADOS DE POLARIZACIÓN DE LA LUZ 179

En términos del vector tridimensional a, los diferentes estados puros vienen dados por la su-
percie de la esfera de radio 1/2 de la gura, en tanto que los puntos del interior representan
estados mezcla.

Figura 3.2: Esfera de Poincaré que representa los diferentes estados de polarización de la
luz. La supercie de la esfera representa a los estados puros o estados vectoriales, mientras
que los puntos del interior representan a los estados mezcla que vienen representados por
operadores densidad ρ. La esfera es un espacio convexo.
( ) ( )
1 0
En particular los estados ortogonales y dan lugar a sendos operadores de pro-
( ) ( ) 0 1
1 0 0 0
yeccción y los cuales vienen caracterizados por los vectores a y −a, siendo
0 0 0 1
a ≡ (0, 0, 1/2), es decir por los dos polos Norte y Sur de la esfera de Poincaré de la gura.
Si Ea y Eb son dos proyectores caracterizados por sendos vectores a y b y representan estados
ortogonales, entonces Ea Eb = 0. En términos de las matrices de Pauli Ea Eb = aµ bν σµ σν = 0,
y tomando trazas, sabiendo que a0 = b0 = 1/2, nos queda (1/4 + a · b) = 0, y que como a y
b son a su vez de módulo 1/2, la solución es a = −b. Estados ortogonales vienen dados por
puntos opuestos de la esfera de estados, y tomados por pares caracterizan por lo tanto a todas
las posibles bases ortonormales de C2 . Signica esto que cualquier otro estado puro se obtendrá
como superposición coherente de dos de estos estados ortogonales, y que cualquier otro estado
no puro, mediante combinaciones lineales convexas de estados puros.

3.4.1. Parámetros de Stokes


La descripción anterior de los estados de polarización en términos del tetravector aµ es
equivalente a la que realiza Stokes (1852). Si tenemos una onda polarizada de forma elíptica en
la que los campos sean

Ex = a cos(kz − ωt), Ey = b cos(kz − ωt + δ),

el campo describe en el plano XOY una elipse inscrita en un rectángulo de lados 2a y 2b.10
Los puntos de contacto de la elipse con el rectángulo exterior son A, A′ ≡ (±a, ±b cos δ) y
B, B ′ ≡ (±a cos δ, ±b). Los parámetros de Stokes son

s0 = a2 + b2 , s1 = a2 − b2 , s2 = 2ab cos δ, s3 = 2ab sin δ,


10
M. Born and E. Wolf, Principles of Optics, Cambridge Univ. Press, (1993), ch.1
180 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

que no son independientes pues s20 = s21 + s22 + s23 y donde s0 representa la intensidad de la
onda electromagnética. Comparados con la descripción anterior s0 = 2a0 , s1 = 2a3 , s2 = 2a1 y
s3 = 2a2 . El radio de la esfera de Poincaré en este caso no vale 1/2 sino que vale s0 . Los polos
N y S representan luz polarizada circular derecha e izquierda, respectivamente. Podríamos

Figura 3.3: Campo eléctrico de una onda polarizada de forma elíptica.

interpretar la descripción cuántica del fotón de tal manera que la parte real de una función de
onda no normalizada representara la parte transversal del campo eléctrico instantáneo asociado
al fotón. La normalización de la función de onda se interpretaría como la densidad de energía
del fotón. Los diferentes estados de polarización elíptica se corresponden con los estados puros
de la descripción cuántica.

3.4.2. Superposición coherente

Si tenemos dos estados puros, y por lo tanto vectoriales, |Φ > y |Ψ >, el vector α|Φ >
+β|Ψ > una vez normalizado, representará otro estado puro y se dice que es la superposición
coherente de ambos. En este caso lo que admitimos es que la fase relativa con que se superponen
ambos estados es importante.
( Supongamos
) por sencillez
( ) que nos estamos reriendo básicamente a los dos estados polares
1 0
exp(i(kz − ωt)) y exp(i(kz − ωt)), y que α y β los tomamos en principio reales con
0 1 ( )
α
α + β = 1. Entonces el vector estado a que dan lugar es el
2 2 exp(i(kz − ωt)) y como
( 2 ) β
α αβ
proyector el que viene representado en la esfera por el vector [αβ, 0, (α2 − β 2 )/2] y
αβ β 2
por lo tanto en el meridiano que está en el plano XOZ por el punto P representado en la gura
3.4 siendo N P = β y P S = α.
En efecto, a3 = (α2 − β 2 )/2 = 1/2 − β 2 = α2 − 1/2, y por lo tanto las distancias del punto
P a los planos tangentes a los polos son iguales a β 2 y α2 respectivamente. Si α = β , el punto
representativo estará sobre el ecuador. Estos valores α2 y β 2 son las probabilidades de que el
estado sea el N o el S , o bien las proporciones que de los estados N y S utilizamos para construir
su superposición.
Si α y β son en general complejos, una vez extraída la fase de α, que lo supondremos en
adelante real, el estado se reduce a (3.50) y (3.51), con lo que aquella superposición coherente
3.4. APÉNDICE: ESTADOS DE POLARIZACIÓN DE LA LUZ 181

Figura 3.4: El punto P representa la superposición coherente de los estados N y S con


coecientes reales α y β.

con los mismos a y b y diferentes δ , nos produce todos los puntos de un mismo paralelo. Además
δ es el ángulo acimutal y el giro es en el sentido positivo (horario) alrededor de un eje que va
del segundo estado al primero.

Figura 3.5: El punto P es la superposición coherente de N y S con coecientes a y beiδ .

La situación es totalmente simétrica si la superposición la efectuamos a partir de dos estados


arbitrarios ortogonales. Tenemos sobre la√ esfera dos puntos opuestos. A continuación determi-
namos la superposición con α = β = 1/ 2, la cual nos determina la posición del meridiano
cero. A partir de ahí giraremos en sentido positivo el ángulo δ , y el paralelo correspondiente
dependerá de los valores a y b.
Por lo tanto la superposición coherente es una aplicación denida sobre la supercie de la
esfera, tal que a cada par de puntos opuestos, y dados los correspondientes números a y beiδ ,
les corresponde otro punto de la supercie, construído de la forma anteriormente señalada.
182 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

3.4.3. Superposición incoherente

Sean |Φ1 > y |Φ2 > dos estados puros ortogonales, caracterizados por los proyectores E1 y
E2 , y por los vectores reales a y −a. Si denimos el estado ρ = αE1 + (1 − α)E2 , con 0 < α < 1,
representa una superposición que decimos es incoherente, de ambos estados en las proporciones
α y 1 − α. En esta representación, el vector que lo caracteriza es el αa − (1 − α)a = (2α − 1)a.
El punto característico en la gura 3.6, está por lo tanto en la línea de unión de los dos estados
puros, de tal forma que P A = (1 − α) y P B = α. Es por lo tanto el centro de masa de dos
masas α y (1 − α) situadas en A y B respectivamente.

Figura 3.6: El punto P es la superposición incoherente de los estados puros A y B en las


proporciones α y 1 − α, respectivamente.

Podemos interpretar la superposición incoherente como el centro de masa de todas las posi-
bles superposiciones coherentes en las mismas proporciones de A y B , en las que la fase relativa
δ se deja libre. En este caso obtendríamos todos los posibles estados del paralelo que dista de
los planos polares (1 − α) y α respectivamente.
Si ρ1 , ρ2 , . . . , ρk son k estados puros, y por lo tanto representados por ∑
sendos puntos de la
∑ de la esfera de estados, y α1 , α2 , . . . , αk , 0 ≤ αi ≤ 1 tal que
supercie αi = 1, entonces
ρ= αi ρi se dice que es la mezcla incoherente, con pesos αi de los k estados puros ρi . Su
punto representativo vendrá dado por el baricentro de los correspondientes puntos ρi en los que
se ha supuesto colocado un peso de valor αi . Los estados puros son los únicos que no pueden
expresarse como combinación lineal convexa de otros estados puros.
La superposición incoherente se convierte así en la combinación lineal convexa de vectores
de R3 , pertenecientes a la supercie de la esfera de radio 1/2.

3.4.4. Filtros

Son observables tales que si el sistema está en un estado cualquiera lo proyectan en un


posible estado puro. Vienen representados por proyectores y se caracterizan por el proyector
correspondiente sobre el estado que ltran. Si el estado inicial del sistema es ρ, entonces la
medida de E en el estado ρ viene dada por < E >= TrρE , en tanto que el nuevo estado en
el que queda ′
( el fotón
) después de la medida, es el ρ = EρE/Tr(ρE). Por ejemplo supongamos
1 0
que ρ1 = y sea E el proyector sobre el estado dado por el vector a de componentes
0 0
3.4. APÉNDICE: ESTADOS DE POLARIZACIÓN DE LA LUZ 183
( √ )
√ − 3i/4
[0, 3/4, 1/4], es decir E = √3/4 . El valor esperado de E en el estado ρ1 vale
3i/4 1/4
3/4, que es precisamente la proporción en que el estado E se compone a partir de ρ1 y de su
estado ortogonal. Después de su medida, el estado en que queda el sistema es:
( √ )
′ √3/4 − 3i/4
ρ = Eρ1 E/T r(ρ1 E) = (4/3)Eρ1 E = =E
3i/4 1/4

es decir el propio E .

( )
1
Desde el punto de vista vectorial por ser el estado puro, |ρ1 >≡ por lo que el valor
0

esperado < E;(ρ1√>=< ) ρ1 |Eρ1 >= 3/4 y el estado nal del sistema será el |ρ1 >= E|ρ1 >
3/2
/||E|ρ1 > || = que resulta ser precisamente el propio estado E , pues |ρ′1 >< ρ′1 | = E .
i/2 ( )
3/4 0
Si el estado inicial no es puro, por ejemplo ρ2 = , que corresponde a una
0 1/4
superposición incoherente de 3/4 del ρ1 anterior y 1/4 de su complementario ortogonal, entonces
< E; ρ2 >= T rρ2 E = 5/8, es decir aquella parte de ρ2 que se proyecta en E , y el estado nal
ρ′2 resulta ser el propio estado E .
Si el estado
( inicial es
) un estado totalmente incoherente, como el dado por el operador den-
1/2 0
sidad ρ3 = , representado por el punto O, entonces < E; ρ3 >= 1/2, ya que dicho
0 1/2
estado incoherente también se puede formar a partir de E y de su complementario ortogonal al
50 %.
184 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

3.5. Apéndice: Espinores


En esta sección de contenido puramente matemático, revisaremos las propiedades principales
de los espinores, en particular las relacionadas con las posibles representaciones del grupo de
rotaciones que describen objetos de espín 1/2. Vamos a encontrar estas representaciones a partir
de funciones propias de los diferentes operadores de espín que conmutan. Pero conviene resaltar
que además de tener operadores de espín referidos al sistema de referencia del observador inercial,
u observador del laboratorio, también tenemos operadores de espín referidos a los ejes ligados a
la partícula, ya que, en general, las partículas que analizamos poseen orientación como variables
cinemáticas y por lo tanto podemos asignarles un triedro cartesiano comóvil, que rota. Esto nos
va a producir el resultado de que una partícula de espín 1/2, su función de onda, necesariamente,
posee cuatro componentes.
Todos los cálculos de este apéndice resultan abrumadores si se tratan de hacer a mano,
por lo que el uso de un programa de cálculo algebráico facilita la tarea. Son muchas las de-
rivadas e integrales de funciones complejas que hay que realizar para determinar productos
escalares y representaciones matriciales de los diferentes operadores. En mi página web el che-
ro http://tp.lc.ehu.es/documents/SpinorsNotesBilbao.nb, es un notebook del programa
Mathematica11 en el que se recogen los cálculos de este apéndice.
La función de onda más general de una partícula elemental es una función compleja de las
diez variables cinemáticas, Φ(t, r, u, ρ), y la parte del espín está ligada con la dependencia de
las variables invariantes por traslación u y ρ y viene dado por el operador

S = u × U + W = Z + W, (3.52)

donde Z y W están dados por los operadores


~ ~
Z = u × ∇u , W = {∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )} . (3.53)
i 2i
Éstos últimos se expresan en la representación tan(α/2) del grupo de rotaciones, como se ha
expresado en las secciones anteriores. ∇u y ∇ρ son respectivamente, los operadores gradiente
con respecto a las variables u y ρ. Estos operadores conmutan entre sí y conmutan con los
operadores H = i~∂/∂t y P = −i~∇. Son por lo tanto operadores invariantes por traslación.
Esta característica nos permite separar la función de onda más general en términos de funciones
de variables espacio-temporales y de funciones de las variables velocidad-orientación, donde
estas últimas nos describirán las propiedades invariantes por traslación de la partícula.
Los operadores de espín satisfacen las reglas de conmutación

[Z, Z] = i~Z, [W , W ] = i~W , [Z, W ] = 0, (3.54)

y por lo tanto
[S, S] = i~S.

3.5.1. Vectores unidad


Como estamos describiendo la orientación de la partícula colocando un conjunto de tres
vectores unidad ortogonales ei , cuya orientación espacial viene dada en términos de las variables
ρ o α, entonces, si escogemos que en el instante inicial τ = 0, estos ejes coincidan con los del
laboratorio, las componentes de los vectores ei en cualquier instante, vienen dados por

(ei )j = Rji (α) = δji cos α + nj ni (1 − cos α) − ϵjik nk sin α, (3.55)


11
Mathematica, es un programa de cálculo registrado por Wolfram Research Inc. 100 Trade Center Drive,
Champaign, IL 61820-7237, USA.
3.5. APÉNDICE: ESPINORES 185

en la parametrización normal, y en la parametrización ρ por


1
(ei )j = Rji (ρ) = ((1 − ρ2 )δji + 2ρj ρi − 2ϵjik ρk ). (3.56)
1 + ρ2
Las componentes cartesianas del vector unidad que dene el eje de rotación n son:
n1 = sin θ cos ϕ, n2 = sin θ sin ϕ, n3 = cos θ, (3.57)
donde θ es el ángulo polar y ϕ es el ángulo acimutal. Explícitamente:
e11 = cos α + sin2 θ cos2 ϕ(1 − cos α),
e12 = cos θ sin α + sin2 θ sin ϕ cos ϕ(1 − cos α),
e13 = − sin θ sin ϕ sin α + sin θ cos θ cos ϕ(1 − cos α),

e21 = − cos θ sin α + sin2 θ sin ϕ cos ϕ(1 − cos α),


e22 = cos α + sin2 θ sin2 ϕ(1 − cos α),
e23 = sin θ cos ϕ sin α + sin θ cos θ sin ϕ(1 − cos α),

e31 = sin θ sin ϕ sin α + sin θ cos θ cos ϕ(1 − cos α),
e32 = − sin θ cos ϕ sin α + sin θ cos θ sin ϕ(1 − cos α),
e33 = cos α + cos2 θ(1 − cos α),
en la representación normal α = αn, o parametrización normal del grupo de rotaciones. En la
parametrización ρ = tan(α/2)n, resulta ser
e11 = (1 + ρ21 − ρ22 − ρ23 )/(1 + ρ2 ),
e12 = (2ρ1 ρ2 + 2ρ3 )/(1 + ρ2 ),
e13 = (2ρ1 ρ3 − 2ρ2 )/(1 + ρ2 ),

e21 = (2ρ2 ρ1 − 2ρ3 )/(1 + ρ2 ),


e22 = (1 − ρ21 + ρ22 − ρ23 )/(1 + ρ2 ),
e23 = (2ρ2 ρ3 + 2ρ1 )/(1 + ρ2 ),

e31 = (2ρ1 ρ3 + 2ρ2 )/(1 + ρ2 ),


e32 = (2ρ3 ρ2 − 2ρ1 )/(1 + ρ2 ),
e33 = (1 − ρ21 − ρ22 + ρ23 )/(1 + ρ2 ),
donde ρ2 ≡ ρ21 + ρ22 + ρ23 = tan2 (α/2).

3.5.2. Proyección del espín en los vectores unidad


Además de los operadores que denen las diferentes componentes del espín Si , Zi y Wi
en el sistema de referencia del laboratorio, podemos encontrar otro conjunto de operadores de
espín. Éstos son las proyecciones de los operadores de espín en los ejes del cuerpo ei , es decir,
los operadores Ri = ei · S , Mi = ei · Z y Ti = ei · W , respectivamente. En particular, los
operadores de espín Ti , recolectando los términos de (3.56) y (3.53), tienen la expresión

k=3
~ ∑
k=3
( )
Ti = (ei )k Wk = 2
(1 − ρ2 )δik + 2ρi ρk − 2ϵkij ρj
2i(1 + ρ )
k=1 k=1
( )
∂ ∂
× + ϵklr ρl + ρk (ρ · ∇ρ ) ,
∂ρk ∂ρr
186 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

que después de algunas manipulaciones toman la forma vectorial


~
T = {∇ρ − ρ × ∇ρ + ρ(ρ · ∇ρ )} . (3.58)
2i
Vemos, por inspección, que este resultado puede también obtenerse de la expresión de W
en (3.53), sin más que reemplazar ρ por −ρ, seguido de un cambio global de signo. Esto es
así porque nosotros describimos la orientación de la partícula por el vector ρ en el sistema de
referencia del laboratorio, pero desde el punto de vista activo, es decir, con los ejes del laboratorio
jos y lo que gira son los ejes del cuerpo. Sin embargo la orientación con respecto a los ejes
del cuerpo se hace describiendo el movimiento de los ejes del laboratorio, cuya orientación con
respecto a los del cuerpo es −ρ, y el cambio global de signo de los operadores proviene de
cambiar la interpretación activa por la pasiva.
Satisfacen las reglas de conmutación

[T , T ] = −i~T , [T , W ] = 0.

donde el signo menos de los primeros conmutadores frente a las relaciones de conmutación de
los momentos angulares, realzan el hecho de que son operadores del álgebra de Lie del grupo de
rotaciones, en una representación pasiva. En general todos los operadores de espín proyectados
en los ejes del cuerpo, Ri , Mi y Ti , conmutan con las correspondientes proyecciones en el
laboratorio Si , Zi y Wi . Esto es conforme al principio de indeterminación, ya que componentes
del espín con respecto a sistemas de referencia diferentes, son observables compatibles y por lo
tanto conmutan.

3.5.3. Funciones de onda espinoriales


Para encontrar las funciones propias de los operadores de espín tenemos que resolver ecua-
ciones de la forma:

S 2 χ(u, ρ) = s(s + 1)~2 χ(u, ρ), S3 χ(u, ρ) = m~χ(u, ρ).

Pero como también tenemos operadores de espín proyectados en los ejes del cuerpo que conmutan
con los anteriores, podemos ampliar el conjunto de operadores que conmutan. Podemos exigir,
por ejemplo, que las funciones anteriores sean también vectores propios de T3 ,

T3 χ(u, ρ) = n~χ(u, ρ),

de tal manera que el conjunto completo de observables que conmutan también incluye proyec-
ciones del espín en los ejes del cuerpo.
El operador espín al cuadrado

S 2 = Z 2 + W 2 + 2Z · W , (3.59)

se expresa según (3.54) como la suma de tres operadores que conmutan, por lo que sus vectores
propios se escogerán como vectores propios simultáneos de los tres operadores de la derecha de
(3.59). Los operadores Z y W derivan la función de onda con respecto a las variables u y ρ.
Podemos separar cada χ(u, ρ) en la forma

χ(u, ρ) = Uj (u) Vj (ρ), (3.60)
j

donde la suma va sobre un rango nito, y donde Uj (u) serán funciones propias de Z 2 y Vj (ρ)
de W 2 , respectivamente.
3.5. APÉNDICE: ESPINORES 187

3.5.4. Representaciones sobre la esfera unidad. Armónicos esféricos


Las funciones Uj (u) son múltiplos de los armónicos esféricos denidos sobre la orientación
del vector velocidad u, ya que el operador Z tiene la estructura de un momento angular orbital
en términos de las variables u. Sus valores propios son enteros. El factor global es una función
arbitraria del valor absoluto de la velocidad, u.
En efecto, si la velocidad la expresamos en cordenadas polares esféricas, u ≡ (u, β, λ), donde
β es el ángulo polar y λ el acimutal

ux = u sin β cos λ, uy = u sin β sin λ, uz = u cos β,

las componentes del momento angular Zi aparecen como:


( ) ( )
∂ cos β ∂ ∂ cos β ∂ ∂
Z1 = i~ sin λ + cos λ , Z2 = −i~ cos λ − sin λ , Z3 = −i~ ,
∂β sin β ∂λ ∂β sin β ∂λ ∂λ
{ }
±iλ ∂ cos β ∂
Z± = Z1 ± iZ2 = ~e ± +i . (3.61)
∂β sin β ∂λ
Vemos que son independientes de la variable u, ya que en realidad el grupo de rotaciones sobre
R3 lo que hace es transformar puntos de la supercie de una esfera en puntos de esa misma
esfera, es decir, actúa de forma transitiva sobre las esferas centradas en el origen, cualesquiera
que sea el radio u.
El operador Z 2 que conmuta con los tres Zi , toma la forma
[ 2 ]
∂ cos β ∂ 1 ∂2
Z = −~
2 2
+ + . (3.62)
∂β 2 sin β ∂β sin2 β ∂λ2

Podemos por lo tanto buscar funciones propias comunes a Z 2 y Z3 en la forma f (u)G(β, λ),
con f (u) arbitraria y respecto de la parte que depende de las variables angulares

Z 2 Ylm (β, λ) = l(l + 1)~2 Ylm (β, λ), Z3 Ylm (β, λ) = m~Ylm (β, λ).

Solo existen soluciones de este sistema de ecuaciones diferenciales para valores enteros de l y
con m = −l, −l + 1, . . . , l. Las funciones |l, m >≡ Ylm (β, λ), denidas sobre la esfera unidad,
reciben el nombre de armónicos esféricos. La medida sobre la esfera normalizada en la unidad
es ∫ π ∫ 2π
1
dβ sin βdλ = 1 (3.63)
0 0 4π
Los armónicos esféricos son ortogonales respecto del producto escalar hermítico denido me-
diante ∫ 2π ∫ π
1
< l, m|s, n >= dλ sin βdβ Ylm∗ (β, λ)Ysn (β, λ) = δmn δls ,
4π 0 0
es decir respecto de la medida invariante y normalizada sobre la esfera unidad (1/4π) sin βdβdλ.
La solución del sistema consiste en buscar las funciones de la forma Yll (β, λ) en variables sepa-
radas Yll (β, λ) = Al (β)Bl (λ), que satisfagan

Z+ Al (β)Bl (λ) = 0, Z3 Al (β)Bl (λ) = l~Al (β)Bl (λ),

es decir,
A′l − l(cos β/ sin β)Al = 0, −iBl′ = lBl ,
que resultan ser proporcionales a las funciones Al (β) ≃ sinl β y Bl (λ) ≃ exp(ilλ). Como sobre
la supercie de la esfera el punto (β, λ) es el mismo que el (β, λ + 2π), resulta que exp(ilλ) =
exp(il(λ + 2π)), lo que implica que necesariamente l debe ser un número entero.
188 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

Estas funciones, una vez normalizadas con respecto a la medida (3.63) se pueden escribir
como √
(2l + 1)(2l)!
l
Yl (β, λ) = (−1) l
sinl β eilλ , (3.64)
22l (l!)2
y el resto se obtienen de éstos mediante la acción reiterada sobre ellos de Z− . No existen vectores
propios correspondientes a valores propios semienteros, ya que la supercie de la esfera no es el
espacio homogéneo de mayor dimensión. Podemos ver que Ylm∗ = (−1)m Yl−m , y los primeros
armónicos normalizados en la unidad son:

|0, 0 >= 1,
√ √
3 √ 3
|1, 1 >= − sin β eiλ , |1, 0 >= 3 cos β, sin β e−iλ ,
|1, −1 >=
2 2
√ √ √
15 15 5
|2, 2 >= sin β e , |2, 1 >= −
2 2iλ
sin β cos β e , |2, 0 >=

(3 cos2 β − 1).
8 2 4
Para obtener la forma más general de un espinor hay que encontrar también la parte Vj (ρ),
que depende de las variables de orientación. Esto lo haremos a continuación tras el análisis de
la acción del grupo de rotaciones sobre sí mismo, como grupo de transformaciones.

3.5.5. Representaciones espinoriales sobre SU(2)


Vamos a describir en detalle la parte de la función de onda ligada con la orientación, V (ρ).
Si no existiera contribución al espín proviniente de la parte del zitterbewegung Z , el operador
espín (3.52) se reduciría al operador W dado en (3.53). Para obtener las ecuaciones de valores
propios vamos primero a escribir estos operadores en coordenadas esféricas.
Si representamos el vector ρ = tan(α/2)n = rn, en coordenadas esféricas como (r, θ, ϕ),
siendo r = |ρ| = tan(α/2) y θ y ϕ los ángulos polar y acimutal del vector unidad n, respecti-
vamente, entonces el vector unidad n tiene por componentes cartesianas las dadas en (3.57). Si
a partir de ahora tomamos ~ = 1, los operadores de espín (3.53) quedan representados por los
operadores diferenciales
[ ( ) ( ) ]
1 ∂ 1 ∂ sin ϕ cos θ cos ϕ ∂
W1 = 2
(1 + r ) sin θ cos ϕ + cos θ cos ϕ − sin ϕ − + ,
2i ∂r r ∂θ r sin θ sin θ ∂ϕ
[ ( ) ( ) ]
1 ∂ 1 ∂ cos θ sin ϕ cos ϕ ∂
W2 = (1 + r2 ) sin θ sin ϕ + cos θ sin ϕ + cos ϕ − − ,
2i ∂r r ∂θ sin θ r sin θ ∂ϕ
[ ]
1 ∂ sin θ ∂ ∂
W3 = 2
(1 + r ) cos θ − + .
2i ∂r r ∂θ ∂ϕ
El operador de Casimir del grupo de rotaciones W 2 es:
[ { 2 }]
1 + r2 2 ∂
2 2(1 + r2 ) ∂ 1 ∂ cos θ ∂ 1 ∂2
W =−
2
(1 + r ) 2 + + + + .
4 ∂r r ∂r r2 ∂θ2 sin θ ∂θ sin2 θ ∂ϕ2

Los operadores de espín de subida(up) y bajada(down) denidos como habitualmente por


W± = W1 ± iW2 , son
[ ( ) ( ) ]
eiϕ ∂ cos θ + ir ∂ r cos θ − i ∂
W+ = 2
(1 + r ) sin θ + − ,
2i ∂r r ∂θ r sin θ ∂ϕ
[ ( ) ( ) ]
e−iϕ ∂ cos θ − ir ∂ r cos θ + i ∂
W− = 2
(1 + r ) sin θ + − .
2i ∂r r ∂θ r sin θ ∂ϕ
3.5. APÉNDICE: ESPINORES 189

Satisfacen las reglas de conmutación

[W3 , W+ ] = W+ , [W3 , W− ] = −W− , [W+ , W− ] = 2W3 .

Podemos vericar que (Wi )∗ = −Wi y que W+ = −(W− )∗ , donde ∗ signica tomar el complejo
conjugado del correspondiente operador.
Si Fsm (r, θ, ϕ) es una función propia de W 2 y W3 , satisface las ecuaciones diferenciales:

W 2 Fsm (r, θ, ϕ) = s(s + 1)Fsm (r, θ, ϕ), W3 Fsm (r, θ, ϕ) = mFsm (r, θ, ϕ).

Para obtener soluciones de este sistema, vamos a proceder de la siguiente manera. Primero
vamos a calcular las funciones propias de la forma Fss . Sobre ellas el operador W+ nos produce
W+ Fss = 0 y después, actuando sucesivamente con el operador W− obtendremos las restantes
funciones propias Fsm de la misma representación irreducible caracterizada por el parámetro s
y para −s ≤ m ≤ s. El objetivo es encontrar primero las funciones Fss .
Consideremos que podemos escribir las funciones Fss en variables separadas en la forma
Fs (r, θ, ϕ) = A(r)B(θ)C(ϕ). Entonces
s

W3 A(r)B(θ)C(ϕ) = sA(r)B(θ)C(ϕ)

da lugar a
sin θ
(1 + r2 ) cos θA′ BC − AB ′ C + ABC ′ = 2isABC
r
donde A′ es la derivada de A y así con las demás, y dividiendo ambos lados por ABC llegamos
a
A′ (r) sin θ B ′ (θ) C ′ (ϕ)
(1 + r2 ) cos θ − + = 2is.
A(r) r B(θ) C(ϕ)
El tercer término de la izquierda debe ser constante, ya que los demás términos son indepen-
dientes de ϕ. Este término lo ponemos como C ′ (ϕ)/C(ϕ) = ik y por lo tanto C(ϕ) = eikϕ , salvo
un factor constante arbitrario. Como C(ϕ + 2π) = C(ϕ) implica que la constante k debe ser un
entero. Las otras dos funciones satisfacen:

r(1 + r2 ) cos θA′ B − sin θAB ′ + ir(k − 2s)AB = 0. (3.65)

Si existen soluciones con funciones reales A y B , entonces necesariamente k = 2s de tal manera


que el valor propio s puede ser un entero o un semientero, y la ecuación (3.65) se puede separar
en la forma:
A′ (r) sin θ B ′ (θ)
r(1 + r2 ) = = p = constante, (3.66)
A(r) cos θ B(θ)
cuya solución general, salvo un factor global constante, es
( 2 )p/2
r
A(r) = , B(θ) = (sin θ)p .
1 + r2
Si actuamos sobre esta solución Fss ≡ A(r)B(θ)C(ϕ), con W+ , como debe ser W+ Fss = 0,
nos produce:

r(1 + r2 ) sin2 θA′ B + (sin θ cos θ + ir sin θ)AB ′ − 2s(ir cos θ + 1)AB = 0.

Dividiendo ambos miembros por AB , teniendo en cuenta (3.66), obtenemos para los parámetros
la condición (p − 2s)(1 + ir cos θ) = 0. Entonces existen soluciones reales en variables separadas,
para todo p = 2s = k . Vienen dadas, salvo un factor global constante, por:
( 2 )s
r
s
Fs (r, θ, ϕ) = (sin θ)2s ei2sϕ . (3.67)
1 + r2
190 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

Para s = 1/2 y después de la acción con W− obtenemos los dos vectores ortogonales

1/2 r 1/2 −1/2 r cos θ + i


Ψ1/2 = √ sin θ eiϕ , W− Ψ1/2 = Ψ1/2 = √ ,
1 + r2 1 + r2
que producen una representación bidimensional del grupo de rotaciones. Podemos vericar que
−1/2
W− Ψ1/2 = 0.
Del análisis de la estructura de los operadores W± , si tomamos el complejo conjugado de la
expresión W+ Fss = 0 obtenemos −W− (Fss )∗ = 0 y por lo tanto (Fss )∗ ∼ G−s
s de tal manera que
tomando los espinores complejos conjugados de la anterior representación, obtenemos otro par
de espinores ortogonales correspondientes a s = 1/2.
cos θ − i
e 1/2 = r√ e −1/2 = √ r
Ψ 1/2 , Ψ 1/2 sin θ e−iϕ .
1 + r2 1 + r2
Las restantes representaciones para espines superiores se pueden obtener por el mismo pro-
cedimiento. Otra forma es obtenerlas mediante productos tensoriales de las dos representaciones
irreducibles bidimensionales anteriores. Por ejemplo, para s = 1 podemos obtener tres repre-
sentaciones ortogonales. Si de (3.67) con s = 1 y actuando con el operador W− obtenemos

1/2 r2
Ψ11 = (Ψ1/2 )2 = sin2 θ ei2ϕ ,
1 + r2
1/2 −1/2 r
Ψ01 = (Ψ1/2 )(Ψ1/2 ) = sin θ (i + r cos θ) eiϕ ,
1 + r2
−1/2 (i + r cos θ)2
Ψ−1
1 = (Ψ1/2 )
2
= ,
1 + r2
que también puede obtenerse como el producto tensorial de Ψ ⊗ Ψ.
Si hubiéramos trabajado en la representación canónica, donde los parámetros son α = αn,
esto equivale a reemplazar la variable r = tan(α/2) en términos del parámetro α y expresar el
operador diferencial ∂/∂r en términos de ∂/∂α, por lo que los operadores de espín quedan
[ ( ) ( ) ]
1 ∂ cos θ cos ϕ ∂ sin ϕ cos θ cos ϕ ∂
W1 = 2 sin θ cos ϕ + − sin ϕ − + ,
2i ∂α tan(α/2) ∂θ tan(α/2) sin θ sin θ ∂ϕ
[ ( ) ( ) ]
1 ∂ cos θ sin ϕ ∂ cos θ sin ϕ cos ϕ ∂
W2 = 2 sin θ sin ϕ + + cos ϕ − − ,
2i ∂α tan(α/2) ∂θ sin θ tan(α/2) sin θ ∂ϕ
[ ]
1 ∂ sin θ ∂ ∂
W3 = 2 cos θ − + ,
2i ∂α tan(α/2) ∂θ ∂ϕ
[ 2 { 2 }]
∂ 1 ∂ 1 ∂ cos θ ∂ 1 ∂2
W =−
2
+ + + + ,
∂α2 tan(α/2) ∂α 4 sin2 (α/2) ∂θ2 sin θ ∂θ sin2 θ ∂ϕ2
[ ( ) ( ) ]
eiϕ ∂ cos θ ∂ cos θ tan(α/2) − i ∂
W+ = 2 sin θ + +i − ,
2i ∂α tan(α/2) ∂θ tan(α/2) sin θ ∂ϕ
[ ( ) ( ) ]
e−iϕ ∂ cos θ ∂ cos θ tan(α/2) + i ∂
W− = 2 sin θ + −i −
2i ∂α tan(α/2) ∂θ tan(α/2) sin θ ∂ϕ
y los espinores de las dos representaciones ortogonales bidimensionales se escriben como
1/2 α −1/2 α α
Ψ1/2 = i sin sin θ eiϕ , Ψ1/2 = cos − i sin cos θ (3.68)
2 2 2
y
e 1/2 = cos α + i sin α cos θ,
Ψ e −1/2 = −i sin α sin θ e−iϕ .
Ψ (3.69)
1/2 2 2 1/2 2
3.5. APÉNDICE: ESPINORES 191

Se ha mencionado que los anteriores espinores son ortogonales. Para dotar a este espacio
de funciones con una estructura de espacio de Hilbert es necesario denir un producto escalar,
hermítico, denido positivo. La matriz Jacobiana de las variables ρ′ en términos de las variables
ρ dada en (3.39), posee por determinante
( )
∂ρ′ i (1 + µ2 )2
det = ,
∂ρj (1 − µ · ρ)4

y la transformación del elemento de volumen

(1 + µ2 )2 3
d 3 ρ′ = d ρ.
(1 − µ · ρ)4

A partir de (3.39) obtenemos que

(1 + µ2 )
1 + ρ′ =
2
(1 + ρ2 )
(1 − µ · ρ)2

por lo que la medida


( )2
d 3 ρ′ (1 − µ · ρ)2 (1 + µ2 )2 3 d3 ρ
= d ρ =
(1 + ρ′ 2 )2 (1 + µ2 )(1 + ρ2 ) (1 − µ · ρ)4 (1 + ρ2 )2

es de hecho una medida invariante.


En coordenadas esféricas se escribe como
r2 sin θ
drdθdϕ
(1 + r2 )2

y en la representación normal es

sin2 (α/2) sin θdαdθdϕ.

Como el grupo de rotaciones es un grupo doblemente conexo, la medida anterior tiene


que estar denida sobre una variedad simplemente conexa, es decir, sobre el grupo recubridor
universal del grupo de rotaciones SO(3), que es el grupo SU (2). La variedad del grupo SU (2)
en la representación canónica viene dada por la esfera tridimensional de radio 2π en la que los
puntos de su supercie representan a un único elemento de SU (2), la matriz unitaria 2 × 2, −I.
La medida invariante y normalizada resulta ser
1
dµN (α, θ, ϕ) ≡ sin2 (α/2) sin θ dα dθ dϕ. (3.70)
4π 2
∫ 2π ∫ π ∫ 2π
1
dα dθ dϕ sin2 (α/2) sin θ = 1.
0 0 0 4π 2
Por lo tanto, el producto escalar hermítico queda denido como
∫ 2π ∫ π ∫ 2π
1
< f |g >= 2 dα dθ dϕ f ∗ (α, θ, ϕ)g(α, θ, ϕ) sin2 (α/2) sin θ, (3.71)
4π 0 0 0

donde f ∗ es la función compleja conjugada de la f .


Los anteriores espinores son vectores ortogonales con respecto a esta medida invariante
(3.70). En particular, los espinores normalizados
√ correspondientes a s = 1/2 vienen dados en
(3.68)-(3.69), multiplicados por el factor 2.
192 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

Los operadores de espín proyectados en los ejes del cuerpo ei , vienen dados en (3.58) en la
parametrización ρ, y hemos visto que dieren de los operadores W únicamente en el cambio
ρ → −ρ, seguido de un cambio global de signo. Esto corresponde en la parametrización canónica
al cambio α → −α, seguido del cambio global de signo.
Estos operadores son
[ ( )
1 ∂ cos θ cos ϕ ∂
T1 = 2 sin θ cos ϕ + + sin ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
sin ϕ cos θ cos ϕ ∂
− , (3.72)
tan(α/2) sin θ sin θ ∂ϕ

[ ( )
1 ∂ cos θ sin ϕ ∂
T2 = 2 sin θ sin ϕ + − cos ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
cos θ sin ϕ cos ϕ ∂
− − , (3.73)
sin θ tan(α/2) sin θ ∂ϕ
[ ]
1 ∂ sin θ ∂ ∂
T3 = 2 cos θ − − . (3.74)
2i ∂α tan(α/2) ∂θ ∂ϕ
Se puede vericar, como se ha mencionado anteriormente, que satisfacen las reglas de con-
mutación:
[Ti , Tk ] = −iϵikl Tl , (3.75)
[Wi , Tk ] = 0. (3.76)
Como W 2 = T 2 podemos encontrar vectores propios comunes de los operadores W 2 , W3 y
(s)
T3 , que los denotaremos por Dmn (α) de tal manera que

W 2 Dmn
(s) (s)
(α) = s(s + 1)Dmn (α),
(s) (s)
W3 Dmn (α) = mDmn (α),
(s) (s)
T3 Dmn (α) = nDmn (α).
(s) (s)
Como W3 (α)Dmn (α) = mDmn (α), si producimos el cambio α → −α obtenemos que
(s) (s)
W3 (−α)Dmn (−α) = mDmn (−α) y el posterior cambio global de signo lo reduce a

−W3 (−α)Dmn
(s) (s)
(−α) = T3 (α)Dmn (−α) = −mDmn
(s)
(−α),

por lo que los anteriores espinores (3.68)-(3.69) son también vectores propios de T3 .
Con esta notación, los cuatro espinores normalizados, denotados por los correspondientes
valores propios |s, m, n >, son

Φ1 = |1/2, 1/2, 1/2 > = 2(cos(α/2) + i cos θ sin(α/2)), (3.77)
√ −iϕ
Φ2 = |1/2, −1/2, 1/2 > = i 2 sin(α/2) sin θe , (3.78)

Φ3 = |1/2, 1/2, −1/2 > = i 2 sin(α/2) sin θe . iϕ
(3.79)

Φ4 = |1/2, −1/2, −1/2 > = 2(cos(α/2) − i cos θ sin(α/2)), (3.80)

Forman un conjunto ortonormal con respecto a la medida normalizada e invariante (3.70) y


con respecto al producto escalar denido en (3.71). Podemos comprobar que los operadores
de bajada W− Φ1 = Φ2 , W− Φ2 = 0, W− Φ3 = Φ4 , W− Φ4 = 0, y análogamente T− Φ1 = 0,
T− Φ3 = Φ1 , T− Φ2 = 0, and T− Φ4 = Φ2 , y las correspondientes relaciones cuando se actúa
con los operadores que suben W+ y T+ , respectivamente. Observar que debido al signo opuesto
en las relaciones de conmutación de los operadores Ti , los operadores T± operan en sentido
contrario.
3.5. APÉNDICE: ESPINORES 193

La razón es que [W3 , W± ] = ±W± , mientras que [T3 , T± ] = ∓T± . Esto trae consigo que si |w, m >
es vector propio de W3 con valor propio m, W3 |w, m >= m|w, m >, la acción de W+ produce un
vector propio de W3 con valor propio m + 1. En efecto

W3 (W+ |w, m >) = (W+ + W+ W3 )|w, m >= W+ |w, m > +W+ m|w, m >= (m + 1)(W+ |w, m >),
mientras que si |t, r > es vector propio de T3 con valor propio r, T+ |t, r > es vector propio de T3
con valor propio r − 1. En efecto
T3 T+ |t, r >) = (−T+ + T+ T3 )|t, r >= −T+ |t, r > +T+ r|t, r >= (r − 1)(T+ |t, r >).

Un aspecto importante que conviene resaltar es que para las partículas de espín 1/2, a pesar
de que las representaciones irreducibles correspondientes a s = 1/2, son bidimensionales, para
describir la parte del espín de la función de onda, necesitamos una función compleja de un espacio
de Hilbert de dimensión cuatro, ya que para describir la orientación de la partícula, tenemos
que asociar a la misma un sistema de referencia local, por lo que además de la proyección del
espín en el sistema del laboratorio W , poseemos como observables las proyecciones del espín en
los ejes del cuerpo T , las cuales deben ser incluidas porque son operadores que conmutan con
los anteriores.

3.5.6. Representación matricial de los observables internos


La representación matricial de cualquier observable A que actúa sobre las variables de orien-
tación o en el espacio de Hilbert de dimensión cuatro generado por estos cuatro espinores de
espín 1/2, Φi , se obtiene de Aij =< Φi |AΦj >, i, j = 1, 2, 3, 4. Una vez que jamos estos cua-
tro vectores básicos normalizados, cuando los operadores actúan sobre el subespacio que ellos
generan, los diferentes operadores diferenciales como Wi y Ti , van a tener una representación
matricial 4 × 4 por bloques de la forma:
( )
~ σ 0
S≡W = , (3.81)
2 0 σ
( ) ( ) ( )
~ 0 I ~ 0 iI ~ I 0
T1 = , T2 = , T3 = , (3.82)
2 I 0 2 −iI 0 2 0 −I
donde σ son las tres matrices de Pauli y I representa la matriz unidad 2 × 2. Hemos incluido la
constante de Planck en los operadores de momento angular.
Si de forma análoga calculamos la representación matricial de las nueve componentes, en
esa misma base, de los tres vectores unidad (ei )j , i, j = 1, 2, 3 que denen la orientación de la
partícula, obtenemos las nueve matrices hermíticas de traza nula
( ) ( ) ( )
1 0 σ 1 0 iσ 1 σ 0
e1 = , e2 = , e3 = . (3.83)
3 σ 0 3 −iσ 0 3 0 −σ
Podemos vericar que Ti = S · ei = ei · S . Vemos que en general las diferentes componentes de
los vectores unidad ei , no conmutan entre sí. Los valores propios de cada componente eij , en
esta representación matricial son ±1/3. Sin embargo, la representación matricial del cuadrado
de cada una de las componentes es (eij )2 = ∑I/3, de tal forma que la magnitud al cuadrado de
cada vector unidad es efectivamente e2i = j (eij )2 = I, la matriz unidad. Los valores propios
de los operadores (eij )2 no son los cuadrados de los valores propios de los operadores eij . Esto
es debido a que en general, la función eij Φk no pertenece al mismo espacio que el que generan
las funciones Φk , k = 1, . . . , 4, a pesar de que este subespacio es invariante bajo los operadores
Wi y Tj . De hecho, cada función eij Φk es una combinación lineal de un espinor de espín 1/2 y
de un espinor de espín 3/2.
No se entiende por qué cualquier componente del vector unidad eij de un sistema cartesiano
puede tener como valores propios ±1/3 en el caso cuántico y su cuadrado (eij )2 = I/3 en vez
de ser I/9.
194 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

3.5.7. Teorema de Peter-Weyl para grupos compactos

Los espinores que acabamos de obtener, pueden ser obtenidos también por medio de un
teorema importante relativo a las representaciones de grupos compactos, y que se conoce en la
literatura como el teorema de Peter-Weyl 12 . Lo vamos a enunciar sin demostración la cual se
puede encontrar en cualquiera de las referencias citadas.

Teorema.- Sea D(s) (g) un sistema completo de representaciones unitarias no equi-


valentes e irreducibles de un grupo compacto G, enumeradas por el parámetro s.
(s)
Sea ds la dimensión de la correspondiente representación y Dij (g), 1 ≤ i, j ≤ ds los
correspondientes elementos matriciales. Entonces, las funciones
√ (s)
ds Dij (g), 1 ≤ i, j ≤ ds

forman un conjunto ortonormal completo sobre G, con respecto a una medida nor-
malizada e invariante µN (g) denida sobre este grupo, es decir,
∫ √ √
(s)∗ (r)
ds Dij (g) dr Dkl (g) dµN (g) = δ sr δik δjl . (3.84)
G

Que el conjunto es completo signica que cada función de cuadrado integrable denida sobre
G, f (g), admite un desarrollo en serie, convergente en norma, en términos de las funciones
(s)
ortogonales anteriores Dij (g), en la forma
∑ (s)
√ (s)
f (g) = aij ds Dij (g),
s,i,j

(s)
y donde los coecientes, en general números complejos aij , se obtienen a partir de
∫ √
(s) (s)∗
aij = ds Dij (g) f (g)dµN (g).
G

En nuestro caso, SU (2) considerado como la variedad de un grupo, es la esfera tridimensional


simplemente conexa de radio 2π , con una medida normalizada e invariante dada por (3.70),

1
dµN (α, θ, ϕ) = sin θ sin(α/2)2 dαdθdϕ.
4π 2
En la parametrización normal, las representaciones bidimensionales de SU (2) corresponden
a los valores propios s = 1/2 de S 2 y la representación matricial está dada por

D(1/2) (α) = cos(α/2)I − i sin(α/2)(n · σ),

con el vector unidad n dado en (3.57), es decir,


( )
(1/2) cos(α/2) − i cos θ sin(α/2) −i sin θ sin(α/2) e−iϕ
D (α) = .
−i sin θ sin(α/2) eiϕ cos(α/2) + i cos θ sin(α/2)
12
N. Ja. Vilenkin, Fonctions spéciales et Théorie de la représentation des groupes, Dunod, Paris (1969), p.
39.
A.O. Barut and R. Raczka, Theory of group representations and applications, PWN-Polish Scientic Publishers,
Warszawa (1980), p. 174.
F. Peter and H. Weyl, Math. Ann. 7, 735 (1927).
3.5. APÉNDICE: ESPINORES 195

Si comparamos estas componentes matriciales con los cuatro espinores ortogonales dados en
(3.77)-(3.80) vemos que ( )
1 Φ4 −Φ2
D (1/2)
(α) = √ , (3.85)
2 −Φ3 Φ1

es decir, 2 veces las 4 componentes matriciales de D(1/2) (α) son los cuatros espinores básicos
Φi .
En la representación tridimensional de SO(3), considerada como una representación 3 × 3
de SU(2)
(1)
Dij (α) ≡ D(1) (α, θ, ϕ) = δij cos α + ni nj (1 − cos α) + ϵikj nk sin α ≡ ej i

donde
n1 = sin θ cos ϕ, n2 = sin θ sin ϕ, n3 = cos θ,
obtenemos otro conjunto de nueve funciones ortogonales, en este caso todas reales, que resultan
ser las 9 componentes eij de los vectores unidad ligados al punto r . De acuerdo con el teorema

de Peter-Weyl, multiplicadas por 3, puesto que son matrices de dimensión 3 × 3, forman otro
conjunto ortonormal y ortogonal al conjunto anterior de cuatro espinores Φk .

3 < eij |ekl >= δik δjl i, j, k, l = 1, 2, 3, < eij |Φk >= 0, i, j = 1, 2, 3, k = 1, 2, 3, 4.

Resulta un buen ejercicio el vericar esta ortogonalidad, realizando las correspondientes inte-
grales por medios manuales o haciendo uso de algún programa de cálculo algebraico, como en
el chero notebook de Mathematica, mencionado. Estas 9 funciones son vectores propios del
operador W 2 con valor propio 1(1 + 1) = 2.

W 2 eij = 2eij , i, j = 1, 2, 3.

Respecto del grupo SU (2), Φ1 y Φ2 son vectores básicos de una representación irreducible. Lo
mismo sucede con Φ3 y Φ4 . Por lo tanto el producto tensorial de estas dos representaciones
generan hasta 3 posibles representaciones de espín 1. Así, si denimos las funciones, que en la
notación |w, w3 , t3 > son

3 2
g11 = Φ1 ≡ |1, 1, 1 >,
√2
3
g12 = Φ1 Φ2 ≡ |1, 0, 1 >,
2

3 2
g13 = Φ ≡ |1, −1, 1 >,
2 2

3 2
g21 = Φ3 ≡ |1, 1, −1 >,
√2
3
g22 = Φ3 Φ4 ≡ |1, 0, −1 >,
2

3 2
g23 = Φ ≡ |1, −1, −1 >,
2 4

3
g31 = Φ1 Φ3 ≡ |1, 1, 0 >,
2

g32 = 3(Φ1 Φ4 + Φ2 Φ3 ) ≡ |1, 0, 0 >,

3
g33 = Φ2 Φ4 ≡ |1, −1, 0 >,
2
196 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

Todos estos espinores son vectores propios de W 2 con valor propio 1(1 + 1),

W 2 gij = 2gij ,

los tres primeros g11 , g12 , g13 son vectores propios de T3 con valor propio 1, los g21 , g22 , g23 son
vectores propios de T3 con valor propio −1, y nalmente los g31 , g32 , g33 son vectores propios de
T3 con valor propio 0. Cada terna forma una representación irreducible de SO(3). Los g11 , g21 , g31
son vectores propios de W3 con valor propio 1, los g12 , g22 , g32 son vectores propios de W3 con
valor propio 0, y nalmente los g13 , g23 , g33 son vectores propios de W3 con valor propio −1.
Se puede comprobar que forman una base ortonormal de la representación 3 × 3 de todos
los objetos de espín 1 del grupo de rotaciones.

< gij |gkl >= δik δjl .



Como las funciones 3eij también forman una base ortonormal de esta representación es posible
expresarlas una en términos de la otra. Así, podemos comprobar que
√ 1
3 e11 = (g11 − g13 − g21 + g23 ) ,
2
√ −i
3 e12 = (g11 + g13 − g21 − g23 ) ,
2
√ 1
3 e13 = √ (g22 − g12 ) ,
2
√ i
3 e21 = (g11 − g13 + g21 − g23 ) ,
2
√ 1
3 e22 = (g11 + g13 + g21 + g23 ) ,
2
√ −i
3 e23 = √ (g12 + g22 ) ,
2
√ −1
3 e31 = √ (g31 − g33 ) ,
2
√ i
3 e32 = √ (g31 + g33 ) ,
2

3 e33 = g32 ,

pero aunque estos espinores formados por las componentes de los vectores unidad que describen
la orientación son también vectores propios de W 2 con valor propio w = 1, no son vectores
propios de W3 y T3 .
W 2 eij = 2eij ,
que, como hemos visto, también satisfacen las reglas de ortogonalidad y normalización
√ √
< 3eij | 3ekl >= δik δjl .

3.5.8. Espinores generales


En el caso de que la parte del zitterbewegung no sea nula, podemos obtener también espinores
de espín 1/2 como parte de las representaciones irreducibles contenidas en el producto tensorial
de los estados de espín 1 y espín 1/2, de las funciones U (u) y V (ρ), respectivamente, en que se
descompone la función de onda más general (3.60).
El espín total de la partícula es de la forma

S = u × U + W = Z + W,
3.5. APÉNDICE: ESPINORES 197

donde Z = −i~u × ∇u y W viene dado en (3.53). Las proyecciones del espín en los ejes del
cuerpo, es decir los operadores Ti = ei · W , vienen descritos en (3.58). Satisfacen las reglas de
conmutación:
[Z, Z] = iZ, [W , W ] = iW , [T , T ] = −iT ,
[Z, W ] = 0, [Z, T ] = 0, [W , T ] = 0.
Estas reglas de conmutación son invariantes bajo el cambio ρ por −ρ en la denición de los
operadores W y T , puesto que se intercambian uno en otro. Finalmente, la expresión de los
vectores unidad ligados a la partícula ei vienen dados en (3.55) y (3.56).
Podemos ver que estas componentes de los vectores unidad y los operadores Wi y Tj , satis-
facen las siguientes propiedades:
1) eij (−α, θ,∑
ϕ) = −ej i (α, θ, ϕ).
2) e∑i · W ≡ j eij Wj = Ti .
3) j ej Tj = W .
4) Para todo i, j , la acción Wi ej i = 0, sin suma sobre el índice i.
5) Para todo i, j , la acción Ti eij = 0, sin suma sobre el índice i.
6) Para todo i, j, k, con i ̸= j , tenemos que Wi ekj + Wj eki = 0, y en el caso de que i = j ,
nos lleva a la propiedad 4.
7) Para todo i, j, k, con i ̸= j , tenemos que Ti ej k + Tj eik = 0, y análogamente al caso
anterior, cuando i = j nos lleva de nuevo a la propiedad 4.
Esto implica que ei · W = W · ei = Ti , debido a la propiedad 4, cuando actúa sobre una
función arbitraria f ,
∑ ∑ ∑
(W · ei )f ≡ Wj (eij f ) = f Wj (eij ) + eij Wj (f ) = Ti (f ),
j j j

debido a que j Wj eij =∑ 0. ∑
De la misma manera j ej Tj ≡ j Tj ej = W .
Fijemos ahora el valor del espín. Podemos describir partículas de cualquier valor de su
espín. Consideremos sin embargo los espines de valor más bajo. Para partículas de espín 1/2,
si tomamos por simplicidad las funciones propias V (ρ) de W 2 correspondientes al valor propio
1/2, como el espín total debe ser 1/2, la parte orbital Z debe contribuir solamente con los
armónicos esféricos de valor z = 0 y z = 1.
Si no hay contribución de la parte del zitterbewegung, z = 0, las funciones de Wigner
se pueden escoger como funciones propias simultáneas de los tres operadores que conmutan
W 2 , W3 , y T3 , y los correspondientes vectores normalizados |w, w3 , t3 > vienen dados por las
funciones (3.77-3.80).
Si tenemos una contribución del zitterbewegung correspondiente al valor z = 1, entonces las
funciones U (u) son los armónicos esféricos

3
Y1 (β, λ) ≡ |1, 1 >= − sin(β)e
1 iλ
, (3.86)
2

Y10 (β, λ) ≡ |1, 0 >= 3 cos(β), (3.87)

3
Y1−1 (β, λ) ≡ |1, −1 >= sin(β)e−iλ , (3.88)
2
normalizados con respecto a la medida invariante
∫ π ∫ 2π
1
sin(β)dβdλ = 1.
0 0 4π
Se representan en la forma de funciones propias |z, z3 > de Z 2 y Z3 , donde las variables β y λ
representan la orientación del vector velocidad u.
198 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

La representación producto tensorial del grupo de rotaciones contruída a partir de las dos
representaciones irreducibles, la 1 asociada a los armónicos esféricos (3.86)-(3.88) y la repre-
sentación 1/2 dada en (3.77)-(3.80) se descompone en la suma directa de representaciones
irreducibles 1 ⊗ 1/2 = 3/2 ⊕ 1/2. La representación 3/2 es de dimensión 8, y corresponde a
espinores de espín s = 3/2 y la otra 1/2 de dimensión 4 es la de s = 1/2.
Las siguientes funciones de las cinco variables compactas β , λ, α, θ y ϕ, donde las variables β
y λ son las mismas que las de los armónicos esféricos Ylm , y las restantes α, θ y ϕ, provienen de
los espinores Φi , representan funciones normalizadas de espín 1/2, |s, s3 , t3 > que son vectores
propios de los operadores S 2 , S3 y T3
1 ( √ )
Ψ1 ≡ |1/2, 1/2, 1/2 > = √ Y10 Φ1 − 2Y11 Φ2 , (3.89)
3
1 ( √ )
Ψ2 ≡ |1/2, −1/2, 1/2 > = √ −Y10 Φ2 + 2Y1−1 Φ1 , (3.90)
3
1 ( √ )
Ψ3 ≡ |1/2, 1/2, −1/2 > = √ Y10 Φ3 − 2Y11 Φ4 , (3.91)
3
1 ( √ )
Ψ4 ≡ |1/2, −1/2, −1/2 > = √ −Y10 Φ4 + 2Y1−1 Φ3 , (3.92)
3

y vectores propios todos ellos de Z 2 con valor propio 1(1 + 1), puesto que son combinaciones
lineales de los armónicos esféricos Y1m , por lo que su representación matricial en esta base es
Z 2 = 2I. Son además vectores propios de W 2 con valor propio 1/2(1/2 + 1), por ser combina-
ciones lineales de los Φi , , por lo que su representación matricial en esta base es W 2 = 3/4I.
Podemos vericar que

S− Ψ 1 = Ψ 2 , S− Ψ2 = 0, S− Ψ3 = Ψ4 , , S− Ψ4 = 0,

T− Ψ1 = 0, T− Ψ2 = 0, T− Ψ3 = Ψ1 , T − Ψ4 = Ψ 2 .
No son vectores propios del operador W3 , a pesar de que generan un espacio vectorial invariante
para los operadores S 2 , S3 y T3 . En esta base (3.89)-(3.92) formada por los vectores ortonormales
Ψi , la representación matricial del espín es
( )
~ σ 0
S =Z +W = , (3.93)
2 0 σ

mientras que la representación matricial de Z y de W es


( ) ( )
2~ σ 0 −~ σ 0
Z= , W = , (3.94)
3 0 σ 6 0 σ

los cuales no satisfacen las reglas de conmutación de un momento angular debido a que el espacio
sobre el que actúan no es un espacio invariante para estos operadores Z y W . Se puede observar
que Z tiene la misma orientación que el espín S , ya que es un múltiplo positivo de él, mientras
que W tiene la opuesta, como se sugiere de la gura de la portada.
Como S 2 = Z 2 + W 2 + 2Z · W , si calculamos las representaciones matriciales en la base Ψi ,
obtenemos (tomando ~ = 1):
3 3 3
Z 2 = 2I, W 2 = I, Z · W = −I, S 2 = (2 + − 2)I = I,
4 4 4
con lo que en la base Ψi los valores esperados de estos observables son los mismos en cualquiera
de los cuatro estados a pesar de no ser estos vectores, vectores propios de Wi y Zi . El que los
valores esperados en los vectores de la base Ψi , de Z · W = −I, sugiere que ambas componentes
3.5. APÉNDICE: ESPINORES 199

del espín Z y W tienen sentidos contrarios, mientras que los valores absolutos de la parte
rotativa del espín W 2 y el espín total S 2 , son los mismos.
Estos valores matriciales de Z 2 y W 2 no se corresponden con los cuadrados de sus respectivas
representaciones matriciales pues de (3.94) resulta Z 2 = 43 I y W 2 = 121
I, mientras que Z · W =
− 3 I,
1
√ √
El módulo de S , S vale 3/2, mientras que el de √ Z resulta ser 2/ 3, es decir 4/3 del
anterior, mientras que la parte W su módulo es 1/2 3, es decir 1/3 del módulo de S pero
en sentido contrario.
√ Se puede observar que al ser Z opuesto a W , resulta que el módulo
S = Z − W = 3/2. Esto justica que desde el punto de vista cuántico hayamos representado
estos operadores con la orientación relativa que aparece en la gura de la portada, con Z en la
misma dirección que S y en sentido contrario la W .
Si observamos a los espinores Ψi , éstos son vectores propios de Z 2 con valor propio 1(1+1) =
2, y de W 2 con valor propio 1/2(1/2 + 1) = 3/4, pero no son vectores propios de Z3 y de W3 .
De hecho, la acción de estos operadores nos saca de este espacio vectorial de dimensión 4. No es
un espacio de una representación irreducible de estos operadores de espín, Zi y Wi , pero sí de
los operadores Si , de los que es una suma directa de dos representaciones irreducibles de valor
s = 1/2.
La proyección del operador de espín W sobre los ejes del cuerpo, es decir, los operadores T ,
toman la misma forma que en el caso anterior (3.82)
( ) ( ) ( )
~ 0 I ~ 0 iI ~ I 0
T1 = , T2 = , T3 = , (3.95)
2 I 0 2 −iI 0 2 0 −I

ya que las funciones Ψ1 y Ψ2 son vectores propios de T3 con valor propio 1/2, mientras que
las funciones Ψ3 y Ψ4 lo son con valor propio −1/2, y por lo tanto los espinores Ψi generan
un espacio invariante para los operadores Si y Tj . En efecto, la base formada por las funciones
propias simultáneas del operador espín total S 2 , S3 y T3 , y la representación de los ket, es la
misma que en el caso de los Φi dados en (3.77)-(3.80).
La expresión en esta base de las componentes de los vectores unidad ei viene dada por
( ) ( ) ( )
1 0 σ 1 0 iσ 1 σ 0
e1 = − , e2 = − , e3 = − . (3.96)
9 σ 0 9 −iσ 0 9 0 −σ

Podemos observar que las matrices de los operadores W = Ti ei = ei Ti , pero los Ti no se


pueden obtener de la representación matricial como Ti = W · ei , ya que el espacio de Hilbert de
dimensión 4 generado por los espinores Ψi , (3.89)-(3.92), no es irreducible para los operadores
eij y los Wi , pero sí lo es para los Ti .
200 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS

3.6. Resumen de Mecánica Clásica y Cuántica


Vamos a esquematizar aspectos generales de la descripción de las partículas elementales
clásicas y cuánticas.

Mecánica Clásica

Estados: Cada punto x ∈ X del espacio cinemático X .

Partícula elemental: X es un espacio homogéneo del grupo cinemático G.

Observables : Toda función de las variables cinemáticas y de sus derivadas.


Transformación del estado: x′ = gx ≡ f (x, g), g ∈ G.

Partícula elemental: Le0 = T ṫ + R · ṙ + U · u̇ + W · ω.

Transformación de la Lagrangiana: Le′ (x′ , ẋ′ ) = L(x,


e ẋ) + dα(g, x)/dτ

Interacción: LeI = −eA0 (t, r)ṫ + eA(t, r) · ṙ .

Constantes Noetherianas (no rel.) G ⊗ SO(3)L :


dU dU
H = −T −u· , P = mu− , K = mr−P t−U , J = r×P +u×U +W ,
dt dt
Ti = W · ei , i = 1, 2, 3.

Constantes Noetherianas (relativ.) P ⊗ SO(3)L :


dU dU
H = −T −u· , P = R− , K = Hr/c2 −P t−S×u/c2 , J = r×P +u×U +W ,
dt dt
Ti = W · ei , i = 1, 2, 3.

Algunos observables
H
H = ±γ(v)mc2 , P = ±γ(v)mv = v, S = ∓γ(v)m(r − q) × u.
c2

Invariantes (no relativ.)


( )2
P2 1
m, H− = 0, S 2CM = J − K ×P , T2 = W2
2m m

Invariantes (relativ.)
pµ pµ = (H/c)2 −P 2 = m2 c2 , wµ wµ = (P · S CM )2 −(HS CM /c)2 = −m2 c2 S 2 , T 2 = W 2.

S CM = J − q × P , HS CM /c = HJ /c2 − K × P , K = Hq/c2 − P t.
3.6. RESUMEN DE MECÁNICA CLÁSICA Y CUÁNTICA 201

Mecánica Cuántica

Estados: Cada vector de norma unidad |ϕ >, ϕ(x) ∈ L2 (X) del espacio de Hilbert
L2 (X), sobre el espacio cinemático X .

Partícula elemental: L2 (X) es el espacio de Hilbert de una representación pro-


yectiva unitaria irreducible del grupo cinemático G.

Observables : Todo operador lineal autoadjunto sobre el espacio de Hilbert.


Transformación del estado:
{ }
′ ′ −1 −i −1
|ϕ >= U (g)|ϕ >, ϕ (x) = U (g)ϕ(x) = ϕ(g x) exp α(g ; x) ,
~
y los operadores unitarios y sus generadores innitesimales
{ }
−i σ ~ i ∂ ∂α(g, x)
U (g) = exp g Xσ , Xσ = uσ (x) − λσ (x), λσ (x) = .
~ i ∂xi ∂g σ g=0

Generadores (no relativ.) G ⊗ SO(3)L :


∂ ~
H = i~ , P = ∇, K = mr − P t − U , J = r × P + u × U + W.
∂t i
~ ~
U= ∇u , W = (∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )) , S = u × U + W ,
i 2i
~
Ti = W · ei , i = 1, 2, 3. T = (∇ρ − ρ × ∇ρ + ρ(ρ · ∇ρ )) ,
2i
Generadores (relativ.) P ⊗ SO(3)L :
∂ ~
H = i~ , P = ∇, K = Hr/c2 −P t−S ×u/c2 , J = r ×P +u×U +W .
∂t i
~ ~
U= ∇u , W = (∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )) , S = u × U + W .
i 2i
~
Ti = W · ei , i = 1, 2, 3. T = (∇ρ − ρ × ∇ρ + ρ(ρ · ∇ρ )) ,
2i
Invariantes-Operadores de Casimir (no relativ.)
( )2
P2 1
m, H− = 0, S 2CM = J − K ×P , T2 = W2
2m m

Invariantes-Operadores de Casimir (relativ.)


pµ pµ = (H/c)2 −P 2 = m2 c2 , wµ wµ = (P · S CM )2 −(HS CM /c)2 = −m2 c2 s(s+1)~2 , T 2 = W 2.

Ecuación de Dirac
( )
1 du
H − P · u − 2S · ×u = 0.
c dt
202 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
Capítulo 4

Partícula de Dirac

4.1. Cuantización del modelo u = c

Consideremos el modelo de Luxones, con u = c y u̇ ̸= 0. Estamos describiendo dos tipos


de partículas con un movimiento circular del centro de carga alrededor del centro de masa, a la
velocidad c.
Para la partícula (H > 0), en el sistema de referencia del centro de masa, (ver Fig.4.1) el
centro de carga describe un círculo de radio R0 = S/mc, siendo el espín constante y ortogonal al
plano de la trayectoria. Para la antipartícula, con la misma orientación del espín, el movimiento
de la carga es en sentido contrario al de la gura.

Figura 4.1: Movimiento del centro de carga de la partícula (H > 0), para el observador del
C.M.
Si hacemos el análisis para el observador del centro de masa, la partícula se reduce a un
sistema mecánico de tres grados de libertad: las dos coordenadas x e y del centro de carga en el
plano de la trayectoria y la orientación α del sistema cartesiano local asociado al punto y que
rota con velocidad angular ω . Pero estos tres grados de libertad no son independientes. La fase α
es la misma que la del movimiento orbital. Pensad por ejemplo, que el triedro local sea el triedro
de Frenet-Serret. Finalmente, como el movimiento es circular de radio constante, solamente nos
queda un sólo grado de libertad, por ejemplo, la coordenada x. Para el observador del centro
de masa, la partícula (y la antipartícula) es equivalente a un oscilador armónico unidimensional
de pulsación ω = mc2 /S y amplitud R0 , pero en su estado fundamental. El Principio atómico

203
204 CAPÍTULO 4. PARTÍCULA DE DIRAC

requiere que como oscilador armónico no puede tener estados excitados.


Como la energía del estado fundamental del oscilador armónico unidimensional es ~ω/2,
si la identicamos con la energía de la partícula en este referencial +mc2 , esto implica que el
parámetro clásico S tiene que tomar necesariamente el valor S = ~/2. Todos los sistemas La-
grangianos que posean el mismo espacio cinemático corresponden al ser cuantizados únicamente
a partículas (y antipartículas) de espín 1/2. Y esto es independiente del tipo de Lagrangiana
que consideremos y que esté denida en el mismo espacio cinemático.

4.2. Ecuación de Dirac


Las variables cinemáticas de esta partícula transforman bajo P de acuerdo con

t′ (τ ) = γt(τ ) + γ(v · R(µ)r(τ ))/c2 + b, (4.1)


γ2
r ′ (τ ) = R(µ)r(τ ) + γvt(τ ) + (v · R(µ)r(τ ))v + a, (4.2)
(1 + γ)c2
R(µ)u(τ ) + γv + (v · R(µ)u(τ ))vγ 2 /(1 + γ)c2
u′ (τ ) = , (4.3)
γ(1 + v · R(µ)u(τ )/c2 )
µ + ρ(τ ) + µ × ρ(τ ) + F c (v, µ; u(τ ), ρ(τ ))
ρ′ (τ ) = , (4.4)
1 − µ · ρ(τ ) + Gc (v, µ; u(τ ), ρ(τ ))
donde las funciones F c y Gc vienen dadas en (2.130) y (2.131), respectivamente. Al cuantizar
esta partícula, la función de onda es una función compleja Φ(t, r, u, ρ) de todas las variables
cinemáticas. Para el grupo de Poincaré todos los exponentes y por lo tanto todas las funciones
gauge sobre sus espacios homogéneos son nulas, por lo que las Lagrangianas se pueden escoger
estrictamente invariantes. Las representaciones proyectivas son verdaderas representaciones, por
lo que los diez generadores sobre el espacio de Hilbert, teniendo en cuenta (4.1)-(4.4) y (3.14)
vienen dados por:
∂ ~ i~ ∂ ~ 1
H = i~ , P = ∇, K=r 2
− t ∇ − 2 S × u, (4.5)
∂t i c ∂t i c
~
J =r× ∇ + S, (4.6)
i
donde el operador S , que es el momento angular con respecto al punto r , es el operador espín
de Dirac, que va a venir dado por el operador diferencial sobre las variables u y ρ
~ ~
S =u× ∇u + {∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )} = u × U + W , (4.7)
i 2i
siendo ∇u y ∇ρ los operadores gradiente con respecto a u y ρ, como en el caso Galileano. El
operador S no es una constante del movimiento, ni siquiera para la partícula libre.
Para obtener el conjunto completo de observables que conmutan, empecemos por el operador
de Casimir, u operador de Klein-Gordon

H 2 − c2 P 2 = m2 c4 . (4.8)

Los operadores H y P únicamente derivan a la función de onda con respecto al tiempo t y a


la posición r , respectivamente. El operador de espín S deriva con respecto a la velocidad y la
orientación, por lo que conmuta con el operador de Klein-Gordon (4.8). Podemos por lo tanto
encontrar funciones propias simultáneas de los operadores (4.8), S 2 y S3 . Esto nos permite
buscar soluciones en variables separadas, de tal manera que la función de onda la podemos
reescribir como ∑
Φ(t, r, u, ρ) = ψi (t, r)χi (u, ρ), (4.9)
i
4.2. ECUACIÓN DE DIRAC 205

donde las ψi (t, r) describen la parte espacio-temporal y las χi (u, ρ) representan a la parte que
describe la estructura del espín. En consecuencia

(H 2 − c2 P 2 − m2 c4 ) ψi (t, r) = 0, (4.10)

cada una de las partes espacio-temporales satisfacen la ecuación the Klein-Gordon, mientras
que las que describen la estructura interna, satisfacen

S 2 χi (u, ρ) = s(s + 1)~2 χi (u, ρ), (4.11)

S3 χi (u, ρ) = ms ~χi (u, ρ). (4.12)


En el Apéndice 3.5 se han encontrado soluciones de estas últimas ecuaciones. En particular,
estamos interesados en las soluciones que describan partículas de espín 1/2. Estas soluciones
son también vectores propios de la proyección del operador espín sobre los ejes del cuerpo T3 ,
por lo que la solución general de un espinor de espín 1/2 es un objeto de cuatro componentes.
Para partículas de espín 1/2, si tomamos como funciones propias las χ(ρ) de S 2 con valor
propio 1/2, como el espín total debe ser 1/2, la parte orbital asociada al zitterbewegung Z = u×
U solo puede contribuir con armónicos esféricos de valores propios z = 0 y z = 1. Esto signica,
que desde el punto de vista cuántico podemos encontrar hasta dos representaciones diferentes
de partículas de espín 1/2, las caracterizadas por el singlete z = 0 (¾leptones?) o por el triplete
z = 1 (¾quarks?) en tres posibles estados de su componente z3 . Si hubiéramos denominado a la
parte Z del espín como el color, podríamos tener dos clases de partículas de Dirac, las que no
tienen color (leptones) y las coloreadas (quarks). Los tres colores correspondientes a los valores
propios de Z3 son inobservables porque los estados Ψi (3.89-3.92) son vectores propios de S3 y
T3 pero no de Z3 . Sin embargo, esta interpretación de Z3 como si representara el color como
en el modelo estándar no es del todo clara. Bastaría con demostrar que los modelos con z = 0
no son consistentes, tras la segunda cuantización, con la cromodinámica cuántica mientras que
sí lo son los modelos con z = 1. En cualquier caso, ambos modelos satisfacen la ecuación de
Dirac1 , y por lo tanto describen partículas de Dirac, como vamos a ver.
Para z = 0, las funciones de espín 1/2 χi (ρ) son combinaciones lineales de las cuatro
funciones Φi (3.77)-(3.80) y en el caso z = 1 son combinaciones lineales de las cuatro Ψi de
(3.89)-(3.92), de tal manera que el factor que aparece en frente de los armónicos esféricos es 1
porque como u = c, resulta ser una constante. El espacio de Hibert que describe la estructura
interna de una partícula de Dirac es isomorfo al espacio de Hilbert cuatridimensional C4 .
Si tenemos dos direcciones arbitrarias en el espacio, caracterizadas por los vectores unidad u
y v respectivamente, y Su y Sv son las proyecciones del momento angular en esas direcciones,
Su = u · S y Sv = v · S , entonces S−u = −Su , y sus conmutadores son [Su , Sv ] = i~Su×v .
En el caso del signo opuesto para las reglas de conmutación de los operadores Ti , por ejemplo,
[T1 , T2 ] = −i~T3 , sugiere que los vectores unidad e1 × e2 = −e3 , y sus permutaciones cíclicas
1 → 2 → 3. Por lo tanto los vectores unidad ei ligados al cuerpo, no solamente poseen como
valores propios ±1/3, sino que se comportan en el caso cuántico como un triedro inverso. En
este caso los vectores ei no son vectores arbitrarios en el espacio, sino vectores ligados a los
ejes del cuerpo que giran y por lo tanto no son observables compatibles, de tal manera que la
medida de las componentes, por ejemplo de ei , producirá una interacción con el cuerpo que
enmascarará la medida de los otros.
1
Paul Adrien Maurice Dirac Nace el 8 de agosto de 1902 en Bristol, Gloucestershire,
Inglaterra y fallece el 20 de octubre de 1984 en Tallahassee, Florida, USA. Se gradua como ingeniero
eléctrico en Bristol y después se dedica a la matemática en el St John's College de Cambridge. Su
artículo del año 1925 juntamente con los dos de 1928 sobre la estructura del electrón y la ecuación
que lleva su nombre, y la publicación de The principles of Quantum Mechanics en 1930 le valieron
el Premio Nobel en 1933. Se le considera como uno de los creadores del formalismo cuántico.
206 CAPÍTULO 4. PARTÍCULA DE DIRAC

Usaremos esta interpretación de un triedro inverso asociado a las partículas más adelante,
cuando analicemos la quiralidad en la sección 4.2.7. Para las antipartículas el comportamiento
es el contrario, como un triedro directo.
Los operadores Si y Ti poseen la representación matricial obtenida anteriormente, que es
( )
~ σ 0
S≡W = , (4.13)
2 0 σ
( ) ( ) ( )
~ 0 I ~ 0 iI ~ I 0
T1 = , T2 = , T3 = , (4.14)
2 I 0 2 −iI 0 2 0 −I
donde σ representan las tres matrices de Pauli y I es la matriz unidad 2 × 2.
Análogamente, las representaciones matriciales de las nueve componentes de los vectores
unidad (ei )j , i, j = 1, 2, 3 da lugar a dos conjuntos alternativos de representaciones, dependiendo
de que la contribución del zitterbewegung sea z = 0 o z = 1. En el primer caso, tenemos:
( ) ( ) ( )
1 0 σ 1 0 iσ 1 σ 0
e1 = , e2 = , e3 = , (4.15)
3 σ 0 3 −iσ 0 3 0 −σ

mientras que en el caso z = 1 la representación es


( ) ( ) ( )
1 0 σ 1 0 iσ 1 σ 0
e1 = − , e2 = − , e3 = − . (4.16)
9 σ 0 9 −iσ 0 9 0 −σ

Conviene observar que las diferentes componentes de los observables ei no son, en general,
observables compatibles, puesto que vienen representadas por operadores que no conmutan.
Si nalmente escribimos la función de onda para partículas de espín 1/2 en la siguiente
forma, para el caso z = 0,


i=4
Φ(0) (t, r, u, α) = ψi (t, r)Φi (α, θ, ϕ), (4.17)
i=1

resulta ser independiente de las variables u, y en el caso z = 1, mediante


i=4
Φ(1) (t, r, u, α) = ψi (t, r)Ψi (β, λ; α, θ, ϕ). (4.18)
i=1

donde β y λ representan la dirección del vector u. Por lo tanto, una vez que las funciones Φi o
Ψj que describen la estructura interna quedan identicadas con las cuatro funciones ortogonales
y de norma unidad (dadas en el apéndice en (4.93-4.96) y ((4.97-4.100)), respectivamente), que
son los vectores unidad de una base del espacio de Hilbert interno, C4 , la función de onda más
general resulta ser un objeto de cuatro componentes. Las seis componentes del espín Si y Tj ,
juntamente con las nueve componentes (ei )j , y la matriz unidad 4 × 4, completamente agotan
las 16 matrices hermíticas 4 × 4, linealmente independientes. Forman por lo tanto una base
vectorial del álgebra de Dirac. De esta forma, cualquier otro observable que sea invariante por
traslación, y que describa por lo tanto parte de la estructura interna, por ejemplo el operador
velocidad o aceleración, velocidad angular, etc., debe ser posible expresarlo en términos de una
combinación lineal real de las 16 matrices mencionadas. Veremos en la Sec. 4.3 que la orientación
interna, caracteriza completamente la estructura interna del electrón.
El operador velocidad en la base Ψi se calculará en función de sus componentes en coorde-
nadas polares esféricas

u1 = c sin β cos λ, u2 = c sin β sin λ, u3 = c cos β.


4.2. ECUACIÓN DE DIRAC 207

Su representación matricial en esta base es totalmente nula puesto que estos vectores son vectores
propios de S 2 , S3 y T3 y en estos vectores el valor esperado de los operadores de velocidad es
estrictamente cero pero con una gran dispersión.
El operador espín S = u × U + W con respecto al centro de carga, que como se ve en (3.93)
y (4.13), coincide con la representación habitual del operador espín de Dirac.

4.2.1. Operador de Dirac


Si consideramos la expresión del momento cinemático para las partículas libres con u = c
H 1
K= r − tP − 2 S × u,
c2 c
y tomamos la derivada temporal de esta expresión seguida del producto escalar con el vector u,
nos conduce a una expresión invariante Poincaré (Operador de Dirac):
( )
1 du
H −P ·u− 2 × u · S = 0. (4.19)
c dt
Cuando el operador de Dirac actúa sobre una función de onda cualquiera Φ(0) o Φ(1) , sabemos
que H y P poseen la representación diferencial dada en (4.5) y el espín la representación
diferencial (4.7), o la representación matricial equivalente (4.13), pero en principio no sabemos
cómo representar la velocidad u y el observable (du/dt) × u. Sin embargo, sabemos que para
esta partícula u y du/dt son vectores ortogonales y que juntamente con el vector u × du/dt
forman un triedro ortogonal directo, y que para el observador del centro de masa el centro de
carga describe un círculo de radio R0 = ~/2mc en el plano que contiene a u y du/dt.

Figura 4.2: Representación de los ejes locales y diferentes observables para la solución (a)
H > 0 y para la (b) H < 0. Esta orientación nos produce una ecuación de Dirac en la
representación de Pauli-Dirac.

Representación de Pauli-Dirac
Consideremos en primer lugar el caso z = 0. Como u y du/dt son observables invariantes
por traslación, son elementos del álgebra de Dirac. De aquí resulta que podemos relacionar estos
tres vectores con los tres vectores que denen el triedro inverso (left-handed) que describe la
orientación e1 , e2 y e3 en su representación (4.15). Entonces, como se muestra en la parte (a)
208 CAPÍTULO 4. PARTÍCULA DE DIRAC

de la Figura 4.2 y para la partícula, H > 0, tenemos que u = ae1 y du/dt × u = be3 , donde a
y b son números constantes, reales y positivos. Por lo tanto, el tercer término del operador de
Dirac es (b/c2 )e3 · S = (b/c2 )T3 , y el operador (4.19) queda
b
H − aP · e1 − T3 = 0. (4.20)
c2
Si hacemos la identicación con la antipartícula, H < 0, la parte (b) de la Figura 4.2, la
relación de los observables anteriores es opuesta a la obtenida anteriormente, pero ahora con
los coecientes −a y −b, respectivamente, es decir, obtenemos
b
H + aP · e1 + T3 = 0, (4.21)
c2
la cual corresponde claramente al cambio H → −H en la ecuación (4.20). Explícitamente (4.20)
aparece como:
( ) ( ) ( )
a 0 P ·σ b~ I 0 P3 P1 − iP2
H− − 2 = 0, P · σ = .
3 P ·σ 0 2c 0 −I P1 + iP2 −P3

Si multiplicamos (4.21) por (4.20), teniendo presente que (P · e1 )T3 + T3 (P · e1 ) = 0,


obtenemos una expresión que se satisface tanto para la partícula como para la antipartícula

a2 2 b2 ~2
H2 − P I− I = 0, (4.22)
9 4c4
y que es solamente una relación algebraica entre H 2 y P 2 , independiente del espín. Si identica-
mos esta expresión con el operador de Klein-Gordon (4.8), el cual también contiene soluciones
con H > 0 y H < 0, esto conduce a a = 3c y b = 2mc4 /~ = c3 /R0 y substituyendo en (4.20)
obtenemos la ecuación de Dirac:

H − cP · α − βmc2 = 0, (4.23)

donde las matrices de Dirac tradicionales α y β son hermíticas y vienen dadas por
( ) ( )
I 0 0 σ
β= ∼ T3 , α = ∼ e1 . (4.24)
0 −I σ 0

Habitualmente la ecuación de Dirac se escribe de otra forma. Si en (4.23) multiplicamos todo


por la izquierda por la matriz β , como β 2 = I, se llega a

βH − cP · βα − mc2 = 0, γ 0 P0 − γ i P i − mc = 0, γ µ Pµ − mc = 0,

por lo que las matrices γ µ de Dirac son


( ) ( ) ( )
I 0 0 σ 0 I
γ ≡β=
0
, γ≡γ α= 0
, 5 0 1 2 3
γ = iγ γ γ γ = (4.25)
0 −I −σ 0 I 0

es decir, hemos obtenido la representación de Pauli-Dirac, donde 3e1 juega el papel de un


vector unidad en la dirección de la velocidad. La matriz γ 0 es hermítica y las γ i antihermíticas.
Si estos coecientes los hubiéramos sustituído en la ecuación correspondiente a la antipartí-
cula (4.21) corresponde a la representación equivalente que se produce por el cambio β → −β
y α → −α. Como veremos en la sección 4.2.7 al analizar la quiralidad, habríamos llegado a
la misma expresión de la ecuación de Dirac que en (4.23) con las mismas matrices de (4.24)
si bubiéramos partido del modelo de antipartícula (b) pero asociando al electrón los ejes ei
opuestos a los de la gura 4.2, es decir un sistema de ejes directo (right-handed).
4.2. ECUACIÓN DE DIRAC 209

La ecuación de Dirac (4.23) maniesta la relación que existe entre el momento temporal
mecánico o energía H , que se expresa como suma de un término ligado al movimiento del
centro de masa, cP · α, o energía de traslación, lineal en el momento lineal mecánico, y el
término dependiente linealmente del espín, o energía de rotación. Esta relación es válida para la
partícula libre, mientras que si el electrón interacciona con un campo electromagnético externo,
esa relación la deben satisfacer solamente las partes mecánicas, ya que de acuerdo con el principio
atómico no es modicada su estructura mecánica, por lo que la H = Hm + eϕ y P = P m + eA
totales, satisfacen
H = eϕ + c (P − eA) · α + βmc2 , (4.26)
siendo ϕ y A los potenciales escalar y vectorial externos, respectivamente.
Al actuar sobre una función de onda arbitraria correspondiente a un posible estado de
una partícula de Dirac, esta ecuación aparece en el caso libre actuando sobre las componentes
espacio-temporales del espinor de Dirac como

(i~[γ µ ]ij ∂µ − mc δij ) ψj (t, r) = 0,

y en el caso de interacción con un campo electromagnético externo y debido al principio atómico,


como
((i~∂µ − eAµ (t, r))[γ µ ]ij − mc δij ) ψj (t, r) = 0.
Para el observador del centro de masa (P = 0), y en (4.23) el operador H se reduce a
( )
2 2 I 0
H = βmc = mc ,
0 −I

luego los espinores ψ que solamente tuvieran no nulas las componentes superiores ψ1 y ψ2 son
vectores propios de H con valor propio +mc2 mientras que aquellos espinores con componentes
no nulas ψ3 y ψ4 son vectores propios de H con valor propio −mc2 .

Figura 4.3: Orientación de los ejes del cuerpo en la representación de Pauli-Dirac, corres-
pondientes a los cuatro estados básicos Φi de (3.89)-(3.92), respectivamente, con el vector
e2 en la dirección de la aceleración y e1 y −e1 en la dirección de la velocidad. El sistema
de ejes local en los casos (1) y (2) es left-handed, mientras que es right-handed en (3) y
(4), por corresponder a la antipartícula.

Podemos obtener de forma análoga la ecuación de Dirac en el caso de que la parte del
zitterbewegung valga z = 1, utilizando el conjunto de matrices (4.16) en vez del conjunto
210 CAPÍTULO 4. PARTÍCULA DE DIRAC

(4.15), ya que son múltiplos uno del otro y lo único que puede cambiar es algún factor constante
en los cálculos intermedios. Explícitamente, la ecuación equivalente a la (4.20) es ahora la
( ) ( ) ( )
a 0 P ·σ b~ I 0 P3 P1 − iP2
H+ + 2 = 0, P · σ = .
9 P ·σ 0 6c 0 −I P1 + iP2 −P3
Al multiplicarla por ella misma con H cambiado por −H , se obtiene como en el caso anterior
después de indenticarla con la ecuación de Klein-Gordon
a2 2 b2 ~2 mc4
H2 − P I− I = 0, a = 9c, b=6 ,
81 36c4 ~
es decir como en (4.23) con las mismas matrices α y β :

H − cP · α − βmc2 = 0.

Los cuatro estados básicos Φi , (4.93)-(4.96) or (4.97)-(4.100), en la representación de Pauli-


Dirac, se corresponden con los cuatro estados representados en la gura 4.3, donde los f i
son los vectores unidad del sistema de referencia del laboratorio, y los ei los vectores unidad
ligados al punto r , con el vector e2 en la dirección de la aceleración. En los estados (1) y (2) la
proyección del espín W , opuesto a S , en el eje e3 , T3 es −1/2, mientras que los dos de abajo
(3) y (4) corresponden a T3 = 1/2, y ambos con las dos posibilidades de S3 = ±1/2 en los ejes
del laboratorio. Conviene observar que los dos inferiores, se corresponden con los estados de la
antipartícula, en los que el sistema de ejes es right-handed.

Representación de Weyl de la ecuación de Dirac


La posible identicación de los observables internos con las diferentes combinaciones lineales
reales de las matrices hermíticas ei conduce a diferentes representaciones equivalentes de las
matrices de Dirac, y por lo tanto a diferentes expresiones para la ecuación de Dirac.

Figura 4.4: Orientación de los ejes en la representación de Weyl.

Por ejemplo, si realizamos la identicación que se sugiere en la Figura 4.4 para la partícula,
u = −ae3 y el observable du/dt × u = be1 en términos de sendas constantes positivas a y b,
obtenemos por el mismo método las matrices hermíticas
( ) ( )
0 I −σ 0
βW = ∼ T1 , αW = ∼ −e3 , (4.27)
I 0 0 σ
4.2. ECUACIÓN DE DIRAC 211

y así, las matrices gama resultan ser


( ) ( ) ( )
0 I 0 σ −I 0
γW ≡ β =
0
, γW ≡ γ α =
0
, 5
γW = , (4.28)
I 0 −σ 0 0 I

es decir, la representación de Weyl de la ecuación de Dirac. Su interés reside en el análisis de


las interacciones débiles de los fermiones que violan la conservación de la paridad, y se distinguen
las partes quirales de izquierda (Left) de las derechas (Right) denidas por
( ) ( ) ( )
1 I 0 1 0 0 ψL
ψL = (1 − γ )ψ =
5
ψ, ψR = (1 + γ )ψ = 5
ψ, ψ = ,
2 0 0 2 0 I ψR

por lo que las componentes superiores del espinor son Left y las inferiores Right. Con esta
representación los generadores de las transformaciones del grupo de Lorentz que actúan sobre
los espinores son ( ) ( )
i σ 0 1 −σ 0
J= , K= .
2 0 σ 2 0 σ
De esta forma una representación del grupo de Lorentz sobre los espinores toma la forma
( (1/2,0) )
D (Λ) 0
D(Λ) =
0 D(0,1/2) (Λ)

por lo que las componentes superiores e inferiores transforman de manera independiente con las
dos representaciones irreducibles no equivalentes 2 × 2, de SL(2, C).
Cuando comparamos ambas representaciones, vemos que la representación de Weyl se ob-
tiene a partir de la de Pauli-Dirac si es que rotamos el sistema de ejes del cuerpo un valor
π/2 alrededor del eje e2 . De esta forma, el operador velocidad cα tiene sentido contrario a e3 .
Entonces, el operador de rotación es el
( )
iπ iπ 1 I −I
R(π/2, e2 ) = exp( e2 · W ) = exp( T2 ) = √ .
~2 ~2 2 I I

Podemos comprobar que R γPµ D R† = γW µ


, donde γPµ D y γW
µ
son la matrices gama en las
representaciones de Pauli-Dirac y de Weyl, respectivamente.

Representación supersimétrica
Es aquella en que las matrices hermíticas de Dirac se escogen como
( ) ( )
0 −iI 0 σ
βS = ∼ −T2 , αS = ∼ e1 . (4.29)
iI 0 σ 0

y así las matrices γ µ


( ) ( ) ( )
0 −iI −iσ 0 0 I
γS0 = , γS = , γS5 = . (4.30)
iI 0 0 iσ −I 0

Está relacionada con la de Pauli-Dirac mediante la transformación unitaria TS γPµ D TS† = γSµ . Esta
transformación corresponde a una rotación de valor π/2 alrededor del eje e1 , en la representación
de Pauli-Dirac
( )
iπ iπ 1 I iI
TS = R(π/2, e1 ) = exp( e1 · W ) = exp( T1 ) = √ .
~2 ~2 2 iI I
212 CAPÍTULO 4. PARTÍCULA DE DIRAC

Figura 4.5: Orientación de los ejes locales en la representación Supersimétrica.

Representación de Majorana
Como ecuación diferencial, la ecuación de Dirac se escribe

(i~γ µ ∂µ − mc) ψi (t, r) = 0,

como un operador diferencial lineal matricial de coecientes constantes, que actúa sobre un
vector columna de cuatro componentes, que son funciones complejas de t y r . Si buscamos
una representación en la que las matrices γ µ tengan todas sus componentes imaginarias puras,
podemos hacer que en el sistema de ecuaciones diferenciales anterior todos los coecientes sean
constantes reales y por lo tanto buscar soluciones en las que las cuatro funciones ψi se puedan
escoger reales. Esta es la representación de Majorana. En ella, las matrices hermíticas
( ) ( ) ( ) ( )
0 iI σ1 0 0 I σ3 0
βM = ∼ T2 , α1 = , α2 = , α3 = , (4.31)
−iI 0 0 −σ1 I 0 0 −σ3

y así, las matrices gama resultan ser imaginarias puras


( ) ( ) ( ) ( )
0 iI 0 −iσ1 iI 0 −iσ3
0
γM ≡ β =
0 1
, γM = 2
, γM = , 3
γM
= .
−iI 0 −iσ1 0 0 −iI −iσ3
0
(4.32)
De la representación de Pauli-Dirac a la representación de Majorana podemos pasar mediante
la transformación unitaria
 
( ) 1 1 1 −1
1 I + iσ2 I − iσ2 1  −1 1 1 1 
TM = ≡  
2 −iI + σ2 iI + σ2 2  −i −i i −i 
i −i i i

mediante TM γPµ D TM µ
= γM .
Para el observador del centro de masa en el que H = βmc2 , los espinores de la forma
   
iψ 0
 0   iψ 
Ψ1 =     2
 ψ  , Ψ2 =  0  , HΨi = mc Ψi , i = 1, 2
0 ψ
4.2. ECUACIÓN DE DIRAC 213

son estados de H > 0, mientras que los espinores linealmente independientes de los anteriores
   
−iψ 0
 0   −iψ 
Ψ3 = 
 ψ ,
 Ψ4 = 
 0 ,
 HΨi = −mc2 Ψi , i = 3, 4
0 ψ

son estados de H < 0.


En la literatura también aparece otra representación de Majorana en la que las matrices
gama, que siguen siendo imaginarias, se toman como:
( ) ( ) ( ) ( )
0 σ2 iσ3 0 0 −σ2 −iσ1 0
0
γM ≡β= , 1
γM = , 2
γM = , 3
γM = .
σ2 0 0 iσ3 σ2 0 0 −iσ1

Como resumen, la representación de Pauli-Dirac conduce a que la matriz hermítica β es pro-


porcional a la T3 = e3 · W , y las matrices hermíticas α a e1 . La representación de Weyl es la
que la matriz hermítica β es proporcional a la T1 = e1 · W y las matrices hermíticas α a −e3 .
La representación supersimétrica β es proporcional a −T2 = −e2 · W , las matrices hermíticas
α a e1 . La representación de Majorana es una transformación unitaria que combina los estados
de partícula y antipartícula a partes iguales.

4.2.2. Transformación gauge

Supongamos una transformación de cambio de fase, que afecte al estado de partícula, pero
no a la antipartícula, en la representación de Dirac. Sobre el espinor de Dirac vendría dado por
la transformación unitaria
   iα 
ψ1 e ψ1 ( iα ) ( −iα )
 ψ2   eiα ψ2 
G =  , G = e I 0 , G−1 = G† = e I 0 ,
 ψ3   ψ3  0 I 0 I
ψ3 ψ3

que afecta solamente a las componentes superiores. Esto en la representación de Pauli-Dirac

Figura 4.6: Cambio de fase de la partícula que corresponde a un giro α de la carga en la


dirección de su movimiento. El eje e3 y el espín S no son afectados por esta transformación.
214 CAPÍTULO 4. PARTÍCULA DE DIRAC

supone que al actuar sobre los observables básicos con esta transformación unitaria
( ) ( )
† 0 eiα σ 0 (cos α + i sin α)σ
Ge1 G = = = cos αe1 + sin αe2 ,
e−iα σ 0 (cos α − i sin α)σ 0
( ) ( )
† 0 ieiα σ 0 (− sin α + i cos α)σ
Ge2 G = = = − sin αe1 +cos αe2 ,
−ie−iα σ 0 (− sin α − i cos α)σ 0
Ge3 G† = e3 , GSG† = S,
GT1 G† = cos αT1 + sin αT2 , GT2 G† = − sin αT1 + cos αT2 , GT3 G† = T3 .
Esta transformación corresponde en la gura 4.6 al desplazamiento de una fase α de la posición
del centro de carga de la partícula. Si el cambio de fase afectase solamente a una de las com-
ponentes de los espinores básicos, representaría este cambio de fase del correspondiente vector
básico del conjunto de la gura 4.3.

4.2.3. Dinámica de los observables


En la representación de Heisenberg, la derivada temporal de cualquier observable A es
dA i ∂A
= [H, A] + . (4.33)
dt ~ ∂t
La función de onda depende de las variables cinemáticas. Entre éstas está el tiempo. La evo-
lución temporal corresponde a una traslación temporal generada por el Hamiltoniano H, de tal
manera que ψ(t, x1 , . . . , xn ) = exp(−iHt/~)ψ(0, x1 , . . . , xn ). El valor esperado en el instante t de
un observable A, con el sistema en el estado ψ(t) es

< A(t) >=< ψ(t)|A|ψ(t) >=< ψ(0)|eiHt/~ A e−iHt/~ |ψ(0) >,


equivalente a tomar el valor esperado de un operador diferente A(t) = eiHt/~ A e−iHt/~ , pero en
el estado inicial ψ(0), independiente del tiempo, como si la carga estuviera quieta. En el instante
t + ∆t
< A(t + ∆t) >=< ψ(t + ∆t)|A|ψ(t + ∆t) >=< ψ(0)|eiH(t+∆t)/~ A e−iH(t+∆t)/~ |ψ(0) > .
y la diferencia

i
< A(t + ∆t) > − < A(t) >= < ψ(0)|HA(t) − A(t)H|ψ(0) > ∆t,
~
por lo que
d < A(t) > i dA(t)
= < ψ(0)|[H, A(t)]|ψ(0) >=< ψ(0)| |ψ(0) > .
dt ~ dt
De esta forma el cálculo de la variación temporal del valor esperado de un observable es equiva-
lente al valor esperado del observable [H, A(t)] con respecto a cualquier estado inicial ψ(0). Si el
observable A, es una función explícita del tiempo, entonces es fácil ver que es el valor esperado del
observable (4.33), con respecto al estado incial arbitrario ψ(0) del sistema.

Podemos ver que para Dirac, el punto r se mueve con la velocidad c. En efecto, el conmutador
[H, r] es distinto de cero debido a que [Pi , xj ] = −i~δij , por lo que la velocidad de r es
dr i i
u= = [H, r] = [c (P − eA) · α, r] = cα,
dt ~ ~
incluso en interacción. Los valores propios de las matrices αi son ±1, por lo que si alguna
componente del vector velocidad es medida con precisión, solamente puede ser ±c.
La representación de Pauli-Dirac encontrada, es compatible con la aceleración du/dt a lo
largo del vector e2 . En efecto, en el sistema de referencia del centro de masa el Hamiltoniano
de Dirac se reduce a H = βmc2 , y para el operador velocidad u = cα, se tiene
( )
du i 2mc3 0 iσ c2
2
= [mc β, cα] = = 3e2 , (4.34)
dt ~ ~ −iσ 0 R0
4.2. ECUACIÓN DE DIRAC 215

donde c2 /R0 es el módulo constante de la aceleración en este sistema de referencia, y donde 3e2
juega el papel de vector unidad en esa dirección.
La derivada temporal del sistema cartesiano ligado al punto es
de1 i c
= [βmc2 , e1 ] = e2 , (4.35)
dt ~ R0
de2 i c
= [βmc2 , e2 ] = − e1 , (4.36)
dt ~ R0
de3 i
= [βmc2 , e3 ] = 0, (4.37)
dt ~
puesto que e3 es ortogonal al plano de la trayectoria y no cambia, y donde c/R0 = ω es la
velocidad angular del movimiento interno de la carga. Esta evolución temporal de los observables
ei es la correcta si como hemos supuesto se trata de un triedro cartesiano inverso como se
muestra en la Figura 4.2-(a). Es por esta razón que al comienzo del capítulo hemos supuesto
que el triedro rota con la misma velocidad que la velocidad angular del movimiento del centro
de carga.
Al mismo tipo de conclusión habríamos llegado si hubiéramos utilizado la representación de
Weyl donde las matrices de Dirac vienen dadas en (4.27). En efecto, en esta representación
de1 i
= [βW mc2 , e1 ] = 0, (4.38)
dt ~
de2 i c
= [βW mc2 , e2 ] = e3 , (4.39)
dt ~ R0
de3 i c
= [βW mc2 , e3 ] = − e2 . (4.40)
dt ~ R0
Para ser consistente con la consideración anterior de que los vectores 3ei , juegan el papel de
vectores unidad, esto implica que el espín, para el observador del centro de masa en la repre-
sentación de Pauli-Dirac, debe tener la orientación de 3e3 . Este es el caso para las componentes
superiores, mientras que para las inferiores (que en esta representación corresponden a estados
con H < 0) la orientación es la opuesta. Esto signica que para las partículas el correspondiente
conjunto de ejes ligados al cuerpo forma un triedro inverso, mientras que para las antipartícu-
las, el correspondiente conjunto de ejes, forma un triedro directo. Esto pone de maniesto una
diferencia en la quiralidad entre partículas y antipartículas, como veremos en la sección 4.2.7.
En general
dS i i
= [H, S] = [cP · α + βmc2 , S] = cP × α ≡ P × u,
dt ~ ~
no es una constante del movimiento, pero para el observador del centro de masa, el operador
espín u × U + W se reduce al espín con respecto al centro de masa S que sí es constante en
este referencial:
dS i
= [βmc2 , S] = 0. (4.41)
dt ~
Únicamente la componente T3 del espín sobre los ejes del cuerpo, en la representación de
Pauli-Dirac permance constante mientras que las otras dos componentes T1 y T2 cambian debido
a la rotación de estos ejes.
dT1 i c
= [βmc2 , T1 ] = T2 , (4.42)
dt ~ R0
dT2 i c
= [βmc2 , T2 ] = − T1 , (4.43)
dt ~ R0
dT3 i
= [βmc2 , T3 ] = 0. (4.44)
dt ~
216 CAPÍTULO 4. PARTÍCULA DE DIRAC

En cambio, es la componente T1 la que permanece constante en la representación de Weyl

dT1 i
= [βW mc2 , T1 ] = 0, (4.45)
dt ~
dT2 i c
= [βW mc2 , T2 ] = T3 , (4.46)
dt ~ R0
dT3 i c
= [βW mc2 , T3 ] = − T2 . (4.47)
dt ~ R0
Si se analiza desde un observador arbitrario, el movimiento es una hélice y la aceleración no
es de módulo constante c2 /R0 , y el operador espín con respecto al centro de carga S no es una
constante del movimiento, ya que quien es constante es el momento angular total J = r ×P +S ,
que se conserva.

4.2.4. Conservación de la probabilidad


La ecuación de Dirac se escribe:
∂Φ ~
i~ − u · ∇Φ − mc2 βΦ = 0, (4.48)
∂t i
donde Φ es el espinor (4.17) o el espinor (4.18) un espinor o vector columna de cuatro compo-
nentes,  
ψ1 (t, r)
 ψ2 (t, r) 
Φ(t, r, u, α) =  
 ψ3 (t, r)  (4.49)
ψ4 (t, r)
una vez que las partes relativas a la dependencia de las variables u y α se han sustituido por
los cuatro espinores básicos. La velocidad u = cα es el operador velocidad de Dirac escrito en
términos de las matrices hermíticas 4 × 4 de Dirac α y β = γ 0 , es la matriz hermítica de Dirac,
relacionada con el vector unidad sobre el que se proyecta el espín. Cada una de las funciones
ψi (t, r), i = 1, 2, 3, 4, es solución de la ecuación de Klein-Gordon, (∂ µ ∂µ + m2 c2 /~2 )ψi = 0.
Si ahora tomamos la compleja conjugada y traspuesta de la expresión anterior,

∂Φ∗ ~
−i~ + ∇Φ∗ · u − mc2 Φ∗ β = 0. (4.50)
∂t i
donde Φ∗ representa el espinor la, traspuesto y complejo conjugado del (4.49). Si a la primera
ecuación (4.48) la multiplicamos por el vector la Φ∗ por la izquierda y la (4.50) por el vector
columna Φ por la derecha, y restamos la segunda de la primera, el término en β se cancela, y
se llega a
∂(Φ∗ Φ)
+ ∇(Φ∗ uΦ) = 0,
∂t
∑ ∗
que llamando a Φ∗ Φ = ψi ψi = ρ(t, r) una función escalar y denida positiva que se inter-
preta como la densidad de probabilidad de presencia del electrón y a Φ∗ uΦ = j(t, r), como la
densidad de corriente de probabilidad, la ecuación de Dirac nos produce localmente la ecuación
de continuidad
∂ρ
+ ∇ · j = 0. (4.51)
∂t
Existe por lo tanto conservación local de la probabilidad, en cada punto∫ (t, r) ∈ R4 , del espacio
tiempo. Esta ley de conservación implica que la integral a t constante V ρdV se conserva cua-
lesquiera que sea el volumen de integración V . Si este volumen es todo el espacio tridimensional,
esa integral vale 1, como corresponde a una función de onda normalizada.
4.2. ECUACIÓN DE DIRAC 217

La densidad de corriente j = Φ∗ uΦ = cΦ∗ αΦ = cΦ∗ γ 0 γΦ, que como (γ 0 )2 = I, y deniendo


e = Φ∗ γ 0 , nos permite escribir la ecuación de continuidad
el espinor conjugado como vector la Φ
e µ Φ ≡ (cρ, j),
en forma covariante en términos del tetravector j µ = cΦγ

∂µ j µ = 0. (4.52)

Si al tetravector j µ , lo multiplicamos por el valor de la carga e, obtenemos el tetravector densidad


de corriente eléctrica, que también satisface la misma ecuación de continuidad, por lo que se
refuerza la idea de que la distribución dada por la función de onda como función de t y r , el
punto r representa la localización de la carga eléctrica del electrón.
Como el tetravector de densidad de corriente eléctrica es j µ = ecΦγ e µ Φ, la interacción con
un campo externo se escribe en la forma del acoplamiento mínimo en términos de potenciales
Aµ (t, r), que son solamente funciones de (t, r):

j µ (t, r)Aµ (t, r).

En electrodinámica cuántica no existe ningún otro acoplamiento entre los campos externos y
las propiedades de la partícula, lo que refuerza la idea de que, efectivamente, lo que se está
describiendo de forma clásica, es la evolución del centro de carga, es decir de un punto al que se
le asocia el valor de una carga eléctrica e y ningún multipolo eléctrico o magnético. Y la función
de onda lo que describe es la densidad de probabilidad de presencia de la carga eléctrica.

4.2.5. Invariancia PCT

Figura 4.7: La inversión espacial del electrón en el sistema del centro de masa es equivalente
a una rotación de valor π alrededor de S . El sistema local de ejes permanece left-handed,
ya que el carácter de partícula (o antipartícula) no cambia.

En la Figura 4.7 representamos la inversión espacial de la descripción del electrón, conside-


rado como el luxón cuyo centro de carga se mueve alrededor de su centro de masa a la velocidad
de la luz. Bajo la inversión P y desde el punto de vista del observador del centro de masa cambia
de acuerdo con

P : {r → −r, u → −u, du/dt → −du/dt, S → S, H → H, e1 → −e1 , e2 → −e2 , e3 → e3 }.

En la representación de Pauli-Dirac (Figura 4.2), vemos que esta inversión equivale a una
rotación de valor π alrededor del eje e3 y, por lo tanto,

P ≡ R(π, e3 ) = exp(iπe3 · S/~) = exp(iπT3 /~) = iγ0 ,


218 CAPÍTULO 4. PARTÍCULA DE DIRAC

que es una de las posibles representaciones del operator paridad ±γ0 o bien ±iγ0 . En la repre-
sentación de Weyl esto corresponde a una rotacion de valor π alrededor del eje e1 con lo que
tomamos P ≡ iγ0 . Esto resulta de la compatibilidad con la conjugación de carga, según Racah.2
La inversión espacial no afecta al carácter left o right-handed del sistema de referencia local
de vectores unidad ei , ya que transforma partícula en partícula y antipartícula en antipartícula.
Podemos comprobar que con la transformación unitaria P ≡ iγ0 ,

P HP † = mc2 P βP † = H, P SP † = S, P e1 P † = −e1 , P e2 P † = −e2 , P e3 P † = e3 .

Figura 4.8: La inversión temporal del electrón produce una partícula cuyo momento tem-
poral H es negativo.
En la Figura 4.8 representamos la inversión temporal, también para el observador del centro
de masa,

T : {r → r, u → −u, du/dt → du/dt, S → S, H → −H, e1 → −e1 , e2 → e2 , e3 → e3 },

pero este movimiento corresponde a una partícula con H < 0, tal que la orientación relativa
entre el espín, velocidad y posición, dados por la ecuación (2.167), está conforme al movimiento
descrito en esta gura. El sistema local de ejes es left-handed. El operador de inversión temporal
viene dado por3 y puede también tomarse como una rotación de valor π alrededor del eje e2 ,
( )
0 −I
T = R(π, e2 ) = exp(iπe2 · S/~) = exp(iπT2 /~) = , T −1 = T † .
I 0

T HT † = mc2 T βT † = −H, T ST † = S, T e1 T † = −e1 , T e2 T † = e2 , T e3 T † = −e3 .


La transformación P T viene dada por la matriz
( ) ( )
0 I 0 −I
TP = , PT = ,
I 0 −I 0

y al actuar sobre las matrices γ µ producen

P γ 0 P −1 = γ 0 , P γ i P −1 = −γ i , T γ 0 T −1 = −γ 0 , T γ i T −1 = γ i ,

(P T )γ µ (P T )−1 = −γ µ ,
ya que las cuatro matrices γ transforman como las componentes de un tetravector

(P T )xµ (P T )−1 = −xµ , (P T )∂ µ (P T )−1 = −∂ µ ,


2
G. Racah, Nuovo Cimento 14, 322 (1937).
3
B. Thaller, The Dirac equation, Springer, Berlin (1992), p 75.
4.2. ECUACIÓN DE DIRAC 219

Es por esto que la ecuación de la partícula de Dirac libre es invariante bajo el grupo completo
de Poincaré, incluyendo inversiones.
Una partícula de Dirac es un sistema mecánico cuyos atributos intrínsecos son la masa m > 0
y el espín ~/2. Vemos que también el signo de H es invariante Poincaré y por lo tanto es otra
propiedad intrínseca lo que establece dos clases diferentes de sistemas de la misma masa y espín.
Al sistema con H > 0 se le da habitualmente el nombre de partícula mientras que se reserva
el nombre de antipartícula para el de H < 0. El valor de la masa no lo ja la teoría, hay que
introducirlo a mano. Para caracterizar su interacción con un campo electromagnético externo,
tenemos que introducir a mano otra propiedad intrínseca, la carga eléctrica e, localizada en
el punto r . Esto implica que además de las propiedades mecánicas m y S el sistema posee
propiedades electromagnéticas como la carga eléctrica e, que debido a su movimiento a la
velocidad de la luz y a su separación con respecto al centro de masa produce un momento
dipolar eléctrico d y un momento dipolar magnético µ, respectivamente. La carga eléctrica
puede tener ambos signos, positiva o negativa.
           
S S S S S S
m  m  m  m  m  m 
           
H   H   H   −H   H   −H 

P =           
 , T  e  =  −e  , C  e  =  −e 
e  e         
µ  µ   µ   −µ   µ   −µ 
d −d d d d −d

y la transformación global P CT nos da


   
S S
m m
   
H  H 
P CT  
 e =
 .
e
   
µ µ
d d

La transformación P CT , transforma la partícula en su antipartícula, invirtiendo incluso el


sistema local de ejes y recíprocamente, manteniendo invariantes los atributos mecánicos m y
S y los atributos electromagnéticos µ y d. La invariancia P CT de este sistema establece una
relación entre el signo de H y el signo de la carga e, a pesar de que la indeterminación en el signo
de la carga de la partícula, persiste. El producto eH es invariante P CT . La ecuación de Dirac
es invariante P CT puesto que esta transformación aplica soluciones con H > 0 en soluciones
con H < 0 y recíprocamente, puesto que esta ecuación contiene la descripción de ambos tipos
de partículas elementales.
Esto implica que la partícula y la antipartícula, en el sistema de referencia del centro de
masa, poseen un momento dipolar magnético y un momento dipolar eléctrico oscilante, en un
plano ortogonal al espín. Una vez jada la dirección del espín, el momento magnético de ambas
posee la misma orientación relativa con respecto al espín, bien paralelo a antiparalelo, de acuerdo
con cual haya sido la elección del signo de la carga de la partícula. El momento dipolar eléctrico
oscila hacia la izquierda para las partículas y hacia la derecha para las antipartículas lo que
muestra una diferencia entre ambas que recibe el nombre de quiralidad. Si como habitualmente
consideramos que el electrón es la partícula, es de carga negativa, la transformación P CT
transforma la partícula (a) de la gura 4.9 en el sistema (b). Si lo que denominamos partícula
es de carga positiva, entonces el espín y el momento magnético son opuestos entre sí, tanto para
la partícula como para antipartícula.
Sin embargo, no tenemos constancia de que se hayan realizado medidas experimentales
para encontrar la orientación relativa entre el espín y el momento magnético para electrones
220 CAPÍTULO 4. PARTÍCULA DE DIRAC

Figura 4.9: Atributos electromagnéticos µ y d para (a) una partícula de carga negativa y su
transformada P CT , (b), la antipartícula de carga positiva y la orientación relativa con su
espín, analizado todo por el observador del centro de masa. El momento dipolar eléctrico
de la partícula oscila hacia la derecha mientras que lo hace hacia la izquierda para la
antipartícula.

y positrones libres, (y tampoco para muones) a pesar de que se han realizado medidas muy
precisas para determinar el valor absoluto de g , la relación giromagnética.

4.2.6. Dos experimentos plausibles


Un experimento plausible indirecto 4 ha sido propuesto para medir la orientación relativa
entre el espín y el momento magnético de los electrones externos en átomos alcalinos como el
Rb o Cs.
Los átomos de Rb87 tienen un electrón en el nivel 5s. Su núcleo tiene espín 3/2 y como el
resto de las capas electrónicas están completas, el estado fundamental del átomo tiene un espín
total 1, por lo que el electrón externo se coloca con su espín en dirección contraria al espín
del núcleo. El momento magnético del átomo es básicamente el del electrón externo, ya que las
capas internas están completas y el momento magnético del núcleo es mucho más pequeño, del
orden de me /87mp con respecto al del electrón, siendo me y mp las masas del electrón y del
protón, respectivamente.
Átomos de rubidio Rb87 muy fríos, en un campo magnético externo se orientarán de tal
manera que sus momentos magnéticos apunten en la dirección del campo. Si ahora lanzamos en
la dirección del campo un haz de fotones polarizados circularmente de suciente energía ∼ 6.8
GHz para producir la transición hiperna que nos da vuelta al espín del electrón más externo,
colocando al átomo en el estado excitado hiperno, y por lo tanto con espín total 2, únicamente
aquellos fotones cuyo espín tenga sentido contrario al de este electrón serán capaces de hacer la
transición, y podrán ser absorbidos. Fotones con su espín en la dirección del espín del electrón
externo no lo producirán. Por lo tanto, midiendo la orientación del espín de los fotones de la
luz polarizada circular que produce la transición hiperna, sabremos que el espín del electrón
externo tiene la orientación contraria, y como su momento magnético tiene la orientación del
campo, obtenemos la orientación relativa entre espín y momento magnético. Ahora la tarea sería
también medir la orientación relativa para los positrones, para conrmar esta predicción.
4
M.Rivas, Are the electron spin and magnetic moment parallel or antiparallel vectors?, LANL Ar-
Xiv:physics/0112057.
4.2. ECUACIÓN DE DIRAC 221

Existe una indenición en el signo de la carga de la materia, que está también presente en el
formalismo de Dirac. Sin embargo la predicción que se hace es consistente con los estados ligados
formados por una partícula y su antipartícula. Como ejemplo, consideremos el positronio (un
sistema ligado inestable electrón-positrón). Antes de aniquilarse posee un estado fundamental
de espín 0 y momento magnético 0. Esto signica que los espines de ambos electrón y positrón
son opuestos y lo mismo sucede para sus momentos magnéticos. Por lo tanto, para el electrón y
el positrón debe existir la misma orientación relativa entre su espín y su momento magnético.
Otro ejemplo, el pión neutro π 0 , es una combinación lineal de los estados ligados quark-
antiquark uū, dd¯ y a veces también se incluye el par ss̄. Es un sistema ligado que en su estado
fundamental es de espín 0 y momento magnético 0. Como cada uno de los quarks anteriores
poseen masas y cargas distintas poseen diferentes momentos magnéticos, la posibilidad de que
su combinación lineal dé un espín 0 y momento magnético 0, es que para cada uno de los
pares valgan cero, por lo que cada quark y su correspondiente antiquark deben tener la misma
orientación relativa entre el espín y su momento magnético.
Otro experimento que se propone es medir la dirección de precesión del espín de los e+ y
e− o bien de los µ+ and µ− en un anillo de almacenamiento. Si cada par e+ y e− o bien µ+
y µ− tienen la misma orientación relativa entre el espín y el momento magnético, entonces el
momento que las fuerzas externas hacen sobre ellos por parte de un campo magnético es el
mismo
dS
µ×B =
dt
Sin embargo, si inyectamos estas partículas con un acelerador de tal manera que las partículas
y las antipartículas tengan el espín en la misma dirección, por ejemplo hacia arriba, como las
dos clases de partículas poseen carga contraria, hay que invertir el sentido del campo magnético
del anillo, por lo que precesarán en sentido contrario. Si fuera posible detectar esta dirección de
precesión, conrmaría esta predicción, pero al mismo tiempo nos daría la orientación relativa
entre el espín y el momento magnético.

4.2.7. Quiralidad

El modelo clásico que satisface la ecuación de Dirac cuando se cuantiza, da lugar a dos
posibles sistemas con H > 0 y H < 0. Al sistema cuyo H > 0 se le suele denominar la partícula.
Ambos sistemas son de energía positiva E = |H|. Para la partícula el movimiento interno del
centro de carga tiene lugar en un plano ortogonal al espín en sentido hacia la izquierda cuando
se ja la dirección del espín en el sentido positivo. Para la antipartícula, el movimiento es hacia
la derecha, para la misma orientación del espín. Para las partículas, el sistema local orientable
de vectores unidad ei se comporta como un triedro inverso, que rota con velocidad angular en
la dirección opuesta a la del espín. Para las antipartículas resulta ser un triedro directo que rota
en el sentido del espín.
Si hubiéramos comenzado nuestro análisis considerando en primer lugar el ejemplo de la
antipartícula, entonces a la hora de obtener la misma representación de Pauli-Dirac como en
el caso anterior, habríamos tenido que considerar que los ejes del cuerpo son los de la gura
4.10, es decir, en la dirección opuesta a los que escogimos anteriormente, y esto nos lleva por
los mismos argumentos que las matrices γ µ deben reemplazarse por las −γ µ , de manera que
el Hamiltoniano, en el sistema de referencia del centro de masa, se reduce a −βmc2 . De esta
forma, el movimiento de los ejes del cuerpo es, en vez de (4.35-4.37), el dado por

de1 i
= [−βmc2 , e1 ] = −ωe2 , (4.53)
dt ~
de2 i
= [−βmc2 , e2 ] = ωe1 , (4.54)
dt ~
222 CAPÍTULO 4. PARTÍCULA DE DIRAC

Figura 4.10: Orientación relativa de los ejes del cuerpo para la antipartícula que dan lugar
a la representación de Pauli-Dirac. Los ejes se comportan como un sistema de ejes directo
que rotan alrededor de la dirección del espín.

de3 i
= [−βmc2 , e3 ] = 0, (4.55)
dt ~
con ω = c/R0 , lo cual corresponde claramente a un triedro directo que rota con una velocidad
angular ω , en la dirección del espín.
La materia es de izquierdas y la antimateria es de derechas, por lo que respecta al movimiento
y al comportamiento de los ejes del cuerpo. Materia y antimateria muestran una diferente
quiralidad.
A pesar de que el movimiento del centro de carga tiene lugar en una región del orden de
la longitud de onda Compton, es posible que esta separación sea físicamente inobservable, este
movimiento corresponde sin embargo a la oscilación de un dipolo eléctrico instantáneo, que
oscila con una frecuencia muy alta. El sentido del movimiento de este dipolo, una vez que la
dirección del espín ha sido jada, revela la diferencia entre partícula y antipartícula.
Finalmente, si comparamos el operador espín y el vector e3 vemos que
( ) ( )
~ σ 0 1 σ 0
S= , e3 = .
2 0 σ 3 0 −σ

de tal forma que las dos componentes superiores del espinor de Dirac corresponden a solucio-
nes de valor positivo de H y por lo tanto están relacionadas con S ∼ e3 , mientras que las
componentes inferiores corresponden al valor negativo de H , y para estas componentes estos
operadores se comportan como S ∼ −e3 , lo cual brinda una relación vectorial como la que se
representa en las guras 4.2 y 4.10, respectivamente.

4.3. Álgebra de Dirac

Las tres componentes espaciales del espín Si , las tres componentes del espín en los ejes del
cuerpo Tj y las nueve componentes de los ejes del cuerpo (ei )j , i, j = 1, 2, 3, cuyas representa-
ciones matriciales vienen dadas en el caso z = 0 por (4.15) o en (4.16) en el caso z = 1, son
15 matrices hermíticas de traza nula, que juntamente con la matriz unidad 4 × 4, I, forman un
conjunto de 16 matrices hermíticas, linealmente independientes. Son por lo tanto una base del
4.3. ÁLGEBRA DE DIRAC 223

álgebra de Dirac como espacio vectorial, y satisfacen las siguientes reglas de conmutación:

[Si , Sj ] = i~ϵijk Sk , [Ti , Tj ] = −i~ϵijk Tk , [Si , Tj ] = 0, (4.56)

[Si , (ej )k ] = i~ϵikr (ej )r , [Ti , (ej )k ] = −i~ϵijr (er )k , (4.57)


y los vectores reescalados 3ei , en el caso z = 0,
4i
[(3ei )k , (3ej )l ] = (δij ϵklr Sr − δkl ϵijr Tr ) , (4.58)
~
mostrando que los operadores ei transforman como vectores bajo rotaciones pero no son ob-
servables que conmuten. En el caso z = 1, los vectores reescalados −9ei , satisfacen las mismas
relaciones (4.58).
Si jamos el par de índices i, y j , entonces el conjunto de cuatro operadores, por ejemplo,
S 2 , Si , Tj y (ej )i forman un conjunto de 4 matrices hermíticas que conmutan. En efecto, las
funciones Φi , i = 1, . . . , 4, dadas anteriormente (3.77)-(3.80), son funciones propias simultáneas
de S 2 , S3 , T3 pero no de (e3 )3 con valores propios s = 1/2, y para s3 = ±1/2, t3 = ±1/2, pero
la acción de e33 sobre los espinores básicos nos los saca del espacio de la representación, a pesar
de que su representación matricial es diagonal, por lo que los espinores básicos no son vectores
propios de e33 .
Estos observables básicos satisfacen las siguientes reglas de anticonmutación:

~2
{Si , Sj } = {Ti , Tj } = δij I, (4.59)
2
~2
{Si , Tj } = (3ej )i , (4.60)
2
{Si , (3ej )k } = 2 δik Tj , {Ti , (3ej )k } = 2 δij Sk , (4.61)
2 2
δik δjl I + ϵikr ϵjls (er )s .
{(ei )j , (ek )l } = (4.62)
9 3
Si denimos ahora las matrices adimensionales y normalizadas:
2 2
aij = 3(ei )j , (ó aij = −9(ei )j ), si = Si , ti = Ti , (4.63)
~ ~
juntamente con la matriz unidad 4 × 4, I, forman un conjunto de 16 matrices Γλ , λ = 1, . . . , 16
que son hermíticas, unitarias, linealmente independientes y de determinante unidad. Son la base
ortonormal del álgebra de Dirac como álgebra de Cliord.
El conjunto de 64 matrices unitarias de determinante +1, ±Γλ , ±iΓλ , λ = 1, . . . , 16 forman
un subgrupo nito de SU (4). Su ley de composición se puede obtener de:

aij akl = δik δjl I + iδik ϵjlr sr − iδjl ϵikr tr + ϵikr ϵjls ars , (4.64)
aij sk = iϵjkl ail + δjk ti , (4.65)
aij tk = −iϵikl alj + δik sj , (4.66)
si ajk = iϵikl ajl + δik tj , (4.67)
si sj = iϵijk sk + δij I, (4.68)
s i tj = tj si = aji , (4.69)
ti ajk = −iϵijl alk + δij sk , (4.70)
ti tj = −iϵijk tk + δij I, (4.71)

y análogamente podemos usar estas expresiones para obtener las reglas de conmutación y de
anticonmutación (4.56-4.62).
224 CAPÍTULO 4. PARTÍCULA DE DIRAC

El álgebra de Dirac es generada habitualmente por las cuatro matrices gama de Dirac γ µ ,
µ = 0, 1, 2, 3 que satisfacen las reglas de anticonmutación:

{γ µ , γ ν } = 2η µν I, (4.72)

donde η µν es el tensor métrico de Minkowski.


Análogamente, el álgebra de Dirac puede ser generada por los cuatro observables siguientes,
por ejemplo: S1 , S2 , T1 y T2 . En efecto por (4.68) y (4.71) obtenemos los I, S3 y T3 respectiva-
mente y mediante (4.69), los restantes elementos.
Clásicamente, la orientación interna de un electrón es caracterizada por el conocimiento de
las componentes de los ejes del cuerpo (ei )j , i, j = 1, 2, 3, que en conjunto constituyen una
matriz ortogonal. Para caracterizar completamente y de forma única una matriz ortogonal a
partir de sus componentes, necesitamos conocer al menos cuatro de ellas. En la versión cuántica
el conocimiento de cuatro de las matrices (ei )j y haciendo uso algebraico de (4.64)-(4.71),
nos permite recuperar los restantes elementos del álgebra de Dirac. Es en este sentido que la
orientación interna del electrón completamente caracteriza su estructura interna. El álgebra
de Dirac que contiene a los observables del electrón que son invariantes por traslación, y es
generada por las cuatro matrices γ µ , puede ser también generada algebraicamente a partir de
cualesquiera cuatro de los operadores que describen su orientación.

4.4. Simetrías espacio-temporales adicionales


Las variables cinemáticas de esta partícula clásica de Dirac se reducen al tiempo t, posición
r , velocidad u y orientación α, con la condición de que la velocidad es siempre u = c, o bien 1
en unidades naturales. Si la partícula tiene masa m ̸= 0 y espín s ̸= 0, podemos denir también
una unidad natural de longitud s/mc y una unidad natural de tiempo s/mc2 . La unidad natural
de longitud es el radio del zitterbewegung, o movimiento circular del centro de carga de la gura
4.1, y la unidad natural de tiempo es el tiempo empleado por la carga durante una vuelta, y
para el observador del centro de masa. Esto implica que para partículas con masa y espín,
todas sus variables cinemáticas y sus derivadas temporales se pueden tomar adimensionales.
El formalismo es por lo tanto invariante bajo aquellas dilataciones espacio-temporales que no
modiquen la velocidad de la luz.
Resulta de esto que, aunque hemos comenzado con el grupo de Poincaré como el grupo
básico de simetrías espacio-temporales, estas partículas con masa y espín poseen un grupo de
simetrías más amplio. Al menos contiene también dilataciones espacio-temporales con generador
D. La acción de esta transformación sobre las variables cinemáticas es

t′ = eλ t, r ′ = eλ r, u′ = u, α′ = α.

La nueva constante del movimiento Noetheriana toma la forma

D = tH − r · P . (4.73)

Sea R(β) una rotación arbitraria que cambia los ejes coordenados del observador inercial.
La acción de esta rotación arbitraria R(β) sobre las variables cinemáticas es

t′ = t, r ′ = R(β)r, u′ = R(β)u, R(α′ ) = R(β)R(α),

y por esta razón los generadores J de las rotaciones involucran a operadores diferenciales que
derivan con respecto a todas estas variables cinemáticas, excluido el tiempo.
La orientación de la partícula, representada por las variables α, o de forma equivalente por
la matriz ortogonal de rotación R(α), se interpreta como la orientación de un sistema hipotético
4.4. SIMETRÍAS ESPACIO-TEMPORALES ADICIONALES 225

de tres ejes unidad cartesianos ei , i = 1, 2, 3, localizados en el punto r . No poseen realidad física,


pero la elección de este sistema cartesiano ligado al punto es completamente arbitraria, como
hemos visto en el análisis clásico, de tal manera que el formalismo debe ser independiente de
sus valores reales. Esto signica que, además del anterior grupo de rotaciones que modica los
ejes del observador inercial, debe existir otro grupo de rotaciones locales SO(3)L , de elementos
R(γ), que modica a las variables de orientación α, pero sin modicar al resto de las variables
r y u, es decir, una rotación local del sistema de ejes del cuerpo:
t′ = t, r ′ = r, u′ = u, R(α′ ) = R(γ)R(α), (4.74)
Los generadores de este nuevo grupo de rotaciones, que afecta solamente a las variables de
orientación, serán la proyección de los operadores de momento angular W proyectados sobre
los ejes de la partícula. Es claro que estas dos operaciones de rotación de los ejes del observador
y de los ejes de la partícula, conmutan entre sí. Estas últimas rotaciones las podemos interpretar
como rotaciones activas de los ejes de la partícula. A partir del teorema de Noether, los nuevos
observables conservados serán:
Ti = W · ei , (4.75)
donde ei son los tres vectores unidad ortogonales que denen los ejes de la partícula.
Si R(α) es la matriz ortogonal de rotación que describe la orientación de la partícula, si
la consideramos por columnas, estas columnas describen las componentes de los tres vectores
unidad ortogonales ei , i = 1, 2, 3. Las Ecuaciones (4.74) corresponden a la transformación
e′i = R(γ)ei de los ejes de la partícula.
Los operadores Wi , representan a las componentes de los operadores de momento angular
asociados al cambio de orientación de la partícula, y proyectados en los ejes del observador
inercial correspondiente. Las magnitudes conservadas (4.75), son las componentes de los opera-
dores de momento angular proyectados sobre los ejes de la partícula Ti = ei · W . Al cuantizar
el sistema, vendrán dados por los operadores diferenciales (4.90)-(4.92) del apéndice de este
capítulo, y satisfacen
T 2 = W 2 , [Ti , Tj ] = iϵijk Tk ,
[Ti , Kj ] = [Ti , Jj ] = [Ti , H] = [Ti , D] = [Ti , Pj ] = 0.
Hemos visto que los operadores autoadjuntos Ti generan otro grupo SU (2) que es la repre-
sentación del grupo de rotaciones locales SO(3)L , que modica solamente a las variables de
orientación, conmuta con el grupo de rotaciones generado por los Jj , y con la totalidad del
grupo de Poincaré ampliado, incluidas las dilataciones espacio-temporales.

4.4.1. Análisis del grupo de simetrías ampliado


Sean H , P , K y J los generadores del grupo de Poincaré P . Con la identicación habitual de
pµ ≡ (H/c, P ) como los operadores que denen el tetramomento y wµ ≡ (P · J , HJ /c − K × P )
como el operador tetravector de Pauli-Lubanski los dos operadores de Casimir del grupo de
Poincaré son
C1 = pµ pµ , C2 = −wµ wµ .
Estos operadores de Casimir, si los medimos en el sistema de referencia del centro de masa
donde P = K = 0, y en unidades naturales c = 1, ~ = 1, se reducen respectivamente en
una representación irreducible a C1 = m2 y C2 = H 2 J 2 = m2 s(s + 1). Los dos parámetros m
y s, que caracterizan a cada representación irreducible del grupo de Poincaré, representan las
propiedades intrínsecas de una partícula elemental relativista.
Consideremos las dilataciones espacio-temporales de generador D. La acción de esta trans-
formación sobre las variables cinemáticas es
t′ = eλ t, r ′ = eλ r, u′ = u, α′ = α.
226 CAPÍTULO 4. PARTÍCULA DE DIRAC

Denotemos esta ampliación del grupo de Poincaré por W , a veces denominado grupo de Weyl.
En la representación cuántica, este nuevo generador, cuando actúa sobre la función de onda,
toma la forma:
D = it∂/∂t + ir · ∇. (4.76)
y satisface
[D, pµ ] = −ipµ , [D, J µν ] = 0.
Este grupo ampliado solamente posee un operador de Casimir 5 , el cual, para partículas con
masa, con lo que el operador C1 ̸= 0 es invertible, se reduce a

C = C2 C1−1 = C1−1 C2 ≡ C2 /C1 = s(s + 1).

En el sistema de referencia del centro de masa, este operador se reduce a C = S 2 , el cuadrado


del operador espín.
Al admitir también como simetría las dilataciones espacio-temporales vemos que la masa
deja de ser una propiedad intrínseca. Es únicamente el espín la propiedad intrínseca de una
partícula elemental. En efecto, puesto que el radio del movimiento interno es R = s/mc, un
cambio de las escalas de longitud y tiempo corresponde a un cambio de masa, permaneciendo
s y c constantes. Pero esta transformación de una partícula elemental de espín 1/2 modica su
estructura, su radio interno y su masa y se transforma en un estado de masa diferente pero del
mismo espín.
La estructura del operador diferencial J = r × P + Z + W , donde la parte del espín es
S = Z + W posee por valor propio s = 1/2 en el modelo analizado. Esto implica que el
valor propio del operador W 2 corresponde a w = 1/2 mientras que para la parte Z 2 se reduce
solamente a las dos posibilidades z = 0 o z = 1.
Además del grupo W vamos a considerar la representación del grupo de rotaciones locales
generadas por los Ti con valores propios w = t = 1/2. Tenemos por lo tanto un grupo de
transformaciones espacio-temporales más amplio que el grupo de Weyl, con una estructura
adicional SU (2) al ser cuantizado.
Los generadores Ti conmutan con todos los generadores del grupo de Weyl W , y este nuevo
grupo de simetría lo podemos escribir como S = W ⊗ SU (2)T .
Este nuevo grupo posee solamente dos operadores de casimir S 2 y T 2 con valores propios
1/2. Esto es lo que justica que nuestra función de onda sea un objeto de cuatro componentes.
Al escoger el conjunto completo de observables que conmutan, tomamos los operadores T 2 = S 2 ,
el operador S3 y el T3 que pueden tomar los valores ±1/2 y, por ejemplo el operador pµ pµ y
los operadores pµ . De esta manera, podemos separar en la función de onda las variables de
orientación y velocidad de las variables espacio-tiempo,


i=4
ψ(t, r, u, α) = ϕi (t, r)χi (u, α)
i=1

donde los cuatro espinores χi (v, α) se pueden clasicar de acuerdo con los valores propios
|s3 , t3 >. Las funciones ϕi (t, r) se pueden escoger como vectores propios del operador de Klein-
Gordon
pµ pµ ϕi (t, r) = m2i ϕi (t, r).
Como este operador pµ pµ no conmuta con el observable D, el valor propio de la masa mi no
es una propiedad intrínseca, y el correspondiente valor depende del estado particular ϕi que se
considere.
5
L. Abellanas and L. Martínez Alonso J. Math. Phys. 16 1580 (1975).
4.4. SIMETRÍAS ESPACIO-TEMPORALES ADICIONALES 227

Para la clasicación de los espinores χi (u, α) podemos considerar también la parte de los
operadores de momento angular Z . Como [Z 2 , S 2 ] = [Z 2 , T 2 ] = [Z 2 , pµ ] = 0, podemos tomar
Z 2 como un observable que conmuta. Solamente puede tomar valores propios enteros al actuar
sobre funciones de las variables de velocidad. Es debido a que en términos de estas variables
tiene la estructura de un momento angular orbital. Como el espín total S = Z + W , y el valor
propio de S 2 es 1/2, los posibles valores propios de Z 2 son solamente z = 0 ó z = 1. Ver el
apéndice al nal del capítulo para una clasicación posible de las χi (u, α), de acuerdo con z = 0
y que da lugar a las funciones propias (3.77-3.80), y las funciones propias correspondientes a
z = 1, dadas en (4.93-4.96). En este caso, las funciones propias no pueden ser simultáneamente
vectores propios de Z3 . Sin embargo, el valor esperado de Z3 en la base correspondiente a z = 0,
Φi , es 0, mientras que su valor esperado en la base correspondiente a z = 1, Ψi , es de ±2/3.

4.4.2. Ampliación del espacio cinemático


Una vez que el grupo cinemático ha sido ampliado incluyendo como simetrías adicionales
las dilataciones espacio-temporales, tenemos una nueva variable cinemática adimensional aso-
ciada a este nuevo subgrupo uniparamétrico. De esta forma el espacio cinemático, como espacio
homogéneo del nuevo grupo, puede ser ampliado. En efecto, si tomamos la derivada temporal
de la constante del movimiento (4.73), obtenemos:

H = P · u.

Si lo comparamos con la ecuación (4.19), vemos que falta un término. Esto implica, que desde el
punto de vista clásico necesitamos una nueva variable cinemática adimensional β , que transforme
bajo estas transformaciones, y que contribuya al nuevo observable D. El espacio cinemático
ampliado transforma ahora:

t′ = eλ t, r ′ = eλ r, u′ = u, α′ = α, β ′ = λ + β.

Desde el punto de vista de la teoría de grupos, esta nueva variable adimensional corresponde
con sus dimensiones y dominio lo mismo que el parámetro normal del nuevo subgrupo, cuyo
generador es D.
Desde el punto de vista Lagrangiano, la nueva Lagrangiana dependerá también de β y de
β̇ , con una estructura general de la forma
e = ṫT + ṙ · R + u̇ · U + ω · W + β̇B,
L
e β̇ . La constante del movimiento Noetheriana asociada a la invariancia
siendo ahora B = ∂ L/∂
de las ecuaciones dinámicas bajo las dilataciones espacio-temporales nos lleva a que

D = tH − r · P − B,

y el nuevo generador en la versión cuántica aparece como:



D = it∂/∂t + ir · ∇ + i .
∂β
De esta forma, el último término de (4.19) está relacionado con la derivada temporal del último
término de la ecuación de Dirac:
( )
dB 1 du
= 2S · ×u .
dt c dt
Este nuevo observable B , con dimensiones de acción, posee una derivada temporal positiva
para las partículas y una derivada temporal negativa para las antipartículas. Este signo está
228 CAPÍTULO 4. PARTÍCULA DE DIRAC

claramente ligado con el signo de H . Para el observador del centro de masa P = 0, H = ±mc2 =
dB/dt, que da por solución B(t) = B(0) ± mc2 t. En unidades de ~ este observable representa
la mitad de la fase del movimiento interno de la carga alrededor del centro de masa
1
B(t) = B(0) ± ~ωt.
2
Una partícula de Dirac necesita dar dos vueltas para que su fase B(t), en unidades de ~,
incremente en 2π .
Debido a que las rotaciones locales generadas por los Ti conmutan con todo el grupo W , las
variables cinemáticas anteriores también siguen generando un espacio homogéneo del grupo total
W ⊗ SU (2)T , y, por lo tanto, también representan las variables cinemáticas de una partícula
elemental cuyo grupo de simetrías espacio-temporales sea este nuevo grupo ampliado.

4.4.3. Relación con el modelo estándar


Hemos analizado el grupo de simetrías espacio-temporales de un modelo clásico de partícula
elemental que satisface la ecuación de Dirac cuando se cuantiza. La materia descrita por este
modelo (estados con H > 0), es de izquierdas mientras que es de derechas para la antimateria
(estados con H < 0). El concepto de derechas e izquierdas, se reere al movimiento del centro
de carga una vez que la dirección del espín ha quedado jada. Para la materia el movimiento
de la carga es en sentido contrario a las agujas del reloj cuando miramos en la dirección del
espín. Está contenido en un plano ortogonal a la dirección del espín, con el convenio habitual
de signos para formas lineales y multivectores del álgebra geométrica. El movimiento tiene la
dirección de las agujas del reloj para la antimateria.
El grupo de simetrías de la Lagrangiana de esta partícula es el S = W ⊗ SO(3)T y es
W ⊗ SU (2)T en su descripción cuántica. Es más amplio que el grupo de Poincaré que es con el
que comenzamos el análisis cinemático. En la versión cuántica, además del grupo de Poincaré
contiene un nuevo grupo U (1), el cual es la representación unitaria del grupo de dilataciones
espacio-temporales. Además contiene un grupo SU (2)T que es la representación unitaria del
grupo de rotaciones locales del sistema cartesiano ligado al punto. El grupo total posee dos
operadores de Casimir: S 2 , el operador de Casimir de W y T 2 el operador de Casimir de
SU (2)T , que toman ambos los valores propios s = t = 1/2 para la partícula de Dirac que
acabamos de considerar.
Algunas de estas características poseen ciertas similitudes con el modelo estándar de partí-
culas elementales, por lo que respecta a aspectos cinemáticos. Si, por ejemplo, interpretamos los
generadores de las rotaciones locales Ti como si describiesen el isospín y que las componentes
del momento angular Z , relacionadas con la parte zitterbewegung del espín, como si describie-
sen color, entonces una partícula elemental de Dirac, descrita por este formalismo es un objeto
masivo de espín 1/2, isospín 1/2, y de masa y carga arbitraria. Admite como estados de espín
los s3 = ±1/2 y también para el isospín t3 = ±1/2. Existen dos representaciones irreducibles
no equivalentes correspondientes a la parte zitterbewegung del espín z . Puede ser una partícula
sin color z = 0 (lepton?) descrita por los espinores Φi de (4.17) o una partícula con color z = 1
descrita por los espinores Ψi de (4.18) en uno cualquiera de los tres posibles estados de color
z3 = 1, 0, −1, (quark?), pero no admite valores mayores para el valor propio z . Los estados
básicos pueden ser vectores propios de Z 2 pero no de Z3 , de tal manera que el correspondiente
color no es simultáneamente observable con los demás atributos del espín, y resulta por lo tanto
inobservable en estados de espín denido. No existen posibilidades de transición entre partí-
culas con color y sin color, debido a la ortogonalidad de las correspondientes representaciones
irreducibles Φi y Ψj , < Φi |Ψj >= 0.
Como los valores propios de Z3 son inobservables, podemos rotar entre sus tres estados
manteniendo el mismo valor del color z = 1. Estas rotaciones se reducen a una representación de
4.5. UNA LAGRANGIANA DE INTERACCIÓN DE DOS PARTÍCULAS DE DIRAC 229

un nuevo grupo interno, el grupo unitario SU (3) que transforma entre sí los tres vectores propios
de Z3 los vectores Yij de (4.101) entre ellos y que no modica el valor z = 1 de los espinores Ψi .
Sin embargo, esta relación entre este nuevo grupo unitario SU (3), el cual no es propiamente un
grupo de transformaciones espacio-temporales sino un grupo de transformaciones entre estados
z = 1, y el grupo de simetrías W ⊗ SU (2)T no es simplemente un producto directo y su análisis
lo vamos a dejar para una futura investigación.
Este formalismo es puramente cinemático. No hemos hecho mención de ningún tipo particu-
lar de interacción, electromagnética, débil o fuerte, entre las diferentes clases de partículas. De
esta forma, la comparación estricta con el modelo estándard, a pesar de que nos han aparecido
como grupos adicionales U (1), SU (2)T y SU (3), puede parecer un poco articial.
Desde el punto de vista clásico, el modelo con z = 1, es el modelo de la portada en el que
el movimiento del centro de carga alrededor del centro de masa produce el momento magnético
del electrón. El espín es la suma de la parte orbital Z y la parte rotativa W en la dirección de
la velocidad angular ω . El espín es s = 1/2, que se compone de los dos valores mínimos para
las dos partes. El valor mínimo, no nulo, de Z , es z = 1 y en la dirección del espín total S y el
valor mínimo no nulo de W , w = 1/2, en sentido contrario, de la parte rotativa.
En el caso z = 0, la trayectoria del centro de carga no encerraría ningún área, sería un
movimiento armónico unidimensional de pulsación ω juntamente con un sistema cartesiano de
ejes ligado al punto que oscila, y que rotan con la velocidad angular ω , del mismo valor que
la pulsación ω . El espín es aquí rotativo W , en la misma dirección que la velocidad angular
del sistema cartesiano comóvil, ω . Al no encerrar área la trayectoria del punto r , su momento
magnético con respecto al centro de masa sería cero. En este caso el valor del espín es el valor
mínimo no nulo del momento angular cuántico asociado a la rotación, es decir s = w = 1/2.
De acuerdo con esta discusión, como el electrón es una partícula de Dirac que posee momento
magnético, es la descripción de la portada, con z = 1, la que produce, en nuestra opinión, la
descripción clásica del electrón. La partícula con z = 0 es también una partícula de Dirac, pero
de momento magnético cero. Podría representar a un neutrino, donde el punto r representaría
la localización de la carga débil del mismo.

4.5. Una Lagrangiana de interacción de dos partículas de Dirac

Una partícula elemental puede ser aniquilada por la interacción con su antipartícula. Pero si
no es destruida por esta interacción, hemos hecho la hipótesis de que no puede ser modicada,
que su estructura no puede cambiar. Como sus propiedades intrínsecas son el espín S y su
proyección en los ejes del cuerpo T , estas dos propiedades no pueden ser alteradas por ninguna
interacción con algún campo externo o con otra partícula.
Consideremos un sistema compuesto por dos partículas elementales con espín y con el mismo
espacio cinemático 6 . Vamos a usar el subíndice a = 1, 2 para distinguir a las variables cinemáti-
cas que se reeren a cada partícula. El espacio cinemático del sistema es el producto cartesiano
de ambos espacios para cada partícula y formado por las variables (ta , r a , ua , αa , βa ), a = 1, 2.
La Lagrangiana del sistema compuesto se podrá escribir como

L = L1 + L2 + LI

donde las La , a = 1, 2, son las Lagrangianas libres de cada partícula y LI es la Lagrangiana de la


interacción entre ellas, que estamos buscando. Ambas La son invariantes bajo el grupo ampliado
S = W ⊗ SO(3)T y lo que pretendemos es buscar una Lagrangiana de interacción LI que sea
también invariante bajo S . La estructura general de cada una de las Lagrangianas La asociadas
6
M. Rivas, An interaction Lagrangian for two spin 1/2 elementary Dirac particles, J. Phys. A: Math. and
Theor. 40, 2541 (2007).
230 CAPÍTULO 4. PARTÍCULA DE DIRAC

a cada partícula, como solamente dependen de las correspondientes variables cinemáticas, es

e a = Ta ṫa + Ra · ṙ a + U a · u̇a + W a · ω a + Ba β̇a


L

donde Ta = ∂ L e a /∂ ṫa , Ra = ∂ L
e a /∂ ṙ a , U a = ∂ L
e a /∂ u̇a , W a = ∂ L
e a /∂ω a y Ba = ∂ L
e a /∂ β̇a ,
debido a la homogeneidad de cada L e a en términos de las derivadas τ de las correspondientes
variables cinemáticas. El espín y la proyección del espín sobre los ejes del cuerpo para cada
partícula, son
S a = ua × U a + W a , Tai = eai · W a
donde eai , i = 1, 2, 3 son los tres vectores ortogonales con origen en cada punto r a .
La Lagrangiana de interacción entre estas dos partículas L e I , será en general una función
de todas las variables cinemáticas de ambas partículas y de sus derivadas τ , y homogénea de
grado uno en estas últimas. Pero si ambas propiedades intrínsecas de las dos partículas Sa
y Ta , no son modicadas por la interacción, la Lagrangiana no puede ser una función de las
derivadas τ de aquellas variables cinemáticas que den lugar a estas propiedades, es decir, no
puede ser función de las variables u̇a y ω a , a = 1, 2. En caso contrario, las funciones U a y W a
contendrían términos provinientes de la L e I y serían diferentes que en el caso libre. Las funciones
U a y W a , que dan lugar a la denición del espín, se tienen que obtener solamente a partir de
las correspondientes Lagrangianas libres, L ea .
Entonces, por lo que respecta a la dependencia de la Lagrangiana L e I de las derivadas con
respecto a τ de las variables cinemáticas, dependerá solamente de ṫa , ṙ a y β̇a , a = 1, 2. Además
de esto, será función de las variables cinemáticas ta , r a , ua y βa , pero no de las αa debido
a la invariancia bajo el grupo de rotaciones locales SO(3)L . La invariancia bajo dilataciones
espacio-temporales implica que la Lagrangiana debe ser función de la diferencia de fase β1 − β2 ,
y de β̇1 − β̇2 , pero como esas fases son completamente arbitrarias debe ser independiente de
estas fases.
Debido a la ligadura ua = ṙ a /ṫa , la Lagrangiana de la interacción será nalmente una
función
eI = L
L e I (ta , r a , ṫa , ṙ a ),

y función homogénea de grado uno de las derivadas ṫa , ṙ a , a = 1, 2.


Si escribimos, como es habitual, el tetravector Minkowskiano xµa ≡ (cta , r a ), la invariancia
bajo traslaciones implica que la Lagrangiana debe ser función de xµ1 − xµ2 . Los dos siguientes
términos ηµν ẋµ1 ẋν2 y ηµν (xµ1 − xµ2 )(xν2 − xν1 ), donde ηµν es el tensor métrico de Minkowski, son in-
variantes Poincaré. Si consideramos que el parámetro de evolución τ no tiene dimensiones, estos
términos poseen dimensiones de longitud al cuadrado. Por lo tanto su cociente es adimensional
e invariante bajo dilataciones espacio-temporales. La otra condición es que la Lagrangiana sea
homogénea de primer grado en las derivadas τ de las variables cinemáticas. La raíz cuadrada
de lo anterior cumple este requisito. Si ambas partículas son idénticas, y por lo tanto indis-
tinguibles, nos queda una simetría discreta: la Lagrangiana de interacción debe ser invariante
bajo el intercambio 1 ↔ 2 entre las etiquetas de ambas partículas. Llegamos, por lo tanto a la
Lagrangiana invariante bajo el grupo total S
√ √
µ ν
eI = g ηµν ẋ ẋ
1 2 c2 ṫ1 ṫ2 − ṙ 1 · ṙ 2
L µ µ = g
ηµν (x1 − x2 )(xν2 − xν1 ) (r 2 − r 1 )2 − c2 (t2 − t1 )2

donde g es una constante de acoplamiento con dimensiones de acción.


Otras Lagrangianas alternativas que cumplen estos requisitos, pueden también construirse.
e = g(ẋ1 − ẋ2 )µ (x1 − x2 )µ /(x1 − x2 )2 , pero es una derivada total con respecto
Por ejemplo, L
a τ de la función log(x1 − x2 )2 . Otra puede ser L e = g(ẋ1 + ẋ2 )µ (x1 − x2 )µ /(x1 − x2 )2 , sin
dimensiones y lineal en las derivadas de las variables cinemáticas, pero cambia de signo bajo el
4.5. UNA LAGRANGIANA DE INTERACCIÓN DE DOS PARTÍCULAS DE DIRAC 231

intercambio 1 ↔ 2, y por lo tanto todos los observables de la interacción, como la energía de


interacción, cambian de signo, lo cual no tiene sentido físico para dos partículas idénticas.
Otra posibilidad sería

eI = g ηµν ẋµ1 ẋν2 c2 ṫ1 ṫ2 − ṙ 1 · ṙ 2


L = g ,
ηµν (ẋµ1 − ẋµ2 )(xν2 − xν1 ) (ṙ 1 − ṙ 2 ) · (r 2 − r 1 ) − c2 (ṫ1 − ṫ2 )(t2 − t1 )

que cumple tanto las condiciones de homogeneidad como de invariancia de escala. En una
descripción síncrona queda
c2 − u1 · u2
LI = g (4.77)
(u1 − u2 ) · (r 2 − r 1 )
La interaccion entre dos partículas de Dirac no es única. Sabemos que entre los leptones y
los quarks hay interacciones de corto alcance, como la débil y la fuerte y otra que es tanto
de corto como de largo alcance que es la interacción electromagnética. La Lagrangiana que se
propone, tiene la ventaja de que describe una interacción que es invariante bajo cambios de
escala, y por lo tanto puede describir una interacción tanto de corto como de largo alcance,
y que, además posee un comportamiento Coulombiano, cuando se suprimen los espines de
las partículas, como veremos en la siguiente sección. De esta forma, suministra una especie
de generalización como acción a distancia, de una interacción electromagnética a distancias
arbitrarias y a corta distancia el equivalente a la interacción débil. La novedad es que ha sido
obtenida suponiendo un grupo de simetrías más amplio que el grupo de Poincaré.

4.5.1. Descripción síncrona


Una vez que un cierto observador inercial queda jado, consideremos que éste realiza una
descripción síncrona, es decir, que usa como parámetro de evolución su tiempo t, que resulta ser
el mismo que los dos tiempos t1 y t2 de las dos partículas. En este caso, t = t1 = t2 , ṫ1 = ṫ2 = 1,
y por lo tanto √ √
c2 − u1 · u2 c2 − u1 · u2
LI = g =g (4.78)
(r 2 − r 1 )2 r
donde r = |r 1 −r 2 | es la separación instantánea entre las dos cargas en este sistema de referencia,
y ua = dr a /dt la velocidad de la carga a.
Un promedio sobre la posición y velocidad de la carga, en el centro de masa de la partícula 1
implica que < r 1 >= q 1 y < u1 >= 0, de tal manera que la interacción se reduce a la interacción
Coulombiana instantánea entre el centro de masa de la primera partícula y el centro de carga de
la otra. Un nuevo promedio sobre la otra corresponde nalmente a la interacción Coulombiana
instantánea de dos partículas puntuales sin espín, puesto que al eliminar el zitterbewegung
estamos suprimiendo la estructura del espín.
Esto está sugiriendo que, en el sistema internacional de unidades, la constante de acopla-
miento gc = ±e2 /4πϵ0 en términos de las cargas eléctricas de cada partícula y donde el signo
± depende de si las cargas son de signos opuestos o del mismo signo. Si la constante de acopla-
miento, que tiene dimensiones de acción, la escribimos como g = α~, resulta que la constante
adimensional α, es precisamente la constante de estructura na

e2
α= .
4πϵ0 ~c
De esta forma la interacción es independiente de las masas de las partículas y en la descripción
síncrona toma la forma √
c2 − u1 · u2
LI = α~ .
r
232 CAPÍTULO 4. PARTÍCULA DE DIRAC

La Lagrangiana del sistema de las dos partículas L e=L e1 + L


e2 + L
e I no es invariante bajo cambio
e
de escala, pues las Li , i = 1, 2 no lo son, por lo que un cambio de escala espacio-temporal lo
que nos describe es la interacción, con la misma L e I de dos partículas de la misma carga y el
mismo espín, pero de masas diferentes de las anteriores. Si inicialmente estábamos describiendo
la interacción entre dos electrones, el cambio de escala lo que sugiere es que el sistema material
reescalado corresponde a la interacción, con la misma Lagrangiana de interacción L e I , de dos
partículas de la misma carga y espín que las anteriores, ambas de la misma masa, pero distinta
de la masa de los electrones. Estaríamos describiendo la interacción entre dos muones o dos
partículas tau. Sin embargo, si utilizamos variables adimensionales usando como unidad de
longitud R0 = ~/2mc el radio del zitterbewegung y como unidad de velocidad la constante
universal c, la Lagrangiana de interacción nos queda
√ √
α~c 1 − u1 · u2 2 1 − u1 · u2
LI = = 2αmc ,
~/2mc r r

donde todas las variables son adimensionales. Si L1 y L2 dependen de la masa, reescalando toda
la Lagrangiana por el factor mc2 , nos queda nalmente una Lagrangiana adimensional que en
la descripción síncrona queda

1 − u1 · u2
L = L1 + L2 + 2α , (4.79)
r
y que es independiente de las masas de las partículas y donde el único parámetro físico es la
constante de estructura na α.
La Lagrangiana (4.77) quedaría en la descripción síncrona de la forma

c2 − u1 · u2
LI = α~ ,
(u1 − u2 ) · (r 2 − r 1 )

con la misma constante de acoplamiento. Si hacemos el reescalamiento anterior en términos de


la unidad de longitud R0 la velocidad c, y después reecalamos toda la Lagrangiana por mc2 ,
nos queda
1 − u1 · u2
L = L1 + L2 + 2α , (4.80)
(u1 − u2 ) · (r 2 − r 1 )
con todas las variables adimensionales y en términos de la misma constante adimensional α.
Una primera conclusión de esta descripción síncrona, tanto para la Lagrangiana (4.78) como
la (4.77) es que para que haya interacción tiene que ser siempre u1 ̸= u2 , pues en caso contrario
no existiría interacción. Un sistema de dos electrones en reposo con espines paralelos y mo-
viéndose al unísono u1 = u2 , no interaccionan independientemente de la distancia a que estén
separados sus centros de carga r. Lo mismo un electrón y un positrón con los espines opuestos,
se podría tener que u1 = u2 , y por lo tanto la Lagrangiana de interacción sería idénticamente
nula.
El formalismo es invariante Poincaré mientras que la interacción es además invariante bajo el
grupo ampliado S , que contiene también cambios de escala y rotaciones locales. La parte libre L0
describiría partículas de espín 1/2 y diferentes masas, pero la interacción sería independiente de
las masas de las partículas. Todos los leptones, o todos los quarks, que poseen masas diferentes,
vendría descrita su interacción por la misma L eI .
La derivada variacional de la L con respecto a las variables r a nos produce de la parte La
el término −dpa /dt,
( ) ( )
dpa d ∂La d2 ∂La
− =− + 2 ,
dt dt ∂ua dt ∂aa
4.5. UNA LAGRANGIANA DE INTERACCIÓN DE DOS PARTÍCULAS DE DIRAC 233

por ser La independiente de r a , y de la parte LI la expresión


( )
∂LI d ∂LI
− = Fa
∂r a dt ∂ua

que nos lleva a las ecuaciones


dpa
= F a , a = 1, 2.
dt
La derivada variacional con respecto a las variables de orientación, es la misma que en el caso
libre de cada partícula, pues LI es independiente de ellas y resulta
dW a
= ωa × W a, a = 1, 2.
dt
Como por otra parte, el momento lineal mecánico de cada partícula se puede escribir en términos
de la velocidad del centro de masa de cada una, esto es pa = γ(va )mv a , a = 1, 2, la primera de
las ecuaciones nos deniría la aceleración de los centros de masa de cada partícula, por lo que
reescribir el momento lineal de esta forma equivale a incluir, en términos de r a y sus derivadas,
la denición del centro de masa de cada partícula, esto es:

(q a − r a )2 d2 r a
qa = ra +
c2 − v a · ua dt2
o lo que es lo mismo, la ecuación diferencial de segundo orden para la posición del centro de
carga de cada partícula, en términos de la posición y velocidad del centro de masa de las mismas:

d2 r a c2 − v a · ua
= (q − r a ), a = 1, 2.
dt2 (q a − r a )2 a

Haremos uso de esta forma de describir la interacción de dos electrones, que conduce a la
existencia de estados ligados entre ellos, en la sección 6.6.
234 CAPÍTULO 4. PARTÍCULA DE DIRAC

4.6. Apéndice: El grupo S = W ⊗ SU (2)T ⊗ U (1)Q

Vamos a analizar las representaciones de este grupo, en particular las representaciones de


los generadores de las diferentes transformaciones innitesimales. La parte correspondiente a
los generadores de las rotaciones, es un duplicado de lo visto en el Apéndice 3.5.
Bajo traslaciones innitesimales de tiempo y espacio de parámetros δτ y δb, respectivamente,
las variables cinemáticas transforman:

t′ = t + δτ, r ′ = r + δb, u′ = u, α′ = α, β′ = β

de tal manera que los generadores autoadjuntos de las traslaciones son


H=i , P = −i∇, [H, P ] = 0.
∂t
Bajo una dilatación innitesimal de parámetro normal δλ, transforman como:

t′ = t + tδλ, r ′ = r + rδλ, v ′ = v, α′ = α, β ′ = β + δλ

por lo que el generador adopta la forma (~ = 1)

∂ ∂
D = it + ir · ∇ + i = tH − r · P − B, [D, H] = −iH, [D, Pj ] = −iPj .
∂t ∂β

Para describir la orientación podemos representar cada elemento del grupo de rotaciones por
el trivector α = αn, donde α es el ángulo a girar y n es el vector unidad a lo largo del eje de
rotación. Esta es la parametrización normal o canónica. Alternativamente, podemos representar
cada rotación por el trivector ρ = tan(α/2)n. En este caso, cada matriz de rotación toma la
forma
1 ( )
R(ρ)ij = 2
(1 − ρ2 )δij + 2ρi ρj + 2ϵikj ρk .
1+ρ
La ventaja de esta parametrización es que la composición de dos rotaciones es especialmente
simple. R(ρ′ ) = R(µ)R(ρ) toma la forma
µ+ρ+µ×ρ
ρ′ = .
1−µ·ρ

Bajo una rotación innitesimal de parámetro δµ = δα/2, o en términos del parámetro normal,
las variables cinemáticas transforman como

δt = 0, δβ = 0
δri = −2ϵijk rj δµk ,
δui = −2ϵijk uj δµk ,
δρi = (δik + ρi ρk + ϵikl ρl ) δµk ,

de manera que la variación de las variables cinemáticas por unidad de parámetro normal de
rotación δαk es

δtk = 0, δβk = 0,
δrik = −ϵijk rj ,
δuik = −ϵijk uj ,
1
δρik = [δik + ρi ρk + ϵikl ρl ] ,
2
4.6. APÉNDICE: EL GRUPO S = W ⊗ SU (2)T ⊗ U (1)Q 235

y así los generadores autoadjuntos Jk , son, utilizando unidades naturales ~ = 1 y c = 1,


( )
∂ ∂ 1 ∂ ∂ ∂
Jk = iϵijk rj + iϵijk uj + + ρk ρi + ϵikl ρl .
∂ri ∂ui 2i ∂ρk ∂ρi ∂ρi
Pueden ser separados en tres partes, de acuerdo a los diferentes operadores diferenciales invo-
lucrados, que derivan con respecto a las tres clases de variables cinemáticas r , u y ρ, respecti-
vamente:
J = L + Z + W,

Lk = iϵijk rj ,
∂ri
( )
∂ 1 ∂ ∂ ∂
Zk = iϵijk uj , Wk = + ρk ρi + ϵikl ρl . (4.81)
∂ui 2i ∂ρk ∂ρi ∂ρi
Todos ellos satisfacen las reglas de conmutación del momento angular y conmutan entre sí:

[Lj , Lk ] = iϵjkl Ll , [Zj , Zk ] = iϵjkl Zl , [Wj , Wk ] = iϵjkl Wl ,

[L, Z] = [L, W ] = [Z, W ] = 0.


y por lo tanto

[Jj , Jk ] = iϵjkl Jl , [J , H] = [J , D] = 0, [Jj , Pk ] = iϵjkl Pl .

La variable de orientación anterior ρ, bajo un boost general de velocidad v , transforma como


ρ + F (v, u, ρ)
ρ′ = ,
1 + G(v, u, ρ)
donde
γ(v)
F (v, u, ρ) = (u × v + v(u · ρ) + (u × ρ) × v) ,
1 + γ(v)
γ(v)
G(v, u, ρ) = (u · v + v · (u × ρ)) , γ(v) = (1 − v 2 )−1/2 .
1 + γ(v)
Finalmente, bajo un boost innitesimal de parámetro δv , γ(v) ≈ 1, las variables cinemáticas
transforman como:

δt = r · δv
δr = tδv
δu = δv − u(u · δv)
δρ = − [ρ(u · δv) + ρ ((u × ρ) · δv) − u × δv − δv(u · ρ)−
(u × ρ) × δv] /2,
δβ = 0,

por lo que la variación de estas variables por unidad de parámetro innitesimal de velocidad
δvj , es

δtj = rj
δrij = tδij
δvij = δij − ui uj
1
δρij = − [ρj ui + ρi ϵjkl uk ρl − ϵikj uk − δij uk ρk ] ,
2
δβj = 0,
236 CAPÍTULO 4. PARTÍCULA DE DIRAC

de tal manera que los generadores de los boosts Kj adoptan la forma


( )
∂ ∂ ∂ ∂
Kj = irj + it +i − uj ui +
∂t ∂rj ∂uj ∂ui
( )
1 ∂ ∂ ∂ ∂
ρj u i + ρi ϵjkl uk ρl − ϵikj uk − uk ρk
2i ∂ρi ∂ρi ∂ρi ∂ρj
Análogamente, los generadores Kj se pueden descomponer en tres partes, de acuerdo con los
operadores diferenciales involucrados y los vamos a representar con las mismas letras mayúsculas
que en el caso de los operadores de la descomposición de J pero con una tilde superpuesta:
( )
e e f e ∂ ∂ e ∂ ∂
K = L + Z + W , Lj = irj + it , Zj = i − uj ui ,
∂t ∂rj ∂uj ∂ui
( )
fj = 1 ∂ ∂ ∂ ∂
W ρj ui + ρi ϵjkl uk ρl + ϵjki uk − u k ρk
2i ∂ρi ∂ρi ∂ρi ∂ρj
Satisfacen las reglas de conmutación:
ej , L
[L e k ] = −iϵjkl Ll , ej , Zek ] = −iϵjkl Zl ,
[Z e Z]
[L, e = [L,
e Wf ] = 0,

y también
[Kj , Kk ] = −iϵjkl Jl .
Podemos vericar que
e = u × Z,
Z f = u × W.
W
Si denimos el operador espín con respecto al centro de carga en la forma habitual S =
e =Z
Z + W , y la parte del momento cinemático S e +W f = u × S , satisfacen

[Sj , Sk ] = iϵjkl Sl , [Sj , Sek ] = iϵjkl Sel , [Sej , Sek ] = −iϵjkl Sl ,

donde en esta última expresión hemos utilizado la ligadura de que u2 = 1. Generan el álgebra
de Lie de un grupo de Lorentz que conmuta con las traslaciones espacio-temporales, [S, pµ ] =
e p µ ] = 0.
[S,
Con respecto a la parte SU (2)T , calculemos sus generadores. Este grupo, con un elemento
innitesimal de parámetros δνk actua sobre las variables cinemáticas de la forma:

δt = 0, δβ = 0, δri = 0, δui = 0, δρi = (δik + ρi ρk + ϵikl ρl ) δνk ,

En la parametrización ρ del grupo de rotaciones, los vectores unidad de los ejes del cuerpo ei ,
i = 1, 2, 3 poseen por componentes:
(ei )j = R(ρ)ji ,
de manera que los operadores Tk = ek · W de proyección de la parte rotacional del espín W en
los ejes del cuerpo, vienen dados por
( )
1 ∂ ∂ ∂
Tk = + ρk ρi − ϵikl ρl . (4.82)
2i ∂ρk ∂ρi ∂ρi

Dieren de los Wk de (4.81) por el cambio de ρ por −ρ, seguido de un cambio global de signo.
Satisfacen las reglas de conmutación:

[Tj , Tk ] = −iϵjkl Tl . (4.83)

el signo menos del lado derecho de (4.83) corresponde a la diferencia entre la interpretación activa
y pasiva de las transformaciones. Una rotación de los ejes del laboratorio (rotación pasiva) posee
4.6. APÉNDICE: EL GRUPO S = W ⊗ SU (2)T ⊗ U (1)Q 237

por generadores los J , que satisfacen [Jj , Jk ] = iϵjkl Jl . Los Ti corresponden a los generadores
de las rotaciones del sistema de referencia ligado a la partícula(rotación activa), así que de esta
forma, los generadores −Ti poseerán reglas de conmutación pasivas [−Tj , −Tk ] = iϵjkl (−Tl ).
En la parametrización normal de las rotaciones α = αn, si describimos el vector unidad n a
lo largo del eje de rotación por los ángulos habituales, polar y acimutal θ y ϕ, respectivamente,
de tal manera que n ≡ (sin θ cos ϕ, sin θ sin ϕ, cos θ), los anteriores generadores Wi toman la
forma
[ ( )
1 ∂ cos θ cos ϕ ∂
W1 = 2 sin θ cos ϕ + − sin ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
sin ϕ cos θ cos ϕ ∂
+ , (4.84)
tan(α/2) sin θ sin θ ∂ϕ

[ ( )
1 ∂ cos θ sin ϕ ∂
W2 = 2 sin θ sin ϕ + + cos ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
cos θ sin ϕ cos ϕ ∂
− , (4.85)
sin θ tan(α/2) sin θ ∂ϕ

[ ]
1 ∂ sin θ ∂ ∂
W3 = 2 cos θ − + , (4.86)
2i ∂α tan(α/2) ∂θ ∂ϕ

[
∂2 1 ∂
W 2
= − 2
+ +
∂α tan(α/2) ∂α
{ 2 }]
1 ∂ cos θ ∂ 1 ∂2
+ + , (4.87)
4 sin2 (α/2) ∂θ2 sin θ ∂θ sin2 θ ∂ϕ2

[
eiϕ ∂ cos θ ∂ ∂ cos θ ∂
W+ = W1 + iW2 = 2 sin θ + +i − +
2i ∂α tan(α/2) ∂θ ∂θ sin θ ∂ϕ
]
i ∂
, (4.88)
tan((α/2)) sin θ ∂ϕ

[
e−iϕ ∂ cos θ ∂ ∂ cos θ ∂
W− = W1 − iW2 = 2 sin θ + −i − −
2i ∂α tan(α/2) ∂θ ∂θ sin θ ∂ϕ
]
i ∂
, (4.89)
tan(α/2) sin θ ∂ϕ
y los generadores pasivos Ti toman la forma
[ ( )
1 ∂ cos θ cos ϕ ∂
T1 = 2 sin θ cos ϕ + + sin ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
sin ϕ cos θ cos ϕ ∂
− , (4.90)
tan(α/2) sin θ sin θ ∂ϕ

[ ( )
1 ∂ cos θ sin ϕ ∂
T2 = 2 sin θ sin ϕ + − cos ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
cos θ sin ϕ cos ϕ ∂
− − , (4.91)
sin θ tan(α/2) sin θ ∂ϕ
238 CAPÍTULO 4. PARTÍCULA DE DIRAC

[ ]
1 ∂ sin θ ∂ ∂
T3 = 2 cos θ − − . (4.92)
2i ∂α tan(α/2) ∂θ ∂ϕ
Los Ti están relacionados ahora con los Wi , por el cambio α por −α (sin cambio global de
signo).
Con respecto a la parte U (1)Q , de generador Q, que conmuta con todos los demás, la acción
de un elemento innitesimal δχ de este grupo sobre las variables cinemáticas es:

δt = 0, δβ = δχ, δri = 0, δui = 0, δρi = 0,

por lo que el generador en la representación cuántica de este grupo es el


Q = −i
∂β

Como conmuta con todos los demás, podemos sacar de la función de onda la parte dependiente
de esta variable
Qf (β) = qf (β), f (β) ∼ eiqβ ,
con lo que la función de onda general es

ψ(t, r, u, α, β) = eiqβ Ψ(t, r, u, α),

donde la variable β aparece dentro de una fase general.


Los vectores propios normalizados de W 2 = T 2 , W3 y T3 para w = t = 1/2, si los escribimos
en la forma |w3 , t3 >, (que podemos vericar son también vectores propios de Z 2 con z = 0) se
escriben como |0; s3 , t3 >

Φ1 = |1/2, 1/2 >= 2 (cos(α/2) + i cos θ sin(α/2)) , (4.93)
√ −iϕ
Φ2 = | − 1/2, 1/2 >= i 2 sin(α/2) sin θe , (4.94)

Φ3 = |1/2, −1/2 >= −i 2 sin(α/2) sin θe , iϕ
(4.95)

Φ4 = | − 1/2, −1/2 >= 2 (cos(α/2) − i cos θ sin(α/2)) . (4.96)

Los operadores de subida y bajada W± y los correspondientes T± , los transforman entre sí.
Los {Φ1 , Φ2 } están ligados por W± , y análogamente los {Φ3 , Φ4 }, mientras que los conjuntos
{Φ1 , Φ3 } y {Φ2 , Φ4 } están ligados cada uno de ellos por los T± . Por ejemplo

W− Φ1 = Φ2 , W− Φ2 = 0, W − Φ3 = Φ 4 , , W− Φ4 = 0,

T− Φ1 = 0, T− Φ2 = 0, T − Φ3 = Φ 1 , T − Φ4 = Φ 2 .
Forman un conjunto ortonormal con respecto a la medida normalizada e invariante, denida
sobre SU (2)
1
dg(α, θ, ϕ) = 2 sin2 (α/2) sin θ dα dθ dϕ,

α ∈ [0, 2π], θ ∈ [0, π], ϕ ∈ [0, 2π].

dg(α, θ, ϕ) = 1.
SU (2)

La función de onda ψ se puede separar en la forma


i=4
ψ(t, r, u, α) = ϕi (t, r)χi (u, α)
i=1
4.6. APÉNDICE: EL GRUPO S = W ⊗ SU (2)T ⊗ U (1)Q 239

donde las cuatro χi se pueden clasicar de acuerdo con los valores propios |w3 , t3 >. Las funciones
ϕi (t, r) se pueden escoger como vectores propios del operador de Klein-Gordon

pµ pµ ϕi (t, r) = m2i ϕi (t, r).

Las funciones χ(u, α) se pueden a su vez separar en variables ya que el espín total S con s = 1/2,
es la suma de las dos partes S = Z + W , con [Z, W ] = 0, de tal manera que si la parte W
contribuye con w = 1/2 entonces la parte Z contribuye con z = 0 o bien z = 1. La contribución
con z = 0 corresponde a las funciones χi (α) independientes de las variables de velocidad y el
conjunto ortonormal son los anteriores Φi , i = 1, 2, 3, 4, de (4.93)-(4.96) que pueden rescribirse
en la forma |z; s3 , t3 >, con z = 0.
Como Z = −iu × ∇u , para la parte z = 1 los vectores propios de Z 2 y Z3 son los armónicos
esféricos Y1i (β, λ), i = −1, 0, 1. Las variables β y λ representan la dirección del vector velocidad
u. Como [Zi , Wj ] =∑ 0, podemos separar de nuevo las variables en las funciones χ(u, α). En este
caso las χ(u, α) = ϕi (β, λ)λi (α, θ, ϕ). Lo cuatro vectores ortonormales, vectores propios de
S3 , y T3 , y de Z 2 con z = 1, |1; s3 , t3 >, son ahora
1 ( √ )
Ψ1 = |1; 1/2, 1/2 >= √ Y10 (β, λ)Φ1 − 2Y11 (β, λ)Φ2 , (4.97)
3
1 ( √ )
Ψ2 = |1; −1/2, 1/2 >= √ −Y10 (β, λ)Φ2 + 2Y1−1 (β, λ)Φ1 , (4.98)
3
1 ( 0 √ )
Ψ3 = |1; 1/2, −1/2 >= √ Y1 (β, λ)Φ3 − 2Y11 (β, λ)Φ4 , (4.99)
3
1 ( √ )
Ψ4 = |1; −1/2, −1/2 >= √ −Y10 (β, λ)Φ4 + 2Y1−1 (β, λ)Φ3 . (4.100)
3

Los Φi son los mismos que en (4.93-4.96) y los armónicos esféricos Y1i (β, λ) son
√ √
3 √ −1 3
Y1 = −
1 iλ 0
sin(β)e , Y1 = 3 cos(β), Y1 = sin(β)e−iλ . (4.101)
2 2
que son ortonormales con respecto a la medida invariante dµ(β, λ) = sin(β)/(4π)dβdλ. Los
operadores Zi vienen dados por
∂ cos β ∂ ∂ cos β ∂
Z1 = i sin λ +i cos λ , Z2 = −i cos λ +i sin λ ,
∂β sin β ∂λ ∂β sin β ∂λ

Z3 = −i
.
∂λ
y los operadores de subida y bajada Z± = Z1 ± iZ2 , son
( )
±iλ ∂ cos β ∂
Z± = e ± +i ,
∂β sin β ∂λ

de tal manera que


√ √
Z− Y11 = 2 Y10 , Z− Y10 = 2 Y1−1 , Z− Y1−1 = 0.

Los cuatro espinores Ψi son ortonormales con respecto a la medida invariante


1
dg(α, θ, ϕ ; β, λ) = sin2 (α/2) sin θ sin β dα dθ dϕ dβdλ
16π 3
α ∈ [0, 2π], β, θ ∈ [0, π], λ, ϕ ∈ [0, 2π].
240 CAPÍTULO 4. PARTÍCULA DE DIRAC

Como anteriormente, los operadores de subida y bajada S± = Z± + W± y los correspondientes


T± transforman las Ψi entre sí.

S− Ψ 1 = Ψ 2 , S− Ψ2 = 0, S− Ψ3 = Ψ4 , , S− Ψ4 = 0,

T− Ψ1 = 0, T− Ψ2 = 0, T− Ψ3 = Ψ1 , T − Ψ4 = Ψ 2 .
Esta es la razón por la que el espinor más general en esta representación posee cuatro compo-
nentes.
En la base con z = 0, los Φi de (4.93-4.96), los operadores de espín y los vectores básicos
del cuerpo, toman la forma
( )
1 σ 0
S= = Z + W , pero Z = 0.
2 0 σ
( ) ( ) ( )
1 0 I 1 0 −iI 1 I 0
T1 = , T2 = , T3 = ,
2 I 0 2 iI 0 2 0 −I
( ) ( ) ( )
1 0 σ 1 0 −iσ 1 σ 0
e1 = , e2 = , e3 = ,
3 σ 0 3 iσ 0 3 0 −σ
en términos de las matrices de Pauli σ y de la matriz unidad 2 × 2, I.
En la base con z = 1 los Ψi vienen dados en (4.97-4.100), los operadores Si y Ti toman la
misma forma matricial que en el caso anterior, mientras que los vectores ei aparecen
( ) ( ) ( )
−1 0 σ −1 0 −iσ −1 σ 0
e1 = , e2 = , e3 = .
9 σ 0 9 iσ 0 9 0 −σ

En todos los casos, las 6 matrices Hermíticas de traza nula Si , Tj , junto con las nueve matrices
Hermíticas de traza nula eij y la matriz unidad 4 × 4, son linealmente independientes y por lo
tanto forman una base completa y Hermítica del álgebra de Dirac, de manera que cualquier otro
observable que sea invariante por traslación, se expresará como una combinación lineal real de
estas 16 matrices Hermíticas. Hemos hecho uso de este hecho para obtener la ecuación de Dirac
en este modelo.
Ambas representaciones son ortogonales entre sí, < Φi |Ψj >= 0, y producen dos represen-
taciones irreducibles diferentes, de donde podemos deducir que describen dos tipos distintos de
partículas del mismo espín 1/2. ¾Será que una de las representaciones corresponde a la descrip-
ción de hadrones, es decir quarks, y la otra lo que describe son los leptones? Esto está sin probar
ya que aunque se ha avanzado alguna sugerencia en este sentido en la sección 4.4.3, no queda
claro que una de las clases de partículas tenga color y la otra no.
La representación matricial de los operadores Zi y Wi en la base Ψi vienen dados por
( ) ( )
2 σ 0 −1 σ 0
Z= , W = ,
3 0 σ 6 0 σ

a pesar de que los vectores Ψi no son vectores propios de Z3 y W3 . En la base Φi , la representación


de los Zi son las matrices nulas por lo que en este caso S = W . Vemos que Z es un múltiplo
positivo y mayor que S y por lo tanto tiene su misma dirección, mientras que W tiene sentido
contrario, como corresponde a la representación pictórica del modelo de la portada.
En ambos casos z = 0 y z = 1, se tiene que

T1 e1 + T2 e2 + T3 e3 = e1 T1 + e2 T2 + e3 T3 = W ,

lo que pone de maniesto que los operadores Ti son las componentes del momento angular
rotativo W , en los correspondientes ejes del cuerpo ei .
Capítulo 5

Estructura electromagnética del

electrón

5.1. Estructura del electrón con espín


Consideremos que un electrón clásico viene descrito por el modelo relativista en el que el
centro de carga se mueve en círculos, a la velocidad de la luz, alrededor del centro de masa, y
en el sistema de referencia del centro de masa.
Una de las primeras preguntas que uno se plantea es: ¾Cuál es el campo electromagnético
producido por esta partícula? Como el centro de carga está acelerado, desde el punto de vista
clásico el sistema debería radiar. Sin embargo, desde el punto de vista mecánico el sistema es
estable y conserva tanto la energía como sus momentos lineal y angular. La radiación se deberá
producir cuando el centro de masa se acelere, es decir, cuando la partícula deje de ser libre.
Existen soluciones no radiativas de las ecuaciones de Maxwell asociadas a puntos cargados
que se mueven a la velocidad de la luz. Una posibilidad es considerar soluciones derivadas a
partir de los potenciales de Liénard-Wiechert en la forma (Aµret +Aµadv )/2, donde Aµret y Aµadv son
los potenciales retardados y avanzados, respectivamente. Pero incluso aunque el campo eléctrico
fuese (E ret + E adv )/2, no es ni estático ni siquiera de comportamiento Coulombiano. No parece
reproducir lo que habitualmente consideramos que es el campo asociado a un electrón puntual
en reposo. Sin embargo, el modelo de partícula puntual es solamente una aproximación a una
descripción de una partícula elemental sin espín, ya que no parecen existir este tipo de partículas
elementales.
Vamos a calcular el campo electromagnético instantáneo del modelo de partícula con espín
y considerar a continuación una solución estática: el promedio temporal del campo retardado
durante una vuelta completa de la carga. La sorpresa va a ser su comportamiento Coulombiano
en cualquier dirección, cosa que no ocurre con el promedio temporal del campo avanzado.

5.1.1. Formulación covariante


Podemos dar una formulación covariante tanto de los potenciales de Lienard-Wiechert como
de los campos y que además sea independiente del parámetro de evolución. Si llamamos z µ (τ ) ≡
(ctp (τ ), r p (τ )), a las variables cinemáticas que describen el centro de carga de la partícula, sea
xµ ≡ (ct, x) el instante y el punto de observación y llamamos Rµ = xµ − z µ (τ ), la expresión
covariante de los potenciales de Lienard-Wiechert que genera la carga en ese punto, se escribe
e ż µ (τ ) e ż µ q e {1, β}
Aµ (x) = = , e= , Aµ ≡ ,
c (x − z(τ ))ν żν (τ ) c Rν żν 4πϵ0 c R(1 − n · β)
siendo τ el valor del parámetro arbitrario de evolución en el instante retardado, β = up (τ )/c,
R = |R| y n = R/R. Los potenciales en ese punto no son independientes pues Aµ Rµ = e/c y

241
242 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

resulta que Rν Rν = 0 en el instante retardado. Si derivamos esta expresión con respecto a xµ ,


sabiendo que τ (x) es función del punto de observación x, y usamos la notación más compacta
(a · b) ≡ aµ bµ

∂τ ∂τ Rµ {1, −n}
∂µ (R · R) = 0 = Rµ − (R · ż) , τ,µ ≡ = ≡ .
∂xµ ∂x µ (R · ż) (1 − n · β)cṫp

De esta forma, suprimiendo el factor global e/c,

z̈µ τ,ν żµ


Aµ,ν = − (żν + (R · z̈)τ,ν − (ż · ż)τ,ν )
(R · ż) (R · ż)2

y substituyendo el τ,ν nos queda

z̈µ Rν żµ żν żµ (R · z̈)Rν żµ (ż · ż)Rν


Aµ,ν = − − +
(R · ż)2 (R · ż) 2 (R · ż) 3 (R · ż)3

Si subimos el índice ν

z̈µ Rν żµ ż ν żµ (R · z̈)Rν żµ (ż · ż)Rν


Aµ ,ν = − − +
(R · ż)2 (R · ż)2 (R · ż)3 (R · ż)3

y contrayendo µ con ν, es fácil ver que el primer término se cancela con el tercero y el segundo con

el cuarto, por lo que Aµ ,µ = 0 y los potenciales verican la condición de Lorenz.

El campo, sin el factor global e/c, aparece como

żν Rµ − żµ Rν z̈ν Rµ − z̈µ Rν


Fµν = Aν,µ − Aµ,ν = ((ż · ż) − (R · z̈)) + . (5.1)
(R · ż) 3 (R · ż)2

Esta expresión del campo electromagnético también puede ponerse como


( )
1 d żν Rµ − żµ Rν
Fµν = . (5.2)
(R · ż) dτ (R · ż)

Tanto los potenciales como los campos son funciones homogéneas de grado cero de las derivadas
con respecto a τ de las variables cinemáticas de la partícula que crea el campo, por lo que el
resultado es independiente del tipo de parámetro de evolución τ utilizado para la descripción
de la evolución de las fuentes del campo.

Identidades de Jacobi
El campo de una carga puntual (5.1) satisface las identidades de Jacobi

Rα Fµν + Rµ Fνα + Rν Fαµ = 0, ∀α, µ, ν.

Con α = 0, µ = i y ν = j , se llega a

Ri Fj0 − Rj Fi0 1
Fij = , B = n × E,
R0 c

pues F12 = −Bz , F10 = −Ex /c.


5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 243

Tiempo de la partícula
Si usamos como parámetro el tiempo de la partícula, τ = tp , en el instante retardado,
entonces como Rµ ≡ (R, R), tenemos

ż µ ≡ (c, u(tp )), z̈ µ ≡ (0, a(tp )), (R·ż) = cR(1−n·β), (ż·ż) = c2 (1−β 2 ), (R·z̈) = −R·a.

Como Ei /c = F0i , y R0 = R, el primer término de (5.1) da lugar al campo de velocidad, que


queda

1 q −ui R + cRi q 1 − β2
Ei = c2 (1 − β 2 ), Eβ = (n − β).
c 4πϵ0 c c R3 (1 − n · β)3
3 4πϵ0 R2 (1 − n · β)3
Los términos de aceleración de (5.1) dan lugar, respectivamente, a
−uR + cR a
(R · a), −
− n · β)3
c3 R3 (1 c2 R(1 − n · β)2
y produce nalmente en el Sistema Internacional de unidades el campo de aceleración
[ ]
q (n − β)(n · a) a q n × ((n − β) × a)
Ea = − = (5.3)
4πϵ0 c2 R(1 − n · β)3 c2 R(1 − n · β)2 4πϵ0 c2 R(1 − n · β)3

Tiempo del observador


Si usamos como parámetro de evolución el tiempo τ = t del observador en el instante
retardado tr , entonces
( ) ( 2 )
dtp dr p d tp d 2 r p
ż ≡ c
µ
, , z̈ ≡ c 2 , 2 ,
µ
dt dt dt dt

Pero de R = c(t − tp ), derivando esta expresión con respecto a t, resulta

dtp 1 dR d 2 tp 1 d2 R
=1− , = −
dt c dt dt2 c dt2
Por otra parte, si derivamos con respecto a t, (R · R) = R2 − R2 = 0, se tiene:
dR dR dR dR
2R − 2R · = 0, R −R· = 0,
dt dt dt dt
y de R = r − r p , derivando con respecto a t,

dR dr p d2 r p d2 R
=− , = − .
dt dt dt2 dt2
y por lo tanto
( ) ( 2 )
dR dR d R d2 R
µ
R = (R, R), ż = c −
µ
,− , z̈ = − 2 , − 2 .
µ
dt dt dt dt
La parte ( )
dR dR
(R · ż) = Rc − R −R· = Rc,
dt dt
pues el término entre paréntesis es idénticamente nulo.
( ) ( ) ( ) ( ) ( )
1 dR 2 dR 2 2 dR dR 2 dR 2
(ż · ż) = c 1 −
2
− =c 1−
2
+ −
c dt dt c dt dt dt
244 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

( ) ( )
d2 R d2 R 2 dR 1 d2 ( 2 ) 2 dR
(R·z̈) = −R 2 +R· 2 , (ż·ż)−(R·z̈) = c 1 −
2
+ R −R =c 1−
2 2
.
dt dt c dt 2 dt2 c dt
ya que el último término R2 − R2 = 0. Como
( )
dr pi dtp dRi dR
żi R0 − ż0 Ri = − R+c Ri = R + c− Ri ,
dt dt dt dt
d2 r pi d 2 tp d2 R i d2 R
z̈i R0 − z̈0 Ri = − R + c Ri = R − 2 Ri ,
dt2 dt2 dt2 dt
con lo que el campo queda:
( ( ) ) ( ) ( 2 )
1 e 1 dR dR 2 dR e 1 d R d2 R
E= R + c− R c 1−
2
+ 2 2 R 2 − 2R ,
c c c3 R3 dt dt c dt cc R dt dt
es decir
( ) ( ) [ ]
eR eR d R e d2 R q n R d (n) 1 d2 n
E= 3 + + 2 2 = + + 2 2 , (5.4)
R c dt R3 c dt R 4πϵ0 R2 c dt R2 c dt
la expresión del campo debida a Heaviside-Feynman.
Para el campo magnético obtenemos
[ ]
1 µ0 q 1 dn 1 d2 n
B = n×E = n× + n× 2 (5.5)
c 4π R dt c dt

El teorema de Gauss
Que todas las componentes del campo son relevantes lo vemos si calculamos el ujo saliente
en cualquier instante del campo eléctrico sobre una esfera de radio R alrededor de la carga.
Todos los puntos de esta supercie poseen, en el instante t, al mismo punto retardado donde
está localizada la carga. Vamos a tomar la velocidad retardada en la dirección de OZ y el vector
unidad n desde la carga al punto de observación formando un ángulo θ con la velocidad. La
parte del término de aceleración (5.3) del campo eléctrico es perpendicular al vector n, por lo
que no produce ujo. La otra parte tiene dos términos, uno radial que va en la dirección de n y
otra en la dirección de β , que al proyectar en la dirección normal a la esfera, que tiene la misma
dirección que el vector n desde el punto retardado, nos queda
q(1 − β 2 ) q(1 − β 2 )
E(t, r) = (n − β), E · n = , dS = R2 sin θdϕdθ
4πϵ0 R (1 − n · β)
2 3 4πϵ0 R2 (1 − n · β)2
I ∫
q(1 − β 2 ) π sin θdθ q
E · ndS = =
2ϵ0 0 (1 − β cos θ)2 ϵ 0
pues con el cambio cos θ = u, sin θdθ = −du y la
∫ −1 −1
−du −1 1 2
= = .
(1 − βu)2
β (1 − βu) 1 1 − β2
1

El resultado es independiente del valor de β , por lo que en el caso de una partícula con β = 1,
también se cumple. Por lo tanto, en el caso de partículas de Dirac no debemos eliminar esta
parte del campo, ya que aunque el numerador se anula, también se anula n−β y el denominador
(1 − n · β) en la dirección en que n = β , haciendo que en el límite el valor del campo no se anula
sino que se hace singular. Para el cálculo del campo en el caso de partículas con espín, fuera del
plano del zitterbewegung, solamente contribuye el campo de aceleración pero el de velocidad no
lo podemos anular en el plano del zitterbewegung. De no incluir este término de velocidad no
se satisfaría la ecuación de Maxwell ∇ · E = ρ/ϵ0 , es decir el teorema de Gauss.
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 245

5.1.2. Campo de radiación según Dirac


Dirac1 parte de la idea de que el electrón(el positrón) desde el punto de vista electromagné-
tico tiene un atributo puntual, la carga e localizada en un punto, z µ (τ ), caracterizado por las
variables cinemáticas de nuestro electrón con espín. Supone que el campo que crea es el campo
µν
retardado Fret . Este campo proviene de unos potenciales Aµ que satisfacen la condición de Lo-
renz ∂µ A = 0 y la ecuación con fuentes Aµ = µ0 j µ , en el Sistema Internacional de unidades.
µ

De todas sus posibles soluciones escogemos la solución retardada. Si va a radiar, es necesario


que esté sometido a algún campo externo Aµ (x)in que satisface las ecuaciones ∂µ Aµ (x)in = 0
y Aµ in = 0, sin fuentes externas en la región donde se encuentra la partícula, por lo que el
campo real en el entorno de la carga es el
µν µν µν
Fact = Fret + Fin ,
µν
superposición del campo externo Fin y del campo retardado que crea la propia partícula. Dirac
plantea que de forma simétrica el campo real podría ser la superposición de la solución avanzada
µν µν
Fadv , más otro campo Fout ,
µν µν µν
Fact = Fadv + Fout ,
que representaría la radiación emergente desde la región donde está la carga, incluyendo la que
produzca la propia carga. La diferencia
µν µν µν µν µν
Frad = Fout − Fin = Fret − Fadv ,

sería un campo sin fuentes y representaría el campo radiado por el electrón. Si el electrón
no estuviera solicitado por ningún campo externo, la radiación debería ser nula. Al denir
Aµrad = Aµret − Aµadv , esto implica que el campo radiado por la partícula satisface la condición de
Lorenz ∂µ Aµrad = 0 y la ecuación sin fuentes Aµ rad = 0, ya que es un campo que deja de estar
vinculado a la carga que lo produjo, a la que abandona.
De forma alternativa a lo que hace Dirac, vamos a calcular este campo, como hace Barut2 ,
en un punto próximo a la carga pero sobre la trayectoria de la misma x = z(τ ), cuyos instantes
retardado y avanzado corresponden a los instantes τB = τ − σ , y τA = τ + σ , respectivamente.
Vamos a usar la expresión (5.1) de los campos que la representamos como
1
Fµν (x) = (żν Rµ ((ż · ż) − (R · z̈)) + z̈ν Rµ (R · ż)) − {ν ←→ µ}
(R · ż)3
donde {ν ←→ µ} representa al mismo término pero con ν y µ intercambiados. Luego hay que
determinar ( )
rad
Fµν ret
(z(τ )) = lı́m Fµν (τB ) − Fµν
adv
(τA )
σ→0
Para ello vamos a desarrollar a órdenes más bajos los diferentes términos. Para el campo retar-
dado tenemos
...
R(τB ) = z(τ ) − z(τB ) = ż(τB )σ + z̈(τB )σ 2 /2 + z (τB )σ 3 /6 + · · ·
...
(R · ż)τB = (ż · ż)τB σ + (ż · z̈)τB σ 2 /2 + (ż · z )τB σ 3 /6 + · · · = (ż · ż)τB σ − (z̈ · z̈)τB σ 3 /6 + · · · ,
... ...
(R · z̈)τB = (z̈ · ż)τB σ + (z̈ · z̈)τB σ 2 /2 + (z̈ · z )τB σ 3 /6 + · · · = (z̈ · z̈)τB σ 2 /2 + (z̈ · z )τB σ 3 /6 + · · · ,
...
ya que para la partícula puntual (ż · ż) = c2 , (ż · z̈) = 0, (z̈ · z̈) + (ż · z ) = 0 y así sucesivamente.
Para el campo avanzado tenemos
...
R(τA ) = z(τ ) − z(τA ) = −ż(τA )σ + z̈(τA )σ 2 /2 − z (τA )σ 3 /6 + · · ·
1
P.A.M. Dirac, Classical theory of radiating electrons, Proc. Roy. Soc. A 167, 148 (1938)
2
A.O. Barut, Electrodynamics and classical theory of elds and particles, Dover NY (1980).
246 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

...
(R · ż)τA = −(ż · ż)τA σ + (ż · z̈)τA σ 2 /2 − (ż · z )τA σ 3 /6 + · · · = −(ż · ż)τA σ + (z̈ · z̈)τA σ 3 /6 + · · · ,
... ...
(R · z̈)τA = (z̈ · ż)τA σ + (z̈ · z̈)τA σ 2 /2 + (z̈ · z )τA σ 3 /6 + · · · = (z̈ · z̈)τA σ 2 /2 − (z̈ · z )τA σ 3 /6 + · · · ,
A orden más bajo el campo retardado en el punto intermedio (z(τ )), queda

(żν z̈µ − żµ z̈ν )τB + O(σ)


ret
Fµν (z(τ )) = − .
2σ(ż · ż)2 (1 − (z̈ · z̈)/(ż · ż) σ 2 /6)3

Para el campo avanzado tenemos a orden más bajo

(żν z̈µ − żµ z̈ν )τA + O(σ)


adv
Fµν (z(τ )) = − .
2σ(ż · ż)2 (1 − (z̈ · z̈)/(ż · ż) σ 2 /6)3

Por lo tanto el campo de radiación sobre la partícula queda

1 (żν z̈µ − żµ z̈ν )τA − (żν z̈µ − żµ z̈ν )τB
rad
Fµν ret
= lı́m (Fµν − Fµν
adv
)= lı́m ,
σ→0 (ż · ż)2 σ→0 2σ

es decir ... ...


1 d żν z µ − żµ z ν
rad
Fµν = (żν z̈µ − żµ z̈ν ) = (5.6)
(ż · ż)2 dτ (ż · ż)2
pues τA − τB = 2σ , y que vemos es también homogénea de grado cero en las derivadas de las
variables cinemáticas. El resultado de Dirac es este mismo pero con un coeciente de 2/3.
Si este campo de radiación corresponde a un fotón emitido en ese instante, produce una
autofuerza de reacción sobre la propia partícula, esto producirá una variación del momento
lineal de valor ( )
dpµ e2 1 ...µ (z̈ · z̈) µ
µν
= eFrad żν = z + ż ,
dτ 4πϵ0 c (ż · ż) (ż · ż)2
...
habiendo puesto (z̈ · z̈) = −(ż · z ) y restituido el coeciente constante en el Sistema Internacional
e/4πϵ0 c. Esta fuerza tiene sentido contrario a la velocidad del punto, ya que el coeciente
...
(z̈ · z̈) < 0, y la tercera derivada z tiene sentido contrario a ż sugiriendo que el fotón emitido
tiene la dirección de la velocidad. Para la partícula con espín tenemos el problema de que el
tetravector ż , satisface (ż · ż) = 0. Si no tuviéramos este problema, para la partícula libre, si la
analizamos en el CM, el término de reacción se anula idénticamente pues la derivada tercera de
la posición tiene sentido contrario a la velocidad. Es necesario que el movimiento no sea libre
para que se produzca esta radiación.
Por otra parte, como la carga se mueve con c y describe una trayectoria curvilínea, el campo
que crea en un instante cualquiera no alcanza nunca a la carga, por lo que no existiría la
autofuerza que preconiza Dirac.

5.1.3. El campo instantáneo de una partícula de Dirac


El campo eléctrico retardado(o avanzado) de una carga puntual en el punto de observación
x y en el instante t viene dado por
q
E = Eβ + Ea, e≡ ,
4πϵ0
donde
e(1 − β 2 )
E β (t, x) = (n − β) , (5.7)
R2 (1 − n · β)3
e
E a (t, x) = n × ((n − β) × a) , (5.8)
Rc (1 − n · β)3
2
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 247

son los campos de velocidad y aceleración, respectivamente. Los observables r , u = dr/dt


y a = du/dt, son la posición, velocidad y aceleración de la carga, evaluados en el instante
retardado(o avanzado) tr = t − R/c, (o ta = t + R/c). El vector β = u/c, y

x−r
n= , R = |x − r|.
|x − r|

El campo magnético es B = n × E/c. Como el centro de carga del electrón se mueve a la


velocidad de la luz, β = 1, el campo de velocidad E β es nulo, salvo en los puntos del plano
XOY donde n = β en que es singular. De aquí resulta que fuera del plano XOY la única
contribución al campo es la (5.8) que es siempre ortogonal al vector unidad desde la posición
retardada n y que disminuye a largas distancias como 1/R. Y en el plano XOY también el
campo eléctrico es perpendicular al vector n, salvo en aquellos puntos instantáneos en los que
desde el correspondiente punto retardado se tiene n = β en los que el campo se hace innito.

Figura 5.1: Componentes E n , E β y E a del campo eléctrico en el punto P . E n y E β son de


la misma intensidad y la parte de E a proyectada a lo largo de n cancela a la parte E n , por
lo que el campo resultante E es siempre ortogonal al vector unidad retardado n y forma
en el plano normal un ángulo α con el vector E a . ⊥

El campo (5.8) tiene tres partes, que como la aceleración a = c2 /R0 se escribe

en(n · ab) eβ(n · ab) eb


a
E= − − = En + Eβ + Ea.
RR0 (1 − n · β) 3 RR0 (1 − n · β)3 RR0 (1 − n · β)2

siendo ab un vector unidad en la dirección de la aceleración. En el punto P del eje OZ y en las


unidades en las que e = 1 y R0 = 1, como n · β = 0, estos campos valen En = sin α/R = Eβ y
Ea = 1/R y vienen representados en la gura 5.1. La componente de E a a lo largo del vector n
cancela completamente a la componente E n , por lo que el campo resultante está contenido en
el plano perpendicular al vector n, de intensidad 1/R en estas unidades y formando un ángulo
α con la proyección en este plano de la componente E a .
Efectivamente, la componente perpendicular a n de E a , que denominamos E a⊥ es de inten-
sidad cos α/R, que al sumarla con E β de intensidad sin α/R en el plano perpendicular a n nos
da un vector nal E de intensidad 1/R y que forma el mismo ángulo α con la proyección E a⊥ .
Si representamos en el punto P todos los campos durante una vuelta de la carga, obtenemos
un cono de revolución, de semiabertura con el eje OZ de valor π/2−α y cuya generatriz tiene un
248 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

Figura 5.2: Conos de revolución que representan respectivamente los campos eléctricos ins-
tantáneos durante una vuelta completa de la carga en los puntos del eje OZ de coordenadas
z = 1, 2, 3, 4. En el punto 1 el semiángulo del cono que subtiende la trayectoria de la carga
es α = π/4, y es el ángulo que forma el campo con el vector −a⊥ , en el instante retardado.

Figura 5.3: Campos eléctricos instantáneos durante una vuelta de la carga cuyos vértices
respectivos son los puntos negros de coordenadas (x, y, z), respectivamente de abajo a arriba
(0. 5, 0, 1), (1, 0, 2), (1, 0, 3) y (1, 0, 4).
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 249

Figura 5.4: Campos eléctricos instantáneos durante una vuelta de la carga cuyos vértices
respectivos son los puntos negros de coordenadas (x, y, z), a lo largo de la recta y = 0, z = x,
respectivamente de abajo a arriba (2, 0, 2), (3, 0, 3), (4, 0, 4) y (5, 0, 5).

Figura 5.5: Campos eléctricos instantáneos durante una vuelta de la carga cuyos vértices
respectivos son los puntos negros de coordenadas (x, y, z), a lo largo de la recta y = 0, z = 4,
respectivamente de izquierda a derecha (0, 0, 4) (1, 0, 4), (2, 0, 4), (3, 0, 4) y (4, 0, 4).
250 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

tamaño 1/R en estas unidades. En la gura 5.2 representamos los valores del campo resultante
en cada punto de coordenada z = 1, 2, 3 y 4 durante una vuelta completa de la carga.
En las guras 5.3, 5.4 y 5.5 representamos el campo resultante total en los puntos de
coordenadas que se indican. La intensidad local instantánea va creciendo pero como veremos su
valor medio temporal es radial y decrece con la distancia como 1/r2 , con respecto al origen.
En componentes cartesianas, si es ϕ la fase de la carga en su posición retardada, salvo un
factor global e/R02 , las componentes del campo eléctrico son

(1 − x cos ϕ − y sin ϕ)(x − cos ϕ + R sin ϕ) R cos ϕ


Ex = + , (5.9)
(R + x sin ϕ − y cos ϕ)3 (R + x sin ϕ − y cos ϕ)2

(1 − x cos ϕ − y sin ϕ)(y − sin ϕ − R cos ϕ) R sin ϕ


Ey = + , (5.10)
(R + x sin ϕ − y cos ϕ) 3 (R + x sin ϕ − y cos ϕ)2
z(1 − x cos ϕ − y sin ϕ) √
Ex = , R= 1 + x2 + y 2 + z 2 − 2x cos ϕ − 2y sin ϕ. (5.11)
(R + x sin ϕ − y cos ϕ)3
En todas estas guras deberemos imaginarnos el cono, que con origen en el punto de observación,
subtiende el círculo de la trayectoria de la carga. Entonces, en el punto de observación deberemos
trazar una línea perpendicular a cada generatriz de ese cono hasta dar con la línea que dene
el extremo del campo eléctrico, que son las curvas de color rojo que hemos dibujado.

5.1.4. El campo promedio temporal de una partícula de Dirac

Supongamos una carga de prueba en el entorno de nuestro electrón. La frecuencia del zit-
terbewegung es muy alta, del orden de ∼ 1021 s−1 . Si nuestra partícula de prueba se mueve
lentamente, entonces el campo eléctrico detectado en una primera aproximación será una especie
de promedio temporal del campo durante una vuelta completa de la carga.
La expresión general del campo promedio temporal en un punto cualquiera es difícil de
obtener. Para obtener una estimación vamos a calcularlo analíticamente en un punto en la
dirección del espín y en un punto cualquiera de forma numérica. Consideremos que el electrón
está en reposo, es decir su centro de masa se encuentra en el origen del sistema de referencia.
El espín es constante y apunta en la dirección del eje OZ . Vamos a calcular el campo promedio
en un punto P de coordenada z en el eje OZ . En la Figura 5.6, representamos las diferentes
magnitudes en el instante retardado tr , para hacer el cálculo de la ecuación (5.8).
Para ese punto particular de la gura, n · β = 0, y por lo tanto
e e
E= (n × (n × a) − n × (β × a)) = (−a⊥ − β(n · a)) ,
c2 R c2 R
donde el vector a⊥ = a − n(a · n), es la componente de la aceleración perpendicular al vector
unidad n. Para el punto de observación P , la expresión n · a es constante en cualquier punto
retardado, el valor medio temporal de β durante una vuelta completa de la carga es cero, y
el vector a⊥ se reduce a su componente z , a⊥ sin α. Como la aceleración en este sistema de
referencia vale a = c2 /R0 , a⊥ = a cos α y además sin α = R0 /R y cos α = z/R, el campo
eléctrico promedio temporal en el punto P es
ez
E(z) = ẑ, (5.12)
(R02 + z 2 )3/2

donde ẑ es un vector unidad a lo largo del eje OZ . El campo promedio avanzado tiene exac-
tamente la misma expresión. Para la antipartícula hay que cambiar e por −e y la velocidad β
por −β , que en promedio no produce modicación de (5.12).
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 251

Figura 5.6: El campo eléctrico Instantáneo del electrón en el punto P posee una componente
a lo largo de −a⊥ y −β y comprobamos que es perpendicular a n.

Si hubiéramos utilizado la expresión de Heaviside-Feynman (5.4), el campo sería el Coulom-


biano en el punto P , y al hacer el promedio a una vuelta de la carga su proyección en la dirección
OZ vale
e
E(z) = 2 cos αẑ,
R
que reproduce de nuevo (5.12), ya que las otras dos contribuciones d(n/R2 )/dt y d2 n/dt2 son
ortogonales a OZ y su valor promedio a una vuelta es cero.
Es un campo estático y radial a partir del origen del sistema de referencia, con un compor-
tamiento Coulombiano de tipo 1/z 2 , para z grande, pero que además no diverge en el origen.
En la Figura 5.7, comparamos este campo con el campo de Coulomb de una carga puntual en el
origen. La gura ha sido reescalada de tal manera que la unidad es el radio R0 del movimiento
interno.
Vemos claramente el comportamiento Coulombiano de este campo promedio temporal para √
z grande, a partir de |z| ≥ 5R0 . El máximo del campo tiene lugar a la distancia z = R0 / 2.
Si realmente lo que mide una carga de prueba es este campo promedio temporal, su energía no
diverge, con lo que la energía electrostática del electrón estaría renormalizada. Para encontrar
esta energía tendríamos que encontrar la expresión general del campo e integrarla, pero esta
tarea, de momento, va a ser solamente de tipo numérico. De todas formas, el campo instantáneo
diverge donde está la carga, pero diverge como 1/R, luego la energía va como 1/R2 y como el
elemento de volumen va como 4πR2 dR, resulta que no existe divergencia de la energía del campo
instantáneo, en la posición de la carga. Veremos que existen otros puntos, contenidos en el plano
del zitterbewegung, en los que el campo instantáneo también diverge, por lo que el proceso de
cálculo de la energía, parece conducir a innitos. Este cálculo está sin hacer.
Sin embargo, si estamos analizando procesos de alta energía y nuestra partícula de prueba
se mueve sucientemente rápido con respecto al electrón, entonces el campo que detecta es el
campo instantáneo que va como 1/R. Es superior al campo promedio para R > 1, es menor que
el Coulombiano para R < 1, haciéndose innito en la posición de la carga. Esto da a entender,
que desde el punto de vista integral, la contribución de la energía eléctrica debida al campo
instantáneo, para R > 1, es superior a la energía electrostática Coulombiana y que la del campo
promedio temporal. Esta diferencia la podríamos interpretar clásicamente, de forma ingenua,
como el exceso de energía en el entorno del electrón debida a la nube de fotones virtuales que
rodean a la partícula. En cualquier caso, el cálculo de la energía electromagnética del electrón
252 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

Figura 5.7: Campo eléctrico retardado(o avanzado), promedio temporal (5.12) y campo
Coulombiano a lo largo del eje OZ .

requiere el conocimiento preciso de los campos instantáneos, una tarea que está todavía sin
hacer.
Para calcular de forma numérica el campo promedio temporal en un punto arbitrario, con-
sideremos las diferentes magnitudes que aparecen en la Figura 5.8. Vamos a hacer el cálculo en
puntos fuera del plano XOY , por lo que solamente utilizaremos para el cálculo el campo de
aceleración (5.8).

Figura 5.8: Movimiento de la carga y punto de observación P .

Si en el instante t = 0 la carga se encuentra en el punto A del eje OX , entonces, en el instante


t, los observables que se muestran en la gura están expresados en coordenadas cartesianas y
para el sistema de referencia del laboratorio, por

e u
k = R0 [cos ωt, sin ωt, 0] ≡ R0 k, β= = [− sin ωt, cos ωt, 0],
c

du c2 c2
r = [x, y, z], a= = [− cos ωt, − sin ωt, 0] = b,
a
dt R0 R0

e R e
R = r − k = R0 (e
r − k), n= , R = |R| = R0 R.
R
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 253

Con estas deniciones, el campo de aceleración (5.8) se puede escribir como


( )
e n × ((n − β) × a b)
E(t, r) = . (5.13)
R02 (1 − n · β) R
3 e

Vamos a comparar el valor promedio temporal de este campo con el campo Coulombiano ins-
tantáneo producido por una carga puntual en reposo e, en el origen del sistema de referencia
( )
e b
r
E 0 (r) = 2 ,
R0 r2

donde rb es un vector unidad en la dirección radial. Vamos a quitar de ahora en adelante el


factor constante e/R02 entre corchetes, que aparece al comienzo de estas dos expresiones. De
esta manera, la unidad de longitud resulta ser el radio del zitterbewegung, R0 .
Cuando la carga se encuentra en la posición de la Figura 5.8, el campo retardado que produce
e ,
en el punto P se evalúa en el tiempo de observación to = t + R/c. Por lo tanto dto = dt + dR/ω
ya que R0 /c = 1/ω . Como
√ ω
e =
R(t) x − cos ωt)2 + (e
(e y − sin ωt)2 + ze2 , e=
dR x − cos ωt) sin ωt − (e
((e y − sin ωt) cos ωt) dt
e
R
e
con lo que obtenemos dto = (N (t)/R(t))dt , donde N está explícitamente dado por

e +x
N (t) = R(t) e sin ωt − ye cos ωt.

Vamos a calcular el campo promedio en P con respecto al tiempo de observación en ese punto
y durante una vuelta completa de la carga de duración T . Si denimos el tiempo adimensional
τ = ωt, entonces ωT = 2π y por lo tanto
∫ T ∫ T ∫ 2π
1 1 N (t) 1 N (τ )
E(to ) dto = E(t) dt = E(τ ) dτ. (5.14)
T 0 T 0 e
R(t) 2π 0 e )
R(τ

En términos del parámetro adimensional τ , las diferentes expresiones aparecen como

b ) = n(n · a
n × (n × a b) − a
b,

y
1−x
e cos τ − ye sin τ
b) =
n(n · a x − cos τ, ye − sin τ, ze],
[e
Re2
b = [− cos τ, − sin τ, 0],
a
mientras que
1
b) =
n × (β × a y − sin τ, −e
[e x + cos τ, 0],
e
R
y
1 (e )
1−n·β = e sin τ − ye cos τ .
R+x
e
R
Nos interesan medir las componentes radial y transversales del campo, Er = E ·b b,
r , Eθ = E · θ
b
y Eϕ = E · ϕ, respectivamente. Los vectores r b b
b, θ y ϕ son los vectores unidad habituales en
coordenadas esféricas. Si consideramos que el punto de observación P se encuentra en el plano
XOZ , entonces x e = r sin θ, ye = 0 y ze = r cos θ, donde r es la distancia radial al origen en
unidades de R0 .
254 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

Las expresiones nales para las distintas componentes del campo son

e2 − r2 − 1) sin θ cos τ + R
(R e sin θ sin τ + r(1 + sin2 θ cos2 τ )
Er (r, θ, τ ) = ( )3 ,
e + r sin θ sin τ
R

[ ]
e2 − 1) cos τ + R
(R e sin τ + r sin θ cos2 τ cos θ
Eθ (r, θ, τ ) = ( )3 ,
e + r sin θ sin τ
R

e2 − 1) sin τ + R(r
(R e sin θ − cos τ ) + r sin θ sin τ cos τ
Eϕ (r, θ, τ ) = ( )3 ,
e
R + r sin θ sin τ
con √
e=
R r2 − 2r sin θ cos τ + 1.
Para calcular el promedio temporal de estos campos tenemos que realizar la integración (5.14)
e ),
de tal manera que estas expresiones de Er , Eθ y Eϕ , deben ser multiplicadas por N (τ )/R(τ
siendo ahora
N (τ ) = Re + r sin θ sin τ.

El campo eléctrico radial promedio para θ = 0 está ya dibujado en la Figura 5.7, pero lo
hemos recalculado numéricamente en la siguiente Figura 5.9. Vemos el comportamiento Coulom-
biano de la componente radial en las direcciones θ = 0, π/3, π/4, π/6. Para direcciones próximas
al plano XOY , en la región r < 1 el campo promedio temporal cambia de signo, se dirige hacia
el origen, en el que se anula.
Análogamente, en la Figura 5.10 se representa la componente transversal del campo eléctrico
promedio retardado < Eθ (r, θ) > en las mismas direcciones, que vemos que tiende a cero muy
rápidamente. Para θ = π/2, es claro que < Eθ (r, π/2) >= 0. El campo promedio < Eϕ (r, θ) >
se anula por doquier para todo θ ̸= π/2. Sobre el plano θ = π/2 la rutina numérica no funciona.

0.5

0.4

0.3

0.2

0.1

2 4 6 8

Figura 5.9: Promedio temporal de la componente radial < Er (r) > del campo eléctrico
retardado en las direcciones θ = 0, π/3, π/4 y π/6.

El campo magnético promedio se calcula de la misma manera. Vamos a considerar solamente


el campo retardado y lo vamos a comparar con el campo magnético producido por un momento
dipolar magnético µ, situado en el origen del sistema de referencia. El campo de este dipolo es 3

3b r · µ) − µ
r (b
B 0 (r) = .
c2 r 3
3
J.D. Jackson, Classical Electrodynamics, John Wiley and Sons, NY 3rd. ed. (1998).
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 255

2 4 6 8

-0.1

-0.2

-0.3

-0.4

-0.5

Figura 5.10: Promedio temporal de la componente transversal < Eθ (r) > del campo eléctrico
retardado en las direcciones θ = 0, π/3, π/4 and π/6. Tiende a cero muy rápidamente. Para
θ = π/2, se anula por doquier.

Para esta corriente, el momento magnético producido por la carga es de valor ecR0 /2 en la
dirección OZ , de tal manera que en unidades de R0 se puede escribir como
( )
e 3b r·z
r (b b) − z
b
B 0 (r) = .
2cR02 re3

Las componentes no nulas de este campo son


( ) ( )
e cos θ e sin θ
B0r (r, θ) = , B0θ (r, θ) = . (5.15)
cR02 re3 cR02 r3
2e

En este modelo, el campo magnético instantáneo es B = n × E/c. Sus diferentes compo-


nentes, una vez que el factor constante e/cR02 , ha sido suprimido, se escriben como:

(1 − r sin θ cos τ ) cos θ


Br (r, θ, τ ) = ( )3 ,
e
R + r sin θ sin τ

e sin τ
r cos τ (1 + sin2 θ) − (1 + r2 ) sin θ − Rr
Bθ (r, θ, τ ) = ( )3 ,
e
R + r sin θ sin τ

e cos τ + sin τ )r cos θ


(R
Bϕ (r, θ, τ ) = ( )3 .
e + r sin θ sin τ
R

Para el cálculo del promedio temporal del campo retardado, tenemos que multiplicar estas
e , como en el caso anterior. La integración numérica se compara con
componentes por N (t)/R(t)
la expresión de las componentes del campo de dipolo (5.15) en las diferentes direcciones.
El campo del dipolo (5.15) va a innito cuando r → 0. En las Figuras 5.11-5.13 comparamos
las componente de B0r (r) con la componente del campo promedio temporal < Br (r, θ) >, para
r > R0 y en las direcciones θ = π/6, π/4 y π/3. Análogamente, en las Figuras 5.14-5.16, las
componentes B0θ (r, θ) y < Bθ (r, θ) >.
Los promedios temporales < Br (r) > y < Bθ (r) > no divergen en el origen sino que
tienen el comportamiento que se describe en las guras 5.17 y 5.18, respectivamente, cuando los
representamos a lo largo de las direcciones θ = 0, π/3, π/4 and π/6, y toman los valores cos θ y
− sin θ respectivamente, en el punto r = 0.
El promedio temporal de la componente transversal < Bϕ (r, θ) > se anula en todas las
direcciones.
256 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

0.03

0.025

0.02

0.015

0.01

0.005

4 5 6 7 8

Figura 5.11: Componentes radiales del campo de dipolo B0r (r) y del campo magnético
promedio temporal retardado < Br (r) >, en la dirección θ = π/6.

0.025

0.02

0.015

0.01

0.005

4 5 6 7 8

Figura 5.12: Componentes radiales del campo de dipolo B0r (r) y del campo magnético
promedio temporal retardado < Br (r) >, en la dirección θ = π/4.

0.02

0.015

0.01

0.005

4 5 6 7 8

Figura 5.13: Componentes radiales del campo de dipolo B0r (r) y del campo magnético
promedio temporal retardado < Br (r) >, en la dirección θ = π/3.

0.008

0.006

0.004

0.002

4 5 6 7 8

Figura 5.14: Componente promedio temporal retardada < Bθ (r) > y componente B0θ (r) del
campo de dipolo, en la dirección θ = π/6.
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 257

0.012

0.01

0.008

0.006

0.004

0.002

4 5 6 7 8

Figura 5.15: Componente promedio temporal retardada < Bθ (r) > y componente B0θ (r) del
campo de dipolo, en la dirección θ = π/4.

0.015

0.0125

0.01

0.0075

0.005

0.0025

4 5 6 7 8

Figura 5.16: Componente promedio temporal retardada < Bθ (r) > y componente B0θ (r) del
campo de dipolo, en la dirección θ = π/3.
1

0.8

0.6

0.4

0.2

1 2 3 4 5 6

Figura 5.17: Componente promedio temporal retardada < Br (r) > en las direcciones θ =
0, π/3, π/4 y π/6 y su comportamiento en r = 0. Para θ = π/2 se anula por doquier.

1 2 3 4 5

-0.2

-0.4

-0.6

-0.8

Figura 5.18: Componente promedio temporal retardada < Bθ (r) > en las direcciones θ =
0, π/3, π/4 y π/6 y su comportamiento en r = 0.
258 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

1.5

0.5

2 4 6 8

Figura 5.19: Componente promedio temporal < Er (r) > del campo eléctrico avanzado, en
las direcciones θ = 0, π/3, π/4 y π/6. No posee un comportamiento Coulombiano como el
campo retardado.

Para terminar esta sección vamos a hacer el mismo cálculo, pero para los campos avanzados
en vez de los retardados.
En este caso, el tiempo de observación y el tiempo del laboratorio están relacionados por
e
to = t − R/c, y por lo tanto dto = (M (t)/R(t))dt e es el mismo de antes, pero
, donde R(t)

e −x
M (t) = R(t) e sin ωt + ye cos ωt.

Si representamos en la gura 5.19, el promedio temporal del campo eléctrico radial avanzado, en
las mismas direcciones que el de la Figura 5.9, vemos un comportamiento diferente de estas com-
ponentes avanzadas, y aunque el campo decrece a largas distancias, no tiene un comportamiento
Coulombiano.

5.1.5. Energía y momento angular electromagnético

Energía electromagnética
Si calculamos la energía electromagnética asociada al campo en el instante to , como B =
n × E/c, resulta que la densidad de energía

1 1 2 1
h(to ) = ϵ0 E 2 + B = ϵ0 E 2 − ϵ0 (n · E)2 ,
2 2µ0 2

por lo que la energía en cualquier instante del tiempo de observación to vale



E(to ) = h(to )dV.
R3

El valor del campo, debe ser evaluado a partir de la localización de la carga en el correspondiente
tiempo retardado tr , con to = tr + R/c.
Como hemos analizado en el teorema de Gauss, es necesario considerar los dos campos,
aunque el E β se anula salvo en los puntos singulares del plano XOY cuando β → 1. Como
E = Eβ + Ea,
E 2 = Eβ2 + Ea2 + 2E β · E a .
Como
e(1 − β 2 )
Eβ = (n − β) ,
R2 (1 − n · β)3
e
Ea = n × ((n − β) × a) .
Rc (1 − n · β)3
2
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 259

Los vectores que aparecen, en términos de un valor arbitrario de β son


1
n= x − cos ωt, ye − sin ωt, ze],
[e
e
R
β = β[− sin ωt, cos ωt, 0],
β 2 c2
a= [− cos ωt, − sin ωt, 0].
R0
Los productos escalares
β 2 c2
a·n= (1 − x
e cos ωt − ye sin ωt)
R0 R e
β
n·β =
(−ex sin ωt + ye cos ωt) ,
Re
1 (e )
1−n·β = R + βe x sin ωt − βey cos ωt
Re
La parte Eβ2 , (n − β)2 = (1 + β 2 − 2n · β), con lo que

e2 (1 − β 2 )2 (1 + β 2 − 2β (−e e
x sin ωt + ye cos ωt) /R)
Eβ2 = . (5.16)
4
R0 Re4 (1 − n · β)6

La parte de E 2a ,

[n × ((n − β) × a)]2 = a2 (1 − n · β)2 − (1 − β 2 )(a · n)2 ,

por lo que E 2a se escribe

e2 (a2 (1 − n · β)2 − (1 − β 2 )(a · n)2 )


Ea2 = ,
R2 c4 (1 − n · β)6
[ ]
β4 Re2 (1 − n · β)2 − (1 − β 2 ) (1 − x
e cos ωt − ye sin ωt)2
e2
Ea2 = (5.17)
R04 e4 (1 − n · β)6
R
habiendo denido la distancia adimensional Re = R/R0 . Finalmente la parte 2E β · E a contiene
la parte
(n − β) · [n × ((n − β) × a)] = (β 2 − n · β)(n · a),
ya que el término β · a = 0. Por lo tanto

e2 2β 2 (1 − β 2 )(β 2 − n · β) (1 − x
e cos ωt − ye sin ωt)
2E β · E a = . (5.18)
4
R0 e
R (1 − n · β)6
4

Para la parte (n · E)2 solamente contribuye E β ,

1 e2 (1 − β 2 )2 (1 − n · β)2
− (n · E)2 = − 4 , (5.19)
2 R0 2R e4 (1 − n · β)6

Vamos a eliminar de estos términos el factor dimensional ϵ0 e2 /R04 , y para reescribirlo en el


Sistema Internacional de Unidades, deberemos reemplazar e → e/4πϵ0 .
La densidad de energía que hay que integrar, en variables adimensionales es la suma de los
cuatro términos (5.16), (5.17), (5.18) y (5.19), y resulta ser:

h(x, y, z, to ) =,
260 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

y la energía ∫
ϵ0 e2 R03
E(to ) = h(x, y, z, to )dVe
(4πϵ0 )2 R04 R3

donde en la integral, el elemento de volumen dV = R03 dVe se hace en términos de variables


adimensionales y por lo tanto el resultado de la integración es un número nito y adimensional
M . La integral depende del valor de β y una vez realizada la integral hay que hacer el límite
β → 1. Como el centro de masa del electrón está en reposo, R0 = ~/2mc y si suponemos que
toda su energía es puramente electromagnética, podemos identicar esta energía con la energía
en reposo,
e2 2mc e2 α 1
mc2 = M, 1 = M= M, α ≃ , (5.20)
4πϵ0 4π~ 4πϵ0 hc 2π 137
siendo α la constante de estructura na, por lo que el valor de e2 quedaría unívocamente
determinado (salvo un signo) una vez realizada la anterior integral, que no está exenta de
dicultades, y que si esto fuera correcto nos debería dar el valor M = 2π/α ≈ 861.009.

4πϵ0 hc
e2 = .
M
Una partícula cuya estructura fuera puramente electromagnética, tendría un único valor de
la carga eléctrica salvo un signo, lo que correspondería a que electrones, muones y partículas
tau, y sus correspondientes antipartículas, que solamente interaccionan de forma electro-débil,
poseerían la misma carga eléctrica, independientemente de su masa. En el caso de un quark, no
toda la estructura es puramente electromagnética, ya que también interacciona de forma fuerte,
por lo que en la ecuación (5.20) implicaría una energía electromagnética fracción k de su energía
total en reposo mc2 , con lo que
4πϵ0 hc
e2 = k , k < 1.
M
Los quarks tendrían una carga eléctrica, independiente de su masa, y menor que la de los objetos
que solamente interaccionan de forma electrodébil. De hecho la teoría nos debería llevar a que
k = 1/9 o bien 4/9 para los quarks down y up, respectivamente.
El valor de la energía debe ser independiente del tiempo de observación to , ya que el mo-
vimiento de la carga es estacionario, por lo que también debe coincidir con su valor medio
temporal, ∫ ∫ ∫ T
1 T ϵ0
E= E(to )dto = dV E 2 dto ,
T 0 T R3 0
para cualquier valor de T , en particular para el período de una vuelta completa.

Momento angular electromagnético


Si calculamos el momento angular electromagnético con respecto al origen, lo proyectamos
en la dirección OZ y lo identicamos con el momento angular mecánico de la partícula −~/2,
obtenemos otra ecuación ∫
~
− = (r × g)z dV,
2 R3
ϵ0 ( 2 )
g = ϵ0 E × B = ϵ0 E × (n × E/c) = E n − E(n · E β ) ,
c
ya que E a es perpendicular a n. La parte
R0
(r × n)z = y cos ωt − x
(e e sin ωt),
Re
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 261

va multiplicada por E 2 , que es la suma de los tres términos (5.16), (5.17) y (5.18) y por ϵ0 /c.
La parte r × E = r × E β + r × E a , por lo que tenemos dos términos

R0
(r × (n − β))z = y cos ωt − x
(e e sin ωt) − βx cos ωt − βy sin ωt,
Re

(r × a)z = β 2 c2 (e
y cos ωt − x
e sin ωt),
los cuales aparecen multiplicados por

e(1 − β 2 )
n · Eβ = .
R2 (1 − n · β)2

Como (r × E)z = xEy − yEx ,


( )
e(1 − β 2 ) 1
(r × E β )z = 2 (y cos ωt − x sin ωt) − βx cos ωt − βy sin ωt ,
R (1 − n · β)3 e
R
e
(r × E a )z = [(a · n)(r × (n − β))z − (1 − n · β)(r × a)z ] ,
Rc2 (1 − n · β)3
con lo que
( )
ϵ0 ϵ0 e2 (1 − β 2 )2 R0 1
− (n · E β )(r × E β )z = − 4 y cos ωt − x
(e e sin ωt) − βe
x cos ωt − βe
y sin ωt .
c cR (1 − n · β)5 e
R
Análogamente
ϵ0 ϵ0 e2 (1 − β 2 )β 2
− (n · E β )(r × E a )z = − ×
c e − n · β)5
cR3 R(1
[ ( )
1
(1 − x
e cos ωt − ye sin ωt) y cos ωt − x
(e e sin ωt) − βe x cos ωt − βe y sin ωt −
e
R
( ) ]
− R e + βe x sin ωt − βey cos ωt (e y cos ωt − x e sin ωt)
∫ 3
~
− = Sz dV,
2 R
siendo
Sz =
Supongamos que hacemos la evaluación en el instante de observación t0 = 0, cuando la carga
se encuentra en el punto A ≡ (1, 0, 0). Para este punto, la distancia retardada hasta la carga
e = 0. Para otro punto cualquiera P ≡ (x, y, z) el correspondiente punto retardado es el
es R
e, como se muestra en la gura.
B ≡ (cos θ, sin θ, 0), que como el radio del círculo es 1, el θ = −R
Vamos a hacer el siguiente cambio de variables

x = R sin λ cos ϕ+cos R, y = R sin λ sin ϕ−sin R, z = R cos λ, R ∈ [0, ∞], λ ∈ [0, π] ϕ ∈ [0, 2π].

El Jacobiano de la transformación es

J = R2 sin λ(1 − sin λ sin(R + ϕ)),

yR=R e.
La integral que da lugar al valor M , queda en el límite β → 1
∫ ∞ ∫ π ∫ 2π
8 sin λ
M= dR dλ dϕ ,
0 0 0 (2 − cos(R − λ + ϕ) + cos(R + λ + ϕ))3
262 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN

Figura 5.20: La distancia adimensional R desde el punto P al punto retardado B es la misma


que la longitud del arco AB .

Para la otra integral

−R sin λ sin(R + ϕ)R2 sin λ(1 − sin λ sin(R + ϕ))


R4 (1 − sin λ sin(R + ϕ))4
∫ ∞ ∫ ∫
π 2π
− sin2 λ sin(R + ϕ)
N= dR dλ dϕ .
0 0 0 R(1 − sin λ sin(R + ϕ))3
Ambas integrales hechas con Mathematica dan 0, pero si se hace el cálculo de forma numérica
da valores oscilantes muy altos jando la integral en R hasta ciertos valores nitos.
Capítulo 6

Propiedades y efectos asociados con el

espín

6.1. Relación giromagnética

Si tenemos un punto cargado de masa m y carga e que se mueve en el espacio, su momento


angular J y su momento magnético µ respecto de un punto, satisfacen la relación
e
µ= J,
2m
pues de su denición J = r × p, µ = er × v/2 = er × mv/2m.
En el caso del electrón, la relación entre su espín con respecto al centro de masa y su
momento magnético, resulta ser
e
µ=g S, g = 2.
2m
A la magnitud adimensional g es a lo que se denomina relación giromagnética, por ser un número
que relaciona la capacidad de producir campo magnético con la propiedad mecánica ligada con
la rotación.
Uno de los éxitos de la ecuación de Dirac fue el que predecía el valor g = 2 de la relación
giromagnética del electrón 1 . Más tarde, Levy-Leblond 2 obtuvo también la predicción g = 2
pero para un objeto no relativista de espín s = 1/2, con lo que zanjaba la cuestión de que g = 2
no era una propiedad exclusivamente relativista. Proca 3 predijo que para partículas con espín
1, tendría que ser g = 1, lo que condujo a Belinfante 4 a conjeturar que la relación giromagnética
de las partículas elementales estaría ligada con el espín por la regla g = 1/s, cualesquiera que
fuera s, a pesar de que el factor g es adimensional. Encontró modelos cuánticos teóricos de
espín 3/2 en que esto se cumplía y unos años más tarde Moldauer y Case 5 desarrollaron un
formalismo donde corroboraban esto para cualquier espín semientero. Tumanov 6 encontró esto
mismo pero para el valor entero s = 2. En todas estas predicciones teóricas se supuso que la
interacción electromagnética venía dada por el acoplamiento mínimo.
Sin embargo, Weinberg 7 al estudiar la interacción electrodébil hizo la predicción de que
g = 2 para los bosones intermedios de espín 1 que median en la interacción débil. Lo obtuvo
1
P.A.M. Dirac, Proc. Roy. Soc. London A117, 610 (1928).
2
J.M. Levy-Leblond, Comm. Math. Phys. 6, 286 (1967).
A. Proca, Compt. Rend. 202, 1420 (1936); Journ. Phys. Radium, 49, 245 (1988).
3

F.J. Belinfante, Phys. Rev. 92, 997 (1953).


4

P.A. Moldauer and K.M. Case, Phys. Rev. 102, 279 (1956)
5

V.S. Tumanov, Sov. Phys. JETP, 19, 1182 (1964).


6
7
S. Weinberg, in Lectures on Elementary Particles and Quantum Field Theory, edited by S. Deser, M. Grisaru
and H. Pendleton, MIT press, Cambridge, MA (1970), p. 283.

263
264 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

al analizar la interacción de los bosones W con el campo electromagnético, requiriendo que la


amplitud de dispersión del proceso tuviera un buen comportamiento a altas energías. Cuando
se descubren experimentalmente en 1983 en el CERN, los bosones cargados W ± de espín 1 y
se encuentra que para ellos g = 2, contrario a la conjetura de Belinfante y corroborando la
predicción de Weinberg, se planteó la cuestión de hasta qué punto el valor de g sería siempre 2
para cualquier tipo de partícula elemental, independientemente del valor de su espín.
Jackiw 8 ha dado otro argumento de tipo dinámico, conrmando que para campos vectoriales
de espín 1, la relación giromagnética debe ser g = 2, aceptando una invariancia gauge de tipo
no electromagnético. Da también, algunos argumentos ad hoc para campos de espín s = 2, que
también son consistentes con la predicción g = 2.
Por encima de todo esto, las únicas partículas cuya relación giromagnética se haya medido
con precisión, encontrándose que g = 2, además de las correcciones radiativas, son los leptones
cargados (e± , µ± y τ ± ) y los bosones W ± . Por otra parte, el modelo estándar no prevé la
existencia de partículas elementales de espín superior a 1, con lo que conjeturas del tipo de la
de Belinfante, carecen de sentido.
El objeto de esta sección es dar argumentos no de tipo dinámico, como en estos trabajos
previos, sino argumentos de tipo cinemático, aprovechando la estructura del espín de los modelos
que surgen del formalismo 9 . Estos argumentos están basados en la doble estructura del espín
con una parte rotativa y otra, en sentido contrario, debida al movimiento orbital del centro de
carga con respecto al centro de masa y que sería la que produciría o estaría relacionada con
el momento magnético, según la gura de la portada, que hemos visto satisface la ecuación de
Dirac al ser cuantizada.
El operador momento angular de una partícula elemental más general, con respecto al origen
del sistema de referencia, tanto relativista como no relativista, es
~
J = r × ∇ + S = r × P + S, (6.1)
i
donde el operador espín es
S = Z + W, (6.2)
con Z = u × ~i ∇u , siendo ∇u el operador gradiente con respecto a las variables de velocidad,
y W es un operador diferencial lineal que deriva con respecto a las variables de orientación α,
y que por lo tanto, conmuta con el otro. Por ejemplo, en la parametrización de la orientación
dada por ρ = n tan(α/2), el operador W se escribe como
~
W = [∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )] , (6.3)
2i
y otras parametrizaciones pueden verse en el Apéndice 3.5.
La parte primera del espín Z , que está relacionada con el movimiento orbital de la carga,
solamente posee valores propios enteros, sus funciones propias son los armónicos esféricos, ya
que su estructura diferencial es la de un momento angular orbital que en realidad deriva solo
sobre las variables de orientación del vector velocidad u. La parte de espín semientero proviene
del operador (6.3). Este operador W , que deriva con respecto a las variables de orientación del
triedro ligado a la carga, lo que tiene en cuenta es la rotación de la partícula.
Hemos visto tanto en los ejemplos relativistas como en los no relativistas que si la contribu-
ción al espín es de naturaleza orbital, relacionada con la parte del zitterbewegung, Z , entonces
la relación entre el espín y el momento magnético viene dada por
e dk e
µ= k× =− Z, (6.4)
2 dt 2m
8
R. Jackiw, Phys. Rev. D 57, 2635 (1998).
9
M. Rivas, J.M.Aguirregabiria and A. Hernández, Phys. Lett. A 257, 21 (1999).
6.1. RELACIÓN GIROMAGNÉTICA 265

donde k = r − q , es decir con una relación giromagnética normal g = 1. Si el electrón tiene una
relación giromagnética g = 2, esto implica que debe existir otra parte del espín proviniente de
la velocidad angular, pero que no produzca contribución al momento magnético.
De aquí resulta que, para el electrón, ambas partes W y Z contribuyen al espín total. La
parte W está relacionada con las variables angulares que describen la orientación del electrón y
que no contribuye a la separación k entre el centro de masa y el centro de carga. Si el momento
magnético está relacionado con este movimiento por la fórmula (6.4), está relacionado con la
parte Z pero no con el espín total S . Es precisamente cuando tratamos de expresarlo en términos
del espín total cuando surge el concepto de relación giromagnética.
Supongamos ahora que las dos partes Z y W contribuyen al espín total S con sus valores
cuánticos no nulos, más bajos y que además deben ser únicos, ya que al no poseer estados
excitados, una partícula elemental solamente posee unos valores jos de sus propiedades. Para
partículas de Dirac hemos encontrado que el espín total es s = 1/2 y que las dos partes tienen
orientaciones opuestas, teniendo el espín S la misma orientación que la parte Z . La parte orbital
no puede tener un momento angular nulo porque el movimiento del centro de carga no pasa por
el centro de masa, y su valor no nulo más bajo es desde el punto de vista cuántico, z = 1 y para
la parte rotativa w = 1/2 en sentido contrario. Al expresar el momento magnético en términos
del espín total, como resulta que Z = 2S , es donde nos aparece que g = 2.
El valor experimental de g para leptones es

ge = 2,00231930436182, gµ = 2,0023318418, gτ = 2,00235442,

hasta el mayor número de cifras decimales vericadas. Vemos que es superior al valor teórico
predicho por la ecuación de Dirac g = 2. La razón estriba en que una cosa es la predicción
del modelo libre y otra la medida. Cuando medimos debemos interaccionar con la partícula
y la interacción modica la cinemática. Al introducir la partícula en un campo magnético, el
movimiento del centro de carga se modica, y como básicamente el momento magnético es
la intensidad de la corriente asociada a la carga multiplicada por el área encerrada por su
trayectoria, y ésta se modica, el valor del momento magnético medido no es el predicho y
dependerá de la intensidad del campo magnético utilizado.
Hay una corrección cuántica radiativa que es independiente del campo magnético, y que
fue determinada por Schwinger (1948), que toma el valor α/π = 0.0023228, en términos de la
constante de estructura na, de tal manera que el valor experimental resulta ser

α
g =2+ + g(B),
π

donde la parte g(B) es función del campo magnético externo.


En el caso de los protones y neutrones, la relación entre su momento magnético y espín vale:

e e
µp = gp S, gp = 5,585694, µn = gn S, gn = −3,826085,
2mp 2mp

donde mp es la masa del protón. A pesar de ser dos partículas de espín 1/2 no satisfacen la ecua-
ción de Dirac, ya que ésta predice que el correspondiente objeto cuántico debe necesariamente
ser de relación giromagnética g = 2. Protones y neutrones no son partículas elementales, y es
el movimiento de los quarks cargados el que suministra el momento magnético de los mismos.
Esto es más claro en el neutrón que al ser de carga total cero, posee sin embargo momento
magnético.
266 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

6.2. El reloj del electrón

De Broglie en su tesis 10 postula que: Toda porción de materia aislada posee un movimiento
periódico de naturaleza sin precisar, cuya frecuencia viene dada por ν = mc2 /h. Dirac sin
embargo encuentra que la posible frecuencia asociada al movimiento del punto r en el caso del
electrón, es el doble que la que le asocia De Broglie. Esta frecuencia es la del movimiento a la
velocidad de la luz del centro de carga alrededor del centro de masa en el análisis clásico y que
describe un objeto de espín 1/2 al ser cuantizado y que además satisface la ecuación de Dirac.
Este modelo se describe en la gura de la portada para el observador del centro de masa. El
centro de carga efectúa un movimiento circular a la velocidad de la luz, de radio R = ~/2mc y
frecuencia ν0 = 2mc2 /h, en este sistema de referencia.

6.2.1. Midiendo el reloj del electrón

Si efectivamente el electrón tuviera un movimiento interno periódico del estilo que hemos
mencionado, al desplazarse con velocidad constante obtendríamos una trayectoria del centro de
carga que poseería también una periodicidad espacial. Se podría hablar de su longitud de onda
como el valor de su período espacial, o bien la longitud que su centro de masa recorre durante
una vuelta de su centro de carga. Pero la periodicidad temporal depende de la velocidad de su
centro de masa. En efecto, supongamos que vemos moverse al centro de masa con velocidad v
como se indica en la gura 6.1. Como √ el centro de carga se sigue moviendo a la velocidad de
la luz, su velocidad transversal u⊥ = c2 − v 2 , por lo que un electrón en movimiento tarda
más tiempo en completar una vuelta, el reloj del electrón en movimiento va más despacio. Si
llamamos T0 = 2πR/c al tiempo que tarda en dar una vuelta para el observador del centro
de masa, entonces para el que lo ve moverse con la velocidad v tarda T = 2πR/u⊥ = γ(v)T0 ,
siendo γ(v) = (1 − v 2 /c2 )−1/2 .
Si lanzamos un haz de electrones con una velocidad de su centro de masa v a través de un
cristal, por ejemplo de Silicio, y la velocidad es la adecuada de tal manera que la periodicidad
espacial del haz λ = vT y la periodicidad espacial de la red, d = 3,84Å para el Si, sean
comensurables, esto es, o bien d = kλ, o bien λ = nd, con k y n sendos enteros, entonces puede
tener lugar una dispersión resonante con los átomos. Si en la interacción de cada electrón con un
átomo de la red, recibe un impulso transversal ∆p y un impulso longitudinal despreciable frente
a p, cuando haya atravesado una longitud que contenga N átomos y d y λ sean conmensurables,
el impulso transversal total recibido será N ∆p. Por lo tanto este electrón se desviará un ángulo
del orden de N ∆p/p. Si, como proponen y realizan Gouanére et al.11 , medimos la intensidad del
haz que atraviesa el cristal en la propia dirección de incidencia, existirán unos momentos lineales
para los que se detectará una disminución de esta intensidad, debido a la dispersión resonante
transversal. Si d y λ no son conmensurables, la interacción del electrón con cada átomo puede
recibir impulsos laterales ∆p en ambos sentidos y el haz no se desvía.
En la gura 6.2 tenemos un cristal de Silicio. En la gura 6.3 se representa el movimiento
de dos electrones polarizados longitudinalmente y transversalmente con respecto al movimiento
de su centro de masa. Se compara esta descripción con la red de átomos de silicio con los que
va a interaccionar.
Cuando d = kλ, el electrón interacciona con cada átomo que se encuentra en su camino,
mientras que en el caso λ = nd, sufrirá una interacción resonante cada n átomos. Una mayor λ
implica también un mayor momento lineal, y por lo tanto el ángulo de dispersión será menor.
10
L. de Broglie, Thèse de doctorat (1924). Sommaire: . . . nous admettons dans le présent travail l'existence
d'un phénomène periodique d'une nature encore à préciser qui serait lié à tout morceau isolé d'énergie et qui
dépendrait de sa masse propre par l'équation de Planck-Einstein.
11
M Gouanère, M. Spighel, N. Cue, MJ. Gaillard, R. Genre, R. Kirsch,JC. Poizat, J. Remillieux, P. Catillon
and L. Roussel Found. Phys. 38, 659, (2008) y en Annales Fondation Louis de Broglie 30, 109 (2005).
6.2. EL RELOJ DEL ELECTRÓN 267

Figura 6.1: Movimiento del centro de masa con velocidad v y movimiento helicoidal a la velocidad
de la luz del centro de carga de un electrón libre. Se representan los dos momentos angulares S
y S CM , que muestran que S CM es conservado, mientras que √ S precesa alrededor del momento
lineal. La velocidad transversal del centro de carga u⊥ = c2 − v2 , por lo que tarda más en dar
una vuelta. El reloj del electrón móvil va más despacio.

Figura 6.2: Estructura de un cristal de Silicio.


268 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

Figura 6.3: En la izquierda de la gura se representa la red de átomos de silicio, cuyos núcleos
están separados una distancia d = 3,84Å. A la derecha tenemos la proyección sobre el plano XOY
de los movimientos del centro de carga de dos electrones polarizados, (a) longitudinalmente y
(b) transversalmente, al movimiento de su centro de masa. En rojo aparece la correspondiente
trayectoria de su centro de masa. Ambas descripciones no están a la misma escala que la red de
átomos de Si. λC = 2R ∼ 10−13 m es la oscilación transversal del centro de carga, y λ = vT es lo que
recorre el centro de masa durante una vuelta de la carga.

Como
kγ(v)v kmγ(v)v kp
d = kλ = kvT = kγ(v)vT0 = = =
ν0 mν0 mν0
existirán unos momentos lineales resonantes
mν0 d 161,748
pDk = = MeV/c, k = 1, 2, . . . (frecuencia de Dirac)
k k
para los que se detectará una disminución en la intensidad del haz de salida en la dirección
frontal. En el mencionado experimento de Gouanére et al., utilizaron un detector situado a 3 m
del cristal de silicio con una ventana de 3 × 3 mm, por lo que los electrones desviados un ángulo
superior a 0.001 rad no se detectaban. Pretendían medir la frecuencia de De Broglie que es la
mitad que la de Dirac, para la que los momentos lineales resonantes satisfacen
mν0 d 80,874
pBk = = MeV/c, k = 1, 2, . . . (frecuencia de De Broglie)
k k
por lo que establecieron en el experimento el rango de su momento lineal entre 54 y 110 MeV/c,
es decir 80 ± 30 MeV/c, alrededor de la primera frecuencia resonante p1 . Lo que obtuvieron
fue un pico resonante para el valor de p =81.1 MeV/c en vez del valor esperado de p =80.874
MeV/c, (ver gura 6.6) que es el correspondiente a k = 2 para el caso de que la frecuencia del
electrón fuera la de nuestro modelo. En este caso, el pico resonante correspondiente a k = 3,
de un momento lineal p3 =53.916 MeV/c está muy próximo al límite inferior de la energía del
experimento y podría haber sido detectado si hubieran ampliado el rango.
Si el reloj del electrón tuviera la frecuencia de De Broglie ν0 = mc2 /h, entonces los picos
resonantes que se obtendrían son los de la gura 6.4, mientras que en el supuesto de que la
frecuencia fuera la de Dirac y del modelo que presentamos, que es el doble que la de De Broglie,
se obtendrían los picos de la gura 6.5. Todos los picos inferiores asociados a la frecuencia de
6.2. EL RELOJ DEL ELECTRÓN 269

Figura 6.4: Diferentes picos de la dispersión resonante del haz de electrones en el supuesto de
que la frecuencia interna del movimiento del centro de carga fuera la de De Broglie ν0 = mc2 /h.

Figura 6.5: Diferentes picos de la dispersión resonante del haz de electrones en el supuesto de que
la frecuencia interna fuera el doble que la de De Broglie ν0 = 2mc2 /h. Los picos correspondientes
a p3 , p5 . . ., no aparecen en el caso anterior.
270 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

Figura 6.6: La línea de puntos es la medida del número de electrones detectados después de
atravesar el cristal de Si, en el experimento realizado por Gouanère et al. (a) La línea azul
representa el análisis numérico realizado por el método de Montecarlo, en el supuesto de que la
frecuencia interna fuera la de De Broglie ν0 . (b) La curva de color rojo por su parte, representa
el análisis numérico realizado por el método de Montecarlo, en el supuesto de que la frecuencia
interna fuera la de Dirac, el doble que la de De Broglie 2ν0 . El resultado experimental es más
consistente con este análisis a frecuencia doble, solo que el pico aparece un poco desplazado hacia
la derecha. Este desplazamiento de la energía de resonancia podría estar ligado con la temperatura
de la muestra, y por lo tanto con una pequeña dilatación del parámetro d de la red.

De Broglie aparecen en el caso de la frecuencia doble de Dirac, pero no a la inversa. La presencia


de unos u otros permitirá discernir en un primer momento, entre estas dos posibles frecuencias.
Una medida precisa de estos picos representa una medida precisa de la frecuencia interna del
electrón ν0 . Sería deseable, ampliar el rango del experimento de Gouanére et al. para permitir
detectar los picos inferiores a 80.874 MeV/c. Se pondría de maniesto la existencia de este
movimiento periódico interno y nos permitiría determinar la frecuencia del reloj del electrón.
La medida precisa de esta frecuencia podría ser usada para denir una unidad natural de
tiempo asociada a fenómenos físicos en los que intervienen los electrones. Juntamente con la
constante universal c, nos permite tener también una unidad natural de longitud, por lo que
todas las variables cinemáticas usadas en la descripción clásica del electrón se pueden tomar
como adimensionales, en este sistema natural de unidades.

6.3. Dipolo eléctrico instantáneo


El movimiento interno de la carga para el observador del centro de masa es un círculo a la
velocidad de la luz. La posición de la carga está relacionada con el espín por la ecuación
1
k= S × u, (6.5)
mc2
donde S es el espín constante en este referencial y u = dk/dt, con u = c es la velocidad de
la carga. Además de este movimiento del centro de carga, existe la rotación de un sistema de
referencia local que produce una velocidad angular, pero esta rotación no tiene efecto en el
momento dipolar de la partícula. (Ver la Fig. 6.7 donde no se han dibujado ni la velocidad
angular ni el sistema de referencia local).
6.3. DIPOLO ELÉCTRICO INSTANTÁNEO 271

Figura 6.7: Movimiento de la carga del electrón en el sistema de referencia del C.M.

Desde el punto de vista del observador del centro de masa, la partícula se comporta como si
tuviera un momento magnético producido por la corriente asociada a la carga y expresado por
la expresión clásica habitual

1 e dk e dk e
µ= k × j d3 r = k × = k×m =− Z,
2 2 dt 2m dt 2m

donde e es el valor de la carga y j(r − k) = e dk/dt δ 3 (r − k) es la densidad de corriente. El


término orbital k × dk/dt está relacionado con la parte del espín asociada al zitterbewegung,
la cual cuantiza con valores enteros, y que para las partículas de Dirac es dos veces el valor del
espín total, como hemos visto en la sección 6.1.
Pero para el observador del centro de masa, la partícula posee un momento dipolar eléctrico
oscilante con respecto al centro de masa de valor d = ek. Está relacionado con el espín mediante
e
d= S × u. (6.6)
mc2
En su artículo original, Dirac 12 obtiene que el Hamiltoniano del electrón contiene, en pre-
sencia de un campo electromagnético externo, además de la parte libre dos términos

e~ ie~
Σ·B+ α · E = −µ · B − d · E, (6.7)
2m 2mc
donde ( )
σ 0
Σ= , y α = γ0 γ,
0 σ
se expresa en términos de las matrices σ de Pauli y α es la matriz de Dirac que nos produce el
operador velocidad.
Demostraremos que la versión cuántica de la expresión (6.6) es en efecto el dipolo eléctrico
de Dirac (6.7).
La dicultad de relacionar la expresión clásica del momento dipolar con su versión cuántica
consiste en interpretar adecuadamente cómo se expresa el producto vectorial de (6.6) que fue
introducido por J. Willard Gibbs en 1884, en términos de las matrices de Dirac o en términos
12
P.A.M. Dirac, Proc. Roy. Soc. London, A117, 610 (1928).
272 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

del producto matricial (o geométrico) de los elementos del álgebra de Dirac. Vamos a ver que
como el álgebra de Dirac es un álgebra de Cliord dicho producto vectorial se va a interpretar
en términos del producto interior y exterior de este álgebra.
El operador velocidad u = cα y el operador espín S son bivectores del álgebra de Di-
rac considerados como elementos del álgebra geométrica del espacio-tiempo, en el sentido de
Hestenes 13 .
De hecho las matrices alfa de Dirac se escriben como productos de pares de matrices gamma
αi = γ0 γi y lo mismo las componentes del espín Sj = (i~/2) γk γl , j, k, l cíclico 1, 2, 3. Este
álgebra geométrica está generada por las cuatro matrices γ µ de Dirac, µ = 0, 1, 2, 3 que se
interpretan como los cuatro vectores base del espacio-tiempo de Minkowski. Satisfacen la regla
γµ · γν = ηµν , es decir, γ02 = 1 y las γi2 = −1, donde el punto representa el producto interior
en el álgebra de Cliord. Vemos por lo tanto que tanto la velocidad como el espín pertenecen
a la subálgebra par, o álgebra de Pauli del espacio tridimensional. Bajo inversiones espaciales
γ0 → γ0 y γi → −γi , por lo que el operador velocidad cambia de signo, por lo que es un vector
espacial, pero no así el espín, que es invariante y por lo tanto es y corresponde a un bivector
espacial o pseudovector.

Figura 6.8: Base para los vectores (a) y bivectores (pseudovectores) (b) del álgebra de Pauli.

La relación entre el producto vectorial y el producto exterior e interior de dos vectores a y


b en el álgebra de Pauli es,
a × b = −ia ∧ b = b · (ia), (6.8)
donde ∧ representa el símbolo del producto exterior, el punto · representa al producto interior
y la unidad imaginaria i representa al vector unidad pseudoescalar y ia es el bivector dual del
vector a.
El producto interior de un vector b y un bivector A se expresa en términos del producto
geométrico en la forma
1
b · A = (bA − Ab) (6.9)
2
y tanto en el álgebra de Dirac como en la de Pauli, el producto geométrico bA viene dado por
el producto matricial ordinario.
Si escogemos como bases de los vectores y pseudovectors las de la Fig. 6.8, donde los objetos
con doble raya de la parte (b) representan los vectores duales de los correspondientes bivectores
espaciales, y expresamos en estas bases los observables de la Fig. 6.7, entonces el vector espacial
velocidad es u = cγ0 γ2 y el pseudovector espacial S = (~/2)γ2 γ3 y por lo tanto, usando (6.8) y
(6.9) obtenemos
( )
ic~ 1 −ic~
S × u = u · (iS) = (γ0 γ2 γ2 γ3 − γ2 γ3 γ0 γ2 ) = γ0 γ3 .
2 2 2
13
D. Hestenes, Space-Time algebra, Gordon and Breach, NY (1966); D. Hestenes and G. Sobczyk, Cliord
Algebra to Geometric Calculus, D. Reidel Pub. Co. Dordrecht, (1984).
6.4. EFECTO COMPTON 273

El vector k = Rγ0 γ3 donde R = ~/2mc, y haciendo la substitución en (6.6) obtenemos nal-


mente, el resultado deseado,
ie~
d3 = − α3 .
2mc
De esta relación, si utilizamos el reescalamiento espacial usando como unidad de longitud el
radio R0 , resulta que desde el punto de vista cuántico, la separación entre el CC y el CM, en
unidades adimensionales resulta ser
e−q
r e = −iα.

Desde el punto de vista algebráico, el operador velocidad de Dirac en unidades adimensionales


e = α. Como hemos visto en la sección 4.2.2, una rotación de valor π/2 en la fase del
es u
movimiento interno, eiπ/2 = i equivale a girar π/2 el vector velocidad, pero eso nos dene un
vector adimensional en la dirección del CC al CM, por lo que el vector opuesto resulta ser
e−q
r e = −iα.

6.4. Efecto Compton

La luz polarizada circular corresponde a un haz de fotones en el que todos los fotones tienen
su espín orientado, bien hacia adelante o bien hacia atrás 14 . En la interacción de una onda
electromagnética plana con un electrón puntual en reposo (ver Sec.??) vemos que el electrón sale
dispersado siempre hacia adelante, formando un cierto ángulo con la dirección del movimiento
de la onda. La onda le comunica un momento lineal que tiene una parte en la dirección de
propagación de la onda. Si, como se interpreta habitualmente, la dirección de propagación de
la onda electromagnética corresponde con la dirección del movimiento de los fotones del haz,
podemos intentar hacer el análisis relativista de la interacción corpuscular entre un fotón y un
electrón, considerados como partículas puntuales. Lo planteó Arthur H. Compton en 1923.
En efecto, supongamos un electrón en reposo y un fotón incidente a lo largo del eje OZ de
momento lineal p y energía H = pc = hf . Después de la colisión, el fotón sale con un momento
lineal p′ formando un ángulo α con la dirección de incidencia y el electrón lo hace con un
momento lineal de valor k en la dirección β , como se indica en la gura. La conservación del

14
R. A. Beth, Mechanical Detection and Measurement of the Angular Momentum of Light, Phys. Rev. 50,
115 (1936).
274 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

momento lineal y de la energía nos lleva a:



p′ cos α + k cos β = p, p′ sin α = k sin β, cp + mc2 = cp′ + m2 c4 + c2 k 2 , (6.10)

un sistema de tres ecuaciones con cuatro incógnitas, α, β, p′ , k , que no posee solución única,
pero que jada la dirección de salida del fotón α, nos brinda una solución única para p′ , k y β .
Como k = p − p′ ,
1 ( )
k 2 = p2 + p′ − 2p · p′ = 2 H 2 + H ′ − 2HH ′ cos α
2 2
c
sustituyendo esto en √
c(p − p′ ) + mc2 = m2 c4 + c2 k 2
y elevando al cuadrado, llegamos a
1 1 1 − cos α
mc3 (p − p′ ) = mc2 (H − H ′ ) = HH ′ (1 − cos α), ′
− =
H H mc2
y para las frecuencias de los fotones involucrados en la dispersión
1 1 h
− = (1 − cos α) (6.11)
f′ f mc2
y para las longitudes de onda
h
λ′ − λ = λC (1 − cos α), λC = = 2,426 · 10−12 m,
mc
donde a λC se le denomina la longitud de onda Compton del electrón. En los modelos de
electrón con espín, la separación entre el centro de carga y el centro de masa es R0 = ~/2mc =
1.93·10−13 m.
La variación de la energía del fotón dispersado en términos del ángulo de dispersión viene
dada por
hf 1
hf ′ = = hf A(α), A(α) = ,
hf 1 + q(1 − cos α)
1+ (1 − cos α)
mc2
siendo q = p/mc y que se representa en la gura:

f
1.0

0.8

0.6

0.4

Α
0.5 1.0 1.5 2.0 2.5 3.0

Figura 6.9: Representación de la función A(α) = f ′ /f , para un fotón incidente de hf = 2mc2 .

En esta gura, cuando α = π , el fotón sale hacia atrás, f ′ /f = 0.2, lo que corresponde a
haber utilizado fotones de energía hf = 2mc2 ≈ 1 MeV, el doble de la energía en reposo del
electrón.
6.4. EFECTO COMPTON 275

k
p
1.2

1.0

0.8

0.6

0.4

0.2

Α
0.5 1.0 1.5 2.0 2.5 3.0

Figura 6.10: Variación con α del momento lineal k del electrón saliente.

El momento lineal del fotón y del electrón saliente:


pmc √
p′ = = pA(α), k = p 1 + A(α)2 − 2A(α) cos α, (6.12)
mc + p(1 − cos α)
y el ángulo de dispersión del electrón
A(α) sin α 1 − A(α) cos α
sin β = √ , cos β = √ . (6.13)
1 + A(α)2 − 2A(α) cos α 1 + A(α)2 − 2A(α) cos α
Vemos en las guras 6.11 y 6.12 que para ángulos de dispersión del fotón muy bajos, α ≈ 0,
8sin Β<
1.0

0.8

0.6

0.4

0.2

Α
0.5 1.0 1.5 2.0 2.5 3.0

Figura 6.11: Variación del ángulo de dispersión β del electrón saliente en términos del
ángulo de dispersión del fotón, en el caso H ≈ 1MeV = 2mc2 .

sin β ≈ 1, el electrón sale prácticamente a 90◦ del fotón incidente. Solamente sale hacia adelante
sin β = 0 cuando el fotón dispersado tiene la dirección opuesta al incidente. Para α ≈ π/2,
sin β ≈ 0.3 y 0.62, respectivamente.

6.4.1. Contribución del espín


Si tenemos en cuenta los espines del fotón Z y del electrón S , la interacción conserva también
el momento angular del sistema. Tomemos como eje OZ la dirección del fotón incidente y como
plano XOZ el que subtienden los momentos lineales de las partículas dispersadas. Sea θ y ϕ
la orientación inicial del espín del electrón, y θ′ y ϕ′ su orientación nal. Como el espín del
fotón tiene la dirección del momento lineal, salvo tal vez un signo, la conservación de las tres
componentes del momento angular total nos lleva a:

S sin θ cos ϕ = Z2 sin α + S sin θ′ cos ϕ′ , S sin θ sin ϕ = S sin θ′ sin ϕ′ ,


276 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

8sin Β<
1.0

0.8

0.6

0.4

0.2

Α
0.5 1.0 1.5 2.0 2.5 3.0

Figura 6.12: Variación del ángulo de dispersión β del electrón saliente en términos del ángulo
de dispersión del fotón, en el caso de un fotón incidente de energía 5 eV, H ≈ 10−5 mc2 .

Z1 + S cos θ = Z2 cos α + S cos θ′ ,


es decir
sin θ cos ϕ = (Z2 /S) sin α + sin θ′ cos ϕ′ , sin θ sin ϕ = sin θ′ sin ϕ′ ,
(Z1 /S) + cos θ = (Z2 /S) cos α + cos θ′ ,
siendo Z1 y Z2 las componentes del espín del fotón en la dirección de su movimiento, que
sabemos vale Z1 = Z2 = ±~. Este es un sistema de tres ecuaciones con tres incógnitas α, θ′ y
ϕ′ , que nos brindará nalmente la orientación nal del espín del electrón y la dirección de salida
del fotón. Juntamente con las ecuaciones del apartado anterior nos establece que la dirección
de salida del fotón dispersado depende de la orientación inicial del espín del electrón, la cual
puede ser controlada por un simple campo magnético.
De las dos primeras ecuaciones llegamos a

sin2 θ′ = (Z2 /S)2 sin2 α − 2(Z2 /S) sin α sin θ cos ϕ + sin2 θ.

Si de la última dejamos a un lado el término de θ′ y lo elevamos al cuadrado,

cos2 θ′ = (Z1 /S + cos θ − (Z2 /S) cos α)2

sumándolos, obtenemos una ecuación con una sola incógnita, α, el ángulo de salida del fotón:

sin α sin θ cos ϕ = (Z1 /Z2 − cos α)(Z1 /S + cos θ).

Si Z1 y Z2 tienen la misma orientación con respecto al momento lineal del fotón, Z1 /Z2 = +1,
y en términos del ángulo mitad, nos da

Z1 /S + cos θ
cot(α/2) = , Z1 /Z2 = +1,
sin θ cos ϕ

pero si Z1 y Z2 tienen la orientación opuesta Z1 /Z2 = −1

Z1 /S + cos θ
tan(α/2) = − , Z1 /Z2 = −1.
sin θ cos ϕ

Como cot(z/2) = (1 + cos z)/(1 − cos z) = 1/ tan(z/2), resulta

(Z1 /S + cos θ)2 − sin2 θ cos2 ϕ


cos α = , Z1 /Z2 = 1. (6.14)
(Z1 /S + cos θ)2 + sin2 θ cos2 ϕ
6.4. EFECTO COMPTON 277

sin2 θ cos2 ϕ − (Z1 /S + cos θ)2


cos α = , Z1 /Z2 = −1. (6.15)
(Z1 /S + cos θ)2 + sin2 θ cos2 ϕ
la opuesta de la anterior. Para el ángulo ϕ′ se obtiene:
tan ϕ
tan ϕ′ = (6.16)
Z2 sin α
1−
S sin θ cos ϕ
en tanto que θ′ se saca de la última ecuación

cos θ′ = cos θ + Z1 /S − Z2 /S cos α. (6.17)


√ √
Si el módulo del espín del electrón lo tomamos como S = (1/2 + 1)/2~, Z1 /S = ±2/ 3. Si
representamos grácamente el valor del cos α, se obtienen las guras 6.13. Para saber donde

1.0 0.5

COS Α0.5 6 COS Α0.0 6


0.0 -0.5
-0.5 4 -1.0 4
0 F 0 F
1 2 1 2
Q 2 Q 2
3 0 3 0


Figura 6.13: Variación del cos α en el caso de que Z1 /Z2 = 1, Z1 /S = 2/ 3 y Z1 /Z2 = −1,
respectivamente.
el cos α alcanza sus máximos y mínimos, basta con derivar con respecto a θ y ϕ la expresión
(6.14), igualarlas a cero, lo que nos lleva al sistema de ecuaciones

sin θ cos2 ϕ(Z1 /S + cos θ)(1 + Z1 /S cos θ) = 0,sin2 θ sin 2ϕ(Z1 /S + cos θ) = 0,

de tal manera que el mínimo se alcanza para cos θ = −S/Z1 = − 3/2, θ = 5π/6, ϕ = 0, π ,
resultando cos α = −1/2. Para este valor el fotón dispersado sale en la dirección α = 2π/3,
ó 120◦ , que es la dirección de retroceso mayor que puede alcanzar un fotón. Cualquier otra
dirección de retroceso mayor implicaría que el electrón se estuviera moviendo hacia el fotón.
Para ϕ = π , la variación de cos α con θ de (6.14) es la de la gura
COS Α
1.0
0.8
0.6
0.4
0.2
8Q<
0.5 1.0 1.5 2.0 2.5 3.0
-0.2
-0.4

Si Z1 está orientado hacia atrás, entonces se alcanza esta√misma dirección máxima de salida,
pero el espín del electrón debe tener la orientación cos θ = 3/2, θ = π/6, ϕ = 0, π .
En el primer caso, si θ = 0, o aproximadamente tome ese valor, cualesquiera que sea ϕ,
resulta α = 0 y el fotón no es desviado. Lo mismo sucede en el segundo caso si θ = π . Los
electrones polarizados en la dirección del movimiento de los fotones resultan ser invisibles.
278 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

8cos Α<
1.0

0.9

0.8

0.7

0.6

Q
0.5 1.0 1.5 2.0 2.5 3.0

Figura 6.14: Si Z1 /S = 2, la variación del coseno de α con la orientación del espín nos lleva
para ϕ = π a que el fotón dispersado solamente lo sería dentro de un ángulo de valor ±60◦
con respecto a la dirección de incidencia.

8cos Α<
1.0

0.8

0.6

0.4

0.2

Φ
1 2 3 4 5 6
-0.2

-0.4

Figura 6.15: Variación de cos α con ϕ, para el valor de θ = 5π/6 en el primer caso, o bien
θ = π/6 en el segundo.
6.4. EFECTO COMPTON 279

Hemos tomado como plano ZOX el plano que contiene a los fotones inicial y dispersado, y en
este plano el ángulo de dispersión α viene determinado por la orientación del espín del electrón
(θ, ϕ). Recíprocamente, si lo que controlamos es la orientación del espín del electrón entonces el
plano de dispersión viene rotado un ángulo −ϕ, arbitrario, en el que el fotón dispersado forma
un ángulo α con la dirección inicial. O lo que es lo mismo, si en el laboratorio controlamos θ,
la orientación del fotón dispersado es (α, −ϕ) con respecto al plano que subtienden la dirección
del fotón incidente y la dirección del espín del electrón.
Si la dispersión no es con electrones libres, sino con electrones formando parte de átomos,
la interacción puede elevar a los átomos a estados excitados y el problema es diferente. Por ser
el electrón una partícula elemental, no es posible modicar el valor absoluto de su espín, que es
lo que hemos considerado en este análisis.
Experimentalmente se encuentran fotones que salen a 150◦ y más con respecto a la dirección
de incidencia, cuando según este análisis lo más atrás que podrían salir es hasta un ángulo
de 120◦ . En todo este cálculo hemos supuesto un electrón estrictamente puntual, y este hecho
experimental invalida esta parte del cálculo, lo que hace que se contemple que el electrón tenga
algún tipo de estructura. Sin embargo, si el electrón tiene estructura en la que su centro de carga
y centro de masa son puntos distintos y además, el fotón colisiona con el centro de carga del
electrón, hay que rehacer todos estos cálculos porque además de la ley de conservación anterior
hay que tener en cuenta el momento angular del electrón móvil con respecto a su centro de
carga.

6.4.2. Modelo de electrón con espín

Vamos a suponer que la interacción del fotón puntual lo es con el centro de carga del electrón
situado en el instante de la interacción en el origen del sistema de referencia, de acuerdo con
el esquema de la gura: La dirección del fotón incidente lo es a lo largo del eje OZ , el fotón

dispersado está en el plano XOZ formando un ángulo α con OZ y el espín del electrón en
reposo S posee la orientación habitual θ y ϕ. El electrón dispersado posee un momento lineal
k contenido también el el plano XOZ y que forma un ángulo β con OZ .
En la gura distinguimos la estructura del electrón en el sentido de que su centro de masa
y su centro de carga son puntos diferentes. El vector r representa la posición relativa del centro
de carga con respecto al centro de masa. Vamos a llamar ψ a la fase del movimiento del centro
280 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

de carga y R0 = S/mc, al radio de este movimiento interno que se realiza a la velocidad de la


luz.
Si el espín del electrón estuviera orientado a lo largo de OZ , el vector r vendría dado por
 
cos ψ
r 0 = R0  sin ψ  ,
0

pero como está orientado los ángulos θ y ϕ, resulta:


 
cos θ cos ϕ cos ψ − sin ϕ sin ψ
r = Rz (ϕ)Ry (θ)r 0 = R0  cos θ sin ϕ cos ψ + cos ϕ sin ψ 
− sin θ cos ψ

Antes de la colisión, el momento angular del sistema con respecto al centro de carga, es decir
con respecto al origen, vale la suma de los espines de ambas partículas, ya que el electrón se
encuentra en reposo, J 1 = Z 1 + S que por componentes se expresa:
 
S sin θ cos ϕ
J 1 =  S sin θ sin ϕ 
Z1 + S cos θ

Después de la colisión, el fotón posee un espín Z 2 y el electrón posee su espín orientado los
ángulos θ′ y ϕ′ , y además un momento lineal k. El momento angular con respecto al centro de
carga después de la colisión es
 
− sin β
J 2 = Z 2 + S ′ − r × k, k = k  0  ,
cos β

que por componentes nos queda:


 
(cos θ sin ϕ cos ψ + cos ϕ sin ψ) cos β
r × k = R0 k  sin θ cos ψ sin β − (cos θ cos ϕ cos ψ − sin ϕ sin ψ) cos β 
(cos θ sin ϕ cos ψ + cos ϕ sin ψ) sin β
   
sin α sin θ′ cos ϕ′
Z 2 = Z2  0  , S ′ = S  sin θ′ sin ϕ′  .
cos α cos θ′
De la conservación del momento lineal y de la energía seguimos manteniendo la relación entre
β y α de la sección anterior (6.13). Si el momento angular total se conserva, despejando como
antes, los ángulos primados en términos de los demás, se llega a un sistema de ecuaciones:

S′ = J 1 − Z2 + r × k

S sin θ′ cos ϕ′ = S sin θ cos ϕ − Z2 sin α + R0 k (cos θ sin ϕ cos ψ + cos ϕ sin ψ) cos β,
S sin θ′ sin ϕ′ = S sin θ sin ϕ + R0 k (sin θ cos ψ sin β − (cos θ cos ϕ cos ψ − sin ϕ sin ψ) cos β) ,
S cos θ′ = Z1 + S cos θ − Z2 cos α + R0 k (cos θ sin ϕ cos ψ + cos ϕ sin ψ) sin β.
Si denimos las magnitudes a = Z1 /S , b = Z2 /S y R = R0 k/S , las ecuaciones quedan:

sin θ′ cos ϕ′ = sin θ cos ϕ − b sin α + R (cos θ sin ϕ cos ψ + cos ϕ sin ψ) cos β
sin θ′ sin ϕ′ = sin θ sin ϕ + R (sin θ cos ψ sin β − (cos θ cos ϕ cos ψ − sin ϕ sin ψ) cos β)
cos θ′ = a + cos θ − b cos α + R (cos θ sin ϕ cos ψ + cos ϕ sin ψ) sin β.
6.5. EFECTO TÚNEL CLÁSICO 281

Aquí tenemos que sustituir el sin β y cos β en términos de A(α) y como R0 = S/mc, el
coeciente
R0 k √
R= = q 1 + A(α)2 − 2A(α) cos α,
S
con q = p/mc, con lo que los términos

R cos β = q(1 − A(α) cos α), R sin β = qA(α) sin α.

Las ecuaciones nales para obtener la orientación nal del espín del electrón son

sin θ′ cos ϕ′ = sin θ cos ϕ − b sin α + q(cos θ sin ϕ cos ψ + cos ϕ sin ψ)(1 − A(α) cos α),

sin θ′ sin ϕ′ = sin θ sin ϕ+q (A(α) sin θ cos ψ sin α − (cos θ cos ϕ cos ψ − sin ϕ sin ψ)(1 − A(α) cos α)) ,
cos θ′ = a + cos θ − b cos α + qA(α)(cos θ sin ϕ cos ψ + cos ϕ sin ψ) sin α.
Si tomamos la fase ψ = 0, en el instante en el que el fotón alcanza al centro de carga del electrón,
las anteriores ecuaciones se simplican:

sin θ′ cos ϕ′ = sin θ cos ϕ − b sin α + q cos θ sin ϕ(1 − A(α) cos α), (6.18)
′ ′
sin θ sin ϕ = sin θ sin ϕ + q (A(α) sin θ sin α − cos θ cos ϕ(1 − A(α) cos α)) , (6.19)

cos θ = a + cos θ − b cos α + qA(α) cos θ sin ϕ sin α. (6.20)

Son tres ecuaciones extra que junto con las tres (6.10) nos suministran un sistema de seis
ecuaciones para determinar α, β, p′ , k, θ′ y ϕ′ , conocida la orientación inicial del espín del electrón
θ, ϕ.
Controlando la orientación inicial del espín del electrón, es decir los valores θ y ϕ, quedaría
determinada la dirección α y energía p′ de los fotones dispersados, por lo que dispondríamos de
un sintonizador no de las frecuencias de los fotones dispersados, que emergerían en un cono de
semiángulo α alrededor del centro de dispersión, sin más que someter a la muestra de electrones
libres (por ejemplo electrones dentro de una jaula de Penning) a un campo magnético externo.

6.5. Efecto túnel clásico


Una consecuencia de la separación entre el centro de carga y el centro de masa de una
partícula con espín, es que va a poder atravesar una barrera de potencial, a pesar de que su
energía cinética sea inferior a la de la barrera. Esto no es posible para la partícula puntual sin
espín.
Consideremos una partícula no relativista con espín de tipo (anti)orbital, como la descrita
en la Sección 2.2, bajo una barrera de potencial. La Langrangiana de este sistema es:
2 2
e = m ṙ − m u̇ − eV (r)ṫ.
L (6.21)
2 ṫ 2ω 2 ṫ
Como las barreras de potencial cuadradas, usadas habitualmente en mecánica cuántica son
útiles para la resolución sencilla de algunos problemas, sin embargo, desde el punto de vista
dinámico corresponden a dispositivos que producen una fuerza innita en los bordes, lo cual
no nos permite utilizarlas para estudios dinámicos clásicos. Debemos usar barreras de potencial
que conduzcan a fuerzas nitas. Una barrera sencilla que da lugar a fuerzas nitas y constantes,
puede ser del tipo de la de la gura Fig. 6.16, donde V0 representa el valor máximo del potencial.
La fuerza externa que produce sobre la partícula F (x), es constante y dirigida hacia la
izquierda en la region x ∈ (−a, 0) y hacia la derecha en x ∈ (0, b), siendo nula fuera de estas
zonas.
282 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

Figura 6.16: Barrera de Potencial Triangular.

Figura 6.17: Haz de electrones sobre una barrera de potencial. Un electrón puntual sin
espín con Va < V0 no puede pasar de la línea de puntos. Un electrón con espín, polarizado
transversalmente, y de la misma energía, puede cruzar la barrera.
6.5. EFECTO TÚNEL CLÁSICO 283

Potenciales de este tipo se pueden construir como en el experimento que se indica en la gura
6.17, en el cual un haz de electrones, que ha sido acelerado con un potencial de aceleración Va ,
se lanza sobre la región del campo, de potencial V0 contenido entre las placas A, C y B .
En la Figura 6.17, desde un punto de vista clásico, un electrón puntual sin espín (el centro de
carga y el centro de masa son el mismo punto) se detiene en la línea de puntos y la fuerza hacia
la izquierda lo expulsa. Pero un electrón con espín de naturaleza (anti)orbital puede cruzar la
barrera, si está polarizado perpendicularmente al campo y si su energía cinética es mayor que
un cierto valor mínimo, que está por debajo del máximo del potencial. Este potencial mínimo
depende de la separación entre placas.
Supongamos una partícula polarizada con el espín hacia arriba o hacia abajo, en la dirección
OZ . El movimiento de la carga tiene lugar en el plano XOY . Sean qx , qy qz = 0, las coordenadas
del centro de masa y x, y and z = 0, las del centro de carga.
Las ecuaciones dinámicas son

d2 qx 1 d 2 qy
2
= F (x), = 0, (6.22)
dt m dt2

d2 x d2 y
+ ω 2 (x − qx ) = 0, + ω 2 (y − qy ) = 0, (6.23)
dt2 dt2
donde 
 −eV0 /a, para x ∈ (−a, 0),
F (x) = eV0 /b, para x ∈ (0, b),

0, en los demás casos.
Las ecuaciones (6.22) son no lineales y no hemos encontrado de ellas una solución analítica.
Vamos a hacer el cálculo de forma numérica. Vamos a denir diferentes variables adimensionales.
Sea R el radio del movimiento interno. Entonces denimos

q̂x = qx /R, q̂y = qy /R, x̂ = x/R, ŷ = y/R, â = a/R, b̂ = b/R.

La nueva variable temporal α = ωt es la fase del movimiento interno, siendo ω la pulsación


de este movimiento. Las ecuaciones en las nuevas variables quedan:

d2 q̂x d2 q̂y
= A(x̂), = 0,
dα2 dα2

d2 x̂ d2 ŷ
+ x̂ − q̂x = 0, + ŷ − q̂y = 0,
dα2 dα2
donde A(x̂) es

 −eV0 /âmω R , para x̂ ∈ (−â, 0),
2 2

A(x̂) = eV0 /b̂mω 2 R2 , para x̂ ∈ (0, b̂),



0, en los demás casos.
Para el electrón relativista la velocidad de la carga es c, de tal manera que ωR = c, y el
parámetro e/mc2 = 1,9569 × 10−6 V−1 , tal que para potenciales del orden de 1 voltio podemos
tomar el parámetro adimensional eV0 /mω 2 R2 = 1,9569 × 10−6 .
Si tomamos como condiciones iniciales para el centro de masa

q̂y (0) = 0, dq̂y (0)/dα = 0,

entonces el centro de masa se mueve en línea recta a lo largo del eje OX . El sistema anterior
se reduce al análisis de un sistema unidimensional, donde las únicas incógnitas son q̂x y x̂.
284 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

Denominemos a estas variables por q y x, quitando todos los sombreros de las demás variables.
Las ecuaciones a resolver quedan:

d2 q d2 x
= A(x), + x − q = 0, (6.24)
dα2 dα2
donde A(x) es

 −1,9569 × 10−6 a−1 V0 , para x ∈ (−a, 0),
A(x) = 1,9569 × 10−6 b−1 V0 , para x ∈ (0, b), (6.25)

0, en los demás casos.

La integración numérica ha sido hecha con el programa Dynamics Solver 15 , y debido a que
las ecuaciones son adimensionales, las energías quedan reescaladas tomando la máxima energía
potencial de valor 1.

Figura 6.18: Energía cinética durante el cruce para a = b = 1.

Con a = b = 1, y suponiendo que la altura de la barrera es 1, tomando la energía cinética


de la partícula K , por debajo de este valor, K = mq̇(0)2 /2eV0 = 0,41, es decir K = 0,41eV0
para cualquier otro potencial, obtenemos para el movimiento del centro de masa la gráca de la
gura. 6.18, donde se indica la variación de la energía cinética K(q), con la posición del centro
de masa, durante el cruce de la barrera. Existe siempre cruce de la barrera con una energía
cinética por encima de este valor. En la Figura 6.19, se dibuja la misma evolución pero con
una barrera de anchuras a = 1 y b = 10 y K = 0,9055. Por debajo de una energía cinética de
valores 0,4 y 0,9, en ambos ejemplos, las partículas nunca cruzan la barrera y son rechazadas
hacia atrás.
Si en ambos ejemplos la anchura a se toma entre 1 y 0.05, haciendo que la pendiente, y
por lo tanto la fuerza, sea mayor, no hay un cambio apreciable en la energía mínima de cruce.
Por eso, con la anchura a = 1 ja, vamos a calcular las energías mínimas de cruce Kc (b) para
diversos valores de la anchura de la derecha b.
Este análisis clásico para barreras triangulares produce el mismo resultado para barreras
más anchas del tipo de las de la gura 6.20 mientras las anchuras a y b sean las mismas,
cualesquiera que sea la magnitud intermedia c en la que el potencial permanece constante.
Para comparar estos resultados con el efecto túnel cuántico, vamos a cuantizar el sistema. La
función de onda de este sistema es una función compleja de cuadrado integrable, de las variables
15
J.M. Aguirregabiria, Dynamics Solver, disponible en la página web de su autor en el servidor del departa-
mento de Física Teórica de la UPV/EHU, <http://tp.lc.ehu.es/jma.html>
6.5. EFECTO TÚNEL CLÁSICO 285

Figura 6.19: Energía cinética de la partícula durante el cruce con a = 1 y b = 10.

Figura 6.20: Dos barreras de potencial cuyas energías mínimas de cruce son aproximada-
mente las mismas. Para la de la derecha, siempre que las regiones de variación del potencial
a y b sean las mismas, cualesquiera que sea el espesor intermedio c, la energía de cruce es
la misma.
286 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

cinemáticas, ψ(t, r, u). Los generadores del grupo de Galileo en esta representación son

H = i~ , P = −i~∇, K = mr − tP + i~∇u , J = r × P + Z, (6.26)
∂t
donde ∇u es el operador gradiente con respecto a las variables u. Estos generadores satisfacen
las reglas de conmutación del grupo de Galileo extendido 16 , y el operador espín está dado por
Z = −i~u × ∇u .
Uno de los operadores de Casimir del grupo de Galileo extendido es la energía interna E , que
en presencia de un campo electromagnético externo y con un acoplamiento mínimo se escribe
como la diferencia entre la energía mecánica H − eV menos la energía cinética
1
E = H − eV − (P − eA)2 , (6.27)
2m
donde V y A son los potenciales escalar y vectorial externos y donde P − eA es el momento
lineal mecánico.
En este caso no hay campo magnético, A = 0, y V es únicamente función de x. Podemos
buscar soluciones del siguiente conjunto completo de observables que conmutan: El operador de
Casimir (6.27), H , Py , Pz , Z 2 y Zz . La partícula se mueve a lo largo del eje OX , con el espín
en la dirección OZ , por lo que podemos buscar soluciones que sean funciones propias de los
operadores anteriores, en la forma:
( )
1 2
H − eV (x) − P ψ = Eψ, Hψ = Eψ, Py ψ = 0, Pz ψ = 0, (6.28)
2m
Z 2 ψ = s(s + 1)~2 ψ, Zz ψ = ±s~ψ. (6.29)
Vemos que ψ es independiente de y y de z , y su dependencia temporal es de la forma exp(−iEt/~).
Como el operador espín deriva con respecto a las variables de velocidad, podemos buscar solu-
ciones en variables separadas en la forma
ψ(t, x, u) = e−iEt/~ ϕ(x)χ(u),
y por lo tanto ( )
~2 d2
+ E − eV (x) − E ϕ(x) = 0, (6.30)
2m dx2
Z 2 χ(u) = s(s + 1)~2 χ(u), Zz χ(u) = ±s~χ(u). (6.31)
La parte espacial ϕ(x), está desacoplada de la parte del espín χ(u), y E − eV (x) − E representa
la energía cinética de la partícula. La parte espacial satisface la ecuación de Schroedinger uni-
dimensional, y la parte del espín es independiente de la interacción, por lo que la probabilidad
cuántica del efecto túnel está contenida en la parte espacial y no depende de la orientación
particular del espín.
Si la partícula se encuentra inicialmente a la izquierda de la barrera, con una energía cinética
inicial E0 = E−E , podemos entonces determinar la probabilidad de cruce para a = 1 y diferentes
valores de la anchura del potencial b.
Este problema unidimensional con el potencial triangular de la gura Fig. 6.16 está resuelto
en el libro de Landau: 17
 ikx

 e + Re−ikx , x ≤ −a,
 C Ai(D(1 − G + x ) + C Bi(D(1 − G + x ), −a ≤ x ≤ 0,
1 a 2 a
ϕ(x) = x )) + C Bi(L(1 − G − x )), 0 ≤ x ≤ b, (6.32)

 C 3 Ai(L(1 − G − 4
 b b
T eikx , x ≥ b,
16
J.M. Levy-Leblond, Galilei Group and Galilean Invariance, in E.M. Loebl, Group Theory and its applica-
tions, Acad. Press, NY (1971), vol. 2, p. 221.
17
L. Landau and E. Lifchitz, Mécanique quantique, Mir Moscow (1988), 3rd. edition.
6.5. EFECTO TÚNEL CLÁSICO 287

donde x es la misma variable adimensional que en el análisis clásico, y las constantes son
√ √ √
E 3 eV0 a2 3 eV0 b2 E
k= , D= , L= , G= . (6.33)
2mc2 2mc2 2mc2 eV0

Las funciones Ai(x) y Bi(x) son las funciones de Airy de x. Las seis constantes de integración
R, T , y Ci , i = 1, 2, 3, 4, se pueden obtener requiriendo la continuidad de las funciones y de
sus primeras derivadas en los puntos de discontinuidad de la fuerza, esto es en x = −a, x = 0
y x = b. El coeciente |R|2 representa la probabilidad de que la partícula sea reejada por la
barrera y |T |2 es la probabilidad de que se encuentre a la derecha de la barrera, esto es, que la
cruce.

Figura 6.21: Probabilidad clásica P (b) y cuántica de cruce de la barrera, para diferentes
valores del potencial V0 .

Si calculamos la amplitud T para a = 1 y diferentes valores de la anchura b, y para energías


por debajo del umbral de la barrera eV0 , vemos en la Fig. 6.21, la probabilidad media del efecto
túnel cuántico para cuatro valores diferentes del potencial V0 , de 102 , 103 , 104 y 105 Voltios.
Esta probabilidad media se ha calculado suponiendo que a la izquierda de la barrera tenemos
una distribución uniforme de partículas con energía inferior a eV0 .
La correspondiente partícula clásica con espín, o pasa o no pasa. Para hacer una comparación
probabilística, denimos la función P (b) = 1 − Kc (b), donde Kc (b) es la energía mínima de
cruce calculada anteriormente, para cada valor de b. Este valor, si la distribución de partículas
es uniforme en energía por debajo del umbral de la barrera, representa la probabilidad de que
una partícula clásica escogida al azar, esté por encima de la energía de cruce y por lo tanto
cruce la barrera.
Hemos representado también la función P (b) en la Fig. 6.21. Vemos que la probabilidad
clásica de cruce es siempre inferior a la probabilidad cuántica media, pero para potenciales
altos se aproximan, por lo que la contribución al efecto túnel proviniente del espín, empieza a
ser relevante. Podríamos justicar que la contribución cuántica es mayor que la clásica, ya que
la energía media posee una incertidumbre ∆E ligada con el tiempo de cruce ∆t, por la relación
de Heisenberg ∆E∆t ≥ ~, con lo que la imprecisión ∆E en el conocimiento de la energía hace
que esta pueda caer en la zona clásica de cruce aunque la energía media fuera inferior a Kc .
Habría más casos cuánticos de cruce con energías inferiores a Kc , mientras que desde el punto
de vista clásico no lo cruzarían.
288 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

Como el efecto túnel es una función de ~ y el espín de las partículas elementales también es
del orden de ~, es muy difícil separar en un experimento real qué parte del resultado que es de
orden ~ proviene de un efecto estrictamente cuántico o viene de la contribución del espín.
Si la partícula clásica estuviera polarizada longitudinalmente, es decir la orientación del
espín fuera en la dirección del momento lineal o en sentido contrario, nunca cruzaría la barrera
con energías inferiores al máximo eV0 . Vemos que la orientación sí inuye en el caso clásico pero
no en el cuántico, ya que de (6.30) y (6.31) se ve que la probabilidad de cruce es independiente
del espín.
De hecho sí existe una inuencia que no ha sido considerada en el análisis cuántico. Por
tener la partícula separados el centro de masa del centro de carga, posee un momento dipolar
eléctrico d = ek, y por lo tanto una energía de interacción de este dipolo de valor −d · E . Si la
partícula está polarizada longitudinalmente, d y E son ortogonales y esta contribución es nula.
Si, como en el caso clásico analizado, la polarización es transversal al movimiento, el anterior
producto escalar produce una energía de interacción de valor −eER cos ωt, donde E es el campo
eléctrico uniforme de cada zona y R es el radio del movimiento interno o zitterbewegung. En la
parte de la ecuación cuántica hay que reemplazar

H − eV0 ⇒ H − eV0 + eER cos ωt

y resolver la correspondiente función de onda. Este término es del orden de la separación R


entre el centro de masa y el centro de carga, y por lo tanto de orden ~. Aunque este término
puede ser pequeño, debido a que es oscilante y de valor temporal medio nulo, puede ser relevante
en casos en los que los gradientes del campo sean grandes. Veremos en la sección siguiente una
aplicación de este efecto túnel, en la que la polarización sí es importante.

6.5.1. Efecto túnel de polarización del espín

Vamos a ver que la estructura que hemos encontrado del electrón, nos permite hacer una
interpretación de la denominada magnetoresistencia gigante de películas policristalinas 18 . Esto
se conoce en la literatura como el Efecto túnel de polarización del espín 19 .
La cuestión de que si el efecto túnel es un efecto puramente cuántico o puede ser clásico, es
un tema carente de sentido. Hemos visto que existe un efecto túnel clásico, pero para partículas
con espín, en las que sus centros de masa y de carga sean puntos diferentes. De todas formas,
la materia elemental debe ser interpretada bajo las reglas de la mecánica cuántica, ya que es el
cálculo cuántico el que produce un mejor acuerdo con las medidas experimentales.
La conducción eléctrica en materiales sinterizados es completamente diferente de la conduc-
ción en conductores ordinarios. Un material sinterizado no es un medio continuo. Está formado
por pequeños granos que permanecen unidos al ser sometidos a compresión. La conducción
eléctrica es pues, el salto de electrones de grano en grano, en un proceso túnel a través de un
potencial efectivo en la región fronteriza entre los granos. Estos materiales presentan por lo
tanto una alta resistividad, cuando se les compara con los conductores normales.
La forma del potencial en el intersticio es desconocida, pero podemos aproximarla mediante
un potencial de tipo triangular como los de la sección anterior. Cuando un electrón se aleja de
un grano, éste queda positivamente cargado y atrae al electrón. Cuando éste se ha alejado y
queda más próximo al otro grano, induce un dipolo que lo atrae. En ambos casos no sabemos
cómo son estas fuerzas, pero la aproximación anterior de suponerlas constantes justica un
potencial triangular en el intersticio. De todas formas, lo que hemos visto es que para cada
18
Premio Nobel de Física 2007 a Albert Fert y Peter Grünberg por el descubrimiento en 1988 de la Magneto-
resistencia Gigante.
19
V.N. Dobrovolsky, D.I. Sheka and B.V. Chernyachuk, Surface Science 397, 333 (1998); P. Raychaudhuri,
T.K. Nath, A.K. Nigam and R. Pintor, cond-mat/9805258, preprint.
6.6. FORMACIÓN DE PARES DE ELECTRONES LIGADOS 289

barrera de potencial existe un mínimo de energía, por debajo del máximo del potencial, tal que
electrones polarizados transversalmente por encima de esa energía la cruzan, incluso desde el
punto de vista clásico. Este efecto no es predicho por la mecánica cuántica 'ordinaria`, ya que
la probabilidad de cruce por efecto túnel es independiente del espín.
Si tenemos un hilo de este material sometido a un potencial eléctrico, cuando introducimos un
campo magnético externo transversal a la dirección de la corriente, los electrones de conducción
se polarizan de forma transversal al campo eléctrico, y si el nivel de Fermi de estos electrones
está por encima de la energía mínima de cruce, todos aquellos electrones por encima de esta
energía la cruzarán, incluso clásicamente, como si fuera un verdadero conductor. La resistencia
del material ha sido alterada por la presencia de un campo magnético externo transversal.
Podemos diseñar dispositivos electrónicos en los que el control de las corrientes no se efectúa
con campos eléctricos sino controlando la orientación del espín. Un dispositivo de este tipo se
dice que pertenece a la nueva de técnica de la espintrónica, pues se utiliza el control del espín
para producir efectos electrónicos.
Se podría argumentar que la presencia del campo magnético externo que polariza a los
electrones, pudiera modicar la probabilidad de cruce. Incluso con un campo externo del orden
de 1 Tesla, y en una barrera potencial de 1 Voltio, el término de interacción magnética −µ · B
contribuye con una energía del orden de ±5,7 × 10−5 eV, la cual no modica la probabilidad
cuántica de cruce.

6.6. Formación de pares de electrones ligados


Hemos visto en la sección 2.6.2, que las ecuaciones que describen la dinámica del electrón
relativista con espín, son un sistema de ecuaciones diferenciales de cuarto orden para el centro
de carga r , que se puede descomponer en un sistema de ecuaciones de segundo orden acopladas,
para el centro de masa q y el centro de carga r . Son de la forma de (2.196):
1 − q̇ · ṙ
q̈ = 0, r̈ = (q − r),
(q − r)2
donde el punto representa la derivada temporal. La primera representa el movimiento libre
del centro de masa, y la segunda, una especie de movimiento armónico relativista del punto r
alrededor del punto q , manteniéndose constante para todo observador el valor absoluto de la
velocidad u = c.
Es precisamente el factor (1 − q̇ · ṙ)/(q − r)2 el que previene de que si tomamos una solución
con un valor de contorno tal que ṙ(0) = 1, la solución no modica el valor absoluto de la
velocidad de la carga. Si no imponemos esta condición inicial, el valor absoluto de la velocidad
de cualquier otra solución no tiene por qué conservarse. En el caso de interacción entre dos
partículas, tendríamos un sistema de ecuaciones del tipo anterior, donde r a y q a , a = 1, 2,
serían las posiciones de cada una de ellas. Las segundas ecuaciones no se modican, es decir
el movimiento interno de cada partícula elemental no es alterado por ninguna interacción. La
primera ecuación queda reemplazada por dpa /dt = F a donde pa es el momento lineal de la
partícula a que se expresa como es habitual, en términos de la velocidad de su centro de masa,
pa = γ(q̇ a )mq̇ a , γ(q̇ a ) = (1 − q̇ 2a )−1/2 ,
y la fuerza F a la podemos calcular por una Lagrangiana de interacción del tipo (4.78)
( )
∂LI d ∂LI
Fa = −
∂r a dt ∂ua
Para la partícula 1 toma la forma:
( )
r1 − r2 √ d gu2
F 1 = −g 1 − u1 · u2 + √ , (6.34)
|r 1 − r 2 |3 dt 2|r 1 − r 2 | 1 − u1 · u2
290 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

donde g = ±α~c.
Explícitamente se escribe:
√ ( )
g 1 − u1 · u2 u2 (r 1 − r 2 ) · (u1 − u2 )
F1 = − (r 1 − r 2 ) + +
[(r 1 − r 2 )2 ]3/2 2 1 − u1 · u2
( )
g a1 · u2 + u1 · a2 a2
+ u2 +√ .
2[(r 1 − r 2 )2 ]1/2 (1 − u1 · u2 )3/2 1 − u1 · u2
Contiene términos de velocidad que van como 1/r2 y términos de aceleración que van como
1/r en términos de la distancia instantánea entre cargas r = |r 1 − r 2 |. En esta notación, en la
descripción síncrona, ua = ṙ a .
La fuerza sobre la partícula 2 se obtiene sin más que reemplazar 1 ←→ 2 en esta expresión.
El sistema de ecuaciones se puede hacer en términos de variables adimensionales. En efecto si
hacemos u = ce
u v = ce e, q = R0 q
v , r = R0 r e y e
t = ω0 t, la ecuación

d2 r e
d2 r ė · u
c2 1 − q ė
= ω 2
R0 = (e e)
q−r
de
0
dt2 t2 q−r
R0 (e e)2
y como ω0 R0 = c, los coecientes de escala se cancelan y esta ecuación queda en términos de
variables adimensionales. Lo mismo sucede a la

dγ(v)v dγ(v)ev α~c r e2 √


e1 − r
m = mcω0 =− 2 e1 · u
1−u e2 + · · ·
dt dt̃ R0 |e e 2 |3
r1 − r
y el coeciente adimensional

α~c ~
= 2α, pues ω0 R0 = c, R0 = .
mcω0 R02 2mc

El sistema de ecuaciones a resolver es



q̈ a = (F a − q̇ a (F a · q̇ a )) (6.35)
γ(q̇ a )
1 − q̇ a · ṙ a
r̈ a = (q − r a ), a = 1, 2 (6.36)
(q a − r a )2 a
donde α es la constante de estructura na y todas las variables reescaladas son adimensionales.
Para ello el factor de escala espacial es R0 = ~/2mc y el temporal es T0 = ~/2mc2 . Todos los
términos que dependen de la aceleración de las cargas de la ecuación (6.35), han sido reempla-
zados por las expresiones de (6.36). En la expresión de las fuerzas F a se debe reemplazar la
expresión anterior pero sin la constante de acoplamiento g , que después del reescalamiento ha
quedado reducida a 2α. Si las cargas de las partículas fueran de signo contrario, la ecuación
(6.35) vendría afectada por un signo −.
Si, además de la interacción entre las partículas, existiera un campo electromagnético ex-
terno, la ecuación (6.35) se modicaría en la forma, también en variables adimensionales,
e~
q̈ a = · · · + (F − q̇ a (F · q̇ a )) , F = E + ṙ a × cB,
2m2 c3
donde los campos E y cB se expresarán en V/m.
Sería deseable, para hacer un análisis teórico, el encontrar soluciones analíticas de (6.35-6.36).
Nos conformaremos con hacer un cálculo numérico. Vamos a usar el programa de integración
numérica Dynamics Solver, el cual permite preparar cheros para automatizar el proceso de
cálculo, variando a voluntad las condiciones de contorno.
En la gura 6.22 se representa la dispersión de dos partículas de la misma carga, con sus
espines paralelos. El movimiento de sus centros de masa se indica con una echa. Si las partículas
no se aproximan mucho, estas trayectorias se corresponden básicamente con las trayectorias de
6.6. FORMACIÓN DE PARES DE ELECTRONES LIGADOS 291

Figura 6.22: Trayectorias de los centros de masa y carga de dos partículas con espín con
velocidad inicial de sus centros de masa q̇a = 0,1 y un parámetro de impacto pequeño.

dos partículas sin espín, interaccionado a través de una fuerza Coulombiana. Cuando decimos
que no se aproximan mucho queremos decir que su separación relativa es siempre mucho más
grande que la longitud de onda Compton.
Esto se puede entender porque si las partículas están lejos una de otra, el comportamiento
Coulombiano de la Lagrangiana lo justica. Al calcular la interacción entre las correspondientes
cargas, como la frecuencia del movimiento interno es muy alta, la posición media de cada carga
es el correspondiente centro de masa. Sin embargo, en altas energías, las dos partículas se pueden
aproximar por debajo de la longitud de onda Compton, y por lo tanto ese análisis promedio
no funciona. Es necesario conocer las posiciones exactas de las cargas y sus velocidades para
determinar las fuerzas sobre cada una de ellas.
Aquí, nuevos fenómenos físicos aparecen, cuando se compara con partículas sin espín. El
fenómeno de la dispersión frontal, es decir que prácticamente ambas partículas siguen sus tra-
yectorias iniciales sin desviarse, como la calculada en la gura 6.23, no se puede describir en
el caso de partículas sin espín. La interacción Coulombiana hace que dos electrones en colisión
frontal se desvíen siempre. Sin embargo, la experiencia demuestra que la dispersión frontal es
el fenómeno más probable en la colisión de haces de partículas.
Otro fenómeno que no aparece en partículas sin espín, es la formación de pares, es decir
de estados ligados estables de partículas de la misma carga. En la gura 6.24, representamos
la posición inicial de dos partículas de la misma carga con sus espines paralelos y tal que sus
correspondientes centros de masa se encuentran a una distancia inferior a la longitud de onda
Compton, esto es, inferior al diámetro de su movimiento interno. Hemos escrito los símbolos de
las cargas ea en el correspondiente centro de carga r a y las correspondientes letras ma en los
respectivos centros de masa q a . En la parte (a) dibujamos la situación cuando ambas partículas
poseen la misma fase inicial β1 = β2 , de sus movimientos internos. Las fuerzas F a , sobre cada
partícula a = 1, 2, se calculan en términos de las posiciones, velocidades y aceleraciones de las dos
cargas, de acuerdo con (6.34), y dibujamos también esas mismas fuerzas en los correspondientes
centros de masa, para poder plantear las ecuaciones (6.35). Vemos que una fuerza repulsiva entre
las cargas produce también una fuerza repulsiva entre los correspondientes centros de masa. Sin
embargo, si las fases iniciales de sus movimientos internos, fuesen opuestas, β1 = −β2 , como
en la parte (b) de la gura, una fuerza repulsiva entre cargas, calculada igual que en el caso
anterior, produce una fuerza atractiva entre los centros de masa. Si la separación entre los
292 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

Figura 6.23: Dispersión frontal de dos partículas con espín, de la misma carga, y con una
separación inicial 2qa (0) = 10, velocidad de sus centros de masa |q̇a (0)| = 0,18 y un parámetro
de impacto pequeño. Los dos centros de masa pasan uno junto al otro, sin apenas desviarse.

centros de masa fuera superior a la longitud de onda Compton, la fuerza entre centros de masa
sería siempre repulsiva, independientemente de las fases relativas de los movimientos internos.
En la gura 6.25 vemos otra situación de fases opuestas pero donde la separación entre los
centros de masa es mayor aunque sigue siendo inferior a la longitud de onda Compton.

Figura 6.24: Posiciones iniciales de dos partículas de Dirac con sus espines paralelos y con
una separación entre sus centros de masa inferior a la longitud de onda Compton. Las líneas
de puntos representan las trayectorias previsibles de cada carga, si la partícula estuviera
libre. Ambos movimientos tienen el mismo sentido como corresponde a partículas con sus
espines paralelos. En (a) ambas partículas poseen la misma fase inicial y la fuerza repulsiva
entre cargas, produce una fuerza repulsiva entre sus centros de masa, mientras que en (b),
con fases opuestas, la fuerza entre sus centros de masa resulta ser atractiva.

Para analizar esta situación en la que se van a producir movimientos ligados de pares de
partículas de la misma carga, vamos a proceder de la siguiente forma: Comenzamos la integración
numérica imponiendo la condición de que ambos centros de masa se encuentran en reposo y
localizados en el origen del sistema de referencia, es decir q a (0) = q̇ a (0) = 0. Para la partícula
2 tomamos como fase inicial β2 (0) = 0 y para la partícula 1, empezamos con β1 (0) = 0, y la
6.6. FORMACIÓN DE PARES DE ELECTRONES LIGADOS 293

Figura 6.25: (a) Posición inicial de dos partículas con fases opuestas, que produce una
fuerza atractiva entre sus centros de masa, que están separados menos que la longitud
de onda Compton. En la parte (b), después de medio ciclo de las cargas, la fuerza entre
los centros de masa resulta ser repulsiva, pero su intensidad es menor que en la situación
anterior por estar las cargas más alejadas, por lo que el movimiento resultante es también
un movimiento de pares ligados.

vamos incrementando de grado en grado en cada proceso de integración, hasta alcanzar el valor
nal de 2π radianes. Los valores de contorno de las variables r a (0) y ṙ a (0), con la ligadura
|ṙa (0)| = 1, se escogen de tal manera que sean compatibles con estas fases. El sistema total es
analizado en su centro de masa, de tal manera que q 1 (0) = −q 2 (0) y q̇ 1 (0) = −q̇ 2 (0). El proceso
de integración se automatiza de tal forma que cuando los centros de masa de las partículas se
separan por encima de la longitud de onda Compton, la integración se interrumpe y comienza
de nuevo con un nuevo valor de la fase β1 (0) de un grado más, y los correspondientes valores
nuevos de las variables r a (0) y ṙ a (0).
Si las partículas no se separan durante un tiempo de integración correspondiente a 106 vuel-
tas de las cargas alrededor del correspondiente centro de masa, se vuelve a parar el proceso,
se guardan los valores iniciales de las variables que dan lugar a este movimiento ligado y se
comienza de nuevo con nuevos valores de contorno. Este tiempo ligado corresponde, en el caso
de electrones, a un estado ligado de duración superior a 10−15 segundos. Para algunos valores
particulares de las variables, con fases opuestas, hemos dejado el programa de integración fun-
cionando durante una semana, y el estado ligado se mantiene. Esto representa una vida superior
a 10−9 segundos. Si dejásemos el programa funcionando durante un año, esto incrementaría el
tiempo de vida solamente en dos órdenes de magnitud. La sensación general es que los estados
ligados son sucientemente estables, ya que ni siquiera los posibles errores numéricos en la inte-
gración destruyen la ligadura entre las partículas, ni la estabilidad del movimiento. El proceso
se ha repetido de nuevo, cambiando ligeramente las condiciones iniciales de las variables del
centro de masa q a (0) y q̇ a (0), en pasos de valor 0,0001 en estas variables adimensionales, y
con β2 (0) = 0, y el mismo proceder con la fase β1 (0), como el comentado anteriormente. Para
vericar la abilidad del método, cada 103 pasos de integración, se mide el que las velocidades
de las cargas sigan siendo de valor absoluto 1, dentro de un error numérico menor que 10−20 .
Se ha realizado el proceso tomando como fase inicial β2 (0) cualquier otro valor arbitrario.
Se trataba de poner de maniesto si había diferencias en función de las diferencias de fases
iniciales β2 (0) − β1 (0), y de las posiciones y velocidades de los centros de masa q a (0) y q̇ a (0).
Después de recolectar todos los datos que conducen a movimientos ligados, hemos encontrado
los siguientes resultados:
1. La velocidad inicial de los centros de masa debe ser |q̇a (0)| < 0,01c. En caso contrario,
el movimiento entre las dos partículas no es estable y al cabo de unas pocas vueltas se
separan.

2. Para cada velocidad |q̇a (0)| < 0,01c existe un rango ∆ de la fase β1 (0) = β2 (0) + π ± ∆
para el cual el movimiento es estable. Cuanto mayor sea la velocidad de los centros de
294 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

masa, más estrecho es este margen, de tal manera que los movimientos más estables se
producen con las fases prácticamente opuestas.

3. Se han encontrado movimientos ligados para una separación inicial entre los centros de
masa, hasta 0,8 veces la longitud de onda Compton, como la que se representa en la gura
6.25, siempre que las fases y velocidades se encuentren dentro de los rangos mencionados
anteriormente.

En la gura 6.26, mostramos el cálculo del movimiento ligado de las dos partículas con
una separación inicial de sus centros de masa de q1x = −q2x = 0,2×(long. de onda Compton),
q̇1x = −q̇2x = 0,008 y q̇1y = −q̇2y = 0,001, β2 = 0 y β1 = π . La fuerza entre cargas es repulsiva
pero sin embargo, si las fases internas β1 y β2 son opuestas, produce una fuerza atractiva entre
los centros de masa de acuerdo con el mecanismo mostrado en la gura 6.24 (b).
Esta posibilidad de formación de pares ligados, metaestables, de baja energía, de partículas
de la misma carga, no es exclusivo de la Lagrangiana de interacción utilizada. Si usamos una
interacción electromagnética o bien una interacción Coulombiana instantánea entre las cargas de
dos partículas de Dirac, hemos encontrado también este comportamiento en 20 . Este movimiento
ligado no lo destruyen campos eléctricos externos ni tampoco campos magnéticos externos de
la misma dirección que los espines. Sin embargo, un campo magnético transversal al espín,
destruye el movimiento ligado.

Figura 6.26: Movimiento ligado de los centros de masa y centros de carga de dos partículas
con espín, de espines paralelos y con una velocidad de sus centros de masa v ≃ 0,0082. La
separación inicial entre sus centros de masa es de 0,2×(long. de onda Compton).

Cuando calculamos el valor medio de la posición r a , resulta ser el valor del centro de masa
q a , y de esta forma, la fuerza repulsiva entre cargas resulta también una fuerza repulsiva entre
los correspondientes centros de masa, por lo que suprimir el contenido de la parte del espín
asociada al zitterbewegung, elimina la posibilidad de formación de pares ligados.
A pesar de que este resultado nos muestra un mecanismo clásico que justica la formación
de un sistema ligado de espín 1, y por lo tanto un bosón a partir de dos fermiones cargados
iguales, hemos de tener cuidado con el tipo de conclusiones que podemos sacar. En primer
lugar es un análisis clásico, y aunque el rango de energías en las que el fenómeno es estable es
bastante grande, esto no signica que dos electrones puedan quedar ligados hasta esa energía
20
M. Rivas J. Phys. A: Math. Gen. 36 4703 (2003), (Preprint physics/0112005)
6.7. EFECTO HALL 295

de ligadura. De ser así, vamos a estimar desde un punto de vista térmico, a qué temperatura
máxima corresponde la posibilidad de formación de estados ligados. En efecto, si consideramos
desde el punto de vista clásico que el electrón es un sistema de 7 grados de libertad, 3 representan
la posición r , otros 3 la orientación α y nalmente una fase interna β . Si aceptamos el teorema
de equipartición de la energía, entonces para ese máximo de energía cinética que produce el
estado ligado mv 2 /2 = 7κT /2, siendo κ la constante de Boltzmann y v = 0,01c la velocidad
máxima de cada partícula, entonces un gas de electrones polarizados (como los electrones de
conducción en un efecto Hall cuántico, como veremos) pueden formar estados ligados hasta una
temperatura por debajo de T = 8,47 × 105 K, que es en efecto una temperatura muy alta.
En segundo lugar, la materia a este nivel se comporta de acuerdo con los postulados de la
mecánica cuántica y, por lo tanto, debemos resolver dentro del marco cuántico, el correspondien-
te estado ligado y establecer para qué energías es posible. En particular, el movimiento relativo
entre electrones tiene que tener el momento angular orbital cuantizado. Este problema no ha
sido resuelto todavía, pero la existencia de una posibilidad clásica de formación de pares y un
rango de energía tan alto, justica el que se realice un esfuerzo en esa dirección. Un electrón
y un protón pueden formar estados ligados dentro de un margen continuo y muy amplio de
energías. Es solamente la teoría cuántica la que da la respuesta correcta para qué energías los
estados ligados son estacionarios.
Si las fases de las dos partículas fuesen las mismas(o casi las mismas) no hay posibilidad, ni
siquiera clásica, de formación de estados ligados. Como los dos fermiones que forman el estado
ligado poseen el mismo espín y la misma energía, ¾no será que el exigir que sus fases sean
contrarias, es una forma clásica de superar el principio de exclusión de Pauli y justicar la
existencia de estos estados ligados?

6.6.1. El Positronium

Si las dos partículas son de cargas opuestas, la fuerza entre ellas es de atracción, y si sus
espines tuvieran la orientación opuesta, el movimiento de los centros de cargas de ambas serían
los mismos que los que hemos analizado aquí. Un ejemplo de este tipo de interacción, en el
que las dos partículas son de la misma masa y carga opuesta, es el Positronium, o sistema
formado por un electrón y un positrón. Es un sistema que posee estados estacionarios aunque la
probabilidad de que la partícula y la antipartícula colisionen es grande y por lo tanto se aniquilen
ambas. El estado fundamental es un estado de espín cero y momento magnético cero, lo cual
refuerza la predicción de la teoría cinemática que estamos desarrollando de que el espín y el
momento magnético de la partícula y la antipartícula deben tener la misma orientación relativa.
Tiene una vida media de 1.24×10−10 s y el sistema se desintegra en dos fotones con espines y
momento lineal opuestos y de energía la del electrón en reposo. Otro estado estacionario con una
vida media mayor 1.4×10−7 s corresponde al estado de espín 1, que corresponde a la transición
hiperna en la que una de las dos partículas invierte su espín. Se aniquilan emitiendo 3 fotones.
Desde el punto de vista clásico los estados estacionarios admiten la misma descripción apro-
ximada que el átomo de Bohr, con la cuantización del momento angular orbital.

6.7. Efecto Hall

Este efecto fue descubierto por Edwin Hall en 1879. Se trata de la inuencia de un campo
magnético sobre una corriente en un conductor, que produce una diferencia de potencial trans-
versal a la dirección en que circula la corriente. Si en un conductor producimos una corriente
continua e introducimos un campo magnético perpendicular a la corriente, entonces los electro-
nes que se desplazan, al interaccionar con el campo magnético se pondrán a girar, lo que dará
lugar a una acumulación de carga eléctrica en los laterales del conductor, negativa donde se
296 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

acumulan los electrones y positiva en el lado opuesto por disminución de éstos, con lo que se
establece una diferencia de potencial transversal.
Supongamos un conductor plano sobre el que actua un campo magnético en la dirección
OZ . El movimiento de los electrones puntuales, de carga −e, desplazándose con velocidad v en
un campo magnético viene dado por
dv
m = −ev × B.
dt
Si el movimiento tiene lugar en el plano XOY , v = (ẋ, ẏ, 0) y B = (0, 0, B) por lo que estas
ecuaciones se reducen a dos
mẍ = −eB ẏ, mÿ = eB ẋ,
cuya solución general es

x(t) = X − R sin(ωB t + ϕ), y(t) = Y − R cos(ωB t + ϕ).

Son círculos centrados en el punto (X, Y ) y con una fase ϕ y un radio R, arbitrarios. Estos cuatro
parámetros son las cuatro constantes de integración. Sin embargo la pulsación ωB = eB/m,
denominada frecuencia ciclotrónica, es ja. Los electrones se mueven en círculos de diversos
radios pero con la misma velocidad angular ωB .
El movimiento de los electrones sin espín en un conductor Óhmico bajo la inuencia de un
campo electromagnético externo puede venir descrito por el modelo de Drude,
d(γ(v)v) 1
m = −eE − ev × B − mv,
dt τ
donde el último término contiene una fuerza de frenado, opuesta a la velocidad, dependiente
de un parámetro con dimensiones de tiempo τ , denominado tiempo de dispersión, que puede
ser interpretado como el tiempo medio entre colisiones. Si este tiempo es largo representa que
hay poca resistencia al movimiento. Depende de la estructura interna del medio conductor y
del carácter fermiónico de los portadores de carga.
Las soluciones estacionarias son las que v no depende del tiempo,
eτ eτ
v+ v × B = − E.
m m
Si j = −nev es el vector densidad de corriente, donde n representa la densidad de electrones
de conducción del material, la anterior expresión nos establece una relación lineal entre j y E ,
que en el caso de un conductor plano se reduce a
m B m B
2
jx + jy = Ex , 2
jy − jx = Ey ,
ne τ ne ne τ ne
que escrita en forma matricial
( )
ρxx ρxy
j = E, ρik jk = Ei , ji = σik Ek ,
−ρxy ρyy

es la Ley de Ohm, donde ρik es el tensor de resistividad y su inverso σ = ρ−1 , el tensor de


conductividad. En ausencia de campo magnético el tensor de resistividad ρ es diagonal, cuya
componente esencial es la resistividad Óhmica del conductor ρ0 .
( )
ρxx ρxy m B
ρ= , ρxx = ρyy ≡ ρ0 = 2 , ρxy = .
−ρxy ρyy ne τ ne
Si en la situación estacionaria la corriente uye a lo largo de OX , jy = 0, y aunque hemos
establecido una diferencia de potencial entre los extremos del conductor debe existir un campo
6.7. EFECTO HALL 297

eléctrico transversal Ey , que se produce por acumulación de cargas en los laterales del conductor
y que impide que la densidad de corriente tenga una componente en la dirección transversal.
m B
Ex = ρxx jx , Ey = −ρxy jx , ρxx =
2
, ρxy = .
ne τ ne
La ρxx = ρ0 depende de la estructura microscópica, de la temperatura, a través del parámetro
τ , mientras que ρxy es una función lineal del campo magnético externo.

6.7.1. Efecto Hall cuántico


Si representamos las resistividades ρxx y ρxy en la situación estacionaria como función del
campo magnético externo obtenemos las grácas de la gura 6.27. Este análisis ha sido hecho
considerando que el electrón es una partícula puntual. El espín del electrón no ha jugado ningún
papel en este análisis.

Figura 6.27: Variación de la resistividad con el campo magnético externo en el efecto Hall
clásico, para campos magnéticos pequeños, inferiores a 1 Tesla.
Sin embargo, para campos magnéticos grandes la anterior gura tiene la forma que se des-
cribe en 6.28 y que fue determinada experimentalmente por Von Klitzing, Dorda y Pepper21

La ρxy varía linealmente en promedio con B pero efectúa saltos bruscos durante los cuales
permanece constante. La ρxx comienza en su valor constante ρ0 , pero en seguida se pone a oscilar.
En estos tramos en los que ρxy es constante, la ρxx , de color verde, se anula, experimentando
un pico cuando la ρxy deja de ser constante y experimenta una subida. Los tramos horizontales
cumplen la condición
h 1
ρxy = 2 , ν = 1, 2, 3, . . . (6.37)
e ν
Como la constante de estructura na α = e2 /2ϵ0 hc, supuesta conocida la velocidad c y la
permitividad del vacío ϵ0 , la medida precisa de ρxy en los tramos constantes, es una medida
precisa de esta constante universal.
Además, el campo magnético promedio en el que se producen esos tramos constantes vale
nh n
Bν = = Φ0 ,
νe ν
21
K. v. Klitzing, G. Dorda and M. Pepper, New method for high accuracy determination of the ne structure
constant based on quantized Hall resistance, Phys. Rev. Lett. 45, 494 (1980)
298 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

Figura 6.28: Variación de la resistividad con el campo magnético, ρxx (verde), ρxy (rojo),
en el efecto Hall cuántico entero.

donde Φ0 se conoce como el cuanto de ujo y a la cantidad h/e2 como cuanto de resistividad.
Esto se conoce en la literatura como efecto Hall cuántico entero, para distinguirlo del efecto
Hall cuántico fraccionario donde en la resistividad (6.37) el parámetro ν en vez de ser un
entero es un número fraccionario, como se puso de maniesto para campos más altos22 y que se
representa en la gura 6.29.

Figura 6.29: Variación de la resistividad con el campo magnético externo en el efecto Hall
cuántico fraccionario para campos altos.
El efecto Hall se analiza para distribuciones planas de electrones connadas entre capas
de diferentes materiales. El primer efecto entero se descubrió en un MOSFET (Metal-Oxide-
Semiconductor-Field-Eect-Transistor). Es un sandwhich de un transistor de tres capas (metal-
aislante-semiconductor) con los electrones atrapados en una capa de 30Å de espesor entre el
aislante y el semiconductor. El efecto fraccionario se descubrió en una estructura GaAs-GaAlAs
de arseniuro de Galio. En ambos casos las densidades superciales de electrones son del orden
de n ≈ 1011 − 1012 cm−2 . La temperatura de las muestras es de 4 K para el efecto entero y 2 K
para el fraccionario. Más recientemente, se ha detectado el efecto Hall cuántico fraccionario en
el grafeno 23 a temperaturas de 20 K.
El potencial Hall transversal discreto se mantiene constante para campos magnéticos en un
rango nito durante los cuales la resistividad longitudinal cae a cero. La corriente uye de forma
longitudinal sin resistencia pues ρxx = 0. Como hemos visto, electrones con los espines paralelos
22
D.C. Tsui, H.L. Stormer and A.C. Gossard, Two-dimensional magnetotransport in the extreme quantum limit,
Phys. Rev. Lett. 48, 1559 (1982)
X. Du, et al. Nature 462 192 (2009).
23
6.8. ENFRIAMIENTO DE UN GAS POR LÁSER 299

pueden formar estados ligados metaestables de espín 1, que se comportan como bosones y la
corriente a ellos asociada está en su fase superconductora. Esto querría decir que para esos
rangos de campos magnéticos se está produciendo una polarización importante y efectiva de
los espines de los electrones de conducción en la dirección del campo magnético externo, con
la consiguiente formación de pares, algunos de los cuales serían desplazados hacia los bordes
del conductor, produciendo un salto brusco de la tensión Hall lateral. El resto de los electrones
apareados se movería longitudinalmente sin resistencia, y estarían en la fase superconductora.
Puede interpretarse que cuando por efecto del campo magnético se han polarizado un conjunto
de electrones y se forman pares ligados, si aumentamos el campo magnético estos pares no se
deshacen y no se incrementa el número de pares ligados hasta que llegamos a un nuevo campo que
hace que bruscamente aumente la polarización incrementando el número de electrones ligados.
Cuando se forman pares de electrones ligados, un campo eléctrico no deshace el par y ambas
partículas se mueven como un objeto de espín 1 y carga 2e. Si utilizamos la punta de prueba de
un microscopio de efecto túnel aplicado a la supercie plana del conductor, se podría intentar
extraer portadores del conductor y vericar si son electrones aislados o bien pares ligados. Lo
mismo si aplicásemos la punta de extracción al lateral negativo del conductor, para comprobar si
las cargas depositadas son simples electrones sueltos o electrones apareados. Estos experimentos,
según nuestro entender, no se han realizado.

6.7.2. Efecto Hall de espín

El efecto Hall de espín es el fenómeno de la aparición de una acumulación de electrones con


espines opuestos en las dos supercies laterales de un conductor cuando conduce una corriente.
En este caso no es necesaria la presencia de un campo magnético externo. Fue descubierto por
Mikhail I. Dyakonov y Vladimir I. Perel en 1971 24 . Es un fenómeno de transporte en el que
los electrones de conducción cuyo espín tiene la misma orientación, se desplazan lateralmente
hacia un costado del conductor, mientras que los electrones que tienen una orientación opuesta,
lo hacen hacia el otro lado. Aquí no existe una acumulación de carga eléctrica en los bordes
sino de momento angular de sentidos opuestos. En presencia de un campo magnético externo,
los electrones tendrían mayormente la misma polarización y por lo tanto existiría acumulación
de los mismos solamente en uno de los laterales, y por lo tanto una acumulación excedente de
carga eléctrica positiva en el otro lado, como lo conrma el propio efecto Hall. Sin embargo, la
justicación del efecto Hall no se basa en la existencia del espín.
Podría estar relacionado con una fuerza magnética opuesta del campo magnético promedio
producido por la corriente, sobre las dos posibles orientaciones del momento magnético de los
electrones de conducción, F = −∇(µ · B). Electrones en la misma zona, con sus momentos
magnéticos opuestos experimentarían fuerzas de sentidos opuestos.
En algunos semiconductores bidimensionales en los que se verica un efecto Hall cuántico
entero, con campos magnéticos no muy intensos, se observa también un efecto de acumulación
de espín en los laterales del semiconductor.

6.8. Enfriamiento de un gas por láser

Vamos a describir algo que a primera vista puede parecer paradógico. Enfriar un sistema
de átomos suministrando energía. El resultado es que el conjunto de átomos, al nal, pierde
energía.
Cuando un objeto con momento magnético se orienta en un campo magnético externo,
hay dos orientaciones estacionarias posibles: una que el momento magnético se oriente en la
24
M. I. Dyakonov and V. I. Perel, Possibility of orientating electron spins with current. Sov. Phys. JETP Lett.
13, 467 (1971)
300 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

dirección del campo magnético y otra en que la orientación es opuesta al campo. La primera es
una situación estacionaria de equilibrio estable y la segunda es inestable. Cualquier perturbación
la altera y el objeto invierte su momento magnético y pasa a la situación de equilibrio estable,
que es un estado de energía potencial menor y por lo tanto liberando energía en esa transición.
Para volver a obtener esta segunda situación estacionaria de equilibrio habría que suministrar
energía al objeto.
Para entender estos dos estados estacionarios sirva el ejemplo de un lápiz sobre una me-
sa. Solamente hay dos situaciones estacionarias de equilibrio posibles: Una que el lápiz esté
horizontal sobre la mesa y otra que esté perfectamente vertical. La primera es un equilibrio es-
table mientras que la segunda, de mayor energía potencial, es un equilibrio inestable. Cualquier
perturbación le hace caer a la posición estable, liberando su energía potencial. Volver a esta
situación estacionaria inestable requiere gastar energía para elevar el centro de masa del lápiz.
En un átomo, en el modelo en el que los electrones están sometidos al campo eléctrico del
núcleo y al campo magnético del momento magnético del núcleo, los electrones de las diferentes
capas se orientan de ambas formas frente a ese campo magnético, y en capas completas tenemos
electrones orientados de las dos formas posibles. Supongamos ahora un átomo con un solo
electrón en la última capa, estando las capas interiores completas.
La orientación de este momento magnético del último electrón, será la del campo magnético
resultante total que actúa sobre este electrón y que en el estado fundamental del átomo será
con el momento magnético paralelo al campo. Si queremos invertir la orientación del momento
magnético de este último electrón deberemos suministrar energía al átomo y por lo tanto al
electrón. Este proceso de invertir el momento magnético de un electrón en un átomo recibe el
nombre de transición hiperna.
La forma de suministrar energía a un átomo es mediante un haz de fotones. Los electrones
de las capas intermedias no pueden absorber fotones salvo para cambiar de nivel, a un nivel
excitado superior, pero no para cambiar la orientación de su espín, ya que al estar la capa
completa se instalaría en un estado ya ocupado, lo cual lo prohibe el principio de exclusión.
La energía para producir una transición entre niveles atómicos es del orden del eV. Para la
transición hiperna es del orden de 10−5 eV, en el rango de las microondas 25 . Supongamos que
la energía de los fotones del haz es la adecuada para producir la transición hiperna. Si un fotón
del haz es absorbido por el átomo, el electrón de la última capa capturará esa energía y pasará
a la situación estacionaria inestable. Sin embargo, al cabo de un tiempo, se desestabilizará
pasando a la situación estable emitiendo el correspondiente fotón de la transición hiperna.
Parece que lo que le damos al átomo lo volvemos a recuperar más tarde.
Como los fotones tienen espín 1 y el electrón espín 1/2, la transición se produce cuando
el electrón capture a un fotón que tenga su espín en la dirección opuesta a su propio espín,
invirtiendo la orientación de éste, y por lo tanto la orientación de su momento magnético. En
este proceso se conserva el momento angular y la energía, pasando el electrón a un estado de
energía mayor. Pero también se debe conservar el momento lineal, por lo que el momento lineal
del fotón absorbido modica en ese valor el momento lineal total del átomo.
La idea del enfriamiento por láser es utilizar fotones de una energía inferior a la de la
transición hiperna en el sistema de referencia del laboratorio. Si el gas de átomos no está a
la temperatura de 0 K, signica que un átomo posee una cierta energía cinética no nula y por
lo tanto se está desplazando con una cierta velocidad con respecto al sistema de referencia del
laboratorio. Los anteriores fotones no producirían la transición hiperna en átomos en reposo,
pero para los átomos en movimiento, debido al efecto Doppler, resulta que la energía de los
fotones del haz es algo mayor si el momento lineal del átomo se dirige hacia el haz, y menor si
el desplazamiento del átomo tiene la dirección del haz.
25 133
La transición hiperna del Cs es de una frecuencia ν = 9 192 631 770 Hz, en el rango de las microondas
de longitud de onda λ = 3.261 cm, que corresponde a una energía hν = 3.801 × 10−5 eV.
6.9. EL ESPÍN DEL PROTÓN 301

Si el átomo se dirige hacia el haz y su velocidad es la adecuada para que por el efecto
Doppler la energía del fotón que captura es suciente para producir la transición hiperna,
invertirá su momento magnético, pero la componente de la velocidad del centro de masa del
átomo en la dirección del haz disminuirá debido a la captura del momento lineal del fotón.
Como las otras componentes de la velocidad del átomo no se han modicado el átomo tiene
una energía cinética inferior con respecto al laboratorio, que la que tenía antes de la transición.
Pero ha pasado a un estado excitado inestable. Al cabo de un rato, ese electrón excitado pasará
a su estado estacionario estable, emitiendo el correspondiente fotón de la transición hiperna.
Pero ese fotón es emitido por un átomo que está en movimiento con respecto al laboratorio.
El resultado es que en el proceso de absorción hemos perdido un fotón de energía inferior a
la transición hiperna y hemos recuperado un fotón de energía mayor en el proceso de emisión.
La diferencia de energía entre esos dos fotones es la energía cinética que ha perdido el átomo
en este proceso. El átomo se ha enfriado.
En el año 1997, Chu, Cohen-Tanoudji y Phillips reciben el premio Nobel de física por el desa-
rrollo de técnicas de enfriamiento de átomos por láser. La idea es retener un gas monoatómico
en una cavidad a muy baja temperatura del orden del mK, y someterlo a la acción de láseres
dispuestos en tres direcciones perpendiculares, y en ambos sentidos. La energía de los fotones
debe ser inferior a la de la transición hiperna. De esta manera se consigue disminuir cada una
de las componentes de la velocidad del centro de masa de cada átomo, por el procedimiento
mencionado anteriormente. Al actuar con láseres en sentidos opuestos siempre habrá fotones
disponibles y de la energía adecuada para cada átomo, en uno u otro sentido.
A medida que los átomos se enfrían, la velocidad de los átomos disminuye y el resultado
del incremento de energía por efecto Doppler es menor, por lo que habría que sintonizar la
frecuencia de los láseres, incrementándola progresivamente, para poder alcanzar la energía de
transición. Por estos prcedimientos se consiguen enfriar gases a temperaturas del µK.

6.9. El espín del protón

Supongamos que de acuerdo con el modelo estándar, el protón es un sistema ligado de tres
quarks en un estado de momento angular orbital L = 0, de cada uno de ellos. Si suponemos
que los quarks son partículas de Dirac de espín 1/2, y relación giromagnética g = 2, podemos
aplicarles el mismo modelo clásico que el del electrón que hemos desarrollado en este formalismo.
Existe en la literatura una controversia con respecto al espín del protón. Si sumamos los tres
operadores espín de cada quark resulta que experimentalmente esto no produce el momento
angular total del protón y es lo que se conoce como la proton spin crisis26 . De acuerdo con
este experimento realizado en el CERN, la suma de los espines de los tres quarks no solo
no producía el valor esperado del espín del protón sino solamente entre el 4 % y el 24 % del
mismo. Este es considerado como uno de los problemas no resueltos de la física 27 . Se suele
argumentar que faltaría incluir en el espín del protón la contribución de los gluones virtuales,
pero esta sugerencia tampoco da resultado. Hay que tener presente que el operador espín de
Dirac representa al momento angular con respecto al centro de carga, como hemos visto en este
formalismo.
Si los quarks se mueven en un estado de momento angular orbital L = 0, esto signica
literalmente que si hacemos el análisis en el centro de masa del protón, cada quark tiene su
momento lineal en la dirección del centro de masa común, por lo que el centro de masa de cada
quark se mueve a lo largo de una línea recta que pasa por el CM del protón, y por lo tanto, las

Ashman, J.; European Muon Collaboration, Phys. Lett. B 206, 364 (1988), A measurement of the spin
26

asymmetry and determination of the structure function g(1) in deep inelastic muon-proton scattering.
27
https:/ / en.wikipedia.org/wiki/Proton_spin_crisis
302 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

Figura 6.30: Modelo de protón como sistema ligado de tres partículas de Dirac en un
estado de momento angular orbital L = 0, y en el sistema de referencia del CM del protón.
El movimiento del CM de cada quark debe ser necesariamente una trayectoria rectilínea
pasando por el centro de masa del protón. El operador espín de Dirac de cada quark está
denido y dibujado con respecto al correspondiente centro de carga, de tal manera que
la suma de los tres operadores de Dirac ~σ/2 no puede dar lugar al momento angular del
protón con respecto a su CM. Hay que sumar los tres momentos angulares de cada quark
con respecto a su centro de masa.

tres trayectorias de los tres quarks, puesto que pi = 0 en este sistema de referencia, están
contenidas en un plano.
Consideremos que el espín del protón es el momento angular de este sistema de tres quarks
con respecto al centro de masa común en reposo, CM . Como vemos en la gura 6.30, los tres
operadores espín de Dirac S i de cada quark representan a los momentos angulares de cada quark
con respecto al correspondiente centro de carga y no con respecto al centro de masa de cada
quark y han sido dibujados en su correspondiente punto. Esto signica que la suma de los tres
operadores espín de Dirac no pueden darnos el momento angular total del protón. Necesitamos
añadir por cada quark i, el correspondiente momento angular orbital (r i − q i ) × pi , i = 1, 2, 3.
Si tenemos en cuenta que el momento dipolar eléctrico de una partícula de Dirac es d =
e(r − q), como hemos visto en (6.7), esto nos determina al operador de separación entre el CC
y el CM de cada partícula por lo que
i~
r−q =− α,
2mc
en términos de las matrices α de Dirac. De aquí resulta que el término que falta para el cálculo
del espín del protón es que además de la suma de los tres operadores espín de Dirac, necesitamos
la suma de los tres operadores, uno por cada quark,
i~ i~ ~ ~2
α×p= α× ∇= α × ∇.
2mc 2mc i 2mc
Estos términos no son despreciables ya que cuando el CM de cada quark alcanza el CM común
del protón, la energía potencial es cero y la energía cinética alcanza su valor máximo, el valor
medio de cada momento lineal es aproximadamente de 325 MeV/c. Si q representa el campo
espinorial de un quark, el momento angular del protón debe contener al menos los términos:
∑3 ( ) ∑
3 ( 2 )
† ~ † ~
qi σ i qi − qi αi × ∇i qi
2 2mc
i=1 i=1
6.10. EL GRUPO CINEMÁTICO 303

sin tener en cuanta otras posibilidades como la posible contribución al momento angular del
plasma de gluones del protón, que es otra de los posibilidades que se argumentan, pero que no
hemos tenido en cuenta aquí.

6.10. El grupo cinemático

Supongamos que a la hora de describir la evolución de un sistema material localizable bas-


tara con describir la localización espacial en todo instante de un punto de este sistema material.
Como la ecuación diferencial más general de un punto en el espacio tridimensional es de cuarto
orden, su solución general involucra hasta 12 constantes de integración independientes. Si esta
familia de soluciones corresponde a las posibles descripciones que de la evolución del punto
hacen los diferentes observadores inerciales, esto implica que el grupo cinemático de transfor-
maciones espacio-temporales, asociado al principio de relatividad restringido, debe ser un grupo
dependiente como máximo, de 12 parámetros. Sin embargo, si lo que estamos describiendo es
la evolución del punto en el que localizamos las propiedades interactivas de una partícula ele-
mental, hemos visto en el preámbulo de estas notas que necesariamente ese punto, que lo hemos
denominado el centro de carga, se mueve con una velocidad inalcanzable para todos los ob-
servadores, la velocidad de la luz. Al establecer la ligadura de que |dr/dt| = c, eso hace que
solamente 11 parámetros sean esenciales, pues esta ligadura establece una relación entre las 12
constantes de integración. Además, este grupo debe describir un espacio-tiempo en el que la
forma de transformar las velocidades sea tal que exista una velocidad inalcanzable para todo
observador, que se corresponde con la velocidad de módulo constante del centro de carga.
El grupo de transformaciones espacio-temporales dependiente de 11 parámetros, que esta-
blece la relación entre observadores inerciales y que conserva la velocidad de la luz, es el grupo
de Weyl, que se compone de las 10 transformaciones funcionalmente independientes del gru-
po de Poincaré (4 traslaciones+3 rotaciones+3 transformaciones de Lorentz puras o boosts),
más las dilataciones espacio-temporales que conservan la velocidad, esto es las transformaciones
dependientes de un parámetro adimensional λ, t′ = eλ t, r ′ = eλ r .

6.10.1. El espacio cinemático

Para la descripción variacional de un sistema mecánico arbitrario la variedad relevante en la


que se desarrolla la evolución es el espacio cinemático. Es la variedad que dene los puntos
inicial y nal de la evolución. Si lo que pretendemos es describir una partícula elemental, el
principio atómico aquí planteado nos lleva a que esta variedad, el espacio cinemático, debe ser
necesariamente un espacio homogéneo del grupo cinemático asociado al principio de relatividad
restringido.
Si admitimos como grupo cinemático el grupo de Poincaré, P , entonces el espacio cinemático
tiene como máximo dimensión 10, pero como tres de estas variables representan la velocidad del
centro de carga y este punto se mueve con la velocidad c, resulta ser un espacio de dimensión
9. Las nueves variables que describen el espacio cinemático de un fermión son tres variables
espaciales, la localización del centro de carga, una variable temporal y cinco variables adimen-
sionales compactas. La interpretación geométrica de estas variables compactas es clara. Tres
representan la orientación del sistema material y pueden caracterizarse por un sistema carte-
siano de ejes ligado al punto y que rota con respecto a una posición inicial. Esta rotación vendría
caracterizada por el eje de rotación (dos variables compactas, el ángulo cenital θ ∈ [0, π], y el
ángulo acimutal ϕ ∈ [0, 2π]) y la tercera sería el ángulo rotado α ∈ [0, π], que en la versión
cuántica se extendería a α ∈ [0, 2π], para obtener la realización simplemente conexa del grupo
de rotaciones, o sea el grupo SU (2). Las dos restantes variables compactas corresponden a la
orientación espacial del vector velocidad del punto. Una es el ángulo cenital β ∈ [0, π] y la otra
304 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

el ángulo acimutal ψ ∈ [0, 2π], del vector velocidad de módulo constante c.


Si admitimos como grupo cinemático el grupo de Weyl, W , entonces tendríamos una nueva
variable adimensional λ, no compacta, asociada a la variable adimensional de cambio de escala.
De esta forma, una partícula elemental tiene un espacio cinemático de dimensión 10 y posee 7
grados de libertad, esto es, es un punto r , más un sistema cartesiano ligado a él α, cuya realidad
física no es absoluta sino que puede ser escogido de forma arbitraria en cualquier instante, más
una variable adimensional no compacta λ, que representa una especie de fase o gauge interna.
Por lo tanto, el grupo de simetrías de la Lagrangiana libre de la partícula elemental es el grupo
de Weyl, juntamente con los grupos que conmutan con él: El de rotaciones locales SO(3)L o de
su variante cuántica simplemente conexa SU (2)L , del sistema cartesiano arbitrario que describe
la orientación, y nalmente el U (1), de cambio de fase o de gauge {R, +}. Esto, en el caso
cuántico, se reduce a W ⊗ SU (2) ⊗ U (1).
Los operadores de Casimir de este grupo completo de simetrías son SCM2 , el momento angular

con respecto al centro de masa, que es el único operador de Casimir del grupo W , T 2 que es
la parte del momento angular debido a la rotación del sistema cartesiano ligado al punto,
como operador de Casimir del grupo de rotaciones locales SO(3)L . De hecho, los operadores Ti ,
i = 1, 2, 3, son las componentes del momento angular de rotación, proyectadas en los ejes del
sistema cartesiano local. Finalmente, el generador Q del grupo U (1), que al ser la fase interna
adimensional tendría dimensiones de acción y cuyo signicado físico está por determinar. Todos
estos operadores de Casimir tienen dimensiones de acción.
En teoría de cuerdas se postula que una partícula elemental es un punto de un espacio
de dimensión 10, (o de dimensión 11 en la teoría M ), pero que varias de las variables se han
compacticado, quedando solamente como variables no compactas una variable temporal y tres
variables espaciales. Con la inclusión de la constante universal c, las cuatro variables tienen
dimensiones de longitud. El signicado físico o geométrico de las variables compactas no queda
denido, aunque sugieren que son dimensiones espaciales que se han cerrado sobre sí mismas y se
han hecho inobservables. Más aún, la variedad que postula la teoría de cuerdas, no queda claro
si representa al espacio de conguración de los grados de libertad independientes, ni tampoco
si el número de estas variables está restringido y por qué. Si esta variedad se reere al espacio
cinemático de un sistema Lagrangiano, quedaría claro desde el punto de vista geométrico en
nuestro formalismo qué tipo de variables son compactas y cuáles no y su signicado geométrico.
Pero es que además, la formulación variacional lo que establece es que el espacio cinemático
es necesariamente un espacio métrico Finsleriano, con un tensor métrico simétrico que no es
denido positivo. La métrica es denida positiva para puntos causalmente conectados, por lo
que el postulado variacional contiene a su vez al Principio de Causalidad. La evolución dinámica
de cualquier sistema material resulta ser una geodésica que une los puntos inicial y nal de la
evolución.

6.10.2. Grupo de Weyl


El grupo de Weyl es el grupo de Poincaré con una transformación de escala adicional

t′ = eλ t, r ′ = eλ r, (6.38)

además de la acción sobre el espacio-tiempo dada por las ecuaciones (2.247) y (2.248). De esta
forma, si t y r son variables cinemáticas de una partícula elemental, sus derivadas transforman
bajo esta transformación:
ṫ′ = eλ ṫ, ṙ ′ = eλ ṙ,
lo que implica que bajo las dilataciones espacio-temporales, la velocidad transforma como

u′ = u,
6.10. EL GRUPO CINEMÁTICO 305

es invariante y por lo tanto se conserva la velocidad de la luz.


Los generadores del álgebra de Lie del grupo en esta realización son

H = ∂/∂t, Pi = ∂/∂ri , Ki = ct∂/∂ri + (ri /c)∂/∂t, Jk = εkli rl ∂/∂ri , Q = t∂/∂t + r · ∇

Por lo tanto, K , J y Q son adimensionales y las reglas de conmutación resultan

[J , J ] = −J , [J , P ] = −P , [J , K] = −K, [J , H] = 0, (6.39)

[H, P ] = 0, [H, K] = cP , [P , P ] = 0, [K, K] = J , [K, P ] = −H/c, (6.40)


[Q, H] = −H, [Q, P ] = −P , [Q, K] = 0, [Q, J ] = 0. (6.41)
Si, como es habitual, llamamos x0 = ct, p0 = H/c, pi = Pi , Ki = J0i = −Ji0 y Jk = − 21 ϵklr Jlr ,
xµ = ηµν xν , µ = 0, 1, 2, 3 y ∂ν ≡ ∂/∂xν , ∂σ xν = ηνσ , ∂σ xν = δσν , entonces,

Q = xµ ∂µ , pµ = ∂µ , Jµν = −Jνµ = xµ ∂ν − xν ∂µ .

En notación covariante las reglas de conmutación aparecen como:

[Q, pν ] = −pν , [Q, Jµν ] = 0,


[pµ , pν ] = 0,
[Jµν , pσ ] = −ηµσ pν + ηνσ pµ ,
[Jµν , Jρσ ] = −ηµρ Jνσ − ηνσ Jµρ + ηνρ Jµσ + ηµσ Jνρ .

El grupo de Poincaré tiene dos operadores de Casimir funcionalmente independientes. Uno


se interpreta como el cuadrado de la masa del sistema,

C1 = pµ pµ = (H/c)2 − P 2 = m2 c2 , (6.42)

y el otro es el cuadrado del tetravector de Pauli-Lubanski, wµ , denido mediante


1
wµ = εµνσλ pν Jσλ ≡ (P · J , HJ /c − K × P ) ≡ (P · S CM , HS CM /c), (6.43)
2
en términos de los generadores que para la partícula libre serán constantes del movimiento, y
el cual es por construcción ortogonal a pµ , es decir, wµ pµ = 0.
Se relaciona con el espín con respecto al centro de masa S CM , a través de la relación:

S CM = J − q × P , HS CM /c = HJ /c − K × P , (6.44)

habiendo reescrito K = Hq/c − P t, de manera que su componente temporal w0 = P · S =


P · J = P · S CM , representará la helicidad de la partícula, y la parte espacial es el vector (6.44).
De esta forma, el otro operador de Casimir del grupo de Poincaré es

−C2 = wµ wµ = (P · S CM )2 − H 2 S 2CM /c2 = −m2 c2 SCM


2
, (6.45)

el cual depende del valor SCM


2 , el valor absoluto al cuadrado del espín con respecto al centro

de masa, y de la masa de la partícula.


Los operadores wµ satisfacen las reglas de conmutación:

[wµ , wν ] = ϵµνσρ wσ pρ , (6.46)

habiendo tomado el tensor ϵ0123 = +1, y

[pµ , wν ] = 0, [Jµν , wσ ] = −ηµσ wν + ηνσ wµ . (6.47)


306 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN

El grupo de Weyl solamente posee un operador de Casimir

CW = C2 C1−1 ≡ C2 /C1 = SCM


2
, (6.48)

lo que implica que C1 debe ser invertible, por lo que necesariamente el observable masa m ̸= 0.
El único operador de Casimir del grupo de Weyl es el momento angular con respecto al centro
de masa, independiente de la masa no nula de la partícula, por lo que de admitir este grupo
como grupo cinemático la única característica intrínseca de una partícula elemental es el espín.
Efectivamente, quarks y leptones son partículas de Dirac es decir objetos masivos y de espín
1/2.
El grupo de Weyl no posee exponentes, de tal manera que las funciones gauge sobre sus
espacios homogéneos son nulas. Las Lagrangianas de los sistemas mecánicos cuyos espacios
cinemáticos sean espacios homogéneos de W , pueden tomarse estrictamente invariantes.
Como la transformación generada por Q no conmuta con pµ , esta transformación liga estados
de partículas de masas diferentes.

6.10.3. Transformaciones pasivas y activas


Sea un sistema material cuyas variables cinemáticas xi están medidas y referidas a un obser-
vador inercial O. Un cambio de sistema de referencia inercial, hace que las variables cinemáticas
del sistema material x′i referidas al observador O′ se expresen en términos de las xj y de los
parámetros del grupo cinemático G

x′i = fi (xj , gα ), g : O → O′ , g ∈ G.

Las variables xi de un cierto sistema material se han transformado entre observadores inercia-
les y decimos que hemos hecho una transformación pasiva de las variables cinemáticas. Esta
denominación es para distinguir esta transformación de las variables de la que se produciría
si manteniendo jo el observador inercial lo que hacemos es actuar sobre el sistema material
y producimos una transformación activa, con lo que los valores de las variables cinemáticas
cambiarán para este observador. Por ejemplo, trasladando, rotando, o deformando el sistema
material. Si la transformación activa se corresponde con una transformación del grupo cinemáti-
co, la modicación de las variables cinemáticas se expresa de la misma forma que anteriormente,
donde en vez de los parámetros gα del elemento del grupo g deberemos utilizar los parámetros
de su inverso g −1 . Por ejemplo el rotar un sistema material y expresarlo en el mismo sistema de
referencia, las variables que describen al cuerpo rotado se expresarán en términos de las variables
primitivas como si hubiéramos rotado en sentido contrario los ejes coordenados, manteniendo
inalterado el sistema material.
Al admitir como principio fundamental el Principio de Relatividad Restringido, estamos
estableciendo un grupo cinemático en el que las transformaciones que podemos realizar pueden
ser interpretadas de las dos formas, activa y pasiva. En cualquiera de estos casos el sistema
material no es deformado. Si incluyéramos cambios a un sistema acelerado, desde el punto de
vista activo tendríamos que realizar una fuerza sobre el sistema material, lo cual conllevaría
necesariamente una deformación del mismo, salvo que éste fuera indeformable, cosa que no
podemos admitir en general para los sistemas materiales. Descartamos por lo tanto este tipo de
transformaciones, ya que hay asimetría entre la interpretación pasiva y activa. Una no deforma al
sistema material y la otra sí. Desde el punto de vista pasivo da lugar a la aparición de un campo
gravitatorio extenso, en todo el espacio y que no aparece en el sistema de referencia primero.
Este tipo de transformaciones asimétricas en cuanto a su interpretación activa y pasiva, deben
quedar fuera del grupo cinemático que dene la clase de observadores equivalentes.
Se puede trasladar al sistema material o podemos considerar otro observador inercial con
sus ejes trasladados en sentido contrario. Lo mismo para las rotaciones y las transformaciones
6.10. EL GRUPO CINEMÁTICO 307

inerciales puras con velocidad constante. Desde el punto de vista pasivo admitir la invariancia
de las leyes de la física bajo traslaciones temporales es admitir que son inmutables en cualquier
instante en que las analicemos. Las leyes de la física son las mismas hoy que en el pasado
y también en el futuro. Desde el punto de vista activo, una traslación temporal consiste en
esperar el paso del tiempo para hacer el análisis físico. Sin embargo no podemos hacer desde
el punto de vista activo una traslación temporal hacia el pasado. No existe simetría entre los
tratamientos activo y pasivo para las traslaciones temporales. Solo es posible traslación activa
hacia el futuro. Existe una echa del tiempo. Esto parece implicar un único sentido desde el
punto de vista activo, de la acción de este grupo. El generador de este grupo tiene que tener un
único signo. La energía o momento temporal se escoge como una magnitud denida positiva. No
ocurre lo mismo con las demás magnitudes asociadas a los generadores de los otros grupos, que
pueden tomar cualquier signo, como las diferentes componentes del momento lineal o momento
angular.
Sucede lo mismo con las transformaciones discretas. Una inversión espacial pasiva es reali-
zable pero no así la activa, que supone deformar el sistema material. Dado un sistema material
es posible que su sistema espacialmente inverso sea físicamente irrealizable. Tal transformación
no puede formar parte del grupo de simetrías y si el fenómeno físico resulta ser invariante bajo
inversiones, esto es una propiedad física que debe comprobarse experimentalmente, pero que no
puede exigirse, a priori, como una ley de simetría. Si existe la simetría, puede dar lugar a una
ley de conservación que no existiría en el caso de ausencia de la simetría. La interacción débil no
es invariante bajo inversión espacial, y por lo tanto no conserva la paridad del sistema material.
Lo mismo podríamos decir de las transformaciones de cambio de escala. La interpretación
pasiva no afecta al sistema material, en cambio la transformación activa lo deforma. Como el
factor de escala de la partícula elemental se puede tomar como la separación entre el centro de
masa y el centro de carga, R = ~/2mc, que se escribe en términos de dos constantes universales
~ y c, y del observable masa, resulta que modicar la escala equivale a deformar la partícula y
obtener una partícula elemental de masa diferente. La Lagrangiana de interacción que hemos
encontrado en la sección 6.10.3 para dos partículas de Dirac es invariante Poincaré y además
invariante bajo cambio de escala espacio-temporal. Esto implica que si describe la interacción
entre dos electrones, la misma interacción es posible entre dos objetos de la misma carga y espín,
pero de masas diferentes que la del electrón. Al hacer el cambio de escala pasivo estaríamos
transformando el electrón en el muón o la partícula tau. El cambio activo se interpretaría
retirando los electrones y sustituyéndolos por las otras partículas. Lo mismo en el caso de los
diferentes estados másicos de los quarks de idéntica carga.
Este análisis sugiere que desde el punto de vista activo no tenemos un grupo cinemático
completo, como el grupo de Poincaré o el grupo de Weyl, sino que por lo que respecta a las
traslaciones temporales nos debemos restringir al semigrupo de traslaciones temporales activas
hacia el futuro. El generador de estas transformaciones solo puede tener un signo.

6.10.4. Descripción cuántica

Si admitimos que es el grupo de Weyl el grupo cinemático y queremos hacer una descripción
cuántica de una partícula elemental, es preciso denir el conjunto completo de observables que
conmutan.
Como el operador de Casimir del grupo de Weyl, CW , es el cociente de los dos operadores
de Casimir del grupo de Poincaré, y éstos conmutan tanto con el operador de Klein-Gordon
como con el operador de Dirac, resulta que CW también conmuta con ellos. Por lo tanto, una
partícula elemental es un sistema de espín 1/2, cuyas funciones de onda satisfacen la ecuación
de Klein-Gordon y de Dirac, a los que podemos añadir los operadores Sz y Tz , que también
conmutan con CW . No podemos incluir al operador Q porque no conmuta con H y P .
308 REFERENCIAS

Podrán existir, por lo tanto, partículas elementales de masas diferentes, pero de la misma
carga y el mismo espín 1/2.
Referencias

Éstas son las principales referencias del autor y colaboradores acerca de este formalismo y
que pueden obtenerse a través de la página web http://tp.lc.ehu.es/martin.htm. Referencias
a otros trabajos aparecen en el texto principal como notas de pie de página.

Libro

M. Rivas,
Kinematical theory of spinning particles,
Classical and quantum mechanical formalism of elementary particles.
Fundamental Theories of Physics Series, vol 116, Kluwer, Dordrecht 2001.
ISBN 0-7923-6824-X

The spinning electron


Capítulo de contribución al libro:
What is the electron?,
editado por V. Simulik, Apeiron, Montreal 2005.
ISBN 0-9732911-2-5

Artículos

M. Rivas,

Classical Particle Systems: I. Galilei free particles, J. Phys. A 18, 1971 (1985).
Classical Relativistic Spinning Particles, J. Math. Phys. 30, 318 (1989).
Quantization of generalized spinning particles. New derivation of Dirac's equation,
J. Math. Phys. 35, 3380 (1994).

Is there a classical spin contribution to the tunnel eect?, Phys. Lett. A 248, 279 (1998).
Are the electron spin and magnetic moment parallel or antiparallel vectors?,
ArXiv:physics/0112057.

The dynamical equation of the spinning electron, J. Phys. A, 36, 4703, (2003),
ArXiv:physics/0112005.

The spacetime symmetry group of a spin 1/2 elementary particle,


J. Phys. A, 39, 4291, (2006). ArXiv:hep-th/0511244.

A vueltas con el espin, Rev. Esp. de Física 20, no.3 (2006) 14.

309
310 REFERENCIAS

An interaction Lagrangian for two spin 1/2 elementary Dirac particles


J. Phys. A, 40, 2541, (2007). ArXiv:hep-th/0702172.
The atomic hypothesis: Physical consequences
J. Phys. A, 41 304022 (2008).

On the kinematics of the centre of charge of a spinning particle


ArXiv:0807.2512

Measuring the internal clock of the electron


ArXiv:0809.3635.

A lacking term in the proton spin Contribution to the SPIN-2010 Conference, Julich
(Germany) Sept 27-Oct 3, 2010. J. Phys:Conference Series 295 (2011) 012040.

Is General Relativity a simplied theory? J. Phys:Conference Series 437 (2013) 012008.


ArXiv:1203.4076

Is General Relativity a v/c ->0 limit of a Finsler geometry? (Contribution to the Spanish
Relativity Meeting 2012),
Progress in Mathematical Relativity, Gravitation and Cosmology Guimaraes, Portugal
Sept 3-7, 2012 Springer ISBN 978-3-642-40156-5.

The center of mass and center of charge of the electron J. Phys:Conference Series 615
(2015) 012017
Una versión previa puede verse en ArXiv:1211.3253

M. Rivas, J.M. Aguirregabiria and A. Hernández,

A pure kinematical explanation of the gyromagnetic ratio g = 2 of leptons and charged


bosons, Phys. Lett. A 257, 21 (1999).

J.M. Aguirregabiria, M. Rivas and M.A. Valle,

Composition law and contractions of the Poincaré group, Eur. J. Phys.7, (1986) 1.

Conferencias

Is General Relativity a restricted theory?


Conferencia impartida en el Instituto de Astrofísica de Canarias (Noviembre 2014):
http://iactalks.iac.es/talks/view/703

Is General Relativity a restricted theory?


Conferencia impartida en el Virtual Institute of Astroparticle Physics (Enero 2015):
http://viavca.in2p3.fr/martin_rivas.html
REFERENCIAS 311

Web didáctica

http://www.spinningparticles.com

y un Gedanken experiment que sugiere cómo describir a un electrón

http://tp.lc.ehu.es/documents/electron.pps

También podría gustarte