Teoría Cinemática de Partículas Elementales
Teoría Cinemática de Partículas Elementales
Teoría Cinemática de Partículas Elementales
Martín Rivas
e-mail: [email protected]
http://tp.lc.ehu.es/martin.htm
A. Einstein 1
If a spinning particle is not quite a point particle, nor a solid three dimensional top, what
can it be? What is the structure which can appear under probing with electromagnetic
elds as a point charge, yet as far as spin and wave properties are concerned exhibits a
size of the order of the Compton wavelength?
A.O. Barut 3
1
H. Dehmelt, Proc. Natl. Acad. Sci. USA, 86, 861819 (1989).
2
Ver la discución en http://quoteinvestigator.com/2011/05/13/einstein-simple/#more-2363, sobre la autoría
de esta frase.
3
A.O. Barut, Brief History and recent developments in electron theory and Quantumelectrodynamics, in The
electron, New Theory and Experiment, D. Hestenes and A. Weingartshofer (ed.), Kluwer Academic Publishers,
Dordrecht (1991).
ii
DOI:10.13140/RG.2.1.1900.3284
Índice general
Prefacio 1
Preámbulo 5
El centro de carga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
El centro de carga de una partícula elemental . . . . . . . . . . . . . . . . . . . . . . 6
Argumentos de sólido rígido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Argumentos de invariancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Argumentos geométricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Movimiento libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Dos centros, dos espines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Tres constantes universales en una sola . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Teoría de partículas elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Predicciones del formalismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Apéndice: Partículas elementales (Modelo Estándar) . . . . . . . . . . . . . . . . . . 21
1. Formalismo Lagrangiano 23
1.1. Formulación de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2. Principios Fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.1. Principio de Relatividad Restringido . . . . . . . . . . . . . . . . . . . . 25
1.2.2. Principio Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.3. Principio Atómico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.4. Principio de Cuantización . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.3. Principio variacional: Formalismo Lagrangiano . . . . . . . . . . . . . . . . . . 29
1.3.1. Ecuaciones de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . . . . 30
1.3.2. Espacio Cinemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.3.3. Cambio del tiempo por otro parámetro de evolución . . . . . . . . . . . 33
1.3.4. Homogeneidad de la Lagrangiana . . . . . . . . . . . . . . . . . . . . . . 34
1.3.5. Obtención de la Lagrangiana a partir de la función Acción . . . . . . . . 35
1.3.6. Simetría de un sistema dinámico . . . . . . . . . . . . . . . . . . . . . . 35
1.3.7. Funciones gauge de la Lagrangiana . . . . . . . . . . . . . . . . . . . . . 36
1.4. Teorema de Noether generalizado . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.5. Principio atómico: Partículas elementales . . . . . . . . . . . . . . . . . . . . . . 44
1.5.1. Aplicación del formalismo a grupos cinemáticos sencillos . . . . . . . . . 46
1.6. Estructura métrica del espacio cinemático . . . . . . . . . . . . . . . . . . . . . 47
1.6.1. Geodésicas en un espacio de Finsler . . . . . . . . . . . . . . . . . . . . 49
1.6.2. Ejemplo: partícula puntual en un campo electromagnético . . . . . . . . 51
1.6.3. Otros ejemplos de espacios de Finsler . . . . . . . . . . . . . . . . . . . . 53
1.7. Principio de Causalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.8. Formalismo canónico generalizado . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.8.1. Ecuaciones de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . . . . 60
iii
iv ÍNDICE GENERAL
Referencias 309
Prefacio
Estas notas contienen materiales de naturaleza matemática y física del formalismo general
que bajo el título de Teoría Cinemática de Partículas Elementales con Espín he venido
trabajando en los últimos años. El adjetivo cinemática hace referencia a la íntima relación
del formalismo con el grupo cinemático de transformaciones espacio-temporales asociado al
Principio de Relatividad Restringido, que como toda teoría con un cierto carácter universal,
debe necesariamente satisfacer.
Son una revisión de principios fundamentales, como el formalismo Lagrangiano que conduce
a las ecuaciones de Euler-Lagrange, teorema de Noether, etc., pero buscando soluciones de las
correspondientes ecuaciones diferenciales que pasen por los puntos inicial y nal de la evolución.
El formalismo no es equivalente a la formulación canónica. De ahí que las soluciones contendrán,
desde el punto de vista clásico, información no de los datos de un único punto inicial, sino de
los puntos extremos de la evolución. Esto nos produce un formalismo clásico más próximo,
formalmente, a la dinámica cuántica la cual se expresa también en términos de los estados
inicial y nal de la evolución. Veremos que es a través del método de cuantización de Feynman
de Integrales de Caminos, donde las similitudes de ambos formalismos, clásico y cuántico, se
complementan.
A las variables clásicas que denen los puntos extremos de la evolución en la formulación
variacional, propongo denominarlas variables cinemáticas, y, veremos, que en el caso de las
partículas elementales, necesariamente forman un espacio homogéneo del grupo cinemático. De
esta forma, el grupo cinemático no solamente nos suministra las simetrías espacio-temporales
del formalismo, sino que también suministra las variables clásicas de las que debe depender un
sistema material para ser considerado como una partícula elemental. Es por lo tanto crucial,
desde un punto de vista teórico, precisar convenientemente cuál es este grupo cinemático. En
estas notas trabajaremos principalmente con los grupos de Galileo y de Poincaré, dependientes
de diez parámetros, que nos suministrarán respectivamente, modelos no relativistas y relativis-
tas de partículas elementales con espín, pero el formalismo es lo sucientemente general para
que funcione con cualquier otro grupo cinemático que consideremos. Veremos que el grupo cine-
mático de transformaciones espacio-temporales más general, que describa la cinemática de un
punto en un espacio tridimensional depende como máximo de doce parámetros. Si la partícula
elemental posee un centro de carga y un centro de masa como puntos diferentes, entonces nece-
sariamente el grupo cinemático es el grupo de Weyl, que consiste en el grupo de Poincaré junto
con las dilataciones espacio-temporales que conservan la velocidad de la luz.
Además, al expresar el formalismo variacional en términos de las variables cinemáticas, nos
convierte el propio formalismo variacional en un formalismo geodésico sobre este espacio cine-
mático. El espacio cinemático es siempre un espacio métrico Finsleriano, lo que nos orienta
sobre la posibilidad de que cuando establecemos una interacción sobre el sistema material, la
nueva métrica tiene que seguir siendo Finsleriana. En este sentido, si analizamos la partícula
puntual, cuyo espacio cinemático es el espacio-tiempo, cualquier interacción nos modica la
métrica Minkowskiana de la partícula libre y nos producirá, en general, una métrica Finsleria-
na y no pseudo-Riemanniana como postula la teoría general de la relatividad. En este sentido
1
2 PREFACIO
generalizados, sobre todo para realzar el papel que van a jugar las variables de contorno, que
denominaremos variables cinemáticas, en la denición de partícula elemental. En el capítulo dos
se analizarán diferentes modelos Lagrangianos de partículas relativistas y no relativistas para
mostrar cómo los métodos estándar del análisis de las simetrías nos conducen a la denición
de los observables relevantes. En particular, prestaremos atención a la denición del espín, a
través de la invariancia de las ecuaciones dinámicas bajo el grupo de rotaciones. El espín, como
cualquier otro observable, estará ligado con los diferentes grados de libertad y sus derivadas,
y analizaremos su estructura matemática. Aunque partimos de un formalismo Lagrangiano,
veremos que es innecesario transformarlo al formalismo Hamiltoniano equivalente, ya que aquí
estamos interesados no solo en obtener las ecuaciones dinámicas, sino también exigir que se
cumplan las condiciones de contorno de la formulación variacional en los extremos de la evolu-
ción. Con estas condiciones de contorno, el formalismo canónico y el formalismo variacional no
son formalismos equivalentes.
Los dos capítulos siguientes contienen la cuantización del formalismo y el análisis de algunos
ejemplos relativistas y no relativistas. En particular, el cuarto capítulo se dedica al modelo
relativista que satisface la ecuación de Dirac y que nos brinda la descripción pictórica de la
cubierta. Prestaremos especial atención al análisis cuántico del álgebra de observables de Dirac y
su relación con los correspondientes observables clásicos. Veremos una interpretación geométrica
de la diferencia en la quiralidad entre materia y antimateria. Se podría decir, remedando
a Asimov4 , que el electrón es zurdo y el positrón es diestro, o bien, que la materia, es de
izquierdas y solamente la antimateria es de derechas. Este capítulo acaba con el análisis de la
ampliación del grupo cinemático de la partícula de Dirac, pasando del grupo de Poincaré
a una extensión del grupo de Weyl, ya que este modelo posee un grupo de simetrías espacio-
temporales más amplio que el grupo de Poincaré. Encontraremos una Lagrangiana de interacción
invariante bajo este grupo, que nos describiría la interacción entre dos partículas de Dirac. Esta
interación presenta un comportamiento Coulombiano entre las dos cargas cuando el espín de
las partículas desaparece, y muestra, entre otras cosas, que es posible la existencia de estados
ligados metaestables entre electrones, cuando se cumplen ciertas condiciones. La intensidad de
esta interacción viene controlada por el valor de la constante de estructura na, cuando el
análisis se reduce a variables sin dimensiones.
En el capítulo 5 se analiza la estructura del campo electromagnético de una partícula de
Dirac, que, claramente no es un campo estático para el observador del centro de masa, pero
produce campo eléctrico y campo magnético. Veremos que el campo eléctrico promedio temporal
a una vuelta de la carga tiene un comportamiento Coulombiano en cualquier dirección y su
campo magnético es el campo de un dipolo, pero a diferencia de los de una partícula puntual,
estos campos no se hacen innitos en el origen. Presentan singularidades en puntos del plano
del movimiento de la carga que no hemos sido capaces de renormalizar.
Finalmente, en el último capítulo, se analizan algunos efectos físicos relacionados con el es-
pín. El electrón, al tener una frecuencia interna, resulta ser un reloj. ¾Puede medirse de forma
indirecta esta frecuencia? Se analizará la estructura de dipolo eléctrico del electrón, que en el
caso cuántico nos lleva al término de Darwin del Hamiltoniano de Dirac. Veremos cómo la es-
tructura del espín permite justicar, incluso a nivel clásico, el denominado efecto túnel, el cual
sería responsable de la magnetorresistencia colosal de ciertos materiales. Estamos entrando en
los albores de la manipulación de corrientes de electrones mediante el control de su espín, lo
que en la tecnología actual se empieza a denominar como espintrónica. El efecto Compton
analiza la dispersión de fotones por electrones libres y en su análisis utiliza simplemente la
ley de conservación de la energía y del momento lineal. Pero la interacción electromagnética
también conserva el momento angular. Esta nueva conservación implica considerar los espines
tanto del fotón como del electrón, lo que conduce a que si controlamos la orientación del espín
4
Isaac Asimov, El electrón es zurdo, Alianza Editorial, 1980
4 PREFACIO
del electrón libre, podremos determinar la frecuencia del fotón dispersado. Para terminar con
esta exposición, analizaremos la posibilidad de que dos electrones con sus espines paralelos,
bajo ciertas condiciones de proximidad y de velocidad relativa, puedan formar un estado ligado
de carga 2e y espín 1, por lo que tendríamos un mecanismo clásico de formación de bosones
a temperatura nita, que podría ser la base de la formación de condensados de Bose-Einstein
conducentes a la fase superconductora del material a esta temperatura. Consecuencia de este
apareamiento puede estar ligado el efecto Hall cuántico. Como último análisis consideramos la
formación de un protón como un estado ligado de tres partículas de Dirac, los tres quarks. En
el estado actual de este tema vemos que falta un término en el cálculo del espín del protón.
En denitiva hay que hacer las cosas sencillas pero no más sencillas. No conviene simplicar
en exceso en el arranque del formalismo. Las simplicaciones se deben hacer en los análisis de
fenómenos particulares y dependiendo de los valores de los parámetros físicos que intervienen. Y
si, de acuerdo con la primera de las frases de la contraportada, lo que queremos es al menos llegar
a entender al electrón deberíamos ser capaces de poner un electrón, por ejemplo en una jaula
de Penning, someterlo a campos electromagnéticos externos y lograr que emitiera un fotón de
energía determinada, en una dirección de salida prejada y con su espín orientado hacia adelante
o hacia atrás a nuestra elección. Como la descripción precisa de una partícula elemental debe
hacerse en un marco cuántico, los anteriores valores estarían sometidos a las imprecisiones del
principio de incertidumbre. Todavía estamos lejos de lograr este objetivo.
Martín Rivas
Bilbao, Septiembre 2019.
Preámbulo: Movimiento helicoidal del
centro de carga
En este capítulo preliminar vamos a dar tres clases diferentes de argumentos, para que
supuestos el centro de masa y el centro de carga de una partícula elemental puntos diferentes,
mostrar que el centro de carga se mueve en un movimiento helicoidal a la velocidad de la luz y
su ecuación diferencial más general es de cuarto orden. Por una parte nos va a singularizar la
formulación relativista frente a la no relativista, y el hecho de que las ecuaciones dinámicas de
un punto en el espacio tridimensional, no son ecuaciones diferenciales de segundo orden, como
algunos libros de mecánica parecen sugerir, sino de cuarto orden como demuestra la geometría
diferencial. Por otra parte, va a sugerir desde el punto de vista mecánico, que debe existir un
límite superior a la velocidad del centro de masa de cualquier cuerpo masivo.
Esto signica que un formalismo Lagrangiano que describa partículas elementales deberá
depender por lo menos hasta la aceleración del centro de carga, para poder obtener ecuaciones
dinámicas de cuarto orden. Es por esto que comenzaremos repasando en el primer capítulo la
forma en que un formalismo Lagrangiano generalizado produce los resultados generales de las
ecuaciones de Euler-lagrange, análisis de simetrías y teorema de Noether, el formalismo canónico
generalizado, y, sobre todo, el papel que van a jugar las variables cinemáticas.
Comenzaremos este Preámbulo con una denición física, y por lo tanto restringida, de un
concepto de centro de carga de una partícula elemental.
En mecánica está bien denido el concepto de centro de masa de una distribución de masas,
de valores mi , localizadas en los puntos correspondientes r i , de tal manera que admitiendo la
tercera ley de Newton, el centro de masa se mueve bajo la acción de la suma de todas las fuerzas
externas. La denición es ∑
mi r i
RCM = ∑
mi
Desde el punto de vista electromagnético, si tenemos una distribución arbitraria de cargas y
corrientes, el campo electromagnético que generan se puede expresar como el producido a partir
de un punto concreto, pero arbitrario, en el que localizaríamos como fuentes de ese campo, la
carga total y un número, en principio innito, de los diferentes momentos multipolares eléctrico
y magnético asociados a esa distribución y denidos adecuadamente con respecto a ese punto. Si
cambiamos de punto, la carga total asociada al nuevo punto es la misma, pero no así los diferentes
momentos multipolares. Podríamos intentar denir un centro de carga de forma similar a como
denimos el centro de masa, pero existe una dicultad. La distribución de masa es siempre
positiva, en tanto que la distribución de carga eléctrica contiene ambos signos y una denición
del tipo anterior ∑
qi r i
RCC = ∑
qi
5
6 PREÁMBULO: Dos Centros
∑
podría resultar que el denominador qi resultase cero. Se podría subsanar deniendo por
(+)
separado el centro de cargas positivas por un lado RCC , y el centro de cargas negativas por
(−)
otro RCC , determinando los campos que generan por separado las diferentes distribuciones
positivas y negativas. Como las ecuaciones de Maxwell son lineales, su superposición lineal nos
dará el resultado, pero ahora tendríamos dos puntos, junto con los correspondientes momentos
multipolares, como localización de las fuentes del campo.
Otra cuestión es calcular, dada una distribución de cargas y corrientes, la fuerza que actúa
sobre ellas, debido a un campo electromagnético externo, que es generado por fuentes diferentes
de las de esta distribución. ¾Se podría escribir esta fuerza en términos de los valores de la carga
total y de los diferentes multipolos asociados a un cierto punto, juntamente con los valores que
los campos externos y sus derivadas toman en ese punto?
Supongamos para jar ideas, que tenemos una distribución esférica de carga positiva. Si la
distribución es estática en un cierto sistema de referencia inercial, el campo electrostático que
genera es el campo Coulombiano de una carga puntual, la carga total de la distribución, localiza-
da en el centro de simetría esférica. Si sobre esta distribución esférica actúa un campo eléctrico
externo, y el sistema es un conductor, el campo modicará en general la propia distribución
de las cargas al producir movimientos de éstas, apareciendo con respecto al centro de simetría
anterior momentos multipolares que antes no existían. Si la distribución estuviera asociada con
un aislante, este desplazamiento de cargas no se produciría. En este último caso, al no existir
momentos multipolares, el valor del campo eléctrico externo en el centro de simetría por el valor
total de la carga nos produce el valor de la fuerza total externa sobre esta distribución, si es
que la variación del campo externo es suave. En Jackson, 5 se demuestra que el valor medio de
un campo electrostático denido en una región esférica en la que no existen cargas que generen
ese campo, es el valor que el campo toma en el centro de la esfera.
En el apartado anterior hemos hablado de distribuciones arbitrarias de cargas, las cuales para
ciertos efectos se pueden reducir a un punto y respecto del cual los dipolos eléctrico y magnético
se pueden anular. No sabemos si la materia es divisible de forma indenida, pero si no lo es y
llegamos a un último objeto indivisible, a éste le llamamos partícula elemental. Desconocemos si
una partícula elemental se comporta como un conductor o un aislante, si es o no un sólido rígido
desde el punto de vista mecánico, pero en el apartado de principios fundamentales haremos la
hipótesis de que es un sistema mecánico indeformable (Principio atómico). Si su distribución de
cargas y corrientes posee una distribución esférica con respecto a cierto punto, de tal manera
que tomando ese punto como referencia, el campo electromagnético que la partícula elemental
produce fuera como si toda la carga estuviera concentrada en él, entonces denominamos a ese
punto el centro de carga. La supuesta indeformabilidad de una partícula elemental frente a
un campo externo nos lleva a postular que la fuerza externa que actúa sobre ella es la fuerza
de Lorentz denida en el centro de carga. Estamos haciendo la hipótesis de que desde el punto
de vista electromagnético se comporta como una única carga puntual localizada en el centro
de carga, sin ningún otro multipolo. Debido a su estructura mecánica, una partícula elemental
tendrá otro punto característico, su centro de masa. Solo existen dos posibilidades: que ambos
centros sean el mismo punto o que sean distintos. La hipótesis de la existencia de un centro de
carga también se hace en el modelo de partícula puntual, pero en ese modelo se admite que
el punto representa también la localización del centro de masa, hipótesis que aquí no vamos
a aceptar. El modelo debe ser simple, pero admitir que ambos centros son el mismo punto es
hacer el modelo más simple, demasiado simple, en contra de la segunda de las sentencias de la
contraportada.
5
J.D. Jackson, Classical Electrodynamics, John Wiley, NY 199, p. 148-149.
PREÁMBULO: Dos Centros 7
Supongamos que una partícula elemental se pudiera describir como un sólido rígido. Sería
por lo tanto un sistema de seis grados de libertad, de los que tres representarían la posición de un
punto y los otros tres la orientación de un sistema cartesiano ligado a ese punto. Habitualmente,
se toma el punto como el centro de masa q , y la orientación como los ejes principales de inercia
localizados alrededor de q . El centro de masa satisface ecuaciones Newtonianas de segundo orden
y se mueve como un punto de masa m, la masa total del sistema, bajo la acción de la fuerza
total externa. El cambio de orientación se produce por el momento de las fuerzas externas. Un
sólido rígido se desplaza y rota.
Si en vez de considerar la descripción del centro de masa consideramos otro punto cualquiera
r , éste seguirá, en general, una trayectoria helicoidal alrededor del centro de masa, del estilo de
la dibujada en la gura.
Si una partícula elemental fuese un sólido rígido cargado, necesitaríamos conocer también su
estructura electromagnética. Ésta se reduce al conocimiento del centro de carga y los diferentes
multipolos. Si el campo que genera tiene simetría esférica, entonces nos quedamos solamente
con el centro de carga, para calcular desde ahí el campo que la partícula crea y las fuerzas que
los campos externos hacen sobre ella.
En general, dependiendo de cómo esté distribuida la masa y la carga, el centro de masa y
el centro carga serán en general puntos diferentes, que es lo que vamos a suponer aquí. Por lo
tanto, para determinar el movimiento del centro de masa necesito conocer en todo instante la
localización del centro de carga para conocer las fuerzas externas en él denidas. Las ecuaciones
de Newton del centro de masa se escriben
( )
d2 q dr
m 2 = e E(t, r) + × B(t, r) = F (t, r, dr/dt). (1)
dt dt
1 d2 r
n= ,
ω 2 R dt2
8 PREÁMBULO: Dos Centros
donde R es el radio del movimiento circular y ω su velocidad angular. De esta forma, conocido
el centro de carga, podemos determinar el centro de masa mediante
1 d2 r
q(t) = r(t) + . (2)
ω 2 dt2
Es por lo tanto más simple, desde el punto de vista teórico, describir la evolución de un solo
punto, el centro de carga r , en vez del centro de masa q , ya que éste queda determinado en
función del anterior mediante (2) una vez que se conoce la trayectoria de r .
Si eliminamos d2 q/dt2 entre las ecuaciones (1) y (2) obtendremos, en general, una ecuación
diferencial de cuarto orden en la variable vectorial r . Además, como la velocidad angular es
perpendicular al plano que contiene a la velocidad y a la aceleración del punto r ,
1 dr d2 r
ω= × 2 (3)
u2 dt dt
hemos resuelto también el problema de la rotación del sólido rígido cargado, habiendo analizado
solamente la evolución del centro de carga.
Una denición de la velocidad angular como ésta (3) implica que la u ̸= 0, es decir la velocidad del
punto r debe ser inalcanzable para todo observador inercial. De hecho, en el modelo relativista el
Las ecuaciones dinámicas de segundo orden de la partícula libre, para la posición del centro de
masa q y la orientación de los ejes principales de inercia α, quedan
q̈ = 0, ω̇ = 0,
han sido reemplazadas por las ecuaciones dinámicas de cuarto orden del centro de carga,
d4 r 2
2d r
+ ω = 0.
dt4 dt2
De esta forma, un sólido rígido puede ser interpretado como un sistema de tres grados de libertad,
la posición del centro de carga r , que satisface ecuaciones diferenciales de cuarto orden, y por
lo tanto descrito por una Lagrangiana dependiente de la aceleración. La trayectoria del centro
de masa del sólido queda determinada por la trayectoria del centro de carga mediante (2).
Las ecuaciones dinámicas en interacción quedan:
( )
m d4 r d2 r dr
+ m 2 = e E(t, r) + × B(t, r) , (4)
ω 2 dt4 dt dt
en términos de los tres grados de libertad r que es donde están denidos los campos externos.
Una formulación Lagrangiana dependiente de la aceleración del punto r , podría dar lugar a
la obtención de estas ecuaciones dinámicas. Por ejemplo, la Lagrangiana no relativista
( )2 ( )2
m dr m d2 r dr
L= − 2 − eϕ(t, r) + eA(t, r) ·
2 dt 2ω dt2 dt
nos reproduciría las anteriores ecuaciones dinámicas (4), donde el sólido rígido giraría a la
velocidad constante ω , que aquí aparecería como una propiedad intrínseca e inmodicable.
PREÁMBULO: Dos Centros 9
Argumentos de invariancia
Consideremos que r(t), t ∈ [t1 , t2 ] es la trayectoria que sigue un punto de un sistema me-
cánico en el espacio tridimensional y para un cierto observador inercial arbitrario O. Cualquier
otro observador inercial O′ , está relacionado con O mediante una transformación g del grupo
cinemático G, de tal manera que las medidas relativas de espacio y tiempo vienen relacionadas
por
t′ = T (t, r; g1 , . . . , gα ), r ′ = R(t, r; g1 , . . . , gα ),
donde las funciones T y R denen las correspondientes leyes de transformación del grupo
cinemático G, de parámetros (g1 , . . . , gα ), entre ambos observadores. Por lo tanto, la descripción
de esa trayectoria para el observador O′ se obtiene de
Argumentos geométricos
estas ecuaciones son integrables. Si se dene el vector ω = τ t + κb, conocido como vector de
Darboux, las ecuaciones de Frenet-Serret se pueden reescribir
ṫ = ω × t, ṅ = ω × n, ḃ = ω × b,
de tal manera que, en unidades de la longitud del arco, el vector de Darboux representa la
velocidad angular instantánea del triedro local y referida a este mismo triedro.
Llamando r (k) = dk r/dsk ,
podemos despejar entre estas tres ecuaciones los vectores unidad de la terna de Frenet-Serret
en términos de las tres primeras derivadas del vector de posición
1 (2) κ (1) κ̇ 1 (3)
t = r (1) , n= r , b= r − 2 r (2) + r
κ τ κ τ κτ
De esta forma
1 (1)
κ = |r (2) |, τ=(r × r (2) ) · r (3)
κ2
y se expresan a su vez en términos de las tres primeras derivadas de la posición del punto.
Volviendo a derivar r (3) y sustituyendo las expresiones de los vectores unidad, la ecuación
diferencial más general de un punto en el espacio tridimensional es
( ) ( ) ( )
2κ̇ τ̇ κ̇τ̇ 2κ̇2 − κκ̈ 2 κ̇ τ̇
r −
(4)
+ (3)
r + κ +τ +2 2
+ (2)
r +κ − r (1) = 0, (6)
κ τ κτ κ2 κ τ
donde todos los coecientes se expresan a su vez en términos de las diferentes derivadas de la
posición del punto hasta el orden 4.
Si una partícula elemental es un sistema localizado, y al menos la describimos por la evolución
de un punto, éste, en general, deberá satisfacer una ecuación de cuarto orden de este tipo.
Movimiento libre
Supongamos que este punto r es el centro de carga de una partícula elemental. Este punto
debe satisfacer en general una ecuación del tipo (6). La curvatura κ(s) y la torsión τ (s) en cada
momento s, dependerán de las fuerzas y pares externos que se ejercen sobre la partícula en
ese momento. Supongamos ahora que la evolución es libre. Eso quiere decir que no es posible
distinguir un instante de la evolución de cualquier otro. Como la anterior ecuación diferencial
se expresa en términos del triedro local, esto signica que el desplazamiento del triedro, en la
dirección del vector tangente t, y la rotación del triedro, deben ser independientes del instante
en el que lo analizamos, y jado un observador inercial, deben ser independientes de su tiempo.
Esto signica que se debe mover con velocidad de módulo constante y el vector de Darboux
debe ser también constante. Si la velocidad es constante en módulo, el parámetro s y el tiempo
t dieren en un factor multiplicativo. La curvatura y la torsión son constantes y la curva es,
por lo tanto, una hélice. Para un observador inercial el triedro se desplaza con velocidad en
valor absoluto constante y rota respecto de sí mismo con velocidad angular constante. Como
κ̇ = τ̇ = 0, lo que es constante para el observador inercial es ds/dt = u y el valor ω 2 = κ2 + τ 2
y la ecuación diferencial se puede factorizar en la forma
( ) d2 ( )
r (4) + κ2 + τ 2 r (2) = 2 r (2) + ω 2 r = 0.
ds
El término entre paréntesis va denir el centro de la hélice q , mediante
1 (2) d2 q
q=r+ r , =0
ω2 ds2
PREÁMBULO: Dos Centros 11
y la ecuación anterior corresponde a un punto q que se mueve de forma libre, en línea recta, y
el punto r que satisface
r (2) + ω 2 (r − q) = 0,
√
efectúa un movimiento armónico de pulsación constante ω = κ2 + τ 2 alrededor de q , quedando
las anteriores ecuaciones acopladas en la forma
q (2) = 0, r (2) + ω 2 (r − q) = 0.
Esta descripción del movimiento libre debe ser válida para todo observador inercial.
Una primera conclusión es que la velocidad del centro de carga debe ser una velocidad
inalcanzable para cualquier observador inercial. Como su movimiento es acelerado y de velocidad
en módulo constante, no es posible encontrar un observador inercial que esté en un instante en
reposo respecto de la carga, porque en el instante siguiente vería moverse la carga con una
velocidad distinta de cero y por lo tanto contradictorio con el hecho de que mide un movimiento
con velocidad de módulo constante.
En un análisis no relativista, la relación de la medida de las velocidades entre dos obser-
vadores inerciales O y O′ , está dada por u′ = u + v , donde v es la velocidad constante de O
medida por O′ . Así,
u′ = u2 + v 2 + 2v · u.
2
Si u′ tiene que ser también constante para el observador O′ , independientemente de los valores
del vector v , esto implica que v · u̇ = 0, y el vector u debe ser constante. El centro de carga se
debe mover necesariamente a lo largo de una recta con velocidad constante para todo observador
inercial. De esta forma, la hélice general degenera en una línea recta y q = r , el centro de masa
y el centro de carga son necesariamente el mismo punto. Esta es la descripción habitual de la
partícula puntual o partícula sin espín.
En el caso relativista tenemos igualmente que
γ2
u + γ(v)v + (1+γ)c2
(v · u)v u2 − c2
′
u′ =
2
u = , + c2 .
γ(1 + v · u/c )
2
γ 2 (1 + v · u/c2 )2
es consistente con la teoría de Dirac del electrón ya que el operador velocidad de Dirac posee
como valores propios ±c. Esto signica que la función de onda, o espinor de Dirac ψ(t, r), se
expresa en términos de la posición del centro de carga r , que se mueve a la velocidad de la luz,
y que es donde los campos externos están denidos.
En resumen, si una partícula elemental tiene dos centros diferentes, este análisis produce
una solución tan restrictiva, que es única. En efecto:
1. Si describe una hélice, el movimiento de la carga es acelerado, de tal manera que si cam-
biamos de observador inercial, las velocidades no pueden sumarse como vectores, porque
si el vector velocidad u es distinto en dos instantes t1 y t2 , al añadirle un vector constante,
no produce necesariamente dos vectores del mismo módulo en el nuevo referencial. La ley
no relativista de adición de velocidades no se mantiene. Deberá existir otra ley de com-
posición de velocidades que dé lugar, al añadir un vector constante al vector velocidad u,
otro vector velocidad de módulo constante, cualquiera que sea la orientación del vector
velocidad del punto u.
La física no relativista excluye la posibilidad de que una partícula elemental pudiera tener
un centro de carga y un centro de masa como puntos diferentes, si admitimos que la descripción
de su movimiento libre debe ser independiente del observador inercial.
La física relativista suministra una única solución. El centro de carga describe necesaria-
mente una hélice a la velocidad de la luz. 6
En este último caso, el centro de masa se mueve con una velocidad inferior a la del centro
de carga, por lo que existe una velocidad límite para el desplazamiento del centro de masa de
cualquier cuerpo masivo. Si la partícula no es libre, la condición de que es una partícula elemental
nos va a llevar, al admitir el principio atómico, que su estructura interna no es modicada por
una interacción, con lo que el centro de carga de un electrón en interacción se sigue moviendo
a la velocidad de la luz.
respecto al origen del sistema de referencia de cualquier observador inercial se puede escribir
J = r × p + S, o bien J = q × p + S CM , o bien J = k × p + S k .
eso implica que r ̸= q y por lo tanto la partícula elemental posee un CC y un CM que son
puntos distintos, como aquí estamos suponiendo.
En la literatura encontramos ya ejemplos de los dos primeros espines. El observable espín
de Bargmann, Michel y Telegdi 7 , satisface una ecuación dinámica que es la generalización
covariante sobre el espacio-tiempo, de la ecuación dinámica del S CM . Es lineal en los campos
externos y se conserva para la partícula libre. Este simple argumento de su no conservación y
el análisis anterior de la dinámica del espín es suciente para llegar a la conclusión de que los
dos centros son puntos necesariamente distintos. El espín con respecto al centro de carga S ,
satisface la misma ecuación dinámica que el operador espín de Dirac en el caso cuántico, tanto
en el caso libre como en interacción, como veremos a lo largo del curso.
En este curso vamos a postular una denición de partícula elemental que produce modelos
relativistas y no relativistas de partículas con espín una de cuyas características es que son
modelos en los que los centros de masa y de carga son puntos diferentes. Finalmente, solo aquel
modelo relativista cuyo centro de carga se mueve a la velocidad de la luz, va a satisfacer la
ecuación de Dirac al ser cuantizado.
Las tres constantes universales ~, c y e forman parte de propiedades básicas del electrón.
La primera ~, está ligada con una propiedad mecánica, el valor único del espín s = ~/2, de
esta partícula. La segunda c, está ligada con la velocidad límite a la que se tiene que mover
su centro de carga si es que es un punto diferente de su centro de masa. Finalmente la tercera
e, es su característica de interacción. Es el valor de la carga eléctrica, que resulta ser un valor
único para las partículas que solamente interaccionan de forma electromagnética. Estas tres
constantes universales conguran una constante universal adimensional α, la denominada por
Arnold Sommerfeld constante de estructura na, denida en el sistema internacional de
unidades mediante
1 e2 1
α= ≈ ,
4πϵ0 ~c 137
y que toma ese valor numérico en cualquier sistema de unidades. Es una característica inde-
pendiente de la masa de las partículas cargadas con espín. Si demostramos que el valor de esta
constante es único para las partículas que solamente interaccionan de forma electromagnética,
entonces resulta que estas tres constantes universales no son independientes. Según Pauli8 una
teoría que no sea capaz de determinar esta constante, es una teoría incompleta.
Vamos a desarrollar en estas notas un formalismo general que describa partículas elementales
desde el punto de vista clásico y cuántico. La mecánica clásica es un formalismo que describe las
leyes de la dinámica de los sistemas materiales, leyes que, en general, se traducen en ecuaciones
diferenciales ordinarias para las variables que denen los diferentes grados de libertad del sistema
material. Desde un punto de vista reduccionista hoy en día sabemos que los diferentes sistemas
materiales están compuestos por sistemas materiales indivisibles, que denominamos partículas
elementales. Es por eso necesario que el propio formalismo contenga la posibilidad de distinguir
cuándo un sistema mecánico es elemental o no lo es. Esto lo vamos a reducir a postular un
principio fundamental, que lo denominamos principio atómico, el cual establecerá la forma
7
V. Bargmann,L. Michel y V.L. Telegdi, Precession of the polarization of particles moving in a homogeneous
electromagnetic eld, Phys. Rev. Lett. 2, 435 (1959).
8
W. Pauli, Nobel Lectures, vol 13, 1942-1962, Elsevier, Amsterdam (1964)
PREÁMBULO: Dos Centros 15
El formalismo que vamos a desarrollar en este curso no es completo. No hemos sido capaces
de obtener el valor de la constante de estructura na α. Sin embargo produce un conjunto de
predicciones que son consistentes con los planteamientos del modelo estándar y la formulación
relativista y otras que habría que vericar de forma experimental. Muchas de estas predicciones
no aparecen en la descripción habitual de las partículas elementales consideradas como partículas
puntuales. Están desarrolladas a lo largo de las notas en las secciones y capítulos que se indican
y que aquí, simplemente, las pasamos a enumerar:
1. Para una partícula elemental masiva, con dos centros CC y CM distintos, la velocidad
del CC es inalcanzable para todo observador inercial. Como la velocidad de su centro de
masa no puede superar la velocidad del centro de carga, existe para todo cuerpo masivo
un límite superior de la velocidad de desplazamiento de su centro de masa. (Preámbulo)
2. Si una partícula elemental fuera una partícula puntual, no existiría límite a la velocidad
de su centro de masa, y podría alcanzar cualquier velocidad. Este criterio por sí solo,
contradictorio con la experiencia, descarta la posibilidad de que una partícula elemental
se pueda describir como el modelo de partícula puntual. (Preámbulo)
3. El centro de carga y el centro de masa de una partícula elemental masiva que satisface
la ecuación de Dirac, son dos puntos distintos, separados por una distancia R0 = ~/2mc,
para el observador del centro de masa. (Sec. 2.5.2)
16 PREÁMBULO: Dos Centros
5. Si la partícula se mueve en línea recta a la velocidad de la luz, es una partícula sin masa,
y si representa un cuanto de energía electromagnética, entonces necesariamente su espín,
que tiene necesariamente la dirección del movimiento hacia adelante o hacia atrás, solo
puede tomar los valores Sz = ±~, por lo que se trata de un bosón. (Sec. 3.3)
6. La dirección del espín del fotón coincide con la velocidad angular de éste, aunque no están
relacionados. El espín del fotón es invariante, es el mismo para todos los observadores
inerciales, mientras que la velocidad angular transforma entre observadores de acuerdo
con las prescripciones del efecto Doppler. (Sec: 2.5.1)
7. Los fotones son partículas sin masa que van rotando con una velocidad angular en la
dirección del movimiento, hacia adelante o hacia atrás, y cuya frecuencia es la misma que
la de la radiación electromagnética de la que son sus cuantos de energía. (Sec: 2.5.1)
8. La formulación relativista impide que exista una partícula puntual masiva sin espín mo-
viéndose a la velocidad de la luz. Su Lagrangiana sería idénticamente nula. Necesariamente
tiene que tener más de tres grados de libertad y tiene espín. Los fotones tienen orientación
y rotan alrededor de un eje que tiene la dirección de la velocidad. El espín del fotón tiene
la dirección de la velocidad angular pero no está relacionado con ella. (Sec. 3.3)
9. Para una partícula elemental masiva, el centro de carga se mueve alrededor del centro
de masa a la velocidad de la luz, en un movimiento circular de frecuencia ν0 = 2mc2 /h,
o período T0 = 1/ν0 = h/2mc2 , para el observador del centro de masa. Existe un reloj
natural asociado a este movimiento interno del electrón. (Sec. 2.5.2)
10. Desde el punto de vista clásico, el punto donde se localizan las propiedades interactivas de
una partícula elemental, se mueve con una velocidad inalcanzable para todo observador
inercial. La constante universal c representa tanto la velocidad del punto donde está loca-
lizado un fotón como la velocidad del centro de carga de una partícula masiva con espín.
Al cuantizar estos sistemas resulta que tanto la materia fermiónica como los bosones con
espín no nulo que median en su interacción se mueven a la velocidad de la luz. (Sec. 2.5)
11. Para un observador que ve moverse el centro de masa del electrón con velocidad v , el
reloj del electrón va más despacio, con un período mayor T = γ(v)T0 , donde γ(v) =
(1 − v 2 /c2 )−1/2 . (Sec. 6.2.1)
12. Para el observador del centro de masa, una partícula elemental posee además de carga,
un momento magnético, con respecto al centro de masa, perpendicular al plano de la
trayectoria del centro de carga y un momento dipolar eléctrico perpendicular al anterior
y contenido en ese plano. (Sec. 2.5.6)
13. El momento magnético de la materia elemental es producido por este movimiento relativo
del centro de carga, que no es modicado por las interacciones. (Sec. 2.5.6)
14. El electrón, además de un momento magnético creado por el movimiento del centro de
carga, posee un momento dipolar eléctrico con respecto al centro de masa, ya predicho
por la ecuación de Dirac, aunque considerado como no relevante por él, y que rota con la
frecuencia interna del electrón. (Sec. 2.5.6)
PREÁMBULO: Dos Centros 17
15. La relación giromagnética cuántica g = 2, está ligada con que el espín, desde el punto
de vista clásico y cuántico tiene dos partes S = W + Z , una ligada con la rotación de
la partícula W , que no produce momento magnético, y otra Z ligada con el movimiento
relativo entre el centro de masa y el centro de carga (Zitterbewegung). (Sec. 6.1)
16. Si admitimos que la materia elemental son partículas de Dirac, entonces desde el punto de
vista cuántico su espín es necesariamente S = ~/2, independiente de la masa o de la carga
de las mismas. Es decir, los leptones y quarks son fermiones masivos de espín S = ~/2.
(Cap. 4)
22. La orientación relativa entre el espín y el momento magnético, de las partículas eléctri-
camente cargadas, es la misma para la partícula que para su antipartícula. Depende del
signo de la carga de la partícula. Si consideramos que el electrón, de carga negativa, es
la partícula, entonces electrones y positrones tienen su espín y momento magnético en
la misma dirección. Esta orientación relativa no se ha medido experimentalmente. (Sec.
4.2.6)
23. Una medida de la orientación relativa entre el espín y el momento magnético de un electrón
ligado a un átomo se podría realizar produciendo la transición hiperna de átomos de
Rb87 en un campo magnético externo, con un haz de luz polarizada circular. No tenemos
constancia de que este experimento se haya realizado. (Sec. 4.2.6)
24. El efecto túnel no es un efecto puramente cuántico. Se puede producir en el caso cl ásico
y está ligado con la separación entre el centro de carga y el centro de masa. (Sec. 6.5)
26. Dos electrones, desde el punto de vista clásico, pueden formar un estado ligado metaestable
de carga 2e y de espín 1, es decir un bosón desde el punto de vista cuántico, si se cumplen
ciertas condiciones de que sus espines sean paralelos, la velocidad relativa de sus centros
de masa sea inferior 0.01c y las fases de sus movimientos relativos internos sean opuestas.
Este estado ligado es estable frente a campos eléctricos externos pero no frente a campos
magnéticos transversales al espín. (Sec. 6.6)
28. Para campos magnéticos superiores a 1 T, el análisis del efecto Hall cuántico entero
sugiere que la conducción longitudinal se realiza mediante electrones apareados en fase
superconductora. Un experimento consistente en extraer portadores de carga tanto de la
corriente principal como de la zona negativamente cargada del potencial de Hall, podría
mostrar que efectivamente la conducción se realiza mediante portadores de carga de valor
2e y espín 1. No tenemos constancia de que este experimento se haya realizado. (Sec.6.7)
31. El análisis habitual del efecto Compton como interacción de dos partículas puntuales, un
fotón y un electrón, solamente considera la conservación del momento lineal y la energía.
Sin embargo también se conserva el momento angular. El análisis de esta nueva conser-
vación nos lleva a que si somos capaces de controlar la orientación del espín del electrón
dispersor, se determina de forma unívoca la energía y la dirección del fotón dispersado.
(Sec. 6.4)
32. Desde el punto de vista teórico clásico, la Lagrangiana que describe a una partícula
elemental en interacción con agentes externos, se escribe como L e = L e0 + Le I , donde
e
L0 es la Lagrangiana de la partícula libre, que describe sus propiedades mecánicas, y
e I = −eϕ(t, r)ṫ + eA(t, r)ṙ , es la Lagrangiana de la interacción, que predice solamente
L
una interacción electromagnética. (Sec. 2.5.2)
PREÁMBULO: Dos Centros 19
33. El análisis de la interacción de dos partículas de Dirac nos lleva a que la Lagrangiana de
la interacción puede ser invariante bajo un grupo más amplio que el grupo de Poincaré,
que contiene además cambios de escala y rotaciones locales. Todo el análisis se puede
realizar en términos de variables adimensionales. La constante de acoplamiento es 2α,
siendo α la constante de estructura na. La L e I va como 1/r, siendo r la separación entre
los centros de carga de ambas partículas. Así, la parte libre L e 0 puede describir partículas
e
libres de masas arbitrarias, pero la interacción entre ellas LI es independiente de las masas
de las partículas. Tiene la particularidad de que necesariamente, para que la interacción
no sea nula, las velocidades u1 y u2 de los centros de carga de ambas partículas deben
ser diferentes. Dos electrones, que en un instante tuvieran u1 = u2 , no interaccionarían,
independientemente de la distancia que los separara. (Sec. 4.5)
35. Si excluimos el tiempo de las variables cinemáticas, x ≡ (t, qi ), las restantes variables qi
son las variables generalizadas de la formulación variacional y del formalismo canónico. Si
alguna de estas variables representa la derivada temporal de otra de ellas, necesariamente
la Lagrangiana depende de derivadas de orden superior, ya que la Lagrangiana es siempre
una función de las variables cinemáticas y de su siguiente derivada temporal. (Secs. 1.4,
1.3.2)
36. El espacio cinemático X es siempre un espacio métrico Finsleriano. Es un espacio métrico
en el que los coecientes de la métrica no son solamente funciones del punto x, sino
también de su derivada ẋ, gij (x, ẋ). Resulta entonces que la formulación variacional es
equivalente a un problema geodésico sobre X , cuya métrica viene condicionada por el
tipo de interacción a que se somete al sistema. Para una partícula elemental, cualquier
interacción modica la métrica de su espacio cinemático. (Sec. 1.6)
e ẋ),
37. La métrica del espacio cinemático se construye por derivación de la Lagrangiana L(x,
en la forma (Sec. 1.6)
1 ∂2L e2
gij (x, ẋ) = = gji (x, ẋ).
2 ∂ ẋi ∂ x˙j
38. La partícula puntual es un posible modelo de partícula elemental en este formalismo, pero
corresponde a una partícula sin espín. El uso de este modelo debe ser descartado para
el análisis del comportamiento de la materia elemental real, ya que no parecen existir
partículas elementales sin espín. Todas las propiedades físicas asociadas a la participación
del espín en la interacción, quedarían sin ser decritas. (Sec. 2.1)
39. El espacio cinemático de la partícula puntual es el espacio de Minkowski con una métrica
constante gµν = ηµν = diag(1, −1, −1, −1). Al ser constante, es también una métrica
Riemanniana, pero esta consideración es restrictiva. La gravedad, considerada como otra
interacción y en el espíritu de unicación de todas las interacciones, aplicada a la partícula
puntual, deberá modicar la métrica Minkowskiana del espacio-tiempo y dar lugar, en
general, a una métrica Finsleriana gµν (x, ẋ), y no solamente Riemanniana gµν (x), como
postula la Relatividad General. (Sec. 1.6)
40. La gravedad, como cualquier otra interacción, aplicada a la partícula elemental con espín,
modicaría la métrica de su espacio cinemático y produciría, en general, una métrica
Finsleriana de esta variedad y no solo de la subvariedad espacio-temporal. Pasaríamos de
20 PREÁMBULO: Dos Centros
41. Una consecuencia de admitir una descripción variacional de la dinámica, como formulación
geodésica en el espacio cinemático, es que la propia formulación contiene en su seno al
Principio de Causalidad. Cuando la distancia métrica al cuadrado recorrida entre los
estados inicial y nal es denida positiva, es posible la evolución entre estos estados,
mientras que es imposible cuando la distancia al cuadrado entre ellos no sea denida
positiva, usando la métrica Finsleriana del espacio cinemático. (Sec. 1.7)
42. Una consecuencia, que no una predicción de este formalismo, es que no es equivalente
a la formulación canónica. Es decir, las ecuaciones de Euler-Lagrange son equivalentes
a las ecuaciones de Hamilton si es que el problema variacional de buscar soluciones lo
redujéramos a soluciones con condiciones de contorno en el instante inicial t1 . Sin embargo,
este formalismo está planteado con la condición de que las soluciones de los sistemas
dinámicos deben poder expresarse en términos de las condiciones de contorno en los puntos
extremos de la evolución. Y aquí el formalismo canónico con condiciones de contorno en el
instante inicial t1 ya no es equivalente a las ecuaciones de Euler-Lagrange con condiciones
de contorno en los instantes t1 y t2 . De hecho, la formulación canónica no es necesaria ni
para cuantizar este formalismo ni para la descripción de las partículas con espín que en él
van a aparecer. (Sec. 1.8)
43. Si el centro de carga de una partícula con espín se mueve en círculos, de acuerdo con
la teoría de la radiación de partículas puntuales, la partícula libre con espín debería
estar radiando continuamente. Esto es incompatible con el principio de conservación de
la energía. Hay que desarrollar una teoría de la radiación de partículas con espín, que
contemple la posibilidad de radiación cuando el centro de masa esté acelerado, es decir
cuando la partícula esté sometida a una fuerza externa. En este caso, parte de la energía
recibida por la partícula sería transformada en radiación. Esta teoría de la radiación está
sin hacer. (Cap. 5)
44. El requerimiento de que la energía de cualquier sistema material debe ser un observable
denido positivo, podría estar ligado con la diferencia entre la interpretación pasiva o
activa de las traslaciones temporales. Traslaciones temporales pasivas se corresponden
con un cambio hacia adelante o hacia atrás en el punto cero del reloj que mide el tiempo.
Desde el punto de vista activo solamente podemos realizar traslaciones temporales hacia
el futuro. La magnitud conservada asociada a la invariancia de las leyes de la física bajo
traslaciones temporales solamente puede tener un signo. El concepto de energía negativa
no tendría sentido físico. (Sec: 6.10.3)
1 v2 3 v4 5 v6
γ(v) ≈ 1 + + + + ···
2 c2 8 c4 16 c6
El factor γ alcanza el valor 2 para v/c =0.86603. Obsérvese que hay que llegar a una velocidad
v/c = 0,999 999 999 999 87 (doce nueves) con un factor γ = 2 · 106 , para que la energía del
electrón alcance 1.00213 TeV. Los aceleradores actuales (Tevatrón (FermiLab), LHC (Cern))
alcanzan energías del orden de 4 a 8 TeV. Un electrón con una energía de 1 TeV, su centro de
carga da una vuelta alrededor del centro de masa en un tiempo T ≈ 8 × 10−15 s, mientras éste
recorre una distancia de λ ≈ 2400 nm. Un fotón rojo de 680 nm de longitud de onda posee una
energía de 1.82 eV y da una vuelta mientras recorre esa distancia.
La última columna corresponde a la temperatura en grados Kelvin de un gas de electrones
no relativista cuya velocidad media sea la indicada, y supuesto un sistema de siete grados de
libertad. Los puntos suspensivos de algunos apartados implican que para esas velocidades no es
aplicable el razonamiento de la mecánica estadística no relativista.
7 1
κT = mv 2 , κ = 1.38 · 10−23 J/K (Constante de Boltzmann).
2 2
La primera línea roja en negrita, correspondiente a v/c =0.01, representa la velocidad máxima
a la que los centros de masa de dos electrones con sus espines paralelos puedan formar un estado
ligado, como se analizará en la sección 6.6.
La segunda línea roja en negrita corresponde al experimento, no de muy alta energía, de 80
MeV, que analizaremos en la sección 6.2 al analizar la medida del reloj del electrón.
Capítulo 1
Formalismo Lagrangiano
d2 r
m =F
dt2
siendo r la localización del punto y F la fuerza total externa que actúa sobre él.
Admitiendo que las fuerzas entre partículas satisfacen la tercera ley de Newton, entonces
llegamos a que cualquier agregado material posee un punto característico, el centro de masa q ,
denido mediante ∑
mi r i ∑
q= ∑ , m= mi
mi
y que satisface
∑ d2 q
F ext = m ,
dt2
que se conoce como teorema del centro de masa: El centro de masa de cualquier agregado
material se comporta como una partícula puntual de masa la suma de todas las masas del
sistema, sometido únicamente a la suma de todas la fuerzas externas.
Newton postula que toda la materia se atrae con la ley de la gravitación universal, que
satisface la tercera ley de Newton. Según esto, si intentamos separar un folio en dos partes, la
fuerza que deberemos hacer sería, supuestas las dos partes separadas 10 cm y de 1 g de masa
cada una,
m2
F = G 2 = 6,672 × 10−11 × 0,0012 /0,12 = 6,672 × 10−15 N,
d
muy inferior a la que tenemos que hacer. Es claro que las fuerzas de cohesión de la materia
no son de naturaleza gravitatoria, por lo que entre las partículas elementales deben existir otro
tipo de fuerzas. La teoría Newtoniana deja total libertad al tipo de fuerzas que puedan existir.
Si la partícula puntual posee una propiedad llamada carga, ésta está localizada en el mismo
punto r . Tenemos por lo tanto que toda la materia está construida a partir de puntos materiales
de masas arbitrarias, y por supuesto, cargas arbitrarias, que además de interaccionar de forma
gravitatoria, se atraen, y a veces se repelen, con otro tipo de fuerza más intensa.
Si pudiéramos viajar a tiempos Newtonianos, ir a Cambridge, pedirle audiencia y decirle:
Sir, en el futuro del que venimos se sabe que la materia a nivel elemental, además de masa
posee otra propiedad inmodicable que es su espín. Es posible que Sir Isaac, lo pensara un rato
23
24 CAPÍTULO 1. FORMALISMO LAGRANGIANO
y modicara su segunda ley, para tener en cuenta también la variación del momento angular en
términos de los pares externos. Lo importante es que en el momento en que entra en escena la
mecánica cuántica en la década de 1920, se cuantizaría un formalismo diferente.
El formalismo Newtoniano es poco restrictivo y para las fuerzas F entre partículas no
establece ninguna condición, por lo que todo tipo de interacciones son permitidas. Es la teoría
gauge la que limitará el tipo de interacciones en la formulación cuántica y el principio atómico en
el caso clásico. Tampoco establece ningún criterio mediante el cual las cargas, masas y momentos
angulares de las partículas elementales tengan los valores que tienen. Es la teoría cuántica la
que predecirá estos valores. Sin embargo, hasta el momento, la teoría cuántica solo ha predicho
los valores del espín de las partículas elementales dejando total libertad para los valores de las
masas y cargas.
De todas formas, Newton ya era consciente de la posibilidad de fuerzas internas de corto y
largo alcance, como lo pone de maniesto en su disertación en el libro III de Opticks: 1
Now the smallest particles of matter may cohere by strongest attractions, and compose bigger
particles of weaker virtue; and many of these may cohere and compose bigger particles whose
virtue is still weaker, and so on for diverse successions, until the progression ends in the biggest
particles on which the operations in chemistry, and the colors of natural bodies depend, and
which by cohering compose bodies of a sensible magnitude.
For we must learn from the phenomena of nature what bodies attract one another, and what are
the laws and properties of the attraction, before we inquire the cause by which the attraction is
perform'd. The attractions of gravity, magnetism, and electricity, reach to very sensible distan-
ces, and so have been observed by vulgar eyes, and there may be others which reach to so small
distances as to escape observation.
Como de acuerdo con el modelo estándar todas las partículas elementales conocidas, quarks
y leptones, juntamente con los bosones que median en sus interacciones son partículas con espín,
y además no parecen existir partículas elementales sin espín, es razonable intentar obtener un
formalismo para la descripción clásica del espín. El interés de una descripción clásica del espín
es que puede suministrar modelos razonables cuyo comportamiento se aproxime a los resultados
experimentales, mucho mejor que utilizando el modelo de partícula puntual sin espín. De todas
formas no hay que olvidar que la materia a nivel elemental se comporta con más precisión de
acuerdo con las leyes de la mecánica cuántica. Pero una descripción clásica menos simple, nos
va a permitir desarrollar un formalismo cuántico más detallado, en términos de más variables
que den cuenta de su estructura, y por lo tanto, se intuye, que la cuantización de modelos con
espín será algo más detallada y completa que la cuantización de partículas sin espín.
Feynman, en el primer capítulo de sus Lectures on Physics 2 , plantea que If, in some ca-
taclysm, all of scientic knowledge were to be destroyed, and only one sentence passed on to
the next generations of creatures, what statement would contain the most information in the
fewest words? I believe it is the atomic hypothesis (or the atomic fact or whatever you wish to
call it) that all things are made of atoms-little particles that move around in perpetual motion,
attracting each other when they are a little distance apart, but repelling upon being squeezed into
one another.
Si la hipótesis atómica parece ser un principio fundamental, la física tiene que explotar este
hecho y convenientemente denido debe formar parte de los principios fundamentales de una
1
I. Newton, Opticks, A treatise of the Reections, Refractions, Inections and Colours of Light, Dover, NY
1952, p.394.
2
Feynman RP, Leighton RB and Sands M 1968 The Feynman Lectures on Physics, (NY: Addison Wesley)
Vol 1, Sec 1-2.
1.2. PRINCIPIOS FUNDAMENTALES 25
física de partículas, que es lo que haremos en seguida. Los libros de física, al tratar la idea del
atomismo, se contentan con mencionar a Leucipo y a Demócrito de Abdera, como los defensores
de la idea de que la materia es al nal, un conjunto discreto de unidades indivisibles (los átomos).
Demócrito añade, además, que estos objetos últimos son inmutables. Es difícil saber qué es lo
que Demócrito quería decir con inmutabilidad hace 2500 años. Pero esta idea lo que contiene
es que un sistema compuesto es modicable y una partícula elemental no. A una molécula la
podremos excitar, rotar con una cierta velocidad angular, deformar, modicar su masa, pero a
un electrón ni le podemos modicar su masa ni le podemos hacer rotar con cualquier velocidad.
A lo sumo lo que podemos es cambiar la orientación de su velocidad angular. La masa y el valor
absoluto del espín de un electrón son propiedades inmutables. El principio atómico nos va a llevar
a que el número y tipo de variables clásicas que caracterizan los estados de cualquier sistema
material, no están restringidos, pero sí lo están para una partícula elemental. Es un principio
tan restrictivo que nos va a conducir, entre otras cosas al llamado acoplamiento mínimo cuando
analicemos la interacción de sistemas compuestos por partículas elementales y por lo tanto a
restringir el tipo de interacciones permitidas.
El formalismo cinemático que vamos a desarrollar, aunque en sus orígenes se planteó para
dar cuenta de la descripción clásica del espín, ha demostrado ser un método potente para la
descripción de partículas elementales también desde el punto de vista cuántico, ya que sumi-
nistra una denición muy precisa de partícula elemental que tiene como contrapartida cuando
se cuantiza el formalismo, la denición de Wigner: Todos los sistemas elementales que se van a
describir poseen la característica de que al cuantizarlos, su espacio de Hilbert de estados puros
genera una representación proyectiva, unitaria e irreducible del grupo cinemático correspon-
diente. Es precisamente a través del formalismo de cuantización de Feynman que la descripción
clásica y cuántica se complementan entre sí.
El formalismo que vamos a desarrollar se basa en los siguientes cuatro principios fundamen-
tales:
Principio Variacional,
Principio Atómico,
Principio de Cuantización.
observador O′ mide t′ y r ′ del mismo acontecimiento, estos valores están relacionados por
t′ = t + b, r ′ = R(α)r + vt + a,
donde los diez números reales (b, a, v, α) son jos para esos dos observadores, y donde por α
queremos representar los tres parámetros que denen la orientación relativa entre los sistemas
cartesianos de ambos observadores. Estas relaciones se dicen que son el grupo de Galileo de
transformaciones del espacio-tiempo, que es por lo tanto, el grupo cinemático de un formalis-
mo no relativista. Si en vez de estas transformaciones utilizamos las del grupo de Poincaré,
analizadas en el apéndice al nal del segundo capítulo, estaremos en un formalismo relativista.
Este principio no es solamente una declaración de universalidad restringida de las leyes
de la física, es también el establecimiento de que las medidas relativas de cualquier magnitud
física entre diferentes observadores inerciales, dependen de cómo se relacionan las medidas de
acontecimientos espacio-temporales entre ellos. Por universalidad restringida queremos decir que
las leyes de la física no son las mismas para todos los observadores, sino para una clase restringida
de ellos, los denominados observadores inerciales a los que queda restringido el formalismo.
Si un observador está describiendo un fenómeno electromagnético y cambiamos a un sistema
de referencia acelerado, en este sistema, además del fenómeno electromagnético, detectaremos
la presencia de un campo de inercia, indistinguible de un campo gravitatorio, y por lo tanto este
nuevo observador describe fenómenos no descritos por el otro. No son observadores equivalentes.
Vamos a restringirnos a observadores que describen los mismos fenómenos, por lo que se trata
de plantear un principio restringido.
Es el Principio de Relatividad General el que admite la invariancia general bajo cualquier
cambio de observadores, pero si incluimos la gravitación entre las posibles interacciones, ya que
no es posible distinguir físicamente entre un cambio a un sistema de referencia acelerado, de
la presencia de un campo gravitatorio local. También se suele admitir que las leyes de la física
deben ser invariantes bajo cualquier cambio de variables lo que lleva a postularlo de forma
matemática con el nombre de Principio de Covariancia General.
Admitir este Principio de Relatividad Restringido es jar el correspondiente grupo cine-
mático en el arranque del formalismo que proponemos, ya que, como veremos, jados dos
observadores cualesquiera, las medidas relativas de cualquier otra magnitud física dependen
exclusivamente de este grupo. Y por otra parte, que entre las posibles interacciones que se pue-
dan describir en este formalismo, no está incluida la gravedad, la cual vendrá descrita en un
contexto diferente.
dp
= e (E + u × B) ,
dt
donde p es el momento lineal de la partícula, u la velocidad del centro de carga y E y B el
campo electromagnético externo. Y esta ecuación de la dinámica va a depender del tipo de
variables que describen a la partícula elemental y no del contexto, es decir que vale tanto en
el caso relativista como en el no relativista. En este contexto clásico no hemos sido capaces
de describir otro tipo de interacciones. La interacción débil y fuerte se obtienen en el contexto
cuántico bajo la hipótesis de la invariancia gauge local.
que actuar, no puede dividirse ni tampoco se deformará. No puede poseer estados excitados.
De alguna manera, si la estructura de una partícula elemental no puede ser modicada, esto
implica que los posibles estados en los que podemos encontrarla son simplemente modicaciones
cinemáticas de uno cualquiera de ellos. Como en el proceso de aislar una partícula elemental
necesitamos un número nito de etapas, esto signica que en la descripción de la partícula
elemental necesitamos un número nito de variables para describir sus estados. Si el estado de
una partícula elemental cambia, siempre podremos encontrar algún otro observador inercial que
la describa en el mismo estado que antes de la modicación, es decir con los mismos valores de
todas las variables esenciales que caracterizan su estado. Un electrón sigue siendo un electrón
aunque se le someta a una interacción. Esto va a implicar una restricción en el tipo de variables
clásicas que podemos usar para describir sus estados en una descripción variacional.
Es esta distinción explícita, entre los sistemas materiales compuestos y las partículas ele-
mentales, formando parte del formalismo, y la aceptación de la existencia de las partículas
elementales como un hecho destacado, lo que da contenido a este principio atómico, como prin-
cipio fundamental.
Estos tres principios enunciados, completan el marco clásico del formalismo. Para su cuan-
tización deberemos sustituir este último principio variacional por el siguiente cuarto principio.
the two formulations are, of course, closely related, but there are reasons for believing that the Lagrangian one
is more fundamental.
5
L.M. Brown (editor), Feynman's thesis: A new approach to quantum theory, (World Scientic 2005)
6
M. Ostrogradsky, Mémoire sur les équations diérentielles relatives au problème des isopérimètres, Mem.
Acad. St. Petersburg, 6(4), 385-517 (1850).
30 CAPÍTULO 1. FORMALISMO LAGRANGIANO
en cambio si la Lagrangiana depende hasta las derivadas de orden k de los grados de libertad,
estas ecuaciones resultan ser
( ) ( )
∂L d ∂L k
k d ∂L
− + · · · + (−1) k = 0, i = 1, . . . , n, (1.1)
∂qi dt ∂q (1) dt ∂q
(k)
i i
donde el orden de derivación temporal de los grados de libertad, en vez de un punto, lo hemos
escrito en forma de un superíndice entre paréntesis. Vamos a llegar a estas ecuaciones, como
condición necesaria de que la solución haga a la acción extremal. Pero también es importante
el resaltar, que en el formalismo variacional que nos lleva a estas ecuaciones (1.1), debemos
imponer condiciones de contorno en los dos extremos de la evolución, que se mantienen jas.
Además de construir las ecuaciones de Euler-Lagrange, vamos a ver cuáles son estas variables
independientes y esenciales que nos denen los estados inicial y nal de la evolución, y que
denominaremos variables cinemáticas. En particular el principio atómico nos limitará cuáles
son estas variables para las partículas elementales.
Finalmente, analizaremos la estructura del espacio de las variables cinemáticas y veremos
que para cualquier sistema mecánico es siempre un espacio métrico, pero no Riemanniano sino
Finsleriano. De esta manera, si un mismo sistema mecánico caracterizado por un conjunto de
variables cinemáticas, se analiza bajo dos interacciones diferentes, desde el punto de vista geomé-
trico implica que la métrica del mismo espacio cinemático en las dos situaciones de interacción,
es una métrica Finsleriana diferente. Así, la gravedad, se estudiará como una modicación de la
métrica generada por los contenidos materiales de todos los objetos, incluido el propio sistema
mecánico, pero sin exigir la invariancia frente a un grupo cinemático.
∫ t2
(1) (k)
A[q] = L(t, qi (t), qi (t), . . . , qi (t))dt, (1.2)
t1
donde i = 1, . . . , n. Para cada posible trayectoria qi (t) introducida en (1.2), nos suministra un
número real, la acción sobre esa trayectoria.
Una vez que tenemos denido el funcional acción (1.2) para un determinado camino arbitrario
qi (t), para analizar su variación, producimos una modicación innitesimal del mismo qi′ (t), que
′ (s)′ (s) (s)
lo escribimos qi (t) = qi (t) + δqi (t) y de todas sus derivadas temporales qi (t) = qi (t) + δqi (t),
manteniendo jos los extremos de la evolución, es decir, que en t1 y t2 la modicación de las variables
(s) (s)
generalizadas y sus derivadas hasta el orden k−1, se anulen, y por lo tanto, δqi (t1 ) = δqi (t2 ) = 0,
para i = 1, . . . , n y s = 0, 1, . . . , k − 1 (ver gura 1.1).
Figura 1.1: Caminos q(t) y q ′ (t) modicado pasando por los mismos estados extremos 1 y 2
(s) (s) (s)
La variación de las diferentes derivadas de qi (t) viene dada por qi (t) → qi (t) + δqi (t) =
(s) s s
qi (t) + d δqi (t)/dt , puesto que la modicación de la derivada de orden s es precisamente la
derivada de orden s de la modicación de la función. Esto lleva a que el funcional acción sufre una
modicación entre ambos caminos, δA = A[q + δq] − A[q], dada por:
∫ t2 ∫ t2
(s) (s) (s)
δA = L(t, qi (t) + δqi (t))dt − L(t, qi (t))dt
t1 t1
∫ [ ]
t2 ∑n
∂L ∂L (1) ∂L (k)
= dt δqi + (1) δqi + · · · + (k) δqi , (1.3)
t1 i=1
∂qi ∂qi ∂qi
después de desarrollar a orden más bajo la primera integral y restarle la segunda. El término
( ) ( )
∂L (1) ∂L d d ∂L d ∂L
(1)
δqi = (1)
δqi = (1)
δqi − (1)
δqi ,
∂qi ∂qi dt dt ∂qi dt ∂qi
∫ ∫ ( )
t2 t2
∂L (1) ∂L ∂L d ∂L
(1)
δqi dt = (1)
δqi (t2 ) − (1)
δqi (t1 ) − (1)
δqi dt
t1 ∂qi ∂qi ∂qi t1 dt ∂qi
∫ ( )
t2
d ∂L
=− (1)
δqi dt,
t1 dt ∂qi
ya que las variaciones δqi (t1 ) y δqi (t2 ), se anulan. Lo mismo para el siguiente término:
( ) ( )
∂L (2) ∂L d (1) d ∂L (1) d ∂L (1)
(2)
δqi = (2) dt
δqi = (2)
δqi − (2)
δqi ,
∂qi ∂qi dt ∂qi dt ∂qi
∫ ∫ ( ) ∫ ( )
t2 t2 t2
∂L (2) d ∂L (1) d2 ∂L
δqi dt =− δqi dt = δqi dt,
t1
(2)
∂qi t1 dt ∂qi
(2)
t1 dt2 ∂qi
(2)
(1)
ya que δqi y δqi se anulan en t1 y t2 , y nalmente para el último término
∫ ∫ ( )
t2 t2
∂L (k) dk ∂L
δqi dt = (−1)k δqi dt,
t1 ∂qi
(k)
t1 dtk ∂qi
(k)
32 CAPÍTULO 1. FORMALISMO LAGRANGIANO
de tal manera que cada término de (1.3) se escribe solamente en términos de las variaciones de
los grados de libertad δqi
y no de sus derivadas de orden superior. Observar de nuevo que para
(s)
llegar hasta aquí ha sido necesario suponer la anulación de las variaciones de todas las δqi , para
s = 0, . . . , k − 1, en los instantes t1 y t2 . Recolectando todos los términos, obtenemos
∫ [ ( ) ( )]
t2 ∑n
∂L d ∂L k d
k
∂L
δA = dt − + · · · + (−1) δqi (t).
t1 i=1
∂qi dt ∂qi(1) dtk ∂qi(k)
Si el funcional acción es extremal sobre el camino qi (t), su variación debe ser nula, δA = 0. Como
las modicaciones del camino δqi (t) son arbitrarias, todos los términos entre paréntesis cuadrados
deben anularse de forma idéntica. Obtenemos así, un sistema de ecuaciones diferenciales ordinarias
( ) ( )
∂L d ∂L dk ∂L
− (1)
+ · · · + (−1)k k (k)
= 0, i = 1, . . . , n, (1.4)
∂qi dt ∂qi dt ∂qi
las denominadas ecuaciones de Euler-Lagrange (1755). 7 8
Una vez que la integral temporal se calcula, el resultado será una función explícita de las kn + 1
(r)
variables en el instante inicial, qj (t1 ), r = 0, . . . , k − 1, incluyendo el tiempo t1 , y de las
correspondientes kn + 1 variables en el instante nal t2 . También será función de los parámetros
y constantes intrínsecas del sistema material. Lo escribimos como
( )
(r) (r)
A t1 , qi (t1 ); t2 , qi (t2 ) ≡ A(x1 , x2 ).
Y llegamos a la siguiente
Denición: Las variables cinemáticas del sistema son el tiempo t y los n grados
de libertad qi y sus derivadas hasta el orden k − 1. La variedad que generan X recibe
el nombre de espacio cinemático o espacio de los estados del sistema.
∫ τ2
= e (x(τ ), ẋ(τ )) dτ,
L (1.7)
τ1
donde ahora el punto signica tomar la derivada con respecto al parámetro de evolución τ , que
e ≡ L(t, qi , q̇ (s) /ṫ) ṫ(τ ),
sin pérdida de generalidad se puede escoger adimensional. Por lo tanto L i
s = 1, . . . , k − 1, tiene dimensiones de acción.
10
P.A.M. Dirac, Proc. Cam. Phil. Soc. 29, 389 (1933): a greater elegance is obtained, a symmetrical treat-
ment suitable for relativity.
11
Finsler geometry, Relativity and Gauge theories, Reidel Pub. Co, Dordrecht (1985).
G.S. Asanov,
12
Methods of Mathematical Physics, Vol. 1, Interscience, N.Y. (1970); I.M. Gelfand,
R. Courant, D. Hilbert,
S.V. Fomin, Calculus of Variations Prentice Hall, Englewood Clis, N.J. (1963).
1.3. PRINCIPIO VARIACIONAL: FORMALISMO LAGRANGIANO 35
donde hemos usado el criterio habitual de suma sobre el índice mudo j , extendido al conjunto
de todas las variables cinemáticas.
A[ q ] es un funcional sobre los posibles caminos, es decir, toma en general valores diferentes
para los diferentes caminos que unen cada par de puntos jos x1 y x2 . Entonces, para que se
produzcan en general, valores diferentes, es necesario que Ldτ e no sea una diferencial exacta.
En caso contrario, si Ldt = dλ, entonces A[ q ] = λ(x2 ) − λ(x1 ) y el funcional no distingue con
valores diferentes entre los diferentes caminos, y la función acción del sistema entre x1 y x2 ,
es esa única integral A(x1 , x2 ) = λ(x2 ) − λ(x1 ), que queda expresada en función de la función
λ(x), siendo por lo tanto, independiente del camino.
Si λ(x) es una función real denida sobre el espacio cinemático X de un sistema Lagrangiano
cuya función acción sea A(x1 , x2 ), entonces la función A′ (x1 , x2 ) = A(x1 , x2 ) + λ(x2 ) − λ(x1 ) es
otra función acción equivalente a A(x1 , x2 ) en el sentido de que produce las mismas ecuaciones
dinámicas. En efecto, por (1.10) da lugar a una Lagrangiana Le′ que diere de L e en una derivada
total con respecto a τ . 13
e ẋ) + dλ(x) ,
Le′ (x, ẋ) = L(x, (1.12)
dτ
e y Le′ producen las mismas ecuaciones dinámicas y A(x1 , x2 ) y A′ (x1 , x2 ) se dice
y por lo tanto L
que son funciones acción equivalentes.
Supongamos una Lagrangiana de un sistema de un grado de libertad L(t, q, q̇) y la modicamos a
L′ = L + dλ(t, q)/dt. ′
Las ecuaciones dinámicas a partir de L son:
grados de libertad o de derivadas de orden superior. La única condición es que λ sea función de las
variables cinemáticas.
y también
A(g ′ gx1 , g ′ gx2 ) = A(gx1 , gx2 ) + α(g ′ ; gx2 ) − α(g ′ ; gx1 )
= A(x1 , x2 ) + α(g; x2 ) − α(g; x1 ) + α(g ′ ; gx2 ) − α(g ′ ; gx1 ),
y por lo tanto, por identicación con el anterior (1.16), recolectando los términos con el mismo
argumento x, se llega a
y como x1 y x2 son dos puntos arbitrarios de X, esta expresión es (1.15) y dene una función
ξ(g ′ , g), independiente de x.
La condición que requiere el teorema de Noether para la transformación de la función acción es equivalente a
que la Lagrangiana transforme bajo una transformación innitesimal de la forma:
e
L(δgx, e ẋ) + dλ(x) δg,
δg ẋ) = L(x,
dτ
es decir que sea invariante salvo una derivada total de una función de las variables cinemáticas.
Demostración:
Supongamos que tenemos un grupo continuo uniparamétrico de transformaciones G, del espacio
de conguración ampliado (t, qi ), que puede extenderse a un grupo de transformaciones de todo
el espacio cinemático X . Sea δg un elemento innitesimal de G, y su acción sobre estas variables
viene dada por:
y en general
(0) (s)
donde M0 y Mi son únicamente funciones de qi y de t mientras que las funciones Mi con
s ≥ 1, se obtienen a partir de las derivadas de aquellas, y serán funciones del tiempo t y de las
variables qi y sus derivadas hasta el orden s.
15
Emmy Amalie Noether Nace en Erlangen, Baviera, Alemania, el 23 de marzo de 1882 y
fallece en Bryn Mawr, Pennsylvania, USA, el 14 de abril de 1935. Sus mayores contribuciones en
matemáticas son en el campo del álgebra abstracta, anillos y módulos. Sin embargo su inuencia
en la física teórica es importante con el teorema que aquí se presenta y su teoría de invariantes, que
condujo a Einstein a formular distintos conceptos en su teoría de la relatividad general.
1.4. TEOREMA DE NOETHER GENERALIZADO 39
Por ejemplo,
dq ′ i (t′ )
(0)
d(qi (t) + Mi δg) dt
q ′ i (t′ ) ≡
(1)
= ,
dt′ dt dt′
pero a primer orden en δg
(0)
(1) dMi (t, q) (1) dM0 (t, q)
Mi (t, q, q (1) ) = − qi ,
dt dt
donde las derivadas totales
(s) (s−1)
Las demás Mi para s > 1, se obtienen de la misma forma a partir de la funciones Mi .
Si reemplazamos en la primera integral el intervalo de integración (t′1 , t′2 ) por (t1 , t2 ) sabiendo
que el Jacobiano de t′ en términos de t implica que el diferencial dt′ = (1 + d(δt)/dt)dt, y por
lo tanto:
∫ t2 ( ) ∫ t2
(s) (s) d(δt) (s)
δA[ q ] = L(t + δt, qi + δqi ) 1 + dt − L(t, qi )dt
t1 dt t1
∫ t2 ( )
d(δt) ∂L ∂L (s)
= L + δt + (s) δqi (t) dt,
t1 dt ∂t ∂q i
habiendo reemplazado la Lagrangiana L(t + δt, q (s) + δq (s) ), por su desarrollo Taylor a primer
orden en las variaciones δt y δq (s) .
En la variación de δqi (t) = q ′ i (t′ ) − qi (t) está contenida una variación en la forma de la
(s) (s) (s)
(s)
función qi (t), y una variación de su argumento t, (ver gura 1.2), el cual también es afectado
por la transformación del grupo, y por lo tanto,
(s) (s)
donde δ̄qi (t) es la variación en la forma de la función qi (t) en el instante t. Sabiendo que
para la variación de forma a t constante
(s) (s−1)
δ̄qi (t) = ds (δ̄qi (t))/dts = d(δ̄qi (t))/dt,
40 CAPÍTULO 1. FORMALISMO LAGRANGIANO
Figura 1.2: Transformación del punto A en el A′ , y de la curva q(t) en la q ′ (t′ ) bajo una
transformación innitesimal. La variación δq = q′ (t′ ) − q(t) = BA′ es la suma de la parte
BC = q (1) δt y la parte CA′ = δ̄q , que es la variación a t constante de la función q , y que aquí
la denominamos la variación en forma de la función.
resulta que
∫ ( )
t2
d(δt) ∂L ∂L (s) ∂L (s+1)
δA[ q ] = L + δt + (s) δ̄qi (t) + (s) qi δt dt
t1 dt ∂t ∂qi ∂qi
∫ ( )
t2
d(Lδt) ∂L (s)
= + (s) δ̄qi (t) dt. (1.22)
t1 dt ∂qi
donde el primer término es la suma del primero, segundo y cuarto de la integral anterior.
Si reemplazamos en los últimos términos
∂L ∂L
δ̄qi = δ̄qi ,
∂qi ∂qi
( ) ( )
∂L (1) ∂L d(δ̄qi ) d ∂L d ∂L
δ̄q
(1) i
= (1) dt
= δ̄qi − δ̄qi ,
∂qi ∂qi dt ∂q (1) dt ∂q (1)
( ) (
i
) i
∂L (2) d ∂L (1) d ∂L (1)
(2)
δ̄qi = (2)
δ̄qi − (2)
δ̄qi
∂qi dt ∂q dt ∂q
i i
( ) ( ( ( ) ) )
d ∂L (1) d d ∂L d2 ∂L
= δ̄q − δ̄qi + 2 δ̄qi ,
dt ∂q (2) i dt dt ∂q (2) dt ∂q
(2)
i i i
( ) ( ( ) ) ( )
∂L d ∂L d d ∂L k
(k) (k−1) (k−2) k d ∂L
δ̄qi = δ̄q − δ̄qi + · · · + (−1) k δ̄qi ,
(k)
∂qi dt ∂q (k) i dt dt ∂q (k) dt ∂q
(k)
i i i
y juntando términos, obtenemos
∫ t2 {
d(Lδt)
δA[ q ] = dt +
t1 dt
1.4. TEOREMA DE NOETHER GENERALIZADO 41
[ ( ) ( )]
∂L d ∂L d k ∂L
+δ̄qi − + · · · + (−1)k k (1.23)
∂qi dt ∂q (1) dt (k)
∂qi
( [ i
( ) ( )])
d ∂L d ∂L dk−1 ∂L
+ δ̄qi (1)
− (2)
+ · · · + (−1)k−1 k−1 (k)
(1.24)
dt ∂qi dt ∂q dt ∂q
( [ (i ) (i )])
d ∂L d ∂L dk−2 ∂L
(1)
+ δ̄qi (2)
− (3)
+ · · · + (−1)k−2 k−2 (k)
(1.25)
dt ∂qi dt ∂qi dt ∂qi
( [ ])}
d (k−1) ∂L
+ ··· + δ̄qi (k)
. (1.26)
dt ∂q i
∂L
pi = .
∂ q̇i
Como generalización de esto, para sistemas Lagrangianos con derivadas de orden superior, el for-
malismo canónico generalizado se obtiene deniendo como variables generalizadas los grados de
(s)
libertad qi y sus derivadas temporales qi hasta el orden k − 1, es decir las variables generalizadas
son todas las variables cinemáticas excluído el tiempo. Entonces cada variable generalizada posee
16
un momento canónico conjugado denido de acuerdo con los paréntesis cuadrados anteriores:
( ) ( )
∂L d ∂L dk−1 ∂L
pi(1) = − + · · · + (−1) k−1
(1.27)
(1)
∂qi dt ∂qi
(2) dtk−1 (k)
∂qi
( ) ( )
∂L d ∂L dk−2 ∂L
pi(2) = − + · · · + (−1) k−2
(1.28)
(2)
∂qi dt ∂qi
(3) dtk−2 (k)
∂qi
...
∂L
pi(k) = (k)
(1.29)
∂qi
(s−1)
Se dice que pi(s) es el momento conjugado de la variable qi
y como regla general se ve que en
(s)
su denición, el primer término contiene la derivada parcial de L
con respecto a qi , es decir a la
(s−1)
primera derivada temporal de la correspondiente variable generalizada canónico conjugada qi .
Se puede ver de su denición que estos momentos satisfacen
∂L dpi(s+1)
pi(s) − (s)
=− , i = 1, . . . , n, s = 1, . . . , k − 1. (1.30)
∂qi dt
Con esta denición de los momentos canónicos, las ecuaciones de Euler-Lagrange (1.4) se escriben:
dpi(1) ∂L
= , i = 1, . . . , n. (1.31)
dt ∂qi
De esta manera, si la Lagrangiana no es función explícita de algún grado de libertad qi , entonces
el correspondiente momento canónico conjugado pi(1) , es una constante del movimiento.
donde los pi(s) están dados en (1.27-1.29). Si reemplazamos en (1.32) la variación en forma
(s) (s) (s+1)
δ̄qi = δqi − qi δt, entonces
∫ t2
d { (s−1) (s)
}
δA(x1 , x2 ) = Lδt + δqi pi(s) − qi pi(s) δt dt (1.33)
t1 dt
con el criterio habitual de suma sobre índices repetidos. Si sustituimos las variaciones δt = M0 δg
(s) (s)
y δqi = Mi δg , en términos del elemento innitesimal del grupo δg , (1.18-1.21), obtenemos:
∫ t2
d {( (s)
)
(s−1)
}
δA(x1 , x2 ) = L − pi(s) qi M0 + pi(s) Mi δgdt, (1.34)
t1 dt
es tal que a primer orden en el parámetro innitesimal del grupo la podemos poner como
que es equivalente a que la Lagrangiana transforme bajo una transformación innitesimal como
e
L(δgx, e ẋ) + δg dλ(x) ,
δg ẋ) = L(x,
dτ
que implica que las ecuaciones dinámicas son invariantes. Igualando (1.35) a (1.34) podemos
realizar la integral temporal de (1.34) que se reduce al término entre corchetes evaluado en
t2 menos él mismo evaluado en t1 . El valor del parámetro δg del grupo se cancela en ambos
miembros, y reagrupando los términos que dependen de t1 a la izquierda y los de t2 derecha,
obtenemos un observable que toma los mismos valores en los dos instantes arbitrarios t1 y t2 .
Es, por lo tanto, una constante del movimiento y representa la magnitud física conservada
( )
(s) (s−1)
N = λ(x) − L − pi(s) qi M0 (t, q) − pi(s) Mi (t, q, . . . , q (s) ). (1.36)
(s)
El término entre paréntesis H = pi(s) qi − L, suma de los productos de cada momento por
la derivada temporal de la correspondiente variable generalizada canónico conjugada menos la
Lagrangiana, recibe el nombre de Hamiltoniano generalizado, de tal manera que nalmente
(s−1)
N = λ(x) + HM0 (t, q) − pi(s) Mi (t, q, . . . , q (s) ). (1.37)
son funciones de las variables cinemáticas. Si consideramos que el Hamiltoniano fuera el mo-
mento conjugado de la variable tiempo, aparece en cada término el correspondiente momento
multiplicado por la forma innitesimal de transformar la correspondiente variable cinemática
(s) (s) (k−1)
canónico conjugada, δt = δgM0 , δqi = δgMi , s = 0, 1, . . . , k − 1, desde t hasta la qi .
La única diferencia es que el término del Hamiltoniano aparece afectado por el signo +, en
tanto que el resto de los pi aparecen con signo −. Tendríamos tantos momentos canónicos como
variables cinemáticas.
Como λ(x)δg tiene dimensiones de acción, todos los términos de (1.37) tienen las mismas
dimensiones que λ(x) y por lo tanto las constantes del movimiento Noetherianas tienen
la dimensión complementaria frente a la acción, de la dimensión del parámetro δg
del grupo de simetrías.
El Hamiltoniano y los diferentes momentos se escriben en términos de las funciones Fi (x, ẋ)
del desarrollo (1.8) de la Lagrangiana y de sus derivadas temporales, como vemos en este ejemplo.
Por ejemplo, si tenemos una Lagrangiana que depende hasta la derivada segunda de un grado
de libertad e r, u, ṫ, ṙ, u̇). La Lagrangiana L
r, L(t, r, dr/dt, d2 r/dt2 ) ≡ L(t, r, u, a), y la L(t, e se puede
escribir
e
e = ∂ L x˙i = Fi (x, ẋ)x˙i = T ṫ + Rṙ + U u̇,
L
∂ x˙i
donde las funciones T = ∂ L/∂e ṫ, R = ∂ L/∂
e ṙ y U = ∂ L/∂
e u̇, son funciones homogéneas de grado
cero de las derivadas ẋi , y por lo tanto son funciones de (t, r, u, a). Las variables cinemáticas son,
x ≡ {t, r, u} y las variables generalizadas son q ≡ {r, u} por lo que hay un momento canónico
conjugado de r , pr y otro pu el canónico conjugado de u. Vemos que:
∂L e ṫ) ∂ ṙ
∂(L/ 1 ∂L e ∂Le
= = ṫ = =R
∂u ∂ ṙ ∂u ṫ ∂ ṙ ∂ ṙ
∂L e ṫ) ∂ u̇
∂(L/ 1 ∂L e ∂Le
= = ṫ = =U
∂a ∂ u̇ ∂a ṫ ∂ u̇ ∂ u̇
pues u̇ = aṫ.
El momento pr se dene de acuerdo con (1.27-1.29)como
( ) ( )
∂L d ∂L ∂Le d ∂Le dU
pr = − = − =R− ,
∂u dt ∂a ∂ ṙ dt ∂ u̇ dt
y el momento pu
∂L ∂Le
pu = = = U,
∂a ∂ u̇
que han quedado expresados en términos de las funciones Fi (x, ẋ) y de sus derivadas temporales.
La Lagrangiana
e ṫ = T + Ru + U a,
L = L/
y el Hamiltoniano generalizado
dU dU
H = pr u + pu a − L = Ru − u + U a − T − Ru − U a = −T − u.
dt dt
Los observables H y pi(s) son funciones homogéneas de grado cero en las derivadas de las
(s)
variables cinemáticas ẋi . Las funciones λ(x) y Mi (x) dependen únicamente de las variables
cinemáticas. En consecuencia, las constantes del movimiento Noetherianas son funciones homo-
géneas de grado cero en las derivadas de las variables cinemáticas y por lo tanto invariantes
bajo cambios arbitrarios del parámetro de evolución. Son funciones de las derivadas temporales
de los grados de libertad.
44 CAPÍTULO 1. FORMALISMO LAGRANGIANO
Los grupos de Galileo y de Poincaré son grupos de Lie de diez parámetros y por lo tanto los
espacios homogéneos más amplios que podemos encontrar en ellos son de dimensión 10. Además,
las variables que denen a los espacios homogéneos comparten con los parámetros del grupo
sus mismos dominios, su dimensionalidad y su signicación geométrica. Ambos grupos, como
veremos más adelante, se pueden parametrizar en términos de 10 variables (b, a, v, α) con los
siguientes dominios y dimensiones, b ∈ R representa un parámetro con dimensiones de tiempo
17
E.P. Wigner, Ann. Math. 40, 149 (1939)
18
M. Rivas, J. Phys. A 18, 1971 (1985); J. Math. Phys. 30, 318 (1989); J. Math. Phys. 35, 3380 (1994).
1.5. PRINCIPIO ATÓMICO: PARTÍCULAS ELEMENTALES 45
( )2 2
1 dr e 0 = 1 m ṙ
L0 = m , L
2 dt 2 ṫ
en términos de los grados de libertad y también como función homogénea de grado 1 en términos de
las derivadas de las variables cinemáticas. Podemos ver que e0
L depende de las derivadas de todas las
variables cinemáticas. Las ecuaciones de Euler-Lagrange a partir de L0 se reducen a d2 r/dt2 = 0,
e imponemos como condiciones de contorno que la solución pase por los estados inicial y nal x1 y
x2 , respectivamente,
r2 − r1
r(t) = r 1 + (t − t1 ), t ∈ [t1 , t2 ]
t2 − t1
46 CAPÍTULO 1. FORMALISMO LAGRANGIANO
La función acción, es decir la integral de la Lagrangiana a lo largo del camino clásico vale
∫ ( )2
m t2
r2 − r1 m (r 2 − r 1 )2
A(x1 , x2 ) = dt = ,
2 t1 t2 − t1 2 t2 − t1
que nalmente se expresa en términos de las variables cinemáticas de los estados inicial y nal y
del único parámetro característico de la partícula elemental sin espín, que es la masa m.
La Lagrangiana e0
L se puede obtener de la función acción mediante el proceso de límite (1.10)
derivándola con respecto a las variables t2 y r 2 y haciendo el límite 2 → 1,
[ ] [ ]
∂A ∂A m (r 2 − r)2 (r 2 − r) · ṙ m ṙ 2 e0 .
lı́m ṫ + ṙ2i = lı́m − ṫ + 2 = =L
2→1 ∂t2 ∂r2i 2 2→1 (t2 − t)2 t2 − t 2 ṫ
El teorema de Noether nos va a llevar a que la energía y el momento lineal se expresen en términos
de las derivadas de la e0 ,
L en la forma:
( )2
∂Le0 1 ṙ 2 m dr e0
∂L ṙ dr
H=− = m 2 = , p= =m =m ,
∂ ṫ 2 ṫ 2 dt ∂ ṙ ṫ dt
funciones homogéneas de grado cero en términos de las derivadas de las variables cinemáticas, y
por lo tanto dependientes de las derivadas temporales de los grados de libertad. El resultado es
que las magnitudes conservadas son independientes del parámetro arbitrario de evolución τ.
Esta Lagrangiana es una función homogénea de grado 1 en las derivadas ṫ y ṙ , lo que nos permite
ponerla como una suma de tantos términos como variables cinemáticas:
e e
e 0 = ∂ L0 ṫ + ∂ L0 ṙi = −H ṫ + p · ṙ.
L
∂ ṫ ∂ ṙi
Ejemplo: Sistema no elemental. Supongamos un sistema material que viene caracterizado por
las siguientes variables cinemáticas: (t, r 1 , r 2 ), es decir el tiempo y la posición de dos puntos. Si doy
dos conjuntos de esos valores en los puntos extremos de la evolución x1 ≡ (t(τ1 ), r 1 (τ1 ), r 2 (τ1 )) y
x2 ≡ (t(τ2 ), r 1 (τ2 ), r 2 (τ2 )), no es posible encontrar un cambio de sistema de referencia inercial que
los ligue, ya que si la traslación temporal nos lleva t(τ1 ) a t(τ2 ) y la traslación espacial desplaza
r 1 (τ1 ) a r 1 (τ2 ), es imposible, en general, que traslade r 2 (τ1 ) a r 2 (τ2 ), salvo que estuvieran rígi-
damente ligados con r1 . El espacio cinemático no es un espacio homogéneo ni siquiera del grupo
de traslaciones. Este sistema de 6 grados de libertad no puede ser considerado como una partícula
elemental.
respectivamente, y la conservación del momento angular no queda descrita para esta partícula.
La Lagrangiana que describa este sistema será función de (t, r, u), siendo u = dr/dt la velocidad
del punto r .
Compliquemos un poco el grupo y admitamos que las leyes de la física son también inva-
riantes por rotación de los sistemas de referencia. Entonces el grupo G viene dado por
t′ = t + b, r ′ = R(α)r + a,
dependiente de siete parámetros. El espacio homogéneo más amplio será el propio grupo y ten-
dremos como variables cinemáticas a (t, r, α), tantas como los parámetros del grupo y diremos
que la partícula elemental, además de estar localizada en el punto r , posee una orientación des-
crita por las variables α. La Lagrangiana que describa este sistema será función de (t, r, u, α, ω),
dependerá, además de la velocidad del punto r , u = dr/dt, de la velocidad de cambio de la
orientación, o velocidad angular ω . Para este tipo de partícula, el teorema de Noether ya nos
brinda la denición de momento angular, al tener un grupo cinemático más amplio. Estamos
describiendo algo formalmente equivalente a un sólido rígido, pero sin especicar ni forma ni
tamaño.
El siguiente paso, que vamos a desarrollar en más detalle, es considerar que el grupo ci-
nemático también contiene transformaciones inerciales puras con desplazamiento relativo entre
observadores con velocidad constante (boosts). Introducimos en el grupo tres nuevos parámetros
de velocidad v , y por lo tanto podremos usar tres variables de velocidad como variables cinemá-
ticas. La Lagrangiana dependerá también de la derivada de la velocidad. Además, el teorema de
Noether nos producirá la denición de otro observable, el momento cinemático. Analizaremos
más adelante las dos posibilidades de usar bien el grupo de Galileo G o el de Poincaré P .
1 ∂2L e2
e 2 = gij (x, ẋ)ẋi ẋj ,
L gij (x, ẋ) = = gji
2 ∂ ẋi ∂ ẋj
donde las funciones gij (x, ẋ) son homogéneas de grado cero en las ẋi y por lo tanto involucran
solamente derivadas temporales. Pero además de depender del punto x, son funciones de las ẋ.
Un espacio métrico en el que la métrica es también función de las derivadas de las variables del
espacio recibe el nombre de espacio de Finsler(1934)19 20 .
19
P. Finsler, Über Kurven und Flächen in allgemeinen Räumen. Disertation, Götingen 1918.; G.S. Asanov,
Finsler geometry, Relativity and Gauge theories, (Reidel Pub. Co, Dordrecht 1985); H. Rund, The Hamilton-
Jacobi theory in the calculus of variations, (Krieger Pub. Co., N.Y 1973). H. Rund, The dierential geometry of
Finsler spaces, (Springer, Berlin, 1959).
20
Paul Finsler Nacido el 11 Abril 1894 en Heilbronn, Neckar, Alemania, y fallecido en Zurich,
Suiza, el 29 de Abril de 1970. Se dedicó a la geometría diferencial y a la teoría de conjuntos.
48 CAPÍTULO 1. FORMALISMO LAGRANGIANO
√
e=±
Como ±L e 2 , el problema variacional en el espacio cinemático X se reescribe
L
∫ τ2 ∫ τ2 √ ∫ τ2 √
e ẋ)dτ =
L(x, e 2 (x, ẋ)dτ =
L gij (x, ẋ)ẋi ẋj dτ =
τ1 τ1 τ1
∫ x2 √ ∫ x2
= gij (x, ẋ)dxi dxj = ds,
x1 x1
pudiendo interpretar ds como el diferencial de arco de la curva que une los puntos extremos
de la evolución en el espacio cinemático X . Al postular que la distancia que recorre el sistema
dinámico en el espacio X entre x1 y x2 debe ser mínima, estamos transformando el problema
variacional de hacer extremal la acción del sistema mecánico en un problema geodésico en un
espacio métrico. La evolución de todo sistema dinámico entre los estados inicial x1 y nal x2 ,
sigue una geodésica del espacio X . Y esto es independiente de que el sistema dinámico sea un
sistema arbitrario o sea una partícula elemental. Incluso en este caso, es independiente de que la
partícula sea libre o esté sometida a una interacción. Lo que sucede es que entre una partícula
libre y otra en interacción, la Lagrangiana, y por lo tanto la métrica, son distintas, es decir,
toda interacción modica la métrica del espacio cinemático de la partícula libre.
Si utilizamos transformaciones del espacio cinemático que dejan invariante a la Lagrangiana,
entonces, bajo estas transformaciones, las magnitudes gij transforman como las componentes
covariantes de un tensor simétrico de dos índices.
Dadas las ecuaciones de Euler-Lagrange de un sistema dinámico, el problema variacional
implica que debemos buscar soluciones de estas ecuaciones que pasen por los puntos extremos
x1 y x2 . Esto, en general, no tiene por qué poseer solución para puntos arbitrarios. Si preparamos
al sistema en el punto x1 , diremos que el punto x2 está causalmente conectado con x1 , si las
ecuaciones de Euler-Lagrange entre esos puntos poseen solución. En caso contrario diremos que
están causalmente desconectados y no podemos llevar, por evolución dinámica, el sistema del
estado x1 al estado x2 . Como L e 2 > 0, la métrica del espacio es denida positiva entre los estados
causalmente conectados, por lo que en la variedad X si entre dos puntos innitesimalmente
próximos y para velocidades adecuadas no se satisface que entre ellos gij (x, ẋ)dxi dxj > 0,
entonces no es posible que estén conectados causalmente y por lo tanto la evolución entre ellos
no está permitida.
√
e 0 = ±mc
L ẋ20 − ṙ 2 , x0 = ct.
Si reescalamos e0
L dividiéndola por la constante mc, la Lagrangiana tiene ahora dimensiones de
(0)
longitud donde claramente se ve que la métrica resulta ser gµν = ηµν , la métrica de Minkowski,
e
con ηµν = diag(1, −1, −1, −1). Como L > 0 eso implica que para todo τ se tiene que cumplir que
2
e 2 = gµν
L ẋ ẋ = c2 ṫ2 − ṙ 2 > 0,
(0) µ ν
por lo que los puntos causalmente conectados son aquellos que se alcanzan a partir de uno dado
con la condición de que la partícula se mueva con u2 = ṙ 2 /ṫ2 < c2 , es decir u < c. Dado x1 los
puntos causalmente conectados con él son los del interior de su cono de luz del futuro. El resto de
los puntos del espacio cinemático (que en este caso se reduce al espacio-tiempo) están causalmente
desconectados. Son los puntos del pasado, los de su cono de luz y aquellos que quedan fuera de
éste. En esos casos ηµν ẋµ ẋν ≤ 0, y las ecuaciones de Euler-Lagrange no suministran solución física.
Consideraba que los conjuntos eran como números generalizados con los que se podían establecer
técnicas aritméticas. Fue Elie Cartan quien en 1934, publica un libro titulado Les espaces de Finsler,
donde denomina espacios de Finsler a los espacios métricos que estamos estudiando.
1.6. ESTRUCTURA MÉTRICA DEL ESPACIO CINEMÁTICO 49
coecientes que son simétricos en sus índices pues ∂Fi /∂ ẋj = ∂Fj /∂ ẋi .
Para la partícula puntual libre reescalada,
tanto para e0
L como para e0 .
−L
En general, el espacio cinemático tendrá una métrica que será función de punto x si es que la
Lagrangiana lo es, pero lo que siempre resultará es que es ineludible que sea función de las ẋi .
En el caso de la partícula puntual relativista libre, la métrica no depende ni de x ni de ẋ como
corresponde a un sistema libre en el que todos los puntos del espacio y todas las velocidades son
equivalentes. Pero si introducimos una interacción, y la intensidad de la interacción depende de
la velocidad, como en el caso de un campo magnético, la métrica va a dejar de ser constante y
en general dependerá de la velocidad del punto.
e ẋ)
∂ L(x, e ′ , ẋ′ ) ∂ ẋ′ j
∂ L(x
′
∂ ẋ j
Fi (x, ẋ) = = = Fj (x′ , ẋ′ ).
∂ ẋi ∂ ẋ′ j ∂ ẋi ∂ ẋi
Podemos denir las componentes covariantes del vector tangente con el uso del tensor métrico
Como
e e e ẋ)
e = ∂ L(x, ẋ) ẋi ,
L L e ∂ L(x, ẋ) ẋi = gij ẋi ẋj = ẋi ẋi ,
e2 = L e
⇒ ẋi = gij ẋi = L
∂ L(x, e i
= LF
∂ ẋi ∂ ẋi ∂ ẋi
e 2 representa el valor absoluto al cuadrado del vector tangente a la trayectoria, y el
con lo que L
vector
e ẋ)
∂ L(x, ẋi
Fi = = , Fi F i = 1,
∂ ẋ i
Le
representa al vector unidad tangente.
Si derivamos ẋi con respecto a ẋj , tenemos
( ) ( )
∂ ẋi ∂ ∂ Le ∂ 1 ∂ e2
L 1 ∂2L e2
= Le = = = gij .
∂ ẋj ∂ ẋj ∂ ẋi ∂ ẋj 2 ∂ ẋi 2 ∂ ẋi ∂ ẋj
50 CAPÍTULO 1. FORMALISMO LAGRANGIANO
e
∂L 1 ∂Le2 1 ∂(gjk ẋj ẋk ) ẋj ẋk ∂gjk
= = = ,
∂xi 2Le ∂xi 2Le ∂xi 2L e ∂xi
y
∂L e ẋi 1
= Fi = = gij ẋj .
∂ ẋ i
Le e
L
( )
d e
∂L 1 dLe 1 dgij j 1
= − gij ẋj + ẋ + gij ẍj .
dτ ∂ ẋ i e
L dτ
2 e
L dτ e
L
Por otra parte
dgij ∂gij k ∂gij k 1 dL e 1 d(log L) e
= ẋ + ẍ , = ,
dτ ∂xk ∂ ẋk e 2 dτ
L e dτ
L
con lo que podemos eliminar las L e de todos los denominadores, y si escogemos el parámetro
de evolución como la longitud del arco, L e = 1 y log L e = 0, nos quedan las ecuaciones de las
geodésicas
1 ∂gjk j k ∂gij j k ∂gij j k
gij ẍj = ẋ ẋ − ẋ ẋ − ẋ ẍ . (1.39)
2 ∂xi ∂xk ∂ ẋk
Sin embargo el último término es nulo debido a la simetría del tensor métrico, pues
( )
∂gij 1 ∂3L e2 ∂gik
= = ,
∂ ẋk i j
2 ∂ ẋ ∂ ẋ ∂ ẋ k ∂ ẋj
y al contraer con ẋj , resulta ∂gik /∂ ẋj ẋj = 0, pues el tensor gij es función homogénea de grado
cero en las ẋ. Por otra parte, en el segundo término los índices j, k son mudos por lo que lo
podemos escribir como ( )
∂gij j k 1 ∂gij ∂gik
ẋ ẋ = + ẋj ẋk .
∂xk 2 ∂xk ∂xj
Las componentes contravariantes del tensor métrico se denen como habitualmente g li gij = δil .
Si usamos este tensor, contrayendo en (1.39) con g li , nos quedan en la forma
con ( )
1 ∂gij ∂gik ∂gjk
Γljk = g li k
+ j
− = Γlkj ,
2 ∂x ∂x ∂xi
donde los símbolos de Christoel Finslerianos se denen de la misma forma que en el caso
Riemanniano en términos de las derivadas con respecto a las x, del tensor métrico. A diferencia
del caso Riemanniano, son funciones de x y también de ẋ.
Una expresión alternativa de las ecuaciones de las geodésicas es
( )
1 ∂gkl ∂gik ∂gil
j k l
gij ẍ = Ψikl ẋ ẋ , Ψikl = − − k = Ψilk . (1.41)
2 ∂xi ∂xl ∂x
El espacio cinemático X es, en general, un espacio de Finsler con torsión. El tensor de torsión
de Cartan, es un tensor simétrico
( )
1 ∂gij 1 ∂3L e2
Cijk = = ,
2 ∂ ẋk 4 ∂ ẋi ∂ ẋj ∂ ẋk
1.6. ESTRUCTURA MÉTRICA DEL ESPACIO CINEMÁTICO 51
en todos sus índices. Los espacios de Riemann son espacios sin torsión de Cartan, porque la
métrica es independiente de las derivadas de las ẋ.
Postular, como hace la Relatividad General, que la gravedad produce una modicación de
la métrica del espacio cinemático de la partícula puntual, esto es, del espacio-tiempo, en la que
los coecientes gij (x) resultan ser solamente funciones de punto, es establecer una restricción
matemática fuerte sobre las posibles métricas, ya que éstas pueden, en general, ser funciones
también de las ẋ. Por eso consideramos que en su estatus actual la Relatividad General es una
especie de límite de baja velocidad de una teoría de la gravitación más general. La segunda
restricción es que en la naturaleza no existen partículas elementales sin espín, por lo que la
gravedad, lo que modicaría sería la métrica del espacio cinemático de la partícula elemental
con espín, que resulta ser una variedad más amplia que el espacio-tiempo, como veremos a lo
largo de este curso.
Como conclusión nal, diríamos que la Relatividad General parece ser una teoría de la
gravedad de materia sin espín, moviéndose a baja velocidad. 21
g00 (x) = 1 + k 2 A20 + 2kA0 = (1 + kA0 (x))2 , gii (x) = −1 − kA0 (x) + k 2 A2i (x), i = 1, 2, 3,
g0i (x) = kAi (x) + k 2 A0 (x)Ai (x), gij (x) = k 2 Ai (x)Aj (x), i ̸= j = 1, 2, 3.
Así, en el caso de un campo eléctrico uniforme, A0 = E·r/c, A = 0, los coecientes no nulos de la
aproximación Riemaniana son g00 = (1+eE ·r/mc2 )2 , gii = −(1+eE ·r/mc2 ). Si lo que tenemos
es un campo magnético uniforme, A0 = 0, A = (r × B)/2, g00 = 1, gii = −1 + (e(r × B)/2mc)2i ,
g0i = e(r × B)i /2mc y nalmente gij = (e(r × B)/2mc)i (e(r × B)/2mc)j , con i ̸= j . En una
interacción en la que solamente tuviéramos una energía potencial, como en el caso habitual
gravitatorio, mA0 = mV (x)/c, y el g00 = (1 + V (x)/c2 )2 , gii = −(1 + V (x)/c2 ), como veremos
en los ejemplos analizados más adelante.
Las ecuaciones dinámicas las podemos determinar como las ecuaciones de Euler-Lagrange
obtenidas a partir de la Lagrangiana reescalada Le . En el ejemplo de la partícula puntual cargada
( )
d ∂L e ∂Aσ µ
= −ṗσ − k Ȧσ = −ṗσ − k ẋ , Fσµ (x) = ∂σ Aµ − ∂µ Aσ = −Fµσ (x),
dτ ∂ ẋσ ∂xµ
ẍσ (ẋ · ẍ)ẋσ
ṗσ = kFσµ (x)ẋµ , o bien− = kFσµ (x)ẋµ
(ẋ · ẋ)1/2 (ẋ · ẋ)3/2
Si en un sistema de referencia inercial el observador ja el parámetro de evolución como el
tiempo τ = t, las ecuaciones dinámicas son
dH dp
= eE · u, = e (E + u × B) .
dt dt
La primera de estas ecuaciones es consecuencia de la segunda y de que para una partícula
elemental puntual H 2 − p2 c2 = m2 c4 , es un invariante. La segunda de las ecuaciones, para la
posición del punto, se transforma en
d2 r e [ u ]
= E + u × B − (u · E)
dt2 mγ(u) c2
Otra forma alternativa es construir las ecuaciones de las geodésicas a partir de la métrica
que se obtiene derivando dos veces la L e 2 . La métrica es
( )
k k(A · ẋ) ẋµ ẋν
2
gµν = ηµν + k Aµ Aν + (ẋµ Aν + ẋν Aµ ) + ηµν −
(ẋ · ẋ)1/2 (ẋ · ẋ)1/2 (ẋ · ẋ)
g00 = 1 + k 2 A20 + 2kγ(u)A0 + kγ(1 − γ 2 )(A0 − u · A/c),
Figura 1.3: Cuatro movimientos de una partícula puntual en su espacio cinemático, entre
los puntos x1 y x2 , (a) en el caso libre, (b) en presencia de un campo magnético B , (c)
movimiento libre visto desde un observador acelerado o movimiento en presencia de un
campo gravitatorio uniforme g. El ejemplo (d) es el análisis gravitatorio en presencia de
una masa M situada en el origen del sistema de referencia que crea un campo Newtoniano.
En los cuatro casos el espacio cinemático es el mismo, el espacio-tiempo, pero con métricas
Finslerianas diferentes que producen trayectorias que en el espacio tridimensional son, en
el caso (a) una recta sin torsión ni curvatura, en (b) con torsión y curvatura, y en (c) y
(d) una trayectoria plana con curvatura.
Las cuatro trayectorias son geodésicas del espacio-tiempo pero con respecto a cuatro métri-
cas diferentes. En la parte (a) el movimiento es libre, la trayectoria es una recta; en (b) está
sometida a un campo magnético uniforme, y su trayectoria espacial tiene curvatura y torsión.
En este caso la métrica Finsleriana del espacio-tiempo es diferente de la métrica del caso libre.
El campo magnético externo la modica. En (c) es la misma trayectoria libre pero vista desde
un observador acelerado. De acuerdo con el principio de equivalencia esto equivale a la presen-
cia de un campo gravitatorio constante. También en este caso la métrica ha sido modicada.
Finalmente, en (d) analizamos el movimiento de la partícula puntual en un campo gravitatorio
Newtoniano producido por una masa M localizada en el origen del sistema de referencia inercial
que hace el análisis.
Los ejemplos que siguen, relativos al movimiento de una partícula de masa m, vamos a
reescalar la Lagrangiana dividiéndola por el factor mc, con lo que Le tendrá ahora dimensiones
de longitud. Conviene recordar, que si la evolución se expresa en términos de un parámetro
adimensional τ , los coecientes de la métrica gµν son adimensionales, ya que las coordenadas
de los puntos del espacio-tiempo tienen dimensiones de longitud.
22
Este tema corresponde a una charla impartida en castellano por el autor en el IAC en Noviembre
de 2014. (http://iactalks.iac.es/talks/view/703) y a una videoconferencia, impartida en inglés en el VIA,
(http://viavca.in2p3.fr/site.html) en Enero de 2015.
54 CAPÍTULO 1. FORMALISMO LAGRANGIANO
la métrica es gµν = ηµν con ηµν = diag(1, −1, −1, −1). Es constante y corresponde a la métrica
de Minkowski.
dp
= eu × B.
dt
ẋ0 c −ẋi −ui
p0 = √ =√ , pi = √ =√
ẋ20 − ṙ 2 c − u2
2
ẋ20 − ṙ 2 c2 − u2
kxu2 uy kxuy ( 2 )
g00 = 1 + , g11 = −1 + c − u2y − u2z ,
(c2 − u2 )3/2 (c2 −u )
2 3/2
kxuy ( 2 )
g22 = −1 + k 2 x2 + 3c − 3u2x − 2u2y − 3u2z ,
(c2 −u )
2 3/2
kxuy ( 2 )
g33 = −1 + c − u2x − u2y ,
(c2 −u )
2 3/2
siendo nulos los demás, donde la dependencia de las velocidades ha desaparecido y se ha transfor-
mado en una métrica Riemanniana. Con esta métrica restringida obtendremos una Lagrangiana
eR
restringida L
Le 2R = c2 ṫ2 − ṙ 2 + k 2 x2 ẏ 2 − 2kxcṫẏ,
y por lo tanto la fuerza sobre la partícula no es la fuerza de Lorentz. Esta métrica no es solución
de vacío de las ecuaciones de Einstein, sino que produce un escalar de curvatura y tensor de
Einstein, que valen
−k 2 3k 2 3k 3 x k2 1 −k 2
R= , Gtt = , Gty = − , Gxx = , Gyy = (k 2 + 3k 4 x2 ), Gzz = ,
2 4 4 4 4 4
y los símbolos de Christoel no nulos son
1
Γttx = k 2 x/2, Γtxy = − k(1+k 2 x2 ), Γxty = −k/2, Γxyy = k 2 x, Γytx = k/2, Γyxy = −k 2 x/2.
2
e B , son
Con la fuerza de Lorentz las ecuaciones dinámicas que se obtienen de la Lagrangiana L
dux eB 1 duy eB 1 duz
= uy = kcuy , =− ux = − kcux , = 0,
dt mγ(u) γ(u) dt mγ(u) γ(u) dt
que nos lleva a que ux dux /dt + uy duy /dt + uz duz /dt = u · du/dt = 0, por lo que el movimiento
es con velocidad de módulo constante, el factor γ(u) es constante y la partícula se desplaza en
la dirección OZ con velocidad constante y rota a la vez que se desplaza con velocidad constante
en el plano XOY , con velocidad angular ω = eB/γ(u)m. Sin embargo las ecuaciones de las
geodésicas debidas a la métrica restringida que se deriva de L e R son
(c) En el ejemplo (c) de un campo gravitatorio uniforme, la dinámica vendría descrita por la
Lagrangiana
eg = L
L e 0 + g · r cṫ,
c2
que conduce a las ecuaciones dinámicas dp/dt = g , con p = γ(u)u, independientes de la masa
de la partícula. Esta Lagrangiana reescalada, desde el punto de vista geodésico corresponde a
una evolución en el espacio-tiempo con una métrica Finsleriana dada por:
( g · r )2 (g · r)
g00 = 1 + 2
− (3γ − γ 3 ) 2 ,
c c
u2i (g · r)
gii = −1 + γ(1 + γ 2 ) 2 , i = 1, 2, 3
c2 c
u i (g · r)
g0i = −(γ 3 − γ) , i = 1, 2, 3
c c2
ui uj (g · r)
gij = γ 3 2 , i ̸= j = 1, 2, 3
c c2
El término g · r tiene dimensiones de velocidad al cuadrado. Si la velocidad del punto es des-
preciable frente a c, los coecientes no nulos son los
( g · r )2
g00 = 1 + − 2(g · r)/c2 , gii = −1 + (g · r)/c2 , i = 1, 2, 3
c2
es decir ( g · r )2 ( g · r)
g00 = 1 − 2 , gii = − 1 − 2 , i = 1, 2, 3,
c c
56 CAPÍTULO 1. FORMALISMO LAGRANGIANO
Las ecuaciones de Euler-Lagrange para los n grados de libertad qi , (1.4) forman un sistema
de n ecuaciones diferenciales ordinarias de orden 2k , por lo que para singularizar una solución, de
acuerdo con los teoremas de existencia y unicidad, nos basta con suministrar las 2kn condiciones
(s)
de contorno en el instante inicial t1 , qi (t1 ), i = 1, . . . , n, s = 0, 1, 2, . . . 2k − 1.
Ahora bien, redeniendo unas variables intermedias, toda ecuación diferencial de orden m se
puede reducir a un sistema de m ecuaciones diferenciales ordinarias de primer orden. En nuestro
(s)
caso a un sistema de 2kn ecuaciones de primer orden. Deniendo, como nuevas variables qi ,
58 CAPÍTULO 1. FORMALISMO LAGRANGIANO
s = 1, . . . , 2k − 1:
(1) (2) (2k−2)
dqi (1) dqi (2) dqi (3) dqi (2k−1)
= qi , = qi , = qi , ..., = qi
dt dt dt dt
hasta llegar a las n ecuaciones diferenciales nales (1.4), que aparecerían como en (1.31)
∂L d (1) (2k−1)
− pi(1) (t, qi , qi , . . . , qi ) = 0,
∂qi dt
a las cuales les suministraríamos como condiciones de contorno las 2kn condiciones en el instante
t1 , mencionadas anteriormente.
El formalismo canónico se basa en utilizar como variables intermedias las kn variables gene-
(s)
ralizadas qi , i = 1, . . . , n, s = 0, 1, 2, . . . , k − 1, es decir las variables cinemáticas con el tiempo
excluido y los kn momentos canónicos conjugados pi(s) . A las ecuaciones de primer orden que
se obtendrán se les denominará ecuaciones canónicas de Hamilton.
Como el Hamiltoniano generalizado está denido por
∑
k
(s) (k)
H= pi(s) qi − L(t, qi , . . . , qi ), (1.43)
s=1
(k)
si de la dención del momento de orden k , pi(k) = ∂L/∂qi pudiéramos despejar las n derivadas
(k)
de orden máximo qi en términos de los n pi(k) , entonces la Lagrangiana quedaría escrita en
(s)
términos del tiempo t, de las kn variables canónicas qi , s = 0, . . . , k − 1 y de los n momentos
pi(k) . De esta forma el Hamiltoniano resultaría ser una función H(t, q, p), del tiempo, de las
variables canónicas y de sus momentos canónico conjugados. Entonces,
∑
k−1
∂H (s)
∑
k
∂H ∂H
dH = dqi + dp + dt, (1.44)
(s) ∂pi(r) i(r) ∂t
s=0 ∂qi r=1
∑
k
(s)
∑
k
(s) ∂L ∑ ∂L k
(s)
dH = qi dpi(s) + pi(s) dqi − dt − (s)
dqi ,
∂t ∂q
s=1 s=1 s=0 i
∑
k
(s)
∑
k
dq
(r−1)
i
qi dpi(s) = dpi(r) ,
dt
s=1 r=1
(r−1)
donde los coecientes de las dpi(r) son derivadas temporales de sus variables generalizadas qi ,
r = 1, . . . , k , canónico conjugadas. El segundo de los términos lo escribimos
∑
k
(s)
∑
k−1
(s) (k)
pi(s) dqi = pi(s) dqi + pi(k) dqi .
s=1 s=1
(s)
con lo que en los primeros sumandos solo hay diferenciales dqi de las variables generalizadas,
con s ≤ k − 1. Hacemos lo mismo con el último sumatorio
∑
k
∂L (s) ∂L ∑ ∂L k−1
(s) ∂L (k)
(s)
dqi = dqi + (s)
dqi + (k) dqi ,
∂qi
s=0 ∂qi s=1 ∂qi ∂qi
1.8. FORMALISMO CANÓNICO GENERALIZADO 59
(k)
donde hemos destacado el último sumando que contiene la dqi . Pues bien, este último sumando
se cancela con el último de la expresión anterior, con lo que esos dos términos se condensan en
( )
∑k
(s)
∑ k
∂L (s) ∂L ∑
k−1
∂L (s)
pi(s) dqi − (s)
dqi = − dqi + pi(s) − (s) dqi ,
∂q ∂q i ∂q
s=1 s=0 i s=1 i
Pero de la denición de los momentos canónicos, tenemos las expresiones (1.30) y (1.31) que
nos llevan a que esta expresión quede:
∑
k
(s)
∑
k
∂L (s) dpi(1) ∑
k−1
dpi(s+1) (s) ∑
k−1
dpi(s+1) (s)
pi(s) dqi − (s)
dqi =− dqi − dqi = − dqi ,
dt dt dt
s=1 s=0 ∂qi s=1 s=0
(s)
donde las diferenciales dqi se extienden a todas las variables generalizadas. De esta forma,
recolectando términos, tenemos
∑
k−1
dpi(s+1) (s)
∑
k
dq
(r−1)
∂L
dH = − dqi + i
dpi(r) − dt, s = 0, 1, . . . , k − 1
dt dt ∂t
s=0 r=1
∂H dpi(s+1)
(s)
=− , s = 0, 1, . . . , k − 1, i = 1, . . . , n,
∂qi dt
(r−1)
∂H dq
= i , r = 1, . . . , k, i = 1, . . . , n,
∂pi(r) dt
con lo que llegamos al sistema de 2kn ecuaciones de primer orden para las variables canónicas
q ′ s y p′ s, donde qi es la canónica conjugada de la pi(s+1) , s = 0, 1, . . . , k − 1,
(s)
(s)
dqi ∂H dpi(s+1) ∂H
= , = − (s) , i = 1, . . . , n, s = 0, 1, . . . , k − 1. (1.45)
dt ∂pi(s+1) dt ∂q i
Esta operación corchete es antisimétrica {A, B} = −{B, A} y satisface las propiedades distri-
butivas
{A, B + C} = {A, B} + {A, C}, {A, BC} = {A, B}C + B{A, C}.
Para cualesquiera tres variables dinámicas A, B, C se cumplen las identidades de Jacobi:
∂A ∂A ∂H ∂A ∂H ∂A
= + (s) − (s)
= + {A, H}.
∂t ∂qi ∂p i(s+1) ∂p i(s+1) ∂q ∂t
i
La función principal de Hamilton es una función sobre el espacio cinemático del sistema
mecánico que se dene como la función acción del punto nal de la evolución. Históricamente
se la representa por S(x), y aunque aquí vamos a usar la letra S para representar al observable
espín, vamos a mantener esta notación en esta sección complementaria. Según esta denición:
donde el punto inicial x1 es jo, pero arbitrario. La función principal de Hamilton resulta ser
una función del tiempo t y de las variables generalizadas q 's. Vamos a hacer la demostración
en el caso de una Lagrangiana ordinaria dependiente hasta las derivadas primeras de los grados
de libertad qi , L(t, q, q̇), pero su demostración se puede extender a Lagrangianas generalizadas.
Si en el instante nal de la evolución t, las condiciones de contorno q(t) cambiaran de forma
innitesimal q + δq , ¾cómo cambiaría esta función?
La variación del funcional acción a lo largo del camino q(t) y q(t) + δq(t) es
∫ t [ ]
∂L ∂L
A(q + δq) − A(q) = δA = dt δq + δ q̇
t1 ∂q ∂ q̇
1.8. FORMALISMO CANÓNICO GENERALIZADO 61
Figura 1.4: Modicación del punto nal de la evolución en el instante t y por lo tanto del
camino q(t). La variación de la δq es su variación en forma δ̄q , a t constante.
Si la trayectoria q(t) es la que hace extremal al funcional acción entonces se anula el término
entre corchetes cuadrados y la variación del funcional acción se reduce a la variación de la
función acción
∂L ∂L ∂L
δA = δq − δq = (t) δq(t),
∂ q̇ t ∂ q̇ t1 ∂ q̇
pues δq(t1 ) = 0. Pero esto es la variación de la función principal de Hamilton δS cuando dejando
jo t, cambiamos el resto de las variables cinemáticas q ,
∂L ∂S
S(t, q + δq) − S(t, q) = δS(t, q) = δqi = pi δqi , ⇒ = pi . (1.46)
∂ q̇i ∂qi
donde pi es el momento conjugado de la variable qi en el instante t. Nos falta saber cómo cambia
la función principal de Hamilton, cuando modicamos el tiempo del punto nal, manteniendo
constantes los valores de las variables q en el instante nal y, por supuesto, en el instante inicial
t1 . La variación del funcional acción es
∫ t+δt ∫ t
′ ′ ′
A(q ) − A(q) = δA = L(t, q , q̇ )dt − L(t, q, q̇)dt.
t1 t1
d
δ̄ q̇ = δ̄q.
dt
62 CAPÍTULO 1. FORMALISMO LAGRANGIANO
Figura 1.5: Modicación del punto nal de la evolución del instante t al instante t + δt,
manteniendo constantes en ese instante los valores de las variables q.
23
D.A. Wells, Theory and Problems of Lagrangian dynamics, Schaum McGraw Hill, NY (1967) p.1:...the basic
laws of dynamics can be formulated in several ways other than that given by Newton. The most important of
these are referred to as: a)D'Alembert's principle, b) Lagrange's equations, c) Hamilton's equations, d) Hamilton's
principle. All are basically equivalent.
E.C.G. Sudarshan and N. Mukunda, Classical Dynamics: A modern perspective, John Willey NY (1974), p.24
... this completes the demonstration, in the standard case, of the complete equivalence of the Lagrangian and
Hamiltonian forms of dynamics.
64 CAPÍTULO 1. FORMALISMO LAGRANGIANO
x′i = f i (xj ; g σ ), ∀x ∈ X, ∀g ∈ G, i, j = 1, . . . , n, σ = 1, . . . , r.
La parametrización del grupo se puede siempre tomar de tal manera que las coordenadas
del elemento neutro e del grupo son e ≡ (0, . . . , 0), de tal manera que un elemento innitesimal
del grupo es uno cuyas coordenadas δg σ , σ = 1, . . . , r, son innitesimales.
Bajo la acción de un elemento innitesimal δg del grupo G, el cambio en las coordenadas
x del punto x ∈ X está dada por
i
i i i i ∂f i (x; g)
x + dx = f (x; δg) = x + δg σ = xi + uiσ (x)δg σ ,
∂g σ g=e
después de un desarrollo Taylor a primer orden en los parámetros del grupo y sabiendo que
xi = f i (x; 0). Hay nr funciones auxiliares del grupo que se denen por
∂f i (x; g)
i
uσ (x) = , (1.48)
∂g σ g=e
Los coecientes cα σλ son un conjunto de constantes reales, llamadas las constantes de estruc-
tura del grupo y el espacio vectorial que construyen los generadores se le llama el álgebra de
Lie L(G), asociada al grupo de Lie G. Las constantes de estructura son antisimétricas en sus
σλ = −cλσ , y satisfacen las identidades de Jacobi:
índices inferiores cα α
Las ecuaciones (1.51) son las reglas de conmutación que caracterizan la estructura del álgebra
de Lie del grupo.
Si una transformación nita del grupo, de parámetros g σ , se puede hacer en n pasos más
pequeños de parámetros g σ /n, con n sucientemente grande, entonces una transformación nita
U (g)h(x) Se puede obtener como
( )n
gσ
U (g)h(x) ≡ lı́m I + Xσ h(x) = exp(g σ Xσ ) h(x).
n→∞ n
Esto dene la aplicación exponencial y en este caso se dice que los parámetros g σ son los
parámetros normales o canónicos. En la parametrización normal la ley de composición de
los subgrupos uniparamétricos se reduce a la suma de los correspondientes parámetros de los
elementos que intervienen en la operación.
Consideremos que F(X) es el espacio de Hilbert de los estados de un sistema cuántico;
(1.49) puede ser interpretada como la función de onda transformada bajo el elemento del grupo
g . Entonces, si el operador U (g) es unitario, habitualmente se escribe en la forma
( )
i σe
U (g) = exp g Xσ ,
~
en términos de la unidad imaginaria i y la constante de Planck ~, de tal manera que en este ca-
so los nuevos operadores X eσ son operadores autoadjuntos y representan ciertos observables del
sistema. Las dimensiones físicas de estos observables dependen de las dimensiones de los paráme-
tros del grupo g σ , puesto que el argumento de una exponencial es adimensional, y la presencia
de la constante de Planck implica que g σ X eσ tiene dimensiones de acción. Estos observables,
teniendo en cuenta (1.50), se representan en una representación unitaria por los operadores
diferenciales autoadjuntos
Xeσ = ~ uiσ (x) ∂ . (1.52)
i ∂xi
Sin embargo, (1.49) no es la forma más general de transformación de una función de onda
de un sistema cuántico, como veremos en el Capítulo 3. Pero una vez que conozcamos cómo
transforma, podremos otener las expresiones explícitas de los generadores del grupo por un
procedimiento similar. En general, la función de onda transforma bajo un grupo continuo con lo
que se denomina una representación unitaria proyectiva del grupo, la cual involucra en general,
alguna fase adicional.
66 CAPÍTULO 1. FORMALISMO LAGRANGIANO
Cuando tenemos una representación de un grupo de Lie, bien sea mediante operadores linea-
les o por matrices que actúan sobre un espacio vectorial, podemos denir lo que se denominan
operadores de Casimir. Son operadores C que pueden ser expresados como funciones de los ge-
neradores Xσ del álgebra de Lie, habitualmente en forma polinómica, y que tienen la propiedad
de que conmutan con todos los generadores, esto es, satisfacen [C, Xσ ] = 0, ∀σ = 1, . . . , r. En
general no se expresan como combinaciones lineales reales de los Xσ y por lo tanto no pertenecen
al álgebra de Lie del grupo. Pertenecen a lo que se denomina el álgebra del grupo, es decir,
el álgebra asociativa, pero en general no conmutativa construida a partir de todas las combina-
ciones lineales reales o complejas de productos de los Xσ , en la correspondiente representación
del grupo.
En aquellas representaciones en las que los Xσ sean operadores autoadjuntos, como en el
caso de un formalismo cuántico, los operadores de Casimir pueden también ser autoadjuntos y
representarán a aquellos observables que permanecen invariantes bajo cualquier transformación
del grupo. En particular, cuando consideremos los grupos cinemáticos que relacionan a los ob-
servadores inerciales, los operadores de Casimir de estos grupos representarán las propiedades
intrínsecas del sistema. Son aquellas propiedades que son independientes de qué observador iner-
cial las mida. Son aquellos observables cuyas medidas toman el mismo valor cuando cambiamos
de sistema de referencia
Para grupos semisimples, es decir, grupos que no poseen subgrupos invariantes Abelianos,
como el grupo de rotaciones SO(3), los grupos unitarios SU (n) y muchos otros, se demuestra
que los operadores de Casimir son polinomios reales homogéneos de los generadores Xσ , pero
esto no es el caso para grupos de Lie arbitrarios. Sin embargo, para la mayor parte de los grupos
con interés en física, como el grupo de Galileo, Poincaré, De Sitter, Weyl, SL(4, R), el grupo
inhomogéneo ISL(4, R) y el grupo Conforme SU (2, 2), los operadores de Casimir se pueden
tomar como polinomios de coecientes reales de los generadores.
∂f (x)
f ′ (x) = f (x + δa) = f (x) + δa = (I + δaP )f (x).
∂x
Al operador P = ∂/∂x le llamamos el generador de la transformación innitesimal y el elemento
innitesimal del grupo se convierte en el operador δg ≡ I + δaP al actuar sobre las variables
y funciones de estas variables. Si f (x) es una función invariante bajo la acción de este grupo,
entonces P f = ∂f /∂x = 0, y f no depende de x.
Para la transformación nita de parámetro a, se cumple la aplicación exponencial eaP , pues
aP (aP ) (aP )n a ∂ a2 ∂ 2
eaP ≡ I + + + ... + + ... = I + + + ...
1! 2! n! 1! ∂x 2! ∂x2
Al aplicarlo sobre la variable x
x′ = eaP x = x + a,
y al aplicarlo sobre cualquier función de x
a ∂f (x) a2 ∂ 2 f (x)
eaP f (x) = f (x) + + + . . . = f (x + a)
1! ∂x 2! ∂x2
ya que el primer miembro es el desarrollo Taylor de f (x) desde el punto x al punto x + a. El
parámetro a es el parámetro canónico del grupo.
x′ = x − yδα, y ′ = y + xδα.
∂f ∂f dx dy
−y +x = 0, ⇒ = , xdx + ydy = 0
∂x ∂y −y x
68 CAPÍTULO 1. FORMALISMO LAGRANGIANO
ya que el elemento de arco de componentes (dx, dy) es ortogonal al gradiente de f y por lo tanto
f debe ser una función arbitraria de las curvas x2 + y 2 =cte, es decir f (x2 + y 2 ).
Si lo que queremos es analizar una rotación nita de valor α la aplicación exponencial nos
produce el correspondiente operador de rotación
( ) ( ) ( )
α ∂ ∂ α2 ∂ ∂ 2 αn ∂ ∂ n
e ≡I+
αJ
−y +x + −y +x + ... + −y +x + ...
1! ∂x ∂y 2! ∂x ∂y n! ∂x ∂y
es decir
x′ = eαJ x = x cos α − y sin α.
Análogamente, si lo aplicamos a la variable y llegamos a
t′ = t, x′ = x + δvt.
La acción del elemento innitesimal sobre una función f (t, x) viene dada por
∂f (t, x)
f ′ (t, x) = f (t′ , x′ ) = f (t, x) + δvt = (I + δvK) f (t, x),
∂x
donde K = t∂/∂x es el generador de los boosts a lo largo del eje OX .
Si queremos analizar un boost nito entonces la aplicación exponencial nos lleva a
( ) ( )
v v2 2 v ∂ v2 ∂ 2
e = I + K + K + ... = I +
vK
t + t + ...,
1! 2! 1! ∂x 2! ∂x
1.10.1. Cinemática
Los sistemas materiales que evolucionan vienen descritos por un conjunto de variables, que
van cambiando a partir de unos valores iniciales. Denominamos variables cinemáticas a estas
variables que evolucionan y que describen de forma unívoca los estados por los que va pasando el
sistema material. Al espacio de todos los estados del sistema material le denominamos espacio
cinemático, y es una variedad X de dimensión n, siendo n el número de variables cinemáticas
xi que caracterizan de forma unívoca cada uno de los diferentes estados del sistema material.
1.10.2. Dinámica
Vamos a suponer que la evolución de los sistemas materiales se puede describir en términos
del conocimiento de un parámetro continuo τ del cual las variables cinemáticas son funciones
continuas y derivables xi (τ ). Denominamos descripción dinámica del sistema, entre dos estados
inicial x1 y nal x2 al conocimiento de las funciones x(τ ), que satisfacen las condiciones de
contorno x(τ1 ) ≡ x1 , x(τ2 ) ≡ x2 , es decir que pasa por los puntos extremos de la evolución, con
τ2 > τ 1 .
Entre las variables cinemáticas xi debe al menos existir una, x0 , la cual es una función
monótona creciente del parámetro de evolución τ , es decir ẋ0 > 0. Esto nos permite invertir
la función x0 = x0 (τ ) y obtener τ = τ (x0 ), y poder caracterizar la evolución en términos de
una de las variables cinemáticas. Estas variables que satisfacen durante la evolución que ẋi > 0,
se dice que son variables de tipo temporal, puesto que nos permiten analizar la evolución en
términos de su cambio monótono creciente. La echa del tiempo va a implicar que al denir
una magnitud conservada ligada a la invariancia por traslación temporal, la energía, sea una
magnitud denida positiva.
Se trata de calcular, conocidos los puntos extremos de la evolución de un sistema material,
cuál es esa función x(τ ) que nos determina la dinámica del sistema.
La acción del sistema material a lo largo de un camino cualquiera que une esos puntos
extremos se calcula en función del conocimiento de una función L(x,e ẋ), denominada función
Lagrangiana del sistema material, de tal manera que para cada camino x(τ ) nos dene un
número real ∫ τ2
A[x(τ )] = e
L(x(τ ), ẋ(τ ))dτ,
τ1
donde cada integral se calcula a lo largo del correspondiente camino x(τ ).
Estamos describiendo la dinámica mediante un formalismo variacional. Como las funciones
xi (τ ) son derivables con respecto a τ y suponemos que existe al menos una variable función
monótona de τ , de tipo temporal x0 ≡ t, las variables cinemáticas son también funciones deri-
vables con respecto a t. Al establecer el formalismo variacional es necesario conocer cuáles de
las variables cinemáticas son realmente independientes y de que no existen relaciones funcio-
nales entre ellas. Por ejemplo si tengo como variables cinemáticas la posición de un punto y la
velocidad de ese punto, tres de las variables cinemáticas denen las coordenadas ri del punto y
otras tres variables cinemáticas son las componentes de la velocidad del punto vi = dri /dt, por
lo que existe una relación funcional entre ellas.
70 CAPÍTULO 1. FORMALISMO LAGRANGIANO
donde al haber dependencia funcional entre algunas de las variables cinemáticas, ya que algunas
son derivadas temporales de otras, el elemento independiente que caracteriza globalmente a una
posible evolución es un camino q(t) en términos de los grados de libertad. Dado un camino qj (t),
éste conduce de forma unívoca a un camino x(τ ) entre los instantes τ1 y τ2 > τ1 .
La formulación variacional, reducida a su dependencia estricta de los grados de libertad esen-
ciales e independientes, nos lleva a que la trayectoria q(t) de los grados de libertad que, además
de hacer que las variables cinemáticas pasen por los extremos x1 y x2 , hace extremal al fun-
cional acción, debe satisfacer el sistema de ecuaciones diferenciales ordinarias, las denominadas
ecuaciones de Euler-Lagrange,
( ) ( )
∂L d ∂L d k ∂L
− + . . . + (−1)k k = 0,
∂qi dt ∂q (1) dt ∂q
(k)
i i
e 2 (x, ẋ), es
donde las Fi son funciones homogéneas de grado cero de las ẋi . Esto implica que L
homogénea de grado 2 de las ẋi , y se puede escribir como
donde los coecientes gij son funciones homogéneas de grado cero de las ẋi .
Dos puntos próximos xi y xi +dxi , se dice que están causalmente conectados si gij dxi dxj > 0,
ya que la acción al cuadrado entre ellos es denida positiva. La acción entre dos puntos próxi-
mos no puede ser nunca nula, ya que implicaría que la L e se anula idénticamente en un instante,
con lo que dejaríamos de tener asociada una acción a un sistema material. La anulación de
la acción implicaría que el sistema deja de evolucionar. Esto conduce, por ejemplo, a que en
el caso relativista no es posible tener una partícula puntual moviéndose a la velocidad de la
luz, ya que la Lagrangiana se anularía idénticamente. Como L e 2 > 0, necesariamente tiene que
contener, además de las coordenadas del punto, otras variables cinemáticas que hagan que la
1.10. APÉNDICE: SUMARIO DE MECÁNICA CLÁSICA 71
acción al cuadrado sea siempre, en cualquier punto, denida positiva. Los fotones, son partículas
puntuales que además tienen orientación, es decir, rotan.
Principio de Causalidad
La evolución de un sistema material entre los puntos x1 y x2 a lo largo de un camino x(τ ) es
posible, si en cada momento de la evolución τ se cumple gij dxi dxj > 0.
Dados dos puntos arbitrarios x1 y x2 esto no será siempre posible, por lo que jado x1 existe
un subconjunto de puntos del espacio cinemático que están causalmente conectados con x1 . El
resto son inalcanzables desde él, y la evolución entre ellos es imposible.
Este principio no establece de forma unívoca el que dado un punto inicial se pueda predecir
hacia qué punto evoluciona. Más bien lo que establece es la posibilidad de que la evolución entre
dos puntos dados sea o no factible.
Métrica
El espacio cinemático X es un espacio métrico con un tensor métrico, simétrico, denido por
1 ∂2L e2
gij = = gji .
2 ∂ ẋi ∂ ẋj
No es, en general, denido positivo, por lo que a partir de cada punto (x, ẋ), solamente aquellos
puntos x + dx son alzanzables desde x si gij dxi dxj > 0. Es un espacio métrico de Finsler.
obtener del anterior mediante un simple cambio de sistema de referencia a otro observador
equivalente. Esto trae consigo que el espacio cinemático es necesariamente un espacio homogéneo
para el grupo cinemático asociado al Principio de Relatividad Restringido.
4. La función acción es el valor del funcional acción para el camino que la hace extremal.
9. Las funciones Fi (x, ẋ) son funciones homogéneas de grado cero de las ẋi y por lo tanto
son funciones de las derivadas temporales de las variables generalizadas. Como cada su-
mando Fi ẋi tiene dimensiones de acción, cada Fi tiene la dimensión complementaria de
la correspondiente variable xi .
e 2 , que es denida positiva, se puede siempre escribir como
10. La función L
1 ∂2L e2
e 2 = gij (x, ẋ)ẋi x˙j ,
L gij (x, ẋ) = = gji ,
2 ∂ ẋi ∂ ẋj
donde los coecientes gij = gji , son funciones homogéneas de grado 0 de las derivadas ẋi .
1.10. APÉNDICE: SUMARIO DE MECÁNICA CLÁSICA 73
√ √
11. La Lagrangiana se puede escribir a partir de Le 2 como L
e= L e 2 o bien L
e=− L e 2 , ya que
e 2 denida positiva esta raíz cuadrada existe, luego o bien L
al ser L e es denida positiva
a lo largo de la trayectoria, o bien es denida negativa. Existen por lo tanto dos tipos
distintos de sistemas dinámicos con las mismas variables cinemáticas y que conducen a
trayectorias que hacen que la acción del sistema sea máxima o mínima. Para partículas
elementales si Le describe a la partícula, −L
e a la antipartícula. Partícula y antipartícula
conducen sobre el espacio cinemático a la misma denición de distancia métrica L e2 .
13. Si consideramos dos puntos próximos del espacio cinemático x y x + dx tal que el valor
e 2 (x, dx) < 0, implica que la evolución entre esos puntos es causalmente imposible.
de L
14. Si el sistema mecánico es una partícula elemental, entonces es condición necesaria que
el espacio cinemático X sea un espacio homogéneo del grupo cinemático G asociado al
Principio de Relatividad Restringido.
e
L(δgx, e ẋ) + δg dλ(x) ,
δg ẋ) = L(x,
dτ
entonces
(s−1)
N = λ(x) + HM0 − pi(s) Mi ,
que contiene, además de la función λ(x) tantos términos como variables cinemáticas,
donde el Hamiltoniano aparece multiplicando por la función M0 de cómo transforma la
variable cinemática x0 = t, y cada momento pi(s) canónico conjugado de la variable gene-
(s−1)
ralizada qi , cambiado de signo, por cómo transforma innitesimalmente esta variable
(s−1)
generalizada Mi . Las constantes del movimiento Noetherianas son funciones lineales
del Hamiltoniano y de los momentos canónicos, siendo los coecientes de esta expresión
lineal funciones de las variables cinemáticas.
74 CAPÍTULO 1. FORMALISMO LAGRANGIANO
18. Todas las constantes del movimiento asociadas a grupos de simetrías representan a obser-
vables físicos que no son denidos positivos.
Capítulo 2
PARTÍCULAS NO RELATIVISTAS
t′ (τ ) = t(τ ) + b, (2.1)
′
r (τ ) = R(µ)r(τ ) + vt(τ ) + a. (2.2)
Debido a cómo transforman estas variables, las interpretamos como el tiempo y la posición de
la partícula, respectivamente. Si suponemos que el parámetro de evolución τ es invariante para
todos los observadores inerciales, tomando la derivada τ de ambos miembros resulta que las
derivadas de las variables cinemáticas en cualquier instante τ , transforman:
u′ (τ ) = R(µ)u(τ ) + v.
De esta manera podríamos obtener la forma de transformar de las sucesivas derivadas. La La-
grangiana que describa a esta partícula será función L(t, r, u) y en la descripción paramétrica
e r, ṫ, ṙ) = L(x,
de la evolución L(t, e ẋ) y homogénea de grado 1 de las derivadas ẋi . Esta homo-
geneidad nos lleva a la forma general:
e = T ṫ + R · ṙ,
L (2.5)
e ṫ y Ri = ∂ L/∂
donde T = ∂ L/∂ e ṙi son todavía funciones desconocidas de las variables cinemáticas
y de sus derivadas. Además, son funciones homogénes de grado cero de las derivadas de las
variables cinemáticas, por lo que son funciones de (t, r, u). Esta homogeneidad es independiente
75
76 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
de que la partícula sea libre o esté sometida a alguna interacción. Además las funciones T y Ri
no son totalmente independientes. En efecto, si en la expresión (2.5) hacemos la derivada de
ambos miembros con respecto a ṙi , tenemos
∂T ∂Rj
+ uj = 0. (2.6)
∂ui ∂ui
También sabemos que como T y Ri son derivadas parciales de L e y ésta es una función continua
y derivable de sus argumentos, se cumple la igualdad de derivadas cruzadas
pero estas funciones dependen de estas derivadas a través de las variables ui = ṙi /ṫ, por lo que
( )
∂Ri ∂Ri ∂uj ∂Ri ṙj ∂T ∂T ∂uj ∂T δij ∂T ∂Ri
= = − 2 = = = ⇒ + uj = 0,
∂ ṫ ∂uj ∂ ṫ ∂uj ṫ ∂ ṙi ∂uj ∂ ṙi ∂uj ṫ ∂ui ∂uj
que es otra relación del tipo (2.6), que sugiere que ∂Ri /∂uj = ∂Rj /∂ui .
Si la partícula es libre, las ecuaciones dinámicas deben ser invariantes para el conjunto de
observadores inerciales, ya que tanto desde el punto de vista activo como pasivo, el cambio de
sistema de referencia o la transformación cinemática de la partícula no pueden alterar sus leyes
dinámicas. Si estuviera bajo una interacción, habría que desplazar también los mecanismos que
interaccionan con ella, por lo que en general las ecuaciones dinámicas no serán invariantes, ya
que los cambios que hacemos entre observadores inerciales afectan solamente a las variables
cinemáticas y sus derivadas, asociadas a la partícula y no a los mecanismos de interacción como
campos, imanes, etc.
Desde el punto de vista de las transformaciones innitesimales, como e 0 (t, r, ṫ, ṙ)
L depende de
estas variables que transforman según (2.1-2.4), los diferentes generadores del grupo de Galileo al
actuar sobre funciones de estas variables son:
∂
H= , P = ∇, J = r × ∇ + ṙ × ∇ṙ , K = t∇ + ṫ∇ṙ .
∂t
2
e 0 = mṙ = d e 0 = mṙ, e 0 = 1 m ṙ + F (ṫ),
KL (mr). ṫ∇ṙ L ⇒ L
dτ 2 ṫ
siendo F (ṫ) una función arbitraria de ṫ que debe ser homogénea de grado 1, por lo que en general,
tiene la forma F = −H0 ṫ, con H0 una constante, que se interpreta como la energía interna.
2.1. PARTÍCULA PUNTUAL NO RELATIVISTA 77
pero de (2.3) y (2.4) tenemos que ∂ ṫ/∂ ṫ′ = 1 y ∂ ṙi /∂ ṫ′ = −R−1 (µ)ik vk , respectivamente, por lo
que
1
T ′ = T − mv 2 − v · R(µ)R. (2.10)
2
Análogamente
R′ = R(µ)R + mv. (2.11)
Los momentos canónico conjugados de los tres grados de libertad independientes qi = ri , son
e 0 /∂ ṙi = Ri , y por lo tanto el teorema de Noether nos lleva a las siguientes constantes del
pi = ∂ L
movimiento, que vamos a denominar momentos, bajo los diferentes subgrupos de simetrías:
a) Bajo traslaciones temporales la función gauge (2.7) es nula, δt = δb, M = 1, mientras que
δri = 0 y la constante se reduce a la expresión H = R · dr/dt − L e 0 /ṫ = −T .
b) Bajo traslaciones espaciales también α(g; x) ≡ 0, δt = 0, M = 0, mientras que δri = δai ,
Mij = δij y el observable conservado es R.
c) Bajo transformaciones Galileanas puras con velocidad constante (boosts) δt = 0 y M = 0,
en tanto que δri = tδvi y Mij = tδij , pero ahora la función gauge a primer orden order en el
parámetro de velocidad es α(δv; x) = mr · δv , por lo que el observable conservado es mr − P t.
d) Bajo rotaciones α(g; x) ≡ 0, δt = 0 y M = 0, pero δri = εijk rj δαk y Mik = εijk rj y la
magnitud conservada es r × R.
Recolectando estas magnitudes, les podemos dar los siguientes nombres y símbolos:
Les hemos reservado los mismos símbolos en mayúsculas que los de los correspondientes
generadores del grupo de simetrías, que dejan las ecuaciones dinámicas invariantes: Incluso sus
nombres hacen referencia al tipo de parámetro de la correspondiente transformación. Todos
ellos pueden tomar ambos signos, ya que si el parámetro de una transformación de un grupo
es positivo el de su inversa es negativo y los generadores de las transformaciones innitesimales
78 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
son vectores tangentes a las órbitas, y por lo tanto pueden tener componentes de cualquier
signo. Como la dimensionalidad de una constante Noetheriana es la complementaria con res-
pecto a la acción de la dimensión del parámetro del grupo, resulta que H tiene dimensiones de
acción/tiempo = energía, P dimensión de acción/distancia = masa×velocidad, K dimensión
de acción/velocidad = masa×distancia y nalmente como el parámetro de las rotaciones es
adimensional J tiene dimensión de acción.
En general, lo que hemos denido como el momento temporal, recibe habitualmente el nom-
bre de energía o bien de Hamiltoniano del sistema. Sin embargo, ninguno de los observables
asociados a los grupos uniparamétricos de simetrías es denido positivo. Por energía entendemos
un observable que es siempre denido positivo por lo que en realidad la energía se deniría como
E = |H|. Esto es importante a la hora de clasicar las diferentes partículas que vamos a encontrar,
sobre todo en la formulación relativista, en la que, por lo que respecta a H, el signo de H es
también una propiedad intrínseca, independiente del observador inercial que la mida. En la formu-
lación relativista llamamos partícula a aquél sistema para el que Hp > 0 y antipartícula cuando
Ha < 0. En ambos casos, si partícula y antipartícula poseen masa m y están en reposo, Hp = mc2
y Ha = −mc , y su energía es E = mc = |H|. Esta discusión entre partículas y antipartículas se
2 2
desarrollará con más detalle en la sección 2.7 lo que nos llevará a denominar al observable momento
temporal como energía, pero siendo siempre, para las partículas masivas, un observable denido
positivo, distinguiendo a la antipartícula por el signo opuesto de la carga.
Para el momento cinemático existen nombres alternativos en la literatura. Así, Levy-Leblond lo
denomina momento Galileano y en otros textos, escasos por cierto, se le suele denominar momento
estático, porque es un observable de dimensiones de masa × distancia. Siendo consistentes con
la propuesta primera le deberíamos denominar momento Poincaré en el caso relativista. En estas
notas usaremos el nombre de momento cinemático, incluso en la formulación relativista.
Si tomamos la derivada τ en (2.14) del momento cinemático K̇ = 0, por ser una constante
del movimiento, implica P = mṙ/ṫ = mu = R, donde u es la derivada temporal de la posición
de la partícula. Si tenemos en cuenta la relación (2.6), entonces
∂T ∂Rj 1
= −uj = −uj mδij = −mui ⇒ T (u) = − mu2 + T0 ,
∂ui ∂ui 2
siendo T0 una constante, ya que T no depende de más variables. Con estas funciones la Lagran-
giana de la partícula puntual libre queda
2
e 0 = T ṫ + R · ṙ = 1 m ṙ + T0 ṫ,
L ⇒
1
L0 = mu2 + T0 .
2 ṫ 2
son
∂A0 ∂Aj d
+ uj − (mui + Ai ) = 0, i = 1, 2, 3
∂ri ∂ri dt
es decir ( )
d2 r i ∂A0 ∂Ai ∂Aj ∂Ai
m 2 = − + uj −
dt ∂ri ∂t ∂ri ∂rj
el último término entre paréntesis es una función antisimétrica en i y j , por lo que puede ponerse
como ϵijk Bk uj , con lo que la variación del momento lineal mecánico de la partícula puntual
dP m d2 r
= m 2 = E + u × B, (2.20)
dt dt
con
∂A
E = ∇A0 − , B = ∇ × A,
∂t
es igual a la fuerza de Lorentz asociada a sendos campos E y B funciones solamente de t y de
r . En el caso relativista también obtendríamos que dP m /dt = E + u × B , pero la expresión de
P m = γ(u)mu en términos de la velocidad, es diferente. Si tanto A0 como A fueran funciones
de u, al plantear las ecuaciones dinámicas tendríamos:
( )
∂A0 ∂Aj d ∂A0 ∂Aj
+ uj − mui + + Ai + uj = 0.
∂ri ∂ri dt ∂ui ∂ui
∂A0 ∂Aj
+ uj = 0,
∂ui ∂ui
que cumple las condiciones (2.6) que satisfacen respectivamente T y R, es idénticamente nulo
y no interviene en la dinámica, como si tanto A0 como A, fueran independientes de u como
habíamos supuesto. Lo mismo se puede aplicar al caso de la partícula puntual relativista, por
lo que la fuerza más general es una fuerza de tipo de Lorentz, con campos solamente espacio-
temporales. Respecto de la variación de la energía mecánica, solamente la parte de la fuerza de
interacción E realiza trabajo. En efecto, en el caso no relativista,
( )2
m dr dHm dr d2 r
Hm = , =m · = u · E.
2 dt dt dt dt2
2 dHm dP m dHm dP m
2
Hm − 2P m · = 0, =u· = u · E.
c dt dt dt dt
En ambos casos, la variación por unidad de tiempo de la energía mecánica de la partícula, es el
trabajo de la fuerza E debida a la interacción, a lo largo de la trayectoria que sigue el centro
de masa de la partícula. Como los campos externos están denidos en el punto r , este punto
también representa la localización del centro de carga de la partícula.
2.1. PARTÍCULA PUNTUAL NO RELATIVISTA 81
que resulta ser una derivada total y puede eliminarse por no intervenir en la dinámica. La
transformación (2.23), que deja invariantes las ecuaciones dinámicas, modicando los campos
externos en cada punto del espacio-tiempo, recibe el nombre de transformación gauge local.
Pudiera parecer que al dejar las ecuaciones dinámicas invariantes, nos produciría una ley
de conservación, utilizando el teorema de Noether. Pero no se trata de una transformación
de un grupo uniparamétrico, sino de una transformación de tipo general, generada por una
función arbitraria λ, que hace que la Lagrangiana no sea invariante, sino que transforme con
una derivada total. Parece entonces que si asociado a ese término existe algún parámetro del
sistema, éste puede ser la carga, lo mismo que en el caso no relativista el parámetro masa nos
caracterizaba a la función gauge cuya derivada total aparecía en la variación de la Lagrangiana.
1
(ei )j = R(ρ)ji = [(1 − ρ2 ) δji + 2ρj ρi + 2εikj ρk ] (2.24)
1 + ρ2
Sin embargo, esta asignación que hace un observador inercial de las variables de orientación de
la partícula, como un sistema de tres vectores unidad ortogonales ligados al punto es totalmente
arbitraria. Esto quiere decir que la Lagrangiana no va a ser una función explícita del valor actual de
estas variables, ya que cualquier otra asignación nos daría los mismos valores para la acción. Pero
lo que verdaderamente importa es que esta orientación va cambiando, por lo que la Lagrangiana
sí va a ser función de cómo la orientación cambia, es decir de la velocidad angular con que este
sistema de ejes rota, la cual es independiente de cual sea esa asignación inicial. Quiere esto decir
que si cualquier observador modica la orientación de los ejes unidad que asigna a la partícula,
esto no cambia el valor de la velocidad angular de los mismos, como veremos más adelante.
Tendremos por lo tanto otra simetría adicional a la del grupo cinemático, la de las rotaciones
locales de los sistemas de ejes unidad asociados al punto. Le llamaremos el grupo de rotaciones
Local, y lo designaremos por SO(3)L , el cual conmuta con todo el grupo de Galileo, por lo que al
menos el grupo de simetrías espacio-temporales es el e es función
G ⊗ SO(3)L . El resultado es que L
de las variables esenciales de orientación ρ y ρ̇ a través de su dependencia de la velocidad angular
ω, la cual se expresa en términos de ρ y ρ̇ en la forma (2.35), como veremos.
Entonces las variables cinemáticas son las diez variables reales x(τ ) ≡ (t(τ ), r(τ ), u(τ ), ρ(τ ))
con dominios t ∈ R, r ∈ R3 , u ∈ R3 y ρ ∈ R3c similarmente a los correspondientes parámetros
del grupo. La relación entre los valores x′ (τ ) y x(τ ) en cualquier instante τ para cualquier par
de observadores inerciales, y usando la representación pasiva de las rotaciones, está dado por:
t′ (τ ) = t(τ ) + b, (2.25)
′
r (τ ) = R(µ)r(τ ) + vt(τ ) + a, (2.26)
′
u (τ ) = R(µ)u(τ ) + v, (2.27)
µ + ρ(τ ) − µ × ρ(τ )
ρ′ (τ ) = . (2.28)
1 − µ · ρ(τ )
1
M. Rivas, Classical Particle Systems: I. Galilei free particles, J. Phys. A 18, 1971 (1985).
2.2. PARTÍCULA GALILEANA CON ESPÍN 83
Esta última expresión corresponde a que cada vector unidad transforma en la forma e′i = R(µ)ei ,
y formando con los tres vectores en forma de columna la matriz R(ρ), resulta R(ρ′ ) = R(µ)R(ρ)
y esta composición de matrices de rotación equivale a que entre los parámetros esenciales exista
la ley de transformación mencionada (2.28).
Entre estas variables cinemáticas existen las tres ligaduras diferenciales u(τ ) = ṙ(τ )/ṫ(τ ),
que junto con la homogeneidad de la Lagrangiana L e en términos de las derivadas de las variables
cinemáticas:
e ẋ) = (∂ L/∂
L(x, e ẋi )ẋi , (2.29)
nos reducen de diez a seis los grados de libertad esenciales de la partícula.
Estos grados de libertad son, la posición r(t) y la orientación ρ(t). La Lagrangiana depende
hasta la segunda derivada de r(t) y de la primera derivada de ρ(t). La expresión (2.29) está
dada explícitamente por:
Le = T ṫ + R · ṙ + U · u̇ + V · ρ̇, (2.30)
e ṫ, Ri = ∂ L/∂
donde las funciones T = ∂ L/∂ e ṙi , Ui = ∂ L/∂
e u̇i , Vi = ∂ L/∂
e ρ̇i serán, en general,
funciones de las variables cinemáticas (t, r, u, ρ) y funciones homogéneas de grado cero en
términos de las derivadas (ṫ, ṙ, u̇, ρ̇).
Las variables generalizadas son r , u y ρ, y sus momentos canónico conjugados son:
( ) ( )
∂L d ∂L ∂Le d ∂L e dU
pr = − 2 2
= − =R− ,
∂(dr/dt) dt ∂(d r/dt ) ∂ ṙ dt ∂ u̇ dt
∂L ∂Le
pu = = = U,
∂(du/dt) ∂ u̇
∂L ∂Le
pρ = = =V.
∂(dρ/dt) ∂ ρ̇
Como variables canónico-conjugadas, pr es el momento conjugado de r , pu es el momento
conjugado de u y pρ es el momento conjugado de las variables de orientación ρ.
Si suponemos que el parámetro de evolución τ es invariante, las variables derivadas trans-
forman bajo G :
En vez de la derivada ρ̇(τ ) que transforma de una manera complicada, es mejor denir la
velocidad angular de la partícula ω como función de ella, en la representación pasiva, en la
forma
2
ω= (−ρ̇ + ρ × ρ̇), (2.35)
1 + ρ2
como veremos más adelante.
Es una función lineal de ρ̇, y transforma, como vemos más abajo, como:
ω ′ (τ ) = R(µ)ω(τ ). (2.36)
84 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
Dos observadores inerciales miden el mismo valor absoluto de la velocidad angular. La trans-
formación inversa de la (2.35) es la
1
ρ̇ = (−ω − ρ × ω + ρ(ρ · ω)) , (2.37)
2
Estamos interpretando la matriz de rotación que dene la orientación de la partícula R(ρ(τ ))
como una matriz cuyas tres columnas representan, en el instante τ , las componentes de los tres
vectores unidad ligados al punto. Entonces R(ρ(τ )) representaría la rotación que lleva el sistema
de ejes ligado a la partícula en el instante τ = 0 al sistema cartesiano en el instante τ .
((ė1 (τ ))(ė2 (τ ))(ė3 (τ ))) = Ṙ(ρ(τ ))R(ρ(0)) = Ṙ(ρ(τ ))R−1 (ρ(τ ))((e1 (τ ))(e2 (τ ))(e3 (τ )))
con lo que la velocidad de cambio de cada eje, considerado como vector columna, es la acción sobre
el propio eje en el instante τ de una matriz
dei
= Ṙ(ρ(τ ))R−1 (ρ(τ ))ei (τ ) = Ωei (τ ),
dτ
donde la matriz Ω = ṘR−1 = ṘRT es antisimétrica. En efecto, en cualquier instante τ se cumple,
R(ρ(τ ))R (ρ(τ )) = I, donde el superíndice T signica la matriz transpuesta, y I es la matriz unidad
T
dei
= ω × ei . (2.38)
dτ
y ω se interpreta como la velocidad angular con que rota el sistema cartesiano ligado al punto. Las
componentes de ω, expresadas como funciones de las variables ρ y ρ̇ vienen dadas en (2.35).
Si cada observador inercial cambia la matriz R(τ ) formada por los tres vectores unidad en el
instante τ , por otra cualquiera R′ (τ ) = R(τ )M , donde M es cualquier matriz ortogonal, entonces
′T
(τ ) = M T RT (τ ), y para este observador Ω′ = Ṙ′ R′ = ṘM M T RT = ṘRT = Ω, por lo que
T
R
cualquier asignación que este observador haga de la orientación, nos produce la misma expresión de
la velocidad angular como función de ρ y ρ̇, cualesquiera que sea la ρ, en este sistema de referencia
en cualquier instante. Esto justica que la Lagrangiana no dependa explícitamente de las variables
ρ y ρ̇, y sí lo sea a través de la expresión de la velocidad angular como función de ellas.
que implica una relación lineal entre las componentes estrictas ωi′ en términos de las ωj , lo
que conduce a la ecuación (2.36) en términos de las componentes esenciales ω de la matriz
antisimétrica Ω. Ver el apéndice 2.8.3 para la descripción precisa de la orientación.
e ρ̇i )ρ̇i se pueda escribir como
Esto hace que la parte de la Lagrangiana (∂ L/∂
∂L e e ∂ω j
∂L
V · ρ̇ ≡ ρ̇ i
= ρ̇i = W · ω, (2.39)
∂ ρ̇i ∂ω j ∂ ρ̇i
2.2. PARTÍCULA GALILEANA CON ESPÍN 85
e
debido a la linealidad de ω en términos de ρ̇ y donde Wi = ∂ L/∂ω i . Por lo tanto, la forma más
similar a (2.7), lo que nos permite interpretar el parámetro m como la masa de la partícula. Bajo
la acción de un elemento arbitrario del grupo de Galileo, la Lagrangiana L e 0 , si las ecuaciones
dinámicas son invariantes bajo el grupo de Galileo, transforma de acuerdo con:
e 0 (gx(τ ), d(gx(τ ))/dτ ) = L
L e 0 (x(τ ), ẋ(τ )) + dα(g; x(τ ))/dτ. (2.42)
Esto nos conduce, a través de un cálculo similar al desarrollado en (2.9)-(2.11), a que estas
funciones transforman:
a) Bajo una traslación temporal la función acción es invariante, λ(x) = 0, y llamamos como
es habitual a la magnitud conservada el momento temporal total de la partícula, H . Como
(s) (s)
δt = δb y δqi = 0, M = 1 y Mi = 0, y aplicando (1.37), tenemos:
(s)
H = pi(s) qi − L0 = (R − dU /dt) · u + U · u̇/ṫ + V · ρ̇/ṫ
−T − R · u − U · u̇/ṫ − W · ω/ṫ
86 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
(ρ)
δρi = 0, Mij = 0,
y entonces
dU
P =R− = pr , (2.48)
dt
donde todos los términos tienen dimensiones de masa×velocidad.
c) Bajo transformaciones Galileanas puras de velocidad δv, A(x1 , x2 ) no es invariante sino que
teniendo en cuenta (1.13) y la función gauge (2.41) a primer orden en los parámetros δvi , la
acción transforma como δA = mr 2 · δv − mr 1 · δv y por lo tanto, λi (x) = mri , lo que nos dene
las componentes del momento cinemático total de la partícula, K , en la forma:
(r) (u)
δt = 0, M = 0, δri = δvi t, Mij = δij t, δui = δvi , Mij = δij ,
(ρ)
δρi = 0, Mij = 0,
y así
K = mr − P t − U , (2.49)
donde todos los sumandos tienen dimensiones de masa×distancia.
A partir de K̇ = 0, nos lleva a P = mu − dU /dt, por lo que identicándolo con (2.48),
la función R = mu independientemente de la Lagrangiana particular que escojamos. Observar
que el momento lineal total no tiene la dirección de la velocidad u = dr/dt, del punto r .
(ρ)
e 0 ∂ωk (ρ)
∂L
−Vi Mij = − M = Wj ,
∂ωk ∂ ρ̇i ij
puesto que
∂ωk (ρ)
M = −δkj ,
∂ ρ̇i ij
y por lo tanto, en forma vectorial
J = r × P + u × U + W = L + Z + W = r × P + S, (2.50)
donde todos los sumandos tienen dimensiones de acción o momento angular. L = r × P repre-
senta al momento angular orbital, Z = u×U es el momento angular debido a la dependencia de
la Lagrangiana de la aceleración y que, como veremos, proviene del movimiento orbital relativo
del centro de carga alrededor del centro de masa (o Zitterbewegung) y W proviene de la depen-
dencia de la Lagrangiana de la velocidad angular y lo interpretamos como la parte rotativa del
momento angular.
Como J es el momento angular total de la partícula con respecto al origen del observador, S
representa el momento angular de la partícula o espín con respecto al punto r . Como dJ /dt = 0,
el espín S satisface dS/dt = P × u y no es una constante del movimiento ni siquiera para la
partícula libre. Es el momento angular clásico equivalente al operador espín de Dirac en el caso
cuántico, puesto que satisface exactamente su misma ecuación dinámica.
e) Hemos mencionado que además del grupo de Galileo como grupo de simetrías de la partícula
elemental libre tenemos el grupo de rotaciones locales SO(3)L . Este grupo solamente afecta a
las variables de orientación. Así, las variables cinemáticas transforman:
ρ + δα/2 − ρ × δα/2 1
ρ′ =
(L)
, δρi = δαj (δij + ρi ρj − ϵilj ρl ) = Mij δαj .
(1 − ρ · δα/2) 2
(L)
e 0 ∂ωk (L)
∂L
Tj = −Vi Mij = − M ,
∂ωk ∂ ρ̇i ij
pero
∂ωk (L) −1 ( )
Mij = 2
(1 − ρ2 )δkj + 2ρk ρj + 2ϵkjs ρs
∂ ρ̇i 1+ρ
con lo que este término es en realidad la componente k , cambiada de signo, del vector unidad
ej , (ej )k , dado en (2.24), con lo que estas constantes del movimiento son
pues ∂L0 /∂ri = 0, con lo que obtenemos dP /dt = 0, donde P viene dado en (2.48).
La conservación de las proyecciones Ti se puede obtener también de las propias ecuaciones
dinámicas relativas a la orientación. Como L e depende de ρ y de ρ̇ a través de la velocidad
angular ω , estas ecuaciones dinámicas se reescriben como
( ) ( )
∂Le0 d ∂L e0 e 0 ∂ωj
∂L d ∂L e 0 ∂ωj e0
∂L
− = 0, − = 0, = Wj ,
∂ρi dτ ∂ ρ̇i ∂ωj ∂ρi dτ ∂ωj ∂ ρ̇i ∂ωj
dei
= ω × ei ,
dτ
de donde con Ti = W · ei , derivando con respecto a τ ,
dTi
= (ω × W ) · ei + W · (ω × ei ) = 0.
dτ
Veremos la importancia que tienen estas componentes conservadas del espín en el caso
cuántico, para clasicar los estados básicos del espacio de Hilbert del electrón.
d(r − k)
K̇ = 0 = mṙ − P ṫ − mk̇, es decir, P =m . (2.53)
dt
Entonces el punto q = r − k se mueve a velocidad constante y vemos que representa la posición
del centro de masa de la partícula. Por lo tanto, el observable k = r − q es la posición relativa
del punto r con respecto al centro de masa, el cual queda denido por
1
q=r− U. (2.54)
m
2.2. PARTÍCULA GALILEANA CON ESPÍN 89
Sin embargo, si sobre la partícula y en el punto r , tenemos localizada una fuerza F , el momento
de esta fuerza con respecto al origen, nos dará la variación de J ,
dJ dP dS
=r×F =u×P +r× +
dt dt dt
pero dP /dt = F , con lo que el espín S satisface exactamente la misma ecuación dinámica que
en el caso libre, es decir
dS
= P × u,
dt
solo que hora P no es una constante del movimiento. Para el otro
dJ dP dS CM
=r×F =v×P +q× +
dt dt dt
por lo que
dS CM
= (r − q) × F ,
dt
es el par externo, de la fuerza denida en r , con respecto al centro de masa. Si el espín con
respecto al centro de masa no se conserva, entonces r ̸= q y el centro de masa y el centro de
carga son necesariamente dos puntos distintos.
dU ′ dU dU ′ dU dU
= R(µ) , u′ · =u· + v · R(µ)
dt′ dt dt′ dt dt
Esto nos lleva a que el momento lineal P y el momento temporal H , transformen entre los
observadores Galileanos en la forma dada en (2.16-2.17) para estos mismos observables en el
caso de la partícula puntual.
1
H ′ = H + v · R(µ)P + mv 2 , (2.58)
2
′
P = R(µ)P + mv. (2.59)
De esta forma, si H0 y P 0 = 0, son los valores que toman estos observables para el observador
del centro de masa, entonces, para cualquier otro observador que ve moverse al centro de masa
con velocidad v
1 P2
H = H0 + mv 2 = H0 + , P = mv.
2 2m
Por lo tanto, cualquiera que sea el observador, la magnitud H − P 2 /2m = H0 es un número
constante y dene una propiedad intrínseca de la partícula elemental, ya que su medida es
e , es la que dene la parte
independiente del observador. Además, la parte espacio-temporal de L
variante gauge, y adopta la forma general
T ṫ + R · ṙ = −H ṫ + P · ṙ.
En efecto
1
−H ′ ṫ′ + P ′ · ṙ ′ = −H ṫ + P · ṙ + mv 2 ṫ + mv · R(µ)ṙ.
2
2.2. PARTÍCULA GALILEANA CON ESPÍN 91
dk′ dk
k′ = R(µ)k, = R(µ) , W ′ = R(µ)W
dt′ dt
lo que nos lleva a que
S ′CM = R(µ)S CM
y por lo tanto S ′ 2CM = SCM
2 , es una propiedad invariante entre observadores. Para la partícula
q ′ (τ ) = R(µ)q(τ ) + vt(τ ) + a.
Esto no va a ser así en el caso relativista y el centro de masa no transforma como la posición
del punto. Esto se debe a que si q y r son considerados con simultaneidad en un referencial,
sus transformados q ′ y r ′ no tienen por qué ser simultáneos en otro referencial relativista, cosa
que sí ocurre en el caso no relativista. También, en el caso relativista, la denición del centro
de masa q depende de la aceleración del punto r .
1 d4 r d2 r
+ 2 = 0, (2.65)
ω 2 dt4 dt
cuya solución general es:
m 2 mω 2 2
H = B − (C + D 2 ), (2.71)
2 2
P = mB, (2.72)
K = mA, (2.73)
J = A × mB − mωC × D. (2.74)
d(r − k)
P =m ,
dt
y q = r − k, dene la posición del centro de masa de la partícula, que es un punto distinto de
r y que usando (2.64) viene dado por
1 1 d2 r
q=r− U =r+ 2 . (2.75)
m ω dt2
Tiene la forma (2) que poseía el centro de masa en términos del centro de carga en el análisis
hecho en el preámbulo de estas notas.
Las ecuaciones dinámicas (2.65) se pueden reescribir en la forma:
d2 q
= 0, (2.76)
dt2
d2 r
+ ω 2 (r − q) = 0, (2.77)
dt2
donde (2.76) es (2.65) después de derivar dos veces (2.75), y la ecuación (2.77) es (2.75) habiendo
puesto todos los términos en el lado izquierdo.
A partir de (2.76) vemos que el punto q se mueve en línea recta y a velocidad constante,
mientras que el movimiento de r , dado en (2.77), es un movimiento armónico isótropo de
pulsación constante ω , alrededor del punto q .
El espín de la partícula con respecto al centro de masa, S CM se dene como
1
S CM = J − q × P = J − K × P, (2.78)
m
que al quedar escrito en términos de constantes del movimiento, es claramente otra constante del
movimiento. Su magnitud S 2 es una propiedad constante e invariante para todos los observadores
inerciales, por lo que será una propiedad intrínseca que caracteriza a la partícula. En términos
de las constantes de integración se expresa como
S CM = −mω C × D. (2.79)
94 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
Figura 2.1: Movimiento de la carga e > 0 en el sistema del C.M. El momento magnético
tiene sentido contrario al espín y el momento dipolar eléctrico d = ek, es perpendicular al
espín.
Esta carga efectúa un movimiento oscilante de muy alta frecuencia ω , que para el electrón
relativista es, como veremos, ω = 2mc2 /~ ≃ 1,55 × 1021 s−1 . El valor medio de la posición de
la carga es el centro de masa pero este movimiento relativo da lugar al momento magnético
µ de la partícula, dibujado en la gura en sentido opuesto al espín, en el supuesto de que la
carga e > 0 y ortogonal al plano del zitterbewegung. Su valor es, de acuerdo con su denición
clásica: 3
∫
1 e dk e
µ= r × j d3 r = k × =− S CM , (2.86)
2 2 dt 2m
3
J.D. Jackson, Classical Electrodynamics, John Wiley & Sons, NY (1998), 3rd. ed. p.186.
4
P.A.M. Dirac, The Principles of Quantum mechanics, Oxford Univ. Press, 4th ed. (1967).
96 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
cuya ecuación característica es λ6 + 2λ4 + λ2 + a2 = 0. Posee seis raíces diferentes, que corres-
ponden a los seis modos normales del sistema. Si llamamos λ = iz , estas variables verican
z 2 (1 − z 2 )2 = a2 , por lo que si resolvemos la ecuación cúbica z(1 − z 2 ) = a, las seis soluciones
de la forma ±iz serán los seis valores propios del sistema. Si denimos
( √ )
1 3 3a
k = arcsin , (2.93)
3 2
por lo que incluso con campos magéticos muy intensos, el parámetro a es muy pequeño y la
solución correspondiente es oscilatoria.
La solución general del sistema completo será una combinación lineal de estas tres oscilacio-
nes y dependerá de doce constantes de integración que se expresarán en términos de los doce
valores iniciales de la posición y velocidad del centro de masa y del centro de carga. La forma
de la solución para el centro de carga es:
y
1 1 1 B v1 (0)/aω
ω1 ω2 ω3 D = u1 (0)/ω ,
ω12 ω22 ω32 F r2 (0) − q2 (0)
donde q(0), v(0) and r(0), u(0), son, respectivamente la posición y velocidad del centro de
masa y centro de carga en el instante t = 0.
Si llamamos N a la inversa de la matriz que contiene a las frecuencias, resulta ser:
ω ω (ω − ω2 ) ω22 − ω32 ω3 − ω2
1 2 3 3
N= ω1 ω3 (ω1 − ω3 ) ω32 − ω12 ω1 − ω3 ,
∆
ω1 ω2 (ω2 − ω1 ) ω12 − ω22 ω2 − ω1
donde ∆ = (ω1 − ω2 )(ω2 − ω3 )(ω3 − ω1 ), de tal manera que obtenemos la expresión nal de las
constantes de integración en términos de las condiciones iniciales.
√
A orden más bajo en el parámetro a, puesto que k ≈ 3a/2, los modos normales son:
a 3a2 a 3a2
ω1 = a + O(a3 ), ω2 = −1 − + + O(a3 ), ω3 = 1 − − + O(a3 ). (2.95)
2 8 2 8
En términos de los parámetros físicos, y en la evolución temporal, estas frecuencias normales
son, a orden más bajo:
ωc 3ωc2 ωc 3ωc2
ω1 = ωc , ω2 = ω − − , ω2 = ω + − , (2.96)
2 8ω 2 8ω
donde ωc = eB/m y ω son la frecuencia ciclotrónica y la del zitterbewegung, respectivamente.
Para expresar estos valores iniciales en términos de parámetros físicos, como el radio del
movimiento interno R0 , el radio ciclotrónico Rc , la velocidad del centro de masa v o la frecuencia
del zitterbewegung ω , consideremos un electrón que se lanza con velocidad v , perpendicular al
campo magnético uniforme externo B . Tomamos el plano XOY de tal manera que la posición
inicial del centro de masa está en la coordenada Rc = −vm/eB sobre el eje OX , y la velocidad
inicial v es a lo largo de la dirección positiva del eje OY . Con este convenio, el centro de
masa efectúa una precesión alrededor del eje OZ con una velocidad angular |ωc | en la dirección
positiva. Para una partícula de carga positiva la posición inicial se habría tomado en −|Rc |
sobre el eje OX y la velocidad angular iría en sentido negativo del eje OZ .
La posición inicial del centro de carga se caracteriza por los tres parámetros ϕ, θ y ψ , donde
θ y ϕ representan la orientación inicial de la velocidad angular interna ω , y el parámetro ψ es la
fase inicial del centro de carga como se muestra en la Figura 2.2. Con todos estos valores nulos,
ω apunta a lo largo del eje OZ y la posición del centro de carga es el punto Rc + R0 sobre el
eje OX .
Estos valores iniciales, escritos en forma matricial son:
Rc Rc R0
q(0) = 0 , r(0) = 0 + Roz (ϕ)Roy (θ)Roz (ψ) 0 ,
0 0 0
0 0 0
v(0) = v , u(0) = v + Roz (ϕ)Roy (θ)Roz (ψ) ωR0 ,
0 0 0
donde Roz (α) representa una rotación en sentido activo, de valor α alrededor del eje OZ . Como
el espín antiorbital tiene su orientación opuesta a la de la velocidad angular, su valor inicial es
0
S CM (0) = Roz (ϕ)Roy (θ) 0 , (2.97)
−S
2.2. PARTÍCULA GALILEANA CON ESPÍN 99
Figura 2.2: Fase inicial ψ del centro de carga y orientación inicial (θ, ϕ) de la velocidad
angular ω.
donde S = mωR02 . Entonces, las condiciones iniciales para determinar los coecientes de la
solución general son:
−v2 (0)/aω Rc v1 (0)/aω 0
−u2 (0)/ω = aRc − αR0 , u1 (0)/ω = γR0 ,
r1 (0) − q1 (0) βR0 r2 (0) − q2 (0) δR0
A = Rc − βR0 + aR0 α,
B = −R0 (aγ + δ),
R0 aR0
C = (α + β) − (2α + 3β),
2 4
100 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
R0 aR0
D = (δ − γ) + (2γ − 3δ),
2 4
R0 aR0
E = (β − α) + (3β − 2α),
2 4
R0 aR0
F = (δ + γ) + (2γ + 3δ),
2 4
y los coecientes
b1 /a = −δR0 , b2 /a = βR0 .
Este movimiento depende del radio ciclotrónico Rc , a través del parámetro A, y el resto de
los términos dependen del radio interno R0 .
La solución general, despreciando términos de orden aR0 , se puede escribir en forma vectorial
como:
Rc R0
r(t) = Roz (ωc t) 0 + (I − Roz (ωc t)) R(ϕ, θ, ψ) 0
0 0
( ) R0
ωc t
+ Roz − R(ϕ, θ, ψ + ωt) 0 + O(aR0 ),
2
0
donde I es la matriz unidad 3 × 3 y R(ϕ, θ, ψ) ≡ Roz (ϕ)Roy (θ)Roz (ψ). Los dos primeros
términos representan el movimiento del centro de masa a este orden de aproximación, mientras
que el tercero es precísamente el movimiento relativo del centro de carga alrededor del centro
de masa. La contribución a orden aR0 , que hemos despreciado, se puede escribir como:
O(aR0 )
[ ( ) ] 0
ωc t
= −Jz Roz (ωc t)R(ϕ, θ, ψ) − Roz − R(ϕ, θ, ψ + ωt) aR0
2
0
( ) aR0
sin(ωt) ωc t
−Jz Roz − R(ϕ, θ, ψ) 0 ,
2 2
0
donde
0 −1 0
Jz = 1 0 0 ,
0 0 0
es la matriz 3 × 3, generadora de las rotaciones alrededor del eje OZ . Los dos primeros términos
representan la corrección a este orden, del movimiento del centro de masa, y el tercero es
la corrección del movimiento relativo interno. La presencia del generador Jz en este término,
implica que esta corrección no produce ninguna contribución al movimiento alrededor del eje
OZ . La solución alrededor de OZ es exactamente:
Figura 2.3: Movimiento del centro de masa y centro de carga (en rojo) de una partícula
negativamente cargada, en un campo magnético uniforme. El espín con respecto al centro
de masa precesa en sentido contrario del movimiento ciclotrónico y con la mitad de la
velocidad angular. La velocidad del centro de masa es perpendicular al campo.
La trayectoria de los centros de masa y carga se ha dibujado en la Figura 2.3, donde el
movimiento rizado representa la trayectoria del centro de carga.
Para el estudio de la dinámica del espín con respecto al centro de masa, sustituiremos la
solución general en su denición analítica
dk(t)
S CM (t) = −mk(t) × , (2.101)
dt
donde lo único que tenemos que calcular es la derivada (2.100). Para este cálculo, tenemos que
tener en cuenta que
Roz (ωt) = exp(Jz ωt),
y por lo tanto
Ṙoz (ωt) = exp(Jz ωt)Jz ω = Roz (ωt)Jz ω = Jz ω Roz (ωt).
Tomando la derivada de (2.100) obtenemos los siguientes términos:
( ) −ωc R0 /2
dk ωc t
= Roz − Jz R(ϕ, θ, ψ + ωt) 0
dt 2
0
( ) 0
ωc t
+ Roz − R(ϕ, θ, ψ + ωt) ωR0 , (2.102)
2
0
102 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
donde
0 R0
ωR0 = ωJz 0 . (2.103)
0 0
De todos estos términos, el primero es de orden ωc R0 = vR0 /Rc = aωR0 = ac, que incluso con
campos magnéticos intensos se puede despreciar.
La dinámica del espín con respecto al centro de masa se reduce a:
( ) 0 ( )
ωc t ω t
R(ϕ, θ, ψ + ωt) = Roz − c
S CM (t) = Roz − 0 S CM (0), (2.104)
2 2
−mωR0 2
donde S CM (0) viene dado en (2.97). El espín con respecto al centro de masa precesa hacia
atrás con la mitad de la velocidad angular del movimiento ciclotrónico mientras que su valor
absoluto permanece constante a este orden de aproximación. En la Figura 2.4 representamos
esta evolución durante el mismo intervalo temporal que la de la Figura 2.3 con una orientación
inicial θ = 30◦ y ϕ = 90◦ , donde podemos observar, además de la precesión con velocidad
angular constante, una pequeña nutación, al siguiente orden de aproximación.
Figura 2.4: Precesión del espín con respecto al centro de masa S CM , alrededor del eje OZ .
Por lo tanto
0 ωc R0
dq
= Roz (ωc t) v − Roz (ωc t) Jz R(ϕ, θ, ψ) 0 ,
dt
0 0
de tal manera que teniendo en cuenta (2.99) y (2.102)
2
( )2 ωc R0
dq
= v 2 + Jz R(ϕ, θ, ψ) 0
dt
0
0 ωc R0
− 2 v · Jz R(ϕ, θ, ψ) 0 ,
0 0
2
( )2 −ωc R0 /2
dk
= ω 2 R02 + Jz R(ϕ, θ, ψ + ωt) 0
dt
0
−ωc R0 /2 0
+2 Jz R(ϕ, θ, ψ + ωt) 0 · R(ϕ, θ, ψ + ωt) ωR0 .
0 0
Como
β(t) γ(t) cos ϕ sin θ
R(ϕ, θ, ψ + ωt) = δ(t) α(t) sin ϕ sin θ ,
− sin θ cos(ωt + ψ) sin θ sin(ωt + ψ) cos θ
−δ(t) −α(t) − sin ϕ sin θ
Jz R(ϕ, θ, ψ + ωt) = β(t) γ(t) cos ϕ sin θ ,
0 0 0
donde
entonces
ωc R0 −δ(t)
Jz R(ϕ, θ, ψ + ωt) 0 = ωc R0 β(t) .
0 0
En consecuencia ( )2
dq
= v 2 + ωc2 R02 (δ(0)2 + β(0)2 ) − 2vωc R0 β(0),
dt
( )2
dk ωc2 R02
= ω 2 R02 + (δ(t)2 + β(t)2 ) + ωωc R02 (δ(t)γ(t) − β(t)α(t)).
dt 4
Como
δ(t)γ(t) − β(t)α(t) = − cos θ,
δ(0)2 + β(0)2 = 1 − sin2 θ cos2 ψ,
δ(t)2 + β(t)2 = 1 − sin2 θ cos2 (ψ + ωt),
104 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
1 eB mc2
HI = − amc2 cos θ = − cos θ = −µ · B, (2.107)
2 2m ω
y como S = mωR02 = mc2 /ω , Sz = −S cos θ, implica que
eS cos θ eSz
µz = =− , (2.108)
2m 2m
o bien
e
µ=− S CM . (2.109)
2m
La energía de interacción se puede también escribir como:
eB e −ω c
HI = − S cos θ = B · S CM = · S CM , (2.110)
2m 2m 2
, como el producto escalar del espín con respecto al centro de masa y la velocidad angular
i.e.
Desde otro punto de vista, si suponemos que la relación entre el espín y el mo-
mento magnético viene dada por (2.109), y que la dinámica del momento angular
con respecto al centro de masa viene dada por la ecuación del momento
dS CM e
=µ×B =− S CM × B = Ω × S CM .
dt 2m
La velocidad angular constante de precesión del espín, es la frecuencia angular de
Larmor
eB ωc
Ω= =− ,
2m 2
ya que ω c = −eB/m, i.e., de valor mitad y dirección opuesta a la velocidad an-
gular ciclotrónica, como se pone de maniesto en la Figura 2.4. Esto produce la
contribución a primer orden, ya que a este orden el espín conserva su valor absoluto.
Sin embargo, esta hipótesis no contiene los términos adicionales de corrección a los
modos normales ωi , que pueden ser relevantes en procesos de alta energía, y que se
pueden obtener usando la solución general exacta.
tante. De esta forma, las variables cinemáticas son x ≡ (t, r, ρ), que se interpretan como el
tiempo, la posición y la orientación, respectivamente.
2.3. PARTÍCULA PUNTUAL RELATIVISTA 105
Debido a la estructura del exponente (2.240), la función gauge es la misma que en los ejemplos
anteriores. La relación general (2.57) nos lleva a que W × ω = 0, ya que la Lagrangiana
es independiente de u̇, y por lo tanto W y ω son colineales. De acuerdo con la forma de
transformar de la Lagrangiana, el término W · ω es invariante Galileano y como W y ω son
colineales, podemos tomar W ∼ ω y una posible Lagrangiana puede ser de la forma:
2 2
e = m ṙ + I ω .
L (2.111)
2 ṫ 2 ṫ
Las diferentes constantes del movimiento Noetherianas son
( )
m dr 2 I 2
H= + Ω , P = mu,
2 dt 2
K = mr − P t, J = r × P + W,
donde u = dr/dt es la velocidad del punto r , y Ω = ω/ṫ is la velocidad angular en términos de
la evolución temporal, frente a la ω que representa la velocidad angular pero no con respecto
al tiempo sino con respecto al parámetro de evolución arbitrario τ . El punto r se mueve con
velocidad constante y representa tanto la posición del centro de carga como la posición del
centro de masa. El espín con respecto al centro de masa es el observable S ≡ W que satisface
la ecuación dinámica dS/dt = ω × S = 0, y por lo tanto, el sistema cartesiano local asociado
al punto r rota con velocidad angular constante Ω.
El espín toma el valor constante S = IΩ, y cuyo valor absoluto es independiente del obser-
vador inercial. El parámetro I juega el papel de momento principal de inercia, lo que sugiere
una proporcionalidad directa entre el espín y la velocidad angular, lo que corresponde a un
sistema mecánico con simetría esférica. Podríamos asociar un cierto tamaño a la partícula ya
que sugiere que posee un radio de giro R0 , relacionado con los otros parámetros por I = mR02 .
Este modelo correspondería clásicamente a un sólido rígido con simetría esférica (los tres
momentos principales de inercia iguales) de tal manera que las variables de orientación ρ descri-
ben la orientación de sus ejes principales de inercia. Es una partícula de seis grados de libertad.
Tres representan la posición del centro de carga r y los otros tres ρ, la orientación de un siste-
ma cartesiano, comóvil, ligado al punto r . Como no hay dependencia de la Lagrangiana de la
aceleración los centros de carga y centro de masa, son el mismo punto.
Para el observador del centro de masa no existe corriente asociada la movimiento del centro
de carga, por lo que no es posible asociarle ni momento magnético ni momento dipolar eléctrico.
Por lo visto en los ejemplos anteriores, las propiedades magnéticas de la partícula están asociadas
con la parte del espín relacionada con el zitterbewegung, y están ausentes en este modelo de
tipo sólido rígido.
PARTÍCULAS RELATIVISTAS
γ2
′ R(µ)u(τ ) + γv + (v · R(µ)u(τ ))v
ṙ (1 + γ)c2
u′ (τ ) = = . (2.116)
ṫ′ γ(1 + v · R(µ) u(τ )/c2 )
De la misma manera obtendríamos la ley de transformación de las sucesivas derivadas tempo-
rales, como la aceleración, etc.
Si a partir de (2.116) calculamos el módulo de la velocidad, resulta:
u2 − c2
u′ =
2
+ c2 . (2.117)
γ 2 (1 + v · R(µ) u(τ )/c2 )2
En principio el valor de la velocidad del punto no está restringido, pero si u < c entonces u′ < c
para todo observador inercial, y lo mismo si u > c, u′ > c y también si u = c resulta que
u′ = c. La formulación relativista nos brinda la descripción de tres tipos diferentes de partículas
puntuales, según que su velocidad u sea u < c, u = c o u > c, para todo observador inercial.
Para los casos u = c y u > c no es posible encontrar un observador en reposo respecto de ellas,
ya que el parámetro v del grupo de Poincaré satisface v < c.
No existen ligaduras entre estas variables y solamente la homogeneidad de la Lagrangiana
en términos de las derivadas de las variables cinemáticas nos reducen de cuatro a tres el número
de grados de libertad de la partícula. Esta homogeneidad nos lleva a la forma general:
e = T ṫ + R · ṙ,
L (2.118)
Desde el punto de vista de las transformaciones innitesimales, como e 0 (t, r, ṫ, ṙ)
L depende
de estas variables que transforman según (2.112-2.115), los diferentes generadores del grupo de
Poincaré al actuar sobre funciones de estas variables son:
∂ r ∂ ṙ ∂
H= , P = ∇, J = r × ∇ + ṙ × ∇ṙ , K= + t∇ + 2 + ṫ∇ṙ ,
∂t c2 ∂t c ∂ ṫ
como en el caso Galileano, salvo el generador de los boosts K, que tiene una estructura diferente
porque la transformación de velocidad v afecta no solo a las variables espaciales r y ṙ como en el
caso Galileano, sino que también a las variables temporales t y ṫ.
Si e0 = 0
HL PL
y e 0 = 0, implica que L e 0 no es función de t ni de r . Además J L
e 0 = 0 implica
que es función de ṙ 2 y también de ṫ para ser homogénea de grado 1. Finalmente, si es invariante
bajo los boosts Lorentzianos K L e 0 = 0, lo que implica que
( )
ṙ ∂ e 0 = 0,
+ ṫ∇ ṙ L
c2 ∂ ṫ
homogénea de grado 1 en estas derivadas y que tenga dimensiones de acción. Una posibilidad es que
√
sea de la forma s c2 ṫ2 − ṙ 2 , con s un parámetro de dimensiones de masa×velocidad, por ejemplo
mc.
Poincaré y además una constante del movimiento. Como P 2 = (H/c)2 u2 /c2 , con u < c, esto
implica que este invariante sea denido positivo, de dimensiones masa×velocidad al cuadrado,
y lo escribamos como el cuadrado (mc)2 en términos de una magnitud constante, la masa
de la partícula que la tomamos como el número positivo m. Despejando H , obtenemos dos
posibilidades
H = ±mc2 (1 − u2 /c2 )−1/2 = ±γ(u)mc2 .
De aquí que P = ±γ(u)mu. Vamos a ver que el signo de H , que puede ser positivo o negativo,
es otra propiedad invariante Poincaré.
Para el observador del centro de masa, P = 0, por lo que H = ±mc2 . Si H > 0 para el
observador del centro de masa, entonces de (2.125) se tiene que para cualquier otro observador,
H ′ = γH ≥ H > 0, pues γ ≥ 1. Si H < 0, entonces también H ′ = γH ≤ H < 0. El signo de H es
otra propiedad invariante entre observadores.
La velocidad u < c, porque en caso contrario H sería imaginario. Si u > c el invariante (H/c)2 −
P 2 < 0 y no es posible denir la masa en reposo de la partícula. Si sustituímos las expresiones
de T y R en (2.118), obtenemos dos posibles Lagrangianas para una partícula puntual libre de
masa m, caracterizadas además, por el signo de H
√
e 0 = ∓mc c2 ṫ2 − ṙ 2 .
L (2.127)
La partícula que describe la Lagrangiana (2.127) con el signo +, posee un momento temporal
H < 0, y la de signo −, H > 0. Partículas y antipartículas aparecen de forma más simétrica en
la formulación relativista. Si desarrollamos la Lagrangiana al orden más bajo en u/c, en el caso
H > 0, obtenemos
2
e 0 = −mc2 ṫ + m ṙ ,
L
2 ṫ
por lo que el primer término −mc2 ṫ es equivalente al término Galileano −H0 ṫ de (2.18). La
Lagrangiana con H < 0 posee como límite de baja velocidad −(m/2)ṙ 2 /ṫ que no aparece
descrita como un posible ejemplo en el caso Galileano. Ver la sección 2.7 para la diferencia
entre partículas y antipartículas por lo que respecta a su interacción.
El espín con respecto al centro de masa se dene similarmente al caso no relativista
c2
S CM ≡ J − q × P = J − K × P = 0, (2.128)
H
es nulo, por lo que la partícula puntual relativista no posee espín.
Los espacios homogéneos de mayor dimensión de P , pueden ser parametrizados por las
variables (t, r, u, ρ), donde el parámetro velocidad u puede ser u < c, u = c, o bien u > c,
por lo que el grupo de Poincaré describe tres tipos maximales de partículas con espín. Las
denominaremos, de acuerdo con el valor de este parámetro, por los nombres siguientes: al primer
grupo, en el que la carga de la partícula se mueve con u < c, le llamaremos bradión, a partir del
griego βραδυς que signica lento. Los bradiones son por lo tanto aquellas partículas elementales
cuya posición de la carga r nunca alcanza la velocidad de la luz. A la segunda clase de partículas
con (u = c) las denominaremos luxones puesto que el punto r se mueve siempre a la velocidad
de la luz para todo observador, y nalmente, a las del tercer grupo que como u > c, las
llamaremos taquiones, a partir del griego τ αχυς , rápido.
2.5. LUXONES 109
Para el segundo grupo hemos usado el nombre latino de luxones en vez del griego fotones,
porque en este grupo, además de describir fotones clásicos con espín también vamos a encontrar
la descripción clásica del electrón. Esta clase de partículas relativistas y los taquiones no poseen
equivalentes no relativistas.
La primera clase corresponde a partículas cuyo espacio cinemático es todo el grupo de
Poincaré y produce modelos que van a tener correspondencia, en el caso de baja velocidad frente
a c, con los modelos que se analizan en el caso Galileano. De acuerdo con el análisis hecho en el
preámbulo sobre el movimiento del centro de carga, cuya velocidad debe ser inalcanzable para
todo observador inercial, es precisamente al grupo de luxones al que vamos a dedicar el estudio
que sigue. Quienes quieran analizar otros ejemplos relativistas, en particular los taquiones,
pueden consultar el libro del autor. En el caso de los taquiones no es posible encontrar modelos
que al ser cuantizados tengan espín 1/2.
2.5. Luxones
Consideremos aquellas partículas elementales cuyo espacio cinemático está formado por las
variables (t, r, u, ρ) de dominios t ∈ R, r ∈ R3 , ρ ∈ R3c , y u ∈ R3 pero con u = c. Como u = c
vamos a denominar a esta clase de partículas con el nombre de Luxones. Esta variedad es un
espacio homogéneo del grupo de Poincaré P . En efecto, consideremos el punto de esta variedad
x ≡ (0, 0, u, 0). El grupo que lo deja invariante (the little group) es el subgrupo uniparamétrico
Vu de transformaciones de Lorentz puras en la dirección del vector u. Entonces X ∼ P/Vu ,
resulta ser un espacio homogéneo de dimensión nueve.
Para estas partículas, las variables t, r transforman de acuerdo con (2.112) y (2.113), respec-
tivamente. Sus derivadas como en (2.114) y (2.115). Para la velocidad u la forma de transformar
(2.116) y de su módulo (2.117) por lo que si u = c para un observador, esto implica u′ = c, para
todos por lo que la variedad dada es un espacio homogéneo de P .
La forma general de transformación de las variables de orientación ρ, se obtiene de (2.252)
pero ahora las funciones F y G, que involucran factores γ(u), se hacen innitas en el límite
u → c, pero su cociente tiene un límite nito que nos lleva nalmente a
µ + ρ(τ ) − µ × ρ(τ ) + F c (v, µ; u(τ ), ρ(τ ))
ρ′ (τ ) = , (2.129)
1 − µ · ρ(τ ) + Gc (v, µ; u(τ ), ρ(τ ))
donde las funciones F c y Gc vienen dadas por:
γ(v)
F c (v, µ; u, ρ) = [u × v + u(v · µ) + v(u · ρ)
(1 + γ(v))c2
+ u × (v × µ) + (u × ρ) × v + (u · ρ)(v × µ)
+ (u × ρ)(v · µ) + (u × ρ) × (v × µ)] , (2.130)
γ(v)
Gc (v, µ; u, ρ) = [u · v + u · (v × µ) + v · (u × ρ)
(1 + γ(v))c2
− (u · ρ)(v · µ) + (u × ρ) · (v × µ)] . (2.131)
Como u′ = u = c, el valor absoluto de la velocidad es invariante lo cual signica que u′ puede
ser obtenido a partir de u mediante una rotación:
u′ = R(ϕ)u, (2.132)
donde el parámetro ϕ, que caracteriza a esta matriz de rotación, es
γ
µ + F c (v, µ; u(τ ), 0) µ+ (1+γ)c2
[u × v + u(v · µ) + u × (v × µ)]
ϕ= = γ . (2.133)
1 + Gc (v, µ; u(τ ), 0) 1+ (1+γ)c2
[u · v + u · (v × µ)]
110 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
e′i = R(ϕ)ei , i = 1, 2, 3,
′
Ṙ(ρ ) = R(ϕ)Ṙ(ρ),
T
y la matriz antisimétrica Ω = Ṙ(ρ)R (ρ) posee por componentes esenciales las componentes del
vector velocidad angular ω,
0 −ωz ωy
Ω = ωz 0 −ωx . (2.136)
−ωy ωx 0
Podemos ver que transforma
Para esta partícula no existen ligaduras entre sus variables cinemáticas, y como u̇ = 0, la
forma más general de su Lagrangiana utilizando la homogeneidad, es
e = T ṫ + R · ṙ + W · ω.
L (2.137)
e ṫ, Ri = ∂ L/∂
Las funciones T = ∂ L/∂ e ṙi , Wi = ∂ L/∂ω
e i , serán funciones de (t, r, ρ) y funciones
homogéneas de grado cero de las derivadas de las variables cinemáticas (ṫ, ṙ, ω). Como ṫ ̸= 0 las
podremos expresar en términos de u = ṙ/ṫ y de Ω = ω/ṫ, que son efectivamente la velocidad y
velocidad angular de la partícula, respectivamente. Si la partícula es libre, la invariancia de la
Lagrangiana bajo P , nos lleva a que estas funciones transformen bajo P :
γ2
R′ = R(µ)R − γvT /c2 + (v · R(µ)R)v, (2.139)
(1 + γ)c2
W ′ = R(ϕ)W . (2.140)
Son invariantes por traslación y por lo tanto independientes de t y de r . Son por lo tanto
únicamente funciones de (u, Ω), con la ligadura u = c. La invariancia bajo rotación nos prohibe
la dependencia explícita de ρ, de tal manera que la dependencia en las variables ρ y ρ̇, lo es a
través de la velocidad angular ω , como hemos comentado en la sección 2.2.
El teorema de Noether nos da lugar, como anteriormente, a las siguientes constantes del
movimiento:
γ2
P ′ = R(µ)P + γvH/c2 + (v · R(µ)P )v, (2.146)
(1 + γ)c2
S ′ = R(ϕ)S. (2.147)
La relación entre P y u se obtiene a partir de (2.143), tomando la derivada con respecto a τ y
con la condición de que el espín, que se reduce a W , es constante, K̇ = 0 = H ṙ/c2 − P ṫ, es
decir, P = Hu/c2 . Tomando ahora el producto escalar de esta expresión con u obtenemos que
H = P · u.
A partir de (2.145) y (2.146), la magnitud (H/c)2 − P 2 es una propiedad invariante y
constante del movimiento, que debido a la relación entre sus términos, es idénticamente nula.
La partícula es de masa nula. Para esta partícula, ambos observables H y P son siempre no
nulos para todo observador inercial. En caso contrario, si se anulan para un observador se anulan
para todos. Por (2.147), S 2 es otro invariante y constante del movimiento, por lo que juntamente
con la masa nula es otra propiedad intrínseca de la partícula.
La parte de la Lagrangiana T ṫ + R · ṙ = −H ṫ + P · ṙ , puede ponerse como −(H − P · u)ṫ = 0,
por lo que es idénticamente nula. La Lagrangiana se reduce solamente al tercer término que es
de la forma S · ω . Una partícula de masa nula que se mueve en línea recta a la velocidad
112 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
de la luz, necesariamente tiene que venir caracterizada por variables de orientación, pues en
caso contrario L e = 0, es decir, los fotones necesariamente van rotando. La formulación
relativista prohibe la existencia de partículas puntuales masivas que se mueven en línea recta a
la velocidad de la luz.
Vemos a partir de (2.132) y (2.147) que la magnitud adimensional ϵ = S · u/Sc, es otro
invariante y constante del movimiento, y lo que esperamos es que la Lagrangiana sea una función
explícita de él y de S . Teniendo en cuenta la forma de transformar bajo P de u, ω y S , dadas en
(2.132), (2.135) y (2.147) respectivamente, resulta que el espín debe ser necesariamente función
vectorial de u y ω . Por otra parte, la Lagrangiana debe ser función explícita y homogénea de
grado uno de todas las derivadas de las variables cinemáticas, luego S tiene que ser una función
homogénea de grado cero de ṫ y ṙ .
Si el espín no es transversal, como ocurre con los fotones reales, entonces S = ϵ Su/c con
ϵ = ±1, por lo que la Lagrangiana queda nalmente:
( )
e ϵ S ṙ · ω
L= . (2.148)
c ṫ
γ2
HL = γH + γv · p, pL = p + γHv/c2 + (v · p)v.
(1 + γ)c2
Como H = hν , p = Hu/c2 , para la frecuencia medida en OL llegamos a
νL = γν(1 + v · u/c )2
donde u es la velocidad del fotón medida por O. Supongamos en primer lugar que el origen de O
se aleja OL , por lo que los fotones que llegan al origen de OL son los que v · u = −vc, de ahí que
la frecuencia detectada vale
√
1 − v/c
νL = γν(1 − v/c) = ν , νL < ν.
1 + v/c
Sin embargo cuando OL ve a O acercarse, entonces los fotones que le llegan son los que v · u = vc,
por lo que la frecuencia que detecta es mayor y vale:
√
1 + v/c
νL = γν(1 + v/c) = ν , νL > ν.
1 − v/c
Experimento de Beth
El experimento de Beth 5 , realizado en el año 1936, consiste en producir un haz de luz
monocromática polarizada circular de frecuencia ν , y hacerla incidir sobre una placa adherida a
un péndulo de torsión, para ser absorbidos los fotones por ella. Si la potencia del haz polarizado
es P el haz lleva n = P/hν fotones por segundo, todos con el espín en la misma dirección.
Entonces al ser absorbidos por la placa, ésta varía su momento angular J con respecto al punto
O, en la forma dJ/dt = n~ por segundo, lo que da lugar a que el momento M de las fuerzas
externas producidas por la torsión del péndulo debe igualar a esta variación.
Figura 2.5: Haz de luz monocromática polarizada circular de intensidad n fotones por
segundo, que son absorbidos por una placa que está en equilibrio mediante un hilo de
torsión. Al absorber los fotones, la placa gira un ángulo ϕ, a derechas o a izquierdas, según
que el haz de luz polarizada circular sea a derechas o a izquierdas, comprobándose que
todos los fotones del haz tienen el espín en la misma dirección.
Para un hilo de longitud L, radio a y módulo de torsión µ, el momento de las fuerzas externas
que lo hace rotar un ángulo ϕ, vale:
πa4
M =µ ϕ.
2L
Midiendo el ángulo ϕ que ha girado la placa, se comprueba en el experimento que M = n~, ya
que cada fotón absorbido lleva un momento angular de valor ~.
Pero el dispositivo del experimento de Beth es también un analizador de la polarización de
los fotones. Si al hacer incidir el haz de luz polarizada circular sobre el disco de la gura, éste
gira hacia la derecha, el haz contiene fotones con sus espines hacia adelante. Si el disco gira
hacia la izquierda, los fotones tienen su espín hacia atrás.
Los antifotones, es decir partículas para las que H < 0, se corresponden con las que cumplen
H = S · Ω = p · u < 0 y por lo tanto el espín y la velocidad angular tienen sentidos opuestos
y lo mismo la velocidad y el momento lineal. En cualquier caso poseen la misma energía que
los fotones con H > 0. Para saber si un sistema material absorbe un fotón o un antifotón,
habría que medir por separado el espín del fotón absorbido, que es una medida mecánica,
y por otra la velocidad angular del fotón, de la cual solamente se conoce su valor absoluto,
la frecuencia. Pero también midiendo la dirección del momento lineal que debe ser opuesta
a la velocidad. Lo que parece es que las partículas producidas por radiación son fotones, ya
que la presión de radiación, y por lo tanto la dirección del momento lineal coinciden. Por
eso resulta difícil de determinar de forma experimental si lo que se absorbe es un fotón o
un antifotón. En la interacción electromagnética electrón-núcleo, si la interpretamos como un
intercambio de fotones, para que las partículas se aproximen y la órbita sea una trayectoria
ligada intercambiando una partícula fotónica, ésta tiene que ser un antifotón. En cambio, en
la interacción electrón-electrón, las partículas se separan, por lo que lo que intercambian es un
fotón. Ver la sección 2.7 para el análisis de partículas y antipartículas.
La relación entre los diversos observables para el fotón (H > 0) y el antifotón (H < 0) viene
representada en la gura 2.6
Figura 2.6: Relación entre los diferentes observables u, S , Ω y p, para el fotón H > 0 en la
columna izquierda y para el antifotón H < 0 en la columna derecha para las dos helicidades
ϵ = ±1. S = ϵSu/c, p = Hu/c2 = ϵSΩ/c, H = p · u = S · Ω.
Si los posibles estados del fotón los representamos de forma vectorial como | sign(H), ϵ >,
los estados de la izquierda de la gura son los |+, + > y |+, − >, y los de la derecha |−, + > y
|−, − >, respectivamente. Son estados independientes y ortogonales. Si el campo de radiación
solamente está compuesto de fotones (H > 0), es por lo que la descripción clásica de los estados
vectoriales de la luz monocromática, aparece descrita por vectores complejos del espacio de
Hilbert C2 y los estados de polarización por la esfera de Poincaré, como la combinación lineal
convexa de estados puros (Ver apéndice 3.4). Sobre la posible detección de antifotones ir a la
sección 2.7 y siguiente.
2.5. LUXONES 115
R(ϕ)u̇
u̇′ = . (2.152)
γ(1 + v · R(µ)u/c2 )
la expresión (2.150) viene de R(ρ′ ) = R(ϕ)R(ρ), que tomando la derivada con respecto a τ ,
Ṙ(ρ′ ) = Ṙ(ϕ)R(ρ) + R(ϕ)Ṙ(ρ), debido a que el parámetro ϕ depende de τ a través de la
velocidad u(τ ), y por lo tanto
R(ϕ)ΩRT (ϕ) corresponde a R(ϕ)ω y la matriz antisimétrica Ωϕ = Ṙ(ϕ)RT (ϕ) tiene por com-
ponentes esenciales el vector ω ϕ , es decir, la ecuación (2.151).
La condición de homogeneidad de la Lagrangiana conduce a la forma general
e = T ṫ + R · ṙ + U · u̇ + W · ω,
L (2.153)
libre el teorema de Noether, debido a la invariancia bajo el grupo de Poincaré, nos produce las
siguientes constantes del movimiento:
En este caso el espín S , es decir el momento angular con respecto al punto r , viene dado como
en el caso Galileano, por
S = u × U + W = Z + W, (2.158)
no es una magnitud conservada sino que satisface la ecuación dinámica
dS
= P × u,
dt
que se anula solamente si P = 0.
Como en el caso Galileano, tenemos también la invariancia de las ecuaciones dinámicas bajo
el grupo de rotaciones locales SO(3)L que nos cambian las variables de orientación sin modicar
la velocidad angular por lo que como en (2.51) obtenemos las tres constantes del movimiento
que queda expresado para la partícula libre en términos de constantes del movimiento y por
lo tanto es otra constante del movimiento. Su módulo, −wµ wµ = m2 c2 SCM 2 , donde S
CM es el
espín medido por el observador del centro de masa, es también otra constante del movimiento
para la partícula libre, y si aceptamos el principio atómico, debe tomar el mismo valor incluso
bajo interacción. Queda expresado en términos de las propiedades invariantes y por lo tanto
intrínsecas m y SCM de la partícula, siendo SCM 2 el módulo al cuadrado de S CM , que en el
caso cuántico es 3~ /4. El módulo de este espín no es invariante y para un observador que ve
2
1
r=± S × u. (2.165)
mc2
Esta ecuación es la dinámica del punto r para el observador del centro de masa y este movimiento
interno tiene lugar en un plano ortogonal al espín constante S . El producto escalar con u nos
lleva a r · dr/dt = 0, por lo que el radio de este movimiento (el zitterbewegung) es constante.
Tomando la derivada temporal de ambos miembros de (2.165), obtenemos mc2 u = ±(S ×
du/dt), debido a que el espín es constante en este referencial, con lo que u y S son ortogonales.
Si volvemos a derivar esta expresión concluímos que du/dt y S son también ortogonales. Si
introducimos en (2.165) esta expresión de u y tenemos presente la ortogonalidad entre el espín
y la aceleración, tanto para la partícula como la antipartícula, se llega a
d2 r mc2
+ ω 2 r = 0, ω= . (2.166)
dt2 S
que es exactamente la misma ecuación del preámbulo (2) y de la partícula no relativista (2.75)
cuando el centro de masa está en reposo. Haciendo en (2.165) el producto vectorial con u y
usando la ortogonalidad del espín con la velocidad se llega a
S = ±mu × r. (2.167)
Figura 2.7: Movimiento del centro de carga del electrón en el sistema de referencia del
centro de masa. La parte antiorbital Z = u × U del espín tiene la dirección de S y la parte
W tiene la dirección de ω. El espín es ortogonal a la velocidad del centro de carga y a la
separación entre CC y CM.
M. Mathisson, Neue mechanik materieller systeme, Acta Phys. Pol. 6, 163 (1937); Das zitternde elektron
7
Weyssenhof and A. Raabe, Relativistic dynamics of spin-uids and spin-particles, Acta Phys. Pol. 9, 7 (1947);
Relativistic dynamics of spin-particles moving with the velocity of light, 9, 19 (1947).
2.5. LUXONES 119
con lo que su módulo no es invariante Poincaré y teniendo presente cómo transforma u̇ dado
en (2.152), se tiene que S · u̇ = S ′ · u̇′ y de (2.132) S ′ · u′ = γ(1 + v · R(µ)u/c2 )S · u. Puesto
que el espín es ortogonal a u y u̇, para el observador del centro de masa, resulta ser siempre
ortogonal a u y u̇ para cualquier otro observador inercial.
Un método alternativo para ver esto es tomar la derivada temporal en (2.156) y (2.157), y de aquí
dS du
Hu − c2 P − ×u−S× = 0,
dt dt
como
dS
= P × u,
dt
es decir,
du
S× = (H − u · P )u.
dt
y un producto escalar con S , conduce a (H − u · P )u · S = 0. El factor entre paréntesis no se anula
puesto que el invariante H /c − P = m c es denido positivo y si resultase que H = u · P ,
2 2 2 2 2
entonces (u·P ) /c −P con u ≤ c sería negativo, lo que es una contradicción. Por lo tanto S·u = 0.
2 2 2
Si ahora tomamos la derivada temporal de esta expresión, sabiendo que dS/dt es ortogonal a u,
obtenemos S · u̇ = 0. El observable S tiene siempre la dirección del vector no nulo u̇ × u para las
partículas (H > 0) y en sentido contrario para las antipartículas (H < 0).
Figura 2.8: Movimiento del centro de carga del positrón en el sistema de referencia del
centro de masa. La parte W de su espín tiene sentido contrario a la velocidad angular de
rotación del sistema cartesiano ligado al punto y que aquí no se ha dibujado. La parte Z
tiene el sentido orbital y por lo tanto la misma dirección que S .
La expresión (2.170) del espín con respecto al centro de carga se puede reescribir como
(H ṫ − P · ṙ)
S= u̇ × u.
u̇2
Como sabemos de (2.132) que u′ = R(ϕ)u y de (2.152) que u̇′ = R(ϕ)u̇/γ(1 + v · R(µ)u/c2 ),
′2
resulta que u̇ = u̇ /γ (1 + v · R(µ)u/c )
2 2 2 2
y el numerador (H ṫ − P · ṙ) es invariante Poincaré, de
Desde el punto de vista geométrico, como el vector u es tangente a la trayectoria del centro
de carga y su derivada es perpendicular a él, resulta de (2.170) que el espín de la partícula
con respecto al centro de carga S tiene dirección opuesta a la binormal, y dirección según la
binormal para la antipartícula.
El centro de masa, con respecto al centro de carga, está en la dirección de la aceleración tanto
para la partícula como para la antipartícula. El punto r , como en el caso no relativista, efectúa
un movimiento central alrededor del centro de masa. Si de (2.171) expresamos la aceleración en
términos de r − q , el espín con respecto al punto r también puede ponerse como:
H
S=− (r − q) × u = ∓γ(v)m(r − q) × u, (2.172)
c2
que refuerza la idea de su carácter antiorbital con respecto al centro de masa para la partícula
(H > 0) y orbital para la antipartícula (H < 0). Queda expresado en términos de los dos puntos
característicos, r y q , de sus velocidades respectivas u y v , y del parámetro positivo m, la masa.
Como en cualquier caso se compone de dos términos S = Z + W , esto quiere decir que para la
antipartícula Z tiene también la dirección de S y por lo tanto la parte W en sentido contrario,
con lo que esta parte W tiene sentido opuesto a la velocidad angular. En esto coincide con los
fotones, en los que el espín que es únicamente rotativo tiene la dirección de la velocidad angular
para la partícula y sentido contrario a la velocidad angular para la antipartícula.
9
J.J. Sakurai, Advanced Quantum Mechanics, Addison-Wesley Reading, MA (1967).
2.5. LUXONES 121
Vemos que la partícula tiene masa y espín, el centro de carga se mueve en círculos a la velo-
cidad de la luz en un plano perpendicular al espín. Todas estas propiedades son independientes
del tipo de Lagrangiana de la forma (2.153) que consideremos. De la última expresión de (2.172)
y en el caso de la partícula libre (v = constante) se obtiene dS/dt = P × u.
b) El momento lineal no tiene la misma dirección que la velocidad de este punto u, sino que
está relacionado con un cierto valor medio de la misma: . . . `la componente x1 de la velocidad,
cα1 , tiene dos partes, una parte constante de valor c2 p1 H −1 , y ligada con el momento lineal por
2
la expresión relativista habitual, y una parte oscilante, cuya frecuencia es por lo menos 2mc /h,
. . .'.
c) Acerca de las componentes del vector de posición r : `La parte oscilante de x1 es pequeña,
. . . , es del orden de magnitud de ~/mc, . . .'.
d) En el artículo original de 1928, 11 cuando analiza la interacción del electrón con un
campo electromagnético externo, después de hacer el cuadrado del operador de Dirac, obtiene
dos nuevos términos en el Hamiltoniano de interacción:
e~ ie~
Σ·B+ α · E, (2.173)
2m 2mc
y donde el espín del electrón aparece escrito como S = ~Σ/2,
( )
σ 0 e e
Σ= , µ= S=2 S, g = 2,
0 σ m 2m
10
P.A.M. Dirac, The Principles of Quantum mechanics, Oxford Univ. Press, 4th ed. Oxford (1967).
11
P.A.M. Dirac, The quantum theory of the electron, Proc. Roy. Soc. Lon. A117, 610 (1928). La traducción
que ofrecemos en las notas es del autor.
122 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
y la partícula de Dirac posee una relación giromagnética g = 2. Los campos E y B son los
campos eléctrico y magnético externos, respectivamente. Entonces dice, `El electrón se va a
comportar como si tuviera un momento magnético (e~/2m) Σ y un momento dipolar eléctrico
(ie~/2mc) α. El momento magnético es el mismo que el del modelo de electrón con espín'
(modelo de Pauli). `El momento dipolar eléctrico, como es imaginario puro, podemos esperar
que no aparezca en el modelo.'
Sin embargo, en nuestro modelo clásico, y para el observador del centro de masa, existe un
momento dipolar eléctrico instantáneo y un momento magnético, dados por
e e dk e
d = ek = S × u, µ= k× =− Z, (2.174)
mc2 2 dt 2m
donde S es el espín total y Z = −mk×dk/dt, la parte del espín que proviene del zitterbewegung,
o movimiento orbital de la carga. El valor medio de d es cero, y el valor medio de µ es el vector
constante µ.
e) En su libro12 analiza la dinámica del espín S = ~σ/2, y llega a la conclusión que
dS
= p × cα = p × u
dt
tanto para el electrón libre como en interacción, y que por lo tanto satisface la misma ecuación
dinámica que el momento angular de una partícula con respecto a su centro de carga. El operador
espín de Dirac representa al momento angular del electrón con respecto al centro de carga.
Este modelo clásico produce una predicción cinemática que es la misma que la del modelo
no relativista descrito en la Sec.2.2.7. Si la carga de la partícula es negativa, la corriente de
la misma Fig.2.7 produce un momento magnético que tiene la misma dirección que el espín.
Todos los experimentos realizados para medir de forma precisa la relación giromagnética, están
basados en la determinación de frecuencias de precesión del espín, las cuales son independientes
de la orientación del mismo. El hecho de que sea difícil separar a los electrones en dos haces en
un experimento de tipo Stern-Gerlach, está sugiriendo realizar experimentos de polarización a la
hora de determinar la orientación relativa entre el espín y el momento magnético. Hemos sugerido
recientemente, un par de experimentos para encontrar cómo es esta orientación relativa13 , y que
es analizado en la sección 4.2.6.
Otra consecuencia del modelo clásico es que refuerza el que la interacción con un campo
externo sea del tipo del denominado acoplamiento mínimo, de la forma jµ Aµ , entre la corrien-
te asociada al movimiento de la carga y los potenciales externos. Las propiedades magnéticas
del electrón provienen de esta corriente y no de ninguna distribución de momentos dipolares
magnéticos, de tal manera que la única interacción posible entre un punto cargado r , y un
campo externo, es el de la corriente j µ , asociada al movimiento del punto r , con los potenciales
externos.
Hemos visto que las partículas relativistas que satisfacen u = c y u perpendicular a u̇,
el vector de posición r se mueve en círculos de acuerdo con la ecuación dinámica (2.165) y
para el observador del centro de masa el movimiento armónico (2.166), como vemos dibujado
en la gura 2.7. Pero esta solución es independiente del tipo de la Lagrangiana particular que
escojamos, como función invariante Poincaré de las variables cinemáticas y sus derivadas, y
12
P.A.M. Dirac, The principles of Quantum Mechanics, Oxford 4th edition 1958, p. 266
13
M. Rivas, Are the electron spin and magnetic moment parallel or antiparallel vectors?, Ar-
Xiv:physics/0112057.
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 123
donde las funciones T y R denen la acción sobre el espacio-tiempo del grupo cinemático G, de
parámetros (g1 , . . . , gr ). Entonces, eliminando t como función de t′ de la primera y sustituyendo
en la segunda, obtenemos
r ′ (t′ ) = r ′ (t′ ; g1 , . . . , gr ). (2.175)
Como O′ puede ser cualquier observador, la ecuación (2.175) representa a la familia completa
de todas las trayectorias del punto para todos los observadores inerciales. Esta familia está
parametrizada por los parámetros del grupo gi . Si eliminamos los parámetros gi entre la función
r ′ (t′ ) y sus sucesivas derivadas temporales, obtendremos la ecuación diferencial invariante que
satisface la trayectoria del punto, para cualquier observador inercial. Que es invariante se ve
por construcción ya que es independiente de los parámetros del grupo. Vamos a considerar a
continuación que G sea el grupo de Poincaré y obtendremos la ecuación diferencial invariante
relativista.
d2 r ∗ (t∗ )
= −ω02 r ∗ (t∗ ). (2.176)
dt∗ 2
Como la carga se mueve con la velocidad c para el observador del centro de masa O∗ , se
mueve también con c para cualquier otro observador O. La relación de sus medidas viene dada
por
dr dr/dt∗
r (1) = = ,
dt dt/dt∗
dr ∗ (t∗ ) dK dV
K(t∗ ) = R(α)r ∗ (t∗ ), V (t∗ ) = R(α) ∗
= ∗, = −ω02 K,
dt dt dt∗
dB dA
B(t∗ ) = v · K/c2 , A(t∗ ) = v · V /c2 =
∗
, = −ω02 B,
dt dt∗
con A adimensional y B con dimensiones de tiempo. K tiene dimensiones de longitud y V de
velocidad. En particular
dt
= γ(1 + v · V /c2 ) = γ(1 + A),
dt∗
Por otra parte
K 2 = R02 , V 2 = c2 , K · V = 0, K · v = c2 B, V · v = c2 A.
Haciendo uso de la relación (2.176) y sus derivadas, obtenemos mediante derivación las siguientes
expresiones para las derivadas temporales del punto r en el sistema de referencia arbitrario O:
( )
1 γ
r (1)
= V + (1 + γ + γA) v (2.177)
γ(1 + A) 1+γ
( )
ω02 γ
r (2)
= −(1 + A)K + BV + Bv , (2.178)
γ 2 (1 + A)3 1+γ
ω02 (
r (3) = 3 5
−3ω02 B(1 + A)K − (1 + A − 3ω02 B 2 )V +
γ (1 + A)
)
γ 2 2
(A(1 + A) + 3ω0 B )v (2.179)
1+γ
ω04 (
r (4) = 4 7
(1 + A)(1 − 2A − 3A2 − 15ω02 B 2 )K−
γ (1 + A)
(7 + 4A − 3A2 − 15ω02 B 2 )BV −
)
γ
(1 − 8A − 9A2 − 15ω02 B 2 )Bv . (2.180)
1+γ
De éstas se obtiene
( ) ( )
r (1) · r (1) = ω02 R02 = c2 , r (1) · r (2) = 0, (2.181)
( ) ( ) ω 4 R2
r (2) · r (2) = − r (1) · r (3) = 4 0 0 4 , (2.182)
γ (1 + A)
( ) 1 ( ) ω 5 R2
r (2) · r (3) = − r (1) · r (4) = 5 0 0 6 (2ω0 B), (2.183)
3 γ (1 + A)
( ) 6
ω0 R0 2 ( )
r (3) · r (3) = 6 8
1 − A2 + 3ω02 B 2 , (2.184)
γ (1 + A)
( ) ω06 R02 ( )
r (2) · r (4) = 6 8
−1 + 2A + 3A2 + 9ω02 B 2 , (2.185)
γ (1 + A)
( ) 4ω07 R02 ( )
r (3) · r (4) = 1 + A + 3ω 2 2
0 B (ω0 B). (2.186)
γ 7 (1 + A)10
Como ω0 B es adimensional, las dimensiones de estos términos están en los coecientes ω0k R02 ,
es decir L2 T −k .
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 125
Por inspección de (2.177-2.180) vemos que las cuatro derivadas temporales de la posición
del centro de carga se expresan como combinación lineal de los tres vectores V , K y v , donde
los dos primeros son ortogonales y el tercero es un vector constante que, en general, no es
combinación lineal de los otros dos.
γ 2 (1 + A)3 (3)
v = r (1) − 3Bγ(1 + A)r (2) + r , (2.187)
ω02
γA (1) 3γ 2 B γ 3 (1 + A)3
V = r + (1 + γ + γA)(1 + A)r (2) − (1 + γ + γA) r (3)(2.188)
1+γ 1+γ (1 + γ)ω02
γB (1) γ 2 (1 + A) γ 4 B(1 + A)3 (3)
K = r + 2 [3ω02 B 2 γ − (1 + γ)(1 + A)]r (2) − r . (2.189)
1+γ (1 + γ)ω0 (1 + γ)ω02
Está claro que las tres derivadas r (i) , i = 2, 3, 4 se podrán expresar como una combinación
lineal. Si denimos
γ 2 (1 + A)3 (2) γ 3 (1 + A)5 (3) γ 4 (1 + A)7 (4)
d1 = γ(1 + A)r (1) , d2 = r , d3 = r , d4 = r ,
ω02 ω02 ω04
obtenemos la relación:
que representa la ecuación diferencial invariante que satisface la posición del centro de carga,
en cualquier sistema de referencia inercial.
A partir de las ecuaciones (2.182)-(2.184) podemos expresar las magnitudes A, B y γ en
términos de los productos escalares entre las diferentes derivadas temporales (r (i) · r (j) ), i, j =
2, 3. La ligadura de que la velocidad es c, implica que estos productos escalares y los sucesivos
para derivadas de orden superior, se pueden expresar solamente en términos de tres de ellos, ya
que todos se expresan como funciones de γ , A y B .
con R0 = c/ω0 y así todos los términos en numerador y denominador tienen las mismas dimen-
siones espacio-temporales. De esta forma
( )
3(r (2) · r (3) ) (3) 2(r (3) · r (3) ) 3(r (2) · r (3) )2 1 (2) (2) 1/2
r −
(4)
r + − − (r · r ) r (2) = 0.
(r · r )
(2) (2) (r · r )
(2) (2) 4(r · r )
(2) (2) 2 R 0
(2.194)
Es una ecuación diferencial de cuarto orden que contiene como soluciones trayectorias descritas
a la velocidad de la luz. En efecto, si (r (1) · r (1) ) = c2 , entonces por derivaciones sucesivas
obtenemos que (r (1) · r (2) ) = 0 y volviendo a derivar (r (2) · r (2) ) + (r (1) · r (3) ) = 0. Teniendo esto
presente y haciendo el producto escalar de (2.194) con r (1) , obtenemos (r (1) ·r (4) )+3(r (2) ·r (3) ) =
126 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
0, que es otra de las relaciones entre las derivadas como consecuencia de que |r (1) | = c. Vamos
a compararla con la ecuación diferencial más general de un punto en el espacio tridimensional
dada en el preámbulo (6),
( ) ( ) ( )
2κ̇ τ̇ κ̇τ̇ 2κ̇2 − κκ̈ 2 κ̇ τ̇
r (4)
− + r (3) 2 2
+ κ +τ + + (2)
r +κ − r (1) = 0,
κ τ κτ κ2 κ τ
donde los puntos sobre κ y τ representan derivadas temporales. La ecuación diferencial del
centro de carga describe un movimiento helicoidal ya que carece del término en la primera
derivada r (1) , que implica, de acuerdo con lo expresado en el preámbulo, que existe una relación
constante entre curvatura y torsión. En efecto, si el término en r (1) es cero, esto implica que
κ̇/κ = τ̇ /τ , y por lo tanto el coeciente de r (3) resulta ser −3κ̇/κ. En efecto como la curvatura
κ = |d2 r/ds2 | = (r (2) · r (2) )1/2 /c2 , en términos de derivadas temporales y derivando de nuevo
con respecto al tiempo, se deduce que
resulta que
( )2
(r (3) · r (3) ) κ̇
= κ2 + τ 2 + ,
(r (2) · r (2) ) κ
y como
κ̈ (r (3) · r (3) ) + (r (2) · r (4) ) (r (2) · r (3) )2
= − (2) (2) 2 ,
κ (r (2) · r (2) ) (r · r )
y donde el producto escalar (r (2) · r (4) ) se podrá expresar en términos de los otros 3. Este
coeciente que se puede comprobar sumando los términos de (2.182)-(2.184), es
( )2
κ̇ κ̈ (r (3) · r (3) ) 3(r (2) · r (3) )2 1 (2) (2) 1/2
2 − = (2) (2) − − (r · r ) ,
κ κ (r · r ) 4(r · r ) (2) (2) 2 R0
6 6
5 5
4 4
3 3
2 2
1 1
Figura 2.9: Proyección en el plano XOY del movimiento del centro de carga (azul) y centro
de masa (rojo) de un electrón libre, que se ha lanzado con v/c =0.2 La trayectoria de la
izquierda, el electron es lanzado en el plano del zitterbewegung, el espín es perpendicular
a este plano y la separación entre CC y CM no es constante. La trayectoria de la derecha
corresponde a lanzar al electrón en una dirección perpendicular al plano del zitterbewe-
gung, con el espín en la dirección del movimiento. Aquí, la separación entre ambos puntos
es constante. Ambos movimientos tienen un período espacial de valor d = vγ(v)T0 =1.28255,
en estas unidades.
R = R0 γ(v)2 .
d2 q d2 r
= 0, = ω02 (q − r). (2.197)
dt2 dt2
un movimiento libre para el centro de masa y un movimiento armónico isótropo alrededor de q
para el centro de carga, de pulsación constante ω0 = c/R0 .
En la gura 2.10 se representa el movimiento del CC y del CM en el plano XOY para
cuatro velocidades diferentes, en las que se aprecia que la separación relativa entre estos centros
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 129
6 6 6 6
5 5 5 5
4 4 4 4
3 3 3 3
2 2 2 2
1 1 1 1
0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0
Figura 2.10: Proyección en el plano XOY , del movimiento del CC y del CM, con velocidades
respectivas v/c=0.2,0.3,0.4 y 0.5. Obsérvese que la separación relativa del CM oscila entre
(1 − v/c)R0 y (1 + v/c)R0 , para esta orientación del espín.
oscila en el intervalo entre (1 − v/c)R0 y (1 + v/c)R0 . Las longitudes de onda (lo que recorre
el CM durante una vuelta del CC) de esos movimientos son, respectivamente 1.28255, 1.97597,
2.74221 y 3.6276. En la gura 2.11 los mismos movimientos pero con una velocidad del CM
perpendicular al plano del zitterbewegung. En este caso la separación entre centros es constante.
6 6 6 6
5 5 5 5
4 4 4 4
3 3 3 3
2 2 2 2
1 1 1 1
0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0
Figura 2.11: Proyección en el plano XOZ , del movimiento del CC y del CM, con velocidades
respectivas v/c=0.2,0.3,0.4 y 0.5. Obsérvese que la separación relativa entre el CC y el CM
es constante, pero lo que recorre el CM en cada vuelta del CC es lo mismo que en el caso
de la gura anterior.
-1.0
-0.5
0.0
0.5 0.5
0.0 1.0
-0.5
Figura 2.12: Movimiento del CC y del CM en la que la velocidad del CM v/c =0.1 y posee
una orientación de 30◦ , con respecto al plano del zitterbewegung. La separación |q − r| no
es constante, pero este vector q − r es siempre ortogonal al vector velocidad u del centro
de carga.
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 131
La parte relacionada con Lm se reduce a −dP m /dt, siendo P m el momento lineal mecánico,
mientras que la relacionada con LI suministra la fuerza de Lorentz sobre la carga localizada en
el punto r . Pasando al otro miembro la derivada del momento lineal se llega a
dP m
= F, (2.199)
dt
en tanto que la denición habitual del centro de masa permanece inalterada
d2 r c2 − v · u
= (q − r) . (2.200)
dt2 (q − r)2
Esta ecuación también procede de la denición del espín con respecto al centro de carga (2.172)
H
S=− (r − q) × u,
c2
y en la dención de S = u×U +W aparecen solamente las funciones U y W las cuales son
propiedades mecánicas que no son modicadas por la interacción ya que e I no depende ni de u̇ ni
L
deω . Si resulta que el espín S no es modicado por la interacción, esto implica que en su denición
anterior, laH que gura se reere al momento temporal mecánico Hm , que tampoco es modicado
e m , de ahí que la denición del centro de masa
por la interacción ya que su denición procede de la L
u×S
q−r = ,
Hm
que es la que conduce a la ecuación (2.200) permanezca inalterada cuando hay una interacción.
Pero el momento lineal mecánico se escribe en términos de la velocidad del centro de masa
como P m = mγ(v)v , de manera que las ecuaciones de la partícula libre (2.196) ha quedado
reemplazada en presencia de un campo externo por (2.199) y (2.200). Vamos a modicar (2.199),
( )
dP m dv dv v
= mγ(v) + mγ(v) v ·
3
= F,
dt dt dt c2
por lo que despejando la derivada de orden superior dv/dt en el primer miembro, obtenemos
las ecuaciones diferenciales que describen la evolución del centro de masa y del centro de carga
de un electrón relativista con espín en presencia de un campo electromagnético externo, en
cualquier sistema de referencia inercial:
[ ]
d2 q e 1
= E + u × B − 2 v ([E + u × B] · v) , (2.201)
dt2 mγ(v) c
d2 r c2 − v · u
= (q − r) . (2.202)
dt2 (q − r)2
donde
dq dr
v= , u= ,
dt dt
con la ligadura |u| = c. Podemos comparar estas ecuaciones relativistas con las no relativistas de
la partícula Galileana (2.84) y (2.85). Para los otros tres grados de libertad se sigue manteniendo
la misma ecuación dinámica (2.52)
( )
∂Lm d ∂Lm dW
− = 0, = Ω × W. (2.203)
∂ρ dt ∂(dρ/dt) dt
ya que la dependencia de estas variables lo es a través de Ω siendo LI independiente de ella.
De la ecuación (2.202), haciendo el producto escalar de ambos miembros por (q − r) resulta:
du
(q − r) · = c2 − v · u.
dt
Por otra parte
d du du
(q · u − r · u) = v · u + q · − c2 − r · = 0,
dt dt dt
por lo que la función (q − r) · u es una integral primera del sistema. Si volvemos a hacer el
producto escalar por u en ambos miembros de (2.202), vemos que esta integral primera es nula
pues u · du/dt = 0. El vector velocidad u es siempre ortogonal al vector q − r .
La relación de estos valores con los que mide un observador inercial O′ que ve moverse a O con
una velocidad v viene dada por
v · r0 γ 2 (v · r 0 )v
t′0 = γ(t0 + ), r ′0 = r 0 + γvt0 + .
c2 1+γ c2
Si el instante inicial para proceder a la integración es el t′0 = 0 en este referencial, eso corresponde
a t0 = −v · r 0 /c2 , para el observador del centro de masa, por lo que la posición inicial del centro
de carga en el observador del laboratorio, en el instante t′0 = 0, es
γ (v · r 0 )v
r ′0 = r 0 − .
1+γ c2
Para el resto de variables resulta ser
γ2
u0 + γv + (1+γ)c2
(v · u0 )v
u′0 = ,
γ(1 + v · u0 /c2 )
γ
(1 + v · u0 /c2 )a0 − (v · a0 /c2 )u0 − (1+γ)c2
(v · a0 )v
a′0 = ,
γ 2 (1 + v · u0 /c2 )3
γ
(1 + v · u0 /c2 )w0 − (v · w0 /c2 )u0 − (1+γ)c2
(v · w0 )v
w′0 =
γ 3 (1 + v · u0 /c2 )4
[ ]
γ
3(v · a0 /c2 ) (1 + v · u0 /c2 )a0 − (v · a0 /c2 )u0 − (1+γ)c2
(v · a0 )v
− .
γ 3 (1 + v · u0 /c2 )5
Estas condiciones de contorno contienen información de la velocidad del centro de masa v del
electrón. Interpretadas como condiciones de contorno en el instante inicial t′0 = 0 del sistema
de ecuaciones (2.201) y (2.202) resulta que conocemos r ′0 , u′0 , v ′0 = v y nos faltaría por conocer
q ′0 , la posición inicial del centro de masa.
Si consideramos la denición de la posición del centro de masa (2.171) con H = γmc2 , y
P = γmv , nos queda que ( 2 )
c − v · u du
q=r+ ,
(du/dt)2 dt
con lo que la condición inicial para el centro de masa en el sistema de referencia del laboratorio
sería
c2 − v · u′0 ′
q ′0 = r ′0 + a0 ,
a′0 2
en términos de la posición, velocidad y aceleración del centro de carga. Conviene recordar que
en la expresión de la velocidad del centro de masa está la dependencia de la tercera derivada.
En resumen, para caracterizar las condiciones de contorno en el instante inicial t′0 = 0, en
el sistema de referencia del laboratorio debemos jar los valores
γ2
γ (v · r 0 )v u0 + γv + (1+γ)c2
(v · u0 )v
r ′0 = r0 − , u′0 = , (2.205)
1+γ c2 γ(1 + v · u0 /c2 )
c2 − v · u′0 ′
q ′0 = r ′0 + a0 , v ′0 = v, (2.206)
a′0 2
con γ
(1 + v · u0 /c2 )a0 − (v · a0 /c2 )u0 − (1+γ)c2
(v · a0 )v
a′0 = ,
+ v · u0
γ 2 (1 /c2 )3
y donde las magnitudes r 0 , u0 y a0 , son las magnitudes que aparecen para el observador del
centro de masa (2.204). No necesitamos incluir las correspondientes a la sacudida w0 porque
están ya contenidas en la denición de la velocidad del centro de masa v .
2.6. LA ECUACIÓN DINÁMICA DEL ELECTRÓN CON ESPÍN 135
dr de
r de
r
u= = R0 ω0 = c ,
dt de
t de
t
du e
d2 r e
c2 d2 r
=c ω0 = .
dt e
dt 2 e
R0 dt2
por lo tanto la ecuación diferencial (2.202) en unidades naturales queda
e
d2 r 1−ve·u e
= (e e),
q−r
de
t 2 q−r
(e e )2
e
d2 q e~
= e × Bc − v
[E + u e (E + u
e × Bc) · v
e]
e
dt 2 2m 2 c3 γ
donde los campos externos E y B están denidos en cada instante del laboratorio en la posición
del centro de carga r .
( )
1 du
H − eϕ(t, r) = u · (P − eA(t, r)) + 2 S · ×u (2.210)
c dt
en términos de los momentos totales H y P y de los potenciales ϕ y A. En el caso cuántico,
(2.209) y (2.210) nos van a dar las ecuaciones de Klein-Gordon en interacción y la ecuación de
Dirac en interacción, respectivamente, que satisface la función de onda del electrón.
Conocida la ecuación dinámica del momento P m dada en (2.199), si derivamos con respecto
al tiempo en (2.207) se tiene
dHm dP m dHm
2Hm − 2c2 P m · = 0, = v · F (t, r),
dt dt dt
es decir dHm = F · dq , la variación de la energía mecánica es el trabajo de la fuerza externa,
denida en el centro de carga r , a lo largo de la trayectoria del centro de masa q .
(Hm /c)2 − P 2m = m2 c2 ,
donde m es un observable positivo que se interpreta como la masa de la partícula. Entre estos
dos observables mecánicos hay la relación,
P m = Hm v/c2
donde v representa la velocidad del centro de masa de la partícula. Esto trae consigo que
Hm = ±γ(v)mc2 , P m = ±γ(v)mv.
El formalismo relativista predice que hay dos clases de sistemas materiales de la misma masa
positiva m, pero en los que Hm puede ser positivo o negativo y que el momento lineal mecánico
P m , tenga la dirección de la velocidad del centro de masa o en sentido contrario, respectiva-
mente. Al primero se le da el nombre de partícula, reservando el nombre de antipartícula para
el segundo. La diferencia entre ambos es que si la Lagrangiana libre del primero es L e 0 , entonces
e
la Lagrangiana libre del segundo es −L0 .
En cuanto a la estructura interna del movimiento de las variables cinemáticas, implica que
para la partícula, jada la dirección del espín S , el movimiento del centro de carga es antiorbital
2.7. PARTÍCULAS Y ANTIPARTÍCULAS 137
para la partícula y orbital para la antipartícula. Es claro que las propiedades mecánicas inmo-
dicables Hm , P m y S , provinientes de la Lagrangiana mecánica libre L e 0 , cambian de signo
cuando proceden de −L e 0 , pues todas las funciones T , R, U y W también cambian de signo.
e
Para la parte LI toma la forma general
e I = −eϕ(t, r)ṫ + eA(t, r) · ṙ,
L
dP m d(γ(v)mv)
= e (E + u × B) , P m = γ(v)mv, = e (E + u × B) ,
dt dt
e a = −L
mientras que para la antipartícula, de L e0 + L
e ∗ , se llega a
I
dP m d(γ(v)mv)
= e∗ (E + u × B) , P m = −γ(v)mv, = −e∗ (E + u × B) ,
dt dt
donde E = −∇ϕ − ∂A/∂t y B = ∇ × A. Si frente a un mismo campo electromagnético
externo, la aceleración del centro de masa de la partícula es opuesta a la de la antipartícula,
entonces −e∗ = −e, ambos objetos tendrían la misma carga, y esta última ecuación dinámica
se reescribiría,
d
(γ(v)mv) = −e (E + u × B) .
dt
Podríamos denir el momento lineal siempre en el sentido de la velocidad, con lo cual Hm
sería siempre un observable denido positivo, lo que nos daría lugar a dos posibles tipos de
partículas que a igualdad de masa solamente dieren en el signo de la carga, y que vendrían
descritas por las dos Lagrangianas
ep = L
L e 0 − eϕ(t, r)ṫ + eA(t, r) · ṙ,
ea = L
L e 0 + eϕ(t, r)ṫ − eA(t, r) · ṙ,
que corresponde simplemente a un cambio de e por −e, y donde la parte común L e 0 es la que
conduce a una Hm > 0 y P m = Hm v/c . En cualquier caso, el signo de la carga de la partícula
2
no está denido.
Como las ecuaciones dinámicas que se obtienen de L e a y de −L
e a son las mismas, conducen a
dos posibles interpretaciones equivalentes de las diferencias entre partícula y antipartícula. Una
es que ambos objetos elementales tienen la misma masa y carga eléctrica, pero sus propiedades
mecánicas Hm y P m son opuestas. La interpretación del convenio actual es que poseen cargas
opuestas, lo que nos lleva a adoptar la denición de que la energía es positiva y que el momento
lineal tiene la dirección de la velocidad del centro de masa para ambas. La exigencia de la
positividad de la energía puede tener que ver con la dirección de la echa del tiempo. Ver el
análisis que se hace en la sección 6.10.3 sobre transformaciones activas y pasivas del grupo
cinemático.
Este tratamiento es válido para el establecimiento de las ecuaciones dinámicas del centro
de masa de cada partícula. Para la parte del movimiento interno tendríamos para ambas la
ecuación
d2 r c2 − v · u
= (q − r),
dt2 (q − r)2
138 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
La estructura compuesta más simple formada por antimateria sería el núcleo de antihelio
formado por dos antiprotones y dos antineutrones, es decir una partícula antialfa. Esto llevó
a desarrollar un espectrómetro para medir estas partículas. Se le denomina Alpha Magnetic
Spectrometer del cual la versión AMS02 fue instalada en la ISS (International Space Station)
en mayo de 2011, a una altura media de 350 Km. Hasta 2013 había detectado del orden de
25 × 109 medidas de electrones y positrones en el rango de 0.5 a 350 GeV, de los cuales 4 × 105
eran positrones, observando un aumento de la relación positrones/electrones en el rango de 10
a 250 GeV, no habiendo una diferencia signicativa a lo largo del tiempo ni en la dirección de
observación, pero conrmando an unexplained excess of high-energy positrons in Earth-bound
cosmic rays, en palabras de Samuel Ting, director del proyecto 15 . En diciembre de 2016 informa
que ha detectado una pequeña fracción de antihelio-3 entre unos 109 núcleos de helio detectados
durante un año.
15
S. Coutu, Physics 6, 40 (2013); AMS Collaboration Phys. Rev. Lett. 110, 141102 (2013)
2.8. APÉNDICE: GRUPO DE ROTACIONES SO(3) 141
Figura 2.17: Rotación activa de valor α del vector r, alrededor del eje OA
OA = (r · u)u
DC = u × r sin α
donde el primer índice i es un índice de la y el segundo k de columna de la matriz que caracteriza
a esta rotación. Si jamos el vector u, entonces una rotación en el sentido positivo alrededor de
un eje de valor α produce el mismo efecto que una rotación de valor 2π − α tomada en sentido
contrario. Entonces, a la hora de singularizar cada rotación por un vector α, la variedad que
caracteriza al grupo se reduce al conjunto de puntos contenidos dentro y sobre la supercie de
una esfera de radio π , (ver gura 2.18) pero donde los puntos opuestos de la supercie de la
esfera, que representan rotaciones de valor π , corresponden a una misma rotación y por lo tanto
están identicados.
Esta particularidad hace que si tratamos de unir dos puntos de la variedad mediante una
curva de puntos de la variedad, hay dos tipos de curvas que nos unen dichos puntos. Estos tipos
de curvas no pueden reducirse, por deformación, el uno al otro, ya que o pasan por la supercie
de la esfera y saltan a su punto opuesto, o bien unen directamente ambos puntos. La variedad
es un conjunto cerrado y acotado, es decir compacto. Y como la conexión mediante arcos de
dos puntos cualesquiera tiene dos posibilidades, pasando por el borde o sin pasar, resulta que
el grupo de rotaciones es también doblemente conexo. El det(R(α)) = 1, con lo que el grupo
de rotaciones se identica con SO(3), el grupo de matrices 3 × 3 ortogonales de determinante
unidad (Special Orthogonal group).
Otras parametrizaciones alternativas se obtienen deniendo el vector ϕ = sin(α/2)u y la
matriz de rotación se representa por:
√
R(ϕ)ik = (1 − 2ϕ2 ) δik + 2ϕi ϕk + 2 1 − ϕ2 εijk ϕj (2.213)
y la variedad es una esfera de radio unidad con identicación de puntos opuestos sobre la
supercie.
Si denimos el vector ρ = tan(α/2)u en esta parametrización una rotación se expresa
mediante:
1
R(ρ)ik = [(1 − ρ2 ) δik + 2ρi ρk + 2εijk ρj ] (2.214)
1 + ρ2
Ejercicio: Calcular, utilizando dos parametrizaciones distintas del grupo de rotaciones, la matriz
que representa una rotación, en el sentido pasivo, de valor α = 30◦ alrededor de un eje cuyos
cosenos directores son proporcionales a los números (−1, 2, 2).
con lo que comprobamos que generan un espacio vectorial de dimensión 3. Un álgebra de Lie,
además de ser espacio vectorial posee una ley de composición interna, que es distributiva res-
pecto de la suma vectorial, pero que no es en general conmutativa ni asociativa. Basta para
caracterizarla, el conocer dicha ley para los vectores de la base. Para matrices la ley [ , ] se
reduce a su conmutador. Los tres Ji cumplen las reglas de conmutación:
so(3) J1 J2 J3
J1 0 J3 −J2
J2 −J3 0 J1
J3 J2 −J1 0
∑
Sea M = αi Ji una combinación lineal arbitraria de los elementos de la base
∑ Ji , con tres
números reales arbitrarios αi . Esa suma la vamos a escribir formalmente como αi Ji = αu · J ,
siendo αi = αui en términos de las tres componentes de un vector unidad u y donde mediante
144 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
∑
el `producto escalar' u · J ≡ U lo que queremos expresar es el sumatorio ui Ji en forma
compacta. Calculemos la matriz
( ) 0 −u3 u2
M n
exp(M ) ≡ lı́m I + ≡ exp(αU ) = exp α u3 0 −u1 =
n→∞ n
−u2 u1 0
1 0 0 0 −u3 u2 2 −(u22 + u23 ) u1 u2 u1 u3
0 1 0 + u3α α
0 −u1 + u1 u2 −(u21 + u23 ) u2 u3 +
1! 2!
0 0 1 −u2 u1 0 u1 u3 u2 u3 −(u1 + u2 )
2 2
0 u3 −u2
α3
+ −u3 0 u1 + · · ·
3!
u2 −u1 0
de tal manera que habiendo llamado
0 −u3 u2 −(u22 + u23 ) u1 u2 u1 u3
U = u · J = u3 0 −u1 , U2 = u1 u2 −(u21 + u23 ) u2 u3 ,
−u2 u1 0 u1 u3 u2 u3 −(u1 + u2 )
2 2
exp(αJ1 ) exp(βJ1 ) = (I + sin αJ1 + (1 − cos α)J12 )(I + sin βJ1 + (1 − cos β)J12 ) =
Podemos ver que R(α)−1 = RT (α) = R(−α) y que la suma de los elementos diagonales
vale 1 + 2 cos α, en tanto que los cosenos directores del vector unitario u que dene el eje de giro
son proporcionales a los números (R32 − R23 , R13 − R31 , R21 − R12 ), salvo en el caso de que
la rotación sea de valor α = π , que al ser R simétrica, se obtendrán a partir de los elementos
2.8. APÉNDICE: GRUPO DE ROTACIONES SO(3) 145
diagonales que valen, respectivamente −1+2u21 , −1+2u22 y −1+2u23 y las dos posibles soluciones
para cada ui deben ser compatibles con el resto de los elementos Rij .
1
1 + 2 cos α = Rii , ui = ϵijk Rkj , α ̸= 0, π.
2 sin α
Si α = 0, los Rkj , k ̸= j son nulos y la anterior relación es indeterminada, como corresponde al
eje de una rotación nula.
Si calculamos los valores propios de toda matriz ortogonal que representa una rotación,
vemos que se reducen al valor real 1 con vectores propios en el subespacio vectorial de R3 de
dimensión 1 en la dirección del eje de giro, y otros dos valores propios en general complejos
conjugados, de la forma eiα y e−iα , sin vectores propios reales, que en el caso particular α = π
se reducen a −1 que es doble y los correspondientes vectores propios constituyen el espacio
vectorial bidimensional ortogonal al eje de giro.
[Ji , Jk ] = −εikl Jl , i, k, l = 1, 2, 3
Si cada rotación viene dada por un vector α ∈ SO(3) entonces es posible obtener el vec-
tor resultante de la composición de dos rotaciones arbitrarias. Sea R(γ) = R(α)R(β). Si los
vectores α = αu, β = βv y γ = γw, entonces haciendo el producto matricial e identicando
término a término obtenemos:
γ u tan α/2 + v tan β/2 + tan α/2 tan β/2(u × v)
w tan = (2.216)
2 1 − tan α/2 tan β/2(u · v)
α β γ
ρ = tan u, µ = tan v, ν = tan w
2 2 2
entonces R(ν) = R(ρ)R(µ) resulta:
ρ+µ+ρ×µ
ν= (2.217)
1−ρ·µ
146 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
Si tenemos una pequeña tapa cilíndrica boca abajo y la damos la vuelta, esto es la giramos π
radianes alrededor de uno de sus diámetros quedando boca arriba, y a continuación la volvemos a
girar otros π radianes alrededor de otro diámetro, vuelve a quedar boca abajo, y sus puntos han
girado un ángulo doble del que forman estos dos ejes, y en el sentido en que se han tomado estos
ejes.
caracterizada por el ángulo α y el vector unitario u que dene el eje de rotación, vamos a tratar
de representar ambos elementos sobre esta esfera. El vector u lo podemos denir por un punto
sobre ella que representa a su extremo o bien mediante un plano, ortogonal a u que pasando
por el centro corta a la esfera según un círculo máximo. Adoptaremos este segundo punto de
vista. En cuanto al ángulo α, asociado a este eje, deniremos sobre el círculo máximo anterior
un segmento orientado de longitud α/2.
cos γ/2 = cos α/2 cos β/2 + sin α/2 sin β/2 cos(π − ϕ) =
= cos α/2 cos β/2 − sin α/2 sin β/2 cos ϕ
relación que podemos obtener directamente a partir de la composición de las dos matrices que
representan dichas rotaciones.
Si inicialmente en t = 0, escogemos los ejes del laboratorio en coincidencia con los tres ejes
del cuerpo, entonces en el instante t, la matriz R(α(t)) representa la rotación activa que debo
someter a los ejes del laboratorio para llevarlos a coincidencia con los ejes del cuerpo.
Si ahora consideramos otro observador inercial Galileano O′ que está relacionado con O
mediante una transformación Galileana, esto es que nuestras medidas de acontecimientos espacio
temporales están relacionadas mediante
t′ = t + b, r ′ = R(µ)r + vt + a,
signica que la información sobre cualquier otra magnitud de tipo vectorial la relacionamos
con la matriz Jacobiana del cambio de coordenadas espaciales, esto es Rij (µ), siendo µ los
tres parámetros que caracterizan a nuestra orientación relativa. En particular, los tres vectores
unidad ligados al cuerpo transformarán con
e′i = R(µ)ei ,
y Ω es una matriz antisimétrica cuyas tres componentes esenciales denen el vector velocidad
angular instantánea ω(t), ωi = 12 ϵijk Ωjk .
En efecto, para toda matriz de rotación RRT = I, para todo instante t, R(t)RT (t) = I, luego
derivando con respecto al tiempo
ṘRT + RṘT = 0, Ω + ΩT = 0.
dei
= Ωei ≡ ω × ei .
dt
La cinemática se corresponde con una rotación instantánea alrededor de un eje en la dirección
de ω .
Si expresamos las rotaciones en términos del vector α = αu, que representa el ángulo total
girado por el sistema, entonces la velocidad angular se expresa:
dα du du
ω=u + sin α + (1 − cos α)u × . (2.220)
dt dt dt
2.8. APÉNDICE: GRUPO DE ROTACIONES SO(3) 149
2 2
ω= (ρ̇ + ρ × ρ̇), w = RT (ρ)ω = (ρ̇ − ρ × ρ̇).
1 + ρ2 1 + ρ2
siendo w el vector velocidad angular referido a los ejes del cuerpo.
Si en (2.219) derivamos ambos miembros con respecto a t′ , sabiendo que ∂t/∂t′ = 1, resulta
Ω′ (t′ ) = Ṙ(α′ (t′ ))RT (α′ (t′ )) = R(µ)Ṙ(α(t))RT (α(t))RT (µ) = R(µ) Ω(t) RT (µ)
que corresponde a la forma de transformar de un tensor con dos índices, y que para sus com-
ponentes esenciales se reduce a
ω ′ (t′ ) = R(µ)ω(t).
De la expresión (2.214) obtenemos que en la representación de las rotaciones en términos
del parámetro ρ, los ejes ligados al cuerpo ek poseen por componentes
1
(ek )i = [(1 − ρ2 ) δik + 2ρi ρk + 2εijk ρj ]. (2.221)
1 + ρ2
que corresponde a un objeto con simetría de inercia esférica, es decir con los tres momentos
principales de inercia iguales y cuyo momento angular S = W = Iω . Como observación, un
objeto con los tres momentos principales de inercia iguales, no es necesariamente de forma
esférica, como sucede, por ejemplo, con un cubo. En el caso de que los momentos principales
fueran diferentes
1
L = (I1 ω12 + I2 ω22 + I3 ω32 ),
2
las ecuaciones de Euler-Lagrange se escriben, con Si = Ii ωi , (sin sumar sobre i)
como la acción de una rotación, seguida de una transformación Galileana pura y nalmente
una traslación espacial y temporal. De esta forma, todos los parámetros que denen cada sub-
grupo uniparamétrico son parámetros normales, y se puede utilizar la aplicación exponencial.
Explícitamente,
t′ = t + b, (2.222)
′
r = R(α)r + vt + a, (2.223)
b′′ = b′ + b, (2.224)
′′ ′ ′ ′
a = R(α )a + v b + a , (2.225)
′′ ′ ′
v = R(α )v + v , (2.226)
′′ ′
R(α ) = R(α )R(α). (2.227)
Para las rotaciones vamos a usar dos parametrizaciones diferentes. Una es la normal o
canónica en términos del vector α = αn, donde n es un vector unidad a lo largo del eje
de rotación, y el ángulo girado α ∈ [0, π] en radianes, se interpreta como positivo si tiene la
orientación de las agujas de un reloj, cuando miramos en la dirección que marca el vector n.
Otra parametrización, que tiene ventajas algebraicas, es expresar cada rotación por el vector
µ = n tan(α/2), con α y n como en el caso anterior.
La matriz de rotación R(α) = exp(α · J ) se expresa en términos de los parámetros normales
αi y de la representación matricial de los generadores Ji , que aparecen como
0 0 0 0 0 1 0 −1 0
J1 = 0 0 −1 , J2 = 0 0 0 , J3 = 1 0 0 ,
0 1 0 −1 0 0 0 0 0
y satisfacen las reglas de conmutación [Ji , Jk ] = ϵikl Jl , de tal manera que si denimos el vector
α = αn, se puede poner, en la representación activa,
µ′ + µ + µ′ × µ
µ′′ = . (activa) (2.230)
1 − µ′ · µ
Esto se puede ver de forma sencilla usando el homomorsmo entre el grupo de rotaciones y el
grupo unitario SU (2). Los generadores matriciales de SU (2) son J = −iσ/2 en términos de las
152 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
1
R(µ) = √ (I − iµ · σ) , (2.231)
1 + µ2
Si las dos rotaciones R(µ) y R(µ′ ) que aparecen en (2.230) fueran de valor π , aunque tan(π/2) = ∞,
esta expresión no es singular sino que posee como límite:
n × n′
n′′ tan(α′′ /2) = .
n · n′
′′ ′′
El valor absoluto de esta relación implica que tan(α /2) = tan θ , es decir, α = 2θ , donde θ es
′
el ángulo entre los dos vectores unidad n y n . Obtenemos el resultado conocido de que cualquier
rotación de valor α alrededor de un eje caracterizado por el vector unidad n puede obtenerse por
la composición de dos rotaciones de valor π alrededor de dos ejes perpendiculares a n y separados
por un ángulo α/2.
b′′ = b′ + b, (2.233)
′′ ′ ′ ′
a = R(µ )a + v b + a , (2.234)
′′ ′ ′
v = R(µ )v + v , (2.235)
µ′ + µ − µ′ × µ
µ′′ = . (2.236)
1 − µ′ · µ
Los generadores del grupo en la realización (2.222, 2.223) son los operadores diferenciales
y las reglas de conmutación del álgebra de Lie del grupo de Galileo en la representación pasiva
son
[J , J ] = −J , [J , P ] = −P , [J , K] = −K, [J , H] = 0, (2.238)
[H, P ] = 0, [H, K] = P , [P , P ] = 0, [K, K] = 0, [K, P ] = 0. (2.239)
Salvo que se indique de forma expresa, vamos a utilizar en estas notas, una notación abreviada
para los conmutadores de los diferentes operadores, considerados como escalares y trivectores,
que los representaremos en caracteres en negrita:
donde δij = δji es la delta de Kronecker y ϵijk es el tensor completamente antisimétrico, de tal
forma que los índices latinos casen a ambos lados de los conmutadores.
La acción del grupo (2.222)-(2.223) representa la relación que existe entre las medidas de
las coordenadas (t, r) de un cierto acontecimiento espacio-temporal medido por un observador
inercial O y las correspondientes coordenadas (t′ , r ′ ) del mismo acontecimiento medidas por
otro observador inercial O′ . Los diez parámetros del grupo tienen el siguiente signicado: Si
consideramos el acontecimiento de coordenadas (0, 0) medidas por O, por ejemplo la emisión
de un haz de fotones desde su origen cuando su reloj marca t = 0, para O′ valen (b, a), donde
b es el parámetro que representa la traslación temporal y a la traslación espacial. El parámetro
v , con dimensiones de velocidad, representa la velocidad del origen del sistema cartesiano de O
medido por O′ , y nalmente los parámetros α, o R(α), representan la orientación del sistema
cartesiano de O medido por O′ . Los diez parámetros (b, a, v, α) representan la descripción del
sistema cartesiano de O, medido por O′ .
El grupo de Galileo posee exponentes no triviales dados por 18
( )
′ 1 2 ′ ′
ξ(g, g ) = m v b + v · R(α)a . (2.240)
2
Están caracterizados por el parámetro no nulo m.
La extensión central del grupo de Galileo 19 es un grupo de 11 parámetros con un generador
adicional I que conmuta con todos los otros diez
y el resto de las reglas de conmutación son las mismas del propio grupo de Galileo (2.238, 2.239),
salvo la última que queda
habiendo usado nuestra notación abreviada, y en términos del parámetro no nulo m. Si denimos
los siguientes operadores, funciones polinómicas de los generadores del álgebra de Lie,
1 1 2
W = IJ − K × P, U = IH − P , (2.243)
m 2m
18
V. Bargmann, On unitary ray representations of continuous groups, Ann. Math. 5, 1 (1954).
19
J.M. Levy-Leblond, Galilei Group and Galilean Invariance, in E.M. Loebl,Group Theory and its applica-
tions, Acad. Press, NY (1971), vol. 2, p. 221.
154 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
vemos que U conmuta con todos los generadores del grupo de Galileo extendido, y el W satisface
las reglas de conmutation:
[W , W ] = −IW , [J , W ] = −W , [W , P ] = [W , K] = [W , H] = 0.
De esta forma, W 2 también conmuta con todos los generadores. Resulta que el grupo de Galileo
extendido posee tres operadores de Casimir funcionalmente independientes. En aquellas repre-
sentaciones en las que el operador I resulte ser un múltiplo del operador unidad, por ejemplo en
las representaciones irreducibles, esos tres invariantes se interpretan como la masa, M = mI , la
energía interna H0 = H − P 2 /2m, y el valor absoluto del espín.
( )2
1
S = J − K ×P .
2
(2.244)
m
El operador espín S en aquellas representaciones en las que I = I, satisface las reglas deconmu-
tación:
[S, S] = −S, [J , S] = −S, [S, P ] = [S, H] = [S, K] = 0,
es decir, es un operador momento angular, transforma como un vector bajo rotaciones y es inva-
riante bajo traslaciones y transformaciones de Galileo puras, respectivamente. Queda reducido
al operador momento angular total J en aquellos sistemas de referencia en los que P = K = 0,
es decir, para los observadores del centro de masa.
2.10. APÉNDICE: GRUPO DE POINCARÉ P 155
′′ µ′ + µ − µ′ × µ + F (v ′ , µ′ , v, µ)
µ = , (2.252)
1 − µ′ · µ + G(v ′ , µ′ , v, µ)
γγ ′ [
F (v ′ , µ′ , v, µ) = v × v ′ + v(v ′ · µ′ ) + v ′ (v · µ)
(1 + γ)(1 + γ ′ )c2
+ v × (v ′ × µ′ ) + (v × µ) × v ′ + (v · µ)(v ′ × µ′ )
]
+ (v × µ)(v ′ · µ′ ) + (v × µ) × (v ′ × µ′ ) , (2.253)
γγ ′ [
G(v ′ , µ′ , v, µ) = v · v ′ + v · (v ′ × µ′ ) + v ′ · (v × µ)
(1 + γ)(1 + γ ′ )c2
]
− (v · µ)(v ′ · µ′ ) + (v × µ) · (v ′ × µ′ ) . (2.254)
γ2
(−γb + γv · a/c2 , −R(−µ)(a − γvb + (v · a)v), −R(−µ)v, −µ).
(1 + γ)c2
Los generadores del grupo en la realización (2.247, 2.248), y en términos de los parámetros
normales (b, a, β, α), son
pµ = ∂µ , Jµν = −Jνµ = xµ ∂ν − xν ∂µ .
[pµ , pν ] = 0,
[Jµν , pσ ] = −ηµσ pν + ηνσ pµ ,
[Jµν , Jρσ ] = −ηµρ Jνσ − ηνσ Jµρ + ηνρ Jµσ + ηµσ Jνρ .
pµ pµ = (H/c)2 − P 2 = m2 c2 , (2.257)
S CM = J − q × P , HS CM /c = HJ /c − K × P , (2.259)
2.10. APÉNDICE: GRUPO DE POINCARÉ P 157
de masa, y de la masa de la partícula. Vemos que en el caso relativista, los dos parámetros
m y SCM son las propiedades intrínsecas de toda partícula elemental. En el caso cuántico,
las representaciones deben ser irreducibles, y SCM
2 = s(s + 1)~2 , para todo s = 0, 1/2, 1, . . .,
dependiendo del valor cuántico del espín de la partícula, pero en el caso clásico, el valor SCM
2
El grupo de Poincaré no posee exponentes, de tal manera que las funciones gauge sobre sus
espacios homogéneos son nulas. Las Lagrangianas de los sistemas mecánicos cuyos espacios
cinemáticos sean espacios homogéneos de P , pueden tomarse estrictamente invariantes.
158 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
El producto L(v ′ )L(R(µ′ )v) = L(v ′′ )R(w) donde v ′′ es la composición relativista de las velo-
cidades v ′ y R(µ′ )v , y R(w) es la rotación de Thomas-Wigner asociada a los boosts L(v ′ ) y
L(R(µ′ )v).
Por lo tanto, la expresión (2.251) es equivalente a
y (2.252) es
R(µ′′ ) = R(w)R(µ′ )R(µ) ≡ R(ϕ)R(µ). (2.264)
La matriz de rotación de Thomas-Wigner, R(w) es:
( ( ) ( )
1 γ′2 1 − γ ′ ′ γ2 1 − γ′ ′ ′
R(w)ij = δij + vi vj + 2 Rik vk Rjl vl
1 + γ ′′ c2 1 + γ ′ c 1+γ
)
γ′γ 2γ ′ 2 γ 2 (vk′ Rkl
′ v)
+ 2 (vi′ Rjk
′
vk − vj′ Rik
′
v ′ R ′ vk
l
vk ) + ,
c (1 + γ ′ )(1 + γ)c2 i jk
y el factor ( )
′′ ′ v ′ · R(µ)v
γ =γ γ 1+ .
c2
La matriz R(w) se escribe en términos del parámetro vectorial w, el cual es función de v ′ , µ′
y v , dada por
F (v ′ , 0, R(µ′ )v, 0)
w= , (2.265)
1 + G(v ′ , 0, R(µ′ )v, 0)
y el parámetro ϕ, tal que R(ϕ) = R(w)R(µ′ ) es
µ′ + F (v ′ , µ′ , v, 0)
ϕ= . (2.266)
1 + G(v ′ , µ′ , v, 0)
[J , J ] = −J , [J , K] = −K, [K, K] = J .
2.10. APÉNDICE: GRUPO DE POINCARÉ P 159
Una rotación de ángulo α alrededor de un eje caracterizado por el vector unidad n está dada
por la matriz unitaria 2 × 2, exp(α · J ),
Así, todo elemento de SL(2, C) queda parametrizado por seis números reales (v, µ), y lo
interpretamos en la forma
A(v, µ) = L(v)R(µ). (2.271)
Toda matriz compleja 2 × 2 de determinante unidad, A ∈ SL(2, C) puede ser escrita en
términos de un tetravector complejo aµ y de las cuatro matrices de Pauli σµ . Si ponemos
A = aµ σµ , como detA = 1 nos lleva a aµ aµ = 1 o (a0 )2 − a2 = 1. La forma general de (2.271) es
√ [ ( ) ( )]
1+γ µ·u u+u×µ
A(v, µ) = σ0 1 − i +σ· − iµ , (2.272)
2(1 + µ2 ) 1+γ 1+γ
done Re (aµ ) y Im (aµ ) son la parte real e imaginaria de las correspondientes componentes del
tetravector aµ . Cuando Re (a0 ) = 0 la expresión (2.273) está denida y representa una rotación
de valor π alrededor de un eje en la dirección del vector Im (a).
Si representamos toda transformación de Lorentz en términos de un boost seguido de una
rotación, es decir en la forma contraria, Λ(v, µ) = R(µ)L(v), entonces la expresión general de
A es la misma que en (2.272) pero con un cambio de signo en el producto vectorial u × µ. Por
lo tanto, la descomposición es también única. La rotación R(µ) es la misma que antes pero el
boost viene expresado en términos de las variables aµ por
[ ]
u = 2 Re (a0 )Re (a) + Im (a0 )Im (a) + Im (a) × Re (a) .
160 CAPÍTULO 2. EJEMPLOS DE PARTÍCULAS CON ESPÍN
Obsérvese la diferencia en el tercer término el cual es el opuesto cuando se compara con (2.274).
En la representación matricial 4 × 4 del grupo de Lorentz sobre el espacio-tiempo de Min-
kowski, un boost se expresa como L(β) = exp(β · K) en términos de los parámetros normales
y adimensionales βi y de los generadores de los boosts Ki , dados por las matrices 4 × 4,
0 1 0 0 0 0 1 0 0 0 0 1
1 0 0 0
K1 = , K2 = 0 0 0 0 , K 3 = 0 0 0 0 .
0 0 0 0 1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 1 0 0 0
∑
Si llamamos B = β · K ≡ i βi Ki , tenemos
2
0 β1 β2 β3 β 0 0 0
β1 0 0 0 0 β1 β1 β1 β2 β1 β3
B= 2
β2 0 0 0 , B = 0 β2 β1 β2 β2 β2 β3 ,
β3 0 0 0 0 β3 β1 β3 β2 β3 β3
con β 2 = β12 + β22 + β32 y B 3 = β 2 B , de tal manera que las demás potencias de B se pueden
expresar en términos de éstas, obtenemos que la expresión nal de L(β) = exp(β · K) es
1 1 1 1 1 1 1
exp(β · K) = exp(B) = I + B + B2 + B3 + · · · = I + B + B2 + β2B + β2B2 + · · ·
1! 2! 3! 1! 2! 3! 4!
que sumando componente a componente, converge a
C (β1 /β)S (β2 /β)S (β3 /β)S
(β /β)S 1 + β1 β1 (C − 1) β1 β2 β1 β3
1 2 2 (C − 1) 2 (C − 1)
β β β
β2 β1 β2 β2 β2 β3
(β2 /β)S (C − 1) 1 + (C − 1) (C − 1)
β 2
β 2
β 2
β3 β1 β3 β2 β3 β3
(β3 /β)S (C − 1) (C − 1) 1 + (C − 1)
β2 β2 β2
donde se ha abreviado S = sinh β y C = cosh β .
¾Cuál es el signicado físico de los parámetros normales βi ? Supongamos dos observadores
O y O′ que relacionan sus medidas espacio-temporales x y x′ mediante x′ µ = L(β)µ ν xν . El
observador O emite en el instante t y en el instante posterior t + dt dos señales luminosas desde
el origen de su sistema cartesiano de referencia. Estas dos señales medidas por O′ tienen lugar
en los puntos r ′ y r ′ + dr ′ y en los instantes t′ y t′ + dt′ , respectivamente. Están dadas por
cdt′ = L0 0 cdt, dx′ = Li 0 cdt
i
ya que para O, dxi = 0. El cociente dx′ i /dt′ es precisamente la velocidad de la fuente emisora
v i , es decir la velocidad del origen del sistema de referencia de O medido por O′ . Esta velocidad
es v i = cLi 0 /L0 0 = c(βi /β)S/C , de tal manera que la relación entre los parámetros normales y
las componentes de la velocidad relativa entre observadores es
v β sinh2 β cosh2 β − 1 1
= tanh β, tanh2 β = = , = 1 − tanh2 β
c β cosh2 β cosh2 β cosh2 β
por lo que tanh β = v/c. La función cosh β ≡ γ(v) = (1 − v 2 /c2 )−1/2 y cuando la transformación
la expresamos en términos del parámetro velocidad toma la forma de la matriz simétrica
γ γvx /c γvy /c γvz /c
2 2 vx vy γ 2 vx vz γ 2
γvx /c 1 + v2x γ
c γ + 1 c 2 γ+1
c 2 γ+1
L(v) = vy vx γ 2 vy2 γ 2 vy vz γ 2 . (2.275)
γvy /c 1 +
c γ+1
2
c γ+1
2
c γ+1
2
v z v x γ 2 v z v y γ 2 vz2 γ 2
γvz /c 1+ 2 γ+1
c2 γ + 1 c2 γ + 1 c
2.10. APÉNDICE: GRUPO DE POINCARÉ P 161
La transformación inversa es L−1 (v) = L(−v). Una matriz de rotación en la forma 4×4 aparece
escrita por bloques como ( )
1 0T
R(µ) = e , (2.276)
0 R(µ)
e
donde R(µ) es la matriz ortogonal 3 × 3 dada en (2.228). Podemos dar también una represen-
tación matricial de este tipo a los boosts Lorentzianos (2.275) en la forma
( )
γ γv T /c
L(v) = γ2 , (2.277)
γv/c I3 + (1+γ)c 2 vv
T
donde v T es el vector la transpuesto del vector columna tridimensional v , y I3 la matriz unidad
3 × 3. De esta forma, la componente de la matriz 3 × 3, (vv T )ij = vi vj . Es fácil ver en esta
representación que la transformación conjugada
R(µ)L(v)R(µ)−1 = L(R(µ)v).
En efecto ( )
γ γv T /c
R(µ)L(v) = γ2 ,
γR(µ)v/c R(µ) + (1+γ)c2
(R(µ)v)v T
y al actuar por la derecha con R(µ)−1 = R(µ)T , nos queda
( )
γ (R(µ)v)T /c
γ 2 = L(R(µ)v).
γR(µ)v/c I3 + (1+γ)c 2 (R(µ)v)(R(µ)v)
T
163
164 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
este caso, los operadores que caracterizan a su orientación, completamente reproducen todo el
álgebra de observables internos, todo el álgebra de Dirac.
Si todos los caminos son igualmente probables, entonces estos complejos ϕ[x(τ )], son todos del
mismo valor absoluto distinguiéndose unos de otros solamente en su fase. La virtud de Feynman
es cómo dene esa fase. Esta fase va a ser el valor de la acción del sistema entre los puntos x1
y x2 , en unidades de ~, a lo largo del correspondiente camino x(τ ), es decir,
{ ∫ τ2 } { }
i e i
ϕ[x(τ )] = N exp L(x(τ ), ẋ(τ ))dτ = N exp A[x] (x1 , x2 ) , (3.1)
~ τ1 ~
siendo N un factor constante de normalización, el mismo para todos los caminos. La fase es la
acción a lo largo de ese camino, A[x] (x1 , x2 ), dividida por ~. La amplitud de probabilidad ϕ[x(τ )]
es un funcional sobre todos los caminos posibles, y por eso, la representamos con paréntesis
cuadrados, pero que una vez realizada la integral (3.1) en vez de ser un número complejo es una
función compleja de las variables extremas x1 y x2 .
En este método estadístico de Feynman, la existencia de alternativas o caminos indepen-
dientes no produce la suma de las correspondientes probabilidades. Este tipo de estadística la
vamos a denominar estadística interriente. La probabilidad de un proceso completo en el
que existen varias alternativas independientes, se determina calculando primero la amplitud de
1
R.P. Feynman and A.R. Hibbs, Quantum Mechanics and Path Integrals, MacGraw Hill, NY (1965), p. 36.
3.1. CUANTIZACIÓN FEYNMAN DE LOS SISTEMAS LAGRANGIANOS 165
desde una rendija, pero al superponer el efecto de las dos rendijas, el campo eléctrico resultante
puede ser cero. No se suman las probabilidades de llegada sino las amplitudes de probabilidad.
Si extendemos esta idea a un sistema arbitrario podemos imaginar que en cada punto de
la evolución del sistema en su espacio cinemático en vez del plano transversal que contiene
al campo electromagnético le asociamos un plano complejo en el que dibujamos la amplitud
ϕ[x(τ )], como en la gura 3.1,
como ∫ x2
K(x1 , x2 ) = ϕ[x(τ )]D(x(τ )),
x1
donde por D(x(τ )) quiere indicar una medida sobre la clase de caminos que unen x1 con x2 .
El kernel de Feynman K(x1 , x2 ), será en general una función compleja denida sobre la
variedad X × X . Más propiamente es una función generalizada o distribución, debido a la
forma especial de construirla sumando o integrando sobre una innidad de caminos. Si pudié-
ramos a su vez sumar (o integrar) diferentes kérneles K(x1 , x), todos ellos con el mismo punto
nal x, pero diferentes puntos iniciales x1 , lo que obtendríamos es la amplitud de probablidad
de que nuestro sistema mecánico estuviera en x, proviniente de algunos puntos iniciales, pero
desconocidos, es decir, la interpretación habitual de la función de onda Φ(x) de dicho sistema
al ser cuantizado. Las diferentes funciones de onda o estados, se obtendrían de las diferentes
formas de sumar los kérneles de Feynman sobre todas las posibilidades de sus puntos iniciales
y de los correspondientes caminos de llegada.
Por este razonamiento, llegamos a la conclusión de que al cuantizar por el método de Feyn-
man cualquier sistema Lagrangiano, los estados cuánticos del mismo quedan descritos por fun-
ciones complejas de las variables cinemáticas, y de cuadrado integrable. Solamente funciones
de las variables cinemáticas y no de otras variables ni siquiera del espacio de conguración, del
espacio de fase o del espacio de conguración ampliado. El espacio de Hilbert de los estados es
el espacio L2 (X). Lo que el formalismo no ja es cómo es la medida sobre X , para realizar las
integraciones.
Vemos que el método de Feynman realza el papel de las variables cinemáticas para carac-
terizar el estado cuántico del sistema, frente a otras variedades, como por ejemplo la de los
grados de libertad independientes. Consideramos que es ésta una de las razones del por qué las
variables cinemáticas debían jugar también un papel crucial en la formulación clásica. Queda
así justicado el que la denición de partícula clásica se haya hecho dotando de propiedades
exclusivas al espacio cinemático, haciendo que sea un espacio homogéneo del grupo cinemático.
En mecánica cuántica estamos acostumbrados a que la función de onda Φ(x), en vez de ser
una sola función compleja, sea una función multicomponente, es decir un conjunto de n funciones
complejas de las variables t y r , ψi (t, r), i = 1, . . . , n formando una especie de vector columna,
que puede ser considerado como un objeto de un espacio de Hilbert n−dimensional. En general,
esta descomposición nita en componentes, transforma con una representación irreducible del
grupo de rotaciones, con lo que cada una de las componentes ψi hace referencia a una posible
orientación del espín. La cuantización a lo Feynman hace que nuestra función de onda Φ(x), sea
solamente una función, pero del conjunto de variables cinemáticas, es decir de más variables que
tiempo y posición. Una vez que denamos el conjunto completo de observables que conmutan,
al encontrar una base del espacio de Hilbert de los estados, nos va a permitir buscar funciones
en variables separadas, de tal manera que Φ(x) se va a poder escribir en términos de una
parte espacio temporal ϕ(t, r), dependiente de las variables t y r , y de otra parte χ, que va
a depender del resto de las variables cinemáticas, invariantes por traslación. Diremos que la
función de onda ha quedado descompuesta en su parte espacio-temporal ϕ y en su parte interna
χ. Es esta descomposición la que va a dar lugar a la aparición de las diferentes componentes
de la función de onda. En el caso de las partículas elementales, las variables adicionales van a
ser la velocidad u y la orientación α, y los operadores de espín van a derivar solamente con
respecto a estas variables, por lo que pueden considerarse como observables internos.
Para calcular cómo transforma la función de onda entre observadores inerciales, sean éstos
O y O′ de tal manera que las variables cinemáticas transforman con un elemento g ∈ G, del
3.1. CUANTIZACIÓN FEYNMAN DE LOS SISTEMAS LAGRANGIANOS 167
entonces para que la probabilidad se conserve entre observadores inerciales, es suciente admitir
que la medida µ(x) es invariante bajo las transformaciones del grupo. En ese caso, la ecuación
168 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
ya que las funciones gauge pueden escogerse de tal manera que α(0; x) = 0, y como la función
ζ(g) = ξ(g, g −1 ) da lugar a otra fase constante, la podemos suprimir. Denimos la transforma-
ción de la función de onda mediante:
{ }
i
Φ′ (x) = U (g)Φ(x) = Φ(g −1 x) exp − α(g −1 ; x) . (3.12)
~
Si el grupo G es el grupo cinemático, esta es la realización del Principio de Relatividad Res-
tringido en el caso cuántico, es decir, la expresión del cambio de la función de onda entre
observadores inerciales.
Si el operador unitario lo representamos en términos del generador intesimal autoadjunto
del álgebra de Lie en la forma
{ }
i σ
U (g) = exp − g Xσ , (3.13)
~
entonces, para una transformación innitesimal de parámetros δg σ , la transformación inversa
tiene por parámetros innitesimales −δg σ , por lo que a primer orden en δg σ
( )
i σ i
U (δg)Φ(x) = I − δg Xσ Φ(x) = Φ(x) − δg σ Xσ Φ(x),
~ ~
mientras que
−1 −1 ∂Φ(x) ∂f j (x, g)
Φ(δg x) ≡ Φ(f (x, δg )) = Φ(x) − δg σ uiσ (x) , ujσ (x) = ,
∂x i ∂g σ g=0
y { }
i i
exp − α(δg ; x) = 1 − α(δg −1 ; x).
−1
~ ~
Como α(0; x) = 0,
−1 ∂α(g; x)
α(δg ; x) = (−δg σ ) = −λσ (x)δg σ , (3.14)
∂g σ g=0
y sustituyendo en (3.12) los términos anteriores y después de identicar los términos de primer
orden en δg σ , resulta que los generadores Xσ , al actuar sobre las funciones de onda tienen la
representación diferencial
~ ∂
Xσ = ujσ (x) j − λσ (x), (3.15)
i ∂x
170 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
Cuando los comparamos con las constantes del movimiento Noetherianas (1.36) escritas en la
forma
(0) (1) (k−1)
−Nσ = −H Mσ + pi(1) Miσ + pi(2) Miσ + . . . + pi(k) Miσ − λσ (x), (3.17)
vemos que podemos enunciar una especie de receta de correspondencia. Si nos restringimos
a grupos continuos, las funciones λσ (x) de (1.36), se obtienen a partir de las funciones gauge
Lagrangianas α(g; x), mediante (1.14), es decir, de la misma forma en que obtenemos las fun-
ciones λσ (x) en (3.14). Identicando el Hamiltoniano y los momentos generalizados en (3.17)
con los correspondientes operadores diferenciales en (3.16) que aparecen multiplicando a las
(s) (s)
correspondientes funciones Miσ , obtenemos: El Hamiltoniano generalizado H = pi(s) qi − L,
que multiplica en (3.17) a la función Mσ , se identica con el operador i~∂/∂t que multiplica a
su vez a la función Mσ en (3.16). Análogamente, el momento generalizado pi(s+1) , que multiplica
(s) (s)
a la función Miσ , se identica con el operador diferencial −i~∂/∂qi , for s = 0, . . . , k − 1, ya
que las funciones λσ (x), son las mismas. Al generador Xσ le daremos el mismo nombre que al
observable Nσ y lo representaremos con la misma notación.
Receta: Conviene recordar que como variables pi(s+1) y qi(s) son canónico-conjugadas. En-
tonces, cada momento generalizado pi(s+1) queda reemplazado por (~/i) multiplicado por el
operador diferencial que deriva con respecto a la variable canónico-conjugada de ese momento
(s)
qi , y el Hamiltoniano generalizado H , por el operador diferencial i~∂/∂t.
~ ∂ ∂
pi(s+1) −→ , H −→ i~ .
i ∂q (s) ∂t
i
En el caso de las partículas elementales, como las variables cinemáticas son t, r, u, ρ, como
coordenadas generalizadas solo tenemos las r, u y ρ y de momentos conjugados respectivos, los
P , U y V , éstos aparecerán representados por
~ ∂ ~ ∂ ~ ∂ ∂
P = , U= , V = , H = i~ . (3.18)
i ∂r i ∂u i ∂ρ ∂t
donde hemos puesto ∇ρ ≡ ∂/∂ρ. La representación de los momentos (3.18) de acuerdo con el
principio atómico, es válida incluso cuando la partícula elemental esté sometida a una interac-
ción.
Sabemos que e ρ̇i
Vi = ∂ L/∂ y e
Wj = ∂ L/∂ω e
j = ∂ L/∂ ρ̇i ∂ ρ̇i /∂ωj = Vi ∂ ρ̇i /∂ωj . Como en la
representación activa
2 1
ωi = (ρ̇i + ϵijk ρj ρ̇k ), ρ̇i = (ωi − ϵikj ρk ωj + ρi (ρ · ω)) ,
1 + ρ2 2
( )
∂ ρ̇i 1 ∂ ρ̇i ~ ∂ ∂ ∂
= (δij − ϵikj ρk + ρi ρj ) , Wj = Vi = + ϵjik ρi + ρj ρi ,
∂ωj 2 ∂ωj 2i ∂ρj ∂ρk ∂ρi
es decir (3.19).
t′ (τ ) = t(τ ) + b, (3.25)
r ′ (τ ) = R(α)r(τ ) + vt(τ ) + a, (3.26)
′
u (τ ) = R(α)u(τ ) + v. (3.27)
las funciones de onda son funciones complejas sobre X y por lo tanto, funciones de las variables
(t, r, u). Sobre este espacio cinemático, la función gauge es la misma que en (2.41), donde m
dene la masa de la partícula. Si tomamos en cuenta la receta de correspondencia desarrollada
anteriormente, el Hamiltoniano es H → i~∂/∂t, y el momento generalizado pr ≡ P → −i~∇ y el
otro momento generalizado pu ≡ U → −i~∇u . Los generadores de la representación proyectiva
están dados por
∂ ~ ~ ~
H = i~ , P = ∇, K = mr − t ∇ − ∇u , (3.28)
∂t i i i
~ ~
J = r × ∇ + u × ∇u = L + Z, (3.29)
i i
donde ∇ es el operador gradiente con respecto a las variables generalizadas q 1 ≡ r y ∇u es el
operador gradiente con respecto a las variables generalizadas q 2 ≡ u. Conviene resaltar que esta
representación de los generadores es independiente de la Lagrangiana particular que hayamos
considerado. Solo depende de las variables cinemáticas (t, r, u), y de la función gauge habitual,
del grupo de Galileo.
El momento angular con respecto al centro de carga, relacionado con el Zitterbewegung,
Z = u × U y veremos más adelante que cuantiza solamente con valores enteros.
3.2. PARTÍCULAS NO RELATIVISTAS CON ESPÍN 173
[qi , Pj ] = i~ δij ,
que resultan ser las reglas canónicas de conmutación entre el momento lineal y la posición de
una partícula puntual. Por lo tanto, las reglas canónicas de conmutación entre el momento lineal
total y la posición del centro de masa de una partícula con espín, están ya contenidas en las
reglas de conmutación del álgebra de Lie extendida del grupo cinemático. Es por eso que el
operador
~
q=r− ∇u , (3.30)
im
puede ser interpretado como el operador de posición del centro de masa. Una discusión general
sobre otras deniciones del operador de posición del centro de masa, pueden encontrarse en el
libro del autor.
En esta representación, un operador de Casimir es la energía interna H − P 2 /2m. Vemos
que el espín con respecto al centro de masa se dene como habitualmente
1 ~ ~ ~
S CM = J − K × P = u × U + k × P = u × ∇u + ∇u × ∇;
m i im i
que aparece escrito en términos de dos operadores que no conmutan, y que satisface
[S CM , S CM ] = i~S CM , [J , S CM ] = i~S CM , [S CM , P ] = [S CM , H] = [S CM , K] = 0,
Debido a la estructura de Z 2 en términos de las variables u, que resulta ser la misma que la
del momento angular orbital de una partícula puntual en términos de las variables de posición
r , la parte del espín de la función de onda es en realidad de la forma
donde f (u) es una función arbitraria del módulo de u y Yzmz (θ, ϕ) son los armónicos esféricos
en la dirección θ, ϕ del vector u.
Para el observador del centro de masa, S CM = Z y ambos momentos angulares son el mismo.
Pero para un observador arbitrario, los operadores Z no conmutan con los generadores de los
boosts K , por lo que el valor absoluto de Z 2 no es invariante Galileano, mientras que S 2CM sí lo
es. De todas formas, la descomposición de la función de onda en una función multicomponente
que reeja la estructura de su espín es una propiedad intrínseca que se puede poner de maniesto
en cualquier sistema de referencia.
Cuando la partícula interacciona con un campo electromagnético externo, de acuerdo con
el principio atómico su estructura mecánica interna no se modica por lo que las ecuaciones
(3.31-3.33) se deben satisfacer para las partes mecánicas Hm = H − eϕ y P m = P − eA, y para
las componentes del espín Z que quedan inalteradas, por lo que obtenemos la ecuación habitual
del acoplamiento mínimo
( )
(P − eA)2
H − eϕ − ψi (t, r) = Eψi (t, r), (3.35)
2m
donde los generadores H y P tienen la misma representación que en (3.28) por lo que cada
parte espacio-temporal ψi , satisface la ecuación de Schroedinger modicada.
En este formalismo, cuando el espín es de naturaleza (anti)orbital, no conduce al cuantizar
a espines semienteros. Estos modelos de partículas solamente sirven como modelos de bosones.
La partícula libre viaja con velocidad constante y rota con velocidad angular constante. El
espín clásico es S = Iω , y el centro de carga y el centro de masa son el mismo punto.
Para describir la orientación de una partícula hagámoslo deniendo tres ejes unidad or-
togonales ei , i = 1, 2, 3 ligados al punto r , como formando un sistema cartesiano comóvil,
análogamente a como describimos la orientación de un sólido rígido. Si los tomamos inicialmen-
te paralelos a los correspondientes ejes cartesianos del observador inercial, entonces sus nueve
componentes nos denen una matriz ortogonal de rotación Rij (ρ) que describe cómo rotar el
sistema de referencia inercial para llevarlo a coincidencia con los ejes del cuerpo. Describe por
lo tanto la evolución de esta triada, con la condición inicial Rij (t = 0) = δij .
Las variables cinemáticas t, r y ρ transforman bajo G en la forma
t′ (τ ) = t(τ ) + b, (3.37)
′
r (τ ) = R(µ)r(τ ) + vt(τ ) + a, (3.38)
µ + ρ(τ ) + µ × ρ(τ )
ρ′ (τ ) = . (3.39)
1 − µ · ρ(τ )
3.2. PARTÍCULAS NO RELATIVISTAS CON ESPÍN 175
Sobre el correspondiente espacio de Hilbert, los generadores Galileanos están dados por:
∂ ~ ~
H = i~ , P = ∇, K = mr − t ∇, (3.40)
∂t i i
~ ~
J= r × ∇ + {∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )} = L + W , (3.41)
i 2i
donde ∇ρ representa al operador gradiente con respecto a las variables ρ y en la parametrización
ρ del grupo de rotaciones.
La parte W resulta del análisis general del grupo. Los generadores del grupo en esta pa-
rametrización Xi se obtienen a partir de (3.39) y de acuerdo con (1.48) y (1.50). Se obtiene
como ( )
∂ρ′ k ∂
Xi = ,
∂µ i ∂ρk
µ=0
X = ∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )
[Xi , Xk ] = −2ϵikl Xl
~
W = {∇ρ + ρ × ∇ρ + ρ(ρ · ∇ρ )} , (3.42)
2i
satisfacen las reglas de conmutación del momento angular
[W , W ] = i~W . (3.43)
Si tomamos el eje OZ como la línea que describe el punto donde está localizado el fotón, las
variables cinemáticas se reducen a (t, z, α), siendo α la orientación de un triedro uno de cuyos
ejes es la propia dirección del movimiento OZ y α representa el ángulo girado por el triedro
en su desplazamiento y rotación. La Lagrangiana que describe de forma clásica a un fotón de
momento angular S y helicidad ϵ = ±1, es según la sección 2.5.1
e = ϵS ż α̇ .
L
cṫ
Las constantes del movimiento Noetherianas son
e
∂L ∂Le ∂Le
H=− = ϵSω, Pz = = ϵSω/c = ϵSk, Sz = = ϵS,
∂ ṫ ∂ ż ∂ α̇
con ω = dα/dt la velocidad angular de la partícula, k = ω/c el número de onda. Para el fotón
ϵω > 0 y ϵω < 0 para el antifotón. De esta forma H > 0 y Pz > 0 para el fotón y negativos
para el antifotón. Si de acuerdo con Planck esta partícula representa un cuanto de energía
electromagnética, tiene que tener una energía de valor hν , siendo ν la frecuencia de la radiación,
que si la identicamos con la frecuencia angular de la partícula, resulta H = S2πν = hν , por
lo que el valor S = ~. Desde el punto de vista cuántico el espín Sz solamente puede tomar los
valores enteros ±~, por lo que se trata de un bosón. Si el espín no tomara esos valores, tampoco
la energía de un fotón sería ~ω = hν . Para singularizar una solución entre los valores extremos
de las variables cinemáticas no basta jar t1 , z1 , α1 con 0 ≤ α1 ≤ 2π y lo mismo en el punto
2, sino que hay que indicar el número completo n de vueltas que la partícula ha dado, de tal
manera que la fase nal se exprese como 2πn + α2 , con 0 ≤ α2 ≤ 2π . De esta forma
2πn + α2 − α1
ω= , z2 − z1 = c(t2 − t1 ).
t2 − t1
∂ ∂ ∂
H = i~ , Pz = −i~ , Sz = −i~ .
∂t ∂z ∂α
La función de onda que describe los estados del fotón será una función de cuadrado integrable
ψ(t, z, α), que al ser vector propio de esos tres generadores que conmutan se puede tomar en
variables separadas,
que es vector propio de los anteriores generadores con los correspondientes valores propios. Se
corresponde con la descripción dada en (3.48) una vez que los dos estados de espín se han
reemplazado por las dos componentes del vector columna. La identicación de los dos estados
de polarización corresponde a
( ) ( )
1 −iα 0
e iα
−→ , e −→ .
0 1
Estos dos estados básicos corresponden a fotones de un haz de luz polarizada circular a derechas e
izquierdas, respectivamente. Si incluyéramos los estados del antifotón entonces el vector columna
sería de cuatro componentes.
De esta forma un fotón polarizado será una combinación lineal
( )
a
ψ(t, z) = e i(kz−ωt)
, |a|2 + |b|2 = 1
b
con lo que aparece como una onda plana que viaja en el sentido positivo del eje OZ . La función
acción entre dos estados inicial y nal, toma la forma
(z2 − z1 )(2πn + α2 − α1 )
A(x1 , x2 ) = ϵ~ = ϵ~(2πn + α2 − α1 ) = ϵ~ω(t2 − t1 ),
c(t2 − t1 )
extendida a todo el rango de las variables cinemáticas en esta evolución. Así, el valor esperado
de la posición en uno de estos estados es
∫ z2 ∫ 2πn+α2
1 1
< z >=< ψ|z|ψ >= z dzdα = (z1 + z2 ),
(z2 − z1 )(2πn + α2 − α1 ) z1 α1 2
donde α y β son dos complejos tales que |α|2 + |β|2 = 1, el cual es vector propio del operador
H = i~∂/∂t con valor propio ~ω , y del operador P = −i~∇ con valor propio (0, 0, ~k). Si
escribimos α = a exp(iδa ) y β = b exp(iδb ) y convenimos en representar el estado de tal manera
que saquemos fuera la fase de la primera componente, para que ésta sea real, entonces,
( ) ( )
α a
|Ψ > = exp(i(kz − ωt)) = exp(i(kz − ωt + δa )) (3.49)
β beiδ
siendo δ = δb − δa .
El proyector que caracteriza este estado es el |Ψ >< Ψ| que viene dado en la forma:
( 2 ) ( 0 )
a abe−iδ a + a3 a1 − ia2
|Ψ >< Ψ| = = (3.50)
abeiδ b2 a1 + ia2 a0 − a3
En términos del vector tridimensional a, los diferentes estados puros vienen dados por la su-
percie de la esfera de radio 1/2 de la gura, en tanto que los puntos del interior representan
estados mezcla.
Figura 3.2: Esfera de Poincaré que representa los diferentes estados de polarización de la
luz. La supercie de la esfera representa a los estados puros o estados vectoriales, mientras
que los puntos del interior representan a los estados mezcla que vienen representados por
operadores densidad ρ. La esfera es un espacio convexo.
( ) ( )
1 0
En particular los estados ortogonales y dan lugar a sendos operadores de pro-
( ) ( ) 0 1
1 0 0 0
yeccción y los cuales vienen caracterizados por los vectores a y −a, siendo
0 0 0 1
a ≡ (0, 0, 1/2), es decir por los dos polos Norte y Sur de la esfera de Poincaré de la gura.
Si Ea y Eb son dos proyectores caracterizados por sendos vectores a y b y representan estados
ortogonales, entonces Ea Eb = 0. En términos de las matrices de Pauli Ea Eb = aµ bν σµ σν = 0,
y tomando trazas, sabiendo que a0 = b0 = 1/2, nos queda (1/4 + a · b) = 0, y que como a y
b son a su vez de módulo 1/2, la solución es a = −b. Estados ortogonales vienen dados por
puntos opuestos de la esfera de estados, y tomados por pares caracterizan por lo tanto a todas
las posibles bases ortonormales de C2 . Signica esto que cualquier otro estado puro se obtendrá
como superposición coherente de dos de estos estados ortogonales, y que cualquier otro estado
no puro, mediante combinaciones lineales convexas de estados puros.
el campo describe en el plano XOY una elipse inscrita en un rectángulo de lados 2a y 2b.10
Los puntos de contacto de la elipse con el rectángulo exterior son A, A′ ≡ (±a, ±b cos δ) y
B, B ′ ≡ (±a cos δ, ±b). Los parámetros de Stokes son
que no son independientes pues s20 = s21 + s22 + s23 y donde s0 representa la intensidad de la
onda electromagnética. Comparados con la descripción anterior s0 = 2a0 , s1 = 2a3 , s2 = 2a1 y
s3 = 2a2 . El radio de la esfera de Poincaré en este caso no vale 1/2 sino que vale s0 . Los polos
N y S representan luz polarizada circular derecha e izquierda, respectivamente. Podríamos
interpretar la descripción cuántica del fotón de tal manera que la parte real de una función de
onda no normalizada representara la parte transversal del campo eléctrico instantáneo asociado
al fotón. La normalización de la función de onda se interpretaría como la densidad de energía
del fotón. Los diferentes estados de polarización elíptica se corresponden con los estados puros
de la descripción cuántica.
Si tenemos dos estados puros, y por lo tanto vectoriales, |Φ > y |Ψ >, el vector α|Φ >
+β|Ψ > una vez normalizado, representará otro estado puro y se dice que es la superposición
coherente de ambos. En este caso lo que admitimos es que la fase relativa con que se superponen
ambos estados es importante.
( Supongamos
) por sencillez
( ) que nos estamos reriendo básicamente a los dos estados polares
1 0
exp(i(kz − ωt)) y exp(i(kz − ωt)), y que α y β los tomamos en principio reales con
0 1 ( )
α
α + β = 1. Entonces el vector estado a que dan lugar es el
2 2 exp(i(kz − ωt)) y como
( 2 ) β
α αβ
proyector el que viene representado en la esfera por el vector [αβ, 0, (α2 − β 2 )/2] y
αβ β 2
por lo tanto en el meridiano que está en el plano XOZ por el punto P representado en la gura
3.4 siendo N P = β y P S = α.
En efecto, a3 = (α2 − β 2 )/2 = 1/2 − β 2 = α2 − 1/2, y por lo tanto las distancias del punto
P a los planos tangentes a los polos son iguales a β 2 y α2 respectivamente. Si α = β , el punto
representativo estará sobre el ecuador. Estos valores α2 y β 2 son las probabilidades de que el
estado sea el N o el S , o bien las proporciones que de los estados N y S utilizamos para construir
su superposición.
Si α y β son en general complejos, una vez extraída la fase de α, que lo supondremos en
adelante real, el estado se reduce a (3.50) y (3.51), con lo que aquella superposición coherente
3.4. APÉNDICE: ESTADOS DE POLARIZACIÓN DE LA LUZ 181
con los mismos a y b y diferentes δ , nos produce todos los puntos de un mismo paralelo. Además
δ es el ángulo acimutal y el giro es en el sentido positivo (horario) alrededor de un eje que va
del segundo estado al primero.
Sean |Φ1 > y |Φ2 > dos estados puros ortogonales, caracterizados por los proyectores E1 y
E2 , y por los vectores reales a y −a. Si denimos el estado ρ = αE1 + (1 − α)E2 , con 0 < α < 1,
representa una superposición que decimos es incoherente, de ambos estados en las proporciones
α y 1 − α. En esta representación, el vector que lo caracteriza es el αa − (1 − α)a = (2α − 1)a.
El punto característico en la gura 3.6, está por lo tanto en la línea de unión de los dos estados
puros, de tal forma que P A = (1 − α) y P B = α. Es por lo tanto el centro de masa de dos
masas α y (1 − α) situadas en A y B respectivamente.
Podemos interpretar la superposición incoherente como el centro de masa de todas las posi-
bles superposiciones coherentes en las mismas proporciones de A y B , en las que la fase relativa
δ se deja libre. En este caso obtendríamos todos los posibles estados del paralelo que dista de
los planos polares (1 − α) y α respectivamente.
Si ρ1 , ρ2 , . . . , ρk son k estados puros, y por lo tanto representados por ∑
sendos puntos de la
∑ de la esfera de estados, y α1 , α2 , . . . , αk , 0 ≤ αi ≤ 1 tal que
supercie αi = 1, entonces
ρ= αi ρi se dice que es la mezcla incoherente, con pesos αi de los k estados puros ρi . Su
punto representativo vendrá dado por el baricentro de los correspondientes puntos ρi en los que
se ha supuesto colocado un peso de valor αi . Los estados puros son los únicos que no pueden
expresarse como combinación lineal convexa de otros estados puros.
La superposición incoherente se convierte así en la combinación lineal convexa de vectores
de R3 , pertenecientes a la supercie de la esfera de radio 1/2.
3.4.4. Filtros
es decir el propio E .
( )
1
Desde el punto de vista vectorial por ser el estado puro, |ρ1 >≡ por lo que el valor
0
′
esperado < E;(ρ1√>=< ) ρ1 |Eρ1 >= 3/4 y el estado nal del sistema será el |ρ1 >= E|ρ1 >
3/2
/||E|ρ1 > || = que resulta ser precisamente el propio estado E , pues |ρ′1 >< ρ′1 | = E .
i/2 ( )
3/4 0
Si el estado inicial no es puro, por ejemplo ρ2 = , que corresponde a una
0 1/4
superposición incoherente de 3/4 del ρ1 anterior y 1/4 de su complementario ortogonal, entonces
< E; ρ2 >= T rρ2 E = 5/8, es decir aquella parte de ρ2 que se proyecta en E , y el estado nal
ρ′2 resulta ser el propio estado E .
Si el estado
( inicial es
) un estado totalmente incoherente, como el dado por el operador den-
1/2 0
sidad ρ3 = , representado por el punto O, entonces < E; ρ3 >= 1/2, ya que dicho
0 1/2
estado incoherente también se puede formar a partir de E y de su complementario ortogonal al
50 %.
184 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
S = u × U + W = Z + W, (3.52)
y por lo tanto
[S, S] = i~S.
e31 = sin θ sin ϕ sin α + sin θ cos θ cos ϕ(1 − cos α),
e32 = − sin θ cos ϕ sin α + sin θ cos θ sin ϕ(1 − cos α),
e33 = cos α + cos2 θ(1 − cos α),
en la representación normal α = αn, o parametrización normal del grupo de rotaciones. En la
parametrización ρ = tan(α/2)n, resulta ser
e11 = (1 + ρ21 − ρ22 − ρ23 )/(1 + ρ2 ),
e12 = (2ρ1 ρ2 + 2ρ3 )/(1 + ρ2 ),
e13 = (2ρ1 ρ3 − 2ρ2 )/(1 + ρ2 ),
[T , T ] = −i~T , [T , W ] = 0.
donde el signo menos de los primeros conmutadores frente a las relaciones de conmutación de
los momentos angulares, realzan el hecho de que son operadores del álgebra de Lie del grupo de
rotaciones, en una representación pasiva. En general todos los operadores de espín proyectados
en los ejes del cuerpo, Ri , Mi y Ti , conmutan con las correspondientes proyecciones en el
laboratorio Si , Zi y Wi . Esto es conforme al principio de indeterminación, ya que componentes
del espín con respecto a sistemas de referencia diferentes, son observables compatibles y por lo
tanto conmutan.
Pero como también tenemos operadores de espín proyectados en los ejes del cuerpo que conmutan
con los anteriores, podemos ampliar el conjunto de operadores que conmutan. Podemos exigir,
por ejemplo, que las funciones anteriores sean también vectores propios de T3 ,
de tal manera que el conjunto completo de observables que conmutan también incluye proyec-
ciones del espín en los ejes del cuerpo.
El operador espín al cuadrado
S 2 = Z 2 + W 2 + 2Z · W , (3.59)
se expresa según (3.54) como la suma de tres operadores que conmutan, por lo que sus vectores
propios se escogerán como vectores propios simultáneos de los tres operadores de la derecha de
(3.59). Los operadores Z y W derivan la función de onda con respecto a las variables u y ρ.
Podemos separar cada χ(u, ρ) en la forma
∑
χ(u, ρ) = Uj (u) Vj (ρ), (3.60)
j
donde la suma va sobre un rango nito, y donde Uj (u) serán funciones propias de Z 2 y Vj (ρ)
de W 2 , respectivamente.
3.5. APÉNDICE: ESPINORES 187
Podemos por lo tanto buscar funciones propias comunes a Z 2 y Z3 en la forma f (u)G(β, λ),
con f (u) arbitraria y respecto de la parte que depende de las variables angulares
Z 2 Ylm (β, λ) = l(l + 1)~2 Ylm (β, λ), Z3 Ylm (β, λ) = m~Ylm (β, λ).
Solo existen soluciones de este sistema de ecuaciones diferenciales para valores enteros de l y
con m = −l, −l + 1, . . . , l. Las funciones |l, m >≡ Ylm (β, λ), denidas sobre la esfera unidad,
reciben el nombre de armónicos esféricos. La medida sobre la esfera normalizada en la unidad
es ∫ π ∫ 2π
1
dβ sin βdλ = 1 (3.63)
0 0 4π
Los armónicos esféricos son ortogonales respecto del producto escalar hermítico denido me-
diante ∫ 2π ∫ π
1
< l, m|s, n >= dλ sin βdβ Ylm∗ (β, λ)Ysn (β, λ) = δmn δls ,
4π 0 0
es decir respecto de la medida invariante y normalizada sobre la esfera unidad (1/4π) sin βdβdλ.
La solución del sistema consiste en buscar las funciones de la forma Yll (β, λ) en variables sepa-
radas Yll (β, λ) = Al (β)Bl (λ), que satisfagan
es decir,
A′l − l(cos β/ sin β)Al = 0, −iBl′ = lBl ,
que resultan ser proporcionales a las funciones Al (β) ≃ sinl β y Bl (λ) ≃ exp(ilλ). Como sobre
la supercie de la esfera el punto (β, λ) es el mismo que el (β, λ + 2π), resulta que exp(ilλ) =
exp(il(λ + 2π)), lo que implica que necesariamente l debe ser un número entero.
188 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
Estas funciones, una vez normalizadas con respecto a la medida (3.63) se pueden escribir
como √
(2l + 1)(2l)!
l
Yl (β, λ) = (−1) l
sinl β eilλ , (3.64)
22l (l!)2
y el resto se obtienen de éstos mediante la acción reiterada sobre ellos de Z− . No existen vectores
propios correspondientes a valores propios semienteros, ya que la supercie de la esfera no es el
espacio homogéneo de mayor dimensión. Podemos ver que Ylm∗ = (−1)m Yl−m , y los primeros
armónicos normalizados en la unidad son:
|0, 0 >= 1,
√ √
3 √ 3
|1, 1 >= − sin β eiλ , |1, 0 >= 3 cos β, sin β e−iλ ,
|1, −1 >=
2 2
√ √ √
15 15 5
|2, 2 >= sin β e , |2, 1 >= −
2 2iλ
sin β cos β e , |2, 0 >=
iλ
(3 cos2 β − 1).
8 2 4
Para obtener la forma más general de un espinor hay que encontrar también la parte Vj (ρ),
que depende de las variables de orientación. Esto lo haremos a continuación tras el análisis de
la acción del grupo de rotaciones sobre sí mismo, como grupo de transformaciones.
Podemos vericar que (Wi )∗ = −Wi y que W+ = −(W− )∗ , donde ∗ signica tomar el complejo
conjugado del correspondiente operador.
Si Fsm (r, θ, ϕ) es una función propia de W 2 y W3 , satisface las ecuaciones diferenciales:
W 2 Fsm (r, θ, ϕ) = s(s + 1)Fsm (r, θ, ϕ), W3 Fsm (r, θ, ϕ) = mFsm (r, θ, ϕ).
Para obtener soluciones de este sistema, vamos a proceder de la siguiente manera. Primero
vamos a calcular las funciones propias de la forma Fss . Sobre ellas el operador W+ nos produce
W+ Fss = 0 y después, actuando sucesivamente con el operador W− obtendremos las restantes
funciones propias Fsm de la misma representación irreducible caracterizada por el parámetro s
y para −s ≤ m ≤ s. El objetivo es encontrar primero las funciones Fss .
Consideremos que podemos escribir las funciones Fss en variables separadas en la forma
Fs (r, θ, ϕ) = A(r)B(θ)C(ϕ). Entonces
s
W3 A(r)B(θ)C(ϕ) = sA(r)B(θ)C(ϕ)
da lugar a
sin θ
(1 + r2 ) cos θA′ BC − AB ′ C + ABC ′ = 2isABC
r
donde A′ es la derivada de A y así con las demás, y dividiendo ambos lados por ABC llegamos
a
A′ (r) sin θ B ′ (θ) C ′ (ϕ)
(1 + r2 ) cos θ − + = 2is.
A(r) r B(θ) C(ϕ)
El tercer término de la izquierda debe ser constante, ya que los demás términos son indepen-
dientes de ϕ. Este término lo ponemos como C ′ (ϕ)/C(ϕ) = ik y por lo tanto C(ϕ) = eikϕ , salvo
un factor constante arbitrario. Como C(ϕ + 2π) = C(ϕ) implica que la constante k debe ser un
entero. Las otras dos funciones satisfacen:
r(1 + r2 ) sin2 θA′ B + (sin θ cos θ + ir sin θ)AB ′ − 2s(ir cos θ + 1)AB = 0.
Dividiendo ambos miembros por AB , teniendo en cuenta (3.66), obtenemos para los parámetros
la condición (p − 2s)(1 + ir cos θ) = 0. Entonces existen soluciones reales en variables separadas,
para todo p = 2s = k . Vienen dadas, salvo un factor global constante, por:
( 2 )s
r
s
Fs (r, θ, ϕ) = (sin θ)2s ei2sϕ . (3.67)
1 + r2
190 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
Para s = 1/2 y después de la acción con W− obtenemos los dos vectores ortogonales
1/2 r2
Ψ11 = (Ψ1/2 )2 = sin2 θ ei2ϕ ,
1 + r2
1/2 −1/2 r
Ψ01 = (Ψ1/2 )(Ψ1/2 ) = sin θ (i + r cos θ) eiϕ ,
1 + r2
−1/2 (i + r cos θ)2
Ψ−1
1 = (Ψ1/2 )
2
= ,
1 + r2
que también puede obtenerse como el producto tensorial de Ψ ⊗ Ψ.
Si hubiéramos trabajado en la representación canónica, donde los parámetros son α = αn,
esto equivale a reemplazar la variable r = tan(α/2) en términos del parámetro α y expresar el
operador diferencial ∂/∂r en términos de ∂/∂α, por lo que los operadores de espín quedan
[ ( ) ( ) ]
1 ∂ cos θ cos ϕ ∂ sin ϕ cos θ cos ϕ ∂
W1 = 2 sin θ cos ϕ + − sin ϕ − + ,
2i ∂α tan(α/2) ∂θ tan(α/2) sin θ sin θ ∂ϕ
[ ( ) ( ) ]
1 ∂ cos θ sin ϕ ∂ cos θ sin ϕ cos ϕ ∂
W2 = 2 sin θ sin ϕ + + cos ϕ − − ,
2i ∂α tan(α/2) ∂θ sin θ tan(α/2) sin θ ∂ϕ
[ ]
1 ∂ sin θ ∂ ∂
W3 = 2 cos θ − + ,
2i ∂α tan(α/2) ∂θ ∂ϕ
[ 2 { 2 }]
∂ 1 ∂ 1 ∂ cos θ ∂ 1 ∂2
W =−
2
+ + + + ,
∂α2 tan(α/2) ∂α 4 sin2 (α/2) ∂θ2 sin θ ∂θ sin2 θ ∂ϕ2
[ ( ) ( ) ]
eiϕ ∂ cos θ ∂ cos θ tan(α/2) − i ∂
W+ = 2 sin θ + +i − ,
2i ∂α tan(α/2) ∂θ tan(α/2) sin θ ∂ϕ
[ ( ) ( ) ]
e−iϕ ∂ cos θ ∂ cos θ tan(α/2) + i ∂
W− = 2 sin θ + −i −
2i ∂α tan(α/2) ∂θ tan(α/2) sin θ ∂ϕ
y los espinores de las dos representaciones ortogonales bidimensionales se escriben como
1/2 α −1/2 α α
Ψ1/2 = i sin sin θ eiϕ , Ψ1/2 = cos − i sin cos θ (3.68)
2 2 2
y
e 1/2 = cos α + i sin α cos θ,
Ψ e −1/2 = −i sin α sin θ e−iϕ .
Ψ (3.69)
1/2 2 2 1/2 2
3.5. APÉNDICE: ESPINORES 191
Se ha mencionado que los anteriores espinores son ortogonales. Para dotar a este espacio
de funciones con una estructura de espacio de Hilbert es necesario denir un producto escalar,
hermítico, denido positivo. La matriz Jacobiana de las variables ρ′ en términos de las variables
ρ dada en (3.39), posee por determinante
( )
∂ρ′ i (1 + µ2 )2
det = ,
∂ρj (1 − µ · ρ)4
(1 + µ2 )2 3
d 3 ρ′ = d ρ.
(1 − µ · ρ)4
(1 + µ2 )
1 + ρ′ =
2
(1 + ρ2 )
(1 − µ · ρ)2
y en la representación normal es
Los operadores de espín proyectados en los ejes del cuerpo ei , vienen dados en (3.58) en la
parametrización ρ, y hemos visto que dieren de los operadores W únicamente en el cambio
ρ → −ρ, seguido de un cambio global de signo. Esto corresponde en la parametrización canónica
al cambio α → −α, seguido del cambio global de signo.
Estos operadores son
[ ( )
1 ∂ cos θ cos ϕ ∂
T1 = 2 sin θ cos ϕ + + sin ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
sin ϕ cos θ cos ϕ ∂
− , (3.72)
tan(α/2) sin θ sin θ ∂ϕ
[ ( )
1 ∂ cos θ sin ϕ ∂
T2 = 2 sin θ sin ϕ + − cos ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
cos θ sin ϕ cos ϕ ∂
− − , (3.73)
sin θ tan(α/2) sin θ ∂ϕ
[ ]
1 ∂ sin θ ∂ ∂
T3 = 2 cos θ − − . (3.74)
2i ∂α tan(α/2) ∂θ ∂ϕ
Se puede vericar, como se ha mencionado anteriormente, que satisfacen las reglas de con-
mutación:
[Ti , Tk ] = −iϵikl Tl , (3.75)
[Wi , Tk ] = 0. (3.76)
Como W 2 = T 2 podemos encontrar vectores propios comunes de los operadores W 2 , W3 y
(s)
T3 , que los denotaremos por Dmn (α) de tal manera que
W 2 Dmn
(s) (s)
(α) = s(s + 1)Dmn (α),
(s) (s)
W3 Dmn (α) = mDmn (α),
(s) (s)
T3 Dmn (α) = nDmn (α).
(s) (s)
Como W3 (α)Dmn (α) = mDmn (α), si producimos el cambio α → −α obtenemos que
(s) (s)
W3 (−α)Dmn (−α) = mDmn (−α) y el posterior cambio global de signo lo reduce a
−W3 (−α)Dmn
(s) (s)
(−α) = T3 (α)Dmn (−α) = −mDmn
(s)
(−α),
por lo que los anteriores espinores (3.68)-(3.69) son también vectores propios de T3 .
Con esta notación, los cuatro espinores normalizados, denotados por los correspondientes
valores propios |s, m, n >, son
√
Φ1 = |1/2, 1/2, 1/2 > = 2(cos(α/2) + i cos θ sin(α/2)), (3.77)
√ −iϕ
Φ2 = |1/2, −1/2, 1/2 > = i 2 sin(α/2) sin θe , (3.78)
√
Φ3 = |1/2, 1/2, −1/2 > = i 2 sin(α/2) sin θe . iϕ
(3.79)
√
Φ4 = |1/2, −1/2, −1/2 > = 2(cos(α/2) − i cos θ sin(α/2)), (3.80)
La razón es que [W3 , W± ] = ±W± , mientras que [T3 , T± ] = ∓T± . Esto trae consigo que si |w, m >
es vector propio de W3 con valor propio m, W3 |w, m >= m|w, m >, la acción de W+ produce un
vector propio de W3 con valor propio m + 1. En efecto
W3 (W+ |w, m >) = (W+ + W+ W3 )|w, m >= W+ |w, m > +W+ m|w, m >= (m + 1)(W+ |w, m >),
mientras que si |t, r > es vector propio de T3 con valor propio r, T+ |t, r > es vector propio de T3
con valor propio r − 1. En efecto
T3 T+ |t, r >) = (−T+ + T+ T3 )|t, r >= −T+ |t, r > +T+ r|t, r >= (r − 1)(T+ |t, r >).
Un aspecto importante que conviene resaltar es que para las partículas de espín 1/2, a pesar
de que las representaciones irreducibles correspondientes a s = 1/2, son bidimensionales, para
describir la parte del espín de la función de onda, necesitamos una función compleja de un espacio
de Hilbert de dimensión cuatro, ya que para describir la orientación de la partícula, tenemos
que asociar a la misma un sistema de referencia local, por lo que además de la proyección del
espín en el sistema del laboratorio W , poseemos como observables las proyecciones del espín en
los ejes del cuerpo T , las cuales deben ser incluidas porque son operadores que conmutan con
los anteriores.
Los espinores que acabamos de obtener, pueden ser obtenidos también por medio de un
teorema importante relativo a las representaciones de grupos compactos, y que se conoce en la
literatura como el teorema de Peter-Weyl 12 . Lo vamos a enunciar sin demostración la cual se
puede encontrar en cualquiera de las referencias citadas.
forman un conjunto ortonormal completo sobre G, con respecto a una medida nor-
malizada e invariante µN (g) denida sobre este grupo, es decir,
∫ √ √
(s)∗ (r)
ds Dij (g) dr Dkl (g) dµN (g) = δ sr δik δjl . (3.84)
G
Que el conjunto es completo signica que cada función de cuadrado integrable denida sobre
G, f (g), admite un desarrollo en serie, convergente en norma, en términos de las funciones
(s)
ortogonales anteriores Dij (g), en la forma
∑ (s)
√ (s)
f (g) = aij ds Dij (g),
s,i,j
(s)
y donde los coecientes, en general números complejos aij , se obtienen a partir de
∫ √
(s) (s)∗
aij = ds Dij (g) f (g)dµN (g).
G
1
dµN (α, θ, ϕ) = sin θ sin(α/2)2 dαdθdϕ.
4π 2
En la parametrización normal, las representaciones bidimensionales de SU (2) corresponden
a los valores propios s = 1/2 de S 2 y la representación matricial está dada por
Si comparamos estas componentes matriciales con los cuatro espinores ortogonales dados en
(3.77)-(3.80) vemos que ( )
1 Φ4 −Φ2
D (1/2)
(α) = √ , (3.85)
2 −Φ3 Φ1
√
es decir, 2 veces las 4 componentes matriciales de D(1/2) (α) son los cuatros espinores básicos
Φi .
En la representación tridimensional de SO(3), considerada como una representación 3 × 3
de SU(2)
(1)
Dij (α) ≡ D(1) (α, θ, ϕ) = δij cos α + ni nj (1 − cos α) + ϵikj nk sin α ≡ ej i
donde
n1 = sin θ cos ϕ, n2 = sin θ sin ϕ, n3 = cos θ,
obtenemos otro conjunto de nueve funciones ortogonales, en este caso todas reales, que resultan
ser las 9 componentes eij de los vectores unidad ligados al punto r . De acuerdo con el teorema
√
de Peter-Weyl, multiplicadas por 3, puesto que son matrices de dimensión 3 × 3, forman otro
conjunto ortonormal y ortogonal al conjunto anterior de cuatro espinores Φk .
3 < eij |ekl >= δik δjl i, j, k, l = 1, 2, 3, < eij |Φk >= 0, i, j = 1, 2, 3, k = 1, 2, 3, 4.
Resulta un buen ejercicio el vericar esta ortogonalidad, realizando las correspondientes inte-
grales por medios manuales o haciendo uso de algún programa de cálculo algebraico, como en
el chero notebook de Mathematica, mencionado. Estas 9 funciones son vectores propios del
operador W 2 con valor propio 1(1 + 1) = 2.
W 2 eij = 2eij , i, j = 1, 2, 3.
Respecto del grupo SU (2), Φ1 y Φ2 son vectores básicos de una representación irreducible. Lo
mismo sucede con Φ3 y Φ4 . Por lo tanto el producto tensorial de estas dos representaciones
generan hasta 3 posibles representaciones de espín 1. Así, si denimos las funciones, que en la
notación |w, w3 , t3 > son
√
3 2
g11 = Φ1 ≡ |1, 1, 1 >,
√2
3
g12 = Φ1 Φ2 ≡ |1, 0, 1 >,
2
√
3 2
g13 = Φ ≡ |1, −1, 1 >,
2 2
√
3 2
g21 = Φ3 ≡ |1, 1, −1 >,
√2
3
g22 = Φ3 Φ4 ≡ |1, 0, −1 >,
2
√
3 2
g23 = Φ ≡ |1, −1, −1 >,
2 4
√
3
g31 = Φ1 Φ3 ≡ |1, 1, 0 >,
2
√
g32 = 3(Φ1 Φ4 + Φ2 Φ3 ) ≡ |1, 0, 0 >,
√
3
g33 = Φ2 Φ4 ≡ |1, −1, 0 >,
2
196 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
Todos estos espinores son vectores propios de W 2 con valor propio 1(1 + 1),
W 2 gij = 2gij ,
los tres primeros g11 , g12 , g13 son vectores propios de T3 con valor propio 1, los g21 , g22 , g23 son
vectores propios de T3 con valor propio −1, y nalmente los g31 , g32 , g33 son vectores propios de
T3 con valor propio 0. Cada terna forma una representación irreducible de SO(3). Los g11 , g21 , g31
son vectores propios de W3 con valor propio 1, los g12 , g22 , g32 son vectores propios de W3 con
valor propio 0, y nalmente los g13 , g23 , g33 son vectores propios de W3 con valor propio −1.
Se puede comprobar que forman una base ortonormal de la representación 3 × 3 de todos
los objetos de espín 1 del grupo de rotaciones.
pero aunque estos espinores formados por las componentes de los vectores unidad que describen
la orientación son también vectores propios de W 2 con valor propio w = 1, no son vectores
propios de W3 y T3 .
W 2 eij = 2eij ,
que, como hemos visto, también satisfacen las reglas de ortogonalidad y normalización
√ √
< 3eij | 3ekl >= δik δjl .
S = u × U + W = Z + W,
3.5. APÉNDICE: ESPINORES 197
donde Z = −i~u × ∇u y W viene dado en (3.53). Las proyecciones del espín en los ejes del
cuerpo, es decir los operadores Ti = ei · W , vienen descritos en (3.58). Satisfacen las reglas de
conmutación:
[Z, Z] = iZ, [W , W ] = iW , [T , T ] = −iT ,
[Z, W ] = 0, [Z, T ] = 0, [W , T ] = 0.
Estas reglas de conmutación son invariantes bajo el cambio ρ por −ρ en la denición de los
operadores W y T , puesto que se intercambian uno en otro. Finalmente, la expresión de los
vectores unidad ligados a la partícula ei vienen dados en (3.55) y (3.56).
Podemos ver que estas componentes de los vectores unidad y los operadores Wi y Tj , satis-
facen las siguientes propiedades:
1) eij (−α, θ,∑
ϕ) = −ej i (α, θ, ϕ).
2) e∑i · W ≡ j eij Wj = Ti .
3) j ej Tj = W .
4) Para todo i, j , la acción Wi ej i = 0, sin suma sobre el índice i.
5) Para todo i, j , la acción Ti eij = 0, sin suma sobre el índice i.
6) Para todo i, j, k, con i ̸= j , tenemos que Wi ekj + Wj eki = 0, y en el caso de que i = j ,
nos lleva a la propiedad 4.
7) Para todo i, j, k, con i ̸= j , tenemos que Ti ej k + Tj eik = 0, y análogamente al caso
anterior, cuando i = j nos lleva de nuevo a la propiedad 4.
Esto implica que ei · W = W · ei = Ti , debido a la propiedad 4, cuando actúa sobre una
función arbitraria f ,
∑ ∑ ∑
(W · ei )f ≡ Wj (eij f ) = f Wj (eij ) + eij Wj (f ) = Ti (f ),
j j j
∑
debido a que j Wj eij =∑ 0. ∑
De la misma manera j ej Tj ≡ j Tj ej = W .
Fijemos ahora el valor del espín. Podemos describir partículas de cualquier valor de su
espín. Consideremos sin embargo los espines de valor más bajo. Para partículas de espín 1/2,
si tomamos por simplicidad las funciones propias V (ρ) de W 2 correspondientes al valor propio
1/2, como el espín total debe ser 1/2, la parte orbital Z debe contribuir solamente con los
armónicos esféricos de valor z = 0 y z = 1.
Si no hay contribución de la parte del zitterbewegung, z = 0, las funciones de Wigner
se pueden escoger como funciones propias simultáneas de los tres operadores que conmutan
W 2 , W3 , y T3 , y los correspondientes vectores normalizados |w, w3 , t3 > vienen dados por las
funciones (3.77-3.80).
Si tenemos una contribución del zitterbewegung correspondiente al valor z = 1, entonces las
funciones U (u) son los armónicos esféricos
√
3
Y1 (β, λ) ≡ |1, 1 >= − sin(β)e
1 iλ
, (3.86)
2
√
Y10 (β, λ) ≡ |1, 0 >= 3 cos(β), (3.87)
√
3
Y1−1 (β, λ) ≡ |1, −1 >= sin(β)e−iλ , (3.88)
2
normalizados con respecto a la medida invariante
∫ π ∫ 2π
1
sin(β)dβdλ = 1.
0 0 4π
Se representan en la forma de funciones propias |z, z3 > de Z 2 y Z3 , donde las variables β y λ
representan la orientación del vector velocidad u.
198 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
La representación producto tensorial del grupo de rotaciones contruída a partir de las dos
representaciones irreducibles, la 1 asociada a los armónicos esféricos (3.86)-(3.88) y la repre-
sentación 1/2 dada en (3.77)-(3.80) se descompone en la suma directa de representaciones
irreducibles 1 ⊗ 1/2 = 3/2 ⊕ 1/2. La representación 3/2 es de dimensión 8, y corresponde a
espinores de espín s = 3/2 y la otra 1/2 de dimensión 4 es la de s = 1/2.
Las siguientes funciones de las cinco variables compactas β , λ, α, θ y ϕ, donde las variables β
y λ son las mismas que las de los armónicos esféricos Ylm , y las restantes α, θ y ϕ, provienen de
los espinores Φi , representan funciones normalizadas de espín 1/2, |s, s3 , t3 > que son vectores
propios de los operadores S 2 , S3 y T3
1 ( √ )
Ψ1 ≡ |1/2, 1/2, 1/2 > = √ Y10 Φ1 − 2Y11 Φ2 , (3.89)
3
1 ( √ )
Ψ2 ≡ |1/2, −1/2, 1/2 > = √ −Y10 Φ2 + 2Y1−1 Φ1 , (3.90)
3
1 ( √ )
Ψ3 ≡ |1/2, 1/2, −1/2 > = √ Y10 Φ3 − 2Y11 Φ4 , (3.91)
3
1 ( √ )
Ψ4 ≡ |1/2, −1/2, −1/2 > = √ −Y10 Φ4 + 2Y1−1 Φ3 , (3.92)
3
y vectores propios todos ellos de Z 2 con valor propio 1(1 + 1), puesto que son combinaciones
lineales de los armónicos esféricos Y1m , por lo que su representación matricial en esta base es
Z 2 = 2I. Son además vectores propios de W 2 con valor propio 1/2(1/2 + 1), por ser combina-
ciones lineales de los Φi , , por lo que su representación matricial en esta base es W 2 = 3/4I.
Podemos vericar que
S− Ψ 1 = Ψ 2 , S− Ψ2 = 0, S− Ψ3 = Ψ4 , , S− Ψ4 = 0,
T− Ψ1 = 0, T− Ψ2 = 0, T− Ψ3 = Ψ1 , T − Ψ4 = Ψ 2 .
No son vectores propios del operador W3 , a pesar de que generan un espacio vectorial invariante
para los operadores S 2 , S3 y T3 . En esta base (3.89)-(3.92) formada por los vectores ortonormales
Ψi , la representación matricial del espín es
( )
~ σ 0
S =Z +W = , (3.93)
2 0 σ
los cuales no satisfacen las reglas de conmutación de un momento angular debido a que el espacio
sobre el que actúan no es un espacio invariante para estos operadores Z y W . Se puede observar
que Z tiene la misma orientación que el espín S , ya que es un múltiplo positivo de él, mientras
que W tiene la opuesta, como se sugiere de la gura de la portada.
Como S 2 = Z 2 + W 2 + 2Z · W , si calculamos las representaciones matriciales en la base Ψi ,
obtenemos (tomando ~ = 1):
3 3 3
Z 2 = 2I, W 2 = I, Z · W = −I, S 2 = (2 + − 2)I = I,
4 4 4
con lo que en la base Ψi los valores esperados de estos observables son los mismos en cualquiera
de los cuatro estados a pesar de no ser estos vectores, vectores propios de Wi y Zi . El que los
valores esperados en los vectores de la base Ψi , de Z · W = −I, sugiere que ambas componentes
3.5. APÉNDICE: ESPINORES 199
del espín Z y W tienen sentidos contrarios, mientras que los valores absolutos de la parte
rotativa del espín W 2 y el espín total S 2 , son los mismos.
Estos valores matriciales de Z 2 y W 2 no se corresponden con los cuadrados de sus respectivas
representaciones matriciales pues de (3.94) resulta Z 2 = 43 I y W 2 = 121
I, mientras que Z · W =
− 3 I,
1
√ √
El módulo de S , S vale 3/2, mientras que el de √ Z resulta ser 2/ 3, es decir 4/3 del
anterior, mientras que la parte W su módulo es 1/2 3, es decir 1/3 del módulo de S pero
en sentido contrario.
√ Se puede observar que al ser Z opuesto a W , resulta que el módulo
S = Z − W = 3/2. Esto justica que desde el punto de vista cuántico hayamos representado
estos operadores con la orientación relativa que aparece en la gura de la portada, con Z en la
misma dirección que S y en sentido contrario la W .
Si observamos a los espinores Ψi , éstos son vectores propios de Z 2 con valor propio 1(1+1) =
2, y de W 2 con valor propio 1/2(1/2 + 1) = 3/4, pero no son vectores propios de Z3 y de W3 .
De hecho, la acción de estos operadores nos saca de este espacio vectorial de dimensión 4. No es
un espacio de una representación irreducible de estos operadores de espín, Zi y Wi , pero sí de
los operadores Si , de los que es una suma directa de dos representaciones irreducibles de valor
s = 1/2.
La proyección del operador de espín W sobre los ejes del cuerpo, es decir, los operadores T ,
toman la misma forma que en el caso anterior (3.82)
( ) ( ) ( )
~ 0 I ~ 0 iI ~ I 0
T1 = , T2 = , T3 = , (3.95)
2 I 0 2 −iI 0 2 0 −I
ya que las funciones Ψ1 y Ψ2 son vectores propios de T3 con valor propio 1/2, mientras que
las funciones Ψ3 y Ψ4 lo son con valor propio −1/2, y por lo tanto los espinores Ψi generan
un espacio invariante para los operadores Si y Tj . En efecto, la base formada por las funciones
propias simultáneas del operador espín total S 2 , S3 y T3 , y la representación de los ket, es la
misma que en el caso de los Φi dados en (3.77)-(3.80).
La expresión en esta base de las componentes de los vectores unidad ei viene dada por
( ) ( ) ( )
1 0 σ 1 0 iσ 1 σ 0
e1 = − , e2 = − , e3 = − . (3.96)
9 σ 0 9 −iσ 0 9 0 −σ
Mecánica Clásica
Algunos observables
H
H = ±γ(v)mc2 , P = ±γ(v)mv = v, S = ∓γ(v)m(r − q) × u.
c2
Invariantes (relativ.)
pµ pµ = (H/c)2 −P 2 = m2 c2 , wµ wµ = (P · S CM )2 −(HS CM /c)2 = −m2 c2 S 2 , T 2 = W 2.
S CM = J − q × P , HS CM /c = HJ /c2 − K × P , K = Hq/c2 − P t.
3.6. RESUMEN DE MECÁNICA CLÁSICA Y CUÁNTICA 201
Mecánica Cuántica
Estados: Cada vector de norma unidad |ϕ >, ϕ(x) ∈ L2 (X) del espacio de Hilbert
L2 (X), sobre el espacio cinemático X .
Ecuación de Dirac
( )
1 du
H − P · u − 2S · ×u = 0.
c dt
202 CAPÍTULO 3. CUANTIZACIÓN DE LOS MODELOS
Capítulo 4
Partícula de Dirac
Figura 4.1: Movimiento del centro de carga de la partícula (H > 0), para el observador del
C.M.
Si hacemos el análisis para el observador del centro de masa, la partícula se reduce a un
sistema mecánico de tres grados de libertad: las dos coordenadas x e y del centro de carga en el
plano de la trayectoria y la orientación α del sistema cartesiano local asociado al punto y que
rota con velocidad angular ω . Pero estos tres grados de libertad no son independientes. La fase α
es la misma que la del movimiento orbital. Pensad por ejemplo, que el triedro local sea el triedro
de Frenet-Serret. Finalmente, como el movimiento es circular de radio constante, solamente nos
queda un sólo grado de libertad, por ejemplo, la coordenada x. Para el observador del centro
de masa, la partícula (y la antipartícula) es equivalente a un oscilador armónico unidimensional
de pulsación ω = mc2 /S y amplitud R0 , pero en su estado fundamental. El Principio atómico
203
204 CAPÍTULO 4. PARTÍCULA DE DIRAC
H 2 − c2 P 2 = m2 c4 . (4.8)
donde las ψi (t, r) describen la parte espacio-temporal y las χi (u, ρ) representan a la parte que
describe la estructura del espín. En consecuencia
(H 2 − c2 P 2 − m2 c4 ) ψi (t, r) = 0, (4.10)
cada una de las partes espacio-temporales satisfacen la ecuación the Klein-Gordon, mientras
que las que describen la estructura interna, satisfacen
Usaremos esta interpretación de un triedro inverso asociado a las partículas más adelante,
cuando analicemos la quiralidad en la sección 4.2.7. Para las antipartículas el comportamiento
es el contrario, como un triedro directo.
Los operadores Si y Ti poseen la representación matricial obtenida anteriormente, que es
( )
~ σ 0
S≡W = , (4.13)
2 0 σ
( ) ( ) ( )
~ 0 I ~ 0 iI ~ I 0
T1 = , T2 = , T3 = , (4.14)
2 I 0 2 −iI 0 2 0 −I
donde σ representan las tres matrices de Pauli y I es la matriz unidad 2 × 2.
Análogamente, las representaciones matriciales de las nueve componentes de los vectores
unidad (ei )j , i, j = 1, 2, 3 da lugar a dos conjuntos alternativos de representaciones, dependiendo
de que la contribución del zitterbewegung sea z = 0 o z = 1. En el primer caso, tenemos:
( ) ( ) ( )
1 0 σ 1 0 iσ 1 σ 0
e1 = , e2 = , e3 = , (4.15)
3 σ 0 3 −iσ 0 3 0 −σ
Conviene observar que las diferentes componentes de los observables ei no son, en general,
observables compatibles, puesto que vienen representadas por operadores que no conmutan.
Si nalmente escribimos la función de onda para partículas de espín 1/2 en la siguiente
forma, para el caso z = 0,
∑
i=4
Φ(0) (t, r, u, α) = ψi (t, r)Φi (α, θ, ϕ), (4.17)
i=1
∑
i=4
Φ(1) (t, r, u, α) = ψi (t, r)Ψi (β, λ; α, θ, ϕ). (4.18)
i=1
donde β y λ representan la dirección del vector u. Por lo tanto, una vez que las funciones Φi o
Ψj que describen la estructura interna quedan identicadas con las cuatro funciones ortogonales
y de norma unidad (dadas en el apéndice en (4.93-4.96) y ((4.97-4.100)), respectivamente), que
son los vectores unidad de una base del espacio de Hilbert interno, C4 , la función de onda más
general resulta ser un objeto de cuatro componentes. Las seis componentes del espín Si y Tj ,
juntamente con las nueve componentes (ei )j , y la matriz unidad 4 × 4, completamente agotan
las 16 matrices hermíticas 4 × 4, linealmente independientes. Forman por lo tanto una base
vectorial del álgebra de Dirac. De esta forma, cualquier otro observable que sea invariante por
traslación, y que describa por lo tanto parte de la estructura interna, por ejemplo el operador
velocidad o aceleración, velocidad angular, etc., debe ser posible expresarlo en términos de una
combinación lineal real de las 16 matrices mencionadas. Veremos en la Sec. 4.3 que la orientación
interna, caracteriza completamente la estructura interna del electrón.
El operador velocidad en la base Ψi se calculará en función de sus componentes en coorde-
nadas polares esféricas
Su representación matricial en esta base es totalmente nula puesto que estos vectores son vectores
propios de S 2 , S3 y T3 y en estos vectores el valor esperado de los operadores de velocidad es
estrictamente cero pero con una gran dispersión.
El operador espín S = u × U + W con respecto al centro de carga, que como se ve en (3.93)
y (4.13), coincide con la representación habitual del operador espín de Dirac.
Figura 4.2: Representación de los ejes locales y diferentes observables para la solución (a)
H > 0 y para la (b) H < 0. Esta orientación nos produce una ecuación de Dirac en la
representación de Pauli-Dirac.
Representación de Pauli-Dirac
Consideremos en primer lugar el caso z = 0. Como u y du/dt son observables invariantes
por traslación, son elementos del álgebra de Dirac. De aquí resulta que podemos relacionar estos
tres vectores con los tres vectores que denen el triedro inverso (left-handed) que describe la
orientación e1 , e2 y e3 en su representación (4.15). Entonces, como se muestra en la parte (a)
208 CAPÍTULO 4. PARTÍCULA DE DIRAC
de la Figura 4.2 y para la partícula, H > 0, tenemos que u = ae1 y du/dt × u = be3 , donde a
y b son números constantes, reales y positivos. Por lo tanto, el tercer término del operador de
Dirac es (b/c2 )e3 · S = (b/c2 )T3 , y el operador (4.19) queda
b
H − aP · e1 − T3 = 0. (4.20)
c2
Si hacemos la identicación con la antipartícula, H < 0, la parte (b) de la Figura 4.2, la
relación de los observables anteriores es opuesta a la obtenida anteriormente, pero ahora con
los coecientes −a y −b, respectivamente, es decir, obtenemos
b
H + aP · e1 + T3 = 0, (4.21)
c2
la cual corresponde claramente al cambio H → −H en la ecuación (4.20). Explícitamente (4.20)
aparece como:
( ) ( ) ( )
a 0 P ·σ b~ I 0 P3 P1 − iP2
H− − 2 = 0, P · σ = .
3 P ·σ 0 2c 0 −I P1 + iP2 −P3
a2 2 b2 ~2
H2 − P I− I = 0, (4.22)
9 4c4
y que es solamente una relación algebraica entre H 2 y P 2 , independiente del espín. Si identica-
mos esta expresión con el operador de Klein-Gordon (4.8), el cual también contiene soluciones
con H > 0 y H < 0, esto conduce a a = 3c y b = 2mc4 /~ = c3 /R0 y substituyendo en (4.20)
obtenemos la ecuación de Dirac:
H − cP · α − βmc2 = 0, (4.23)
donde las matrices de Dirac tradicionales α y β son hermíticas y vienen dadas por
( ) ( )
I 0 0 σ
β= ∼ T3 , α = ∼ e1 . (4.24)
0 −I σ 0
βH − cP · βα − mc2 = 0, γ 0 P0 − γ i P i − mc = 0, γ µ Pµ − mc = 0,
La ecuación de Dirac (4.23) maniesta la relación que existe entre el momento temporal
mecánico o energía H , que se expresa como suma de un término ligado al movimiento del
centro de masa, cP · α, o energía de traslación, lineal en el momento lineal mecánico, y el
término dependiente linealmente del espín, o energía de rotación. Esta relación es válida para la
partícula libre, mientras que si el electrón interacciona con un campo electromagnético externo,
esa relación la deben satisfacer solamente las partes mecánicas, ya que de acuerdo con el principio
atómico no es modicada su estructura mecánica, por lo que la H = Hm + eϕ y P = P m + eA
totales, satisfacen
H = eϕ + c (P − eA) · α + βmc2 , (4.26)
siendo ϕ y A los potenciales escalar y vectorial externos, respectivamente.
Al actuar sobre una función de onda arbitraria correspondiente a un posible estado de
una partícula de Dirac, esta ecuación aparece en el caso libre actuando sobre las componentes
espacio-temporales del espinor de Dirac como
luego los espinores ψ que solamente tuvieran no nulas las componentes superiores ψ1 y ψ2 son
vectores propios de H con valor propio +mc2 mientras que aquellos espinores con componentes
no nulas ψ3 y ψ4 son vectores propios de H con valor propio −mc2 .
Figura 4.3: Orientación de los ejes del cuerpo en la representación de Pauli-Dirac, corres-
pondientes a los cuatro estados básicos Φi de (3.89)-(3.92), respectivamente, con el vector
e2 en la dirección de la aceleración y e1 y −e1 en la dirección de la velocidad. El sistema
de ejes local en los casos (1) y (2) es left-handed, mientras que es right-handed en (3) y
(4), por corresponder a la antipartícula.
Podemos obtener de forma análoga la ecuación de Dirac en el caso de que la parte del
zitterbewegung valga z = 1, utilizando el conjunto de matrices (4.16) en vez del conjunto
210 CAPÍTULO 4. PARTÍCULA DE DIRAC
(4.15), ya que son múltiplos uno del otro y lo único que puede cambiar es algún factor constante
en los cálculos intermedios. Explícitamente, la ecuación equivalente a la (4.20) es ahora la
( ) ( ) ( )
a 0 P ·σ b~ I 0 P3 P1 − iP2
H+ + 2 = 0, P · σ = .
9 P ·σ 0 6c 0 −I P1 + iP2 −P3
Al multiplicarla por ella misma con H cambiado por −H , se obtiene como en el caso anterior
después de indenticarla con la ecuación de Klein-Gordon
a2 2 b2 ~2 mc4
H2 − P I− I = 0, a = 9c, b=6 ,
81 36c4 ~
es decir como en (4.23) con las mismas matrices α y β :
H − cP · α − βmc2 = 0.
Por ejemplo, si realizamos la identicación que se sugiere en la Figura 4.4 para la partícula,
u = −ae3 y el observable du/dt × u = be1 en términos de sendas constantes positivas a y b,
obtenemos por el mismo método las matrices hermíticas
( ) ( )
0 I −σ 0
βW = ∼ T1 , αW = ∼ −e3 , (4.27)
I 0 0 σ
4.2. ECUACIÓN DE DIRAC 211
por lo que las componentes superiores del espinor son Left y las inferiores Right. Con esta
representación los generadores de las transformaciones del grupo de Lorentz que actúan sobre
los espinores son ( ) ( )
i σ 0 1 −σ 0
J= , K= .
2 0 σ 2 0 σ
De esta forma una representación del grupo de Lorentz sobre los espinores toma la forma
( (1/2,0) )
D (Λ) 0
D(Λ) =
0 D(0,1/2) (Λ)
por lo que las componentes superiores e inferiores transforman de manera independiente con las
dos representaciones irreducibles no equivalentes 2 × 2, de SL(2, C).
Cuando comparamos ambas representaciones, vemos que la representación de Weyl se ob-
tiene a partir de la de Pauli-Dirac si es que rotamos el sistema de ejes del cuerpo un valor
π/2 alrededor del eje e2 . De esta forma, el operador velocidad cα tiene sentido contrario a e3 .
Entonces, el operador de rotación es el
( )
iπ iπ 1 I −I
R(π/2, e2 ) = exp( e2 · W ) = exp( T2 ) = √ .
~2 ~2 2 I I
Representación supersimétrica
Es aquella en que las matrices hermíticas de Dirac se escogen como
( ) ( )
0 −iI 0 σ
βS = ∼ −T2 , αS = ∼ e1 . (4.29)
iI 0 σ 0
Está relacionada con la de Pauli-Dirac mediante la transformación unitaria TS γPµ D TS† = γSµ . Esta
transformación corresponde a una rotación de valor π/2 alrededor del eje e1 , en la representación
de Pauli-Dirac
( )
iπ iπ 1 I iI
TS = R(π/2, e1 ) = exp( e1 · W ) = exp( T1 ) = √ .
~2 ~2 2 iI I
212 CAPÍTULO 4. PARTÍCULA DE DIRAC
Representación de Majorana
Como ecuación diferencial, la ecuación de Dirac se escribe
como un operador diferencial lineal matricial de coecientes constantes, que actúa sobre un
vector columna de cuatro componentes, que son funciones complejas de t y r . Si buscamos
una representación en la que las matrices γ µ tengan todas sus componentes imaginarias puras,
podemos hacer que en el sistema de ecuaciones diferenciales anterior todos los coecientes sean
constantes reales y por lo tanto buscar soluciones en las que las cuatro funciones ψi se puedan
escoger reales. Esta es la representación de Majorana. En ella, las matrices hermíticas
( ) ( ) ( ) ( )
0 iI σ1 0 0 I σ3 0
βM = ∼ T2 , α1 = , α2 = , α3 = , (4.31)
−iI 0 0 −σ1 I 0 0 −σ3
son estados de H > 0, mientras que los espinores linealmente independientes de los anteriores
−iψ 0
0 −iψ
Ψ3 =
ψ ,
Ψ4 =
0 ,
HΨi = −mc2 Ψi , i = 3, 4
0 ψ
Supongamos una transformación de cambio de fase, que afecte al estado de partícula, pero
no a la antipartícula, en la representación de Dirac. Sobre el espinor de Dirac vendría dado por
la transformación unitaria
iα
ψ1 e ψ1 ( iα ) ( −iα )
ψ2 eiα ψ2
G = , G = e I 0 , G−1 = G† = e I 0 ,
ψ3 ψ3 0 I 0 I
ψ3 ψ3
supone que al actuar sobre los observables básicos con esta transformación unitaria
( ) ( )
† 0 eiα σ 0 (cos α + i sin α)σ
Ge1 G = = = cos αe1 + sin αe2 ,
e−iα σ 0 (cos α − i sin α)σ 0
( ) ( )
† 0 ieiα σ 0 (− sin α + i cos α)σ
Ge2 G = = = − sin αe1 +cos αe2 ,
−ie−iα σ 0 (− sin α − i cos α)σ 0
Ge3 G† = e3 , GSG† = S,
GT1 G† = cos αT1 + sin αT2 , GT2 G† = − sin αT1 + cos αT2 , GT3 G† = T3 .
Esta transformación corresponde en la gura 4.6 al desplazamiento de una fase α de la posición
del centro de carga de la partícula. Si el cambio de fase afectase solamente a una de las com-
ponentes de los espinores básicos, representaría este cambio de fase del correspondiente vector
básico del conjunto de la gura 4.3.
i
< A(t + ∆t) > − < A(t) >= < ψ(0)|HA(t) − A(t)H|ψ(0) > ∆t,
~
por lo que
d < A(t) > i dA(t)
= < ψ(0)|[H, A(t)]|ψ(0) >=< ψ(0)| |ψ(0) > .
dt ~ dt
De esta forma el cálculo de la variación temporal del valor esperado de un observable es equiva-
lente al valor esperado del observable [H, A(t)] con respecto a cualquier estado inicial ψ(0). Si el
observable A, es una función explícita del tiempo, entonces es fácil ver que es el valor esperado del
observable (4.33), con respecto al estado incial arbitrario ψ(0) del sistema.
Podemos ver que para Dirac, el punto r se mueve con la velocidad c. En efecto, el conmutador
[H, r] es distinto de cero debido a que [Pi , xj ] = −i~δij , por lo que la velocidad de r es
dr i i
u= = [H, r] = [c (P − eA) · α, r] = cα,
dt ~ ~
incluso en interacción. Los valores propios de las matrices αi son ±1, por lo que si alguna
componente del vector velocidad es medida con precisión, solamente puede ser ±c.
La representación de Pauli-Dirac encontrada, es compatible con la aceleración du/dt a lo
largo del vector e2 . En efecto, en el sistema de referencia del centro de masa el Hamiltoniano
de Dirac se reduce a H = βmc2 , y para el operador velocidad u = cα, se tiene
( )
du i 2mc3 0 iσ c2
2
= [mc β, cα] = = 3e2 , (4.34)
dt ~ ~ −iσ 0 R0
4.2. ECUACIÓN DE DIRAC 215
donde c2 /R0 es el módulo constante de la aceleración en este sistema de referencia, y donde 3e2
juega el papel de vector unidad en esa dirección.
La derivada temporal del sistema cartesiano ligado al punto es
de1 i c
= [βmc2 , e1 ] = e2 , (4.35)
dt ~ R0
de2 i c
= [βmc2 , e2 ] = − e1 , (4.36)
dt ~ R0
de3 i
= [βmc2 , e3 ] = 0, (4.37)
dt ~
puesto que e3 es ortogonal al plano de la trayectoria y no cambia, y donde c/R0 = ω es la
velocidad angular del movimiento interno de la carga. Esta evolución temporal de los observables
ei es la correcta si como hemos supuesto se trata de un triedro cartesiano inverso como se
muestra en la Figura 4.2-(a). Es por esta razón que al comienzo del capítulo hemos supuesto
que el triedro rota con la misma velocidad que la velocidad angular del movimiento del centro
de carga.
Al mismo tipo de conclusión habríamos llegado si hubiéramos utilizado la representación de
Weyl donde las matrices de Dirac vienen dadas en (4.27). En efecto, en esta representación
de1 i
= [βW mc2 , e1 ] = 0, (4.38)
dt ~
de2 i c
= [βW mc2 , e2 ] = e3 , (4.39)
dt ~ R0
de3 i c
= [βW mc2 , e3 ] = − e2 . (4.40)
dt ~ R0
Para ser consistente con la consideración anterior de que los vectores 3ei , juegan el papel de
vectores unidad, esto implica que el espín, para el observador del centro de masa en la repre-
sentación de Pauli-Dirac, debe tener la orientación de 3e3 . Este es el caso para las componentes
superiores, mientras que para las inferiores (que en esta representación corresponden a estados
con H < 0) la orientación es la opuesta. Esto signica que para las partículas el correspondiente
conjunto de ejes ligados al cuerpo forma un triedro inverso, mientras que para las antipartícu-
las, el correspondiente conjunto de ejes, forma un triedro directo. Esto pone de maniesto una
diferencia en la quiralidad entre partículas y antipartículas, como veremos en la sección 4.2.7.
En general
dS i i
= [H, S] = [cP · α + βmc2 , S] = cP × α ≡ P × u,
dt ~ ~
no es una constante del movimiento, pero para el observador del centro de masa, el operador
espín u × U + W se reduce al espín con respecto al centro de masa S que sí es constante en
este referencial:
dS i
= [βmc2 , S] = 0. (4.41)
dt ~
Únicamente la componente T3 del espín sobre los ejes del cuerpo, en la representación de
Pauli-Dirac permance constante mientras que las otras dos componentes T1 y T2 cambian debido
a la rotación de estos ejes.
dT1 i c
= [βmc2 , T1 ] = T2 , (4.42)
dt ~ R0
dT2 i c
= [βmc2 , T2 ] = − T1 , (4.43)
dt ~ R0
dT3 i
= [βmc2 , T3 ] = 0. (4.44)
dt ~
216 CAPÍTULO 4. PARTÍCULA DE DIRAC
dT1 i
= [βW mc2 , T1 ] = 0, (4.45)
dt ~
dT2 i c
= [βW mc2 , T2 ] = T3 , (4.46)
dt ~ R0
dT3 i c
= [βW mc2 , T3 ] = − T2 . (4.47)
dt ~ R0
Si se analiza desde un observador arbitrario, el movimiento es una hélice y la aceleración no
es de módulo constante c2 /R0 , y el operador espín con respecto al centro de carga S no es una
constante del movimiento, ya que quien es constante es el momento angular total J = r ×P +S ,
que se conserva.
∂Φ∗ ~
−i~ + ∇Φ∗ · u − mc2 Φ∗ β = 0. (4.50)
∂t i
donde Φ∗ representa el espinor la, traspuesto y complejo conjugado del (4.49). Si a la primera
ecuación (4.48) la multiplicamos por el vector la Φ∗ por la izquierda y la (4.50) por el vector
columna Φ por la derecha, y restamos la segunda de la primera, el término en β se cancela, y
se llega a
∂(Φ∗ Φ)
+ ∇(Φ∗ uΦ) = 0,
∂t
∑ ∗
que llamando a Φ∗ Φ = ψi ψi = ρ(t, r) una función escalar y denida positiva que se inter-
preta como la densidad de probabilidad de presencia del electrón y a Φ∗ uΦ = j(t, r), como la
densidad de corriente de probabilidad, la ecuación de Dirac nos produce localmente la ecuación
de continuidad
∂ρ
+ ∇ · j = 0. (4.51)
∂t
Existe por lo tanto conservación local de la probabilidad, en cada punto∫ (t, r) ∈ R4 , del espacio
tiempo. Esta ley de conservación implica que la integral a t constante V ρdV se conserva cua-
lesquiera que sea el volumen de integración V . Si este volumen es todo el espacio tridimensional,
esa integral vale 1, como corresponde a una función de onda normalizada.
4.2. ECUACIÓN DE DIRAC 217
∂µ j µ = 0. (4.52)
En electrodinámica cuántica no existe ningún otro acoplamiento entre los campos externos y
las propiedades de la partícula, lo que refuerza la idea de que, efectivamente, lo que se está
describiendo de forma clásica, es la evolución del centro de carga, es decir de un punto al que se
le asocia el valor de una carga eléctrica e y ningún multipolo eléctrico o magnético. Y la función
de onda lo que describe es la densidad de probabilidad de presencia de la carga eléctrica.
Figura 4.7: La inversión espacial del electrón en el sistema del centro de masa es equivalente
a una rotación de valor π alrededor de S . El sistema local de ejes permanece left-handed,
ya que el carácter de partícula (o antipartícula) no cambia.
En la representación de Pauli-Dirac (Figura 4.2), vemos que esta inversión equivale a una
rotación de valor π alrededor del eje e3 y, por lo tanto,
que es una de las posibles representaciones del operator paridad ±γ0 o bien ±iγ0 . En la repre-
sentación de Weyl esto corresponde a una rotacion de valor π alrededor del eje e1 con lo que
tomamos P ≡ iγ0 . Esto resulta de la compatibilidad con la conjugación de carga, según Racah.2
La inversión espacial no afecta al carácter left o right-handed del sistema de referencia local
de vectores unidad ei , ya que transforma partícula en partícula y antipartícula en antipartícula.
Podemos comprobar que con la transformación unitaria P ≡ iγ0 ,
Figura 4.8: La inversión temporal del electrón produce una partícula cuyo momento tem-
poral H es negativo.
En la Figura 4.8 representamos la inversión temporal, también para el observador del centro
de masa,
pero este movimiento corresponde a una partícula con H < 0, tal que la orientación relativa
entre el espín, velocidad y posición, dados por la ecuación (2.167), está conforme al movimiento
descrito en esta gura. El sistema local de ejes es left-handed. El operador de inversión temporal
viene dado por3 y puede también tomarse como una rotación de valor π alrededor del eje e2 ,
( )
0 −I
T = R(π, e2 ) = exp(iπe2 · S/~) = exp(iπT2 /~) = , T −1 = T † .
I 0
P γ 0 P −1 = γ 0 , P γ i P −1 = −γ i , T γ 0 T −1 = −γ 0 , T γ i T −1 = γ i ,
(P T )γ µ (P T )−1 = −γ µ ,
ya que las cuatro matrices γ transforman como las componentes de un tetravector
Es por esto que la ecuación de la partícula de Dirac libre es invariante bajo el grupo completo
de Poincaré, incluyendo inversiones.
Una partícula de Dirac es un sistema mecánico cuyos atributos intrínsecos son la masa m > 0
y el espín ~/2. Vemos que también el signo de H es invariante Poincaré y por lo tanto es otra
propiedad intrínseca lo que establece dos clases diferentes de sistemas de la misma masa y espín.
Al sistema con H > 0 se le da habitualmente el nombre de partícula mientras que se reserva
el nombre de antipartícula para el de H < 0. El valor de la masa no lo ja la teoría, hay que
introducirlo a mano. Para caracterizar su interacción con un campo electromagnético externo,
tenemos que introducir a mano otra propiedad intrínseca, la carga eléctrica e, localizada en
el punto r . Esto implica que además de las propiedades mecánicas m y S el sistema posee
propiedades electromagnéticas como la carga eléctrica e, que debido a su movimiento a la
velocidad de la luz y a su separación con respecto al centro de masa produce un momento
dipolar eléctrico d y un momento dipolar magnético µ, respectivamente. La carga eléctrica
puede tener ambos signos, positiva o negativa.
S S S S S S
m m m m m m
H H H −H H −H
P =
, T e = −e , C e = −e
e e
µ µ µ −µ µ −µ
d −d d d d −d
Figura 4.9: Atributos electromagnéticos µ y d para (a) una partícula de carga negativa y su
transformada P CT , (b), la antipartícula de carga positiva y la orientación relativa con su
espín, analizado todo por el observador del centro de masa. El momento dipolar eléctrico
de la partícula oscila hacia la derecha mientras que lo hace hacia la izquierda para la
antipartícula.
y positrones libres, (y tampoco para muones) a pesar de que se han realizado medidas muy
precisas para determinar el valor absoluto de g , la relación giromagnética.
Existe una indenición en el signo de la carga de la materia, que está también presente en el
formalismo de Dirac. Sin embargo la predicción que se hace es consistente con los estados ligados
formados por una partícula y su antipartícula. Como ejemplo, consideremos el positronio (un
sistema ligado inestable electrón-positrón). Antes de aniquilarse posee un estado fundamental
de espín 0 y momento magnético 0. Esto signica que los espines de ambos electrón y positrón
son opuestos y lo mismo sucede para sus momentos magnéticos. Por lo tanto, para el electrón y
el positrón debe existir la misma orientación relativa entre su espín y su momento magnético.
Otro ejemplo, el pión neutro π 0 , es una combinación lineal de los estados ligados quark-
antiquark uū, dd¯ y a veces también se incluye el par ss̄. Es un sistema ligado que en su estado
fundamental es de espín 0 y momento magnético 0. Como cada uno de los quarks anteriores
poseen masas y cargas distintas poseen diferentes momentos magnéticos, la posibilidad de que
su combinación lineal dé un espín 0 y momento magnético 0, es que para cada uno de los
pares valgan cero, por lo que cada quark y su correspondiente antiquark deben tener la misma
orientación relativa entre el espín y su momento magnético.
Otro experimento que se propone es medir la dirección de precesión del espín de los e+ y
e− o bien de los µ+ and µ− en un anillo de almacenamiento. Si cada par e+ y e− o bien µ+
y µ− tienen la misma orientación relativa entre el espín y el momento magnético, entonces el
momento que las fuerzas externas hacen sobre ellos por parte de un campo magnético es el
mismo
dS
µ×B =
dt
Sin embargo, si inyectamos estas partículas con un acelerador de tal manera que las partículas
y las antipartículas tengan el espín en la misma dirección, por ejemplo hacia arriba, como las
dos clases de partículas poseen carga contraria, hay que invertir el sentido del campo magnético
del anillo, por lo que precesarán en sentido contrario. Si fuera posible detectar esta dirección de
precesión, conrmaría esta predicción, pero al mismo tiempo nos daría la orientación relativa
entre el espín y el momento magnético.
4.2.7. Quiralidad
El modelo clásico que satisface la ecuación de Dirac cuando se cuantiza, da lugar a dos
posibles sistemas con H > 0 y H < 0. Al sistema cuyo H > 0 se le suele denominar la partícula.
Ambos sistemas son de energía positiva E = |H|. Para la partícula el movimiento interno del
centro de carga tiene lugar en un plano ortogonal al espín en sentido hacia la izquierda cuando
se ja la dirección del espín en el sentido positivo. Para la antipartícula, el movimiento es hacia
la derecha, para la misma orientación del espín. Para las partículas, el sistema local orientable
de vectores unidad ei se comporta como un triedro inverso, que rota con velocidad angular en
la dirección opuesta a la del espín. Para las antipartículas resulta ser un triedro directo que rota
en el sentido del espín.
Si hubiéramos comenzado nuestro análisis considerando en primer lugar el ejemplo de la
antipartícula, entonces a la hora de obtener la misma representación de Pauli-Dirac como en
el caso anterior, habríamos tenido que considerar que los ejes del cuerpo son los de la gura
4.10, es decir, en la dirección opuesta a los que escogimos anteriormente, y esto nos lleva por
los mismos argumentos que las matrices γ µ deben reemplazarse por las −γ µ , de manera que
el Hamiltoniano, en el sistema de referencia del centro de masa, se reduce a −βmc2 . De esta
forma, el movimiento de los ejes del cuerpo es, en vez de (4.35-4.37), el dado por
de1 i
= [−βmc2 , e1 ] = −ωe2 , (4.53)
dt ~
de2 i
= [−βmc2 , e2 ] = ωe1 , (4.54)
dt ~
222 CAPÍTULO 4. PARTÍCULA DE DIRAC
Figura 4.10: Orientación relativa de los ejes del cuerpo para la antipartícula que dan lugar
a la representación de Pauli-Dirac. Los ejes se comportan como un sistema de ejes directo
que rotan alrededor de la dirección del espín.
de3 i
= [−βmc2 , e3 ] = 0, (4.55)
dt ~
con ω = c/R0 , lo cual corresponde claramente a un triedro directo que rota con una velocidad
angular ω , en la dirección del espín.
La materia es de izquierdas y la antimateria es de derechas, por lo que respecta al movimiento
y al comportamiento de los ejes del cuerpo. Materia y antimateria muestran una diferente
quiralidad.
A pesar de que el movimiento del centro de carga tiene lugar en una región del orden de
la longitud de onda Compton, es posible que esta separación sea físicamente inobservable, este
movimiento corresponde sin embargo a la oscilación de un dipolo eléctrico instantáneo, que
oscila con una frecuencia muy alta. El sentido del movimiento de este dipolo, una vez que la
dirección del espín ha sido jada, revela la diferencia entre partícula y antipartícula.
Finalmente, si comparamos el operador espín y el vector e3 vemos que
( ) ( )
~ σ 0 1 σ 0
S= , e3 = .
2 0 σ 3 0 −σ
de tal forma que las dos componentes superiores del espinor de Dirac corresponden a solucio-
nes de valor positivo de H y por lo tanto están relacionadas con S ∼ e3 , mientras que las
componentes inferiores corresponden al valor negativo de H , y para estas componentes estos
operadores se comportan como S ∼ −e3 , lo cual brinda una relación vectorial como la que se
representa en las guras 4.2 y 4.10, respectivamente.
Las tres componentes espaciales del espín Si , las tres componentes del espín en los ejes del
cuerpo Tj y las nueve componentes de los ejes del cuerpo (ei )j , i, j = 1, 2, 3, cuyas representa-
ciones matriciales vienen dadas en el caso z = 0 por (4.15) o en (4.16) en el caso z = 1, son
15 matrices hermíticas de traza nula, que juntamente con la matriz unidad 4 × 4, I, forman un
conjunto de 16 matrices hermíticas, linealmente independientes. Son por lo tanto una base del
4.3. ÁLGEBRA DE DIRAC 223
álgebra de Dirac como espacio vectorial, y satisfacen las siguientes reglas de conmutación:
~2
{Si , Sj } = {Ti , Tj } = δij I, (4.59)
2
~2
{Si , Tj } = (3ej )i , (4.60)
2
{Si , (3ej )k } = 2 δik Tj , {Ti , (3ej )k } = 2 δij Sk , (4.61)
2 2
δik δjl I + ϵikr ϵjls (er )s .
{(ei )j , (ek )l } = (4.62)
9 3
Si denimos ahora las matrices adimensionales y normalizadas:
2 2
aij = 3(ei )j , (ó aij = −9(ei )j ), si = Si , ti = Ti , (4.63)
~ ~
juntamente con la matriz unidad 4 × 4, I, forman un conjunto de 16 matrices Γλ , λ = 1, . . . , 16
que son hermíticas, unitarias, linealmente independientes y de determinante unidad. Son la base
ortonormal del álgebra de Dirac como álgebra de Cliord.
El conjunto de 64 matrices unitarias de determinante +1, ±Γλ , ±iΓλ , λ = 1, . . . , 16 forman
un subgrupo nito de SU (4). Su ley de composición se puede obtener de:
aij akl = δik δjl I + iδik ϵjlr sr − iδjl ϵikr tr + ϵikr ϵjls ars , (4.64)
aij sk = iϵjkl ail + δjk ti , (4.65)
aij tk = −iϵikl alj + δik sj , (4.66)
si ajk = iϵikl ajl + δik tj , (4.67)
si sj = iϵijk sk + δij I, (4.68)
s i tj = tj si = aji , (4.69)
ti ajk = −iϵijl alk + δij sk , (4.70)
ti tj = −iϵijk tk + δij I, (4.71)
y análogamente podemos usar estas expresiones para obtener las reglas de conmutación y de
anticonmutación (4.56-4.62).
224 CAPÍTULO 4. PARTÍCULA DE DIRAC
El álgebra de Dirac es generada habitualmente por las cuatro matrices gama de Dirac γ µ ,
µ = 0, 1, 2, 3 que satisfacen las reglas de anticonmutación:
{γ µ , γ ν } = 2η µν I, (4.72)
t′ = eλ t, r ′ = eλ r, u′ = u, α′ = α.
D = tH − r · P . (4.73)
Sea R(β) una rotación arbitraria que cambia los ejes coordenados del observador inercial.
La acción de esta rotación arbitraria R(β) sobre las variables cinemáticas es
y por esta razón los generadores J de las rotaciones involucran a operadores diferenciales que
derivan con respecto a todas estas variables cinemáticas, excluido el tiempo.
La orientación de la partícula, representada por las variables α, o de forma equivalente por
la matriz ortogonal de rotación R(α), se interpreta como la orientación de un sistema hipotético
4.4. SIMETRÍAS ESPACIO-TEMPORALES ADICIONALES 225
Denotemos esta ampliación del grupo de Poincaré por W , a veces denominado grupo de Weyl.
En la representación cuántica, este nuevo generador, cuando actúa sobre la función de onda,
toma la forma:
D = it∂/∂t + ir · ∇. (4.76)
y satisface
[D, pµ ] = −ipµ , [D, J µν ] = 0.
Este grupo ampliado solamente posee un operador de Casimir 5 , el cual, para partículas con
masa, con lo que el operador C1 ̸= 0 es invertible, se reduce a
∑
i=4
ψ(t, r, u, α) = ϕi (t, r)χi (u, α)
i=1
donde los cuatro espinores χi (v, α) se pueden clasicar de acuerdo con los valores propios
|s3 , t3 >. Las funciones ϕi (t, r) se pueden escoger como vectores propios del operador de Klein-
Gordon
pµ pµ ϕi (t, r) = m2i ϕi (t, r).
Como este operador pµ pµ no conmuta con el observable D, el valor propio de la masa mi no
es una propiedad intrínseca, y el correspondiente valor depende del estado particular ϕi que se
considere.
5
L. Abellanas and L. Martínez Alonso J. Math. Phys. 16 1580 (1975).
4.4. SIMETRÍAS ESPACIO-TEMPORALES ADICIONALES 227
Para la clasicación de los espinores χi (u, α) podemos considerar también la parte de los
operadores de momento angular Z . Como [Z 2 , S 2 ] = [Z 2 , T 2 ] = [Z 2 , pµ ] = 0, podemos tomar
Z 2 como un observable que conmuta. Solamente puede tomar valores propios enteros al actuar
sobre funciones de las variables de velocidad. Es debido a que en términos de estas variables
tiene la estructura de un momento angular orbital. Como el espín total S = Z + W , y el valor
propio de S 2 es 1/2, los posibles valores propios de Z 2 son solamente z = 0 ó z = 1. Ver el
apéndice al nal del capítulo para una clasicación posible de las χi (u, α), de acuerdo con z = 0
y que da lugar a las funciones propias (3.77-3.80), y las funciones propias correspondientes a
z = 1, dadas en (4.93-4.96). En este caso, las funciones propias no pueden ser simultáneamente
vectores propios de Z3 . Sin embargo, el valor esperado de Z3 en la base correspondiente a z = 0,
Φi , es 0, mientras que su valor esperado en la base correspondiente a z = 1, Ψi , es de ±2/3.
H = P · u.
Si lo comparamos con la ecuación (4.19), vemos que falta un término. Esto implica, que desde el
punto de vista clásico necesitamos una nueva variable cinemática adimensional β , que transforme
bajo estas transformaciones, y que contribuya al nuevo observable D. El espacio cinemático
ampliado transforma ahora:
t′ = eλ t, r ′ = eλ r, u′ = u, α′ = α, β ′ = λ + β.
Desde el punto de vista de la teoría de grupos, esta nueva variable adimensional corresponde
con sus dimensiones y dominio lo mismo que el parámetro normal del nuevo subgrupo, cuyo
generador es D.
Desde el punto de vista Lagrangiano, la nueva Lagrangiana dependerá también de β y de
β̇ , con una estructura general de la forma
e = ṫT + ṙ · R + u̇ · U + ω · W + β̇B,
L
e β̇ . La constante del movimiento Noetheriana asociada a la invariancia
siendo ahora B = ∂ L/∂
de las ecuaciones dinámicas bajo las dilataciones espacio-temporales nos lleva a que
D = tH − r · P − B,
claramente ligado con el signo de H . Para el observador del centro de masa P = 0, H = ±mc2 =
dB/dt, que da por solución B(t) = B(0) ± mc2 t. En unidades de ~ este observable representa
la mitad de la fase del movimiento interno de la carga alrededor del centro de masa
1
B(t) = B(0) ± ~ωt.
2
Una partícula de Dirac necesita dar dos vueltas para que su fase B(t), en unidades de ~,
incremente en 2π .
Debido a que las rotaciones locales generadas por los Ti conmutan con todo el grupo W , las
variables cinemáticas anteriores también siguen generando un espacio homogéneo del grupo total
W ⊗ SU (2)T , y, por lo tanto, también representan las variables cinemáticas de una partícula
elemental cuyo grupo de simetrías espacio-temporales sea este nuevo grupo ampliado.
un nuevo grupo interno, el grupo unitario SU (3) que transforma entre sí los tres vectores propios
de Z3 los vectores Yij de (4.101) entre ellos y que no modica el valor z = 1 de los espinores Ψi .
Sin embargo, esta relación entre este nuevo grupo unitario SU (3), el cual no es propiamente un
grupo de transformaciones espacio-temporales sino un grupo de transformaciones entre estados
z = 1, y el grupo de simetrías W ⊗ SU (2)T no es simplemente un producto directo y su análisis
lo vamos a dejar para una futura investigación.
Este formalismo es puramente cinemático. No hemos hecho mención de ningún tipo particu-
lar de interacción, electromagnética, débil o fuerte, entre las diferentes clases de partículas. De
esta forma, la comparación estricta con el modelo estándard, a pesar de que nos han aparecido
como grupos adicionales U (1), SU (2)T y SU (3), puede parecer un poco articial.
Desde el punto de vista clásico, el modelo con z = 1, es el modelo de la portada en el que
el movimiento del centro de carga alrededor del centro de masa produce el momento magnético
del electrón. El espín es la suma de la parte orbital Z y la parte rotativa W en la dirección de
la velocidad angular ω . El espín es s = 1/2, que se compone de los dos valores mínimos para
las dos partes. El valor mínimo, no nulo, de Z , es z = 1 y en la dirección del espín total S y el
valor mínimo no nulo de W , w = 1/2, en sentido contrario, de la parte rotativa.
En el caso z = 0, la trayectoria del centro de carga no encerraría ningún área, sería un
movimiento armónico unidimensional de pulsación ω juntamente con un sistema cartesiano de
ejes ligado al punto que oscila, y que rotan con la velocidad angular ω , del mismo valor que
la pulsación ω . El espín es aquí rotativo W , en la misma dirección que la velocidad angular
del sistema cartesiano comóvil, ω . Al no encerrar área la trayectoria del punto r , su momento
magnético con respecto al centro de masa sería cero. En este caso el valor del espín es el valor
mínimo no nulo del momento angular cuántico asociado a la rotación, es decir s = w = 1/2.
De acuerdo con esta discusión, como el electrón es una partícula de Dirac que posee momento
magnético, es la descripción de la portada, con z = 1, la que produce, en nuestra opinión, la
descripción clásica del electrón. La partícula con z = 0 es también una partícula de Dirac, pero
de momento magnético cero. Podría representar a un neutrino, donde el punto r representaría
la localización de la carga débil del mismo.
Una partícula elemental puede ser aniquilada por la interacción con su antipartícula. Pero si
no es destruida por esta interacción, hemos hecho la hipótesis de que no puede ser modicada,
que su estructura no puede cambiar. Como sus propiedades intrínsecas son el espín S y su
proyección en los ejes del cuerpo T , estas dos propiedades no pueden ser alteradas por ninguna
interacción con algún campo externo o con otra partícula.
Consideremos un sistema compuesto por dos partículas elementales con espín y con el mismo
espacio cinemático 6 . Vamos a usar el subíndice a = 1, 2 para distinguir a las variables cinemáti-
cas que se reeren a cada partícula. El espacio cinemático del sistema es el producto cartesiano
de ambos espacios para cada partícula y formado por las variables (ta , r a , ua , αa , βa ), a = 1, 2.
La Lagrangiana del sistema compuesto se podrá escribir como
L = L1 + L2 + LI
donde Ta = ∂ L e a /∂ ṫa , Ra = ∂ L
e a /∂ ṙ a , U a = ∂ L
e a /∂ u̇a , W a = ∂ L
e a /∂ω a y Ba = ∂ L
e a /∂ β̇a ,
debido a la homogeneidad de cada L e a en términos de las derivadas τ de las correspondientes
variables cinemáticas. El espín y la proyección del espín sobre los ejes del cuerpo para cada
partícula, son
S a = ua × U a + W a , Tai = eai · W a
donde eai , i = 1, 2, 3 son los tres vectores ortogonales con origen en cada punto r a .
La Lagrangiana de interacción entre estas dos partículas L e I , será en general una función
de todas las variables cinemáticas de ambas partículas y de sus derivadas τ , y homogénea de
grado uno en estas últimas. Pero si ambas propiedades intrínsecas de las dos partículas Sa
y Ta , no son modicadas por la interacción, la Lagrangiana no puede ser una función de las
derivadas τ de aquellas variables cinemáticas que den lugar a estas propiedades, es decir, no
puede ser función de las variables u̇a y ω a , a = 1, 2. En caso contrario, las funciones U a y W a
contendrían términos provinientes de la L e I y serían diferentes que en el caso libre. Las funciones
U a y W a , que dan lugar a la denición del espín, se tienen que obtener solamente a partir de
las correspondientes Lagrangianas libres, L ea .
Entonces, por lo que respecta a la dependencia de la Lagrangiana L e I de las derivadas con
respecto a τ de las variables cinemáticas, dependerá solamente de ṫa , ṙ a y β̇a , a = 1, 2. Además
de esto, será función de las variables cinemáticas ta , r a , ua y βa , pero no de las αa debido
a la invariancia bajo el grupo de rotaciones locales SO(3)L . La invariancia bajo dilataciones
espacio-temporales implica que la Lagrangiana debe ser función de la diferencia de fase β1 − β2 ,
y de β̇1 − β̇2 , pero como esas fases son completamente arbitrarias debe ser independiente de
estas fases.
Debido a la ligadura ua = ṙ a /ṫa , la Lagrangiana de la interacción será nalmente una
función
eI = L
L e I (ta , r a , ṫa , ṙ a ),
que cumple tanto las condiciones de homogeneidad como de invariancia de escala. En una
descripción síncrona queda
c2 − u1 · u2
LI = g (4.77)
(u1 − u2 ) · (r 2 − r 1 )
La interaccion entre dos partículas de Dirac no es única. Sabemos que entre los leptones y
los quarks hay interacciones de corto alcance, como la débil y la fuerte y otra que es tanto
de corto como de largo alcance que es la interacción electromagnética. La Lagrangiana que se
propone, tiene la ventaja de que describe una interacción que es invariante bajo cambios de
escala, y por lo tanto puede describir una interacción tanto de corto como de largo alcance,
y que, además posee un comportamiento Coulombiano, cuando se suprimen los espines de
las partículas, como veremos en la siguiente sección. De esta forma, suministra una especie
de generalización como acción a distancia, de una interacción electromagnética a distancias
arbitrarias y a corta distancia el equivalente a la interacción débil. La novedad es que ha sido
obtenida suponiendo un grupo de simetrías más amplio que el grupo de Poincaré.
e2
α= .
4πϵ0 ~c
De esta forma la interacción es independiente de las masas de las partículas y en la descripción
síncrona toma la forma √
c2 − u1 · u2
LI = α~ .
r
232 CAPÍTULO 4. PARTÍCULA DE DIRAC
donde todas las variables son adimensionales. Si L1 y L2 dependen de la masa, reescalando toda
la Lagrangiana por el factor mc2 , nos queda nalmente una Lagrangiana adimensional que en
la descripción síncrona queda
√
1 − u1 · u2
L = L1 + L2 + 2α , (4.79)
r
y que es independiente de las masas de las partículas y donde el único parámetro físico es la
constante de estructura na α.
La Lagrangiana (4.77) quedaría en la descripción síncrona de la forma
c2 − u1 · u2
LI = α~ ,
(u1 − u2 ) · (r 2 − r 1 )
(q a − r a )2 d2 r a
qa = ra +
c2 − v a · ua dt2
o lo que es lo mismo, la ecuación diferencial de segundo orden para la posición del centro de
carga de cada partícula, en términos de la posición y velocidad del centro de masa de las mismas:
d2 r a c2 − v a · ua
= (q − r a ), a = 1, 2.
dt2 (q a − r a )2 a
Haremos uso de esta forma de describir la interacción de dos electrones, que conduce a la
existencia de estados ligados entre ellos, en la sección 6.6.
234 CAPÍTULO 4. PARTÍCULA DE DIRAC
t′ = t + δτ, r ′ = r + δb, u′ = u, α′ = α, β′ = β
∂
H=i , P = −i∇, [H, P ] = 0.
∂t
Bajo una dilatación innitesimal de parámetro normal δλ, transforman como:
t′ = t + tδλ, r ′ = r + rδλ, v ′ = v, α′ = α, β ′ = β + δλ
∂ ∂
D = it + ir · ∇ + i = tH − r · P − B, [D, H] = −iH, [D, Pj ] = −iPj .
∂t ∂β
Para describir la orientación podemos representar cada elemento del grupo de rotaciones por
el trivector α = αn, donde α es el ángulo a girar y n es el vector unidad a lo largo del eje de
rotación. Esta es la parametrización normal o canónica. Alternativamente, podemos representar
cada rotación por el trivector ρ = tan(α/2)n. En este caso, cada matriz de rotación toma la
forma
1 ( )
R(ρ)ij = 2
(1 − ρ2 )δij + 2ρi ρj + 2ϵikj ρk .
1+ρ
La ventaja de esta parametrización es que la composición de dos rotaciones es especialmente
simple. R(ρ′ ) = R(µ)R(ρ) toma la forma
µ+ρ+µ×ρ
ρ′ = .
1−µ·ρ
Bajo una rotación innitesimal de parámetro δµ = δα/2, o en términos del parámetro normal,
las variables cinemáticas transforman como
δt = 0, δβ = 0
δri = −2ϵijk rj δµk ,
δui = −2ϵijk uj δµk ,
δρi = (δik + ρi ρk + ϵikl ρl ) δµk ,
de manera que la variación de las variables cinemáticas por unidad de parámetro normal de
rotación δαk es
δtk = 0, δβk = 0,
δrik = −ϵijk rj ,
δuik = −ϵijk uj ,
1
δρik = [δik + ρi ρk + ϵikl ρl ] ,
2
4.6. APÉNDICE: EL GRUPO S = W ⊗ SU (2)T ⊗ U (1)Q 235
δt = r · δv
δr = tδv
δu = δv − u(u · δv)
δρ = − [ρ(u · δv) + ρ ((u × ρ) · δv) − u × δv − δv(u · ρ)−
(u × ρ) × δv] /2,
δβ = 0,
por lo que la variación de estas variables por unidad de parámetro innitesimal de velocidad
δvj , es
δtj = rj
δrij = tδij
δvij = δij − ui uj
1
δρij = − [ρj ui + ρi ϵjkl uk ρl − ϵikj uk − δij uk ρk ] ,
2
δβj = 0,
236 CAPÍTULO 4. PARTÍCULA DE DIRAC
y también
[Kj , Kk ] = −iϵjkl Jl .
Podemos vericar que
e = u × Z,
Z f = u × W.
W
Si denimos el operador espín con respecto al centro de carga en la forma habitual S =
e =Z
Z + W , y la parte del momento cinemático S e +W f = u × S , satisfacen
donde en esta última expresión hemos utilizado la ligadura de que u2 = 1. Generan el álgebra
de Lie de un grupo de Lorentz que conmuta con las traslaciones espacio-temporales, [S, pµ ] =
e p µ ] = 0.
[S,
Con respecto a la parte SU (2)T , calculemos sus generadores. Este grupo, con un elemento
innitesimal de parámetros δνk actua sobre las variables cinemáticas de la forma:
En la parametrización ρ del grupo de rotaciones, los vectores unidad de los ejes del cuerpo ei ,
i = 1, 2, 3 poseen por componentes:
(ei )j = R(ρ)ji ,
de manera que los operadores Tk = ek · W de proyección de la parte rotacional del espín W en
los ejes del cuerpo, vienen dados por
( )
1 ∂ ∂ ∂
Tk = + ρk ρi − ϵikl ρl . (4.82)
2i ∂ρk ∂ρi ∂ρi
Dieren de los Wk de (4.81) por el cambio de ρ por −ρ, seguido de un cambio global de signo.
Satisfacen las reglas de conmutación:
el signo menos del lado derecho de (4.83) corresponde a la diferencia entre la interpretación activa
y pasiva de las transformaciones. Una rotación de los ejes del laboratorio (rotación pasiva) posee
4.6. APÉNDICE: EL GRUPO S = W ⊗ SU (2)T ⊗ U (1)Q 237
por generadores los J , que satisfacen [Jj , Jk ] = iϵjkl Jl . Los Ti corresponden a los generadores
de las rotaciones del sistema de referencia ligado a la partícula(rotación activa), así que de esta
forma, los generadores −Ti poseerán reglas de conmutación pasivas [−Tj , −Tk ] = iϵjkl (−Tl ).
En la parametrización normal de las rotaciones α = αn, si describimos el vector unidad n a
lo largo del eje de rotación por los ángulos habituales, polar y acimutal θ y ϕ, respectivamente,
de tal manera que n ≡ (sin θ cos ϕ, sin θ sin ϕ, cos θ), los anteriores generadores Wi toman la
forma
[ ( )
1 ∂ cos θ cos ϕ ∂
W1 = 2 sin θ cos ϕ + − sin ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
sin ϕ cos θ cos ϕ ∂
+ , (4.84)
tan(α/2) sin θ sin θ ∂ϕ
[ ( )
1 ∂ cos θ sin ϕ ∂
W2 = 2 sin θ sin ϕ + + cos ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
cos θ sin ϕ cos ϕ ∂
− , (4.85)
sin θ tan(α/2) sin θ ∂ϕ
[ ]
1 ∂ sin θ ∂ ∂
W3 = 2 cos θ − + , (4.86)
2i ∂α tan(α/2) ∂θ ∂ϕ
[
∂2 1 ∂
W 2
= − 2
+ +
∂α tan(α/2) ∂α
{ 2 }]
1 ∂ cos θ ∂ 1 ∂2
+ + , (4.87)
4 sin2 (α/2) ∂θ2 sin θ ∂θ sin2 θ ∂ϕ2
[
eiϕ ∂ cos θ ∂ ∂ cos θ ∂
W+ = W1 + iW2 = 2 sin θ + +i − +
2i ∂α tan(α/2) ∂θ ∂θ sin θ ∂ϕ
]
i ∂
, (4.88)
tan((α/2)) sin θ ∂ϕ
[
e−iϕ ∂ cos θ ∂ ∂ cos θ ∂
W− = W1 − iW2 = 2 sin θ + −i − −
2i ∂α tan(α/2) ∂θ ∂θ sin θ ∂ϕ
]
i ∂
, (4.89)
tan(α/2) sin θ ∂ϕ
y los generadores pasivos Ti toman la forma
[ ( )
1 ∂ cos θ cos ϕ ∂
T1 = 2 sin θ cos ϕ + + sin ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
sin ϕ cos θ cos ϕ ∂
− , (4.90)
tan(α/2) sin θ sin θ ∂ϕ
[ ( )
1 ∂ cos θ sin ϕ ∂
T2 = 2 sin θ sin ϕ + − cos ϕ −
2i ∂α tan(α/2) ∂θ
( ) ]
cos θ sin ϕ cos ϕ ∂
− − , (4.91)
sin θ tan(α/2) sin θ ∂ϕ
238 CAPÍTULO 4. PARTÍCULA DE DIRAC
[ ]
1 ∂ sin θ ∂ ∂
T3 = 2 cos θ − − . (4.92)
2i ∂α tan(α/2) ∂θ ∂ϕ
Los Ti están relacionados ahora con los Wi , por el cambio α por −α (sin cambio global de
signo).
Con respecto a la parte U (1)Q , de generador Q, que conmuta con todos los demás, la acción
de un elemento innitesimal δχ de este grupo sobre las variables cinemáticas es:
∂
Q = −i
∂β
Como conmuta con todos los demás, podemos sacar de la función de onda la parte dependiente
de esta variable
Qf (β) = qf (β), f (β) ∼ eiqβ ,
con lo que la función de onda general es
Los operadores de subida y bajada W± y los correspondientes T± , los transforman entre sí.
Los {Φ1 , Φ2 } están ligados por W± , y análogamente los {Φ3 , Φ4 }, mientras que los conjuntos
{Φ1 , Φ3 } y {Φ2 , Φ4 } están ligados cada uno de ellos por los T± . Por ejemplo
W− Φ1 = Φ2 , W− Φ2 = 0, W − Φ3 = Φ 4 , , W− Φ4 = 0,
T− Φ1 = 0, T− Φ2 = 0, T − Φ3 = Φ 1 , T − Φ4 = Φ 2 .
Forman un conjunto ortonormal con respecto a la medida normalizada e invariante, denida
sobre SU (2)
1
dg(α, θ, ϕ) = 2 sin2 (α/2) sin θ dα dθ dϕ,
4π
α ∈ [0, 2π], θ ∈ [0, π], ϕ ∈ [0, 2π].
∫
dg(α, θ, ϕ) = 1.
SU (2)
∑
i=4
ψ(t, r, u, α) = ϕi (t, r)χi (u, α)
i=1
4.6. APÉNDICE: EL GRUPO S = W ⊗ SU (2)T ⊗ U (1)Q 239
donde las cuatro χi se pueden clasicar de acuerdo con los valores propios |w3 , t3 >. Las funciones
ϕi (t, r) se pueden escoger como vectores propios del operador de Klein-Gordon
Las funciones χ(u, α) se pueden a su vez separar en variables ya que el espín total S con s = 1/2,
es la suma de las dos partes S = Z + W , con [Z, W ] = 0, de tal manera que si la parte W
contribuye con w = 1/2 entonces la parte Z contribuye con z = 0 o bien z = 1. La contribución
con z = 0 corresponde a las funciones χi (α) independientes de las variables de velocidad y el
conjunto ortonormal son los anteriores Φi , i = 1, 2, 3, 4, de (4.93)-(4.96) que pueden rescribirse
en la forma |z; s3 , t3 >, con z = 0.
Como Z = −iu × ∇u , para la parte z = 1 los vectores propios de Z 2 y Z3 son los armónicos
esféricos Y1i (β, λ), i = −1, 0, 1. Las variables β y λ representan la dirección del vector velocidad
u. Como [Zi , Wj ] =∑ 0, podemos separar de nuevo las variables en las funciones χ(u, α). En este
caso las χ(u, α) = ϕi (β, λ)λi (α, θ, ϕ). Lo cuatro vectores ortonormales, vectores propios de
S3 , y T3 , y de Z 2 con z = 1, |1; s3 , t3 >, son ahora
1 ( √ )
Ψ1 = |1; 1/2, 1/2 >= √ Y10 (β, λ)Φ1 − 2Y11 (β, λ)Φ2 , (4.97)
3
1 ( √ )
Ψ2 = |1; −1/2, 1/2 >= √ −Y10 (β, λ)Φ2 + 2Y1−1 (β, λ)Φ1 , (4.98)
3
1 ( 0 √ )
Ψ3 = |1; 1/2, −1/2 >= √ Y1 (β, λ)Φ3 − 2Y11 (β, λ)Φ4 , (4.99)
3
1 ( √ )
Ψ4 = |1; −1/2, −1/2 >= √ −Y10 (β, λ)Φ4 + 2Y1−1 (β, λ)Φ3 . (4.100)
3
Los Φi son los mismos que en (4.93-4.96) y los armónicos esféricos Y1i (β, λ) son
√ √
3 √ −1 3
Y1 = −
1 iλ 0
sin(β)e , Y1 = 3 cos(β), Y1 = sin(β)e−iλ . (4.101)
2 2
que son ortonormales con respecto a la medida invariante dµ(β, λ) = sin(β)/(4π)dβdλ. Los
operadores Zi vienen dados por
∂ cos β ∂ ∂ cos β ∂
Z1 = i sin λ +i cos λ , Z2 = −i cos λ +i sin λ ,
∂β sin β ∂λ ∂β sin β ∂λ
∂
Z3 = −i
.
∂λ
y los operadores de subida y bajada Z± = Z1 ± iZ2 , son
( )
±iλ ∂ cos β ∂
Z± = e ± +i ,
∂β sin β ∂λ
S− Ψ 1 = Ψ 2 , S− Ψ2 = 0, S− Ψ3 = Ψ4 , , S− Ψ4 = 0,
T− Ψ1 = 0, T− Ψ2 = 0, T− Ψ3 = Ψ1 , T − Ψ4 = Ψ 2 .
Esta es la razón por la que el espinor más general en esta representación posee cuatro compo-
nentes.
En la base con z = 0, los Φi de (4.93-4.96), los operadores de espín y los vectores básicos
del cuerpo, toman la forma
( )
1 σ 0
S= = Z + W , pero Z = 0.
2 0 σ
( ) ( ) ( )
1 0 I 1 0 −iI 1 I 0
T1 = , T2 = , T3 = ,
2 I 0 2 iI 0 2 0 −I
( ) ( ) ( )
1 0 σ 1 0 −iσ 1 σ 0
e1 = , e2 = , e3 = ,
3 σ 0 3 iσ 0 3 0 −σ
en términos de las matrices de Pauli σ y de la matriz unidad 2 × 2, I.
En la base con z = 1 los Ψi vienen dados en (4.97-4.100), los operadores Si y Ti toman la
misma forma matricial que en el caso anterior, mientras que los vectores ei aparecen
( ) ( ) ( )
−1 0 σ −1 0 −iσ −1 σ 0
e1 = , e2 = , e3 = .
9 σ 0 9 iσ 0 9 0 −σ
En todos los casos, las 6 matrices Hermíticas de traza nula Si , Tj , junto con las nueve matrices
Hermíticas de traza nula eij y la matriz unidad 4 × 4, son linealmente independientes y por lo
tanto forman una base completa y Hermítica del álgebra de Dirac, de manera que cualquier otro
observable que sea invariante por traslación, se expresará como una combinación lineal real de
estas 16 matrices Hermíticas. Hemos hecho uso de este hecho para obtener la ecuación de Dirac
en este modelo.
Ambas representaciones son ortogonales entre sí, < Φi |Ψj >= 0, y producen dos represen-
taciones irreducibles diferentes, de donde podemos deducir que describen dos tipos distintos de
partículas del mismo espín 1/2. ¾Será que una de las representaciones corresponde a la descrip-
ción de hadrones, es decir quarks, y la otra lo que describe son los leptones? Esto está sin probar
ya que aunque se ha avanzado alguna sugerencia en este sentido en la sección 4.4.3, no queda
claro que una de las clases de partículas tenga color y la otra no.
La representación matricial de los operadores Zi y Wi en la base Ψi vienen dados por
( ) ( )
2 σ 0 −1 σ 0
Z= , W = ,
3 0 σ 6 0 σ
T1 e1 + T2 e2 + T3 e3 = e1 T1 + e2 T2 + e3 T3 = W ,
lo que pone de maniesto que los operadores Ti son las componentes del momento angular
rotativo W , en los correspondientes ejes del cuerpo ei .
Capítulo 5
electrón
241
242 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
∂τ ∂τ Rµ {1, −n}
∂µ (R · R) = 0 = Rµ − (R · ż) , τ,µ ≡ = ≡ .
∂xµ ∂x µ (R · ż) (1 − n · β)cṫp
Si subimos el índice ν
y contrayendo µ con ν, es fácil ver que el primer término se cancela con el tercero y el segundo con
Tanto los potenciales como los campos son funciones homogéneas de grado cero de las derivadas
con respecto a τ de las variables cinemáticas de la partícula que crea el campo, por lo que el
resultado es independiente del tipo de parámetro de evolución τ utilizado para la descripción
de la evolución de las fuentes del campo.
Identidades de Jacobi
El campo de una carga puntual (5.1) satisface las identidades de Jacobi
Con α = 0, µ = i y ν = j , se llega a
Ri Fj0 − Rj Fi0 1
Fij = , B = n × E,
R0 c
Tiempo de la partícula
Si usamos como parámetro el tiempo de la partícula, τ = tp , en el instante retardado,
entonces como Rµ ≡ (R, R), tenemos
ż µ ≡ (c, u(tp )), z̈ µ ≡ (0, a(tp )), (R·ż) = cR(1−n·β), (ż·ż) = c2 (1−β 2 ), (R·z̈) = −R·a.
1 q −ui R + cRi q 1 − β2
Ei = c2 (1 − β 2 ), Eβ = (n − β).
c 4πϵ0 c c R3 (1 − n · β)3
3 4πϵ0 R2 (1 − n · β)3
Los términos de aceleración de (5.1) dan lugar, respectivamente, a
−uR + cR a
(R · a), −
− n · β)3
c3 R3 (1 c2 R(1 − n · β)2
y produce nalmente en el Sistema Internacional de unidades el campo de aceleración
[ ]
q (n − β)(n · a) a q n × ((n − β) × a)
Ea = − = (5.3)
4πϵ0 c2 R(1 − n · β)3 c2 R(1 − n · β)2 4πϵ0 c2 R(1 − n · β)3
dtp 1 dR d 2 tp 1 d2 R
=1− , = −
dt c dt dt2 c dt2
Por otra parte, si derivamos con respecto a t, (R · R) = R2 − R2 = 0, se tiene:
dR dR dR dR
2R − 2R · = 0, R −R· = 0,
dt dt dt dt
y de R = r − r p , derivando con respecto a t,
dR dr p d2 r p d2 R
=− , = − .
dt dt dt2 dt2
y por lo tanto
( ) ( 2 )
dR dR d R d2 R
µ
R = (R, R), ż = c −
µ
,− , z̈ = − 2 , − 2 .
µ
dt dt dt dt
La parte ( )
dR dR
(R · ż) = Rc − R −R· = Rc,
dt dt
pues el término entre paréntesis es idénticamente nulo.
( ) ( ) ( ) ( ) ( )
1 dR 2 dR 2 2 dR dR 2 dR 2
(ż · ż) = c 1 −
2
− =c 1−
2
+ −
c dt dt c dt dt dt
244 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
( ) ( )
d2 R d2 R 2 dR 1 d2 ( 2 ) 2 dR
(R·z̈) = −R 2 +R· 2 , (ż·ż)−(R·z̈) = c 1 −
2
+ R −R =c 1−
2 2
.
dt dt c dt 2 dt2 c dt
ya que el último término R2 − R2 = 0. Como
( )
dr pi dtp dRi dR
żi R0 − ż0 Ri = − R+c Ri = R + c− Ri ,
dt dt dt dt
d2 r pi d 2 tp d2 R i d2 R
z̈i R0 − z̈0 Ri = − R + c Ri = R − 2 Ri ,
dt2 dt2 dt2 dt
con lo que el campo queda:
( ( ) ) ( ) ( 2 )
1 e 1 dR dR 2 dR e 1 d R d2 R
E= R + c− R c 1−
2
+ 2 2 R 2 − 2R ,
c c c3 R3 dt dt c dt cc R dt dt
es decir
( ) ( ) [ ]
eR eR d R e d2 R q n R d (n) 1 d2 n
E= 3 + + 2 2 = + + 2 2 , (5.4)
R c dt R3 c dt R 4πϵ0 R2 c dt R2 c dt
la expresión del campo debida a Heaviside-Feynman.
Para el campo magnético obtenemos
[ ]
1 µ0 q 1 dn 1 d2 n
B = n×E = n× + n× 2 (5.5)
c 4π R dt c dt
El teorema de Gauss
Que todas las componentes del campo son relevantes lo vemos si calculamos el ujo saliente
en cualquier instante del campo eléctrico sobre una esfera de radio R alrededor de la carga.
Todos los puntos de esta supercie poseen, en el instante t, al mismo punto retardado donde
está localizada la carga. Vamos a tomar la velocidad retardada en la dirección de OZ y el vector
unidad n desde la carga al punto de observación formando un ángulo θ con la velocidad. La
parte del término de aceleración (5.3) del campo eléctrico es perpendicular al vector n, por lo
que no produce ujo. La otra parte tiene dos términos, uno radial que va en la dirección de n y
otra en la dirección de β , que al proyectar en la dirección normal a la esfera, que tiene la misma
dirección que el vector n desde el punto retardado, nos queda
q(1 − β 2 ) q(1 − β 2 )
E(t, r) = (n − β), E · n = , dS = R2 sin θdϕdθ
4πϵ0 R (1 − n · β)
2 3 4πϵ0 R2 (1 − n · β)2
I ∫
q(1 − β 2 ) π sin θdθ q
E · ndS = =
2ϵ0 0 (1 − β cos θ)2 ϵ 0
pues con el cambio cos θ = u, sin θdθ = −du y la
∫ −1 −1
−du −1 1 2
= = .
(1 − βu)2
β (1 − βu) 1 1 − β2
1
El resultado es independiente del valor de β , por lo que en el caso de una partícula con β = 1,
también se cumple. Por lo tanto, en el caso de partículas de Dirac no debemos eliminar esta
parte del campo, ya que aunque el numerador se anula, también se anula n−β y el denominador
(1 − n · β) en la dirección en que n = β , haciendo que en el límite el valor del campo no se anula
sino que se hace singular. Para el cálculo del campo en el caso de partículas con espín, fuera del
plano del zitterbewegung, solamente contribuye el campo de aceleración pero el de velocidad no
lo podemos anular en el plano del zitterbewegung. De no incluir este término de velocidad no
se satisfaría la ecuación de Maxwell ∇ · E = ρ/ϵ0 , es decir el teorema de Gauss.
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 245
sería un campo sin fuentes y representaría el campo radiado por el electrón. Si el electrón
no estuviera solicitado por ningún campo externo, la radiación debería ser nula. Al denir
Aµrad = Aµret − Aµadv , esto implica que el campo radiado por la partícula satisface la condición de
Lorenz ∂µ Aµrad = 0 y la ecuación sin fuentes Aµ rad = 0, ya que es un campo que deja de estar
vinculado a la carga que lo produjo, a la que abandona.
De forma alternativa a lo que hace Dirac, vamos a calcular este campo, como hace Barut2 ,
en un punto próximo a la carga pero sobre la trayectoria de la misma x = z(τ ), cuyos instantes
retardado y avanzado corresponden a los instantes τB = τ − σ , y τA = τ + σ , respectivamente.
Vamos a usar la expresión (5.1) de los campos que la representamos como
1
Fµν (x) = (żν Rµ ((ż · ż) − (R · z̈)) + z̈ν Rµ (R · ż)) − {ν ←→ µ}
(R · ż)3
donde {ν ←→ µ} representa al mismo término pero con ν y µ intercambiados. Luego hay que
determinar ( )
rad
Fµν ret
(z(τ )) = lı́m Fµν (τB ) − Fµν
adv
(τA )
σ→0
Para ello vamos a desarrollar a órdenes más bajos los diferentes términos. Para el campo retar-
dado tenemos
...
R(τB ) = z(τ ) − z(τB ) = ż(τB )σ + z̈(τB )σ 2 /2 + z (τB )σ 3 /6 + · · ·
...
(R · ż)τB = (ż · ż)τB σ + (ż · z̈)τB σ 2 /2 + (ż · z )τB σ 3 /6 + · · · = (ż · ż)τB σ − (z̈ · z̈)τB σ 3 /6 + · · · ,
... ...
(R · z̈)τB = (z̈ · ż)τB σ + (z̈ · z̈)τB σ 2 /2 + (z̈ · z )τB σ 3 /6 + · · · = (z̈ · z̈)τB σ 2 /2 + (z̈ · z )τB σ 3 /6 + · · · ,
...
ya que para la partícula puntual (ż · ż) = c2 , (ż · z̈) = 0, (z̈ · z̈) + (ż · z ) = 0 y así sucesivamente.
Para el campo avanzado tenemos
...
R(τA ) = z(τ ) − z(τA ) = −ż(τA )σ + z̈(τA )σ 2 /2 − z (τA )σ 3 /6 + · · ·
1
P.A.M. Dirac, Classical theory of radiating electrons, Proc. Roy. Soc. A 167, 148 (1938)
2
A.O. Barut, Electrodynamics and classical theory of elds and particles, Dover NY (1980).
246 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
...
(R · ż)τA = −(ż · ż)τA σ + (ż · z̈)τA σ 2 /2 − (ż · z )τA σ 3 /6 + · · · = −(ż · ż)τA σ + (z̈ · z̈)τA σ 3 /6 + · · · ,
... ...
(R · z̈)τA = (z̈ · ż)τA σ + (z̈ · z̈)τA σ 2 /2 + (z̈ · z )τA σ 3 /6 + · · · = (z̈ · z̈)τA σ 2 /2 − (z̈ · z )τA σ 3 /6 + · · · ,
A orden más bajo el campo retardado en el punto intermedio (z(τ )), queda
1 (żν z̈µ − żµ z̈ν )τA − (żν z̈µ − żµ z̈ν )τB
rad
Fµν ret
= lı́m (Fµν − Fµν
adv
)= lı́m ,
σ→0 (ż · ż)2 σ→0 2σ
x−r
n= , R = |x − r|.
|x − r|
El campo (5.8) tiene tres partes, que como la aceleración a = c2 /R0 se escribe
Figura 5.2: Conos de revolución que representan respectivamente los campos eléctricos ins-
tantáneos durante una vuelta completa de la carga en los puntos del eje OZ de coordenadas
z = 1, 2, 3, 4. En el punto 1 el semiángulo del cono que subtiende la trayectoria de la carga
es α = π/4, y es el ángulo que forma el campo con el vector −a⊥ , en el instante retardado.
Figura 5.3: Campos eléctricos instantáneos durante una vuelta de la carga cuyos vértices
respectivos son los puntos negros de coordenadas (x, y, z), respectivamente de abajo a arriba
(0. 5, 0, 1), (1, 0, 2), (1, 0, 3) y (1, 0, 4).
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 249
Figura 5.4: Campos eléctricos instantáneos durante una vuelta de la carga cuyos vértices
respectivos son los puntos negros de coordenadas (x, y, z), a lo largo de la recta y = 0, z = x,
respectivamente de abajo a arriba (2, 0, 2), (3, 0, 3), (4, 0, 4) y (5, 0, 5).
Figura 5.5: Campos eléctricos instantáneos durante una vuelta de la carga cuyos vértices
respectivos son los puntos negros de coordenadas (x, y, z), a lo largo de la recta y = 0, z = 4,
respectivamente de izquierda a derecha (0, 0, 4) (1, 0, 4), (2, 0, 4), (3, 0, 4) y (4, 0, 4).
250 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
tamaño 1/R en estas unidades. En la gura 5.2 representamos los valores del campo resultante
en cada punto de coordenada z = 1, 2, 3 y 4 durante una vuelta completa de la carga.
En las guras 5.3, 5.4 y 5.5 representamos el campo resultante total en los puntos de
coordenadas que se indican. La intensidad local instantánea va creciendo pero como veremos su
valor medio temporal es radial y decrece con la distancia como 1/r2 , con respecto al origen.
En componentes cartesianas, si es ϕ la fase de la carga en su posición retardada, salvo un
factor global e/R02 , las componentes del campo eléctrico son
Supongamos una carga de prueba en el entorno de nuestro electrón. La frecuencia del zit-
terbewegung es muy alta, del orden de ∼ 1021 s−1 . Si nuestra partícula de prueba se mueve
lentamente, entonces el campo eléctrico detectado en una primera aproximación será una especie
de promedio temporal del campo durante una vuelta completa de la carga.
La expresión general del campo promedio temporal en un punto cualquiera es difícil de
obtener. Para obtener una estimación vamos a calcularlo analíticamente en un punto en la
dirección del espín y en un punto cualquiera de forma numérica. Consideremos que el electrón
está en reposo, es decir su centro de masa se encuentra en el origen del sistema de referencia.
El espín es constante y apunta en la dirección del eje OZ . Vamos a calcular el campo promedio
en un punto P de coordenada z en el eje OZ . En la Figura 5.6, representamos las diferentes
magnitudes en el instante retardado tr , para hacer el cálculo de la ecuación (5.8).
Para ese punto particular de la gura, n · β = 0, y por lo tanto
e e
E= (n × (n × a) − n × (β × a)) = (−a⊥ − β(n · a)) ,
c2 R c2 R
donde el vector a⊥ = a − n(a · n), es la componente de la aceleración perpendicular al vector
unidad n. Para el punto de observación P , la expresión n · a es constante en cualquier punto
retardado, el valor medio temporal de β durante una vuelta completa de la carga es cero, y
el vector a⊥ se reduce a su componente z , a⊥ sin α. Como la aceleración en este sistema de
referencia vale a = c2 /R0 , a⊥ = a cos α y además sin α = R0 /R y cos α = z/R, el campo
eléctrico promedio temporal en el punto P es
ez
E(z) = ẑ, (5.12)
(R02 + z 2 )3/2
donde ẑ es un vector unidad a lo largo del eje OZ . El campo promedio avanzado tiene exac-
tamente la misma expresión. Para la antipartícula hay que cambiar e por −e y la velocidad β
por −β , que en promedio no produce modicación de (5.12).
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 251
Figura 5.6: El campo eléctrico Instantáneo del electrón en el punto P posee una componente
a lo largo de −a⊥ y −β y comprobamos que es perpendicular a n.
Figura 5.7: Campo eléctrico retardado(o avanzado), promedio temporal (5.12) y campo
Coulombiano a lo largo del eje OZ .
requiere el conocimiento preciso de los campos instantáneos, una tarea que está todavía sin
hacer.
Para calcular de forma numérica el campo promedio temporal en un punto arbitrario, con-
sideremos las diferentes magnitudes que aparecen en la Figura 5.8. Vamos a hacer el cálculo en
puntos fuera del plano XOY , por lo que solamente utilizaremos para el cálculo el campo de
aceleración (5.8).
e u
k = R0 [cos ωt, sin ωt, 0] ≡ R0 k, β= = [− sin ωt, cos ωt, 0],
c
du c2 c2
r = [x, y, z], a= = [− cos ωt, − sin ωt, 0] = b,
a
dt R0 R0
e R e
R = r − k = R0 (e
r − k), n= , R = |R| = R0 R.
R
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 253
Vamos a comparar el valor promedio temporal de este campo con el campo Coulombiano ins-
tantáneo producido por una carga puntual en reposo e, en el origen del sistema de referencia
( )
e b
r
E 0 (r) = 2 ,
R0 r2
e +x
N (t) = R(t) e sin ωt − ye cos ωt.
Vamos a calcular el campo promedio en P con respecto al tiempo de observación en ese punto
y durante una vuelta completa de la carga de duración T . Si denimos el tiempo adimensional
τ = ωt, entonces ωT = 2π y por lo tanto
∫ T ∫ T ∫ 2π
1 1 N (t) 1 N (τ )
E(to ) dto = E(t) dt = E(τ ) dτ. (5.14)
T 0 T 0 e
R(t) 2π 0 e )
R(τ
b ) = n(n · a
n × (n × a b) − a
b,
y
1−x
e cos τ − ye sin τ
b) =
n(n · a x − cos τ, ye − sin τ, ze],
[e
Re2
b = [− cos τ, − sin τ, 0],
a
mientras que
1
b) =
n × (β × a y − sin τ, −e
[e x + cos τ, 0],
e
R
y
1 (e )
1−n·β = e sin τ − ye cos τ .
R+x
e
R
Nos interesan medir las componentes radial y transversales del campo, Er = E ·b b,
r , Eθ = E · θ
b
y Eϕ = E · ϕ, respectivamente. Los vectores r b b
b, θ y ϕ son los vectores unidad habituales en
coordenadas esféricas. Si consideramos que el punto de observación P se encuentra en el plano
XOZ , entonces x e = r sin θ, ye = 0 y ze = r cos θ, donde r es la distancia radial al origen en
unidades de R0 .
254 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
Las expresiones nales para las distintas componentes del campo son
e2 − r2 − 1) sin θ cos τ + R
(R e sin θ sin τ + r(1 + sin2 θ cos2 τ )
Er (r, θ, τ ) = ( )3 ,
e + r sin θ sin τ
R
[ ]
e2 − 1) cos τ + R
(R e sin τ + r sin θ cos2 τ cos θ
Eθ (r, θ, τ ) = ( )3 ,
e + r sin θ sin τ
R
e2 − 1) sin τ + R(r
(R e sin θ − cos τ ) + r sin θ sin τ cos τ
Eϕ (r, θ, τ ) = ( )3 ,
e
R + r sin θ sin τ
con √
e=
R r2 − 2r sin θ cos τ + 1.
Para calcular el promedio temporal de estos campos tenemos que realizar la integración (5.14)
e ),
de tal manera que estas expresiones de Er , Eθ y Eϕ , deben ser multiplicadas por N (τ )/R(τ
siendo ahora
N (τ ) = Re + r sin θ sin τ.
El campo eléctrico radial promedio para θ = 0 está ya dibujado en la Figura 5.7, pero lo
hemos recalculado numéricamente en la siguiente Figura 5.9. Vemos el comportamiento Coulom-
biano de la componente radial en las direcciones θ = 0, π/3, π/4, π/6. Para direcciones próximas
al plano XOY , en la región r < 1 el campo promedio temporal cambia de signo, se dirige hacia
el origen, en el que se anula.
Análogamente, en la Figura 5.10 se representa la componente transversal del campo eléctrico
promedio retardado < Eθ (r, θ) > en las mismas direcciones, que vemos que tiende a cero muy
rápidamente. Para θ = π/2, es claro que < Eθ (r, π/2) >= 0. El campo promedio < Eϕ (r, θ) >
se anula por doquier para todo θ ̸= π/2. Sobre el plano θ = π/2 la rutina numérica no funciona.
0.5
0.4
0.3
0.2
0.1
2 4 6 8
Figura 5.9: Promedio temporal de la componente radial < Er (r) > del campo eléctrico
retardado en las direcciones θ = 0, π/3, π/4 y π/6.
3b r · µ) − µ
r (b
B 0 (r) = .
c2 r 3
3
J.D. Jackson, Classical Electrodynamics, John Wiley and Sons, NY 3rd. ed. (1998).
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 255
2 4 6 8
-0.1
-0.2
-0.3
-0.4
-0.5
Figura 5.10: Promedio temporal de la componente transversal < Eθ (r) > del campo eléctrico
retardado en las direcciones θ = 0, π/3, π/4 and π/6. Tiende a cero muy rápidamente. Para
θ = π/2, se anula por doquier.
Para esta corriente, el momento magnético producido por la carga es de valor ecR0 /2 en la
dirección OZ , de tal manera que en unidades de R0 se puede escribir como
( )
e 3b r·z
r (b b) − z
b
B 0 (r) = .
2cR02 re3
e sin τ
r cos τ (1 + sin2 θ) − (1 + r2 ) sin θ − Rr
Bθ (r, θ, τ ) = ( )3 ,
e
R + r sin θ sin τ
Para el cálculo del promedio temporal del campo retardado, tenemos que multiplicar estas
e , como en el caso anterior. La integración numérica se compara con
componentes por N (t)/R(t)
la expresión de las componentes del campo de dipolo (5.15) en las diferentes direcciones.
El campo del dipolo (5.15) va a innito cuando r → 0. En las Figuras 5.11-5.13 comparamos
las componente de B0r (r) con la componente del campo promedio temporal < Br (r, θ) >, para
r > R0 y en las direcciones θ = π/6, π/4 y π/3. Análogamente, en las Figuras 5.14-5.16, las
componentes B0θ (r, θ) y < Bθ (r, θ) >.
Los promedios temporales < Br (r) > y < Bθ (r) > no divergen en el origen sino que
tienen el comportamiento que se describe en las guras 5.17 y 5.18, respectivamente, cuando los
representamos a lo largo de las direcciones θ = 0, π/3, π/4 and π/6, y toman los valores cos θ y
− sin θ respectivamente, en el punto r = 0.
El promedio temporal de la componente transversal < Bϕ (r, θ) > se anula en todas las
direcciones.
256 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
0.03
0.025
0.02
0.015
0.01
0.005
4 5 6 7 8
Figura 5.11: Componentes radiales del campo de dipolo B0r (r) y del campo magnético
promedio temporal retardado < Br (r) >, en la dirección θ = π/6.
0.025
0.02
0.015
0.01
0.005
4 5 6 7 8
Figura 5.12: Componentes radiales del campo de dipolo B0r (r) y del campo magnético
promedio temporal retardado < Br (r) >, en la dirección θ = π/4.
0.02
0.015
0.01
0.005
4 5 6 7 8
Figura 5.13: Componentes radiales del campo de dipolo B0r (r) y del campo magnético
promedio temporal retardado < Br (r) >, en la dirección θ = π/3.
0.008
0.006
0.004
0.002
4 5 6 7 8
Figura 5.14: Componente promedio temporal retardada < Bθ (r) > y componente B0θ (r) del
campo de dipolo, en la dirección θ = π/6.
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 257
0.012
0.01
0.008
0.006
0.004
0.002
4 5 6 7 8
Figura 5.15: Componente promedio temporal retardada < Bθ (r) > y componente B0θ (r) del
campo de dipolo, en la dirección θ = π/4.
0.015
0.0125
0.01
0.0075
0.005
0.0025
4 5 6 7 8
Figura 5.16: Componente promedio temporal retardada < Bθ (r) > y componente B0θ (r) del
campo de dipolo, en la dirección θ = π/3.
1
0.8
0.6
0.4
0.2
1 2 3 4 5 6
Figura 5.17: Componente promedio temporal retardada < Br (r) > en las direcciones θ =
0, π/3, π/4 y π/6 y su comportamiento en r = 0. Para θ = π/2 se anula por doquier.
1 2 3 4 5
-0.2
-0.4
-0.6
-0.8
Figura 5.18: Componente promedio temporal retardada < Bθ (r) > en las direcciones θ =
0, π/3, π/4 y π/6 y su comportamiento en r = 0.
258 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
1.5
0.5
2 4 6 8
Figura 5.19: Componente promedio temporal < Er (r) > del campo eléctrico avanzado, en
las direcciones θ = 0, π/3, π/4 y π/6. No posee un comportamiento Coulombiano como el
campo retardado.
Para terminar esta sección vamos a hacer el mismo cálculo, pero para los campos avanzados
en vez de los retardados.
En este caso, el tiempo de observación y el tiempo del laboratorio están relacionados por
e
to = t − R/c, y por lo tanto dto = (M (t)/R(t))dt e es el mismo de antes, pero
, donde R(t)
e −x
M (t) = R(t) e sin ωt + ye cos ωt.
Si representamos en la gura 5.19, el promedio temporal del campo eléctrico radial avanzado, en
las mismas direcciones que el de la Figura 5.9, vemos un comportamiento diferente de estas com-
ponentes avanzadas, y aunque el campo decrece a largas distancias, no tiene un comportamiento
Coulombiano.
Energía electromagnética
Si calculamos la energía electromagnética asociada al campo en el instante to , como B =
n × E/c, resulta que la densidad de energía
1 1 2 1
h(to ) = ϵ0 E 2 + B = ϵ0 E 2 − ϵ0 (n · E)2 ,
2 2µ0 2
El valor del campo, debe ser evaluado a partir de la localización de la carga en el correspondiente
tiempo retardado tr , con to = tr + R/c.
Como hemos analizado en el teorema de Gauss, es necesario considerar los dos campos,
aunque el E β se anula salvo en los puntos singulares del plano XOY cuando β → 1. Como
E = Eβ + Ea,
E 2 = Eβ2 + Ea2 + 2E β · E a .
Como
e(1 − β 2 )
Eβ = (n − β) ,
R2 (1 − n · β)3
e
Ea = n × ((n − β) × a) .
Rc (1 − n · β)3
2
5.1. ESTRUCTURA DEL ELECTRÓN CON ESPÍN 259
e2 (1 − β 2 )2 (1 + β 2 − 2β (−e e
x sin ωt + ye cos ωt) /R)
Eβ2 = . (5.16)
4
R0 Re4 (1 − n · β)6
La parte de E 2a ,
e2 2β 2 (1 − β 2 )(β 2 − n · β) (1 − x
e cos ωt − ye sin ωt)
2E β · E a = . (5.18)
4
R0 e
R (1 − n · β)6
4
1 e2 (1 − β 2 )2 (1 − n · β)2
− (n · E)2 = − 4 , (5.19)
2 R0 2R e4 (1 − n · β)6
h(x, y, z, to ) =,
260 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
y la energía ∫
ϵ0 e2 R03
E(to ) = h(x, y, z, to )dVe
(4πϵ0 )2 R04 R3
4πϵ0 hc
e2 = .
M
Una partícula cuya estructura fuera puramente electromagnética, tendría un único valor de
la carga eléctrica salvo un signo, lo que correspondería a que electrones, muones y partículas
tau, y sus correspondientes antipartículas, que solamente interaccionan de forma electro-débil,
poseerían la misma carga eléctrica, independientemente de su masa. En el caso de un quark, no
toda la estructura es puramente electromagnética, ya que también interacciona de forma fuerte,
por lo que en la ecuación (5.20) implicaría una energía electromagnética fracción k de su energía
total en reposo mc2 , con lo que
4πϵ0 hc
e2 = k , k < 1.
M
Los quarks tendrían una carga eléctrica, independiente de su masa, y menor que la de los objetos
que solamente interaccionan de forma electrodébil. De hecho la teoría nos debería llevar a que
k = 1/9 o bien 4/9 para los quarks down y up, respectivamente.
El valor de la energía debe ser independiente del tiempo de observación to , ya que el mo-
vimiento de la carga es estacionario, por lo que también debe coincidir con su valor medio
temporal, ∫ ∫ ∫ T
1 T ϵ0
E= E(to )dto = dV E 2 dto ,
T 0 T R3 0
para cualquier valor de T , en particular para el período de una vuelta completa.
va multiplicada por E 2 , que es la suma de los tres términos (5.16), (5.17) y (5.18) y por ϵ0 /c.
La parte r × E = r × E β + r × E a , por lo que tenemos dos términos
R0
(r × (n − β))z = y cos ωt − x
(e e sin ωt) − βx cos ωt − βy sin ωt,
Re
(r × a)z = β 2 c2 (e
y cos ωt − x
e sin ωt),
los cuales aparecen multiplicados por
e(1 − β 2 )
n · Eβ = .
R2 (1 − n · β)2
x = R sin λ cos ϕ+cos R, y = R sin λ sin ϕ−sin R, z = R cos λ, R ∈ [0, ∞], λ ∈ [0, π] ϕ ∈ [0, 2π].
El Jacobiano de la transformación es
yR=R e.
La integral que da lugar al valor M , queda en el límite β → 1
∫ ∞ ∫ π ∫ 2π
8 sin λ
M= dR dλ dϕ ,
0 0 0 (2 − cos(R − λ + ϕ) + cos(R + λ + ϕ))3
262 CAPÍTULO 5. ESTRUCTURA ELECTROMAGNÉTICA DEL ELECTRÓN
espín
P.A. Moldauer and K.M. Case, Phys. Rev. 102, 279 (1956)
5
263
264 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
donde k = r − q , es decir con una relación giromagnética normal g = 1. Si el electrón tiene una
relación giromagnética g = 2, esto implica que debe existir otra parte del espín proviniente de
la velocidad angular, pero que no produzca contribución al momento magnético.
De aquí resulta que, para el electrón, ambas partes W y Z contribuyen al espín total. La
parte W está relacionada con las variables angulares que describen la orientación del electrón y
que no contribuye a la separación k entre el centro de masa y el centro de carga. Si el momento
magnético está relacionado con este movimiento por la fórmula (6.4), está relacionado con la
parte Z pero no con el espín total S . Es precisamente cuando tratamos de expresarlo en términos
del espín total cuando surge el concepto de relación giromagnética.
Supongamos ahora que las dos partes Z y W contribuyen al espín total S con sus valores
cuánticos no nulos, más bajos y que además deben ser únicos, ya que al no poseer estados
excitados, una partícula elemental solamente posee unos valores jos de sus propiedades. Para
partículas de Dirac hemos encontrado que el espín total es s = 1/2 y que las dos partes tienen
orientaciones opuestas, teniendo el espín S la misma orientación que la parte Z . La parte orbital
no puede tener un momento angular nulo porque el movimiento del centro de carga no pasa por
el centro de masa, y su valor no nulo más bajo es desde el punto de vista cuántico, z = 1 y para
la parte rotativa w = 1/2 en sentido contrario. Al expresar el momento magnético en términos
del espín total, como resulta que Z = 2S , es donde nos aparece que g = 2.
El valor experimental de g para leptones es
hasta el mayor número de cifras decimales vericadas. Vemos que es superior al valor teórico
predicho por la ecuación de Dirac g = 2. La razón estriba en que una cosa es la predicción
del modelo libre y otra la medida. Cuando medimos debemos interaccionar con la partícula
y la interacción modica la cinemática. Al introducir la partícula en un campo magnético, el
movimiento del centro de carga se modica, y como básicamente el momento magnético es
la intensidad de la corriente asociada a la carga multiplicada por el área encerrada por su
trayectoria, y ésta se modica, el valor del momento magnético medido no es el predicho y
dependerá de la intensidad del campo magnético utilizado.
Hay una corrección cuántica radiativa que es independiente del campo magnético, y que
fue determinada por Schwinger (1948), que toma el valor α/π = 0.0023228, en términos de la
constante de estructura na, de tal manera que el valor experimental resulta ser
α
g =2+ + g(B),
π
e e
µp = gp S, gp = 5,585694, µn = gn S, gn = −3,826085,
2mp 2mp
donde mp es la masa del protón. A pesar de ser dos partículas de espín 1/2 no satisfacen la ecua-
ción de Dirac, ya que ésta predice que el correspondiente objeto cuántico debe necesariamente
ser de relación giromagnética g = 2. Protones y neutrones no son partículas elementales, y es
el movimiento de los quarks cargados el que suministra el momento magnético de los mismos.
Esto es más claro en el neutrón que al ser de carga total cero, posee sin embargo momento
magnético.
266 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
De Broglie en su tesis 10 postula que: Toda porción de materia aislada posee un movimiento
periódico de naturaleza sin precisar, cuya frecuencia viene dada por ν = mc2 /h. Dirac sin
embargo encuentra que la posible frecuencia asociada al movimiento del punto r en el caso del
electrón, es el doble que la que le asocia De Broglie. Esta frecuencia es la del movimiento a la
velocidad de la luz del centro de carga alrededor del centro de masa en el análisis clásico y que
describe un objeto de espín 1/2 al ser cuantizado y que además satisface la ecuación de Dirac.
Este modelo se describe en la gura de la portada para el observador del centro de masa. El
centro de carga efectúa un movimiento circular a la velocidad de la luz, de radio R = ~/2mc y
frecuencia ν0 = 2mc2 /h, en este sistema de referencia.
Si efectivamente el electrón tuviera un movimiento interno periódico del estilo que hemos
mencionado, al desplazarse con velocidad constante obtendríamos una trayectoria del centro de
carga que poseería también una periodicidad espacial. Se podría hablar de su longitud de onda
como el valor de su período espacial, o bien la longitud que su centro de masa recorre durante
una vuelta de su centro de carga. Pero la periodicidad temporal depende de la velocidad de su
centro de masa. En efecto, supongamos que vemos moverse al centro de masa con velocidad v
como se indica en la gura 6.1. Como √ el centro de carga se sigue moviendo a la velocidad de
la luz, su velocidad transversal u⊥ = c2 − v 2 , por lo que un electrón en movimiento tarda
más tiempo en completar una vuelta, el reloj del electrón en movimiento va más despacio. Si
llamamos T0 = 2πR/c al tiempo que tarda en dar una vuelta para el observador del centro
de masa, entonces para el que lo ve moverse con la velocidad v tarda T = 2πR/u⊥ = γ(v)T0 ,
siendo γ(v) = (1 − v 2 /c2 )−1/2 .
Si lanzamos un haz de electrones con una velocidad de su centro de masa v a través de un
cristal, por ejemplo de Silicio, y la velocidad es la adecuada de tal manera que la periodicidad
espacial del haz λ = vT y la periodicidad espacial de la red, d = 3,84Å para el Si, sean
comensurables, esto es, o bien d = kλ, o bien λ = nd, con k y n sendos enteros, entonces puede
tener lugar una dispersión resonante con los átomos. Si en la interacción de cada electrón con un
átomo de la red, recibe un impulso transversal ∆p y un impulso longitudinal despreciable frente
a p, cuando haya atravesado una longitud que contenga N átomos y d y λ sean conmensurables,
el impulso transversal total recibido será N ∆p. Por lo tanto este electrón se desviará un ángulo
del orden de N ∆p/p. Si, como proponen y realizan Gouanére et al.11 , medimos la intensidad del
haz que atraviesa el cristal en la propia dirección de incidencia, existirán unos momentos lineales
para los que se detectará una disminución de esta intensidad, debido a la dispersión resonante
transversal. Si d y λ no son conmensurables, la interacción del electrón con cada átomo puede
recibir impulsos laterales ∆p en ambos sentidos y el haz no se desvía.
En la gura 6.2 tenemos un cristal de Silicio. En la gura 6.3 se representa el movimiento
de dos electrones polarizados longitudinalmente y transversalmente con respecto al movimiento
de su centro de masa. Se compara esta descripción con la red de átomos de silicio con los que
va a interaccionar.
Cuando d = kλ, el electrón interacciona con cada átomo que se encuentra en su camino,
mientras que en el caso λ = nd, sufrirá una interacción resonante cada n átomos. Una mayor λ
implica también un mayor momento lineal, y por lo tanto el ángulo de dispersión será menor.
10
L. de Broglie, Thèse de doctorat (1924). Sommaire: . . . nous admettons dans le présent travail l'existence
d'un phénomène periodique d'une nature encore à préciser qui serait lié à tout morceau isolé d'énergie et qui
dépendrait de sa masse propre par l'équation de Planck-Einstein.
11
M Gouanère, M. Spighel, N. Cue, MJ. Gaillard, R. Genre, R. Kirsch,JC. Poizat, J. Remillieux, P. Catillon
and L. Roussel Found. Phys. 38, 659, (2008) y en Annales Fondation Louis de Broglie 30, 109 (2005).
6.2. EL RELOJ DEL ELECTRÓN 267
Figura 6.1: Movimiento del centro de masa con velocidad v y movimiento helicoidal a la velocidad
de la luz del centro de carga de un electrón libre. Se representan los dos momentos angulares S
y S CM , que muestran que S CM es conservado, mientras que √ S precesa alrededor del momento
lineal. La velocidad transversal del centro de carga u⊥ = c2 − v2 , por lo que tarda más en dar
una vuelta. El reloj del electrón móvil va más despacio.
Figura 6.3: En la izquierda de la gura se representa la red de átomos de silicio, cuyos núcleos
están separados una distancia d = 3,84Å. A la derecha tenemos la proyección sobre el plano XOY
de los movimientos del centro de carga de dos electrones polarizados, (a) longitudinalmente y
(b) transversalmente, al movimiento de su centro de masa. En rojo aparece la correspondiente
trayectoria de su centro de masa. Ambas descripciones no están a la misma escala que la red de
átomos de Si. λC = 2R ∼ 10−13 m es la oscilación transversal del centro de carga, y λ = vT es lo que
recorre el centro de masa durante una vuelta de la carga.
Como
kγ(v)v kmγ(v)v kp
d = kλ = kvT = kγ(v)vT0 = = =
ν0 mν0 mν0
existirán unos momentos lineales resonantes
mν0 d 161,748
pDk = = MeV/c, k = 1, 2, . . . (frecuencia de Dirac)
k k
para los que se detectará una disminución en la intensidad del haz de salida en la dirección
frontal. En el mencionado experimento de Gouanére et al., utilizaron un detector situado a 3 m
del cristal de silicio con una ventana de 3 × 3 mm, por lo que los electrones desviados un ángulo
superior a 0.001 rad no se detectaban. Pretendían medir la frecuencia de De Broglie que es la
mitad que la de Dirac, para la que los momentos lineales resonantes satisfacen
mν0 d 80,874
pBk = = MeV/c, k = 1, 2, . . . (frecuencia de De Broglie)
k k
por lo que establecieron en el experimento el rango de su momento lineal entre 54 y 110 MeV/c,
es decir 80 ± 30 MeV/c, alrededor de la primera frecuencia resonante p1 . Lo que obtuvieron
fue un pico resonante para el valor de p =81.1 MeV/c en vez del valor esperado de p =80.874
MeV/c, (ver gura 6.6) que es el correspondiente a k = 2 para el caso de que la frecuencia del
electrón fuera la de nuestro modelo. En este caso, el pico resonante correspondiente a k = 3,
de un momento lineal p3 =53.916 MeV/c está muy próximo al límite inferior de la energía del
experimento y podría haber sido detectado si hubieran ampliado el rango.
Si el reloj del electrón tuviera la frecuencia de De Broglie ν0 = mc2 /h, entonces los picos
resonantes que se obtendrían son los de la gura 6.4, mientras que en el supuesto de que la
frecuencia fuera la de Dirac y del modelo que presentamos, que es el doble que la de De Broglie,
se obtendrían los picos de la gura 6.5. Todos los picos inferiores asociados a la frecuencia de
6.2. EL RELOJ DEL ELECTRÓN 269
Figura 6.4: Diferentes picos de la dispersión resonante del haz de electrones en el supuesto de
que la frecuencia interna del movimiento del centro de carga fuera la de De Broglie ν0 = mc2 /h.
Figura 6.5: Diferentes picos de la dispersión resonante del haz de electrones en el supuesto de que
la frecuencia interna fuera el doble que la de De Broglie ν0 = 2mc2 /h. Los picos correspondientes
a p3 , p5 . . ., no aparecen en el caso anterior.
270 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
Figura 6.6: La línea de puntos es la medida del número de electrones detectados después de
atravesar el cristal de Si, en el experimento realizado por Gouanère et al. (a) La línea azul
representa el análisis numérico realizado por el método de Montecarlo, en el supuesto de que la
frecuencia interna fuera la de De Broglie ν0 . (b) La curva de color rojo por su parte, representa
el análisis numérico realizado por el método de Montecarlo, en el supuesto de que la frecuencia
interna fuera la de Dirac, el doble que la de De Broglie 2ν0 . El resultado experimental es más
consistente con este análisis a frecuencia doble, solo que el pico aparece un poco desplazado hacia
la derecha. Este desplazamiento de la energía de resonancia podría estar ligado con la temperatura
de la muestra, y por lo tanto con una pequeña dilatación del parámetro d de la red.
Figura 6.7: Movimiento de la carga del electrón en el sistema de referencia del C.M.
Desde el punto de vista del observador del centro de masa, la partícula se comporta como si
tuviera un momento magnético producido por la corriente asociada a la carga y expresado por
la expresión clásica habitual
∫
1 e dk e dk e
µ= k × j d3 r = k × = k×m =− Z,
2 2 dt 2m dt 2m
e~ ie~
Σ·B+ α · E = −µ · B − d · E, (6.7)
2m 2mc
donde ( )
σ 0
Σ= , y α = γ0 γ,
0 σ
se expresa en términos de las matrices σ de Pauli y α es la matriz de Dirac que nos produce el
operador velocidad.
Demostraremos que la versión cuántica de la expresión (6.6) es en efecto el dipolo eléctrico
de Dirac (6.7).
La dicultad de relacionar la expresión clásica del momento dipolar con su versión cuántica
consiste en interpretar adecuadamente cómo se expresa el producto vectorial de (6.6) que fue
introducido por J. Willard Gibbs en 1884, en términos de las matrices de Dirac o en términos
12
P.A.M. Dirac, Proc. Roy. Soc. London, A117, 610 (1928).
272 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
del producto matricial (o geométrico) de los elementos del álgebra de Dirac. Vamos a ver que
como el álgebra de Dirac es un álgebra de Cliord dicho producto vectorial se va a interpretar
en términos del producto interior y exterior de este álgebra.
El operador velocidad u = cα y el operador espín S son bivectores del álgebra de Di-
rac considerados como elementos del álgebra geométrica del espacio-tiempo, en el sentido de
Hestenes 13 .
De hecho las matrices alfa de Dirac se escriben como productos de pares de matrices gamma
αi = γ0 γi y lo mismo las componentes del espín Sj = (i~/2) γk γl , j, k, l cíclico 1, 2, 3. Este
álgebra geométrica está generada por las cuatro matrices γ µ de Dirac, µ = 0, 1, 2, 3 que se
interpretan como los cuatro vectores base del espacio-tiempo de Minkowski. Satisfacen la regla
γµ · γν = ηµν , es decir, γ02 = 1 y las γi2 = −1, donde el punto representa el producto interior
en el álgebra de Cliord. Vemos por lo tanto que tanto la velocidad como el espín pertenecen
a la subálgebra par, o álgebra de Pauli del espacio tridimensional. Bajo inversiones espaciales
γ0 → γ0 y γi → −γi , por lo que el operador velocidad cambia de signo, por lo que es un vector
espacial, pero no así el espín, que es invariante y por lo tanto es y corresponde a un bivector
espacial o pseudovector.
Figura 6.8: Base para los vectores (a) y bivectores (pseudovectores) (b) del álgebra de Pauli.
La luz polarizada circular corresponde a un haz de fotones en el que todos los fotones tienen
su espín orientado, bien hacia adelante o bien hacia atrás 14 . En la interacción de una onda
electromagnética plana con un electrón puntual en reposo (ver Sec.??) vemos que el electrón sale
dispersado siempre hacia adelante, formando un cierto ángulo con la dirección del movimiento
de la onda. La onda le comunica un momento lineal que tiene una parte en la dirección de
propagación de la onda. Si, como se interpreta habitualmente, la dirección de propagación de
la onda electromagnética corresponde con la dirección del movimiento de los fotones del haz,
podemos intentar hacer el análisis relativista de la interacción corpuscular entre un fotón y un
electrón, considerados como partículas puntuales. Lo planteó Arthur H. Compton en 1923.
En efecto, supongamos un electrón en reposo y un fotón incidente a lo largo del eje OZ de
momento lineal p y energía H = pc = hf . Después de la colisión, el fotón sale con un momento
lineal p′ formando un ángulo α con la dirección de incidencia y el electrón lo hace con un
momento lineal de valor k en la dirección β , como se indica en la gura. La conservación del
14
R. A. Beth, Mechanical Detection and Measurement of the Angular Momentum of Light, Phys. Rev. 50,
115 (1936).
274 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
un sistema de tres ecuaciones con cuatro incógnitas, α, β, p′ , k , que no posee solución única,
pero que jada la dirección de salida del fotón α, nos brinda una solución única para p′ , k y β .
Como k = p − p′ ,
1 ( )
k 2 = p2 + p′ − 2p · p′ = 2 H 2 + H ′ − 2HH ′ cos α
2 2
c
sustituyendo esto en √
c(p − p′ ) + mc2 = m2 c4 + c2 k 2
y elevando al cuadrado, llegamos a
1 1 1 − cos α
mc3 (p − p′ ) = mc2 (H − H ′ ) = HH ′ (1 − cos α), ′
− =
H H mc2
y para las frecuencias de los fotones involucrados en la dispersión
1 1 h
− = (1 − cos α) (6.11)
f′ f mc2
y para las longitudes de onda
h
λ′ − λ = λC (1 − cos α), λC = = 2,426 · 10−12 m,
mc
donde a λC se le denomina la longitud de onda Compton del electrón. En los modelos de
electrón con espín, la separación entre el centro de carga y el centro de masa es R0 = ~/2mc =
1.93·10−13 m.
La variación de la energía del fotón dispersado en términos del ángulo de dispersión viene
dada por
hf 1
hf ′ = = hf A(α), A(α) = ,
hf 1 + q(1 − cos α)
1+ (1 − cos α)
mc2
siendo q = p/mc y que se representa en la gura:
f¢
f
1.0
0.8
0.6
0.4
Α
0.5 1.0 1.5 2.0 2.5 3.0
En esta gura, cuando α = π , el fotón sale hacia atrás, f ′ /f = 0.2, lo que corresponde a
haber utilizado fotones de energía hf = 2mc2 ≈ 1 MeV, el doble de la energía en reposo del
electrón.
6.4. EFECTO COMPTON 275
k
p
1.2
1.0
0.8
0.6
0.4
0.2
Α
0.5 1.0 1.5 2.0 2.5 3.0
Figura 6.10: Variación con α del momento lineal k del electrón saliente.
0.8
0.6
0.4
0.2
Α
0.5 1.0 1.5 2.0 2.5 3.0
Figura 6.11: Variación del ángulo de dispersión β del electrón saliente en términos del
ángulo de dispersión del fotón, en el caso H ≈ 1MeV = 2mc2 .
sin β ≈ 1, el electrón sale prácticamente a 90◦ del fotón incidente. Solamente sale hacia adelante
sin β = 0 cuando el fotón dispersado tiene la dirección opuesta al incidente. Para α ≈ π/2,
sin β ≈ 0.3 y 0.62, respectivamente.
8sin Β<
1.0
0.8
0.6
0.4
0.2
Α
0.5 1.0 1.5 2.0 2.5 3.0
Figura 6.12: Variación del ángulo de dispersión β del electrón saliente en términos del ángulo
de dispersión del fotón, en el caso de un fotón incidente de energía 5 eV, H ≈ 10−5 mc2 .
sin2 θ′ = (Z2 /S)2 sin2 α − 2(Z2 /S) sin α sin θ cos ϕ + sin2 θ.
sumándolos, obtenemos una ecuación con una sola incógnita, α, el ángulo de salida del fotón:
Si Z1 y Z2 tienen la misma orientación con respecto al momento lineal del fotón, Z1 /Z2 = +1,
y en términos del ángulo mitad, nos da
Z1 /S + cos θ
cot(α/2) = , Z1 /Z2 = +1,
sin θ cos ϕ
Z1 /S + cos θ
tan(α/2) = − , Z1 /Z2 = −1.
sin θ cos ϕ
√
Como cot(z/2) = (1 + cos z)/(1 − cos z) = 1/ tan(z/2), resulta
1.0 0.5
√
Figura 6.13: Variación del cos α en el caso de que Z1 /Z2 = 1, Z1 /S = 2/ 3 y Z1 /Z2 = −1,
respectivamente.
el cos α alcanza sus máximos y mínimos, basta con derivar con respecto a θ y ϕ la expresión
(6.14), igualarlas a cero, lo que nos lleva al sistema de ecuaciones
sin θ cos2 ϕ(Z1 /S + cos θ)(1 + Z1 /S cos θ) = 0,sin2 θ sin 2ϕ(Z1 /S + cos θ) = 0,
√
de tal manera que el mínimo se alcanza para cos θ = −S/Z1 = − 3/2, θ = 5π/6, ϕ = 0, π ,
resultando cos α = −1/2. Para este valor el fotón dispersado sale en la dirección α = 2π/3,
ó 120◦ , que es la dirección de retroceso mayor que puede alcanzar un fotón. Cualquier otra
dirección de retroceso mayor implicaría que el electrón se estuviera moviendo hacia el fotón.
Para ϕ = π , la variación de cos α con θ de (6.14) es la de la gura
COS Α
1.0
0.8
0.6
0.4
0.2
8Q<
0.5 1.0 1.5 2.0 2.5 3.0
-0.2
-0.4
Si Z1 está orientado hacia atrás, entonces se alcanza esta√misma dirección máxima de salida,
pero el espín del electrón debe tener la orientación cos θ = 3/2, θ = π/6, ϕ = 0, π .
En el primer caso, si θ = 0, o aproximadamente tome ese valor, cualesquiera que sea ϕ,
resulta α = 0 y el fotón no es desviado. Lo mismo sucede en el segundo caso si θ = π . Los
electrones polarizados en la dirección del movimiento de los fotones resultan ser invisibles.
278 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
8cos Α<
1.0
0.9
0.8
0.7
0.6
Q
0.5 1.0 1.5 2.0 2.5 3.0
Figura 6.14: Si Z1 /S = 2, la variación del coseno de α con la orientación del espín nos lleva
para ϕ = π a que el fotón dispersado solamente lo sería dentro de un ángulo de valor ±60◦
con respecto a la dirección de incidencia.
8cos Α<
1.0
0.8
0.6
0.4
0.2
Φ
1 2 3 4 5 6
-0.2
-0.4
Figura 6.15: Variación de cos α con ϕ, para el valor de θ = 5π/6 en el primer caso, o bien
θ = π/6 en el segundo.
6.4. EFECTO COMPTON 279
Hemos tomado como plano ZOX el plano que contiene a los fotones inicial y dispersado, y en
este plano el ángulo de dispersión α viene determinado por la orientación del espín del electrón
(θ, ϕ). Recíprocamente, si lo que controlamos es la orientación del espín del electrón entonces el
plano de dispersión viene rotado un ángulo −ϕ, arbitrario, en el que el fotón dispersado forma
un ángulo α con la dirección inicial. O lo que es lo mismo, si en el laboratorio controlamos θ,
la orientación del fotón dispersado es (α, −ϕ) con respecto al plano que subtienden la dirección
del fotón incidente y la dirección del espín del electrón.
Si la dispersión no es con electrones libres, sino con electrones formando parte de átomos,
la interacción puede elevar a los átomos a estados excitados y el problema es diferente. Por ser
el electrón una partícula elemental, no es posible modicar el valor absoluto de su espín, que es
lo que hemos considerado en este análisis.
Experimentalmente se encuentran fotones que salen a 150◦ y más con respecto a la dirección
de incidencia, cuando según este análisis lo más atrás que podrían salir es hasta un ángulo
de 120◦ . En todo este cálculo hemos supuesto un electrón estrictamente puntual, y este hecho
experimental invalida esta parte del cálculo, lo que hace que se contemple que el electrón tenga
algún tipo de estructura. Sin embargo, si el electrón tiene estructura en la que su centro de carga
y centro de masa son puntos distintos y además, el fotón colisiona con el centro de carga del
electrón, hay que rehacer todos estos cálculos porque además de la ley de conservación anterior
hay que tener en cuenta el momento angular del electrón móvil con respecto a su centro de
carga.
Vamos a suponer que la interacción del fotón puntual lo es con el centro de carga del electrón
situado en el instante de la interacción en el origen del sistema de referencia, de acuerdo con
el esquema de la gura: La dirección del fotón incidente lo es a lo largo del eje OZ , el fotón
dispersado está en el plano XOZ formando un ángulo α con OZ y el espín del electrón en
reposo S posee la orientación habitual θ y ϕ. El electrón dispersado posee un momento lineal
k contenido también el el plano XOZ y que forma un ángulo β con OZ .
En la gura distinguimos la estructura del electrón en el sentido de que su centro de masa
y su centro de carga son puntos diferentes. El vector r representa la posición relativa del centro
de carga con respecto al centro de masa. Vamos a llamar ψ a la fase del movimiento del centro
280 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
Antes de la colisión, el momento angular del sistema con respecto al centro de carga, es decir
con respecto al origen, vale la suma de los espines de ambas partículas, ya que el electrón se
encuentra en reposo, J 1 = Z 1 + S que por componentes se expresa:
S sin θ cos ϕ
J 1 = S sin θ sin ϕ
Z1 + S cos θ
Después de la colisión, el fotón posee un espín Z 2 y el electrón posee su espín orientado los
ángulos θ′ y ϕ′ , y además un momento lineal k. El momento angular con respecto al centro de
carga después de la colisión es
− sin β
J 2 = Z 2 + S ′ − r × k, k = k 0 ,
cos β
S′ = J 1 − Z2 + r × k
S sin θ′ cos ϕ′ = S sin θ cos ϕ − Z2 sin α + R0 k (cos θ sin ϕ cos ψ + cos ϕ sin ψ) cos β,
S sin θ′ sin ϕ′ = S sin θ sin ϕ + R0 k (sin θ cos ψ sin β − (cos θ cos ϕ cos ψ − sin ϕ sin ψ) cos β) ,
S cos θ′ = Z1 + S cos θ − Z2 cos α + R0 k (cos θ sin ϕ cos ψ + cos ϕ sin ψ) sin β.
Si denimos las magnitudes a = Z1 /S , b = Z2 /S y R = R0 k/S , las ecuaciones quedan:
sin θ′ cos ϕ′ = sin θ cos ϕ − b sin α + R (cos θ sin ϕ cos ψ + cos ϕ sin ψ) cos β
sin θ′ sin ϕ′ = sin θ sin ϕ + R (sin θ cos ψ sin β − (cos θ cos ϕ cos ψ − sin ϕ sin ψ) cos β)
cos θ′ = a + cos θ − b cos α + R (cos θ sin ϕ cos ψ + cos ϕ sin ψ) sin β.
6.5. EFECTO TÚNEL CLÁSICO 281
Aquí tenemos que sustituir el sin β y cos β en términos de A(α) y como R0 = S/mc, el
coeciente
R0 k √
R= = q 1 + A(α)2 − 2A(α) cos α,
S
con q = p/mc, con lo que los términos
Las ecuaciones nales para obtener la orientación nal del espín del electrón son
sin θ′ cos ϕ′ = sin θ cos ϕ − b sin α + q(cos θ sin ϕ cos ψ + cos ϕ sin ψ)(1 − A(α) cos α),
sin θ′ sin ϕ′ = sin θ sin ϕ+q (A(α) sin θ cos ψ sin α − (cos θ cos ϕ cos ψ − sin ϕ sin ψ)(1 − A(α) cos α)) ,
cos θ′ = a + cos θ − b cos α + qA(α)(cos θ sin ϕ cos ψ + cos ϕ sin ψ) sin α.
Si tomamos la fase ψ = 0, en el instante en el que el fotón alcanza al centro de carga del electrón,
las anteriores ecuaciones se simplican:
sin θ′ cos ϕ′ = sin θ cos ϕ − b sin α + q cos θ sin ϕ(1 − A(α) cos α), (6.18)
′ ′
sin θ sin ϕ = sin θ sin ϕ + q (A(α) sin θ sin α − cos θ cos ϕ(1 − A(α) cos α)) , (6.19)
′
cos θ = a + cos θ − b cos α + qA(α) cos θ sin ϕ sin α. (6.20)
Son tres ecuaciones extra que junto con las tres (6.10) nos suministran un sistema de seis
ecuaciones para determinar α, β, p′ , k, θ′ y ϕ′ , conocida la orientación inicial del espín del electrón
θ, ϕ.
Controlando la orientación inicial del espín del electrón, es decir los valores θ y ϕ, quedaría
determinada la dirección α y energía p′ de los fotones dispersados, por lo que dispondríamos de
un sintonizador no de las frecuencias de los fotones dispersados, que emergerían en un cono de
semiángulo α alrededor del centro de dispersión, sin más que someter a la muestra de electrones
libres (por ejemplo electrones dentro de una jaula de Penning) a un campo magnético externo.
Figura 6.17: Haz de electrones sobre una barrera de potencial. Un electrón puntual sin
espín con Va < V0 no puede pasar de la línea de puntos. Un electrón con espín, polarizado
transversalmente, y de la misma energía, puede cruzar la barrera.
6.5. EFECTO TÚNEL CLÁSICO 283
Potenciales de este tipo se pueden construir como en el experimento que se indica en la gura
6.17, en el cual un haz de electrones, que ha sido acelerado con un potencial de aceleración Va ,
se lanza sobre la región del campo, de potencial V0 contenido entre las placas A, C y B .
En la Figura 6.17, desde un punto de vista clásico, un electrón puntual sin espín (el centro de
carga y el centro de masa son el mismo punto) se detiene en la línea de puntos y la fuerza hacia
la izquierda lo expulsa. Pero un electrón con espín de naturaleza (anti)orbital puede cruzar la
barrera, si está polarizado perpendicularmente al campo y si su energía cinética es mayor que
un cierto valor mínimo, que está por debajo del máximo del potencial. Este potencial mínimo
depende de la separación entre placas.
Supongamos una partícula polarizada con el espín hacia arriba o hacia abajo, en la dirección
OZ . El movimiento de la carga tiene lugar en el plano XOY . Sean qx , qy qz = 0, las coordenadas
del centro de masa y x, y and z = 0, las del centro de carga.
Las ecuaciones dinámicas son
d2 qx 1 d 2 qy
2
= F (x), = 0, (6.22)
dt m dt2
d2 x d2 y
+ ω 2 (x − qx ) = 0, + ω 2 (y − qy ) = 0, (6.23)
dt2 dt2
donde
−eV0 /a, para x ∈ (−a, 0),
F (x) = eV0 /b, para x ∈ (0, b),
0, en los demás casos.
Las ecuaciones (6.22) son no lineales y no hemos encontrado de ellas una solución analítica.
Vamos a hacer el cálculo de forma numérica. Vamos a denir diferentes variables adimensionales.
Sea R el radio del movimiento interno. Entonces denimos
d2 q̂x d2 q̂y
= A(x̂), = 0,
dα2 dα2
d2 x̂ d2 ŷ
+ x̂ − q̂x = 0, + ŷ − q̂y = 0,
dα2 dα2
donde A(x̂) es
−eV0 /âmω R , para x̂ ∈ (−â, 0),
2 2
entonces el centro de masa se mueve en línea recta a lo largo del eje OX . El sistema anterior
se reduce al análisis de un sistema unidimensional, donde las únicas incógnitas son q̂x y x̂.
284 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
Denominemos a estas variables por q y x, quitando todos los sombreros de las demás variables.
Las ecuaciones a resolver quedan:
d2 q d2 x
= A(x), + x − q = 0, (6.24)
dα2 dα2
donde A(x) es
−1,9569 × 10−6 a−1 V0 , para x ∈ (−a, 0),
A(x) = 1,9569 × 10−6 b−1 V0 , para x ∈ (0, b), (6.25)
0, en los demás casos.
La integración numérica ha sido hecha con el programa Dynamics Solver 15 , y debido a que
las ecuaciones son adimensionales, las energías quedan reescaladas tomando la máxima energía
potencial de valor 1.
Figura 6.20: Dos barreras de potencial cuyas energías mínimas de cruce son aproximada-
mente las mismas. Para la de la derecha, siempre que las regiones de variación del potencial
a y b sean las mismas, cualesquiera que sea el espesor intermedio c, la energía de cruce es
la misma.
286 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
cinemáticas, ψ(t, r, u). Los generadores del grupo de Galileo en esta representación son
∂
H = i~ , P = −i~∇, K = mr − tP + i~∇u , J = r × P + Z, (6.26)
∂t
donde ∇u es el operador gradiente con respecto a las variables u. Estos generadores satisfacen
las reglas de conmutación del grupo de Galileo extendido 16 , y el operador espín está dado por
Z = −i~u × ∇u .
Uno de los operadores de Casimir del grupo de Galileo extendido es la energía interna E , que
en presencia de un campo electromagnético externo y con un acoplamiento mínimo se escribe
como la diferencia entre la energía mecánica H − eV menos la energía cinética
1
E = H − eV − (P − eA)2 , (6.27)
2m
donde V y A son los potenciales escalar y vectorial externos y donde P − eA es el momento
lineal mecánico.
En este caso no hay campo magnético, A = 0, y V es únicamente función de x. Podemos
buscar soluciones del siguiente conjunto completo de observables que conmutan: El operador de
Casimir (6.27), H , Py , Pz , Z 2 y Zz . La partícula se mueve a lo largo del eje OX , con el espín
en la dirección OZ , por lo que podemos buscar soluciones que sean funciones propias de los
operadores anteriores, en la forma:
( )
1 2
H − eV (x) − P ψ = Eψ, Hψ = Eψ, Py ψ = 0, Pz ψ = 0, (6.28)
2m
Z 2 ψ = s(s + 1)~2 ψ, Zz ψ = ±s~ψ. (6.29)
Vemos que ψ es independiente de y y de z , y su dependencia temporal es de la forma exp(−iEt/~).
Como el operador espín deriva con respecto a las variables de velocidad, podemos buscar solu-
ciones en variables separadas en la forma
ψ(t, x, u) = e−iEt/~ ϕ(x)χ(u),
y por lo tanto ( )
~2 d2
+ E − eV (x) − E ϕ(x) = 0, (6.30)
2m dx2
Z 2 χ(u) = s(s + 1)~2 χ(u), Zz χ(u) = ±s~χ(u). (6.31)
La parte espacial ϕ(x), está desacoplada de la parte del espín χ(u), y E − eV (x) − E representa
la energía cinética de la partícula. La parte espacial satisface la ecuación de Schroedinger uni-
dimensional, y la parte del espín es independiente de la interacción, por lo que la probabilidad
cuántica del efecto túnel está contenida en la parte espacial y no depende de la orientación
particular del espín.
Si la partícula se encuentra inicialmente a la izquierda de la barrera, con una energía cinética
inicial E0 = E−E , podemos entonces determinar la probabilidad de cruce para a = 1 y diferentes
valores de la anchura del potencial b.
Este problema unidimensional con el potencial triangular de la gura Fig. 6.16 está resuelto
en el libro de Landau: 17
ikx
e + Re−ikx , x ≤ −a,
C Ai(D(1 − G + x ) + C Bi(D(1 − G + x ), −a ≤ x ≤ 0,
1 a 2 a
ϕ(x) = x )) + C Bi(L(1 − G − x )), 0 ≤ x ≤ b, (6.32)
C 3 Ai(L(1 − G − 4
b b
T eikx , x ≥ b,
16
J.M. Levy-Leblond, Galilei Group and Galilean Invariance, in E.M. Loebl, Group Theory and its applica-
tions, Acad. Press, NY (1971), vol. 2, p. 221.
17
L. Landau and E. Lifchitz, Mécanique quantique, Mir Moscow (1988), 3rd. edition.
6.5. EFECTO TÚNEL CLÁSICO 287
donde x es la misma variable adimensional que en el análisis clásico, y las constantes son
√ √ √
E 3 eV0 a2 3 eV0 b2 E
k= , D= , L= , G= . (6.33)
2mc2 2mc2 2mc2 eV0
Las funciones Ai(x) y Bi(x) son las funciones de Airy de x. Las seis constantes de integración
R, T , y Ci , i = 1, 2, 3, 4, se pueden obtener requiriendo la continuidad de las funciones y de
sus primeras derivadas en los puntos de discontinuidad de la fuerza, esto es en x = −a, x = 0
y x = b. El coeciente |R|2 representa la probabilidad de que la partícula sea reejada por la
barrera y |T |2 es la probabilidad de que se encuentre a la derecha de la barrera, esto es, que la
cruce.
Figura 6.21: Probabilidad clásica P (b) y cuántica de cruce de la barrera, para diferentes
valores del potencial V0 .
Como el efecto túnel es una función de ~ y el espín de las partículas elementales también es
del orden de ~, es muy difícil separar en un experimento real qué parte del resultado que es de
orden ~ proviene de un efecto estrictamente cuántico o viene de la contribución del espín.
Si la partícula clásica estuviera polarizada longitudinalmente, es decir la orientación del
espín fuera en la dirección del momento lineal o en sentido contrario, nunca cruzaría la barrera
con energías inferiores al máximo eV0 . Vemos que la orientación sí inuye en el caso clásico pero
no en el cuántico, ya que de (6.30) y (6.31) se ve que la probabilidad de cruce es independiente
del espín.
De hecho sí existe una inuencia que no ha sido considerada en el análisis cuántico. Por
tener la partícula separados el centro de masa del centro de carga, posee un momento dipolar
eléctrico d = ek, y por lo tanto una energía de interacción de este dipolo de valor −d · E . Si la
partícula está polarizada longitudinalmente, d y E son ortogonales y esta contribución es nula.
Si, como en el caso clásico analizado, la polarización es transversal al movimiento, el anterior
producto escalar produce una energía de interacción de valor −eER cos ωt, donde E es el campo
eléctrico uniforme de cada zona y R es el radio del movimiento interno o zitterbewegung. En la
parte de la ecuación cuántica hay que reemplazar
Vamos a ver que la estructura que hemos encontrado del electrón, nos permite hacer una
interpretación de la denominada magnetoresistencia gigante de películas policristalinas 18 . Esto
se conoce en la literatura como el Efecto túnel de polarización del espín 19 .
La cuestión de que si el efecto túnel es un efecto puramente cuántico o puede ser clásico, es
un tema carente de sentido. Hemos visto que existe un efecto túnel clásico, pero para partículas
con espín, en las que sus centros de masa y de carga sean puntos diferentes. De todas formas,
la materia elemental debe ser interpretada bajo las reglas de la mecánica cuántica, ya que es el
cálculo cuántico el que produce un mejor acuerdo con las medidas experimentales.
La conducción eléctrica en materiales sinterizados es completamente diferente de la conduc-
ción en conductores ordinarios. Un material sinterizado no es un medio continuo. Está formado
por pequeños granos que permanecen unidos al ser sometidos a compresión. La conducción
eléctrica es pues, el salto de electrones de grano en grano, en un proceso túnel a través de un
potencial efectivo en la región fronteriza entre los granos. Estos materiales presentan por lo
tanto una alta resistividad, cuando se les compara con los conductores normales.
La forma del potencial en el intersticio es desconocida, pero podemos aproximarla mediante
un potencial de tipo triangular como los de la sección anterior. Cuando un electrón se aleja de
un grano, éste queda positivamente cargado y atrae al electrón. Cuando éste se ha alejado y
queda más próximo al otro grano, induce un dipolo que lo atrae. En ambos casos no sabemos
cómo son estas fuerzas, pero la aproximación anterior de suponerlas constantes justica un
potencial triangular en el intersticio. De todas formas, lo que hemos visto es que para cada
18
Premio Nobel de Física 2007 a Albert Fert y Peter Grünberg por el descubrimiento en 1988 de la Magneto-
resistencia Gigante.
19
V.N. Dobrovolsky, D.I. Sheka and B.V. Chernyachuk, Surface Science 397, 333 (1998); P. Raychaudhuri,
T.K. Nath, A.K. Nigam and R. Pintor, cond-mat/9805258, preprint.
6.6. FORMACIÓN DE PARES DE ELECTRONES LIGADOS 289
barrera de potencial existe un mínimo de energía, por debajo del máximo del potencial, tal que
electrones polarizados transversalmente por encima de esa energía la cruzan, incluso desde el
punto de vista clásico. Este efecto no es predicho por la mecánica cuántica 'ordinaria`, ya que
la probabilidad de cruce por efecto túnel es independiente del espín.
Si tenemos un hilo de este material sometido a un potencial eléctrico, cuando introducimos un
campo magnético externo transversal a la dirección de la corriente, los electrones de conducción
se polarizan de forma transversal al campo eléctrico, y si el nivel de Fermi de estos electrones
está por encima de la energía mínima de cruce, todos aquellos electrones por encima de esta
energía la cruzarán, incluso clásicamente, como si fuera un verdadero conductor. La resistencia
del material ha sido alterada por la presencia de un campo magnético externo transversal.
Podemos diseñar dispositivos electrónicos en los que el control de las corrientes no se efectúa
con campos eléctricos sino controlando la orientación del espín. Un dispositivo de este tipo se
dice que pertenece a la nueva de técnica de la espintrónica, pues se utiliza el control del espín
para producir efectos electrónicos.
Se podría argumentar que la presencia del campo magnético externo que polariza a los
electrones, pudiera modicar la probabilidad de cruce. Incluso con un campo externo del orden
de 1 Tesla, y en una barrera potencial de 1 Voltio, el término de interacción magnética −µ · B
contribuye con una energía del orden de ±5,7 × 10−5 eV, la cual no modica la probabilidad
cuántica de cruce.
donde g = ±α~c.
Explícitamente se escribe:
√ ( )
g 1 − u1 · u2 u2 (r 1 − r 2 ) · (u1 − u2 )
F1 = − (r 1 − r 2 ) + +
[(r 1 − r 2 )2 ]3/2 2 1 − u1 · u2
( )
g a1 · u2 + u1 · a2 a2
+ u2 +√ .
2[(r 1 − r 2 )2 ]1/2 (1 − u1 · u2 )3/2 1 − u1 · u2
Contiene términos de velocidad que van como 1/r2 y términos de aceleración que van como
1/r en términos de la distancia instantánea entre cargas r = |r 1 − r 2 |. En esta notación, en la
descripción síncrona, ua = ṙ a .
La fuerza sobre la partícula 2 se obtiene sin más que reemplazar 1 ←→ 2 en esta expresión.
El sistema de ecuaciones se puede hacer en términos de variables adimensionales. En efecto si
hacemos u = ce
u v = ce e, q = R0 q
v , r = R0 r e y e
t = ω0 t, la ecuación
d2 r e
d2 r ė · u
c2 1 − q ė
= ω 2
R0 = (e e)
q−r
de
0
dt2 t2 q−r
R0 (e e)2
y como ω0 R0 = c, los coecientes de escala se cancelan y esta ecuación queda en términos de
variables adimensionales. Lo mismo sucede a la
α~c ~
= 2α, pues ω0 R0 = c, R0 = .
mcω0 R02 2mc
Figura 6.22: Trayectorias de los centros de masa y carga de dos partículas con espín con
velocidad inicial de sus centros de masa q̇a = 0,1 y un parámetro de impacto pequeño.
dos partículas sin espín, interaccionado a través de una fuerza Coulombiana. Cuando decimos
que no se aproximan mucho queremos decir que su separación relativa es siempre mucho más
grande que la longitud de onda Compton.
Esto se puede entender porque si las partículas están lejos una de otra, el comportamiento
Coulombiano de la Lagrangiana lo justica. Al calcular la interacción entre las correspondientes
cargas, como la frecuencia del movimiento interno es muy alta, la posición media de cada carga
es el correspondiente centro de masa. Sin embargo, en altas energías, las dos partículas se pueden
aproximar por debajo de la longitud de onda Compton, y por lo tanto ese análisis promedio
no funciona. Es necesario conocer las posiciones exactas de las cargas y sus velocidades para
determinar las fuerzas sobre cada una de ellas.
Aquí, nuevos fenómenos físicos aparecen, cuando se compara con partículas sin espín. El
fenómeno de la dispersión frontal, es decir que prácticamente ambas partículas siguen sus tra-
yectorias iniciales sin desviarse, como la calculada en la gura 6.23, no se puede describir en
el caso de partículas sin espín. La interacción Coulombiana hace que dos electrones en colisión
frontal se desvíen siempre. Sin embargo, la experiencia demuestra que la dispersión frontal es
el fenómeno más probable en la colisión de haces de partículas.
Otro fenómeno que no aparece en partículas sin espín, es la formación de pares, es decir
de estados ligados estables de partículas de la misma carga. En la gura 6.24, representamos
la posición inicial de dos partículas de la misma carga con sus espines paralelos y tal que sus
correspondientes centros de masa se encuentran a una distancia inferior a la longitud de onda
Compton, esto es, inferior al diámetro de su movimiento interno. Hemos escrito los símbolos de
las cargas ea en el correspondiente centro de carga r a y las correspondientes letras ma en los
respectivos centros de masa q a . En la parte (a) dibujamos la situación cuando ambas partículas
poseen la misma fase inicial β1 = β2 , de sus movimientos internos. Las fuerzas F a , sobre cada
partícula a = 1, 2, se calculan en términos de las posiciones, velocidades y aceleraciones de las dos
cargas, de acuerdo con (6.34), y dibujamos también esas mismas fuerzas en los correspondientes
centros de masa, para poder plantear las ecuaciones (6.35). Vemos que una fuerza repulsiva entre
las cargas produce también una fuerza repulsiva entre los correspondientes centros de masa. Sin
embargo, si las fases iniciales de sus movimientos internos, fuesen opuestas, β1 = −β2 , como
en la parte (b) de la gura, una fuerza repulsiva entre cargas, calculada igual que en el caso
anterior, produce una fuerza atractiva entre los centros de masa. Si la separación entre los
292 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
Figura 6.23: Dispersión frontal de dos partículas con espín, de la misma carga, y con una
separación inicial 2qa (0) = 10, velocidad de sus centros de masa |q̇a (0)| = 0,18 y un parámetro
de impacto pequeño. Los dos centros de masa pasan uno junto al otro, sin apenas desviarse.
centros de masa fuera superior a la longitud de onda Compton, la fuerza entre centros de masa
sería siempre repulsiva, independientemente de las fases relativas de los movimientos internos.
En la gura 6.25 vemos otra situación de fases opuestas pero donde la separación entre los
centros de masa es mayor aunque sigue siendo inferior a la longitud de onda Compton.
Figura 6.24: Posiciones iniciales de dos partículas de Dirac con sus espines paralelos y con
una separación entre sus centros de masa inferior a la longitud de onda Compton. Las líneas
de puntos representan las trayectorias previsibles de cada carga, si la partícula estuviera
libre. Ambos movimientos tienen el mismo sentido como corresponde a partículas con sus
espines paralelos. En (a) ambas partículas poseen la misma fase inicial y la fuerza repulsiva
entre cargas, produce una fuerza repulsiva entre sus centros de masa, mientras que en (b),
con fases opuestas, la fuerza entre sus centros de masa resulta ser atractiva.
Para analizar esta situación en la que se van a producir movimientos ligados de pares de
partículas de la misma carga, vamos a proceder de la siguiente forma: Comenzamos la integración
numérica imponiendo la condición de que ambos centros de masa se encuentran en reposo y
localizados en el origen del sistema de referencia, es decir q a (0) = q̇ a (0) = 0. Para la partícula
2 tomamos como fase inicial β2 (0) = 0 y para la partícula 1, empezamos con β1 (0) = 0, y la
6.6. FORMACIÓN DE PARES DE ELECTRONES LIGADOS 293
Figura 6.25: (a) Posición inicial de dos partículas con fases opuestas, que produce una
fuerza atractiva entre sus centros de masa, que están separados menos que la longitud
de onda Compton. En la parte (b), después de medio ciclo de las cargas, la fuerza entre
los centros de masa resulta ser repulsiva, pero su intensidad es menor que en la situación
anterior por estar las cargas más alejadas, por lo que el movimiento resultante es también
un movimiento de pares ligados.
vamos incrementando de grado en grado en cada proceso de integración, hasta alcanzar el valor
nal de 2π radianes. Los valores de contorno de las variables r a (0) y ṙ a (0), con la ligadura
|ṙa (0)| = 1, se escogen de tal manera que sean compatibles con estas fases. El sistema total es
analizado en su centro de masa, de tal manera que q 1 (0) = −q 2 (0) y q̇ 1 (0) = −q̇ 2 (0). El proceso
de integración se automatiza de tal forma que cuando los centros de masa de las partículas se
separan por encima de la longitud de onda Compton, la integración se interrumpe y comienza
de nuevo con un nuevo valor de la fase β1 (0) de un grado más, y los correspondientes valores
nuevos de las variables r a (0) y ṙ a (0).
Si las partículas no se separan durante un tiempo de integración correspondiente a 106 vuel-
tas de las cargas alrededor del correspondiente centro de masa, se vuelve a parar el proceso,
se guardan los valores iniciales de las variables que dan lugar a este movimiento ligado y se
comienza de nuevo con nuevos valores de contorno. Este tiempo ligado corresponde, en el caso
de electrones, a un estado ligado de duración superior a 10−15 segundos. Para algunos valores
particulares de las variables, con fases opuestas, hemos dejado el programa de integración fun-
cionando durante una semana, y el estado ligado se mantiene. Esto representa una vida superior
a 10−9 segundos. Si dejásemos el programa funcionando durante un año, esto incrementaría el
tiempo de vida solamente en dos órdenes de magnitud. La sensación general es que los estados
ligados son sucientemente estables, ya que ni siquiera los posibles errores numéricos en la inte-
gración destruyen la ligadura entre las partículas, ni la estabilidad del movimiento. El proceso
se ha repetido de nuevo, cambiando ligeramente las condiciones iniciales de las variables del
centro de masa q a (0) y q̇ a (0), en pasos de valor 0,0001 en estas variables adimensionales, y
con β2 (0) = 0, y el mismo proceder con la fase β1 (0), como el comentado anteriormente. Para
vericar la abilidad del método, cada 103 pasos de integración, se mide el que las velocidades
de las cargas sigan siendo de valor absoluto 1, dentro de un error numérico menor que 10−20 .
Se ha realizado el proceso tomando como fase inicial β2 (0) cualquier otro valor arbitrario.
Se trataba de poner de maniesto si había diferencias en función de las diferencias de fases
iniciales β2 (0) − β1 (0), y de las posiciones y velocidades de los centros de masa q a (0) y q̇ a (0).
Después de recolectar todos los datos que conducen a movimientos ligados, hemos encontrado
los siguientes resultados:
1. La velocidad inicial de los centros de masa debe ser |q̇a (0)| < 0,01c. En caso contrario,
el movimiento entre las dos partículas no es estable y al cabo de unas pocas vueltas se
separan.
2. Para cada velocidad |q̇a (0)| < 0,01c existe un rango ∆ de la fase β1 (0) = β2 (0) + π ± ∆
para el cual el movimiento es estable. Cuanto mayor sea la velocidad de los centros de
294 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
masa, más estrecho es este margen, de tal manera que los movimientos más estables se
producen con las fases prácticamente opuestas.
3. Se han encontrado movimientos ligados para una separación inicial entre los centros de
masa, hasta 0,8 veces la longitud de onda Compton, como la que se representa en la gura
6.25, siempre que las fases y velocidades se encuentren dentro de los rangos mencionados
anteriormente.
En la gura 6.26, mostramos el cálculo del movimiento ligado de las dos partículas con
una separación inicial de sus centros de masa de q1x = −q2x = 0,2×(long. de onda Compton),
q̇1x = −q̇2x = 0,008 y q̇1y = −q̇2y = 0,001, β2 = 0 y β1 = π . La fuerza entre cargas es repulsiva
pero sin embargo, si las fases internas β1 y β2 son opuestas, produce una fuerza atractiva entre
los centros de masa de acuerdo con el mecanismo mostrado en la gura 6.24 (b).
Esta posibilidad de formación de pares ligados, metaestables, de baja energía, de partículas
de la misma carga, no es exclusivo de la Lagrangiana de interacción utilizada. Si usamos una
interacción electromagnética o bien una interacción Coulombiana instantánea entre las cargas de
dos partículas de Dirac, hemos encontrado también este comportamiento en 20 . Este movimiento
ligado no lo destruyen campos eléctricos externos ni tampoco campos magnéticos externos de
la misma dirección que los espines. Sin embargo, un campo magnético transversal al espín,
destruye el movimiento ligado.
Figura 6.26: Movimiento ligado de los centros de masa y centros de carga de dos partículas
con espín, de espines paralelos y con una velocidad de sus centros de masa v ≃ 0,0082. La
separación inicial entre sus centros de masa es de 0,2×(long. de onda Compton).
Cuando calculamos el valor medio de la posición r a , resulta ser el valor del centro de masa
q a , y de esta forma, la fuerza repulsiva entre cargas resulta también una fuerza repulsiva entre
los correspondientes centros de masa, por lo que suprimir el contenido de la parte del espín
asociada al zitterbewegung, elimina la posibilidad de formación de pares ligados.
A pesar de que este resultado nos muestra un mecanismo clásico que justica la formación
de un sistema ligado de espín 1, y por lo tanto un bosón a partir de dos fermiones cargados
iguales, hemos de tener cuidado con el tipo de conclusiones que podemos sacar. En primer
lugar es un análisis clásico, y aunque el rango de energías en las que el fenómeno es estable es
bastante grande, esto no signica que dos electrones puedan quedar ligados hasta esa energía
20
M. Rivas J. Phys. A: Math. Gen. 36 4703 (2003), (Preprint physics/0112005)
6.7. EFECTO HALL 295
de ligadura. De ser así, vamos a estimar desde un punto de vista térmico, a qué temperatura
máxima corresponde la posibilidad de formación de estados ligados. En efecto, si consideramos
desde el punto de vista clásico que el electrón es un sistema de 7 grados de libertad, 3 representan
la posición r , otros 3 la orientación α y nalmente una fase interna β . Si aceptamos el teorema
de equipartición de la energía, entonces para ese máximo de energía cinética que produce el
estado ligado mv 2 /2 = 7κT /2, siendo κ la constante de Boltzmann y v = 0,01c la velocidad
máxima de cada partícula, entonces un gas de electrones polarizados (como los electrones de
conducción en un efecto Hall cuántico, como veremos) pueden formar estados ligados hasta una
temperatura por debajo de T = 8,47 × 105 K, que es en efecto una temperatura muy alta.
En segundo lugar, la materia a este nivel se comporta de acuerdo con los postulados de la
mecánica cuántica y, por lo tanto, debemos resolver dentro del marco cuántico, el correspondien-
te estado ligado y establecer para qué energías es posible. En particular, el movimiento relativo
entre electrones tiene que tener el momento angular orbital cuantizado. Este problema no ha
sido resuelto todavía, pero la existencia de una posibilidad clásica de formación de pares y un
rango de energía tan alto, justica el que se realice un esfuerzo en esa dirección. Un electrón
y un protón pueden formar estados ligados dentro de un margen continuo y muy amplio de
energías. Es solamente la teoría cuántica la que da la respuesta correcta para qué energías los
estados ligados son estacionarios.
Si las fases de las dos partículas fuesen las mismas(o casi las mismas) no hay posibilidad, ni
siquiera clásica, de formación de estados ligados. Como los dos fermiones que forman el estado
ligado poseen el mismo espín y la misma energía, ¾no será que el exigir que sus fases sean
contrarias, es una forma clásica de superar el principio de exclusión de Pauli y justicar la
existencia de estos estados ligados?
6.6.1. El Positronium
Si las dos partículas son de cargas opuestas, la fuerza entre ellas es de atracción, y si sus
espines tuvieran la orientación opuesta, el movimiento de los centros de cargas de ambas serían
los mismos que los que hemos analizado aquí. Un ejemplo de este tipo de interacción, en el
que las dos partículas son de la misma masa y carga opuesta, es el Positronium, o sistema
formado por un electrón y un positrón. Es un sistema que posee estados estacionarios aunque la
probabilidad de que la partícula y la antipartícula colisionen es grande y por lo tanto se aniquilen
ambas. El estado fundamental es un estado de espín cero y momento magnético cero, lo cual
refuerza la predicción de la teoría cinemática que estamos desarrollando de que el espín y el
momento magnético de la partícula y la antipartícula deben tener la misma orientación relativa.
Tiene una vida media de 1.24×10−10 s y el sistema se desintegra en dos fotones con espines y
momento lineal opuestos y de energía la del electrón en reposo. Otro estado estacionario con una
vida media mayor 1.4×10−7 s corresponde al estado de espín 1, que corresponde a la transición
hiperna en la que una de las dos partículas invierte su espín. Se aniquilan emitiendo 3 fotones.
Desde el punto de vista clásico los estados estacionarios admiten la misma descripción apro-
ximada que el átomo de Bohr, con la cuantización del momento angular orbital.
Este efecto fue descubierto por Edwin Hall en 1879. Se trata de la inuencia de un campo
magnético sobre una corriente en un conductor, que produce una diferencia de potencial trans-
versal a la dirección en que circula la corriente. Si en un conductor producimos una corriente
continua e introducimos un campo magnético perpendicular a la corriente, entonces los electro-
nes que se desplazan, al interaccionar con el campo magnético se pondrán a girar, lo que dará
lugar a una acumulación de carga eléctrica en los laterales del conductor, negativa donde se
296 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
acumulan los electrones y positiva en el lado opuesto por disminución de éstos, con lo que se
establece una diferencia de potencial transversal.
Supongamos un conductor plano sobre el que actua un campo magnético en la dirección
OZ . El movimiento de los electrones puntuales, de carga −e, desplazándose con velocidad v en
un campo magnético viene dado por
dv
m = −ev × B.
dt
Si el movimiento tiene lugar en el plano XOY , v = (ẋ, ẏ, 0) y B = (0, 0, B) por lo que estas
ecuaciones se reducen a dos
mẍ = −eB ẏ, mÿ = eB ẋ,
cuya solución general es
Son círculos centrados en el punto (X, Y ) y con una fase ϕ y un radio R, arbitrarios. Estos cuatro
parámetros son las cuatro constantes de integración. Sin embargo la pulsación ωB = eB/m,
denominada frecuencia ciclotrónica, es ja. Los electrones se mueven en círculos de diversos
radios pero con la misma velocidad angular ωB .
El movimiento de los electrones sin espín en un conductor Óhmico bajo la inuencia de un
campo electromagnético externo puede venir descrito por el modelo de Drude,
d(γ(v)v) 1
m = −eE − ev × B − mv,
dt τ
donde el último término contiene una fuerza de frenado, opuesta a la velocidad, dependiente
de un parámetro con dimensiones de tiempo τ , denominado tiempo de dispersión, que puede
ser interpretado como el tiempo medio entre colisiones. Si este tiempo es largo representa que
hay poca resistencia al movimiento. Depende de la estructura interna del medio conductor y
del carácter fermiónico de los portadores de carga.
Las soluciones estacionarias son las que v no depende del tiempo,
eτ eτ
v+ v × B = − E.
m m
Si j = −nev es el vector densidad de corriente, donde n representa la densidad de electrones
de conducción del material, la anterior expresión nos establece una relación lineal entre j y E ,
que en el caso de un conductor plano se reduce a
m B m B
2
jx + jy = Ex , 2
jy − jx = Ey ,
ne τ ne ne τ ne
que escrita en forma matricial
( )
ρxx ρxy
j = E, ρik jk = Ei , ji = σik Ek ,
−ρxy ρyy
eléctrico transversal Ey , que se produce por acumulación de cargas en los laterales del conductor
y que impide que la densidad de corriente tenga una componente en la dirección transversal.
m B
Ex = ρxx jx , Ey = −ρxy jx , ρxx =
2
, ρxy = .
ne τ ne
La ρxx = ρ0 depende de la estructura microscópica, de la temperatura, a través del parámetro
τ , mientras que ρxy es una función lineal del campo magnético externo.
Figura 6.27: Variación de la resistividad con el campo magnético externo en el efecto Hall
clásico, para campos magnéticos pequeños, inferiores a 1 Tesla.
Sin embargo, para campos magnéticos grandes la anterior gura tiene la forma que se des-
cribe en 6.28 y que fue determinada experimentalmente por Von Klitzing, Dorda y Pepper21
La ρxy varía linealmente en promedio con B pero efectúa saltos bruscos durante los cuales
permanece constante. La ρxx comienza en su valor constante ρ0 , pero en seguida se pone a oscilar.
En estos tramos en los que ρxy es constante, la ρxx , de color verde, se anula, experimentando
un pico cuando la ρxy deja de ser constante y experimenta una subida. Los tramos horizontales
cumplen la condición
h 1
ρxy = 2 , ν = 1, 2, 3, . . . (6.37)
e ν
Como la constante de estructura na α = e2 /2ϵ0 hc, supuesta conocida la velocidad c y la
permitividad del vacío ϵ0 , la medida precisa de ρxy en los tramos constantes, es una medida
precisa de esta constante universal.
Además, el campo magnético promedio en el que se producen esos tramos constantes vale
nh n
Bν = = Φ0 ,
νe ν
21
K. v. Klitzing, G. Dorda and M. Pepper, New method for high accuracy determination of the ne structure
constant based on quantized Hall resistance, Phys. Rev. Lett. 45, 494 (1980)
298 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
Figura 6.28: Variación de la resistividad con el campo magnético, ρxx (verde), ρxy (rojo),
en el efecto Hall cuántico entero.
donde Φ0 se conoce como el cuanto de ujo y a la cantidad h/e2 como cuanto de resistividad.
Esto se conoce en la literatura como efecto Hall cuántico entero, para distinguirlo del efecto
Hall cuántico fraccionario donde en la resistividad (6.37) el parámetro ν en vez de ser un
entero es un número fraccionario, como se puso de maniesto para campos más altos22 y que se
representa en la gura 6.29.
Figura 6.29: Variación de la resistividad con el campo magnético externo en el efecto Hall
cuántico fraccionario para campos altos.
El efecto Hall se analiza para distribuciones planas de electrones connadas entre capas
de diferentes materiales. El primer efecto entero se descubrió en un MOSFET (Metal-Oxide-
Semiconductor-Field-Eect-Transistor). Es un sandwhich de un transistor de tres capas (metal-
aislante-semiconductor) con los electrones atrapados en una capa de 30Å de espesor entre el
aislante y el semiconductor. El efecto fraccionario se descubrió en una estructura GaAs-GaAlAs
de arseniuro de Galio. En ambos casos las densidades superciales de electrones son del orden
de n ≈ 1011 − 1012 cm−2 . La temperatura de las muestras es de 4 K para el efecto entero y 2 K
para el fraccionario. Más recientemente, se ha detectado el efecto Hall cuántico fraccionario en
el grafeno 23 a temperaturas de 20 K.
El potencial Hall transversal discreto se mantiene constante para campos magnéticos en un
rango nito durante los cuales la resistividad longitudinal cae a cero. La corriente uye de forma
longitudinal sin resistencia pues ρxx = 0. Como hemos visto, electrones con los espines paralelos
22
D.C. Tsui, H.L. Stormer and A.C. Gossard, Two-dimensional magnetotransport in the extreme quantum limit,
Phys. Rev. Lett. 48, 1559 (1982)
X. Du, et al. Nature 462 192 (2009).
23
6.8. ENFRIAMIENTO DE UN GAS POR LÁSER 299
pueden formar estados ligados metaestables de espín 1, que se comportan como bosones y la
corriente a ellos asociada está en su fase superconductora. Esto querría decir que para esos
rangos de campos magnéticos se está produciendo una polarización importante y efectiva de
los espines de los electrones de conducción en la dirección del campo magnético externo, con
la consiguiente formación de pares, algunos de los cuales serían desplazados hacia los bordes
del conductor, produciendo un salto brusco de la tensión Hall lateral. El resto de los electrones
apareados se movería longitudinalmente sin resistencia, y estarían en la fase superconductora.
Puede interpretarse que cuando por efecto del campo magnético se han polarizado un conjunto
de electrones y se forman pares ligados, si aumentamos el campo magnético estos pares no se
deshacen y no se incrementa el número de pares ligados hasta que llegamos a un nuevo campo que
hace que bruscamente aumente la polarización incrementando el número de electrones ligados.
Cuando se forman pares de electrones ligados, un campo eléctrico no deshace el par y ambas
partículas se mueven como un objeto de espín 1 y carga 2e. Si utilizamos la punta de prueba de
un microscopio de efecto túnel aplicado a la supercie plana del conductor, se podría intentar
extraer portadores del conductor y vericar si son electrones aislados o bien pares ligados. Lo
mismo si aplicásemos la punta de extracción al lateral negativo del conductor, para comprobar si
las cargas depositadas son simples electrones sueltos o electrones apareados. Estos experimentos,
según nuestro entender, no se han realizado.
Vamos a describir algo que a primera vista puede parecer paradógico. Enfriar un sistema
de átomos suministrando energía. El resultado es que el conjunto de átomos, al nal, pierde
energía.
Cuando un objeto con momento magnético se orienta en un campo magnético externo,
hay dos orientaciones estacionarias posibles: una que el momento magnético se oriente en la
24
M. I. Dyakonov and V. I. Perel, Possibility of orientating electron spins with current. Sov. Phys. JETP Lett.
13, 467 (1971)
300 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
dirección del campo magnético y otra en que la orientación es opuesta al campo. La primera es
una situación estacionaria de equilibrio estable y la segunda es inestable. Cualquier perturbación
la altera y el objeto invierte su momento magnético y pasa a la situación de equilibrio estable,
que es un estado de energía potencial menor y por lo tanto liberando energía en esa transición.
Para volver a obtener esta segunda situación estacionaria de equilibrio habría que suministrar
energía al objeto.
Para entender estos dos estados estacionarios sirva el ejemplo de un lápiz sobre una me-
sa. Solamente hay dos situaciones estacionarias de equilibrio posibles: Una que el lápiz esté
horizontal sobre la mesa y otra que esté perfectamente vertical. La primera es un equilibrio es-
table mientras que la segunda, de mayor energía potencial, es un equilibrio inestable. Cualquier
perturbación le hace caer a la posición estable, liberando su energía potencial. Volver a esta
situación estacionaria inestable requiere gastar energía para elevar el centro de masa del lápiz.
En un átomo, en el modelo en el que los electrones están sometidos al campo eléctrico del
núcleo y al campo magnético del momento magnético del núcleo, los electrones de las diferentes
capas se orientan de ambas formas frente a ese campo magnético, y en capas completas tenemos
electrones orientados de las dos formas posibles. Supongamos ahora un átomo con un solo
electrón en la última capa, estando las capas interiores completas.
La orientación de este momento magnético del último electrón, será la del campo magnético
resultante total que actúa sobre este electrón y que en el estado fundamental del átomo será
con el momento magnético paralelo al campo. Si queremos invertir la orientación del momento
magnético de este último electrón deberemos suministrar energía al átomo y por lo tanto al
electrón. Este proceso de invertir el momento magnético de un electrón en un átomo recibe el
nombre de transición hiperna.
La forma de suministrar energía a un átomo es mediante un haz de fotones. Los electrones
de las capas intermedias no pueden absorber fotones salvo para cambiar de nivel, a un nivel
excitado superior, pero no para cambiar la orientación de su espín, ya que al estar la capa
completa se instalaría en un estado ya ocupado, lo cual lo prohibe el principio de exclusión.
La energía para producir una transición entre niveles atómicos es del orden del eV. Para la
transición hiperna es del orden de 10−5 eV, en el rango de las microondas 25 . Supongamos que
la energía de los fotones del haz es la adecuada para producir la transición hiperna. Si un fotón
del haz es absorbido por el átomo, el electrón de la última capa capturará esa energía y pasará
a la situación estacionaria inestable. Sin embargo, al cabo de un tiempo, se desestabilizará
pasando a la situación estable emitiendo el correspondiente fotón de la transición hiperna.
Parece que lo que le damos al átomo lo volvemos a recuperar más tarde.
Como los fotones tienen espín 1 y el electrón espín 1/2, la transición se produce cuando
el electrón capture a un fotón que tenga su espín en la dirección opuesta a su propio espín,
invirtiendo la orientación de éste, y por lo tanto la orientación de su momento magnético. En
este proceso se conserva el momento angular y la energía, pasando el electrón a un estado de
energía mayor. Pero también se debe conservar el momento lineal, por lo que el momento lineal
del fotón absorbido modica en ese valor el momento lineal total del átomo.
La idea del enfriamiento por láser es utilizar fotones de una energía inferior a la de la
transición hiperna en el sistema de referencia del laboratorio. Si el gas de átomos no está a
la temperatura de 0 K, signica que un átomo posee una cierta energía cinética no nula y por
lo tanto se está desplazando con una cierta velocidad con respecto al sistema de referencia del
laboratorio. Los anteriores fotones no producirían la transición hiperna en átomos en reposo,
pero para los átomos en movimiento, debido al efecto Doppler, resulta que la energía de los
fotones del haz es algo mayor si el momento lineal del átomo se dirige hacia el haz, y menor si
el desplazamiento del átomo tiene la dirección del haz.
25 133
La transición hiperna del Cs es de una frecuencia ν = 9 192 631 770 Hz, en el rango de las microondas
de longitud de onda λ = 3.261 cm, que corresponde a una energía hν = 3.801 × 10−5 eV.
6.9. EL ESPÍN DEL PROTÓN 301
Si el átomo se dirige hacia el haz y su velocidad es la adecuada para que por el efecto
Doppler la energía del fotón que captura es suciente para producir la transición hiperna,
invertirá su momento magnético, pero la componente de la velocidad del centro de masa del
átomo en la dirección del haz disminuirá debido a la captura del momento lineal del fotón.
Como las otras componentes de la velocidad del átomo no se han modicado el átomo tiene
una energía cinética inferior con respecto al laboratorio, que la que tenía antes de la transición.
Pero ha pasado a un estado excitado inestable. Al cabo de un rato, ese electrón excitado pasará
a su estado estacionario estable, emitiendo el correspondiente fotón de la transición hiperna.
Pero ese fotón es emitido por un átomo que está en movimiento con respecto al laboratorio.
El resultado es que en el proceso de absorción hemos perdido un fotón de energía inferior a
la transición hiperna y hemos recuperado un fotón de energía mayor en el proceso de emisión.
La diferencia de energía entre esos dos fotones es la energía cinética que ha perdido el átomo
en este proceso. El átomo se ha enfriado.
En el año 1997, Chu, Cohen-Tanoudji y Phillips reciben el premio Nobel de física por el desa-
rrollo de técnicas de enfriamiento de átomos por láser. La idea es retener un gas monoatómico
en una cavidad a muy baja temperatura del orden del mK, y someterlo a la acción de láseres
dispuestos en tres direcciones perpendiculares, y en ambos sentidos. La energía de los fotones
debe ser inferior a la de la transición hiperna. De esta manera se consigue disminuir cada una
de las componentes de la velocidad del centro de masa de cada átomo, por el procedimiento
mencionado anteriormente. Al actuar con láseres en sentidos opuestos siempre habrá fotones
disponibles y de la energía adecuada para cada átomo, en uno u otro sentido.
A medida que los átomos se enfrían, la velocidad de los átomos disminuye y el resultado
del incremento de energía por efecto Doppler es menor, por lo que habría que sintonizar la
frecuencia de los láseres, incrementándola progresivamente, para poder alcanzar la energía de
transición. Por estos prcedimientos se consiguen enfriar gases a temperaturas del µK.
Supongamos que de acuerdo con el modelo estándar, el protón es un sistema ligado de tres
quarks en un estado de momento angular orbital L = 0, de cada uno de ellos. Si suponemos
que los quarks son partículas de Dirac de espín 1/2, y relación giromagnética g = 2, podemos
aplicarles el mismo modelo clásico que el del electrón que hemos desarrollado en este formalismo.
Existe en la literatura una controversia con respecto al espín del protón. Si sumamos los tres
operadores espín de cada quark resulta que experimentalmente esto no produce el momento
angular total del protón y es lo que se conoce como la proton spin crisis26 . De acuerdo con
este experimento realizado en el CERN, la suma de los espines de los tres quarks no solo
no producía el valor esperado del espín del protón sino solamente entre el 4 % y el 24 % del
mismo. Este es considerado como uno de los problemas no resueltos de la física 27 . Se suele
argumentar que faltaría incluir en el espín del protón la contribución de los gluones virtuales,
pero esta sugerencia tampoco da resultado. Hay que tener presente que el operador espín de
Dirac representa al momento angular con respecto al centro de carga, como hemos visto en este
formalismo.
Si los quarks se mueven en un estado de momento angular orbital L = 0, esto signica
literalmente que si hacemos el análisis en el centro de masa del protón, cada quark tiene su
momento lineal en la dirección del centro de masa común, por lo que el centro de masa de cada
quark se mueve a lo largo de una línea recta que pasa por el CM del protón, y por lo tanto, las
Ashman, J.; European Muon Collaboration, Phys. Lett. B 206, 364 (1988), A measurement of the spin
26
asymmetry and determination of the structure function g(1) in deep inelastic muon-proton scattering.
27
https:/ / en.wikipedia.org/wiki/Proton_spin_crisis
302 CAPÍTULO 6. PROPIEDADES Y EFECTOS ASOCIADOS CON EL ESPÍN
Figura 6.30: Modelo de protón como sistema ligado de tres partículas de Dirac en un
estado de momento angular orbital L = 0, y en el sistema de referencia del CM del protón.
El movimiento del CM de cada quark debe ser necesariamente una trayectoria rectilínea
pasando por el centro de masa del protón. El operador espín de Dirac de cada quark está
denido y dibujado con respecto al correspondiente centro de carga, de tal manera que
la suma de los tres operadores de Dirac ~σ/2 no puede dar lugar al momento angular del
protón con respecto a su CM. Hay que sumar los tres momentos angulares de cada quark
con respecto a su centro de masa.
∑
tres trayectorias de los tres quarks, puesto que pi = 0 en este sistema de referencia, están
contenidas en un plano.
Consideremos que el espín del protón es el momento angular de este sistema de tres quarks
con respecto al centro de masa común en reposo, CM . Como vemos en la gura 6.30, los tres
operadores espín de Dirac S i de cada quark representan a los momentos angulares de cada quark
con respecto al correspondiente centro de carga y no con respecto al centro de masa de cada
quark y han sido dibujados en su correspondiente punto. Esto signica que la suma de los tres
operadores espín de Dirac no pueden darnos el momento angular total del protón. Necesitamos
añadir por cada quark i, el correspondiente momento angular orbital (r i − q i ) × pi , i = 1, 2, 3.
Si tenemos en cuenta que el momento dipolar eléctrico de una partícula de Dirac es d =
e(r − q), como hemos visto en (6.7), esto nos determina al operador de separación entre el CC
y el CM de cada partícula por lo que
i~
r−q =− α,
2mc
en términos de las matrices α de Dirac. De aquí resulta que el término que falta para el cálculo
del espín del protón es que además de la suma de los tres operadores espín de Dirac, necesitamos
la suma de los tres operadores, uno por cada quark,
i~ i~ ~ ~2
α×p= α× ∇= α × ∇.
2mc 2mc i 2mc
Estos términos no son despreciables ya que cuando el CM de cada quark alcanza el CM común
del protón, la energía potencial es cero y la energía cinética alcanza su valor máximo, el valor
medio de cada momento lineal es aproximadamente de 325 MeV/c. Si q representa el campo
espinorial de un quark, el momento angular del protón debe contener al menos los términos:
∑3 ( ) ∑
3 ( 2 )
† ~ † ~
qi σ i qi − qi αi × ∇i qi
2 2mc
i=1 i=1
6.10. EL GRUPO CINEMÁTICO 303
sin tener en cuanta otras posibilidades como la posible contribución al momento angular del
plasma de gluones del protón, que es otra de los posibilidades que se argumentan, pero que no
hemos tenido en cuenta aquí.
con respecto al centro de masa, que es el único operador de Casimir del grupo W , T 2 que es
la parte del momento angular debido a la rotación del sistema cartesiano ligado al punto,
como operador de Casimir del grupo de rotaciones locales SO(3)L . De hecho, los operadores Ti ,
i = 1, 2, 3, son las componentes del momento angular de rotación, proyectadas en los ejes del
sistema cartesiano local. Finalmente, el generador Q del grupo U (1), que al ser la fase interna
adimensional tendría dimensiones de acción y cuyo signicado físico está por determinar. Todos
estos operadores de Casimir tienen dimensiones de acción.
En teoría de cuerdas se postula que una partícula elemental es un punto de un espacio
de dimensión 10, (o de dimensión 11 en la teoría M ), pero que varias de las variables se han
compacticado, quedando solamente como variables no compactas una variable temporal y tres
variables espaciales. Con la inclusión de la constante universal c, las cuatro variables tienen
dimensiones de longitud. El signicado físico o geométrico de las variables compactas no queda
denido, aunque sugieren que son dimensiones espaciales que se han cerrado sobre sí mismas y se
han hecho inobservables. Más aún, la variedad que postula la teoría de cuerdas, no queda claro
si representa al espacio de conguración de los grados de libertad independientes, ni tampoco
si el número de estas variables está restringido y por qué. Si esta variedad se reere al espacio
cinemático de un sistema Lagrangiano, quedaría claro desde el punto de vista geométrico en
nuestro formalismo qué tipo de variables son compactas y cuáles no y su signicado geométrico.
Pero es que además, la formulación variacional lo que establece es que el espacio cinemático
es necesariamente un espacio métrico Finsleriano, con un tensor métrico simétrico que no es
denido positivo. La métrica es denida positiva para puntos causalmente conectados, por lo
que el postulado variacional contiene a su vez al Principio de Causalidad. La evolución dinámica
de cualquier sistema material resulta ser una geodésica que une los puntos inicial y nal de la
evolución.
t′ = eλ t, r ′ = eλ r, (6.38)
además de la acción sobre el espacio-tiempo dada por las ecuaciones (2.247) y (2.248). De esta
forma, si t y r son variables cinemáticas de una partícula elemental, sus derivadas transforman
bajo esta transformación:
ṫ′ = eλ ṫ, ṙ ′ = eλ ṙ,
lo que implica que bajo las dilataciones espacio-temporales, la velocidad transforma como
u′ = u,
6.10. EL GRUPO CINEMÁTICO 305
[J , J ] = −J , [J , P ] = −P , [J , K] = −K, [J , H] = 0, (6.39)
Q = xµ ∂µ , pµ = ∂µ , Jµν = −Jνµ = xµ ∂ν − xν ∂µ .
C1 = pµ pµ = (H/c)2 − P 2 = m2 c2 , (6.42)
S CM = J − q × P , HS CM /c = HJ /c − K × P , (6.44)
lo que implica que C1 debe ser invertible, por lo que necesariamente el observable masa m ̸= 0.
El único operador de Casimir del grupo de Weyl es el momento angular con respecto al centro
de masa, independiente de la masa no nula de la partícula, por lo que de admitir este grupo
como grupo cinemático la única característica intrínseca de una partícula elemental es el espín.
Efectivamente, quarks y leptones son partículas de Dirac es decir objetos masivos y de espín
1/2.
El grupo de Weyl no posee exponentes, de tal manera que las funciones gauge sobre sus
espacios homogéneos son nulas. Las Lagrangianas de los sistemas mecánicos cuyos espacios
cinemáticos sean espacios homogéneos de W , pueden tomarse estrictamente invariantes.
Como la transformación generada por Q no conmuta con pµ , esta transformación liga estados
de partículas de masas diferentes.
x′i = fi (xj , gα ), g : O → O′ , g ∈ G.
Las variables xi de un cierto sistema material se han transformado entre observadores inercia-
les y decimos que hemos hecho una transformación pasiva de las variables cinemáticas. Esta
denominación es para distinguir esta transformación de las variables de la que se produciría
si manteniendo jo el observador inercial lo que hacemos es actuar sobre el sistema material
y producimos una transformación activa, con lo que los valores de las variables cinemáticas
cambiarán para este observador. Por ejemplo, trasladando, rotando, o deformando el sistema
material. Si la transformación activa se corresponde con una transformación del grupo cinemáti-
co, la modicación de las variables cinemáticas se expresa de la misma forma que anteriormente,
donde en vez de los parámetros gα del elemento del grupo g deberemos utilizar los parámetros
de su inverso g −1 . Por ejemplo el rotar un sistema material y expresarlo en el mismo sistema de
referencia, las variables que describen al cuerpo rotado se expresarán en términos de las variables
primitivas como si hubiéramos rotado en sentido contrario los ejes coordenados, manteniendo
inalterado el sistema material.
Al admitir como principio fundamental el Principio de Relatividad Restringido, estamos
estableciendo un grupo cinemático en el que las transformaciones que podemos realizar pueden
ser interpretadas de las dos formas, activa y pasiva. En cualquiera de estos casos el sistema
material no es deformado. Si incluyéramos cambios a un sistema acelerado, desde el punto de
vista activo tendríamos que realizar una fuerza sobre el sistema material, lo cual conllevaría
necesariamente una deformación del mismo, salvo que éste fuera indeformable, cosa que no
podemos admitir en general para los sistemas materiales. Descartamos por lo tanto este tipo de
transformaciones, ya que hay asimetría entre la interpretación pasiva y activa. Una no deforma al
sistema material y la otra sí. Desde el punto de vista pasivo da lugar a la aparición de un campo
gravitatorio extenso, en todo el espacio y que no aparece en el sistema de referencia primero.
Este tipo de transformaciones asimétricas en cuanto a su interpretación activa y pasiva, deben
quedar fuera del grupo cinemático que dene la clase de observadores equivalentes.
Se puede trasladar al sistema material o podemos considerar otro observador inercial con
sus ejes trasladados en sentido contrario. Lo mismo para las rotaciones y las transformaciones
6.10. EL GRUPO CINEMÁTICO 307
inerciales puras con velocidad constante. Desde el punto de vista pasivo admitir la invariancia
de las leyes de la física bajo traslaciones temporales es admitir que son inmutables en cualquier
instante en que las analicemos. Las leyes de la física son las mismas hoy que en el pasado
y también en el futuro. Desde el punto de vista activo, una traslación temporal consiste en
esperar el paso del tiempo para hacer el análisis físico. Sin embargo no podemos hacer desde
el punto de vista activo una traslación temporal hacia el pasado. No existe simetría entre los
tratamientos activo y pasivo para las traslaciones temporales. Solo es posible traslación activa
hacia el futuro. Existe una echa del tiempo. Esto parece implicar un único sentido desde el
punto de vista activo, de la acción de este grupo. El generador de este grupo tiene que tener un
único signo. La energía o momento temporal se escoge como una magnitud denida positiva. No
ocurre lo mismo con las demás magnitudes asociadas a los generadores de los otros grupos, que
pueden tomar cualquier signo, como las diferentes componentes del momento lineal o momento
angular.
Sucede lo mismo con las transformaciones discretas. Una inversión espacial pasiva es reali-
zable pero no así la activa, que supone deformar el sistema material. Dado un sistema material
es posible que su sistema espacialmente inverso sea físicamente irrealizable. Tal transformación
no puede formar parte del grupo de simetrías y si el fenómeno físico resulta ser invariante bajo
inversiones, esto es una propiedad física que debe comprobarse experimentalmente, pero que no
puede exigirse, a priori, como una ley de simetría. Si existe la simetría, puede dar lugar a una
ley de conservación que no existiría en el caso de ausencia de la simetría. La interacción débil no
es invariante bajo inversión espacial, y por lo tanto no conserva la paridad del sistema material.
Lo mismo podríamos decir de las transformaciones de cambio de escala. La interpretación
pasiva no afecta al sistema material, en cambio la transformación activa lo deforma. Como el
factor de escala de la partícula elemental se puede tomar como la separación entre el centro de
masa y el centro de carga, R = ~/2mc, que se escribe en términos de dos constantes universales
~ y c, y del observable masa, resulta que modicar la escala equivale a deformar la partícula y
obtener una partícula elemental de masa diferente. La Lagrangiana de interacción que hemos
encontrado en la sección 6.10.3 para dos partículas de Dirac es invariante Poincaré y además
invariante bajo cambio de escala espacio-temporal. Esto implica que si describe la interacción
entre dos electrones, la misma interacción es posible entre dos objetos de la misma carga y espín,
pero de masas diferentes que la del electrón. Al hacer el cambio de escala pasivo estaríamos
transformando el electrón en el muón o la partícula tau. El cambio activo se interpretaría
retirando los electrones y sustituyéndolos por las otras partículas. Lo mismo en el caso de los
diferentes estados másicos de los quarks de idéntica carga.
Este análisis sugiere que desde el punto de vista activo no tenemos un grupo cinemático
completo, como el grupo de Poincaré o el grupo de Weyl, sino que por lo que respecta a las
traslaciones temporales nos debemos restringir al semigrupo de traslaciones temporales activas
hacia el futuro. El generador de estas transformaciones solo puede tener un signo.
Si admitimos que es el grupo de Weyl el grupo cinemático y queremos hacer una descripción
cuántica de una partícula elemental, es preciso denir el conjunto completo de observables que
conmutan.
Como el operador de Casimir del grupo de Weyl, CW , es el cociente de los dos operadores
de Casimir del grupo de Poincaré, y éstos conmutan tanto con el operador de Klein-Gordon
como con el operador de Dirac, resulta que CW también conmuta con ellos. Por lo tanto, una
partícula elemental es un sistema de espín 1/2, cuyas funciones de onda satisfacen la ecuación
de Klein-Gordon y de Dirac, a los que podemos añadir los operadores Sz y Tz , que también
conmutan con CW . No podemos incluir al operador Q porque no conmuta con H y P .
308 REFERENCIAS
Podrán existir, por lo tanto, partículas elementales de masas diferentes, pero de la misma
carga y el mismo espín 1/2.
Referencias
Éstas son las principales referencias del autor y colaboradores acerca de este formalismo y
que pueden obtenerse a través de la página web http://tp.lc.ehu.es/martin.htm. Referencias
a otros trabajos aparecen en el texto principal como notas de pie de página.
Libro
M. Rivas,
Kinematical theory of spinning particles,
Classical and quantum mechanical formalism of elementary particles.
Fundamental Theories of Physics Series, vol 116, Kluwer, Dordrecht 2001.
ISBN 0-7923-6824-X
Artículos
M. Rivas,
Classical Particle Systems: I. Galilei free particles, J. Phys. A 18, 1971 (1985).
Classical Relativistic Spinning Particles, J. Math. Phys. 30, 318 (1989).
Quantization of generalized spinning particles. New derivation of Dirac's equation,
J. Math. Phys. 35, 3380 (1994).
Is there a classical spin contribution to the tunnel eect?, Phys. Lett. A 248, 279 (1998).
Are the electron spin and magnetic moment parallel or antiparallel vectors?,
ArXiv:physics/0112057.
The dynamical equation of the spinning electron, J. Phys. A, 36, 4703, (2003),
ArXiv:physics/0112005.
A vueltas con el espin, Rev. Esp. de Física 20, no.3 (2006) 14.
309
310 REFERENCIAS
A lacking term in the proton spin Contribution to the SPIN-2010 Conference, Julich
(Germany) Sept 27-Oct 3, 2010. J. Phys:Conference Series 295 (2011) 012040.
Is General Relativity a v/c ->0 limit of a Finsler geometry? (Contribution to the Spanish
Relativity Meeting 2012),
Progress in Mathematical Relativity, Gravitation and Cosmology Guimaraes, Portugal
Sept 3-7, 2012 Springer ISBN 978-3-642-40156-5.
The center of mass and center of charge of the electron J. Phys:Conference Series 615
(2015) 012017
Una versión previa puede verse en ArXiv:1211.3253
Composition law and contractions of the Poincaré group, Eur. J. Phys.7, (1986) 1.
Conferencias
Web didáctica
http://www.spinningparticles.com
http://tp.lc.ehu.es/documents/electron.pps