Relatividad para Futuros Fisicos
Relatividad para Futuros Fisicos
Relatividad para Futuros Fisicos
Saúl Ramos-Sánchez
CopIt-arXives
Publishing Open Access
with an Open Mind
2018
Este libro contiene material protegido por Leyes de Autor
Derechos y permisos
Todo el contenido de este libro es propiedad intelectual de su autor quien, sin embargo,
otorga permiso al lector para copiar, distribuir e imprimir sus textos libremente, siempre
y cuando se cumpla con lo siguiente: (i) el material no debe ser modificado ni alterado,
(ii) la fuente debe ser citada siempre y los derechos intelectuales deben ser atribuidos a su
autor, (iii) estrictamente prohibido su uso con fines comerciales.
Producido con software libre incluyendo LATEX y Linux. Indexado en el catálogo de publi-
caciones electrónicas de la Universidad Nacional Autónoma de México y en Google Books.
CopIt-arXives
Cd. de México - Cuernavaca - Madrid - Curitiba
Viçosa - Washington DC - London - Oxford
Con el apoyo de la
Universidad Nacional Autónoma de México
Instituto de Física
A Démian y Adriana
Índice general
Índice general i
Presentación v
Bibliografía ix
Introducción xv
2. Geometría en relatividad 69
2.1. Tensores en relatividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2.1.1. Algunas propiedades de vectores . . . . . . . . . . . . . . . . . . . . 69
2.1.2. 1–formas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.1.3. Gradiente de una función . . . . . . . . . . . . . . . . . . . . . . . . 75
2.1.4. Tensor métrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.1.5. El papel del tensor métrico . . . . . . . . . . . . . . . . . . . . . . . 79
2.1.6. La base del tensor métrico . . . . . . . . . . . . . . . . . . . . . . . . 81
2.1.7. Tensores de rango (M, N ) . . . . . . . . . . . . . . . . . . . . . . . . 83
2.1.8. Álgebra tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.1.9. Gradiente de un tensor en espacio–tiempo plano . . . . . . . . . . . 89
2.2. Ecuaciones de Maxwell en relatividad especial . . . . . . . . . . . . . . . . . 90
2.2.1. Fuerza de Lorentz y ecuaciones de Maxwell . . . . . . . . . . . . . . 91
2.3. Tensor de energía–momento . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
2.3.1. Tensor de energía–momento de un fluido perfecto. . . . . . . . . . . 97
2.3.2. Conservación de energía–momento . . . . . . . . . . . . . . . . . . . 100
2.4. Espacio con métrica no trivial . . . . . . . . . . . . . . . . . . . . . . . . . . 102
2.4.1. Coordenadas curvilíneas . . . . . . . . . . . . . . . . . . . . . . . . . 102
2.4.2. Vectores y 1–formas base en coordenadas curvilíneas . . . . . . . . . 104
2.4.3. Tensor métrico y gradiente en coordenadas curvilíneas . . . . . . . . 104
2.4.4. Derivadas en coordenadas curvilíneas . . . . . . . . . . . . . . . . . . 106
2.4.5. Derivada covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
ÍNDICE GENERAL iii
gratuito para enseñanza básica en México. Un prototipo vanguardista del acceso abierto
para la educación pública de México. A casi 60 años de la destacada obra de Torres-Bodet,
nos congratulamos de la publicación en línea de este primer volumen.
opinen que se requiere más tiempo o herramientas alternativas para discutir los elementos
de la relatividad aquí presentados. No obstante, estoy convencido de que los temas de este
texto pueden ser transmitidos a estudiantes de licenciatura como se plantea aquí, dado que
ellos también dedican tiempo a repasar los temas y resolver los ejercicios propuestos, y se
evitan en un primera lectura los temas marcados con un asterisco.
Agradecimientos
Deseo agradecer particularmente el trabajo y dedicación que Lartaun Aramis de Icaza
Astiz invirtió en la traducción y captura de este texto como parte de su proceso de ti-
tulación. Asimismo, le agradezco sus sugerencias en distintas partes del texto, las cuales
benefician al lector. En especial, Aramis fue quien hizo notar que este trabajo hubiera
estado incompleto sin incluir una sección dedicada al estudio de las ondas gravitacionales,
recientemente detectadas.
Mi gratitud va además a los muchos estudiantes entusiastas que han participado en
los cursos de relatividad que he impartido en la Facultad de Ciencias de la UNAM. Sus
preguntas continuas y su fascinación por esta área han sido y son una motivación para
escribir y mejorar este texto. También es un placer agradecer a los estudiantes que han
sido ayudantes del curso, quienes, más allá de su deber, han participado en el diseño de
algunos de los ejercicios contenidos en estas notas. Por su invaluable labor, agradezco a
Yessenia Olguín Trejo, Jorge Armando Arroyo Troncoso, Carlos Crispín Espinosa Ponce
y, muy especialmente, a Tupac Bravo Ibarra, quien depositó su talento en ingeniosos y
didácticos ejercicios, diseñados para que sus compañeros más jóvenes compartieran el placer
de entender los vericuetos de la relatividad.
Estoy también en deuda con Iker Loic de Icaza Astiz y Aitor Lander de Icaza Astiz,
quienes invirtieron mucho tiempo trazando cuidadosamente todas las figuras que aparecen
en este texto.
Agradezco el apoyo recibido para el desarrollo de este trabajo mediante los proyectos
CONACyT F-252167 y DGAPA-PAPIIT IN100217, así como el apoyo que me brindó el
Instituto de Física para la publicación de la versión impresa de este trabajo. Además,
agradezco la hospitalidad del ICTP, quien me recibió durante la última etapa de redacción
de este texto. Finalmente, deseo agradecer la cuidadosa revisión realizada por los árbitros,
quienes contribuyeron a mejorar la calidad de esta obra.
S. Ramos-Sánchez
UNAM
2018
Bibliografía
E.F. Taylor, J.A. Wheeler, Spacetime physics: Introduction to Special Relativity. Free-
man & Co., 1992.
S. Weinberg, The Quantum Theory of Fields I. Cambridge Univ. Press, 1995 (seccio-
nes 2.2–2.4).
A. Einstein, Relativity. The special and general theory. Methuen & Co Ltd., 1916.
Relatividad General
B.F. Schutz, A first course in general relativity. Cambridge Univ. Press, 1985.
C.W. Misner, K.S. Thorne, J.A. Wheeler, Gravitation. Freeman & Co., 1975.
Cosmología
E.W. Kolb, M.S. Turner, The early universe. Addison-Wesley Pub. Co., 1988.
Divulgativos
c denota la rapidez de la luz en el vacío, dada por c = 299, 793, 458 m/s. En cálculos
numéricos se utilizará el valor aproximado c ≈ 3 × 108 m/s.
Los índices latinos i, j, k, . . . toman los valores 1, 2, 3, de manera que están reservados
para vectores espaciales, habituales, y/o las componentes espaciales de un vector en
espacio–tiempo.
Puede haber más de un índice repetido en una expresión monomial. Por ejemplo,
3 X
X 3
Fµν F µν ≡ Fµν F µν .
µ=0 ν=0
Debido a que el resultado es un número real y, por tanto, independiente del índice µ,
en la expresión xµ y µ decimos que el índice µ ha sido contraído.
Puesto que las convenciones aquí definidas no son universales, el lector deberá verificar
qué convenciones se utilizan en los textos auxiliares que decida emplear.
xiv Algunos datos y convenciones
Introducción
La relatividad en el siglo XXI
Pese a lo interesante de estas últimas anotaciones, durante varias décadas del siglo
pasado en los círculos científicos más conservadores los estudios de los agujeros negros,
las ondas gravitacionales y la cosmología no eran vistos más que como curiosos trabajos
teóricos. La razón fue y ha sido que es complicado o imposible realizar confirmaciones
directas y que es difícil hacer los cálculos relativistas precisos para poder comparar con
observaciones indirectas.
Sin embargo, ingeniosos (y a veces sólo afortunados) experimentos han acumulado vas-
ta evidencia indirecta. Por ejemplo, sobre cosmología, el descubrimiento de la radiación
cósmica de fondo, predicha y descrita por el modelo cosmológico de la gran explosión como
la radiación remanente de una época temprana en la que el universo era muy caliente, fue
un ladrillo importante en la consolidación de la cosmología. Su descubrimiento fue galardo-
nado con el máximo honor del Premio Nobel en 1978. A pesar de esto, aún existían dudas
sobre si el modelo de la gran explosión, basado en la relatividad general, era el correcto para
describir esta radiación. Por fortuna, una década después fue confirmado que la radiación
no es uniforme en todo el cosmos y que la medición de estas inhomogeneidades coincide
con lo predicho por la teoría. Celebrado con el Premio Nobel en 2006, este descubrimiento
no dejó muchas opciones abiertas. La cosmología descrita por la relatividad es la más apro-
piada. Una medición más detallada de la expansión del universo condujo pronto al último
mayor descubrimiento cosmológico: el universo crece cada vez más rápido (Premio Nobel
2011). Y (casi) todo puede ser ajustado perfectamente a partir de la relatividad general.
La confirmación de la existencia de los agujeros negros y las ondas gravitacionales no
tiene una historia más corta. Por una parte, los agujeros negros siempre han representado
una singular molestia científica. El hecho de que la teoría indique que la fuerza gravitacional
en el corazón de los agujeros negros es infinita indica un grave problema: justamente ahí
la teoría de la relatividad general deja de ser válida. Así, por algún tiempo se consideró
que los agujeros negros son un truco que nos juegan las matemáticas. Sin embargo, los
teóricos plantearon que, al igual que las estrellas compuestas enteramente de neutrones, los
agujeros negros son los cadáveres de estrellas más grandes que la nuestra. La confirmación
de la existencia de las estrellas de neutrones en los 1960s y observaciones indirectas del
movimiento de estrellas alrededor de regiones oscuras condujeron a la certeza de que hay
muchos agujeros negros en el universo, y de que pueden tener masas de millones de veces
la del Sol.
Además, los agujeros negros, aunque no son las típicas aspiradoras cósmicas que nos
pintan, sí absorben grandes cantidades de materia de su vecindario cósmico, creando a
su alrededor un anillo de material incandescente que emite radiación, llamado disco de
acreción. Esta radiación predicha por la teoría ha sido confirmada especialmente en el
centro de galaxias como la nuestra. En la Vía Láctea, el movimiento de un grupo de
estrellas alrededor del centro de la galaxia, “perseguido” por astrónomos desde los 1990s,
ha revelado que ahí habita un cuerpo relativamente pequeño y oscuro con masa de casi 3
millones de veces la del Sol y que emite radiación según las predicciones para un agujero
xvii
negro. Si esto no bastara, en 2011 se observó un disco de acreción con emisión de radiación
X, consistente con las predicciones de agujeros negros con masas de miles de millones de
veces la de nuestra estrella absorbiendo el material de un quásar.
La última serie de observaciones indirectas de los agujeros negros tiene que ver con las
ondas gravitacionales. A pesar de que éstas pueden producirse con cualquier movimiento
acelerado (hasta un aplauso las produce) de acuerdo a la teoría, sólo ondas gravitacionales
generadas por violentos eventos cósmicos son capaces de producir ondas gravitacionales que
podamos detectar en la Tierra con sensores tan sensibles como para medir deformaciones
del espacio de una milésima del tamaño de un protón o menos. La detección de ondas
gravitacionales en 2015, galardonada en 2017 con el Premio Nobel, tuvo el reto de explicar el
origen de la detección. Supercomputadoras con sofisticados programas lograron demostrar
que la señal, de acuerdo con la relatividad, sólo es consistente con la colisión y mezcla de dos
agujeros negros con masas equivalentes a algunas decenas de veces la del Sol. De un golpe,
dos de las predicciones más controversiales de la relatividad fueron comprobadas ¡hace
apenas un par de años! Y la evidencia sigue acumulándose actualmente con la finalidad de
explorar posibles desviaciones de las predicciones de la teoría de Einstein y de encontrar
aplicaciones astronómicas del estudio de las ondas gravitacionales.
No sólo las ondas gravitacionales y los agujeros negros están bajo la lupa de los inves-
tigadores actualmente. Como decíamos, el modelo cosmológico de la gran explosión puede
explicar todas las observaciones de la dinámica del universo bajo suposiciones muy senci-
llas sobre la geometría del espacio–tiempo y una suposición sobre el contenido del cosmos
basada en mediciones recientes: un 5 % es materia como la que hay en nuestro planeta,
un 27 % es un tipo de materia denominado materia oscura que no emite luz, y un 68 %
del contenido cósmico es una forma de energía apodada energía oscura que provoca la
expansión acelerada que observamos.
El mayor misterio es que nadie tiene la menor idea de qué son la materia y la energía
oscuras. No es nada que hayamos podido observar directamente hasta ahora, aunque hay
suficiente evidencia indirecta para afirmar que esas “sustancias” o algo que tiene los mismos
efectos existe. Hay quienes, no obstante, están convencidos de que debemos modificar lige-
ramente las ecuaciones básicas de la relatividad general para percatarnos de la verdadera
naturaleza de esas entidades oscuras. Otros consideran que sólo la inmensamente desafiante
búsqueda de la compatibilidad de la relatividad general y la mecánica cuántica disipará
nuestras dudas.
Y esta mezcla nos conduce hoy de regreso a los agujeros negros. El interior de los
agujeros negros, por ser inobservable, es totalmente desconocido. Lo único que sabemos
es que la gravedad debe ser tan intensa en su interior que podría tener efectos sobre las
partículas más diminutas comparables con los efectos producidos por las fuerzas cuánticas
que, según la física de partículas, rigen su comportamiento. De ser así, es posible que ahí
se manifieste una forma de gravedad cuántica, que debemos teorizar con base en lo que
hemos comprobado en el último siglo.
xviii Introducción
Pero incluso para los menos interesados en los aspectos fundamentales de la gravedad,
la teoría de la relatividad ofrece hoy herramientas modernas importantes. Además de ser
relevante en el sistema de posicionamiento global (GPS), es crucial en las observaciones
astronómicas. La desviación de la luz debida a su paso cerca de formaciones galácticas,
estrellas, planetas, etc. provoca un desplazamiento en la posición real de las estrellas y
galaxias con respecto a la aparente. Pero no es el único efecto. Si detrás de un cuerpo
astrofísico muy masivo habita una galaxia, la desviación de los haces de luz emitidos por
la galaxia en todas direcciones pueden ser desviados hacia nosotros en todo el contorno del
“estorbo” astrofísico. A este efecto se le llama lente gravitacional. Las lentes gravitacionales
no sólo permiten caracterizar lo que hay detrás de los objetos observables que provocan la
desviación de la luz, sino también, cuando se presentan en regiones donde no hay obstáculos
visibles, nos exhiben propiedades de objetos inobservables, como los agujeros negros y
formaciones de materia oscura, que aún no han sido descritos completamente.
La relatividad, a pesar de su edad, sigue siendo un tesoro en desarrollo, cuyas preguntas
y respuestas plantean retos actuales que probablemente se convertirán en la base de los
descubrimientos futuros y de un cambio de paradigma como el que vivieron los testigos de
la osadía de Einstein. La pregunta que podemos formularnos es si queremos ser los futuros
físicos que estarán en el corazón de esa previsible revolución o no.
Capítulo 1
Fundamentos de la relatividad
especial
1.1. Introducción
Desde el siglo XVII, Galileo Galilei introdujo el elemento clave para la relatividad: el
principio de la relatividad. En su versión, establece que todas las leyes físicas son las
mismas en cualquier sistema moviéndose con una velocidad uniforme con respecto a otro
sistema en reposo absoluto (después llamaremos a estos sistemas inerciales).
La mecánica de Newton se desarrolló basada en este principio, encontrando que dos
axiomas adicionales eran necesarios para que las teorías fueran consistentes:
Durante dos siglos, estos axiomas fueron considerados correctos. Sin embargo, el descubri-
miento de la electrodinámica y, en particular, el hecho de que E y B satisfacen la ecuación
de onda en el vacío
1 ∂2 2 1 ∂2 2 1
2 2
−∇ E =0= 2 2
− ∇ B, c2 = , (1.1)
c ∂t c ∂t µ0 ǫ 0
produjeron un cambio de paradigma. Primero, para Maxwell esto fue una señal clara de que
la luz era efectivamente una onda electromagnética gobernada por los campos E y B. En
segundo lugar, estas ecuaciones de onda no son invariantes bajo las transformaciones que
Galileo y Newton propusieron para relacionar los puntos de vista de observadores inerciales
(ver problema 1.3 y la sección 1.3).
2 Fundamentos de la relatividad especial
rapidez
del éter
v
arrastre
del éter
v L = 11 m
espejo
brazo 2
divisor √
de haz c c2 − v 2
=⇒ L
fuente de luz espejo
c+v
c−v brazo 1
patrón de L
interferencia
Figura 1.1: Interferómetro de Michelson y Morley. Un haz de luz es dividido a lo largo de dos
direcciones perpendiculares (los brazos del interferómetro). Tras recorrer un distancia L, los haces
son reflejados hacia el divisor de haz, que los recombina y dirige hacia un observador. En caso de
que el éter exista y se desplace en la dirección de uno de los brazos, se debería observar un patrón
de interferencia.
1.2 El experimento de Michelson–Morley 3
recta del espejo y la fuente, se colocan otro espejo y una lente donde habrá un observador.
Los caminos perpendiculares por los que se desplazan los haces se conocen como brazos del
interferómetro. Los haces de luz que surgen del divisor de haz recorren la misma distancia
L = 11m hasta los espejos, de ida y regreso, para ser recombinados y proyectados hacia
el punto de observación. Dado que la Tierra se desplaza, se espera que el éter exhiba una
velocidad de arrastre v en la dirección opuesta a la dirección de movimiento del planeta,
a lo largo de la cual deberá ubicarse uno de los brazos del interferómetro. Debido a esta
diferencia, suponiendo que las velocidades del movimiento se componen trivialmente (como
sumas y restas vectoriales), deberíamos observar un patrón de interferencia en el punto de
observación.
Del lado derecho de la figura 1.1, se presenta un diagrama de las velocidades efectivas
del haz a lo largo de los brazos del interferómetro de Michelson-Morley. Calculando el
tiempo de viaje por los brazos, empleando las distintas velocidades, obtenemos
Por lo tanto, la diferencia entre los tiempos de viaje de la luz por los brazos del interferó-
metro está dada por
2Lγ
∆T = T1 − T2 = (γ − 1) . (1.4)
c
Dada la diferencia ∆T 6= 0 (debido a que la velocidad de arras-
tre del éter es v 6= 0), la teoría ondulatoria de la luz indica que el v
patrón de interferencia a observar está caracterizado por la cons-
tante c∆T /λ, donde λ denota la longitud de onda del haz de luz.
Sin embargo, Michelson y Morley no detectaron ningún patrón de
interferencia. Es posible concebir que el éter, por alguna razón, Figura 1.2: Dirección del
fluya en una dirección diagonal que iguale la rapidez con la que éter propuesta para jus-
se desplaza la luz a lo largo de ambos brazos del interferómetro, tificar los resultados.
como se muestra en la figura 1.2. En ese caso se obtendría ∆T = 0,
justificando el resultado nulo del experimento. Sin embargo, tras rotar el experimento el
resultado seguía siendo el mismo. El experimento fue confirmado muchas veces, cada vez
con mayor resolución1 .
El irlandés George Francis FitzGerald en 1889 e, independientemente, el holandés Hen-
drik Antoon Lorentz en 1892 propusieron una resolución al resultado nulo de Michelson y
1
Ver e.g. G. Joos. Die Jenaer Wiederholung des Michelsonversuchs. Ann. Phys. 7, 1930.
4 Fundamentos de la relatividad especial
Morley, insistiendo en la existencia del éter. De alguna manera, esta sustancia contrae los
objetos en la dirección de la corriente etérea, siguiendo la regla
L 2L′ γ 2 2Lγ
L′ = =⇒ T1 = = = T2 . (1.5)
γ c c
Entonces, como se esperaba, el patrón de interferencia no aparecía.
Pero esta propuesta estaba lejos de la respuesta final. Entre otras cosas, aunque intere-
sante, no resolvía el problema de la indetectabilidad del éter. La solución correcta llegaría
con una interpretación radical del resultado de Michelson y Morley: ¡la rapidez de la luz c es
siempre la misma en el vacío! Como veremos en breve, esto condujo a resultados contrain-
tuitivos que, en gran medida, contradecían la dominante física Newtoniana y la relatividad
Galileana.
x′ = Gx, (1.7)
ct′ = ct,
′ v
x1 = x1 − vt = x1 − (ct), transformación de Galileo
c (1.8)
′
x2 = x2 ,
′
x3 = x3 .
′
x1 x1
′
x3 x3
Figura 1.3: Marco de referencia S ′ moviéndose con velocidad v con respecto a S.
6 Fundamentos de la relatividad especial
ejemplo, se puede mostrar fácilmente que la segunda ley de la mecánica no se altera. Para
ello, diferenciamos las coordenadas de los puntos p y p′ , obteniendo
′ v ′ ′ v
x1 = x1 − x0 =⇒ u1 ≡ ẋ1 = u1 − ẋ0 = u1 − v,
c c
2′
x = x2 =⇒ 2′ 2′
u ≡ ẋ = u ,2 (1.9)
′ ′
x2 = x2 =⇒ u3 = u3 ,
donde hemos definido x0 ≡ ct, por conveniencia, y las derivadas temporales pueden con-
siderarse con respecto a t en p y p′ debido a la universalidad del tiempo en la mecánica
Newtoniana. Diferenciando otra vez, hallamos que
′ ′
a1 = u̇1 = a1 ,
′
a2 = a2 , (1.10)
3′
a = a3 ,
f ′ = ma′ = ma = f , (1.11)
Las transformaciones descritas por G = G(v) con la operación básica del producto entre
matrices forman un grupo (a veces denominado grupo de Galileo); es decir, el conjunto
de todas las transformaciones que pueden expresarse por medio de (1.12) satisface las
siguientes propiedades:
′
x0 = ct x0
x1 = x0
arctan vc
′
x1 , x1
Figura 1.4: Diagrama de espacio–tiempo para dos marcos de referencia en configuración estándar.
El marco de referencia S tiene coordenadas (x0 , x1 ). La ecuación que satisface el eje vertical en S
′
es x1 = 0, mientras que en S ′ es x1 = 0 o equivalentemente x1 − vc x0 = 0.
8 Fundamentos de la relatividad especial
Supongamos que los marcos S y S ′ están en configuración estándar. Esto quiere decir
particularmente que los diagramas de espacio–tiempo de ambos marcos de referencia coin-
′ ′
ciden en el origen, xi = xi = 0 y x0 = x0 = 0. Supongamos también que el marco de
referencia en reposo S es nuestro marco preferencial y que la velocidad de S ′ con respecto a
S es v > 0. Deseamos conocer la percepción de un observador en S ′ acerca de las posiciones
de las partículas en el universo.
En la figura 1.4, además de los ejes x0 y x1 del sistema de referencia S, que satisfacen
′ ′
x0 = 0 para el eje x1 y x1 = 0 para el eje x0 , se presentan los ejes x0 y x1 del sistema
′ ′
de referencia S ′ . Para construir el eje x1 exigimos x0 = 0; vemos que coincide con el
eje x1 debido a que en las transformaciones Galileanas el tiempo es absoluto, o sea, es
′ ′
el mismo en S y S ′ . En cambio, el eje x0 sí cambia. Exigiendo x1 = 0 y aplicando la
transformación de Galileo (1.8), obtenemos x1 = x1 − vc x0 = 0, lo que implica que el eje
′
′
arctan(v/c) aumenta, incrementando la inclinación de x0 con respecto a x0 . Notamos que
no existe ninguna razón especial por la que arctan(v/c) no pueda tener cualquier valor; en
particular, nada impide que v pueda ser mayor a c (correspondiente a la línea punteada en
la figura). Adicionalmente, si la velocidad de S ′ fuera en la dirección opuesta (v < 0), el
′
eje x0 estaría del lado izquierdo del eje x0 .
Para un observador en S, un objeto en reposo describe una curva vertical, paralela
′
a x0 . Pero, para un observador en S ′ , el reposo se traduce en una curva paralela a x0 .
′ ′
La intersección de cada línea paralela a x0 con el eje x1 define un valor diferente de
posición. Por lo tanto, en general la posición de una partícula medida por un observador en
S no coincide con la posición que otro observador en S ′ obtiene. Entonces, una partícula
en reposo en la perspectiva de S, es una partícula que, a medida que avanza el tiempo,
′
cambia de posición hacia valores cada vez más pequeños (más grandes) de x1 en S ′ si v > 0
(v < 0).
′
x0 x0
O1 O2
′
x1 , x1
Figura 1.5: Varilla de longitud ℓ en S.
−v 3 0 0 1 x3
10 Fundamentos de la relatividad especial
distancias en un determinado espacio son conocidas como isometrías del espacio. Por lo
tanto, las transformaciones Galileanas son isometrías de nuestro espacio 3-dimensional.
Una pregunta interesante es si esta invariancia puede extenderse a las cuatro dimensio-
′
nes codificadas en (x0 , x1 , x2 , x3 )T . De hecho, como (∆x0 )2 = (∆x0 )2 = 0 por la universa-
lidad del tiempo, se satisface en este caso particular que
2. la luz en todos los marcos de referencia inerciales (en el vacío) se mueve con la
misma rapidez; y
transformaciones de Lorentz.5
Supongamos que S y S ′ están en configuración estándar o que, usando el tercer postula-
do, se pueden llevar a esa forma. Consideremos un reloj moviéndose libre y uniformemente
en S a lo largo de la curva
dxi
xi = xi (t) , tal que = cte . (1.20)
dt
Definimos el tiempo propio τ , el cual es el tiempo medido desde la perspectiva del propio
reloj. Como el tiempo es homogéneo (i.e. hay simetría en el tiempo), entonces
dt dx0
= cte =⇒ = cte . (1.21)
dτ dτ
De (1.20) y (1.21), se obtiene la relación
dxµ d2 xµ
= cte =⇒ = 0, (1.22)
dτ dτ 2
la cual debe mantenerse en S ′ por estar asociada a la segunda ley de Newton. La derivada
′
de xµ puede expresarse como
′ 3
X ∂xµ dxν ′ ′
dxµ ∂xµ dxν
= ≡ ,
dτ ∂xν dτ ∂xν dτ
ν=0
′
x0 x0
′
x1 = 0
x1
′
Figura 1.6: Eje x0 del marco de referencia S ′ observado por S, cuando S ′ se mueve con rapidez
v > 0 en la dirección x1 de S.
Esta ecuación es muy importante, pues implica que las transformaciones que surgen de los
postulados de la relatividad especial son lineales, i.e.
′ ′
xµ = B µ ν xν , (1.24)
′
donde B ≡ (B µ ν ) es una matriz 4 × 4 que codifica las transformaciones conocidas como
transformaciones de Lorentz.
′
Como en las transformaciones de Galileo, esperamos que el eje temporal x0 en S ′ esté
descrito por
v
x1 = x0 , (1.25)
c
′
que corresponde a x1 = 0, como se observa en la figura 1.6. Imponemos ahora esta res-
tricción en (1.24) como un siguiente paso en nuestra búsqueda de la expresión de las
transformaciones de Lorentz. A partir de (1.24), se obtiene que
′ ′ ′ ′ ′ ′
x1 = B 1 ν xν = B 1 0 x0 + B 1 1 x1 + B 1 2 x2 + B 1 3 x3
′ v ′ (1.26)
′ ′ !
= B 1 0 + B 1 1 x0 + B 1 2 x2 + B 1 3 x3 = 0,
c
en donde hemos sustituido (1.25) en la segunda igualdad. Esta condición se satisface sólo
si cada componente es nula, i.e.
′ v ′ ′ ′
B1 0 + B1 1 = B1 2 = B1 3 = 0 , (1.27)
c
lo que implica que
′ ′
x1 = (−βx0 + x1 )B 1 1 , (1.28)
1.4 Transformaciones de Lorentz y relatividad especial 13
′
x0 x0
′
x1
′
Figura 1.7: Eje x0 del marco de referencia S ′ observado por S, cuando S ′ se mueve con rapidez
v < 0 en la dirección x1 de S.
′
con β = v/c, como antes. Notemos que B 1 1 solamente debe depender de la velocidad relati-
va v entre los marcos de referencia porque lo único que distingue a S de S ′ es precisamente
′
v. Además, la isotropía del espacio–tiempo permite que B 1 1 no dependa de la dirección de
v, sino sólo de la rapidez |v|.
Podemos hacer el ejercicio análogo, pero ahora desde el punto de vista de S ′ , es decir,
considerando que S ′ es el marco de referencia en reposo. S es ahora un marco de referencia
en movimiento en la dirección x1 , pero en la dirección opuesta a como S observa que S ′ se
mueve, como se ilustra en el diagrama de espacio–tiempo 1.7. En este escenario, obtenemos
que la exigencia x1 = 0 que describe el eje temporal de S conduce a
′ ′
x1 = B 1 1′ (βx0 + x1 ) . (1.29)
Como en ambos casos el prefactor sólo depende de |v|, podemos suponer que ambos son
iguales a una constante por determinar, i.e.
′
B 1 1′ = B 1 1 ≡ γ. (1.30)
1
γ=p . factor de Lorentz (1.35)
1 − β2
Es interesante observar que el factor de Lorentz obtenido aquí coincide con el obtenido por
FitzGerald y Lorentz, ecuación (1.3), en el contexto de su teoría del éter, también conocida
como electrodinámica Lorentziana. Es esta coincidencia histórica la que condujo al nombre
de esta constante.
′
Ahora, con ayuda de (1.28) y (1.29), reemplazamos x1 = γ(−βx0 + x1 ) en x1 =
′ ′
γ(βx0 + x1 ) y encontramos
′ ′
x1 = γ(βx0 − γβx0 + γx1 ) = γβx0 − γ 2 βx0 + γ 2 x1 , (1.36)
′ 1 − γ2 1
x0 = γx0 + x = γ(x0 − βx1 ) . (1.37)
γβ
Esta ecuación es uno de los hallazgos más relevantes de la relatividad especial. En contras-
te con las transformaciones de Galileo, bajo transformaciones de Lorentz, el tiempo no es
absoluto. En dos marcos de referencia inerciales con una rapidez relativa, β 6= 0, las me-
′
diciones del tiempo no son iguales. Consecuentemente, dado que en general ∆x0 6= ∆x0 ,
′
∆x0 = 0 no significa que ∆x0 = 0, por lo que la simultaneidad es relativa. 6
En resumen, hemos encontrado que las transformaciones de Lorentz están dadas por
′
x0 =γ(x0 − βx1 ),
′
x1 =γ(−βx0 + x1 ), boost de Lorentz
2′ 2
(1.38)
x =x ,
′
x3 =x3 ,
6
Como una nota histórica, en la teoría Lorentziana del éter el concepto de tiempo local, definido como
t = t − vt/c2 , también estableció la relatividad de la simultaneidad, como identificó Henri Poincaré desde
′
1900. Aunque el tiempo local fue originalmente introducido como un artefacto matemático, Poincaré fue
quien descubrió que conducía a importantes efectos físicos, como este.
1.4 Transformaciones de Lorentz y relatividad especial 15
cuando el marco de referencia S ′ se mueve con velocidad uniforme v = (v, 0, 0)T con res-
pecto a S. Las ecuaciones (1.38) definen una transformación de Lorentz en una dimensión,
′
conocida como boost de Lorentz.7 En términos de la matriz B = (B µ ν ), los boosts se pueden
reescribir como
γ −βγ 0 0
−βγ γ 0 0
x′ = Bx, B= 0
. (1.39)
0 1 0
0 0 0 1
Se puede mostrar directamente que la transformación de Lorentz para una determinada β
satisface B −1 (β) ≡ (B µ ν ′ ) = B(β → −β), tal como lo hacen las transformaciones Galilea-
nas.
Mientras que los boosts de Lorentz dependen del factor de Lorentz (1.35), las transfor-
maciones de Galileo dependen sólo linealmente de β. Esta diferencia es muy importante.
Supongamos que un marco de referencia S ′ se desplaza con una rapidez mayor a c. Clara-
mente, en este caso β 2 > 1 y consecuentemente γ no tiene un valor real. De acuerdo a las
ecuaciones (1.38), un observador en S ′ sería incapaz de definir sus coordenadas espaciales
y temporales, ya que sus mediciones de distancia y tiempo tendrían valores imaginarios.
Estas inconsistencias hacen obligatorio establecer que la rapidez máxima que un marco de
referencia puede tener es justamente la de la luz, i.e. |v| ≤ c siempre. Y, como no existen
marcos de referencia que puedan desplazarse con rapidez por encima de c, no es posible
transmitir información más rápidamente de lo que es posible mediante un haz de luz. Una
consecuencia inmediata de esta observación es que la interacción a distancia de los sistemas
físicos no puede ser instantánea.
′ ′ ′
Por otra parte, notamos que, si se exige que x0 = x0 , entonces x1 + x1 = γ(x1 + x1 ),
lo que implica que γ = 1 y x1 = x1 − vc x0 . Este resultado coincide justamente con las
′
transformaciones de Galileo (1.8). Notamos también que cuando la rapidez con la que S ′
se mueve con respecto a S es despreciable, β ≪ 1, el factor de Lorentz se puede aproximar
como
1
γ ≈ 1 + β 2 + O(β 4 ) . (1.40)
2
Por lo tanto, observamos que e.g. la coordenada espacial puede expresarse como
′ 1
x1 ≈ x1 − βx0 + β 2 x1 + O(β 3 ) . (1.41)
2
Claramente, en la mecánica Newtoniana las velocidades de los sistemas son tales que β 2 →
0. Así, los términos de orden β 2 y menores se pueden considerar correcciones relativistas
a los resultados Newtonianos. En suma, la interpretación de estas observaciones es que las
7
Como veremos en la sección 1.9, las transformaciones de Lorentz forman un grupo que incluye los boost
y las rotaciones en tres dimensiones.
16 Fundamentos de la relatividad especial
transformaciones de Galileo son un caso especial de los boosts de Lorentz para observadores
inerciales con rapidez relativa muy pequeña con respecto a la rapidez de la luz, v ≪ c.
Otra consecuencia de los boosts de Lorentz (1.38) es que, a diferencia de lo que ocurre
en la mecánica Newtoniana, al considerar la relatividad especial es imposible hablar de
tiempo y espacio independientemente. El espacio y el tiempo se mezclan. El movimiento
relativo de diferentes marcos de referencia inerciales pone de manifiesto que, en realidad,
el tejido que sustenta la dinámica del universo es el espacio–tiempo. Este concepto podría
considerarse la contribución central de la relatividad a la ansiada búsqueda de un teoría
que unifique conceptual y matemáticamente la física en una única descripción.
La existencia del espacio–tiempo revela que el carácter paramétrico (tan especial) que
juega el tiempo en la física Newtoniana debe ahora ser adoptado por todas las coordenadas
del espacio–tiempo xµ si deseamos describir sistemas que se desplazan con una rapidez
suficientemente alta, tal que las correcciones de orden β n , con n ≥ 2, no sean despreciables.
A estos sistemas los llamamos sistemas relativistas. Un claro ejemplo de sistemas relativistas
son las partículas elementales libres. Discutiremos algunos detalles más respecto a esta
observación en la sección 1.11, en donde se abordarán algunos aspectos generales de las
teorías de campos cuánticos.
Para, entre otras cosas, poder establecer claramente en qué casos un evento tiene in-
fluencia sobre otro, es útil definir el intervalo entre eventos como la separación en espacio–
tiempo entre ellos. En el diagrama de espacio–tiempo 1.8 aparecen tres pares de eventos.
Aquellos conectados por la línea a π/4 se conocen como intervalos luminoides o ‘tipo luz’.
La diferencia en las coordenadas espacio–temporales de eventos conectados por intervalos
luminoides satisfacen ∆x0 = ±∆x1 . Si consideramos que la rapidez con la que la informa-
ción se transmite entre los eventos está dada por c|∆x1 |/|∆x0 |, entonces siempre es c; por
lo tanto, estos eventos tienen siempre una relación causal.
El segundo tipo de eventos se ejemplifica en la figura 1.8 por los eventos conectados
por una línea vertical. En este ejemplo particular, los eventos ocurren en el mismo lugar,
sólo están separados temporalmente. Notamos que se satisface |∆x0 | > |∆x1 | = 0. Es
decir, la velocidad a la que la información entre los eventos debe desplazarse es nula, y,
por lo tanto, claramente el evento del futuro es influenciado por el evento del pasado.
Esta observación es también cierta para eventos que no ocurren en el mismo lugar, pero
satisfacen |∆x0 | > |∆x1 | 6= 0. En ese caso, la rapidez con la que la información de un
evento pasado debe viajar a un evento futuro está dada por c|∆x1 |/|∆x0 | < c y, por lo
tanto, también existe una relación causal entre ellos. Los intervalos de este tipo se conocen
como intervalos temporaloides. Notamos, entonces, que los intervalos temporaloides pueden
representarse en un diagrama de espacio–tiempo como líneas verticales, pero también como
líneas con una pendiente mayor a 1.
Finalmente, los eventos conectados por una línea horizontal en la figura 1.8 son eventos
que ocurren simultáneamente y en lugares diferentes desde la perspectiva de un observador
x0
temporaloide x1 = x0
luminoide
espacialoide
x1
Figura 1.8: Ejemplos de intervalos entre dos eventos en diagramas de espacio–tiempo. Los inter-
valos luminoides o ‘tipo luz’ conectan eventos a lo largo de rectas en las que ∆x0 = ±∆x1 . Los
intervalos temporaloides o ‘tipo tiempo’ conectan eventos que satisfacen |∆x0 | > |∆x1 |, como los
que ocurren en una misma posición espacial (línea vertical). Los intervalos espacialoides o ‘tipo
espacio’ corresponden a eventos que cumplen |∆x0 | < |∆x1 |, como los eventos simultáneos (línea
horizontal).
18 Fundamentos de la relatividad especial
en reposo. En este caso, notamos que |∆x1 | > |∆x0 | = 0, por lo que la rapidez con la que la
información entre los eventos debe transmitirse para que estén causalmente conectados es
infinita. Esto es una clara indicación de que los eventos en ese ejemplo no están relacionados
causalmente. Lo mismo se puede concluir de eventos que satisfacen simplemente |∆x1 | >
|∆x0 | =
6 0, pues en este caso la rapidez con la que la información de un evento pasado
debe viajar a un evento futuro es c|∆x1 |/|∆x0 | > c, lo cual está prohibido por las reglas
de los boosts de Lorentz. A intervalos que describen eventos como estos se les conoce como
espacialoides.
Frecuentemente, al referirnos a las posiciones de distintos objetos, también nos referi-
remos a intervalos a pesar de que, a primera vista, la posición de un objeto no define un
evento. Sin embargo, el evento al que hacemos referencia es a la medición de la posición
de un objeto, lo cual ocurre en una posición y un momento determinado. Por ejemplo, si
la posición de los dos extremos de una varilla es obtenida simultáneamente, el intervalo
entre los eventos de medición es espacialoide y, por lo tanto, no hay relación causal entre
el resultado de ambas mediciones.
El concepto de intervalo, definido como la separación espacio–temporal entre distintos
eventos, es expresado concretamente (en un espacio–tiempo plano) como
3
X
∆s2 ≡ (∆x0 )2 − (∆xi )2 = (∆x0 )2 − (∆xi )(∆xi ), (1.42)
i=1
de diferenciales, emplearemos también las diferencias ∆xµ , cuando así convenga en la dis-
cusión.
Mediante estas expresiones para el intervalo entre eventos, podemos clasificar de forma
práctica los pares de eventos. Claramente, de acuerdo a las definiciones de los distintos
tipos de intervalos, estos pueden clasificarse de acuerdo a
Como es imposible que un sistema físico alcance |u|2 > c2 , encontramos nuevamente la
conclusión previa de que no es posible que la información sea comunicada ni que exista
relación causal entre los eventos que forman parte de un intervalo espacialoide. Pero eventos
conectados por intervalos luminoides o temporaloides están vinculados causalmente.
Es interesante que el segundo postulado de la relatividad especial establece que si
∆s2 = 0, inmediatamente se obtiene que (∆s′ )2 = 0. Esto resulta evidente al reescribir la
primera parte de la expresión (1.45) de la forma
′ ′
ui ui = c 2 ⇐⇒ ui ui = c 2 . (1.46)
La invariancia del intervalo, expresada para cualesquiera dos sistemas de referencia iner-
ciales S y S ′ como
′
∆x0 = γ∆x0 ⇐⇒ ∆t = γ∆t′ . dilatación temporal (1.49)
1
∆t′ = ∆t → avanzan más rápido en S, (1.50)
γ
1.6 Dilatación temporal 21
o sea, un observador en S ′ aprecia que el tiempo corre a un ritmo menor en S. ¿Es esto una
paradoja? La razón de esta aparente “paradoja” es la relatividad del movimiento. Cuando
′
∆xi = 0 en el marco de referencia en movimiento S ′ y medimos tiempos desde el punto
de vista del marco en reposo S, encontramos
′ ′ 1
∆x0 = γ∆x0 ⇐⇒ ∆x0 = ∆x0 , (1.52)
γ
′
donde el tiempo en el marco en movimiento, ∆x0 , parece más corto desde el punto de vista
de S. De manera similar, desde el punto de vista de S ′ es S el que se mueve. Así, si hay
dos eventos tales que ∆xi = 0, entonces
′ 1 ′
∆x0 = γ∆x0 ⇐⇒ ∆x0 = ∆x0 . (1.53)
γ
′
Notemos que los eventos para los cuales ∆xi = 0 y ∆xi = 0 solamente pueden coincidir
para β = 0, es decir, en general son eventos distintos.
¿Realmente significa que el tiempo disminuye su ritmo para sistemas en movimiento?
Desde el punto de vista de sistemas en reposo (llamémosles laboratorio), la respuesta es sí.
Ejemplo 1.1.
Un muón es una partícula elemental inestable que tiene las mismas cargas y espín que el
electrón, pero su masa es aproximadamente 200 veces la masa del electrón. Consideremos
el movimiento de un muón producidos por el impacto de rayos cósmicos en la atmósfera.
Típicamente, los muones son producidos a una altitud de 15 kilómetros con una rapidez de
aproximadamente 0.9997 c. Los muones no son estables y decaen en otras partículas en un
tiempo de 2.2 µs en reposo. Sin dilatación temporal, el muón viajaría aproximadamente
660 metros en la atmósfera. Sin embargo, son detectados en la superficie terrestre.
Como los muones generados por los rayos cósmicos se mueven a velocidades relativistas,
debemos considerar la dilatación temporal (1.49). Con β = 0.9997, vemos que el tiempo de
vida del muón, desde el punto de vista del laboratorio es
′
∆x0 = γ∆x0 ≈ 40.8(2.2 µs) ≈ 89.8 µs. (1.54)
Por lo tanto, el muón puede viajar hasta 27 kilómetros si no es detenido por la materia en
el suelo. Este efecto es suficiente para mostrar que la dilatación temporal sí ocurre.
22 Fundamentos de la relatividad especial
En el ejemplo anterior supusimos que el muón describe una trayectoria normal con
′
la misma velocidad, pero eso podría no ser cierto en general. En lugar del tiempo x0 en
cada uno de los marcos de referencia que el muón adopte, es más conveniente considerar al
tiempo medido por la partícula en movimiento a lo largo de su línea de universo arbitraria.
A este tiempo es lo que llamamos tiempo propio τ .
Dado que, desde su propia perspectiva, un sistema con tiempo propio τ no está en
movimiento, instantáneamente podemos asegurar que dxi = 0. Así,
Como el intervalo es invariante para cualquier observador inercial, ds2 = ds′2 , a partir de
la ecuación (1.55) concluimos que el tiempo propio también lo es:
Esto implica que, aunque el tiempo t no es universal, el tiempo propio τ sí lo es; es decir
todo observador inercial mide el mismo tiempo τ asociado a un sistema en una trayectoria
espacio–temporal arbitraria, pero es diferente al tiempo local t del observador a menos de
que éste se desplace en la misma trayectoria que el sistema observado.
Otra observación importante es que resulta imposible definir el tiempo propio para
intervalos espacialoides, ya que si ds2 < 0 entonces también dτ 2 es negativo y, consecuen-
temente, el tiempo propio es imaginario. Pero esto no es una sorpresa, pues el tiempo propio
está definido como el tiempo de un sistema físico en movimiento medido desde su propio
marco de referencia y, como hemos visto, la imposibilidad de rebasar la rapidez de la luz
impide que exista un sistema físico que se desplace a lo largo de trayectorias espacialoides.
Ahora consideremos el marco de referencia del laboratorio S (en reposo) y el movimiento
(arbitrario) de un sistema con tiempo propio τ . De c2 dτ 2 = ds2 se obtiene que
q
cdτ = (dx0 )2 − dxi dxi
r
0 dxi dxi
= dx 1 − 0 0 (1.57)
r dx dx
|u|2
= dx0 1 − 2 ,
c
i
donde hemos definido ui ≡ dx
dt , que es la i-ésima componente de la velocidad del sistema
en movimiento, medida por un observador en el laboratorio S. Podemos reescribir esta
relación como
1 dτ 1
cdτ = dx0 ⇐⇒ = . (1.58)
γ(u) dt γ(u)
1.7 Un primer vistazo a 4–vectores 23
d µ′ ν
′
′ dxµ µ′ dx
ν
Uµ = = B ν x = B ν ,
dτ ′ dτ dτ
donde hemos empleado en la segunda igualdad la invariancia de τ , y en la tercera igualdad
′
que dB µ ν /dτ = 0 porque dγ/dτ = γ 4 v · a/c2 = 0 y dβ/dτ = γu · a/uc = 0 para
observadores inerciales con velocidad v con respecto al reposo. Esta ecuación conduce a
′ ′
U µ = B µ ν U ν , que coincide con la transformación de dx debida a un boost de Lorentz.
Por otra parte, la velocidad local (uµ ) del marco de referencia S se transforma como
′ ′ ′
′ dxµ B µ ν dxν B µ ν xν
uµ = = c = c . (1.61)
dt′ dx0′ B 0′ σ x σ
′
De hecho, como ui es una componente de la velocidad u′ medida en S ′ de un cuerpo
en movimiento en S con velocidad u, la ecuación (1.61) representa la regla de adición de
10
La línea de mundo (o worldline) es la trayectoria en el espacio–tiempo que describe un sistema en
movimiento, parametrizada por una variable temporal.
24 Fundamentos de la relatividad especial
velocidades relativista. Para hacerlo evidente, consideremos que S ′ se mueve con respecto
′
a S con velocidad v = (v, 0, 0)T , entonces uµ está asociada con un boost de uµ a lo largo
de la dirección x1 . Se obtiene, con γ = (1 − β 2 )−1/2 , que para un boost de Lorentz en la
dirección x1 la ecuación (1.61) se expresa en componentes como
1
1′ cγ(dx1 − βdx0 ) c( dx
dx0
− β)
u = 0 1
= dx1
,
γ(dx − βdx ) 1 − β dx 0
i
(1.62)
dx
i′ cdxi c dx 0
u = = 1 , i = 2, 3,
γ(dx0 − βdx1 ) 1 − β dx
dx0
de donde concluimos que la regla de adición de velocidades para un boost en x1 está dada
por
′ u1 − v ′ ui
u1 = vu1
, ui = , i = 2, 3. adición de velocidades (1.63)
1− vu1
c2 γ 1− c2
pµ = mU µ , 4–momento
µ µ (1.66)
f = mA 4–fuerza
1.7 Un primer vistazo a 4–vectores 25
en un sistema con masa en reposo m. Con estas definiciones y la ecuación (1.65), nos
percatamos de que la segunda ley de Newton se preserva para 4–vectores, i.e.
dpµ
.fµ = (1.67)
dτ
Por definición, notamos también que ambos, p = (pµ ) y f = (f µ ), se transforman como dx
y, por lo tanto, son 4–vectores.
Se pueden definir cantidades adicionales que son 4–vectores, tales como
p
k = (k µ ) = , 4–vector de onda
~
J = (J µ ) = ρU, 4–corriente (ρ es la densidad de carga en reposo)
A = (Aµ ) = (φ, A)T . 4–potencial electromagnético
Mientras las coordenadas espaciales de los 4–vectores se interpretan como los vectores
propios de sus cantidades correspondientes, la componente 0 requiere una explicación adi-
cional. Consideremos como ejemplo el 4–momento p. Cuando la rapidez u = |u| del sistema
es pequeña comparada con c, es posible expresar p0 como
0 0 1 u2 1 2 1 2
p = mU = mcγ(u) ≈ mc 1 + + ... = mc + mu + . . . , (1.68)
2 c2 c 2
en donde la aproximación resulta de desarrollar γ(u), con u/c ≪ 1, en una serie de Taylor.
Aunque identificamos fácilmente a 21 mu2 como la energía cinética del sistema desde el
punto de vista de S, el primer término es más complicado.
Para u = 0, p0 = 1c mc2 está totalmente determinado por la masa inercial (invariante)
del sistema en su propio marco de referencia. Como mc2 aparece al mismo nivel que 21 mu2 ,
Einstein argumentó que este término debe ser interpretado como la energía inercial de un
sistema en reposo, su propia energía potencial. Los términos restantes son potencias de
u2 , estos pueden ser consideradas correcciones relativistas, sólo relevantes para velocidades
grandes, u2 ≈ c2 , con unidades de energía. Y esta última es una observación crucial.
Para Einstein, esto significaba que
E 1
p0 ≡ = γ(u)mc2 , (1.69)
c c
donde E es la energía total del sistema. Podemos reescribir la interpretación anterior como
E = γ(u)mc2 que, para un partícula en reposo, u = 0, se reduce a la fórmula más conocida
de la física,11 E = mc2 . La ecuación (1.69) fue la conclusión más relevante del artículo de
11
Algunos autores introducen a este nivel el oscuro concepto de masa relativista, M ≡ γ(u)m, mediante el
cual obtienen E = M c2 . Interpretan M como una “masa debida al movimiento” de un sistema. Esto pareciera
indicar que la estructura de una partícula es modificada por su movimiento, lo cual no es correcto. Por esta
razón, no emplearemos ese concepto en este texto.
26 Fundamentos de la relatividad especial
e− γ
e+ γ
e− + e+ → γ + γ
Figura 1.9: Aniquilación electrón–positrón que resulta en luz con la energía equivalente a la masa
del par.
Esto implica que para que u alcance el valor c, el sistema debe tener una energía infinita.
Así establecemos la imposibilidad de que un sistema masivo alcance la rapidez de la luz.
Actualmente, en el acelerador de partículas más poderoso construido, cada par de protones
alcanza (con masa total de casi 2 GeV/c2 ) la enorme energía de 13 TeV. Sustituyendo,
obtenemos que la rapidez de estas partículas es 99.999998 % de la rapidez de la luz.
Volviendo a nuestra discusión sobre el 4–momento, el correspondiente 4–vector puede
ser escrito como T
E
p= ,p ≡ (γ(u)mc, γ(u)mu)T , (1.70)
c
donde hemos empleado (1.69) y definido el momento propio p ≡ γ(u)mu en compatibilidad
con (1.60). En estos términos, encontramos la relación entre el momento propio y la energía
1.7 Un primer vistazo a 4–vectores 27
de un sistema relativista
E
u.p= (1.71)
c2
Por otra parte, aplicando la hipótesis de De Broglie al 4–momento, podemos obtener el
4–vector de onda k = (k µ ):
p E p T ~ω k~ T ω T
k= = , = , = ,k . (1.72)
~ c~ ~ c~ ~ c
Hemos usado en la tercera igualdad la hipótesis de los cuantos de Planck, E = ~ω, donde
ω es la frecuencia cuántica de la onda asociada al sistema. La ecuación (1.72) indica que
la componente 0 del 4–vector de onda es la frecuencia de onda.
Como dijimos antes, las componentes V µ de un 4–vector V deben ser transformadas
como las de dx, i.e.
′ ′
V µ = Bµ ν V ν , (1.73)
al ser observadas por distintos observadores inerciales. Sin embargo, como también hemos
visto, no todas las cantidades físicas se pueden codificar en 4–vectores, pues algunas son
invariantes para todos los observadores inerciales o, en términos técnicos, invariantes o
escalares de Lorentz. Además de la masa en reposo m de un sistema y de la rapidez de
la luz c, hemos visto que ds2 y dτ 2 son escalares de Lorentz. Es posible construir otras
cantidades escalares con base en los 4–vectores.
Con esta finalidad, definiremos el producto escalar en el espacio–tiempo. Recordemos
primero que
ds2 = c2 dτ 2 = dx0 dx0 − dxi dxi . (1.74)
Esta expresión se asemeja al producto escalar “típico” salvo por el signo peculiar, el cual
permite la existencia de intervalos espacialoides, para los cuales ds2 < 0. Con estas obser-
vaciones, resulta razonable proponer que el espacio vectorial de cuatro dimensiones de los
marcos de referencia inerciales está dotado con el producto interior indefinido12 dado por
A · B ≡ A0 B 0 − Ai B i , (1.75)
lo cual es una constante universal. Además, vemos que de la definición (1.70) obtenemos
E2
p · p = p0 p0 − pi pi = − |p|2 . (1.77)
c2
Comparando (1.76) y (1.77), obtenemos
E2
− |p|2 = m2 c2 ⇐⇒ E 2 = m2 c4 + |p|2 c2 , (1.78)
c2
d(U · U ) dU
= 0 = 2U · = 2U · A ; (1.80)
dτ dτ
es decir, la 4–velocidad U es siempre “perpendicular en el espacio–tiempo” 13 a la 4–
aceleración A, tal como ocurre en la mecánica Newtoniana cuando la velocidad tridimen-
sional satisface v · v =cte. La diferencia es que, mientras que en la mecánica Newtoniana
v·a = 0 sólo para algunos casos (como el movimiento circular uniforme), en espacio–tiempo
U · A = 0 es siempre válida.
x0
′
x0
′
x0 x0 ′
x1 = βx0
arctan β
arctan β
′
x1
x0 = βx1
arctan β
′
x1 arctan β x1
′
referencia. En la sección 1.4 supusimos que el eje x0 de un marco inercial S ′ coincide
en los tratamientos relativistas de Newton y Einstein (ver figura 1.6). Esta suposición,
aunada a la universalidad de la rapidez de la luz, condujo a las transformaciones relativis-
′
tas (1.38). Ahora podemos usar estas transformaciones para encontrar también el eje x1
en la perspectiva de un observador en S:
′ ′
Eje x0 : x1 = γ(x1 − βx0 ) = 0 =⇒ x1 = βx0 ,
′ ′ (1.81)
Eje x1 : x0 = γ(x0 − βx1 ) = 0 =⇒ x0 = βx1 .
En la figura 1.10(a) se muestran las rectas descritas por la ecuación (1.81), correspondientes
′ ′
a los ejes x0 y x1 . La forma de este diagrama es el resultado de la mezcla de espacio y
tiempo por efecto de los boosts de Lorentz, una manifestación de que un observador inercial
no puede tratar al espacio y el tiempo de manera independiente. La comprensión de que el
espacio y el tiempo xi y x0 están inexorablemente mezclados en el espacio–tiempo puede
ser considerada como la contribución de Einstein a la ambiciosa meta de unificación.
Es importante remarcar que el diagrama de espacio–tiempo 1.10(a) es la apreciación de
un observador localizado en S, en su propio sistema de referencia, de un marco de referencia
en movimiento S ′ . Un observador localizado en S ′ ve a S en movimiento con rapidez −β,
′ ′
con los ejes x0 y x1 determinados en términos de x0 y x1 , mediante las ecuaciones
′ ′ ′ ′
Eje x0 : x1 = γ(x1 + βx 0 ) = 0 =⇒ x1 = −βx0 .
′ ′ ′ ′ (1.82)
Eje x1 : x0 = γ(x0 + βx1 ) = 0 =⇒ x0 = −βx1 .
30 Fundamentos de la relatividad especial
Las curvas descritas por estas ecuaciones son los ejes espacio–temporales mostrados en la
figura 1.10(b).
Observando las diferencias en las figuras 1.10, notamos que, con relación a la curva
luminoide o curva nula x0 = x1 (que coincide para todos los observadores inerciales, como
el lector puede comprobar trivialmente), en los diagramas de espacio–tiempo los ejes de un
marco de referencia que se desplaza con β > 0 se acercan a la curva luminoide mientras
que se alejan si β < 0.
Una vez establecida la forma de los ejes en un diagrama de espacio–tiempo, es preciso
calibrarlos para poder comparar mediciones en los distintos marcos de referencia. Con este
propósito, empleamos la invariancia del intervalo
′ ′
∆s2 = (∆s′ )2 =⇒ (∆x0 )2 − (∆x1 )2 = (∆x0 )2 − (∆x1 )2 , (1.83)
donde supusimos, por simplicidad, ∆x2 = ∆x3 = 0. Además, podemos suponer que uno de
los eventos del intervalo ocurre en xµ = 0, lo que simplifica la invariancia del intervalo a
′ ′
(x0 )2 − (x1 )2 = (x0 )2 − (x1 )2 ≡ K , K = cte . (1.84)
x0
′
x0
1 x1
′
-2 -1 1 2 x1
-1
Figura 1.11: Las curvas hiperbólicas descritas por (1.84) permiten la calibración de los ejes. Para
cada constante positiva, las hipérbolas asignan un valor positivo y uno negativo a los ejes temporales
que intersequen. Cada constante negativa corresponde a una hipérbola que asigna un valor positivo
y otro negativo a los ejes espaciales que interseque.
1.8 Diagramas de espacio–tiempo y efectos relativistas 31
De esta expresión, encontramos que un observador en S mide que el tiempo entre ambos
eventos es proporcional a la distancia que separa a los eventos y a la velocidad relativa del
observador inercial en movimiento, ∆x0 = β∆x1 . Claramente, a menos de que β ≪ 1, los
observadores no estarán de acuerdo en que los eventos ocurrieron al mismo tiempo.
Existe una consecuencia adicional de que la simultaneidad sea relativa: no todos los
observadores inerciales pueden estar de acuerdo en el orden de la secuencia de eventos
(ver ejercicio 1.12). Para ilustrar este fenómeno relativista, consideremos dos eventos que
ocurren simultáneamente en S, en el origen O y E = (0, x1 , 0, 0). Ahora, dos observadores
con rapidez v en direcciones opuestas a lo largo del eje x1 encuentran que, aunque el evento
β grande
′
x0 x0
′
∆x0
∆x0
x1
Figura 1.12: Dilatación temporal. Considerando boosts de Lorentz con β > 0, el tiempo medido en
S ′ es siempre menor al medido por un observador en S.
1.8 Diagramas de espacio–tiempo y efectos relativistas 33
′′ ′
x0 x0 x0
curva luminoide
o curva nula
′
x1
O
ε x1
′′
∆s2 < 0 x1
Figura 1.13: Secuencia de eventos separados por un intervalo espacialoide, ∆s2 < 0. Mientras que
los eventos O y E son simultáneos para S, para S ′ (S ′′ ), E ocurre antes (después) de O.
en el origen siempre ocurre en el mismo lugar y tiempo, el segundo evento ocurre a distintos
tiempos. Si llamamos S ′ al marco de referencia en movimiento en la dirección positiva de x1
y S ′′ al que se mueve en sentido opuesto, las posiciones del evento E difieren temporalmente
de acuerdo a:
S ′ : E = (−γβx1 , γx1 , 0, 0),
(1.85)
S ′′ : E = (+γβx1 , γx1 , 0, 0),
Relatividad de la posición. Así como la mezcla del espacio y el tiempo provoca que
distintos observadores inerciales sean incapaces de ponerse de acuerdo sobre la secuencia
temporal en la que ocurrieron dos eventos separados por un intervalo espacialoide, es im-
34 Fundamentos de la relatividad especial
′
x0 x0
′
x1
O x1
Figura 1.14: Eventos localizados en la misma posición para un observador en S ′ . Aunque O y E no
ocurren en la misma posición en S, un observador en S ′ aprecia que ambos ocurren en la misma
posición.
′ !
Exigiendo que x1 = γ(x1 − βx0 ) = 0, encontramos la rapidez a la que el marco de
referencia S ′ debería desplazarse para que los eventos ocurrieran en la misma posición
espacial,
x1
β= . (1.86)
x0
x0
longitud de desplazamiento x1
la varilla debido a la
para S no simultaneidad
Al aplicar el boost de Lorentz, hemos tomado en cuenta que S se desplaza con rapidez −β
con respecto a S ′ . El resultado ∆x0 6= 0, confirma que las mediciones de los extremos de la
varilla no son simultáneas para un observador en S. El ajuste debido a la no simultaneidad
de las mediciones realizadas en S ′ se obtiene de notar que el extremo ilustrado a la derecha
en la figura 1.15 se desplazó, debido a la rapidez β de la varilla, una distancia β∆x0 que
debe ser sustraída de la distancia ∆x1 medida en S. De esta forma, encontramos que la
longitud de la varilla en movimiento desde la perspectiva del marco de referencia en reposo
está dada por
ℓ = ∆x1 − β∆x0 = γℓ′ − γβ 2 ℓ′ = γ(1 − β 2 )ℓ′ = ℓ′ /γ, (1.89)
es decir, de acuerdo con un observador en S, la longitud de la varilla en movimiento se
contrae por un factor de γ1 < 1 en la dirección del movimiento:
Notemos que este resultado coincide con la contracción propuesta por FitzGerald y Lorentz,
ecuación (1.5), en su teoría del éter.
Experimentalmente la contracción de la longitud solamente puede ser comprobada en
experimentos que involucran colisiones de átomos o núcleos; o corrientes (súper)rápidas.
Los diagramas de espacio–tiempo son muy útiles para estudiar la conexión causal entre
eventos. Recordemos nuestra discusión la sección 1.5. Hemos visto que la invariancia del
intervalo implica que ningún cambio de signo de ds2 es admisible para diferentes obser-
vadores inerciales. A partir de esta observación, concluimos que los eventos relacionados
por intervalos espacialoides, con ds2 < 0, están desconectados causalmente para cualquier
observador inercial debido a que la rapidez con la que una señal emitida en el lugar y mo-
mento de un primer evento para llegar al lugar y momento del segundo es siempre mayor
que la de la luz y, por lo tanto, no existe forma de comunicación que permita que uno
de ellos provoque el otro. Además, hemos visto en la sección 1.8 que es imposible para
distintos observadores inerciales determinar con total certeza cuál evento ocurrió antes y
cuál después si están separados por un intervalo espacialoide.
Por otro lado, eventos que ocurren a lo largo de una curva nula, donde ds2 = 0, son algo
especiales. Primero, notamos que ds2 = 0 implica dτ = 0, lo cual significa que un sistema
moviéndose a la velocidad de la luz, ¡no posee un tiempo propio! Eventos a lo largo de
caminos nulos sólo pueden conectarse por medio de señales que se desplacen a la velocidad
de la luz y son apreciados de la misma manera por cualquier observador inercial. Por lo
tanto, todo evento que haya ocurrido en el pasado de acuerdo a un observador inercial, es
igualmente apreciado en el pasado por otros observadores.
1.8 Diagramas de espacio–tiempo y efectos relativistas 37
x0
futuro
E
x1
pasado
x2
Finalmente, para eventos con intervalo temporaloide, el tiempo propio τ sí puede ser
definido. Por lo tanto, la línea de mundo de un observador a lo largo de una trayectoria
temporaloide puede ser descrita por los puntos del intervalo y parametrizada por τ . La
condición ds2 = dτ 2 > 0 para los eventos a lo largo de la trayectoria temporaloide y la
invariancia del intervalo establecen que la diferencia temporal entre los eventos se mantiene.
Consecuentemente, un evento que ocurre en el pasado debe ser observado en el pasado desde
cualquier marco de referencia. Como discutimos en la sección 1.5, la causalidad entre los
eventos de este tipo se mantiene debido a que una señal que se desplaza con rapidez menor
a la de la luz desde un evento pasado puede alterar los resultados en un evento futuro.
En resumen, de nuestra discusión encontramos que:
Para eventos separados por un intervalo finito, notamos que sólo están causalmente
vinculados si satisfacen ∆s2 ≥ 0. Por lo tanto, la “superficie” en el espacio–tiempo 4–
dimensional definida por todos los intervalos que satisfacen14 ∆s2 = 0, trazada desde un
primer evento E, establece una frontera entre los eventos que están causalmente conectados
y los causalmente desconectados. Esta “superficie” define el llamado cono de luz del evento
E. Los eventos al interior del cono de luz están causalmente conectados con el evento E,
como se ilustra en la figura 1.16.
Todos los posibles futuros del evento E se localizan en la región superior del cono
de luz, mientras que la región inferior contiene todos los posibles pasados del evento. Si
14
Dado que en cuatro dimensiones la condición elimina una de las variables, la “superficie” es en realidad
un volumen.
38 Fundamentos de la relatividad especial
futuro común
E1 E2
pasado común
Figura 1.17: Los conos de luz de dos eventos E1 y E2 , simultáneos para un observador en reposo.
La intersección de los conos determina los conjuntos de eventos que pueden corresponder al futuro
y pasado comunes a E1 y E2 .
consideramos un observador inercial arbitrario, este siempre concluirá que el pasado de una
línea de mundo que pasa por E está definitivamente en el interior de la región inferior del
cono de luz.
Usando esta herramienta, es posible averiguar, por ejemplo, el origen de ciertas pro-
piedades comunes a diferentes regiones del universo o la posibilidad de que dos eventos
simultáneos se afecten en el futuro, independientemente del movimiento (inercial) de los
observadores. Como ilustramos en la figura 1.17, los conos de luz de dos eventos que suce-
den simultáneamente para algún observador se traslapan en las dos regiones sombreadas,
una en el pasado y otra en el futuro de los eventos. La región de x0 menor corresponde al
conjunto de eventos pasados que pudo haber influido en ambos eventos, mientras que la
región futura contiene posibles consecuencias de la combinación de los eventos. Un ejemplo
que representa esta situación fácilmente es el interferómetro de Michelson-Morley, donde
los eventos E1 y E2 se identifican con la reflexión de los haces de luz emitidos por una misma
fuente en los extremos de los brazos del interferómetro (ver sección 1.2).
Es importante ser cuidadosos al usar esta lógica en general. Por ejemplo, si considerára-
mos los conos de luz de dos regiones muy distantes en el cosmos y no encontráramos que se
traslaparon durante los últimos 13,800 millones de años 15 , podríamos concebir que no hay
manera de que esas dos regiones observadas hayan tenido un pasado común. Sin embargo,
las observaciones cosmológicas han mostrado que regiones que serían consideradas ajenas
en este análisis tan simple sí debieron estar en contacto causal en algún momento. Como
veremos brevemente en la sección 3.5, los detalles de la expansión del universo alteran
profundamente el resultado más simple.
15
Esta es la edad del universo de acuerdo al modelo cosmológico más acertado hasta ahora, el llamado
ΛCDM o modelo de la gran explosión.
1.9 El grupo de transformaciones de Lorentz 39
x = xk + x⊥ , (1.91)
−1/2
γ(v) = 1 − |β|2 . (1.93)
Generalizando las expresiones (1.38), es natural proponer que este boost arbitrario puede
expresarse como
′
x0 = γ(x0 − β · x), (1.94)
′ 0
x = x⊥ + γ(xk − βx ) .
40 Fundamentos de la relatividad especial
x′ = x − xk + γxk − βγx0
x·v
= x − (1 − γ) 2 v − βγx0
|v|
0
γx x·v
=x− + (1 − γ) 2 v
c |v|
0 γ−1
= x + −γx + x · β β. (1.95)
|β|2
Estas ecuaciones se reducen para β = (β, 0, 0)T = (v/c, 0, 0)T a la segunda expresión
en (1.38):
1′ 1 0 γ−1 1
x = x + −γx + βx β = x1 − γβx0 − x1 + γx1
β2 (1.96)
1 0
= γ(x − βx ) .
Las ecuaciones (1.94) y (1.95) pueden ser reescritas en forma matricial como
γ −β 1 γ −β 2 γ −β 3 γ
−β 1 γ 1 + γ−12 β 1 β 1 γ−1 1 2
β β γ−1 1 3
β β
µ′ |β| |β|2 |β|2
B = (B ν ) = 2 γ−1 1 2 γ−1 2 2 γ−1 2 3 , (1.97)
−β γ |β|2
β β 1 + |β|2 β β |β|2
β β
3 γ−1 1 3 γ−1 2 3 γ−1 3 3
−β γ |β|2
β β |β|2
β β 1 + |β|2 β β
con los signos iguales en ambas expresiones. Estas relaciones pueden ser combinadas me-
diante
′ ′
dx1 − dx0 = M (dx1 − dx0 ) , (1.101)
1′ 0′ 1 0
dx + dx = N (dx + dx ) ,
donde M y N son dos constantes por determinar. Sumando y restando las ecuaciones (1.101),
llegamos a
′
dx0 = a dx0 + b dx1 , (1.102)
1′
dx = a dx1 + b dx0 ,
M +N N −M
a≡ & b≡ . (1.103)
2 2
′ ′ !
(dx0 )2 − (dx1 )2 = (dx0 )2 − (dx1 )2 ,
!
a 2 − b2 = 1 . (1.104)
La condición (1.104) reduce el número de parámetros libres a uno, el cual puede ser con-
venientemente reexpresado, notando que esa relación es similar a la identidad hiperbólica
cosh2 φ − senh2 φ = 1 .
42 Fundamentos de la relatividad especial
tanh φ = β . (1.106)
donde β 1 = (β1 , 0, 0)T , β 2 = (0, β2 , 0)T y β f = (β1 , β2 /γ1 , 0)T . A la rotación R se le llama
rotación de Thomas-Wigner y su presencia indica que los boosts de Lorentz no forman un
grupo por ellos mismos. Debemos incluir otras rotaciones (no hiperbólicas) para conseguir
el grupo de transformaciones de Lorentz.
Como hemos visto, la transformación de Lorentz más general es una transformación
lineal de los 4–vectores, tales como dx, de acuerdo a
′ ′
dxµ = Λµ ν dxν . (1.109)
Para que Λ sea consistente con los postulados de la relatividad especial, debemos exigir
la invariancia del intervalo. Expresando este requerimiento mediante el producto escalar
definido en la ecuación (1.75), tenemos
!
dx · dx = dx′ · dx′ . (1.110)
Con la finalidad de emplear una notación más útil, introducimos el llamado tensor métrico
del espacio–tiempo η = (ηµν ), tal que
Para que la última igualdad se satisfaga, se requiere que η sea una matriz 4 × 4 con las
siguientes entradas no triviales en la diagonal
Comparando la última expresión del primer renglón con la primera del segundo, encontra-
mos la condición
′ ′ !
ηµ′ ν ′ Λµ ρ Λν σ = ηρσ . (1.114)
Reordenando los índices, encontramos que las transformaciones de Lorentz más generales
deben satisfacer
′ ′
(ΛT )ρ µ ηµ′ ν ′ Λν σ = ηρσ (1.115)
que se puede reescribir como
ΛT ηΛ = η. (1.116)
Calculando el determinante de cada lado de la igualdad y recordando que el determinante
de un producto de matrices es el producto de los determinantes, encontramos
lo que implica que det Λ = ±1. Además, reescribiendo la ecuación (1.116), encontramos
que
ΛT = ηΛ−1 η −1 , (1.118)
lo que significa que Λ debe ser ortogonal con respecto a η.17
Es posible demostrar que las matrices ortogonales con determinante ±1 Λ asociadas
a las transformaciones de Lorentz forman el grupo de Lie O(3, 1) en el espacio–tiempo
(plano), con 3 dimensiones espaciales y 1 temporal.
A pesar de que todas las transformaciones del grupo O(3, 1) son admisibles, este grupo
contiene tres subgrupos de transformaciones que parecen poco físicas. Notemos que admitir
′
transformaciones con Λ0 0 ≤ −1 y/o det Λ = −1 conduce a transformaciones como las
representadas por las matrices diagonales
T P
que actúan como x0 −→ − x0 y x−→ − x, respectivamente. Tratar con estas operaciones
T
representa un reto (note, por ejemplo, que T p = − Ec , p , donde p es el 4–momento; es
17
Habitualmente, las matrices ortogonales tridimensionales M que forman el grupo de Lie O(3) satisfacen
M T = 1M −1 1. Hemos escrito explícitamente la matriz identidad 1 para enfatizar la analogía con la ecua-
ción (1.118), con la diferencia de que la métrica en 3 dimensiones espaciales, siguiendo la lógica de (1.111),
es simplemente la identidad (si el espacio es plano).
1.9 El grupo de transformaciones de Lorentz 45
decir, la inversión temporal conduce a energías negativas). Se dice que estas transformacio-
nes cambian la orientación del espacio–tiempo y son denominadas impropias. Entonces, nos
′
podemos restringir naturalmente al subgrupo propio (det Λ = +1) y ortócrono18 (Λ0 0 ≥ 1)
SO+ (3, 1), el cual incluye boosts de Lorentz (rotaciones hiperbólicas) y las rotaciones Eu-
clidianas. Frecuentemente, es a este al que le llamamos grupo de Lorentz, aunque el grupo
de Lorentz sea más general.
Debido a la homogeneidad del universo, podemos considerar el conjunto adicional de
transformaciones en el espacio–tiempo formado por las traslaciones espacio–temporales,
definidas por
xµ → xµ + aµ , (1.120)
donde aµ son las componentes de un 4–vector de desplazamiento arbitrario. Las transfor-
maciones de Lorentz y las traslaciones forman el grupo más grande conocido de transfor-
maciones del espacio–tiempo, llamado grupo de Poincaré.
Hemos visto que las transformaciones de Lorentz dejan algunas cantidades invariantes,
que hemos llamado escalares de Lorentz, pese a transformar de forma no trivial a los
4–vectores. No obstante, el formalismo de la relatividad especial permite ver que, como
la ecuación (1.67) muestra, las leyes de la mecánica de Newton también son invariantes
para todos los observadores inerciales en el espacio–tiempo, ajustadas por correcciones
relativistas. Similarmente, aunque de forma más espectacular, las leyes de Maxwell de la
electrodinámica son invariantes bajo las transformaciones de Lorentz (ver ejercicio 1.3 y
sección 2.2). En general, es posible establecer que todas las leyes físicas son invariantes ante
las transformaciones relativistas, como establece el principio de relatividad. Por lo tanto, se
dice que estas transformaciones son transformaciones de simetría o simplemente simetrías
del espacio–tiempo.19
Un resultado espectacular demostrado por la matemática alemana Amalie Emmy Noet-
her es el llamado (primer) teorema de Noether que, de manera informal, puede ser enunciado
de la siguiente forma: toda simetría continua de un sistema conduce a una cantidad cuyo
valor es conservado en el tiempo, llamada constante de movimiento o carga de Noether.
Las simetrías descritas por las transformaciones de Lorentz son continuas porque los
boosts dependen de (las tres componentes de) la velocidad del observador y de los tres
ángulos de rotaciones espaciales, que son cantidades que adoptan cualquier valor continuo.
Por lo tanto, de acuerdo al teorema de Noether, esperamos que existan seis cantidades
conservadas asociadas al grupo de Lorentz.
18
Describe cualquier transformación de Lorentz que preserve la dirección del tiempo.
19
Una analogía que permite entender el uso de la palabra simetría es considerar que una esfera perfecta
es invariante bajo rotaciones y, por lo tanto, goza de una simetría bajo rotaciones.
46 Fundamentos de la relatividad especial
En mecánica clásica, es bien sabido que un sistema que es simétrico bajo rotaciones
en tres dimensiones espaciales posee tres cantidades conservadas, las tres componentes del
momento angular L. En términos de la matriz antisimétrica (M µν ) con componentes
M µν ≡ xµ pν − pν xν , (1.121)
∂0 M 23 = ∂0 M 13 = ∂0 M 12 = 0 .
21
Se recomienda la lectura de la sección 14 de L.D. Landau, E.M. Lifshitz, The classical theory of fields
(V.2). Butterworth Heinemann, 1994.
1.9 El grupo de transformaciones de Lorentz 47
que coincide con la relación (1.71), cierta para un sistema de una sola partícula estudiado
por cualquier observador inercial si la partícula se desplaza con velocidad uniforme. Los
tres grados de libertad de la ecuación (1.123) son las constantes de movimiento asociadas
a los boosts de Lorentz.
El resultado (1.123) conduce a una interesante conclusión, pero, para llegar a ella,
consideremos primero las cantidades conservadas asociadas a las traslaciones (1.120) que
complementan el grupo de simetrías del espacio–tiempo para formar el grupo de Poincaré.
Calculando la derivada con respecto al tiempo propio de las traslaciones, encontramos que
la 4–velocidad no es alterada bajo estas transformaciones,
d µ d µ d µ
x → (x + aµ ) = x (1.124)
dτ dτ dτ
debido a que aµ es un 4–vector constante. Dado que el momento de una partícula de masa
m es definido como p = m U , el 4–momento se conserva bajo traslaciones. En términos de
las componentes pµ , encontramos que tanto la energía del sistema E como el momento p
son cantidades conservadas.
Para entender ahora en general el significado de (1.123), consideremos un sistema de
muchas partículas, las cuales, en principio, se mueven en direcciones y con velocidades
arbitrarias. La matriz de cantidades conservadas (1.121) se expresa en este caso como
X
M µν ≡ xµn pνn − pνn xνn , (1.125)
n
donde n etiqueta a cada una de las partículas que componen el sistema. Las componentes
no triviales M ij correspondientes al momento angular sólo reflejan que el momento angular
total, dado por la suma de los momentos angulares individuales, se conserva. Por otra parte,
las componentes M 0i conducen a
X X En
pn t − xn = cte , (1.126)
n n
c2
donde hemos supuesto que todas las mediciones de momentos y posiciones se realizan
simultáneamente desde el punto de vista de un observador inercial, y hemos dividido por
c. Dado que la energía se conserva en un sistema cerrado y en aquellos invariantes bajo
traslaciones, como P
suponemos que es el sistema que analizamos aquí, entonces podemos
dividir (1.126) por n En /c2 = cte:
P P 2
n pn n En xn /c
P 2
t − P 2
= cte . (1.127)
n En /c n En /c
Las discusiones hasta este punto han sido generales. En esta sección buscamos aportar
algunos ejemplos que conducen a predicciones únicas de la relatividad especial.
El efecto Doppler le ocurre a cualquier frente de onda cuya fuente se está moviendo
con respecto a un observador inercial. Esto se debe a que las crestas de la onda, desde la
perspectiva del observador, están más o menos separadas dependiendo del movimiento de
la fuente.
Centrémonos en la luz como el frente de onda. La luz es emitida con frecuencia ν ′ desde
una fuente en movimiento con velocidad v a lo largo del eje x1 , pero tal que la línea de
visión hace un ángulo θ con respecto al eje x1 , como se observa en la figura 1.18 (que no
es un diagrama de espacio–tiempo).
1.10 Aplicaciones ópticas de la relatividad especial 49
′
Si el tiempo entre dos crestas consecutivas de una onda de luz emitida es ∆x0 /c,
entonces la frecuencia de la luz está dada por
c
ν′ = . (1.131)
∆x0′
La medición del tiempo ∆x0 /c entre dos crestas consecutivas realizada por un observa-
dor en reposo es afectada por dos efectos: i) el del movimiento de la fuente a lo largo de la
línea de visión (que es el origen del efecto Doppler en la mecánica Newtoniana), y ii) por
la dilatación temporal relativista. La combinación de estos elementos se expresa mediante
′ ′
∆x0 ∆x0 ∆x0
=γ + βℓ γ , (1.132)
c c c
donde βℓ es la componente de β = (β, 0, 0)T a lo largo de la línea de visión,
βℓ = β cos θ. (1.133)
1 1
= ′ γ(1 + β cos θ) . efecto Doppler relativista (1.134)
ν ν
′
x2 x2
v
fuente x1
′
S′
observador x1
S
Figura 1.18: Una fuente de luz en movimiento S ′ emite luz que es observada por un observador en
reposo S a un ángulo θ con respecto a su horizontal.
50 Fundamentos de la relatividad especial
Claramente, cuando cos θ = 1, la línea de visión es a lo largo del eje x1 , con la fuente
alejándose del observador, como en la figura 1.19. En este caso, tenemos
s
1 1 1+β 1 1+β
= ′p = ′ . (1.135)
ν ν 1 − β2 ν 1−β
A estos dos casos usualmente se les conoce como efecto Doppler longitudinal y en su
límite no relativista corresponden al efecto Doppler Newtoniano. Vemos que para β ≪ 1
las expresiones (1.135) y (1.136) pueden aproximarse por
v
ν ′ = ν(1 ± β) + O(β 2 ) ≈ ν 1 ± , (1.137)
c
dependiendo de si la fuente se acerca (−) o se aleja (+), lo cual corresponde al resultado
de la física Newtoniana. Las correcciones relativistas son proporcionales a β 2 /2, lo que
explica por qué este efecto es principalmente apreciable en fuentes que se desplazan a
grandes velocidades, tales como las estrellas de galaxias distantes. Observamos que, como
en el caso Newtoniano, entre más rápido se aleja (acerca) la fuente, la frecuencia de la luz
emitida es menor (mayor) o, en otras palabras, más roja (azul) se observa su luz. Debido
a que las estrellas típicamente se alejan de nosotros (debido esencialmente a la expansión
cósmica), es frecuente que el efecto Doppler sea llamado simplemente corrimiento al rojo,
′
x2 x2
′
x 1 , x1
Figura 1.19: Una fuente emite luz mientras se aleja en el eje x1 de un observador en reposo.
1.10 Aplicaciones ópticas de la relatividad especial 51
aunque también existan estrellas con movimiento hacia nosotros y exhiban, por lo tanto,
un corrimiento al azul en su espectro de radiación.
La descripción relativista del efecto Doppler dada por (1.134) revela que hay un caso
que no aparece en la física Newtoniana. Para cos θ = 0, es decir, cuando la línea de visión
es perpendicular al movimiento de la fuente, ocurre el llamado efecto Doppler transversal.
En este caso, la relación entre las frecuencias se simplifica a
ν′ − ν
z≡ corrimiento al rojo (1.139)
ν
Como veremos en las secciones 3.1.2 y 3.3.2, en el contexto gravitacional hay correc-
ciones adicionales. En conjunto, este corrimiento al rojo es importante para determinar la
edad o comportamiento de estrellas y galaxias. Es, por ejemplo, conocido que las estrellas
lejanas se ven más rojas de lo que realmente son (corrimiento al rojo astrofísico) porque se
están alejando de nosotros.
Las distancias y el tiempo dependen del movimiento del observador o del objeto ob-
servado. Esto implica que otras cantidades se afectan similarmente. Hemos visto cómo
velocidades locales cambian dependiendo del movimiento relativo de observadores. Análo-
gamente, aceleraciones y fuerzas se ven modificadas. Curiosamente, hasta algunos efectos
angulares se vuelven evidentes cuando tenemos involucradas velocidades relativistas; este
es el caso de la percepción del ángulo de incidencia de la luz por diferentes observadores
inerciales.
52 Fundamentos de la relatividad especial
′
x2 x2
v
α α′
′
x1 x1
Figura 1.20: Ángulo de incidencia de la luz en marcos de referencia inerciales en reposo y en
movimiento.
1.10 Aplicaciones ópticas de la relatividad especial 53
s
1 1−β 1
tan α′ = tan α . aberración relativista (1.146)
2 1+β 2
1 1
tan α′ < tan α ⇐⇒ α′ < α si β > 0,
2 2 (1.147)
1 ′ 1 ′
tan α > tan α ⇐⇒ α >α si β < 0.
2 2
Este efecto se conoce bien desde finales del siglo XVII; se le llama aberración de la luz o
aberración de Bradley. La aberración de la luz tiene un papel importante en la astronomía
porque este efecto altera la posición aparente de las estrellas a lo largo del día y el año
debido a la rotación y traslación de la Tierra, como se observa esquemáticamente en la
figura 1.21a. Claramente, la aberración anual es más importante. Como se ilustra en la
figura 1.21b, estos efectos producen una variación oscilatoria del ángulo de observación de
cuerpos estelares a lo largo del año.
α′
α posición
aparente
Tierra
α′
marzo septiembre marzo
v
(a) (b)
Figura 1.21: (a) Si un observador terrestre se mueve con la velocidad v indicada con respecto a una
estrella (cercana) debida a la rotación y traslación de la Tierra, la posición aparente de la estrella
tendrá un ángulo menor al que percibiría un observador en reposo. (b) Variación del ángulo de
incidencia a lo largo del año.
54 Fundamentos de la relatividad especial
p2
E= +V (1.148)
2m
origina la ecuación de Schrödinger (en la representación de posiciones),
∂ψ ~2 2
i~ = − ∇ + V ψ, (1.149)
∂t 2m
tras reemplazar las cantidades físicas E y p por los operadores cuánticos (diferenciales)22
· ∂ ·
E → Ê = i~ , p → p̂ = −i~∇, (1.150)
∂t
y luego aplicar (1.148) sobre la llamada función de onda ψ = ψ(t, x), que caracteriza por
completo a un sistema cuántico. Claramente, la ecuación (1.149) trata de manera diferente
a las coordenadas espaciales y a la temporal, lo que subraya su incompatibilidad con la
relatividad especial.
El primer intento de obtener una ecuación cuántico–relativista fue hecha por el mismo
Schrödinger. Su tratamiento fue el mismo que el anterior, pero empezando con la relación
de energía y momento relativista (1.78),
E 2 = p 2 c2 + m2 c4 . (1.151)
∂2φ
− ~2 = −~ 2 2 2
c ∇ + m 2 4
c φ, (1.152)
∂t2
donde la función φ = φ(t, x) aún debe interpretarse. Esta ecuación puede escribirse de
forma más sugerente como
∂2 2 m2 c 2
− ∇ φ + φ = 0, ec. de Klein–Gordon (1.153)
c2 ∂t2 ~2
coordenadas xµ . Por esta razón, se dice que esta ecuación trata al tiempo y las posiciones de
la misma forma. Sin embargo, la diferencia en signo de las derivadas es importante; sugiere
la posibilidad de definir el 4–vector de derivadas (el origen de los signos se explicará en la
sección 2.1.5)
µ ∂ ∂ ∂ ∂ T
∂ ≡ (∂ ) = ,− ,− ,− , (1.154)
∂x0 ∂x1 ∂x2 ∂x3
de manera que podamos escribir la ecuación de Klein–Gordon como
m2 c 2 m2 c 2
∂·∂ φ+ φ= ηµν ∂ µ ∂ ν φ + φ = 0. (1.155)
~2 ~2
con ambos signos. Es decir, la ecuación de Klein–Gordon indica que un sistema físico puede
poseer energía negativa.
Este problema es de suma importancia y fue resuelto algún tiempo después de la apari-
ción de la ecuación de Klein–Gordon por Dirac, Feynman y Stückelberg, al interpretar los
estados de energía negativa como estados de energía positiva moviéndose al pasado. Pero
antes de entrar en estos detalles, estudiemos dos aspectos importantes de la ecuación de
Klein–Gordon: el límite no relativista y la definición de la 4–corriente de probabilidad.
E = E0 + E ′ ≈ E0 ≡ mc2 , E ′ ≪ E0 , (1.158)
2
= 2
−2 − 2 ϕ e− ~
∂t ∂t ~ ∂t ~
2
2iE0 ∂ E0
≈− + 2 φ. (1.162)
~ ∂t ~
Sustituyendo (1.162) en la ecuación de Klein-Gordon (1.153), encontramos
2imc2 ∂ m2 c4 2 m2 c2
− + + ∇ φ + φ = 0, (1.163)
~c2 ∂t h2 c 2 ~2
que se simplifica a
∂ ~2 2
i~ φ=− ∇ φ, límite no relativista de la ec. de Klein–Gordon (1.164)
∂t 2m
1.11 Mecánica cuántica relativista de partículas sin espín* 57
lo cual coincide con la ecuación de Schrödinger (1.149) para una partícula libre. Esta es
una observación interesante ya que significa que la ecuación de Klein–Gordon puede ser
considerada como el origen relativista de la ecuación de Schrödinger.24
Aún podemos obtener más información de aquí. Consideremos la ecuación de Schrö-
dinger para una partícula libre en la forma
∂ i~ 2
φ= ∇ φ. (1.165)
∂t 2m
Multiplicando por φ∗ y agregando la ecuación resultante a su conjugado, encontramos
∂ ∂ i~
φ∗ φ + φ φ∗ = φ∗ ∇2 φ − φ∇2 φ∗ , (1.166)
∂t ∂t 2m
que puede reescribirse como
∂ ∗ i~ ∗ ∗
(cφ φ) + ∇ · − (φ ∇φ − φ∇φ ) = 0. (1.167)
∂x0 2m
Recordando que en mecánica cuántica no relativista φ∗ φ define la densidad de probabilidad
ρ de la función de onda φ, y definiendo una corriente de probabilidad
i~
j≡− (φ∗ ∇φ − φ∇φ∗ ) , (1.168)
2m
encontramos la ecuación de continuidad
∂ρ
+ ∇ · j = 0, (1.169)
∂t
la cual expresa la conservación de probabilidad, de la siguiente manera. Si la probabilidad
R 3 no
relativista de que una partícula se encuentre en un volumen Ω se define como P ≡ Ω d x ρ,
entonces Z I
∂P 3
= − d x ∇ · j = − j · n̂dS = 0 . (1.170)
∂t
Ω ∂Ω
La última igualdad se debe al hecho de que j desaparece cuando x → ∞ y el volumen
Ω tiene frontera ∂Ω al infinito. Podemos reescribir la ecuación de continuidad (1.169) en
términos de una 4–corriente
como
∂ · J = ηµν ∂ µ J ν = 0. ecuación de continuidad (1.172)
24
Aunque, como es habitual, los operadores diferenciales y el ansatz para φ son concebidos ad hoc.
58 Fundamentos de la relatividad especial
Notamos que esta ecuación, de acuerdo con la discusión anterior, expresa la conservación
de J 0 en todo el espacio siempre y cuando j = (J i ) desaparezca en el infinito, como se
espera por ser un límite físico. Las definiciones de ρ y j son típicas de la mecánica cuántica
no relativista y es bien sabido que satisfacen (1.169).
Extendamos este tratamiento a la ecuación de Klein–Gordon. Para lograrlo, multipli-
quemos esta ecuación en su forma (1.155) por φ∗ y restémosle a la ecuación resultante su
conjugada. Obtenemos
m2 c 2 ∗
φ∗ ηµν ∂ µ ∂ ν φ − φηµν ∂ µ ∂ ν φ∗ + (φ φ − φφ∗ ) = ηµν ∂ µ (φ∗ ∂ ν φ − φ∂ ν φ∗ ) = 0 (1.173)
~2
Esta expresión adopta la forma (1.172) si las componentes de la 4–corriente relativista
satisfacen
J ν ∝ φ∗ ∂ ν φ − φ∂ ν φ∗ . (1.174)
Sin embargo, vemos que, en el límite no relativista, las componentes espaciales sólo pueden
compararse con (1.168) si multiplicamos por i~/2m. Por lo tanto, proponemos que la 4–
corriente en el caso relativista esté dada por
i~
Jµ ≡ (φ∗ ∂ µ φ − φ∂ µ φ∗ ) , (1.175)
2m
donde la naturaleza escalar de Lorentz de φ se hace evidente una vez más. Por lo tanto,
esta solución es claramente compatible con la relatividad especial. Sin embargo, recordemos
1.11 Mecánica cuántica relativista de partículas sin espín* 59
p
que E puede ser tanto positiva o negativa. Para E− ≡ − p2 c2 + m2 c4 < 0, el exponente
pierde su conveniente forma covariante
i i
− p · x = (p · x + |E− |t) , (1.178)
~ ~
pero puede ser corregida si consideramos tiempos negativos
i i
− p · x = (p · x − |E− ||t|) , t < 0. (1.179)
~ ~
Se puede interpretar este resultado como una señal de que soluciones de energía positiva
se mueven temporalmente hacia el futuro, mientras que soluciones de energía negativa se
mueven hacia atrás en el tiempo. A esto se le conoce como la interpretación de Feynman–
Stückelberg.
Para que esta observación tenga sentido, consideremos la dispersión elástica de una
partícula φ con un fotón γ, el cual carece de masa,
φγ → φγ, (1.180)
es decir, originalmente tenemos un φ y un γ, los cuales, después de interactuar, salen con las
propiedades originales (energía, momento, carga, ...). Lo que es importante para nosotros
es la interacción donde diferentes energías para φ podrían surgir.
Consideremos que φ tiene energía E1 > 0 mientras γ tiene energía Eγ . Tendremos dos
casos:
1. Eγ < E1 ,
2. Eγ > E1 .
En ambos casos, como se puede observar esquemáticamente en la figura 1.22, la interacción
ocurre como sigue. En x1 φ emite un fotón con ciertas propiedades25 y en x2 φ absorbe
otro fotón con las mismas propiedades del fotón emitido. La diferencia aparece debido a la
energía restante en φ, E = E1 − Eγ , después de emitir el fotón. Claramente, el primer caso,
ilustrado en 1.22a, es el más sencillo. Como en este caso E = E1 − Eγ > 0, φ se comporta
normalmente perdiendo momento en x1 y recuperándolo tiempo después (x2 0 > x1 0 ) en
x2 .
No obstante, en el segundo caso, ilustrado en 1.22b, después de emitir el fotón en x1 , φ
tiene energía negativa E = E1 − Eγ < 0 y ya no puede desplazarse hacia el futuro. En lugar
de eso, retrocede en el tiempo a x2 , con x2 0 < x1 0 , donde absorbe un fotón con energía Eγ
lo que hace que φ vuelva a su estado original, con energía E1 > 0.
25
Al emitir el fotón, φ altera su 4–momento, satisfaciendo siempre el principio de conservación. Sin
embargo, en una situación como la presentada esquemáticamente en la figura 1.22, el momento lineal espacial
de φ tras la emisión del fotón es mayor que el que tenía antes de emitirlo; esto implica particularmente que,
tras emitir el fotón, no satisface la relación p2 = m2 c2 . A este tipo de partículas se les llama virtuales.
60 Fundamentos de la relatividad especial
x0 x0
Eγ > E1
φ γ
E1
x02 x01
γ Eγ E = E1 − Eγ < 0
Eγ < E1 E1 φ
φ E1
γ
E = E1 − Eγ > 0
x01 x02
Eγ
φ E1 γ
x11 x12 x1 x11 x12 x1
(a) Eγ < E1 . (b) Eγ > E1 .
Figura 1.22: Interacción de una partícula escalar φ con un fotón γ mediante el intercambio de
partículas virtuales de energía (a) E1 − Eγ > 0 y (b) E1 − Eγ < 0. En (b), la partícula con energía
negativa “viaja al pasado”.
Ejercicios
1.1 Preguntas conceptuales.
(a) En relatividad especial, el postulado de la universalidad de la rapidez de la luz es esencial
′ ′
para obtener las transformaciones de Lorentz, xµ = B µ ν xν . ¿Son las únicas transformaciones
′
consistentes con ese postulado? Considere, por ejemplo, las transformaciones conformes xµ =
axµ , con a = cte. ¿Qué significa este resultado?
(b) En la relatividad Galileana, el intervalo espacial o distancia ℓ2 ≡ (∆xi )(∆xi ) = |∆x|2 es
invariante ante transformaciones Galileanas entre los marcos de referencia inerciales, es decir,
ℓ2 = (ℓ′ )2 . Sin embargo, al dividir por (∆t)2 6= 0 se llega a que |u|2 = |u − v|2 , en donde v
es la velocidad uniforme a la que se mueve un marco de referencia inercial S ′ con respecto a
otro marco en reposo S. ¿Cuál es la inconsistencia?
1.2 Invariancia del intervalo.
(a) Muestre que el intervalo espacial ℓ2 ≡ (∆xi )(∆xi ) = |∆x|2 es invariante bajo una transfor-
mación tridimensional relativista de Galileo.
(b) Muestre que el intervalo espacial–tiempo ∆s2 = (∆x0 )(∆x0 ) − (∆xi )(∆xi ) es invariante bajo
un boost de Lorentz unidimensional.
(c) Siguiendo la discusión del artículo Indefinite quadratic forms and the invariance of the interval
in Special Relativity de J.H. Elton [arXiv:math.GM/0904.3913], demuestre que el intervalo
espacio–temporal es invariante.
Sugerencia: Es importante comprender el teorema demostrado ahí, antes de aplicarlo, y seguir
la discusión compartida en el apéndice G de la referencia [2] de ese artículo.
62 Fundamentos de la relatividad especial
para algunas constantes λ y µ, y el resultado Galileano de que x′ = 0 debe coincidir con la curva
x − vt = 0. Muestre cómo funciona la derivación de Einstein.
1.5 Preguntas conceptuales.
(a) ¿Cómo expresaría en términos del 4–momento la conservación de momento y energía? ¿Qué
implicaciones tiene para los 4–vectores f = (f µ ) y p = (pµ ), y para el resultado anterior, la
acción de una fuerza externa sobre el sistema?
(b) Un granjero con conocimientos de relatividad tiene un granero de longitud LG y una escalera
de longitud LE > LG , que quiere guardar en el granero. Planea utilizar la contracción de
Lorentz para guardar la escalera. El granjero le dice a su hijo que corra con la escalera hacia
el granero a una rapidez relativista (uniforme) v hasta que él cierre la puerta del granero
cuando la escalera cruce la puerta. ¿Qué observa su hijo? ¿Logrará el granjero guardar su
escalera?
(c) Un tráiler muy veloz es conducido por un físico. Sabe que su vehículo tiene una altura de 5
m y que el puente de una carretera sólo alcanza los 4 m. Como su tráiler puede lograr una
rapidez de hasta 0.7c, medita sobre la posibilidad de tomar esa carretera. ¿Con qué rapidez
deberá conducir para pasar por debajo del puente?
1.6 4–vectores.
(a) Demuestre que el producto interior de dos 4–vectores x · y = x0 y 0 − xi y i es un invariante de
Lorentz.
1.11 Mecánica cuántica relativista de partículas sin espín* 63
(b) Describa muy brevemente (si es posible, usando alguna ecuación) por qué no es posible que
un observador inercial viaje con rapidez c.
1.10 La paradoja de los gemelos.
Dos gemelos, Chana y Chón, viven en la Tierra. Chón decide emprender un viaje en su nave
espacial con rapidez constante v < c a Alfa Centauri, mientras que Chana decide quedarse en casa.
En cuanto llega a su destino, Chón da media vuelta y emprende su viaje de regreso a la Tierra con
la misma rapidez v. En el sistema de referencia de Chana, dibuje un diagrama de espacio–tiempo
que describa la trayectoria recorrida por Chón.
1.11 Gedankenexperiment de Einstein.
Sean (a′ , b′ ) y (a′′ , b′′ ) los extremos de dos barras de idéntica longitud propia ℓ. Las barras se mueven
con una rapidez constante de 0.6c en direcciones opuestas con respecto a un observador en reposo
sobre el eje x1 . Tras algún tiempo, el observador en reposo nota que ambos extremos de las barras
coinciden en los puntos (a, b).
(a) Explique mediante diagramas de espacio–tiempo si es posible que otro observador los vea en
el orden opuesto, E3 , E2 y E1 .
(b) Explique mediante diagramas de espacio–tiempo si es posible que otro observador los vea en
el orden E1 , E3 y E2 .
(c) Una clarividente llora de dolor en el preciso instante en el que su hermano, a 500 km de
12
distancia, se golpea. Un científico observa ambos eventos desde un avión viajando a 13 c desde
el punto donde se encuentra el hermano hacia la clarividente. De acuerdo al científico, ¿qué
evento ocurrió antes? ¿Cuánto tiempo antes ocurrió el primer evento? Dibuje un diagrama
de espacio–tiempo del problema en cuestión. ¿Qué conclusiones obtendría el científico si el
avión viajara en la dirección opuesta?
(a) Muestre que la composición de boosts de Lorentz en diferentes direcciones no es otro boost.
Para hacerlo, considere un boost B1 en la dirección x1 seguido de un boost B2 en la dirección
x2 .
(b) Suponga que el resultado es un boost Bf en alguna dirección f seguido por una rotación R(θ)
cuyo eje axial es el que no es alterado por los boosts, es decir, B2 B1 = R(θ)Bf , donde
1 0 0 0
0 cos θ sen θ 0
R(θ) = 0 − sen θ cos θ 0 .
0 0 0 1
Encuentre el boost Bf en términos de θ y los parámetros β1 , γ1 , β2 y γ2 de B1 y B2 .
(c) Exigiendo que la matriz Bf sea simétrica, encuentre sen θ y cos θ en términos de los parámetros
de B1 y B2 .
(d) Use el resultado del inciso anterior para reescribir explícitamente Bf . ¿En qué plano está la
dirección del boost de Lorentz Bf ?
(e) En el plano de la dirección del boost Bf , hay un vector de cuatro dimensiones ω (con sólo
dos entradas no nulas) perpendicular a la dirección f del boost, es decir, tal que ω · f = 0.
Argumente por qué ω debe satisfacer Bf ω = ω. Usando esta relación, encuentre la dirección
f del boost.
(f) Con base en estos resultados, indique cuál es la estructura de la descomposición de un boost
arbitrario en términos de boosts y rotaciones.
1.15 Preguntas conceptuales.
(a) Un experimento moderno ha detectado una partícula con masa en reposo m, que alcanza una
rapidez v > c. ¿Es correcto el resultado experimental? ¿Por qué?
(b) ¿Puede un electrón libre emitir o absorber un solo fotón? Use conservación de energía y
momento para responder.
1.16 Movimiento acelerado en 1 + 1 dimensiones.
(a) En un espacio unidimensional, un cuerpo se mueve con aceleración a = d2 x/dt2 de acuerdo
a un sistema de referencia en reposo S. Demuestre que a′ = d2 x′ /dt′2 en un sistema de
referencia S ′ que se mueve con rapidez v con respecto a S está relacionado con a mediante
a
a′ = 3 ,
γ (1 − uv/c2 )3
en donde u es la rapidez a la que se mueve el cuerpo en S.
(b) Encuentre las componentes de la 4–aceleración A = d2 x/dτ 2 , donde τ es el tiempo propio.
Determine el invariante de Lorentz α = A · A en términos de a.
(c) Si α es constante, encuentre x(t). ¿Qué curva describe un objeto acelerado uniformemente?
(d) Demuestre que el tiempo propio τ de un observador con α constante es
c −1 αt
τ = senh .
α c
Sugerencia: recuerde que dt = γ(u)dτ .
66 Fundamentos de la relatividad especial
tan 12 θi c+v
= .
tan 21 θr c−v
νr c + v cos θi sen θi
= = .
νi c − v cos θr sen θr
Sugerencia: escriba las relaciones ópticas que mide un observador en S ′ que se mueve con el espejo,
y obtenga las observaciones realizadas en S.
1.18 Generadores del grupo de Lorentz propio.
El grupo de Lorentz propio está compuesto por todas las matrices Λ que describen una transfor-
mación de Lorentz propia. Este grupo está formado entonces por los boosts y las rotaciones en 3
dimensiones, por lo que el grupo puede entenderse en términos de 6 parámetros asociados a estas
transformaciones. Se pueden tomar estos parámetros como 3 ángulos de rotación ωi y 3 parámetros
hiperbólicos φi . Cualquier elemento de este grupo puede expresarse en general como
Λ(ω, φ) = e−iω·S−iφ·K ,
(a) Considere, por ejemplo, una rotación en el plano x2 – x3 , es decir, alrededor del eje x1 .
Escriba la matriz 4 × 4 Λ que la representa. Considere ahora que el ángulo de rotación
es infinitesimalmente pequeño. Utilizando la forma infinitesimal (1.184) y la forma de Λ,
encuentre S1 . Utilizando la forma infinitesimal de las rotaciones alrededor de los otros ejes
encuentre S2 y S3 .
(b) Recuerde que un boost puede escribirse en términos de los parámetros hiperbólicos φi =
ln(γi (1 + βi )), i = 1, 2, 3, como una rotación hiperbólica. Considere ahora la forma infinite-
simal de los boosts en términos de los parámetros hiperbólicos en las 3 direcciones posibles.
Haciendo lo análogo a lo hecho en el inciso anterior, encuentre los generadores K1 , K2 y K3
de los boosts en las 3 direcciones.
(c) Se define el conmutador como [A, B] = AB − BA. Encuentre las relaciones de conmutación
entre todos los generadores, es decir [Ki , Kj ], [Si , Sj ] y [Ki , Sj ].
1.11 Mecánica cuántica relativista de partículas sin espín* 67
1
Aj = (Sj + iKj ),
2
1
Bj = (Sj − iKj ).
2
Encuentre los conmutadores [Ai , Aj ], [Bi , Bj ] y [Ai , Bj ]. ¿Qué puede concluir a partir de estos
conmutadores sobre el grupo de Lorentz?
1.19 Grupos de Lorentz y Poincaré.
(a) A partir de la invariancia del intervalo ds2 , aplique transformaciones de Lorentz para demos-
trar que
Λµ α ηµν Λν β = ηαβ .
Escriba la forma matricial de la ecuación anterior.
(b) De la forma matricial que obtuvo en el inciso anterior, demuestre que det Λ = ±1.
(c) De la ecuación del inciso (a) demuestre que |Λ0 0 | ≥ 1. Con este resultado y el del inciso
anterior, ha mostrado que podemos dividir el grupo en 4 sectores (dependiendo del signo de
Λ0 0 y de det Λ).
(d) De los resultados obtenidos en (b) y (c), defina los 4 sectores que componen a O(3, 1). De-
termine a qué sector pertenece el elemento identidad, las rotaciones espaciales y los boosts.
(e) Definimos la inversión temporal como T = diag(−1, 1, 1, 1) y la inversión espacial como P =
diag(1, −1, −1, −1). Demuestre que T y P pertenecen a O(3, 1). Indique a qué componente
conexa pertenecen T , P y su composición T P = PT .
(f) Pruebe o refute que cada componente conexa forma un subgrupo de O(3, 1).
(g) (Grupo de Poincaré) Una generalización de O(3, 1) es el llamado grupo de Poincaré, el
cual considera también traslaciones espacio–temporales y contiene como subgrupo a O(3, 1).
La acción de un elemento general del grupo de Poincaré, que denotaremos como (Λ, a) (donde
Λ ∈ O(3, 1) y a ∈ R(3,1) ), sobre un vector x es x′ = (Λ, a)x = Λx + a, que, en términos de
componentes, es
xµ → Λµ ν xν + aµ . (1.185)
Note que un elemento (Λ, 0), con a = 0 es simplemente un elemento de O(3, 1). Considere
dos elementos del grupo de Poincaré (Λ1 , a1 ) y (Λ2 , a2 ). Use (1.185) para demostrar que la
regla de composición del grupo de Poincaré está dada por
(h) Encuentre la expresión para el inverso a (Λ, a), i.e., el elemento tal que (Λ, a)(Λ, a)−1 = 1.
1.20 Matrices de Dirac.
Suponga que el Hamiltoniano H de una partícula relativista puede ser escrito como un cuadrado
perfecto de una cantidad que es lineal en p
H = (c(α1 p1 + α2 p2 + α3 p3 ) + βmc2 )2 .
68 Fundamentos de la relatividad especial
(a) Si H es igual a la energía relativista, encuentre las condiciones que deben cumplir los coefi-
cientes α1 , α2 , α3 y β.
(b) Para que se cumplan las condiciones encontradas en (a), se necesita que αi , y β sean matrices.
¿Qué eigenvalores pueden tomar estas matrices?
(c) Demuestre que la traza de las matrices αi y β es cero. ¿Cómo debe ser la dimensión de estas
matrices?
(d) ¿Cuál es la dimensión mínima que deben tener estas matrices? Con base en los resultados
previos, ¿qué estructura tienen los objetos sobre los que actúan estas matrices?
(e) Un álgebra de Clifford (o Dirac) se define mediante el siguiente anticonmutador
{γ µ , γ ν } = γ µ γ ν + γ ν γ µ = 2η µν 1,
Geometría en relatividad
para preservar la invariancia del producto escalar entre 4–vectores observados por distintos
observadores inerciales. El producto escalar ha sido definido como
A · B ≡ ηµν Aµ B ν , (2.3)
A · B = Aµ B µ = Aµ B µ , (2.4)
donde hemos usado la propiedad del tensor métrico (que demostraremos en la sección 2.1.5)
En este contexto, se dice que una de las funciones del tensor métrico es bajar índices.
70 Geometría en relatividad
Los 4–vectores o simplemente vectores forman un espacio vectorial que satisface las pro-
piedades de todo espacio vectorial. Particularmente, si A y B son vectores con componentes
Aµ y B µ , µ = 0, . . . , 3, entonces
(A + B)µ = Aµ + B µ
(2.6)
(aA)µ = aAµ , a∈R
y, en consecuencia, las componentes de la suma de vectores se transforman como
′ ′ ′
(A + B)µ = Λµ ν Aν + Λµ ν B ν (2.7)
bajo una transformación de Lorentz.
Por otro lado, como las transformaciones de Lorentz son transformaciones lineales que
′ ′ ′
relacionan dos sistemas coordenados, los de coordenadas xµ y xµ , mediante xµ = Λµ ν xν y,
′
viceversa, xν = Λν µ′ xµ , en una relación continua y biyectiva, entonces las transformaciones
de Lorentz son difeomorfismos1 que satisfacen
′
µ′ ∂xµ ν ∂xν
Λ ν= y Λ µ ′ = . (2.8)
∂xν ∂xµ′
Escrito de esta forma, notamos que, si Λ es un difeomorfismo arbitrario, tal como una
transformación de coordenadas, tanto (2.8) como (2.7) también se satisfacen. Esta obser-
vación permite notar que las transformaciones de Lorentz, hasta ahora empleadas para
caracterizar los vectores, son sólo un caso especial de las transformaciones generales permi-
tidas en la teoría de la relatividad, las cuales corresponden a todos los difeomorfismos del
espacio–tiempo. Es decir, es posible generalizar las transformaciones de Lorentz a transfor-
maciones que modifiquen radicalmente el espacio–tiempo, transformaciones que relacionen
las coordenadas inerciales con coordenadas asociadas a sistemas acelerados, rotantes, o
cualesquiera otros, siempre que las transformaciones puedan expresarse como (2.8). Este
resultado meramente geométrico es tremendamente poderoso, pues permite generalizar la
relatividad especial a cualquier marco de referencia, como veremos en el capítulo 3. Antes
de llegar a esa generalización, debemos desarrollar algunos elementos que nos serán de gran
utilidad.
En el contexto de la relatividad especial, que es formulada en un espacio–tiempo 4–
dimensional plano, podemos elegir la base del espacio de vectores dada por
e0 = (1, 0, 0, 0)T ,
e1 = (0, 1, 0, 0)T ,
(2.9)
e2 = (0, 0, 1, 0)T ,
e3 = (0, 0, 0, 1)T ,
1
Formalmente, un difeomorfismo es un mapeo diferenciable, biyectivo e invertible que relaciona un
espacio continuo y localmente plano (conocido como variedad) con otro. Las transformaciones de Lorentz
son difeomorfismos del espacio–tiempo plano en sí mismo.
2.1 Tensores en relatividad 71
con µ corriendo sobre las componentes de la base y ν sobre los elementos de la base.El
espacio–tiempo plano descrito por la base (2.9) es conocido como espacio–tiempo de Min-
kowski.
En general, dada una base, un vector arbitrario A puede ser escrito como
A = Aµ e µ . (2.11)
Con esta definición, un vector A no tiene índices y, por lo tanto, es invariante ante difeo-
morfismos, incluyendo las transformaciones de Lorentz, es decir,
′
A = Aµ eµ = Aµ eµ′ = A′ . invariancia de vectores (2.12)
Esto significa que, aunque las componentes de un vector sí se transforman, el propio vector
no. Claramente, esto implica que eµ′ 6= eµ , de donde podemos deducir cómo se transforman
′ ′
los vectores base. Empleando Aµ = Λµ ν Aν en (2.12),
′ ′ ′ !
A′ = Aµ eµ′ = Λµ ν Aν eµ′ = Aν (Λµ ν eµ′ ) = Aν eν = A,
e0 = γe0′ − γβe1′ ,
(2.14)
e1 = γe1′ − γβe0′ ,
Esta ecuación indica que los vectores base se transforman inversamente a las componentes
de vectores.
72 Geometría en relatividad
compatible con (1.118), como el lector puede comprobar fácilmente (ejercicio 2.1). Entonces,
para obtener la nueva base {eµ′ } en términos de la base no transformada {eν }, utilizamos
la transformación inversa (2.16) en (2.13) y obtenemos
2.1.2. 1–formas
Consideremos ahora una función lineal p que toma como parámetro un vector arbitrario
y devuelve algún escalar. La acción de p sobre un vector A está dada por
donde hemos definido pµ ≡ p(eµ ). En la segunda igualdad, hemos tomado en cuenta que
las componentes Aµ del vector A son simples escalares y que p es una función lineal. La
expresión (2.19) define la llamada contracción de índices, que se traduce en la suma de las
componentes involucradas sobre los valores que pueden adoptar los índices,
p(A) = Aµ pµ = A0 p0 + A1 p1 + A2 p2 + A3 p3 . (2.20)
Aunque veremos que la contracción de índices está relacionada con el producto escalar,
aquí parecería que no se trata de lo mismo, pues p es una función lineal, no un vector. Por
el momento, lo importante es notar los signos (todos positivos) y también la posición de
los índices empleados en la suma (uno arriba y otro abajo). Los índices repetidos que se
contraen desaparecen en el resultado final, por lo que frecuentemente también son llamados
índices mudos. Es evidente que la elección del símbolo asociado al índice mudo es indife-
rente, por lo que puede sustituirse siempre y cuando el cambio ocurra en los dos lugares
en donde aparece y el nuevo símbolo no aparezca en alguna otra parte de la expresión.
Ahora determinemos cómo cambian las cantidades pµ bajo difeomorfismos. Para lograr-
lo, siguiendo la definición de pµ , esta vez tomamos la acción de p sobre el vector base eµ′
afectado por Λ,
pµ′ ≡ p(eµ′ ) = p(Λν µ′ eν ) = Λν µ′ p(eν ) = Λν µ′ pν . (2.21)
2.1 Tensores en relatividad 73
Encontramos que las cantidades pµ se transforman como los vectores base, siguiendo la
regla
p µ′ = Λ ν µ′ p ν , (2.22)
es decir, inversamente a como las componentes de un vector lo hacen. Empleando este
resultado, es directo comprobar que la contracción de índices (2.20) es, por definición, un
escalar y, por lo tanto, un invariante bajo difeomorfismos e invariante de Lorentz:
′ ′
Aµ pµ′ = (Λµ ν Aν )(Λρ µ′ pρ )
′
= Λ ρ µ ′ Λ µ ν Aν p ρ
(2.23)
= δνρ Aν pρ = Aρ pρ
= Aµ p µ ,
Ve (eµ ) = Vµ . (2.24)
Como los vectores, las 1–formas construyen un espacio vectorial, por lo que se puede
ω µ } para ellas, tal que
definir una base {e
eµ,
pe = pµ ω pµ ∈ R. (2.26)
e µ (A) = pµ ω
pe(A) = pµ ω e µ (Aν eν ) = pµ Aν ω
e µ (eν ) (2.27)
!
= p µ Aµ ,
2
Históricamente, las 1–formas también han sido llamadas vectores covariantes, pero aquí evitaremos ese
lenguaje.
74 Geometría en relatividad
!
donde usamos (2.25) en la última igualdad. Es decir, pµ Aµ = pµ Aν ω
e µ (eν ), lo que implica
e µ (eν ) = δνµ ,
ω µ, ν = 0, ..., 3. (2.28)
ω
e0 = (1, 0, 0, 0),
ω
e1 = (0, 1, 0, 0),
(2.29)
ω
e2 = (0, 0, 1, 0),
ω
e3 = (0, 0, 0, 1),
la cual, a pesar de su forma constante, depende del marco de referencia. Esta forma de
los vectores duales base (así como los vectores base {eµ } de la ecuación (2.9)) representa
la elección más sencilla de la base del espacio–tiempo de Minkowski, pero otras elecciones
también son válidas. Particularmente, si aplicamos un simple cambio de coordenadas, las
expresiones de los vectores y 1-formas en términos de sus bases continúan siendo válidas,
aunque sus componentes y los vectores base adquieren formas muy diferentes. Lo mismo es
cierto para otros difeomorfismos que modifiquen la geometría del espacio–tiempo original.
Es importante hacer notar que, debido a que tanto las componentes de un vector como
las de una 1–forma (o vector dual) son números reales, un conjunto de 4 valores no tiene
un significado definido a menos de que se indique a qué tipo de vectores pertenecen.
Veamos ahora cómo se transforman los vectores duales base bajo un difeomorfismo
arbitrario Λ. Empleando (2.26) y (2.21), tenemos
′ ′
eµ .
e µ = Λ ν µ′ p ν ω
pe′ = pµ′ ω (2.30)
′
e µ = pµ ′ ω
Imponiendo la invariancia relativista pµ ω e µ , concluimos que
′ ′
ω eµ.
e ν = Λν µ ω transformación de vectores duales base (2.31)
Suponga que la trayectoria de una partícula está descrita por la función escalar3 para-
métrica φ(τ ), donde τ es el tiempo propio introducido en la sección 1.4. Como xµ = xµ (τ ),
entonces φ puede interpretarse como un campo (escalar) del espacio–tiempo descrito por
las coordenadas {xµ },
φ(τ ) = φ[xµ (τ )].
La derivada paramétrica de φ está dada por
eµ ≡ e
ω dxµ , 1–formas o vectores duales base (2.36)
3
En general, una función escalar es aquélla que para cada punto de un cierto espacio asigna un valor
real, es decir, para un espacio X N de N dimensiones es una función de X N → R.
76 Geometría en relatividad
las cuales forman una base completa del espacio de vectores duales. Se obtiene que, para
cualquier función escalar φ, podemos escribir la 1–forma gradiente en esta base como
e ∂φ e µ
dφ = (e
dφ)µ e
dxµ = dx , (2.37)
∂xµ
que tiene la estructura usual para los diferenciales de funcionales.
ω µ } y satisfacen
A partir de este resultado, recordando que la base {eµ } es dual a {e
(2.28), encontramos que los vectores base pueden expresarse como
La definición del producto escalar (2.3) que hemos aplicado hasta ahora puede describir-
se formalmente en términos de los vectores base. Considere dos vectores en el espacio–tiempo
de Minkowski, tales que
A · B = (Aµ eµ ) · (B ν eν ) = Aµ B ν eµ · eν
!
(2.39)
= Aµ B ν ηµν .
Esto implica que en cualquier marco de referencia inercial de la relatividad especial las
componentes de la métrica pueden obtenerse mediante el producto punto de los vectores
base,
ηµν = eµ · eν . (2.40)
La métrica η establece una regla para relacionar dos vectores A y B con el escalar A · B,
llamado producto escalar. Proponemos entonces que η es una función cuyas entradas son
dos vectores y cuyo resultado es el producto escalar de estos. Claramente, esta función es
bilineal (lineal en ambas entradas). Además, de acuerdo a (2.40), al aplicar η sobre los
vectores base, obtenemos las componentes ηµν de η. Como veremos en la sección 2.1.7, una
función multilineal del espacio de vectores a los reales, como esta, es llamada tensor. Por
lo tanto, η es un tensor llamado tensor métrico de Minkowski.
Frecuentemente, la expresión (2.40) da la impresión de que el producto punto del lado
derecho de esa ecuación es el producto escalar habitual en coordenadas Cartesianas. Eso
es incorrecto. La razón es que los vectores base {eµ } habitan en el espacio–tiempo de
Minkowski, y son los mismos en cualquier punto del espacio–tiempo, como consecuencia
de la constancia de la métrica y los vectores base. Por lo tanto, el lado derecho de (2.40)
debe leerse como eµ · eν = ηαβ eµ α eν β .
2.1 Tensores en relatividad 77
Esta expresión es una indicación de que, dependiendo de la base elegida, el producto es-
calar adopta distintas estructuras. Pero también es posible concebir que la base {eµ } no
corresponda a un espacio–tiempo plano, es decir, que los vectores base no puedan ser
relacionados con la base de Minkowski (2.9) por medio de difeomorfismos (cambios de
coordenadas) idénticos en todos los puntos del espacio–tiempo generado.
Nuevamente, es preciso hacer un paréntesis para explicar el significado del lado derecho
de (2.43). A partir del hecho de que el producto escalar es invariante bajo difeomorfismos,
′
el producto de dos vectores expresados en la base de Minkowski con coordenadas xα puede
ser relacionado al producto de esos mismos vectores en un espacio–tiempo con coordenadas
xµ arbitrarias mediante
′ ′
α′ β′ α′ β′ µ ν ∂xα ∂xβ µ ν
A · B = η α′ β ′ A B = η α′ β ′ Λ µ Λ ν A B = η α′ β ′ µ A B
∂x ∂xν (2.44)
! µ ν
= gµν A B = A · B ,
4
Una métrica g no-degenerada satisface que, si g(A, B) = 0 ∀B, entonces A = 0. Esta es una condición
más débil que la positividad requerida en espacios más comunes, como el Euclídeo.
78 Geometría en relatividad
′ ′
donde Λα µ = ∂xα /∂xµ denota las componentes del difeomorfismo que permite transi-
tar del espacio de Minkowski al espacio con coordenadas xµ . Esta expresión conduce a
identificar las componentes de la métrica del espacio–tiempo como
′ ′
∂xα ∂xβ
gµν = ηα′ β ′ , (2.45)
∂xµ ∂xν
que coincide con (2.43) sólo si los vectores base del nuevo espacio {eµ } son expresados en
las coordenadas Minkowskianas, tal que
′
′ ∂xα
eµ α = . (2.46)
∂xµ
Con esta información, a partir de la expresión de los vectores en términos de los vectores
base (2.11), encontramos que se satisface
A · B = g(Aµ eµ , B ν eν )
= Aµ B ν g(eµ , eν ) (2.47)
µ ν
= A B gµν
para dos vectores arbitrarios A y B definidos en cualquier sistema de coordenadas y un
espacio arbitrario. Es decir, (2.47) es la expresión más general del producto escalar y se
transforma en (2.3) en un espacio de coordenadas Cartesianas, cuyos vectores base son
elegidos como en (2.9).
Dado que el producto escalar es una operación conmutativa, vemos que, a partir de la
definición del tensor métrico (2.41), se satisface que
g(A, B) = A · B = B · A = g(B, A), (2.48)
es decir, el tensor métrico es simétrico bajo el intercambio de sus entradas. A partir de esta
relación, es posible establecer que las componentes del tensor métrico son simétricas bajo
el intercambio de índices, es decir,
gµν = gνµ , (2.49)
lo cual se verifica trivialmente cuando g = η.
Dado que el tensor métrico define un producto escalar en un determinado espacio–
tiempo (o un espacio) coordenado, como discutimos en la sección 1.9.3, permite establecer
la forma de medir distancias en él mediante el intervalo ds2 . Es directo generalizar la
ecuación (1.111), válida para espacio–tiempo plano en coordenadas Cartesianas, a
ds2 ≡ dx · dx = gµν dxµ dxν , (2.50)
válido en cualquier sistema coordenado. Es decir, dado un intervalo, es posible determinar
las componentes de la métrica, y viceversa. Por esta razón, es frecuente que coloquialmente
se confunda al intervalo con la métrica, aunque sean conceptos diferentes.
2.1 Tensores en relatividad 79
Más allá de ser una herramienta para calcular el producto escalar entre vectores de-
finidos en un determinado espacio–tiempo, el tensor métrico tiene un papel crucial en la
relación entre vectores y 1–formas. Para describir esta propiedad y justificar la notación
introducida en (2.4), definamos una 1–forma A,e tal que
e
A(B) = A · B, (2.51)
donde hemos empleado (2.43) en la última igualdad. De esta forma, obtenemos la expresión
Aµ = gµν Aν , (2.52)
Este mapeo entre vectores y vectores duales puede interpretarse como el mapeo entre los
vectores base y los vectores duales base dado por
g
eµ ,
eν 7−→ gνµ ω (2.54)
e B)
ge(A, e =A
e·B
e = Aµ Bν ge(e
ωµ, ω
eν )
(2.55)
≡ Aµ Bν geµν ,
en donde, siguiendo la discusión alrededor de (2.47), hemos definido las componentes del
tensor métrico en el espacio de 1–formas ge por medio de su acción sobre los vectores duales
base. Repitiendo nuestra discusión previa, podemos obtener el análogo a (2.52),
Aµ = geµν Aν , (2.56)
80 Geometría en relatividad
que mapea 1–formas a vectores. Este mapeo se puede interpretar ahora como la relación
entre las bases establecida por
ge
e ν 7−→ geνµ eµ .
ω (2.57)
Para encontrar la relación entre g y ge, podemos mapear un vector arbitrario A a su
e mediante la acción del tensor métrico g, y luego mapear A
dual A e a A mediante ge:
g ge
e µ 7−→ Aν gνµ geµα eα .
Aν eν 7−→ Aν gνµ ω (2.58)
La última expresión debe coincidir con A = Aν eν , por lo que obtenemos que ge está relacio-
nado con el tensor métrico g mediante
gνµ geµα = δνα , (2.59)
es decir, en términos matriciales, ge = g −1 , por lo que frecuentemente es llamado el tensor
métrico inverso o el inverso de la métrica. Es preciso aclarar que g −1 no es el inverso de
g en el sentido de que tome números y arroje un par de vectores (como esperaríamos de
la inversa de la función bilineal g), sino que, al contrario de g, g −1 mapea 1–formas en
vectores. Así, para un vector arbitrario A, encontramos que
g g −1
e −
A 7−→ A 7 → A. (2.60)
es decir, el tensor métrico inverso tiene la función de subir índices. Además, podemos
reescribir (2.59) como
gνµ g µα = δνα . (2.63)
∂
(e
dφ)µ = φ.
∂xµ
Por lo tanto, las componentes del correspondiente vector están dadas por
T
µ µ ∂ ∂ ∂ ∂
(dφ) ≡ ∂ φ = 0
,− 1,− 2,− 3 φ, (2.65)
∂x ∂x ∂x ∂x
que coincide con (y justifica) nuestra propuesta de 4–vector gradiente (1.154) de un campo
escalar φ.
A partir de la definición de producto escalar entre vectores (2.47) y de la relación (2.52),
obtenemos
A · B = gµν Aµ B ν = Aµ (gµν B ν ) = Aµ Bµ
(2.66)
= (gνµ Aµ )B ν = Aν B ν = Aµ B µ ,
confirmando la expresión (2.4). Esto significa que el producto escalar entre dos vectores se
expresa como el producto de las componentes de uno de los vectores con las de la 1–forma
asociada al otro vector. Análogamente, empleando (2.55) y (2.62), llegamos a
e·B
A e = g µν Aµ Bν = Aµ Bµ = Aµ B µ , (2.67)
e·B
de donde concluimos que A e = A · B.
e⊗B
A e = (Aµ ω
e µ ) ⊗ (Bµ ω
e ν ) = Aµ B ν ω
eµ ⊗ ω
eν (2.68)
e ⊗ V.
y es un elemento del espacio V e
Considerando que V y W son dos vectores, la acción de Ae⊗ B
e en la pareja de vectores
(V, W ) está dada por
e ⊗ B(V,
A e e ) B(W
W ) = A(V e ). (2.69)
Primeramente, notamos que el producto tensorial es una operación no conmutativa, pues
e ⊗ A(V,
B e W ) = B(V
e ) A(W
e ) 6= A(V
e ) B(W
e ). (2.70)
y, por lo tanto, las componentes del tensor métrico también se transforman no trivialmente
de acuerdo a
∂xα ∂xβ
g µ′ ν ′ = gαβ transformación de la métrica (2.73)
∂xµ′ ∂xν ′
ante cualquier difeomorfismo. Notamos que la expresión (2.43) que relaciona la métrica
de Minkowski con alguna otra métrica es un caso particular de esta propiedad del tensor
métrico.
2.1 Tensores en relatividad 83
De nuestra discusión, es evidente que el tensor métrico no puede ser el único elemento
e ⊗ V.
en el espacio V e Podemos concebir que existen varios objetos t de la forma
eµ ⊗ ω
t = tµν ω eν , (2.74)
Como el resultado (2.73) no depende de las propiedades específicas del tensor métrico, estas
componentes deben transformarse bajo difeomorfismos arbitrarios siguiendo la misma regla,
es decir,
∂xα ∂xβ
tµ′ ν ′ = tαβ . (2.76)
∂xµ′ ∂xν ′
Aunque t debe considerarse como una función que toma dos vectores y regresa un esca-
lar, sus características específicas dependen de las propiedades de la matriz de componentes
(tµν ). Por ejemplo, a diferencia del tensor métrico, las componentes de t podrían satisfacer
la relación antisimétrica tµν = −tνµ o no respetar ninguna relación de simetría. En este
último caso, siempre es posible separar las componentes en dos partes:
tales que
tµν = t(µν) + t[µν] . (2.77)
Las componentes simétricas pueden obtenerse a partir de las componentes arbitrarias de
t, mediante el proceso de simetrización expresando por
1
t(µν) ≡ [tµν + tνµ ]. (2.78)
2!
De forma similar, podemos antisimetrizar las componentes de t mediante
1
t[µν] ≡ [tµν − tνµ ]. (2.79)
2!
En la sección 2.1.2, introdujimos las 1–formas como funciones lineales que aceptan vec-
tores y devuelven escalares. Similarmente, el tensor métrico, introducido en la sección 2.1.4,
es una función bilineal que acepta pares de vectores y devuelve el producto escalar de éstos.
84 Geometría en relatividad
Además, tanto las 1–formas como el tensor métrico son invariantes bajo difeomorfismos,
tales como un cambio de coordenadas o una transformación de Lorentz, pese a que sus com-
ponentes sí son alteradas por las transformaciones. Otra propiedad en común es que las
componentes de las 1–formas y del tensor métrico se obtienen de su acción en los vectores
base {eµ }. Finalmente, notamos que la base del tensor métrico es el producto tensorial de
los elementos base de las 1–formas. Estas similitudes revelan que ambos objetos pertenecen
a una clase grande de estructuras conocidas como tensores.
Como generalización, un tensor puede ser considerado una función multilineal que toma
N vectores y arroja algún escalar. Estos tensores son elementos del espacio V eN = V⊗·
e · ·⊗ V,
e
donde Ve es el espacio generado por las 1–formas base y N se conoce como el rango de los
tensores. Notamos que, en este sentido, una cantidad escalar es un tensor de rango 0.
Las componentes tµνρ... de un tensor t arbitrario estarían dadas por su aplicación sobre
los vectores base, t(eµ , eν , eρ , . . .). El número de componentes de los tensores depende del
rango del tensor y de la dimensionalidad del espacio V e en el que son definidos. En 4
N
dimensiones, un tensor de rango N tiene 4 componentes. Por ejemplo, un escalar tiene
40 = 1 componente, una 1–forma tienen 41 = 4 componentes, y un tensor de rango dos,
como el tensor métrico, tiene 42 = 16 componentes, aunque no todas sean independientes
debido a sus relaciones de simetría.
Por otra parte, como el espacio de vectores V comparte muchas propiedades con su dual,
el espacio de 1–formas V, e no es difícil concebir que los vectores también son un tipo de
tensores, y que éstos pueden generalizarse. Recordemos, por ejemplo, que el tensor métrico
inverso g −1 es una función lineal que acepta 1–formas y devuelve el producto escalar de
éstas, como es evidente de (2.55). También ahí es evidente que las componentes g µν de
este tensor se obtienen de la acción del tensor métrico inverso sobre las 1–formas base,
g −1 (e
ωµ, ω
e ν ). En analogía con el caso anterior, podemos considerar que los elementos del
espacio VM son tensores de rango M que toman M 1–formas y devuelven escalares. Si t es
ahora un elemento de VM , sus componentes son el resultado de su acción sobre las 1–formas
base, tµνρ... = t(eωµ, ω
eν , ω
e ρ , . . .).
Podemos generalizar la definición de tensores a objetos multilineales que toman M
1–formas y N vectores, y devuelven escalares,
e B,
t(A, e ...; U, V, ...) ∈ R. (2.80)
eN , tales que si t ∈ VM ⊗ V
Estos tensores son elementos del espacio VM ⊗ V eN ,
e ν1 ⊗ ω
t = tµ1 µ2 ...µM ν1 ν2 ...νN eµ1 ⊗ eµ2 ⊗ · · · ⊗ eµM ⊗ ω e ν2 ⊗ · · · ⊗ ω
e νN , (2.81)
′ ′ ′
′ ′ ′ ∂xµ1 ∂xµ2 ∂xµM ∂xν1 ∂xν2 ∂xνN µ1 µ2 ...µM
tµ1 µ2 ...µM ν1′ ν2′ ...νN′ = · · · · · · ′ t ν1 ν2 ...νN . (2.83)
∂xµ1 ∂xµ2 ∂xµM ∂xν1′ ∂xν2′ ∂xνN
Para formalizar estos mapeos, dado un vector A y una 1–forma A, e notamos que g(eµ , A) =
ν ν ν −1
g(eµ , A eν ) = A g(eµ , eν ) = A gµν = Aµ y, análogamente, g (e e = Aµ . Por lo tanto,
ω µ , A)
e = g(eµ , A)e
A ωµ , A = g −1 (e e µ.
ω µ , A)e (2.86)
Para tensores M N , podemos emplear que t
µ1 µ2 ...µM
ν1 ν2 ...νN eµ1 es un vector (con índice
µ1 variable y los demás fijos), por lo que, de acuerdo a (2.86),
eα
ω α = gαµ1 tµ1 µ2 ...µM ν1 ν2 ...νN ω
g(eα , tµ1 µ2 ...µM ν1 ν2 ...νN eµ1 )e (2.87)
es una 1–forma con componentes (de índice α)
tα µ2 ...µM ν1 ν2 ...νN ≡ gαµ1 tµ1 µ2 ...µM ν1 ν2 ...νN ; (2.88)
es decir, el tensor métrico también baja un índice al actuar sobre tensores generales. Inser-
tando (2.87) en la expresión
de un tensor de rango (M, N ), hallamos que el tensor métrico
mapea un tensor M N a un tensor M −1
N +1
M g M −1
7−→ . (2.89)
N N +1
86 Geometría en relatividad
No es difícil convencerse de que la inversa del tensor métrico tiene el efecto opuesto,
M g −1 M +1
7−→ . (2.90)
N N −1
Esta observación explica por qué es necesario definir los tensores mediante productos ten-
e
soriales tanto de V como de su dual, V.
La aplicación repetida del tensor métrico sobre un tensor de rango (M, N ) conduce a
la cadena
M g M −1 g M −2 g M −3 g
7−→ 7−→ 7−→ 7−→ · · · . (2.91)
N N +1 N +2 N +3
Claramente, después de M aplicaciones del tensor métrico sobre el tensor M N , éste se
0
convierte en un tensor M +N . Similarmente, tras N aplicaciones de g −1 , obtenemos un
M +N
tensor 0 . Este resultado nos muestra que un tensor t de rango (M, N ) puede ser
transformado a otro equivalente de rango (M ′ , N ′ ), tal que M ′ + N ′ = M + N por acción
del tensor métrico. Por ejemplo, un tensor F puede ser expresado como tensor de rango
(1, 1) o (2, 0) o (0, 2) al permitir la acción del tensor métrico o su inversa.
El mapeo entre distintos tensores nos ayuda a determinar lo que g −1 es en términos
tensoriales. Si aplicamos dos veces g a las componentes g αβ de g −1 , obtenemos
2
Entonces, g αβ son las componentes de un tensor 0 . Adicionalmente, notamos que
gµα g αβ = gµ β . (2.93)
Sin embargo, como g αβ son las componentes de la inversa de g, con componentes gαβ ,
entonces
gµ β = δµβ . (2.94)
Por otra parte, así como las componentes de un tensor de rango (0, 2) puede ser sepa-
radas en simétricas y antisimétricas de acuerdo a (2.78) y (2.79), podemos encontrar un
método de hacer lo mismo con tensores arbitrarios. Para lograrlo, podemos reescribir (2.78)
como
1 1 X
t(µ1 µ2 ) = (tµ1 µ2 + tµ2 µ1 ) = tµσ(1) µσ(2) , (2.95)
2! 2!
σ∈Σ2
donde σ es un elemento del conjunto de permutaciones de los elementos y Σ2 = {(1, 2), (2, 1)},
lo que implica que, por ejemplo, para el segundo elemento de Σ2 debemos tomar σ(1) = 2
2.1 Tensores en relatividad 87
Suma + de tensores del mismo rango. Si A y B son tensores de rango (N, M ), entonces
t = A + B es también un tensor de rango (N, M ) y sus componentes están dadas por
tµ1 ...µM1 ν1 ...νN1 α1 ...αM2 β1 ...βN2 = Aµ1 ...µM1 ν1 ...νN1 B α1 ...αM2 β1 ...βN2 , (2.108)
tµ1 ...µp−1 µp+1 ...µM ν1 ...νq−1 νq+1 νN = Aµ1 ...µp−1 αµp+1 ...µM ν1 ...νq−1 ανq+1 νN , (2.109)
donde t es un tensor diferente de rango (M − 1, N − 1) debido a que el índice α ha
desaparecido (ha sido contraído).
Notemos que la contracción y el producto exterior conducen al producto interior.
Sean A y B e un vector y una 1–forma respectivamente. Entonces t = A ⊗ Be es de
µ µ
rango (1, 1) y componentes t ν = A Bν . Si contraemos los índices,
t µ µ = Aµ B µ , (2.110)
entonces el resultado tiene rango (0, 0), es decir, es un escalar.
que la función escalar φ es un tensor de rango (0, 0), podríamos proponer que la operación
gradiente e
d es tal que incrementa el rango en una unidad, es decir
0 ed 0
7−→ . (2.112)
0 1
Esta idea puede aplicarse a tensores. Consideremos un tensor arbitrario t, tal que
e ν1 ⊗ ω
t = tµ1 µ2 ...µM ν1 ν2 ...νN eµ1 ⊗ eµ2 ⊗ · · · ⊗ eµM ⊗ ω e ν2 ⊗ · · · ⊗ ω
e νN . (2.113)
Consideremos adicionalmente que los vectores y 1–formas base están dados, respectivamen-
te, por las bases constantes (2.9) y (2.29), válidas sólo en el espacio–tiempo de Minkowski.
El gradiente de t es entonces
M N
e e
dt = (dt)α ⊗ ω α
e = t,α ⊗ ω α
e = t µ1 µ2 ...µN
ν1 ν2 ...νN ,α ⊗ eµi ⊗ ω
e νj
eα,
⊗ω (2.114)
i=1 j=1
Vemos que f depende de qc u, por lo que una primera conjetura es que el vector de
fuerza de Lorentz f debe de ser proporcional al vector de velocidad, qc U . Además debe
haber un segundo tensor para agregar la acción del campo. Debido a que U es un vector
y f también, el segundo tensor puede ser de rango (1, 1) y debe presentarse la contracción
de algún índice. La elección más natural, en términos de las componentes, es entonces
q
f µ = F µν U ν . (2.120)
c
Notemos que el índice ν del lado derecho se contrae y el único índice libre es µ en ambos
lados. La introducción del tensor F de rango (1, 1) permite que f tenga la estructura
correcta. Ahora, veamos que, como pµ pµ = m2 c2 , entonces
d µ dpµ
0= (p pµ ) = 2 pµ = 2f µ pµ = 2f µ mUµ ⇐⇒ f µ Uµ = 0, (2.121)
dτ dτ
donde hemos empleado (1.66) y (1.67). Aplicando el tensor métrico para bajar y subir índi-
ces sobre (2.120) y (2.121), expresando F ahora como un tensor de rango (0, 2), obtenemos
fµ U µ = 0 =⇒ Fµν U ν U µ = 0 . (2.122)
Dado que Fµν U ν U µ = Fνµ U µ U ν y que U µ U ν = U ν U µ , podemos descomponer (2.122) en
dos partes como
1 µ ν
U U (Fµν + Fνµ ) = 0 ⇐⇒ Fµν = −Fνµ . (2.123)
2
Este resultado significa que el tensor F es antisimétrico. A F se le conoce como el tensor
de Faraday.
Una elección del tensor de Faraday en representación matricial que conduce a la fuerza
de Lorentz como la conocemos es (ver ejercicio 2.7)
0 E(1) E(2) E(3)
−E(1) 0 −B(3) B(2)
(Fµν ) =
−E(2) B(3)
, (2.124)
0 −B(1)
−E(3) −B(2) B(1) 0
donde E(i) y B(i) son los campos eléctrico y magnético en la dirección xi con i = 1, 2, 3.
Evitamos usar la notación E1 , . . . para no confundir E con un tensor, ya que E y B son
sólo vectores tridimensionales. Es fácil mostrar que las componentes espaciales de f ,
q
fi = Fiµ U µ , (2.125)
c
92 Geometría en relatividad
determinan la fuerza de Lorentz habitual. Es útil notar que la versión de F de rango (2, 0)
tiene componentes ligeramente diferentes:
0 −E(1) −E(2) −E(3)
E(1) 0 −B(3) B(2)
F µν = η µα η νβ Fαβ =⇒ (F µν ) =
E(2) B(3)
. (2.126)
0 −B(1)
E(3) −B(2) B(1) 0
Por ejemplo, E(1) = −F 01 = F01 mientras que B(1) = F 32 = F32 .
Ahora consideremos una distribución continua de cargas eléctricas moviéndose a una
velocidad local u. La densidad de carga en su sistema de referencia propio es ρ0 , entonces
la densidad de carga medida en el laboratorio en reposo es
ρ = γ(u)ρ0 porque V = γ(u)−1 V ′ , (2.127)
donde V es el volumen medido en el laboratorio y V ′ está medido en el marco de referencia
en movimiento. Vemos que la relación entre ρ y ρ0 es similar a
dt = γ(u)dτ (2.128)
x0
y, por lo tanto, ρ parece transformarse de la misma manera que c .
Por otra parte, la densidad de corriente en este sistema puede definirse como
j = ρu, (2.129)
la cual está restringida por la ecuación de continuidad,
∂ρ
+ ∇ · j = 0. (2.130)
∂t
Con base en estas observaciones, podemos proponer que la 4–corriente de una carga en
movimiento desde el punto de vista de un observador en reposo está dada por
(J µ ) = (cρ, j)T = (cγ(u)ρ0 , uγ(u)ρ0 )T = (ρ0 U µ ) (2.131)
para representar la generalización de la corriente tridimensional j. Para nuestro sistema,
las componentes J µ se transforman como dxµ porque son proporcionales a U µ . Con esta
definición, la ecuación de continuidad (2.130) puede reexpresarse como
R
Una consecuencia de esta ecuación es que la carga definida por Q ≡ d3 xJ 0 se conserva
en el tiempo. Para confirmarlo, calculamos la derivada temporal de Q como
Z 0 Z I
∂Q 3 ∂J 3
= d x = − d x∇ · j = j · n̂dS = 0, (2.133)
c∂t c∂t
Ω Ω ∂Ω
2.2 Ecuaciones de Maxwell en relatividad especial 93
(Es importante la posición de los índices. Nótese que esta notación no es consistente con
la contracción de índices porque ésta no es aún una notación covariante.)
Recordando que ∂ µ φ = η µν ∂ν φ, entonces ∂ i φ = −∂i φ y ∂ 0 φ = ∂0 φ, por lo que
−F 0i = −∂ 0 Ai + ∂ i φ,
(2.137)
−F jk = −εijk ∂ j Ak = −∂ j Ak + ∂ k Aj .
Para que la primera de estas ecuaciones sea simétrica, podemos definir el 4–potencial
A como
(Aµ ) = (φ, A1 , A2 , A3 )T . (2.138)
Por lo tanto, en términos de este tensor, las componentes del tensor de Faraday están dadas
por
F µν = ∂ µ Aν − ∂ ν Aµ =⇒ Fµν = ∂µ Aν − ∂ν Aµ = Aν,µ − Aµ,ν . (2.139)
A partir de (2.139), se obtiene la llamada identidad de Bianchi
debido a que, como por ejemplo Aν,µσ = Aν,σµ (las derivadas conmutan), se satisface
Notemos que (2.140) provee una ecuación diferencial no trivial sólo para µ 6= ν 6= σ. Por
ejemplo, si ν = µ, el lado izquierdo de (2.140) no contiene información,
De hecho, debido a que la identidad de Bianchi (2.140) posee varias simetrías, las únicas
elecciones no triviales de índices son:
4π ν
∂µ F µν = J . (2.144)
c
! 4π 0
∂µ F µ0 = ∂i F i0 = ∇ · E = J = 4πρ. (2.145)
c
Por último, veamos una manera de simplificar las ecuaciones de Maxwell. Podemos
introducir el dual de Hodge del tensor de Faraday ∗F como el tensor de componentes
1
∗F µν ≡ εµνρσ Fρσ , (2.148)
2
∗F µν ,µ = 0. (2.150)
Para concluir este ejemplo, identificamos las cantidades escalares (invariantes) que se
pueden construir con F y ∗F . Los invariantes son aquéllos en los que todos los índices
han sido contraídos y, por lo tanto, no se transforman bajo difeomorfismos. Para la teoría
electromagnética, sólo hay dos:
Fµν F µν = 2 |B|2 − |E|2 , (2.151)
µν
Fµν ∗F = −4 B · E.
x3
x2
∆A
x1
u1 ∆t
superficie de
x1 constante
Figura 2.1: El número de partículas que atraviesan una porción ∆A de la superficie x1 = cte en
un tiempo ∆t es nu1 ∆t∆A para velocidades no relativistas. Entonces, el flujo no relativista por
unidad de área es nu1 .
N µ = nU µ , (2.153)
N 0 = nc y N i = 0. (2.154)
T 00 = ρ = mc2 n,
(2.156)
T 0i = T i0 = 0 y T ij = 0 describe un fluido con presión cero.
T µν = T νµ . (2.159)
Un fluido perfecto más general, dotado también de presión, tiene un T cuyas compo-
nentes forman una matriz diagonal en el marco de referencia en reposo,
(T µν ) = diag(ρ, P, P, P ), (2.160)
donde ρ es la densidad de energía y P denota la presión del fluido (no confundir con el
4–vector de momento p). La forma de T se basa en las propiedades del fluido perfecto:
No es difícil convencernos de que, para que el tensor de energía–momento sea válido para
marcos de referencia en movimiento en espacio–tiempo de Minkowski y que sea compatible
con la expresión para polvo (2.158) con P = 0, las componentes de T deben escribirse como
1
T µν = (ρ + P )U µ U ν − P η µν . energía–momento de fluido ideal (2.161)
c2
P = ωρ, (2.162)
La ecuación de estado describe las propiedades más importantes del fluido perfecto.
∂ 0 pµ = 0 , (2.164)
dondeRΩ es un volumen µν
0 3 00
R 3 que contiene a todo el sistema, tal0 que T = 0 fuera de Ω. Como
Q = d xT = d xρ, entonces podemos identificar Q con la energía total de sistema
2.3 Tensor de energía–momento 101
descrito por el tensor T . Por lo tanto, la conservación de energía puede escribirse como
∂0 Q0 = 0, que, en la lógica de la ecuación (2.133), se satisface si
En estos términos, podríamos afirmar que el tensor T es una especie de corriente de mo-
mento y energía. Como para la carga eléctrica en (2.133), notamos que no sólo para Q0 ,
sino para las 4 cantidades Qµ se satisface
Z Z I
∂Qµ 3 ∂T
µ0
= d x = − d x∂i T = − dST µi n̂i = 0 ,
3 µi
(2.167)
c∂t c∂t
Ω Ω ∂Ω
gµν = eµ · eν = δµν , µ, ν = 1, 2 ,
donde δµν es la delta de Kronecker, definiendo así el producto escalar en estas coordenadas.
En el espacio Euclídeo, las posiciones se determinan con vectores x = xµ eµ = (x1 , x2 )T .
′ ′
Un difeomorfismo general de las coordenadas (x1 , x2 ) a (x1 , x2 ) está parcialmente
codificado en la matriz Jacobiana
! ′ ′!
∂xµ
′
∂x1 ∂x1
1 2
= ∂x2′ ∂x2′ (2.173)
∂xν ∂x
1
∂x
2∂x ∂x
Recordando que los vectores base {eµ } se transforman con la inversa de la matriz de
transformación para las transformaciones de coordenadas, encontramos
∂xν
e µ′ = eν , (2.183)
∂xµ′
eµ = e
mientras las 1–formas base ω dxµ se transforman como
′
e ′ ∂xµ e ν
dxµ = dx . (2.184)
∂xν
Ejemplo 2.2 Bases en coordenadas polares.
En coordenadas polares tenemos, usando (2.183), que
∂x ∂y
er = ex + ey = cos θex + sen θey ,
∂r ∂r (2.185)
∂x ∂y
eθ = ex + ey = −r sen θex + r cos θey ,
∂θ ∂θ
y para las 1–formas base, aplicando (2.184), obtenemos
e ∂r e ∂r e x y
dr = dx + dy = e dx + edy = cos θe
dx + sen θe
dy,
∂x ∂y r r
(2.186)
e = ∂θ dx
dθ e + ∂θ e 1
dy = − sen θe
1
dx + cos θe dy.
∂x ∂y r r
Notemos que ahora los vectores base dependen de la posición, a pesar del hecho de que
seguimos en espacio plano y ex = (1, 0)T , ey = (0, 1)T . Además, los vectores base no son
paralelos en distintos puntos, como se ilustra en la figura 2.2. Finalmente, la longitud de los
vectores base tampoco es en general constante; por ejemplo, |eθ |2 = r2 sen2 θ+r2 cos2 θ = r2
(aunque |er |2 = 1).
Ahora discutamos algunos aspectos sobre la métrica, usando las coordenadas polares
desarrolladas en los ejemplos 2.1 y 2.2.
Como estamos en el espacio Euclídeo, sabemos que las componentes de la métrica en
las coordenadas usuales (x, y) forman la matriz identidad, (gµν ) = diag(1, 1). Sin embargo,
adoptando los resultados más importantes de la sección 2.1.4, en coordenadas polares
encontramos que
1 0
g µ′ ν ′ = e µ ′ · e ν ′ =⇒ (gµ′ ν ′ ) = , (2.187)
0 r2
2.4 Espacio con métrica no trivial 105
y
eθ
er
eθ
er
x
Figura 2.2: En general, los vectores base en coordenadas polares no son paralelos, y su dirección
depende de su posición en el espacio.
donde hemos empleado (2.43) con el producto escalar Cartesiano. Esta métrica conduce al
intervalo
ds2 = |drer + dθeθ |2 = dr2 + r2 dθ2 = gµ′ ν ′ dxµ dxν .
′ ′
(2.188)
Adicionalmente, la inversa de la métrica es
µ′ ν ′ 1 0
(g )= 1 , (2.189)
0 r2
para determinar las componentes del (vector) dual de la 1–forma e dφ con componentes φ,ν ′ :
′ ′ ′ ∂φ
φ,µ = g µ ν φ,ν ′ =⇒ φ,r = g rr φ,r + g rθ φ,θ = ,
∂r (2.190)
1 ∂φ
φ,θ = g θr φ,r + g θθ φ,θ = 2 .
r ∂θ
Así, obtenemos que la 1–forma gradiente es e
dφ = (φ,r , φ,θ ) mientras que el correspondiente
vector adopta la forma
1 ∂φ 1 ∂φ
dφ = (φ,r , φ,θ )T = er + 2 eθ , (2.191)
r2 ∂r r ∂θ
que es muy diferente del resultado en las coordenadas usuales: e
dφ = (φ,x , φ,y ) y dφ =
(φ,x , φ,y )T .
Debemos hacer un comentario con respecto a la notación habitual en otros textos. El
gradiente de un vector en coordenadas polares se escribe usualmente como
∂φ 1 ∂φ e ∂φ ê 1 ∂φ ê
dφ = êr + êθ , dφ = dr + dθ. (2.192)
∂r r ∂θ ∂r r ∂θ
106 Geometría en relatividad
Esta es solamente otra forma equivalente de escribir dφ, en donde los vectores base están
normalizados como
er eθ 1
êr = = er , êθ = = eθ . (2.193)
|er | |eθ | r
∂eµ
eµ,ν = ≡ Γα µν eα , símbolos de Christoffel (2.196)
∂xν
donde hemos usado el hecho de que, como vimos en el ejemplo de coordenadas pola-
res (2.194), las derivadas de los vectores base son una combinación lineal de los vectores
8
A partir de aquí, omitimos las primas sobre los índices para simplificar la notación.
9
En la literatura, es frecuente encontrar los símbolos de Christoffel de primer tipo, Γαµν = gαλ Γλ µν , que
no emplearemos aquí.
2.4 Espacio con métrica no trivial 107
base. Con esta expresión, podríamos interpretar a los símbolos de Christoffel Γα µν como
∂e
la α-ésima componente de ∂xµν . Sin embargo, es importante enfatizar que estas no son
componentes de un tensor, como veremos en la sección 2.4.6.
Para el ejemplo de coordenadas polares, podemos obtener Γα µν directamente de (2.194):
1
Γθ rθ = Γθ θr = , Γr θθ = −r,
r (2.197)
Γr rr = Γθ rr =Γr rθ = Γr θr = Γθ θθ = 0.
Como las derivadas eµ,ν 6= 0 en general, entonces los vectores base contribuyen a la
derivada de un vector general V = V µ eµ de la siguiente manera:
∂V
= V µ ,ν eµ + V µ eµ,ν
∂xν
= V µ ,ν eµ + V µ Γα µν eα (2.198)
= V µ ,ν eµ + V α Γµ αν eµ
= (V µ ,ν + V α Γµ αν )eµ .
D · V = V µ ;µ = V µ ,µ + V α Γµ αµ . (2.201)
Notamos que, si g µν ,µ 6= 0, (2.204) tiene dos términos además del habitual en coordenadas
Cartesianas:
D · D φ = ∂ · ∂φ + ∂ν φg µν ,µ + g αν ∂ν φΓµ αµ , (2.205)
donde ∂ · ∂ = g µν ∂µ ∂ν .
φ = p µ Aµ , (2.206)
Por otro lado, sabemos que φ;ν = φ,ν , lo que implica que
ω eλ.
e µ ,ν = −Γµ λν ω (2.210)
Estas observaciones son importantes para obtener la forma de la derivada covariante para
cualquier tensor t, tal que
≡B
z }| {
t= tµ1 µ2 ...ν1 ν2 ... eµ1 ⊗ eµ2 ⊗ ... ⊗ ωe ν1 ⊗ ω
e ν2 ⊗ ... . (2.211)
Dα tµ1 µ2 ...ν1 ν2 ... ≡ tµ1 µ2 ...ν1 ν2 ...,α + Γµ1 λα tλµ2 ...ν1 ν2 ... + Γµ2 λα tµ1 λ...ν1 ν2 ... + . . .
(2.213)
− Γρ ν1 α tµ1 µ2 ...ρν2 ... − Γρ ν2 α tµ1 µ2 ...ν1 ρ... − . . . ,
que pueden ser también denotadas como tµ1 µ2 ...ν1 ν2 ...;α ≡ Dα tµ1 µ2 ...ν1 ν2 ... . Si t tiene rango
(M, N ), Dt corresponde a un tensor de rango (M, N + 1).
Derivada covariante de la métrica. Primero, es importante recordar que las ecua-
ciones tensoriales son invariantes ante transformaciones (por eso el lenguaje tensorial es
tan conveniente). Esto significa particularmente que, si una ecuación tensorial es válida en
un sistema de coordenadas, debe ser válida para cualquier otro.
Consideremos ahora la derivada covariante de un vector V , con componentes V α ;µ .
Como V α ;µ corresponde a las componentes de un tensor, entonces la aplicación de la
métrica conduce a
Vµ;ν = gµα V α ;ν . (2.214)
Por otro lado, la acción directa de la métrica en V seguida de la derivada covariante,
aplicando la regla de Leibniz, conduce a
Por otra parte, usando la derivada covariante de un tensor de rango (0, 2) de acuerdo
a (2.212), encontramos
!
0 = gµα;ν = gµα,ν − gλα Γλ µν − gµλ Γλ αν ,
(2.217)
⇐⇒ gµα,ν = gλα Γλ µν + gµλ Γλ αν .
1
Γλ αν = g λµ (gµα,ν + gνµ,α − gαν,µ ). símbolos de Christoffel (sin torsión)
2
(2.221)
10
Es posible concebir espacios en los que Γλ µν 6= Γλ νµ . Se dice que estos espacios están dotados de torsión
λ
y Γ µν − Γλ νµ son las componentes del llamado tensor de torsión asociado (ver ejercicio 2.17).
2.4 Espacio con métrica no trivial 111
Esta conclusión resulta muy importante en la práctica para calcular los símbolos de Chris-
toffel en espacios y espacios–tiempo métricos.
Revisitando divergencia y Laplaciano. Ahora podemos simplificar nuestras expre-
siones para la divergencia de un vector V y el Laplaciano de un campo escalar φ.
Un resultado estándar de álgebra lineal basado en la fórmula de Leibniz y Jacobi para
el determinante de una matriz invertible A establece que
∂ det A
= (A−1 )ji det A. (2.222)
∂Aij
Denotando el determinante de la matriz asociada a las componentes del tensor métrico
como |g| ≡ det g, la fórmula (2.222) implica para el determinante de la métrica que
∂|g| ∂xα ∂|g|
= g µν |g| =⇒ = g µν |g|. (2.223)
∂gµν ∂gµν ∂xα
La última ecuación puede reescribirse de la siguiente forma
∂α |g|
= g µν ∂α gµν ⇐⇒ ∂α ln |g| = g µν ∂α gµν = g µν gµν,α . (2.224)
|g|
Empleando los resultados anteriores, es posible reexpresar (2.221), con los índices α y ν
contraídos, en términos de |g| como
1 1
Γµ αµ = g µλ (gαλ,µ + gµλ,α − gαµ,λ ) = (gαλ ,λ + g µλ gµλ,α − gαµ ,µ )
2 2
1 µλ 1 p 1 p (2.225)
= g gµλ,α = ∂α ln |g| = ∂α (ln |g|) = p ∂α |g|.
2 2 |g|
Formalmente, estas ecuaciones son válidas para el valor absoluto del determinante de la
métrica, por lo que las dos últimas igualdades solamente son válidas cuando |g| > 0 (lo
cual no es automático porque |g| denota sólo el determinante de g). En los casos en los que
|g| < 0, como en el espacio–tiempo de Minkowski, |g| debe ser reemplazado por −|g|.
Empleando (2.225) en (2.201), encontramos una nueva expresión para la divergencia
1 p
D · V = V µ ,µ + p V µ ∂µ |g|, (2.226)
|g|
lo que conduce finalmente a
1 p
D · V = p ∂µ V µ |g| . (2.227)
|g|
1
Γµ rµ = Γr rr + Γθ rθ = (2.229)
r
Γµ θµ = Γr θr + Γθ θθ = 0, (2.230)
∂V r ∂V θ 1 1 ∂ ∂V θ
D · V = V µ ,µ + V α Γµ αµ = + + Vr = (rV r ) + . (2.231)
∂r ∂θ r r ∂r ∂θ
p
Por otro lado, a partir de (2.226), se obtiene el mismo resultado con |g| = r (ver (2.187)):
1 p 1 1 1
D · V = p ∂µ (V µ |g|) = ∂µ (rV µ ) = ∂r (rV r ) + ∂θ (rV θ ) . (2.232)
|g| r r r
1 ∂ 1 ∂ V̂ θ
D · V̂ = (rV̂ r ) + , (2.233)
r ∂r r ∂θ
La relación entre las bases {eµ } y {êµ } surge de êµ = eµ /|eµ |, donde |eµ | denota la magnitud
del vector base eµ , como en (2.193). Por lo tanto, como V no debería depender de su base,
!
V̂ = V̂ µ êµ = V̂ µ eµ /|eµ | = V µ eµ = V =⇒ V µ ≡ V̂ µ /|eµ | , (2.235)
′
donde Γµ α′ ν ′ denota los símbolos de Christoffel transformados, que deseamos conocer en
términos de Γµ αν . Comparando (2.239) y (2.240), vemos que el primer término de (2.240)
es idéntico al primero de (2.239), de manera que resulta
′ ′ ′
∂xµ ∂xν α µ α ∂x
ν ∂ 2 xµ ∂xα α µ′
µ ′ A Γ αν = A ν α
+ A Γ α′ ν ′
∂x ∂x ν ν ′
∂x ∂x ∂x ∂xα
y, consecuentemente,
′ ′
µ′ ∂xµ ∂xν ∂xα µ ∂xν ∂xα ∂xµ
⇐⇒ Γ α′ ν ′ = Γ αν − . (2.241)
∂xµ ∂xν ∂xα
′ ′
∂xν ′ ∂xα′ ∂xν ∂xα
Debido a la presencia del segundo término, incompatible de acuerdo a (2.83) con la trans-
formación de un tensor de rango (1, 2), vemos que Γ no puede ser un tensor.
Sin embargo, aunque Γ no es un tensor, cada Γµ sí es un tensor de rango (1, 1), con
componentes (Γµ )λ ν . Esto puede verse sencillamente de la definición de Γλ µν
e e ν = Γλ µν eλ ⊗ ω
deµ = eµ,ν ω eν , (2.242)
donde es claro que para cada vector eµ hay un tensor de rango (1, 1) e
deµ cuyas componentes
son Γλ µν con µ fija.
de Lorentz. En otras palabras, las expresiones finales obtenidas en las secciones 2.2 y 2.3
son válidas para observadores inerciales, o, en otras palabras, son compatibles sólo con la
relatividad especial.
El origen de este resultado es que la derivada regular no constituye un tensor en un
espacio (o espacio–tiempo) dotado de un tensor métrico no trivial. Como hemos visto en la
sección 2.4.5, la derivada covariante es la única que es compatible con todo difeomorfismo,
constituyendo un tensor, y además se reduce a la derivada regular en el caso en el que la
métrica sea trivial. Por lo tanto, en los sistemas físicos descritos previamente basta con sus-
tituir las derivadas por derivadas covariantes para lograr que sean globalmente covariantes,
como se les denomina a las ecuaciones que son las mismas en los espacios relacionados bajo
cualquier difeomorfismo.
Por lo tanto, las ecuaciones de Maxwell (2.144) y la ecuación de continuidad (2.132) se
expresan en el formalismo covariante como
4π ν
F µν ;µ = J con J µ ;µ = 0 . (2.243)
c
Adicionalmente, las otras ecuaciones de Maxwell descritas por la identidad de Bianchi
electromagnética (2.140) en términos covariantes están dadas por
F[µν;σ] = 0 , (2.245)
considerando que las componentes del tensor de Faraday son antisimétricas, Fµν = −Fνµ .
Por otra parte, también las ecuaciones de conservación de energía–momento (2.166) son
alteradas al formularlas en el formalismo covariante:
T µν ;µ = 0 . (2.246)
ningún sistema coordenado específico. Por lo tanto, las leyes físicas no deberían depender
de nuestra elección de coordenadas.
El principio de covariancia no establece explícitamente una conexión con un observador
específico. Sin embargo, recordando que los sistemas de referencia son marcos de referencia
de distintos observadores, notamos que implícitamente los difeomorfismos relacionan las
perspectivas de diferentes observadores. Los difeomorfismos más generales corresponden a
deformaciones del espacio–tiempo que son capaces de alterar su estructura. Por lo tanto,
los marcos de referencia relacionados por distintas transformaciones pueden corresponder
a los de observadores inerciales, rotantes, acelerados, torcidos, etc.. Lo que el principio
de covariancia general significa es que, sin importar el tipo de observadores, si sus mar-
cos de referencia están relacionados mediante difeomorfismos, las ecuaciones en notación
covariante son válidas para todos los observadores.
Evidentemente, entonces, el principio de covariancia general establece una generali-
zación crucial al principio de relatividad, permitiendo que distintos observadores puedan
interpretar y comparar sus mediciones.
Figura 2.3: Dos geodésicas sobre la esfera apuntando hacia el polo norte o sur forman meridianos,
que, por definición, se cruzan en dos puntos. Sin embargo, en una región suficientemente pequeña,
localmente, las líneas pueden parecer paralelas, lo que nos podría hacer creer que el espacio es plano.
espacio tangente TP M
con métrica g(P)
u1 u2 u3 u4 p
u1
(a) (b)
Figura 2.4: (a) Una variedad diferencial M es cubierta por un conjunto de abiertos ui . (b) Una
variedad Riemanniana tiene una métrica asociada a cada espacio tangente TP M a sus puntos P.
2.6.2. Variedades
Como hemos visto en la sección 2.6.1, una variedad es cualquier espacio continuo que
localmente es Rm , aunque la forma (topología) del espacio completo puede ser bastante
diferente a la de la geometría Euclidiana. Algunos ejemplos de variedades son ilustrados
en la figura 2.5.
Es tan general la definición de variedad, que uno podría caer en la tentación de pensar
que un espacio arbitrario es una variedad. Sin embargo, el contraejemplo más simple es
el cono, pues es imposible escoger una región abierta alrededor de su vértice que parezca
localmente un espacio Euclídeo.
12
Un homeomorfismo es una función uno-a-uno, continua e invertible entre dos espacios topológicos.
2.6 Espacio y espacio–tiempo con curvatura 119
Sm Tm
Rm
Los ejemplos de variedades mostrados en la figura 2.5 pueden describirse por un conjun-
to de funciones continuas llamadas coordenadas xµ , de manera que las coordenadas de la
variedad son solamente los parámetros libres independientes que parametrizan la variedad.
Las variedades más relevantes para la relatividad son Riemannianas. Sus principales
cualidades son
1. son diferenciables en todas partes, por lo que están dotadas con una conexión; y
Figura 2.6: Las variedades Riemannianas son el subconjunto de todos los espacios topológicos
localmente planos, diferenciables, y dotados de métrica y conexión compatibles.
Es decir, a primera aproximación, gµν (P) = δµν mientras que gµν,ρ (P) = 0. Las segundas
derivadas del tensor métrico pueden ser no nulas, gµν,ρσ (P) 6= 0, lo cual, como veremos,
es una manifestación de la curvatura del espacio. Notemos que todas estas propiedades se
relacionan con un punto P, lo que implica que lejos de P el tensor métrico g(P) puede violar
estas restricciones, pero existirá otro punto en esa región y una elección de coordenadas
para los que se satisfacen.
Por otro lado, la métrica y la conexión son compatibles si13
en todas partes. Vemos que esta sencilla propiedad (que, como vimos en (2.216), es una
propiedad del espacio plano) tiene varias consecuencias para la conexión y la derivada
covariante. En primer lugar, también la derivada covariante del tensor métrico inverso se
anula, Dg −1 = 0; en segundo, la métrica conmuta con la derivada covariante, lo que implica
que
Dµ V µ = Dµ (g µν Vν ) = g µν Dµ Vν = Dν Vν ; (2.249)
y, por último, la conexión puede calcularse mediante la ecuación (2.221).
Dadas las propiedades de la métrica en una variedad Riemanniana, notamos directa-
mente que en un punto P donde la métrica está dada por (2.247) se satisface
Γλ µν = 0 ∀ λ, µ, ν, (2.250)
Como veremos, esta conjetura es correcta, pero debemos expresarla en términos de tensores,
que, a diferencia de la conexión de Levi-Civita Γ, son independientes de la base y del marco
de referencia.
Esta discusión se generaliza directamente a variedades pseudo-Riemannianas y Loren-
tzianas. Estas variedades se distinguen de las Riemannianas en que su métrica (y, por lo
tanto, su producto escalar) no es positiva definida. El espacio–tiempo de Minkowski es
la variedad pseudo-Riemanniana más simple, ya que es plana y tiene métrica constante
universal g = η, de signatura (3, 1) en todo punto P, como discutimos en la sección 2.1.4.
Esta observación permite ajustar la definición de planitud local. Una variedad Lorentziana
de signatura (3, 1) es localmente plana si en todos sus puntos P es posible elegir un sistema
de coordenadas en el que
gµν (P) = ηµν + O((xµ )2 ) ≈ ηµν . (2.252)
Todas las afirmaciones sobre la conexión y su compatibilidad con la métrica en una variedad
Riemanniana son igualmente válidas en variedades pseudo-Riemannianas.
perpendicular al ecuador
xµ (λ) : R → M, λ0 ≤ λ ≤ λ1 , (2.253)
dxµ
Tµ = . (2.254)
dλ
Figura 2.9: Una línea recta en espacio plano mediante transporte paralelo.
2.6 Espacio y espacio–tiempo con curvatura 123
d dxµ dxν dxα
+ Γµ αν = 0. ecuación de la geodésica (2.258)
dλ dλ dλ dλ
d2 xµ
=0 =⇒ xµ (λ) = aµ λ + bµ , aµ , bµ = cte, (2.259)
dλ2
que es precisamente la ecuación de una línea recta.
Como no supusimos nada sobre la geometría del espacio en la ecuación (2.255), si
Γµ αν establece la conexión de la variedad, la expresión (2.258) debe describir las curvas
más rectas posibles en espacio curvo. Como hemos dicho antes, precisamente estas curvas
son llamadas geodésicas. Las líneas rectas son las geodésicas del espacio plano. Es posible
mostrar que las curvas trazadas en la figura 2.8 no son geodésicas y, por lo tanto, a pesar
de que aparentan ser paralelas, no nos permiten emplear el postulado de paralelismo para
saber si la esfera es curva o no. Sin embargo las curvas trazadas en la figura 2.7b sí son
geodésicas.
Revisemos nuestro procedimiento de forma más general. Para obtener la ecuación de
dx
la geodésica (2.258), hemos descrito una curva en donde T = dλ se transporta tal que
T permanece paralelo a su instancia previa. Notemos que, por definición, T es un vector
tangente a la curva xµ (λ), como en la figura 2.10.
T (λ1 ) T (λ2 )
xµ (λ 1) xµ (λ 2)
xµ (λ)
Figura 2.10: Transporte paralelo de un vector T a lo largo de la curva xµ (λ).
124 Geometría en relatividad
La suma sobre el índice α impide simplificar más esta expresión. Esta forma de la ecuación
de la geodésica será frecuentemente más útil que (2.258).
El procedimiento que hemos empleado para describir las trayectorias geodésicas es lla-
mado transporte paralelo de un vector.Análogamente, podemos transportar paralelamente
a lo largo de una curva xµ (λ) cualquier otro tensor. Para transportar paralelamente un
vector arbitrario V , debemos exigirle que no sea alterado a lo largo de una trayectoria
parametrizada por un parámetro afín λ. Es decir, debe satisfacer (2.255),
dV
=0 (2.264)
dλ
la cual es equivalente a
dxµ ∂V
= T µ V ν ;µ eν = 0 ⇐⇒ T µ V ν ;µ = 0 , (2.265)
dλ ∂xµ
dV µ
+ Γµ αν V α T ν = 0, transporte paralelo de V (2.266)
dλ
A
A C Vf C
Vi Vf Vi
Figura 2.11: Transporte paralelo de un vector V en circuitos. Mientras que en (a) espacio plano el
vector, tras ser transportado paralelamente, no cambia, i.e. Vi = Vf , en (b) la esfera sí, i.e. Vi 6= Vf .
dt
= 0, (2.270)
dλ
que se satisface, en analogía con (2.256), cuando
T µ tµ1 µν21...
ν2 ...;µ = 0 (2.271)
y que es equivalente a
dtµ1 µν21...
ν2 ...
+ Γµ1 αν tαµ2ν...
1 ν2 ...
T ν + Γµ2 αν tµ1 α... ν α µ1 µ2 ... ν
ν1 ν2 ... T + . . . − Γ ν1 ν t αν2 ... T − . . . = 0. (2.272)
dλ
Vf = AVi , (2.273)
2.6 Espacio y espacio–tiempo con curvatura 127
A partir de ds2 = gµν dxµ dxν , encontramos que la métrica y su inversa adoptan la forma
1 0 µν 1 0
(gµν ) = , (g ) = , (2.276)
0 sen2 θ 0 sen12 θ
donde θ es el ángulo de latitud, como se muestra en la figura 2.12.
Consideremos el transporte paralelo en S2 de un vector V = V µ eµ a lo largo de una
línea de latitud constante θ0 . La trayectoria está descrita por
0<θ≤π
θ 0 < ϕ ≤ 2π
Es decir, la matriz que relaciona V (2π) con V (0) es una representación bidimensional del
grupo de rotaciones SO(2).
V β ,ν = −Γβ αν V α ∀β (2.297)
para las componentes del vector. Esta expresión es válida sólo si suponemos que la trayec-
toria a lo largo de la que se transporta el vector V depende únicamente de la dirección fija
xν , tal que dxµ /dλ = 0 para µ 6= ν.
Para calcular el cambio en V como un efecto del transporte paralelo a lo largo de la
curva AB en la dirección xν , podemos emplear
Z B Z B
∂V β ν
AB : V β (B) = Viβ + ν
dx = V i
β
− Γβ αν V α dxν , (con ν fija), (2.298)
A ∂x A
xµ = aµ
xµ = aµ + δaµ
B xν = aν + δaν
C
xν
A xν = aν
D
xµ
Figura 2.13: Circuito ABCD a lo largo del cual un vector V es transportado paralelamente.
que, usando Z Z
B D
ν ν
dx = δa y dxν = −δaν (2.306)
A C
y la suposición de que Γβ αν V α y sus derivadas apenas cambian con xν , obtenemos
Z B Z D
β α ν
− Γ αν V dx − Γβ αν V α dxν ≈ δaν (−Γβ αν V α + Γβ αν V α ) + δaµ δaν (Γβ αν V α ),µ .
A C
(2.307)
Repitiendo estos pasos para las integrales restantes en (2.303), conseguimos finalmente
δV β ≈ δaµ δaν (Γβ αν V α ),µ − δaµ δaν (Γβ αµ V α ),ν
= δaµ δaν [Γβ αν,µ V α − Γβ αν Γα γµ V γ − Γβ αµ,ν V α + Γβ αµ Γα γν V γ ] (2.308)
µ ν β β γ β β γ α
= δa δa [Γ αν,µ −Γ γν Γ αµ −Γ αµ,ν +Γ γµ Γ αν ]V ,
(sin sumar sobre µ, ν) donde hemos empleado (2.297) e intercambiamos los índices γ y α en
los dos términos con V γ en el paso intermedio. Es útil definir la cantidad en los corchetes
como el tensor de Riemann o el tensor de curvatura de Riemann
lo que implica que, en espacio o espacio–tiempo curvo, las derivadas covariantes no con-
mutan.
Una observación significativa sobre el tensor de Riemann es que la expansión de la
métrica hasta segundo orden en xµ , al centrar el sistema coordenado en cualquier punto
de una variedad Riemanniana, se puede expresar como
1
gµν ≈ δµν − Rµναβ xα xβ , (2.313)
3
donde
Rµναβ = gµλ Rλ ναβ .
La expansión (2.313) muestra que el tensor de Riemann es una forma de “medir” qué tan
grandes son las desviaciones de la métrica curva con respecto a la métrica plana. El mismo
resultado aplica para variedades Lorentzianas, en las que solamente es preciso reemplazar
δµν por ηµν .
Como estas relaciones son tensoriales, deben ser válidas para cualquier sistema de coorde-
nadas posible sobre los distintos puntos de la variedad; es decir, estas relaciones son válidas
sobre toda la variedad, no sólo localmente. Además, es posible verificar la propiedad cíclica
Las propiedades de simetría del tensor de Riemann indican que no todas sus compo-
nentes son independientes. De (2.317) y (2.318) concluimos que cada par de índices es
antisimétrico; en d dimensiones obtenemos 12 d(d − 1) componentes independientes para
cada par, y después, usando la propiedad simétrica (2.319), podemos determinar que el
número de componentes libres es
1 1 1 1
d(d − 1) d(d − 1) + 1 = d(d − 1)(d2 − d + 2) . (2.321)
2 2 2 8
Al sumar estas tres expresiones, encontramos que localmente (en espacio plano) debe sa-
tisfacerse
R αβµν,λ + R αβλµ,ν + R αβνλ,µ = 0. (2.327)
Esta expresión puede generalizarse para la variedad completa con la ecuación tensorial
La ecuación (2.329) define las componentes del tensor de Ricci, las cuales pueden expresarse
explícitamente, al reemplazar (2.309) en (2.329), como
Esta identidad establece una relación entre las derivadas de los tensores de Riemann y de
Ricci. Una relación mucho más importante se obtiene al contraer la identidad de Bianchi
una vez más
1
Gµν ≡ Rµν − g µν R tensor de Einstein (2.334)
2
donde empleamos la simetría de Rµν y gµν , que implica también que Gµν = Gνµ .
Este es un resultado muy interesante. Vemos que Dµ Gµν = 0 se parece a la ecuación
de conservación energía–momento para un sistema de muchas partículas, Dµ T µν = 0. De
hecho, este parecido es mucho más que eso, como Einstein descubrió. Como discutiremos
en el siguiente capítulo con todo detalle, esta comparación revela que el tensor (geométri-
co) de Einstein y el tensor de energía–momento están relacionados mediante las llamadas
ecuaciones de campo de Einstein
8πGN µν 8πGN
Gµν = T ≡ κT µν , κ≡ , ecs. de campo de Einstein (2.336)
c4 c4
en donde hemos retenido sólo los términos a orden ǫ en el segundo renglón, y en el último
renglón hemos empleado la simetría de gµν y renombrado el índice γ como µ.
Observando que
ξ α pα = cte . (2.350)
Por permutación de los índices, vemos que también las siguientes ecuaciones son válidas:
de donde conseguimos
para cada α, donde hemos empleado en la última igualdad la expresión de los vectores
base (2.38). La letra en paréntesis no denota dependencia alguna de los vectores de Killing;
se trata de una etiqueta para identificarlos.
Los 4 vectores de Killing dados por (2.358) corresponden, de acuerdo a (2.337), a sime-
trías bajo traslaciones espacio–temporales en las 4 coordenadas Cartesianas del espacio–
tiempo de Minkowski. Las cantidades conservadas asociadas a estos vectores de Killing a lo
largo de geodésicas, según (2.351), son p0 = E/c y las componentes del momento espacial
p. La expresión (2.358) aporta una información adicional: los generadores de las trasla-
ciones son los operadores diferenciales ∂α , como es bien sabido en mecánica. Una manera
alternativa de escribir estos 4 vectores de Killing, aunque mucho menos informativa es
ξ(0) = (1, 0, 0, 0)T , ξ(1) = (0, 1, 0, 0)T , ξ(2) = (0, 0, 1, 0)T , ξ(3) = (0, 0, 0, 1)T (2.359)
2.9 Vectores de Killing y simetrías del espacio–tiempo* 141
tales que para cada vector de Killing ξ(α, λ), con α y λ fijos, sólo bαλ = 2 = −bλα (el valor
ha sido elegido con el propósito de simplificar las expresiones) y todos los otros elementos
son nulos. En general, los vectores de Killing pueden escribirse como
ξ(α, λ) = g µα bαλ xλ eµ
1 µα
= g bαλ xλ + g µλ bλα xα eµ (2.360)
2
1
= bαλ g µα xλ − g µλ xα eµ ,
2
donde hemos empleado la antisimetría de bαλ .
Para identificar claramente los vectores de Killing, separamos ahora los valores no nulos
de b en aquéllos con índices puramente espaciales, {b12 , b13 , b23 }, y los que tienen índices
mezclados, {b01 , b02 , b03 }. Denotando los vectores de Killing puramente espaciales como
ξ(i, j), i, j = 1, 2, 3, reemplazando bij = 2 y reescribiendo las componentes espaciales de la
métrica como g µi = −δiµ , vemos que en este caso (2.360) implica
1
ξ(i, j) = bij g µi xj − g µj xi eµ
2
1
= − bij δiµ xj − δjµ xi eµ (2.361)
2
= −xj ei + xi ej
= xi ∂ j − xj ∂ i .
Notamos que la acción de ξ(i, j) sobre xi es ξ(i, j)xi = −xj , y sobre xj es ξ(i, j)xj = xi ,
lo que corresponde a una rotación por π/2 en el plano (i, j) a favor de las manecillas del
reloj. Por lo tanto, identificamos que los 3 vectores de Killing ξ(i, j) asociados a bij 6= 0
corresponden a los generadores de rotaciones espaciales en los 3 planos (i, j). De hecho,
el operador ξ(i, j) = xi ∂j − xj ∂i es conocido en mecánica como el operador de momento
angular. En una notación alternativa, los vectores de Killing pueden escribirse como
ξ(1, 2) = (0, −x2 , x1 , 0)T , ξ(1, 3) = (0, −x3 , 0, x1 )T , ξ(2, 3) = (0, 0, −x3 , x2 )T . (2.362)
En total analogía con estos resultados, encontramos que los generadores de las simetrías
espacio–temporales están dados por
ξ(0, i) = xi e0 + x0 ei = xi ∂0 + x0 ∂i . (2.363)
142 Geometría en relatividad
La diferencia en el signo surge de que, en este caso, deberemos considerar también que
g 0µ = +δ0µ . Las rotaciones espacio–temporales en el espacio–tiempo de Minkowski que lo
dejan invariante son precisamente los boosts de Lorentz, por lo que (2.363) representa a
los generadores de los boosts. Estos vectores de Killing también pueden reescribirse como
ξ(0, 1) = (x1 , x0 , 0, 0)T , ξ(0, 2) = (x2 , 0, x0 , 0)T , ξ(0, 3) = (x3 , 0, 0, x0 )T . (2.364)
El hecho de que necesitamos dos expresiones explica por qué estas cantidades tensoriales
no son realmente tensores, sino solamente pseudotensores.
Otra densidad útil es el elemento de volumen en d dimensiones, que se transforma como
′
∂x d
e
d x =
d ′ ed x, (2.376)
∂x
es decir, es una densidad tensorial de peso ω = 1. Por lo tanto, las integrales covariantes
deben contener p
dd x = |g|dd x , (2.377)
para que se transformen de manera tensorial. Nuevamente, en una variedad Lorentziana
de signatura (3, 1), como el espacio–tiempo de Minkowski, el determinante |g| debe ser
reemplazado por −|g| para que sea positivo definido.
Los pseudotensores son importantes para construir la teoría covariante. Por ejemplo,
en espacio curvo (o, en coordenadas curvilíneas generalizadas), es ε y no εe lo que aparece
en la definición del tensor dual de Hodge del tensor Faraday,
1 1 1
∗ F µν = εµνρσ Fρσ = p εeµνρσ Fρσ , (2.378)
2 2 |g|
que solamente en un espacio plano coincide con la expresión que se usó anteriormente
en (2.148), justificando la notación ahí empleada.
Ejercicios
2.1 Transformación de Lorentz inversa.
(a) Muestre que si Λ−1 es la inversa de un boost de Lorentz a lo largo de la dirección x1 , entonces
satisface (1.118).
(b) Se dice que, así como la métrica de Minkowski η = (ηµν ) se emplea para bajar índices como
en (2.5), la inversa de la métrica η −1 = (η µν ) se emplea para subir índices. Reescriba (1.118)
en términos de componentes (con índices) empleando (2.5).
2.2 Transformaciones de tensores.
(a) A partir de la transformación de las componentes de un vector y la invariancia de tensores,
obtenga la regla de transformación de las componentes de una 1–forma,Ve = Vµ ωeµ.
(b) De la regla de transformación de las componentes de vectores y 1–formas obtenga la regla de
transformación de las componentes de un tensor t definido como en (2.81).
2.10 Densidades tensoriales* 145
Aµν B να = Aµν B νγ , ηµν Aµα V ν = ηρν Aρα V ν , ηαβ ηγδ Aαµν B γ µ C λδ = η λγ Aβµ ν B δµ Cγδ .
2.5 Parte simétrica y antisimétrica de un tensor.
En general, intercambiar los índices genera un tensor distinto al original. Sin embargo, es posible
definir simetría y antisimetría en un tensor, como se vio en la sección 2.1.7. Emplee las definiciones
para la parte simétrica (2.96) y antisimétrica (2.103) de un tensor para resolver los siguientes
ejercicios.
(a) Aplique las definiciones mencionadas para dar expresiones de T(αβ) , T[αβ] , T(αβγ) y T[αβγ] .
(b) Muestre que un tensor de rango (0, 2) que es antisimétrico en un sistema de referencia es
antisimétrico en todos.
(c) Sean Aµν las componentes de un tensor antisimétrico y sean S µν las componentes de un
tensor simétrico. Muestre que
Aµν S µν = 0.
(d) Muestre que si Vµν son las componentes de un tensor arbitrario, entonces
1 µν
V µν Aµν = (V − V νµ )Aµν ,
2
1
V µν Sµν = (V µν + V νµ )Sµν .
2
donde A y S son los tensores definidos en el inciso anterior.
2.6 Tensor de rango 2.
Suponga que Aµν son las componentes de un tensor simétrico de rango (0, 2).
(a) Muestre que la elección del tensor de Faraday (2.124) conduce a la fuerza de Lorentz habi-
tual (2.119) al sustituirlo en la relación tensorial (2.120).
(b) Muestre que la ecuación (2.139) corresponde a las componentes de un tensor de rango dos.
Sugerencia: las componentes de un tensor se transforman de una forma precisa bajo la acción
del grupo de Lorentz.
(c) Muestre que se cumple la ecuación (2.140).
(d) Encuentre todas las simetrías bajo intercambio de índices de la identidad de Bianchi (2.140).
Sugerencia: hay simetrías bajo intercambio de dos o tres índices.
(e) Muestre que la relación (2.144) conduce a dos de las ecuaciones de Maxwell (2.118).
2.8 Símbolo de Levi-Civita y delta de Kronecker.
Se definen las componentes del símbolo de Levi-Civita de rango 4 (es espacio–tiempo plano) como
+1 permutaciones de (µ1 µ2 µ3 µ4 ) pares,
µ1 µ2 µ3 µ 4
ε = −1 permutaciones de (µ1 µ2 µ3 µ4 ) impares,
0 índices repetidos.
(a) Muestre que las componentes del tensor dual de Faraday en 4 dimensiones, ∗F µν , coinciden
con las de F µν tras realizar las sustituciones E → −B y B → E.
(b) Demuestre que las identidades de Bianchi son equivalentes a la ecuación ∂µ ∗ F µν = ∗F µν,µ =
0. (Sugerencia: contraiga las identidades de Bianchi con un símbolo de Levi-Civita.)
(c) Muestre que ∗(∗F ) = −F .
2.10 Electromagnetismo y relatividad especial.
(a) Suponga que un observador viaja a la velocidad relativista u = (u, 0, 0)T . ¿Cuál sería la
forma de los campos E ′ y B ′ medidos por este observador?
(b) Calcule de manera explícita en términos de E y B las cantidades Fαβ F αβ y ∗Fαβ F αβ . ¿Cómo
se transforman estas cantidades bajo el grupo de Lorentz?
(c) Utilice el resultado anterior para indicar si, dado un marco de referencia donde E 6= 0 y
B = 0, es posible encontrar otro marco de referencia (o una transformación de Lorentz)
donde E = 0 y B 6= 0.
2.11 Ecuaciones de Maxwell y transformaciones generales de coordenadas.
Como hemos visto, dos ecuaciones de Maxwell son obtenidas de (2.144). Bajo difeomorfismos, los
elementos que aparecen en esa ecuación se transforman como
′ ′ ′
′ ′ ′ ∂xµ µ ′ ′ ∂xµ ∂xν µν
xµ → xµ = f µ (x), Jµ → Jµ = J , F µν → F µ ν = F ,
∂xµ ∂xµ ∂xν
para un conjunto de funciones f = (f µ ) con Jacobiano diferente de cero.
(f) ¿Qué tendrá que satisfacer el operador ∂µ para que (2.144) mantenga su forma ante alguna
transformación general de coordenadas?
¿bajo qué condiciones, en caso de ser posible, esperaría que el fluido electromagnético pudiera
considerarse un fluido perfecto? (Sugerencia: use la forma explícita de F µν , F µ α y Fµν .)
2.14 Tensor de energía–momento para un campo de Klein-Gordon.
El tensor de energía–momento para un campo escalar con masa m en espacio–tiempo plano está
dado por
1
Tµν = ∂µ φ∂ν φ − ηµν (∂α φ∂ α φ − m2 φ2 ).
2
(a) Encuentre la densidad de energía ρ y la presión P .
(b) Muestre que ∂µ T µν = 0 implica la ecuación de Klein-Gordon,
(∂ µ ∂µ + m2 )φ = 0.
(c) Suponga ahora que φ no depende de la posición, es decir, sólo depende de x0 . Sin emplear los
resultados anteriores, compare con el tensor de energía–momento para un fluido perfecto de
acuerdo al ejercicio 2.12 con ε = 0 y encuentre U µ , P y ρ. ¿Son compatibles estos resultados
con lo que encontró en (a)?
2.10 Densidades tensoriales* 149
(a) Obtenga la transformación inversa y, a partir de esta, obtenga la métrica para el sistema p,
q.
(b) Sea V un vector en el sistema parabólico con componentes Ap = 1 y Aq = 0, encuentre las
componentes de A en el sistema Cartesiano.
(c) De igual forma, es posible definir coordenadas sinusoidales en el espacio plano 2–dimensional
u y w por medio de las relaciones u = x y w = y − a sen(bx), con a y b constantes. ¿Cuál es
la métrica en el sistema sinusoidal?
(d) Suponga que un observador se mueve con velocidad constante v, cuyas componentes son
v x = v y v y = 0. ¿Cuál es la velocidad del observador en el sistema (u, w)?
(e) Muestre que la componente de la velocidad v w no es independiente del tiempo a pesar de que
la magnitud de v es constante. Explique por qué v w no es constante a pesar de que el vector
v siempre apunta en la misma dirección y su magnitud es constante.
(f) Concluya que dv w /dt no puede ser la componente aw del vector de aceleración del observador.
¿Esto se relaciona con la derivada que hemos considerado?
2.16 Derivada covariante.
En coordenadas curvilíneas, la derivada usual debe ser sustituida por la derivada covariante, que
captura la naturaleza tensorial del gradiente e
d. El gradiente de un vector arbitrario V en una base
coordenada curvilínea está dado por
(a) Demuestre que la derivada covariante de las componentes de una 1–forma está dada por
Dµ qα = qα,µ − Γν αµ qν . (Sugerencia: Considere la expresión Dµ (qα V α ). Por un lado utilice la
regla de Leibniz para la derivada covariante y por otro lado recuerde que la derivada covariante
de una función escalar es Dµ φ = ∂µ φ). ¿Cómo calcularía las componentes de la derivada
covariante de un tensor de rango (1, 1), es decir, Dµ T α β ?
150 Geometría en relatividad
Así, hemos obtenido una expresión útil para los símbolos de Christoffel
Γα µβ = ω
e α (∂µ eβ ).
(c) Con base en los resultados del inciso anterior, ¿los símbolos de Christoffel son tensores? ¿Por
qué?
2.17 Símbolos de Christoffel.
(a) Muestre que si los símbolos de Christoffel no son simétricos, es decir, Γλ µν 6= Γλ νµ , entonces
Γλ µν − Γλ νµ son las componentes de un tensor de rango (1, 2). Este tensor es llamado tensor
de torsión asociado.
(b) Muestre las siguientes identidades:
a) g αβ ,γ = −Γα µγ g µβ − Γβ µγ g µα .
b) V ν µ;ν = −|g|−1/2 (|g|1/2 V ν µ ),ν − Γλ µσ V σ λ .
c) gµν,α = Γ µνα + Γ νµα .
donde |g| = det g y los símbolos de Christoffel están dados por (2.221).
2.18 Tensor de Riemann.
Una forma de describir la curvatura de una variedad Riemanniana en dimensión n es mediante un
tensor de rango (1, 3) conocido como tensor de curvatura de Riemann. Este tensor se puede entender
como la medida de qué tanto difiere la métrica del espacio de una métrica plana. Se definen las
componentes del tensor de Riemann como en (2.309), en términos de los símbolos de Christoffel.
R αβµν = −R αβνµ ,
R αβµν = −R βαµν ,
R αβµν = +R µναβ ,
R αβµν + R ανβµ + R αµνβ = 0,
Rα αµν = 0.
(Dµ Dν − Dν Dµ )v α = Rα βµν v β .
2.10 Densidades tensoriales* 151
(d) Empleando la definición de la derivada covariante (2.213), muestre que para un tensor arbi-
trario con componentes tµ1 µν21···
ν2 ··· se satisface (2.312).
d2 xµ µ dxγ dxν
+ Γ γν = 0, (2.379)
dλ2 dλ dλ
en donde λ es el parámetro de la trayectoria y es un parámetro afín, es decir, se relaciona con el
tiempo propio τ mediante λ = aτ + b, con a y b constantes. Cualquier parámetro afín (incluyendo
al tiempo propio) puede parametrizar una geodésica.
(b) Muestre que cuando se inserta el Lagrangiano de una partícula libre en la ecuación (2.381)
se obtiene la ecuación geodésica (2.379) en la forma U ν Dν U µ = 0.
Sugerencia: recuerde que en el formalismo Lagrangiano xµ y U µ son variables independien-
tes, y que las derivadas de gµν son no triviales en general. Emplee también gµν,ρ U ν U ρ =
1 ν ρ ρ ν
2 (gµν,ρ U U + gµρ,ν U U ).
Este resultado es de suma relevancia. Dado que las ecuaciones de Euler–Lagrange de una
partícula libre conducen a la ecuación de las geodésicas, obtenemos que las partículas libres
en un espacio–tiempo arbitrario siguen las trayectorias descritas por estas curvas.
2.20 Preguntas conceptuales.
(a) Sobre la superficie de la 2–esfera de radio 1 descrita por el elemento de línea ds2 = dθ2 +
sen2 θdφ2 , un vector V es igual a eθ en θ = π/4, φ = φ0 . ¿Cómo se ve V después del transporte
paralelo alrededor del círculo φ = φ0 ? ¿Cuál es la magnitud de V ?
(b) Sabemos que si el tensor de Riemann es cero, entonces el espacio es plano, y viceversa.
Suponga ahora que sólo se sabe que la contracción conocida como tensor de Ricci Rµ αµβ =
g µν R ναµβ es cero. ¿Es plano el espacio en cuestión?
(c) ¿Qué es una geodésica?
152 Geometría en relatividad
(d) Si dos observadores A y B siguen la misma trayectoria geodésica (sin importar el espacio
en cuestión) y se ubican en puntos diferentes, ¿existe algún método para que A conozca las
mediciones desde el punto de vista de B?
2.21 Transporte paralelo y la 2–esfera.
Considere nuevamente la 2–esfera con elemento de línea ds2 = dθ2 + sen2 θdφ2 (0 ≤ θ ≤ π, 0 ≤ φ ≤
2π), donde θ = 0 es el polo norte y θ = π el sur.
V θ ,θ = 0 y V φ ,θ + cot θV φ = 0.
mg mi
g g
planeta
Figura 3.1: Principio de equivalencia. El movimiento de partículas en una caja debido a un campo
gravitacional y al movimiento acelerado de la caja son indistinguibles para un observador dentro
de una caja pequeña.
mi = mg . (3.3)
a = ẍ = −∇φ(x) (3.4)
m1 m2 m1 m2
g g
planeta
Vemos, sin embargo, que si la caja es suficientemente grande, las partículas que caen
debido al efecto de un campo gravitacional pueden distinguirse de otras que están sujetas
a una aceleración constante, como se observa esquemáticamente en la figura 3.2.
Se deduce entonces que una forma alternativa de expresar el principio de equivalencia
(débil) es que el movimiento de partículas libres en un campo gravitacional es equivalente
a que las mismas partículas estén en un marco de referencia uniformemente acelerado,
siempre y cuando sólo pequeñas regiones del espacio–tiempo sean consideradas.
Una interesante consecuencia de esta interpretación se expresa en otro Gedankenexpe-
riment de Einstein. Imaginemos de nuevo nuestro experimento encerrado en una caja, pero
esta vez la caja cae por acción del campo gravitacional mientras que una partícula en la
caja también cae libremente. Como la caja y la partícula caen con la misma aceleración
uniforme, un observador no nota ningún movimiento de la partícula dentro de la caja, como
se observa esquemáticamente en la figura 3.3. Este mismo experimento puede realizarse con
dos o más partículas, y el observador podría describir la caja como un marco de referencia
no acelerado, siempre y cuando la caja sea suficientemente pequeña (y la caja no haga con-
tacto con el piso). Impresionantemente, antes de su inevitable muerte, el observador en la
caja podría afirmar que en ese marco de referencia las leyes de la física pueden describirse
con la relatividad especial.
Entonces, hemos encontrado que en regiones pequeñas alrededor de cada punto del
espacio–tiempo dotado con un campo gravitacional, hay un marco de referencia especial
(localmente inercial) en el cual las leyes de la naturaleza toman la forma de aquéllas en un
marco de referencia inercial.
Curiosamente, la definición de una variedad es muy similar a la afirmación anterior:
en una región pequeña alrededor de cada punto de una variedad Riemanniana existe un
espacio en el cual la métrica es plana. Esto conduce a una sorprendente interpretación
156 Relatividad general y sus aplicaciones básicas
m m
g
planeta
Figura 3.3: Cuando la caja también está acelerada por el campo gravitacional, un observador no
puede notar ningún movimiento de la partícula.
En nuestro estudio del efecto Doppler relativista en la sección 1.10.1, encontramos que
para velocidades Newtonianas (no relativistas), la frecuencia ν ′ de la luz emitida por una
fuente que se aproxima a un observador no coincide con la frecuencia observada ν de
acuerdo a
ν′ ∆v ∆v
≈1− , ≪ 1, (3.5)
ν c c
donde ∆v corresponde a la diferencia entre la velocidad v ′ de la fuente cuando un fotón con
energía hν ′ se emite al tiempo tE y la velocidad v del receptor cuando el fotón es detectado
al tiempo tD con energía hν. En marcos de referencia inerciales v y v ′ son constantes, y
entonces v y v ′ pueden medirse simultáneamente, es decir
∆v ≡ v ′ (tE ) − v(tD ) = v ′ (tE ) − v(tE ) . (3.6)
y
g g
t0 :
hν
t0 + ∆t :
y
Figura 3.4: Emisión y recepción de luz de partículas en movimiento con una aceleración g y separadas
una distancia y.
ν′ GN M y
≈1− 2 2 . corrimiento al rojo gravitacional (3.9)
ν c R
Por construcción, la expresión anterior sólo es válida para R2 /y ≫ GN M/c2 y debe ser
reemplazada en casos más generales, como será discutido en la sección 3.3.2. Es preciso
destacar que el corrimiento al rojo gravitacional no corresponde a un simple cambio de
perspectiva. A diferencia del corrimiento al rojo longitudinal de la relatividad especial (en
el que la luz emitida por una fuente que se aleja del observador es apreciada con menor
158 Relatividad general y sus aplicaciones básicas
d2 xµ µ dxα dxβ
+ Γ αβ = 0. (3.12)
dτ 2 dτ dτ
3.2 Campos gravitacionales débiles: límite Newtoniano 159
donde hemos definido las componentes de la velocidad local, ui = ∂xi /∂t. Como, por
suposición, |ui | ≪ c, entonces (3.13) se reduce en este límite a
2
µ dxα dxβ dx0
Γ αβ ≈ Γµ 00 . (3.14)
dτ dτ dτ
La primera pregunta es cómo escribir la ecuación (3.26) en forma tensorial. Vemos que,
en términos de h00 = 2φ/c2 y T00 = ρm c2 = ρ, (3.26) se convierte en
2 2 8πGN 8πGN
∇2 h00 = ∇ φ= ρm = T00 , (3.29)
c2 c2 c4
donde T00 se ha tomado en el marco del centro de masa, como en (2.156). En cualquier otro
marco, debemos considerar todas las componentes de Tµν y gµν . Por lo tanto, la ecuación
tensorial que estamos buscando depende de gµν del lado izquierdo y Tµν del lado derecho.
Considerando el posible origen del Laplaciano espacial asociado al Laplaciano en tér-
minos de la derivada covariante, hacemos una primera conjetura:
8πGN
Dµ Dµ gαβ = Tαβ . (3.30)
c4
Desafortunadamente, notamos de inmediato que esto no puede ser correcto porque, en
general, gαβ;µ = 0 y Tαβ 6= 0. No obstante, es claro que requerimos segundas derivadas
de la métrica para llegar a la ecuación de Poisson. Entonces, proponemos una segunda
conjetura en la que, en lugar del Laplaciano covariante, empleamos directamente el tensor
Rαβ como el origen de ∇2 h00 . Dado que
1 1
R00 ≈ Γi 00,i ≈ − η iλ h00,λi = ∇2 h00 , (3.31)
2 2
entonces podemos conjeturar que
4πGN
Rµν = Tµν . (3.32)
c4
Pero sabemos que, en general, Dµ Rµν 6= 0 mientras Dµ Tµν = 0.
Una conjetura más interesante es considerar del lado izquierdo el operador tensorial
más general de rango 2 que dependa de las segundas derivadas de la métrica gµλ,νβ y de
gµν . Proponemos
Oµν = Rµν + Ag µν R − Λg µν , A, Λ = cte, (3.33)
tal que
Oµν = κT µν , κ = cte, (3.34)
y Dµ T µν = 0. Juntas, estas condiciones implican Dµ Oµν = 0, lo que conduce a
que, comparando con (2.335), sólo se satisface en general si A = − 21 con base en argu-
mentos meramente geométricos. Consecuentemente, salvo por el término (covariantemen-
te) constante −Λg µν , O coincide con el tensor de Einstein G, cuyas componentes Gµν =
Rµν − 12 g µν R satisfacen Dµ Gµν = 0. Entonces, encontramos que, escogiendo κ = 8πG c4
N
para obtener (3.29) en el límite Newtoniano, la relación tensorial más general que conduce
a la ecuación gravitacional de Poisson es
conocida como las ecuaciones de campo de Einstein. Por razones que serán exploradas más
tarde, la constante Λ es conocida como constante cosmológica y típicamente se asocia a la
energía intrínseca del vacío cuántico. Como mostramos detalladamente en el apéndice C, las
ecuaciones de campo de Einstein pueden ser obtenidas directamente mediante el principio
variacional a partir de la llamada acción de Einstein-Hilbert. Sin embargo, no existe manera
de obtener, de primeros principios, esa acción. Es decir, así como la segunda ley de Newton
y la ecuación de Schrödinger de la mecánica cuántica, las ecuaciones de campo de Einstein
son leyes empíricas basadas en nuestras observaciones.
Dado que la ecuación de Poisson se puede obtener a partir de (3.36) con constante
cosmológica nula, en el límite Newtoniano, las ecuaciones de Einstein establecen la conexión
entre materia/energía y geometría que sugiere el principio de equivalencia. El lado izquierdo
de (3.36) sólo contiene elementos geométricos, mientras que el lado derecho contiene la
descripción del contenido que habita en el espacio–tiempo expresado por la geometría. Por
lo tanto, la dinámica del contenido del universo, de acuerdo a las ecuaciones de campo de
Einstein, está regida por la estructura geométrica del espacio–tiempo y, al mismo tiempo,
el contenido del universo es fuente de las deformaciones (topología, curvatura, conexión,
etc.) del espacio–tiempo.
En especial, la dinámica de partículas libres (y radiación), de acuerdo a las ecuaciones
de Einstein, está completamente determinada por la métrica y, según nuestra discusión
de la sección 2.6.3, corresponde al movimiento a lo largo de las geodésicas de la geome-
tría. Por otra parte, hemos identificado que, al menos en el límite Newtoniano, la métrica
corresponde al campo gravitacional; por lo tanto, una partícula libre sometida a un cam-
po gravitacional sigue la trayectoria regida por la métrica del espacio–tiempo, es decir,
una geodésica. Notamos que, en efecto, la gravedad desaparece para un observador que
se desplaza junto a la partícula en caída libre porque, localmente, la métrica es plana
en los espacios–tiempo Lorentzianos de la relatividad general y, por lo tanto, el campo
gravitacional es el mismo reinante en la relatividad especial.
Einstein propuso esta generalización de su teoría de la relatividad como una descripción
de las interacciones gravitacionales. Entonces no sólo caracteriza el movimiento de los
objetos en caída libre que están sometidos a una forma local de la relatividad compatible
con la teoría especial de Einstein, sino que debería ser capaz de proveer reglas para el
3.3 Solución de Schwarzschild: estrellas y agujeros negros 163
movimiento de cuerpos masivos, rotantes, con carga eléctrica, acelerados por algún efecto
adicional de cualquier origen.
Las ecuaciones de campo de Einstein corresponden a una ley física sólo si es posible
comprobar que todas sus consecuencias pueden ser verificadas experimentalmente, y ob-
tener esas consecuencias requiere resolver las ecuaciones de Einstein. Y resolverlas no es
asunto menor. Debido a las simetrías de Rµν y Tµν , (3.36) contiene 10 ecuaciones diferen-
ciales parciales acopladas y cuadráticas en gµν y sus derivadas. Resolver esas ecuaciones
significa frecuentemente encontrar el tensor métrico que mejor se adapta a la dinámica
de un sistema físico que experimenta interacciones gravitacionales. Pero también significa
encontrar la dinámica del contenido de un espacio–tiempo dada una métrica de interés.
El resto del capítulo está dedicado a identificar las consecuencias de la relatividad general
dadas dos importantes métricas para nuestra existencia, la correspondiente a estrellas y la
que describiría el universo como un todo.
Antes de comenzar a trabajar con la solución más sencilla de las ecuaciones de Eins-
tein (3.36), es preciso introducir una simplificación a la notación. A partir de esta sección,
emplearemos las llamadas unidades naturales, definidas por
GN = c = ~ = 1, (3.37)
tación Newtoniana. Sin embargo, las observaciones indican que en los núcleos galácticos y
otras estructuras cósmicas reinan campos gravitacionales intensos, incluso probablemente
responsables de las enormes energías que los rayos cósmicos alcanzan. Comprender la física
gravitacional en general requiere obtener soluciones exactas de las ecuaciones de Einstein.
La solución de Schwarzschild se considera la solución más sencilla y útil de las ecuaciones
de campo de Einstein. Esta solución corresponde a la descripción de un sistema con las
siguientes propiedades:
La segunda propiedad implica que la métrica debe satisfacer gµν,0 = 0, como supusimos
en el límite de campo débil, mientras que la tercera suposición exige que el tensor de
energía-momento y la constante cosmológica se anulen, Tµν = 0 = Λ.
Obtener una solución a las ecuaciones de Einstein consiste, en este caso, en obtener la
expresión más general de la métrica o, análogamente, del elemento de línea (o intervalo) que
se ajusta a las cualidades buscadas. Para obtener la métrica de Schwarzschild, recordemos
primero que en coordenadas esféricas tridimensionales el elemento de línea del espacio plano
está dado por
s2 = dr2 + r2 (dθ2 + sen2 θdϕ2 ) ≡ dr2 + r2 dΩ2 ,
de (3.39)
donde dΩ2 es el diferencial de ángulo sólido. El término r2 dΩ2 corresponde al elemento
de línea bidimensional para una 2-esfera de radio r fijo, y su estructura hace evidente la
simetría esférica. A partir de la expresión (3.39), proponemos el siguiente intervalo en un
espacio–tiempo con simetría esférica:
ds2 = dt2 − de
s2 = dt2 − dr2 − r2 dΩ2 . (3.40)
En general, una métrica con simetría esférica podría tener términos no diagonales y
coeficientes no triviales, conduciendo a una expresión como
ds2 = g00 dt2 + 2g0r dtdr + grr dr2 − r2 dΩ2 + 2g0θ dtdθ + 2g0ϕ dtdϕ. (3.41)
Para encontrar las expresiones precisas de las componentes g00 y grr de la métrica que
conducen a una solución de las ecuaciones de Einstein, es preciso introducir la métrica
obtenida hasta aquí,
(gµν ) = diag(g00 , grr , −r2 , −r2 sen2 θ) , (3.43)
en las ecuaciones de Einstein, y resolver las ecuaciones diferenciales resultantes. Para un
sistema arbitrario, esto no es posible de manera exacta; afortunadamente, sí lo es para
nuestro sistema.
Propongamos un ansatz para las componentes desconocidas de la métrica:
con2 T (r), R(r) > 0 ∀ r y las condiciones de frontera lı́mr→∞ T (r) = lı́mr→∞ R(r) = 0, tal
que el intervalo adopta la forma
2 2
ds2 = eT (r) dt − eR(r) dr − r2 dΩ2 . (3.45)
1
m(r) ≡ r(1 − e−2R ), función de masa (3.46)
2
donde T ′ = dT /dr.
2
Como veremos, estas condiciones se violan en el interior de un agujero negro, donde ambas funciones
cambian de signo.
166 Relatividad general y sus aplicaciones básicas
Sustituyendo las componentes (0, 0) del tensor de Einstein (3.47) y del tensor de energía–
momento (3.54) en la ecuación de campo de Einstein,
dm
= 4πρm r2 . (3.60)
dr
3.3 Solución de Schwarzschild: estrellas y agujeros negros 167
4πP r3 + m(r)
T′ = . (3.65)
r(r − 2m)
En lugar de entrar en los detalles para resolver las ecuaciones diferenciales obtenidas,
recordemos que queremos resolver un sistema con Tµν = 0. Esto, por supuesto, solamente
es válido en el exterior de la estrella, en donde
dm
ρm = P = 0 =⇒ =0 =⇒ m(r) = M = cte. (3.67)
dr
En esta región, (3.65) adopta la forma
dT M 1 1
T′ = = =− + , (3.68)
dr r(r − 2M ) 2r 2(r − 2M )
168 Relatividad general y sus aplicaciones básicas
2M
g00 = e2T = 1 − = e−2R , (3.70)
r
donde la última igualdad es consecuencia de (3.62) con (3.67). Empleando el resulta-
do (3.70) en el intervalo propuesto (3.42), encontramos la solución buscada para una estrella
de Schwarzschild
−1
2 2M 2 2M
ds = 1 − dt − 1 − dr2 − r2 dΩ2 . intervalo de Schwarzschild (3.71)
r r
s
∆τ1 ν2 1 − rs /r1
= = . corrimiento al rojo gravitacional (3.78)
∆τ2 ν1 1 − rs /r2
170 Relatividad general y sus aplicaciones básicas
Suponiendo que r2 > r1 e incluyendo unidades para comparar con resultados previos,
encontramos que (3.79) puede reescribirse como
ν2 GN M 1 1 G N M r 2 − r1 y
≈1− − =1− ≈ 1 − g 2 < 1, (3.80)
ν1 c2 r1 r2 r1 r2 c2 c
GN M
donde identificamos y ≡ r2 − r1 > 0 y la aceleración gravitacional con g ≈ r 1 r2 , lo cual es
consistente con el resultado previo (3.8) y (3.9).
Como antes, debemos enfatizar que el corrimiento al rojo descrito por (3.78) corresponde
a un efecto enteramente físico. Un observador ubicado en r2 > r1 observa que la luz
detectada en esa posición es más roja (tiene menos energía) que cuando es detectada por
otro observador ubicado en r1 , i.e. ν2 < ν1 . La luz pierde energía a medida que se aleja de
la fuente del campo gravitacional.
Como hemos visto en la sección 2.9.1, las simetrías de la geometría del espacio–tiempo
conducen a la conservación de cantidades físicas. Es posible obtener ese mismo resultado
directamente de la ecuación de la geodésica que describe el movimiento de una partícula
libre en espacio–tiempo con curvatura (ver ejercicio 2.19).
Sabemos que el movimiento de las partículas libres es regido por la ecuación de la
geodésica (2.263),
U α U µ ;α = 0 . (3.81)
Esta ecuación no está bien definida para partículas no masivas porque no es posible definir
su tiempo propio τ y, consecuentemente, su 4–velocidad U . Considerando que la relación
de dispersión relativista (1.78) es válida para todo sistema relativista, es correcto genera-
lizar (3.81) en términos del 4–momento como
pα pµ ;α = 0 . (3.82)
de donde
pα pµ,α = Γβ µα pα pβ . (3.84)
3.3 Solución de Schwarzschild: estrellas y agujeros negros 171
La ecuación (3.86) nos indica qué cantidades se conservan y bajo qué condiciones. En
caso de que la métrica no dependa de xµ , i.e. si gαγ,µ = 0, encontramos que pα pµ,α = 0, lo
cual para una partícula masiva se puede escribir como
dxα ∂
pα pµ,α = m pµ = 0 . (3.87)
dτ ∂xα
Una forma más sugerente y útil de esta última expresión es
d
m pµ = 0 =⇒ pµ = gµν pν = cte , (3.88)
dτ
es decir, una partícula libre conserva la componente pµ de su 4–momento en un espacio–
tiempo con coordenada cíclica xµ . Esta información puede ser empleada, entre otras cosas,
para determinar las trayectorias de las partículas libres (con o sin masa) en cualquier
espacio–tiempo, como haremos en la siguiente sección.
Un resultado menor adicional es que, dado que gαγ,µ = 0 siempre es válido localmente,
en el marco de referencia de una partícula libre un observador siempre mide que se conservan
la energía y el momento. Este resultado no es soprendente, ya que, como discutimos en
la sección 3.1.1, para partículas libres en caída libre, el principio de equivalencia establece
que un observador que se mueve con ellas las observa en estado inercial y, por lo tanto, se
satisfacen los principios de conservación que son válidos en la relatividad especial.
V (r) ℓ4 V (r)
T ℓ3
E3 ℓ 1 < ℓ2 < ℓ3 < ℓ4
ℓ3 ℓ 1 < ℓ2 < ℓ3
E2 T T
ℓ2
E1 C
T
ℓ2 ℓ21 < 12M 2
E0 ℓ1
ℓ22 = 12M 2
ℓ1
ℓ23,4 > 12M 2
2M rc+ > 6M r 2M 3M r
(a) Partículas masivas, e = 1 (b) Partículas sin masa, e = 0
Figura 3.5: Potencial efectivo para partículas con masa (a) y sin masa (b) para diferentes valores
de ℓ. Una partícula masiva libre con energía E “rebota” en los puntos de retorno T o permanece en
los puntos fijos C, en órbitas circulares estables de radio rc+ . Las partículas sin masa no orbitan.
Si una partícula empieza en r < 2M y con relativamente poca energía, vemos que
golpea una barrera que impide que se escape. Esta barrera se sitúa alrededor del radio de
Schwarzschild y aparece también para partículas sin masa, como los fotones. Como veremos
en la sección 3.3.5, esto es en parte el corazón de la física de los agujeros negros. Sin embargo,
debemos notar que este comportamiento clásico no puede ser la historia completa, pues
sospechamos que a distancias pequeñas los efectos cuánticos deben ser importantes.
Retomando las órbitas circulares del comportamiento 4, encontramos que estas ocurren
cuando
dV d2 r
− =0= , (3.98)
dr r=rc dτ 2 r=rc
donde rc es el radio orbital. Calculando V ′ y multiplicando por r4 , encontramos que esta
condición es equivalente a la ecuación cuadrática
M erc2 − ℓ2 rc + 3M ℓ2 = 0 , (3.99)
cuyas soluciones para e = 1 son
p
ℓ2 ± ℓ2 1 − 12M 2 /ℓ2
rc±
= . (3.100)
2M
Calculando ahora V ′′ (r) y evaluando en r = rc , notamos que no existen órbitas circulares si
ℓ2 < 12M 2 ; para ℓ2 = 12M 2 , ambas soluciones coinciden en rc = 6M y corresponden a una
órbita inestable por tratarse de un punto de inflexión de V ; finalmente, para ℓ2 > 12M 2 ,
rc+ > 6M (rc− < 6M ) corresponde a una órbita circular estable (inestable) por ser un
mínimo (máximo) de V . Además, en el límite con ℓ2 ≫ 12M 2 la solución inestable se
convierte en
− ℓ2 1 12M 2
rc ≈ 1− 1− + . . . = 3M , (3.101)
2M 2 ℓ2
y rc+ → ∞. Este límite coincide con la solución de (3.99) para e = 0 ilustrada con los
máximos de la figura 3.5b, lo que significa que la trayectoria de las partículas con masa y
sin masa coinciden en este límite. Es decir, las órbitas circulares de fotones y partículas
masivas son las mismas, pero son inestables.
Finalmente, para partículas sin masa (e = 0), como se ilustra en la figura 3.5b, la
barrera de potencial no solamente evita que la luz penetre estrellas más allá de cierta
r > 3M , sino que también evita que ésta escape por encima de r = 2M . Es debido a estas
propiedades que hemos definido antes el llamado radio de Schwarzschild, rs = 2M .
3.3 Solución de Schwarzschild: estrellas y agujeros negros 175
Hemos visto que r = rs es un punto especial más allá del cual una partícula entrante
no tiene oportunidad de escapar. Esta observación está relacionada con la estructura de la
métrica de Schwarzschild codificada en (3.71). El intervalo y, por lo tanto, la métrica de
Schwarzschild presentan dos singularidades radiales:4
Aunque ambos puntos son considerados importantes físicamente, sólo uno de ellos corres-
ponde a una singularidad física del espacio–tiempo de Schwarzschild.
En general, en variedades Riemannianas descritas por métricas en cierto sistema coor-
denado, la métrica exhibe dos tipos de singularidades:
12rs2
Rµναβ Rµναβ = , (3.102)
r6
lo cual diverge solamente para r = 0. De hecho, se puede mostrar que no diverge ningún
escalar de curvatura en r = rs , lo que significa que el espacio–tiempo de Schwarzschild no
exhibe divergencias en este punto. Sin embargo, como veremos en breve, r = rs tiene alguna
importancia física en los pocos objetos que aún pueden describirse por este espacio–tiempo
en esa posición, es decir, aquéllos para los que T µν = 0 en r = rs . Notemos que la mayoría
de los objetos astrofísicos no satisfacen esta condición. Por ejemplo, para el Sol (y estrellas
4
Existen otras singularidades no radiales. Por ejemplo, al invertir la métrica, encontramos que θ = 0 es
una singularidad. Como r = rs , θ = 0 es sólo una singularidad de coordenadas.
176 Relatividad general y sus aplicaciones básicas
trayectoria
de la
partícula
trayectoria
prohibida
rs = 2M r
Figura 3.6: Conos de luz de partículas a distintas distancias del radio de Schwarzschild. Desde
la perspectiva de un observador distante, una partícula tarda más tiempo en recorrer una cierta
distancia a medida que se aproxima a r = rs .
dr
Reexpresando dτ = dr dt
dt dτ en términos del tiempo t medido por un observador distante, y
empleando (3.89), obtenemos la ecuación diferencial
dt rs −1 2 rs −1/2
=ε 1− ε −1+ , (3.105)
dr r r
cuya integral indefinida (para ε2 < 1) en la región rs < r < rs /1 − ε2 es
p r
εr ε2 − 1 + rs /r εrs (3 − 2ε2 ) ε2 − 1 + rs /r
t(r) = − arctan
ε2 − 1 (1 − ε2 )3/2 1 − ε2
p (3.106)
ε2 − 1 + rs /r
− 2rs arctanh .
ε
Claramente, el tercer término diverge cuando r se aproxima a rs . Esto significa que un
observador distante en reposo nunca ve que la partícula que cae alcanza rs .
Además, debido al corrimiento al rojo (3.78) asociado al campo gravitacional
s
1 − rs /r
ν obs (r) = ν emit , (3.107)
1 − rs /R
un observador distante localizado en R > rs observa que la luz emitida con frecuencia ν emit
desde la posición r por un cuerpo que se aproxima a r = rs sufre un corrimiento al rojo
hasta que ν obs → 0.
Sin embargo, la historia de acuerdo a la partícula que cae en el agujero negro es bastante
diferente. Usando la ecuación de movimiento (3.104) para una partícula masiva que se
aproxima al agujero negro, obtenemos
r
dr rs
= − ε2 − 1 + , (3.108)
dτ r
(el signo menos se debe a que la partícula se aproxima y, por lo tanto, r disminuye a medida
que τ aumenta) que conduce a
√2 q
r ε −1+rs /r + rs
arctan ε2 −1+rs /r
para ε2 < 1 ,
1−ε 2 (1−ε 2 )3/2 1−ε2
τ= q (3.109)
−r 2 r para ε2 = 1 .
3 rs
Estos resultados son finitos. Esto muestra que r = rs no es un punto donde la física falla,
relacionado a una singularidad del espacio–tiempo, aunque algunas características inusuales
aparezcan ahí para observadores distantes.
Ahora, nos gustaría explorar qué sucede al interior de un agujero negro, es decir, para
r < rs . Usemos la variable ρ = rs − r, tal que
rs r
Figura 3.7: Las direcciones radial y temporal son intercambiadas al interior del agujero negro, por lo
que el futuro de toda partícula ahí siempre es la singularidad r = 0. Este comportamiento peculiar
puede ser eliminado mediante un cambio de coordenadas.
dT = ±dX ,
mientras que la superficie con t constante está dada por las líneas rectas
T t
= tanh = cte (para r > rs ). (3.116)
X 2rs
X 2 − T 2 = −1 .
X2 − T 2 = 0 =⇒ T = ±X ,
que coincide con la superficie de tiempo para t → ±∞, indicando, como se esperaba, que
un observador en reposo observa que una partícula nunca alcanza el horizonte.
Con esta información, podemos trazar el diagrama de Kruskal de la figura 3.8, en el
que se omiten las coordenadas angulares, por lo que cada punto representa los eventos
que ocurren en una esfera de radio r. Formalmente, las coordenadas de Kruskal–Szekeres
describen correctamente sólo las regiones I y II. Vemos que si trazamos un cono de luz en
cualquier punto de la región I, el futuro de una partícula puede incluir hipérbolas asociadas
180 Relatividad general y sus aplicaciones básicas
r = rs agujero negro T r = rs
0 rs
r= r<
< r cte
0
rs
r>
∞
t>0
t=
X
t<0
t=
t cte
−
∞
rs
r>
rs
r<
0< 0
r= agujero negro
con tiempo invertido
= agujero blanco
Figura 3.8: Espacio-tiempo de Schwarzschild en coordenadas de Kruskal–Szekeres. Debido a que
no se muestran las coordenadas θ y ϕ, cada punto es una esfera de radio r. Las regiones I y II
corresponden al exterior e interior de un agujero negro, respectivamente, mientras que las regiones
III y IV, al exterior e interior de un “agujero blanco”. Las líneas punteadas corresponden al horizonte
de eventos. Los únicos “bordes” del espacio–tiempo permitidos son los asociados a la singularidad.
región IV, conduce inevitablemente a valores de r cada vez mayores, hasta que es expulsada
a través del horizonte de eventos, en la región III. Dado que, al contrario del agujero negro
de la región II, la región IV expulsa toda partícula e información ahí contenida, es común
llamarla agujero blanco.
La composición agujero blanco/agujero negro del diagrama de Kruskal revela una ca-
racterística interesante. Si suponemos que las singularidades en III y en II son indepen-
dientes, entonces el universo descrito por el agujero negro y su exterior es independiente
del descrito por el agujero blanco y su exterior. Pero, si consideramos que sólo existe una
singularidad y que las parábolas correspondientes en las regiones II y III son el mismo
lugar del espacio–tiempo, entonces existe una conexión entre las dos regiones del universo
denotadas por I y III a través de la singularidad, convirtiendo el agujero negro (y el blanco)
en un agujero de gusano. Este tipo de conexiones son más formalmente conocidas como
puentes de Einstein–Rosen y corresponden a las extensiones máximas del espacio–tiempo
de Schwarzschild que garantizan que toda partícula tenga una trayectoria futura, incluso
tras caer en la singularidad del agujero negro.
Los agujeros de gusano de Schwarzschild o puentes de Einstein–Rosen no pueden existir
en nuestro universo, pues las singularidades de este tipo se desintegrarían mucho antes de
que cualquier partícula, incluso un fotón, sea capaz de atraversarlo, si la conexión ocurre
entre dos regiones del mismo universo.6 Una posibilidad de lograr la estabilidad de este
tipo de conexiones, primeramente explorada por K. Thorne, es incluir materia formada de
partículas con masa o energía negativas, aún no observada. Otra forma de que los puentes de
Einstein–Rosen puedan existir es si éstos conectan dos universos diferentes, en un escenario
en el que nuestro universo es sólo uno de muchos en un multiverso. Desafortunadamente,
dado que la información no puede salir de un agujero negro, no es posible confirmar o
descartar esta conjetura. Por lo tanto, por el momento, aunque los agujeros de gusano son
una posibilidad interesante, se les considera una simple curiosidad teórica.
Se considera que los agujeros negros surgen del colapso de una estrella vieja. Cuando la
fusión nuclear del hidrógeno de una estrella ha llegado a su etapa final debido a la escasez
de protones libres, la presión producida por la fusión deja de ser suficiente para soportar
la fuerza gravitacional. Este desequilibrio provoca primeramente la expulsión violenta de
la capa exterior de la estrella, dejando el resto en forma de un denso cuerpo celeste (con
densidades de entre 103 y 1011 kg/cm3 ), el cual puede ser una enana blanca o una estrella
de neutrones, dependiendo de la masa de la estrella original.
Las enanas blancas están casi enteramente compuestas de electrones degenerados (con
las mismas propiedades cuánticas) mientras que las estrellas de neutrones contienen casi
6
Ver e.g. R.W. Fuller, J.A. Wheeler, Causality and multiply-connected space–time, Phys.Rev.128, 1962.
182 Relatividad general y sus aplicaciones básicas
están completamente caracterizadas por tres propiedades de un agujero negro que un ob-
servador externo puede medir: su masa M , su carga eléctrica Q y su momento angular
(también llamado espín por los astrofísicos) J. Por supuesto que, antes de colapsar, una
estrella posee más información (como el espín cuántico, números bariónico y leptónico,
cargas de color y sabor, etc.), pero esta información, que es lo que algunos llaman el “pelo”
del agujero negro, desaparece dentro del horizonte de eventos para un observador externo
una vez que la estrella colapsa y se configura el agujero negro. Se dice entonces que un
agujero negro no tiene pelo para un observador externo, como nosotros.
El “teorema” o, más bien, la conjetura de no pelo solamente ha sido probada parcial-
mente en algunos casos, bajo condiciones precisas del tipo de “pelo” o de los valores de la
carga eléctrica del agujero negro.8 La obtención de una demostración general o para casos
específicos complejos representa aún un área de investigación en progreso.
De ser correcta la conjetura de no pelo, sólo existen cuatro tensores métricos posibles
para los agujeros negros, los cuales se clasifican de acuerdo con sus propiedades básicas de
momento angular J y carga Q, empleando los nombres de sus descubridores:
7
Las ecuaciones de Einstein–Maxwell (3.117) son las ecuaciones de campo de Einstein aplicadas al caso
de un tensor de energía–momento en espacio curvo, resultado de generalizar el introducido en (2.169).
8
Ver e.g. P.O. Mazur. Black hole uniqueness theorems, [arXiv:hep-th/0101012], y sus referencias.
3.3 Solución de Schwarzschild: estrellas y agujeros negros 183
J =0 J 6= 0
Q=0 Schwarzschild Kerr
Q 6= 0 Reissner–Nordström Kerr–Newman
↓ ↓
Simetría esférica Simetría axial
A pesar de que estos tensores comparten algunas propiedades, tales como las simetrías
geométricas (esférica o axial) que determinan la forma de los agujeros negros, su estructura
está definida por los detalles de cada caso. Como un ejemplo y sin discutirlo en detalle, la
métrica de Kerr conduce al siguiente intervalo en coordenadas esférico–polares:
rrs 2 2rrs a sen2 θ
ds2 = 1 − dt + dtdϕ
Σ Σ
Σ 2 2 2 2 rrs a2 sen2 θ
− dr − Σdθ − r + a + sen2 θdϕ2 , (3.118)
∆ Σ
emitida por intensos discos de acreción de materia (caliente y densa) tragada por el agujero
negro. En contraste con los discos de acreción de estrellas jóvenes, que emiten radiación
infrarroja, estos agujeros negros emiten en la región de rayos X del espectro.
1. el corrimiento al rojo gravitacional, que hemos estudiado en las secciones 3.1.2 y 3.3.2,
primero como una consecuencia inmediata del principio de equivalencia;
2. la desviación de la luz por una fuente gravitacional, que es una buena prueba de la
relatividad general, aunque es detectable incluso en el límite de campo débil (New-
toniano); y
Consideremos que el campo gravitacional del Sol (y otras estrellas) está descrito por
la solución de Schwarzschild y estudiemos el movimiento de fotones en el plano θ = π/2,
regido por las ecuaciones de movimiento (3.94) y (3.90) (con e = 0),
2
dr 2 ℓ2 2M
= ε − 2V (r), V (r) = 2 1 − ,
dλ 2r r (3.119)
dϕ ℓ
=± 2,
dλ r
donde los signos en la segunda ecuación provienen de restringir ℓ > 0. Combinando la
ecuación radial y angular, obtenemos
s
dϕ ℓ2 /r4 1
=± ℓ2 2M
=± q , (3.120)
dr 2
ε − 2 1− r2 1 − 1 1 − 2M
r r b2 r2 r
suponiendo que la dirección original del fotón es ϕ0 . Vemos primero que esta ecuación
puede reescribirse de una manera más sugerente, como
r sen(ϕ − ϕ0 ) = b, (3.124)
lo que se parece a la ecuación de una línea recta en coordenadas polares. Para apreciar
esto, consideremos qué sucede cerca de la estrella. La distancia de acercamiento máximo,
186 Relatividad general y sus aplicaciones básicas
1 2
2 ε =V(r)
1 2
2ε
2M r
ϕ′ ϕ0
b
Figura 3.9: Distancia de máximo acercamiento a una estrella esférica y estática para una partícula
no masiva con energía ε2 /2. Dado que se trata de movimientos clásicos sometidos al potencial estelar
V (r), la luz proveniente de r → ∞ se acerca hasta que se satisface V (r) = ε2 /2, que es su punto
de retorno. Cuando la energía de la luz está por encima del máximo del potencial, penetra hasta la
estrella.
!
como se ilustra en la figura 3.9, está determinada por 12 ε2 = V (r), que en términos de u y
despreciando 2M u, como antes, conduce a
1
u2 ≈ , (3.125)
b2
de donde observamos que b corresponde al parámetro de impacto. Sustituyendo este resul-
tado en (3.123), encontramos
π
ϕ − ϕ0 ≈ . (3.126)
2
Esto, por supuesto, no es el resultado completo porque un fotón debe experimentar una
desviación idéntica cuando se aleja, tal que
ϕ′ − ϕ0 = (ϕ′ − ϕ) + (ϕ − ϕ0 ) ≈ π, (3.127)
donde ϕ′ denota la dirección del fotón que se aleja. Esto es, por supuesto, el resultado
Newtoniano, suponiendo que la masa de los fotones es nula.12
12
Se obtienen resultados diferentes si se supone incorrectamente que los fotones tienen un masa pequeña.
3.4 Pruebas de la relatividad general 187
1
y≈ . (3.132)
b
Sustituyendo este resultado en (3.131) se obtiene
π 2M
ϕ − ϕ0 ≈ + , (3.133)
2 b
que, aplicando la misma lógica que en (3.127), conduce al resultado final
4M
ϕ′ − ϕ 0 ≈ π + . (3.134)
b
Este resultado difiere del Newtoniano por 4M b , lo que implica que la luz se desvía
gravitacionalmente. Podemos ver este efecto ilustrado en la figura 3.10.
188 Relatividad general y sus aplicaciones básicas
ϕ − ϕ0
ϕ0
4M b
b
ϕ′
Figura 3.10: Ángulo de deflexión de la luz provocado por el campo gravitacional de una estrella
modelada por la métrica de Schwarzschild.
Mercurio es el planeta más cercano al Sol y, por lo tanto, el más afectado por el campo
gravitacional de nuestra estrella. Desde una perspectiva Newtoniana, no obstante, esto no
puede alterar la forma elíptica de la órbita de Mercurio. A pesar de esto, se ha observado
que el perihelio15 de Mercurio cambia de posición a una tasa de ∼ 43′′ /siglo. Esto puede
explicarse si las órbitas planetarias precesan, causando un desplazamiento precesional ∆
del perihelio, como se ilustra en la figura 3.11.
13
Ver M. Niaz, Critical appraisal of physical science as a human enterprise, cap 9. Springer, 2009.
14
Texas Mauritanian Eclipse Team, Gravitational deflection of light: solar eclipse of 30 June 1973 I.
Description of procedures and final results., Astronomical Journal 81 p.452, 1976.
15
El perihelio es la posición de máximo acercamiento de un planeta a su estrella.
3.4 Pruebas de la relatividad general 189
∆
planeta
Sol
d2 u M
+ u = 2 + 3M u2 . (3.141)
dϕ2 ℓ
Incluso Mercurio, el planeta más rápido (para el cual ℓ es grande), se puede mostrar que el
cociente 3M u2 /(M/ℓ2 ) es del orden 10−7 y entonces podemos despreciar el segundo término
190 Relatividad general y sus aplicaciones básicas
del lado derecho de (3.141). Despreciar este término corresponde al límite Newtoniano
estricto. Por lo tanto, tenemos que la ecuación de movimiento se reduce (en este límite) a
d 2 u0 M
2
+ u0 ≈ 2 , (3.142)
dϕ ℓ
cuya solución es
M M
u0 (ϕ) ≈ (1 − λ cos(ϕ − ϕ0 )) = 2 (1 − λ cos ϕ), (3.143)
ℓ2 ℓ
en donde la última igualdad resulta de tomar ϕ0 = 0 por simplicidad. La solución (3.143)
describe una elipse con excentricidad λ, es decir, hemos recuperado el resultado Newto-
niano. Sustituyendo en la ecuación original (3.139), omitiendo el término 2M u3 , podemos
verificar que la excentricidad está dada por
r
ℓ2
λ = 1 + 2 (ε2 − 1). (3.144)
M
Para averiguar la corrección relativista a la solución Newtoniana u0 (ϕ), podemos usar un
2
método perturbativo. Definiendo η ≡ 3M ℓ2
≪ 1, podemos reescribir (3.141) como
d2 u M ℓ 2 u2
+ u = + η . (3.145)
dϕ2 ℓ2 M
Proponemos un primer ansatz
d 2 u0 d 2 u1 M ℓ2 2
+ u 0 + η + ηu 1 = + η (u + 2ηu0 u1 + η 2 u21 ). (3.147)
dϕ2 dϕ2 ℓ2 M 0
Recordando (3.142), los primeros dos términos del lado izquierdo cancelan el primero del
lado derecho. Entonces, a primer orden de η, encontramos
d 2 u1 ℓ2 2 M M
+ u 1 ≈ u = 2 (1 − λ cos ϕ)2 = 2 (1 − 2λ cos ϕ + λ2 cos2 ϕ)
dϕ2 M 0 ℓ ℓ
(3.148)
M 1 2λM M λ2
= 2 1 + λ2 − 2 cos ϕ + cos 2ϕ,
ℓ 2 ℓ 2ℓ2
donde usamos cos2 ϕ = 12 (1 + cos 2ϕ). Para esta ecuación, proponemos un segundo ansatz
Sustituyendo los datos de Mercurio y el Sol (con M⊙ → 1.989 × 1030 kg GN /c2 ≈ 1.47 km,
rc ≈ 5.5 × 107 km), obtenemos
6π · 1.47 km
∆≈ ≈ 5 × 10−7 rad/órbita. (3.158)
5.5 × 107 km
que, comparado con el valor medido ∆ = 42.98′′ ±0.04′′ , exhibe una precisión sobresaliente.
1
Γµ αβ = g µν (gαν,β + gβν,α − gαβ,ν )
2
1
≈ η µν (hαν,β + hβν,α − hαβ,ν ) (3.160)
2
1
= (hα µ ,β + hβ µ ,α − hαβ ,µ ).
2
Por otro lado, las únicas contribuciones lineales al tensor de Ricci (2.331) son las lineales
en Γ, puesto que los otros términos son cuadráticos en h. Por lo tanto,
Las ecuaciones de Einstein linealizadas pueden expresarse como Rµν − 21 ηµν R ≈ 8πTµν .
Por lo tanto,
hµα,ν α + hνα,µ α − hµν ,α α − h,µν − ηµν (hαβ ,αβ − h,α α ) = 16πTµν . (3.164)
Ahora, para simplificar esta expresión, definimos el operador barra actuando sobre las
componentes del tensor hµν como
1
hµν ≡ hµν − ηµν h. (3.165)
2
Se utilizará la barra para implicar la misma operación para cualquier otro tensor simétrico.
Entonces Gµν = Rµν a primer orden en hµν y hµν = hµν , es decir hµν = hµν − 21 ηµν h. Con
esta notación, las ecuaciones de Einstein linealizadas (3.164) se convierten en
kσ k σ = 0 . (3.172)
Por lo tanto, la onda plana (3.171) es una solución de la ecuación linealizada si el vector
de onda es nulo o luminoide. Esto significa que las perturbaciones a la métrica plana
codificadas en h se propagan a la velocidad de la luz. La componente temporal del vector
de onda se refiere a la frecuencia de la onda, y escribimos (k σ ) = (ω, k 1 , k 2 , k 3 )T .
Imponemos la condición de norma de Hilbert (3.167) en términos del ansatz (3.171),
µν σ σ !
∂µ h = ∂µ (Aµν eikσ x ) = iAµν kµ eikσ x = 0, (3.173)
Entonces, para una onda plana con esta norma, que viaja en la dirección x3 , sus compo-
nentes A11 y A12 (junto con su frecuencia ω) caracterizan completamente la onda.
Para obtener los efectos de la onda, se considera el movimiento relativo de un anillo
de partículas cercanas. Resulta que las componentes A11 y A12 corresponden a las dos
polarizaciones de la onda gravitacional. Como se justifica a continuación, renombramos
estas componentes independientes como A+ = A11 y A× = A12 .
Si empezamos con un anillo de partículas estacionario en el plano x1 –x2 , a medida que
pase la onda con polarización A+ , estas oscilan horizontal y verticalmente con la forma de
“+”, como se representa en la figura 3.12. Para el caso de la polarización correspondiente a
A× , el anillo de partículas oscila con la forma de “×”, como se representa en la figura 3.13.
Estas perturbaciones ondulatorias que se desplazan mediante vectores de onda luminoides
son las que llamamos ondas gravitacionales.
La existencia de las ondas gravitacionales es, como la de los agujeros negros, una ines-
perada predicción de la relatividad general. Einstein notó en 1916 que su teoría indica que
cualquier cuerpo es capaz de producir deformaciones ondulatorias en el espacio si sufre
una aceleración repentina. Esto ocurre, por ejemplo, cuando dos objetos cuerpos colisio-
nan, o cuando dos masas similares forman un sistema gravitacional binario, como el de los
planetoides Plutón-Carionte.
Como hemos visto, las ondas gravitaciones, al desplazarse, alargan y contraen repetiti-
vamente el espacio por el que transitan gracias a la energía que transportan. Desafortuna-
damente, debido a que la gravedad es la fuerza más débil de las fuerzas de la naturaleza,
a pesar de que todo cuerpo puede producir ondas gravitacionales, son prácticamente inde-
x2
x1
Figura 3.12: Movimientos de un anillo de partículas libres en el plano x1 − x2 provocados por una
onda con polarización A+ . En el gráfico, la dirección horizontal es x1 ; sin embargo, las figuras a la
derecha corresponden a configuraciones que ocurren en tiempos posteriores a las de la izquierda.
196 Relatividad general y sus aplicaciones básicas
x2
x1
Figura 3.13: Movimientos de un anillo de partículas libres en el plano x1 − x2 producidos por una
onda con polarización A× .
tectables a menos de que sean producidas por fuentes gravitatorias inmensamente masivas
o energéticas, tales como estrellas de neutrones o agujeros negros. Por si fuera poco, como
la intensidad de las ondas es atenuada con la distancia recorrida y las posibles fuentes
supermasivas no son cercanas a la Tierra, incluso en un caso óptimo, una onda que llegara
a nosotros causaría deformaciones espaciales mucho más pequeñas que un núcleo atómico.
Uno de los pioneros en la búsqueda de las ondas gravitacionales fue el físico estadou-
nidense Joseph Weber, quien diseño cilindros de aluminio, de 2m de longitud y 1m de
diámetro, que podrían absorber la energía de una onda gravitacional y resonar con la onda
detectada. A pesar de que en 1968 Weber afirmó haber observado lo que esperaba, sus re-
sultados fueron controvertidos porque no podían ser replicados y porque, entre otras cosas,
describían la existencia de fuentes relativamente pequeñas y tan masivas como miles de
galaxias juntas. Desde la predicción y hasta entonces, las ondas gravitacionales eran tan
controversiales que muchos, incluyendo al mismo Einstein, dudaron de su existencia.
Poco después, entre 1974 y 1978, llegaría la reivindicación de las ondas gravitacionales.
En 1974, los astrónomos Joseph H. Taylor Jr. y su ex-estudiante Russell A. Hulse descubrie-
ron un sistema rotante de dos estrellas de neutrones separadas apenas por algunas veces la
distancia entre la Luna y la Tierra. Cuatro años después de descubrir este sistema, Taylor
notó que el sistema rotaba cada vez más rápido, pero en una órbita cada vez más pequeña.
La única explicación consistente con los datos es que el sistema está en ruta de colisión
porque pierde energía en forma de ondas gravitacionales. Esta constituyó la primera prue-
ba indirecta de la existencia de las ondas gravitacionales. Tras el merecido premio Nobel
de 1993 a Taylor y Hulse, se convirtió en consenso que las ondas gravitacionales existen,
aunque nuestra tecnología debería aún desarrollarse para poder detectarlas directamente.
La colaboración LIGO fue fundada entre 1983 y 1992, en Estados Unidos, por los
físicos experimentales Ronald Drever y Rainer Weiss y el teórico Kip Thorne con la misión
de detectar directamente ondas gravitacionales mediante el uso de dos interferómetros,
3.4 Pruebas de la relatividad general 197
similares al empleado por Michelson y Morley para descartar la hipótesis del éter, uno en
Livingston, Louisiana, y otro en Hanford, Washington, a 3002 km de distancia.
Los interferómetros usados para medir ondas gravitacionales constan de dos túneles
de la misma longitud formando una “L”, dotados con sofisticados sistemas para aislarlos
lo mejor posible de las vibraciones ambientales. En ausencia de ondas gravitacionales los
haces de luz empleados en los interferómetros no producen ninguna señal. Cuando una
onda gravitacional atraviesa el interferómetro, contrae el espacio en una dirección mientras
que lo expande en la dirección perpendicular. En el caso ideal en que las ondas llueven
verticalmente sobre los interferómetros, uno de los brazos se encoje mientras el otro se
alarga. Esto provoca que los haces de luz emerjan desincronizados porque uno viajó mayor
distancia que el otro, y produzcan una señal oscilatoria de frecuencia compatible con la de
la onda gravitacional que provocó la deformación del interferómetro.
Este mecanismo sería muy sencillo si las deformaciones del interferómetro fueran per-
ceptibles a simple vista. Desafortunadamente, lo que LIGO y otros experimentos similares,
como el de la colaboración Virgo en Italia, habían demostrado hasta 2010 es que las ondas
gravitacionales deforman los brazos de los interferómetros por un factor menor a 10−21 ,
razón por la que los brazos de los detectores de LIGO miden 4 km de longitud. Y LIGO
construyó dos interferómetros tan distantes para confirmar toda señal detectada.
Los gigantescos interferómetros de LIGO son capaces de detectar alteraciones en la
longitud de los brazos de hasta 10−19 m. Con tal precisión, que rebasa la de todos los
experimentos similares, finalmente el pasado 14 de septiembre de 2015 apareció una señal
con duración de aproximadamente 0.2 s. La señal fue detectada por ambos detectores, con
6 ms de diferencia. Más allá de esta diferencia, que es consistente con la velocidad a la
que se desplazan las ondas gravitacionales, las señales son idénticas, un breve pero notorio
pulso oscilatorio con una amplitud de apenas 10−18 m. La señal tiene una certidumbre de
5.1 σ. Y con una certeza del 90 %, la señal se debe a la coalescencia de dos agujeros negros
ocurrida hace aproximadamente 1,300 millones de años en algún lugar del universo. Se
trataría de un sistema binario compuesto por agujeros negros de Kerr, con masas de 36 y
29 M⊙ , y que, al mezclarse, produjeron un agujero negro rotante con una masa equivalente
a 62M⊙ . La energía liberada en forma de ondas gravitacionales durante esta colisión sería
la equivalente a 3M⊙ .
Por este descubrimiento, Kip Thorne, Rainer Weiss y Barry C. Barish han sido galar-
donados con el premio Nobel en física 2017. Es posible que su descubrimiento, comparable
con el descubrimiento del bosón de Higgs, permita el descubrimiento de distintos aspec-
tos de la naturaleza que han sido invisibles a los observatorios astronómicos basados en
telescopios electromagnéticos.
198 Relatividad general y sus aplicaciones básicas
En un universo uniforme, que lo haya sido durante toda su historia, podemos concebir
que la simetría materia–antimateria debería haber sido respetada siempre. La solución a
este problema exige un contacto entre la física de partículas, la dinámica relativista y la
termodinámica del universo en evolución.
donde a(t) es conocido como el factor de escala y aquí tiene dimensiones de longitud,18
por lo que la coordenada radial r no tiene unidades. El factor de escala, por lo tanto, es
una medida de la tasa de crecimiento de las distancias en (o expansión de) el universo y
no una medida del tamaño del universo. La constante k representa el tipo de curvatura del
espacio, y puede adquirir los siguientes valores:
+1 universo cerrado,
k= 0 universo plano, (3.178)
−1 universo abierto.
Estos valores son independientes del tamaño del universo; sin embargo, resulta claro que
si nuestro universo es plano o abierto, puede ser infinitamente grande, mientras que, si
k = +1, es fácil mostrar que la métrica de FRW corresponde a la métrica de una esfera
y que, por lo tanto, vivimos en un universo con un tamaño preciso que aún no podemos
medir porque no hemos alcanzado a observar los objetos celestes que habitan en los límites
de la esfera.19
Supongamos ahora que la dinámica del universo está gobernada por las ecuaciones de
Einstein,
1
Rµν − gµν R = 8πTµν , (3.179)
2
y que el contenido del universo puede ser modelado como un fluido perfecto, por lo que
el tensor de energía–momento tiene la estructura (2.160) y satisface la ecuación de esta-
do (2.162), P = ωρ. En principio, ω puede variar en el tiempo, pero suponemos aquí que
18
En otras convenciones, el factor de escala es adimensional.
19
Sin embargo, mediciones indirectas de k arrojan que la descripción más aceptable del universo observable
corresponde a k = 0. Esta observación no descarta del todo las otras opciones porque cabe la posibilidad
de que la porción observable del universo tenga k = 0 mientras que el universo entero (mucho más grande)
posea otro tipo de geometría.
200 Relatividad general y sus aplicaciones básicas
se trata de una constante adimensional, cuyos valores dependen del contenido del universo,
de acuerdo a (2.163). Por lo tanto, el tensor de energía–momento adopta la forma
ȧ2 k 8π
2
+ 2 = ρ. (3.183)
a a 3
Definiendo el parámetro de Hubble al tiempo t como
ȧ(t)
H(t) ≡ , (3.184)
a(t)
k 8π
H2 + 2
= ρ. ecuación de Friedmann (3.185)
a 3
donde la llamada densidad crítica ρc = 3H 2 /8π define el valor que la densidad de energía
ρ debe tomar a un tiempo t para que el lado derecho de (3.186) se anule y, por lo tanto, el
3.5 Principios relativistas de cosmología 201
espacio–tiempo (al tiempo t) sea plano, es decir, k = 0. Por ejemplo, al tiempo actual t0 ,
con el valor medido del parámetro de Hubble
H0 ≡ H(t0 ) ≈ 67.8 km/s Mpc, (3.187)
obtenemos que la densidad crítica presente es ρ0,c ≡ ρc (t0 ) = 3H02 /8π ≈ 4.844 keV/cm3 .
Definimos ahora el parámetro de densidad o abundancia20 Ω ≡ ρ/ρc , que permite rees-
cribir la versión (3.186) de la ecuación de Friedmann como
k
= Ω − 1. (3.188)
a2 H 2
Con estos elementos, es posible obtener algunas consecuencias importantes para la diná-
mica y forma de nuestro universo a todo tiempo. Primero, la ecuación de Friedmann (3.188)
es una relación entre la curvatura del espacio y el contenido del universo parametrizado
por Ω, de donde observamos que
sgn(k) = sgn(Ω − 1). (3.189)
Consecuentemente,
k = +1 =⇒ Ω > 1,
k=0 =⇒ Ω = 1,
k = −1 =⇒ Ω < 1.
Segundo, reescribiendo la ecuación de Friedmann como
8π 2
ȧ2 =
ρa − k, (3.190)
3
notamos que, si la densidad de energía ρ es positiva, la expansión del universo, codificada
en el crecimiento de a con el tiempo, sólo puede cesar si k = +1.
Por otra parte, debido a la homogeneidad del espacio–tiempo de FRW, las componentes
espaciales (µ, ν) = (i, i) de las ecuaciones de campo de Einstein (3.179) bajo la métrica de
FRW conducen a la misma ecuación. Por ejemplo, tomando µ = ν = 2 encontramos
" 2 # " 2 #
ä ȧ k 2 2 ä ȧ k
+2 +2 2 r a −3 + + 2 r2 a2 = 8π(−P )(−a2 r2 ) , (3.191)
a a a a a a
20
En la literatura, es habitual que Ω sólo se refiera a la fracción actual de energía con respecto a la
densidad crítica. Aquí, la abundancia actual se denota como Ω0 ≡ Ω(t = t0 ).
202 Relatividad general y sus aplicaciones básicas
donde hemos usado la definición del parámetro de Hubble y la última igualdad surge al
sustituir la ecuación de Friedmann (3.185). Notamos que si ρ + 3P > 0, la expansión del
universo se desacelera, mientras que si P < −ρ/3, el universo se expande cada vez más
velozmente.
Dependiendo del tipo de sustancia que es descrita por el fluido perfecto, la ecuación de
estado P = ωρ puede tener
1/3 radiación,
ω= 0 materia,
−1 energía del vacío.
Por lo tanto, observamos que un universo poblado solamente de materia y radiación tiene
una expansión que se ralentiza. Por lo tanto, si k = +1 y el universo contiene sólo materia
y radiación, tras alcanzar su tamaño máximo, comienza a contraerse hasta reducirse a
una singularidad con a = 0. Por el contrario, si el universo está vacío pero posee una
cantidad de energía intrínseca (probablemente de naturaleza cuántica), la correspondiente
ecuación de estado es P = −ρ (ver ejercicio 3.2) y el universo se expande aceleradamente.
Esta misteriosa energía de presión negativa es habitualmente denominada energía oscura;
su existencia es conjeturada debido a la observación de que el universo se expande hoy
aceleradamente.
Combinando la ecuación de Friedmann y (3.192), o bien, empleando Dµ T µ 0 = 0, obte-
nemos la expresión de la ecuación de continuidad o conservación de energía en el universo
de FRW,
Dµ T µ 0 = T µ 0,µ + Γµ λµ T λ 0 − Γλ µ0 T µ λ
ρ = ρr + ρm + ρΛ , (3.197)
la radiación desaparecerá antes que la materia, pero la energía oscura persistirá, condu-
ciendo, como discutimos antes, a un periodo de expansión acelerada sin límites. Notemos
también que una curiosa consecuencia de (3.196) es que, para un determinado volumen, la
energía no se conserva durante la evolución del universo.
dr2
ds2 = dt2 − a2 (t) = 0. (3.199)
1 − kr2
Considerando que la luz se aproxima desde la posición r hacia la posición de un observador
ubicado en r = 0, notamos que r decrece a medida que t aumenta, por lo que (3.199)
204 Relatividad general y sus aplicaciones básicas
conduce a
dt dr
= −√ . (3.200)
a(t) 1 − kr2
Si un rayo de luz es emitido por una fuente en la posición r al tiempo t y detectado en
r = 0 al tiempo t = t0 , entonces se satisface
Z t0 Z r
dt′ dr′
= √ . (3.201)
t a(t′ ) 0 1 − kr′2
Por otra parte, considerando la luz como una onda clásica, podemos imaginar que dos
crestas consecutivas son emitidas a los tiempos t y t + ∆t, pero son detectadas a los
tiempos t0 y t0 + ∆t0 . Dado que el lado derecho de (3.201) es fijo para una misma fuente,
tenemos que Z t0 Z t0 +∆t0
dt′ dt′
= , (3.202)
t a(t′ ) t+∆t a(t′ )
que es equivalente a
Z t+∆t Z t0 Z t0 Z t0 +∆t0
dt′ dt′ dt′ dt′
+ = + (3.203)
t a(t′ ) t+∆t a(t′ ) t+∆t a(t′ ) t0 a(t′ )
Por lo tanto, si el periodo de la onda asociada a la luz es tan corto como para que el factor
de escala sea constante durante la emisión de la luz, obtenemos
∆t ∆t0
= , (3.204)
a(t) a(t0 )
que establece una relación entre la frecuencia de la luz al ser emitida y cuando es observada
∆t0 νemit a0
= = . (3.205)
∆t νobs a(t)
De esta forma, concluimos que el corrimiento al rojo en la cosmología de FRW está dado
por
a(t0 )
z+1= . corrimiento al rojo cosmológico (3.206)
a(t)
Observamos que si los objetos celestes están relativamente cerca, la luz que permite detec-
tarlos fue emitida alrededor de t = t0 y, por lo tanto, z = 0.
Es interesante notar que para objetos celestes un poco más distantes, cuya luz es emitida
al tiempo t < t0 , tal que la distancia que los separa de nosotros se puede aproximar por
d ≈ t0 − t (en unidades naturales) y es menor a algunos cientos de Megaparsecs, es posible
expresar el corrimiento al rojo (3.206) como
1 a(t) a0 + ȧ0 (t − t0 )
= ≈ ≈ 1 − H0 d . (3.207)
z+1 a0 a0
3.5 Principios relativistas de cosmología 205
Dado que z también es pequeño en este caso, tenemos que 1/z + 1 ≈ 1 − z, lo que permite
concluir que, para objetos celestes no tan distantes se satisface
conocida como la ley de Hubble, que establece una relación lineal entre la velocidad de
recesión de las galaxias cercanas codificada en z y su distancia (propia) a la Tierra d a través
de la constante H0 . Fue precisamente Hubble, quien en 1929 descubrió y luego confirmó
observacionalmente la relación cuasi-lineal (3.208), razón por la que H0 es conocida como
la constante de Hubble.22
Al analizar el lado derecho de la ecuación de Friedmann (3.190) con las soluciones para
la densidad de energía (3.196), vemos que, cuando a → 0, ρa2 tiende a infinito como a−2 o
a−1 dependiendo de si el universo está dominado por radiación o materia, respectivamente.
Dado que en el pasado remoto el factor de escala debió tener valores minúsculos, para
esa época el valor de k resulta irrelevante y la densidad de energía del universo es, en
buena aproximación, la densidad crítica, ρ ≈ 3H 2 /8π. Es decir, en sus orígenes, el universo
puede ser considerado plano si su contenido se puede caracterizar como materia o radiación,
como se supone habitualmente. Curiosamente, diversas mediciones astrofísicas conducen a
la conclusión de que la densidad de energía del universo actual es también muy cercana
a la crítica, por lo que nuestro universo hoy puede modelarse por la métrica de FRW con
k = 0.
La observación de que el universo puede ser considerado como plano tanto en sus pri-
meros instantes como en el presente representa una interrogante conocida como el problema
de planitud. Una posible solución a esta cuestión es simplemente adoptar k = 0 como una
propiedad de la geometría de nuestro espacio–tiempo, para todo tiempo. Aunque, como
estudiaremos en esta sección, esta es una excelente aproximación para muchos propósitos,
no es necesario en general suponer que k = 0 si se acepta que el universo experimentó hace
casi 14, 000 millones de años un proceso de expansión exponencial con duración de alrede-
dor de 10−34 s, que permitió que la región observable del universo escalara su tamaño entre
1025 y 1030 veces. La hipótesis de la existencia de este periodo de expansión acelerada del
universo temprano, conocido como inflación cosmológica, será discutido con mayor detalle
en la sección 3.5.6 y se encuentra actualmente bajo constante escrutinio experimental y
teórico.
22
La ley de Hubble (3.208) sólo es válida para corrimientos al rojo en el intervalo 0.01 . z . 0.1, pues
para valores menores, las estrellas y galaxias también son afectadas por los campos gravitacionales cercanos,
y para valores mayores las aproximaciones dejan de ser válidas.
206 Relatividad general y sus aplicaciones básicas
Como ρ = ρc = cte para un universo plano repleto de energía de vacío, con ω = −1,
el parámetro de Hubble es constante y, por lo tanto, a(t) escala exponencialmente. Por
lo tanto, en resumen, obtenemos que el factor de escala para los distintos contenidos del
universo se expresa en función del tiempo como
1
t2 radiación,
2
a(t) ∝ t3 materia, (3.212)
eH∗ t p
energía oscura, H∗ = 8πρc /3 = cte.
Es interesante notar que el universo crece más rápidamente cuando contiene materia que
cuando sólo contiene radiación; pero, si H∗ es lo suficientemente grande, la energía oscura
provoca la expansión más veloz. Además, confirmamos que la expansión es acelerada, ä > 0,
sólo en el caso de la energía oscura.
Por otra parte, si dividimos la ecuación de Friedmann en un universo plano (3.209) por
H02 , obtenemos la relación
H2 8π ρ
2 = 2 ρ= . (3.213)
H0 3H0 ρ0,c
con ρr = ρ0,r a−4 , ρm = ρ0,m a−3 y ρΛ = ρ0,Λ , de acuerdo con (3.196), donde ρ0,i denota la
densidad de energía actual correspondiente a la especie i, con i = r, m, Λ, y hemos adoptado
la normalización a0 = 1. En este caso, (3.213) se debe reescribir como
Ω0,r ≈ 5.38 × 10−5 , Ω0,Λ ≈ 0.692 ± 0.012, Ω0,m ≈ 0.308 ± 0.012 . (3.217)
por encima de las de todas las partículas elementales conocidas. Desafortunadamente, nin-
guno de los varios observatorios configurados para la detección de las hipotéticas partículas
ha conseguido una detección directa.
Debido a que el factor de escala a no es una cantidad que podamos medir directamente, al
contrario del corrimiento al rojo z, resulta más conveniente expresar la integral en (3.220)
en términos de la variable x ≡ a/a0 = (z + 1)−1 como
Z (z+1)−1
dx
t(z) = p . (3.221)
0 H0 Ω0,r x + Ω0,m x−1 + Ω0,Λ x2
−2
Una estrella que emite su luz en nuestra época (como e.g. el Sol y Alfa Centauri)
no exhibe ningún corrimiento al rojo debido a la expansión del universo, de donde sigue
que z0 = 0. Por lo tanto, empleando los datos observacionales del parámetro de Hubble
actual (3.187) y las abundancias presentes (3.217), la edad del universo hasta el día de hoy
resulta ser el conocido valor t0 ≡ t(z0 = 0) ≈ 13.8 × 109 años.
La expresión para la edad del universo (3.221) permite determinar la edad posible de
una estrella, galaxia, cúmulo o cualquier otro objeto astrofísico, cuyo espectro de emisión
(y absorción) sea medido. Si, al compararla con el espectro asociado al objeto identificado,
la medición resulta con un corrimiento al rojo z 6= 0 ajeno al movimiento del objeto,
concluimos que éste no pudo haber existido antes del tiempo t(z). Sabemos, por ejemplo,
que muchas de las estrellas más antiguas tienen corrimientos al rojo de z ∼ 11. Esto indica
que las primeras estrellas pudieron haber aparecido cuando el universo tenía apenas como
4 × 108 años.
3.5 Principios relativistas de cosmología 209
10 10
10 9
10 8
t(z)/años
10 7
10 6
10 5
Figura 3.14: Edad en años del universo para distintos valores de corrimiento al rojo z. La época
actual corresponde a z0 = 0 y t(z0 ) ≈ 1.38 × 1010 años. El máximo corrimiento al rojo posiblemente
detectable es alrededor de z = 3, 500, cuando el universo observable habría existido por alrededor
de 60,000 años.
H 2 X ρi k
2 = − 2 2 = Ω0,r a−4 + Ω0,m a−3 + Ω0,Λ + Ω0,k a−2 (3.224)
H0 ρ0,c H0 a
i
lo que, con las abundancias observadas (3.217) y (3.226), conduce a amax ≈ 0.606 y con-
secuentemente a Ωmax,k ≈ −0.006+0.021
−0.023 . Es interesante notar a partir de la ecuación de
aceleración (3.214) que, considerando las especies que llenan el universo, el valor del factor
de escala al que la expansión del universo comenzó la etapa de aceleración presente está
dado por la condición
ä 1 X ρi 1 !
=− (3ωi + 1) = − 2Ω0,r a−4 + Ω0,m a−3 − 2Ω0,Λ = 0, (3.228)
aH0 2 ρ0,i 2
i
3.5 Principios relativistas de cosmología 211
que, comparando con (3.227), conduce a que el inicio de la expansión acelerada del universo
coincide con amax . A partir de estos resultados llegamos a una importante conclusión: el
universo siempre ha sido casi plano, como supusimos antes, y el momento en el que se alejó
más de esta descripción está determinado por el instante en el que se inició la expansión
acelerada que hoy observamos.
Esta conclusión, no obstante, no explica por qué, dados todos los eventos cósmicos
que el universo ha sufrido, las mediciones indican que hoy el universo es plano, Ω0,tot =
Ω0,r +Ω0,m +Ω0,Λ +Ω0,k ≈ 1. Esta observación tiene poco sentido porque, a partir de (3.196),
notamos que en el universo temprano la energía oscura fue despreciable en el contenido del
universo, y por lo tanto, de la definición de la densidad de curvatura (3.222), la curvatura
del universo crece con el tiempo como
|k| |k|
|Ωk | = = 2 ∝ t(6ω+2)/3(ω+1) (3.229)
a2 H 2 ȧ
con ω = 0, 1/3. Es decir, si k 6= 0, no importa qué tan cercano a cero haya sido Ωk (t = 0),
la curvatura debería ser hoy muy diferente. Esta es una forma más precisa de establecer el
llamado problema de planitud.
Finalmente, discutamos la edad de nuestro universo en el caso de que k 6= 0. A partir
de (3.224) y repitiendo los pasos que conducen a (3.221), obtenemos
Z (z+1)−1
dx
t(z) = p (3.230)
0 H0 Ω0,r x + Ω0,m x−1 + Ω0,Λ x2 + Ω0,k
−2
Hasta antes del descubrimiento de las ondas gravitacionales y desde la invención del
telescopio, el único método para explorar el cosmos a distancias cosmológicas ha sido la
radiación electromagnética que detectamos en nuestro planeta. La mayor cantidad de la
radiación detectada proviene de planetas, estrellas, (super)novas, galaxias, cúmulos y otros
fenómenos como la acreción de materia en agujeros negros.
Sin embargo, en 1964 los radioastrónomos estadounidenses Arno Penzias y Robert Wil-
son, quienes hacían experimentos de radiocomunicación satelital para los laboratorios Bell
con una gigantesca antena enfriada con helio líquido, notaron que es posible detectar a
cualquier hora del día radiación isotrópica (proveniente de todas direcciones), ajena a toda
fuente observable, en el canal de microondas con frecuencia de 4, 080 MHz, equivalente a
longitud de onda de 7.35 cm. Aunque pensaron al principio que se trataba de algún tipo de
“ruido” experimental, lograron identificar que se trata de un fondo de radiación cósmica.
212 Relatividad general y sus aplicaciones básicas
8πh ν3
u(ν) = , (3.231)
c3 exp(hν/kB T ) − 1
donde h y kB son respectivamente las constantes de Planck y Boltzmann y hemos incluido
todas las constantes para mayor claridad.26
En la figura 3.15a se muestra la distribución espectral asociada a un cuerpo negro
con T = 2.726 K, que coincide con la de la radiación observada por distintos detectores.
El máximo del espectro corresponde a la frecuencia que concentra la mayor cantidad de
radiación emitida. En el espectro de la radiación de fondo detectada, el máximo ocurre
en la frecuencia 160.24 GHz, en la región de microondas. Por esta razón y porque su
origen no se puede asociar a ninguna fuente puntual terrestre o astrofísica, esta radiación
es llamada radiación cósmica de fondo o radiación de fondo de microondas (CMB). Por
su descubrimiento, Penzias y Wilson fueron galardonados en 1978 con el premio Nobel en
Física.
Afortunadamente, trabajos teóricos especialmente de Robert Dicke y Yakov Zel’dovich
habían ya mostrado que la cosmología predice la existencia de la CMB. Para empezar,
consideremos que la radiación del universo puede ser descrita como radiación de cuerpo
negro con temperatura T . Entonces, la densidad de energía (total) independiente de las
frecuencias está dada por
Z ∞
8π 5 kB
4
ρr = dνu(ν) = αT 4 , con α ≡ 3 c3
≈ 4.72 × 10−6 GeV K−4 m−3 (3.232)
0 15h
donde α es llamada constante de densidad de radiación. Como, por otra parte, la ecuación
de Friedmann conduce a ρr = ρ0,r (a/a0 )−4 , encontramos la relación
ρ 1/4 1 T0
0,r
a = a0 ≡ a0 , (3.233)
α T T
entre el factor de escala y la temperatura, donde T0 ≡ (ρ0,r /α)1/4 ≈ 2.726 K define la tem-
peratura de la radiación en nuestra época que, como esperamos, coincide con la medición
de la CMB.
26
En esta sección evitamos el uso de unidades naturales para evitar confusiones.
3.5 Principios relativistas de cosmología 213
λ /cm λ / μm
7.35 0.6 0.3 0.19 0.15 0.12 0.1 10 3 1.67 1.2 0.94 0.75
u (ν )
u (ν )
50 100 150 200 250 300 100 200 300 400
ν /GHz ν /THz
(a) (b)
Figura 3.15: Distribución espectral de radiación de cuerpo negro (a) en microondas con T = 2.726
K y (b) en el infrarrojo distante con T = 3, 090 K.
3/2
x2e 1 2πme kB T
= e−Ei /kB T , ec. de Saha (3.235)
1 − xe 0.76nb h2
27
Formalmente, xe ≡ np /(np + nH ), donde np es la densidad de número de protones (o electrones) y nH
la densidad de número de átomos de hidrógeno.
28
Una derivación detallada y confiable de (3.235) puede encontrarse en la sección 2.3 de S. Weinberg,
Cosmology. Oxford Univ. Press, 2008. Esta ecuación es una aplicación de la ecuación general de Saha, válida
para todos los procesos de ionización en equilibrio.
3.5 Principios relativistas de cosmología 215
donde la densidad de bariones en el universo está dada por nb = n0,b (T /T0 )3 ya que escala
con la temperatura como la densidad de materia (ver (3.196) y (3.233)) y la densidad actual
observada es n0,b ≈ 0.2503 m−3 .
La ecuación de Saha (3.235) sólo puede ser resuelta numéricamente. Sustituyendo xe =
0.1, encontramos que la temperatura de la CMB al tiempo de última dispersión es Trec ≈
3, 090 K, correspondiente mediante (3.233) a zrec ≈ 1, 133 y, de acuerdo a (3.230), a la
época en la que el universo tenía la edad t(zrec ) ≈ 380, 000 años. En la figura (3.15b) se
presenta el espectro de la CMB en el infrarrojo distante, correspondiente al tiempo cuando
fue emitida.
A partir de los datos obtenidos, notamos que zrec < 3, 500 y, por lo tanto, la emisión
de la CMB ocurrió durante la época de dominio de la materia. Por otra parte, dado que
la luz existente antes de esta época desapareció debido a las grandes interacciones que
mantenía con la materia, la CMB es la luz más vieja que podemos observar hoy. Esta
radiación isotrópica forma una esfera alrededor de nosotros llamada la superficie de última
dispersión, delimitando los puntos más distantes que nos es posible observar. Esta es la
información astrofísica más antigua que podemos emplear para entender la evolución de
nuestro universo.
Los valores obtenidos para la temperatura, corrimiento al rojo y tiempo de emisión de
la CMB son del orden de magnitud correcto, pero son sólo valores aproximados. La razón
es que hemos hecho un número de suposiciones. La primera es que el régimen de equilibrio
del proceso (3.234) es válido durante todo el periodo de recombinación, lo cual ciertamente
se viola fuertemente sobre todo al final de esta época. Es decir, la ecuación de Saha (3.235)
debe ser sustituida por una descripción que tome en cuenta las desviaciones del equilibrio.
La segunda es que consideramos que el hidrógeno no tiene estados excitados, de tal forma
que los protones y electrones se combinan directamente en el estado base del hidrógeno, lo
cual tampoco es totalmente correcto.
Un último pero crucial aspecto de la verdadera naturaleza de la CMB es que, contrario
a nuestra suposición, no es del todo isotrópica y homogénea. De hecho, la dinámica cósmica
durante la época de última dispersión es registrada por la CMB, produciendo pequeñas
anisotropías (de una parte en cien mil) que revelan diminutas acumulaciones de materia
aquí y allá, consideradas hoy las semillas de la formación de la estructura (estelar, galáctica,
etc.). El estudio de las anisotropías, por lo tanto, puede revelarnos aspectos de la época de
materia, posterior a la formación de los primeros átomos de hidrógeno. Pero además puede
revelar aspectos del universo anterior a ese tiempo, pues si, por ejemplo, había algún tipo
de ondas gravitacionales primigenias en el plasma de hidrógeno ionizado de los últimos
años de la época de radiación, éstas podrían haber tenido un efecto en la CMB. El estudio
de estos aspectos es, al momento de escribir este texto, investigación en progreso y tema
de grandes debates.
216 Relatividad general y sus aplicaciones básicas
Como hemos mencionado, las mediciones de la CMB han mostrado que es bastante
homogénea. Para lograr esta homogeneidad, sería preciso que, si bien hoy distintas regiones
del cosmos no se encuentran en contacto causal, debieron haber estado en contacto causal en
algún momento del pasado. Por lo tanto, una pregunta natural es ¿qué región del espacio–
tiempo de FRW pudo haber estado en contacto causal antes de la emisión de la radiación
cósmica de fondo al tiempo trec ?
Una pregunta similar es la que resolvimos para el espacio–tiempo de Minkowski en el
contexto de la relatividad especial, en la sección 1.8.2. En ese caso, entendimos que si los
conos de luz de dos puntos del espacio–tiempo se intersecan, entonces los puntos han estado
en contacto causal.
Para repetir este procedimiento en el espacio–tiempo de FRW, es conveniente definir el
tiempo conforme τ por medio de (retomando unidades naturales)
dτ ≡ dt/a(t) . tiempo conforme (3.236)
Lo especial acerca del tiempo conforme es que permite reescribir el intervalo de FRW (3.177)
como (eligiendo dΩ = 0 sin pérdida de generalidad, por la isotropía del espacio–tiempo)29
dr2
ds2 = a2 dτ 2 − dχ2 , con, dχ2 ≡ (3.237)
1 − kr2
que es conformemente equivalente al intervalo de Minkowski, es decir, es equivalente al
intervalo de Minkowski salvo por un factor conforme que, en este caso, es el factor de
escala. Una consecuencia de la forma del intervalo (3.237) es que la trayectoria de la luz
está regida por
dτ = ±dχ , (3.238)
donde el signo + (−) es para rayos de luz que se alejan (acercan). Por lo tanto, los conos de
luz en el plano τ − χ están delimitados por rectas, como en el espacio–tiempo de Minkows-
ki.30 Con esta información, sabemos que, por ejemplo, todos los eventos dentro del cono
de luz sombreado por debajo del punto o en la figura 3.16 están relacionados causalmente
con él.
Llamemos horizonte cosmológico u horizonte de partícula h a la mayor distancia a partir
de la cual un observador puede recibir un rayo de luz emitido en el universo de FRW. Para
un observador al tiempo t, esta distancia está dada por el tiempo conforme total τ (t)
multiplicado por el factor conforme, es decir,
Z τ (t) Z t Z a(t) ′
dt′ da
h(t) ≡ a(t) dτ ′ = a(t) = a(t) , horizonte cosmológico (3.239)
0 0 a(t′ ) 0 a ′2 H ′
29
χ es conocido como coordenada comóvil.
30
En el plano t − r, las trayectorias luminoides son curvas.
3.5 Principios relativistas de cosmología 217
z
1100 10 0.5 0 0.5 10 1100
aquí y ahora
14 1
o
12 0.6
τ /10 9 10
a/a0
8 p q
horizonte actual
6
0.1
4
2 0.01
recombinación
0 0.001
-15 -10 -5 0 5 10 15
χ/10 9
Figura 3.16: Ilustración del problema del horizonte cosmológico. Al momento de su emisión, la CMB
pudo haber sido afectada sólo por los eventos en su horizonte cosmológico. Debido a que la CMB fue
emitida cuando el universo tenía apenas 380, 000 años (z ∼ 1, 100), correspondiente a τ ∼ 0.4 × 109 ,
fotones que nos alcancen desde dos posiciones opuestas en nuestro horizonte cosmológico actual,
χ = p, q, no pudieron haber tenido un pasado común. Por lo tanto, resulta inexplicable que tengan
las mismas propiedades.
donde hemos empleado la definición del parámetro de Hubble, H = ȧ/a. De esta definición,
observamos que h(t) es la mayor distancia entre una partícula y su entorno desde la que
los eventos pueden afectarla al tiempo t. En especial, eventos más allá del horizonte h(t)
al tiempo t no pueden ser observados a ese tiempo, aunque podrían ser observados en el
futuro. Entonces, si o en la figura 3.16 corresponde a nuestra posición en el tiempo pre-
sente, podemos observar todas las partículas y eventos en una esfera con radio h0 ≡ h(t0 ),
pero otro observador distante podría observar otras partículas y eventos. Cada observador
tiene su propio horizonte de eventos. Sólo en la medida en que las observaciones de dos
observadores distantes coincidan aunque sea en una pequeña región (cuando los horizontes
se intersecan) pueden ambos tener una conexión causal.
Por otra parte, conforme pasa el tiempo, incluso horizontes cosmológicos que no se inter-
secan pueden aparecer en el horizonte cosmológico de un observador futuro. Consideremos
con más detalle la situación descrita en la figura 3.16. Dos haces de luz emitidos durante
el periodo de recombinación desde puntos opuestos p y q en la esfera de nuestro horizonte
cosmológico actual pudieron haber sido afectados sólo por los eventos contenidos en sus res-
pectivos horizontes cosmológicos. Debido a que la CMB fue emitida en t = trec ≈ 380, 000
años y arec ≈ 10−3 , entonces τrec ≈ 0.38 × 109 . Como se muestra en la figura, ese tiempo
conforme no es suficiente para que los conos de luz asociados a sus horizontes cosmológicos
se intersequen. Por esta razón, uno esperaría de forma natural que la radiación emitida
desde p y q tenga e.g. temperaturas diferentes. Peor aún: dado que entre p y q hay un
218 Relatividad general y sus aplicaciones básicas
número grande de regiones que no sostienen relación causal, se esperaría un número gran-
de de temperaturas diferentes en la CMB, contrastando con las observaciones. Este es el
problema del horizonte, probablemente el mayor de los problemas del modelo de la gran
explosión.
Para cuantificar este problema, podemos medir cuántas veces cabe el horizonte de la
CMB, medido al día de hoy, en nuestro horizonte cosmológico presente. Dado que dχ no
depende del tiempo en el que se mida, su integral hasta r = rrec tiene el mismo valor que
tuvo durante la época de recombinación. Por lo tanto, escalando ese tamaño con el factor
de escala, encontramos que el horizonte cosmológico de la CMB al tiempo t está dado por
Z χrec Z τrec
h(trec )
hrec (t) = a(t) dχ = a(t) dτ = a(t) . (3.240)
0 0 a(trec )
Expresiones análogas son válidas para otros horizontes cosmológicos antiguos. Claramente,
el horizonte cosmológico actual es mucho más grande que el horizonte cosmológico de
recombinación escalado al día de hoy, tal que h(t0 )/hrec (t0 ) cuenta el número de regiones
en el horizonte actual que estuvieron causalmente desconectadas durante el periodo de
recombinación.
Estimemos el número de regiones que, desde la perspectiva actual, estuvieron desconec-
tadas durante la emisión de la CMB. Para conseguirlo, (sobre)simplificaremos la evolución
del cosmos, suponiendo que hasta que se completó la recombinación el universo estaba
enteramente dominado por radiación y que la evolución posterior se efectuó en un universo
dominado por materia. Además, supondremos que nuestro espacio–tiempo es plano y que la
época de dominio de la energía oscura ha sido tan breve que no ha afectado mucho nuestra
apreciación del pasado (lo cual es falso). Bajo estas suposiciones, el horizonte cosmológico
actual está dado por
Z t0 Z t0
dt 2/3
h(t0 ) = a(t0 ) ≈ t0 t−2/3 dt = 3t0 . (3.241)
0 a(t) 0
Por otra parte, el horizonte cosmológico durante recombinación escalado al día de hoy de
acuerdo a (3.240) está dado por
Z trec r
mat dt 2/3 trec 1/6 2/3
hrec (t0 ) ≈ a (t0 ) rad (t)
= (H0 t0 ) 2 = 2H0 t0 trec 1/2 , (3.242)
0 a H 0
√
donde hemos tomado a = arad ∝ t entre t = 0 y t = trec , mientras que a = amat ∝
t2/3 después de trec . Entonces, el número de regiones desconectadas causalmente durante
recombinación es en nuestra perspectiva
h(t0 ) 3t0
≈ 1/6 2/3
∼ 300 , (3.243)
hrec (t0 ) 2H0 t0 trec 1/2
3.5 Principios relativistas de cosmología 219
en donde hemos reemplazado los valores obtenidos para la edad del universo hoy y cuando
ocurrió la recombinación. Este resultado es problemático porque implica que deberíamos
observar al menos 300 temperaturas diferentes en el CMB que no son detectadas.
Analicemos ahora la fórmula para el horizonte cosmológico (3.239). Al considerar a ∝
t2/3(ω+1)
con 1 − 3ω ≥ 0, notamos que (los factores de proporcionalidad se cancelan y)
3ω + 1 2/3(ω+1) +1−2/3(ω+1) 3ω + 1
h(t) = t t = t. (3.244)
3(ω + 1) 3(ω + 1)
Por otro lado, el inverso del parámetro de Hubble, frecuentemente llamado radio de Hubble
u horizonte de Hubble, para los mismos casos es
3(ω + 1)
H −1 (t) = t. (3.245)
2
Comparando ambos resultados, notamos la interesante relación entre el horizonte cosmo-
lógico y el horizonte de Hubble
h(t) ≈ H −1 (t) . (3.246)
Esta relación conduce a que ambos horizontes sean usualmente empleados de forma in-
tercambiable; sin embargo, esto es incorrecto porque sólo coinciden cuando 1 + 3ω > 0.
Particularmente, difieren para el caso ω = −1 que estudiaremos en la siguiente sección,
cuando a crece de forma exponencial en el tiempo.
En términos de la relación (3.246), podemos reexpresar el problema del horizonte. El
número de veces que cabe hoy el horizonte cosmológico de recombinación en nuestro hori-
zonte actual está dado por
h(t0 ) h(t0 )arec (H0 a0 )−1
= ≈ ≫ 1. (3.247)
hrec (t0 ) a0 h(trec ) (arec Hrec )−1
Es decir, el problema del horizonte es resultado de que (aH)−1 crezca con el tiempo.
Como la curvatura siempre crece, entonces tenemos en estos términos que (3.248) sa-
tisface
d X
d d ä
Ωi − 1 = |k| (aH)−2 = |k| ȧ−2 = −2|k| 3 > 0 . (3.249)
dt dt dt ȧ
i
Dado que en un universo en expansión ȧ > 0, entonces encontramos que el crecimiento de
la curvatura está asociado a la desaceleración de la expansión, ä < 0. Asimismo, a partir de
la primera igualdad, notamos que el problema de planitud se relaciona con el crecimiento
de (aH)−1 con el tiempo. Coincidentemente, este es el origen también del problema de
horizonte, como discutimos al final de la sección previa.
Una propuesta para resolver los problemas de planitud y de horizonte a la vez es
incluir, durante la época de radiación (z > 3, 500), una fase de expansión acelerada en el
universo temprano llamada inflación cosmológica. La primera consecuencia de tal periodo
sería que (aH)−1 decrezca, de tal forma que la curvatura del universo inicial sea diluida.
Simultáneamente, si (aH)−1 decrece, sería posible lograr que las regiones que aparentan hoy
siempre haber estado en desconexión causal hayan tenido un traslape durante el periodo
de expansión acelerada.
Como hemos visto, una forma de satisfacer ä > 0 es permitir que la ecuación de es-
tado del fluido perfecto que describe el contenido del universo esté regida por ω ≈ −1.
Hemos discutido que esta situación ocurre de manera exacta cuando la energía oscura o de
vacío domina el contenido del universo, pero no es la única opción. Desafortunadamente,
por requerir elementos de teoría cuántica de campos, no discutiremos los detalles de los
mecanismos inflacionarios en este texto. Baste decir que es requerido que el universo en
los primeros instantes esté dominado por un campo cuántico llamado inflatón, el que sólo
evoluciona en el tiempo, produciendo una expansión exponencial del universo, a ∝ eHinf t
con Hinf ≈cte, y reduciendo los problemas de planitud y horizonte (entre otros) por un
factor e−Hinf ∆tinf , donde ∆tinf = tfin −tini es la duración de la fase inflacionaria del universo.
Existen diversos modelos de inflación cosmológica, actualmente contrastados con las
observaciones, pero todos conducen a ciertas propiedades comunes. Para resolver los pro-
blemas cosmológicos, la duración de inflación debe satisfacer
Z tfin
a(tend )
Ninf ≡ ln = Hinf dt ≈ 50 − 70 , (3.250)
a(tini ) tini
Los detalles de esta fase también son tema de investigación moderna. Durante el periodo
de inflación, pequeñas fluctuaciones de campos cuánticos pudieron haber sido magnificadas
a tamaños clásicos, produciendo las pequeñas anisotropías de la CMB y las semillas de la
estructura a grandes escalas que observamos.
En esta sección, hemos estudiado algunos de los aspectos más relevantes de la cosmología
directamente a partir de la relatividad general, sin incorporar muchos elementos adicionales
de física estadística y física de partículas. Sin embargo, un tratamiento exhaustivo de
esta área de investigación moderna rebasa los objetivos de este texto. Con la finalidad
de complementar nuestra discusión y como referencia, en la tabla 3.1 se presentan los
principales eventos cosmológicos que, con base en diversos tipos de evidencia (teórica y
experimental), hoy consideramos parte de la historia del cosmos.
La cronología puede dividirse en tres etapas con base en la forma en la que la eviden-
cia ha sido acumulada. La primera etapa comprende el universo temprano, entre t = 0
y t ≈ 10−10 s. En esta etapa es donde existe mayor incertidumbre, ya que hasta ahora
ningún experimento ni observación ha sido capaz de confirmar alguna de las hipótesis y
conjeturas planteadas. Por esta razón, es adecuado decir que es la etapa con más incógnitas
y también la más activa de la cosmología. Todos los eventos de este periodo son conside-
raciones emanadas de modelos de física más allá de la física convencional, aún bajo diseño
e investigación. Salvo por le fase inflacionaria, se cree que la dinámica de la evolución del
universo está dominada por la radiación.
Para
p empezar, se sospecha que la física por debajo del llamado tiempo de Planck,
tP l ≡ ~GN /c5 ∼ 10−43 (que es la unidad de tiempo que se puede formar al combinar
las constantes fundamentales de la naturaleza conocidas), es una mezcla de la relatividad
general con la mecánica cuántica, proveyendo una forma de gravedad cuántica que aún no
es posible descifrar completamente. En esta época, llamada frecuentemente era de Planck,
algunos sospechan que el contenido del universo sostenía una dinámica similar a la descrita
por la teoría de cuerdas o la gravedad cuántica por lazos. Por encima de este tiempo y
hasta aproximadamente 10−36 s, se conjetura que el universo pudo haber evolucionado en
un estado de vacío regido probablemente por campos de una teoría de gran unificación,
en la que todas las fuerzas fundamentales de la naturaleza se comportan como una sola
gran fuerza. El campo del inflatón comienza a tener un peso importante en la evolución
del universo alrededor de 10−34 s, cuando su energía cinética y potencial se combinan para
dar lugar a una expansión cuasi-exponencial. Al término de la inflación, cuando el universo
multiplicó su tamaño por un factor ∼ 1026 en apenas 10−32 s, los valores del campo del
inflatón comienzan a oscilar, acumulando una enorme energía que es finalmente emitida
al universo en forma de radiación ultra-energética. La radiación eleva la temperatura del
universo hasta temperaturas tan altas como 1026 K, por lo que denominamos a este proceso
222 Relatividad general y sus aplicaciones básicas
Cuadro 3.1: Cronología de eventos según el modelo ΛCDM o de la gran explosión. Los eventos del
recuadro superior son hipotéticos y están basados en diversos modelos más allá del modelo estándar
de partículas. Los eventos en el segundo recuadro se basan en la física de partículas ya verificada.
Los eventos del recuadro inferior están basados en observaciones astrofísicas. ρ indica la especie
que domina cada época: inflatón ρinf , materia ρm , radiación ρr y energía oscura ρΛ . z se refiere al
corrimiento al rojo gravitacional debido a la expansión del universo.
recalentamiento. Las transformaciones continuas entre fotones y materia dan, a su vez, lugar
a todas las partículas (y antipartículas) del modelo estándar de partículas elementales y,
en caso de confirmarse, de los modelos supersimétricos. El universo continúa su expansión
dominado por esa radiación, enfriándose paulatinamente. Poco antes de que el universo
tenga 10−10 s de edad, ocurre el proceso de bariogénesis, en el que la violación del equilibrio
termodinámico combinada con una mínima violación de conservación de carga eléctrica,
paridad y de cantidad de materia, conduce al dominio de la materia sobre la antimateria.
La segunda etapa de evolución cosmológica está basada en la física de partículas cono-
cida; esta etapa seguramente ocurrió cuando el universo tenía entre t ≈ 10−10 s y t ≈ 200 s,
y está dominada por partículas ultrarrelativistas, descritas como radiación. Entendemos los
eventos de esta época bastante bien gracias a experimentos en colisionadores de partículas
que permiten conocer la dinámica de las partículas elementales a muy altas temperaturas.
3.5 Principios relativistas de cosmología 223
106 años se le llama época oscura. Las primeras estrellas y cuásares se forman al concluir la
época oscura mediante la acumulación gravitacional de grandes cantidades de hidrógeno,
emitiendo fotones con suficiente energía para ionizar los átomos de hidrógeno libres en
las cercanías de los astros. Como resultado de este proceso conocido como reionización,
el contenido del universo se convierte en un plasma que perdura hasta que el universo
alcanza la edad de 109 años. A esa edad cosmológica, las diferentes estrellas, regidas por
concentraciones de materia oscura, comienzan a formar galaxias que poseen en sus núcleos
las primeras estrellas muertas convertidas en agujeros negros. Las galaxias se expanden y
distribuyen, atrayendo polvo estelar que formará cuerpos celestes sin brillo propio, tales
como los planetas, planetoides, asteroides, etc. Hace casi 6 × 109 años, la disminución
continua de ρm consiguió que la energía oscura comience a dominar; desde entonces la
expansión del universo es cada vez más veloz. Aproximadamente mil millones de años más
tarde se formó nuestro sistema solar y otros parecidos.
Ejercicios
3.1 Límite Newtoniano.
Suponga un espacio–tiempo Newtoniano con coordenadas cartesianas xa = (t, xi ). En el formalismo
Newtoniano la métrica es plana, pero las partículas masivas sienten una fuerza generada por el
potencial gravitacional φ(x) y la aceleración de una partícula masiva está dada por a = −∇φ.
(a) Muestre que una partícula masiva en caída libre se mueve a lo largo de una curva xa = xa (λ)
que satisface
2
d2 t d2 xi ∂φ dt
= 0, + = 0.
dλ2 dλ2 ∂xi dλ
(b) De las ecuaciones anteriores identifique las componentes de la conexión Newtoniana (símbolos
de Christoffel).
(c) Utilizando los resultados del inciso anterior, deduzca que
∂2φ
Rj 0k0 = −Rj 00k =
∂xj ∂xk
y todas las demás componentes se anulan.
(d) Analice las simetrías que deberían tener las componentes de R abcd . ¿Puede la conexión New-
toniana ser obtenida a partir de una métrica?
3.2 Ecuaciones de Einstein y constante cosmológica.
La forma más general de las ecuaciones de campo de Einstein
(a) Si reescribimos (3.251) de la forma Gµν = Λgµν +8πTµν , podemos definir un tensor de energía–
Λ
momento efectivo asociado a la constante cosmológica como Tµν ≡ Λgµν /8π. Muestre que
3.5 Principios relativistas de cosmología 225
en ese caso la constante cosmológica se puede interpretar como un “fluido perfecto” uniforme
con densidad de energía ρ = Λ/8π y ecuación de estado P = −ρ. Es decir, la constante
cosmológica se puede asociar con la energía del vacío.
(b) ¿Qué significa físicamente que la presión del vacío P sea negativa?
3.3 Preguntas conceptuales.
Considere dos observadores fijos localizados cerca de un agujero negro de Schwarzschild de masa
M . Un observador localizado en r1 = 3M , emite un pulso de luz violeta (λ = 400 nm) a un segundo
observador localizado en r2 = 8M . ¿De qué color es el pulso para el observador localizado en r2 ?
¿Qué tipo de corrimiento al rojo se observaría si el segundo observador se localizara en el radio de
Schwarzschild?
3.4 Solución de Schwarzschild.
La solución de Schwarzschild es una solución exacta de las ecuaciones de Einstein en el vacío que
es estática y esféricamente simétrica. El elemento de línea está dado por
" −1 #
2M 2M
ds2 = 1 − dt2 − 1− dr2 + r2 dθ2 + r2 sen2 θdϕ2 .
r r
(a) Para la métrica anterior, encuentre (con un cálculo explícito) los 9 símbolos de Christoffel
diferentes de cero.
(b) Muestre que para una métrica gµν cuyas componentes son independientes de la coordenada
µ
x0 , entonces q0 ≡ g0µ dx
dτ es constante a lo largo de una trayectoria geodésica, i.e. muestre
que se satisface
dq0
= 0.
dτ
(c) Considere nuevamente el caso particular de la métrica de Schwarzschild. Muestre que en el
límite no relativista y para movimiento radial en un plano, en el punto θ = π/2 y ϕ = ϕ0 =
cte, la cantidad conservada adopta la forma
2
dxµ M m m dr
m g0µ ≈m− + + ··· .
dτ r 2 dt
ξµ;ν + ξν;µ = 0,
226 Relatividad general y sus aplicaciones básicas
de donde es posible concluir que a lo largo de curvas geodésicas la siguiente cantidad se conserva
pµ ξµ = cte.
Consecuentemente, en relatividad general, los vectores de Killing permiten definir leyes de conser-
vación (asociadas a simetrías del espacio–tiempo).
Determine los vectores de Killing para las cantidades conservadas del problema anterior.
3.6 Preguntas conceptuales.
(a) ¿En qué sistemas sometidos a la acción gravitacional es válida la relatividad especial?
(b) Un astrofísico reporta en un artículo con datos bastante precisos que la teoría de Einstein
tiene un grave error porque predice resultados incorrectos para un objeto estelar cónico. Lo
eligieron a usted como árbitro del artículo. ¿Considera que es un artículo aceptable o no?
Justifique.
(c) ¿Cuáles son las diferencias principales entre un agujero negro de Schwarzschild y uno de Kerr?
3.7 Agujero negro de Schwarzschild.
de Schwarzschild está determinada por el intervalo (3.71). Definimos aquí A(r) =
La métrica
1 − 2M
r .
(a) Como se determinó en el ejercicio 3.5, las cantidades ǫ = A(r)dt/dτ y ℓ = −r2 sen2 θ dϕ/dτ
son constantes de movimiento. Debido a una simetría adicional, el movimiento está confinado
a un plano, que puede ser elegido como el plano ecuatorial θ = π/2. Escriba ds2 en términos
de ǫ, ℓ, A(r), (dr/dτ )2 y dτ .
ν
dxµ
(b) Muestre que e ≡ gµν dx
dτ dτ es constante a lo largo de una geodésica.
(c) Un observador cae radialmente hacia un agujero negro de Schwarzschild con velocidad inicial
dr/dτ = u0 a una distancia R del centro del agujero negro. Exprese la constante ǫ en esa
trayectoria en términos de M , R y u0 .
(d) Calcule la 4–velocidad U µ del observador cayendo, como función de ǫ, R y M .
(e) ¿Cuál es el tiempo propio que le toma al observador alcanzar el horizonte en r = 2M ? (Por
simplicidad, considere ǫ = 1.)
3.8 Órbitas luminosas en un agujero negro de Schwarzschild.
El movimiento de fotones en las cercanías de un agujero negro estático puede determinarse a partir
del intervalo de Schwarzschild (3.71), imponiendo ds2 = dτ 2 = 0, y analizando las ecuaciones
de conservación, como hemos hecho en el texto, o las trayectorias geodésicas. Exploremos aquí la
segunda opción.
1. Muestre que la ecuación radial de la geodésica para una órbita circular en el espacio–tiempo
de Schwarzschild conduce a la dinámica angular dada por
2
dϕ rs
= ,
dt 2r3 sen2 θ
Concluya que el radio de las órbitas circulares tienen radio 3rs /2.
3.9 Movimiento uniformemente acelerado, coordenadas de Rindler y agujeros negros.
Chana se sube a una nave espacial y parte de la Tierra desplazándose rectilíneamente con aceleración
propia α ∼ 10 m/s2 .
(a) Encuentre cuánto tiempo medirá un observador terrestre que le toma a la nave alcanzar la
velocidad 0.999c. ¿Cuánto tiempo mide Chana?
(b) ¿Cuánto tiempo tardará la nave en viajar 30,000 años luz para un observador terrestre y
para Chana? ¿Qué tanto envejecería Chana si viajara a la galaxia Andrómeda, a 2 millones
de años luz de la Tierra?
(c) Con base en las ecuaciones obtenidas para los tiempos y la posición de objetos acelerados, se
definen las coordenadas de Rindler en dimensión 1 + 1 como
1
t= ρ senh(αξ), x = ρ cosh(αξ), coordenadas de Rindler (3.252)
c
las cuales representan el sistema coordenado usado por un observador acelerado con acelera-
ción propia α.
Demuestre que el elemento de línea de las coordenadas de Rindler es
(d) Considere trayectorias puramente radiales en un espacio de Schwarzschild (con dθ2 = dϕ2 =
0). Demuestre que muy cerca del horizonte de sucesos de un agujero negro de Schwarzschild,
i.e. cuando r ≈ 2M , las coordenadas de Rindler son una buena aproximación a las coordena-
das de Schwarzschild. ¿Cuánto vale la aceleración propia en este caso? (Sugerencia: realice el
cambio de variable σ 2 /8M = r − 2M , de tal manera que cuando r → 2M , entonces σ → 0.
Quizá le sea útil la aproximación (Ax)2 /(1 + (Ax)2 ) ≈ (Ax)2 .)
3.10 Solución de De Sitter.
Considere las ecuaciones de Einstein en el vacío con constante cosmológica distinta de cero, tal que
1
R µν − Rgµν − Λgµν = 0.
2
(a) Encuentre el escalar de curvatura R en este caso.
(b) En unidades naturales, considere una métrica con simetría esférica, i.e. una métrica de la
forma
ds2 = a(r)dt2 − b(r)dr2 − r2 dθ2 − r2 sen2 θdφ2 .
Encuentre las cuatro componentes diferentes de cero del tensor de Einstein Gµν .
228 Relatividad general y sus aplicaciones básicas
(c) Resuelva las ecuaciones de Einstein con constante cosmológica y muestre que
ds2 = (1 − Λr2 /3)dt2 − (1 − Λr2 /3)−1 dr2 − r2 dθ2 − r2 sen2 θdφ2 . (3.254)
x2 + y 2 + z 2 + u2 + v 2 = a2 , (3.255)
(a) Utilizando la expresión genérica para el elemento de línea, ds2 = gµν dxµ dxν , halle a partir
de la métrica de FRW las componentes de la métrica.
(b) Determine los símbolos de Christoffel. Para simplificar la notación, a las derivadas de a con
respecto a t denótelas como ȧ.
3.5 Principios relativistas de cosmología 229
(c) Muestre que las componentes no nulas del tensor de Ricci son R00 y Rij (donde i, j = 1, 2, 3)
y que éstas están dadas por
ä ä ȧ2 k
R00 = −3 , Rij = − + 2 2 + 2 2 gij ,
a a a a
donde ä denota la segunda derivada de a respecto a t.
(d) Utilizando las expresiones del inciso anterior y la métrica, muestre que el escalar de curvatura,
o escalar de Ricci, está dado por
ä ȧ2 k
R = −6 + 2+ 2 .
a a a
(e) Con los resultados anteriores halle las componentes no nulas del tensor de Einstein Gµν =
Rµν − 21 gµν R.
(f) Escriba explícitamente las ecuaciones de Einstein Gµν = 8πTµν .
(g) Una de las ecuaciones de Einstein que debió obtener en el inciso anterior es
ȧ2 k 8π
+ 2 = ρ.
a2 a 3
Muestre que en términos del parámetro de Hubble, definido como H ≡ ȧ/a y del cociente
Ω ≡ ρ/ρc , donde ρ es la densidad energética del contenido del universo y ρc ≡ 3H 2 /(8π) la
llamada densidad crítica del universo, la ecuación anterior se puede escribir como
k
= Ω − 1,
H 2 a2
que es conocida como la ecuación de Friedmann.
3.13 Fluido perfecto en el límite Newtoniano.
Como se vio en un problema anterior, la ecuación de la geodésica se puede considerar como una
generalización de la segunda ley de Newton. No obstante, podemos preguntarnos qué es lo que ocurre
en el sentido contrario, es decir, ¿qué ocurre con la ecuación geodésica en el límite Newtoniano?
(b) En el límite Newtoniano (con rapidez local u ≪ c y τ = t), obtenga la expresión para
dxα dxβ
Γµ αβ .
dτ dτ
(c) Utilice la aproximación de campo débil,
gµν = ηµν + εhµν ,
donde hµν es una pequeña desviación de la métrica independiente del tiempo y ε ≪ 1 para
mostrar que (3.257) se reduce a
(U µ ,t + U µ ,i v i ) + εη µσ (φ),σ = 0.
230 Relatividad general y sus aplicaciones básicas
(d) Muestre en este límite para la componente espacial µ = i que la ecuación anterior implica la
ecuación de Euler para un fluido en presencia del potencial gravitacional φ.
∂t v + v · ∇v + ∇(εφ) = 0.
Tanto las ecuaciones de Maxwell como las ecuaciones linealizadas de Einstein tienen soluciones
dadas como ondas propagándose a la velocidad de la luz. La solución de onda plana en el vacío es
donde Aµν y kα son las componentes de un tensor y un vector constante, respectivamente, llamados
tensor de polarización y vector de onda.
(a) Muestre que la solución de onda plana es solución a φµν = 0 siempre y cuando
kα k α = 0 y Aµν kµ = 0. (3.258)
p
Esto quiere decir que k 0 = ω = k, donde k = k12 + k22 + k32 , lo que nos dice que la onda
gravitacional se propaga a la velocidad de la luz.
(b) Sin pérdida de generalidad, suponga que la onda se mueve en la dirección x3 , es decir (k α ) =
(ω, 0, 0, ω). Muestre que la condición (3.258) y el requisito de que hµν sea simétrico implica
que sólo existen 6 polarizaciones independientes.
(c) Dos de las polarizaciones independientes pueden ser
0 0 0 0 0 0 0 0
0 1 0 0 0
(Aµν
+ ) = 0 0 −1 0 ,
(Aµν 0
× ) = 0
0 1 .
1 0 0
0 0 0 0 0 0 0 0
Muestre que estas polarizaciones no tienen traza y son transversales a la dirección de propaga-
ción. La afirmación aquí es que estas dos polarizaciones son las únicas entre las polarizaciones
independientes que pueden transportar energía y momento.
Apéndice A
y extremizándola.
Z τ
δτ 1 δ dxµ dxν
c α = q α
g µν dλ
δx 0 2 g dxµ dxν δx dλ dλ
µν dλ dλ
Z τ
1 δgµν dxµ dxν d δxµ dxν dxµ d δxν
= q + gµν + gµν dλ
0 2 g dxµ dxν δxα dλ dλ dλ δxα dλ dλ dλ δxα
µν dλ dλ
Z τ
1 δxβ dxµ dxν d δxµ dxν dxµ d δxν
= q gµν,β α + gµν + gµν dλ.
0 2 g dxµ dxν δx dλ dλ dλ δxα dλ dλ dλ δxα
µν dλ dλ
(A.4)
232 Ecuación de la geodésica utilizando el principio de mínima acción
Integrando por partes los últimos dos términos, bajo la suposición de que xµ y gµν se anulan
para λ muy grande (en las fronteras de λ), encontramos
Z τ µ ν β Z τ
δτ dλ dx dx δx d 1 ν
dx δxµ
c α = q gµν,β − dλ q g µν
δx 0 2 g dxµ dxν dλ dλ δxα 0 dλ 2 g dxµ dxν dλ δxα
µν dλ dλ µν dλ dλ
Z τ
d 1 dxµ δxν
− dλ q gµν .
0 dλ 2 g dxµ dxν dλ δxα
µν dλ dλ
(A.5)
q p
µ dxν
Escogemos ahora λ = τ =⇒ gµν dx
dλ dλ = gµν U µ U ν = c, lo que implica
Z
δτ 1 τ ′ µ ν δx
β d ν δx
µ d µ δx
ν
c α = dτ gµν,β U U − (gµν U ) α − ′ (gµν U ) α
δx 2c 0 δxα dτ ′ δx dτ δx
Z τ β
1 d d δx
= dτ ′ gµν,β U µ U ν − (gβν U ν ) − (gµβ U µ )
2c 0 dτ dτ δxα
Z
1 τ ′ µ ν µ ν dU ν ν µ dU µ δxβ
= dτ gµν,β U U − gβν,µ U U − gβν − gµβ,ν U U − gµβ
2c 0 dτ dτ δxα
!
= 0.
(A.6)
Para extremizar esta derivada, el integrando debe ser cero, lo cual ocurre para
1 1 dU ν 1 dU µ
(−gνµ,β + gβν,µ + gµβ,ν ) U µ U ν + gβν + gµβ =0
2 2 dτ 2 dτ
dU µ 1
⇐⇒ g αβ gβµ + (gµβ,ν + gβν,µ − gµβ,ν ) U µ U ν =0
dτ 2 (A.7)
dU α 1 αβ
⇐⇒ + g (gµβ,ν + gβν,µ − gµβ,ν ) U µ U ν =0
dτ 2
U µ U α ,µ + Γα µν U µ U ν =0.
La última ecuación coincide con la ecuación de la geodésica. Entonces, hemos obtenido que
la ecuación de la geodésica describe la trayectoria a lo largo de la cual el tiempo y longitud
propia son extremales.
Apéndice B
Rαβµν es tensor
Como se dijo anteriormente, Rα βµν son las componentes de un tensor y, por lo tanto,
deben transformarse apropiadamente bajo difeomorfismos, de acuerdo a
′
α′ ∂xα ∂xβ ∂xµ ∂xν α
R β ′ µ′ ν ′ = R βµν .
∂xα ∂xβ ′ ∂xµ′ ∂xν ′
Para demostrar que es así, empecemos por la propiedad de transformación de la conexión
afín, ecuación (2.241),
′ ′
µ′ ∂xµ ∂xα ∂xν µ ∂xα ∂xν ∂ 2 xµ
Γ α′ ν ′ = Γ αν − , (B.1)
∂xµ ∂xα ∂xν
′ ′
∂xα′ ∂xν ′ ∂xν ∂xα
lo que puede resolverse para la segunda derivada como
′ ′ ′ ′
∂ 2 xµ ∂xα ∂xν µ′ ∂xµ µ
= − Γ α ′ν′ + Γ αν , (B.2)
∂xν ∂xα ∂xα ∂xν ∂xµ
′ ′
∂xα ∂xν
donde hemos multiplicado por ∂xα y ∂xν en la izquierda y realizado las sumas de (B.1).
Ahora podemos obtener una derivada de (B.2) con respecto de xλ
′ ′ ′
∂ 3 xµ ∂ 2 xµ µ ∂xµ γ
= Γ αν + Γ αν,λ
∂xλ ∂xν ∂xα ∂xλ ∂xµ ∂xγ !
′ ′ ′ ′ ′ ′ ′
∂ 2 xα ∂xν ∂xα ∂ 2 xν µ′ ∂xα ∂xν ∂xλ µ′
− + Γ α′ ν ′ − Γ α′ ν ′ ,λ′ .
∂xλ ∂xα ∂xν ∂xα ∂xλ ∂xν ∂xα ∂xν ∂xλ
(B.3)
con constante cosmológica Λ. Aquí Rαβ denota las componentes del tensor de Ricci (2.329)
y g αβ las componentes del tensor métrico inverso; κ = 8π en unidades naturales, |g| es
el determinante de la métrica, y LM es la densidad Lagrangiana que describe la materia
del sistema que depende, en general, de campos p que no aparecen en la primera integral.
Como explicamos en la sección 2.10, el término −|g| es requerido para que la integral sea
covariante relativista, donde el signo negativo surge del hecho de que, en el espacio–tiempo,
la métrica corresponde a un producto escalar que no es positivo-definido.
El principio variacional establece que las ecuaciones de movimiento pueden obtenerse
extremizando la acción, es decir, cuando se satisface
δS = 0 . (C.2)
donde hemos usado la definición del escalar de Ricci (2.330) y la de las componentes del
236 Ecuaciones de Einstein y la acción de Einstein-Hilbert
Por otra parte, variando la identidad (2.63), g αβ gβγ = δβα , encontramos que
lo que conduce a
δg αβ
δg αη = −g αβ δgβγ g γη =⇒ = −g αµ g νβ . (C.7)
δgµν
δLM
T µν = 2 − g µν LM . (C.9)
δgµν
Por último, calculamos la variación del tensor de Ricci. Para lograrlo, lo expresamos en
términos de las componentes del tensor de Riemann, mediante Rαβ = Rγ αγβ , y empleamos
la expresión de las componentes del tensor de Riemann en términos de la conexión de
Christoffel (2.309). De esta forma, encontramos que
γ
δRαβ δΓ αβ δΓγ ηβ η δΓη αγ
= − Γ αγ − Γγ ηβ
δgµν δgµν ,γ δgµν δgµν
γ (C.10)
δΓ αγ γ
δΓ ηγ η γ δΓη αβ
− + Γ αβ + Γ ηγ .
δgµν ,β δgµν δgµν
237
Por otro lado, las derivadas covariantes de las variaciones δΓγ αβ y δΓγ αγ se pueden escribir
mediante (2.213) como
Esta información aplicada a ambas variaciones en (C.11) y combinada con la variación del
tensor de Ricci (C.10), conduce a
δRαβ
g αβ δgµν = Dγ g αβ δΓγ αβ − Dβ g αβ δΓγ αγ = Dγ g αβ δΓγ αβ − g αγ δΓβ αβ . (C.13)
δgµν
porque se trata de una derivada total y, como tal, de un término de superficie que se anula
si consideramos la frontera del espacio–tiempo al infinito.
Finalmente, notamos que para que la variación de la acción (C.8) sea cero para cualquier
δgµν , es preciso que se satisfaga
1
Rµν − g µν (R + 2Λ) = κT µν , ecuaciones de campo de Einstein (C.15)
2
con T µν dado por (C.9), que coincide justamente con las ecuaciones de campo de Einstein.
238 Ecuaciones de Einstein y la acción de Einstein-Hilbert
Índice alfabético
variedad, 118
pseudo-Riemanniana, 121
Riemanniana, 118
vector de Killing, 138
en espacio–tiempo plano, 139
vector de Poynting, 101
vectores, 69
invariancia, 71
propiedades de, 69
vectores duales, 74
velocidad de recesión, 203
velocidad propia, 23
virtual, partícula, 59