RT Optica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 152

ÓPTICA

Irene López Pinar


Universidad de Zaragoza
Curso 2022/2023
1
Fundamentos: difracción, coherencia e interferencias
1. Introducción
Según la teoría geométrica, la luz está compuesta por rayos que siguen trayectorias bien
definidas en el espacio. Conforme a esto, esperaríamos una separación bien definida al
observar la luz y la sombra detrás de un diafragma o un obstáculo.

Sin embargo, esta separación entre luz y sombra no es nítida, apareciendo máximos y
mínimos de intensidad que no predice la teoría geométrica. Estos fenómenos, que se
manifiestan más cuanto menor es el tamaño del diafragma u obstáculo, se denominan
fenómenos de difracción y son causa de la naturaleza ondulatoria de la luz.
Notar aquí que el tamaño es relativo a dos aspectos:

• Según la distancia del emisor y pantalla del diafragma u obstáculo.


• Según el tamaño del diafragma u obstáculo frente a la longitud de onda.
En el primer caso distinguiremos la difracción de Fraunhofer (lejos) o la de Fresnel
(cerca). En el segundo caso, asumiremos siempre tamaños por encima de la longitud de
onda, pues por debajo de la misma los fenómenos son mucho más extraños
(descubiertos recientemente).1

2. La luz como una onda: El principio de Huygens

Según este principio, un frente de onda  progresa como si cada uno de sus puntos
emitiera ondas esféricas elementales, siendo la posición ´ del frente de onda al cabo
de un tiempo t la envolvente de dichas ondas elementales. El problema que
presentaba este principio era que implicaba la aparición de una onda de retroceso ´´
además de la onda ordinaria ´, lo que estaba en contra de la experiencia.

2.1 Principio de Huygens-Fresnel


Fresnel introdujo modificaciones en el principio de Huygens suponiendo que las ondas
secundarias podían propagar la perturbación en todas las direcciones, pero con una

1
Ejemplos cotidianos también son cuando observamos bombillas a distancia y vemos imágenes
estrelladas por difracción en el borde del iréis del ojo, o los halos de luz de un día de niebla por
difracción en las gotas de lluvia.
amplitud que debería ser máxima en la dirección normal a la envolvente y disminuir
con un factor de oblicuidad f () que debía ser nulo para   π/2. Con este principio
(llamado de Huygens-Fresnel) se evitaba el problema de la onda de retroceso.

Principio de Huygens Principio de Huygens-Fresnel


La formulación matemática de este principio la llevó a cabo Kirchhoff, y para ello,
introdujo la llamada teoría escalar que vamos a resumir a continuación.

2.2 Teoría escalar


Por la naturaleza electromagnética de la luz y el carácter eléctrico de la materia, los
fenómenos de difracción se deben a la interacción de la luz con los electrones del
diafragma y del borde de la abertura, pues entran en vibración forzada y radian luz de
igual frecuencia y coherente con el incidente.
Los electrones del diafragma son reflejados (si es opaco) pero la luz de los del borde si
que es emitida y es esta la que explica la interferencia entre la luz que pasa y la emitida
en los bordes (notar que los agujeros realmente pequeños llegan a comportarse como
emisores por este motivo).
El problema es que tratar esta teoría de forma vectorial resulta muy complejo y no es
necesario si la fuente y el lugar de observación están alejados del obstáculo difractor
y si la abertura tiene dimensiones muy grandes en comparación con la longitud de
onda. Con esta idea, en la aproximación escalar asumimos que la luz (el campo eléctrico)
es una variable escalar que satisface la ecuación de ondas:

Así, la intensidad en un punto del espacio es proporcional a |𝜉|2 , sin tener en cuenta la
constante, pues simplemente conoceremos la figura de difracción de forma relativa. De
hecho, asumiendo aberturas suficientemente grandes, diremos que el efecto del borde
es despreciable y simplemente analizaremos la emisión de cada punto de la abertura
como emisor puntual (Principio de Huygens) y hallaremos la resultante interferencial
en los puntos de la pantalla de observación.
3. Teorema de Kirchhoff

Cada uno de los puntos de la fuente luminosa (representados genéricamente por S en


la figura) emite una onda esférica que es difractada por la abertura (amarilla) y produce
en un punto genérico P un campo eléctrico que queremos calcular.
La suma de los campos eléctricos debidos a los diferentes puntos de la fuente
proporciona el campo eléctrico difractado total. Notar que como hemos indicado antes,
no consideramos el efecto del borde.
El campo total es:

Que es la expresión matemática del teorema de Kirchhoff.


Dem.
Asumamos que los campos eléctricos de la apertura tienen la forma (no consideramos
el carácter vectorial del campo, teoría escalar):

Con la amplitud compleja:

Con ello tratamos de hallar la amplitud compleja resultante en un punto P del espacio,
a priori se comprende que será necesario conocer las posiciones de las fuentes, así como
las amplitudes y fases con que emiten. Pero puede también resolverse este problema si
se conoce Ec en los puntos de una superficie cerrada cualquiera, Σ, que contenga en su
interior al punto P, pero no contenga a ninguna de las fuentes, siempre que se conozcan
también las derivadas de Ec respecto al normal exterior a Σ en todos los puntos de Σ.
Para demostrarlo vamos a emplear el teorema de Green que dice que, si U y V son dos
funciones escalares continuas, con derivadas parciales primeras y segundas continuas
en los puntos de una superficie cerrada y del volumen que encierra, se cumple la
expresión:

Para aplicar el teorema definimos las funciones U y V:

Tengamos en cuenta además que la función U así definida presenta una singularidad en
el origen P, donde se hace infinita. Esta singularidad es evitable y basta para ello excluir
a P del dominio de integración por medio de una esfera Σ' de centro P y radio ρ tan
pequeño como se quiera. La superficie sobre la que habrá que integrar ahora será Σ+Σ'.
Para resolver las integrales, primero calculemos las expresiones:

La primera se puede obtener de la ecuación de ondas:

La segunda la obtenemos aplicando la simetría radial que presenta U:


Con esto vemos que el miembro de la izquierda de la igualdad se anula, y el miembro de
la derecha lo podemos escribir como:

Primero calculamos B, que es la integral sobre la superficie de la esfera que engloba a P.


Hacemos la sustitución:

Donde omega es el ángulo sólido que contiene a la superficie desde P. Y, por otra parte,
teniendo en cuenta el origen del radio ro:

Obteniendo:

Si hacemos tender a cero el radio (para conseguir el campo en el punto P) nos queda:

Ahora si volvemos a la igualdad A+B=0 podemos ver que A=-B y, por tanto, sustituyendo:

Que es la expresión matemática del teorema de Kirchhoff.


QED.
3.1 Aplicación del teorema de Kirchhoff al caso de una sola fuente puntual
Podemos escribir el resultado de Kirchhoff cuando S es una fuente emisora puntual y
tratamos de hallar el campo en P:

Esta expresión se llama integral de Kirchhoff y como se ve es simétrica respecto a la


fuente y al punto donde se calcula la amplitud, lo que tiene la lógica interpretación física
de que, supuesta la fuente en P, en S se obtendría la misma amplitud que ahora se
obtiene en P.
Dem.

Tomemos una superficie de integración cualquiera, Σ. En los puntos de Σ a distancia rs


de S, la amplitud compleja de la vibración será:

Para aplicar el teorema de Kirchhoff tenemos en cuenta:

Si la superficie Σ se toma de tal modo que rs y r son grandes comparadas con λ, lo que
implica que S y P estén suficientemente distanciados, y se tiene en cuenta que k = 2π/
λ, los primeros términos en los paréntesis de los segundos miembros (las fracciones que
llevan r al cuadrado en el denominador) pueden despreciarse. Entonces podemos
escribir el resultado de Kirchhoff:

QED.
3.2 Aplicación de la integral de Kirchhoff a la difracción

Para obtener la expresión del campo eléctrico de la luz difractada por una abertura, se
forma la superficie σ con la abertura y la chapa que contiene a la abertura (suponiendo
que llega hasta el infinito), además de una superficie esférica de radio infinito centrada
en el punto P.
Hacemos las suposiciones:

• Detrás de la chapa no hay campo eléctrico porque ésta es opaca.


• Despreciamos el efecto del borde porque la apertura es suficientemente grande.
• En la superficie esférica no hay campo eléctrico porque la luz necesitaría un
tiempo infinito para llegar a ella.
En consecuencia, solamente contribuye la superficie σ a la integral de Kirchhoff, luego
tomando la integral de Kirchhoff:
− i k ( r + rs )
ikA e
4  rrs
EcP =  cos( N , r ) − cos( N , rs )  d 

Sustituimos los valores:

− i k ( r + rs )
ikA e
4  rrs
EcP = (cos  + cos  ) d

*Notar que el signo de theta cambia y es porque tomamos justo el ángulo opuesto.

3.3 Principio de Huygens-Fresnel (matemáticamente)


Este principio se puede demostrar reorganizando la expresión del teorema de Kirchhoff
correspondiente a una fuente puntual, que indica que la luz se propaga de S a  como
onda esférica (término 1º) desde  a P también como onda esférica (término 2º) y
además queda afectada por un factor de oblicuidad (término 3º para =0) que depende
de  . La integral supone la contribución, al campo eléctrico en P, de todas las ondas
secundarias que parten de  . El factor de oblicuidad f () disminuye desde =0 y vale
cero para =π.
Tomamos la expresión anterior:
− i k ( r + rs )
ikA e
4  rrs
EcP = (cos  + cos  ) d

Y reorganizamos:

A e−i k r  ik 
EcP =  ( e−ikrs )   (1 + cos  )  d
 r
s r  4 

4. Difracción de Fresnel y de Fraunhofer

Si S, D y P son respectivamente la fuente puntual de luz, el diafragma refractor y el punto


donde queremos calcular la amplitud, será necesario que en la integral de Kirchhoff
calculemos la suma rs+r que aparece en el exponente.
− i k ( r + rs )
ikA e
4  rrs
EcP = (cos  + cos  ) d

Entonces supongamos el diafragma plano y tomemos origen de coordenadas en un


punto O del plano del diafragma con ejes xi y eta en el plano. Entonces las coordenadas
de S son xs,ys,zs y las de P son xp,yp,zp.
Podemos escribir:

rs 2 = ( xs −  ) 2 + ( ys − ) 2 + zs 2

Luego llamando a la distancia SO por ls:


ls 2 = xs 2 + ys 2 + zs 2
Obtenemos:
1/ 2
 2( xs + ys )  2 +  2 
rs = ls 1 − + 
 ls 2 ls 2 

Si suponemos que las dimensiones lineales del diafragma son pequeñas comparadas con
las distancias de P y S a su plano (,  << ls), podríamos desarrollar en serie de potencias:

xs + ys
rs  ls −
ls
Y hacer exactamente lo mismo para el punto P:

x p + y p
r l−
l
Si tenemos ahora en cuenta los cosenos directores de los vectores que van desde S hasta
O y desde O hasta P, se obtiene una expresión final para rs+r:

( − xs / ls , − ys / ls , − zs / ls ) = ( s ,  s ,  s )
( xP / l , y P / l , z P / l ) = ( P ,  P ,  P )
rs + r  (ls + l ) + ( s −  P ) + (s −  P )

Es muy importante que en todo este desarrollo lo hemos hecho partiendo de que l s y l
están a una distancia infinita del diafragma, y eso nos ha permitido poder despreciar
los términos cuadráticos y en delante de la serie de Taylor. Esto es lo que se llama
difracción de Fraunhofer que es el más corriente y sencillo de tratar de los problemas
ópticos.
Cuando ls o l son finitos (o al menos uno de ellos), entonces contribuyen a la fase los
términos de segundo grado y más altos órdenes y el fenómeno recibe el nombre de
difracción de Fresnel.

4.1 Difracción de Fraunhofer


Teniendo en cuenta que para ls y l grandes (que implica que las ondas procedentes de S
llegan al diafragma como planas) podemos considerar ,  constantes (notar que los
ángulos son prácticamente iguales para todos los rayos QP siempre que los puntos P
estén próximos al eje) y 1/rrs también (pues el factor rsr indica la reducción de la
amplitud de las ondas esféricas con la distancia y varia muy poco para los distintos
puntos de la pantalla).
Por otra parte, A/rs = Ec en la abertura, se encuentra la expresión que permite el cálculo
de la amplitud compleja del campo eléctrico difractado en aproximación de
Fraunhofer.

− i k ( s − p ) + (  s −  p ) 
EcP = cte  Ec e d

Si iluminamos la abertura con distribución de intensidad no uniforme (en general esto


es causa de que la apertura de difracción no sea uniformemente transparente u otras
razones) el resultado anterior se convierte en el expresado en la última fórmula, que
indica que la distribución de campo eléctrico difractado es la transformada de Fourier
de la distribución de campo eléctrico en la abertura.

− i k ( s − p ) + (  s −  p ) 
EcP = cte  Ec ( , ) e d

4.2 Aberturas importantes


En esta parte y la siguiente estudiaremos los fenómenos de difracción de Fraunhofer en
algunas aberturas que tienen especial interés práctico.

En la práctica, los dispositivos para obtener difracción de Fraunhofer sin necesidad de


trabajar a distancias infinitas operan como indica la figura de la derecha. Un colimador
C1 con la fuente S en su plano focal envía sobre la abertura del diafragma D ondas planas.
Otro sistema convergente, C2, actúa como colector y discriminador, llevando a concurrir
en los distintos puntos P ' de una pantalla en su plano focal las familias de rayos paralelos
entre sí de entre todos los que por difracción se producen en todas las direcciones en
los puntos M del diafragma.

Difracción por abertura rectangular


Obtenemos que:

EcP = cte(ab)(sen U / U )(sen V / V )


Donde: 𝑈 = 𝑘𝛼𝑃 𝑎 y 𝑉 = 𝑘𝛽𝑃 𝑏. Siendo la intensidad entonces2:

I P = cte(a 2b 2 )( sen U / U ) 2 ( sen V / V ) 2

Dem.
Como hemos explicado antes, necesitamos colimar los rayos (para simular el infinito)
pero esto es a nivel conceptual. Realmente, la operación que realizaremos será la
integral anterior3:

La intensidad se puede deducir elevando al cuadrado la expresión anterior (y pasando a


funciones trigonométricas):

Ahora podemos hacer que S esté en el eje óptico del colimador siendo dicho eje normal
al plano de la abertura:

( s , s ,  s ) = (0,0,1)
+a +b
EcP = cte  exp(ik P )d  exp(ik  P ) d
−a −b

2
Nota que las constantes no importan porque esta técnica sólo sirve para predecir el patrón de
difracción (como normalizar la intensidad).

3 Nota esto está cogido del libro básicamente las letras primadas se refieren a las que tienen un
sub p en en el dibujo.
Cuyo resultado es:

EcP = cte(ab)(sen U / U )(sen V / V )

U = k P a

V = k  Pb
Siendo la intensidad entonces:

I P = cte(a 2b 2 )( sen U / U ) 2 ( sen V / V ) 2

QED.
Ahora podríamos estudiar la distribución de intensidades en el plano, para ello, daremos
diferentes valores a alfa y beta. En particular, vamos a hacer el estudio en los puntos del
eje x’:

• Mínimos

Notamos que entre cada dos mínimos consecutivos hay un máximo. La anchura angular
de un máximo o ángulo bajo el cual se ven dos mínimos consecutivos será:

Excepto para el centra (theta=0) que tiene doble anchura, pues, para m=0 se tiene
máximo.

• Máximos
Los vamos a obtener haciendo:

Que conduce a la condición:


Que puede resolverse gráficamente buscando los puntos de intersección de la recta y=u
con los de la gráfica de la función y=tan(u):

Análogamente se podría hacer el estudio para el eje y’:

Obteniendo mínimos en:

El aspecto de la figura de difracción para una abertura cuadrada (a=b) sería:

Pero como se puede deducir de las expresiones para los mínimos, la distancia es menor
en la dirección del eje que corresponde a la mayor dimensión de la abertura. Además,
existe una fuerte disminución con la distancia de los valores de los máximos que hace
que la energía de la luz difractada esté fundamentalmente contenida en el máximo
central.
Para conseguir no tener efectos de difracción (ósea ponernos en términos de óptica
geométrica), toda la luz procedente de S debería ir a su imagen S’ si los objetivos
utilizados son perfectos, lo cual sólo puede suceder si además 𝜆 = 0, lo que implicaría
𝜑 = 𝜃 = 0. Ello pone manifiesto que la óptica geométrica es límite de la óptica
ondulatoria al disminuir la longitud de onda en relación con las dimensiones de la
abertura.
Difracción por una rendija

Si en la abertura rectangular hacemos una dimensión mucho menor que la otra, a<<b,
convertimos la abertura rectangular en una rendija.

• En el eje x del plano focal del colector aparecerán los máximos y mínimos
distanciados como indica la figura tanto más cuanto más pequeño sea a.
• Sin embargo, en el eje y, debido a que b es muy grande, los máximos y mínimos
se concentrarán mucho sobre el eje x' apareciendo indistinguibles.
El aspecto de la figura será como una serie de bandas de muy pequeña altura simétricas
respecto a S'0 imagen de la fuente puntual S0, y espaciadas con arreglo a las expresiones
anteriores, siendo la central de doble anchura que las laterales.
Si la fuente de luz en lugar de ser puntual fuera lineal y paralela al eje 𝜂 un punto como
el S1, incoherente con S0, produciría en el plano focal del colector otra serie de bandas
iguales simétricas respecto a su imagen directa S’1. La fuente continua daría así una serie
de bandas paralelas a su dimensión como muestra la fotografía.

Difracción por una abertura circular


Consideremos una abertura circular de centro O y radio R, iluminada
perpendicularmente con luz paralela procedente de una fuente puntual en el eje
colimada, es decir 𝛼 = 𝛽 = 0
𝑘𝑟𝜌′
Obtenemos que el campo en un punto P’ tras la difracción es (donde 𝑍 = ):
𝑓′

Ahora, si llamamos A al módulo de la constante compleja C, multiplicando la expresión


anterior por su conjugada, o bien sustituyendo C por A y elevando al cuadrado puesto
que J1(Z) es real, tendremos para la intensidad:
Ahora como hemos comentado antes, puesto que nos interesamos por distribuciones
relativas, normalizamos la función de intensidad de modo que, considerada como
función de 𝜌′ de intensidad unidad en el centro de la figura de difracción, basta
prescindir del factor constante (πR2A)2 ya que el valor límite de J1(Z)/Z cuando Z tiende
a 0 es ½, por tanto, escribiremos definitivamente para la distribución relativa de
intensidades en la figura de difracción:

Dem.

La amplitud compleja en un punto P’(x’,y’) del plano focal del colector C2, de focal f’,
vendrá dada por la contribución de todos los elementos de área dΣ de la abertura,
aplicando la integral de Kirchhoff:

Puesto que el fenómeno es de revolución, podemos simplificar tomando coordenadas


polares (𝜌, 𝜓) en el plano de la abertura y (𝜌′, 𝜓′) en el plano (x’,y’).
Por la misma razón y sin pérdida de generalidad, tomaremos P’ en el eje x’ con lo que
𝜓′ = 0 y todos los rayos difractados que van a P’ tendrán 𝛽 ′ = 𝑠𝑒𝑛𝜑 = 0, pues sólo
llegarán los contenidos en plano horizontal que forman con el eje de revolución un
ángulo 𝜃. Bajo estos presupuestos, las coordenadas de M serán, siendo f’ la focal del
colector:

Los cosenos directores de los rayos que van a P’ serán:


Pues en la práctica los efectos de difracción importantes están tan cerca de S’0 que la
aproximación anterior se puede tomar sin error apreciable. El elemento de área de la
abertura tendrá por expresión:

Con todo, el exponente del integrando será:

Y podremos escribir:

Teniendo en cuenta que la función de Bessel de orden cero, J0(u), de una variable real
u, viene definida por la expresión:

Donde J0(u) es una función real, ya que su expresión integral puede descomponerse en
la suma:

Siendo nula la segunda integral.


La expresión podremos ponerla entonces como:

Como por otra parte las funciones J0 y J1 están ligadas por la relación:

Escribimos:
Poniendo Z=kr𝜌′/f’ y multiplicando y dividiendo por Z para simplificar, se tiene:

QED.
Recurriendo a las tablas de la función de Bessel podemos calcular los máximos y
mínimos de

• Mínimos

• Máximos

Como se ve, la luz se reparte en una mancha circular central y en una serie de anillos
alternativamente claros y oscuros, cuya intensidad en los máximos va decreciendo al
apartarse del centro. Esta figura de difracción, que se encuentra en la imagen de un
punto en todos los sistemas ópticos perfectos desde el punto de vista geométrico que
operan con pupila circular, recibe el nombre de mancha o disco de AIRY, y es la base
para el estudio del poder resolutivo y de toda la teoría difraccional de la imagen.
Como puede verse, a partir de las expresiones anteriores, la figura de difracción
disminuye de tamaño al disminuir 𝜆 o aumentar D.
Teniendo en cuenta la definición de Z y las tablas anteriores, se pueden calcular los
radios de los anillos. Así el radio del disco central, o, lo que es igual el del primer anillo
oscuro, será:

Donde D es el diámetro de la abertura.


Si queremos obtener el radio angular, es decir el ángulo 𝜽 bajo el cual se ve el radio 𝝆′
del disco central desde el punto principal imagen del sistema, que será 𝜃 = 𝜌′ /f',
tendríamos:

Si la intensidad en un punto de la mancha es IP’ siendo igual al flujo de energía recibida


en el plano focal por unidad de superficie, se puede calcular la energía que llega a un
anillo comprendido entre dos radios. Dicha energía se obtendría integrando la función
de intensidad sobre todo el anillo tomando diferenciales de áreas por coronas
elementales:

5. Propagación en el límite de la óptica geométrica


5.1 Ortogonalidad de superficies de onda y rayos
Cuando los efectos difraccionales son despreciables (límite de la óptica geométrica) las
trayectorias de la luz (rayos) están bien definidas. Es decir, que vamos a tratar la luz a
partir de la mecánica clásica y la cuántica en lugar del electromagnetismo, estudiándola
a partir de los fotones (partículas) que la componen. Notar que todo esto será una
aproximación (la forma precisa de estudiar el comportamiento de la luz es a partir del
electromagnetismo).
En primer lugar, introducimos el Teorema de Malus-Dupin que dice que los rayos
siempre serán perpendiculares a los frentes de onda.
Dem.
Para comprobarlo partimos del campo eléctrico en un punto:

E (r , t ) = Ac (r , t ) ei  ( r ,t )
La parte que va determinar la forma de los frentes de onda es la fase, pero si nos
centramos en un entorno espacio-temporal infinitesimal, podemos desarrollarla en
serie de Taylor y después aproximarla a un frente plano:

   
 = t + r
 t  r

 = t − k r
Identificando la forma de las expresiones:


=
t


k =− = − 
r
Si recordamos que el gradiente de una fusión es ortogonal a una superficie y que el
vector de ondas da la dirección de la trayectoria de la luz, queda probado que los rayos
son ortogonales a los frentes de onda.
QED.
5.2 Principio de Fermat
Y finalmente al Principio de Fermat:

B
 ( L) =   nr ds = 0
A
A partir del principio de Fermat pueden obtenerse las leyes de la óptica geométrica (por
ejemplo, la Ley de Snell). Está relacionado con el principio de Maupertius o de mínima
acción de mecánica. Este principio dice que de todas las trayectorias que puede seguir
una partícula (con energía constante) entre un punto A y otro B, la trayectoria real es
aquella para la que la acción es una extremal.

5.3 Ecuación de las trayectorias en los medios de gradiente de índice


En un medio en el que el índice de refracción cambia con el punto del espacio (medio
de gradiente de índice) las trayectorias de los rayos no son rectilíneas. Para averiguar
estas trayectorias se puede utilizar el principio de Fermat y llegar a la relación:
𝑑 𝑑𝑟 𝑑
⃗∇𝑛𝑟 = (𝑛𝑟 ) → ⃗∇𝑛𝑟 = ⃗)
(𝑛 𝑇
𝑑𝑠 𝑑𝑠 𝑑𝑠 𝑟

O equivalentemente:

 nr d  dxi 
=  nr  (i = 1, 2,3)
 xi ds  ds 

Donde 𝑛𝑟 es el índice de refracción real y 𝑑𝑠 el diferencial de arco de la trayectoria que


siguen los fotones de la luz. Si se conoce la dependencia funcional del índice de
refracción con las coordenadas y las condiciones de contorno apropiadas, se pueden
integrar las ecuaciones y obtener las trayectorias de la luz.

5.4 Ejemplos para distintos medios y aplicaciones


Índice de refracción constante
Asumimos que:
𝑛 = 𝑛0 = 𝑐𝑡𝑒
Entonces:
𝑑2𝑟
=0
𝑑𝑠 2
Siendo el vector velocidad de la partícula en t=0:
𝑑𝑟 ⃗⃗
= 𝑟′0 = 𝑐𝑡𝑒
𝑑𝑠
Luego de aquí deducimos que:

𝑟(𝑠) = 𝑟0 + ⃗⃗𝑟′0 𝑠
Que básicamente define una recta:
Índice de refracción que varía (lentes de gradiente de índice y fibra óptica)

Supongamos este sistema (que luego veremos que tiene que ver con la fibra óptica y
otras aplicaciones). El objetivo es conocer la trayectoria que seguirán los rayos de luz.
Sabemos que:

𝑛2 (𝑥, 𝑦) = 𝑛02 (1 − 𝑔2 (𝑥 2 + 𝑦 2 )) 𝑡𝑞 𝑔2 (𝑥 2 + 𝑦 2 ) ≪ 1

Entonces vamos a usar:

𝑥 𝑔2 2 2 ))
𝑔2 2
√1 + 𝑥 2 ≅ 1 + → 𝑛 ≅ 𝑛0 (1 − (𝑥 +𝑦 = 𝑛0 (1 − 𝑟 )
2 2 2

Ahora vamos a tratar de resolver la trayectoria sólo con un parámetro s siendo:


𝑠 = 𝑧 → 𝑟(𝑥(𝑧), 𝑦(𝑧), 𝑧(𝑧))
Y notamos que tenemos la ecuación para todas las posibles trayectorias:
𝑑 𝑑𝑟
⃗𝑛=
∇ (𝑛 )
𝑑𝑧 𝑑𝑧
Pero sólo vamos a considerar aquellas que siguen una trayectoria meridional (como
contenidas en un único plano que cortase al cilindro) y pasamos a coordenadas
cilíndricas tal que:

𝑟(𝑥(𝑧), 𝑦(𝑧), 𝑧(𝑧)) = 𝑟(𝑟(𝑧), 𝜙(𝑧), 𝑧)

Pero como es meridional 𝜙(𝑧) = 𝑐𝑡𝑒 y por simplificar diremos que la constante es cero:
𝑟(𝑟(𝑧), 0, 𝑧)
Luego nuestra trayectoria será tal que para cada z sólo nos importará la distancia al
medio.
Entonces:

𝑑 𝑑𝑟 𝑑𝑛 𝑑2 𝑟
(𝑛 ) = = −𝑛0 𝑔2 𝑟 → 𝑛 2 + 𝑛0 𝑔2 𝑟 = 0
𝑑𝑧 𝑑𝑧 𝑑𝑟 𝑑𝑧
Pero ahora vamos a asumir que el índice de refracción varía muy poco en r, el tubo es lo
suficientemente pequeño como para que:
𝑛 ≅ 𝑛0
Entonces:
𝑑2 𝑟
+ 𝑔2 𝑟 = 0 → 𝑟(𝑧) = 𝐴𝑐𝑜𝑠(𝑘𝑧) + 𝐵𝑠𝑒𝑛(𝑘𝑧)
𝑑𝑧 2
𝑘 = ±𝑔
2𝜋 2𝜋
=𝑔→𝑃=
𝑃 𝑔
O sea, que tenemos un movimiento oscilatorio periódico como trayectoria para nuestros
rayos. Destacar que A y B fijarán el ángulo de inclinación con el que apuntamos el láser,
aplicando unas condiciones iniciales del estilo:
𝑟(0) = 𝑟0
𝑟′(0) = 𝑟0 ′
Llegamos a:
𝑟0′
𝑟(𝑧) = 𝑟0 𝑐𝑜𝑠(𝑔𝑧) + 𝑠𝑒𝑛(𝑔𝑧)
𝑔
𝑟′(𝑧) = −𝑟0 𝑠𝑒𝑛(𝑔𝑧) + 𝑟0′ 𝑐𝑜𝑠(𝑔𝑧)
Es decir, trayectoria del estilo:
Cuando se introduce en el medio citado en la lámina anterior un haz de rayos de luz, se
producen fenómenos de auto-focalización (colimación). Al variar la longitud d se pueden
conseguir distintos efectos.
Si se corta el dispositivo por alguno de los máximos se consigue un haz de luz colimada,
o lo contrario si se le da la vuelta. Si se corta el dispositivo entre un máximo y un mínimo,
se consigue concentrar en un punto la luz que sale. Estos dispositivos se llaman lentes
de gradiente de índice o lentes Green, son de pequeño tamaño, y se emplean en micro-
óptica y en montajes con fibras ópticas.

En el interior de una fibra óptica la luz se propaga debido a los fenómenos de reflexión
total que ocurren en su superficie lateral. Si la fibra óptica tiene un gradiente de índice
apropiado, la luz queda confinada en la dirección transversal sin necesidad de reflexión
total. Así influyen menos los defectos de la superficie y las pérdidas de energía hacia el
exterior son menores. El control adecuado del gradiente de índice permite minimizar el
ensanchamiento de los pulsos de luz, cuando estas fibras se utilizan para transmitir
información digital.4

4
Notar que es importante que estos tubos (y demás sistemas) sean más grandes que la longitud
de onda, si no, toda la aproximación a despreciar efectos de difracción no es correcta.
6. Monocromaticidad y coherencia
El campo eléctrico de la luz generada por todas las partículas fluctúa. Por lo tanto, para
saber si la luz es coherente o no lo único que se puede hacer es averiguar si las
fluctuaciones del campo eléctrico en instantes diferentes están relacionadas o no.
Para medir la relación entre las fluctuaciones en dos instantes separados por un
intervalo de tiempo podríamos calcular el valor medio del producto de campos:

E (t ) E (t +  )

Si no existiese relación entre las fluctuaciones (luz incoherente) tendríamos un valor


medio nulo. Sin embargo, si las fluctuaciones estuviesen relacionadas no se cumpliría
la propiedad anterior y el valor medio sería distinto de cero.
Como el campo eléctrico es complejo, la relación entre sus fluctuaciones en dos
instantes se mide mediante la función de correlación:

( ) = E * (t ) E (t +  )

De esta manera se consigue que, al menos esa función sea real en τ=0. A partir de ella y
de la intensidad reducida Y5:

Y = E * (t ) E (t )

Se define una función normalizada llamada grado de coherencia temporal:

 ( ) = ( ) / Y = E * (t ) E (t +  ) / E * (t ) E (t )

La cuestión ahora es cómo se puede evaluar teóricamente ese grado de coherencia.

6.1 Grado de coherencia temporal


Para tratar de calcular la función de correlación:

( ) = E * (t ) E (t +  )

Expresamos los campos eléctricos como superposición de sus componentes espectrales:


+
E (t ) =  E ( ) exp i 2 t  d
−

+
E (t +  ) =  E (  ) exp i 2  ( t +  )  d 
−

5
Nota que la intensidad Y se denota así porque la intensidad no normalizada I llevaría una
1 ε
constante, recordar que en vacío sería: I = 2 √μ0 Y
0
Puede demostrarse que en la luz emitida por fuentes ordinarias las diferentes
componentes espectrales fluctúan al azar y no están correlacionadas entre sí:

E * ( ) E ( ´) = 0 si    ´

Cuando si que puede existir correlación tenemos que:


+ +
E * (t ) E (t +  ) =  d   d    E * ( )E (  )  exp  −i 2   t   exp i 2    ( t +  )  =
− −
+
  E * ( ) E ( )  exp i 2   d 
−

Teniendo en cuenta todo esto se encuentra que el grado de coherencia temporal de un


haz de luz es la transformada de Fourier de su espectro normalizado:

( ) + E ( ) E ( )
*

 ( ) = = exp ( i 2 ) d
Y − Y

Donde:
𝐼(𝜈)
𝑌 = Γ(𝜏 = 0); 𝐼(𝜈) = 〈𝐸 ∗ (𝜈)𝐸(𝜈)〉 → 𝑔(𝜈) =
𝑌
En forma genérica:
+
 ( ) =  g ( ) exp ( i 2 ) d
−

6.2 Ejemplo de grado de coherencia temporal


Para ilustrar el resultado anterior, consideremos el haz de luz cuyo espectro es:

I si  0 −  / 2     0 +  / 2
I ( ) =  0
0 si    0 −  / 2 ó    0 +  / 2

*Nota como que la intensidad sea constante en un intervalo de frecuencias implica que
si consideramos cada frecuencia con un color, veríamos todos los colores con la misma
intensidad en ese intervalo (si es muy grande, veríamos luz blanca).
Normalizándolo y calculando su transformada de Fourier se obtiene (τ). Primero vamos
a calcular:
𝐼(𝜈) 𝐼0
𝑔(𝜈) = =
𝑌 Γ(𝜏 = 0)
𝜈0 −Δν/2
1
Γ(𝜏 = 0) = ∫ 𝐼0 𝑑𝜈 = 𝐼0 Δν → 𝑔(𝜈) =
𝜈0 −Δν/2 Δν

De forma que sustituyendo en la fórmula anterior para el grado de coherencia:


 0 + 2
 ( ) =  d exp ( i 2 ) /  =
 0 − 2
 0 + / 2
exp ( i 2 ) sen  ( ) 
= exp(i 2 0  )
i 2 (  )   ( )
0 − /2

Como puede verse en la figura, |γ| disminuye conforme |τ| aumenta desde 0, hasta que
se anula y posteriormente pasa por algunos máximos de pequeño valor. La anchura de
|| entre los primeros ceros es inversamente proporcional a la anchura del espectro.
Ceros :  ( ) =  
 = 1/    = 2 / 
Se cumple, por tanto, la propiedad general de la transformada de Fourier, de tener
anchura inversamente proporcional a la de la función que transforma. Esto significa que
cuanto más monocromática sea la luz (menor anchura espectral) más ancha será la
función de coherencia γ. Como veremos posteriormente, esto es beneficioso para la
producción de interferencias.
Además, destacar que con este estudio de máximos y mínimos se puede cuantificar la
coherencia midiendo el espectro.

6.3 Interferencias con agujeros de Young

Se encuentra el de la intensidad en el punto P:

I = I1 + I 2 + 2 I1 I 2 Re  ( s +  )
La magnitud del término de interferencia depende del valor de la parte real del grado
de coherencia temporal de la fuente, para un intervalo temporal igual a la diferencia
entre los tiempos de recorrido de la luz por los caminos 1 y 2.
Dem.
Vamos a analizar un montaje como el de la figura, en el que S, S 1 y S2 son tres agujeros
de tamaño muy pequeño. El agujero S está iluminado y emite una onda esférica que
ilumina los agujeros S1 y S2, de los que salen ondas esféricas que interfieren. Vamos a
observar las interferencias en el plano XY.
El campo eléctrico de la luz se puede descomponer en tres componentes, según los ejes
X, Y, Z. Para cada componente, la intensidad en un punto genérico P viene dada por las
expresiones:

1 0
I=  A 2 =
2 0
1 0
 E * ( t ) E ( t ) =
2 0
1 0
Y
2 0

Los valores medios se introducen para promediar las fluctuaciones de la intensidad. Y es


la intensidad reducida de la luz en P.
El campo eléctrico en P correspondiente a una componente (EX, EY o EZ) es suma de los
campos debidos a la luz que sale de los agujeros S1 y S2:

E(t ) = E1 (t ) + E2 (t )

Y =  E *1 (t ) + E *2 (t )   E1 (t ) + E2 (t )  = Y1 + Y2 + 2 Re E *2 (t ) E1 (t )

Para calcular la función de correlación de campos vamos a relacionar los campos en P


con el campo Es en el agujero S:

E1 (t ) = a1 exp(i ) Es (t1 ) t1 = t −  s1 − 1
E2 (t ) = a2 exp(i ) Es (t2 ) t2 = t −  s 2 −  2
Yi = ai Ys
2

En las expresiones obtenidas |𝑎𝑖 |(i=1,2) dan cuenta de la propagación del campo como
onda esférica desde S a Si y desde Si a P, así como del tamaño del agujero Si. Por otra
parte  da cuenta del salto de fase entre la onda que llega a Si y la onda secundaria que
sale de él.
Operamos:
E *2 (t ) E1 (t ) = a1 a2 E *s (t2 ) Es (t1 ) = a1 a2 (t1 − t2 ) =
(t1 − t2 )
a1 Ys a2 Ys  = Y1Y2  (t1 − t2 )
2 2

Ys

t1 − t2 =  s +  ,  s =  s 2 − s1 ,  =  2 −1

E *2 (t ) E1 (t ) = Y1Y2  ( s +  )

Y sustituyendo:

Y = Y1 + Y2 + 2 Y1Y2 Re  ( s +  )

O equivalentemente:

I = I1 + I 2 + 2 I1 I 2 Re  ( s +  )

QED.
Podemos hacer el análisis de la intensidad en función del grado de coherencia:

• Luz monocromática

Luz monocromática : g ( ) =  ( − 0 )

Por lo tanto:
+
 ( s +  ) =   ( − 0 ) exp i 2 ( s +  )  d = exp i0 ( s +  ) 
−

I = I1 + I 2 + 2 I1 I 2 cos  ,  = 0 ( s +  )

De forma que en el caso sencillo de la luz monocromática de frecuencia ω0, los


máximos y mínimos de interferencia se extienden hasta el infinito6:

• Luz policromática
En realidad, la luz con que se ilumina S no puede ser monocromática y por ello la parte
real del grado de coherencia tiene una anchura finita y va decreciendo conforme τs+τ se
aparta del valor cero.

6
Las zonas de intensidad máximas o mínimas dependen de los valores extremos del coseno (más
o menos uno).
Por ello el contraste de las franjas se va atenuando conforme τs+τ se aleja de dicho valor.
Para conseguir que las interferencias ocupen la zona más amplia posible en el plano XY
la luz debe ser lo más monocromática posible. Suele utilizarse luz correspondiente a una
raya espectral emitida por átomos excitados.

Espectro simétrico
Como las rayas espectrales tienen un espectro simétrico o casi simétrico, vamos a
averiguar en qué se convierte la expresión de la intensidad en P para el caso de espectro
simétrico.
Si 𝑔(𝜈) es simétrico respecto a 𝜈0 , al hacer el cambio de variable 𝑥 = 𝜈 − 𝑣0 y tener en
cuenta que 𝑔(𝑥) es simétrica respecto a x=0, se encuentran los resultados:
+
 ( ) =  g ( ) exp ( i 2 ) d
−

x =  − 0
+
 ( ) = exp(i 2 0 )  g ( x ) exp ( i 2 x ) dx
−

Donde notamos que:

exp(i 2  x ) = cos (2  x ) + isen (2  x )


Y por el hecho de ser simétrica, la integral con el seno se anula (es una par con una
impar):
+
 ( ) = exp(i0 )  g ( x ) cos ( 2 x ) dx =  c ( ) exp(i0 )
−

Donde:

 c ( ) =   ( )   ( ) =   ( ) exp(i0 )

I = I1 + I 2 + 2 I1 I 2  c ( s +  ) cos 

 = 0 ( s +  )
La expresión de γ es la obtenida para luz monocromática, pero aquí ω0 es la frecuencia
del centro de la raya espectral.
Interferencias con agujeros de Young: estructura espacial
Vamos ahora a estudiar la estructura espacial de las interferencias. Podemos despejar
en el desfase asumiendo que n=1:

2  x d xd 
= n s +
0  D1 D2 

Según las fórmulas obtenidas I=cte (d=cte) significa x=cte (líneas rectas paralelas al eje
Y). La expresión de d permite obtener las condiciones de máximo y de mínimo. Se
obtienen así franjas interferenciales paralelas al eje Y, que se llama franjas de Young.
Habitualmente xS=0 y las franjas son simétricas respecto al eje Y. La distancia Dx entre
dos máximos o dos mínimos consecutivos no depende de xS y permite determinar I0 a
partir de la medida de Dx, D2 y d.

Dem.
Para ello hay que tener en cuenta que d se puede expresar en función de la diferencia
de caminos D1 y D2. Para obtener una estructura sencilla se suele hacer el montaje de
forma que:
xS, d << D1
d, x, y << D2
Entonces partimos de lo desarrollado antes:

I = I1 + I 2 + 2 I1I 2  c ( s +  ) cos  =
I1 + I 2  2 I1I 2  ( s +  ) cos 

 = 0 ( s +  ) = (2 / 0 )n ( s + )
Donde definimos:

 s = SS 2 − SS1 ,  = S 2 P − S1 P

SS1 + SS 2  2 D1 , S1 P + S 2 P  2 D2

Y calculamos:
2 2
2 D1  s  ( SS2 + SS1 )( SS2 − SS1 ) = SS2 − SS1 = ( xs + d / 2) 2 + D12 
− ( xs − d / 2)2 + D12  = 2 xs d   s = xs d / D1

2 2
2 D2   ( S2 P + S1P)( S2 P − S1P) = S 2 P − S1P = ( x + d / 2) 2 + y 2 + D2 2 
− ( x − d / 2) 2 + y 2 + D2 2  = 2 xd   = x d / D2

Entonces podemos despejar en el desfase asumiendo que n=1:

2  x d xd 
= n s +
0  D1 D2 

QED.
Interferencias con rendijas de Young

El montaje de franjas de Young suele hacerse con rendijas en lugar de agujeros para
aumentar la luminosidad de las franjas. Para ello se sustituyen los agujeros S, S1 y S2 por
rendijas (R, R1 y R2) paralelas al eje Y que pasan por los puntos S, S1 y S2.
De la rendija R sale una onda cilíndrica cuyos rayos son perpendiculares a la superficie
del cilindro y por lo tanto a R. Por ello, la luz que sale de un punto de R solamente excita
a los puntos que están a la misma altura en R1 y R2. Es decir, que la luz que sale del punto
genérico Sa excita al punto Sa1 de R1 y al Sa2 de R2. Las ondas esféricas que salen de Sa1 y
Sa2 producen franjas de máximo, paralelas al eje Y, iguales a las producidas por las ondas
que salen de S1 y S2. Por tanto, al sustituir los agujeros por rendijas la estructura del
sistema de franjas interferenciales sigue igual, pero con más intensidad.
Sin embargo, si la rendija R deja de ser paralela a las otras dos, xS tomará un valor
diferente para cada punto de R y saldrán sistemas de franjas desplazadas unas
respecto a otras. Esto producirá una disminución de la visibilidad de las franjas al
enmascararse unas con otras. Si R1 y R2 dejan de ser paralelas entre sí el parámetro que
variará y producirá enmascaramiento de franjas será d. Es, por tanto, muy importante
el paralelismo de las rendijas.
Hasta aquí hemos utilizado rendijas con tamaño infinitesimal, a pesar de que en la
realidad tienen tamaño finito. Posteriormente nos ocuparemos de los efectos que
producen las anchuras de R1 y R2. Vamos ahora a estudiar el efecto del ensanchamiento
de R. Si la rendija R tiene una anchura A, la podemos considerar como una superposición
de rendijas de anchura infinitesimal. A cada una de estas rendijas le corresponde un
valor diferente de xS y produce un sistema de franjas interferenciales desplazadas
respecto a las demás. El efecto de esta superposición es un enmascaramiento de las
franjas interferenciales y, por lo tanto, una pérdida en su contraste.
Se muestra la expresión que toma la intensidad en el punto P para una rendija de
anchura A:

I = I1 + I 2 + 2 I1 I 2  12 
 c ( ) cos  0 ,  0 =  ( xs = 0)

2 Ad
 12 = sen /  ,  = 
0 2 D1

Para poder hablar de forma precisa de la visibilidad de las franjas definimos el factor de
visibilidad V y encontramos su expresión, que indica claramente que la visibilidad
decrece hacia los extremos del campo interferencial (debido a la presencia de γc(τ)) y
cuando la anchura A de la rendija aumenta (debido a la presencia de γ12).
I Max − I Min
V=
I Max + I Min

2 I1 I 2
V=  12  c ( )
I1 + I 2

Se puede decir que a mayor abertura se pierde visibilidad en las franjas.

Dispositivos interferenciales de doble rendija


El principal problema del montaje de rendijas de Young es que las rendijas R1 y R2 dejan
pasar muy poca luz, además de que es muy complicado conseguir el paralelismo y que
sean completamente iguales en un sistema real. Por eso se recurre a montajes más
luminosos y que eviten ese problema.

• Biprisma de Fresnel
El biprisma de Fresnel produce dos imágenes virtuales (S1, S2) de la rendija de
iluminación S0 (perpendicular al plano del dibujo) que emiten en fase. Por lo tanto, las
ondas que provienen de S1 y S2 interfieren después del biprisma y aparecen franjas en la
pantalla de observación, con máximo en el centro. Al haber eliminado las rendijas R1 y
R2 del montaje de Young, el sistema de franjas interferenciales es mucho más luminoso.
• Espejos de Fresnel

Los espejos de Fresnel producen un resultado similar. Los saltos de fase p que ocurren
en las reflexiones en los espejos se compensan y sigue habiendo máximo en el centro.

• Bilente de Billet

La bilente de Billet está formada por dos medias lentes desplazadas lateralmente. Aquí
las imágenes S1 y S2 de S0 son reales. Debido a la simetría aparece máximo en el centro.

• Espejo de Lloyd

Mediante el espejo de Lloyd interfieren los haces que salen de la rendija S0 y de su


imagen virtual S1. El salto de fase p que ocurre en la reflexión en el espejo hace que haya
mínimo en el eje, en lugar de máximo. En todos estos dispositivos las franjas
interferenciales se forman en toda la zona de superposición de los dos haces (zona
rayada). Se dice que las franjas no están localizadas.
2
Fenómenos básicos de interacción luz-materia
Fuentes de luz
En este capítulo vamos a analizar más en profundidad la composición de la materia y los
fenómenos cuánticos relacionados con la emisión de los átomos. El fin es estudiar las
fuentes de luz y la emisión de ondas.

1. Ley de radiación de Planck


Esta ley nos dice cómo es el espectro que emite un cuerpo negro. Nos da la energía
media por unidad de volumen en un intervalo de frecuencias unidad:

8  h 3 1
WT ( ) =   h
c 3
e −1

 = 1/(k BT )

La potencia que radia la boca del cuerpo negro:

Potencia radiada por la boca = WT S c

Distribución espectral de la luz emitida


por un cuerpo negro. Conforme
aumenta T el máximo de la curva se
desplaza hacia longitudes de onda del
espectro ultravioleta y crece la
proporción de radiación emitida en esa
zona espectral (intensidad de radiación
es mayor a mayores temperaturas)

2. Absorción, emisión espontánea y estimulada


Los átomos en estado gaseoso presentan niveles de energía interna discretos. Un
átomo puede pasar a un nivel de mayor energía absorbiendo un fotón de energía hν=ΔE.
También puede pasar a un nivel de menor energía emitiendo un fotón, que debe cumplir
el mismo tipo de condición que el fotón absorbido.

h =  E
Consideremos un conjunto de átomos que se encuentran en presencia de radiación de
frecuencia ν, que puede provocar transiciones entre los niveles 1 y 2. Sean E1, E2 las
energías de los niveles y N1, N2 sus poblaciones. Las probabilidades de absorción y
emisión son:

Pabs = N1 B12 W

Pemis = N 2 A21 + N 2 B21 W

La emisión espontánea se hace de forma isótropa y con fases al azar. La emisión


estimulada es básicamente que cuando empieza a haber fotones por el medio, estos
incitan más emisión de fotones, por tanto, tiene lugar solamente en la dirección del haz
estimulador. Los fotones emitidos por emisión estimulada son como réplicas de los
estimuladores porque guardan relación de fase con ellos (son coherentes).

2.1 Coeficientes de Einstein


El principio de incertidumbre tiempo-energía de la Mecánica Cuántica dice que para un
nivel atómico debe de cumplirse que:

t E 
La incertidumbre temporal Δt (tiempo que tarda a caer el átomo desde ese nivel)
provoca una incertidumbre ΔE en la energía del nivel. Debido a esta incertidumbre la
emisión no es monocromática (porque existe un Δν)7:

E = h 

Hay otros mecanismos que ensanchan más el espectro de la transición (efecto Doppler
aleatorio debido al movimiento errático de los átomos, colisiones entre átomos, etc.).
Por tanto, las probabilidades de absorción y emisión dependen de la frecuencia:

Pabs ( ) = N1 B12 W ( )

Pemis ( ) = N 2 A21 + N 2 B21 W ( )

7
Notar con esto que la luz poco monocromática tiene tiempos muy rápidos de transición, lo que
da lugar a no correlación entre emisiones y por eso es incoherente.
Se encuentran las relaciones de Einstein:

A21 / B21 = 8 h 3 / c 3

B12 / B21 = g2 / g1
A partir de aquí podemos calcular la relación entre probabilidades de emisión
espontánea y emisión estimulada:

Pemis espon N 2 A21 A21 8 h 3


= = =
Pemis estim N 2 B21 W ( ) B21 W ( ) c3W ( )

En el caso de radiación en equilibrio térmico:

Pemis espon
= exp(  h ) − 1 = exp(h / k B T ) − 1
Pemis estim

Esto tiene consecuencias importantes en los láseres:

En caso de radiación no térmica las consecuencias son similares.


Dem.
Suponiendo que los átomos se encuentran en equilibrio térmico e imponiendo esta
condición a la radiación:

Pemis ( ) = Pabs ( )

W ( ) = WT ( )

Se encuentra una expresión para la densidad cúbica media de energía:

N 2 A21 + N 2 B21 WT ( ) = N1 B12 WT ( )

8  h 3 1
WT ( ) =   h
c 3
e −1
N 2 A21 A 1
WT = = 21 
N1 B12 − N 2 B21 B21 ( N1 N 2 ) ( B12 B21 ) − 1

A21 / B21 = 8 h 3 / c 3

Comparando la expresión anterior con la ley de radiación de Planck:


8  h 3 1
WT ( ) =   h
c 3
e −1

( N1 / N2 ) B12 = B21 exp( )

Teniendo en cuenta que en el equilibrio térmico la probabilidad de que un átomo se


encuentre en un nivel de energía E viene dada por la distribución de Boltzman y
considerando la degeneración g del nivel:

P( E)  g exp(− E)

( N1 / N 2 ) = ( g1 / g 2 ) exp  −  ( E1 − E2 )  = ( g1 / g 2 ) exp(   )

A partir de aquí se encuentran las relaciones de Einstein.


QED.
3. Radiadores de patrón
El cuerpo negro es el único radiador cuya ley de radiación es conocida de forma absoluta.
Los patrones de radiación siempre son cuerpos negros.

3.1 Radiadores de patrón primarios


Cuerpo negro patrón

Está formado por un tubo de torio


rodeado de una vasija llena de platino.
Se calienta hasta que se funde el platino
que mantiene la temperatura constante,
así, la carcasa del cilindro deja pasar la
radiación por un orificio (cuerpo negro).

Cavidades cónicas

Se calientan de forma uniforme


mediante termopares de precisión. La
fuente puede usarse como puntual o
extensa (según la abertura usada).

3.2 Radiadores de patrón secundarios


Con un cuerpo negro patrón podemos calibrar un detector. Con un detector calibrado
se pueden calibrar radiadores que no sean cuerpos negros. Estos radiadores son
patrones secundarios.
Lámpara de filamento y halógenas

Los filamentos de tungsteno se


sumergen en un gas noble para disminuir
la evaporación de los átomos del
filamento.

Para obtener más potencia y evitar por


completo la pérdida de los átomos del
filamento se usan lamparas halógenas.
Producen un espectro similar al del
cuerpo negro pero de menor intensidad.
Se les llama cuerpos grises.

Lámparas de arcos

Formadas por dos electrodos de carbono


que se alimentan con un voltaje continuo
y se acercan tal que aparece una descarga
eléctrica, que da lugar a un plasma muy
brillante cuando ioniza el aire.

Lámparas de arco en gases

Los átomos se introducen en el interior de


una ampolla de vidrio, con electrodos de
tungsteno. La descarga en arco ioniza los
átomos del interior de la ampolla que al
recombinarse con los electrodos forman
átomos neutros excitados. Estos dan
lugar a emisiones espontáneas (se
obtienen rayas espectrales8). Destacar
que a mayor presión el espectro obtenido
se ensancha y puede llegar a ser continuo.

4. Teoría de bandas
Cuando la densidad de átomos crece y se forma un sólido, aparecen interacciones entre
los distintos átomos. Esto hace que los niveles discretos de energía de los átomos en
estado gaseoso se conviertan en bandas anchas de energía. En nuestro modelo
simplificado, para explicar el comportamiento basta con conocer los estados de energía
de cada uno de los electrones (niveles electrónicos) que se agrupan formando bandas.

8
Por ejemplo, así funciona la de Mercurio que usamos siempre en prácticas.
La anchura de las bandas aumenta al aumentar su energía, pues los niveles electrónicos
más bajos de energía (próximos al nucleo) quedan apantallados y no son afectados por
este contacto entre átomos.
La penúltima banda de energía se denomina banda de valencia (B.V.) por el papel que
juega en los procesos de enlace. La última banda se denomina banda de conducción
(B.C.) porque estos electrones son los responsables de la conductividad del material.
Están separadas por un gap de energías prohibidas de valor Eg.
La probabilidad de que un nivel esté ocupado viene dada por la distribución de Fermi:

1
f (E) =
exp  ( E − EF ) / K B T  + 1

E es la energía del nivel y EF la energía del nivel de Fermi (que viene determinada por la
energía del último electrón que ocupa el nivel, pues es la energía mínima para extraer o
llevar electrones).

El nivel de Fermi se encuentra entre la B.V. y la B.C. de forma que para T=0 todos los
niveles de la B.V. están llenos y todos los de la B.C. están vacíos. Si el gap Eg es muy
grande, la probabilidad de que estén ocupados los niveles de la B.C. es despreciable,
aunque se eleve la temperatura y por ello el material es aislante.
En los metales la B.V. y la B.C. se solapan y hay conductividad incluso para T=0. En los
semiconductores el gap Eg es pequeño de forma que, aunque para T=0 su conductividad
sea nula, al elevar la temperatura la probabilidad de ocupación de los niveles de la B.C.
es apreciable y aparece conductividad.

4.1 Semiconductores intrínsecos


Físicamente lo que ocurre es que para T>0 algunos electrones pueden alcanzar niveles
de energía superiores por excitación térmica. Como la B.V. está llena deben de pasar a
la B.C. y constituyen electrones libres que contribuyen a la conductividad, pudiendo
saltar de un átomo a otro y generando así corriente eléctrica si el material se somete a
una diferencia de potencial.
Pares electrón-hueco. Agitación térmica
Cuando un electrón abandona la B.V., para pasar a la B.C., aparece un estado electrónico
vacío (hueco) que se comporta como una partícula de carga positiva que puede
propagarse libremente si se somete a un campo eléctrico, generando una corriente igual
a la de los electrones.9
La transición de un electrón desde la B.V. a la B.C. es equivalente a la aparición de dos
portadores de carga; uno de carga positiva (hueco) en la B.V. y otro de carga negativa
(electrón) en la B.C. Se dice que se ha creado un par electrón-hueco. Según lo anterior
en un semiconductor puro (intrínseco) hay tantos electrones en la B.C. como huecos en
la B.V.
Tipos de semiconductores. Detección y emisión de luz
Los semiconductores intrínsecos más simples están formados por un único elemento de
la tabla periódica (Ge o Si, por ejemplo) aunque hay también compuestos binarios. Se
pueden usar como detectores (midiendo el número de pares electrón hueco que se
generan al absorberse la luz) y como emisores (tienen lugar recombinaciones de
electrones y huecos para producir luz).10 Si bien los semiconductores indirectos
requieren de una tercera partícula (fonón) y por ello no se suelen usar como fuentes de
luz sino como de electricidad.

4.2 Semiconductores extrínsecos


Los semiconductores extrínsecos son semiconductores intrínsecos con impurezas en
pequeña proporción (dopantes).

9
Notar que en realidad los huecos “no se mueven” sino que se producen corrientes de electrones
para meterse en los huecos (y eso es lo que medimos).
10
Notar que para que un electrón pase a la B.C. debe absorber energía dada por hν y por ello,
cuando se recombina un electrón y un hueco produce un fotón, es decir, la emisión de luz (esto
es así para semiconductores directos). Esta emisión puede ser espontánea o estimulada.
Dopante tipo N

El dopante introduce en el gap niveles


electrónicos ocupados cerca de la B.C., estos
electrones pueden pasar a la B.C. contribuyendo
a la conducción sin que aparezcan huecos en la
B.V. Se tiene exceso de portadores negativos y el
semiconductor se llama de tipo N.

En T=0 el nivel Fermi está entre el nivel donante y


la B.C. Ejemplos de dopantes As, P y Sb.

Dopante tipo P

El dopante introduce niveles electrónicos vacío


cerca de la B.V., los electrones de la misma pasan
a dichos niveles. Aparece un exceso de huecos
(carga positiva) y se llama semiconductor de tipo
P.

En T=0 el nivel de Fermi está entre el nivel


receptor y la B.V. Ejemplos de dopantes son Al, In,
y Ga.

Unión P-N

Al unir los semiconductores de tipos P y N debe


aparecer un flujo de portadores de carga que
consiga igualar los niveles de Fermi. Los
portadores de tipo P se difunden hacia la zona de
tipo N (recombinándose con los electrones y
cargando positivamente el inicio de la zona) y los
portadores de tipo N se difunden hacia la zona de
tipo P (recombinándose con los huecos y
cargando negativamente el inicio de la zona).

Se origina una diferencia de potencial en la unión,


denominada barrera de potencial y una zona
desierta sin portadores de carga.

Así, con el material P-N se puede crear un fotodiodo (detección de luz por polarización
inversa). Si enviamos a la unión luz (que produzca pares electrón-hueco), la barrera de
potencial llevará a los electrones a la parte de tipo N y a los huecos hacia la parte de tipo
P, evitando así las recombinaciones de portadores y creando dos corrientes del mismo
signo que pueden ser medidas y permiten la detección de luz. Este fenómeno se
potencia si se polariza la unión P-N con el polo positivo en la parte de tipo N y el
negativo en la parte de tipo P (polarización inversa).
Fotodiodo Diodo fotoemisor (LED)

Si la unión se polariza de forma directa (polo positivo en la parte de tipo P y negativa


en la parte de tipo N) los electrones se van a la zona P y los huecos a la N. Cuando los
portadores llegan a la unión se recombinan produciendo luz. Estos emisores se llaman
LED (light emitting diode). Para aprovechar de forma óptima la energía emitida hay que
evitar en lo posible la reflexión total en la superficie de salida de la luz. Se utilizan en
fibras ópticas y se puede conseguir que emitan en distintas regiones del espectro.
Existen los de emisión superficial (basados en uniones obtenidas dopando de forma
diferente el mismo semiconductor, homo-uniones) y los de emisión lateral (basados en
uniones obtenidas a partir de dos semiconductores diferentes, hetero-uniones).

4.3 Inversión de población


Cuando se consigue inversión de población, el medio puede utilizarse para amplificar
un haz de luz o para generar un haz de luz coherente (luz láser), como veremos
posteriormente.
La inversión de población consiste en conseguir que la probabilidad de emisión
estimulada sea mayor que la de absorción para que un haz de luz que pase entre los
niveles 1 y 2 de los átomos de una muestra produzca emisión estimulada.11

Pemis estim  Pabs  N 2  N1 g 2 / g1  N 2 / N1  g 2 / g1


N2 / N1 = ( g2 / g1 )exp(−h / K BT )
Mediante absorción de fotones desde el nivel 1 al 2 lo máximo que se puede conseguir
es N2/N1 = g2/g1. Por ello es preciso que entren en juego más niveles mediante un
proceso de bombeo con tres o cuatro niveles.

11
Notar que la espontánea se reparte en todas las direcciones y no contribuye a la intensidad
del haz.
Bombeo con tres niveles

Mediante absorción de fotones (u otra


energía) los átomos pasan del nivel 1 al 3.
De aquí caen rápidamente al 2 (sin dejar
que lleguen al 1 otra vez). Si la energía
que produce las transiciones 1 → 3
(energía de bombeo) es suficiente, se
puede conseguir la inversión de
población. Como el nivel 1 es el
fundamental, el bombeo al nivel 2
consume mucha energía y el proceso de
amplificación es poco eficiente.

Como ejemplo está el láser de rubí que emite a 694,3 nm (luz roja). La potencia de
bombeo necesaria puede deteriorar al rubí, por eso el bombeo se hace pulsante (para
que se enfríe) y por eso la luz láser también es pulsante.
Bombeo con cuatro niveles

La transición de bombeo se hace entre el


nivel 0 y el 3. La transición 3 → 2 debe ser
muy rápida y la vida media del nivel 2
larga, como antes. La vida media del nivel
1 debe ser muy corta para que no se
acumulen átomos en él. Como la
inversión de población se hace respecto a
un nivel que no es el fundamental y está
poco poblado, hace falta mucha menos
energía, el proceso de amplificación es
mucho más eficiente.

Como ejemplo está el láser de neodimio que emite a 1,064 m (infrarrojo). Como el
bombeo de cuatro niveles es más eficiente, hace falta menos energía de bombeo y se
calienta menos la muestra. Esto permite emisión láser en régimen continuo.
Bombeo por transferencia

En los gases los niveles de energía son


estrechos y el bombeo óptico no es
eficiente. Se emplea el bombeo por
transferencia que se basa en la
recombinación de iones de un átomo
ionizado por descarga eléctrica.12

12
Al crearse iones de He se recombinan con electrones formando átomos de helio neutros en
estados excitados. Estos interaccionan con átomos de Ne en estado fundamental, que los sube
Como ejemplo, el láser de He-Ne es muy estable y funciona en régimen continuo. La
longitud de onda habitual de emisión es 633 nm.

Láseres de semiconductor. Bombeo por inyección de portadores


Se basan en la emisión que tiene lugar en una unión P-N con polarización directa. Puede
demostrarse que si la intensidad de portadores (electrones y huecos) inyectados es
suficientemente alta se produce inversión de población que desencadena emisión
láser. Estos láseres se utilizan, por su pequeño tamaño, en comunicaciones ópticas.
Modulando la corriente de inyección se modula la emisión láser, de esta manera, se
transfiere al emisor láser la información que se quiere transmitir ópticamente.

Amplificación de luz

Vamos a desarrollar un modelo sencillo que permita calcular la intensidad a la salida de


un amplificador de luz:

I ( z) = I (0) exp[ ( ) z]
Como puede verse, en este caso la ganancia (I(d)/I (0)) crece exponencialmente con la
longitud del medio amplificador y es mayor cuanto mayor es la inversión de población
y cuanto menor es la velocidad de grupo de la luz en el material.
Dem.
Se considera que el bombeo es uniforme a lo largo del medio amplificador y que se
consigue que N1 y N2 sean constantes.

El cilindro de la figura izquierda tiene una sección de área unidad. Tenemos que:

a estado excitado. Así se quedan despoblados niveles inferiores en el Ne y se da la inversión de


población.
Pabs = N1 B12 W = N1 B12 I / Vg

Pemis estim = N 2 B21 W = N 2 B21 I / Vg

dI = ( Pemis estim − Pabs )h dz = ( N 2 B21 − N1 B12 )( I / Vg )h dz

Donde:

 ( ) = ( N 2 B21 − N1 B12 )(h / Vg )

Obteniendo entonces:

dI / I =  ( ) dz
I ( z) = I (0) exp[ ( ) z]
QED.
5. Fuentes de luz láser
Un emisor láser consta de un medio amplificador
(convenientemente bombeado) colocado entre dos
espejos (E1, E2). Cuando se emite un fotón por
emisión espontánea en la dirección perpendicular a
los espejos sufre múltiples reflexiones en ellos. El
paso múltiple de esta luz por el medio amplificador
produce un haz de luz intenso, que puede salir al
exterior si uno de los espejos (E2 por ejemplo) es
parcialmente transmisor.

Los dos espejos E1 y E2 constituyen lo que se denomina cavidad láser o resonador. Las
pérdidas por reflexión deben ser inferior a la ganancia del medio. La luz que se emite
inclinada respecto al eje sufre una amplificación despreciable frente a la de la luz que va
a lo largo del eje, por tanto, proporciona una energía bastante bien dirigida y como los
fotones emitidos por emisión estimulada tienen sus fases relacionadas con los
estimuladores, la luz láser es muy coherente.

5.1 Láser linealmente polarizado


En los láseres de gas la ganancia es pequeña y, por tanto, las pérdidas por reflexión
imposibilitan su funcionamiento. Hay varias soluciones:

• Colocar ventanas en los extremos del tubo, de forma que la luz que se propaga
a lo largo del eje incida con ángulo Brewster sobre ellas. De esta manera
solamente se amplifica la polarización que no sufre pérdidas y el láser emite luz
linealmente polarizada.
• Depositar multicapas anti-reflectantes sobre ventanas perpendiculares al eje.
En este caso la luz láser emitida es despolarizada (natural).
• Solución mixta: uno de los espejos se pone en el extremo de la cavidad (fijo) y el
otro fuera para poder alinearlo con el primero. De esta manera solamente es
necesaria una ventana en ángulo Brewster si se quiere producir luz láser
polarizada.

5.2 Amplificadores de fibra óptica


Para construir un láser de fibra óptica hay
que añadir espejos a ambos extremos del
amplificador. La luz láser se genera a
partir de la emisión espontánea que
queda confinada en ambos sentidos de la
fibra y que posteriormente se amplifica a
lo largo de la fibra. Para construir láseres
más estables, conviene que los espejos
sean de fibra óptica.

Se construyen láseres de fibra con distintos átomos amplificadores. Los más usados son
los de erbio (para comunicaciones ópticas) y los de iterbio (para producir alta potencia).
Resumen de características de algunos láseres:
3
Detectores de luz
1. Introducción a los fotodetectores
Un fotodetector es un dispositivo que cambia algún parámetro físico medible cuando
absorbe luz, pudiendo así medir el flujo radiante que recibe. Existen dos tipos básicos
de fotodetectores:

• Detectores fotónicos
Absorbe fotones que originan cargas móviles, que con un campo eléctrico dan lugar a
una corriente eléctrica (medible). Cuando las cargas escapan de material tenemos
efecto fotoeléctrico y sino, fotoconductividad.

• Detectores térmicos
La energía luminosa absorbida se convierte en calor, que cambia la temperatura del
material, modificando así alguna magnitud medible para determinar el flujo incidente.
Llamaremos S(Fe ) a la señal de salida que proporciona el fotorreceptor, que depende
del flujo radiante Fe. La eficiencia se mide como S/Fe (responsividad). Cuando el
detector responde de forma diferente a dos flujos radiantes iguales, pero de distinta
longitud de onda, empleamos S(λ) (respuesta espectral). Es necesario determinar el
punto de trabajo apropiado S(T) (temperatura inicial, en el caso de detectores térmicos)
o S(V) (voltaje de alimentación, en el caso de detectores fotoeléctricos).
La señal de salida se ve afectada por un ruido total (número variable de fotones en Fe,
variabilidad en la conversión de fotones en fotoelectrones, conductividad de materiales,
etc.) que determina la calidad de la detección señal/ruido. Se puede disminuir el ruido
promediando la señal durante el tiempo de integración.
La sensibilidad se define como el flujo radiante mínimo que produce una señal
distinguible del ruido de oscuridad. Como el flujo varía con el tiempo, se analiza como
es la respuesta en función de la frecuencia:
La función Spp(f) se llama función de
transferencia. La frecuencia (fc) para la
que Spp(fc)/Spp(0)=1/2 se llama frecuencia
de corte y su inversa es el tiempo de
respuesta del detector (tr=1/fc).

No es recomendable que en el espectro de frecuencias de la señal haya frecuencias


superiores a 0,1fc con amplitud apreciable. En caso contrario, la respuesta del detector
afecta a la señal y ésta queda distorsionada. Es decir, S(t) no tiene la misma forma que
Fe(t).
2. Célula fotoeléctrica
Una célula fotoeléctrica está formada por dos
polos, negativo (fotocátodo o superficie
recubierta con material fotoeléctrico) y positivo
(ánodo o electrodo). Cuando la luz incide sobre
el cátodo, se liberan electrones, que son
atraídos hacia el ánodo y producen una
corriente eléctrica, que permite medir el flujo
radiante incidente.

Lo que realmente se mide es la caída de tensión VS que esta corriente produce en una
resistencia de carga RL. Es necesario un voltaje de alimentación elevado para generar
una corriente apropiada y un voltaje Vs que varíe lineal con Fe.
El rango espectral de detección va desde 100nm hasta 1700nm, si bien la señal va
acompañada de ruido por la emisión térmica de fotoelectrones del cátodo (disminuible
por refrigeración).
No se pueden detectar señales cuyo tiempo de evolución sea del orden o inferior a la
anchura del pulso de corriente (electrones de velocidades diferentes generados por un
pulso instantáneo de luz) o al tiempo de respuesta del circuito RLC que se forma.

3. Fotomultiplicador
El fotomultiplicador multiplica la
corriente anódica de la célula
fotoeléctrica. La multiplicación se hace
por la liberación de electrones en el
choque de los que salen del fotocátodo
con dynodos.

Al final se mide la caída de tensión VS que produce la corriente anódica en la resistencia


de carga RL. El fotomultiplicador se comporta igual que la fotocélula, pero sus
parámetros característicos son diferentes debido al proceso de multiplicación, tienen
una responsividad, sensibilidad y rapidez superiores, pero necesitan un mayor voltaje
de alimentación.
4. Fotoconductor
Cuando en un material semiconductor se absorbe
un fotón y pasa un electrón de la B.V. a la B.C.,
aparece un par electrón-hueco que crea una
corriente eléctrica si el material se somete a una
diferencia de potencial.
Se alimenta mediante un voltaje constante (V) y se suele colocar en serie con una
resistencia de carga (RL) para extraer la señal. La responsividad disminuye con el
tamaño del fotoconductor, pues los pares electrón-hueco pueden recombinarse con
otros portadores en su camino a los electrodos.
El tiempo de respuesta también disminuye con el tamaño y depende del tiempo de
respuesta del circuito RLC. La señal también va acompañada de ruido por la emisión
térmica.
Presentan un mayor rango espectral que las anteriores, aunque tiene peor
responsividad que los fotomultiplicadores. La sensibilidad y voltaje de alimentación es
similar al de las fotocélulas, pero su respuesta es muy lenta.

5. Fotodiodos PN
Mejoran a los fotoconductores polarizando la
unión PN de forma inversa (para evitar
recombinaciones) y potenciando la barrera de
potencial, que promueve el movimiento de los
pares electrón-hueco.
En general, el fotodiodo se pone en serie con una resistencia de carga, RL y se mide la
caída de tensión VS que produce la corriente. Cuando se opera sin voltaje de
polarización se dice que el fotodiodo trabaja en régimen de célula fotovoltaica., se
puede detectar luz, pero con menos eficiencia y además con V adecuado garantizamos
la linealidad de la función característica VS(Fe).
La anchura de pulso de corriente es mucho menor porque el campo eléctrico de la
barrera de potencial es muy intenso. Por ello, el tiempo de respuesta es menor. En
general no necesitan refrigeración para disminuir el ruido ambiente.
Su rango espectral es similar al de las fotocélulas y fotomultiplicadores. Con los
fotoconductores presenta menos responsividad, pero más sensibilidad y rapidez. Con
las fotocélulas presenta menos sensibilidad cuando están refrigeradas. Con los
fotomultiplicadores pueden ser tan rápidos y de similar voltaje.

6. Fotodiodos PIN
Mejoran a los PN introduciendo un
semiconductor intrínseco entre P y N. La barrera
y zona desierta se extienden a toda la zona
intrínseca, por los pocos portadores que hay en
el intrínseco.
El aumento del espesor de la zona desierta implica el aumento de la responsividad al
aumentar el tamaño de la zona que es capaz de generar portadores móviles y disminuye
el tiempo de respuesta al disminuir la proporción de portadores que se generan fuera
de la zona desierta.

7. Fotodiodos de avalancha (ADP)


Los fotones son absorbidos en la zona
intrínseca y los fotoelectrones van hacia la
zona P bajo la influencia de un campo
eléctrico moderado. Al llegar a la zona PN+ el
campo eléctrico crece comunica a los
electrones energía suficiente como para
arrancar varios del material por colisión. Esto
origina un fenómeno de multiplicación.

Los fenómenos de avalancha mejoran la responsividad, pero empeoran la sensibilidad


y aumentan el tiempo de respuesta. Cuando se detectan señales pequeñas frente a la
corriente de oscuridad es importante obtener más corriente con el mismo flujo radiante,
porque la proporción de ruido disminuye con el aumento de la corriente.

8. Termopilas
Las termopilas se basan en el efecto termoeléctrico:
cuando se ponen en contacto dos materiales
termoeléctricos en puntos de diferente
temperatura, aparece una diferencia de potencial
que crece con la diferencia de temperaturas. Se
puede medir así la temperatura de un punto si la del
otro se mantiene constante. Si se conecta uno de
ellos a un conductor térmico absorbente, aumenta
la temperatura con la incidencia de luz. Permite
medir el flujo absorbido y transformado en calor

La lámina debe tener muy poca capacidad calorífica (para que el incremento de
temperatura sea lo mayor posible) y conductividad térmica grande (para que se alcance
el equilibrio térmico lo antes posible). Para potenciar el efecto termoeléctrico se colocan
en serie varios termopares formando una termopila protegida por una película
protectora.
La curva de respuesta espectral debería ser plana ya que la energía luminosa se
transforma en calor con independencia de la longitud de onda, sin embargo, hay
variaciones porque las láminas absorbentes no se comportan exactamente como el
cuerpo negro y a que la transmisión de las películas protectoras varía con la longitud
de onda.
Respecto a los fotoconductores son igual de sensibles, pero más lentas. Se usan para
medir longitudes de onda altas, calibrar láseres y medir temperatura a distancia
(aprovechando la radiación infrarroja del cuerpo a medir).

9. Bolómetros
Formados por una lámina absorbente de radiación en
contacto térmico con un termistor (cuya resistencia
varía con la temperatura que adquiere la lámina al
calentarse). La medida de la resistencia del termistor
proporciona el valor del flujo radiante absorbido.

Para compensar los efectos de la temperatura ambiente se suele medir


simultáneamente las resistencias de dos termistores idénticos, uno conectado a la
lámina absorbente y el otro aislado de la radiación. Aunque los hay más sensibles
formados por mallas de hilos aislantes que impiden el contacto térmico con el entorno.
Se consigue una sensibilidad muy buena, cercana a la de los fotomultiplicadores
refrigerados, pero en el rango de infrarrojos y ondas milimétricas. Son más rápidos que
las termopilas. Se utilizan en espectrómetros muy sensibles y detección de longitudes
de onda largas (como el fondo de radiación cósmica del universo).
10. Detectores de imagen
Para medir el flujo que llega a los distintos puntos de un plano. Hay analógicos (placas
fotográficas) y digitales (alineamiento de fotodiodos).
Placas fotográficas

Están formadas por haluros de plata


en una emulsión de gelatina y
cubiertas por una capa protectora.
Cuando se expone a la luz, los
fotones provocan que los electrones
pasen a la B.C. e interaccionen con
iones de plata para formar átomos
de plata neutros.

Habrá granos que no hayan absorbido ningún fotón (que, por ello, no contendrán ningún
átomo de plata neutro) y, al contrario. En el proceso de revelado se introduce la placa
en un producto químico que sólo actúa sobre los granos con átomos de plata neutros.
Así, se convierten a todos los iones de plata en átomos de plata, de forma que todos los
granos revelados quedan ennegrecidos. Luego con un fijador se eliminan los granos no
revelados.
Alineamientos de fotodiodos

En cuanto a las matrices de fotodetectores, se


fabrican con fotodiodos microscópicos. Se suele
acoplar un condensador en la salida de a cada píxel
que adquiere una carga proporcional a la señal
detectada. La medida secuencial de las cargas de los
condensadores permite obtener la señal detectada.
Tenemos así detectores de imagen que se
denominan CCD (charge coupled devices).

Láminas microcanal

Son intensificadores de imagen, convierten una imagen


débil en otra con intensidad amplificada. Los más
usuales emplean láminas microcanal, cada capilar
funciona como un multiplicador de electrones pues
entre las caras se establece una diferencia de potencial.
Cuando los electrones impactan, liberan otros y se
produce la avalancha.

Para intensificar una imagen se proyecta sobre un fotocátodo transparente que emite
electrones por una lámina microcanal y después van a parar a una pantalla fluorescente
que reproduce la imagen amplificada.
4
Radiometría, fotometría y colorimetría
Cuando la radiación es emitida o recibida es necesario conocer sus características (flujo
radiante y espectro). La radiometría permite determinar estas características mediante
los detectores que se han estudiado en la lección anterior, mientras que la fotometría y
la colorimetría permiten determinarlas a través de la observación mediante el ojo.

1. El ojo humano
La imagen se forma (invertida) sobre la retina (que
contiene los detectores que transmiten la imagen
al cerebro) a través de fibras nerviosas que salen del
ojo por el nervio óptico. Hay detectores de dos
tipos: los bastones solamente transmiten
información de intensidad, mientras que los conos
transmiten información de intensidad y de color. La
transmisión de la información del color se hace a
través de tres tipos de conos que son sensibles a
diferentes zonas del espectro (rojo, verde o azul).

En la fóvea la concentración de bastones es pequeña porque existen muchos conos que


proporcionan una visión mejor. Conforme disminuye la concentración de conos
aumenta la de bastones hasta alcanzar un valor máximo, a partir del cual decrece
suavemente para conseguir que la percepción del campo visual disminuya suavemente
hacia la periferia.
Cuando el nivel de luminosidad del objeto es suficiente para activar los conos (visión
diurna o fotópica) la visión es en color. A niveles bajos de luminosidad solamente
funcionan los bastones, entonces la visión es en escala de grises y menos nítida (visión
nocturna o escotópica).
El ojo humano no percibe con la misma eficiencia todas las longitudes de onda. Se
emplea la variable factor de visibilidad Vλ que es la longitud de onda de la respuesta
espectral entre la del valor máximo (longitud que se ve con la máxima claridad, 555nm
fotópica y 507nm escotópica).
2. Magnitudes radiométricas y fotométricas
En radiometría la magnitud básica es el flujo radiante (Fe) que se define como la energía
emitida por un radiador en la unidad de tiempo y se mide en vatios (W):

Flujo radiante : Fe (W )
En fotometría la magnitud básica es el flujo luminoso (F). El flujo luminoso
correspondiente a un flujo radiante Feλ se define como13:

Flujo luminoso : F = K Fe V ; F = K  Fe V d 
0

Y se mide en lumen (lm):

1W de 555 nm  680 lm  K = 680 lm / W


Para medir las propiedades de absorción, reflexión y transmisión de energía de un
cuerpo se define la absorbancia, reflectancia, transmitancia y densidad óptica:

En las expresiones anteriores Fei, Fea, Fer, Fet son los flujos radiantes incidente,
absorbido, reflejado o transmitido respectivamente.
La intensidad radiante de una fuente puntual se define como el flujo radiante emitido
por unidad de ángulo sólido y se mide en vatios partido por estereorradián (W/esterad):

d Fe
Intensidad radiante : I e = (W / esterad )
d

La intensidad luminosa se define de forma análoga y se mide en candelas


(cd=lm/esterad):

dF
Intensidad luminosa : I = (cd = lm/esterad)
d

La magnitud que define la irradiación de la fuente es la irradiancia en radiometría y la


iluminación en fotometría, que se definen como el flujo radiante o el flujo luminoso que
recibe la unidad de área. Sus unidades son el W/m2 o el lux (lx=lm/m2):

d Fe dF
Irradiancia : Ee = (W / m 2 ) Iluminación : E = (lx = lm / m2 )
dS dS

13
Si la luz es policromática se define con la integral a todas las longitudes de onda.
2.1 Fuentes puntuales. Relación entre intensidad e irradiancia
Para un emisor puntual sobre una superficie S, obtenemos la ley del cuadrado de la
distancia (irradiancia o iluminación si se cambia Ie por I). La dependencia con 1/r2 es
debida a que en P nace una onda esférica. La máxima eficiencia en la irradiación tiene
lugar en la dirección normal:

I e cos 
Ee =
r2
Siendo obtener el flujo radiante o luminoso recibido por una superficie S:

I e cos 
Fe =  d Fe =  dS
S S r2
Dem.
Consideremos una fuente puntual P que irradia
una superficie receptora. En la figura Ie es la
intensidad radiante en dirección PO, r es la
distancia entre P y O, α es el ángulo que forma
la normal a la superficie receptora en O con la
dirección PO. Queremos calcular la irradiancia
en el punto O a partir del cálculo del flujo dFe
recibido por un pequeño elemento de
superficie dS que rodea a O. Lamaremos dω al
ángulo sólido subtendido por dS desde P.

Tomando:

dFe I e d 
Ee = =
dS dS

d S cos 
d =
r2
Se lleva a cabo la deducción de la expresión de la irradiancia:

I e cos 
Ee =
r2
Integrando la expresión se puede obtener el flujo radiante o luminoso recibido por una
superficie S:

I e cos 
Fe =  d Fe =  dS
S S r2
QED.
2.2 Fuentes extensas. Relación entre radiancia, intensidad e irradiancia
El flujo recibido por el área dS2 en
torno a O debe ser proporcional al
brillo de la fuente, al área dS1 del
emisor y al ángulo sólido dω, y
debe depender del ángulo α1.

Expresamos el diferencial de flujo radiante:

dFe = Le f (1 ) dS1 d


Donde Le se llama radiancia y caracteriza el brillo de la fuente y f(α1) es un factor
adimensional que se normaliza de forma que f(0)=1.

Le dimensiones de intensidad / área (W/estrad × m 2 )

La magnitud fotométrica análoga (L) se llama luminancia y se mide en nit (nit=cd/m2):

Luminancia L (nit = cd/m2 )


La irradiancia será14:

dFe L e d S1 f (1 ) cos  2 dI e cos 2


Ee = = =
dS2 r2 r2

Donde el diferencial de intensidad radiante se ha definido como:

dI e = L e f (1 ) d S1

Dem.
Tomamos como diferencial de ángulo sólido:

d S2 cos  2
d =
r2
Y sustituimos en el diferencial de flujo radiante:

L e d S1 d S2 f (1 ) cos  2
dFe =
r2
Ahora sustituimos en la expresión de irradiancia.
QED.

14
La irradiancia puede ponerse formalmente igual a la ley del cuadrado de la distancia para
fuentes puntuales.
Emisor Lambertiano
Si nos fijamos en la expresión:

dFe = Le f (1 ) dS1 d


Existen un tipo de emisores particulares llamados emisores perfectos o Lambertianos
que son aquellos para los que:
Emisor Lambertiano
f ( ) = cos 

Son emisores Lambertianos algunos15 emisores naturales y lámparas y los vidrios


esmerilados y superficies pintadas con pintura blanca de grado fino, cuando reflejan
luz. Podemos particularizar las expresiones anteriores para el caso de emisores
Lambertianos (que de ahora en adelante usaremos, por ser los más comunes):

2.3 Receptor circular


Cálculo del flujo radiante (o flujo luminoso) recibido por un receptor circular que es
irradiado por una pequeña fuente superficial:

2 R d  L e d S1 R 2
Fe = L e d 2 d S1  d   =
0 0
 d 2 +  2 
2
R2 + d 2

O equivalentemente:

Fe =  Le dS1 sen 2 max


Donde:
𝑅 𝑅
𝑠𝑒𝑛𝛼𝑚𝑎𝑥 = =
𝑟 𝑑2 + 𝑅2

Dem.

15
No son Lambertianos emisores especiales como las mariposas o aves de plumaje peculiar
porque se componen de cristales fotónicos y no pigmentos tal que su forma de emitir no es
por reflexión si no por refracción.
Expresamos el diferencial de flujo:

L e cos 1 cos  2 d S1 d S2
dFe =
r2
Donde los ángulos y el diferencial de superficie del receptor se pueden poner como:

1 = 2 = 
dS2 =  d  d
Ahora sustituimos:

L e cos 2  d S1  d  d L e d 2 d S1 d  d 
dFe = ==
d2 + 2
2
 d 2 +  2 

Y entonces integramos:

2 R d  L e d S1 R 2
Fe = L e d d S1  d  
2
=
0 0
 d 2 +  2 
2
R2 + d 2

Que teniendo en cuenta:

𝑅 𝑅
𝑠𝑒𝑛𝛼𝑚𝑎𝑥 = =
𝑟 𝑑2 + 𝑅2
Podemos poner:

Fe =  Le dS1 sen 2 max

QED.
Ahora, cuando el contorno del área receptora no es tan simple como una
circunferencia, el cálculo del flujo obliga a realizar una integración numérica, a no ser
que la superficie receptora sea lo suficientemente pequeña como para que no sea
necesaria la integración. Vamos a estudiar este problema a partir de la solución
encontrada para superficie receptora con contorno circular.
Para ello, vamos a suponer que el flujo aproximado es aquel que se obtiene cuando el
disco grande se ve muy pequeño (por ejemplo, a grandes distancias de él):

F ´e =  Le dS1 R 2 / d 2

Y podemos comparar el resultado exacto del flujo con el aproximado y calcular el error
de la aproximación:

F  − Fe  R 
2

e= e = 
Fe d
Teniendo en cuenta que no se consiguen medidas radiométricas ni fotométricas con
errores inferiores al 1%, se calcula el valor que debe tener el radio de la superficie
receptora para que la aproximación tenga este error:

1% de error si R/d = 0.1


Generalizando esta expresión a otros contornos, resulta que podemos evitar la
integración siempre que el máximo tamaño lineal de la superficie receptora no exceda
la quinta parte de la distancia a la fuente luminosa.

2.4 Emisor circular


En este caso vamos a hacerlo al revés, el emisor será el disco grande, de tal forma que
el cálculo de la irradiancia (o iluminación) se hace integrando sobre la fuente.
Obtenemos:

2 R d  L e R2
Ee = L e d  d  =
2
0 0
 d 2 +  2 
2
R2 + d 2

Y con la expresión del ángulo igual que antes:

Ee =  Le sen 2 max

Dem.
Realizamos un desarrollo similar:

L e cos 1 cos  2 d S1
dEe =
r2
Con:

1 = 2 =  dS1 =  d  d
De forma que:

L e cos 2   d  d
dEe = =
d2 + 2

Le d 2  d  d 
= 2
 d 2 +  2 

Si integramos:

2 R d  L e R2
Ee = L e d  d  =
2
0 0
 d 2 +  2 
2
R2 + d 2

QED.
Si se hace un estudio de la posibilidad de considerar como infinitesimal el área de un
emisor extenso. Se obtiene el mismo resultado que se obtuvo en el estudio de receptor
extenso:

E´e =  Le R 2 / d 2

Con el error en la aproximación:

E´ − E  R 
2

e= e e = 
Ee d
Para el radio:

1% de error si R/d = 0.1


2.5 Emisores secundarios
Vamos a estudiar lo que ocurre con un receptor cuando emite (por reflexión o
transmisión difusa) parte de la energía recibida. Consideramos el caso de reflexión (o
transmisión) en un difusor Lambertiano. Obteniendo la expresión para la radiancia de la
superficie que refleja (emisor secundario):

Le =  Ee / 
Y una expresión análoga para el caso en el que el emisor secundario se observa por
transmisión:

Le =  Ee / 

Dem.
El emisor tiene área dS1 y reflectancia ρ. El flujo que recibe la superficie dS1 es Fe=EedS1
y el flujo que reemite Fer=ρEedS1. Este flujo puede también calcularse teniendo en cuenta
que debe de coincidir con el calculado considerando que la superficie dS 1 presenta una
radiancia Le.
Para ello construimos una semiesfera de radio r, calculamos el flujo reemitido que pasa
por un elemento de superficie dS2 y lo integramos sobre la semiesfera. Como los ángulos
α1 y α2 que intervienen en la ley del cuadrado de la distancia (α1=α y α2=0) no cambian
en una corona circular construida como indica la figura, tomaremos ésta como elemento
de área dS2.
Buscamos una expresión del flujo reemitido en función de Le. Para ello empezamos por:

Fe = Ee dS1
Fer =  Ee dS1

De donde:

L e cos1 cos 2 d S1 d S2
dFer =
r2
Y aplicamos:

1 =   2 = 0
Entonces para la superficie de la esfera:

dS2 = 2 r sen r d
= 2 r 2 sen d
Y con eso integramos:
 /2
Fer = 2 Le dS1  sen cos d =  Le dS1
0

Obteniendo la expresión:

Le =  Ee / 
QED.
3. Medidas radiométricas
El objetivo será medir el flujo
radiante parcial, que se puede
obtener tanto por emisión directa
o por reflexión/trasmisión difusa
de una muestra.
En algunas ocasiones es preciso
conocer el flujo absoluto para lo
cual es preciso utilizar detectores
calibrados mediante radiadores
patrón.

El flujo puede ser dinámico o estático, si es dinámico habrá que asegurarse que la
respuesta del detector sea rápida (y se suele medir el flujo parcial).
A partir de las medidas de flujo y de las relaciones radiométricas que hemos estudiado,
se pueden obtener parámetros del emisor (Ie o Le) o de la muestra (ρ o t) que permitan
realizar estudios sobre ellos.

3.1 Esfera integrante


Para medir el flujo radiante total emitido
en todas las direcciones por una fuente se
utiliza la esfera integrante de Ulbrich, que
consiste en una esfera hueca recubierta
de blanco difusor, con una pequeña
abertura de salida y un obstáculo que
impide la llegada directa de la luz de la
fuente a la abertura.

Cuando se introduce una fuente en la parte central de la esfera, el flujo que sale por la
abertura es proporcional al flujo total emitido por la fuente. Para determinar la
constante de proporcionalidad hay que realizar una medida con una lámpara calibrada.
Se utilizan también cuando es preciso medir flujos radiantes tan altos que deteriorarían
el detector si se dirigiesen directamente a él.
4. Colorimetría
Cuando la luz emitida por una fuente llega a un punto, la
información desde la radiometría es el flujo radiante total y el
espectro. Desde el punto de vista de la fotometría, el ojo percibe
de la luz los atributos del color: luminosidad, tono y saturación.

• Luminosidad: flujo del haz de luz


• Tono: tipo de color
• Saturación: proporción de blanco

Tono y saturación son atributos cromáticos.

4.1 Metamerismo. Leyes de Grassmann


El metamerismo es la incapacidad del ojo de distinguir todas las longitudes de onda del
espectro visible. Esta limitación viene dada por el número de conos disponibles.
La existencia de tres tipos de conos induce al manejo del color mediante un álgebra en
la que los colores se intenten obtener mediante mezclas realizadas con tres colores
básicos (colores primarios).
En esta álgebra hay que considerar el metamerismo a través de las llamadas leyes de
Grassman. Estas leyes están esquematizadas:

A= B y C = D  A+C = B + D
Donde A y B son metámeros al igual que C y D.

4.2 Mezcla de colores: colores primarios y coordenadas tricromáticas


Los tres colores promarios son el RGB
(red, green, blue). Cualquier color C se
puede obtener como una combinación
lineal de estos. Siendo los colores (P1, P2,
P3) y los coeficientes (t1, t2, t3), que
regulan los flujos luminosos y deben
cumplir 1=t1+t2+t316. Además, esta
relación indica que es suficiente con
representar dos de las coordenadas en un
diagrama bidimensional para tener una
representación completa de los atributos
cromáticos (sólo hay 2 grados de
libertad, aunque haya 3 coordenadas).

16
Así, en general normalizaremos los colores (que afecta a la luminosidad, pero no al tono).
A veces no es posible obtener un determinado color C como mezcla de los tres primarios.
En estos casos siempre es posible obtener una mezcla de C con uno de los primarios
como mezcla de los otros dos primarios. Esto implica la existencia de coordenadas
tricromáticas negativas.

4.3 Álgebra del color (triángulos de Maxwell)


Una forma típica de representar el color en un diagrama
plano consiste en situar los tres primarios en los vértices
de un triángulo rectángulo. Se puede expresar las
coordenadas de los dos colores:

1CA = t1A P1 + t2 A P2 + t3 A P3
1CB = t1B P1 + t2 B P2 + t3B P3

Entonces una mezcla de ambos se puede dar el la proporción que sea (m,n):

mC A + nCB = (mt1 A + nt1B ) P1


+ (mt2 A + nt2 B ) P2
+ (mt3 A + nt3 B ) P3
Donde quedaría:

1CmA+nB = r1P1 + r2 P2 + r3 P3
Si hacemos:

ri = (mtiA + ntiB ) /(m + n)


A partir del resultado es evidente que el color C queda alineado con CA y CB cuando se
representa en el diagrama y que sus distancias a estos son inversamente
proporcionales a los coeficientes m y n de la mezcla:

C AC n
=
CCB m

Se puede conseguir C de infinitas mezclas porque hay infinitos segmentos que pasan por
C (luego hay infinitos metámeros).
Todos los colores con coordenadas tricromáticas positivas se encuentran en el interior
del triángulo, mientras que se encuentran fuera los colores con alguna coordenada
negativa.
4.4 Sistema RGB
Uno de los sistemas de primarios más conocidos
es el RGB. Los primarios corresponden a luces
monocromáticas cuyas longitudes de onda son:

B en el origen, R eje horizontal y G en el vertical.


Pero se hace cambio de escalas para que las tres
coordenadas del blanco sean 1/3.

Las coordenadas tricromáticas de las longitudes de onda del espectro visible forman el
lugar del espectro (la curva negra que rodea la figura). Los demás colores reales son
mezclas de los situados en el lugar del espectro, por lo que se encuentran en el interior.

4.5 Sistema XYZ (sistema CIE)17


Como en el RGB hay muchos colores con coordenada negativa se introduce el sistema
XYZ, donde los primarios (X,Y,Z) no corresponden a colores reales. Z se toma como
origen de coordenadas, ZX y ZY se toman como ejes cartesianos (x, y). Se eligen de forma
que:

• y lleve toda la información del flujo luminoso.


• XY y ZY sean tangentes al lugar del espectro y XZ pase por el origen del sistema
RGB.
• Las tres coordenadas del blanco patrón sean igual a 1/3.
El paso de coordenadas tricromáticas del sistema RGB al XYZ se lleva a cabo mediante
la transformación:

 x r 
 y = M g 
   
 z   b 
 2.7689 1.7517 1.1302 
M =  1 4.5907 0.0601
 0 0.0565 5.5943

17
El triángulo rojo en la gráfica de arriba.
Valores triestímulo en el sistema XYZ
La figura muestra tres curvas que representan
las coordenas x, y, z de los puntos del lugar
del espectro, denominadas valores
triestímulo. La ventaja de este sistema es la
medida de espectros directamente, en lugar
del experimento de mezcla de colores.

Para determinar las coordenadas x, y, z correspondientes a un color, hay que conocer el


espectro de la luz correspondiente y operar:

4.6 Sensibilidad a las diferencias de color


El número de colores reales que existen en el
interior de la representación del color viene
determinado por la sensibilidad del ojo a las
diferencias de color. Esta sensibilidad cambia
con la dirección de forma que el lugar
geométrico de los puntos que comienzan a
diferenciarse en color desde un punto fijo es
una elipse (elipse de MacAdam).
5
Medios dieléctricos anisótropos
Fenómenos electro-ópticos y magneto-ópticos
1. Medios anisótropos. Tensor dieléctrico
La propagación de ondas electromagnéticas viene dada por las ecuaciones de Maxwell.
Cuando el medio es isótropo las propiedades eléctricas y magnéticas no cambian con la
dirección. En los medios anisótropos si lo hacen, entonces se emplean tensores
dieléctricos y tensores permeabilidades magnéticas en lugar de las constantes.
Los medios más interesantes son los anisótropos eléctricos, que sólo presentan
anisotropía eléctrica:

2. Ejes principales
Al diagonalizar el tensor dieléctrico se obtienen:

Si el campo eléctrico es paralelo a uno de los ejes principales, la onda se propaga con
la constante dieléctrica principal correspondiente. Por ejemplo, si es paralelo al eje ⃗⃗⃗⃗
𝑈1 :

E U1 ( E1 = E , E2 = 0, E3 = 0)  D1 = 1 E , D2 = 0, D3 = 0 ( D = 1E )

2.1 Ejes principales. Medios cristalinos


A partir de las constantes dieléctricas principales se pueden definir las velocidades
principales (cuando las εi son reales) Vi y los índices de refracción principales ni:

Vi = 1/  i 

c i
ni = = =  ir r
Vi  0 0

Si el campo eléctrico de un haz de luz es paralelo al eje principal, i, la luz se propaga con
constante dieléctrica εi, velocidad de fase Vi e índice de refracción ni.
Cuando las εi son complejas se puede mantener la definición de las ni y aparecen índices
de refracción principales complejos. Esto significa que el medio anisótropo es
absorbente.
Como ε1, ε2, ε3 pueden ser reales o complejas con independencia unas de otras, puede
ocurrir que el cambiar la dirección del campo eléctrico de la luz el medio pase de ser
absorbente a ser transparente o a la inversa. Esta propiedad se llama tricroismo
(diferente comportamiento de los tres ejes principales respecto a la absorción).18
Las aplicaciones ópticas más importantes de los medios anisótropos se llevan a cabo con
cristales transparentes. Los cristales tienen simetría de traslación y por este motivo el
tensor dieléctrico de estos medios se puede diagonalizar en una base cartesiana. Por
tanto, los ejes principales son los ejes X, Y, Z y las constantes dieléctricas principales son
εx, εy, εz.

Dx =  x Ex , Dy =  y E y , Dz =  z Ez

3. Medios dieléctricos cristalinos transparentes. Propagación de ondas


Cuando una onda se propaga en este medio se
obtiene que el desplazamiento eléctrico y
campo magnético son ortogonales a la dirección
de propagación, pero el campo eléctrico no,
porque no es paralelo al desplazamiento ya que
están ligados por una relación tensorial.

Se representan sólo las partes reales, pues en realidad son complejos. Las expresiones
relacionadas:
Expresión Sólo parte real
n n
(a) : H s = D (a) : H R  s = DR
c c
n
(b) : s  E = H
c
(c ) : D  s = 0 (c) : DR  s = 0
(d ) : H  s = 0 (d ) : H R  s = 0

La expresión del vector de Poynting en la que el vector ρ (unitario) indica la dirección


de propagación de la energía (dirección de los rayos):

18
Por el momento vamos a estudiar medios transparentes, en los que las εi son reales y también
las ni.
n 2
S = ER  H R = ER H R  = E R cos  
c

La energía y los frentes de onda se propagan en direcciones diferentes. Esto significa


que, al propagarse la energía, los frentes de onda que la acompañan no son
perpendiculares a la dirección de propagación de dicha energía.
Si llamamos Vn a la velocidad de propagación de los frentes de onda (velocidad de fase)
y Vρ a la velocidad de propagación de la energía, se cumple la relación:

V = Vn / cos 

Se define el índice de refracción de la onda y de los rayos:

𝑛 = 𝑐/𝑉𝑛
n = c / V = (c / Vn ) cos  = n cos 

En los medios isótropos las ondas y los


rayos llevan la misma dirección y el
campo eléctrico o el desplazamiento
eléctrico definen de manera indistinta la
polarización de la onda y la polarización
del rayo. En los medios anisótropos el
desplazamiento eléctrico es transversal
a la onda y define la polarización de ésta,
mientras que el campo eléctrico es
transversal al rayo y define la
polarización de éste.
Se deduce una expresión para el vector desplazamiento eléctrico de una onda plana
que se propaga en un medio cristalino transparente.

 s sy s 
( Dx , Dy , Dz ) = ( s  E /  )  2 x 2 , 2 , 2 z 2 
 V −V V −V V −V 2
 x n y n z n 

Una vez fijada la dirección de la onda, el vector desplazamiento eléctrico se mantiene


fijo en el espacio conforme se propaga la onda. Por tanto, la onda es linealmente
polarizada.
Introduciendo la expresión encontrada para el desplazamiento eléctrico en la relación
que indica su ortogonalidad con la onda, se obtiene una ecuación que permite calcular
la velocidad de fase Vn de la onda:
Como la ecuación es de segundo grado en Vn, en general tiene dos raíces diferentes (Vn1
y Vn2). Por lo tanto, en cada dirección se pueden propagar dos ondas con velocidades
de fase diferentes19. Cuando Vn1 y Vn2 son diferentes sus ondas correspondientes tienen
polarizaciones ortogonales:

Campos correspondientes a dos ondas que se


propagan en la misma dirección y las direcciones de
propagación de las energías correspondientes. Con
velocidades de propagación e índices relacionados:

V = Vn / cos 
n = n cos 

4. Ejes ópticos
Las direcciones para las que las dos ondas se propagan con la misma velocidad se
llaman ejes ópticos. Según el sistema del cristal varían los ejes ópticos.
• En los cristales cúbicos las propiedades eléctricas son iguales en las direcciones
X, Y, Z. Por lo tanto, son isótropos y todas las direcciones del espacio son ejes
ópticos.

• En los sistemas hexagonal, tetragonal y trigonal, las propiedades eléctricas son


iguales en dos ejes principales y diferentes en el tercer eje. Estos medios
solamente tienen un eje óptico (debido a la simetría de rotación) y se llaman
uniáxicos.

• En los sistemas rómbico, monoclínico y triclínico las propiedades eléctricas son


diferentes para los tres ejes principales. La carencia de simetría de rotación hace
que haya dos ejes ópticos. Estos medios se llaman biáxicos.20

19
Como el índice depende de la velocidad, si dos ondas se propagan con velocidades distintas,
se someterán a índices distintos. Esto explica lo de la doble imagen en la piedra calcita.
20
El comportamiento de estos materiales es bastante más complejo que el de los uniáxicos. Por
tanto, considerando que las aplicaciones que nos interesan pueden llevarse a cabo mediante
medios uniáxicos, solamente estudiaremos la propagación en estos medios.
4.1 Ejes ópticos. Medios uniáxicos
En el caso de medios uniáxicos el eje principal con velocidad diferente (eje Z) es eje de
simetría. Esto implica que en dichos medios cualquier par de ejes ortogonales entre sí
y ortogonales al eje Z son ejes principales (ejes X, Y).

 x =  y =  o ,  z =  E ; Vx = Vy = Vo , Vz = VE ( Z eje de simetría )

Para cualquier onda que se propague en la dirección del eje Z el vector desplazamiento
eléctrico es ortogonal a dicho eje. Por tanto, la velocidad de propagación es VO.
⃗ = 𝜀0 𝐸⃗
𝑠//𝑍 (𝐷𝑧 = 0) → 𝐷
Según lo anterior, si se propagan ondas en la dirección de dicho eje no existen dos
velocidades de propagación diferentes. Por tanto, el eje Z es el eje óptico.
La simetría de revolución es también responsable de que las ondas que se propagan en
la dirección del eje óptico puedan tener cualquier polarización (con tal que sea
⃗ =
ortogonal a dicho eje) y de que las polarizaciones de la onda y el rayo coincidan (𝐷
𝜀0 𝐸⃗ ) por lo que sus direcciones también coincidirán.

4.2 Propagación en medios uniáxicos


Consideremos ahora una dirección de propagación de ondas diferente del eje óptico,
se obtienen las expresiones de las dos velocidades de propagación:

Vn1 = Vo
1/ 2
Vn 2 = ( s 2 x + s 2 y )V 2 E + s 2 zV 2 o 

Una de las ondas se propaga siempre con velocidad VO y por eso se llama onda ordinaria.
La velocidad de la otra onda cambia con la dirección. Por eso esta onda se llama
extraordinaria. Se simplifica la expresión de la velocidad extraordinaria si se introduce
el ángulo θ que forma la dirección de propagación de la onda con el eje óptico:
1/ 2
Vn 2 = V 2 E sen 2 + V 2o cos 2   = Ve
Vamos a estudiar las polarizaciones de
estas dos ondas. Como los ejes X, Y se
pueden elegir libremente (siempre que
sean ortogonales entre sí) dentro del
plano perpendicular a Z, los elegimos de
forma que Y esté en el plano formado por
el eje Z (eje óptico) y la dirección de
propagación de la onda. Este plano se
llama sección principal.

Consideremos ahora la onda ordinaria que se propaga siempre con velocidad VO. Su
vector de polarización no puede tener componente en la dirección del eje Z (porque esta
componente se tendría que propagar con velocidad VE) por lo que debe ser
perpendicular a dicho eje (además de a la dirección de propagación de la onda). Es decir
que lleva la dirección del eje X y es, por tanto, perpendicular a la sección principal.
Como el vector de polarización de la onda extraordinaria debe ser ortogonal al de la
ordinaria, debe estar contenido en la sección principal (siendo a su vez perpendicular a
la dirección de propagación de la onda).

5. Propagación de la energía
Si lo que se conoce es la dirección del rayo, en lugar de la de la onda (que es lo habitual,
porque el ojo ve el rayo), se puede desarrollar una teoría similar.
Puede encontrarse para la polarización del rayo una expresión similar a la de la
polarización de la onda y lo mismo ocurre con la expresión que permite el cálculo de la
velocidad del rayo:
 x y z 
( Ex , E y , Ez ) = (   D  )  , , 
 1/ V − 1/ V − z − 1/ V 
2 2 2 2 2 2
 x  1/ V y 1/ V  1/ V 

 2x 2y  2z
+ + =0
1/ V 2 x − 1/ V 2  1/ V 2 y − 1/ V 2  1/ V 2 z − 1/ V 2 
Por ejemplo, en cada dirección del espacio se puede propagar la energía con dos
velocidades diferentes y polarizaciones lineales ortogonales entre sí. A estos rayos les
corresponden ondas linealmente polarizadas que se propagan en direcciones diferentes.
Además, en los medios uniáxicos el rayo ordinario está polarizado perpendicularmente
a la sección principal y el extraordinario tiene su polarización contenida en la sección
principal.
Vn = V cos 

n = n  / cos 

Campos correspondientes a los dos rayos que se propagan en la misma dirección y las
direcciones de propagación de las ondas correspondientes, así como sus velocidades de
propagación e índices de refracción.

6. Cambio de medio
Una vez estudiado el comportamiento de la luz en el interior de un medio anisótropo,
tenemos que emprender el estudio de la aplicación real de estos medios.
En general, la luz se genera en el aire y se introduce por refracción en el medio
anisótropo y luego vuelve a salir al aire por refracción. A veces la complicación es mayor
porque la luz atraviesa varios medios anisótropos antes de salir al aire. Para hacernos
idea de los fenómenos que ocurren, vamos a estudiar la refracción desde el aire hasta
un medio anisótropo.
En el caso de refracción en medios anisótropos hay que aplicar el principio de Huygens
y obtener el frente de onda refractado a partir del incidente. La dirección de la onda
refractada es perpendicular al frente de onda refractado.
Para aplicar el principio de Huygens hay que utilizar ondas secundarias, por ejemplo, se
pueden considerar la generación de ondas secundarias a partir de la superficie de
separación entre los dos medios. En un medio isótropo estas ondas secundarias
(originadas por una fuente puntual) son esféricas. Tenemos que averiguar cómo son en
un medio anisótropo uniáxico.

6.1 Superficie de onda en medio anisótropos (uniáxicos)


Los frentes de onda 1, 2, 3 corresponden a ondas
planas que salen de O en las direcciones
indicadas. Los caminos recorridos por las tres
ondas son diferentes porque Vn cambia con la
dirección. Por eso, al trazar la envolvente, ésta no
es tangente a los frentes de onda en los puntos
A, B, C, como ocurría en el medio isótropo.

Como en la propagación la energía acompaña a los frentes de onda, cada uno de los
puntos de la superficie de onda (envolvente) corresponde a uno de los frentes de onda
y al rayo asociado. Por ello, la energía que se propaga con la onda 1 lleva la dirección
obtenida al unir el punto O con el punto de tangencia entre el frente de onda plano y la
superficie de onda.
Teniendo en cuenta que en cada dirección se pueden propagar dos ondas con
velocidades diferentes, es evidente que la superficie de onda debe de tener dos hojas.
Estas dos hojas deben de coincidir en los puntos de contacto con el eje óptico (Vn1=Vn2).
La superficie de onda tiene, por tanto, una hoja esférica y otra elipsoidal, siendo el
elipsoide tangente a la esfera en el corte con el eje óptico:

r 2 = V 2o

x2 + y 2 z 2
+ 2 =1
V2E V o

En el caso VO>VE el elipsoide es alargado En el caso VO<VE el elipsoide es achatado


e interior a la esfera. y exterior a la esfera.

En ambos casos el elipsoide es de revolución. Por lo tanto, al aplicar el principio de


Huygens en un medio uniáxico hay que tener en cuenta que las ondas secundarias que
nacen en cada punto son dobles: una esférica y otra elipsoidal.

6.2 Refracción en medios uniáxicos


Una vez que conocemos los
frentes de onda a los que da
lugar una fuente puntual en un
medio anisótropo uniáxico,
podemos resolver el problema
de la refracción de una onda
desde un medio isótropo
(medio 1) hasta un medio
anisótropo uniáxico (medio 2).

Para ello partimos del frente de onda AB. Si queremos calcular el frente de onda al que
se llega en un tiempo t (habitualmente el tiempo que tarda la luz en recorrer el trayecto
BC) basta con calcular el tiempo de recorrido de la luz desde Pi a Qi (tiempo ti) y
construir una onda secundaria en Qi que dure un tiempo t- ti. La envolvente común de
todas estas ondas da el frente de onda buscado.
Vamos a analizar ahora algunos ejemplos de refracción con medios anisótropos:
Al trazar la tangente por C a la hoja ordinaria
(circular) la unión de A con el punto de
tangencia lleva la dirección de la normal. Por
eso el rayo ordinario (r.o.) coincide con la
onda ordinaria (o.o.). En el caso de la hoja
extraordinaria (elipsoidal) la unión con el
punto de tangencia (r.e.) no coincide con la
normal (o.e.).

La sección principal (plano formado por el eje óptico y la dirección del rayo o la onda)
es el plano de la figura. Las polarizaciones del rayo ordinario y de la onda ordinaria son
perpendiculares a la sección principal. Las polarizaciones del rayo extraordinario y de la
onda extraordinaria son paralelas a la sección principal.
Como el corte de la hoja ordinaria con el plano de incidencia es siempre circular, la ley
de Snell siempre es válida para calcular la dirección de o.o. y r.o.
En este caso la sección de la hoja
extraordinaria con el plano de incidencia es
también circular. Por tanto r.e.=o.e. y
además vale para ellos la ley de Snell. La
sección principal para o.o. y r.o. es un plano
perpendicular a la figura que pasa por o.o. La
sección principal para o.e. y r.e. es un plano
perpendicular a la figura que pasa por o.e.

Las polarizaciones ordinarias son perpendiculares a su sección principal (contenidas en


el plano de la figura). Las polarizaciones extraordinarias son paralelas a su sección
principal (perpendiculares al plano de la figura).
En este último caso hay que recurrir a trazar
ondas secundarias desde dos puntos, por ser
el frente de onda incidente paralelo a la
superficie de separación de los medios. El
r.e. se desvía de la normal, aunque el ángulo
de incidencia es cero. Puede comprobarse
también que si el eje óptico se sale del plano
de incidencia también lo hace el r.e.

7. Efectos electro-ópticos
7.1 Efecto Kerr
Al aplicar un campo eléctrico a un medio se modifican las polarizaciones de las
partículas y cambia el índice de refracción. Los efectos originados por estos cambios del
índice se llaman efectos electro-ópticos.
Al aplicar un campo eléctrico n( E ) = n + a1E + a2 E 2 + ...
n( E ) = n − b1E − b2 E 2 + ...
Cuando el material es amorfo o cristalino con centro de simetría, n(E) debe ser
invariante al cambiar E por -E. Por tanto, b1=0 y entonces el índice de refracción varía de
forma cuadrática con E (efecto Kerr):

rial amorfo o con centro de simetría n( E ) = n − b2 E 2 (efecto Kerr )

La presencia del campo eléctrico crea una dirección privilegiada y el medio se convierte
en anisótropo uniáxico, con el eje óptico paralelo al campo eléctrico externo. Aparecen
por lo tanto un índice ordinario nO(E) y un índice extraordinario nE(E):

El campo eléctrico genera anisotropía nO ( E ) = n − b2O E 2


nE ( E ) = n − b2 E E 2
Cuando una onda atraviesa un espesor d de material en dirección perpendicular al
campo eléctrico las componentes ordinaria y extraordinaria experimentan un desfase
proporcional al cuadrado del campo eléctrico aplicado:

2 2
=

 nO ( E ) − nE ( E ) d =

(b
2E − b2 O ) d E 2 = 2 B( ) d E 2

Donde definimos:

b2 E − b2 O
B ( ) = = coeficiente de Kerr

Modulador de fase
Cubeta de vidrio con dos electrodos donde se
introduce un líquido de efecto Kerr intenso y se
aplica una diferencia de potencial, generando un
campo E=V/L. La luz se envía perpendicularmente
al campo eléctrico, por lo que el líquido actúa
como una lámina desfasadora: δ varía de forma
cuadrática con V.

7.2 Efecto Pockels


En cristales sin centro de simetría no se anula b1, por lo que el índice de refracción tiene
una dependencia lineal con E:

Cristal sin centro de simetría n( E) = n − b1E


En este caso los índices de refracción al aplicar un campo paralelo al eje óptico:
Campo eléctrico paralelo al eje óptico no ( E ) = no − b1o E
nE ( E ) = nE − b1E E

Si una onda recorre un espesor d en dirección perpendicular al campo eléctrico aparece


el desfase:

2 2 2
=  no ( E ) − nE ( E )  d = ( no − nE ) d + (b1E − b1o )d E
  
O equivalentemente:

 =  0 +  V / V
Donde:

E =V / L
L
V =
2(b1E − b1o ) d

Se produce un cambio de fase lineal con V si el espesor d se elige de forma que el


desfase sin campo sea un múltiplo de 2π:

2
( no − nE ) d = 2 N  0 = 0

 =  V / V
Esta simplicidad hace que el efecto Pockels sea el que habitualmente se use para
modular, en lugar del efecto Kerr.

Modulador de fase

Además, los materiales que presentan efecto Pockels


son sólidos y por ello más manejables que los líquidos
que presentan efecto Kerr. El valor de Vπ es del orden
de unos pocos cientos de voltios, mientras que para
el efecto Kerr supera el kilovoltio.
8. Efectos magnetoópticos
8.1 Efecto Faraday
Cuando un medio con propiedades magnéticas se
somete a un campo magnético, aparecen momentos
magnéticos que llevan a cabo movimientos de precesión
alrededor del vector inducción magnética. Este
fenómeno comunica al medio simetría de rotación en
torno a este vector. Por tanto, el medio se convierte en
anisótropo con simetría rotacional.

Veamos lo que ocurre cuando un haz de luz linealmente polarizada se propaga en la


dirección del campo magnético externo.
Supongamos que el vector de polarización de la luz forma un ángulo α con la horizontal.
La luz se puede propagar con dos velocidades diferentes (índices de refracción
diferentes) que se corresponden con polarizaciones ortogonales. Para que se cumpla la
simetría rotacional esas ondas deben ser circularmente polarizadas, una dextrógira y
otra levógira que se propagan con índices de refracción n+ y n- respectivamente. Por lo
tanto, en la propagación ambas ondas adquieren una diferencia de fase δ que es
proporcional a la diferencia de dichos índices.
El vector de Jones de la polarización lineal inicial, en la base lineal y en la base circular:

 cos  
En base lineal : e =  
 sen  

a 
En base circular : e = a+ e+ + a− e− , e =  + 
 a− 
Donde la base circular es:

1  −i  1 i 
Base circular : e+ =   , e− =  
2 1  2  1

Las componentes del vector de polarización inicial en la base circular se calculan


mediante proyección de vectores:

1  −i  1 i 
e+ =   , e− =  
2 1  2  1

1  cos   1 i
a+ = e+  e = ( i,1)  = ( i cos  + sen  ) = e− i
2  sen   2 2

1  cos   1 −i
a− = e−  e = ( −i,1)  = ( −i cos  + sen  ) = e i
2  sen   2 2
Obteniendo que la polarización incidente en la base circular queda finalmente:

i  e−i 
e=  
2  −ei 
Donde presenta la matriz de Jones de un medio de espesor d con efecto Faraday, en la
base circular es:

 e−i (2 /  ) n+ d 0 
M = 
 0 e−i (2 /  ) n− d 
O equivalentemente:

 e−i (2 /  ) n+ d 0   1 0   e−i / 2 0 


M =  + i 
 
 0 e−i (2 /  ) n− d   0 e   0 ei / 2 

Donde:

2
= ( n+ − n− ) d

Se demuestra que la propagación origina un giro de la polarización de la luz incidente
igual a δ/2 (efecto Faraday):

i  e−i ( + / 2) 
e´= M e =  
2  −ei ( + / 2) 

Donde la rotación introducida es:

  VB ( )
 = /2= (n − n ) d ( n+ − n− ) = Bs
 + − 

 = VB ( ) d B  s

En esta expresión VB se llama coeficiente de Verdet.21


Al invertir el sentido de propagación de la luz
(manteniendo la dirección y sentido del vector
inducción magnética) se invierte el sentido de
giro de la polarización.

21
La fórmula final es válida si se considera el giro positivo cuando tiene lugar en el sentido de
las agujas del reloj cuando la luz se dirige hacia el observador y negativo en el caso contrario.
6
Dispositivos basados en polarización
1. Producción de luz linealmente polarizada
Al introducir luz natural en el interior de un medio anisótropo aparecen dos rayos
linealmente polarizados. Si conseguimos eliminar uno de ellos obtendremos luz
linealmente polarizada. Hay dos formas básicas de hacer esto: desviar uno de los rayos
por otro camino (mediante prismas de polarización) o eliminar uno de los rayos por
absorción (polaroides).
2. Prismas de polarización
2.1 Prisma de Nicol
Calcita (espato de Islandia)

Se usan en el ultravioleta próximo, visible


o infrarrojo próximo. Los cristales de
calcita son uniáxicos.

Prisma de Nicol

Se basa en dos cristales de calcita


pegados con pegamento isótropo22. El
plano de incidencia contiene al eje óptico
y se cumple que nE < n < nO. La luz natural
se descompone en una ordinaria (que
sufre reflexión total) y una extraordinaria
(que sale por el extremo linealmente
polarizada y la absorbe una pintura).

Para que funcione correctamente se debe alinear de forma muy precisa, pues si no, se
podría dar que no hubiese reflexión total en el ordinario o que también la hubiese en el
extraordinario. Por este problema no se usa actualmente.
2.2 Prisma de Glan-Thomson
Es un prisma muy usado en la actualidad porque en el alineamiento basta con que la
luz incidente sea normal a la cara del prisma.

22
Suele ser bálsamo de Canadá.
El cristal de calcita se talla en forma de
paralelepípedo rectángulo, se corta y se
unen las piezas con bálsamo de Canadá.
La componente ordinaria queda reflejada
totalmente y la extraordinaria sale por la
cara opuesta a la de entrada (y la absorbe
una pintura).

2.3 Prisma de Glan-Foulcault


Similar al de Glan-Thomson, se usa para
luz ultravioleta. Las dos piezas del prisma
se separan por una capa de aire delgada.
Como el ángulo límite es menor que en el
prisma de Glan-Thomson (se pasa de nO a
1 en lugar de nO a n) se puede incidir por
la cara grande del prisma y obtener un
haz de luz polarizado más ancho.

2.4 Prisma de Wollaston


Otro tipo de prisma son los prismas separadores de polarización, donde se aprovechan
las dos polarizaciones ortogonales que se generan en su interior.
Se pegan dos prismas pulidos,
triangulares, de calcita, con ejes ópticos
perpendiculares entre sí.
• Rayo de luz natural incide
normalmente (y perpendicular al
eje óptico)
• En el prisma 1 se descompone en
rayo ordinario y extraordinario.
• Pasa del 1 al 2 y la componente
que se propaga con índice nO pasa
a propagarse con índice nE y
viceversa.
Estos fenómenos de refracción, más los
que ocurren entre el 2 y el aire separan
las polarizaciones en direcciones
diferentes.

2.5 Prisma de Rochon


Tanto en el prisma de Wollaston como en el de Rochon, la incidencia sobre el bálsamo
del Canadá se hace con ángulo inferior al límite.
La luz se propaga en la dirección del eje
óptico, en el interior del prisma 1. Por
tanto, solamente se desvía la
componente que cambia de índice al
pasar al prisma 2.

3. Cristales dicróicos
Son otra forma de conseguir luz polarizada, son cristales en los que una de las
constantes dieléctricas principales es compleja. Por tanto, el rayo que se propague con
esta constante dieléctrica será absorbido.
La turmalina es un ejemplo de medio
uniáxico dicróico. Si se talla en forma de
lámina plano-paralela (con las caras de
entrada y salida paralelas al eje óptico) y se
incide en dirección perpendicular a la cara
de entrada con luz natural, el rayo ordinario
es absorbido y solamente sale al exterior la
componente extraordinaria.

3.1 Polaroides
Polarizador lineal dicróico (polaroide)

Es una lámina dicróica de gran extensión


hecha con sustancias plásticas. Se forma de
varias cadenas macromoleculares
anisótropas que al colocarse al azar se ve
macroscópicamente isótropa. Al estirarla,
las cadenas se orientan paralelas,
obteniendo una lámina plano-paralela
uniáxica con el eje óptico paralelo a las caras
de entrada y salida. Al tratarla con yodo las
cadenas se vuelven dicróicas.

Los polaroides son baratos y producen luz linealmente polarizada de muy buena calidad.
Por ello se utilizan como polarizadores lineales siempre que es posible.23

23
Por ejemplo, con láseres hay que usar los prismas, porque se calientan mucho. O también para
longitudes de onda donde los polaroides tienen escasa trasmisión.
3.2 Calibrado de polarizadores lineales
Para poder utilizar un polarizador lineal hay que conocer en qué dirección vibra el
campo eléctrico de la luz que transmite. Para ello hay que calibrarlo.
Desde el aire se incide sobre una lámina
de vidrio transparente de índice de
refracción n con ángulo de incidencia ϕB24
entonces la componente del campo
eléctrico contenida en el plano de
incidencia se anula en la luz reflejada.

Si en el haz de luz incidente se intercala un polarizador lineal y se gira en su propio plano,


su dirección de polarización se encontrará en el plano de incidencia cuando al detector
llegue un mínimo de intensidad reflejada.
Si no se conoce n (ϕB desconocido) a los giros del polarizador en su plano hay que añadir
cambios del ángulo de incidencia, hasta encontrar un mínimo de intensidad.

4. Producción de luz elípticamente polarizada

 =  y − x
desfase   / 2
e = A2 / A1 = tg 

Cuando se superponen dos ondas electromagnéticas linealmente polarizadas, con


campos eléctricos perpendiculares y frecuencias iguales se obtiene luz elípticamente
polarizada, salvo si las dos ondas que se componen están en fase (δ=0) o en oposición
de fase (δ=π).

• La elipse de polarización está inscrita en un rectángulo de lados paralelos a los


dos campos (en direcciones X, Y) de longitudes iguales al doble de sus amplitudes
(A1 para el eje X, A2 para el eje Y ).
• Cuando la diferencia de fase δ vale ±π/2 los ejes de la elipse coinciden con los
ejes X, Y.
• En ese caso, si el campo eléctrico de la luz linealmente polarizada forma un
ángulo α con el eje X, la elipticidad viene dada por e=A2/A1=tgα.

24
Ángulo de Brewster; tgϕB=n
El método más cómodo para producir luz
elípticamente polarizada consiste en enviar luz
linealmente polarizada sobre un dispositivo
(desfasador) que descomponga el campo eléctrico
de la onda en dos componentes ortogonales y les
introduzca una diferencia de fase π/2 ó –π/2.

Hay que situar las líneas neutras del desfasador en las direcciones que deben llevar los
ejes de la elipse de polarización. Después hay que girar el polarizador lineal para que
forme con dichos ejes el ángulo que conduzca a la elipticidad deseada.

5. Desfasadores
Incidimos perpendicular con luz linealmente
polarizada sobre una lámina uniáxica con eje
óptico paralelo. El campo se descompone en dos
componentes:
Ae = A cos 
Ao = A sen 
El desfase y cambio de amplitud que experimentan dichas componentes al atravesar
la lámina25:


= (no − nE )d =
c
2
(no − nE )d

Ate = te Ae , Ato = to Ao (e = Ate / Ato )

Si el campo eléctrico de la luz incidente sobre el desfasador es paralelo o perpendicular


al eje óptico, la polarización no sufre ningún cambio en la lámina. Por eso estas
direcciones se llaman líneas neutras.
La variación de δ en el rango de longitudes de onda de la luz que incide sobre el
desfasador aumenta con d. Por eso hay que fabricar los desfasadores con el espesor
mínimo.

25
Los coeficientes de transmisión to y te deben calcularse mediante las fórmulas de Fresnel.
5.1 Láminas λ/4 y λ /2

• Lámina λ/4
Si el desfasador produce un desfase de ±π/2 la diferencia de caminos ópticos recorridos
por las componentes ordinaria y extraordinaria es igual a la cuarta parte de la longitud
de onda de la luz en el vacío.

Normalmente se fabrican pegando una lámina de


material anisótropo sobre una de vidrio. Pero
cuando se necesita un espesor pequeño, se pegan
láminas de espesores muy próximos y ejes
ópticos perpendiculares y se pule uno de los
bloques hasta alcanzar el valor de d1-d2
correspondiente a la lámina λ/4.

• Lámina λ/2
Si el desfase es ±π la diferencia de caminos ópticos se convierte en λ/2. Estas láminas
giran el campo eléctrico de la luz incidente a su posición simétrica respecto a las líneas
neutras.

5.2 Calibrado de desfasadores


Para calibrar un desfasador hay que determinar las direcciones de sus líneas neutras.
Se coloca el desfasador entre dos
polarizadores lineales cruzados. Al colocar
el desfasador pasará luz porque éste
transformará en elíptica la polarización
lineal de P1, y P2 proyectará la elipse de
polarización sobre su dirección de
polarización lineal.

Se gira el desfasador hasta que las líneas neutras (ln1 y ln2) coincidan con las
direcciones de polarización P1 y P2, así éste no perturbará la polarización de P1 y no
pasará luz por P2.
5.3 Visualización de birrefringencia26
Para medir muestras estructuradas que contienen medios anisótropos transparentes,
se introducen entre dos polarizadores lineales.
Consideramos una lámina plano-paralela
hecha con un medio anisótropo uniáxico
(cuyo eje óptico es paralelo a las caras de
entrada y salida) colocada entre dos
polarizadores (P1, P2). La observación óptima
se lleva a cabo cuando los polarizadores
están cruzados, porque la lámina se ve
rodeada de campo oscuro.

Se verifica que:

Intensidad transmitida27:

I t perp ( ) = (1/ 2) I i ( )  sen 2 21 sen 2  ( ) / 2

• Esta intensidad es máxima si α1=45° (líneas neutras a 45º con las direcciones de
polarización de P1 y P2).
• Si iluminamos el montaje con luz blanca [Ii(λ)=cte] entonces It perp(λ) no será
constante (debido a las variaciones de δ con λ) y la lámina se verá coloreada.
Como δ(λ) depende de la birrefringencia, el color de la lámina cambia con el material
anisótropo del que está hecha, además de cambiar con el espesor. Cuando el material
de la lámina es acromático (birrefringencia proporcional a λ) el cambio de espesor no
origina cambio de color sino solamente cambio de intensidad y la lámina se ve gris.
Estos cambios de coloración o de intensidad permiten ver si
un desfasador introduce un desfase uniforme sobre toda su
superficie o no. Ejemplos de control de calidad son en la
fabricación de prismas o en las tensiones residuales en el
enfriamiento de un vidrio. También se emplea en visualizar
anisotropías inducidas, por ejemplo, para asegurarse de que
el cristal de un automóvil esté hecho con tensiones fuertes
(para que se roma en cachitos).

Otra aplicación muy interesante es la observación de cortes de minerales. El montaje se


hace en el interior de un microscopio (microscopio de polarización).

26
Característica óptica que consiste en la separación de un rayo luminoso en dos, dependiendo
del ángulo de incidencia
27
Donde el espectro de la luz incidente es Ii(λ)
5.4 Filtros birrefringentes
Si los polarizadores entre los que se introduce la
lámina anisótropa tienen sus direcciones de
transmisión paralelas en lugar de
perpendiculares, se obtiene la expresión It paral:

I t paral ( ) = (1/ 2) I i ( ) 

1 − sen (2 ) sen


2
1
2

 ( ) / 2

El espectro de esta luz es complementario del obtenido con polarizadores cruzados:

I t paral complementario de I t perp

Por ejemplo, si la lámina se ve de color amarillo entre polarizadores cruzados, su color


es azul entre polarizadores paralelos. La expresión de It paral particularizada para α1=
α2=45° permite el cálculo de las longitudes de onda y frecuencias para las que la
transmisión es máxima.
El dispositivo no puede utilizarse como filtro espectral porque deja pasar un espectro
muy ancho debido a que la función coseno al cuadrado que aparece en la intensidad
transmitida es muy ancha:

I t paral ( ) = (1/ 2) I i ( ) cos 2  ( ) / 2 

Se puede analizar el desfase:

2 
 ( ) =  n0 − nE  d =  n0 − nE  d
 c

n0 − nE = cte
De forma que encontramos los máximos cuando el coseno es máximo:

(no − nE ) d 2 cm
Máximos :  / 2 = m , m = , m =
m (no − nE ) d

Para conseguir un filtro de banda


espectral más estrecha se ponen en
serie unas cuantas láminas de
espesores d, 2d, 4d, etc. (colocadas
entre polaroides paralelos). El factor
de transmisión solamente toma valores
apreciables en una banda estrecha de
longitudes de onda alrededor de cada
λm.
Si a este filtro se añade un filtro de color que elimine las bandas pasantes en torno todas
las λm menos una, se tiene un filtro muy selectivo.
Si en lugar de incidir en dirección
perpendicular sobre el filtro se incide
con otro ángulo, el recorrido en el
filtro aumenta y con él la longitud de
onda de máxima transmisión. De esta
manera tenemos un filtro
sintonizable, que se puede utilizar en
un intervalo espectral Δλ.

5.5 Láseres sintonizables


Cuando el medio activo tiene bandas
de energía entre las que se puede
obtener inversión de población, se
puede conseguir acción láser
mediante bombeo óptico.

Si en el interior de la cavidad se introduce un filtro birrefringente se puede seleccionar


una banda estrecha de longitudes de onda. Tenemos así un láser sintonizable, en el
que solamente se produce luz láser de la longitud de onda seleccionada, debido a las
pérdidas que origina el filtro birrefringente sobre las otras longitudes de onda del
espectro de ganancia.28

5.6 Efecto Kerr. Modulador de intensidad


Un modulador de intensidad se forma
con un modulador de fase basado en
el efecto Kerr entre dos polarizadores
lineales cruzados, con sus direcciones
de polarización formando 45º con el
campo eléctrico externo.

La intensidad transmitida es la Itperp de antes y el desfase introducido:

 = 2 B( ) d E 2
Este dispositivo puede utilizarse para transmisión de mensajes digitales mediante luz,
pero no para analógicos por no tener δ una dependencia lineal con el voltaje.

28
Existen en la actualidad abundantes materiales sólidos capaces de generar luz láser
sintonizable. También hay líquidos, denominados “dyes” (colorantes), que permiten generar luz
láser sintonizable.
5.7 Efecto Pockels. Modulador de intensidad
Si se emplea el efecto Pockels el desfase
ya tiene una dependencia lineal con el
voltaje:
 =  V / V

Operando de forma lineal se da una distorsión máxima del 0.02% cuando el factor de
modulación es del 10%. Se consiguen frecuencias máximas de modulación de 1 GHz.

5.8 Efecto Pockels. Modulador integrado


Para poder conseguir frecuencias de modulación
mayores se usan dispositivos de óptica integrada,
basados en interferómetros de Match-Zender. Se
basan en guías microscópicas sometidas a una
diferencia de potencial de forma que, al propagarse la
luz de forma confinada, el desfase el lineal con V. Se
consiguen frecuencias de modulación superiores a 100
GHz.

5.9 Efecto Pockels. Deflectores


Se emplean para direccionar haces de luz,
utilizando la desviación que produce un
prisma óptico, controlada con un material
electro-óptico (y así con el voltaje
aplicado).

6. Láseres sintonizables
Si en el interior de una cavidad láser se
introduce un modulador electro-óptico,
éste puede volverse opaco. Así, no se
produce emisión intensa y no se destruye
la inversión de población. De esta forma
crece y también la ganancia, hasta el valor
de equilibrio.
Entonces se cambia el voltaje y se vuelve transparente. Al cabo de un tiempo se produce
una emisión láser intensa debida a la alta ganancia alcanzada. Luego la ganancia decae
y se obtiene un pulso intenso de luz láser (anchura de varios nanosegundos y potencias
de giga vatios).
6.1 Efecto Faraday. Aislador óptico

El principal uso del efecto Faraday es el aislador óptico que básicamente deja pasar la
luz en un sentido (1) y la bloquea en el contrario (2). Se utilizan en las redes de fibra
óptica que se usan en comunicaciones ópticas, para evitar la circulación de la luz en el
sentido no deseado.

6.2 Láseres de anillo


Debido a la propagación de la luz láser en dos
sentidos opuestos en el interior de una
cavidad láser lineal, como consecuencia de las
reflexiones múltiples en los espejos, aparecen
ondas estacionarias con nodos y vientres.

Para evitar la pérdida de inversión de población en los nodos, se construye una cavidad
con varios espejos, en la que la luz puede recorrer un circuito cerrado (anillo), tal que
se coloca un aislador óptico que impide uno de los sentidos de propagación y así la
creación de ondas estacionarias.
7
Formación de imágenes
1. Sistema óptico
Un conjunto de superficies que separan medios de distintos índices, constituye un
sistema óptico. Si el sistema está formado por superficies refractantes solamente, se
llama dióptrico; si sólo tiene espejos, catóptrico, y si tiene ambas, catadiótrico.

Reales Imagen virtual29 Objeto virtual30

Al punto emisor se le llama O (punto objeto) y el de salida O’ (punto imagen), pueden


ser: reales o virtuales, puntuales o extensos, y la imagen directa o invertida. Se suele
hablar también de espacio objeto31 y espacio imagen.
Un sistema óptico perfecto es imposible, por eso sólo se exigen las condiciones de
Maxwell:
1) A un plano objeto normal al eje del sistema debe corresponder un plano imagen
también normal al eje.
2) Todos los rayos que entran en el sistema concurrentes en un punto cualquiera del
plano objeto pasan a la salida por un punto del plano imagen.
3) Cualquier figura contenida en el plano objeto se representa en una figura semejante
contenida en el plano imagen, siendo la razón de semejanza constante para cualquier
par de figuras conjugadas y contenidas en estos planos.

2. Condiciones de stigmatismo
Se dice que un sistema se comporta stigmáticamente para un par de puntos O, O',
cuando todos los rayos que salen de O pasan real o virtualmente por O' después de
atravesar el sistema. Para que esto suceda basta que el camino óptico entre O y O' sea
el mismo a lo largo de cualquier rayo.

29
Cuando se forma virtual en realidad los rayos son divergentes a la salida. Pero sus
prolongaciones en sentido contrario a la propagación de la luz se cortan en un punto. Notar que
esta imagen virtual sería objeto real para otro sistema.
30
Los objetos sólo pueden ser virtuales cuando son imagen a su vez de otro sistema.
31
Todo el espacio geométrico donde puede haber objetos, tanto reales como virtuales (al igual
con la imagen).
𝜔
Como el cambio de fase viene dado por ΔΨ = − ( 𝑐 ) 𝑛𝑠 (s=camino recorrido), si la luz
es monocromática, el cambio de fase constante significa camino óptico recorrido
constante. Así pues, la imagen cambiará con la longitud de onda.

3. Aproximación paraxial
Se llama aproximación paraxial o de Gauss a la que hace que todos los ángulos sean
suficientemente pequeños como para que:
x=sen x=tg x, cos x=1
3.1 Convenio de signos
Refracción

Positivos:
ε, ε´, ϕ, σ´

Negativos:
σ, ω, ω´

1) Las distancias lineales se toman utilizando un sistema cartesiano (el eje del sistema y
el eje perpendicular) con origen en S (sentido positivo horizontal hacia la derecha y
vertical hacia arriba).
2) Los ángulos de incidencia, refracción y reflexión son positivos si al llevar el rayo a la
normal, por el camino más corto, se hace en el sentido de las agujas del reloj y negativos
en el contrario.
3) Los ángulos que no sean de incidencia, refracción o reflexión, son positivos si al llevar
el rayo al eje, por el camino más corto, se hace en el sentido opuesto de las agujas del
reloj.
Estos criterios son válidos para luz de izquierda a derecha32.
Reflexión

 ´= −

n sen  = n´ sen  ´

n´= −n

Según el criterio de signos que hemos establecido, en el espejo de la figura ε´=-ε. Para
que esta ley se deduzca de la ley de la Snell hace falta suponer que n´=-n. Esta condición
no tiene ningún sentido físico ya que los índices de refracción reales son siempre
positivos. No obstante, el considerar que n´=-n en la reflexión es un artificio matemático
muy útil, que permite obtener fórmulas de cálculo de imágenes con espejos a partir de
las fórmulas obtenidas con dioptrios refractantes.

4. Invariantes
4.1 Invariante de Abbe

1 1 1 1 
n  −  = n´  − 
r s  r s´ 
Esta relación indica que el término n(1/r-1/s) se mantiene invariante (invariante de
Abbe) al pasar del espacio objeto al espacio imagen. Dentro de los límites de la óptica
paraxial, la imagen de un punto del eje siempre es stigmática. De hecho, se puede
demostrar que un sistema en aproximación paraxial (sistema perfecto) cumple las
condiciones de Maxwell (aunque la imagen no presenta semejanza tridimensional
frente al objeto). También se encuentra (tras alguna sustitución) otra formulación para
la invariante de Abbe que es la fórmula de Lange:

32
Luego veremos que, si trabajamos con espejos, a veces es imposible que la luz vaya de
izquierda a derecha y se cambian los signos. También notar que en demostraciones a veces
supondremos también luz de derecha a izquierda. Y finalmente, (con lo que siempre me lio),
cuando te dan una fórmula, sustituyes los valores con su signo, pero si lo que quieres es crear
tu una relación entre distancias (que siempre se consideran positivas) habrá que poner el signo
adecuado (en la incógnita por así decirlo) además de luego sustituir.
Dem.

El punto O lo podemos ver como la imagen virtual de una lente previa que focaliza los
rayos en O, de forma que así se reconvierte en objeto para nuestro sistema que genera
otra imagen O’.
En la figura (en la que todas las distancias y ángulos son positivos) a partir de la aplicación
de la ley de refracción paraxial en el punto I y de la consideración de todos los ángulos
como paraxiales. Partimos de la ley de refracción:

n  = n´  ´
Donde los ángulos son:

n ( −  ) = n´ ( −  ´)
De forma que sustituyendo las siguientes expresiones:

 = sen  = h / r = tg 
 = h / s ,  ´= h / s´
Sustituimos33:

Y dividimos todo por h:

1 1 1 1 
n  −  = n´  − 
r s  r s´ 
QED.

33
Como se ve, el rayo imagen corta al eje a una distancia s´ que no depende de la altura de
incidencia (h es un factor común que nos quitamos), por lo que la imagen O´ es stigmática. Por
eso decimos que la imagen de un punto del eje siempre es stigmática.
Casos particulares de la invariante de Abbe
1) Dioptrio esférico. Despejando directamente de la invariante de Abbe:

2) Dioptrio plano. Haciendo 𝑟 = ∞ tenemos:

3) Espejo esférico. Haciendo 𝑛′ = −𝑛 tenemos:

4) Espejo plano. Haciendo 𝑛′ = −𝑛 𝑦 𝑟 = ∞ tenemos:

Paso de un rayo a través de un sistema


Tanto el invariante de Abbe como la fórmula de Lange nos pueden servir para pasar un
rayo a través de todas las superficies de un sistema, para lo cual habrá que tener en
cuenta los espesores, que son las distancias entre los vértices de superficies
consecutivas.

Para la invariante de Abbe:

Para la fórmula de Lange:


4.2 Invariante de Lagrange-Helmoltz
El término nyσ se mantiene invariante (invariante de Lagrange-Helmoltz) al pasar del
espacio objeto al espacio imagen:

n y  = n´ y´  ´
Dem.

Si consideramos un sistema óptico con una sóla superficie, a partir de la aplicación de la


ley de refracción paraxial en el punto S y de la consideración de todos los ángulos como
paraxiales:

n  = n´´

n y / s = n´ y´/ s´

Se obtiene una relación final que indica que el término nyσ se mantiene invariante
(invariante de Lagrange-Helmoltz) al pasar del espacio objeto al espacio imagen:

n y  = n´ y´  ´
QED.
Paso de un rayo a través de un sistema
Teniendo en cuenta que la imagen dada por una superficie es objeto para la que le sigue,
así como los índices y ángulos, sumando y simplificando se tiene:
5. Aumentos

1) Aumento lateral

Según que el aumento lateral sea positivo o negativo, la imagen será respectivamente
directa o invertida.
2) Aumento angular

3) Aumento axial o aumento en profundidad

5.1 Relaciones entre aumentos


De la relación de Helmholtz se deducen las relaciones:

Y para sistemas sumergidos en medios extremos de igual índice, n1 = n’k, se tiene:

También se puede encontrar relación con las distancias frontales:

Y para un espejo (o dioptrio reflectante):


Si el dioptrio es reflectante (n´= −n) :  ´= −
s
Como para un sistema el aumento total es el producto de los aumentos de todas las
superficies:

O equivalentemente:

Siendo cada aumento lateral correspondiente:

Nótese que el aumento lateral depende de s1, es decir de la posición del objeto respecto
del sistema y que en general cambia con ella. Nunca se puede decir que un sistema tiene
un determinado aumento si no se especifica para qué posición del objeto.
También para el aumento axial encontramos:

n s´2
 ´=
n´ s 2

Y lo podemos relacionar con el aumento lateral de la siguiente forma:

n´ 2
 ´= ´
n
La última expresión dice claramente que el aumento en la dirección axial es diferente al
aumento en la dirección transversal (aumento lateral). Por tanto, está claro que no hay
semejanza tridimensional entre el objeto y la imagen.
Se encuentran expresiones que permiten el cálculo de γ´ y de σ´ a través de γ´:

ny n 1 s
 ´= =  =
n´ y´ n´  ´ s´

 ´=  ´
6. Elementos cardinales
Existen en los sistemas ópticos tres pares de puntos y otros tres pares de planos que
tienen especial importancia, a saber: los focos y los planos focales, los puntos y los
planos principales y los puntos y planos nodales. Estos elementos se suelen llamar
cardinales, y se caracterizan porque en ellos los aumentos toman valores particulares.
6.1 Focos y planos focales

a) Si operando en zona paraxial tomamos como punto objeto el del infinito del eje, el
haz de rayos procedente de él entra en el sistema paralelo al eje, tal que su imagen
(cuando la luz va de derecha a izquierda) se llama foco imagen del sistema F’. El plano
normal al eje por F’ es el plano focal imagen.
b) Análogamente existe un punto F, el foco objeto, tal que todos los rayos que parten
de él, salen del sistema paralelos al eje (también se puede entender como el punto
donde confluyen los rayos que entran paralelos de derecha a izquierda).
Se ve que el aumento angular es infinito en el foco imagen y cero en el foco objeto.
Tanto el foco objeto como el imagen, pueden ser reales o virtuales.

Con este mecanismo se construyen los colimadores. Si un sistema tiene su foco objeto
real y en este foco se pone una fuente puntual de luz, el dispositivo transformará los
haces de rayos divergentes de la fuente en haces paralelos al eje. Tal montaje recibe el
nombre de colimador y se emplea con mucha frecuencia en óptica. Si el punto emisor
está fuera del eje, los rayos emergentes también son paralelos entre sí, pero oblicuos al
eje.

6.2 Planos y puntos principales

Se llaman planos principales dos planos conjugados (uno imagen del otro) normales al
eje, con aumento lateral 𝛽 ′ = +1. Sus puntos de intersección con el eje, H y H ', son los
puntos principales, y, al igual que los focos, pueden ser reales o virtuales.
Hay que insistir en que los planos principales, así como los focales, no tienen existencia
más que como entes paraxiales. Según la superficie coinciden con otros elementos:

a) En una superficie esférica los puntos principales están confundidos en el vértice.


b) En una lente delgada se ve que los planos principales están confundidos en la propia
lente. En un espejo, por la misma razón que en la superficie refractante, los puntos
principales, están en el propio espejo.

6.3 Puntos nodales

Se llaman así dos puntos conjugados en el eje, N y N’, para los cuales el aumento angular,
γ', es la unidad positiva. De la definición se deduce que todo rayo que entra en el sistema
por el punto nodal objeto formando con el eje un ángulo σ, sale del sistema pasando
real o virtualmente por el punto nodal imagen formando con el eje un ángulo σ'. Para
una sola superficie que separa medios de índices n y n' los puntos nodales están en su
centro de curvatura.

6.4 Focal y potencia de un sistema

f negativa y f’ positiva f positiva y f’ negativa


Denominaremos distancia focal imagen, o simplemente focal imagen de un sistema, a
la distancia f' desde el punto principal imagen hasta el foco imagen, precisamente en
este sentido, es decir, H’F’=f’. Análogamente, la focal objeto es HF = f.
Si estos segmentos, con origen siempre en los puntos principales, están dirigidos en el
sentido de la luz incidente, las focales son positivas; negativas, si lo están en sentido
contrario.
Las potencias se definen como ϕ=1/f, ϕ´=1/f´ (potencias objeto e imagen, que se miden
en dioptrías cuando las focales se miden en metros).
Para obtener las focales de una superficie, teniendo en cuenta que los puntos principales
se confunden con el vértice, basta coger la ecuación (reformulación invariante de Abbe):

Y hacer 𝑠 = ∞, 𝑠 ′ = ∞, con lo que:

Y para el espejo (n’=-n):

Para un sistema de varias superficies:

Podemos relacionar ambas distancias focales:

f ´= −(n´/ n) f

Para n´= n : f ´= − f ,  ´H =  H

6.5 Potencia y poder refractor


Así las focales reducidas serán f / n y f'/n'. Sus recíprocas ℱ 𝑦 ℱ′ se denominan poderes
refractores:
Como se ve, para sistemas en el aire coinciden la potencia y el poder refractor.
Para una superficie esférica (aunque es extrapolable a cualquier superficie no esférica)
que separe medios de índices n y n’. Las potencias serán:

Y los poderes refractores:

7. Ecuaciones paraxiales de correspondencia


7.1 Orígenes en los focos
Ecuación de correspondencia de Newton:

Y para sistemas con índices extremos iguales, en los que f=-f’:

Lo que permite conocer z', es decir, la distancia del foco imagen a la imagen y, por tanto,
su posición cuando se conoce N.

7.2 Orígenes en los puntos principales

Y para sistemas con índices extremos iguales:

Que es la que se aplica ordinariamente a las lentes delgadas, siendo a y a' las distancias
de la lente a objeto e imagen, ya que sus planos principales están confundidos en la
propia lente.
7.3 Orígenes sen dos puntos conjugados

7.4 Aumento en función de las distancias (a,a’) de los puntos principales a objeto e
imagen

Y para índices extremos iguales:

7.5 Relación entre aumentos

8. Sistemas compuestos
8.1 Acoplamiento

Acoplemos dos sistemas (I) y (II), de los cuales se conocen sus focos y puntos principales.
Sea t la distancia de acoplamiento F1’F2 entre el foco imagen del sistema (I) y el foco
objeto del sistema (II).
A t se le llama intervalo óptico, y en la figura es positivo. Si los sistemas estuvieran más
próximos de modo que F1’ quedara a la derecha de F2, t sería negativo. Llamemos e a la
distancia de acoplamiento entre los planos principales, es decir e = H1’H2
El conjunto funcionará como un sistema único, siendo nuestro problema determinar
sus elementos cardinales F, F' y H, H'.
La focal imagen del sistema total:

Abscisa del punto principal imagen del sistema total tomando como origen el punto
principal imagen del sistema (II):

La focal objeto del sistema total:

Y para la posición del plano principal objeto del sistema total respecto al plano principal
objeto del sistema (I):

También podemos introducir en las fórmulas el acoplamiento entre planos principales


e, en lugar de la distancia entre focos t:

De la misma forma para los planos principales:


Es común también introducir las potencias en lugar de las focales:

O en función de los poderes refractores obtenemos la fórmula de Guldstram:

8.2 Acoplamiento en aire


Si los sistemas se acoplan en aire, se verifican: 𝑛1 = 𝑛2 = 𝑛2′ = 1, 𝑓1 = −𝑓1′ , 𝑓2 =
−𝑓2′ , 𝑓 = −𝑓 ′ y las fórmulas anteriores quedan:

9. Lentes
Podemos considerar una lente como un sistema compuesto formado por sus dos
superficies de radios 𝑟1 𝑦 𝑟2 , tomando éstas como sistemas simples en los cuales los
puntos principales coinciden en los vértices. La distancia 𝑉1 𝑉2 = 𝑒 se llama espesor y
tiene su origen en 𝑉1 . Consideremos la lente de la figura, con índice de refracción n e
índice de refracción anterior na y posterior np:
9.1 No sumergida en aire
Podemos calcular la focal f´:

1 n − na n − n p ( n − na ) ( n − n p ) e
= − + 
f ´ n p r1 n p r2 n np r1 r2

A partir de ella aplicamos la relación entre focal objeto e imagen:

f = −( na / n p ) f ´

Y las posiciones de los puntos principales H y H´ (de las fórmulas del apartado anterior
H1H y H2’H’):

r1 e na
V1 H =
n − na
n r1 − n r2 − e( n − na )
n − np

r2 e n p
V2 H ´=
n − np
n r1 − n r2 − e( n − n p )
n − na

De esta manera conocemos los datos necesarios para calcular imágenes.

9.2 Sumergida en aire


Simplemente particularizamos lo del apartado anterior para el caso 𝑛𝑎 = 𝑛𝑝 = 1:

 1 1  ( n − 1)
2
1 e
= ( n − 1)  −  + 
f´  r1 r2  n r1 r2

f ´= − f
r1 e
V1 H =
n ( r1 − r2 ) − e ( n − 1)

r2 e
V2 H ´=
n ( r1 − r2 ) − e ( n − 1)

9.3 Lente delgada


Cuando el espesor e se puede considerar pequeño frente al diámetro de la lente (lente
delgada), podemos utilizar la aproximación e=0. En ese caso se tiene V1H=V2H´=0, por lo
que los puntos principales H y H´ coinciden con el centro de la lente.
Un sistema se dice que es convergente cuando un haz de rayos incidente, paralelo al eje,
converge realmente en el foco imagen, es decir, cuando el foco imagen es real. Si el foco
imagen es virtual, los rayos divergen a la salida del sistema y se llama divergente.
Algunos autores asignan el carácter de convergencia o divergencia al hecho de que el
sistema tenga su focal imagen f’ positiva o negativa respectivamente, lo cual no indica
nada sobre su comportamiento. Aunque si que es cierto que esto se verifica para el caso
trivial de las lentes delgadas (izquierda convergente, derecha divergente):

Se pueden obtener expresiones simplificadas para las focales de la lente:

1 n − na n − n p
= −
f ´ n p r1 n p r2

f = −( na / n p ) f ´

También notamos que ahora, la distancia a los objetos e imagen será directamente
desde la lente a ellos (a, a’) ya que la distancia entre sus planos principales es nula:

Y si estamos en el aire:

1 1 1
Lente en aire : = ( n − 1)  −  , f = − f ´
f´  r1 r2 
Cuando se tienen dos lentes delgadas pegadas se encuentra que actúan como una lente
delgada cuya potencia es la suma de las potencias de las dos lentes:

´= ´1 +´2


Tipos de lente delgada

Trazado de rayos a través de una lente delgada


Cuando es convergente:

Cuando es divergente:

Destacar que los rayos que pasan por el centro no se desvían cuando los medios
extremos tienen el mismo índice de refracción ya que N=N’.
10. Espejos
10.1 Lente equivalente a un par de espejos (en general número par de espejos)

Los objetivos de los telescopios suelen estar formados por dos espejos esféricos
funcionando como indica la figura. Aparentemente el par de espejos funciona como una
lente.
Los puntos cardinales de esta lente “equivalente” se pueden calcular a partir de las
fórmulas obtenidas anteriormente para una lente, considerando el espesor como
negativo (porque los rayos alcanzan primero el dioptrio de la derecha y después el de la
izquierda), el índice de refracción de la lente como -1 (porque los dioptrios son
reflectantes) y los índices de refracción anterior y posterior igual a 1.

e negativo
n = −1
na = n p = 1

En general un número par de 2k espejos puede manejarse como un sistema de k lentes.

10.2 Espejo equivalente (en general número impar de espejos)


Si el número de espejos es impar, puede tratarse como un sistema dióptrico asociado a
un espejo, es decir, como un sistema catadióptrico.

Por lo tanto, el sistema formado por el espejo y la lente funciona como si fuese un
espejo (espejo equivalente) de vértice en Si y centro en Ci. Si hay varias lentes delante
del espejo habría que calcular las imágenes de S y C a través de todas las lentes, para
obtener el espejo equivalente.
11. Aberraciones
En la mayor parte de los casos los sistemas ópticos no operan con ángulos tan pequeños
como para que se cumpla la aproximación paraxial. Por ello dejan de cumplirse las
condiciones de sistema perfecto y aparecen defectos que se llaman aberraciones.

• Cuando las imágenes de los puntos del objeto no son stigmáticas tenemos
aberraciones de punto (esférica, coma, astigmatismo).
• Cuando la imagen de un objeto plano no es plana se tiene curvatura.
• Cuando se pierde la semejanza transversal entre objeto e imagen se tiene
distorsión.
• La dependencia de los índices de los vidrios con la longitud de onda (dispersión)
hace que la posición y tamaño de las imágenes dependa de la longitud de onda.
Estos defectos se denominan aberraciones cromáticas.

11.1 Aberraciones de punto: Esférica

Cuando el punto objeto se encuentra en el eje del sistema y entran a éste rayos que
forman ángulos con el eje para los que no sea válida la aproximación paraxial, la imagen
no es un punto sino una mancha (simétrica en torno al eje debido a la simetría del
problema). Los rayos se cortan en se cortan en un punto Ō´, que no coincide con la
imagen paraxial O´.
La distancia O´Ō´=Δs´(σ) se llama aberración esférica longitudinal (AEL) y el radio ρ(σ)
se llama aberración esférica transversal (AET). Ambas están relacionadas de una
manera muy simple, por lo que basta con conocer una de ellas.
La mancha de menor diámetro se denomina círculo de mínima confusión y suele
utilizarse como imagen del punto O. Existe un criterio de tolerancia, que permite una
aberración esférica transversal del orden del radio de la mancha de difracción.

11.2 Aberraciones de punto: Coma

Cuando el punto objeto se encuentra fuera del eje y entra en el sistema un cono amplio
de luz (figura superior) no se cumplen las condiciones de óptica paraxial, lo que impide
que todos los rayos imagen pasen por el mismo punto.
Para corregir esta aberración hay que conseguir que el tamaño de la mancha de coma
sea inferior al de la de difracción.

11.3 Aberraciones de punto: Astigmatismo

Es la aberración que mide el defecto que aparece en la imagen, cuando el objeto está
fuera de eje y el cono de luz que entra al sistema es muy pequeño. Los diseñadores de
instrumentos utilizan y corrigen esta aberración para tratar de conseguir un diseño
correcto.
Los dos puntos imagen se convierten en dos segmentos de recta ortogonales, que se
llaman focales de Sturm. La distancia entre las focales se llama astigmatismo.
Un plano transversal al rayo principal corta la mancha imagen en secciones que son
circulares entre las focales Sturm. La aberración se considera corregida cuando dicho
círculo tiene un tamaño inferior al de la mancha de difracción.

11.4 Aberraciones de punto: Aberración de onda

En general, cuando la máxima aberración de onda no supera la cuarta parte de la


longitud de onda de la luz empleada, el sistema funciona correctamente en la
formación de la imagen de un punto:
Tolerancia: aberración < λ/4
Según lo anterior, la aberración esférica, el coma y el astigmatismo hay que corregirlos
de forma que estén en tolerancia. Para ello hay que conseguir que la mancha imagen
sea menor que la mancha de difracción (o que la aberración de onda sea inferior al valor
tolerable) variando radios e índices de refracción de lentes y otros parámetros del
sistema óptico. Cuando no quedan parámetros libres hay que introducir más lentes.

11.5 Aberración: Curvatura

Cuando, por no cumplirse las condiciones de óptica paraxial, la imagen de un objeto


plano perpendicular al eje no es plana, la aberración se llama curvatura.
Para un punto objeto Oi la curvatura se mide mediante la distancia O´iŌ´i. Cuando el
objeto es muy pequeño la imagen se puede sustituir por su plano tangente, lo que
demuestra que en esas condiciones no hay curvatura. La curvatura le resulta intolerable
al ojo si la parte convexa de la superficie imagen está orientada hacia el ojo.
11.6 Aberración: Distorsión

Cuando se pierde la semejanza entre el plano imagen y el objeto (figura superior)


aparece distorsión porque el aumento lateral depende de la distancia (y) del objeto al
eje.

• Si β´ aumenta al aumentar y se tiene distorsión en corsé (figura (b))


• Si β´ disminuye al aumentar y se tiene distorsión en barrilete (figura (c))
• Cuando el objeto es muy pequeño β´ es constante y desaparece la distorsión
(figura (a))
Se corrige al igual que el resto ya comentadas.

11.7 Aberración: Cromática


Cuando un objeto emite luz policromática que entra en un sistema óptico, los índices
de refracción del sistema cambian con la longitud de onda λ, por lo que cambian los
focos y puntos principales con λ. Como resultado aparecen imágenes distintas del
objeto para cada color. Se tienen entonces aberraciones cromáticas.

n( ) = a1 + a2 /  2 + a3 /  4
Para vidrios transparentes el índice de refracción se puede expresar aproximadamente
en la forma indicada para zonas amplias del espectro (por ejemplo, en todo el espectro
visible). Para determinar a1, a2, a3 basta con conocer el índice de refracción n para tres
longitudes de onda.
Los fabricantes de vidrios dan el índice de refracción de cada vidrio para una colección
de longitudes de onda, correspondientes a rayas espectrales intensas de algunos
átomos, que se denominan líneas de Fraunhofer.

Cuando no coinciden las posiciones de las imágenes de un punto objeto


correspondientes a las diferentes longitudes de onda, se tiene aberración cromática
longitudinal o de posición. Cuando no coinciden los tamaños de las imágenes se tiene
aberración cromática transversal o de aumento. En general aparecen juntos los dos
tipos de aberración cromática.

• Se define la cromática longitudinal como ACL=O´F-O´C y la cromática transversal


como ACT=y´F–y´C.
• Un sistema se llama acromático cuando ACL=0 (O´F=O´C). Esto no implica que
las posiciones de las imágenes de otras longitudes de onda también coincidan.
• Cuando O´F= O´D =O´C el sistema se llama apocromático.

11.8 Doblete pegado acromático


No se puede corregir la aberración cromática en un sistema formado por sólo una lente
porque la potencia cambia con la longitud de onda de forma monótona.
Puede demostrarse que si la lente delgada se sustituye por la superposición de dos
lentes delgadas esta superposición es acromática si se cumple la condición:

En resumen, para acromatizar una lente hay que sustituirla por un doblete pegado,
formado por una lente convergente y otra divergente (con cromáticas opuestas)
pegadas entre sí.
8
Instrumentos ópticos formadores de imagen
1. Limitación de rayos: apertura y campo
En los sistemas reales, la inclinación de los rayos que pueden atravesar un sistema óptico
viene limitada por los diámetros de los diafragmas que hay en el sistema y también por
los diámetros de las lentes (que también se consideran como diafragmas).
Distinguiremos:
1) Diafragma de apertura: Máximo34 limitador de la energía que sale de la imagen,
determina el brillo que observamos en ella.
2) Diafragma de campo: Máximo limitador de la extensión del objeto que puede
visualizarse en la imagen, afecta al tamaño de la imagen.

1.1 Diafragma de apertura

El diafragma de apertura (DA) en este montaje es D2, lo cual se puede deducir si el


sistema es simple (figura izquierda), pero es mejor emplear el método general: calcular
las imágenes hacia la izquierda de todos los diafragmas (incluidas las lentes) y averiguar
cuál de ellas subtiende menos radio angular desde O.
Las imágenes (o diafragmas imagen de DA) que verifican dicha condición se definen
como:

• Pupila de entrada (PE): imagen hacia la izquierda de DA


• Pupila de salida (PS): imagen hacia la derecha de DA
En nuestro sistema D´2i es PE y D2 es DA y PS35.
La determinación del DA se puede hacer también en el espacio imagen, operando con
el punto imagen y con las imágenes de todos los diafragmas hacia la derecha. Pero en
este caso los diámetros se medirían desde O’.

34
En realidad, muchos elementos pueden limitar tanto la energía como el tamaño, pero siempre
hablaremos de diafragma como el elemento que más la limita.
35
Pupila de salida porque como a la derecha no hay lentes el mismo es su imagen.
En general, no se puede decir que un sistema constituido por una serie de lentes y
diafragmas tiene un determinado diafragma de apertura, pues éste depende de la
posición del objeto.
Cuando el punto objeto se encuentra en el infinito, para encontrar la PE hay que
averiguar qué diafragma limita más el diámetro del haz de salida. En este caso la
apertura del sistema se mide mediante la apertura relativa (AR):

Cuando el punto O se encuentra a distancia finita del sistema, la apertura se mide


mediante la apertura numérica (AN):

Donde:
n= índice de refracción del espacio objeto
σ= ángulo con el eje del rayo que desde O pasa por el extremo de la PE

1.2 Diafragma de campo


En este caso analizamos como afecta desplazar el objeto en el eje perpendicular a O y
como esto modifica los rayos y su paso por los diafragmas. En primer lugar, definimos
los campos de iluminación plena, media y límite:

• Para todos los puntos del círculo de radio OOp el sistema óptico deja pasar
aproximadamente la misma proporción de energía que la que deja pasar la PE
(campo de iluminación plena).
• En la figura el recorte es aproximadamente del 50% (iluminación media). La
distancia OOM es el radio del campo de iluminación media.
• Si se sigue apartando el punto objeto, llega un momento en que D 1 solamente
deja pasar un rayo de todos los que pasan por la PE. Este punto O L es el último
que se ve en la imagen. El trozo de objeto que se ve está delimitado por una
circunferencia de radio OOL (radio del campo objeto o del campo límite objeto).
El punto OL se obtiene uniendo el borde superior de D1 con el borde inferior de la PE.
Esta limitación la origina el diafragma D1, que se llama diafragma de campo (DC). Su
imagen hacia la izquierda se llama lucarna de entrada (LE) y su imagen hacia derecha
lucarna de salida (LS). En nuestro sistema y para el plano objeto que se usa, D 1 es DC,
LE y LS.

Como puede verse en la figura, el rayo que en el espacio objeto une el borde superior
de D1 con el borde inferior de la PE, une en el espacio imagen el borde superior de D 1
con el borde superior de la PS. Esta inversión de reglas en la obtención del campo
imagen es debida a que el plano imagen está entre D1 y D2. Esta regla invertida habría
que usarla también para el campo objeto si el plano objeto estuviese entre D´2i y D1.

2. Irradiancia en la imagen producida por un sistema óptico

Como hemos visto anteriormente, la PE regula el flujo luminoso que sale de O´. La
irradiancia calculada para el punto O´ del eje (teniendo en cuenta la limitación del DA)
será también válida para todos los puntos en los que haya iluminación plena.
Considerando el ejemplo de la figura, se calcula el flujo que llega a la imagen (debido a
la emisión de un pequeño elemento de área dS) como el flujo que entra por la PE
corregido por las pérdidas originadas por los componentes ópticos del sistema (espejos
y lentes). A partir de ahí se calcula la irradiancia en la imagen.
Como puede observarse, la irradiancia es proporcional a la apertura numérica al
cuadrado cuando el punto objeto está a distancia finita del sistema óptico. Por este
motivo, la apertura se mide mediante la apertura numérica en este caso:

Cuando O está en el infinito la irradiancia es proporcional a la apertura relativa al


cuadrado. Por ello la apertura se mide mediante la apertura relativa en estas
condiciones:

3. Poder resolutivo de los instrumentos ópticos


Aparece una mancha de difracción en torno a la imagen O´. Para averiguar cómo
podemos calcular el tamaño de dicha mancha notamos que una lente delgada (L)
convergente es equivalente al sistema formado por dos lentes superpuestas (L1 con foco
objeto en O y L2 con foco imagen en O´) y un diafragma (D) sobre ellas con diámetro φ
igual al de la lente L.

La imagen que L produce de O aparece la mancha de difracción de Fraunhofer originada


por un diafragma que coincide con la montura de la lente. Como este diafragma es
circular, aparecerá la mancha de Airy en torno a O´.
Si ahora en el objeto tenemos dos puntos (O1 y O2), en la imagen aparecerán dos
manchas de Airy rodeando a las imágenes O´1 y O´2. Se encuentra experimentalmente
que las dos manchas se ven separadas siempre que sus centros están una distancia
igual o superior al radio angular del disco de Airy.
Este criterio de resolución que limita la distancia mínima d´ entre los puntos imágenes,
limita también la mínima distancia d entre los puntos O 1 y O2 que pueden verse
separados en el objeto. Su inversa da la resolución del sistema en puntos (o líneas) por
unidad de longitud:

1,22𝜆𝑎′ 1 𝑙𝑖𝑛
𝜌𝐴′ = → 𝑅𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 = ′ ( )
𝜙 𝜌𝐴 𝑚𝑚

La resolución se mejora aumentando el diámetro del sistema óptico o disminuyendo


la longitud de onda.

4. Profundidad de foco y de campo


Cuando se utiliza un sistema óptico para producir una imagen sobre un detector digital
bidimensional (CCD), la sensación de enfoque en la imagen es la misma tanto si la
imagen de un punto es otro punto como si es una mancha cuyo tamaño no excede el
tamaño del píxel. En el caso de que se utilice una placa fotográfica como detector, la
sensación de enfoque no cambia mientras la mancha imagen de un punto sea menor
que el tamaño del grano de la placa.

Sea la mancha imagen del punto O (2r) y el tamaño del grano de la placa fotográfica/pixel
d, entonces, la sensación de enfoque es la misma en el detector si 2𝑟 ≤ 𝑑. Este rango
nos lo dan las superficies Π´‐ y Π´+, de forma que el detector de debe colocar en Π. La
distancia O´1O´2 =2Δz´ se llama profundidad de foco. Si el sistema óptico es una lente
delgada de diámetro φ:
La relación ‐1/a + 1/a´=1/f´ implica que si crece f´ también lo hace a´ y por ello la
profundidad de foco. Así, según todo lo anterior, la tolerancia en el posicionamiento de
la placa es mayor cuanto menor sea el diámetro del objetivo, mayor sea el tamaño de
los granos o píxeles del detector y mayor sea la focal imagen.
La distancia 2Δz se llama profundidad de campo, cuya expresión se determina
utilizando los aumentos angular (α´) y lateral (β´):

Esta profundidad es mayor con los mismos tres criterios que antes a lo que le añadimos
disminuir el aumento con el que trabaja el objetivo (alejar el objeto).

5. Cámara fotográfica

Una cámara fotográfica registra las imágenes producidas por un objetivo sobre una
placa analógica o digital:

• Como zz´=‐f´2 (medios extremos iguales) cuando la posición z del objeto cambia
también cambia la posición z´ de la imagen y, para enfocarla, hay que cambiar
la distancia entre el objetivo y la placa.
• Como β´= ‐f/z= ‐z´/ f´ < 0 la imagen sale invertida.
• Al ir acercando el objeto se va alejando la imagen y hay que ir separando la placa
del objetivo, hasta que llega un punto para el cual se alcanza la separación
máxima (punto próximo). No se pueden enfocar puntos más cercanos que el
próximo.
Al lado del objetivo se coloca un diafragma de diámetro variable, que hace de diafragma
de apertura (DA). En lugar de utilizar la apertura relativa para indicar la abertura del
diafragma se utiliza su inversa, que se llama número de diafragma:
En la cámara fotográfica el diafragma de campo es la placa, que se encuentra sobre la
imagen, y todo el campo es de iluminación plena. Se encuentra la expresión que
permite calcular el tamaño del campo objeto en función del tamaño de la placa:

Por otra parte, la apertura del objetivo regula también alguna de sus características. De
forma directa, el aumento del diámetro del objetivo origina aumento de la irradiancia
en la imagen (brillo), pero además mejora la resolución y empeora las profundidades
de foco y campo:36

Puede observarse que cuanto más pequeña es la focal del objetivo mayor es el tamaño
del campo objeto fotografiado y, por lo tanto, menor es el detalle con el que se hace
el registro de la imagen en la placa. En orden de detalle (creciente): gran angular, focal
media, teleobjetivo.

Como hemos visto anteriormente el aumento de la focal origina aumento de las


profundidades de foco y de campo y disminución en la irradiancia sobre la imagen:

36
En la fórmula la resolución es la inversa de eso. Por eso mejora al aumentar el diámetro.
6. Anteojo astronómico
La situación de la PS en los instrumentos, particularmente en los de visión, resulta muy
importante pues en ella ha de ponerse el iris del ojo para que recoja todos los rayos
que proceden del objeto.
Para una visión nítida, suponiendo que el ojo que se acopla con el anteojo tuviera el
mismo diámetro de iris que la PS del anteojo, se debería poner el centro del iris en P' y
se vería todo el campo de una vez.

Cuando la emergencia de pupila (distancia de la última superficie óptica del instrumento


al plano de la PS) es muy pequeña, el ojo no puede llegar a situarse correctamente y la
visión es incomoda y defectuosa. La emergencia de pupila se puede modificar (por
ejemplo, en rifles), mediante lentes colectoras.
Estas modificaciones se pueden usar para observar objetos a distancia finita, siendo
una base del anteojo astronómico.
Para ello, hay que aumentar la distancia entre objetivo y ocular, hasta que la imagen O´
de O coincida con Foc. El DC debe de moverse solidariamente con el ocular para que la
lucarna de entrada siga estando en el plano objeto.

La inversión de imagen que produce el anteojo astronómico se puede corregir mediante


un par de lentes (anteojo astronómico) o un par de prismas (prismáticos) que
introduzcan una inversión adicional.
El anteojo astronómico puede también utilizarse para expandir haces de luz,
fundamentalmente para aumentar el diámetro de los haces de luz láser y conseguir, con
ello, excitar con el haz áreas más amplias:

6.1 Anteojo de Galileo


En el anteojo de Galileo también se acoplan F´ob y Foc, el diafragma de apertura y la PE
siguen siendo el objetivo. Se consigue que la imagen no sea invertida mediante el uso
de un ocular divergente.

Aumento positivo

La PS es virtual, y como se coloca la pupila detrás del ocular en lugar de en la PS, se ve


la imagen como si se mirase a través de un tubo. Por otra parte, no tenemos iluminación
plena en todo el campo, porque el DC se coloca en el ocular, al no poderse colocar en
el objetivo por no formar imagen real. La calidad de la imagen no es buena y solo se
utiliza en instrumentos baratos.

6.2 Telescopios. Montaje de Newton


Cuando se quiere observar objetos lejanos con mucho detalle hay que mejorar la
resolución que dan los anteojos usuales. Para ello hay que aumentar
considerablemente el diámetro del objetivo. Esto no resulta posible técnicamente con
lentes porque el peso del objetivo sería excesivo.
Por ello se construyen objetivos de espejo, que pueden alcanzar varios metros de
diámetro y carecen de aberraciones cromáticas, al no usar vidrio. Tenemos entonces un
telescopio, que está formado por un objetivo de espejo y un ocular de lentes. El
telescopio de Newton es el utilizado habitualmente por los aficionados a la observación
estelar.
El espejo primario es esférico, el
secundario plano y la observación con el
ocular se hace en dirección perpendicular
a la de la entrada de la luz al espejo
primario.
6.3 Telescopios. Montajes de Maksutov y Dchmidt
Como los espejos esféricos no son stigmáticos y producen aberración esférica, ésta se
trata de reducir o anular mediante dispositivos correctores de vidrio que compensan
las variaciones de camino óptico debidas a la aberración.
El corrector de Maksutov, formado por
dos superficies esféricas.

El corrector de Schmidt, formado por


una superficie plana y otra curvada que
se calcula para corregir la aberración
de todos los rayos.

En los telescopios puede quitarse el ocular y registrar la imagen en una placa


fotográfica analógica o digital. También pueden introducirse filtros o elementos
dispersores que permitan un análisis espectroscópico de la imagen. Esto permite
estudiar la composición del objeto en estudio y los fenómenos físicos que ocurren en él.
Todas estas técnicas son de gran utilidad en astrofísica.

6.4 Telescopios. Grandes telescopios


La luz que viene de una estrella se puede aproximar a una onda plana. Pero este
atraviesa turbulencias atmosféricas que lo deforman. Como consecuencia, el telescopio
forma una imagen borrosa de la estrella.
Los grandes telescopios resuelven este problema creando una estrella artificial (con un
láser de luz amarilla), para comparar las deformaciones de ambas estrellas (natural y
artificial) y así eliminar los defectos. Para ello, constan de un espejo deformable, cuyas
deformaciones compensan las del frente de onda, que vuelve a ser plano después de la
reflexión. También de fotodiodos para el centrado de la imagen.
En el proceso de corrección una parte la luz que sale del espejo deformable se desvía
hacia un sensor que verifica si el frente de onda que proviene de la estrella artificial es
plano. En caso contrario envía señales al espejo deformable para que corrija las
desviaciones. El resto de la luz se canaliza hacia el detector de imagen.
7. Lupa
La lupa o microscopio simple suele estar formada por una única lente convergente,
que se usa para aumentar el tamaño de los objetos cercanos y poder observarlos con
más detalle. Asumiendo que el punto próximo del ojo es de 250mm tenemos que al
observar un objeto:

Si el mismo objeto se coloca en el plano focal objeto de la lupa:

Donde se ha obtenido el aumento de la lupa con respecto a su focal imagen f’. Se


consigue mayor aumento cuanto más corta es la focal de la lupa. Pero esta focal no
puede disminuirse excesivamente porque el diámetro de la lupa sería pequeño
(aberraciones). Por ello no se suelen usar lupas con aumento muy superior a 10.

8. Microscopio óptico
Para conseguir más aumentos hay que utilizar el microscopio compuesto
(habitualmente llamado microscopio), que consta de un objetivo y un ocular.

La luz que sale del microscopio es colimada, por lo que el objeto (imagen del objetivo)
debe colocarse en el plano focal objeto del ocular. No se debe variar la distancia entre
objetivo y ocular (por las aberraciones), por ello el enfoque se obtiene moviendo todo
el tubo hasta que el punto O coincide con F.
El microscopio, funciona como la lupa y su aumento se expresa como el de una lupa,
con un valor de f´ que se obtiene por semejanza de triángulos37. Destacar que el
aumento es el producto del aumento lateral con el que opera el objetivo y el aumento
ocular actuando como lupa, lo que da un número negativo que implica inversión de
imagen.

El aumento máximo resoluble del microscopio óptico es algo superior a 1000 (teniendo
en cuenta el límite de difracción), por:

• Cuando se va disminuyendo la focal del objetivo de un microscopio óptico (para


conseguir más aumentos) llega un momento en que hay que disminuir tanto su
diámetro, que el aumento del tamaño de la mancha de Airy impide mejorar la
resolución.
• Respecto al ocular, basta con darle el aumento necesario para que dos puntos
justamente resueltos por el objetivo se vean con el ojo bajo un ángulo de 1,3´,
porque el ojo no consigue mejor resolución.
También podemos calcular la resolución lineal38:

8.1 Microscopio óptico. Condensadores


Para observar un objeto, primero hay que iluminarlo, este proceso se denomina
preparación y se hace mediante un espejo y un condensador. La más común es la
iluminación por transmisión.

• El microscopio de polarización utiliza una variante de la iluminación por


transmisión, para introducir contraste en muestras anisótropas. Se emplean dos
polarizadores lineales cruzados y los cambios de coloración que produce la
dirección de los ejes.
• Para observar objetos opacos hay que iluminar por reflexión. Una lámina
divisora refleja hacia el objeto parte de la luz procedente de la lámpara y
transmite parte de la luz reflejada por el objeto.

37
t es la longitud óptica del tubo
38
Por ejemplo, para 1000 aumentos la resolución es de 0,1 μm
• Para poder observar partículas muy pequeñas en la preparación, se utiliza el
condensador de campo oscuro. Solamente la luz difundida por las partículas
entra en el microscopio, y éstas se ven brillantes sobre fondo oscuro.
• En lugar de luz difundida puede utilizarse fluorescencia, se utiliza una lámpara
espectral, de la que se selecciona una de las rayas. Los átomos o moléculas que
absorben la radiación se visualizan mediante la fluorescencia que emiten.

8.2 Microscopio óptico. Con focal de barrido


Para incrementar el contraste de la imagen, eliminando la luz desenfocada, se utiliza
el microscopio con focal de barrido:

• La luz colimada emitida por un láser se focaliza, mediante un condensador, y se


hace pasar por un orificio muy pequeño para conseguir una fuente puntual.
• La luz de esta fuente puntual atraviesa una lámina divisora y llega al objetivo del
microscopio, que forma una imagen puntual sobre el objeto a observar.
• La luz que emite (por difusión o fluorescencia) el punto imagen atraviesa el
objetivo y es desviada hacia la derecha por la lámina divisora, formando una
imagen puntual sobre un orificio muy pequeño. Un detector recoge la luz que
atraviesa el orificio.
Con este montaje se elimina fuertemente la luz desenfocada pero solamente se registra
un punto. Para registrar toda la zona que se quiere observar del objeto hay que ir
moviendo éste en las tres direcciones del espacio. Por eso el microscopio se llama de
barrido.
8.3 Microscopio óptico. Microscopio electrónico
Se pueden conseguir más aumentos disminuyendo la longitud de onda de la radiación
que interacciona con la muestra. Una de las soluciones es el microscopio electrónico,
en el que se aprovecha el pequeño valor de la longitud de onda asociada a los electrones.
Se aceleran los electrones (para que la velocidad sea suficientemente alta y la longitud
de onda sea suficientemente pequeña) y se focalizan sobre la muestra. Las lentes
electromagnéticas del objetivo concentran los electrones que salen de la muestra sobre
una pantalla fluorescente que permite la visualización de la imagen.
Existen también microscopios electrónicos de reflexión y de barrido. En la actualidad se
consiguen hasta 500000 aumentos (resolución de 0,2 nm) con un voltaje de aceleración
del orden de 100 KV.

8.4 Microscopio óptico. Microscopio de rayos X


Otra forma de disminuir la longitud de onda para mejorar la resolución del microscopio
es utilizando rayos X como fuente de iluminación del objeto a observar. Es necesario
usar lentes zonales de Fresnel39 (porque no sirven ni los vidrios ni los espejos).

El haz de rayos X se concentra sobre la muestra mediante una lente difractiva metálica
(lente de Fresnel). La onda transmitida por la muestra o la fluorescencia de rayos X
(emitida en otra dirección) se recoge en un detector. Moviendo la muestra
convenientemente se registra punto a punto la zona necesaria.
La resolución de este microscopio es de varios nanómetros, siendo peor que el
electrónico, pero más útil para el análisis en vivo de muestras biológicas, además de que
es menos perturbativo.

39
Una lente de Fresnel focaliza la luz basándose en el principio de Huygens. La luz colimada llega
a la misma y se difracta en la superficie, de forma que al punto O llegarían ondas de distinta fase.
Se puede construir de tal forma que se componga de circunferencias contiguas con diferencia
de fase π (estas zonas son las zonas semiperiódicas de Fresnel). Entonces se puede potenciar el
campo en O si se impide el paso de la luz por todas las zonas impares o pares. Esto es justo lo
que hace una lente de Fresnel.
8.5 Microscopio óptico. Microscopio de efecto túnel
Se emplea para obtener imágenes a escala atómica de superficies metálicas.

• Cuando una aguja de punta muy aguda (tanto que en su extremo haya solamente
un átomo) se coloca muy próxima a la superficie de un metal aparece una
interacción entre las nubes electrónicas del átomo de la punta y de la superficie.
• Al establecer una diferencia de potencial, pasan electrones de una a otra por
efecto túnel.
• La aguja se desplaza con un control piezoeléctrico y se registra la topografía de
la superficie a escala atómica.

Con el microscopio de efecto túnel se consiguen resoluciones de 0,1 nm en la dirección


de la superficie y 0,01 nm en la dirección perpendicular.

8.6 Microscopio óptico. Microscopio de fuerza atómica


El microscopio de fuerza atómica también registra los átomos que componen la
superficie de un material mediante el barrido con una punta. La punta va unida a una
micro‐palanca muy flexible que es reflectante en su parte superior.

• Un haz de luz láser incide sobre la parte superior de la micro‐palanca cuando la


punta está en contacto con la muestra.
• La luz láser reflejada va a un sistema con cuatro detectores en cuadrante, que
registran la misma señal cuando el haz reflejado está perfectamente centrado.
• Si el haz se descentra (al subir o bajar la punta) la muestra se desplaza
verticalmente mediante un cuarzo piezoeléctrico, hasta que queda nuevamente
centrado. De esta manera se registra la topografía de la superficie.
9
Metrología óptica: redes de difracción e interferómetros
1. Redes de difracción. Redes de rendijas
Vamos a estudiar la difracción de Fraunhofer por un número muy grande de rendijas
paralelas entre sí e igualmente espaciadas (red de difracción) que van a ser capaces de
proporcionar una información mucho más completa sobre el espectro de la fuente.

La iluminación se lleva a cabo, como en el caso de rendijas de Young, mediante una


fuente lineal (habitualmente colocada en el plano focal de la lente colimadora). A la
anchura de cada rendija la llamamos 2a y a la separación entre dos rendijas consecutivas
2d.
El campo eléctrico de la luz difractada por N rendijas, cuando la luz incide
perpendicularmente a la red de difracción:

Notamos que es el producto de un término interferencial y otro difraccional:

Y obtenemos la distribución de luz difractada, como la distribución de intensidad


difractada por una rendija multiplicada por un término interferencial:
1.1 Análisis de la luz difractada
La luz colimada llega al difractor (las rendijas). Se
difracta en todas las direcciones, pero para
analizar el fenómeno nos vamos a quedar con una
aleatoria, la dirección theta. Entonces llega a la
lente, donde se confunden los planos principales
por ser delgada. Cogemos uno de los rayos que
pasa justo por el punto principal y así conocemos
su dirección. Una vez sabida la de este, sabemos la
de todos, porque tienen que converger en el
mismo punto. Para esta dirección nos fijamos en
el color rojo, orden 1. El resto de direcciones de
difracción dan el resto de órdenes.

Siendo que el término interferencial depende de 𝛼𝑃 = 𝑠𝑒𝑛(𝜃), notamos que para que
no haya interferencia (o máximo en intensidad), se tiene que anular. Entonces, notamos
que la diferencia de fase entre dos rayos consecutivos es:

Y los máximos están pues para:

Los máximos principales vendrán dados por:

Por otra parte, se define la anchura de un máximo principal como:

Notamos que, para cada orden m (salvo m=0) y existen varios máximos que dependen
de la longitud de onda. Por tanto, se pueden separar las distintas longitudes de onda
de la luz que ilumina las rendijas si se coloca una rendija muy estrecha en el plano focal
de la lente colimadora. Moviendo esta rendija y colocando detrás un detector se podría
medir el espectro de la luz.
La dispersión angular es mayor cuanto mayor es m:
Además, los máximos principales se estrechan conforme aumenta el número N de
rendijas iluminadas. Por esta razón el poder resolutivo aumenta con m y N:

Hay que recordar que los máximos correspondientes a dos longitudes de onda muy
próximas se consideran resueltos si su distancia es al menos la mitad de su anchura.

En este intento de separar las diferentes longitudes de onda del espectro de la fuente
luminosa, hay que tener en cuenta que en la misma dirección θ pueden aparecer
máximos principales correspondientes a longitudes de onda diferentes (uno por cada
valor de m):40

Si el haz de luz que incide sobre la red de difracción contiene varias de esas longitudes
de onda, la rendija de detección las deja pasar juntas y no se resuelve el espectro.
Se encuentra la expresión de la diferencia entre las longitudes de onda
correspondientes a dos órdenes interferenciales consecutivos (intervalo espectral
libre):

Para evitar superposición de longitudes de onda en la medida del espectro, la anchura


de éste debe ser menor que el intervalo espectral libre:

40
Esto se despeja de la expresión de antes para la dispersión angular.
Hasta ahora hemos considerado incidencia normal de la luz sobre la red de rendijas.
Pero se generaliza la ecuación de la red para el caso de incidencia oblicua:

Teniendo en cuenta que en la ecuación de la red el seno no puede ser mayor que la
unidad, se obtiene el máximo valor posible para el orden interferencial:

Por otra parte, hay que tener en cuenta que debido al término de difracción solo
presentan intensidad apreciable los máximos principales que se producen dentro del
máximo central de difracción. Como puede verse, cuanto menor es a frente a d más
máximos principales aparecen dentro del máximo central de difracción.
Lo ideal sería utilizar para medir el espectro el máximo interferencial coincidente con
el máximo de difracción. Esto ocurre para el máximo de orden cero, que sale en la
dirección de propagación geométrica de la luz. Como este orden interferencial no separa
las longitudes de onda del espectro, se suele utilizar el +1 o el ‐1, con lo cual la
luminosidad no es óptima.
2. Interferómetro de Michelson
Un interferómetro de Michelson está formado por dos espejos planos (E1,E2)
ortogonales entre sí, una lámina divisora semi‐espejada (LD que refleja el 50 % y
transmite el 50 %) que forma 45º con los espejos y una lámina compensadora (LC) sin
espejado.
Un rayo de luz r, que entra al interferómetro en la dirección perpendicular al espejo E 2,
se divide en dos rayos ortogonales (1 y 2) que interfieren (al salir superpuestos) después
de recorrer caminos ópticos que, en general, son distintos. La lámina compensadora se
introduce para que el recorrido en el vidrio sea igual por los dos caminos.
Todos los rayos que entran al interferómetro formando una superficie cónica de
semiángulo θ, producen el mismo estado interferencial (la misma intensidad). Por lo
tanto, en el plano focal de la lente colectora se ven anillos brillantes, oscuros y de
intensidad intermedia.

• Condición de máximo (anillo brillante)

• Condición de mínimo (anillo oscuro)

• Condición de máximo central

• Hay máximo en el centro del campo interferencial (θ=0) si 2d=mλ. En ese caso,
el anillo de máximo orden interferencial degenera en un punto, que se encuentra
en el centro.
• Caso d=0 (campo interferencial brillante y sin anillos). Porque se cumple la
condición de máximo, con m=0, independientemente del valor de θ
Al aumentar o disminuir m disminuye o aumenta respectivamente el radio de los anillos,
lo que implica que el anillo de mayor orden interferencial es el de radio más pequeño.
Al mover uno de los espejos, de forma que aumente d, brotan anillos del centro (un
anillo por cada desplazamiento λ/2 del espejo):

Si disminuimos d los anillos se pierden por el centro:

3. Interferometría por transformada de Fourier. Interferómetro de Twyman


El interferómetro de Twyman es una variante del interferómetro de Michelson, de
forma que a la lámina divisora entra un haz de luz colimada, paralela al eje. Si se
observan las interferencias en una pantalla, la condición de máximo:

Implica que todo el campo se verá uniformemente iluminado. Se puede utilizar este
interferómetro para medir con precisión el recorrido o las vibraciones de una pieza móvil
(a la que se une uno de los dos espejos) contando el número de máximos que van
apareciendo en la pantalla

Se determina el espectro a través de su grado de coherencia. Para ello, a la salida de un


interferómetro de Twyman colocamos un detector. La señal detectada corresponde a la
superposición de los campos eléctricos de la luz que va por los dos brazos, con diferencia
de tiempos de llegada τ. Vamos analizar lo que ocurre cuando registramos la intensidad
en función de τ.
Luego en principio, con la expresión para el espectro, ya podríamos utilizar el
interferómetro. El problema es que falta como medimos el grado de coherencia.
Para poder medir Reγ(τ) hay que mover uno de los espejos del interferómetro dentro
del intervalo máximo posible (‐dM, dM) y registrar la intensidad con el detector. Este
registro (interferograma) permite deducir los valores de Reγ(2d/c)=Reγ(τ).

Dem.

En principio podemos partir de la expresión de la intensidad:

Obteniendo:

La idea es que el grado de coherencia es la transformada de Fourier del espectro


normalizado de la luz, luego el espectro normalizado se puede obtener como
transformada de Fourier inversa del grado de coherencia temporal:
Pero lo que nos proporciona la medida de I(τ) es solamente la parte real del grado de
coherencia, tenemos que seguir analizando el problema.
El espectro es tal que:

Luego podemos reescribir el grado de coherencia temporal:

Entonces notando que g es real y positiva (densidad de energía normalizada), podemos


aplicar:

De donde en general:

QED.
Podemos encontrar varios problemas en relación al interferómetro:

• Es preciso que Reγ(2dM/c) sea despreciable, para que se pueda considerar nula
para |d|>dM y poder hacer la integral de inversión. Este desplazamiento
limitado del espejo determina el poder resolutivo del interferómetro, que es
del orden de 106.
• El proceso de inversión de la transformada de Fourier presenta complicaciones
numéricas. Veremos posteriormente que el espectrómetro de Fabry‐Perot
proporciona el espectro directamente (sin los problemas del algoritmo de
inversión) con un poder resolutivo similar al de transformada de Fourier.
• Las interferencias están afectadas por la coherencia temporal.
4. Interferómetro de Fabry-Perot
4.1 Interferencias múltiples en una lámina planoparalela

Si sobre una lámina planoparalela de vidrio de índice de refracción n (sumergida en aire)


se incide con luz monocromática de amplitud A aparecen múltiples ondas debido a las
reflexiones sucesivas de la luz en el interior de la lámina.
Si las ondas reflejadas o transmitidas se recogen con una lente, se pueden observar
interferencias sobre una pantalla colocada en su plano focal. Por la simetría del
problema todas las ondas que entren formando una superficie cónica de semiángulo θ,
saldrán con la misma condición de interferencia y se observarán anillos en la pantalla.
Entre dos ondas sucesivas reflejadas o transmitidas aparece una diferencia de fase δ,
debida a la diferencia Δ entre los caminos ópticos que recorren en el interior de la
lámina.

la expresión de la intensidad, de la que se deducen las condiciones de máximo y mínimo


de interferencia:

Donde se puede expresar:


Dem.
Se producen interferencias múltiples en la lámina planoparalela, donde las amplitudes
de las distintas ondas se dan en función de ρ (coeficiente de reflexión interna), τ
(coeficiente de transmisión de aire a vidrio) y τ´ (coeficiente de transmisión de vidrio a
aire):

Recordamos los coeficientes de Fresnel entre dos medios l.h.i:

Para obtener la intensidad transmitida, se encuentra la amplitud compleja de la onda


transmitida j:

La amplitud compleja debida a la interferencia de todas las ondas transmitidas es la


suma de una progresión geométrica:

A partir de esta amplitud compleja se obtiene inmediatamente la intensidad reducida:


A partir de la expresión de la intensidad reducida se obtiene inmediatamente la
expresión de la intensidad.
QED.
Y se deduce:

La figura ilustra la dependencia de IT con δ y ρ. Si damos a ρ2 distintos valores (espejando


la lámina por ambas caras) se ve que los máximos de la luz transmitida se afinan mucho
cuando el espejado tiene un factor de reflexión alto, por lo que estos máximos sirven
para determinar el espectro de la fuente de luz.

A partir de la expresión de la intensidad transmitida se obtiene la de la reflejada, así


como las condiciones de máximo y mínimo. La dependencia de IR con δ y ρ es:

O alternativamente:
Y así hallamos:

Se ve que los máximos de la luz transmitida son siempre muy anchos y no sirven para
medir el espectro.
Como la resolución con la que se obtiene el espectro depende de la anchura de los
máximos, se deduce la expresión de esta anchura:

Para caracterizar la anchura de un máximo frente a la distancia entre dos máximos


consecutivos se define la fineza:

4.2 Interferómetro de Fabry-Perot


El interferómetro de Fabry‐Perot se basa en las interferencias discutidas anteriormente
y está formado por dos láminas espejadas, entre las cuales hay una lámina
planoparalela de aire de espesor e. Si se utiliza fuente extensa y lente colimadora, en
el plano focal de la lente colectora aparece la imagen de la fuente con los anillos de
interferencia sobre ella.

La condición de máximo es idéntica a la que se obtiene en el interferómetro de


Michelson, por lo que son válidos los comentarios que se hicieron sobre los anillos:

Como puede verse en las dos figuras, los anillos que se obtienen mediante un
interferómetro de Fabry‐Perot son mucho más finos que los obtenidos mediante un
interferómetro de Michelson. En la figura de la derecha se ve que llegan a separarse
rayas espectrales tan próximas como las del doblete del sodio.
Se muestra que en el Fabry‐Perot el cambio de dirección de un máximo con la longitud
de onda es proporcional al orden interferencial m:

Por otra parte, los máximos se separan mejor (al ser más estrechos) cuanto mayor sea
su fineza F:

Esa es la razón por la cual se obtiene que el poder resolutivo tiene la expresión R=mF:

5. Metrología óptica (aplicaciones)


Como hemos visto, la metrología óptica se basa en:

• Redes de difracción
• Interferometría:
o Interferómetro de Michelson
o Interferómetro de Twyman
o Interferómetro de Fabry-Perot y capas dieléctricas
5.1 Aplicaciones de las redes de difracción
La medida del espectro de un haz de luz permite el estudio de la estructura de la
materia, la identificación de la composición química de la fuente de luz, la medida de la
velocidad del emisor, etc.
Las redes de difracción han contribuido, y siguen contribuyendo a estas medidas,
mediante espectrómetros y espectrógrafos de red.
Fabricación
Las redes de rendijas típicas se fabrican haciendo rayas con una punta de diamante
sobre una lámina de vidrio pulido. La zona rayada queda traslúcida y la no rayada
constituye las rendijas. La red construida así es cara, por lo que, en realidad, esta se
utiliza para hacer réplicas.
Para mejorar las prestaciones de las redes de rendijas se construyen redes de escalillas.
Sobre un sustrato de vidrio se deposita una capa de aluminio y sobre ella se tallan surcos
(con punta de diamante) paralelos (llegando hasta 2000 líneas/mm). Para aumentar esta
densidad se puede usar litografía (las franjas se tallan con luz láser), estas llegan hasta
8000 líneas/mm. También se fabrican réplicas de forma similar a las de las redes de
rendijas. Si la réplica se recubre de una capa, del orden de 1 μm de espesor, de un metal
como aluminio, oro, platino, níquel, etc. se tiene una red que opera por reflexión.
Podemos analizar más en detalle las redes de escalillas:

• En trasmisión
Puede conseguirse que un máximo de orden m≠0, correspondiente a una longitud de
onda λ0, salga en la dirección θ´0 del máximo de difracción (dirección de la onda
refractada) con la máxima eficiencia posible.

• En reflexión
Para 𝜆0 < 0,2 𝜇𝑚 los materiales con los que pueden hacerse las redes absorben la luz,
no sirven las redes por transmisión y hay que usar redes por reflexión, que también se
usan para 𝜆0 > 0,2 𝜇𝑚:

La dirección de máxima eficiencia (dirección del máximo de difracción y, por ello, de


propagación geométrica de la luz) es la de reflexión especular en las superficies de las
escalillas de la red.
Tanto para redes por transmisión como por reflexión se puede obtener el mismo poder
resolutivo con diversas densidades de líneas, con tal que el producto mN se mantenga
constante. Por ejemplo: 𝜆0 = 0,5 𝜇𝑚, 𝐿 = 10𝑐𝑚 → 𝑅𝑡𝑟𝑎 = 150000, 𝑅𝑟𝑒𝑓 = 200000.
Espectrómetros
En los espectrómetros más habituales se utilizan redes por reflexión, cuyo tamaño no
supera los 10 cm. La luz a analizar se focaliza sobre la rendija de entrada S1, es colimada
mediante un espejo cóncavo y dirigida hacia la red. La luz difractada por la red es
focalizada por un espejo cóncavo. En su plano focal aparecen separados las distintas
componentes espectrales de la luz.
Mediante una rendija S2 se deja pasar una banda de anchura dλ, en torno a la longitud
de onda λ, cuya intensidad se mide con el detector. Girando la red se varía λ, de forma
que se recorra todo el espectro de la fuente.
El detalle con el que se puede analizar el espectro depende del poder resolutivo de la
red y de las anchuras de las rendijas S1 y S241. En los observatorios astrofísicos se
utilizan también redes de difracción por transmisión en los espectrómetros.

Espectrógrafos
En los espectrógrafos se registran todas las longitudes de onda del espectro
simultáneamente, en lugar de secuencialmente como se hace en los espectrómetros.
Para ello, en vez de colocar rendija de salida y un detector, se coloca una matriz de
detectores (generalmente una placa lineal CCD). Las distintas longitudes de onda se
registran en pixeles diferentes de la placa. El píxel y la rendija S deben ser
suficientemente estrechos para que no se estropee el poder resolutivo de la red.
Los espectrógrafos aprovechan más la energía, pero son menos flexibles en su uso que
los espectrómetros.
Espectrómetro Espectrógrafo

Espectrógrafos con fibras ópticas


En los observatorios astrofísicos se están utilizando espectrógrafos especiales, para
poder registrar simultáneamente el espectro de muchos objetos del espacio.
La luz de la imagen que produce el objetivo del telescopio se acopla en fibras ópticas
(una para cada punto) en la rendija de entrada del espectrógrafo. Así se registran los
espectros de los diferentes objetos en diferentes lugares de la placa.

41
Cuanto más estrechas, mayor poder resolutivo, pero menor señal detectada.
Circunferencia de Rowland
Otro caso especial es el del análisis de espectros en la zona del ultravioleta lejano o de
rayos X, donde no se pueden usar ni redes de trasmisión ni lentes.
Si se traza una circunferencia tangente al espejo, cuyo diámetro sea igual al radio de
curvatura del espejo (circunferencia de Rowland) y se coloca la rendija S 1 en un punto
de la circunferencia, la red focaliza las distintas longitudes de onda en puntos de dicha
circunferencia. Colocando una rendija S2 que se mueva sobre la circunferencia de
Rowland se puede medir el espectro, sin necesidad de espejo colimador ni de espejo
focalizador, disminuyendo así las pérdidas energéticas.

Utilizando litografía se consigue grabar surcos curvados que permiten mantener la


focalización sobre una rendija de salida fija

Láseres sintonizables: fenómenos acusto-ópticos


Las redes de difracción pueden utilizarse también como reflectores selectivos en láseres
sintonizables. Girando la red va variando la longitud de onda emitida por el láser
(dentro de la banda de amplificación del medio usado).
Láser sintonizable Fenómenos acusto-ópticos

Otra aplicación interesante se encuentra en el dominio de los efectos acusto‐ópticos


(fenómenos de interacción de ondas acústicas con ondas electromagnéticas). Cuando
se hace pasar por un vidrio una onda ultrasónica, aparecen zonas en las que hay
compresión (aumento del índice de refracción) y otras en las que hay expansión
(disminución del índice de refracción). El resultado es un cambio periódico del índice de
refracción, con un periodo Λ=V/f, siendo f la frecuencia de la onda ultrasónica y V su
velocidad de propagación.
Este dispositivo se comporta como una red de difracción. Parte de la luz incidente sigue
en la misma dirección y parte se difracta en la dirección θ. El dispositivo se puede usar
como un modulador lineal de luz.
De acuerdo con la ecuación de la red, Λsenθ debe permanecer constante cuando cambia
la frecuencia del ultrasonido: Λsenθ=cte  senθ1/Λ=f/V. Por tanto, la frecuencia del
ultrasonido se puede variar para variar θ oportunamente. Con esto se consigue dirigir
un haz de luz en la dirección necesaria. Con dos dispositivos acusto‐ópticos se puede
conseguir un direccionamiento bidimensional.

5.2 Aplicaciones del interferómetro de Michelson


Medida de espesores
Se emplean dos superficies pulidas a una distancia e y el espejo E2 del interferómetro,
que se ilumina con luz láser.

• Se observan primero las interferencias producidas por la reflexión en la parte


superior de la pieza y se desplaza ésta hasta que el campo interferencial aparece
uniformemente iluminado (d=0 para la parte de arriba).
• A continuación, se observan las interferencias debidas a la parte inferior
(aparecen anillos). Se desplaza la pieza hasta conseguir nuevamente el campo
interferencial uniformemente iluminado (d=0 para la parte de abajo) y se va
contando el número de anillos (Δm) que desaparecen por el centro.
El error con el que se mide e, el error máximo equivale a la incertidumbre de un anillo
en Δm. En lugar de medir el espesor de un calibre, se puede medir la diferencia de
longitudes de dos piezas, apoyándolas en una misma superficie.
Para medir el espesor e de una lámina de vidrio de índice de refracción n, se procede
de forma parecida.

• Después de conseguir (moviendo E2) la condición d=0, se introduce la lámina de


vidrio paralelamente a E2 y se desplaza este espejo hasta recuperar la condición
de máximo en todo el campo, contando el número de anillos que pasan y
midiendo el radio del anillo residual.
• Otra forma de medir el espesor de la lámina (figura derecha) es ir girando la
lámina y contando el número de anillos que surgen del centro cuando la lámina
se gira un ángulo determinado.

Medida de índices de refracción de gases


Este interferómetro puede utilizarse también para medir el índice de refracción de un
gas a una presión determinada.

• Se introduce una cubeta transparente de caras planas y paralelas en uno de los


brazos del interferómetro, de forma que quede paralela al espejo E2.
• Con la cubeta en vacío se mueve E2 hasta que haya máximo en el centro del
campo interferencial. Después se introduce el gas hasta llegar a la presión
deseada, contando el número de anillos que pasan y midiendo el anillo final
central.

5.3 Aplicaciones del interferómetro de Twyman


Medida de distancias y vibraciones
Cuando estas medidas hay que hacerlas en salas industriales, se suelen sustituir los
espejos por cubos reflectores, que son menos sensibles a la falta de alineamiento.
Pueden también registrarse vibraciones de superficies reflectantes si se usan en lugar
de uno de los espejos.
Control de calidad de dispositivos ópticos
Si se introduce en uno de los brazos del interferómetro una lámina con defectos, los
distintos rayos que entran en la lámina recorren caminos ópticos diferentes y el estado
interferencial cambia. Por lo tanto, si se coloca una pantalla a la salida del
interferómetro, aparecen las curvas de nivel de la topografía de la lámina.
Distancias y vibraciones Control de calidad de dispositivos ópticos

También puede medirse la aberración esférica de la lente LC. Para ello, el espejo E2 debe
ser esférico y tener su centro en el foco imagen de la lente LC (se cambia la lámina por
la lente). Inclinando la lente LC y moviendo oportunamente E2, se pueden medir
aberraciones de puntos fuera de eje.

5.4 Interferencias en láminas delgadas de espesor variable


Supongamos que tenemos una cuña de vidrio de ángulo α muy pequeño iluminada con
luz monocromática en la dirección del rayo r. Las ondas reflejadas en las dos caras de la
lámina (en las direcciones 1 y 2) interfieren en la retina cuando se observan con el ojo.
Se observan franjas de máximo y mínimo paralelas a la arista de la cuña, localizadas en
la cara inferior de la misma.

Este fenómeno ocurre en películas delgadas de cualquier forma (si las películas son
gruesas no se producen las interferencias por falta de coherencia) y la visualización de
las interferencias permite observar las curvas de igual espesor de la película.
Por ejemplo, cuando se coloca sobre una lámina de vidrio la parte convexa de una lente
plano‐convexa, se pueden observar anillos interferenciales llamados anillos de Newton.
Si las interferencias se observan con luz blanca la condición de máximo cambia con λ y
se observan curvas coloreadas (por ejemplo, cuando hay una capa delgada de aceite o
gasolina sobre el agua o el asfalto).
Esto se usa como método (peor pero más fácil) para medir aberraciones de un
instrumento óptico. Se fabrica un molde complementario de cada una de las caras de
las lentes del instrumento y se encaja con la lente correspondiente y se ilumina con luz
monocromática. Si el encaje no es exacto aparecen curvas de nivel que nos indican la
magnitud de los defectos.

5.5 Aplicaciones del interferómetro de Fabry-Perot


Espectrómetro de Fabry-Perot
En un espectrómetro de Fabry–Perot la selección de longitud de onda se hace dejando
pasar una banda estrecha de longitudes de onda (de anchura dλ) en torno a λ, mediante
un pequeño orificio colocado en el plano focal de la lente colectora. Detrás se coloca un
detector y se mueve una de las láminas espejadas de forma que se haga un barrido del
espectro que queremos medir.
El diámetro del orificio debe ser tal que dλ sea menor que la resolución del
interferómetro (Δλ=λ/R) si no se quiere deteriorar el poder resolutivo R que
proporciona el interferómetro.
Por otra parte, para evitar superposición de longitudes de onda diferentes en la misma
dirección, conviene ajustar el intervalo espectral libre al valor de la anchura δλ del
espectro, lo que determina el valor de m que hay que utilizar. La variación que hay que
dar a e para hacer un barrido de la anchura del espectro debe ser λ/2.

El poder resolutivo de este interferómetro es del orden de 10 6, igual que el que se


obtiene mediante un interferómetro por transformada de Fourier.

Óptica de multicapas dieléctricas


En lugar de depositar una capa metálica sobre un sustrato, se deposita una multicapa
dieléctrica (para que el factor de reflexión sea próximo a la unidad).
La luz incide y se dan ondas reflejadas en las diferentes superficies de separación. Estas
ondas pueden interferir:

• Constructivamente: factor de reflexión unidad que sigue siendo muy alto para
un intervalo espectral cuya anchura crece con el número de capas.
• Destructivamente: antirreflectante y sirve para recubrir las lentes y eliminar las
pérdidas de luz por reflexión.
Depositando multicapas reflectantes a ambos lados de una lámina delgada, se consigue
un interferómetro de Fabry‐Perot de espaciado fijo, que puede utilizarse como filtro de
banda estrecha (filtro interferencial).

Modos axiales en una cavidad Fabry-Perot. Láser multimodo


Ahora que hemos estudiado el interferómetro de Fabry–Perot podemos entender que
los dos espejos de un láser de cavidad lineal forman un interferómetro de Fabry–
Perot. Por tanto, solamente saldrán del láser aquellas longitudes de onda del espectro
de ganancia que corresponden a los máximos del Fabry–Perot para θ=0 (dirección del
eje). Sus longitudes de onda y frecuencias son:

La diferencia entre las frecuencias de dos modos consecutivos es:

Al disminuir d aumenta Δν y disminuye el número de modos que emite el láser, que por
emitir varios modos se llama láser multimodo.

Láser monomodo
Si se introduce en el interior de la cavidad de longitud d 1 otra de longitud 𝑑2 ≪ 𝑑1 , la
separación entre modos consecutivos será muy diferente en las dos cavidades.
Como del láser salen solamente los modos comunes a las dos cavidades, se puede
conseguir que solamente haya un modo en la emisión láser (láser monomodo), que por
lo tanto será muy monocromático.
El Fabry‐Perot de espesor d2 se gira para llevar a cabo la selección de la longitud de onda
de emisión. Esta técnica puede utilizarse tanto en láseres de longitud de onda fija como
en láseres sintonizables, para obtener luz láser muy monocromática que permite excitar
las transiciones de los átomos y las moléculas de forma muy selectiva, pudiendo llegar
a excitar solamente una especie isotópica.
Todo esto conduce a aplicaciones de gran interés como espectroscopía de alta
resolución, análisis químico de trazas, separación de isótopos, medicina, etc.

También podría gustarte