Apunts FCweb

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 184

Fundamentos de Comunicaciones

Notas de Clase

Antoni Morell y José L. Vicario

Universitat Autònoma de Barcelona (UAB)


Escola d’Enginyeria
i
Índice general

1. Señales Aleatorias 1

2. Transmisión Analógica en Banda Base 19

3. Transmisión Analógica Paso Banda 38

4. Modulaciones Lineales 54

5. Modulaciones Angulares 72

6. Codificación de Fuente 94

7. Transmisión Digital en Banda Base 125

8. Transmisión Digital Paso Banda 152

ii
Tema 1: Señales Aleatorias
Antoni Morell y José López Vicario

7 de mayo de 2013

1. Necesidad de trabajar con señales aleatorias


Con el fin de entender por qué necesitamos trabajar con señales aleatorias, fijémonos primero en las
dos siguientes figuras.

1 4

0.8
3

0.6
2
0.4

1
0.2

0 0

−0.2
−1

−0.4
−2
−0.6

−3
−0.8

−1 −4
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

Figura 1: Ejemplos de señales aleatorias.

En la primera vemos en trazo negro un coseno de frecuencia 1Hz y fase 0rad. En trazo azul vemos
el mismo coseno pero con una fase que no es exactamente 0 sino que cambia aleatoriamente en cada
instante de tiempo. Algo ası́ es lo que verı́amos en el osciloscopio si lo conectáramos a la salida de un
oscilador real. Si ahora desconectáramos el oscilador, deberı́amos ver una señal constante a 0 puesto
que no hay entrada. Sin embargo, esto no es exactamente ası́ ya que en realidad se apreciarı́a algo como
lo de la segunda figura, es decir, una señal aleatoria que tendrá mayor (trazo azul) o menor (trazo
negro) “amplitud”. Puesto que este tipo de señales se van a dar a la realidad es imprescindible trabajar
con ellas, lo que implica modelarlas de alguna forma. La pregunta ahora es: ¿se puede hacer algo más
que simplemente decir que se trata de una señal aleatoria? La respuesta es clara viendo las figuras,
ya que aunque las señales son aleatorias, tienen comportamientos distintos. En la primera figura hay
una forma senoidal subyacente mientras que en la segunda no, en el trazo azul de la segunda figura
hay más variabilidad que en el trazo negro, etc. Todo esto es lo que podremos cuantificar y modelar
gracias al estudio de las señales aleatorias, también conocidas como procesos aleatorios o estocásticos.

1
2. Variables aleatorias (repaso)
Definición: Una variable aleatoria X(A) es una variable matemática cuyo valor resulta de la medi-
ción de cierto suceso aleatorio A una vez realizado un determinado experimento. Habitualmente se
omite el suceso aleatorio y escribimos simplemente X para representar la variable aleatoria, que puede
ser un valor dentro de un conjunto finito de posibilidades (variable aleatoria discreta) o bien dentro
de un conjunto infinito de posibilidades (variable aleatoria continua), siempre hablando de variables
aleatorias unidimensionales. Asociada a la medida X (que corresponde a un cierto suceso A) está la
probabilidad de que dicho evento ocurra y esto es lo que cuantificaremos con la función densidad de
probabilidad (fdp) de X. Antes de hablar de la fdp, pero, pongamos unos ejemplos:

Ejemplo 1: Consideramos como experimento lanzar una moneda al aire. En este caso, existen dos
posibles sucesos, A = {cara} y A = {cruz}. La medición que hace la variable aleatoria X(A) es la
siguiente. Si sale cara, entonces X({cara}) = 1. Por contra, si sale cruz, X({cruz}) = 0.
Ejemplo 2: Consideramos ahora como experimento escoger un instante del dı́a. Ahora existen infinitos
sucesos posibles dentro del intervalo [0, 24) (dividimos el dı́a en horas). La medición que hacemos en
este caso es directamente el propio suceso, por lo que X(A) = A.

Función de densidad de probabilidad de X: fX (X)

La función de densidad de probabilidad nos dice la probabilidad de que la v.a. esté comprendida
entre dos valores cualquiera. Si hacemos que los dos puntos sean infinitamente próximos, entonces
tendrı́amos la probabilidad de ese punto en cuestión. En otras palabras, conociendo fX (X), calculamos
P (X1 ≤ X ≤ X2 ) como
Z X2
P (X1 ≤ X ≤ X2 ) = fX (X)dX (1)
X1

y siempre se debe cumplir

1. fX (X) ≥ 0
R +∞
2. −∞ fX (X)dX = 1

Valor medio de X : mX

Se calcula con el operador esperanza aplicado a X, es decir


Z +∞
mX = E{X} = XfX (dX) (2)
−∞

y por lo tanto estamos haciendo una ponderación de todos los valores del rango de X ponderando por
su densidad de probabilidad. Ası́ pues, los valores dentro de fX (X) más probables contribuirán más
al valor medio que los menos probables, pero en ningún caso hay que confundir la media de una v.a.
con el valor más probable que ésta pueda tomar.

2
Observación: Si pasamos la v.a. X por una función cualquiera g, entonces Y = g(X) también es v.a.
y por lo tanto podemos calcular su esperanza
Z +∞
mY = E{Y } = E{g(X)} = g(X)fX (X)dX (3)
−∞

Fijémonos que calculamos una “media” ponderada igual que antes donde cada valor g(X) tiene un
peso dado por fX (X).

Valor cuadrado medio de X

Como su nombre indica, se trata de la media de X 2 , o sea, X a través de la función g(z) = z 2 . Ası́ pues,
se calcula como Z +∞
E{X 2 } = X 2 fX (X)dX (4)
−∞

Momento k-ésimo de una v.a.

Se trata de una generalización de las definiciones anteriores, que corresponden a k = 1 y k = 2,


respectivamente. Z +∞
k
E{X } = X k fX (X)dX (5)
−∞

2
Varianza de una v.a. X : σX

La definimos como
Z +∞
2 2
σX = E{(X −mX ) } = (X −mX )2 fX (X)dX = E{X 2 }−2E{X}mX +m2X = E{X 2 }−m2X (6)
−∞

y nos da una idea de cuánto se separan los posibles valores de X respecto a su media, teniendo más
en cuenta los que tienen una alta densidad de probabilidad frente a los que no la tienen.

Fijémonos que calculamos una “media” ponderada igual que antes donde cada desviación (X − mX )2
tiene un peso dado por fX (X).

Desviación estándar de una v.a. X : σX

Se trata simplemente de la raı́z cuadrada de la varianza y es quizá más fácil de interpretar. Por ejem-
plo, el conjunto de valores más probables de una v.a. X se encuentra en el intervalo [mX −σX , mX +σX ].

Correlación entre 2 v.a. X e Y

La correlación entre 2 v.a. X e Y se define como


Z +∞
rXY = E{XY } = XY fX,Y (X, Y )dXdY (7)
−∞

3
y nos da una idea del parecido entre las variables. Cuando rX,Y = 0 diremos que las variables son
ortogonales.

Covarianza entre 2 v.a. X e Y

La covarianza entre 2 v.a. X e Y se define como


Z +∞
cXY = E{(X − mX )(Y − mY )} = (X − mX )(Y − mY )fX,Y (X, Y )dXdY = rXY − mX mY (8)
−∞

y nos da una idea del parecido entre 2 v.a. si quitamos el offset que supone la media de ambas. Cuando
dos variables verifican cXY = 0 diremos que están incorreladas, lo que es equivalente a decir que las
variables (X − mX ) e (Y − my ) son ortogonales.
La relación anterior entre covarianza y correlación sale de

cXY = E{(X − mX )(Y − mY )} = E{XY − mX Y − Y mX + mX mY } (9)


= E{XY } − mX E{Y } − mY E{X} + mX mY = rXY − mX mY − (
m(Ym
((X +(
m(Xm
((Y

= rXY − mX mY

Relación de rXY y cXY con las variables aleatorias independientes:

Diremos que dos v.a. son independientes cuando P (X ∈ IX ∪ Y ∈ IY ) = P (X ∈ IX )P (Y ∈ IY ),


es decir, cuando la probabilidad de la unión es simplemente el producto de probabilidades. Esto
es equivalente a decir que fX,Y (X, Y ) = fX (X)fY (Y ). Cuando 2 v.a. son independientes, entonces
también son incorreladas, mientras que la afirmación en el otro sentido no es necesariamente cierta.
Es decir:

Independientes =⇒ Incorreladas, Independientes 6⇐= Incorreladas

Si son independientes, entonces


Z +∞ Z +∞ Z +∞
rXY = E{XY } = XY fX,Y (X, Y )dXdY = XfX dX Y fY dY = mX mY (10)
−∞ −∞ −∞

Caso particular de v.a.: la Gaussiana

Destacamos aquı́ la v.a. por su trascendencia en ingenierı́a y en telecomunicaciones en particular. Deci-


mos que X sigue una distribución Gaussiana de media mX i varianza σX 2 escribiendo X ∼ N (m , σ 2 )
X X
si su pdf es
(X−mX )2
1 −
2σ 2
fX (X) = √ e X (11)
2πσX
Como vemos en la figura siguiente, el 99,97 % de probabilidad se concentra en el intervalo [mX −
3σX , mX + 3σX ] dentro de RX .

4
fX (X)

X
mX 3σX

Propiedad de la Gaussiana: dos v.a. Gaussianas incorreladas son también independientes.

3. Procesos aleatorios
Definición: Definiremos un proceso estocástico o aleatorio como una extensión del concepto de v.a.
Recordemos que X(A) representaba una medida del suceso A una vez realizado un experimento da-
do. Ahora, en un proceso estocástico, un suceso resultado de realizar un experimento da lugar a una
función en lugar de un único número. Habitualmente, dicha función será temporal y por ese motivo
representaremos el proceso estocástico como X(A, t) o simplemente como X(t).

Ejemplo: Como ejemplo, consideremos el consumo eléctrico de una gran ciudad durante un dı́a entero
C(t). Está claro que tendrá un carácter aleatorio ya que es suma de pequeños consumos individuales
no controlados. Cada dı́a representa una realización del experimento y por lo tanto hay un nuevo
suceso a medir que, a su vez, es función del tiempo.

Podemos ver los procesos aleatorios (p.a.) de dos formas distintas (ver la figura siguiente):

1. A nivel temporal fijada una realización del experimento. Es la forma en que lo hemos definido,
es decir, una vez realizado el experimento se obtiene un suceso A = Ak y dicho suceso da lugar a
una forma temporal (que en general tendrá un carácter aleatorio). Escribiremos una realización
del proceso como X(Ak , t).

2. A nivel de realizaciones fijado un tiempo. Si fijamos t = tk , entonces el conjunto de valores


resultantes de cada realización del experimento es una v.a. que denominaremos X(A, tk ).

Nota: Si escribimos X(Ai , tk ) nos referimos a la medida de lo que ha sucedido en el i-ésimo experi-
mento para un tiempo t = tk y por lo tanto es un número simplemente.

La pregunta ahora es: ¿cómo caracterizar el proceso aleatorio para sacar de él la máxima información
posible y que luego nos sirva tanto para el análisis como para el diseño? Una posible solución serı́a
interpretar el p.a. de la segunda manera descrita (fijado el tiempo obtenemos una v.a.) y trabajar con
la pdf conjunta de todas las variables aleatorias resultantes. Esto resultarı́a sin duda muy complicado
especialmente cuando la variable t sea continua, ya que tendrı́amos una pdf de infinitas dimensiones.

5
X(A1 , t)

X(A2 , t)

X(A3 , t)

X(A, tk )

Por lo tanto nos vemos obligados a simplificar. Veremos en primer lugar los parámetros estadı́sticos
relacionados con procesos aleatorios, ya que éstos nos presentan distintos aspectos de interés de un
modo resumido.

3.1. Parámetros estadı́sticos de los procesos aleatorios


Son los mismos que hemos vistos para v.a. No obstante, es habitual en comunicaciones (como veremos
más adelante) considerar señales complejas ya que es una forma cómoda de representar dos señales
reales que se transmiten simultáneamente como sucede en muchos sistemas. Por este motivo, de ahora
en adelante consideraremos procesos complejos. Es la misma idea pero ahora un suceso da lugar a dos
funciones temporales en vez de sólo una, la real y la imaginaria.

Valor medio: mX (t) = E{X(t)}

En este caso obtenemos la media de la v.a. X(t). Es decir, para cada t tenemos una v.a. distinta y
sacamos su media. Como en el caso de una v.a., si pasamos X(t) a través de una función g obteniendo
R +∞
ası́ g(X(t)), entonces podremos calcular sum media como E{g(X(t))} = −∞ g(X(t))fX(t) dX(t).

Valor cuadrático medio: mX 2 (t) = E{X 2 (t)} (g(x) = x2 )

Autocorrelación: RX (t1 , t2 ) = E{X(t1 )X ∗ (t2 )}

En este caso medimos la correlación entre las v.a. X(t1 ) y X(t2 ), es decir, intuitivamente medimos el
parecido entre las v.a. X(t1 ) y X(t2 ) y lo llamamos autocorrelación porque ambas v.a. son parte de
un mismo proceso aleatorio. En el caso que t1 = t2 , entonces RX (t1 , t1 ) = E{|X(t1 )|2 }, es decir, la
definición de potencia media o esperada en t1 . Por lo tanto escribimos RX (t, t) = PX (t). Nótese que

6
estamos promediando el valor absoluto al cuadrado de la variable. Si X(t) fuera la tensión medida en
una resistencia de valor R = 1Ω, entonces |X(Ai , t = tk )|2 seria la potencia instantánea para el suceso
i-ésimo en el instante tk y el promediado de todos los sucesos en ese mismo tiempo (E{|X(A, tk )|2 })
seria la potencia media en ese instante. En comunicaciones referiremos siempre las potencias a una
R = 1Ω si no se nos dice lo contrario y usaremos el valor real únicamente cuando se quiera obtener la
verdadera potencia en W (es simplemente un factor de escalado).

Autocovarianza: CX (t1 , t2 ) = E{(X(t1 ) − mX (t1 ))(X(t2 ) − mx (t2 ))∗ } = RX (t1 , t2 ) − mX (t1 )m∗X (t2 )

Igual que en v.a., medimos el parecido de X(t1 ) y X(t2 ) quitando sus respectivas medias.

Independencia estadı́stica e incorrelación

Supongamos que tenemos dos procesos X(t) e Y (t). Consideramos las v.a. X(t1 ) e Y (t2 ) con pdf
conjunta fXY (X, Y ; t1 , t2 ). Igual que en 2 v.a. cualquiera, podremos calcular su correlación y su cova-
rianza. Los siguientes casos son de interés:

1. Procesos incorrelados: cuando su covarianza es 0 o bien, equivalentemente, su correlación es


producto de medias.

RXY (t1 , t2 ) = mX (t1 ) · m∗Y (t2 ), CXY (t1 , t2 ) = 0 ∀t1 , t2 (12)

2. Procesos independientes: cuando fXY (X, Y ; t1 , t2 ) = fX (t1 ) · fY (t2 ). Del mismo modo que en
v.a., independencia garantiza incorrelación pero incorrelación no garantiza independencia.

Con los parámetros estadı́sticos hemos conseguido simplificar el problema ya que compactamos
información. No obstante, si la media, autocorrelación, etc. van cambiando con el tiempo, seguimos
teniendo un problema ya que la cantidad de información a tener en cuenta es demasiado grande y no
está claro cómo obtenerla de antemano. Por suerte, muchos de lo procesos que usamos en comunica-
ciones no cambian (con el tiempo) algunos de los parámetros estadı́sticos presentados. Hablamos de
los procesos estacionarios, que vemos a continuación.

3.2. Procesos estacionarios


Como hemos dicho, consideraremos como estacionarios aquellos procesos que de alguna manera tienen
independencia con el tiempo. Ahora bien, bajo esta idea existen dos definiciones distintas de procesos
estacionarios: i) procesos estacionarios en sentido estricto y ii) procesos estacionarios en sentido amplio.

Procesos estacionarios en sentido estricto

Son los procesos que muestran una misma pdf para dos tiempos cualquiera, es decir, se cumple que
las v.a. X(t1 ) y X(t2 ) con pdf fX (X, t1 ) y fX (X, t2 ) respectivamente, cumplen:

fX (X, t1 ) = fX (X, t2 ) ∀t1 , t2 (13)

7
Procesos estacionarios en sentido amplio (WSS)

Son los procesos que muestran independencia temporal tanto en la media como en la autocorrelación
pero no necesariamente en la pdf, es decir, se requiere

mX (t) = mX (t1 ) = mX (t2 ) = mX (constante, independiente del tiempo) (14)

y además

RX (t1 , t2 ) = RX (t1 − t2 ) (depende únicamente de la diferencia de tiempos) (15)

Como depende únicamente de la diferencia de tiempos, es decir RX (t1 , t2 ) = RX (t1 + a, t2 + a),


entonces tiene sentido en este caso definir la autocorrelación como función de esa diferencia de tiempos
solamente. Para ello, consideremos t1 = t + τ y t2 = t (es decir, τ = t1 − t2 ). Entonces escribiremos la
autocorrelación como

RX (t1 , t2 ) = RX (t + τ, t) = RX (τ ) = E{X(t + τ )X ∗ (t)} (16)

Observaciones: en este caso hay algunas analogı́as con la autocorrelación de señales deterministas.

1. La potencia del proceso en el instante t es PX (t) = RX (t, t) = RX (0) y por lo tanto es constante
en el tiempo.
∗ (−τ ).
2. Se cumple RX (τ ) = RX

Por último, nótese que estacionario en sentido estricto implica estacionario en sentido amplio, lo que
al revés no es necesariamente cierto.

Ergodicidad

La ergodicidad nos da una visión práctica de los procesos aleatorios en sentido amplio. Cuando existe
ergodicidad, los promedios estadı́sticos se pueden sustituir por los promedios temporales en una reali-
zación obteniendo el mismo resultado. Se trata de un enfoque práctico, pues los promedios temporales
son más fáciles de llevar a cabo a la práctica. En general es difı́cil demostrar la ergodicidad de un proce-
so, pero cabe decir que la mayorı́a de las señales empleadas en comunicaciones cumplen esta condición.

Cálculo de los promedios temporales: (los más interesantes son los relacionados con la media y la
autocorrelación)
T /2
1
Z
< X(t) > = X(t) = lı́m X(t)dt (17)
T →∞ T −T /2
T /2
1
Z
< X(t + τ )X ∗ (t) > = X(t + τ )X ∗ (t) = lı́m X(t + τ )X ∗ (t)dt (18)
T →∞ T −T /2

Cuando un proceso sea ergódico, entonces se cumplirá: i) mX = X(t) y ii) RX (τ ) = X(t + τ )X ∗ (t).

8
3.3. Procesos cicloestacionarios
En este caso el proceso varı́a estadı́sticamente en el tiempo per existe una periodicidad en dicha va-
riación. En otras palabras, una vez caracterizado el proceso en un intervalo T0 , entonces es inmediato
caracterizarlo para todo t. Definiremos cicloestacionariedad en sentido estricto y en sentido amplio.

Cicloestacionariedad en sentido estricto

La función densidad de probabilidad fX (X, t) es distinta para cada t pero se repite periódicamente,
es decir
∃T0 ∈ R tq fX (X, t) = fX (X, t + nT0 ), ∀n ∈ Z (19)
Cicloestacionariedad en sentido amplio

En este caso lo que se repite periódicamente es la media y la correlación.

mX (t) = mX (t + nT0 ) ∀n ∈ Z
RX (t1 , t2 ) = RX (t1 + nT0 , t2 + nT0 ) ∀n ∈ Z

3.4. Ejemplos de procesos aleatorios


Ejemplo 1: X(t) = A cos (ω0 t + θ), con θ v.a. uniforme en el intervalo [−π, π]

1. Media:

1
Z
mX (t) = E{X(t)} = E{A cos (ω0 t + θ)} = A cos (ω0 t + θ) =0 (20)
−π 2π

2. Autocorrelación:

RX (t + τ, t) = E{X(t + τ )X ∗ (t)} = E{A2 cos (ω0 (t + τ ) + θ) cos (ω0 t + θ)} (21)


A 2 A 2 A 2
= E{cos (ω0 (2t + τ ) + 2θ)} + E{cos (ω0 (τ ))} = cos (ω0 (τ ))
2 2 2

Nota: como la media es constante y la autocorrelación sólo depende de τ , podemos afirmar que se
trata de un proceso estacionario en sentido amplio.

3. Potencia media:
A2
PX (t) = RX (0) = ∀t (22)
2

9
4. Ergodicidad: veamos si los promedios temporales coinciden con los estadı́sticos.
T /2
1
Z
X(t) = lı́m cos (ω0 t + θ)dt (23)
T →∞ T −T /2
1 sin (ω0 T /2 + θ) − sin (ω0 T /2 − θ)
= lı́m =0
T →∞ T ω0
1 T /2
Z

X(t + τ )X (t) = lı́m cos (ω0 (t + τ ) + θ) cos (ω0 t + θ)dt (24)
T →∞ T −T /2
(((
1 T /2 1 (((((((
Z
= lı́m ((cos ( (ω0 (2t + τ ) + 2θ)dt
T →∞ T (( 2
(((( −T /2
1 T /2 1 1 cos (ω0 τ ) 1
Z
+ lı́m cos (ω0 τ )dt = lı́m T = cos (ω0 τ )
T →∞ T −T /2 2 T →∞ T 2 2

Se trata, por lo tanto, de un proceso ergódico.

Ejemplo 2: X(t) = A(t) cos (ω0 t) con A(t) proceso WSS (media mA y autocorrelación RA (τ ))

1. Media:

mX (t) = E{X(t)} = E{A(t) cos (ω0 t)} = E{A(t)} cos (ω0 t) = mA cos (ω0 t) (25)

No es constante y por lo tanto no se trata de un proceso estacionario.

2. Autocorrelación:

RX (t + τ, t) = E{X(t + τ )X ∗ (t)} = E{A(t + τ ) cos (ω0 (t + τ ))A∗ (t) cos (ω0 t)} (26)

= E{A(t + τ )A (t)} cos (ω0 (t + τ )) cos (ω0 t)
1
= RA (τ ) [cos (2ω0 t + ω0 τ ) + cos (ω0 τ )]
2

3. Potencia media:
1
PX (t) = RX (t, 0) = RA (0) [cos (2ω0 t) + 1] (27)
2
En este caso la potencia media varı́a con el tiempo.

4. Cicloestacionariedad: Tanto la media como la autocorrelación son periódicas de periodo T0 = ω0
y por lo tanto X(t) es un proceso cicloestacionario en sentido amplio.

4. La autocorrelación
Veremos algunas propiedades de la autocorrelación y qué sucede cuando un proceso pasa a través de
un sistema LTI. Los resultados son los mismos que habı́amos obtenido para señales deterministas.

10
4.1. Propiedades de la autocorrelación de procesos estacionarios
Las propiedades de la autocorrelación de procesos estacionarios son las mismas que tenı́a la autoco-
rrelación de señales deterministas. Ası́ pues, tenemos

1. RX (0) = E{|X(t)|2 } = PX
∗ (−τ )
2. RX (τ ) = RX

3. RX (0) ≥ |RX (τ )|

4.2. Autocorrelación y sistemas LTI


Supongamos que tenemos un proceso estacionario X(t) a la entrada de un sistema LTI con respuesta
impulsional h(t) tal y como muestra la figura.

X(t) h(t) Y (t)

Entonces. al igual que sucedı́a para señales deterministas, la salida del sistema es otro proceso esta-
cionario Y (t) que cumple:

1. RY (τ ) = RX (τ ) ∗ h(τ ) ∗ h∗ (−τ ) = RX (τ ) ∗ Rh (τ )

2. RXY (τ ) = RX (τ ) ∗ h∗ (−τ )

3. RY X (τ ) = RX (τ ) ∗ h(τ )

Comprobemos la primera relación, que es la que más usaremos. A partir de la definición de autoco-
rrelación sabemos que
Ry (τ ) = E{y(t + τ )y ∗ (t)} (28)
Si ahora aplicamos la relación de sistema lineal, es decir, y(t) = x(t) ∗ h(t) = h(t) ∗ x(t), llegamos a

Ry (τ ) = E{[h(t + τ ) ∗ x(t + τ )][h(t) ∗ x(t)]∗ } (29)

A partir de ahora usaremos la definición de convolución para seguir desarrollando, con lo que podemos
escribir
Z +∞ Z +∞ ∗ 
Ry (τ ) = E h(λ)x(t + τ − λ)dλ h(µ)x(t + −µ)dµ (30)
−∞ −∞
Z +∞ Z +∞
= h(λ)h∗ (µ)E{x(t + τ − λ)x∗ (t − µ)}dλdµ
−∞ −∞
Z +∞ Z +∞
= h(λ)h∗ (µ)Rx (τ + µ − λ)dλdµ
−∞ −∞

donde vemos que nos aparece ya Rx (τ ). Ahora faltarı́a ver que esta expresión es justamente la convolu-
ción de Rx (τ ) con h(τ )∗h∗ (−τ ). De momento nos lo creemos y ya lo acabaremos de comprobar cuando
hablemos de la densidad espectral a la salida de sistemas LTI (desde el punto de vista frecuencial).

11
5. Densidad espectral en procesos aleatorios estacionarios
Los procesos aleatorios estacionarios son señales de potencia media finita (nótese que se trata de señales
de duración infinita en general). Calcular su densidad espectral nos es útil para ver cómo se distribuye
la potencia a lo largo del eje frecuencial. Si el proceso es estacionario, este cálculo está totalmente fun-
damentado puesto que la densidad espectral no varı́a en el tiempo. En un caso más general tendrı́amos
que calcular una densidad espectral variante en el tiempo, pero desde el punto de vista de diseño no es
tan interesante porque no permite asegurar que lo que funciona a t1 lo sigue haciendo más adelante.
Por suerte, la mayorı́a de señales que trataremos en comunicaciones serán o bien estacionarias o bien
cicloestacionarias (las trataremos a continuación).

Para calcular la densidad espectral de potencia SX (f ) de un proceso estacionario X(t), podemos


emplear directamente el teorema de Wiener-Khinchin, que nos dice

SX (f ) = F{RX (τ )}, RX (τ ) = F −1 {SX (f )} (31)

Recordemos que RX depende de la diferencia de tiempos τ pero no de t. Por lo tanto, para dos tiempos
distintos t1 y t2 se cumple RX (t1 + τ, t1 ) = RX (t2 + τ, t2 ).

Deducción del teorema de Wiener-Khinchin

Consideremos el proceso aleatorio truncado XT (t) que definiremos según


(
X(t) |t| < T /2
XT (t) = (32)
0 |t| > T /2

La potencia media de este proceso será el promedio de la potencia asociada a cada una de las v.a. que
lo componen, es decir
1 T /2 
Z
E |X(t)|2 dt

P = lı́m (33)
t→∞ T −T /2

Démonos que cuenta que si RX (0) = E |X(t)|2 no depende de t, entonces esto es directamente


la potencia media, como ya habı́amos dicho anteriormente. No obstante, prosigamos con nuestro
desarrollo. Fijémonos que XT (t) es una señal finita y que por lo tanto |XT (A, f )|2 seria su densidad
espectral de energı́a (ahora la transformada de Fourier F{XT (A, t)} = XT (A, f ) existe). Según el
teorema de Parseval, podemos afirmar que
Z +T /2 Z +∞ Z +∞
2 2
|X(t)| dt = |XT (t)| dt = |XT (f )|2 df (34)
−T /2 −∞ −∞

De aquı́ deducimos que la potencia media de (33) vale (intercambiando esperanza con integral y
viceversa)  Z +∞  Z +∞
1 2 1
P = lı́m E |XT (f )| df = lı́m E{|XT (f )|2 }df (35)
T →∞ T −∞ −∞ T →∞ T
Finalmente, ya que la integral de la densidad espectral de potencia es la potencia, de (35) deducimos
que
1
SX (f ) = lı́m E{|XT (f )|2 } (36)
T →∞ T

12
Nota: la esperanza es necesaria para hacer la media entre sucesos, es decir, XT (f ) contiene una v.a.
para cada valor de f .

Una vez encontrada una expresión para SX (f ) falta ver que se corresponde con F{RX (τ )} tal y
como anuncia el teorema de Wiener-Khinchin. Para ello escribimos E{|X (f )T |2 } = E{XT (f )XT (f )∗ }
y pasamos de nuevo al dominio temporal usando la relación de Fourier, verificando ası́ que
(Z )
T /2
Z T /2
E{|XT (f )|2 } = E{XT (f )XT (f )∗ } = E X(t)e−j2πf t dt X ∗ (λ)e+j2πf λ dλ (37)
−T /2 −T /2

Ahora juntamos ambas integrales y las intercambiamos con el operador esperanza con el fin de conse-
guir la autocorrelación de X(t), es decir
Z T /2 Z T /2
E{|XT (f )|2 } = E{X(t)X ∗ (λ)}e−j2πf (t−λ) dtdλ (38)
−T /2 −T /2

Vemos que para conseguir RX (τ ) es necesario fijar la diferencia de tiempos entre t y λ. Por este motivo
hacemos un cambio de variables: definimos dos nuevas variables τ y µ que son función de t y λ. En
particular, τ = t − λ y µ = t. Para poder resolver la integral en las nuevas variables necesitamos dos
cosas: i) ver en qué región debemos integrar y ii) ver qué vale ahora dtdλ.

Veamos primero cómo se transforma la región (t, λ) ∈ [−T /2, T /2] × [−T /2, T /2] en términos de (τ, µ).
Está claro que µ se mueve en el intervalo [−T /2, T /2] al igual que lo hacı́a t. En cuanto a τ , ésta toma
el valor τ = t − λ. Es decir, fijado un valor de t = µ y considerando que λ ∈ [−T /2, T /2], vemos
que τ debe ir entre µ + T /2 y µ − T /2. Por lo tanto, la región en (τ, µ) queda limitada por las rectas
µ = τ + T /2 y µ = τ − T /2. En resumen, debemos integrar sobre la región de la figura siguiente, donde
apreciamos claramente dos regiones a integrar, correspondientes a τ < 0 y τ > 0.

µ
µ = τ − T /2

T /2

−T
T τ
−T /2

µ = τ + T /2

En segundo lugar, la transformación de dtdλ viene determinada por el jacobiano del cambio de varia-
bles. Recordemos que en nuestro caso aplicamos una transformación T (t, λ) = (τ (t, λ), µ(t, λ)) y que
por lo tanto su jacobiano vale

∂(τ, µ) ∂τ∂t
∂τ 1 −1
∂λ =
= ∂µ =1 (39)

∂(t, λ) ∂t ∂µ 1 0

∂λ

13
con lo que nos queda dtdλ = dτ dµ.

Ahora ya disponemos de todo lo necesario. La integral en (38) se puede calcular como


Z T /2 Z T
2
E{|XT (f )| } = E{X(µ)X ∗ (µ − τ )}e−j2πf τ dτ dµ (40)
τ −T /2 0
Z τ +T /2 Z 0
+ E{X(µ)X ∗ (µ − τ )}e−j2πf τ dτ dµ
−T /2 −T
Z T /2 Z T Z τ +T /2 Z 0
−j2πf τ
= RX (τ )e dτ dµ + RX (τ )e−j2πf τ dτ dµ
τ −T /2 0 −T /2 −T

Cambiamos el orden de integración e integramos primero en µ (puesto que la función no depende de


µ). Ası́ obtenemos
Z T Z 0
E{|XT (f )|2 } = RX (τ )e−j2πf τ (T − τ )dτ + RX (τ )e−j2πf τ (T + τ )dτ (41)
0 −T

Por último juntamos ambas integrales aprovechando el hecho de que |τ | = −τ si τ < 0 y nos queda
T
|τ |
Z
E{|XT (f )| } = T 2
RX (τ )e−j2πf τ (1 − )dτ (42)
−T T

Por lo tanto,

1
Z
lı́m E{|XT (f )|2 } = RX (τ )e−j2πf τ dτ (43)
T →∞ T −∞

y verificamos que SX (f ) = F{RX (τ )}.

5.1. Procesos cicloestacionarios


Como ya hemos visto anteriormente, los procesos cicloestacionarios se caracterizan por tener una
media y una autocorrelación que varı́an en función del tiempo. No obstante, dicha variación no es
cualquiera ya que ambas medidas se repiten periódicamente en el tiempo, lo que hace de los procesos
cicloestacionarios un caso muy especial. En comunicaciones los procesos cicloestacionarios juegan un
papel muy importante ya que, como veremos más adelante, la mayorı́a de las señales empleadas en
comunicaciones tanto analógicas como digitales poseen esta caracterı́stica.

En relación con la densidad espectral de potencia, debemos fijarnos en la función de autocorre-


lación del proceso RX (t, τ ), que aunque depende del tiempo además de τ , sabemos que verifica
RX (t + τ + kT0 , t + kT0 ) = RX (t + τ, t). Dicho de otra forma, si conocemos cuánto vale la función
de autocorrelación durante un periodo entero T0 para cualquier retardo τ , entonces somos capaces de
obtener RX (t, τ ) entera.

Como nos interesa caracterizar las señales por su densidad espectral de potencia (independiente del
tiempo) pero esto sólo tiene sentido si el proceso es estacionario, una alternativa que parece razonable

14
en los procesos cicloestacionarios es tomar una media de la autocorrelación para quitar la dependencia
en t haciendo Z T /2
1
RX (τ ) = RX (t + τ, t)dt (44)
T0 −T /2
Cabe remarcar que en este caso dicha media cobra sentido porque caracteriza más o menos al proceso
en cualquier instante en el sentido que el valor instantáneo no puede ser radicalmente opuesto al valor
medio dada la periodicidad. En un caso más genérico podrı́a ser que no tuvieran nada que ver, con
lo que quizá tendrı́a más sentido trabajar con una densidad espectral variante en el tiempo que serı́a
la transformada de la autocorrelación en ese instante o del promedio de la autocorrelación en una
pequeña ventana alrededor del instante de interés.

En el caso que nos ocupa y empleando RX (τ ) podemos aplicar directamente el teorema de Wiener-
Khinchin obteniendo
SX (f ) = F{RX (τ )} (45)
y diremos que SX (f ) es la densidad espectral de potencia media.

Ejemplos

Recuperamos los dos ejemplos anteriores:

1. X(t) = A cos ω0 t + θ con θ v.a. uniforme en [−π, π]. Vimos que se trataba de un proceso esta-
cionario, por lo tanto su densidad espectral de potencia viene dada por
A2 h ω0 ω0 i
SX (f ) = F{RX (τ )} = δ(f + ) + δ(f − ) (46)
4 2π 2π

2. X(t) = A(t) cos (ω0 t) En este caso el proceso era cicloestacionario con
RA (τ )
RX (t, τ ) = [cos (2ω0 t + ω0 τ ) + cos (ω0 τ )] (47)
2
y periodo T= ω2π0 . Por lo tanto calcularemos primero la autocorrelación media, que vale
T0 /2
1 RA (τ ) RA (τ )
Z
RX (τ ) = [cos (2ω0 t + ω0 τ ) + cos (ω0 τ )] dt = cos (ω0 τ ) (48)
T0 −T0 /2 2 2

Ahora calculamos la densidad espectral de potencia media como


1h ω0 ω0 i
SX (f ) = F{RX (τ )} = SA (f − ) + SA (f + ) (49)
4 2π 2π

5.2. Densidad espectral de potencia de procesos estocásticos a través de sistemas


LTI
Supongamos que tenemos un proceso estacionario X(t) a la entrada de un sistema LTI con respuesta
impulsional h(t) tal y como muestra la figura.
La densidad espectral a la salida vale

SY (f ) = F{RY (τ )} = F{RX (τ ) ∗ h(τ ) ∗ h∗ (−τ )} = SX (f )H(f )H ∗ (f ) = SX (f )|H(f )|2 (50)

15
X(t) h(t) Y (t)

Comprobémoslo siguiendo el análisis iniciado en (30), donde tenı́amos una expresión de Ry (τ ). Ahora
transformamos para encontrar la densidad espectral de potencia a la salida del sistema, esto es
Z +∞ Z +∞ Z +∞ 
Sy (f ) = F{Ry (τ )} = h(λ)h (µ)Rx (τ + µ − λ)dλdµ e−j2πf τ dτ

(51)
−∞ −∞ −∞
Ahora haremos el cambio de variable τ = υ − µ + λ. Para hacerlo bien deberı́amos seguir el ejemplo
que tenemos en la deducción del teorema de Wiener-Khinchin. No obstante, en este caso no cambia
ni el diferencial ni la región de integración (infinita en el espacio), ası́ que escribiremos directamente
Z +∞ Z +∞ Z +∞
Sy (f ) = F{Ry (τ )} = h(λ)h∗ (µ)Rx (τ + µ − λ)dλdµe−j2πf (υ−µ+λ) dυ (52)
−∞ −∞ −∞
Z +∞ Z +∞ Z +∞
−j2πf λ ∗
= h(λ)e dλ h (µ)e +j2πf µ
dµ Rx (υ)e−j2πf υ dυ
−∞ −∞ −∞
Z +∞ ∗
−j2πf µ
= H(f ) h(µ)e dµ Sx (f ) = H(f )H ∗ (f )Sx (f ) (53)
−∞

Con esto comprobamos el resultado de (50) pero también, aplicando la anti-transformada de Fourier,
la relación Ry (τ ) = Rx (τ ) ∗ h(τ ) ∗ h∗ (−τ ) que habı́amos visto con anterioridad.

6. Ruido
La última sección de este tema la dedicaremos a hablar del ruido, algo que nos aparece en cualquier
sistema de comunicación y que modelamos como proceso estocástico. Cuando hablamos de ruido nos
referimos en general a cualquier señal no deseada que aparece en un proceso de comunicación. Las
fuentes de ruido son muy diversas, algunas creadas por el hombre y otras fruto de procesos naturales.
Algunas de las señales de ruido creadas por el hombre se deben a
Conexión de aparatos

Motores

Interferencias de otros sistemas


y generalmente son evitables o al menos muy mitigables con un diseño adecuado (uso de apantalla-
mientos, filtros, ubicación adecuada, ...). Entre las señales de ruido de origen natural podemos citar,
entre otras
Perturbaciones atmosféricas.

Fuentes galácticas como el sol, que produce radiación.

Ruido térmico en los circuitos de los sistemas de telecomunicación


Las dos primeras son mitigables en parte mientras que la última es inevitable a no ser que pongamos
los circuitos a temperaturas próximas al zero absoluto. A continuación nos centramos en el modelado
de esta última fuente de ruido, muy importante en cualquier sistema.

16
Ruido Blanco

El ruido térmico, al que a veces nos referimos como ruido blanco o ruido blanco gaussiano, se de-
be al movimiento aleatorio de los electrones en componentes disipativos. Dicho movimiento, que es
más acusado como mayor es la temperatura fı́sica (más energı́a), provoca pequeñas variaciones de
tensión/corriente. Esta tensión que evoluciona con el tiempo es lo que llamamos ruido térmico y se
modela como un proceso estacionario. Un ejemplo de ello se puede ver en la segunda Figura 1 (derecha).

El modelado del ruido térmico pasa por entender dicho proceso como el efecto combinado de infini-
dad de electrones, cada uno con un movimiento aleatorio distinto. Por el teorema central del lı́mite
sabemos que la suma de muchas v.a. independientes da lugar a una variable con función de distribu-
ción gaussiana. Asi pues, el proceso de ruido térmico n(t) es estacionario al caracterizse por una fdp
gaussiana de media 0 y varianza σn2 , es decir,
2
1 − n
n(t) ∼ N (0, σn2 ), fn (n, t) = √ e 2σn2 (54)
2πσn
Caracterı́sticas del ruido térmico

Estacionario.

Ergódico.

Media nula.
N0
Densidad espectral de potencia plana Sn (f ) = 2 ∀f . Cuando decimos ruido blanco hacemos
referencia a esta caracterı́stica.

Función densidad de probabilidad gaussiana.

Empleando el teorema de Wiener-Khinchin vemos que


N0
Rn (τ ) = F −1 {Sn (f )} = δ(τ ) (55)
2
y por lo tanto el ruido blanco gaussiano es incorrelado (la covarianza, que es igual a la correlación al
presentar media nula, es 0 excepto para τ = 0). Como tiene además distribución gaussiana, podemos
afirmar también que n(t1 ) y n(t2 ) son v.a. independientes para t1 6= t2 .

Valor de N0

Viene determinado por N0 = kTe , donde k = 1, 37 · 10−23 J/K es la constante de Boltzman y Te


es la temperatura en grados Kelvin. En componentes disipativos (cables o resistencias) corresponde
a la temperatura fı́sica a la que estos se encuentran. En otros dispositivos hay que considerar otra
temperatura (lo veréis en otra asignatura).

17
Ruido blanco filtrado

En muchas ocasiones nos encontraremos con un proceso de ruido blanco gaussiano n(t) que pasa a
través de un sistema LTI con respuesta impulsional h(t) y respuesta frecuencial H(f ) como muestra
la figura.

H(f )

n(t) h(t) y(t)

−B B f

En este caso, la densidad espectral de potencia del ruido a la salida del sistema se calcula como
N0
Sy (f ) = Sn (f )|H(f )|2 = |H(f )|2 (56)
2
y la potencia de ruido a la salida es

N0
Z
Py = |H(f )|2 df (57)
−∞ 2
RB N0
Por ejemplo, si tomamos la H(f ) de la figura, Py = −B 2 df = N0 B [W].

En general, cuando filtramos el ruido, éste pierde su caracterı́stica de “blanco” ya que se potencia más
unas frecuencias que otras. En este caso decimos que se trata de ruido “coloreado” en contraposición
al “blanco”.

18
Tema 2: Transmisión Analógica en Banda Base
Antoni Morell y José López Vicario

7 de mayo de 2013

1. Elementos de un sistema de comunicaciones en banda base


Un sistema de comunicaciones (ver la siguiente figura) en general se compone de los siguientes
elementos básicos:

Fuente: quien genera el mensaje x(t) a transmitir. Lo modelaremos como un proceso estacionario
con potencia Px = E{|x(t)|2 } = Rx (0) cuya densidad espectral de potencia toma valores en el
rango [−Bx , Bx ]. Diremos que Bx es el ancho de banda 1 de la señal a transmitir.

Transmisor: adapta el mensaje x(t) para que se pueda transmitir por el canal de comunicaciones.
La señal resultante de este proceso es xT (t) y tiene potencia ST .

Canal: el medio por donde se transmite la información. En el caso de comunicaciones puede ser
un medio de transmisión guiada (par de cobre, fibra óptica, guı́a de transmisión,...) o el aire en
el caso de tener comunicaciones inalámbricas.

Receptor: se encarga de recoger la señal xR (t) (potencia SR ) del canal y transformarla en una
señal interpretable para quien recibe la información xD (t). La señal recibida estará siempre
contaminada por un proceso de ruido n(t), que se manifestará también a la salida. Por lo tanto,
a la salida del receptor tendremos yD (t) = xD (t) + nD (t) con SD y ND las potencias de señal y
ruido, respectivamente.

x(t) xT (t) xR (t) yD (t) = xD (t) + nD (t)


FUENTE TRANSMISOR CANAL RECEPTOR
PX ST SR SD , ND

n(t)

En este tema nos centraremos en las transmisiones en banda base, esto es, aquellas en las que la
transmisión mantiene las frecuencias originales de la señal de fuente. Por contra, en los siguientes
temas hablaremos de transmisiones paso banda y aquı́ siempre existe un desplazamiento frecuencial
1
Definiremos el ancho de banda de una señal en general como la diferencia entre su frecuencia máxima i mı́nima
(ambas siempre positivas).

19
de la señal (modulación) antes de someterla al canal. En el caso de las comunicaciones inalámbricas,
esto es casi siempre un requisito, pues la transmisión sin desplazamiento requerirı́a la transmisión a
frecuencias muy bajas, cosa que sólo se conseguirı́a con antenas muy muy grandes (no es factible).

2. Distorsión lineal
A su paso por el canal, la señal xT (t) puede sufrir alteraciones de ı́ndole diversa y diremos entonces
que xR (t) es una versión distorsionada de xT (t). Clasificaremos la distorsión en dos tipos básicos: i)
distorsión lineal y ii) distorsión no lineal. En esta sección nos centraremos en el primer tipo y más
tarde hablaremos del segundo.

No obstante, veamos primero qué entendemos por una transmisión sin distorsión. La lógica nos dice
que deberı́a ser una transmisión en la que la señal xR (t) no es alterada, pero esto es imposible ya que
siempre tendremos como mı́nimo algo de retardo y algo de atenuación. Sin embargo, ni retardo ni
atenuación afectan a la “calidad” de la señal, ası́ que en una transmisión sin distorsión permitiremos
ambas. En otras palabras, el canal no introduce distorsión si se cumple

xR (t) = αxT (t − td ) = xT (t) ∗ αδ(t − td ) (1)

o lo que es lo mismo, si la respuesta impulsional del canal es hC (t) = αδ(t − td ), lo que en el dominio
transformado significa HC (f ) = αe−j2πf td , es decir, el canal tiene módulo constante y fase lineal. Este
tipo de canal es lo que conocemos por canal ideal.

Cuando el canal es no ideal pero sı́ lineal (lo modelamos como sistema LTI), entonces tenemos distorsión
lineal. Podemos experimentar:
1. Distrosión de amplitud: cuando |HC (f )| no es constante en la zona frecuencial que ocupa xT (t).

2. Distorsión de fase: cuando ∠(HC (f )) 6= −2πf td ± 2kπ


Por supuesto, podemos experimentar ambas simultáneamente.

Ejemplo: consideremos el canal de comunicaciones dado por HC (f ) = α(1 + β cos (2πf t0 ))e−j2πf td .

Vemos que se trata de un caso de distorsión de amplitud ya que el módulo no es constante pero la
fase sı́ es lineal. Si escribimos HC (f ) como
 
β j2πf t0 −j2πf t0 αβ −j2πf (td −t0 ) αβ −j2πf (td +t0 )
HC (f ) = α 1 + (e +e ) e−j2πf td = αe−j2πf td + e + e (2)
2 2 2
entonces la respuesta temporal del canal es
αβ αβ
hC (t) = αδ(t − td ) + δ(t − td + t0 ) + δ(t − td − t0 ) (3)
2 2
y por lo tanto la señal recibida será
αβ αβ
xR (t) = αxT (t − td ) +xT (t − td + t0 ) + xT (t − td − t0 ) (4)
2 2
donde vemos claramente que se distorsiona la señal transmitida añadiendo un par de ecos no deseados.

20
3. Ecualización
La ecualización tiene como objetivo combatir la distorsión lineal introducida por el canal de comuni-
caciones. La manera de hacerlo es añadiendo un sistema LTI después del canal tal que la respuesta
conjunta de ambos sea lo más próxima posible al canal ideal como muestra la figura siguiente.

xR (t)
xT (t) HC (f ) HEQ (f ) xEQ (t)

Hideal (f )

Desde el punto de vista frecuencial imponemos


αe−j2πf td
Hideal (f ) = αe−j2πf td = HC (f )HEQ (f ) −→ HEQ (f ) = (5)
HC (f )
Una posible implementación del ecualizador es a través de lo que conocemos como filtro transversal
(Tapped-Delay) y que responde al siguiente esquema

H̃EQ (f )
xR (t) T T

h0 h1 h2 h2N

xEQ (t)

En este caso, xEQ (t) vale


xEQ (t) = h0 xR (t) + h1 xR (t − T ) + h2 xR (t − 2T ) + . . . + h2N xR (t − 2N T ) (6)
y por lo tanto la respuesta impulsional del ecualizador es
h̃EQ (t) = h0 δ(t) + h1 δ(t − T ) + h2 δ(t − 2T ) + . . . + h2N δ(t − 2N T ) (7)
que en el dominio frecuencial se corresponde a
2N
X
H̃EQ (f ) = h0 + h1 e−j2πf T + . . . + h2N e−j4N πf T = hn e−j2πf nT (8)
n=0

Si sacamos factor común de e−j2πf N T obtenemos


H̃EQ (f ) = e−j2πf N T [h0 ej2πf N T + h1 ej2πf (N −1)T + . . . + h2N e−j2πf N T ] (9)
N
X
= e−j2πf N T hN −n ej2πf nT
n=−N

21
Mirando la última expresión vemos que se parece mucho a una serie de Fourier (simplemente la varia-
ble ahora es f ). Las únicas diferencias son que hay un retardo adicional dado por el término común
e−j2πf N T (que es mayor cuanto mayor sea el tamaño del filtro) y que la serie está truncada a un total
de 2N + 1 coeficientes. Identificando términos entre (5) y (9) nos damos cuenta que lo más fácil es
aprovechar la serie para obtener α/HC (f ), con lo cual el retardo de diseño td queda forzado a N T .
Ahora nos preguntamos: ¿cómo se interpreta este resultado? y más importante aún, ¿sirve de algo
para el diseño de los coeficientes? Fijémonos que HEQ (f ) es conocida y viene dada por (5). Ahora tra-
tamos de aproximar dicha respuesta con H̃EQ (f ), pero la serie de Fourier sólo nos sirve para expresar
una señal periódica en suma de exponenciales complejas con unos coeficientes determinados y además
podemos necesitar infinitos.

El último ingrediente que nos falta es darnos cuenta de que no es necesario reproducir toda HEQ (f )
de la forma más exacta posible. Con la parte correspondiente a la zona frecuencial o ancho de banda
de la señal xT (t) es suficiente, por lo que fuera de este rango podemos tener lo que mejor nos convenga
y en particular, de cara a la serie de Fourier, es muy interesante hacer una extensión periódica de
HEQ (f ) en |f | < Bx (ver la figura).

|HEQ (f )|

|Hideal (f )|

|H̃EQ (f )|
|HC (f )|
−BX BX f

Ahora que ya tenemos una señal periódica (en f pero esto es irrelevante de cara a la transformación) la
expresamos como serie de Fourier, encontrando ası́ los coeficientes hi . Haciendo la analogı́a en tiempo,
ahora el periodo de la señal HEQ (f ) (interpretada como función que depende de f ) es 2BX y por lo
tanto la frecuencia fundamental T de la serie es T = 1/2BX . Por último, como no vamos a poder
poner infinitos retardos, no vemos obligados a truncar la serie de Fourier.

Algunas observaciones:

Cuanto más coeficientes tenga mejor será la ecualización (la serie aproximará mejor a la función
periódica) pero también mayor será el retardo introducido por el filtro transversal, ya que el
retardo total será N T .

Como más estrecho sea el ancho de banda a ecualizar, mayor retardo T hay que poner ya que
T = 1/2BX .

22
4. Distorsión no lineal
Hasta ahora hemos visto la distorsión lineal, en la que la señal pasaba a través de un sistema lineal
(el canal de comunicaciones) donde sufrı́a variaciones de módulo y fase. Ahora nos centramos en lo
que sucede cuando la señal pasa través de un sistema no lineal como podrı́a ser un amplificador de
alta potencia. Es muy importante tener claro que la respuesta impulsional sólo permite caracterizar
sistemas LTI y por tanto lineales. Para modelar sistemas no lineales (NL) tendremos que recurrir
directamente a la relación entrada-salida. Cojamos el ejemplo del amplificador de alta potencia de la
figura siguiente.

x(t) SNL y(t)


x

Vemos claramente que la respuesta es no-lineal y que llega un momento en que el amplificador se
satura. Intentaremos siempre trabajar en la zona lineal próxima al origen para evitar los problemas que
expondremos a continuación. En ese caso, queda justificado trabajar con una aproximación polinómica
de la respuesta del amplificador en esa zona. Consideremos pues el siguiente modelo entrada-salida,
N
X
y(t) = an xn (t) = a1 x(t) + a2 x2 (t) + . . . + aN xN (t) (10)
n=1

En el dominio frecuencial, esto se traduce en

Y (f ) = a1 X(f ) + a2 X(f ) ∗ X(f ) + . . . + aN X(f )∗ .N. ). ∗X(f ) (11)

Fijémonos en el segundo término y analicémoslo a través de un caso sencillo. Si X(f ) fuera una señal
rectangular de ancho total 2BX , entonces X(f ) ∗ X(f ) seria una señal triangular de ancho total 4BX .
Ya intuimos en este simple ejemplo que la distorsión inducida por estos términos es grande, pues no
sólo cambia la forma de la señal en el dominio transformado sino que además aumenta su ancho de
banda. De la misma manera, el último término darı́a lugar a una señal con ancho de banda N veces
superior a la original.

Para profundizar algo más en la distorsión no-lineal consideremos un caso especial pero muy interesante
como es x(t) = A1 cos (2πf1 t)+A2 cos (2πf2 t). Se trata de un caso interesante porque si sabemos qué les
sucede a una combinación de dos tonos puros podremos deducir qué le sucede a una señal genérica
que sea suma de muchas cosenoides. Para simplificar un poco sin perder generalidad supongamos que

23
el sistema NL se caracteriza por y(t) = a1 x(t) + a2 x2 (t). En ese caso, la salida del sistema serı́a

y(t) = a1 (A1 cos (2πf1 t) + A2 cos (2πf2 t)) + a2 (A1 cos (2πf1 t) + A2 cos (2πf2 t))2 (12)
= a1 A1 cos (2πf1 t) + a1 A2 cos (2πf2 t)
+ a2 A21 cos2 (2πf1 t) + A22 cos2 (2πf2 t) + 2A1 A2 cos (2πf1 t) cos (2πf2 t)


Si desarrollamos un poco más los productos de cosenos, llegamos a

y(t) = {a1 A1 cos (2πf1 t) + a1 A2 cos (2πf2 t)} (13)


A2 A2 A2 A2
 
+ a2 1 + a2 2 + a2 1 cos (2π2f1 t) + a2 2 cos (2π2f2 t)
2 2 2 2
+ {a2 A1 A2 cos (2π(f1 − f2 )t) + a2 A1 A2 cos (2π(f1 + f2 )t)}

En esta expresión vemos que obtenemos en primer lugar la señal original con cierto escalado, luego
aparecen unos términos a frecuencias múltiples de f1 y f2 , respectivamente (podemos incluir también
las componentes de continua 0f1 y 0f2 ) y por último unos términos cuya frecuencia es combinación
lineal de las frecuencias originales.

En general, sea cual sea el orden del polinomio que describe el sistema, podemos clasificar los términos
no deseados en

Componentes armónicos: los que tienen frecuencias múltiples de las frecuencias originales.

Productos de intermodulación: los que tienen frecuencias que son combinación lineal de las
frecuencias originales.

Cabe destacar que las nuevas frecuencias no deseadas pueden jugar un papel importante si, además de
distorsionar nuestra propia señal, ejercen interferencia sobre sistemas adyacentes en frecuencia, lo que
llamamos “crosstalk”. En general, los productos de intermodulación son más difı́ciles de controlar que
los armónicos. Por ejemplo, es relativamente fácil que el producto de intermodulación de dos tonos
que forman parte de una misma señal caiga justo encima de la señal deseada mientras que esto se
da más raramente en los armónicos, que normalmente caerán fuera de la banda deseada y serán más
fáciles de eliminar.

Por lo general, la distorsión no lineal se debe a los componentes del sistema (por ejemplo cuando hay
saturación) mientras que la distorsión introducida por el canal de comunicaciones la consideraremos
normalmente lineal.

5. Pérdidas de transmisión
Hemos comentado que el canal de comunicaciones introducirá distorsión a la señal (normalmente
lineal). No obstante, hay dos condiciones más que hay que tener siempre en cuenta para garantizar
una buena comunicación, incluso cuando el canal es ideal o podemos ecualizarlo perfectamente. Estas
dos condiciones son:

24
1. Que la señal deseada llegue con la amplitud suficiente, que mediremos con la potencia recibida.
Haciendo el sı́mil con una conversación normal entre dos personas en un sitio silencioso, serı́a
que estén suficientemente cerca como para que se escuchen entre sı́ de forma nı́tida.

2. Que la relación entre la potencia de la señal deseada y la potencia del ruido, lo que llamamos
relación señal a ruido o SNR, sea lo suficientemente grande. Volviendo al sı́mil anterior, si ahora
las dos personas pasan del sitio silencioso en el que se encontraban al medio de un concierto,
lo más probable es que manteniendo la misma distancia y gritando lo mismo no se escuchen.
Esto es debido a que la relación entre la potencia deseada (su voz) y la potencia de ruido (el
concierto) no llega a un valor mı́nimo necesario.

En este apartado trabajaremos sobre la primera condición.

5.1. Ganancia de potencia


Definiremos ganancia como la relación de potencias entre la señal de salida Pout y la de entrada Pin
de un sistema LTI, de forma que
Pout
Pout = GPin −→ G= (14)
Pin
y se trata de una cantidad adimensional. Dado que a la práctica nos encontramos valores de ganancia
que van desde muy pequeños a muy grandes, por comodidad solemos expresar dicha cantidad en escala
logarı́tmica (que se indica con dB) en vez de hacerlo en escala lineal. Es muy importante recordar que
el dB no es ninguna unidad y que simplemente nos indica que la cantidad que le precede está en escala
logarı́tmica. La transformación entre ambas escalas se hace según

GdB = 10 log10 G G = 10GdB /10 (15)

donde GdB corresponde al valor de la ganancia en escala logarı́tmica y G al mismo valor pero en
escala lineal. Por ejemplo, podemos decir que la ganancia es de 1000 o, equivalentemente, de 30dB. Si
aplicamos (15) a (14) vemos que
 
Pout
GdB = 10 log10 G = 10 log10 = 10 log10 Pout − 10 log10 Pin (16)
Pin
A diferencia de G, la potencia sı́ que tiene unidades (usamos casi siempre W o mW) y al pasarlo a
escala logarı́tmica hablamos de dBW o dBm, respectivamente. Para obtener dBW, debemos pasar a
dB’s una magnitud de potencia expresada en W. De la misma manera, para obtener dBm, debemos
pasar a dB’s una magnitud de potencia expresada en mW. En otras palabras,

PdBW = 10 log10 P (W) (17)


PdBm = 10 log10 P (mW) (18)

Es de vital importancia dividir magnitudes en las mismas unidades de potencia (normalmente W o


mW) cuando calculamos una ganancia o bien, trabajando en dB, que restemos magnitudes con las
mismas unidades (normalmente dBW o dBm):
dBW dBW dBm dBm
GdB = Pout − Pin = Pout − Pin (19)

25
Finalmente, para pasar de dBW a dBm debemos considerar

P (mW) = P (W) · 1000 (20)


PdBm = 10 log10 (P (W) · 1000) = 10 log10 P (W) + 10 log10 1000 = PdBW + 30 (21)

Nota: Recordad esta diferencia de 30dB entre dBm y dBW es algo que usaréis a lo largo de toda la
carrera para pasar de una unidad a otra y viceversa.

5.2. Pérdidas de transmisión


Cuando el sistema LTI del apartado anterior es el medio de transmisión, entonces lo habitual es que
Pout < Pin como parece lógico. En ese caso podemos hablar de ganancia inferior a 1 (lineal) o por
debajo de los 0dB (logarı́tmico), pero es más común hablar de las pérdidas de transmisión del medio
L o LdB , que calculamos como
Pin 1
L = = (22)
Pout G
 
1 dBm,dBW dBm,dBW
LdB = 10 log10 = −GdB = Pin − Pout (23)
G
Por lo tanto ahora
Pin
Pout = (24)
L
dBm,dBW dBm,dBW
Pout = Pin − LdB (25)

En comunicaciones tenemos básicamente dos tipos de transmisión, que son:

Transmisión guiada

Transmisión radio

En el primer caso, como su nombre indica, fijamos el camino por donde viaja la señal, mientras que
en el segundo la señal se propaga por todo el espacio alrededor del transmisor. Dado que son dos tipos
de propagación muy distintos, las pérdidas de transmisión se comportan de manera distinta.

Transmisión guiada

En el caso de transmisión guiada, las pérdidas expresadas en dB acostumbran a ser proporcionales a


la distancia, es decir
LdB = α · l (26)
donde α es el coeficiente de atenuación expresado en dB/m o bien dB/km y l es la longitud entre
transmisor y receptor. En el Cuadro 1 se pueden ver los coeficientes de atenuación para distintos
medios de transmisión y frecuencias.
En estos casos, tenemos
dBm,dBW dBm,dBW
Pout = Pin −α·l (27)
Pout = Pin 10−αl/10 (28)

26
Medio de transmisión Frecuencia Coeficiente de atenuación
Par trenzado 1kHz 1dB/km
Cable coaxial 100kHz 1dB/km
3MHz 4dB/km
Guı́a de onda 10GHz 5dB/km
Fibra óptica λ = 1.5 µm 0,2dB/km

Cuadro 1: Coeficiente de atenuación para distintos medios de transmisión guiados.

Ejemplo: unir dos puntos situados a 30km con un medio de transmisión guiado de α = 3 dB/km.
En este caso, la atenuación serı́a LdB = α · l = 3dB/km · 30km = 90dB. Esto quiere decir que, fijada
la potencia de recepción, la potencia de transmisión debe ser 90 dB superior. Esto es mucho (109 en
lineal), quizá demasiado. La solución es poner repetidores para ir manteniendo el nivel de potencia
deseado a lo largo del camino según muestra la figura siguiente.

L1 G1 L2 G2 GN

Medio de transmisión
Repetidores

Importante: la solución de insertar repetidores cuando la atenuación es muy grande nos permite cumplir
con la primera condición que hemos señalado al principio de la sección. No obstante, los repetidores
introducen ruido a la transmisión y con el fin de cumplir también la segunda condición, hay que hacer
un diseño adecuado del sistema de repetidores. Es algo que queda fuera del temario de esta asignatura
y que veréis más adelante.

Transmisión vı́a radio

En la transmisión vı́a radio, las pérdidas de transmisión en espacio libre vienen dadas por
 2  2
4πl 4πf l
L= = (29)
λ c

donde λ es la longitud de onda, c = 3 · 108 m/s es la velocidad de la luz y l es la distancia entre


transmisor y receptor. Se trata, sin embargo, de un caso algo optimista ya que en la realidad hay una
multitud de efectos que influyen sobre la propagación de las ondas electromagnéticas y que en general
hacen las pérdidas algo más severas. Es algo que veréis más adelante. Por otro lado, las antenas que
usan los transceptores tienen cierta capacidad para concentrar la energı́a electromagnética, lo que se

27
traduce en una cierta ganancia. Juntando todo, tenemos (ver la figura)

GT GR
Pout = Pin (30)
L

GT L GR

Pin Pout

Igual que en el caso de transmisión guiada, para cubrir distancias muy largas puede ser necesario el
uso de repetidores. Recordemos que será necesario un diseño adecuado para conseguir tanto una buena
potencia recibida como una SNR.

6. Filtros
Los filtros son elementos muy comunes (por no decir indispensables) en cualquier sistema de comu-
nicaciones. Son sistemas LTI como los que hemos visto hasta el momento de los cuales nos interesa
especialmente su comportamiento frecuencial, básica y burdamente, qué frecuencias dejan pasar y
qué frecuencias atenúan o eliminan.

Hablamos de filtros ideales cuando el comportamiento es de tipo on/off, es decir, o bien dejar pasar
una frecuencia o bien la eliminan. Como su nombre indica, este es el comportamiento que desearı́amos.
No obstante, es irrealizable en la práctica, donde tendremos transiciones algo más suaves. Los tipos
básicos de filtros (ideales o reales) son:

Filtro paso bajo: deja pasar las frecuencias en un ancho de banda B alrededor del origen y
elimina el resto.

Filtro paso alto: es el complementario del anterior, es decir, elimina las frecuencias en [−B, B]
y deja pasar el resto.

Filtro paso banda: deja pasar una cierta banda frecuencial, es decir f ∈ {[−B2 , −B1 ] ∪ [B1 , B2 ]},
y elimina el resto de frecuencias.

Filtro banda eliminada: es el complementario del anterior, es decir, se dejan pasar todas las
frecuencias menos las que se encuentran en una determinada banda frecuencial.

En la siguiente figura podemos ver las respuestas ideales de estos 4 tipos de filtro y sus correspondientes
sı́mbolos. Nota: en las bandas de paso la respuesta del filtro ideal es H(f ) = αe−j2πf td para no
distorsionar la señal.

28
|H(f )| |H(f )|

Paso bajo Paso banda

−B B f −B2 −B1 B1 B2 f

|H(f )| |H(f )|

Paso alto Banda eliminada

−B B f −B2 −B1 B1 B2 f

Por último, veamos en la siguiente figura como serı́a una respuesta de filtro real paso banda.

Zonas de
transición |H(f )|2

K
K/2

K/102

Banda Banda de
eliminada paso

En dicha respuesta identificamos la banda o bandas de paso y la banda o bandas eliminadas como en
los filtros ideales pero ahora se añaden unas zonas de transición. En la figura de ejemplo tenemos un
filtro paso banda real. En general, queremos que los filtros reales tengan las siguientes caracterı́sticas:

Respuesta lo más plana posible en la banda de paso para distorsionar lo mı́nimo la señal.

Transiciones rápidas para dejar pasar el mı́nimo ruido posible e interferencias de otros sistemas
o de otros canales del mismo sistema.

Retardos pequeños.

Mı́nima distorsión de fase.

No obstante, no es posible conseguir todo a la vez y en función de la aplicación deberemos priorizar


una caracterı́sticas frente a otras.

Por último, como no hay una frecuencia que separe bandas eliminadas de bandas de paso, debemos
especificar algún criterio para definir dichas bandas. Para la banda de paso, solemos definir el ancho
de banda cogiendo las frecuencias f3dB en las que la potencia decrece 3dB respecto al máximo, en

29
fmax , que en lineal se corresponderı́a a una disminución a la mitad de la potencia, esto es
|H(fmax )|2 1
|H(f3dB )|2 = −→ |H(f3dB )| = √ |H(fmax )| (31)
2 2
aunque también se puede definir el ancho de banda a 6dB o lo que  se quiera.  Para definir la banda
|H(fmax )|2
eliminada, miramos las frecuencia en las que la potencia baja 20dB 102
y tendremos la banda
eliminada a 20dB, 40dB (banda eliminada a 40dB), etc.

7. Relación señal a ruido (SNR)


Como ya hemos visto al principio, justo antes del receptor añadimos ruido (de tipo aditivo) a la señal
deseada. El sentido de este modelo es que justo en ese momento es cuando la señal más débil es, es
decir, será la relación SNR en ese punto la que limitará la calidad del sistema y no las relaciones señal
a ruido en puntos anteriores del sistema de comunicaciones.

Centrémonos ahora en un modelo de receptor para un sistema analógico de transmisión en banda base
como podrı́a ser el de telefonı́a fija sobre la red telefónica conmutada (RTC), es decir, el teléfono de
toda la vida (no las alternativas que ofrecen hoy en dı́a algunas compañı́as sobre IP, voz sobre IP). Lo
más simple serı́a amplificar la señal y filtrarla en su ancho de banda para dejar pasar el mı́nimo de
ruido posible. Esto es lo que ilustra la siguiente figura.

xR (t), SR yD (t) = xD (t) + nD (t)


GR
SD , N D
Bx
N0
n(t), Sn (f ) =
2

En general, calcularemos la potencia de la señal en destino yD (t) (proceso aleatorio estacionario)


haciendo

E{|yD (t)|2 } = E{(xD (t) + nD (t)) (xD (t) + nD (t))∗ } (32)


= E{|xD (t)|2 } + E{|nD (t)|2 } + 2Re ( ((∗D
 (
E{x D (t)n
((t)}
(
((
= SD + ND (33)
(34)

donde hemos supuesto que señal deseada y ruido están incorrelados. Esto será lo habitual y lo haremos
ası́ a no ser que nos digan lo contrario.

Con todo esto, la relación señal a ruido en destino vale


SD GR SR SR ST
SN RD = = = = (35)
ND GR N0 Bx N0 Bx LN0 Bx
siendo la última igualdad válida si el canal no introduce distorsión de amplitud. Algunos valores tı́picos
de SNR en sistemas banda base son:

30
Voz en la banda de 500Hz-2kHz para que sea justo inteligible: 5dB - 10dB

Voz en la banda de 200Hz - 3,2kHz para teléfono: 25dB - 35dB

Audio de alta fidelidad en la banda 20Hz - 20kHz: 55dB - 65dB

Observaciones:

El amplificador del receptor no modifica la SNR, sólo permite que la señal en destino tenga un
nivel suficiente.

De forma simple, sólo podré mejorar la SNR si incremento ST , aunque no siempre es posible.

Por último, recordad el valor de SN RD para la transmisión en banda base ya que más adelante lo
utilizaremos para comparar con la transmisión paso banda. Nos quedamos pues con el parámetro
γ = SN RD , es decir
SR
γ= (36)
N0 Bx

8. Filtros terminales óptimos y filtro adaptado


Consideremos ahora el siguiente modelo de sistema de comunicaciones en banda base

xR (t), SR
x(t), Px xT (t), ST yD (t) = xD (t) + nD (t)
HT (f ) HC (f ) HR (f )
Sx (f ), Bx SD , N D

TRANSMISOR CANAL RECEPTOR

n(t), Sn (f )

donde tanto transmisor como canal de comunicaciones y receptor se modelan como un sistema LTI
o “filtro”. El objetivo en este esquema es, dado un canal de comunicaciones y una señal a transmitir
(proceso estacionario caracterizado por su densidad espectral de potencia Sx (f )), ver cómo hay que
diseñar los filtros del transmisor y receptor para combatir tanto el ruido como la distorsión.

Ası́ pues, plantearemos el problema general como la maximización de la SNR en destino, es decir
SD /ND , sujeta a las siguiente restricción (vista desde el punto de vista temporal o frecuencial),

HT (f ) · HC (f ) · HR (f ) = αe−j2πf td
hT (t) ∗ hC (t) ∗ hR (t) = αδ(t − td )

es decir, la respuesta global del sistema debe corresponder a la del canal ideal para no distorsionar la
señal a transmitir x(t). A partir de aquı́ debemos hacer dos observaciones:

1. La parte correspondiente a señal deseada xD (t) de la señal en destino yD (t) será xD (t) = αx(t −
td ). Esto ya impone que
SD = α2 Px (37)

31
2. Se debe fijar la potencia de transmisión ST a un valor deseado, ya que de lo contrario la solución
del problema serı́a la trivial, es decir, poner un filtro HT (f ) que proporcione potencia de trans-
misión arbitrariamente grande. Nótese que la gracia del diseño que planteamos es jugar con las
respuestas frecuenciales HT (f ) y HR (f )sin tener que recurrir a la solución fácil de incrementar
ST a través de la amplificación que haga el transmisor.

El problema de maximización de SNR propuesto involucra esencialmente los módulos de los filtros
ya que la potencia depende de ello. No obstante, al plantear el problema con la restricción de no
distorsión, debemos tener en cuenta también las fases de los filtros, únicamente para cumplir

∠HT (f ) + ∠HC (f ) + ∠HR (f ) = −2πf td ∀f ∈ [−Bx , Bx ] (38)

Esto es trivial ya que tenemos ∠HT (f ) y ∠HR (f ) (dos grados de libertad) para compensar la fase del
canal y forzar que la fase del conjunto sea lineal.

La parte que nos resta corresponde a


SD
máx (39)
{|HT (f )|,|HT (f )|} ND

sujeto a ST fija y |HT (f )|2 · |HC (f )|2 · |HR (f )|2 = α2 . Centrémonos pues en el diseño de módulos. Lo
primero que hay que hacer es expresar SD y ND en función de |HT (f )| y |HR (f )|. Empecemos por lo
más fácil, que es ND y vale Z+∞
ND = Sn (f )|HR (f )|2 df (40)
−∞
El caso de SD es algo más complejo ya que debemos ponerlo también en función de la potencia
transmitida ST que queremos fijar. Esta potencia valdrá
Z +∞
ST = Sx (f )|HT (f )|2 df (41)
−∞

y con la condición de no distorsión en módulo, es decir |HT (f )| · |HC (f )| · |HR (f )| = α, llegamos a


Z +∞
Sx (f )
ST = α2 2 2
df (42)
−∞ |HC (f )| |HR (f )|

De esta última ecuación podemos aislar α2 y sustituir en (37), con lo que obtenemos

ST Px
SD = R +∞ Sx (f )
(43)
−∞ |HC (f )|2 |HR (f )|2 df

Finalmente, usando (43) y (40) podemos escribir la SNR en destino como

SD S T Px
SN RD = = R +∞ Sx (f ) R +∞ (44)
ND df 2
2
−∞ |HC (f )| |HR (f )| 2 −∞ Sn (f )|HR (f )| df

32
La cuestión ahora es como maximizar SN RD imponiendo las restricciones. Fijémonos que la condición
de no distorsión en amplitud ya ha sido impuesta para pasar de (41) a (42). Ası́ mismo, la potencia
en destino ha sido fijada a través de α en (37) y luego usado para encontrar (43). Entonces la única
restricción que nos queda por fijar en (44) es ST , donde aparece explı́citamente. La clave ahora es
ver que si fijamos el valor de ST , teniendo en cuenta que Px viene dado, lo que hay que hacer para
maximizar SN RD es minimizar el denominador. Para ello usamos la desigualdad de Cauchy-Schwarz,
que nos dice que dos vectores u y v en un espacio vectorial con producto escalar definido (sea el espacio
vectorial de los vectores en Rn , los complejos o bien las funciones complejas continuas) cumplen

|hu, vi|2 ≤ hu, ui · hv, vi (45)

y que la igualdad se da cuando u y v son linealmente dependientes, es decir u = kv, siendo k un


elemento del cuerpo sobre el que esté constituido el espacio vectorial.

En el caso que nos ocupa, trabajamos en el espacio vectorial de las funciones complejas continuas
sobre el cuerpo de los complejos donde el producto escalar viene definido por la integral del producto
conjugado de funciones. En ese caso la desigualdad se convierte en
Z +∞ 2 Z +∞ Z +∞
∗ 2
|v(x)|2 dx


u(x)v (x)dx ≤
|u(x)| dx (46)
−∞ −∞ −∞

En realidad, nosotros trabajamos con funciones reales de f (módulos y densidades espectrales), pero
hemos puesto la expresión anterior porque es más genérica y la usaréis otras veces. Aplicándolo al
denominador de (44) vemos que ahı́ tenemos el producto de la norma al cuadrado dos funciones (parte
derecha de la desigualdad) que son
s
Sx (f )
U (f ) = (47)
|HC (f )|2 |HR (f )|2
p
V (f ) = Sn (f )|HR (f )|2 (48)

y la desigualdad nos dice que, sean cuales sean U (f ) y V (f ), el producto de sus normas al cuadrado
R 2
+∞
estará siempre por encima de una cantidad que vale −∞ U (f )V (f )df y que es el producto escalar

de las dos funciones. También nos dice que si U (f ) = kV (f ) entonces el producto de sus normas al
cuadrado tomará su valor mı́nimo. Veamos ahora qué vale U (f )V (f ),
1/2 1/2 1/2
Sx (f ) Sx (f ) · Sn (f )
U (f )V (f ) = · Sn1/2 (f )|HR (f )| = (49)
|HC (f )||HR (f )| |HC (f )|
Nos damos cuenta de que es independiente de los filtros a diseñar
2 y que depende de funciones dadas.
R +∞
Por lo tanto vemos que el valor mı́nimo −∞ U (f )V (f )df es igual para cualquiera que sean los

filtros transmisor y receptor, siempre y cuando se cumpla la condición U (f ) = kV (f ).

Aplicamos entonces dicha condición y obtenemos


1/2 1/2
Sx (f ) Sx (f )
= k Sn1/2 (f )|HR (f )| −→ |HR (f )|2 = (50)
|HC (f )||HR (f )| 1/2
k |HC (f )|Sn (f )

33
Por último, combinando la respuesta óptima que acabamos de encontrar, |HR (f )|2 , con la ecuación
de no distorsión elevada al cuadrado, es decir, |HT (f )|2 |HC (f )|2 |HR (f )|2 = α2 , encontramos
1/2
k α2 Sn (f )
|HT (f )|2 = 1/2
(51)
Sx (f )|HC (f )|

Los filtros terminales óptimos en el transmisor (51) y receptor (50) se califican en la literatura como
de preénfasis y deénfasis respectivamente. Este calificativo tiene relación con la densidad espectral
de ruido y nos remarca que lo mejor que podemos hacer es amplificar la señal en el transmisor es-
pecialmente en aquellas frecuencias donde haya más potencia de ruido (preénfasis) mientras que en
el receptor hay que hacer lo contrario. Fijémonos que sólo el nivel de ruido depende únicamente del
filtro receptor y que ya nos va bien atenuar aquellas frecuencias donde la densidad espectral de ruido
sea alta con el fin de minimizar la potencia total de ruido. Para compensar este efecto y no introducir
distorsión, el transmisor deberá amplificar esas frecuencias. Un análisis semejante podemos hacer con
la densidad espectral de la señal y es el caso de estudio que veremos luego en un ejemplo.

Fijémonos que a través del valor de α2 podremos ajustar SD , mientras que ST se deberá fijar a través
de k una vez hayamos escogido el valor deseado de α2 según las ecuaciones (41) y (51). Una vez
fijados ambos, la SNR en destino óptima que obtendremos usando los filtros terminales óptimos sale
de sustituir (50) en (43), obteniendo ası́

∗ ST PX
SN RD = 2 (52)
R +∞ 1/2 1/2
Sx (f )Sn (f )
−∞ |HC (f )|
R +∞
con ST = −∞ Sx (f )|HT (f )|2 df .

Ejemplo de aplicación: sistema de reducción de ruido Dolby-A (1965)

Este ejemplo, orientado a la grabación/reproducción de audio, es una aplicación de los filtros terminales
óptimos en un sistema donde la densidad espectral de ruido es plana y el canal es ideal (supongamos
|HC (f )| = 1). No obstante, la densidad espectral de la señal de audio concentra más potencia en las
frecuencias bajas que en las altas. En este escenario, el diseño con filtros terminales óptimos (50) -
(51) resulta

k α2
|HT (f )|2 = 1/2
(53)
Sx (f )
1/2
2 Sx (f )
|HR (f )| = (54)
k
tal y como muestra la figura siguiente.
Vemos que el filtro transmisor potencia las frecuencias altas (preénfasis) que, al tener menor densidad
de potencia, son más débiles frente al ruido que las más bajas. Para compensar este efecto y evitar
distorsión de la señal deseada, el filtro receptor toma la forma inversa (deénfasis) y la señal llega
“intacta” al receptor. La pregunta ahora es ¿qué ganamos haciendo esto? La respuesta deberı́a ser,

34
|HT (f )|2

Sx1/2 (f )

|HR (f )|2
−BX BX f

dado el objetivo de diseño de los filtros óptimos, mejorar la SNR con respecto a un sistema simple que
consistirı́a en un filtro paso banda ideal y un amplificador en el lado del receptor, que también dejarı́a
la señal “intacta”. Supongamos, para ser justos, que ambos sistemas fijan la misma SD y para hacerlo
fácil cogemos k = α = 1 para que SD = Px . Consideremos también que el máximo de Sx (f ) vale 1 y
veamos bajo estas condiciones qué sucede con la potencia de ruido en ambos sistemas. El resultado lo
podemos apreciar en la siguiente figura, donde claramente vemos que esta técnica nos elimina parte
del ruido que un sistema simple con un filtro pasa banda ideal dejarı́a pasar.

1
Sn (f )
Bx
−BX BX f

ruido eliminado
f
HR (f )

Filtro adaptado
Antes de concluir este tema hablaremos del filtro adaptado, que no tiene nada que ver con lo que
hemos visto hasta ahora. No obstante, como a veces se presta a cierta confusión en relación con los
filtros terminales óptimos, lo vemos aquı́ ya que también se usará más adelante en la parte de comuni-
caciones digitales. De hecho, las dos principales aplicaciones del filtro adaptado son las comunicaciones
digitales y los sistemas de radar. Pero... ¿en qué consiste?

Supongamos ahora que transmitimos una señal de duración temporal finita p(t) a la que denominare-
mos pulso. El receptor conoce dicha forma temporal pero desconoce su amplitud Ap ası́ como el tiempo
de llegada t0 y quiere detectar el momento en que llega el pulso lo mejor posible. En este supuesto, la
señal recibida será
xR (t) = Ap p(t − t0 ) (55)

35
y su transformada de Fourier
XR (f ) = Ap P (f )e−j2πf t0 (56)
donde P (f ) = F{p(t)}. Ası́ pues, la energı́a total del pulso recibido es
Z +∞ Z +∞
2 2
Ep = |XR (f )| df = Ap |P (f )|2 df (57)
−∞ −∞

Intuitivamente, lo que debe hacer el receptor es de alguna forma comprimir la forma del pulso para que
toda su energı́a se concentre en un margen temporal lo más pequeño posible dando lugar a una señal
abrupta que se desmarque claramente del ruido subyacente. Esto es lo que vemos en la siguiente figura
donde H(f ) es la respuesta frecuencial del filtro adaptado. Fijémonos que hay un retardo adicional td
que será necesario a la práctica para tener un filtro que debe ser causal para que sea realizable.

xR (t) y(t)

p(t)
xR (t) = Ap p(t − t0 ) H(f ) y(t)

t t
t0 t0 + t d

n(t), Sn (f )

El filtro adaptado deberá conseguir la amplitud máxima posible en el instante de diseño t0 + td .


Llamaremos A = y(t0 + td ) a esa amplitud. A partir de la respuesta frecuencial del filtro y XR (f ),
dicha amplitud se puede calcular como
Z +∞
−1
H(f )P (f )e−j2πf t0 ej2πf t df t=t0 +t

A = F {H(f )XR (f )} t=t0 +t = Ap
(58)
d d
−∞
Z +∞
= Ap H(f )P (f )e+j2πf td df
−∞

Por otro lado, la potencia de ruido después del filtro adaptado valdrá
Z +∞
2
σ = |H(f )|2 Sn (f )df (59)
−∞

y coincidirá con su varianza si suponemos que tiene media 0. Finalmente, como el objetivo del filtro
adaptado es detectar el pulso lo mejor posible, lo que hay que hacer es maximizar la relación entre la
amplitud en el instante de detección A y la amplitud del ruido. Como la amplitud del ruido es aleatoria
y por lo tanto impredecible, tomamos una medida estadı́stica que sea el equivalente, en este caso la
desviación estándar que nos dice qué amplitud máxima de ruido debemos esperar en la mayorı́a de los
casos. Nótese que podrı́amos considerar también 2σ, 3σ, etc. para tener en cuenta un caso peor. No
obstante, esto cambiarı́a la función de coste que pondremos a continuación pero no la forma del pulso
adaptado que buscamos. Entonces la función a maximizar será A/σ. Por comodidad, consideraremos
el cuadrado de esta relación. Como antes, cambiamos la función de coste pero no el resultado final (el
filtro adaptado). Ası́ pues nos centramos a maximizar
 2 R +∞ A H(f )P (f )e+j2πf td df 2

A −∞ p
= R +∞ (60)
σ 2
−∞ |H(f )| Sn (f )df

36
Como en el caso de los filtros terminales óptimos, podemos emplear aquı́ la desigualdad de Schwarz.
Identificamos las funciones U (f ) y V ∗ (f ) con

U (f ) = H(f )Sn1/2 (f ) (61)


Ap H(f )P (f )e+j2πf td Ap P (f )e+j2πf td
V ∗ (f ) = = 1/2
(62)
U (f ) Sn (f )
y escribimos la desigualdad como
R 2
+∞
−∞ U (f )V ∗ (f )df
Z +∞
R +∞ ≤ |V (f )|2 df (63)
|U (f )|2 df −∞
−∞
R +∞ R +∞A2p |P (f )|2
Ahora fijémonos que −∞ |V (f )|2 df = −∞ Sn (f ) df es una cantidad fija dado Ap , P (f ) y Sn (f ) que
∗ (f )df 2
R +∞
| −∞ U (f )V | A 2

limita por encima a R +∞
2
= σ , justamente lo que queremos maximizar. Ya sabemos
−∞ |U (f )| df
que para conseguir dicha cota debemos fijar U (f ) = kV (f ), con lo que encontramos
P ∗ (f )e−j2πf td
H opt (f ) = k (64)
Sn (f )
y conseguimos una relación amplitud a ruido máxima de
 2 Z +∞ 2
A Ap |P (f )|2
= df (65)
σ max −∞ |Sn |(f )|
Vemos que el filtro adaptado enfatiza las frecuencias donde el pulso tiene densidad espectral de energı́a
alta mientras que de-enfatiza aquellas en las que la densidad espectral de potencia del ruido es alta.

Por último, estudiemos el caso quizá más interesante y cuyo resultado es el más conocido, que es el
filtro adaptado ante ruido blanco con densidad espectral de potencia Sn (f ) = N20 . En ese caso el filtro
óptimo vale
2k ∗ 2k
H opt (f ) = P (f )e−j2πf td ←→ hopt (t) = p(td − t) (66)
N0 N0
y es una versión girada y desplaza td unidades del pulso original. Como hemos comentado, el hecho
de desplazar p(−t) es necesario si queremos que el filtro resultante esté únicamente en el semiplano
t > 0 y por lo tanto sea causal y realizable. Analicemos ahora cuál es el resultado de convolucionar la
señal recibida xR (t) con el pulso adaptado
2k 2Ap k
xR (t) ∗ hopt (t) = Ap p(t − t0 ) ∗ p(td − t) = p(t) ∗ δ(t − t0 ) ∗ p(−t) ∗ δ(t − td ) (67)
N0 N0
2Ap k
= Rp (t − (t0 + td ))
N0
y vemos que el resultado es la función de autocorrelación del pulso Rp (t) centrada en t0 + td . Por
esto en algunas aplicaciones donde se dé mucha importancia a detectar o no el pulso como es el caso
del radar o bien se necesite una medida muy precisa del tiempo de llegada del pulso (sincronización
precisa) nos interesarán pulsos cuya autocorrelación sea lo más parecida a una delta posible. Con
esto conseguimos: i) mayor diferencia con el nivel de ruido y ii) que ese ruido presente no nos haga
equivocar en el instante de llegada (cosa que podrı́a pasar si Rp fuera suave entorno al origen).

37
Tema 3: Transmisión Analógica Paso Banda
Antoni Morell y José López Vicario

7 de mayo de 2013

1. Elementos de un sistema de comunicaciones paso banda


En el tema anterior nos hemos centrado en la transmisión de señales en banda base. Ahora pasamos al
estudio de la transmisión paso banda, que consiste en trasladar frecuencialmente la señal para poder
ser transmitida a una banda diferente (generalmente superior) de la que se encuentra. La transmisión
paso banda no será útil por:

Facilidad en la implementación de los sistemas. Por ejemplo, es más fácil transmitir la señal de
audio en la banda que ocupan las emisoras de FM que hacerlo directamente en banda base, cosa
que requerirı́a antenas inmensas y potencias de transmisión muy elevadas. En definitiva, equipos
muy grandes.

Posibilidad de multiplexar en frecuencia. Cuando un sistema tiene más de un usuario se hace


necesario poder separarlos de alguna forma para que puedan coexistir. Una de las solución
es situarlos en bandas frecuenciales adyacentes (lo que llamamos canales) de forma que no se
interfieran. Para hacer eso, necesitamos poder desplazar la señal en la banda frecuencial.

En este tema estudiaremos una serie de herramientas que nos serán útiles para trabajar con señales
y sistemas paso banda. En los siguientes dos temas (dedicados a modulaciones lineales y angulares,
respectivamente) veremos especı́ficamente qué mecanismos existen de transmisión paso banda. De
momento, pero, nos quedamos únicamente con el siguiente esquema correspondiente a un sistema de
comunicaciones paso banda.

xT (t) xR (t)
x(t) yD (t) = xD (t) + nD (t)
FUENTE MODULADOR TRANSMISOR CANAL RECEPTOR DEMODULADOR
PX SD , ND
ST SR

n(t)

Vemos que contiene los mismos elementos que el sistema en banda base pero con el añadido de un
modulador y un demodulador que se encargan de adaptar la señal para ser transmitida por el canal
en la banda deseada y devolverla a banda base, respectivamente.

38
2. Señales paso banda: señal analı́tica y equivalente paso bajo
Señal analı́tica y transformada de Hilbert
Empecemos por ver el concepto de señal analı́tica, que está relacionado con la transformada de Hilbert
como veremos a continuación. Cojamos una señal real cualquiera x(t) y calculemos su transformada de
Fourier X(f ). Por las propiedades de simetrı́a de la transformada, sabemos que si x(t) es real entonces
X(f ) debe ser hermı́tica, o lo que es lo mismo, tener módulo par y fase impar como muestra la figura.

∠H(f )

|H(f )|

En la misma figura vemos que no es necesario disponer de toda H(f ) ya que la información que
hay en el semiplano positivo se repite en el semiplano negativo (teniendo en cuenta las simetrı́as).
Aprovechando esta observación definimos la señal analı́tica en el dominio frecuencial como

AX (f ) = 2u(f )X(f ) (1)

de forma que nos quedamos únicamente con la parte sombreada de la figura y multiplicamos por 2
para mantener el área. En el dominio temporal, tenemos
 
−1 −1 1 1 1
ax (t) = F {AX (f )} = 2F {u(f )}∗x(t) = 2 δ(t) − ∗x(t) = x(t)+jx(t)∗ = x(t)+jhx (t)
2 j2πt πt
(2)
1 1
donde hx (t) = H{x(t)} = x(t)∗ πt es lo que conocemos como transformada de Hilbert de x(t) . Vemos
que existe relación entre las partes real e imaginaria de ax (t), esto es

Im{ax (t)} = hx (t) = H{Re{ax (t)}} (3)

¿Qué sucede con la señal analı́tica cuando hay un sistema LTI como el de la figura?

x(t) H(f ) y(t)

En este caso, tenemos a nivel frecuencial Y (f ) = H(f )X(f ). Si buscamos la señal analı́tica en el
dominio frecuencial xorrespondiente a Y (f ) tenemos

AY (f ) = 2u(f )Y (f ) = 2u(f )X(f )H(f ) = 2u(f )X(f )u(f )H(f ) (4)


1
Ya sabı́amos que F {u(t)} = 12 δ(f ) + j2πf
1
, ası́ que aplicando las propiedades de dualidad junto con la de cambio de
−1
escala encontramos fácilmente F {u(f )}.

39
Este resultado nos lleva a poder escribir AY (f ) de tres formas distintas en función de como agrupemos
los términos, que son 
 AX (f )H(f )

AY (f ) = X(f )AH (f ) (5)
 1 A (f )A (f )

2 X H

y que en el dominio temporal se traduce a



 ax (f ) ∗ h(t)

ay (t) = x(t) ∗ ah (t) (6)
 1 a (t) ∗ a (t)

2 x h

Volviendo ahora a la transformada de Hilbert e interpretándola como sistema LTI, éste tendrı́a res-
puesta impulsional
1
h(t) = (7)
πt
y por lo tanto no causal y no realizable. Su respuesta frecuencial serı́a
 
1
H(f ) = F = −jsign(f ) (8)
πt
y tendrı́a módulo constante |H(f )| = 1 y fase ∠H(f ) = −π/2 para f > 0 mientras que para f < 0 la
fase valdrı́a ∠H(f ) = π/2.

Propiedades de la transformada de Hilbert

Son las siguientes:


1. Linealidad.

2. Transformada inversa: se puede comprobar que H−1 {hx (t)} = −H{hx (t)} = x(t). Esto es, tanto
en el dominio temporal como en el frecuencial, la transformada inversa de Hilbert consiste en
volver a transformar y cambiar el signo. Lo podemos ver en el dominio frecuencial transformando
dos veces la señal X(f ), es decir HHX (f ) = −jsign(f )(−jsign(f )X(f )) = −X(f ). Viendo esto
mismo a nivel temporal (haciendo F −1 ) obtendrı́amos πt 1 1
∗ πt ∗ x(t) = −x(t), es decir, se deduce
1 1
que πt ∗ πt = −δ(t).

3. Correlación (pensando en la transformada de Hilbert como un sistema LTI de respuesta impul-


sional h(t) = 1/πt):
−1
Rxhx (τ ) = Rx (τ ) ∗ = −hRx (τ ) (9)
πτ
1
Rhx x (τ ) = Rx (τ ) ∗ = hRx (τ ) (10)
πτ
1 −1
Rhx (τ ) = Rx (τ ) ∗ ∗ = Rx (τ ) ∗ δ(τ ) = Rx (τ ) (11)
πτ πτ
De este último resultado vemos que

Shx (f ) = Sx (f ) (12)

y por lo tanto x(t) y su transformada de Hilbert tienen la misma potencia, es decir Phx = Px .

40
4. Ortogonalidad: dos señales son ortogonales (desde el punto de vista escalar de funciones) si su
1
correlación cruzada en el origen vale 0, y x(t) y hx (t) lo son. Dado que Rhx x (τ ) = Rx (τ ) ∗ πτ
tenemos
Z +∞ Z +∞
1 1 1 1
Rhx x (0) = Rx (τ )∗ = ∗Rx (τ ) = Rx (τ −λ)dλ = Rx (λ)dλ = 0
πτ τ =0 πτ τ =0 −∞ πλ τ =0 −∞ πλ
(13)
ya que se trata de la integral de −∞ a +∞ de una función impar (producto de una función
1
impar πλ por una función par Rx (λ)).

5. Convolución:
1
hx∗y (t) = ∗ x(t) ∗ y(t) = hx (t) ∗ y(t) = x(t) ∗ hy (t) (14)
πt
1 1
¡Cuidado!: no es la convolución de transformadas, que serı́a hx (t) ∗ hy (t) = πt ∗ x(t) ∗ πt ∗ y(t) =
−x(t) ∗ y(t).

Un vez ya conocemos los detalles de la transformada de Hilbert, retomemos el concepto de señal


analı́tica a través de un ejemplo. Consideremos x(t) = A cos 2πfo t que tiene transformada de Fou-
rier X(f ) = A2 [δ(f − f0 ) + δ(f + f0 )]. Para calcular ax (t) necesitamos primero la transformada de
Hilbert. Si la hacemos en el dominio frecuencial tenemos HX (f ) = A2 [−jδ(f − f0 ) + jδ(f + f0 )] =
A −1 {H (f )} = A sin 2πf t y por lo tanto
2j [δ(f − f0 ) − δ(f + f0 )], lo que significa que hx (t) = F X 0
ax (t) = x(t) + jhx (t) = A cos 2πfo t + jA sin 2πf0 t = Ae j2πf0t.

Representación fasorial de la señal analı́tica

Dado que la señal analı́tica ax (t) = x(t) + jhx (t) es compleja, la podemos interpretar como una fasor,
esto es, en cada instante de tiempo t la señal analı́tica se puede representar como un vector en el plano
complejo como muestra la siguiente figura. A medida que el tiempo avanza, también cambia el vector,
tanto en longitud como en orientación.

Im{ax (t)}

ex (t)
hx (t)

ϕx (t)

Re{ax (t)}
x(t)

En la figura ya vemos que podemos describir la señal analı́tica a través de sus componentes real
e imaginaria pero que, alternativamente, lo podemos hacer también a través de su módulo y fase
(variantes en el tiempo). En el contexto de la señal analı́tica, llamamos al primero envolvente de la

41
señal ex (t) y al segundo fase instantánea de la señal ϕx (t) y se obtienen según
p
ex (t) = |ax (t)| = x2 (t) + h2x (t) (15)
hx (t)
ϕx (t) = ∠ax (t) = atan (16)
x(t)

Por último, definimos la frecuencia instantánea de la señal como

1 ∂ϕx (t)
fx (t) = (17)
2π ∂t
Ası́, en el ejemplo anterior con x(t) = A cos 2πfo t, tenemos

ex (t) = A, ϕx (t) = 2πf0 t, fx (t) = f0 (18)

Señales paso banda y el equivalente paso bajo


Nos centramos ahora en las señales paso banda como puede ser la de la figura siguiente, donde f0 es
una frecuencia que escogemos en el intervalo [f1 , f2 ] y generalmente se cumple f0  Bx .

|X(f )|
Bx

−f2 −f0 −f1 f1 f0 f2 f

Encontrar el equivalente paso bajo de X(f ) pasa por hallar primero la señal analı́tica, en este caso
AX (f ) = 2u(f )X(f ) y luego desplazar el resultado f0 unidades a la izquierda. Esto provoca, como
muestra la figura siguiente, tener una representación de X(f ) alrededor del origen de frecuencia y por
esto lo llamamos equivalente paso bajo.

|X(f )|

AX (f )

BX (f )

−f2 −f0 −f1 f1 − f0 f2 − f0 f1 f0 f2 f

Representaremos el equivalente paso bajo de X(f ) en el dominio frecuencial como BX (f ) y en el


dominio temporal como bx (t), tal y como hemos hecho con la señal analı́tica. De la figura anterior, se
deducen las siguientes relaciones entre ambos:

BX (f ) = AX (f + f0 ) (19)
bx (t) = ax (t)e−j2πf0 t (20)

42
A partir del equivalente paso bajo definimos las componentes en fase y cuadratura de la señal, i(t) y
q(t) respectivamente, que se corresponden con la parte real e imaginaria del equivalente paso bajo.
Dicho de otro modo, 
Re{bx (t)} = ix (t)
bx (t) = ix (t) + jqx (t) (21)
Im{bx (t)} = qx (t)
Veamos ahora algunas relaciones importantes. En primer lugar, la representación de x(t) a partir de
sus componentes en fase y cuadratura. Para ello, recordamos que la parte real de la señal analı́tica es
justamente x(t). ası́ que

x(t) = Re{ax (t)} = Re{bx (t)ej2πf0 t } = Re {(ix (t) + jqx (t)) (cos 2πf0 t + j sin 2πf0 t)} (22)
= ix (t) cos 2πf0 t − qx (t) sin 2πf0 t

Luego, tanto envolvente como fase instantánea se pueden expresar a partir del equivalente paso bajo
como
p
ex (t) = |ax (t)| = |bx (t)ej2πf0 t | = |bx (t)| = i2x (t) + qx2 (t) (23)
ϕx (t) = ∠ax (t) = ∠bx (t) + 2πf0 t = ϕbx (t) + 2πf0 t (24)
qx (t)
donde ϕbx (t) = ∠bx (t) = atan ix (t) .

En la representación fasorial, si nos fijamos en la relación ax (t) = bx (t)ej2πf0 t nos damos cuenta que el
equivalente paso bajo nos dice como hay que modificar el fasor ej2πf0 t para obtener la señal analı́tica.
Por lo tanto, el equivalente paso bajo será uno u otro en función de la frecuencia de referencia f0 que
tomemos. Esta idea se ve en la figura siguiente.

Im{ax (t)}

ax (t)
ix (t)
qx (t)

hx (t)
ϕbx (t)
ej2πf0 t

Re{ax (t)}
x(t)

3. Filtrado equivalente paso bajo


Una vez hemos visto que es posible obtener una representación en banda de base de una señal paso
banda, nos preguntamos ahora si es posible tratarla como tal a su paso por un sistema LTI, es decir,

43
¿cómo será el equivalente paso bajo de una señal a la salida de un filtro con respuesta impulsional
h(t)? Para ello elaboraremos a partir del resultado de (6), que nos decı́a

1 1 +∞
Z
ay (t) = ax (t) ∗ ah (t) = ax (λ)ah (t − λ)dλ (25)
2 2 −∞

Si ahora tenemos en cuenta la relación entre señal analı́tica y equivalente paso bajo, es decir ay (t) =
by (t)ej2πf0 t , llegamos a
+∞
1
Z
j2πf0 t
ay (t) = by (t)e = bx (λ)ej2πf0 λ bh (t − λ)ej2πf0 (t−λ) dλ (26)
2 −∞
+∞
1 j2πf0 t 1 j2πf0 t
Z
= e bx (λ)bh (t − λ)dλ = e bx (t) ∗ bh (t)
2 −∞ 2

de lo que deducimos
1 1
by (t) = bx (t) ∗ bh (t) −→ BY (f ) = BX (f ) · BH (f ) (27)
2 2
Si buscamos la representación de la señal paso banda y(t) como y(t) = iy (t) cos 2πf0 t − qy (t) sin 2πf0 t,
entonces podemos partir de ésta última relación y ver que
1
iy (t) + jqy (t) = (ix (t) + jqx (t)) ∗ (ih (t) + jqh (t)) (28)
2
1 1
= (ix (t) ∗ ih (t) − qx (t) ∗ qh (t)) + j (qx (t) ∗ ih (t) + ix (t) ∗ qh (t))
2 2
con lo que llegamos a
1
iy (t) = (ix (t) ∗ ih (t) − qx (t) ∗ qh (t)) (29)
2
1
qy (t) = (qx (t) ∗ ih (t) + ix (t) ∗ qh (t)) (30)
2

4. Modulación y demodulación de señales paso bajo


En este apartado nos centramos en dos cuestiones:

1. Suponiendo que disponemos tanto de ix (t) como de qx (t), es decir, las componentes del equiva-
lente paso bajo de x(t), ver como se construye la propia señal paso banda x(t). Hablamos de
construir el modulador.

2. El proceso inverso, es decir, si recibimos x(t), ver cómo sacar sus componentes. Construimos
aquı́ lo que se conoce como demodulador coherente.

Empecemos por el modulador, que nos sirve para trasladar el mensaje de la fuente a la banda frecuen-
cial requerida. Su diagrama de bloques, que aparece en la siguiente figura, resulta evidente si se tiene
en cuenta la expresión x(t) = ix (t) cos 2πf0 t − qx (t) sin 2πf0 t.

44
ix (t)

cos 2πf0 t

x(t)

π/2

− sin 2πf0 t

qx (t)

Por contra, el diagrama de bloques del demodulador coherente no resulta tan evidente, como se puede
ver en la siguiente figura.

ix (t)

2 cos 2πf0 t Bx

x(t)

π/2

−2 sin 2πf0 t

qx (t)

Bx

Comprobemos que este esquema permite obtener las señales paso bajo ix (t) y qx (t) deseadas. Por la
rama de arriba tenemos, justo antes del filtro paso bajo, la señal
1
x(t)2 cos 2πf0 t = (ix (t) cos 2πf0 t − qx (t) sin 2πf0 t) 2 cos 2πf0 t (31)
2
= ix (t)(1 + cos 2π2f0 t) − qx (t) sin 2π2f0 t
= ix (t) + ix (t) cos 2π2f0 t − qx (t) sin 2π2f0 t

y por lo tanto, después del multiplicador tenemos la señal deseada ix (t) pero también otros dos
componentes. Por suerte, estos dos términos adicionales van modulados por una portadora a 2f0 .
Suponiendo que f0  Bx , entonces seguro que quedan espectralmente lejos de ix (t), ası́ que con un
filtro paso bajo será fácil eliminar la parte indeseada. Por la rama inferior sucede algo parecido ya que
1
x(t)(−2 sin 2πf0 t) = (ix (t) cos 2πf0 t − qx (t) sin 2πf0 t) (−2 sin 2πf0 t) (32)
2
= −ix (t) sin 2π2f0 t + qx (t)(1 − cos 2π2f0 t)
= qx (t) − ix (t) sin 2π2f0 t − qx (t) cos 2π2f0 t

45
y por lo tanto después de un filtrado paso bajo obtendremos qx (t).

Un sistema de comunicaciones paso banda con canal ideal y usando el modulador/demodulador que
acabamos de describir funcionarı́a perfectamente siempre que los osciladores locales estuvieran per-
fectamente sincronizados. Esto pasa obviamente por tener la misma frecuencia f0 y también la misma
fase. En las figuras anteriores las fases eran 0 y además se suponı́a que la señal de salida del modu-
lador era inyectada directamente al demodulador. No obstante, esto nunca sucederá en la práctica
puesto que siempre habrá cierto error. Nótese que la señal llegará con cierto retraso y por lo tanto
desfase al receptor. Por lo tanto, aunque pudiéramos sincronizar a la perfección emisor y receptor,
no nos servirı́a de nada si la señal recorre un mı́nimo camino. Esto quiere decir que no habrá otro
remedio que hacer una estimación de fase de la señal para sintonizar el oscilador local e implica co-
meter cierto error. Veamos qué sucede ante esta situación, es decir cuando el oscilador del emisor
tiene fase cero (cos 2πf0 t) pero el del receptor tiene fase ϕ (o sea cos (2πf0 t + ϕ)). Démonos cuenta
que nos interesa ver el efecto del desfase independientemente de su origen. En la realidad será por
el retraso debido a la propagación y el error de estimación, pero ahora para el análisis simplemente
lo fijamos y suponemos un canal ideal sin retraso, ası́ que a la entrada del demodulador tendremos x(t).

En este nuevo escenario veremos por la rama de arriba justo después del multiplicador

x(t)2 cos (2πf0 t + ϕ) = (ix (t) cos 2πf0 t − qx (t) sin 2πf0 t) 2 cos (2πf0 t + ϕ) (33)
= ix (t)(cos ϕ + cos (2π2f0 t + 2ϕ)) − qx (t)(− sin ϕ + sin (2π2f0 t + 2ϕ))
= ix (t) cos ϕ + ix (t) cos (2π2f0 t + 2ϕ) + qx (t) sin ϕ − qx (t) sin (2π2f0 t + 2ϕ)

y si filtramos paso bajo nos quedaremos con ix (t) cos ϕ + qx (t) sin ϕ. Si el desfase es pequeño el coseno
tomará un valor próximo a 1 y el seno próximo a cero, con lo que no habrá problemas. Sin embargo,
a medida que esto de ser cierto empezaremos a ver parte de componente en cuadratura donde sólo
deberı́a verse componente en fase. Por la rama inferior sucede algo parecido y acabamos obteniendo,
después del filtrado paso bajo, la señal qx (t) cos ϕ − ix (t) sin ϕ.

5. Autocorrelación y densidad espectral de señales paso banda


Para obtener la autocorrelación y densidad espectral de una señal paso banda cualquiera supondremos
que sus componentes en fase y cuadratura son procesos aleatorios estacionarios con funciones de
autocorrelación Rix (τ ) y Rqx (τ ), respectivamente. También puede haber cierta correlación entre ambas
que representaremos por Rix qx (τ ) = Rq∗x ix (−τ ) (ambas reales ya que las componentes fase y cuadratura
lo son). Calculemos primero la autocorrelación de x(t) (que es también una señal real),

Rx (t + τ, t) = E{x(t + τ )x∗ (t)} (34)


= E {[ix (t + τ ) cos (2πf0 (t + τ )) − qx (t + τ ) sin (2πf0 (t + τ ))]
[ix (t) cos (2πf0 t) − qx (t) sin (2πf0 t)]}
Rix (τ )
= [cos (2πf0 τ ) + cos (2πf0 (2t + τ ))]
2
Rix qx (τ )
− [sin (2πf0 (2t + τ )) − sin (2πf0 τ )]
2

46
Rqx ix (τ )
− [sin (2πf0 (2t + τ )) + sin (2πf0 τ )]
2
Rqx (τ )
+ [cos (2πf0 τ ) − cos (2πf0 (2t + τ ))]
2
Vemos que se trata de un proceso cicloestacionario ya que el valor de autocorrelación se repite periódi-
camente. Por ejemplo, fijado τ , se comprueba que Rx (t + τ, t) y Rx (t + fk0 + τ, t + fk0 ) valen exactamente
lo mismo ya que cos (2πf0 (2t + τ )) = cos (2πf0 (2t + 2k
f0 + τ )) = cos (2πf0 (2t + τ ) + 2π2k) y todos los
demás términos trigonométricos que dependen de t son periódicos.

Para calcular la densidad espectral media de potencia, como ya vimos en el primer tema, debemos
calcular primero la autocorrelación promedio (media en un periodo) y luego aplicar el teorema de
Wiener–Khinchin. Por lo tanto obtenemos primero
1
Z
Rx (τ ) = hRx (t + τ, t)i = Rx (t + τ, t)dt (35)
T0 hT0 i

Si nos fijamos en todos los términos que aparecen en (34) nos daremos cuenta que muchos desapare-
cerán en la integración ya que se trata de integrar un seno o bien un coseno en un periodo completo.
Ası́ pues, la autocorrelación media nos quedará

Rix (τ ) + Rqx (τ ) Ri q (τ ) − Rqx ix (τ )


Rx (τ ) = cos 2πf0 τ + x x sin 2πf0 τ (36)
2 2
Finalmente obtenemos la densidad espectral media de potencia como

Six (f ) + Sqx (f )
Sx (f ) = F{Rx (τ )} = ∗ [δ(f − f0 ) + δ(f + f0 )] (37)
4
Six qx (f ) − Sqx ix (f )
+ ∗ [δ(f − f0 ) − δ(f + f0 )]
4j
y la potencia media de la señal paso banda como

Rix (0) + Rqx (0) P ix + Pqx


Px = Rx (0) = = (38)
2 2

6. Retardo de fase y retardo de grupo


Cuando hemos hablado del modulador y el demodulador coherente para señales en fase y cuadratura
hemos considerado un canal extremadamente ideal H(f ) = 1. Ya hemos dicho que en la realidad
habrá como mı́nimo un desfase en la portadora de la señal recibida debido al retardo del canal.
Allı́ únicamente nos hemos preocupado de ver qué efecto tenı́a ese desfase y ası́ lo hemos modelado.
Ahora nos centramos en ver este efecto del canal sobre la señal paso banda y por ello consideramos el
esquema de la siguiente figura.

x(t) H(f ) y(t)


Bx

47
Para no complicar demasiado las cosas, consideraremos aquı́ un canal ideal pero no utópico como
antes. Supondremos que en el margen frecuencial alrededor de f0 donde se encuentra la señal, es decir
en |f | ∈ [f0 − Bx , f0 + Bx ] el canal H(f ) = |H(f )|e−jϕh (f ) tiene módulo más o menos constante y una
fase más o menos lineal que aproximaremos por la serie de Taylor de primer orden, esto es
(
|H(f )| = |H(f0 )|
, |f | ∈ [f0 − Bx , f0 + Bx ] (39)
ϕh (f ) = ϕh (f0 ) + (f − f0 ) ∂ϕ

h
∂f f =f0

Calculemos ahora el equivalente paso bajo a la salida en el dominio frecuencial usando el resultado de
(27), esto es
1
BY (f ) = BX (f )BH (f ) (40)
2
con BH (f ) = AH (f + f0 ) = 2u(f + f0 )H(f + f0 ). Juntándolo todo nos queda
 
∂ϕ
1 −j ϕh (f0 )+f ∂fh
f =f0
BY (f ) = BX (f )2u(f + f0 )|H(f0 )|e (41)
2
y ahora nos interesan las frecuencias que verifican |f | < Bx (banda base). Como hemos supuesto que
f0  Bx , el escalón que empieza en −f0 no tiene ningún efecto, ya que limita más el ancho de banda
de la propia señal. Ası́ que podemos simplificar la expresión anterior en
 
∂ϕ
−j ϕh (f0 )+f ∂fh
f =f0
BY (f ) = BX (f )|H(f0 )|e (42)

A continuación definimos los parámetros tph y tgr (en breve veremos su significado fı́sico) como
ϕh (f0 )
tph = (43)
2πf0
1 ∂ϕh
tgr = (44)
2π ∂f f =f0
de modo que BY (f ) se puede expresar ahora como

BY (f ) = BX (f )|H(f0 )|e−j (2πf0 tph +2πf tgr ) = BX (f )e−j2πf tgr |H(f0 )|e−j2πf0 tph (45)

Ahora anti-transformamos para encontrar el equivalente paso bajo a la salida del canal y en el dominio
temporal, que es
by (t) = bx (t − tgr )|H(f0 )|e−j2πf0 tph (46)
donde se aprecia que tgr aplica un retraso sobre la señal de entrada y es lo que denominamos
retardo de grupo mientras que parece que tph aplica un desfase o retraso a la portadora y es lo que
llamamos retardo de fase. Esto lo veremos más claro sobre la señal real (en ambos sentidos) y paso
banda y(t),
n o n o
y(t) = Re{ay (t)} = Re by (t)ej2πf0 t = Re bx (t − tgr )|H(f0 )|ej2πf0 t e−j2πf0 tph (47)
n o
= Re bx (t − tgr )|H(f0 )|ej2πf0 (t−tph )
= ix (t − tgr )|H(f0 )| cos (2πf0 t − 2πf0 tph ) − qx (t − tgr )|H(f0 )| sin (2πf0 t − 2πf0 tph )

48
donde vemos que tph se puede interpretar como retardo o bien como un desfase de la portadora (tanto
en el seno como en el coseno).

Antes de acabar esta sección pongamos un ejemplo. Consideremos x(t) = a(t) cos 2πf0 t, que única-
mente tiene componente en fase y por lo tanto bx (t) = a(t). En este caso la señal después del canal
vale
n o
y(t) = Re bx (t − tgr )|H(f0 )|ej(2πf0 (t−tph )) = a(t − tgr )|H(f0 )| cos (2πf0 t − 2πf0 tph ) (48)

Si dibujamos las señales de entrada y salida del canal obtendremos algo como lo que se muestra en la
siguiente figura, donde el retardo de grupo retrasa la señal a(t) mientras que el retardo de fase provoca
un retardo sobre la portadora, que en general no valdrán lo mismo.

tgr
a(t)
a(t − tgr )

x(t) y(t)

H(f )

tph

Nota: en un caso real la frecuencia de la portadora serı́a mucho mayor que la de la figura y no podrı́amos
distinguir los ciclos. Sólo verı́amos una zona pintada de negro entre la curva en trazo continuo a(t) y
la curva en trazo discontinuo (la reflexión en el eje de abcisas).

7. Ruido paso banda


El último apartado de este tema se dedica al estudio del ruido en sistemas paso banda. Consideraremos
el siguiente esquema de canal y receptor. Además, supondremos que el canal es ideal y por lo tanto, a
nivel de ruido, lo mejor que podemos hacer en el receptor es colocar un filtro paso banda ideal que deje
pasar justo el ancho de banda de la señal, ya que de esta forma limitaremos al máximo la potencia
entrante de ruido sin alterar la señal deseada.

H(f ) DEMODULADOR
n(t)

w(t)

Consideraremos, como es habitual, que el ruido antes del filtro o w(t) es un proceso estacionario con
autocorrelación Rw (τ ). Por lo tanto, si tuviera densidad espectral plana (ruido blanco) y como ya

49
vimos en el tema anterior, la densidad espectral del ruido después del filtro (densidad espectral de
n(t)) seria la de la siguiente figura.

BT

−f0 f0 f

Hasta aquı́ todo bien. Lo interesante ahora es ver qué sucede con el proceso de ruido filtrado una
vez pasa por el demodulador ya que éste se convierte de ruido paso banda n(t) a ruido paso bajo. El
objetivo ahora es ver cómo son las componentes en fase y cuadratura del ruido (in (t) y qn (t)) y por ello
estudiaremos sus correlaciones Rin (τ ), Rqn (τ ) ası́ como las cruzadas (suponiendo que sean procesos
estacionarios). Estas componentes salen del equivalente paso bajo del ruido bn (t), que se relaciona con
la señal analı́tica del ruido an (t) según

bn (t) = in (t) + jqn (t) = an (t)e−j2πf0 t = (n(t) + jhn (t))e−j2πf0 t (49)

donde hn (t) era la transformada de Hilbert de n(t) (ver la primera sección del tema). Desarrollando
un poco más tenemos

in (t) + jqn (t) = (n(t) + jhn (t))(cos 2πf0 t − j sin 2πf0 t)


= [n(t) cos 2πf0 t + hn (t) sin 2πf0 t] + j [−n(t) sin 2πf0 t + hn (t) cos 2πf0 t] (50)

ası́ que identificando parte real e imaginaria llegamos a

in (t) = n(t) cos 2πf0 t + hn (t) sin 2πf0 t (51)


qn (t) = −n(t) sin 2πf0 t + hn (t) cos 2πf0 t (52)

Ahora ya podemos calcular las funciones de correlación. Empecemos por obtener Rin (t+τ, t). Para ello
recordemos las propiedades de la transformada de Hilbert, especialmente las referidas a correlación de
(9)-(11). Con esto y haciendo uso de las identidades trigonométricas habituales ya podemos hacer el
siguiente cálculo

Rin (t + τ, t) = E{in (t + τ )i∗n (τ )} (53)


= E {[n(t + τ ) cos (2πf0 (t + τ )) + hn (t + τ ) sin (2πf0 (t + τ ))]
[n(t) cos 2πf0 t + hn (t) sin 2πf0 t]}
Rn (τ ) ((
= [cos (2πf0 τ ) + (
cos (2πf
((0( (2t
((+ τ ))]
2 (
hRn (τ ) (((
− [(
sin((2πf
((0( (2t
(+ τ )) − sin (2πf0 τ )]
2
hRn (τ ) (((
+ [(
sin((2πf
((0( (2t
(+ τ )) + sin (2πf0 τ )]
2
Rn (τ ) ((
+ [cos (2πf0 τ ) − (
cos (2πf
((0( (2t
((+ τ ))]
2 (
= Rn (τ ) cos (2πf0 τ ) + hRn (τ ) sin (2πf0 τ )

50
donde comprobamos que efectivamente la autocorrelación de in (t) depende sólo de la diferencia de
tiempos τ y es por lo tanto estacionario (para ser estrictos faltarı́a verificar si la media es constante,
que lo es). No repetiremos todo el desarrollo para el resto de correlaciones, que se calculan de la misma
manera y valen

Rqn (τ ) = Rin (54)


Rin qn (τ ) = Rn (τ ) sin (2πf0 τ ) − hRn (τ ) cos (2πf0 τ ) (55)
Rqn in (τ ) = −Rin qn (τ ) (56)

Si ahora expresamos n(t) como señal paso banda, es decir

n(t) = in (t) cos 2πf0 t − qn (t) sin 2πf0 t (57)

y aplicamos el resultado de (34) podremos calcular Rn (τ ). Aplicando además los resultados en (54) y
(56) llegamos a
Rn (τ ) = Rin (τ ) cos 2πf0 τ − Rqn in (τ ) sin 2πf0 τ (58)

Llegados a este punto, lo que nos interesa ahora es ver cómo son las densidades espectrales de potencia
del ruido en fase y en cuadratura, ya que esto nos determinará la calidad de la señal recibida en cada
rama. De momento, teniendo los resultados de correlación anteriores ya podemos anticipar que

Pin = Rin (0) = Rqn (0) = Pqn (59)

y que
Pn = Rn (0) = Pin = Pqn (60)
Centrémonos pues en las densidades espectrales, empezando por la densidad espectral de la compo-
nente en fase, Sin , que vale
1
Sin (f ) = F{Rin (τ )} = Sn (f ) ∗ [δ(f − f0 ) + δ(f + f0 )] (61)
2
1
− jsign(f )Sn (f ) ∗ [δ(f − f0 ) − δ(f + f0 )]
2j
1 1 1
= [Sn (f − f0 ) + Sn (f + f0 )] − sign(f − f0 )Sn (f − f0 ) + sign(f + f0 )Sn (f + f0 )
2 2 2
1 1
= [1 − sign(f − f0 )]Sn (f − f0 ) + [1 + sign(f + f0 )]Sn (f + f0 )
2 2
1 1
= 2u(−f + f0 )Sn (f − f0 ) + 2u(f + f0 )Sn (f + f0 )
2 2
= u(−f + f0 )Sn (f − f0 ) + u(f + f0 )Sn (f + f0 )

Este resultado se ve gráficamente en la siguiente figura, donde partimos de un proceso de rudio w(t)
espectralmente blanco.

51
in (t)

DEMODULADOR
n(t)
qn (t)

w(t)

Sin (f )
Sw (f ) Sn (f )

f −f0 f0 f f

u(−f + f0 )

−f0 f0 2f0 f

u(f + f0 )

−2f0 −f0 f0 f

De forma resumida podemos escribir


(
Sn (f − f0 ) + Sn (f + f0 ) |f | < f0
Sin (f ) = Sqn (f ) = (62)
0 resto

Del mismo modo que hemos calculado Sin (f ), miremos ahora qué vale Sqn in (f ), esto es
1
Sqn in (f ) = −jsign(f )Sn (f ) ∗ [δ(f − f0 ) + δ(f + f0 )] (63)
2
1
− Sn (f ) ∗ [δ(f − f0 ) − δ(f + f0 )]
2j
j j j j
= − sign(f − f0 )Sn (f − f0 ) − sign(f + f0 )Sn (f + f0 ) + Sn (f − f0 ) − Sn (f + f0 )
2 2 2 2
j j
= [1 − sign(f − f0 )]Sn (f − f0 ) − [1 + sign(f + f0 )]Sn (f + f0 )
2 2
= j[u(−f + f0 )Sn (f − f0 ) − u(f + f0 )Sn (f + f0 )] (64)

que de modo compacto se puede reescribir como


(
j[Sn (f − f0 ) − Sn (f + f0 )] |f | < f0
Sqn in (f ) = −Sin qn (f ) = (65)
0 resto

Esto implica que si la densidad espectral de ruido a la entrada w(t) es plana como en el caso de la figu-
ra, los filtros son ideales y escogemos f0 justo en el medio del ancho de banda, entonces Sqn in (f ) = 0

52
y también Rqn in (τ )) = 0.

Por útlimo, nótese que si la frecuencia de referencia f0 se cambia, cambian también las densidades
espectrales pero no las potencias, tanto de las componentes en fase y cuadratura como de n(t), que
siguen valiendo lo mismo y son todas iguales.

53
Tema 4: Modulaciones Lineales
Antoni Morell y José López Vicario

7 de mayo de 2013

1. Concepto de modulación lineal, parámetros de interés y tipos


En este tema aplicaremos los resultados obtenidos en el tema anterior a esquemas especı́ficos y reales
de transmisión paso banda. Intuitivamente, lo que haremos es transmitir un tono puro (coseno) a
frecuencia f0 sobre el que añadiremos la información. Nos referimos a lo primero a la señal o frecuencia
portadora (es donde viaja la información deseada) y a lo segundo a la señal moduladora (nuestra
información). Habitualmente la portadora tendrá una frecuencia mucho más grande que el ancho de
banda de la señal moduladora, que está en banda base. Tenemos básicamente dos tipos de modulaciones
en función de si transmitimos la información modificando la amplitud de la señal o bien la fase, esto
es:

Modulación lineal: son modulaciones del tipo s(t) = Ac a(t) cos (2πfc t + φc ), donde claramente
la información viaja en la amplitud a(t).

Modulación angular: son modulaciones del tipo s(t) = Ac cos (2πfc t + φc + φ(t)), donde la infor-
mación está en la fase de la portadora a través de φ(t).

Parámetros de interés

Consideremos el siguiente sistema paso banda:

Ss (f )

f SR SD
BT
NR ND
TRANSMISOR +
CANAL DEMODULADOR
MODULADOR

Sn (f )
Sw (f )
w(t)

f f
BT

54
Los parámetros que determinarán lo bueno que es el sistema y por tanto de interés para el ingeniero
son

1. Ancho de banda de transmisión BT : es una caracterı́stica de eficiencia espectral. El ancho de


banda es cara y por lo tanto hay que aprovecharlo lo mejor posible, ası́ que nos interesa que BT
sea lo más pequeño posible.

2. SNR en el demodulador o destino: SN RD = SD /ND . A mayor SNR mayor calidad de la señal


demodulada, por lo tanto como mayor sea mejor. No obstante, está en contraposición a BT ,
ası́ que habrá un compromiso y una decisión a tomar.

3. Complejidad modulador/demodulador: menor complejidad implica menor coste. Esto también


está en contraposición a los otros dos parámetros, ası́ que habrá que decidir en función de las
prestaciones que se requieran.

Por último, la relación señal a ruido en recepción SN RR = SR /ND vendrá determinada por

SR SR Bx
= =γ ≤γ (1)
NR N0 BT BT

donde Bx es el ancho de banda de la señal moduladora (en las modulaciones lineales siempre BT ≥ Bx )
y γ es la SNR en destino para un sistema en banda base (lo vimos en el Tema 2). Nota: este cálculo
se ha hecho suponiendo un filtro receptor paso banda ideal con ancho de banda BT para dejar pasar
el menor ruido posible.

Tipos de modulaciones lineales

Las iremos viendo en los sucesivos apartados y son:

Modulación de amplitud (AM)

Modulación doble banda lateral (DBL)

Modulación banda lateral única (BLU)

Modulación banda lateral vestigial (BLV)

2. Modulación de amplitud (AM)


En la modulación de amplitud (la conocida AM de la radio), la señal que se transmite responde a la
expresión
sAM (t) = Ac (1 + mx(t)) cos 2πfc t (2)
donde x(t) es la señal moduladora y m es lo que llamamos ı́ndice de modulación (constante en el
tiempo y positivo).

55
Modulador

El diagrama de de bloques del modulador de AM es el de la siguiente figura.

m x(t)Ac cos 2πfc t


x(t) m sAM (t)

Ac cos 2πfc t

Ac cos 2πfc t

Analicemos ahora la modulación a partir de sus componentes en fase y cuadratura. Recordemos algunos
resultados del Tema 3:

bs (t) = is (t) + jqs (t) (3)


bs (t) = as (t)e−j2πfc t (4)
j2πfc t
s(t) = Re{as (t)} = Re{bs (t)e } = Re{(is (t) + jqs (t))(cos 2πfc t + j sin 2πfc t)} (5)
= is (t) cos 2πfc t − qs (t) cos 2πfc t

En el caso de la modulación AM e identificando componentes con (5), vemos claramente que

isAM (t) = Ac (1 + mx(t)) (6)


qsAM (t) = 0 (7)

y por lo tanto q
esAM (t) = |bsAM (t)| = i2sAM (t) + qs2AM (t) = Ac |1 + mx(t)| (8)
Ante este resultado nos podrı́amos plantear qué pasarı́a si m y x(t) fueran tales que (1 + mx(t)) ≥ 0.
Entonces la información deseada se encuentra tanto en la componente en fase como en el envolvente
de la señal, es decir, teniendo una cosa o la otra podremos extraer fácilmente x(t). Esta es la gracia
de la modulación de AM porque un circuito que recupere el envolvente de una señal es simple y por lo
tanto barato. Si consideramos que escalamos la señal moduladora para que cumpla |x(t)| < 1, entonces
necesitamos que el ı́ndice de modulación sea menor que la unidad, esto es

Dado |x(t)| < 1 −→ m≤1 (9)

En caso que m > 1 tendremos sobremodulación como muestra la siguiente figura. Esto no quiere decir
que no se pueda recuperar x(t), únicamente que no será posible a través del envolvente de la señal.

56
envolvente 1 + m x(t)

sAM (t)

x(t)
m≤1 t

m>1
envolvente

sAM (t)
sobremodulación

1 + m x(t)

Veamos ahora cuál es la densidad espectral de la señal AM. Recordemos que una señal paso banda
cualquiera s(t) será en general cicloestacionaria y que su autocorrelación media se calcula según

Ris (τ ) + Rqs (τ ) Ri q (τ ) − Rqs is (τ )


Rs (τ ) = hRs (t + τ, t)i = cos 2πfc τ + s s sin 2πfc τ (10)
2 2
tal y como vimos en el Tema 3. En el caso de la señal de AM tendremos

RisAM (τ ) A2c (1 + m2 Rx (τ ))
RsAM (τ ) = hRsAM (t + τ, t)i = cos 2πfc τ = cos 2πfc τ (11)
2 2
que únicamente es cierto si suponemos que x(t) tiene media nula (comprobadlo vosotros calculando
la autocorrelación de isAM (τ ) o RisAM (τ )) como es habitual en la práctica. A partir de aquı́ podemos
calcular la densidad espectral de potencia media de la señal AM como

A2c
SsAM (f ) = F{RsAM (τ )} = [δ(f − fc ) + δ(f + fc ) + m2 Sx (f − fc ) + m2 Sx (f + fc )] (12)
4
En la siguiente figura tenemos una representación gráfica de dicha densidad espectral.

57
Sx (f ) SsAM (f )
BT = 2Bx
Bx

f −fc fc f

En cuanto a la potencia de la modulación AM, la podemos calcular integrando la densidad espectral,


con el valor de la autocorrelación media en 0 o bien, según vimos en el Tema 3, como promedio de las
potencias en fase y cuadratura. En definitiva, PsAM vale:

Ac2
Z
PsAM = SsAM (f )df = (1 + m2 Px ) (13)
−∞ 2
Ac2
= RsAM (0) = (1 + m2 Px )
2
PisAM + PqsAM PisAM Ac2
= = = (1 + m2 Px )
2 2 2

Demodulador

A la entrada del demodulador tendremos (si el canal es muy ideal con HC (f ) = 1) la señal AM más
ruido, esto es
v(t) = sAM (t) + n(t) (14)
Tenemos básicamente dos opciones para recuperar la señal x(t), que son

Demodulador coherente

Demodulador de envolvente

Demodulador coherente

El demodulador coherente tiene el diagrama de bloques que se muestra en la siguiente figura.

v(t) = sAM (t) + n(t)

sAM (t) + w(t) iv (t) DC yD (t) = xD (t) + nD (t)


block
BT Bx

2 cos 2πfc t

Como vemos, usa la rama superior del demodulador coherente que vimos en el Tema 3 puesto que la
componente en fase es inexistente. La señal de entrada v(t) se puede expresar como

v(t) = Ac (1 + mx(t)) cos 2πfc t + in (t) cos 2πfc t − qn sin 2πfc t (15)

58
donde hemos separado el ruido paso banda n(t) en sus componentes fase y cuadratura. Agrupando
los términos relacionados con el seno por un lado y los términos relacionados con el coseno por el otro
llegamos a
v(t) = [Ac (1 + mx(t)) + in (t)] cos 2πfc t − qn sin 2πfc t (16)
y si la comparamos con la expresión general de una señal paso banda, p. ej. (5), e identificando términos
vemos que v(t) tiene como componente en fase

iv (t) = Ac (1 + mx(t)) + in (t) (17)

y como componente en cuadratura qv (t) = qn (t) . En el demodulador coherente recuperamos justa-


mente la componente en fase. No obstante, falta eliminar la componente de contı́nua para recuperar el
espectro de x(t) (ver la figura de densidad espectral de la señal AM). Por esto añadimos un bloqueador
de continua, a la salida del cual tenemos la señal demodulada xD (t) y el ruido en destino nD (t), que
valen

xD (t) = Ac m x(t) (18)


nD (t) = in (t) (19)

Demodulador de envolvente

El esquema de bloques del demodulador de envolvente es el de la siguiente figura.

v(t) = sAM (t) + n(t) Demodulador DC


yD (t) = xD (t) + nD (t)
envolvente block

En un primer bloque extraemos el envolvente de la señal y acto seguido bloqueamos la componente de


continua. Veamos primero la señal que tendremos a la salida del demodulador de envolvente, que es
p p
ev (t) = i2v (t) + qv2 (t) = [Ac (1 + m x(t)) + in (t)]2 + qv2 (t) (20)

Como vemos, hay que tener cierto cuidado ya que el envolvente de la suma de dos señales (deseada y
ruido) no es la suma de sus envolventes. Además, hay que tener en cuenta que para poder recuperar la
señal x(t) a partir del envolvente ev (t) es necesario que ambas señales sean proporcionales. Saquemos
factor común del término Ac (1 + m x(t)) de la expresión anterior para obtener
s 2  2
in (t) qn (t)
ev (t) = Ac (1 + m x(t)) 1+ + (21)
Ac (1 + m x(t)) Ac (1 + m x(t))
in (t) qn (t)
Si definimos a = Ac (1+m x(t)) yb= Ac (1+m x(t)) , entonces
p
(1 + a)2 + b2
ev (t) = Ac (1 + m x(t)) (22)
p
Teniendo en cuenta que podemos hacer la aproximación (1 + a)2 + b2 ≈ 1+a cuando a  1 y b  1,
entonces
ev (t) ≈ Ac (1 + m x(t)) + in (t) (23)

59
Nótese que las condiciones de cumplimiento de la aproximación se resumen en una SNR alta. A la
práctica necesitaremos que sea superior a 10dB para poder considerarla como tal y en ese caso obte-
nemos exactamente la misma señal (tanto en términos de señal deseada como en términos de ruido)
que usando el demodulador coherente.

Por último, es necesario colocar un bloqueador de continua igual que en el demodulador coherente
que elimine la parte de continua, que tiene amplitud Ac . Por lo tanto a la salida de este bloque nos
quedaremos con yD (t) = Ac m x(t) + in (t).

SNR en destino

Una vez hemos analizado las componentes de señal deseada y ruido en la señal demodulada en AM,
que coinciden en el demodulador coherente y el de envolvente si la SNR es superior a 10dB, veamos
ahora cuánto vale la SNR en demodulación, esto es

SD A2 m2 Px
SN RD = = c (24)
ND Pin

Ahora tenemos en cuenta el resultado del tema anterior que nos dice Pn = Pin = Pqn = N0 BT y
también que la potencia de la señal AM (el equivalente de la potencia en recepción SR en banda base)
2
es PsAM = SR = A2c (1 + m2 Px ). De aquı́ podemos aislar A2c y usar el resultado para reescribir la
SN RD como
2SR
1+m2 Px
m2 Px 2SR m2 Px m2 Px
SN RD = = = γ (25)
N0 BT (1 + m2 Px )N0 2Bx 1 + m2 Px
donde recordemos que γ = NS0RBx es la SNR en destino de un sistema en banda base. Por lo tanto,
podemos concluir que la relación SNR en destino en AM es siempre inferior a la SNR en destino de
un sistema de transmisión en banda base con las mismas condiciones de potencia transmitida y ruido.
Nótese que parte de la potencia se usa en la transmisión de un tono puro que luego se convierte en la
componente de continua y que por consiguiente es desaprovechada.

3. Modulación doble banda lateral (DBL)


La señal transmitida en doble banda lateral responde a la expresión

sDBL (t) = Ac x(t) cos 2πfc t (26)

Modulador

El diagrama de bloques del modulador DBL es el de la figura siguiente y consiste únicamente en el


producto por la portadora.

60
x(t) sDBL (t)

Ac cos 2πfc t

Analicemos a continuación la modulación a través de sus componentes en fase y cuadratura ası́ como
su envolvente, que valen

isDBL (t) = Ac x(t) (27)


qsDBL (t) = 0 (28)
q
esDBL (t) = i2sDBL (t) + qs2DBL (t) = Ac |x(t)| (29)

Si nos fijamos en la envolvente nos daremos cuenta que no la podemos usar con un demodulador de
envolvente ya que es proporcional a |x(t)| y no a x(t).

Calculemos ahora su autocorrelación media a partir de la expresión general vista en el Tema 3 y


rescatada en (10), esto es
RisDBL A2c Rx (τ )
RsDBL (τ ) = hRsDBL (t + τ, t)i = cos 2πfc τ = cos 2πfc τ (30)
2 2
A partir de este resultado podemos obtener la densidad espectral de la señal como

A2c A2
SsDBL (f ) = F{RsDBL (τ )} = Sx (f ) ∗ [δ(f − fc ) + δ(f + fc )] = c [Sx (f − fc ) + Sx (f + fc )] (31)
4 4
y por lo tanto es como la señal de AM pero sin la componente de continua, ası́ que el ancho de banda
de transmisión es BT = 2Bx (ver la figura siguiente).

Sx (f ) SsDBL (f )
BT = 2Bx
Bx

f −fc fc f

Por último, calculemos la potencia de la señal DBL como


Z ∞
A2
PsDBL = SsDBL (f )df = c Px (32)
−∞ 2
A 2
= RsDBL (0) = c Px
2
PisDBL + PqsDBL PisDBL A2 Px
= = = c
2 2 2

61
Demodulador

Analicemos ahora el demodulador de DBL, que responde al diagrama de bloques de la siguiente figura.

v(t) = sDBL (t) + n(t)

sDBL (t) + w(t) iv (t)

BT Bx

2 cos 2πfc t

Se trata, por lo tanto, de un demodulador coeherente que recoge sólo la componente en fase, exacta-
mente igual al demodulador coherente que hemos usado para AM. La única diferencia es que ahora
no necesitamos el bloqueo de continua porque no hay ninguna componente de continua superpuesta a
la señal deseada. Igual que en el caso de AM con demodulador coherente, la señal demodulada será la
componente en fase iv (t) = yD (t) = xD (t) + nD (t), donde la parte de señal y de ruido valen ahora

xD (t) = Ac x(t) (33)


nD (t) = in (t) (34)

SNR en destino

En este caso, la SNR en destino vale

SD A2 Px A2 P x
SN RD = = c = c (35)
ND P in N0 BT
2
Si tenemos en cuenta que BT = 2Bx junto con SR = PsDBL = A2c Px ( que nos permite poner A2c en
función de SR ) y lo usamos en la expresión anterior, llegamos a
SD 2SR
SN RD = = =γ (36)
ND 2N0 Bx
Por lo tanto, con DBL obtenemos la misma SNR en destino que con un sistema de transmisión en
banda base (por una misma potencia de transmisión SR y un mismo nivel de ruido N0 ).

4. Modulación banda lateral única (BLU)


Hemos empezado este tema con la modulación AM. Su gran ventaja era que se podı́a implementar
fácilmente a través del demodulador de envolvente. El incoveniente era que se desperdiciaba potencia
en la transmisión de un tono puro a fc . Esto se ha solucionado con la modulación en DBL. No
obstante, el ancho de banda de transmisión es algo que se puede mejorar, ya que tanto en AM como
en DBL hemos empleado el doble del mı́nimo necesario, que deberı́a ser Bx . En banda lateral única

62
(BLU) perseguimos ese objetivo. Si miramos el espectro de la señal DBL nos damos cuenta de que
la información está duplicada en dos bandas laterales (a ambos lados de fc ). Intentaremos, pues,
transmitir una sola de ellas. Puede ser la de frecuencia inferior a fc o bien la de frecuencia superior.
En el primer caso hablamos de BLU-I (la I es de inferior) y en el segundo de BLU-S (la S es de
superior). En la siguiente figura vemos esto gráficamente.

BT = 2Bx

BLU-S BLU-I BLU-I BLU-S

−fc fc f

Modulador

En los casos anteriores hemos planteado la señal a transmitir y a partir de allı́ hemos analizado la
modulación en sı́. En esta ocasión partimos del espectro que queremos conseguir y veremos qué señal
hay que transmitir y cómo conseguirla. Está claro que la señal será la de DBL eliminando una de las
dos bandas laterales. Desde el dominio temporal no sabemos muy bien como conseguirlo por ahora,
pero si pensamos desde el punto de vista frecuencial es muy simple ya que únicamente hay que eliminar
la banda lateral que no queremos. Por lo tanto, el esquema del modulador deberá responder al de la
siguiente figura.

sDBL (t)
x(t) sBLU −S (t)

fc

Ac cos 2πfc t

En este caso el filtro es paso alto con frecuencia de corte fc y serı́a para banda lateral superior. Para
BLU-I necesitarı́amos un filtro paso bajo con frecuencia de corte fc que se quedarı́a con la banda
inferior. Centrémonos primero en BLU-S, donde el filtro paso alto ideal se puede escribir como

HBLU −S (f ) = u(f − fc ) + u(−f − fc ) (37)

A fin de simplificar el análisis y ver cómo son las componentes en fase y cuadratura de la modulación,
supongamos primero que x(t) es una señal determinista. Esto nos permitirá trabajar directamente
con las transformadas de Fourier de las señales sin necesidad de pasar por su densidad espectral 1 y
1
Recordad que la transformada de Fourier de un proceso no nos aporta mucha información ya que es variante en el
tiempo y por eso no la empleamos.

63
luego ya volveremos a las densidades espectrales. Con el fin de no confundir densidad espectral con
espectro de la señal BLU denotaremos el primero como SsBLU como hasta ahora y el segundo como
SBLU . Hecho este apunte, miremos qué vale el espectro de nuestra señal sBLU −S (t), esto es

SBLU −S (f ) = SDBL (f )HBLU −S (f ) (38)


Ac
= [X(f − fc ) + X(f + fc )] · [u(f − fc ) + u(−f − fc )]
2
Ac
= [X(f − fc )u(f − f c) + X(f + fc )u(−f − f c)]
2
como puede comprobarse en la siguiente figura.

u(−f − fc ) u(f − fc )
|X(f + fc )| |X(f − fc )|

−fc fc f

Ahora podemos obtener la señal BLU temporal haciendo la transformada inversa y nos queda
Ac h i
sBLU −S (t) = (x(t) ∗ F −1 {u(f )})ej2πfc t + (x(t) ∗ F −1 {u(−f )})e−j2πfc t (39)
2
n o
j j
Sabiendo que F{u(t)} = 21 δ(f )− 2πf , por dualidad tenemos que F 21 δ(t) − 2πt = u(−f ) y aplicando
la npropiedad de cambio
o de nescala (por o un factor −1,
 es  decir, una reflexión en realidad) llegamos a
1 j 1 j 1 −f
F 2 δ(−t) − 2π(−t) = F 2 δ(t) + 2πt = |−1| u −1 = u(f ) 2 . Aplicando estos resultados a la
ecuación anterior podemos escribir
Ac h i
sBLU −S (t) = (x(t) + jhx (t))ej2πfc t + (x(t) − jhx (t))e−j2πfc t (40)
4
Ac
= [x(t) cos 2πfc t − hx (t) sin 2πfc t]
2
La señal sBLU −I (t) se puede obtener del mismo modo o bien fijándonos que sBLU −I (t) = sDBL (t) −
sBLU −S (t), llegando a
Ac
sBLU −I (t) = Ac x(t) cos 2πfc t − [x(t) cos 2πfc t − hx (t) sin 2πfc t] (41)
2
Ac
= [x(t) cos 2πfc t + hx (t) sin 2πfc t]
2
2
Otra forma de ver la segunda identidad, aunque quizá más complicada, es a partir de la relación F{z(−t)} = Z ∗ (f ),
válida únicamente paraz(t) real. Ası́, a partir de la transformada conocida de u(t) podemos afirmar que F{u(−t)} =
 ∗
∗ 1 j
U (f ) = 2 δ(f ) − 2πf , ya que u(t) es real. Ahora sólo nos queda aplicar dualidad sobre esta última relación para
∗ j
llegar a F {U (t)} = u(−(−f )), es decir, F 12 δ(t) + 2πt

= u(f ). Por último, una tercera vı́a para encontrar u(f ) es
observando que 2u(f ) = 1 + sign(f ) y anti-transformando el conjunto (la función signo en tiempo tiene transformada
conocida y basta con aplicar dualidad junto con sign(−f ) = −sign(f ) ya que se trata de una función impar).

64
De esto deducimos que las componentes en fase y cuadratura en modulaciones BLU valen
Ac
isBLU = x(t) (42)
2
Ac
qsBLU = ± hx (t) (43)
2
habiendo un + en la componente en cuadratura para BLU-S y un - para BLU-I.

Habrı́amos podido sacar el mismo resultado trabajando directamente con los equivalentes paso bajo
de las señales DBL y BLU-S que son la entrada y salida del filtro HBLU −S (f ), respectivamente.
Matemáticamente tenemos la siguiente relación
1
bsBLU −S (t) = bsDBL (t) ∗ bhBLU −S (t) (44)
2
El equivalente paso bajo de la señal DBL ya lo conocemos y vale bsDBL (t) = isDBL (t) + jqsDBL (t) =
Ac x(t). Para calcular el equivalente paso bajo del filtro, miramos primero su señal analı́tica en fre-
cuencia, que vale AHBLU −S (f ) = 2u(f − fc ), y luego la desplazamos fc hacia el origen para obtener
j
BHBLU −S (f ) = 2u(f ), ası́ que anti-transformando llegamos a bhBLU −S (t) = δ(t) + πt . Volviendo a lo
que nos ocupa, tenemos
 
1 j Ac
bsBLU −S (t) = Ac x(t) ∗ δ(t) + = (x(t) + jhx (t)) (45)
2 πt 2
es decir, lo que ya habı́amos obtenido antes.

Consideremos ahora x(t) como proceso aleatorio estacionario y obtengamos la autocorrelación media
y la densidad espectral de potencia media de la señal BLU. Empecemos por lo primero usando el
resultado de (10), con lo que llegamos a
A2c A2
RsBLU (τ ) = hRsBLU (t+τ, t)i = (Rx (τ )+Rhx (τ )) cos 2πfc τ ± c (Rxhx (τ )−Rhx x (τ )) sin 2πfc τ (46)
8 8
Recordando que Rhx (τ ) = Rx (τ ), Rxhx (τ ) = −hRx (τ ), Rhx x (τ ) = hRx (τ ) y simplificando la expresión
llegamos finalmente a
A2c
RsBLU (τ ) = (Rx (τ ) cos 2πfc τ ∓ hRx (τ ) sin 2πfc τ ) (47)
4
donde el signo superior es para BLU-S y el signo inferior para BLU-I.

La densidad espectral de potencia media se calcula a partir de la autocorrelación media como


A2c
SsBLU (f ) = F{RsBLU (τ )} = Sx (f ) ∗ [δ(f − fc ) + δ(f + fc )] (48)
8
A2c 1
∓ (−j sign(f )Sx (f )) ∗ [δ(f − fc ) − δ(f + fc )]
4 2j
A2c
= (Sx (f − fc ) + Sx (f + fc ) ∓ [−sign(f − fc )Sx (f − fc ) + sign(f + fc )Sx (f + fc )])
8
A2c
= ([1 ± sign(f − fc )] Sx (f − fc ) + [1 ∓ sign(f + fc )]Sx (f + fc ))
8

65
donde el signo superior corresponde a BLU-S y el signo inferior a BLU-I.

Por último, calculemos la potencia de la señal BLU como


Z ∞
A2
PsBLU = SsBLU (f )df = c Px (49)
−∞ 4
A 2
= RsBLU (0) = c Px
4
A2c Px A2c Px
PisBLU + PqsBLU + A2c
= = 4 4
= Px
2 2 4
Para ver la primera igualdad hay que fijarse en que la expresión [1 ± sign(f − fc )] Sx (f − fc ) + [1 ∓
sign(f + fc )]Sx (f + fc ) corresponde a seleccionar una banda lateral de Sx (f ) y multiplicarla por 2
como podemos apreciar en la siguiente figura. En la tercera igualdad hemos usado uno de los resultados
vistos en el Tema 3 que nos dice Px = Phx .

SsBLU −S (f )

Sx (f + fc ) Sx (f − fc )

−fc fc f

Demodulador

El demodulador para BLU es exactamente igual que el de DBL ya que la información se encuentra
en la componente en fase (ver figura). La única diferencia es que el filtro paso banda de entrada debe
tener un ancho de banda Bx y seleccionar una de las bandas laterales (superior o inferior en función
de como sea la señal transmitida).

v(t) = sBLU (t) + n(t)

sBLU (t) + w(t) iv (t)

Bx Bx

2 cos 2πfc t

Igual que en el caso deDBL, la señal demodulada será la componente en fase iv (t) = yD (t) = xD (t) +

66
nD (t), donde la parte de señal y de ruido valen ahora

Ac
xD (t) = x(t) (50)
2
nD (t) = in (t) (51)

SNR en destino

En este caso, la SNR en destino vale

SD A2 P x A2c Px
SN RD = = c = (52)
ND 4Pin 4N0 BT
2
Si tenemos en cuenta que BT = Bx junto con SR = PsBLU = A4c Px ( que nos permite poner A2c en
función de SR ) y lo usamos en la expresión anterior, llegamos a

SD 4SR
SN RD = = =γ (53)
ND 4N0 Bx
Por lo tanto, con BLU obtenemos la misma SNR en destino que con un sistema de transmisión en
DBL o en banda base (por una misma potencia de transmisión SR y un mismo nivel de ruido N0 )
pero empleamos el mı́nimo ancho de banda necesario que es Bx .

5. Modulación banda lateral vestigial (BLV)


La modulación en banda lateral vestigial es parecida a la BLU pero ahora no somos tan estrictos y
no seleccionamos una banda lateral únicamente sino que permitimos, además, un vestigio de la banda
eliminada. Como veremos luego, esto tiene una importante aplicación práctica y es poder usar un
detector de envolvente si transmitimos la señal junto con una portadora como ya hicimos en AM.
Como sucede en BLU, podemos tener BLV-S o bien BLV-I. Nosotros nos centraremos en BLV-S, pero
de forma semejante podrı́amos analizar BLV-I. Como hemos dicho, el objetivo de eta modulación es
conseguir una señal (en espectro) como la que se muestra en la figura siguiente.

Sx (f ) SsBLV −S (f )
|HV (f )|
Bx

vestigio

f −fc fc f

Modulador

El modulador de BLV es semejante al de BLV con la diferencia que ahora no aplicamos un filtro ideal
que seleccione una de las bandas laterales sino que colocamos un filtro HV (f ) (ver figura anterior) que
dará lugar al vestigio. La siguiente figura contiene el diagrama de bloques del modulador BLV.

67
sDBL (t)
x(t) HV (f ) sBLV −S (t)

Ac cos 2πfc t

Analizaremos la modulación BLV empleando el equivalente paso bajo, de forma que podemos escribir
1
bsBLV −S (t) = bsDBL (t) ∗ bhv (t) (54)
2
Como hicimos en el caso de BLU, el equivalente paso bajo del filtro lo hallaremos a nivel frecuencial
y corresponde a la siguiente figura, que la interpretaremos como suma de una señal constante en
frecuencia J(f ) = 1 y una señal G(f ) impar parecida a la función signo pero diferente alrededor del
origen, es decir HV (f ) = 1 + G(f ), para dar lugar a la forma que apreciamos en la figura. Por otro

BHV (f )

lado, ya hemos visto en el caso de BLU que

bsDBL (t) = Ac x(t) (55)

ası́ que
1 1 1
bsBLV −S (t) = Ac x(t) ∗ (δ(t) + g(t)) = Ac x(t) + Ac x(t) ∗ g(t) (56)
2 2 2
Como G(f ) es anti-hermı́tica, esto es, G(f ) = −G∗ (−f ) (simetrı́a impar en parte real y par en parte
imaginaria, que en el caso que nos ocupa es nula), por las propiedades de simetrı́a de la transformada de
Fourier podemos afirmar que g(t) será imaginaria pura. Para remarcar esto escribiremos g(t) = jhq (t),
donde hq (t) es la parte imaginaria de g(t) y no tiene nada que ver con la transformada de Hilbert.
Aparte, ya nos va bien que g(t) sea imaginaria pura porque nos generará la componente en cuadratura
de la señal BLV. Ası́ pues
1
bsBLV −S (t) = Ac (x(t) + jx(t) ∗ hq (t)) (57)
2
Nótese que si g(t) = jhq (t) (equivalentemente jg(t) = −hq (t)), en frecuencia tenemos Hq (f ) = −jG(f )
y por lo tanto se trata de un filtro que aproxima la transformación de Hilbert (aunque diferente
alrededor del origen) como muestra la figura siguiente.

68
Hq (f )

Hilbert

−j

A partir del equivalente paso bajo, podemos escribir la señal modulada en BLV-S como
sBLV −S (t) = isBLV −S (t) cos 2πfc t − qsBLV −S (t) sin 2πfc t (58)
Ac Ac
= x(t) cos 2πfc t − x(t) ∗ hq (t) sin 2πfc t
2 2
y por lo tanto podremos recuperar la señal moduladora a partir de la componente en fase de la señal
isBLV −S (t), que es proporcional a x(t).

A nivel espectral, veremos sólo el espectro de la señal BLV-S suponiendo que x(t) es determinista.
Esto ya nos sirve para el análisis posterior y hay que tener en cuenta que para encontrar resultados
más detallados deberı́amos conocer la respuesta del filtro con que trabajamos. Ası́ pues, si partimos
del esquema del modulador, podemos decir que
 
Ac
SBLV −S (f ) = SDBL (f )HV (f ) = X(f ) ∗ [δ(f − fc ) + δ(f + fc )] HV (f ) (59)
2
Ac
= (X(f − fc ) + X(f + fc )) HV (f )
2

Demodulador

El demodulador de BLV es el mismo que el de BLU como se puede ver en la siguiente figura, aunque el
filtro paso banda de entrada debe tener el ancho de banda suficiente para dejar pasar la banda lateral
y su vestigio.

v(t) = sBLV (t) + n(t)

sBLV (t) + w(t) iv (t)

BT Bx

2 cos 2πfc t

Analicemos a continuación las señales que aparecen en el demodulador a nivel frecuencial. A la entrada
del filtro paso bajo tendremos
Ac Ac
(X(f − 2fc ) + X(f ))HV (f − fc ) + (X(f ) + X(f + 2fc ))HV (f + fc ) (60)
4 4

69
Luego, a la salida del mismo filtro tendremos
Ac
X(f )(HV (f − fc ) + HV (f + fc )) (61)
4
Estudiemos este resultado con la ayuda del gráfico siguiente. Vemos que la suma de filtros desplazados
da una respuesta constante (siempre que HV (f ) sea simétrico) y por lo tanto permite recuperar la
señal sin distorsionarla a partir de su componente en fase como ya habı́amos anticipado antes. En la
práctica esta condición no suele darse en emisión y se usan filtros en recepción que permiten cumplir
este criterio y demodular correctamente.

Bx
HV (f − fc )
HV (f + fc )

Sx (f )

Para cerrar esta sección, cabe destacar que a la práctica se puede enviar una portadora de baja potencia
que se usa para sincronizar el oscilador local del receptor. En este caso, además, si la portadora tiene
cierto nivel de potencia es posible utilizar un demodulador de envolvente para recuperar la señal. Esto
es lo que se usaba en la televisión analógica para poder fabricar receptores baratos. La modulación
BLV-S con portadora responde a

sBLV −S+port (t) = Ac (1 + µ x(t)) cos 2πfc t − Ac µ qsBLV −S (t) sin 2πfc t (62)

y su envolvente vale
s
2
µ qsBLV −S (t)
q 
esBLV −S+port (t) = A2c (1 + µ x(t))2 + A2c µ2 qs2BLV −S (t) = Ac (1 + µ x(t)) 1+ (63)
1 + µ x(t)
µq 2
sBLV −S (t)
Vemos que el término 1+µ x(t) nos está introduciendo distorsión en la señal. Para que sea des-
preciable nos interesa que µ  1 o bien que qsBLV −S (t) sea pequeña. Nótese que qsBLV −S (t) depende
del filtro vestigial y a la práctica nos interesa que el vestigio sea ancho espectralmente (como máximo
puede llegar a Bx , momento en el que tendrı́amos el ancho de banda de DBL). Por lo tanto, hay un
compromiso entre calidad de la señal y ancho de banda empleado.

En este caso no calcularemos la SNR en demodulación ya que depende del filtro vestigial que usemos.
No obstante, el procedimiento serı́a el mismo que hemos empleado en las otras modulaciones. Si usamos
detección de envolvente, tendrı́amos el mismo resultado que en AM.

6. Aplicación de las modulaciones: multiplexación en frecuencia


Para terminar este tema, hablaremos de una de las aplicaciones tı́picas de las modulaciones, la mul-
tiplexación en frecuencia, que nos permite transmitir varias señales a la vez en zonas frecuenciales

70
distintas. Es lo que sucedı́a en la transmisión de televisión analógica para combinar la señal de au-
dio con la de video. En la siguiente figura tenemos un ejemplo de modulador y demodulador para
tres señales distintas. Vemos que primero las multiplexamos a una frecuencia intermedia y luego las
subimos a la banda de transmisión. En la figura vemos el diagrama de bloques de transmisor y receptor.

Sx1 (f )

BLU-S

f1 f fc1

Sx2 (f )

sLP (t)
MODULADOR sBP (t)
BLU-S PORTADORA

f2 f
fc2
Sx3 (f )

BLU-S

f3 f
fc3

SsLP (f )

f1 f2 f3
f

DEM x1 (t)
BLU-S

sBP (t) DEMODULADOR DEM x2 (t)


PORTADORA BLU-S

DEM x3 (t)
BLU-S

Observaciones:

Dejar bandas de guarda entre sistemas para poder separar bien las señales con filtros reales.

Las no linealidades que puedan tener los elementos del sistema pueden inducir “crosstalk”, es
decir, que parte de una señal se mezcle con la otra.

71
Tema 5: Modulaciones Angulares
Antoni Morell y José López Vicario

7 de mayo de 2013

1. Concepto de modulación angular: motivación, modulación de fase


(PM) y modulación de frecuencia (FM)
En el tema anterior hemos visto las modulaciones lineales en las que la información se insertaba en la
amplitud de la señal. Las modulaciones angulares, por contra, persiguen insertar la información en la
fase de la señal. ¿Qué motivación hay detrás de esta idea, teniendo en cuenta que se requieren sistemas
más complejos? En un primer momento se pensó que con esta solución se podrı́a reducir el ancho de
banda de la señal transmitida. No obstante, como veremos luego, esto no se consiguió. Por otro lado,
se pensó que estas técnicas tendrı́an gran ventaja sobre sistemas no lineales y esta sı́ que es una de las
grandes virtudes de las señales moduladas angularmente. Consideremos el siguiente sistema no lineal
con la señal de entrada z(t) = x(t) cos (2πfc t + φ(t)).

z(t) SNL y(t) = a1 z(t) + a2 z 2 (t) + a3 z 3 (t)

En estas condiciones, la señal a la salida del SNL es

y(t) = a1 x(t) cos (2πfc t + φ(t)) + a2 x2 (t) cos2 (2πfc t + φ(t)) + a3 x3 (t) cos3 (2πfc t + φ(t)) (1)
 
1 3 1
= a2 x (t) + a1 x(t) + a3 x (t) cos (2πfc t + φ(t)) + a2 x2 (t) cos (2π2fc t + 2φ(t))
2 3
2 4 2
1
+ a3 x3 (t) cos (2π3fc t + 3φ(t))
4
y por lo tanto, nos aparecerá distorsión incluso filtrando en el ancho de banda de la señal, en cuyo
caso nos quedarı́amos con la señal
 
3
s(t) = a1 x(t) + a3 x3 (t) cos (2πfc t + φ(t)) (2)
4

No obstante, es la amplitud la que se ve afectada pero no la fase. Ası́ pues, si empleamos modulaciones
angulares podremos utilizar amplificadores no lineales y cualquier dispositivo no lineal en general sin
ningún problema. Esto es una gran ventaja a la práctica.

72
1.1. Señal paso banda modulada angularmente s(t)
De forma general, escribiremos las modulaciones angulares como
n o
s(t) = Ac cos (2πfc t + φ(t)) = Re Ac ej(2πfc t+φ(t)) (3)

donde φ(t) será una función del mensaje a transmitir x(t), esto es, φ(t) = f (x(t)). Nótese que si
identificamos la expresión anterior con la expresión genérica de una señal paso banda en función de

su equivalente paso bajo bs (t) referenciado a fc , es decir, s(t) = Re bs (t)ej2πfc t , vemos claramente
que en este caso bs (t) = Ac ejφ(t) = Ac cos φ(t) + jAc sin φ(t). Por lo tanto, la componente en fase de la
modulación es is (t) = Ac cos φ(t) y la componente en cuadratura es qs (t) = Ac sin φ(t), ası́ que
p
es (t) = Ac = i2s (t) + qs2 (t) (4)
ϕs (t) = 2πfc t + φ(t), ϕbs (t) = φ(t) (5)
Pis + Pqs A 2 
Ps = = c E{cos2 φ(t)} + E{sin2 φ(t)} (6)
2 2
A2c A2
= E{cos2 φ(t) + sin2 φ(t)} = c
2 2
Nótese que dado que son señales de envolvente constante, cuando se utilice un dispositivo no lineal el
punto de trabajo será siempre el mismo.

Por último, nos preguntamos cuál será el ancho de banda de una modulación angular. Para ello,
tomemos la componente en fase de la señal (podemos hacer algo parecido para la componente en
cuadratura) y desarrollemos en serie de Taylor el coseno alrededor del origen, obteniendo ası́
1 2 1
cos φ(t) = 1 − φ (t) + φ4 (t) − . . . (7)
2! 4!
Si φ(t) tiene ancho de banda B, entonces φ2 (t) = F −1 {Φ(f ) ∗ Φ(f )}, tendrá ancho de banda 2B
y ası́ sucesivamente. Con este primer análisis ya nos damos cuenta que vamos sumando términos
con ancho de banda creciente, ası́ que de forma general la señal paso banda modulada angularmente
tendrá un ancho de banda que tiende a infinito. Está claro que esto no es práctico y en breve veremos
cómo conseguir modulaciones angulares de banda estrecha, entendiendo aquı́ por banda estrecha que
el ancho de banda de la señal sea mucho menor que la frecuencia portadora fc .

1.2. Modulación de fase (PM)


En la modulación de fase, existe proporcionalidad entre la fase de la señal y el mensaje a transmitir
x(t). Esto es,
φ(t) = φ∆ x(t) (8)
donde φ∆ es la sensibilidad de fase medida en rad/V. Si partimos de la condición |x(t)| ≤ 1, entonces
es necesario que φ∆ ≤ π. Esto evita ambigüedad de fase, ya que de lo contrario existe la posibilidad
que dos valores diferentes de x(t) den lugar al mismo valor de fase, haciendo imposible recuperar la
información. Por poner un ejemplo muy simple, imaginemos que φ∆ = 2π. Si x(t1 ) = 0 y x(t2 ) = 1,

73
entonces φ(t1 ) = φ(t2 ) y sin embargo el valor transmitido ha sido distinto. En definitiva, una señal
paso banda modulada en fase responde a la expresión

sP M (t) = Ac cos (2πfc t + φ∆ x(t)) (9)

y su frecuencia instantánea vale

1 ∂ϕsP M (t) φ∆ ∂x(t)


fsP M (t) = = fc + (10)
2π ∂t 2π ∂t

1.3. Modulación de frecuencia (FM)


En este caso la información se introduce en la frecuencia instantánea de la señal como

fsF M (t) = fc + f∆ x(t) (11)

y por lo tanto la frecuencia instantánea de la señal es proporcional al mensaje una vez añadido un
offset fc para poder trasladarla a la banda deseada. Llamaremos f∆ sensibilidad en frecuencia, que
se medirá en Hz/V, y definiremos ∆f como la desviación máxima en frecuencia, que por lo tanto
será f∆ máx |x(t)|. Por lo tanto, la frecuencia instantánea de la señal tomará valores

fsF M (t) ∈ [fc − ∆f, fc + ∆f ] (12)

pero cuidado, esto no es el ancho de banda de la señal FM.

Por último, dada la frecuencia instantánea de la señal FM, podemos encontrar su fase integrando la
frecuencia como
Z t
ϕsF M (t) = 2πfc t + ϕbsF M (t) = 2πfc t + 2πf∆ x(λ)dλ + φ(t0 ), t ≥ t0 (13)
t0

Es fácil comprobar que derivando esta expresión y dividiendo por 2π se obtiene justamente (11). De
ahora en adelante, supondremos que escogemos un instante t0 tal que su fase φ(t0 ) = 0 y escribiremos
de modo más compacto la fase de la señal FM como
Z t
ϕsF M (t) = 2πfc t + 2πf∆ x(λ)dλ (14)

y por lo tanto la señal FM tomará la siguiente expresión


 Z t 
sF M (t) = Ac cos 2πfc t + 2πf∆ x(λ)dλ (15)

Nótese que dada la relación derivada-integral entre las modulaciones PM y FM, se puede obtener
cualquiera de ellas a partir de un único modulador como muestra la siguiente figura. En otras palabras,
si tuviéramos un modulador FM podrı́amos generar la señal FM de forma directa y la señal PM
derivándola previamente. Lo mismo si tuviéramos un modulador de PM, sólo que esta vez deberı́amos
integrar el mensaje para proporcionar la fase adecuada al modulador y ası́ llegar a la señal FM.

74
∂ Modulador
x(t) () sP M (t)
∂t FM

! t
Modulador
x(t) ( )dλ sF M (t)
PM

2. Modulación angular de banda estrecha


Diremos que estamos ante una modulación angular de banda estrecha cuando |φ(t)|  1 rad (nosotros
consideraremos |φ(t)| ≤ 0, 3 rad). Ante esta situación, podremos hacer las siguientes aproximaciones

cos φ(t) ≈ 1
sin φ(t) ≈ φ(t)

cometiendo un error razonablemente pequeño. En estas condiciones, la señal toma un aspecto que
puede recordar la señal de AM

sF M (t) = Ac cos 2πfc t − Ac φ(t) sin 2πfc t (16)

y cuyo ancho de banda de transmisión es BT = 2B.

Ejemplo: x(t) = Am cos 2πfm t (tono único) modulado en FM

En este caso tenemos


 Z t   
Am f∆
sF M (t) = Ac cos 2πfc t + 2πf∆ x(λ)dλ = Ac cos 2πfc t + sin 2πfm t (17)
fm

y definiremos β = Am f∆
fm como ı́ndice de modulación. Nótese que determina la desviación máxima de
fase respecto a 2πfc t que puede haber (que se dará cuando el seno valga 1) y por lo tanto, de acuerdo
con la condición de banda estrecha, requeriremos β ≤ 0, 3. Usando este parámetro, las aproximaciones
de banda estrecha que acabamos de citar y desarrollando el coseno de la suma, expresamos la señal
FM resultante como

sF M (t) = Ac cos 2πfc t − Ac β sin 2πfm t sin 2πfc t (18)


Ac β Ac β
= Ac cos 2πfc t + cos 2π(fc + fm )t − cos 2π(fc − fm )t
2 2
Por lo tanto, la densidad espectral de la señal FM resultante será muy parecida a la que hubiéramos
obtenido modulando en AM. En la siguiente figura se ven los espectros (transformada de Fourier, no
densidad espectral) de ambas.

75
SF M (f ) SAM (f )

fc − fm

fc fc + fm fc − fm fc fc + fm

BT = 2fm

Si analizamos la modulación en detalle vemos que


q p
esF M (t) = i2sF M (t) + qs2F M (t) = Ac 1 + φ2 (t) 6= cte (19)
qsF M (t)
ϕbsF M = arctan = arctan φ(t) 6= φ(t) (20)
isF M (t)

Por lo tanto perdemos la ventaja de tener un envolvente constante ante sistemas no-lineales y además,
la fase de la señal modulada dejará de ser la requerida. No obstante, si φ(t) es pequeño como hemos
supuesto, entonces el módulo será prácticamente constante y trabajaremos alrededor de la zona lineal
del arcotangente, ası́ que el error producido será pequeño.

Por último, comentar que la modulación FM de banda estrecha se podrı́a obtener mediante el siguiente
diagrama de bloques.

! t
x(t) 2πf∆ ( )dλ sF M (t)

π/2 Ac cos 2πfc t

3. Caracterı́sticas espectrales de las señales moduladas angularmen-


te
Estudiaremos el contenido espectral de una señal FM a través de un ejemplo muy simple a partir
del cual podremos extrapolar a una señal más genérica. Consideremos pues una frecuencia pura como
mensaje (una señal cualquiera se podrá interpretar como suma de múltiples cosenos):

x(t) = Am cos 2πfm t (21)

Si modulamos esta señal en FM, la fase del equivalente paso bajo de la señal será
Z t
Am f∆
φ(t) = Am 2πf∆ cos 2πfm λtdλ + φ(t0 ) = [sin 2πfm t − sin 2πfm t0 ] + φ(t0 ), t ≥ t0 (22)
t0 fm

76
Por simplicidad escogemos φ(t0 ) = Am f∆
fm sin 2πfm t0 y definimos β =
A m f∆
fm , con lo que la fase ins-
tantánea de la señal (equivalente paso bajo) queda

φ(t) = β sin 2πfm t, t ≥ t0 (23)

De esta manera, la señal paso banda (la que realmente se transmite) queda
n o
sF M (t) = Ac cos (2πfc t + β sin 2πfm t) = Re Ac ej2πfc t ejβ sin 2πfm t (24)

siendo lo que hay dentro del operador parte real la señal analı́tica de sF M (t). Por lo tanto podemos
calcular el equivalente paso bajo de la señal de forma sencilla haciendo

bsF M (t) = asF M (t)e−j2πfc t = Ac ejβ sin 2πfm t (25)

Si nos fijamos bien nos daremos cuenta que bsF M (t) es una señal periódica de periodo Tm = f1m ya
que bsF M (t + kTm ) = Ac ejβ sin (2πfm (t+kTm )) = Ac ejβ sin (2πfm t+2πk) = bsF M (t). Por lo tanto la podremos
expresarla a partir de su serie de Fourier de la siguiente manera:
+∞
X Z
1
bsF M (t) = cn e j2πfm nt
con cn = bsF M (t)e−j2πfm nt dt (26)
n=−∞
Tm hTm i

Veamos ahora qué valen los coeficientes de Fourier, esto es


Z Tm /2
cn = fm Ac ejβ sin 2πfm t e−j2πfm nt dt (27)
−Tm /2

y haciendo el cambio de variable λ = 2πfm t llegamos a


Z π
f
m
cn =  Ac ej(β sin λ−nλ) dλ (28)
2π
f
m −π

La integral resultante no se puede calcular analı́ticamente pero dada su importancia en diversos ámbi-
tos ha sido estudiada y tabulada. Definimos la función de Bessel de 1a especie de orden n y argumento
β como Z +π
1
Jn (β) = ej(β sin λ−nλ) dλ (29)
2π −π
y en la siguiente figura vemos graficadas algunas de estas funciones. A partir de las funciones de Bessel
de primera especie con n > 0 podemos obtener J−n (β) si hacemos uso de la propiedad que nos dice

J−n (β) = (−1)n Jn (β) (30)

Ahora que tenemos el equivalente paso bajo de la señal en forma de serie de Fourier, volvemos a la
señal paso banda para analizar su espectro bajo la nueva perspectiva que nos da bsF M (t) expresado en
serie de Fourier. Ası́ pues, las señal sF M (t) es
( +∞ )
n o X
s(t) = Re bsF M (t)ej2πfc t = Re Ac Jn (β)ej2πfm nt ej2πfc t (31)
n=−∞
+∞
X +∞
X
= Ac Jn (β) cos (2πfc t + 2πfm nt) = Ac Jn (β) cos (2π(fc + nfm )t)
n=−∞ n=−∞

77
Funciones de Bessel de primera especie
1
J0(β)
0.9 J1(β)

0.8 J2(β)
J (β)
0.7 10

0.6

0.5

0.4

0.3
Jn(β)

0.2

0.1

−0.1

−0.2

−0.3

−0.4

−0.5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
β

Expresada la señal de esta forma, el cálculo tanto del espectro como de la densidad espectral de la
señal resulta fácil a través de la transformada de Fourier o su módulo al cuadrado, respectivamente.
Analicemos pues el espectro de la señal FM resultante, que es
+∞
X Ac Jn (β)
SF M (f ) = F{sF M (t)} = [δ(f − fc − nfm ) + δ(f + fc + nfm )] (32)
n=−∞
2

donde vemos claramente que en función de β se deberán considerar más o menos componentes fre-
cuenciales (ver figura con las funciones de Bessel). Un ejemplo ya visto es para β  1 (FM de banda
estrecha), en cuyo caso deberemos considerar únicamente las funciones de Bessel en n = −1, 0, 1 (ver
figura), siendo el ancho de banda de transmisión BT = 2fm como ya habı́amos visto. En general, si
dibujásemos Jn (β) para un valor de β dado y fuéramos incrementado n, verı́amos que a la larga las
amplitudes de Jn (β) irı́an disminuyendo. El ancho de banda de la señal FM quedarı́a determinado
por el orden del coeficiente cuya amplitud sea considerada ya suficientemente pequeña. En caso de
que el transmisor o receptor corten a un ancho de banda menor, entonces la señal quedará degradada
(habrá distorsión).

Observación: nótese que aumentar β no significa necesariamente aumentar el ancho de banda de


transmisión BT puesto que β depende de fm . Si aumentamos β dejando fm constante, entonces
sı́ aumenta el ancho de banda (hay más “deltas” a considerar y están separadas la misma cantidad
unas de otras). En cambio, si aumentamos β pero disminuyendo fm , entonces habrá más “deltas”
significativas pero estarán más juntas, con lo que puede incluso que el ancho de banda disminuya.

78
Ancho de banda de la señal FM

A fin de poder determinar el ancho de banda de la señal FM, la cuestión es fijar qué entendemos
por suficientemente pequeño y ver cuántas componentes frecuenciales entran. La siguiente gráfica
determina cuál es el orden n de Jn (β) a partir del cual se cumple |Jn (β)| <  para n > M y en
concreto lo hace para  = 0,01 y  = 0,001. A la práctica se observa que la calidad de la señal es
aceptable para  = 0,01 (aunque no del todo buena) mientras que ésta es excelente para  = 0,001. Es
por eso que se acostumbra a usar un término medio dado por

M (β) = β + 2 (33)

si β ≥ 1 (ver trazo discontinuo en el gráfico). En este caso, el ancho de banda total de transmisión
que ocupan las 2M + 1 “deltas” que hemos considerado es
 
Am f∆
BT = 2M (β)fm = 2(β + 2)fm = 2 + 2 fm = 2(Am f∆ + 2fm ) (34)
fm

15

10
ǫ = 0.001

M 5

ǫ = 0.01
β+2
2

0.2 0.5 1 1.5 2 5 10 15 20


β

Imaginemos ahora, como paso previo al cálculo del ancho de banda de una señal cualquiera, que nos
encontramos ante un tono puro como ahora pero no sabemos cuál es exactamente su amplitud y
frecuencia. Únicamente sabemos que Am ≤ 1 y que fm ≤ W . ¿Qué valores de Am y fm deberı́amos
considerar? Lo mejor que podemos hacer es curarnos en salud y considerar el peor caso. Si nos fijamos
en (34) vemos que el ancho de banda más grande se obtendrá cuando Am y fm sean a la vez lo más
grandes posible, es decir Am = 1 y fm = W . Poniendo esto valores en la ecuación anterior, dirı́amos
que el ancho de banda de la señal FM es

BT = 2(f∆ + 2W ) (35)

y corresponderı́a a β = fW∆ . Nótese que si hubiéramos escogido un valor de fm < W hubiéramos obte-
nido un valor de β mayor. No obstante, el ancho de banda hubiera sido más pequeño.

79
Por último, consideremos una señal arbitraria x(t) con ancho de banda Bx y que cumple |x(t)| < 1.
En este caso el ancho de banda se calcula extrapolando al caso que acabamos de ver. Definimos la
razón de desviación D como la desviación de frecuencia relativa a fm , esto es
∆f
D= (36)
fm
y el valor de D que nos dará el mayor ancho de banda (extrapolando al caso anterior) será

∆f f∆ |x(t)|max f∆
D= = = (37)
fm Bx Bx
Entonces calcularemos el ancho de banda de la señal FM como

BT = 2(D + 2)Bx = 2(∆f + 2Bx ) (38)

Esto es lo que haremos si no sabemos nada de la señal. Si tenemos más información podemos deter-
minar cuál es el par {Am , fm } que nos da el mayor ancho de banda y considerarlo para obtener BT .

Por último, a modo de resumen, calcularemos BT en función de D (o β equivalentemente) según sea


el caso:

1. Si D < 0,3, entonces estamos en banda estrecha y BT = 2Bx .

2. Si 0,3 < D < 1, entonces debemos ir a la tabla de M (β) para ver cuántas “deltas” hay que
considerar.

3. Si D ≥ 1, podemos usar la aproximación M (β) = β + 2 y estimamos el ancho de banda como


BT = 2(D+2)Bx . Esta es una variante de la conocida regla de Carson que dice BT = 2(D+1)Bx .

4. Si D ≥ 10, la aproximación BT = 2DBx = 2f∆  Bx también se considera válida.

Notas:

1. La regla de Carson es un intento de combinar las aproximaciones para D muy pequeña y D muy
grande en una sola expresión.

2. Aunque nos hemos centrado en calcular el ancho de banda de las señales FM, el ancho de banda
de una señal PM se calcuları́a de la misma forma sustituyendo D por φ∆ . Ya hemos visto en el
análisis de un tono puro que β (equivalente a D) determinaba, como hemos argumentado a raı́z
de (17), la máxima desviación en fase de la señal FM y esto es justo lo que nos dice φ∆ en una
señal PM.

4. Moduladores y demoduladores de FM
Una vez analizada la modulación, veamos los diagramas de bloques de algunos moduladores y demo-
duladores de FM. Entre los moduladores veremos el modulador directo y el modulador indirecto. Entre
los demoduladores veremos el demodulador por conversión FM-AM y el demodulador discriminador
de fase.

80
Moduladores de FM

Modulador directo: Como muestra la figura siguiente, se trata simplemente de un oscilador contro-
lado por tensión.

x(t) VCO Ac cos (2πfc t + φ(t))

Un circuito resonante muy simple es un condensador y una bobina en paralelo, siendo la frecuencia
resonante de esta configuración f0 = 2π√1LC . Si usamos un condensador regulable en tensión de forma
que C(t) = C0 − C1 x(t), entonces
1 1 1
f0 (t) = p = √ q (39)
2π LC(t) 2π LC0 1 − C1 x(t)
C0

C1
Si C0
x(t)  1 entonces podemos usar la siguiente aproximación de Taylor de primer orden alrededor
1
del origen, √1−x ≈ 1 + x2 , de forma que nos queda
 
1 C1
f0 (t) = √ 1+ x(t) (40)
2π LC0 2C0

Si definimos fc = √1 , entonces
2π LC0

C1
f0 (t) = fc + fc x(t) (41)
2C0
C1
y por lo tanto f∆ = fc 2C0
. La fase de la modulación será pues
Z t
ϕsF M (t) = 2πfc t + 2πf∆ x(λ)dλ (42)

como corresponde a la señal FM.

Modulador indirecto: Corresponde al diagrama de bloques que se puede apreciar en la siguiente


figura.

s1 (t) s2 (t) s3 (t)


x(t) Modulador FM × n1 × n2 s4 (t)
banda estrecha

f1 f2

Como vemos, se basa en un modulador FM de banda estrecha y en bloques multiplicadores de fre-


cuencia. Estos bloques se obtienen a través de sistemas no lineales (ya vimos en su dı́a que aparecı́an

81
harmónicos o múltiples de la frecuencia de entrada) y filtros para eliminar las componentes no desea-
das. Gracias a estos bloques podemos llegar a una modulación FM con la desviación en frecuencia
deseada. Fijémonos en las señales que se obtienen sucesivamente, esto es
 Z t 
s1 (t) = Ac cos 2πf1 t + 2πf∆ x(λ)dλ (43)
 Z t 
s2 (t) = Ac cos 2πn1 f1 t + 2πn1 f∆ x(λ)dλ
 Z t 
s3 (t) = Ac cos 2π(n1 f1 ± f2 )t + 2πn1 f∆ x(λ)dλ
 Z t 
s4 (t) = Ac cos 2πn2 (n1 f1 ± f2 )t + 2πn1 n2 f∆ x(λ)dλ

de forma que la nueva frecuencia portadora es n2 (n1 f1 ± f2 ) y la nueva sensibilidad en frecuencia es


0 =n n f .
f∆ 1 2 ∆

En general, el demodulador indirecto es más estable que el demodulador directo, que da derivas en
frecuencia que hay que controlar. Con la llegada de los circuitos integrados, este hecho mejoró pero el
ámbito de aplicación está limitado a sistemas de potencia baja.

Demoduladores de FM

Demodulador por conversión FM-AM: Responde al siguiente diagrama de bloques y se basa en


el hecho de que derivar una señal FM la convierte en una señal AM que podemos demodular fácilmente
con un demodulador de envolvente, por ejemplo.

∂ Demodulador Bloqueo
sF M (t) Limitador () Kx(t)
∂t de envolvente DC

BT

En el diagrama de bloques aparece en primer lugar un filtro paso banda cuyo único objetivo es eliminar
ruido (como en todas las modulaciones), luego un limitador que fija la amplitud de la señal (deberı́a ser
constante y de no serlo sirve para compensar la distorsión producida) sin modificar
 la fase y finalmente

Rt
el bloque derivador. Veamos pues, qué vale la derivada de sF M (t) = Ac cos 2πfc t + 2πf∆ x(λ)dλ .
Esto es  Z t 

sF M (t) = Ac (2πfc + 2πf∆ x(t)) sin 2πfc t + 2πf∆ x(λ)dλ (44)
∂t
y confirmamos que se ha llevado x(t) a la amplitud en la misma forma que lo hace la modulación
AM. La portadora no es pura como en AM pero el término extra no pasa a la envolvente de la señal
(comprobadlo como ejercicio). Nos falta ver cómo hacer esta derivada. Si lo miramos a nivel frecuencial,
derivar una señal es multiplicar por j2πf , es decir que necesitamos un filtro con respuesta frecuencial
|H(f )| = 2πf . Esto se consigue con resonadores. En la siguiente figura vemos la respuesta de un
resonador y cómo ésta se puede aproximar por una rampa en frecuencia en cierto margen frecuencial.

82
|H(f )|

fc f

Demodulador balanceado: A fin de mejorar el anterior demodulador encontramos el demodulador


balanceado, que responde al siguiente diagrama de bloques.

Demodulador
H1 (f )
de envolvente

+
sF M (t) Kx(t)

Demodulador
H2 (f )
de envolvente

La idea es la misma pero ahora la derivada se hace con dos resonadores invertidos y adecuadamente
alineados como muestra la siguiente figura. De esta forma ampliamos el margen de derivación.

|H1 (f ) − H2 (f )|

fc f

Demodulador discriminador de fase: Por último vemos el demodulador discriminador de fase,


que responde al siguiente diagrama de bloques.

83
sF M (t) Limitador Kx(t)

PSN

La clave en este esquema es interpretar la derivada como la diferencia de la señal en dos instantes muy
muy próximos (definición de derivada). El bloque PSN (Phase-shift network) se encarga de realizar
un retardo que desfase π/2 la portadora y un retardo t1 en φ(t) (retardo de fase y retardo de grupo,
respectivamente), de forma que si a la entrada tenemos la señal FM sF M (t) = Ac cos (2πfc t + φ(t)), a
la salida tendremos Ac sin (2πfc t + φ(t − t1 )). Por lo tanto, el producto de ambas señales (ya quitando
el término a 2fc que elimina el filtro paso bajo) nos da la señal demodulada, que es
A2c
yD (t) = sin (φ(t − t1 ) − φ(t)) (45)
2
Si t1 es suficientemente pequeño podemos aproximar la diferencia de fases por su derivada, es decir
φ(t − t1 ) − φ(t) ≈ t1 φ0 (t), lo que queda justificado a partir de la definición de derivada. Además,
si t1 φ0 (t) es suficientemente pequeño podremos aproximar el seno por su argumento, de forma que
llegamos a
A2
yD (t) = c t1 φ0 (t) = Kx(t) (46)
2
Por último, nótese que a mayor ancho de banda del mensaje x(t), más rápidamente fluctuará dicha
señal. Por lo tanto, menor deberá ser t1 para tener una buena aproximación de la derivada.

5. Ruido y SNR en modulaciones angulares


La última sección de este tema, conocidas las caracterı́sticas de la señales PM y FM ası́ como los
moduladores y demoduladores, se dedica al estudio de la SNR en destino. Para ello consideraremos el
siguiente esquema con s(t) = Ac cos (2πfc t + φ(t)).

v(t) vlim (t)


s(t) CANAL Limitador DEMODULADOR yD (t)

BT Bx

w(t)
N0
Sw (f ) =
2

5.1. Ruido en PM y FM
La señal v(t) será simplemente señal deseada más ruido paso-banda. La expresaremos como la parte
real de la suma de las respectivas señales analı́ticas, esto es
n o n o
v(t) = Re Ac ej(2πfc t+φ(t)) + (in + jqn )ej2πfc t = Re Ac ejφ(t) ej2πfc t + (in + jqn )ej2πfc t (47)

84
Desarrollando un poco más llegamos a

v(t) = Ac cos (2πfc t + φ(t)) + in cos 2πfc t − qn sin 2πfc t (48)

La relación señal a ruido de esta señal o SN RR es

SR A2 /2
SN RR = = c (49)
NR N0 BT
SR
y si usamos como referencia la SNR de la señal en banda base γ = N0 Bx , que en este caso vale
A2c
γ= 2N0 Bx , podemos escribir la SN RR como

Bx
SN RR = γ (50)
BT
No obstante, más que en recepción, lo que realmente nos interesa es la SN RD en destino, que es
lo que finalmente percibimos. Para ello es necesario ver cómo el ruido paso banda afecta a la fase
de la señal modulada angularmente o φ(t), puesto que ahı́ está la información que recuperaremos en
demodulación. Volvamos a la señal v(t), considerando ahora una amplitud no constante Av (t) y una
fase adicional φn (t) para acomodar el proceso de ruido, esto es

v(t) = Av (t) cos (2πfc t + φv (t)) con φv (t) = φ(t) + φn (t) (51)

Veamos esto mismo sobre el plano complejo en la siguiente figura. Dibujaremos ahora el equivalente
paso bajo de la señal (a diferencia del tema 3 donde dibujamos la señal analı́tica) porque es en φv (t)
donde está la información y no en la portadora. De todas formas, pasar de una a otra representación
es muy simple. Podemos imaginar que eje de abscisas en la representación paso bajo juega el papel
del fasor ej2πfc t en la representación de la señal analı́tica que vimos en el tema 3 (recordemos que
bs (t) = as (t)e−j2πfc t ).

Im {bv (t)} señal recibida in (t)

ruido
qn (t)
Av (t)
ϕn (t)
φn (t)

Ac señal deseada
φv (t)
φ(t)

Re {bv (t)}

Como lo que nos importa en este caso es la modificación de φ(t) (fase deseada) debido a ruido, es
decir, φn (t) en la figura, proyectaremos las componentes de ruido sobre la señal deseada, obteniendo
ası́ în (t) y q̂n (t) como se aprecia en la siguiente figura.

85
Im {bv (t)}
în (t)
q̂n (t)
rn (t)
Av (t) ϕn (t)
φn (t)

Ac
φv (t)
φ(t)

Re {bv (t)}

En ella podemos ver que el ángulo que forma el vector de ruido respecto a los nuevos ejes es ϕn (t)−φ(t),
ası́ que sólo nos falta proyectar el módulo del vector de ruido rn (t) sobre los nuevos ejes obteniendo
ası́

în (t) = rn (t) cos (ϕn (t) − φ(t)) (52)


q̂n (t) = rn (t) sin (ϕn (t) − φ(t)) (53)

Ahora ya podemos ver que


q̂n (t)
φn (t) = arctan (54)
Ac + în (t)
Esta expresión no nos será muy útil para poder calcular relaciones señal a ruido, ası́ que intentamos
simplificarla. Suponiendo que el sistema trabaja con SN RR > 10dB, entonces în (t) será despreciable
frente a Ac y además el argumento del arcotangente será muy pequeño, por lo que es lı́cito cambiar el
arcotangente por su argumento. Asi pues llegamos a
q̂n (t)
φn (t) ≈ (55)
Ac
Por último, se puede sustituir q̂n (t) por qn (t) bajo un punto de vista estadı́stico. Intuitivamente, par-
timos del hecho que el ruido tiene una fase ϕn (t) uniformemente distribuida en [0, 2π] y una amplitud
rn (t) distribuida según la estadı́stica de Rayleigh. Fijémonos ahora que la única diferencia entre el
ruido original y el proyectado es la rotación que provoca φ(t), que se podrá considerar como cons-
tante durante un cierto intervalo de tiempo puesto que φ(t) depende de x(t) y ambas magnitudes
variarán de forma mucho más suave que el ruido. Ası́ pues, el ruido proyectado tendrá una amplitud
que seguirá siendo Rayleigh puesto que no es modificada por la rotación y una fase que seguirá unifor-
memente distribuida entre 0 y 2π (a pesar de la rotación). De aquı́ que decimos que ambas son iguales
estadı́sticamente, aunque por ejemplo qn (t) 6= q̂n (t) para un t dado. No obstante, como nos interesan
los parámetros estadı́sticos (básicamente la autocorrelación a fin de obtener la densidad espectral)
para calcular potencias de ruido y relaciones señales a ruido, podemos hacer el cambio puesto que
estas magnitudes sı́ se mantienen. Ası́ que finalmente nos quedamos con:
qn (t)
φn (t) ≈ (56)
Ac

86
5.2. SNR en PM
Sabiendo como “pasa” el ruido paso banda a la fase de la señal, veamos ahora cuánto vale la
SN RD = SD /ND en la modulación PM y por ello debemos identificar las componentes de señal
deseada y ruido en yD (t) = xD (t) + nD (t).

Sigamos pues el diagrama de bloques que hemos puesto al principio de la sección, partiendo de v(t),
la cual acabamos de analizar. Ası́, la señal a la entrada del demodulador será

vlim (t) = Av cos (2πfc t + φ(t) + φn (t)) (57)

donde la amplitud es ahora constante debido al efecto del limitador (pero la fase idealmente no cambia).
Por lo tanto, lo dicho anteriormente para v(t) es igualmente válido desde el punto de vista de la fase.
Ası́ pues, en el demodulador de PM recuperaremos la fase de la señal sin tener en cuenta la debida a
la portadora, con lo que a su salida tendremos

qn (t)
φv (t) = φ(t) + φn (t) = φ∆ x(t) + (58)
Ac
Por último, nos falta considerar el filtro paso bajo para obtener finalmente yD (t) = xD (t) + nD (t)
como
yD (t) = φv (t) ∗ hP B (t) (59)
Nótese que dicho filtro no afectará a la señal deseada, pues lo suponemos ideal y debe tener el ancho
de banda adecuado, pero sı́ al ruido. Por lo tanto, por el lado de la señal deseada es fácil encontrar
SD según
xD (t) = φ∆ x(t) −→ SD = φ2∆ Px (60)
Por el lado del ruido tenemos
Z +∞
qn (t) 1
nD (t) = ∗ hP B (t) −→ ND = 2 Sqn (f )|HP B (f )|2 df (61)
Ac Ac −∞

Aquı́ debemos recordar un resultado sobre el ruido paso banda que obtuvimos en el tema 3 y que nos
decı́a
Sin (f ) = Sqn (f ) = Sn (f + fc ) + Sn (f − fc ) para |f | < fc (62)
lo que gráficamente se traduce en la siguiente figura, y por lo tanto
2N0 Bx
ND = (63)
A2c

87
Sn (f ) Sqn (f )
BT
N0
N0 /2

2Bx

−fc fc f BT f

Juntándolo todo llegamos a


φ2∆ Px
SN RD = 2N0 Bx
= γφ2∆ Px (64)
A2c

donde recordemos que γ = NS0RBx es la SN RD que obtendrı́amos con un sistema paso banda (ya
hemos visto al principio del tema que SR = A2c /2 tanto en PM como en FM). Nótese que como
φ∆ ≤ π para evitar ambigüedad de fase, φ2∆ ≤ 10 dB. Esto quiere decir que en PM podemos mejorar
10 dB como mucho respecto al sistema equivalente en banda base (mismas condiciones de potencia
transmitida). Fijémonos también que la SN RD mejora en PM a medida que incrementamos la potencia
de transmisión como parece lógico. No obstante, el mecanismo no es el mismo que en las modulaciones
lineales. Aquı́ la información viaja en la fase de la señal e incrementar la amplitud no tiene ningún
efecto en la fase y por lo tanto no modifica la potencia de la señal deseada en destino como muestra
(60). Por contra, sı́ que baja la potencia de ruido como hemos visto en (63). Este fenómeno se conoce
como “noise quieting” y lo podemos apreciar cuando sintonizamos una emisora de FM con el volumen
subido. Al pasar de una emisora a otra se oye mucho más ruido que cuando sintonizamos una (caso
en el que la potencia de señal recibida crece, Ac es mayor y ND baja).

5.3. SNR en FM
El análisis de la SN RD en FM es muy parecido al de PM. La diferencia es que ahora no recuperamos
la fase de la señal sino su derivada. En otras palabras, si vlim (t) = Av cos (2πfc t + φ(t) + φn (t)) es
1 ∂
la señal de entrada al demodulador de FM como antes, la salida será 2π ∂t (φ(t) + φn (t)) y una vez
atraviese el filtro paso bajo tendremos la señal en destino, que es
1 ∂(φ(t) + φn (t))
yD (t) = ∗ hP B (t) = xD (t) + nD (t) (65)
2π ∂t
Rt
En FM tenemos φ(t) = 2πf∆ x(λ)dλ y por lo tanto al hacer la derivada y dividir por 2π tenemos
f∆ x(t). Como sucedı́a en PM, el filtro paso bajo no debe tener ningún efecto sobre la señal deseada y
por lo tanto xD (t) y SD deben valer
2
xD (t) = f∆ x(t) −→ SD = f∆ Px (66)

En cuanto a ND , sı́ que tenemos que considerar la derivación que hace el demodulador de FM. Si
antes tenı́amos qnA(t)
c
a la salida del demodulador de PM, ahora tendremos su derivada con el factor
2π dividiendo. Si lo interpretamos bajo el punto de vista de sistemas LTI, sabemos que derivar en
tiempo corresponde a multiplicar por j2πf en frecuencia. Si además consideramos el filtro paso bajo
1
estamos ante la situación de la siguiente figura, donde Hderivador (f ) = 2π j2πf = jf (incluye el 1/2π
y la derivación).

88
qn (t)
Hderivador (f ) HP B (f ) nD (t)
Ac

Por lo tanto
qn (t)
nD (t) = ∗ hderivador (t) ∗ hP B (t) (67)
Ac
y a nivel de densidad espectral tenemos
Z +∞ Z Bx
Sqn (f ) 2 2 1 2 Bx3 N0
ND = |Hderivador (f )| |HP B (f )| = N 0 f df = 2 (68)
−∞ A2c A2c −Bx 3A2c

A diferencia de PM, en FM la densidad espectral del ruido no es plana dado que Sqn (f ) se multiplica
por |Hderivador (f )|2 = f 2 , una parábola en frecuencia. Es decir, la frecuencias alrededor del origen casi
no contribuirán a ND mientras que las más alejadas contribuirán mucho como se puede apreciar en la
siguiente figura.

Sqn (f )
A2c
SnD (f )

2Bx

BT f

Ahora ya podemos calcular la SN RD como


2 P 3A2
f∆ x c
SN RD = (69)
2Bx3 N0
A2c
y en función de la SN RD de paso banda, γ = 2N0 Bx , nos queda
 2
f∆
SN RD = 3γPx = 3γPx D2 (70)
Bx

Observaciones:

1. Habrá mejora respecto banda base cuando 3Px D2 > 1. Considerando Px = 1 a efectos de
normalización como siempre, llegamos a la condición

D > 0, 57 (71)

Por lo tanto, en FM de banda estrecha no hay mejora a nivel de SN RD respecto a γ.

89
2. Existen dos vı́as para aumentar SN RD :

a) Aumentar SR . De ese modo no modificamos SD pero bajamos ND (“noise quieting”).


b) Aumentar BT a través del incremento de D. Esta es una caracterı́stica importante de la
modulación FM ya que permite mantener una cierta SN R0 jugando con SR y BT . En
otras palabras, podemos bajar SR y aumentar BT a fin de mantener la SN RD a un valor
dado SN R0 y viceversa. No obstante, esto tiene un lı́mite ya que habrá un momento en
el que dejaremos de cumplir la condición que hemos usado al principio de la sección de
SN RR > 10 dB.

5.3.1. FM con filtros de preénfasis y deénfasis

Dado que en FM el ruido en destino tiene una densidad espectral parabólica, habrá una fuerte am-
plificación del ruido a las frecuencias próximas a Bx . Para compensar este efecto e intentar conseguir
una densidad espectral plana se usan los filtros de preénfasis y deénfasis. Esta idea ya la vimos con
los filtros terminales óptimos y consiste en amplificar las frecuencias más vulnerables al ruido en el
transmisor para poderlas atenuar luego en el receptor. De esta forma no alteramos la señal pero sı́ el
ruido con el objetivo de hacerlo espectralmente plano en la banda de interés.

En el caso de FM recurrimos al siguiente diagrama de bloques, donde el filtro de prémfasis tiene


carácter paso alto y el de deénfasis tiene carácter paso bajo. Hablamos de “carácter” porque un filtro
ideal eliminarı́a parte de la señal e introducirı́a distorsión en la señal. En otras palabras, para que el
sistema funcione adecuadamente, debemos cumplir la condición
1
HP E (f ) = (72)
HDE (f )

y por lo tanto, las repuestas de los filtros deben ser ‘ı̀nvertibles”. Nótese que un filtro paso bajo ideal
o paso alto ideal no cumple con esta restricción ya que la inversa requerirı́a una respuesta de módulo
infinito en parte del ancho frecuencial.

MODULADOR DEMODULADOR
x(t) HP E (f ) CANAL HDE (f ) yD (t)
FM FM

5.3.2. Efecto umbral

Centrémonos ahora en qué sucede cuando dejamos de cumplir la condición SN RR > 10 dB. En
este caso podemos volver a hacer el diagrama fasorial que hicimos al principio de esta sección pero
considerando que las amplitudes de los vectores de señal y ruido son comparables como se puede
apreciar en la siguiente figura.

90
Im {bv (t)}

señal deseada

bv (t + ∆t) Ac

φv (t) ruido
rn (t)

Re {bv (t)}

bv (t) señal recibida

Aparece ahora un problema importante: la fase del ruido puede modificar mucho la fase de la señal
deseada, pudiendo haber un cambio de hasta π rad como es el caso de la figura en el instante t.
Imaginemos ahora que la fase de la señal no cambia entre t y t + ∆t. No obstante, como la fase del
ruido está uniformemente distribuida en [0, 2π], el fasor correspondiente a la señal recibida (suma de
señal deseada y ruido) describirá una trayectoria con gran incertidumbre de fase entre t y t + ∆t.
Una posible evolución se muestra en la figura en trazo discontinuo. Nótese que cuando la SN RR es
alta esto no sucede. Entonces existirı́a también incertidumbre en la fase pero en un margen pequeño
alrededor de la fase que marca la señal deseada. A continuación, la siguiente figura marca la evolución
de φv (t) entre t y t + ∆t, donde hay un salto de fase próximo a 2π. También se muestra su derivada,
que es lo que verı́amos (u oirı́amos) a la salida de un receptor FM. Teniendo en cuenta que ∆t puede
ser muy pequeño, apreciarı́amos un cambio brusco de tensión a la salida del receptor. Esto es lo que
en la radio de FM se aprecia con un “click”.

φv (t) 1 ∂φv (t)


2π ∂t
2π ∆t

t
∆t

91
Relación entre SN RD y efecto umbral

Una vez descrito el fenómeno, analicemoslo un poco más. Ya sabemos que hay que cumplir SN RRth =
10 dB. Traducido a banda base a través de (50), la correspondiente γth es

BT
γth = SN RRth = 2M (D)10 (73)
Bx
donde hemos usado la expresión ya vista para FM BT = 2M (D)Bx . Esto nos permite finalmente
calcular la SN RD mı́nima que obtendremos si conseguimos evitar el efecto umbral. A través de (70)
y la γth obtenida, llegamos a
SN RDth = 3Px D2 γth (74)
Si consideramos BT = 2(D + 2)Bx (expresión genérica aproximada para D ≥ 1), entonces γth =
20(D + 2) y
SN RDth = 60Px D2 (D + 2) (75)
Comparemos en la siguiente tabla los valores de γth y SN RDth para distintos valores de D, donde
apreciamos la mejora obtenida por la modulación de FM (Px = 1 W).

D γth (dB) SN RDth (dB) Mejora


2 19 29,1 10,1
5 21,5 40,2 18,7
10 23,8 48,6 24,8

Como ya habı́amos anticipado, a medida que aumentamos D la mejora también crece. No obstante,
debemos garantizar γth , ası́ que habrá un momento en el que será necesario incrementar la potencia
transmitida para no sufrir efecto umbral. A la práctica lo que nos limitará es el ancho de banda dispo-
nible BT . A partir de ese dato podremos extraer la razón de desviación D y γth con (73). Finalmente,
2
a través de γth = 2NA0cBx podremos determinar la potencia que debemos transmitir en FM.

Por último, la siguiente gráfica recoge los resultados obtenidos modulando un tono en FM. Es intere-
sante destacar la caı́da brusca de rendimiento en términos de SN RD cuando la γ cae por debajo de
cierto valor, que más o menos corresponde a los valores γth calculados. En cualquier caso, debemos
ser conscientes que usamos un BT aproximado y que por lo tanto los resultados obtenidos no son
infinitamente precisos.

92
50

40
D=5
SN RD (dB)

30
Banda
base
D=2
20

10

0
0 10 20 30 40

γ (dB)

93
Tema 6: Codificación de Fuente
Antoni Morell y José López Vicario

7 de mayo de 2013

1. Introducción
1.1. Las Comunicaciones Digitales: un Nuevo Paradigma
Llegados a este punto de la asignatura, hemos sido capaces de entender y analizar el funcionamiento
de los sistemas de comunicaciones analógicas, tanto en banda base como paso banda. Cabe destacar
que las modulaciones vistas hasta el momento han sido el sustento de los servicios de radiodifusión
durante las últimas décadas. Sin embargo, hoy en dı́a es únicamente la radio en FM quien resiste
el paso del tiempo y el auge de los sistemas digitales. Pero, ¿qué hace tan interesante el uso de los
sistemas digitales?

En un primer análisis, incluso se podrı́a pensar que los sistemas analógicos poseen cierta ventaja, pues
son capaces de transmitir los infinitos valores de amplitud que toma una señal real cualquiera en un
determinado intervalo, mientras que en un sistema digital únicamente se considera un conjunto finito
de valores posibles como veremos a continuación. Bajo este punto de vista, se podrı́a plantear que
transmitir información en formato digital limita de alguna forma la capacidad de comunicación, lo
cual serı́a cierto si estuviéramos en un mundo ideal sin ruido. No obstante, ya sabemos que la señal
recibida en cualquier sistema (sea analógico o digital), que en sentido estricto es siempre analógica1 ,
corresponde sin duda a una versión corrompida de la señal transmitida. La gracia de los sistemas di-
gitales es que, dado que conocemos ciertas caracterı́sticas de la señal de antemano (p. ej. sus posibles
amplitudes), la reconstrucción perfecta de la señal es ahora posible mientras que antes no. La figura
siguiente muestra esta misma idea de forma gráfica.

Más allá de los sistemas de comunicación, un ejemplo que muestra claramente esta ventaja de los siste-
mas digitales frente a los analógicos serı́a un sistema de copiado de documentos. Por el lado analógico
tendrı́amos una fotocopiadora y por el lado digital cualquier sistema capaz de copiar un archivo que
contenga el documento (en el formato que sea), es decir, un ordenador, una tableta, un teléfono móvil,
etc. Está claro que después de un cierto número de copias sucesivas en el sistema analógico, el docu-
mento original y el replicado se podrán diferenciar claramente. En cambio, haciendo el mismo número
de copias sucesivas en el sistema digital no se apreciará diferencia alguna.

1
Cuando hablamos de señales digitales remarcamos su naturaleza finita pero, en sentido estricto, todas las señales
que se transmiten por un canal real son analógicas.

94
señal transmitida señal recibida señal reconstruida

x(t) x(t) x(t)

xmax xmax xmax

xmin
t
xmin
t
xmin
? t

x(t) x(t) x(t)


xmax xmax xmax

xmin xmin xmin


t t t

Esto hace que a partir de este momento dejemos de hablar de SNR como medida de calidad y pase-
mos a hablar de probabilidad de error pues, en el nuevo paradigma digital, asumiremos que la señal
transmitida y recibida son la misma salvo que haya habido un error en la reconstrucción. Además,
para que un sistema digital tenga un funcionamiento adecuado, esta probabilidad debe ser muy baja.

En general, alguna de las ventajas que presenta un sistema digital frente uno analógico son:

Posibilidad de recuperar la información sin error, como ya hemos comentado.

Posibilidad de hacer mulltiplexado a nivel temporal. Lo veremos más adelante. Esto facilita,
entre otras cosas, la integración de servicios. Por poner un ejemplo, a través de una misma lı́nea
de ADSL se nos puede ofrecer acceso a internet, tv y radio a la vez.

Permite la comunicación directa entre máquinas, ya que estas también se comunican interna-
mente gracias a señales de naturaleza digital.

En cuanto a inconvenientes podemos decir:

El ancho de banda para transmitir una misma señal generalmente es mayor.

Se hace necesario que los equipos transmisor y receptor estén sincronizados. En comunicaciones
analógicas podı́a requerirse la sincronización en fase de la portadora. Ahora, además, es también
necesario que el receptor sepa en qué instantes de tiempo debe recoger la información como
veremos más adelante.

95
1.2. Diagrama de Bloques de un Sistema de Comunicaciones Digital
Es el que se muestra en la figura siguiente.

CODIFICADOR CODIFICADOR MODULADOR


FUENTE
DE FUENTE DE CANAL DIGITAL

Transmisor
CANAL

DECODIFICADOR DECODIFICADOR DEMODULADOR


DESTINO
DE FUENTE DE CANAL DIGITAL

Receptor

video, audio, señales


bits bits digitales
datos

En ella vemos los siguientes elementos:

Codificador/decodificador de fuente: Este bloque se encarga de recoger la señal proveniente de


la fuente y transformarla en una cadena de bits. Como veremos en este tema, consideraremos
tanto señales analógicas como señales discretas (que toman una serie de valores dentro de un
conjunto finito). En el primer caso deberemos primero muestrear y luego cuantificar para pasar
las muestras a bits (cometiendo cierto error de cuantificación) mientras que en el segundo caso
nos preocuparemos de pasar la información a bits. En general, es tarea del codificador de fuente
transmitir la información usando la menor cantidad de bits posible y como mayor sea el “nivel
de compresión” mejor. A veces se usan esquemas sin pérdida de información, como pude ser
la conocida compresión de Lempel-Ziv y otras veces se usan mecanismos de compresión con
pérdidas como por ejemplo la compresión de voz MP3. Por supuesto, la tarea del decodificador
de fuente es recuperar la señal generada por la fuente en su misma forma y entregarla al destino.

Codificador/decodificador de canal: la misión de este bloque es añadir redundancia a la cadena


de bits generada por el bloque anterior con el fin de mitigar los efectos adversos del canal (p. ej.
ruido o ganancia variable), que provocarán la reconstrucción incorrecta de algunos de los bits
enviados en el receptor. Aunque no lo hemos puesto explı́citamente en la figura, justo después
del codificador de canal suele haber un entrelazador, que se encarga de desordenar la nueva
cadena de bits con redundancia de una forma conocida. Esto se hace porque es habitual que se
produzcan ráfagas de bits erróneos al pasar por el canal, hecho que baja mucho el rendimiento
de la codificación. Si por el contrario, estos se desordenan en transmisión y se vuelven a ordenar
justo antes del decodificador de canal en el receptor, los bits erróneos consecutivos se reparten
y se mejora enormemente la eficiencia de los códigos de canal. Se trata pues de un bloque con
una funcionalidad relativamente sencilla pero de gran importancia. Por último, mencionar que
la misión del decodificador de canal es aprovechar la redundancia añadida en el transmisor para

96
determinar si ha habido errores en el canal e incluso corregirlos. A su salida encontramos la
cadena de bits sin redundancia. En esta assignatura, no trataremos ni la codificación de canal
ni el entrelazado.

Modulador/demodulador digital: estos dos bloques se encargan de: i) en transmisión, transformar


la cadena de bits recibida en formas de onda susceptibles de ser transmitidas a través del canal
en cuestión y ii) en recepción, recuperar dicha cadena de bits a partir de la señal recibida (ya
sea una onda electromagnética, una señal óptica o bien una señal acústica, por ejemplo). Por
último, decir que el estudio de estos bloques nos ocupará durante los temas 7 y 8 de este curso.
En particular, el tema 7 estará dedicado a la transmisión digital en banda base y el tema 8 a la
transmisión digital paso banda.

2. Codificación de señales analógicas


Como ya hemos apuntado en la sección anterior, existen dos pasos imprescindibles si queremos
transformar una señal analógica en una cadena de bits, que son primero convertir la señal en una
señal discreta a través del muestreo y luego cuantificar los valores obtenidos, es decir, asignarles el
valor más próximo dentro de un conjunto de valores posibles. A continuación recordaremos el concepto
de muestrear una señal.

2.1. Muestreo
Entendemos por muestreo el hecho de coger una señal continua en el tiempo y quedarnos única-
mente con los valores de la señal a tiempos múltiples de T . Es decir:

x(t)

−T T 2T
t

De entrada, la intuición nos dice que si muestreamos suficientemente rápido (T suficientemente pe-
queño) podremos recuperar la señal original x(t) a partir de su versión discretizada xd (t). Veamos,
pues, qué hay de verdad en esta afirmación.

2.1.1. Espectro de una señal muestreada. Criterio de Nyquist.

Consideremos el siguiente esquema de muestreo ideal con tren de deltas:


A nivel temporal tenemos:
+∞
X +∞
X
xd (t) = x(t) δ(t − nT ) = x(nT )δ(t − nT ) (1)
n=−∞ n=−∞

97
x(t) xd (t)

−T T 2T −T T 2T
t t
!+∞
n=−∞ δ(t − nT )

−T T 2T
t

Esto se traduce al dominio frecuencial como:

1
+∞
X m 1  +∞
X  m
Xd (f ) = X(f ) ∗ δ f− = X f− (2)
T m=−∞
T T m=−∞
T

y por lo tanto se trata de una señal periódica en frecuencia. Si asumimos que x(t) tiene un ancho de
banda limitado a W , la representación gráfica de Xd (f ) es:

Xd (f )
1
T X(f )

−W W f
− T1 1
− 2T 1
2T
1
T

1
Observando la figura vemos que, para que las réplicas de X(f ) no se solapen se debe cumplir W < 2T .
1
Teniendo en cuenta que la frecuencia a la que se ha muestreado la señal es fm = T , reescribimos la
condición anterior como
fm > 2W (3)
también conocida como criterio de Nyquist. En otras palabras, para evitar el efecto aliasing (el solapa-
miento o interferencia entre réplicas), es necesario muestrear al doble del ancho de banda de la señal.
Equivalentemente, definimos la frecuencia de Nyquist fN , que es función de fm , como el máximo ancho
de banda que puede tener la señal para que no sufra aliasing una vez muestreada. En otras palabras,
forzando al máximo (3), tenemos
fm
fm = 2fN −→ fN = (4)
2

98
2.1.2. Recuperación de x(t) a partir de xd (t). Interpolación.

En caso de que no haya efecto aliasing, está claro que limitando el espectro de Xd (f ) en [−1/2T, 1/2T ]
y escalando por T recuperamos el espectro de la señal original. Esta idea es la que usamos para
reconstruirla. En concreto, vemos que:
 
f
X(f ) = Xd (f ) T Π (5)
1/T
 
f
Esto se corresponde con el siguiente sistema cuando H(f ) = T Π 1/T :

H(f )
T
Xd (f ) X(f ) = Xd (f ) H(f )
xd (t) 1
− 2T 1
f
x(t) = xd (t) ∗ h(t)
2T

Antitransformando la relación anterior obtenemos:


     
−1 f 1 t t
F {Xd (f ) T Π } = xd (t) ∗ T sinc = xd (t) ∗ sinc (6)
1/T T T T

donde hemos usado F −1 {H(f )} = h(t) = sinc Tt . Desarrollando un poco más obtenemos:
" +∞
#
  +∞  
X t X t − nT
x(t) = x(nT )δ(t − nT ) ∗ sinc = x(nT ) sinc (7)
n=−∞
T n=−∞
T

Ésta es la fórmula de interpolación con la sinc como función de interpolación. Nótese que los valores
de x(t) en los instantes t = nT son iguales que los de xd (t) en t = nT , lo cual es correcto. Veámoslo
en la siguiente figura:

x(t)
x(T ) x(2T )

99

Si nos fijamos, por ejemplo, en t = T , vemos que la sinc centrada allı́, es decir x(T ) sinc t−T
T toma
el valor deseado x(T ) mientras que el resto de funciones sinc se anulan en ese punto. Esto mismo
sucede para cualquier otro punto t = nT . Además, en los valores de t intermedios, la suma de sincs
nos devolverı́a la señal original (en trazo discontinuo en la figura).

No obstante, la función de interpolación ideal (la sinc) no se podrá implementar a la práctica ya


que se trata de un sistema no causal. En todo caso, habrı́a que introducirle un retraso y truncarla
para que h(t) = 0 para t < 0. Otra opción es usar funciones de interpolación más sencillas, como por
ejemplo:
 
Interpolación de orden cero: h(t) = Π t−T T
/2
.
P  
Con esta función tendremos x(t) ≈ n x(nT )Π t−T /2−nT T , es decir, mantenemos el valor de
una muestra hasta que llegue la siguiente. La recuperación de la señal no es muy buena pero es
sencilla.

x(t)
x(T ) x(2T )


Interpolación de primer orden: h(t) = ∆ Tt .
P 
Con esta función tendremos x(t) ≈ n x(nT )∆ t−nTT , es decir, entre dos muestras consecutivas
aproximamos la función por una recta. Resulta también simple de implementar (con un retraso
para que sea causal) y funciona mejor que la anterior.

x(t)
x(T ) x(2T )

100
2.1.3. Implementación práctica

Finalmente, cabe destacar que en la práctica se procura evitar el efecto del aliasing a toda costa. Es
por ello que en el caso del muestro, si la señal de entrada x(t) no cumple el criterio de Nyquist, se
coloca un filtro (llamado antialiasing) que limite el ancho de banda de la señal a fm /2. Es preferible
distorsionar la señal quitándole les componentes frecuenciales más altas que acarrear luego con el
aliasing. Ası́ pues, el diagrama de bloques de un sistema de muestreo debe ser:

Filtro antialiasing Muestreo Cuantificación


x(t) (ancho de banda W) fm > 2W n bits

Conversor A/D

Si queremos recuperar la señal continua a partir de información digitalizada, usaremos un bloque


conversor digital a analógico. No obstante, la señal de salida de este bloque (suma de deltas) con-
tendrá las réplicas no deseadas en frecuencia, por lo que colocaremos, tal y como hemos visto, un filtro
interpolador o reconstructor.

Conversor D/A Filtro interpolador

Ejemplo: importancia de evitar el aliasing.

Consideremos la señal x(t) = cos (2πf0 t). Sabemos que si la muestreamos con fm > 2f0 no va-
mos a tener problemas. En cambio, supongamos que la muestreamos a una frecuencia menor, es decir,
f0 > fm /2. Si no colocamos el filtro anti-alisaing, la señal muestreada en frecuencia será Xd (f ) =
1 P+∞ m

T m=−∞ X f − T , que gráficamente corresponde a:

Xd (f )
1
X(f ) réplicas
T

H(f )

f
−fm − f2m fm
2
fm

101
Si ahora pretendemos recuperar la señal original con el filtro interpolador ideal (sombreado en la fi-
gura), vemos que en realidad estamos recuperando un coseno a frecuencia menor que la original (la
simétrica de f0 respecto a fm /2).

Esto es precisamente lo que está sucediendo cuando en televisión vemos las ruedas de un fórmula
1 girando al revés, también llamado efecto estroboscópico. Supongamos que tenemos un cı́rculo como
el de la figura girando a velocidad constante con periodo T0 . También tenemos una lámpara estro-
boscópica que ilumina el cı́rculo durante un breve instante de tiempo (se ve el cı́rculo quieto) cada Tm
segundos. Según Nyquist, la frecuencia de muestreo de este sistema, que es 1/Tm , debe ser mayor que
dos veces la frecuencia de rotación 1/T0 para capturar el movimiento correctamente, o sea, Tm < T0 /2.
¿Qué sucede si fijamos Tm = 3T4 0 ? Veámoslo en la figura:

t=0 t = Tm

}
T0

t = 2Tm t = 3Tm

Tm

Nos parecerı́a que gira a la izquierda con un periodo T0 = Tm /4.

2.2. Cuantificación
A partir de este momento nos referiremos a cada una de las muestras de la señal discretizada de la
siguiente forrma
xd (nT ) −→ x(n) (8)
y a su versión cuantificada como x̂(n). Recordemos que el proceso de cuantificación consiste en asignar
a x(n) un nivel dentro de un subconjunto de valores posibles, acción necesaria para obtener una señal
digital. A continuación describiremos y analizaremos el cuantificador uniforme y luego pasaremos al
estudio del cuantificador óptimo.

2.2.1. Cuantificador uniforme

Existen básicamente dos tipos de cuantificadores uniformes, que son el ‘midriser’ y el ‘midthread’. En
la figura siguiente vemos sus funciones de cuantificación, que nos dicen cuál es el valor de una muestra
cuantificada x̂ a partir de su valor original x. Como vemos, en ambos casos se supone que el valor de la
muestra x va de un valor mı́nimo −xmax a un valor máximo xmax . También apreciamos los niveles de
decisión xk , puntos del eje de abcisas en los que el valor cuantificado cambia, ası́ como los niveles de

102
cuantificación x̂k , que son las imágenes de los niveles de decisión y forman el subconjunto de valores
posibles que tomará la señal digital. Observe también que la distancia entre dos niveles de decisión
consecutivos es ∆, el paso de cuantificación.

x̂ x̂

x̂k+1
x̂k+1
x̂k
3∆/2
x̂k
∆/2 ∆

−xmax −xmax
xk xk+1 xmax x xk xk+1 xmax x

midraiser midthread

Nosotros nos centraremos en el análisis del cuantificador ‘midraiser’ pero cabe decir que el ‘midthread’
tiene mejor comportamiento ante el ruido ya que si se cuantifica una muestra de valor 0 con algo de
ruido, esta versión de cuantificador uniforme nos dará x̂ = 0 en la mayorı́a de los casos mientras que el
‘midraiser’ irá saltando entre los dos niveles de cuantificación que se encuentran alrededor del origen.
Definiremos en primer lugar los parámetros del cuantificador, que son:

Margen dinámico M D: especifica el rango máximo de valores que podremos cuantificar adecua-
damente y vale M D = 2xmax .

Número de niveles L: nos da el número de niveles considerados (en la figura anterior L = 8


para el ‘midraiser’ y L = 9 para el ‘midthread’). Si luego queremos identificar los niveles con un
número binario de b bits, será necesario que L ≤ 2b .

Duración del intervalo de cuantificación ∆: conocemos ya su significado. Se puede calcular como


∆ = MLD = 2x2maxb (la última igualdad en el caso que L = 2b ).

Nivel de cuantificación: también hemos comentado ya su significado. Si nos fijamos en la figura


x +x
del cuantificador ‘midraiser’ nos damos cuenta de que x̂k = k 2 k−1 y por lo tanto se asigna el
valor medio dentro del intervalo [xk−1 , xk ]. Se puede comprobar, por ejemplo, que para x ∈ [0, ∆],
x̂ = ∆/2.

Error de cuantificación: lo definimos como q (x(n)) = x(n) − x̂(n).

Análisis del error de cuantificación

x +x
Está claro que el error q(x) será nulo para valores de x = k 2 k−1 con 0 = 1, . . . , L, puesto que
hemos decidido poner los niveles de cuantificación justo en medio de los intervalos [xk−1 , xk ]. Además,

103
el máximo error se dará en los extremos de dichos intervalos y tendrá un valor absoluto de ∆/2.
Juntando estas ideas, vemos en la siguiente figura cómo se comporta q(x).

x̂L

−xmax x̂L
x0 x1 xL x

x̂1
zona de error
de sobrecarga
q(x)

∆/2

−∆/2
zona de error granular

Dado que consideramos x(n) como un proceso aleatorio, una función de éste como es q(x(n)) también
lo será. A continuación nos preocupamos por la potencia de dicho proceso en el instante n teniendo
en cuenta que, a fin de simplificar la notación, escribiremos q en vez de q(x(n)). Ası́ pues, la potencia
del error de cuantificación viene dada por
Z +∞ Z +∆/2 Z −∆/2 Z +∞
σq2 = E{q } = 2 2
q fq (q) dq = 2
q fq (q) dq + 2
q fq (q) dq + q 2 fq (q) dq (9)
−∞ −∆/2 −∞ ∆/2
= σq2g + σq2sc

y la hemos dividido en potencia debida a errores en la zona granular o σq2g (primer sumando) y potencia
debida a errores en la zona de error de sobrecarga o σq2sc (dos últimos sumando). Véanse ambas zonas
en la figura anterior. En general nos interesa que el error de sobrecarga tenga la menor potencia posible
(de lo contrario el cuantificador ha sido mal diseñado pues no opera en la zona de trabajo, que es
la de error granular). Por lo tanto, a la hora de diseñar el cuantificador habrá que tener en cuenta
la estadı́stica de x(n) con dos finalidades: i) asegurar que sea un proceso de media nula y ii) escoger
un valor adecuado del M D tal que p(x(n) > xmax ) sea lo suficientemente pequeña. En el primer
punto, si x(n) no es de media nula, tenemos la opción de quitarle la media y añadı́rsela luego. En el
segundo punto, téngase en cuenta que tampoco es bueno escoger xmax demasiado grande pues se corre

104
el riesgo de no capturar la dinámica de la señal. En el caso de que el funcionamiento del cuantificador
sea adecuado (buena elección del margen dinámico, error básicamente granular y ∆ suficientemente
pequeño), podremos considerar lo siguiente (no demostrado2 ):
E{qg (n)} = 0 (10)
E{qg (n + m)x(n)} = 0 (11)
Sqg (f ) = σq2g − fm /2 < f ≤ fm /2 (12)
Es decir, el error tiene media nula, está incorrelado con la señal original y su densidad espectral es
plana (fm es la frecuencia a la que ha sido muestreada la señal original para obtener la secuencia x(n)).
Lo importante entonces es que, en esta situación, el error de cuantificación se puede tratar como si
fuera ruido térmico.

Potencia del error de cuantificación

Calculemos a continuación la potencia del error de cuantificación, pero a diferencia de lo establecido


en (9), lo calculamos ahora como una función de x que es justamente q(x) (ver gráfico anterior), es
R +∞
decir, calcularemos σq2 = E{q 2 (x)} = −∞ q 2 (x)fx (x)dx. Teniendo en cuenta que q(x) = x̂1 − x para
x < x0 , q(x) = x̂k − x para xk−1 ≤ x < xk y que q(x) = x̂L − x para x ≥ xk , entonces obtenemos
Z +∞ Z x0 L Z xk
X Z ∞
2 2 2 2
σq = q (x)fx (x) dx = (x̂1 − x) fx (x) dx + (x̂k − x) fx (x) dx + (x̂L − x)2 fx (x) dx
−∞ −∞ k=1 xk−1 xL
(13)
donde el sumando central corresponde al error granular mientras que el primero y el último corres-
ponden al error de sobrecarga. Haciendo el cambio de variable q = x̂ − x nos queda
Z +∞ L Z x̂k −xk−1
X Z x̂L −xL
σq2 = q 2 fx (x̂1 − q) dq + q 2 fx (x̂k − q) dq + q 2 fx (x̂L − q) dq (14)
x̂1 −x0 k=1 x̂k −xk −∞

donde apreciamos el cambio de orden en los lı́mites de integración debido a que dq = −dx (ya que x̂k
es una constante).

Si ahora nos fijamos en la figura anterior y consideramos que ∆ es lo suficientemente pequeño (o


equivalentemente que L es lo suficientemente grande) y que el error debido a sobrecarga es despreciable,
entonces podemos hacer la siguiente aproximación,
XL Z x̂k −xk−1 L Z ∆/2
X
2 2 2
σq ≈ σqg = q fx (x̂k − q) dq ≈ q 2 fx (x̂k ) dq (15)
k=1 x̂k −xk k=1 −∆/2

donde aproximamos fx (x) en el intervalo x ∈ [xk−1 , xk ] por su valor en el punto medio, esto es f (x̂k ),
y tenemos en cuenta que x̂k − xk−1 = ∆/2 ası́ como x̂k − xk = −∆/2. A partir de aquı́ vemos que
XL Z ∆/2
2 1 2 ∆2
σq ≈ fx (x̂k )∆ q dq = (16)
k=1 −∆/2 ∆ 12
2
Una demostración se puede encontrar en A. B. Sripad y D. L. Snyder, “A Necessary and Sufficient Condition for
Quantization Errors to be Uniform and White”, IEEE Trans. on Acoustics, Speech and Signal Processing, No. 5, Oct.
1977.

105
fx (x)

fx (x̂k )

∆/2

x
xk−1 xk xk+1
x̂k

P R +∞
ya que el término L k=1 fx (x̂k )∆ es una aproximación de −∞ fx (x) dx = 1 usando escalones de an-
chura ∆ (ver figura). Por lo tanto, bajo el supuesto de un valor de ∆ suficientemente pequeño, la
integral se puede aproximar por el sumatorio. Nótese que el resultado obtenido se corresponde con el
error de cuantificación que hubiéramos obtenido suponiendo una densidad de probabilidad de dicho
1 q
error uniforme, es decir, fq (q) = ∆ Π ∆ , lo cual parece bastante razonable (siempre suponiendo que
∆ es lo suficientemente pequeño).

Función densidad de probabilidad de q(x)

La función densidad de probabilidad de q(x) o fq (q) se puede expresar en función de la densidad de


probabilidad de fx (x) ya que q es función de x como hemos visto. De forma genérica, para obtener
dicha función de densidad de probabilidad necesitamos conocer primero su función de distribución
de probabilidad, la cual se obtiene fácilmente como veremos a continuación a través de un ejemplo.
Una vez obtenida Fq (q) ya tenemos la mayor parte del trabajo hecho puesto que es bien conocido que

fq (q) = ∂q Fq (q).

Empecemos pues calculando Fq (q) y en particular recordando su significado, esto es Fq (q 0 ) = P (q ≤ q 0 )


o lo que es lo mismo, la probabilidad de que la v.a. q tome valores inferiores o iguales a un valor dado
q 0 . Suponiendo que la función que relaciona q con x es continua, entonces el conjunto de posibles
valores del error que están por debajo de ese umbral q 0 se corresponderá con un conjunto de posibles
valores de x. Veámoslo en la siguiente figura, en este caso para un umbral q 0 ≤ −∆/2.
Si nos fijamos en la figura, enseguida nos daremos cuenta de que, para q 0 ≤ −∆/2,

Fq (q 0 ) = P (q ≤ q 0 ) = P (x ≥ x0 ) = 1 − Fx (x0 ) = 1 − Fx (x0 (q 0 )) (17)

donde explotamos la relación dada por q(x) para expresar Fq en función de Fx . En particular, para el
caso que estamos estudiando, q = x̂L − x y por lo tanto x = x̂L − q. Ası́ pues, derivando respecto q
obtenemos
∂x(q)
fq (q) = −fx (x(q)) · = −fx (x(q)) · (−1) = fx (x(q)) = fx (x̂L − q) (18)
∂q

106
q(x)

∆/2

x

x
−∆/2

q

Si el umbral se sitúa entre −∆/2 y ∆/2, entonces la situación es la de la siguiente figura.

q(x)
x′L−1 x′L
x′1
x1 xL−1 xL
∆/2

q′ x
−∆/2

En este caso y siguiendo el mismo procedimiento tenemos

Fq (q 0 ) = P (q ≤ q 0 ) = P (x01 ≤ x ≤ x1 ) + . . . + P (x0L ≤ x ≤ xL ) + P (x ≥ xL ) (19)


= Fx (x1 ) − Fx (x01 ) + . . . + Fx (xL ) − Fx (x0L ) + 1 − Fx (xL )

donde los valores xk son constantes y los valores x0k variables que dependen de q 0 como en el caso
anterior, esto es x0k = x̂k − q, en ambos casos para k = 1, . . . , L. Únicamente nos queda derivar Fq (q)
para obtener fq (q), es decir,
L
∂x01 (q) ∂x0 (q) X
fq (q) = −fx (x01 (q)) · − . . . − fx (x0L (q)) · L = fx (x̂k − q) (20)
∂q ∂q
k=1

Por último, nos quedarı́a ver cuál es la pdf del error cuando q 0 ≥ ∆/2, pero se puede anticipar que
se trata de un caso muy parecido al primero que hemos estudiado. Ası́ pues, juntando resultados, nos

107
queda que la pdf del error vale


 fx (x̂L − q), −∞ ≤ q < −∆/2



PL
fq (q) = k=1 fx (x̂k − q) −∆/2 ≤ q ≤ ∆/2 (21)




 f (x̂ − q), q > ∆/2
x 1

Relación señal a ruido en cuantifiación


Dado que el proceso de cuantificación introduce un error y que ese error tiene caracterı́sticas parecidas
a las del ruido (suponiendo un funcionamiento adecuado del codificador como ya hemos dicho) tiene
sentido calcular la relación señal a ruido de cuantificación o bien SN RQ , que la definimos como la
relación de potencias entre la señal original y el ruido de cuantificación. Si desarrollamos esta idea
vemos que
Px σ2 12σx2
SN RQ = = 2x = (22)
Pq ∆ /12 ∆2
donde hemos supuesto que la señal x es de media nula. Recordando que el paso de cuantificación en el
caso ’mid-raiser’ vale ∆ = 2xmax
L = 2x2max
b podemos desarrollar un poco más para llegar definitivamente
a la siguiente relación
12σ 2 σ2
SN RQ = 2 x 2b = 3 22b 2 x (23)
4xmax /2 xmax
que en escala logarı́tmica se transforma en
xmax
SN RQ (dB) = 4, 77 + 6b − 20 log10 (24)
σx
De esta expresión podemos sacar dos conclusiones importantes:

La SN RQ aumenta directamente en 6dB por cada bit que añadimos.

La SN RQ disminuye cuando xmax se incrementa en relación con la varianza de la señal original σx


y aumenta cuando xmax se reduce en relación con σx . Sin embargo y como veremos a continuación
hay que ir con cuidado con esta afirmación. Interpretemos en primer lugar lo que sucede. Si el
rango de la señal aumenta en relación a su varianza estamos forzando que a los valores más
representativos de la señal original les corresponda un número menor de niveles de cuantificación,
es decir, estamos bajando la ’granularidad’ en la zona de interés mientras que a valores poco
probables les corresponderá un número posiblemente excesivo de niveles como podemos apreciar
en la figura siguiente.
El caso opuesto es que xmax sea menor que σx . En ese caso la expresión anterior nos dice que
la SN RQ mejora y es algo que tiene cierta lógica pues hay un mejor aprovechamiento de los
niveles de cuantificación ya que éstos no se malgastan en valores de señal poco probables como
antes. No obstante cabe destacar que, a medida que xmax disminuye, nuestra hipótesis de partida
sobre el error de sobrecarga deja de ser cierta ya que habrá un número significativo de valores
de x en términos de probabilidad que provocaran la saturación del cuantificador. En ese caso la

108
pocos niveles en los valores
de x con más probabilidad !
fx (x)

−xmax xmax x

mejora en SN RQ deja de ser cierta pues Pq = σq2 = σq2g + σq2sc y el segundo término ya no es
despreciable. En definitiva pues cabe recordar que existe un compromiso para escoger un
valor de M D adecuado.

2.3. Cuantificador óptimo


Hasta el momento hemos estudiado el cuantificador uniforme, cuyo diseño es el más obvio y también
el que se usa a la práctica. No obstante, es lógico preguntarse por su optimalidad en términos del
error de cuantificación cometido y es por eso que nos centramos ahora en el diseño del cuantificador
óptimo. El objetivo es ver cuáles deben ser los niveles de cuantificación y los intervalos de decisión
(ahora libres) que se ajustan a una señal cualquiera x(n) caracterizada por su función densidad de
probabilidad fx (x) con el fin de minimizar σq2 .

Consideremos en primer lugar el valor óptimo de los niveles de cuantificación x̂k y recordemos la
expresión de la varianza del error de cuantificación, esto es
Z x0 L Z
X xk Z +∞
σq2 = 2
(x̂1 − x) fx (x) dx + 2
(x̂k − x) fx (x) dx + (x̂L − x)2 fx (x) dx (25)
−∞ k=1 xk−1 xL

La condición para encontrar el valor de x̂k óptimo será, como siempre, ∂σq2 /∂ x̂k = 0 y por lo tanto
Z
∂σq2 xk
= 2(x̂k − x)fx (x) dx = 0, k = 2, . . . , L − 1 (26)
∂ x̂k xk−1

Nótese que el sumatorio desaparece puesto que x̂k aparece únicamente en uno de los términos (excepto
para los casos extremos k = 1, L que trataremos a continuación). Operando un poco vemos que debe
R xk R xk
cumplirse xk−1 x̂k fx (x) dx − xk−1 xfx (x) dx = 0. Como x̂k no es la variable de integración, puede salir
fuera de la integral y llegamos a
R xk R xk Z xk
xk−1 x fx (x) dx xk−1 x fx (x) dx fx (x)
x̂k = xk R = = x dx (27)
x fx (x) dx P (xk−1 ≤ x ≤ xk ) xk−1 P (xk−1 ≤ x ≤ xk )
k−1

109
Esto mismo lo podemos escribir como
Z xk
x̂k = x fx (x|xk−1 ≤ x ≤ xk ) dx = E{x|xk−1 ≤ x ≤ xk } (28)
xk−1

ya que la función densidad condicionada fx (x|xk−1 ≤ x ≤ xk ) debe tener la misma forma que fx (x)
en el intervalo [xk−1 , xk ] pero debe ser escalada por el término P (xk−1 ≤ x ≤ xk ) para asegurar que
su integral valga la unidad. Resumiendo,
(
fx (x)
P (xk−1 ≤x≤xk ) xk−1 ≤ x ≤ xk
fx (x|xk−1 ≤ x ≤ xk ) = (29)
0 resto

y x̂k se calcula como el centroide del intervalo de cuantificación. Por último, nótese que los casos
extremos x̂1 y x̂L son algo particulares ya que hay que considerar dos términos en la derivada. Hagamos
el primer caso, esto es
Z Z Z
∂σq2 x0 x1 x1
= 2(x̂1 − x)fx (x) dx + 2(x̂1 − x)fx (x) dx = 2(x̂1 − x)fx (x) dx (30)
∂ x̂1 −∞ x0 −∞

Nos damos cuenta de que las integrales se pueden juntar y por lo tanto el desarrollo sigue siendo el
mismo salvo que el intervalo a considerar ahora es (−∞, x1 ]. Algo parecido sucede con el otro caso,
ası́ que juntándolo todo llegamos a


 E{x|x ≤ x1 } k=1
x̂k = E{x|xk−1 ≤ x ≤ xk } k = 2, . . . , L − 1 (31)

 E{x|x ≥ x
L−1 } k = L

En segundo lugar y último debemos considerar los umbrales de decisión xk óptimos. Procederemos de
la misma forma que en el caso anterior, esto es, derivando la varianza del error de cuantificación (que
coincide con la potencia suponiendo media nula) e igualando a cero. Fijémonos que, a diferencia del
caso anterior, los umbrales se encuentran en lı́mites de integrales. Para poder hacer dicha derivada
nos apoyaremos en el teorema fundamental del cálculo y en particular en el siguiente resultado
Z b(x)
d
f (t)dt = f (b(x)) · b0 (x) − f (a(x)) · a0 (x) (32)
dx a(x)

y tendremos en cuenta que un mismo valor xk aparece siempre en dos integrales (como lı́mite superior
en una e inferior en otra). Consideremos los casos en que k = 2, . . . , L − 1 donde obtenemos
Z Z
∂σq2 ∂ xk
2 ∂ xk+1
= (x̂k − x) fx (x) dx + (x̂k+1 − x)2 fx (x) dx (33)
∂xk ∂xk xk−1 ∂xk xk

y aplicando (32) llegamos a


 
fx (xk ) (x̂k − xk )2 − (x̂k+1 − xk )2 = 0 (34)

o, lo que es lo mismo, a la condición


x̂k+1 + x̂k
xk = (35)
2

110
si consideramos que la raı́z cuadrada de un número real positivo ofrece dos resultados posibles o, equi-
valentemente, que (x̂k+1 − xk )2 = (x̂k − xk+1 )2 . Por lo tanto, el valor óptimo del umbral de decisión
se encuentra en el punto medio de los niveles de cuantificación.

A la luz de estos resultados, podemos comprobar que el cuantificador uniforme ’midraiser’ es ópti-
mo cuando x está uniformemente distribuida en un cierto intervalo. Fijémonos que los umbrales de
cuantificación caen justo en medio de los niveles de cuantificación por construcción del cuantificador
como requiere la condición (35) y que, a su vez, los niveles de cuantificación se correponden con los
centroides de los intervalos de cuantificación según hemos visto en (28) una vez tenemos en cuenta
fx (x). También resulta evidente que cuando fx (x) deje de ser uniforme la condición (28) dejará de
cumplirse y el cuantificador dejará de ser óptimo. A fin de obtener un sistema óptimo deberı́amos
considerar fx (x) y recurrir a métodos iterativos más o menos complejos capaces de ir ajustando los
umbrales y los niveles hasta conseguir una solución óptima.

2.4. Cuantificador no-uniforme


Sin embargo, la estrategia propuesta en el párrafo anterior no es muy versátil y requiere el conocimiento
exacto de fx (x), lo que no siempre está disponible. Es por este motivo que en la práctica no se emplea
esta solución y se utiliza el siguiente esquema basado en el cuantificador uniforme para tratar señales
con fx (x) no uniforme.

y ŷ ỹ
COMPRESOR CUANTIFICADOR CONVERSOR EXPANSOR
x x̃
C(x) UNIFORME DIGITAL-ANALÓGICO E(ỹ)

TRANSMISOR
RECEPTOR
Cuantificador no-uniforme

La pieza clave en este esquema es el compresor y la modificación que éste provoca en la señal original a
través de la función C(x) en el lado del transmisor. Nótese que una vez enviada la señal ŷ al receptor en
forma de bits (luego abordaremos este punto) y recuperada como ỹ = ŷ + q(y) en el conversor digital-
analógico, el bloque expansor simplemente debe volver a la señal original x̃, que contendrá también
cierto error con respecto x. Es evidente que idealmente la función implementada en el bloque expansor
debe ser la recı́proca de la usada en el bloque compresor, esto es

E(ỹ) = C −1 (ỹ) = x̃ (36)

pues, de no haber conversión a bits (es decir, ni el bloque cuantificador que juega el papel de conver-
sor analógico-digital ni el bloque conversor digital-analógico), tendrı́amos en el esquema anterior la
siguiente sucesión de señales
x −→ C(x) −→ y −→ E(y) −→ x (37)
Una vez aclarado este punto, la siguiente pregunta es obvia: ¿cuál es el papel del bloque compresor?
La intuición nos dice que si el cuantificador uniforme es óptimo cuando fy (y) es uniforme, el papel de

111
C(x) deberı́a ser transformar la señal original x en otra señal y cuya distribución sea lo más parecida
a la uniforme posible. Normalmente las señales de interés presentan valores que se concentran en
probabilidad alrededor del origen y la función C(x) fuerza intervalos no uniformes en x que son más
estrechos como más cercanos al origen estemos y por eso decimos que comprime, lo cual se puede
apreciar en la siguiente figura. A nivel de probabilidad, nótese que si cogemos un valor cualquiera
dentro del margen dinámico de x, la probabilidad de que éste se encuentre dentro de uno de los
intervalos de anchura variable ∆k se iguala entre los distintos intervalos en comparación con el caso
uniforme (intervalos de amplitud fija ∆) pues los intervalos donde los valores son más probables (cerca
del origen) son también más estrechos. Finalmente, como las probabilidades de los intervalos de anchura
variable en x son las mismas que los intervalos de anchura ∆ en y, se confirma que fy (y) será más
parecida a una distribución uniforme que fx (x). Por último, señalar que normalmente forzaremos
ymax = xmax .

C(x)
C ′ (x̂k )
ymax


∆k
−xmax
xk x̂k xk+1 xmax x

Analicemos de nuevo el error de cuantificación, pero esta vez usando la función de compresión C(x).
Supondremos que el error es básicamente granular y que el número de niveles es suficientemente grande
o, lo que es lo mismo, que los intervalos de cuantificación son lo suficientemente pequeños como para
considerar (aproximar) fx (x) constante en ellos. Ası́ pues, podemos expresar el error de cuantificación
como
XL Z xk L
X Z ∆k /2 L
X
2 2 2 ∆3
σq ≈ fx (x̂k ) (x̂k − x) dx = fx (x̂k ) q dq = fx (x̂k ) k (38)
xk−1 −∆k /2 12
k=1 k=1 k=1

donde hemos hecho el cambio de variable q = x̂k − x. Nótese que aunque x̂k no se encuentra en general
en el centro del intervalo, esto sı́ serı́a cierto si suponemos los intervalos ∆k suficientemente pequeños

112
como para que C(x) se pueda considerar lineal en ellos. En ese caso además podremos aproximar la
derivada de C en x̂k como
∆ 2 ymax
C 0 (x̂k ) = = (39)
∆k L ∆k
con lo que
2 ymax
∆k = (40)
L C 0 (x̂k )
y volviendo a la expresión de la potencia del error llegamos a
L
X 2
∆k 4 ymax
σq2 ≈ fx (x̂k ) (41)
12 L2 (C 0 (x̂k ))2
k=1

Finalmente, si aproximamos el sumatorio por su versión integral (donde ∆k juega el papel de dx) y
tenemos en cuenta que ymax = xmax nos queda
Z xmax Z
x2 x2max xmax fx (x)
σq2 ≈ fx (x) 2 max dx = dx (42)
−xmax 3 L (C 0 (x))2 3 L2 −xmax (C 0 (x))2
donde el término integral es lo que se conoce como factor de compresión o F C.

Llegados a este resultado, tenemos dos opciones de diseño, que son:

1. Minimizar σq2 con el objetivo de encontrar la función de compresión C(x) óptima o, lo que es
equivalente, la función C(x) que nos da los pasos de cuantificación ∆k óptimos.

2. Imponer una SN RQ que sea independiente de la estadı́stica de la señal x.

La primera opción, aunque interesante, no deja de presentar el mismo problema que habı́amos visto
con anterioridad, es decir, tendremos que calcular una C(x) para cada señal de entrada en función de
su estadı́stica y, además, ésta será desconocida muchas veces. Por lo tanto, descartamos esta vı́a y nos
centramos en la segunda. Recordemos la expresión de la potencia del error de cuantificación, esto es
x2max
σq2 ≈ FC (43)
3 L2
y por lo tanto la relación señal a ruido de cuantificación será
R xmax 2
σx2 σx2 3 L2 3 L2 −xmax x fx (x)dx
SN RQ ≈ 2 = = 2 R (44)
σq F C x2max xmax xmax fx0 (x) 2 dx
−xmax (C (x))

de modo que relacionando el cuantificador uniforme con el no uniforme se verifica que


1
SN RQN U = SN RQU (45)
FC
donde SN RQN U es la relación señal a ruido del cuantificador no uniforme resultante (después de
aplicar la función de compresión) y SN RQU es la relación señal a ruido del cuantificador uniforme que
ya habı́amos visto con anterioridad en (23). A la vista de (44) resulta evidente que para independizar
la SN RQ de la estadı́stica de la señal debemos conseguir (C 0 (x))2 = k/x2 , lo que quiere decir que
k
C 0 (x) = −→ C(x) = k log(x) + K (46)
x

113
donde K es una constante que determinaremos aplicando la restricción C(xmax ) = xmax . Ası́ obtene-
mos finalmente  
|x|
C(x) = k log( ) + xmax sign(x) (47)
xmax
y por lo tanto la función de expansión correspondiente será
1
E(ỹ) = xmax e k (ỹ−xmax ) sign(ỹ) (48)

Sin embargo, existe aún un problema en lo que hemos desarrollado hasta el momento y es que C(0) = ∞
y por lo tanto no implementable. A continuación veremos cómo resuelven este problema los esquemas
más habituales empleados en la práctica.

Cuantificación de la señal de voz: leyes A y µ

Las leyes A y µ son funciones de compresión estándar que se utilizan en muchos sistemas. La ley µ
responde a la expresión
|x|
log (1 + xmax )
C(x) = xmax sign(x) (49)
log (1 + µ)
y en la siguiente figura podemos ver su representación gráfica para los valores µ = 10 y µ = 255.
Apreciamos que a mayor valor de µ mayor es la compresión (no habrı́a compresión con µ → 0) y
que ahora C(0) = 0. En particular, esta ley con µ = 255 se emplea en la telefonı́a básica de Estados
Unidos.

Ley µ
1
µ=255
0.8 µ=10

0.6

0.4

0.2
C(x)

−0.2

−0.4

−0.6

−0.8

−1
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
|x|/xmax

114
Por otro lado, la ley A responde a la siguiente expresión



 A
 1+log xmax
A |x| sign(x) 0 ≤ |x| ≤ A
C(x) = (50)

 A|x|
 1+log xmax x
 sign(x) xmax
≤ |x| ≤ xmax
1+log A max A

y a diferencia de la ley µ impone una zona alrededor del origen donde no existe compresión. Más
allá de esta particularidad el comportamiento es parecido al de la ley µ y cabe decir, como curiosidad,
que es el sistema empleado para la compresión de la telefonı́a básica en Europa con un valor A = 87,6.

2.5. Modulación PCM y PCM diferencial


Hasta el momento hemos visto los ingredientes básicos para la codificación digital (en bits) de una
señal analógica como pude ser la señal de audio captada por un micrófono. Estos son el muestreo,
donde es fundamental saber en qué condiciones se puede reconstruir la señal real a partir de su ver-
sión muestreada, y la cuantificación, donde hemos analizado el error de cuantificación tanto para el
cuantificador uniforme como para el no-uniforme.

Juntemos ahora las piezas para ver cómo pasar de una señal analógica x(t) a su versión digital, esto
es, la secuencia de bits b(n). Concretamente, veremos dos opciones: i) PCM (Pulse Code Modulation)
y ii) Differential Pulse Code Modulation (DPCM).

Pulse Code Modulation (PCM)

Responde al siguiente esquema, donde vemos que una señal analógica x(t) debe ser primero muestreada

x(n) x̂(n)
FILTRO
MUESTREO
x(t) ANTI-ALIASING
fm = 1/Tm
CUANTIFICADOR CODIFICADOR b(n)
B = fm /2

con el correspondiente filtro paso bajo para evitar el aliasing, cuantificada y finalmente codificada, es
decir, se debe asignar una cadena de bits distinta a cada uno de los niveles de cuantificación. Recuérdese
que harán falta b bits para los L = 2b niveles y que la SN RQ es la vista en (23), es decir,
12σx2 2b σx
2
SN RQ = = 3 2 (51)
4x2max /22b x2max

Por otro lado, la velocidad de transmisión binaria en bits/s necesaria será


b
rb = = b fm (52)
Tm
o, lo que es lo mismo, debemos ser capaces de transmitir un bit cada Tb = Tm /b segundos. Ponga-
mos un ejemplo sencillo para ver el funcionamiento de la codificación PCM con L = 4 niveles. De

115
menor a mayor nivel, éstos serán {−3∆/2, −∆/2, ∆/2, 3∆/2} y los codificaremos con dos bits, esto
es, {00, 01, 10, 11} respectivamente. Veamos en la siguiente figura la codificación de una señal x(t)
cualquiera, cuya codificación en bits es . . . 10111111100001 . . ..

muestras
x(t) muestras bits
cuantificadas
xmax 3∆/2 11

∆/2 10

t
−∆/2 01

−xmax −3∆/2 00

. . . 10111111100001 . . .

Differential Pulse Code Modulation (DPCM)

La codificación PCM diferencial explota el hecho de que la mayorı́a de las señales muestreadas a la
frecuencia de Nyquist o superior presentan una fuerte correlación temporal entre muestras consecu-
tivas. Bajo esta hipótesis tiene sentido tratar una muestra en particular de forma no independiente
como sı́ es el caso de PCM sino en relación con sus predecesoras para poder predecir la muestra x(n) a
partir de N muestras anteriores, esto es, x(n − 1), . . . , x(n − N ). La gracia de todo esto es que entonces
se puede cuantificar el error de predicción y no la muestra en sı́.

Nótese que la forma más simple de hacer la predicción de x(n) es igualar esta a la muestra anterior,
es decir, x̃(n) = x(n − 1), de forma que el error de predicción en este caso es ep (n) = x(n) − x̃(n) =
x(n) − x(n − 1). Una solución más elaborada serı́a hacer una predicción lineal de x(n) como
P
X
x̃(n) = ai x(n − i) (53)
i=1

donde habrı́a que determinar los coeficientes ai según algún objetivo concreto. Una opción muy habi-
tual es escoger los coeficientes que minimizan el error cuadrático medio o MSE, que vale
 !2 
 P
X 
M SE(a1 , . . . , aP ) = E x(n) − ai x(n − i) (54)
 
i=1

donde la esperanza nos sirve para promediar todas las posibles realizaciones de la secuencia x(n).
Nótese que de no tenerla en cuenta conseguirı́amos un error nulo en la realización estudiada pero no
tendrı́amos ningún control sobre el resto, lo cual no tiene ninguna utilidad. No obstante, este análisis

116
no es objeto de este curso.

Veamos a continuación los esquemas de transmisión y recepción en DPCM, que se pueden apreciar
en la siguiente figura. El transmisor realiza la cuantificación del error de predicción como ya hemos
dicho y la transforma en bits mientras que el receptor se encarga de recuperar este error y sumarlo a
la predicción realizada por el receptor.

ep (n) êp (n)


+
x(n) CUANTIFICADOR CODIFICADOR b(n)

-
ˆ
x̃(n)

x̃(n)
PREDICTOR

(a) Transmisor

êp (n)
b(n) DECODIFICADOR ˆ
x̃(n) = x̃(n) + êp (n)

PREDICTOR

(b) Receptor

Aunque la idea es simple, hay un detalle a tener en cuenta para evitar la acumulación del error de
cuantificación. Fijémonos que el predictor tiene a su entrada x̃(n), que es la señal predecida más el
error de predicción cuantificado que se envı́a al receptor, lo que no es lo mismo que la señal original
x(n). Por lo tanto, la muestra actual se predice con las muestras anteriores pero todas ellas sujetas
ˆ
a cierto error de cuantificación. Ası́ a la salida del predictor tenemos x̃(n). Esta predicción ‘especial’
es la que se compara con x(n) para sacar ep (n) y cuantificarlo. La ventaja de esta realimentación del
predictor en el transmisor es que, en recepción, el predictor trabaja con las mismas señales sujetas a
ˆ
error de cuantificación que su homólogo en la parte del transmisor y por lo tanto puede generar x̃(n),
la cual se convierte en x̃(n) una vez se le añade el error de predicción cuantificado que hemos recibido.
Podemos comprobar, definiendo el error de cuantificación eq (n) como eq (n) = êp (n) − ep (n), que
ˆ
eq (n) = êp (n) − ep (n) = êp (n) − (x(n) − x̃(n)) = x̃(n) − x(n) (55)
ˆ
ya que x̃(n) = x̃(n) + êp (n) (ver figura). Por lo tanto, la señal a la salida del receptor se puede escribir
como x̃(n) = x(n) + eq (n) y vemos que únicamente contiene el error de cuantificación correspondiente

117
al instante n. En otras palabras, no acumula errores de cuantificación de instantes pasados.

Por último, analicemos la SN RQ que obtenemos con este esquema de codificación diferencial. Teniendo
en cuenta que la señal reconstruida en DPCM es x̃(n) = x(n) + eq (n) donde eq (n) es el error de
cuantificación cometido en el momento de cuantificar la predicción, si aplicamos la definición de SN RQ
obtenemos

σx2 σx2 σq2 σq2


SN RQDP CM = = = SN RQP CM 2 = SN RQP CM Gp (56)
σe2q σq2 σe2q σeq
donde σe2q es la potencia del error de cuantificación en la predicción hecha por DPCM y σq2 es la
potencia del error de cuantificación de x(n) si ésta hubiera sido cuantificada directamente como en
PCM. La clave en DPCM es que el margen dinámico del error de predicción será mucho menor que la
señal original si existe correlación temporal como hemos asumido. Por lo tanto, suponiendo el mismo
número de niveles de cuantificación tanto para un caso como para el otro, resulta evidente que la
estrategia de DPCM nos permite obtener una potencia de error de cuantificación más baja que la
de PCM y en general mucho menor, esto es σe2q  σq2 . Es por esta razón que llamamos ganancia del
predictor o Gp al factor σq2 /σe2q . En la práctica, dicho factor toma valores de entre 5dB y 10dB en la
codificación de señales de voz y es incluso más alta (unos 12dB) en señales de vı́deo.

3. Codificación de señales discretas


Hasta el momento hemos analizado el proceso de transformación de una señal analógica a una cadena
de bits o señal digital. Ahora nos centraremos en la codificación de una fuente analógica, es decir, una
fuente que emite un sı́mbolo determinado de entre L sı́mbolos posibles cada Ts segundos. Pongamos
un par de ejemplos.

Ejemplo 1: predicción meteorológica. Supongamos que el servicio de información meteorológica de un


paı́s tiene estaciones meteorológicas que emiten el estado del tiempo y supongamos que lo hacen cada
15m diciendo si hay sol, nubes, lluvia o nieve. Esta serı́a una fuente discreta con cuatro sı́mbolos posi-
bles, que podrı́amos etiquetar con letras de la siguiente forma: A - sol, B - nubes, C - lluvia y D - nieve.

Ejemplo 2: señal de voz PCM. Una señal de voz puede considerarse también una fuente de información
discreta una vez ha sido codificada, por ejemplo en PCM. Nótese que en este caso se emite un sı́mbolo
de entre L sı́mbolos posibles (los niveles de cuantificación) cada Tm segundos.

En general, diferenciaremos entre fuentes discretas sin memoria y fuentes estacionarias. En las prime-
ras los sı́mbolos serán independientes e idénticamente distribuidos (i.i.d.) mientras que en las segundas
existirá cierta dependencia estadı́stica entre la secuencia de sı́mbolos emitidos. De todas formas, tra-
taremos sólo fuentes que sean estadı́sticamente estacionarias (proceso estacionario). El primer ejemplo
que hemos puesto podrı́a ser una fuente sin memoria si suponemos que el hecho de haber transmitido
un determinado sı́mbolo en el instante n (por ejemplo sol) no nos dice absolutamente nada del siguien-
te sı́mbolo emitido al cabo de 15m (sı́mbolos independientes). Además, todos los sı́mbolos emitidos
tendrán la misma estadı́stica, esto es, la probabilidad de que ocurra cada uno de ellos será siempre la

118
misma a lo largo del tiempo. Esto no quiere decir que los sı́mbolos sean equiprobables. Por ejemplo,
se puede dar el caso p(A)=0.7, p(B)=0.15, p(C) = 0.14 y p(D)=0.01. El segundo ejemplo serı́a un
caso de fuente estacionaria ya que sabemos que las señales de voz presentan cierta correlación entre
sus muestras.

Los resultados que presentaremos a continuación son fruto de la conocida Teorı́a de la Informa-
ción3 . Estudiarla al detalle nos llevarı́a un curso entero, ası́ que aquı́ sólo presentaremos alguno de los
resultados fundamentales y los algoritmos de codificación más destacados.

3.1. Información mútua y entropı́a


Empecemos por la definición de información mútua. Para ello, modelemos primero una fuente de
información como una v.a. discreta que tiene un conjunto finito de valores con sus probabilidades, esto
es, la fuente o v.a. X puede dar lugar a n posibles sucesos xi , i = 1, . . . , n donde la probabilidad de
cada suceso viene dada por p(xi ). Añadamos ahora una segunda fuente Y cuyos posibles sucesos son
yj , j = 1, . . . , m. Entonces la información mútua entre el suceso X = xi e Y = yj se define como

p(xi |yj )
I(xi ; yj ) = log (57)
p(xi )

donde p(xi |yj ) es la probabilidad de que X = xi condicionada a que sabemos de antemano que Y = yj
p(x ,y )
y vale p(xi |yj ) = p(yi j )j . Las unidades de I(xi ; yj ) son bits si el logaritmo se calcula en base 2 o bien
nats (unidades naturales) si se calcula en base e (logaritmo natural).

Antes de continuar, pongamos un pequeño ejemplo de repaso para relacionar probabilidades conjuntas
con probabilidades condicionadas. Supongamos que tenemos dos monedas A y B con la siguiente tabla
de probabilidades conjuntas.

Moneda X

p(xi , yj ) Cara = 1 Cruz = 2


Moneda Y

Cara = 1 0, 45 0, 05

Cruz = 2 0, 45 0, 05

P
En primer lugar vemos que p(X = 1) = j p(X = 1, Y = yj ) = 0,45 + 0,45 = 0,9 y que p(X = 2) =
P P
j p(X = 2, Y = yj ) = 0,05+0,05 = 0,1. DeP
la misma forma, podemos calcular p(Y = 1) = i p(X =
xi , Y = 1) = 0,45+0,05 = 0,5 y p(Y = 2) = i p(X = xi , Y = 1) = 0,45+0,05 = 0,5. Luego, la proba-
bilidad condicionada de X a que Y = 2, por ejemplo, se calcuları́a como p(X = 1|Y = 2) = 0,45/0,5 =
0,9 y p(X = 2|Y = 2) = 0,05/0,5 = 0,1. Podemos ver que p(X = 1|Y = 2) + p(X = 2|Y = 2) = 1, lo
cual se debe cumplir siempre que sumamos todas las probabilidades sujetas a una misma condición.
3
Uno de los libros de referencia en Teorı́a de la Información es: T.M. Cover, ‘Elements of Information Theory’, John
Wiley & Sons.

119
Es por este motivo que hemos dividido por p(Y = 2) en este caso, consiguiendo escalar adecuadamente
las probabilidades conjuntas para conseguir que la suma de probabilidades sea 1. También vemos que
p(xi |Y = 2) coincide con p(xi ) en este caso, pero ésta es una situación particular debida a que X
e Y son independientes, lo que se puede comprobar viendo que p(xi , yj ) = p(xi )p(yj ). Por lo tanto,
otra forma de decir que dos variables son independientes es p(xi |yj ) = p(xi ), o sea, que el hecho de
condicionar o tener información sobre el valor que toma la v.a. Y no nos aporta ninguna información
adicional sobre la v.a. X.

Siguiendo con el tema que nos ocupa, podemos interpretar I(xi ; yj ) como una medida de cuánta
información sobre el evento xi se puede extraer cuando el evento yj ha tenido lugar. Veamos los casos
extremos para entender mejor el concepto. Supongamos primero que X e Y son independientes con lo
que p(xi |yj ) = p(xi ) tal y como hemos visto en el ejemplo anterior. Aplicado a (57) el resultado que
nos de es I(xi , yj ) = 0 y por lo tanto saber que ha sucedido yj no me aporta información sobre xi .
El otro caso es que siempre que sucede xi entonces también se da yj . Entonces p(xi |yj ) = 1 ya que
sabiendo que yj ha pasado podemos estar 100 % seguros de que xi también. Si nos queremos acabar
de convencer, podemos volver al ejemplo de las monedas con las siguientes probabilidades conjuntas.

Moneda X

p(xi , yj ) Cara = 1 Cruz = 2


Moneda Y

Cara = 1 0 0.5

Cruz = 2 0.5 0

A la vista de la tabla, está claro que si sale cara en la moneda Y saldrá cruz en la moneda X y
viceversa. Si calculamos por ejemplo p(X = 1|Y = 2) = p(X = 1, Y = 2)/p(Y = 2) = 0,5/0,5 nos sale
1 como habı́amos dicho. En términos de información mutua, ésta valdrá
p(xi |yj ) 1
I(xi ; yj ) = log = log = − log p(xi ) (58)
p(xi ) p(xi )
Este resultado nos dice que la información que obtendremos es la propia del suceso xi y por este
motivo la designaremos auto-información.

Sin embargo, hasta ahora hemos trabajado siempre con 2 sucesos particulares de 2 variables aleatorias
distintas y es obvio que esto no mide la relación entre todos los sucesos posibles de las 2 v.a. Es
por esto que en realidad se trabaja con los valores medios tanto de la información mutua como de la
auto-información. Ası́, cuando hablamos de información mutua normalmente nos referimos en realidad
a su promedio, esto es
n X
X m n X
X m
p(xi |yj )
I(X; Y ) = p(xi , yj )I(xi ; yj ) = p(xi , yj ) log (59)
p(xi )
i=1 j=1 i=1 j=1
Xn X m
p(xi , yj )
= p(xi , yj ) log
p(xi )p(yj )
i=1 j=1

120
Del mismo modo, cuando hablamos de auto-información, más conocida como entropı́a y escrita como
H(X), nos referimos a
Xn n
X 1
H(X) = p(xi )I(xi ) = p(xi ) log (60)
p(xi )
i=1 i=1

Hasta el momento hemos estado hablando del concepto de información sin analizarlo en detalle. En
el ámbito de la teorı́a de la información, debemos asociar información con incertidumbre. Ası́, a
mayor incertidumbre de un suceso, mayor información éste nos aporta. Volvamos al caso de las mo-
nedas (primer ejemplo) y calculemos H(x) = −0,1 · log2 0,1 − 0,9 · log2 0,9 = 0,460 bits y H(y) =
−0,5 · log2 0,5 − 0,5 · log2 0,5 = 1 bits. Supongamos ahora que se lanzan las monedas una vez por
segundo y que queremos comunicar el resultado del lanzamiento a otra persona. Además, nos pre-
guntamos cuántos bits serán necesarios en media para transmitir dicha información. En el caso de la
moneda Y habrá que transmitir siempre 1 bit diciendo si ha salido cara o cruz pues ambos sucesos
son equiprobables. En cambio la moneda X no presenta tanta incertidumbre ya que en el 90 % de
los lanzamientos nos saldrá cara. Idealmente podrı́amos transmitir esa información usando sólo 0.460
bits, aunque en la práctica transmitirı́amos 1 bit ya que es nuestra unidad mı́nima de información. En
términos de información mutua, cuando las variables son independientes como en el primer ejemplo de
las monedas, el hecho de conocer Y no nos sirve para extraer información de X y por eso I(X; Y ) = 0.
En el lado opuesto (segundo ejemplo de las monedas), la información que obtenemos de X a través
de Y es la máxima posible, esto es, H(X).

Una vez hecha esta pequeña introducción, veremos un resultado fundamental de la teorı́a de la infor-
mación alrededor de la codificación de fuentes discretas y un par de técnicas de codificación prácticas
e importantes por su relevancia. El objetivo que se persigue es siempre transmitir toda la información
con el menor número de bits posible para mejorar la eficiencia del sistema de comunicación y por
lo tanto, las técnicas que veremos tratarán sobre la compresión de datos. El resultado fundamental
del que hablábamos es el conocido teorema de la codificación de fuente de Shannon (ver Teorema
1 a continuación) y sirve para establecer un lı́mite teórico de la máxima compresión que se puede
conseguir.

Teorema 1 Sea X una v.a. que representa una fuente discreta y sin memoria con L sı́mbolos posibles
xi , i = 1, . . . , L cuyas probabilidades de aparición son p(xi ). Entonces es posible construir un código
instantáneo cuya longitud media R̄ sea

H(X) ≤ R̄ ≤ H(X) + 1 (61)

Básicamente el teorema nos dice que lo máximo que podemos ‘comprimir’ una fuente viene dictado
por su entropı́a H(X). No obstante, hay algunos detalles que conviene comentar. En primer lugar,
debemos aclarar qué es un código instantáneo. Para ello es necesario que dada una palabra código
(la traducción de un sı́mbolo a una cadena de bits) de k bits de longitud a la que llamaremos C k ,
no existe otra palabra código de menor longitud l < k que coincida exactamente con los l primeros
bits de C k . Nótese que de no cumplirse esta condición, no habrı́a manera de distinguir en el receptor
ambas palabras código una vez leı́dos sus primeros l bits y deberı́amos esperar a leer la palabra entera
para poder decodificar (pasar de palabra código a sı́mbolo). No obstante, en un código instantáneo

121
podremos decodificar siempre que encontremos una palabra código pues se garantiza que esos bits
nunca serán el principio de otra palabra.

El teorema habla también de longitud media del código, la cual se define como
L
X
R̄ = p(xi )l(xi ) (62)
i=1

donde l(xi ) es, en bits, la longitud de la palabra código con la que se codifica el sı́mbolo i-ésimo.
Cabe destacar que en todo se está suponiendo que la fuente de información emite un número de
sı́mbolos arbitrariamente grande para que el resultado del teorema sea válido. A continuación vemos
un ejemplo de código instantáneo óptimo, es decir, que cumple con (61) y que se conoce como el código
de Huffman.

3.2. Codificación de fuentes sin memoria: el código de Huffman


La forma más sencilla de explicar el código de Huffman es a través de un ejemplo. Ası́ pues, consi-
deremos la codificación de una fuente que emite siete sı́mbolos distintos xi , i = 1, . . . , 7, ordenados
en probabilidad de mayor a menor y con probabilidades 0,35 − 0,3 − 0,2 − 0,1 − 0,04 − 0,005 − 0,005.
Nota: si no hubieran estado ordenados serı́a el primer paso a hacer. A continuación juntamos los dos
sı́mbolos de menor probabilidad, en este caso x6 y x7 creando un nuevo sı́mbolo x06 de probabilidad
0,01 como muestra la siguiente figura. Al mismo tiempo, asignamos un ‘0’ al sı́mbolo superior y un
‘1’ al inferior (se puede hacer al revés pero una vez escogida una opción hay que mantenerla en toda
la codificación). El resultado de este paso se puede apreciar en la siguiente figura (izquierda). Lue-
go repetimos el proceso, siempre juntando los sı́mbolos de menor probabilidad escogiendo entre los
sı́mbolos aún no seleccionados y el último sı́mbolo ficticio o combinado creado. Después de unos pasos,
el resultado es el de la figura (medio). Ahora tenemos dos sı́mbolos originales y uno de ficticio cuya
probabilidad coincide con la de un sı́mbolo original. Como debemos juntar los dos sı́mbolos de menor
probabilidad, tenemos dos opciones: juntar primero los dos originales o bien juntar un original con el
ficticio. Ambas son válidas y en la figura (derecha) hemos optado por la primera.

0.35 0.35 0.35 0


0.65 0
0.3 0.3 0.3
1
0 0
0.2 0.2 0.2
0 0.35 0 0.35
0.1 0.1 0.1
0.15 0.15 1
0.04 0.04 0 0
0.05 1 0.04 0.05 1
0.005 0 0.005 0 0
0.01 1 0.005 0.01 1
0.01
0.005 0.005 1 0.005 1
1 1 1

Finalmente, para obtener las palabras código nos movemos de derecha a izquierda por el camino que
lleva al sı́mbolo deseado y juntamos todos los bits señalados. Ası́, la codificación resultante es la de la
siguiente tabla.

122
Sı́mbolo Probabilidad Palabra código
x1 0.35 00
x2 0.30 01
x3 0.20 10
x4 0.10 110
x5 0.04 1110
x6 0.005 11110
x7 0.005 11111

A la vista de los resultados, enseguida nos damos cuenta de que los sı́mbolos más probables reciben
menos bits. Esto tiene mucho sentido de cara a minimizar la longitud media del código ya que nos
interesa que las palabras código que aparecen más a menudo sean cortas y no nos importa tanto que
palabras cuya frecuencia de aparición es baja tengan mayor longitud. También podemos comprobar
que se trata de un código instantáneo.

Por último, calculamos la longitud media del código, que vale R̄ = 2·0,85+3·0,10+4·0,04+5·0,01 = 2,21
y la entropı́a de la fuente que vale H(X) = 2,11. Con estos números vemos que se cumple la condición
de optimalidad descrita en el teorema de Shannon.

3.3. Codificación de fuentes estacionarias


En el caso de codificar fuentes estacionarias, el algoritmo de Huffman sigue siendo óptimo si en vez
de codificar los sı́mbolos directamente consideramos la codificación de bloques de J sı́mbolos siempre
que J sea suficientemente grande. El problema es que se necesitan las probabilidades conjuntas de los
sı́mbolos en cada uno de los bloques. Es decir, si el bloque j-ésimo contiene por ejemplo tres sı́mbolos
x1 , x2 , x3 , necesitarı́amos conocer p(xi , xj , xk ), i, j, k = 1, 2, 3 para cada posible combinación. A la
práctica no se suele tener ese conocimiento de antemano y habrı́a que extraerlo de una larga secuencia
de sı́mbolos. Como es algo complejo en la mayorı́a de casos, se utiliza un algoritmo muy popular y que
es independiente (o más bien no se aprecia una dependencia directa) de las estadı́sticas de la fuente.
Es el algoritmo de Lempel-Ziv y es el que se usa para la compresión de ficheros informáticos.

Su funcionamiento es muy simple y brillante. La idea es construir un diccionario donde las pala-
bras se van aprendiendo de la fuente y las palabras codificadas son simplemente la codificación
en binario de su posición en el diccionario. Pongamos un ejemplo para que se vea claro. Supon-
gamos que una fuente X emite dos sı́mbolos x1 y x2 y que la cadena de sı́mbolos emitidos es
x1 x2 x2 x2 x1 x1 x2 x1 x2 x1 x2 x1 x1 . Inicialmente, el diccionario se llena con los sı́mbolos, en
este caso x1 y x2 tal y como muestra la figura (izquierda). Luego se codifica el primer sı́mbolo (salida
000) y se añade una nueva palabra en el diccionario, que siempre está formada por la palabra anterior
(x1 en este caso) más el siguiente sı́mbolo a codificar. En este caso se añadirı́a pues la palabra x1 x2
a la tercera entrada del diccionario y su correspondiente palabra código será 010. Todo esto se puede
apreciar en la figura (medio). En el siguiente paso buscaremos en la secuencia de entrada que nos quede
por codificar la palabra de mayor longitud que se encuentre en el diccionario. En este caso será x2
porque x2 x2 aún no se halla. La salida valdrá 000 001 y añadiremos la palabra x2 x2 a la cuarta

123
posición como se muestra en la figura (derecha). En la tercera iteración verı́amos que la palabra más
larga que se encuentra en el diccionario es x2 x2 , pues x2 x2 x1 aún no se encuentra. Por lo tanto la
salida valdrı́a 000 001 011 y añadirı́amos la palabra x2 x2 x1 al diccionario. Este proceso se repetirı́a
hasta acabar con los sı́mbolos de entrada.

Diccionario Lempel-Ziv Diccionario Lempel-Ziv Diccionario Lempel-Ziv

Palabra código Palabra diccionario Palabra código Palabra diccionario Palabra código Palabra diccionario

000 x1 000 x1 000 x1


001 x2 001 x2 001 x2
010 010 x1 x2 010 x1 x2
011 011 011 x2 x2
100 100 100
101 101 101
110 110 110
111 111 111

Salida: Salida: 000 Salida: 000 001

Aunque en este ejemplo no se aprecie, a medida que va creciendo el diccionario somos capaces de
representar palabras largas que se repiten con relativamente pocos bits y de ahı́ la capacidad de
compresión del algoritmo y su popularidad aún hoy en dı́a. La gracia de esta técnica es que el proceso
de codificación se puede hacer a la inversa en el descodificador sin necesidad de intercambiar los
diccionarios, únicamente el diccionario inicial.

124
Tema 7: Transmisión Digital en Banda Base
Antoni Morell y José López Vicario

24 de mayo de 2013

1. Introducción
Dentro del esquema general de las comunicaciones digitales visto en la introducción del Tema 6, en este
capı́tulo y también en el siguiente nos centraremos en los bloques modulador y demodulador. Por lo
tanto, estudiaremos el proceso de transformar una secuencia de bits de entrada en una forma de onda
analógica que se pueda transmitir por un determinado medio de comunicación y luego ser recogida en el
extremo receptor para ser devuelta a una secuencia de bits en el correspondiente bloque demodulador.
Como lo medios de transmisión serán básicamente los mismos que se usan en las comunicaciones
analógicas, las problemáticas asociadas al canal serán también las mismas, esto es:

Ruido.

Distorsión.

Ancho de banda limitado.

En el caso de transmitir directamente en banda de base, la información viajará sobre la amplitud de


la señal y es por esto que a continuación hablaremos de la señal PAM (Pulse Amplitude Modulation)
digital. No obstante, un paso previo antes de construir la forma de onda a transmitir s(t) consiste en
transformar la secuencia de bits de entrada {b(k)} en una secuencia de amplitudes (o sı́mbolos) {a(k)}.
Por último, la señal s(t) se genera como concatenación de un pulso conocido p(t) con la particularidad
de que el k-ésimo pulso se ve modificado en amplitud por el k-ésimo sı́mbolo a(k). Ası́ pues, el proceso
que tiene lugar en el modulador es
+∞
X
{b(k)} −→ {a(k)} −→ s(t) = a(k)p(t − kT ) (1)
k=−∞

donde T es el periodo de sı́mbolo. Gráficamente podemos apreciar este proceso en la siguiente figura.
Como veremos en el siguiente apartado, existen varias formas para pasar de bits a sı́mbolos. En algunas
ocasiones un sı́mbolo se corresponde con un solo bit, pero otras veces un sı́mbolo agrupa varios bits.
Nótese que dado el periodo de sı́mbolo T , la velocidad de transmisión en sı́mbolos por segundo es
r = 1/T . De forma semejante, si definimos Tb como el periodo entre dos bits consecutivos, la velocidad
de transmisión en bits por segundo será rb = 1/Tb y la relación entre ambas cantidades es
rb
r= (2)
b
donde b es el número de bits que forman un sı́mbolo.

125
b(k)
‘1’ 3∆/2

a(k)
∆/2
‘0’
bits sı́mbolos
−∆/2

−3∆/2

s(t)
3∆/2

∆/2

t
−∆/2
a(k)p(t − kT )

−3∆/2

2. Señalización
Entendemos por señalización o codificación de lı́nea el proceso de recoger los bits de entrada, conver-
tirlos en sı́mbolos y aplicarles un pulso adecuado a las propiedades del medio de transmisión generando
ası́ la señal PAM. Por lo tanto, un modulador en banda base se encarga esencialmente de llevar a cabo
la codificación de lı́nea.
Podemos clasificar los distintos tipos de señalización según la polaridad, los cruces por cero y el número
de bits por sı́mbolo. Ası́ tenemos:

Según la polaridad.

• Unipolar: únicamente usa una polaridad (generalmente positiva) además de los 0V para
señalizar.
• Polar: usa las dos polaridades.
• Bipolar: usa las dos polaridades y también los 0V.

Según los cruces por cero.

• NRZ (Non Return to Zero): no se fuerza el retorno a 0V antes de pasar al siguiente sı́mbolo.
• RZ (Return to Zero): siempre existe un cruce por 0V antes de pasar al siguiente sı́mbolo.

Según el número de bits por sı́mbolo.

126
• Binaria: se usa un bit en cada sı́mbolo.
• M-aria: cada sı́mbolo se forma con más de un bit.

Antes de centrarnos en los ejemplos más comunes de códigos de lı́nea, veamos los parámetros de calidad
con que podremos comparar las distintas soluciones. Estos son:

Eficiencia espectral: como menor sea el ancho de banda de la modulación resultante, es decir
BT , mejor.

Capacidad de detección/corrección de errores: algunos códigos permitirán la corrección o detec-


ción de errores gracias a que existe una estructura de la señal conocida por el receptor.

Probabilidad de error: como menor sea mejor.

Sincronismo: dado que es importante capturar los distintos sı́mbolos en un determinado instante
(instante de detección) para que la lectura sea lo más favorable posible, los códigos que nos
faciliten la determinación de dichos instantes serán más adecuados.

Contenido de continua: nos interesa que no sea muy elevado ya que se producirá distorsión de
la señal cuando atraviese sistemas como los de telefonı́a donde dicha componente es filtrada.

A continuación repasamos algunos de los códigos de lı́nea más utilizados. En todos los casos hemos
supuesto un pulso rectangular por simplicidad, pero éste debe ser reemplazado cuando corresponda.

Señalización binaria unipolar

La vemos en la siguiente figura. Como podemos apreciar, existe la opción NRZ y también la RZ, en
cuyo caso el valor significativo, es decir 0V o bien +∆V, permanece activo durante τ < T segundos.
Esto requiere pulsos más estrechos para crear la señal PAM respecto al caso NRZ y por lo tanto
mayor ancho de banda. Sin embargo, el periodo de reposo que se fuerza en cada sı́mbolo facilita la
sincronización y también da lugar a un nivel de continua menor pues la media de la señal es más
próxima a cero. Resulta evidente que en ambos casos r = rb .

RZ τ
b(k) a(k)

1 ∆
0 0
NRZ

127
Señalización binaria polar

La podemos ver en la siguiente figura (versión NRZ) y respecto a la versión unipolar, ésta mejora en
términos de continua, pues será nula si p1 = p0 donde p1 es la probabilidad de que el bit sea ‘1’ y p0
de que sea ‘0’. Sin embargo, requerirá más potencia para un mismo valor de ∆.

b(k) a(k)
NRZ
1 ∆
0 −∆

Señalización Manchester

La vemos en la siguiente figura y asegura media nula independientemente de las probabilidades de bit.

‘1’ ‘1’ ‘0’

Señalización Bipolar AMI (Alternate Mark Inversion)

Se trata de una señalización como la unipolar y existe tanto en NRZ como en RZ pero a diferencia de
esta, el bit ‘1’ se representa por ∆ y −∆ de forma alternativa. Esto asegura siempre un nivel nulo de
continua pero dificulta el sincronismo en el caso de recibir una secuencia larga de ceros.

Señalización M-aria

Usa más de dos niveles ya que cada sı́mbolo es el resultado de agrupar dos o más bits. Nótese que
según cómo se haga el mapeado entre bits y sı́mbolos, confundir un sı́mbolo por el que se encuentra
a un solo nivel de separación puede suponer más de un bit de error. Por este motivo es habitual usar
codificación Gray. En la siguiente figura vemos un ejemplo con codificación Gray y 4 niveles (grupos
de 2 bits).

128
3∆/2
b(k) a(k)

10 −3∆/2 ∆/2

11 −∆/2
−∆/2
01 ∆/2
00 3∆/2
−3∆/2

3. Densidad espectral de la señal PAM digital


Recordemos que una vez conocido el tipo de señalización a emplear y la forma del pulso p(t), la señal
PAM digital responde a la expresión
+∞
X
s(t) = a(k)p(t − kT ) (3)
k=−∞

Nos interesa ahora calcular su densidad espectral para poder saber sus caracterı́sticas frecuenciales,
entre otras el ancho de banda que ocupará. Como s(t) es un proceso estocástico, deberemos calcular
primero su función de autocorrelación, esto es
" +∞ ! +∞ !#
X X

Rs (t + τ, t) = E[s(t + τ )s (t)] = E a(k)p(t + τ − kT ) a(l)p(t − lT ) (4)
k=−∞ l=−∞

donde hemos considerado que tanto el pulso p(t) como los sı́mbolos a(k) son reales. Teniendo en cuenta
que sólo éstos son aleatorios, podemos desarrollar el producto de sumatorios del siguiente modo,
+∞
X +∞
X
Rs (t + τ, t) = E[a(k)a(l)]p(t + τ − kT )p(t − lT ) (5)
k=−∞ l=−∞
+∞ X
X +∞
= Ra (k − l)p(t + τ − kT )p(t − lT )
k=−∞ l=−∞

donde Ra (k − l) es la autocorrelación de los sı́mbolos cuando están separados k − l instantes de tiempo.


Haciendo el cambio de variable k − l = m (es decir k = m + l), llegamos a
+∞
X +∞
X
Rs (t + τ, t) = Ra (m)p(t + τ − (m + l)T )p(t − lT ) (6)
m=−∞ l=−∞

Comprobamos que no es un proceso estacionario pues hay dependencia en τ pero también en t. No


obstante, la función Rs (t+τ, t) presenta periodicidad T , lo cual podemos comprobar fácilmente viendo
que Rs (t + τ, t) = Rs (t + nT, t + nT + τ ) con n ∈ Z. Faltarı́a comprobar si la media también es cı́clica
para poder decir que se trata de un proceso cicloestacionario, pero ya anticipamos que ası́ es. En este
caso y según vimos en el Tema 1, debemos calcular la media de la autocorrelación en un periodo para

129
luego poder transformar y obtener ası́ la densidad espectral de potencia.

Calculemos entonces la autocorrelación media, esto es


Z +∞ +∞
1 T /2 X X
hRs (t + τ, t)i = Ra (m) p(t + τ − (m + l)T )p(t − lT ) dt (7)
T −T /2 m=−∞
l=−∞

Si hacemos el cambio de variable λ = t − lT llegamos a


+∞
X +∞ Z −T /2−lT
1 X
hRs (t + τ, t)i = Ra (m) p(τ + λ − mT )p(λ) dλ (8)
m=−∞
T T /2−lT
l=−∞

y si nos fijamos en los lı́mites del segundo sumatorio, vemos que se barren todos los intervalos de
duración T desde l = −∞ hasta l = +∞. Por lo tanto, podemos obviar el sumatorio si integramos en
todo λ, esto es
+∞
X Z
1 +∞
hRs (t + τ, t)i = Ra (m) p(τ + λ − mT )p(λ) dλ (9)
m=−∞
T −∞
+∞
X
1
= Ra (m)Rp (τ − mT )
T m=−∞
R +∞
Téngase en cuenta que p(t) es un pulso de duración finita y por lo tanto Rp (τ ) = −∞ p(τ + t)p(t) dt.
Con este resultado ya podemos calcular la potencia de la señal PAM como
+∞
X
1
Ps = Rs (0) = Ra (m)Rp (mT ) (10)
T m=−∞

Por ejemplo, si p(t) = Π τt con τ ≤ T (ejemplo usado en el anterior apartado sobre señalización),
entonces Rp (mT ) = 0 excepto para m = 0 y por lo tanto
1 1
Ps = Ra (0)Rp (0) = Ra (0)Ep (11)
T T
donde Ep es la energı́a del pulso. El resultado obtenido se puede considerar en realidad genérico ya,
como veremos más adelante, normalmente emplearemos pulsos que cumplan Rp (mT ) = 0 para evitar
lo que se conoce como interferencia intersimbólica (ISI).

Pasemos ahora al cálculo de la densidad espectral de potencia. Para ello, recordemos el teorema de
Wiener-Khinchin visto en el Tema 1 que nos decı́a Ss (f ) = F{hRs (t + τ, t)i}. Ası́ pues, podemos
calcular la densidad espectral de s(t) como
Z +∞ Z +∞
1 +∞ X
Ss (f ) = Rs (τ )e−j2πf τ dτ = Ra (m)Rp (τ − mT )e−j2πf τ dτ (12)
−∞ T −∞ m=−∞
  +∞ Z +∞
0 1 X 0
= τ = τ − mT = Ra (m) Rp (τ 0 )e−j2πf τ e−j2πf mT dτ 0
T m=−∞ −∞
+∞ Z +∞
1 X 0
= Ra (m)e−j2πf mT Rp (τ 0 )e−j2πf τ dτ 0
T m=−∞ −∞

130
Vemos que la última integral se corresponde con la transformada de Fourier de la autocorrelación
del pulso y es por lo tanto su densidad espectral de energı́a ya que se trata de un pulso de duración
finita. Sabemos que en este caso la densidad espectral vale |P (f )|2 donde P (f ) = F{p(t)}. Hecha esta
aclaración podemos continuar con nuestro cálculo,
+∞
X
1
Ss (f ) = |P (f )|2
Ra (m)e−j2πf mT (13)
T m=−∞

Si ahora nos fijamos en el sumatorio en m nos daremos cuenta de que se correponde con la transformada
de Fourier continua de la secuencia discreta Ra (m) evaluada en f T . En otras palabras, se trata de la
densidad espectral de potencia de a(k) evaluada en f T o bien Sa (f T ). Ası́ pues, llegamos al siguiente
resultado,
1
Ss (f ) = |P (f )|2 Sa (f T ) (14)
T

Podemos afinar aún más este resultado si quitamos a los sı́mbolos a(k) su media ā haciendo a(k) =
A(k) + ā. Con esto podemos descomponer Ra (m) como

Ra (m) = E[a(k + m)a(k)] = E[(A(k + m) + ā)(A(k) + ā)] = E[A(k + m)A(k)] + ā2 = RA (m) + ā2 (15)

Equivalentemente, podemos escribir

Ra (m) = Ca (m) + ā2 (16)

donde Ca (m) , E[(a(k + m) − ā)(a(k) − ā)] es la covarianza de los sı́mbolos. Aplicando este resultado
a (9) obtenemos
+∞
X +∞
X
1 1
hRs (t + τ, t)i = Ca (m)Rp (τ − mT ) + ā2 Rp (τ − mT ) (17)
T m=−∞
T m=−∞

Si lo expresamos como
+∞
X +∞
X
1 1
hRs (t + τ, t)i = Rp (τ ) ∗ Ca (m)δ(τ − mT ) + ā2 Rp (τ ) ∗ δ(τ − mT ) (18)
T m=−∞
T m=−∞

nos resultará fácil calcular de nuevo la densidad espectral de potencia como transformada de la au-
P
tocorrelación si tenemos en cuenta el desarrollo anterior y la igualdad F{ +∞ m=−∞ δ(τ − mT )} =
1 P+∞ m
T m=−∞ δ(τ − T ), llegando a

+∞
X +∞
X
Ss (f ) = r|P (f )|2 Ca (m)e−j2πf mT + r2 ā2 |P (mr)|2 δ(f − mr) (19)
m=−∞ m=−∞

donde r = 1/T . Nótese que el primer término es continuo en frecuencia y depende de la variabilidad de
los sı́mbolos entorno a su media mientras que el segundo término es discreto en frecuencia y depende
de la media o componente de continua de los sı́mbolos. Además, si suponemos que los sı́mbolos a(k)

131
son independientes y por lo tanto incorrelados además de idénticamente distribuidos, su covarianza
será nula excepto para m = 0, donde valdrá σa2 (su varianza). Considerando lo dicho llegamos a
+∞
X
Ss (f ) = rσa2 |P (f )|2 + r2 ā2 |P (mr)|2 δ(f − mr) (20)
m=−∞

y la potencia de la señal vale


Z +∞ +∞
X
Ps = Ss (f ) df = rσa2 Ep 2 2
+ r ā |P (mr)|2 (21)
−∞ m=−∞

Ejemplo: señalización unipolar binaria con RZ

Consideremos un pulso cuadrado como los vistos anteriomente y de duración inferior a T . Por sim-

plicidad, lo situamos entorno al origen, es decir, p(t) = Π τt , como se puede apreciar en la siguiente
figura.

p(t)
T

Supondremos sı́mbolos i.i.d con p(a(k) = 0) = p y p(a(k) = ∆) = q y por lo tanto ā = 0·p+∆·q = ∆·q.
Además, la autocorrelación valdrá

Ra (m) = E[a(k + m)a(k)]


= 2 · 0 · ∆ · p(a(k) = 0, a(k + m) = ∆)
+ 02 · p(a(k) = 0, a(k + m) = 0) + ∆2 p(a(k) = ∆, a(k + m) = ∆)
= q 2 ∆2

y la covarianza valdrá
Ca (m) = Ra (m) − ā2 = q 2 · ∆2 − q 2 · ∆2 = 0 (22)
ya que se trata de variables independientes. Lo dicho es cierto para todo m excepto para m = 0, en
cuyo caso

Ra (0) = 02 p(a(k) = 0) + ∆2 p(a(k) = ∆) = q · ∆2 (23)


Ca (0) = σa2 2 2 2
= Ra (0) − ā = q∆ − q ∆ = q∆ (1 − q) = pq∆2 2 2
(24)

Por último, |P (f )|2 = sinc2 (f τ ), ası́ que


+∞
X
Ss (f ) = rσa2 sinc2 (f τ ) + r2 ā2 |P (mr)|2 δ(f − mr) (25)
m=−∞

132
El espectro resultante es el que vemos en la figura siguiente. Nótese que cuando τ < T las deltas
aparecen en medio de los lóbulos de la sinc y no se anulan mientras que en el caso τ = T (NRZ) éstas
se anulan y el ancho de banda pasa a ser el menor posible.

Ss (f )

1/τ 2/τ 3/τ f


1/T 2/T 3/T

4. Ruido y errores en transmisión digital: probabilidad de error


En comunicaciones analógicas vimos que la señal recibida estaba siempre corrompida por ruido. A
través de filtros en el receptor o incluso del uso de filtros terminales óptimos, asegurábamos que el
nivel de ruido fuera de alguna manera ‘el menor posible’. Sin embargo, la señal recibida siempre era
una versión corrompida de la señal enviada. En comunicaciones digitales esto es distinto ya que, si
por ejemplo enviamos una señal binaria unipolar, es factible que, aunque los niveles de los pulsos se
vean alterados por ruido, esta alteración no sea suficiente para confundir el nivel alto con el nivel bajo.
Es por eso que a partir de este momento hablaremos de la probabilidad de error, que puede ser de
sı́mbolo o de bit, y que nos mide con frecuencia estadı́stica se dan dichas confusiones o errores.

â(k)
s(t) y(t) y(kT )
CODIFICADOR DETECTOR DECODIFICADOR
b(k) DE LÍNEA
hc (t) hR (t) DE NIVEL DE LÍNEA b̂(k)

w(t)
p(t)

Consideremos ahora el esquema de la figura anterior con el sistema de transmisión completo, donde
vemos que la señal PAM viaja por el canal hc (t), se le añade el proceso de ruido w(t) que conside-
raremos AWGN con densidad espectral Sw (f ) = N0 /2 y pasa por el filtro receptor hR (t). Luego la
señal es muestreada para recuperar los niveles estimados â(k) y poder recuperar la información b̂(k).
Analicemos ahora la señal y(t) a la salida del filtro receptor, que valdrá
+∞
!
X
y(t) = s(t) ∗ hc (t) ∗ hR (t) + n(t) = a(i)p(t − iT ) ∗ hc (t) ∗ hR (t) + n(t) (26)
i=−∞
+∞
X +∞
X
= a(i)p(t) ∗ hc (t) ∗ hR (t) ∗ δ(t − iT ) + n(t) = a(i)pR (t − iT ) + n(t)
i=−∞ i=−∞

133
donde hemos considerado pR (t) = p(t) ∗ hc (t) ∗ hR (t) como el pulso recibido y n(t) = w(t) ∗ hR (t) como
R +∞
el ruido a la salida del filtro receptor cuya potencia vale σn2 = −∞ Sw (f )|HR (f )|2 df .

A partir de este momento consideraremos que pR (t) cumple


(
1 i=0
pR (iT ) = (27)
0 i 6= 0

y que el proceso de ruido es gausiano de media nula. Por lo tanto, su función densidad de probabilidad
valdrá 2
1 − n
fn (n) = √ e 2σn2 (28)
2πσn
Por lo tanto, la señal recibida una vez muestreada se obtiene de sustituir t = kT en (26), esto es
X
y(kT ) = a(k) pR (0) + a(i) pR ((k − i)T ) + n(kT ) (29)
i6=k

y aplicando (27) llegamos a


y(kT ) = a(k) + n(kT ) (30)
En otras palabras, si nos fijamos únicamente en un instante k determinado, el nivel recibido es

y =a+n (31)

donde vemos claramente que el nivel emitido a es enmascarado por la realización de ruido n. En
función del valor que tome n y teniendo en cuenta que hay un conjunto finito de posibles valores de a,
seremos capaces de recuperar el valor emitido o bien lo confundiremos con otro. Como más separados
estén los valores que toma a o, equivalentemente, como menor sea la amplitud del ruido n, más difı́cil
será incurrir en un error de reconstrucción. A continuación nos centramos en el caso binario.

Probabilidad de error en señalización binaria

En el caso binario la amplitud a podrá tomar dos posibles valores: s0 que es el valor bajo y s1 que
es el valor alto. Correspondientemente hablaremos de la hipótesis H0 cuando creemos que s0 se ha
enviado y de la hipótesis H1 cuando creemos que ha sido s1 el valor enviado. Con H0 la señal recibida
será y = s0 + n y por lo tanto la distribución de y será en este caso una gausiana de varianza σn2 pero
centrada a s0 , esto es
(y−s0 )2
1 −
fy (y|H0 ) = √ e 2σn2 = fn (y − s0 ) (32)
2πσn
ya que n = y − s0 . De igual modo
2
(y−s1 )
1 −
fy (y|H1 ) = √ e 2σn2 = fn (y − s1 ) (33)
2πσn
Podemos ver esto mismo en la siguiente figura.

134
fy (y|H0 ) fy (y|H1 )

σn σn
y
s0 s1
γ

En la figura vemos un umbral γ que hay que fijar obligatoriamente para que el detector de nivel pueda
decidir si el sı́mbolo emitido es s0 o bien s1 . Ası́, cuando y < γ estaremos en la hipótesis H0 y el nivel
estimado será â = s0 . Del mismo modo, cuando y ≥ γ estaremos en la hipótesis H1 y el nivel estimado
será â = s1 . La cuestión ahora es ver cuánto vale la probabilidad de error en cada uno de los casos.
La probabilidad de error bajo la hipótesis H0 valdrá
Z +∞ Z +∞ Z +∞ (y−s0 ) 2
1 −
P (e|H0 ) = fy (y|H0 ) dy = fn (y − s0 ) dy = √ e 2σn2 dy (34)
γ γ γ 2πσn

y corresponde al área marcada con textura de puntos en la figura anterior. Nótese que únicamente los
valores de y situados por encima del umbral darán lugar a error y que forman un conjunto de baja
probabilidad como en la figura cuando el sistema funcione de modo adecuado. De forma parecida, la
probabilidad de error bajo la hipótesis H1 valdrá
Z γ Z γ Z γ (y−s1 ) 2
1 −
P (e|H1 ) = fy (y|H1 ) dy = fn (y − s1 ) dy = √ e 2σn2 dy (35)
−∞ −∞ −∞ 2πσn
y corresponde al área gris de la figura. Habiendo calculado ambas probabilidades, la probabilidad total
de error Pe se calcula como
Pe = p0 P (e|H0 ) + p1 P (e|H1 ) (36)
La cuestión ahora es cómo fijar el umbral óptimo de decisión. Para ello derivamos Pe respecto a γ e
igualamos a 0, esto es,
Z +∞ Z γ
∂Pe ∂ ∂
= p0 fn (y − s0 ) dy + p1 fn (y − s1 ) dy = 0 (37)
∂γ ∂γ γ ∂γ −∞

Si aplicamos el teorema fundamental del cálculo, que nos dice


Z b(x)
d
f (t)dt = f (b(x)) · b0 (x) − f (a(x)) · a0 (x) (38)
dx a(x)

llegamos a la siguiente condición de optimalidad para γ,

−p0 fn (γ − s0 ) + p1 fn (γ − s1 ) = 0 (39)

Operando un poco llegamos a

(γ − s1 )2 (γ − s0 )2
log(p0 ) + = log(p 1 ) + (40)
2σn2 2σn2

135
y asilando γ obtenemos la condición
 
p1
log p0 2σn2 + s20 − s21
γopt = (41)
2(s0 − s1 )

Por lo tanto, si p1 = p0 entonces γopt = s0 +s


2 , es decir, el punto medio de los niveles como podrı́amos
1

haber intuido a la vista de la figura anterior ya que en este caso ambas áreas deben ser iguales. No
obstante, el umbral de la figura puede ser bueno si se transmiten más ceros que unos ya que los ’ceros’
tendrán menos error. Es cierto que los ’unos’ se verán perjudicados, pero también se transmiten con
menor frecuencia.

Volvamos ahora al cálculo de Pe a partir de (36) sustituyendo las probabilidades condicionadas, esto
es Z +∞ Z γ
(y−s0 )2 (y−s1 )2
1 − 2 1 −
Pe = p 0 √ e 2σn dy + p1 √ e 2σn2 dy (42)
γ 2πσn −∞ 2πσn
Estas integrales no tienen solución cerrada y es por ello que utilizamos tablas o métodos numéricos
para resolverlas. Existen varias funciones conocidas (tabuladas) que sirven para dicho cálculo como
la función Q(x), la función error erf (x) o la función error complementario erf c(x). Todas ellas están
relacionadas y nosotros trabajaremos con la función Q(x), que se define como
Z +∞
1 2
Q(x) = √ e−λ /2 dλ (43)
2π x
Gracias a la función Q(x) podremos calcular P (e|H0 ) y P (e|H1 ). Empecemos por la primera ya que
es la que más se parece a la función Q(x). Bastará con el cambio de variable y 0 = y−s σn para conseguir
0

nuestro fin, esto es


Z +∞ (y−s0 )2
Z +∞  
1 − 2 1 −y 0 /2 0 γ − s0
P (e|H0 ) = √ e 2σn dy = √ e σn dy = Q (44)
γ 2πσn γ−s0
2πσn σn
σn

En el caso de P (e|H1 ) procedemos del mismo modo y obtenemos


Z γ (y−s1 )2
Z γ−s1
1 − σn 1 0
P (e|H1 ) = √
e 2σn
2
dy = √ e−y /2 σn dy 0 (45)
−∞ 2πσn −∞ 2πσn
Z +∞  
1 0
−y /2 0 γ − s1
= 1− √ e σn dy = 1 − Q
γ−s1
2πσ n σn
σn

donde la última igualdad viene dada por el hecho de que la integral de toda la gaussiana (es una pdf)
vale 1. Finalmente, aprovechamos la propiedad de la función Q(x) que nos dice Q(−x) = 1 − Q(x)
(véase la siguiente figura) para escribir
 
s1 − γ
P (e|H1 ) = Q (46)
σn
Agrupando todo, podemos decir que Pe vale
   
γ − s0 s1 − γ
Pe = p0 Q + p1 Q (47)
σn σn

136
! "
1 2
− u2
√ e

u
−x x

En el caso que escojamos γ como el punto medio de los niveles, es decir γ = s0 +s


2 , tendremos
1

       
s1 − s0 s1 − s0 s1 − s0 d
Pe = p 0 Q + p1 Q =Q =Q (48)
2σn 2σn 2σn 2σn

y por lo tanto, la probabilidad de error depende del cociente entre la mitad de la distancia entre
sı́mbolos y la desviación estándar del ruido. Alternativamente, se puede expresar la Pe en función de
la potencia de la señal, que según hemos visto en el apartado anterior vale Ps = rRa (0)Ep donde
r = 1/T .

Ejemplo: señalización binaria polar vs unipolar

Calculemos a continuación la Pe (Ps ) para señalización polar y para señalización unipolar (sı́mbolos
equiprobables). Para el caso polar,

1 1 Ps
Ra (0) = (−∆)2 + ∆2 = ∆2 −→ Ps = r∆2 Ep −→ ∆2 = (49)
2 2 rEp

y como ∆ es justamente la mitad de la distancia entre sı́mbolos, llegamos a


s !
Ps
PeP OLAR = Q (50)
rEp σn2

Si hacemos lo mismo para el caso unipolar, tenemos

1 1 ∆2 ∆2 ∆2 Ps
Ra (0) = 02 + ∆2 = −→ Ps = r Ep −→ = (51)
2 2 2 2 4 2rEp
∆2 ∆
donde aislado 4 ya que la mitad de la distancia entre sı́mbolos es en este caso 2. Ası́ la Pe nos queda
s !
Ps
PeU N IP OL = Q (52)
2rEp σn2

Como la función Q es monótona decreciente, entonces para una misma potencia transmitida, se cumple
siempre
PeP OLAR < PeU N IP OL (53)

137
Probabilidad de error en señalización M-aria

En este caso existen M sı́mbolos posibles que son si , i = 1, . . . , M y que además supondremos equi-
probables por simplicidad de cálculo. Por lo tanto habrá que fijar M − 1 umbrales de decisión como
muestra la figura siguiente y decidiremos el sı́mbolo si si el valor recibido y (recordemos que era para
un determinado instante k) se encuentra entre los umbrales γi−1 y γi .

fy (y|HM )

s1 s2 s3 sM y
γ1 γ2 γ3 γM −1

En este caso la probabilidad de error valdrá


M −1 Z γi Z +∞ 
1 X
Pe = fy (y|Hi+1 ) dy + fy (y|Hi ) dy (54)
M −∞ γi
i=1
donde recorremos los M umbrales de decisión y sumamos la contribución a la Pe cuando el sı́mbolo
emitido es el de la derecha del umbral (primera integral) o bien el de la izquierda (segunda integral).
Suponemos, por lo tanto, que es muy poco probable que un sı́mbolo transmitido caiga dentro del
intervalo de decisión de un sı́mbolo no consecutivo.

De la misma forma que en el caso binario, podemos calcular los valores óptimos de los umbrales
haciendo
∂Pe 1
= (fy (γi |Hi+1 ) − fy (γi |Hi )) = 0 (55)
γi M
y por lo tanto la condición de optimalidad es
fy (γi |Hi+1 ) = fy (γi |Hi ) (56)
exactamente igual que en el caso binario y por lo tanto
si + si+1
γiopt = (57)
2
Si queremos expresar Pe usando la función Q(x) debemos fijarnos que el término dentro del sumatorio
en (54) es exactamente lo mismo que tenı́amos en (42) para el caso binario (M = 2) donde el resultado
1
era Pe = 2 M Q(d/2σn ), siendo d la distancia entre sı́mbolos (nótese el factor 2 necesario para tener
en cuenta la probabilidad de error a izquierda y derecha del umbral). Asi pues, sumando los M − 1
términos de igual valor obtenemos
   
1 d 2(M − 1) d
Pe = (M − 1)2Q = Q (58)
M 2σn M 2σn
Finalmente, igual que hemos visto para el caso binario, nos interesará expresar la Pe en función de Ps
gracias a la expresión
Ps = rRa (0)Ep (59)
A continuación lo vemos en la señalización M-aria polar como ejemplo.

138
Ejemplo: señalización M-aria polar

En el caso polar y con sı́mbolos equiprobables su media será 0. Por lo tanto, como ya vimos en (16)
podemos sustituir la autocorrelación por la covarianza (varianza en este caso ya que evaluamos Ra (0)),
es decir,
Ps = rσa2 Ep (60)
A fin de calcular la varianza de los sı́mbolos, primero expresamos la amplitud que toma el i-ésimo
sı́mbolo en el caso general, esto es
 
(M − 1)
si = (i − 1) − ∆, i = 1, . . . , M (61)
2

con lo que ya podemos calcular su varianza como


M
X M   M  
1 X (M − 1) 2 2 ∆2 X (M − 1) 2
σa2 = p(si )s2i = (i − 1) − ∆ = (i − 1) − (62)
M 2 M 2
i=1 i=1 i=1

P −1 PM M (M −1) PM −1
Desarrollando el cuadrado anterior y sabiendo que M i=0 i = i=1 i − 1 = 2 y que i=0 i2 =
M (M −1)(2M −1)
6 llegamos a
M2 − 1 2
σa2 = ∆ (63)
12
y dado que la mitad de la distancia entre sı́mbolos es d/2 = ∆/2, entonces nos interesa sacar ∆2 /4 de
la expresión de Ps , esto es
∆2 12Ps 3Ps
= 2
= (64)
4 4rEp (M − 1) rEp (M 2 − 1)
ası́ que s !
2(M − 1) 3Ps
Pe = Q (65)
M rEp (M 2 − 1)σn2

Cabe destacar que la probabilidad que hemos calculado en el ejemplo anterior y también en un caso
genérico es la probabilidad de error de sı́mbolo, que se corresponde con la probabilidad de
error de bit únicamente en el caso binario. En el caso M-ario supondremos que la relación señal a
ruido es suficientemente elevada como para que los errores que se den sean entre sı́mbolos adyacentes.
Además, usaremos codificación de Gray para que el error de un sı́mbolo suponga el error en un único
bit a la hora de decodificar. Como M = 2b siendo b el número de bits por sı́mbolo, a partir de M
sabremos que
b = log2 M (66)
y por lo tanto la probabilidad de error de bit Pb valdrá
s !
Pe 2(M − 1) 3Ps
Pb ≈ = Q (67)
log2 M M log2 M rEp (M 2 − 1)σn2

139
Con esta expresión estamos diciendo que un error de sı́mbolo equivale al error en un bit. No obstante,
como hay varios bits en un sı́mbolo, la probabilidad de error de bit debe ser escalada a razón de b.

Por último, recordar que normalmente hablaremos de la tasa de datos o ‘rate’ de la comunicación
en unidades de bits por segundo. No obstante, r tiene unidades de sı́mbolos por segundo. Como ya
habı́amos visto, sabiendo el número de bits b por sı́mbolo podemos relacionar ambas cantidades según

rb = r · b = r log2 M (68)

5. Filtro adaptado
En el punto anterior hemos calculado la probabilidad de error de sı́mbolo y de bit suponiendo que
no habı́a ISI y que el ruido era gaussiano de media nula y varianza (equivalente a potencia) σn2 . En
este apartado supondremos un canal ideal hc (t) = αδ(t − tc ) que no modificará la forma de la señal
transmitida (simplemente la escalará y retardará) y nos preocuparemos del diseño del filtro receptor
P
hR (t), tal y como podemos ver en la siguiente figura, donde sR (t) = α +∞
k=−∞ a(k)p(t − kT − tc ) es la
señal recibida.

â(k)
+∞
y(t) kT
!
DETECTOR DECODIFICADOR
α a(k)p(t − kT − tc ) hR (t) DE NIVEL DE LÍNEA b̂(k)
k=−∞

w(t)

Suponiendo por ahora que se mantiene la condición de no ISI (volveremos a ello más adelante),
nuestro objetivo debe ser minimizar la probabilidad de error, ya sea de bit o de sı́mbolo, y para ello
nos interesa que la contribución del ruido sea lo menor posible en el instante de muestreo. Visto de
otra forma, Pe es una función monótona decreciente de k∆/σn (donde k es una constante que depende
del tipo de señalización), ası́ que maximizando la relación ∆/σn conseguimos minimizar Pe . Téngase
en cuenta además que hR (t) ya se encargará de compensar la atenuación introducida por el canal a fin
de restaurar los niveles originales de los sı́mbolos emitidos. Pues bien, este objetivo es justamente lo
que perseguı́a el filtro adaptado que se vio en el apartado 8 del tema 2, donde se planteaba la situación
que podemos ver en la siguiente figura, es decir, se emitı́a un pulso p(t) que se recibı́a con un retraso
tc y escalado α. El objetivo era diseñar el filtro hr (t) para que en un tiempo posterior tc + td donde td
era un tiempo de diseño necesario para poder hacer un filtro causal, la relación entre la amplitud de
la señal a la salida del filtro y σn (varianza del ruido después del filtro) fuera lo mayor posible.

140
xR (t) y(t)
p(t)
xR (t) = αp(t − tc ) HR (f ) y(t)

tc t t c + td t
w(t), Sw (f )

Se llegó entonces al siguiente resultado (para densidad espectral de ruido plana Sn (f ) = N0 /2 y por
lo tanto incorrelado, que es el caso que supondremos aquı́),

2k ∗ 2k
HR (f ) = P (f )e−j2πf td ←→ hR (t) = p(td − t) (69)
N0 N0
donde la amplitud k y el retardo td eran parámetros de diseño. Por comodidad, sustituimos λ = 2k/N0
y nos queda
HR (f ) = λ P ∗ (f )e−j2πf td ←→ hR (t) = λ p(td − t) (70)
es decir, el filtro adaptado tiene la misma forma que el pulso emitido p(t) salvo que girado y retrasado
td segundos.

Fijémonos que la señal PAM no es un sólo pulso como habı́amos planteado en el tema 2 sino una
concatenación de pulsos, pero ésta es la única diferencia. Como veremos a continuación, el filtro
adaptado que vimos nos sirve para recibir de forma óptima señales PAM cuando el canal es ideal y el
P
ruido gaussiano e incorrelado. Partiendo de sR (t) = α +∞ i=−∞ a(i)p(t − iT − tc ), la señal a la salida
del filtro receptor vale
+∞
X
y(t) = (sR (t) + w(t)) ∗ hR (t) = α λ a(i)p(t − iT − tc ) ∗ p(td − t) + n(t) (71)
i=−∞
+∞
X
= αλ a(i)p(t) ∗ δ(t − iT − tc ) ∗ p(−t) ∗ δ(t − td ) + n(t)
i=−∞
+∞
X
= αλ a(i)Rp (t − iT − (tc + td )) + n(t)
i=−∞

Ahora debemos muestrear cada kT segundos pero hay que considerar el retraso introducido por el
canal y el filtro receptor a fin de recoger la máxima amplitud posible a la salida del filtro. Ası́, los
instantes de muestreo deben de ser tk = kT + td + tc y la señal muestreada vale
X
y(tk ) = α λ a(k)Rp (0) + α λ a(k)Rp ((k − i)T ) + n(tk ) (72)
i6=k

y dado que el pulso emitido p(t) se ha diseñado de tal forma que Rp (iT ) = 0 excepto para i = 0
(condición de ISI nula), la salida es

y(tk ) = α λ a(k)Rp (0) + n(tk ) (73)

141
1
Además, como Rp (0) = Ep , escogeremos λ = α Ep y nos queda
y(tk ) = a(k) + n(tk ) (74)
es decir, el modelo que habı́amos usado en el apartado anterior sin ISI y óptimo en términos de ruido
por la condición de diseño del filtro adaptado. Nótese que gracias al filtro adaptado minimizamos la
contribución del ruido, pues éste ha sido nuestro principio de diseño. Téngase también en cuenta que
con el factor λ escalamos tanto ruido como amplitud del sı́mbolo (sirve para normalizar) y por lo tanto
no afecta a la condición de optimalidad del filtro.

t

Ejemplo: señalización polar M-aria NRZ con p(t) = Π T

En este caso el filtro adaptado se construye como vemos en la siguiente figura, donde td debe ser como
mı́nimo T /2 para que hR (t) sea causal.

p(t) p(−t) p(td − t)


NO CAUSAL CAUSAL

t t t
td

P
Si s(t) = +∞ k=−∞ a(k)p(t − kT ) es la señal enviada, hc (t) = αδ(t − tc ) y escogemos td = T /2, a la
salida del receptor tendremos la señal representada en la siguiente figura (sin incluir el ruido). En este
caso tenemos una señal con únicamente 4 sı́mbolos. A la salida del receptor podemos ver cada una de
las funciones triangulares resultantes de la convolución de los pulsos emitidos con el filtro adaptado
y en trazo rojo la señal que verı́amos a la salida (suma de todas las funciones triangulares). Hay dos
cosas importantes a tener en cuenta: i) en los instantes de detección únicamente existe contribución
del sı́mbolo ‘que toca’ mientras que el resto de ‘triángulos’ toman valor cero (no hay ISI) y ii) en los
instantes de detección se concentra toda la energı́a del pulso (ya que es proporcional a Rp (0)), que es
lo que nos permite distanciarnos al máximo del ruido (en la figura no lo hemos dibujado). Nótese que
el filtro adaptado escala adecuadamente la señal a su salida para que los niveles de los sı́mbolos sean
los mismos que en transmisión.

T + tc + T /2
s(t)
2T + tc + T /2
3∆/2 3∆/2

∆/2 ∆/2
2T hc (t) hR (t)
−∆/2
T t −∆/2 t

−3∆/2 −3∆/2

142
Probabilidad de error de bit en función de Eb /N0 para señalización M-aria polar

Recordemos que en la sección anterior habı́amos obtenido Pb (también llamada ’Bit Error Rate’ o
BER) y valı́a s !
2(M − 1) 3Ps
BER = Pb ≈ Q (75)
M log2 M rEp (M 2 − 1)σn2
Esto era para sı́mbolos equiprobables y umbrales de detección óptimos. En el caso de usar el filtro
adaptado, podemos calcular la potencia de ruido a la salida del filtro como
Z +∞ Z
2 N0 2 N0 +∞ 2
σn = |HR (f )| df = λ |P (f )|2 df (76)
−∞ 2 2 −∞

Sabiendo que hemos fijado λ = α 1Ep donde α es la atenuación en amplitud del canal y recordando que
|P (f )|2 es la densidad espectral de energı́a del pulso emitido p(t), llegamos a

N0 λ2 N0
σn2 = Ep = (77)
2 2|α|2 Ep

donde vemos claramente que el escalado de la señal deseada se refleja también en la potencia de ruido.
Por otro lado, la energı́a (media) de sı́mbolo o Es es por definición el producto de la potencia media
de la señal por la duración de un sı́mbolo, es decir

Es = Ps T (78)

y la podemos traducir a energı́a de bit o Eb usando el número de bits por sı́mbolo b, es decir
Es Es
Eb = = (79)
b log2 M

Aplicando estos resultado a (75) y recordando que T = 1/r, llegamos a


s ! s !
2(M − 1) 6|α|2 Es 2(M − 1) 6|α|2 log2 M Eb
BER ≈ Q = Q (80)
M log2 M (M 2 − 1)N0 M log2 M (M 2 − 1) N0

Expresar BER(Eb /N0 ) nos es útil para hacer una comparación justa entre señalizaciones ya que hemos
independizado la expresión de la tasa de señalización r y lo que importa es la relación entre la energı́a
dedicada a un bit y N0 . Dicho de otro modo, comparamos la BER para un mismo rb y una misma
Eb /N0 . Por ejemplo, si suponemos un canal sin pérdidas (|α| = 1), tenemos
q 
2Eb
M = 2, b = 1: BER = Q N0
q 
3 4 Eb
M = 4, b = 2: BER = 4 Q 5 N0

6. Interferencia intersimbólica (ISI) y pulsos de Nyquist


Hasta este momento hemos supuesto que los pulsos emitidos conseguı́an ISI nula en el receptor. En
este apartado nos preguntamos qué forma debe tener p(t) para que se cumpla dicha condición. De

143
manera genérica, si la señal recibida después del filtro receptor (sea o no el filtro adaptado) se expresa
como X
y(t) = a(i)pR (t − iT ) + n(t) (81)
i

y se muestrea en los instantes tk = kT (obviamos por simplicidad los retrasos tc y td ), los niveles
recuperados son X
y(tk ) = a(k)pR (0) + a(i)pR ((k − i)T ) +n(tk ) (82)
k6=i
| {z }
ISI
P
donde el término k6=i a(i)pR ((k − i)T ) es lo que denominamos ISI ya que los sı́mbolos anteriores o
posteriores enmascaran el sı́mbolo deseado al igual que lo hace el ruido. Nótese que en el caso de usar
el filtro adaptado pR (t) = (1/Ep ) Rp (t).

Para que no exista ISI, como ya hemos anticipado en apartados anteriores, se requiere que
(
1 k=0
pR (kT ) = (83)
0 k 6= 0

y por lo tanto, nos da igual los valores que tome pR (t) fuera de los instantes de muestreo. De forma
más compacta, podemos escribir dicha condición como
X
pR (t) δ(t − kT ) = δ(k) (84)
k

ya que el producto de pR (t) por el tren de deltas los que hace es seleccionar únicamente los instantes
de muestreo y al igualar a δ(k) (la delta digital en un abuso de notación ya que debe tomar valor 1
para k = 0 y 0 en los demás k).

Esta misma condición se puede ver a nivel frecuencial simplemente haciendo la transformada de
Fourier, esto es X
r PR (f − nr) = 1 (85)
k

es decir, la suma de las réplicas de PR (f ) situadas a múltiplos de r = 1/T deben dar lugar a un espectro
plano. Por lo tanto, si el ancho de banda de transmisión BT es menor que r/2, entonces estamos ante
una situación como la de la siguiente figura (izquierda) y es imposible cumplir la condición de no ISI,
ası́ que BTmin = r/2, caso en el que tendremos la situación de la parte derecha de la figura (donde el
pulso rectangular en frecuencia es la única opción).

ISI NO ISI

r 2r 3r f r 2r 3r f

144
Si antitransformamos el pulso rectangular vemos que el pulso recibido debe ser

pR (t) = sinc(rt) (86)

Con este pulso conseguimos el menor ancho de banda posible pero no es realizable, ası́ que la alter-
nativa es permitir pulsos de ancho de banda BT > r/2 que siempre deben presentar simetrı́a vestigial
alrededor de r/2 para poder cumplir la condición de Nyquist en (85) según se puede ver en la figura
siguiente. A los pulsos que cumplen dicha condición los denominamos pulsos de Nyquist en general y
la familia más conocida es la de los pulsos de coseno alzado (en la figura).

pR (t)

β=0 PR (f ) 1
β = 0.5 T 2T
β=1 β=1

f t
r/2 r 2r
β=0 β = 0.5

La forma temporal de los pulsos coseno alzado es


cos πβrt
pN (t) = sinc(rt) (87)
1 − (4βrt)2

y su transformada

 1 1−β
r, h
 |f | ≤ 2 r
 h ii
1−β
PN (f ) = 1
2r
π
1 + cos βr |f | − r 2 , r 1−β 1+β
2 < |f | ≤ r 2 (88)



0, |f | > r 1+β
2

El factor β se denomina factor de ’roll-off’ y controla el ancho de banda del pulso, que es

BT = r(1 + β) (89)

Nótese en la forma temporal de los pulsos (ver figura anterior) que a mayor factor de ’roll-off’ más
robusto es el pulso frente a errores de sincronismo. En otras palabras, cuando los instantes de detección
tk no son los adecuados, el pulso con mayor β producirá menos ISI.

Por último, téngase en cuenta que pN (t) no es el pulso emitido sino el que debe salir del filtro receptor
y por lo tanto hay que tener en cuenta tanto el canal como dicho filtro ya que pN (t) = p(t)∗hc (t)∗hR (t)
(suponiendo que ni canal ni filtro receptor introducen retraso). En caso de que el canal sea ideal y se
use el filtro adaptado en recepción, el pulso a transmitir es el que se conoce como raı́z de coseno alzado.
p
Dicha nomenclatura es ası́ porque |PSN (f )| = |PN (f )| y por supuesto cumple pSN (t) ∗ pSN (−t) =
RpSN = pN (t). No ponemos aquı́ la expresión de pSN (t) pero su forma temporal es semejante a la de
pN (t).

145
7. Filtros terminales óptimos
Hasta este punto hemos supuesto siempre canal ideal y podı́amos controlar la ISI mediante la confor-
mación de pulso que hemos visto. En el caso de que el canal no fuera ideal, éste introducirı́a ISI aún
usando pulsos de Nyquist. Para hacer frente a esto tenemos dos opciones: i) la óptima que es usar
filtros terminales óptimos (FTO) como ya vimos en la parte de comunicaciones analógicas (tema 2) o
bien ii) usar ecualización aún sabiendo que es una alternativa subóptima. En lo que queda de tema,
veremos estas dos soluciones.

El uso de los FTO tiene como objetivo eliminar la ISI y minimizar la probabilidad de error. Haciendo el
sı́mil con lo que vimos en comunicaciones analógicas, lo primero se corresponde con evitar la distorsión
y lo segundo con maximizar la SNR (ya hemos dicho que en comunicaciones digitales lo importante
es la señal en los instantes de muestreo y no la señal entera como en comunicaciones analógicas). En
la siguiente figura vemos el esquema con el que trabajaremos, donde x(t) es la señal a enviar, ST es
la potencia transmitida, s(t) la señal transmitida y sR (t) la señal a la salida del filtro receptor.

!
s(t) = a(k)p(t − kT ) !
k sR (t) = a(k)pR (t − kT )
! k
x(t) = a(k)px (t − kT ) p(t) = px (t) ∗ hT (t)
k
ST kT
x(t) HT (f ) Hc (f ) HR (f ) DETECTOR â(k)
DE NIVEL

TRANSMISOR CANAL RECEPTOR

w(t), Sw (f )

A continuación trabajaremos con señalización M-aria polar y sı́mbolos equiprobables. Pongamos en


primer lugar el objetivo de optimización, esto es

mı́n Pe −→ máx (90)
2σn

ya que la Pe es una función monótona decreciente de 2σ n
como se aprecia en (58) dado que ∆ es
la distancia entre sı́mbolos d. Podrı́amos intentar minimizar la Pe sin considerar nada más, pero
debemos darnos cuenta de que la expresión de Pe obtenida en (58) supone ISI nula. Por lo tanto, para
ser coherentes debemos imponer esta condición, esto es

Px (f )HT (f )Hc (f )HR (f ) = PN (f )e−j2πf td (91)

Aquı́ forzamos que el pulso recibido sea un pulso de Nyquist PN (f ) con un cierto retraso td .

A continuación recuperamos la expresión obtenida en (64) para escribir

∆2 3ST
= (92)
4 rEp (M 2 − 1)

146
R +∞ R +∞
y dado que en nuestro esquema Ep = −∞ |P (f )|2 df = −∞ |Px (f )|2 |HT (f )|2 df llegamos a

∆2 3ST 3ST 1
= 2
= 2 R +∞ (93)
4 rEp (M − 1) r(M − 1) |Px (f )|2 |HT (f )|2 df
−∞
R +∞
Por otro lado σn2 = −∞ Sw (f )|HR (f )|2 df , ası́ que juntando ambos resultados llegamos a
 
∆ 2 3ST 1 1
= 2 R +∞ R +∞ (94)
2σn r(M − 1) |Px (f )|2 |HT (f )|2 df Sw (f )|HR (f )|2 df
−∞ −∞

Nótese que como la función cuadrática es monótona creciente y 2σ es siempre positivo, el argumento
 2 n
∆ ∆
que maximiza 2σ n
también maximiza 2σ n
, ası́ que trabajaremos con la segunda opción.

3ST
Si fijamos la potencia transmitida ST podemos obviar el término r(M 2 −1)
en (94) ya que es una
 2

constante, ası́ que maximizar 2σ n
es equivalente a hacer
Z +∞ Z +∞
2 2
mı́n |Px (f )| |HT (f )| df Sw (f )|HR (f )|2 df (95)
−∞ −∞

|PN (f )|
Aplicando la condición de ISI nula en (91), podemos decir que |Px (f )||HT (f )| = |Hc (f )HR (f )| y por lo
tanto hay que minimizar la siguiente expresión
Z +∞ Z +∞
|PN (f )|2
mı́n 2
df Sw (f )|HR (f )|2 df (96)
−∞ |Hc (f )HR (f )| −∞

Aplicando
R ahora la desigualdad de Cauchy-Schwarz como hicimos en el caso analógico, esto es,
+∞ 2 R +∞ R +∞
−∞ u(x)v ∗ (x)dx ≤ −∞ |u(x)|2 dx −∞ |v(x)|2 dx, e identificando
s
|PN (f )|2
U (f ) = (97)
|Hc (f )HR (f )|2
p
V (f ) = Sw (f )|HR (f )|2 (98)

llegamos a la desigualdad
Z
+∞ |P (f )|S 1/2 (f ) 2 Z +∞ |PN (f )|2
Z +∞
N w
df ≤ df Sw (f )|HR (f )|2 df (99)
−∞ |Hc (f )| −∞ |Hc (f )HR (f )|2
−∞

Por lo tanto, la cantidad a minimizar está acotada por debajo por algo que no depende de nuestras
incógnitas, los filtros transmisor y receptor. De la desigualdad de Cauchy-Schwarz sabemos que se
alcanza dicho mı́nimo haciendo U (f ) = λV (f ) y por lo tanto
s
|PN (f )|2 p
= λ Sw (f )|HR (f )|2 (100)
|Hc (f )HR (f )|2

ası́ que el módulo del filtro receptor óptimo es


1 |PN (f )|
|HR (f )|2 = (101)
λ |Hc (f )|Sw1/2 (f )

147
y aplicando la condición de ISI nula de (91), el pulso transmitido debe responder a
1/2
|PN (f )|2 |PN (f )|Sw (f )
|P (f )|2 = 2 2
=λ (102)
|Hc (f )| |HR (f )| |Hc (f )|
y el factor λ se utiliza para fijar la potencia transmitida ST .

Al igual que en el caso analógico, los FTO hacen una preémfasis y deénfasis de ruido. El problema
con los FTO es que no siempre tendremos conocimiento a priori del canal, que no siempre podremos
trabajar con el emisor (más fácil con el receptor) y que su implementación práctica no resulta sencilla
en general.

8. Ecualización
Como ya habı́amos anticipado, la ecualización es una alternativa subóptima a los filtros terminales
óptimos cuando el canal nos introduce ISI. El esquema que se emplea en ecualización es el de la
siguiente figura. Se envı́a la señal PAM y pasa por un canal que introduce ISI. En recepción intentamos
compensar el efecto del canal mediante un filtro ecualizador, que se puede situar antes del muestreo o
bien después. Aquı́ trabajaremos el segundo caso y el modelo de señal a la entrada del filtro ecualizador
será el que se aprecia en la figura, es decir
X
y(k) = a(k)pR (0) + a(i)pR (k − i) + n(k) (103)
i6=k

donde pR (k − i) representa la contribución del i-ésimo pulso recibido a la muestra k-ésima actual.
Por ejemplo, pR (k − k) = pR (0) representa la contribución del pulso k-ésimo a la muestra k-ésima y
por lo tanto esperamos que sea mayor que cualquier otro valor pR (k − i). El término del sumatorio es
obviamente el que modela la cantidad de ISI que tenemos. Por otro lado, la contribución de ruido a
la k-ésima muestra es n(k).

kT ā(k)
!
s(t) = a(k)p(t − kT ) Hc (f ) HR (f ) Heq (z) DETECTOR â(k)
k DE NIVEL
!
y(k) = a(k)pR (0) + a(i)pR ((k − i)T ) + n(k)
w(t) i!=k

A fin de dejar claro el modelo de señal con ISI empleado, consideremos la siguiente figura, donde vemos
en trazo negro las contribuciones de los distintos pulsos recibidos correspondientemente escalados por
los niveles a(k), en trazo grueso de color la señal recibida (suma de todo). Nótese que se han marcado
los instantes de muestreo con lı́neas verticales para poder apreciar la contribución de cada pulso a la
muestra en cuestión y claramente se aprecia que existe ISI en este caso.

Volviendo al modelo de señal, nos interesa ahora incluir la parte de señal deseada dentro del sumatorio,
esto es X X
y(k) = a(k)pR (0) + a(i)pR (k − i) + n(k) = a(i)pR (k − i) + n(k) (104)
i6=k i

148
muestra k − 1 muestra k muestra k + 2

a(k)pR (0)

a(k + 1)pR (0)


a(k − 1)pR (0)

a(k − 1)pR (T ) + a(k + 1)pR (−T )

Ası́, interpretando pR (k) como una función discreta de ı́ndice k, podemos ver la secuencia y(k) como
una suma de pulsos digitales pR (k) convenientemente escalados por a(i) (i no es el ı́ndice temporal
sino un parámetro) y desplazados i muestras. En general, a la salida del filtro ecualizador tendremos
X
ā(k) = y(k) ∗ heq (k) = a(i)pR (k − i) ∗ heq (k) + n(k) ∗ heq (k) (105)
i

y si nos olvidamos del término de ruido, basta con que

pR (n) ∗ heq (n) = δ(n) (106)

para que no exista ISI. Aquı́ hemos usado n como ı́ndice temporal y juega el mismo papel de k en las
ecuaciones anteriores. En términos frecuenciales lo que estamos haciendo es invertir el pulso recibido,
pues PR (z) · Heq (z) = 1. En realidad lo que hacemos es invertir el canal, pues en el modelo equivalente
digital pR (n) = p(n) ∗ hc (n) con p(n) = δ(n) ya que se diseña el pulso emitido sin ISI.

Consideraremos aquı́ la realización de heq (z) como un filtro FIR de 2N + 1 coeficientes c(n) con
n = −N, . . . , N tal y como muestra la figura siguiente.

pR (n) z −1 z −1

c(−N ) c(−N + 1) c(−N + 2) c(N )

149
Si consideramos 2L + 1 muestras del pulso pR (n) con n = −L, . . . , L entonces la convolución discreta
de esta versión enventanada de pR (n) con el filtro heq (n) queda descrita por la siguiente ecuación
matricial
    
pR (−L) 0 0 ... 0 c(−N ) 0
    
 pR (−L + 1) pR (−L) 0 ... 0  ...   ... 
    
 ... ... ... ... ...     
  ...   0 
 pR (−N ) ... pR (0) ...   
pR (N )   c(0)  =  1  (107)
 
 . . . . . . . . . . . . . . .  ...   0 
    
    
 0 ... 0 pR (L − 1) pR (L)   . . .   . . . 
0 ... 0 0 pR (L) c(N ) 0
que escribiremos de forma compacta como

pR c = p0 (108)

Nótese que la primera ecuación corresponde a la primera muestra de la convolución, la segunda a la


segunda y ası́ hasta las 2L + 2N + 1 muestras resultantes de la convolución de pR (n) (versión enventa-
nada) con heq (n). Además, todas se fuerzan a 0 excepto una para que no haya ISI. Es por esto que esta
solución es conocida como forzador de ceros. Dado que se trata de un sistema sobredeterminado
(más ecuaciones que incógnitas salvo que quitemos ecuaciones y nos quedemos sólo con las N+1 cen-
trales) resultará imposible satisfacerlas todas y es por eso que lo que hacemos es aproximarlas todas
lo mejor posible, esto es, con el mı́nimo error cuadrático calculado como ||pR c − p0 ||2 . La solución de
esta minimización pasa por la llamada pseudo-inversa de la matriz pR , que conceptualmente equivale
a la inversa y vale pR † = (pR T pR )−1 pR , ası́ que los coeficientes óptimos son

c = pR † p0 (109)

Aunque el forzador de ceros nos es útil para reducir la ISI en gran medida, su principal problema es
que puede realzar el ruido. Calculemos la potencia a la salida del filtro ecualizador suponiendo que
las muestras del proceso discreto n(k) tienen media nula, están incorreladas y presentan potencia σn2 .
Ası́, dicha potencia vale
 2 
 i=+N
X 

σn2 0 = E{|n(k) ∗ heq (k)|2 } = E c(i)n(k − i) (110)
 
i=−N
i=+N
X i=+N
X
2
= E{|c(i)n(k − i)| } = σn2 |c(i)|2
i=−N i=−N
Pi=+N
y el ruido se realza por el término i=−N |c(i)|2 . Cuando la ISI introducida exija valores grandes de
los coeficientes para ser compensada, entonces la contribución de ruido tendrá un efecto importante.

Ante la situación expuesta, podrı́a tener sentido ser más tolerantes con la ISI y utilizar el filtro
ecualizador para minimizar también la contribución del ruido. Esto es lo que hace el filtro de
mı́nimo error cuadrático medio (MMSE) también llamado filtro de Wiener, cuyo criterio de
diseño es

mı́n E ||a(n) − ā(n)||2 (111)
heq (n)

150
es decir, escoger el filtro heq (n) que minimice el error cuadrático medio entre los niveles emitidos y los
niveles recuperados después del filtro sin importarnos demasiado si para ello hay que eliminar ISI o
ruido (en general la mejor combinación de ambas cosas). No obstante, esto queda ya fuera del alcance
de este curso.

151
Tema 8: Transmisión Digital Paso Banda
Antoni Morell y José López Vicario

24 de mayo de 2013

1. Introducción
En comunicaciones digitales, al igual que sucedı́a en comunicaciones analógicas, nos interesará esta-
blecer comunicaciones paso banda. Los motivos para ello son básicamente los mismos:

En caso de transmitir de forma inalámbrica, el hecho de situar la transmisión en un ancho de


banda BT alrededor de una frecuencia central fc más o menos alta permite el uso de antenas de
tamaño suficientemente pequeño para su usabilidad.

Es posible la convivencia de distintos sistemas de comunicaciones transmitiendo en frecuencias


no solapadas.

Señales paso banda

Recordemos ahora las expresiones más comunes de una señal paso banda s(t) cualquiera, que ya
estudiamos en el Tema 3,
n o n o
s(t) = Ac Re{as (t)} = Ac Re bs (t)ej2πfc t+θc = Ac Re (is (t) + jqs (t))ej2πfc t+θc (1)
= Ac is (t) cos (2πfc t + θc ) − Ac qs (t) sin (2πfc t + θc )

donde as (t) es la señal analı́tica de s(t), bs (t) su equivalente paso bajo y is (t), qs (t) las componentes
en fase y cuadratura, respectivamente. Aquı́ hemos incluido en la formulación una fase inicial de la
portadora θc y su amplitud Ac , ambas constantes. La particularidad en comunicaciones digitales es
que las componentes en fase y cuadratura tendrán, en general, la forma de una señal PAM, es decir,
+∞
X
is (t) = I(i)p(t − iT ) (2)
i=−∞
X+∞
qs (t) = Q(i)p(t − iT ) (3)
i=−∞

donde I(i) y Q(i) son los sı́mbolos emitidos por cada una de las ramas. Además, supondremos en
general que se cumple T = N Tc con N grande, donde Tc = 1/fc es el periodo de la portadora o, lo
que es lo mismo, fc = N r.

152
Antes de continuar, pongamos en la siguiente figura un esquema general de un sistema de comunicacio-
nes paso banda para situarnos. En este tema nos centraremos en el estudio de los bloques modulador
y filtro receptor, es decir, ver cómo son las señales que se utilizan y cómo generarlas y luego ver cómo
se reciben y qué probabilidades de error obtendremos en los distintos casos.

I(k) ˆ
I(k)
CODIFICADOR FILTRO DECODIFICADOR
b(k) DE LÍNEA
MODULADOR hc (t) RECEPTOR DE LÍNEA b̂(k)
Q(k) Q̂(k)
w(t)
p(t)
Ac cos (2πfc t + θc )

Densidad espectral de potencia

Antes de empezar a ver las modulaciones digitales básicas, veamos cómo es la densidad espectral de
una señal de comunicaciones digitales. Como ya dijimos en el Tema 3, las señales paso banda con
componentes en fase y cuadratura estacionarias dan lugar a señales cicloestacionarias. Es por eso
que para obtener su densidad espectral de potencia primero calcularemos su autocorrelación media.
Recordando los resultados del tema 3 (apartado 5) sabemos que
   
A2c A2c
Rs (τ ) = Ris (τ ) + Rqs (τ ) cos 2πf0 τ + Ris qs (τ ) − Rqs is (τ ) sin 2πf0 τ (4)
2 2
y si además tenemos en cuenta que lo habitual es que las componentes en fase y cuadratura estén
incorreladas y tengan media nula, entonces la autocorrelación media vale
 
A2c
Rs (τ ) = Ris (τ ) + Rqs (τ ) cos 2πf0 τ (5)
2
ası́ que haciendo la transformada de Fourier encontramos su densidad espectral de potencia, que es
 
A2c
Ss (f ) = Sis (f − fc ) + Sis (f + fc ) + Sqs (f − fc ) + Sqs (f + fc ) (6)
4

donde Sis (f ) y Sqs (f ) son las densidades espectrales de potencia de las componentes en fase y cua-
dratura, respectivamente. Por úlltimo, la potencia de la señal paso banda viene determinada por

A2c  A2
Ps = Rs (0) = Ris (0) + Rqs (0) = c (Pis + Pqs ) (7)
2 2

2. Modulaciones digitales básicas: ASK, MPSK, MQAM, FSK


A continuación trataremos las modulaciones básicas, que son:

Amplitude Shift Keying (ASK)

M Phase Shift Keying (MPSK)

153
M Quadrature Amplitude Modulation (MQAM)

Frequency Shift Keying (FSK)

No obstante, antes de continuar con el estudio de cada caso individual, considérese la siguiente figura
donde vemos el diagrama de bloques de un modulador genérico, que será el que usaremos en las
modulaciones que hemos citado excepto para el caso particular de FSK. Hay que tener en cuenta que
el bloque codificador de lı́nea se encarga de dividir el flujo de bits entrante en dos subflujos, uno para la
componente en fase y el otro para la componente en cuadratura. Luego, en cada uno de esos subflujos
se agrupan los bits para formar los niveles I(k) y Q(k) para finalmente añadirles el pulso p(t) y formar
ası́ la señal PAM de cada rama. Finalmente, las señales is (t) y qs (t) se modulan en fase y cuadratura
y se suman.

i=+∞
!
is (t) = I(k)p(t − kT )
i=−∞

Ac cos (2πfc t + θc )
CODIFICADOR
b(k) DE LÍNEA s(t)
π/2

p(t)
i=+∞
!
qs (t) = Q(k)p(t − kT )
i=−∞

Amplitude Shift Keying (ASK)

Esta modulación serı́a el equivalente digital de la modulación analógica de AM ya que la información


viaja en la amplitud de la componente en fase. Ası́ la expresión matemática de la modulación es
+∞
X
sASK (t) = Ac is (t) cos (2πfc t + θc ), is (t) = I(i)p(t − iT ) (8)
i=−∞

En el caso de usar b bits por sı́mbolo transmitido, hay que transmitir M = 2b sı́mbolos distintos. Para
ello se utiliza señalización M-aria unipolar donde el nivel I(i) toma valores

I(i) ∈ {0, ∆, 2∆, . . . , (M − 1)∆} (9)

Nótese que no tendrı́a sentido usar señalización polar ya que lo que se pretende modificar es la amplitud
del coseno, con lo que un signo negativo provocarı́a un cambio de fase de π rad que para nada nos
interesa ya que, como regla general, cambios bruscos en la forma de onda penalizarán en términos de
ancho de banda. Un ejemplo de modulación ASK con M = 4 se puede ver en la siguiente figura, donde
vemos is (t) en trazo grueso, que es el resultado de los pulsos p(t − iT ) escalados por I(i), y sASK (t)
en trazo fino.

154
3∆

2∆

Caso particular: La modulación 2ASK (b = 1, M = 2) donde los niveles son I(i) ∈ {0, ∆} se conoce
como ‘On-Off Keying’ (OOK). Dicha nomenclatura viene motivada por el hecho de que cuando se
envı́a un ‘0’ no hay señal y cuando se envı́a un ‘1’ aparece la señal senoidal modificada en amplitud
por la forma del pulso p(t).

Densidad espectral de potencia

La modulación ASK no presenta componente en cuadratura, ası́ que aplicando (6) llegamos a
 
A2c
SsASK (f ) = SisASK (f − fc ) + SisASK (f + fc ) (10)
4

donde SisASK (f ) es la densidad espectral de una señal PAM digital. Del tema anterior (tercer apartado),
sabemos que vale
+∞
X
2 2 2 ¯2
SisASK (f ) = rσI |P (f )| + r I |P (mr)|2 δ(f − mr) (11)
m=−∞
2
En el caso ASK la señalización es M-aria polar con σI2 = M12−1 ∆2 (calculado en el tema anterior al
final del apartado 4) y I¯ = M2−1 ∆. Nótese que si P (f ) es un pulso de Nyquist, únicamente la delta
central del sumatorio prevalece y el ancho de banda de transmisión será BT = r(1 + β), como se puede
ver en la siguiente figura.

SsASK (f )
BT = (1 + β)r

f
−fc fc − r fc fc + r

155
M Phase Shift Keying (MPSK)

Esta modulación serı́a la equivalente a la modulación PM que vimos en comunicaciones analógicas ya


que, como veremos, lo que se modifica es la fase de la portadora. Para ver su expresión matemática, par-

timos de la expresión de una señal paso banda cualquiera, esto es s(t) = Ac Re (is (t) + jqs (t))ej2πfc t+θc ,
P P+∞
y considerando que is (t) = +∞ i=−∞ I(i)p(t − iT ), qs (t) = i=−∞ Q(i)p(t − iT ) llegamos a
( +∞ +∞
! )
X X
j2πfc t+θc
s(t) = Ac Re I(i)p(t − iT ) + j Q(i)p(t − iT ) e (12)
i=−∞ i=−∞
( +∞
! )
X
= Ac Re (I(i) + jQ(i))p(t − iT ) ej2πfc t+θc
i=−∞

Si ahora expresamos I(i)+jQ(i) en su forma polar, esto es I(i)+jQ(i) = αi ejφi llegamos a la expresión
de la señal MPSK que es
( +∞ )
X
sM P SK (t) = Ac Re αi p(t − iT )ej2πfc t+θc +φi (13)
i=−∞
+∞
X
= Ac αi p(t − iT ) cos (2πfc t + θc + φi )
i=−∞

Para ser más exactos, en MPSK la amplitud es constante αi = α y lo que se modifica es la fase
del coseno. Normalmente cogeremos α = 1 ya que podemos controlar la amplitud y por lo tanto la
potencia de la señal a través de Ac , ası́ que I(i) + jQ(i) = ejφi , es decir, I(i) = cos φi y Q(i) = sin φi .
En resumen, la señal MPSK queda
+∞
X
sM P SK (t) = Ac α p(t − iT ) cos (2πfc t + θc + φi ) (14)
i=−∞

donde las fases φi tomaran M valores posibles para dar lugar a los M sı́mbolos de la modulación, esto
es φi ∈ {φ̂0 , . . . , φ̂M −1 } y se definen las posibles fases φ̂i equiespaciadas, es decir

φ̂i = i , i = 0, . . . , M − 1 (15)
M
como muestra la siguiente figura.

Q(i)

φ̂2
φ̂1
φ̂0
I(i)

156
A veces también se introduce un offset de fase de modo que
2π π
φ̂= i + , i = 0, . . . , M − 1 (16)
M M
por lo que ningún sı́mbolo tiene únicamente componente en fase o cuadratura.

La representación de la modulación como puntos en el plano complejo I-Q que acabamos de ver en
la figura anterior es lo que llamamos la constelación de sı́mbolos de la modulación y es lo que más se
emplea a la hora de representar gráficamente la modulación.

Ejemplo: 4PSK y QPSK (Quadrature PSK)

Ambas son modulaciones de fase con 4 sı́mbolos. La diferencia es que la primera no presenta offset y
la segunda sı́. Podemos ver la constelación de ambas modulaciones en la siguiente figura y también
las fases que toman los distintos sı́mbolos.

4PSK QPSK
Q(i) Q(i)
φ̂1 = π/2
φ̂1 = 3π/4 φ̂0 = π/4

φ̂2 = π φ̂0 = 0
I(i) I(i)

φ̂2 = −3π/4 = 5π/4 φ̂3 = −π/4 = 7π/4


φ̂3 = 3π/2

Por último, como ya dijimos en el tema anterior, lo habitual es usar codificación de Gray para que los
sı́mbolos más cercanos difieran en un solo bit y poder aproximar la probabilidad de error de bit como
la de sı́mbolo dividido por el número de bits por sı́mbolo, es decir, Pb = BER = Pe /b = Pe / log2 M .
Dicho esto, un posible mapeo entre bits y sı́mbolos en QPSK podrı́a ser el de la siguiente tabla.

b(n) b(n − 1) φ̂i cos φ̂i sin φ̂i


√ √
0 0 π/4 1/ 2 1/ 2
√ √
1 0 3π/4 −1/ 2 1/ 2
√ √
1 1 3π/4 −1/ 2 −1/ 2
√ √
0 1 −π/4 1/ 2 −1/ 2

157
Densidad espectral de potencia

En este caso tenemos tanto componente en fase como componente en cuadratura, ası́ que la densidad
espectral de potencia debe calcularse como
 
A2c
Ss (f ) = Sis (f − fc ) + Sis (f + fc ) + Sqs (f − fc ) + Sqs (f + fc ) (17)
4

y, como en el caso anterior, la densidad espectral de potencia de la componente en fase (lo mismo para
cuadratura) vale
SisM P SK (f ) = rσI2 |P (f )|2 (18)
donde el término proporcional a la media desaparece ya que I¯ = Q̄ = 0 (suponemos sı́mbolos equipro-
√ √
bables). Además, E{I 2 (k)} = E{Q2 (k)} = 1/2(1/ 2)2 + 1/2(−1/ 2)2 = 1/2. Por lo tanto,
1
SisM P SK (f ) = SqsM P SK (f ) = r |P (f )|2 (19)
2
y la densidad espectral de potencia vale

A2c A2
SsM P SK (f ) = r|P (f − fc )|2 + c r|P (f + fc )|2 (20)
4 4
Tiene la misma forma que SsASK (f ) salvo que la delta desaparece.

M Quadrature Amplitude Modulation (MQAM)

MQAM combina de algún modo las dos modulaciones vistas hasta el momento. Por un lado, ASK
inserta la información en la amplitud del sı́mbolo y por otro lado, MPSK lo hace en la fase. Pues bien,
MQAM introduce la información en fase y cuadratura a la vez, ya que en este caso

I(i) + jQ(i) = αi ejφi (21)

donde αi y φi varı́an de un sı́mbolo a otro.

La expresión de la modulación es

sM QAM (t) = Ac is (t) cos (2πfc t + θc ) − Ac qs (t) sin (2πfc t + θc ) (22)

con
+∞
X
is (t) = I(i)p(t − iT ) (23)
i=−∞
X+∞
qs (t) = Q(i)p(t − iT ) (24)
i=−∞

Por lo tanto, igual que en ASK añadiendo en la parte de cuadratura una PAM digital M-aria que se
modula con el seno (salvo que ahora ambas PAM son polares). A nivel de densidad espectral, resulta
muy fácil extrapolar de MPSK a MQAM y su forma es básicamente la misma. La diferencia está en

158
M 2 −1 2
que las varianzas de las PAM serán 12 ∆ en vez de 1/2.

Ejemplo: 16QAM

En este caso tendremos b = 4 bits y M = 16 niveles. Usaremos como siempre codificación de Gray y
en cada rama (fase y cuadratura). En la siguiente tabla podemos ver el mapeo de bits a sı́mbolos y en
la siguiente figura se aprecia la constelación.

b(n) b(n − 1) I(i) b(n − 2) b(n − 3) Q(i)


0 0 ∆/2 0 0 ∆/2
0 1 3∆/2 0 1 3∆/2
1 0 −∆/2 1 0 −∆/2
1 1 −3∆/2 1 1 −3∆/2

Q(i)

1101 1001 0001 0101


αi
1100 1000 0000 0100

φi I(i)
1110 1010 0010 0110

1111 1011 0011 0111

Frequency Shift Keying (FSK)

La modulación FSK es la análoga de la modulación FM que vimos en analógicas. En este caso se


opta por transmitir cada sı́mbolo a una frecuencia distinta, por lo que la expresión de la señal FSK es
diferente a todo el resto y vale
+∞
X 
sF SK (t) = Ac cos 2πfc t + θc + 2πfd a(i)t p(t − iT ), a(i) ∈ {±1, ±3, . . . ± M − 1} (25)
i=−∞

Nótese que los niveles a(i) se definen impares y que la frecuencia instantánea en el sı́mbolo i-ésimo es

fi = fc + fd a(i) (26)

donde fd es la frecuencia de desplazamiento. Además, téngase en cuenta que en FSK se utiliza ha-
bitualmente un pulso p(t) rectangular, mientras que en las otras modulaciones suele ser un pulso de
Nyquist como coseno alzado (o raı́z de coseno alzado) o bien un pulso rectangular. En este último
caso, consideraremos un ancho de banda del pulso r/2 que se convierte en BT = r en paso banda y
aparecerán lóbulos secundarios en el espectro debidos al pulso rectangular que en caso de ser filtrados

159
deformaran p(t) e introducirán ISI.

Volviendo a lo que nos ocupa, sos interesa como siempre que la señal sF SK (t) no presente discontinui-
dades que aumenten su ancho de banda. Es por ello que debemos asegurar continuidad en su fase o
bien que los saltos sean de π (no hace falta que sean de 2π ya que sólo debemos considerar el coseno y
sabemos que cos (x + π) = cos (x)). Ası́ pues, debemos forzar que al final de cada sı́mbolo la fase sea
múltiplo de π, esto es
N N
2πfd T = N π, n∈Z −→ fd = =r (27)
2T 2
Un ejemplo de modulación FSK con dos niveles se puede ver en la figura siguiente.

sF SK (t)

A la práctica se podrı́a generar la señal FSK a través de un banco de osciladores sintonizados a las
2(M − 1) frecuencias de transmisión posibles y un selector que, en función del sı́mbolo a(i), mandase
la señal a la salida, tal y como se puede apreciar en la figura siguiente.

! "
Ac cos 2πfc t + θc − 2πfd (M − 1)t

! "
Ac cos 2πfc t + θc − 2πfd (M − 3)t

! " sF SK (t)
Ac cos 2πfc t + θc − 2πfd (M − 5)t

! "
Ac cos 2πfc t + θc + 2πfd (M − 1)t
SELECTOR

A la práctica esta solución tiene el problema de que se hace difı́cil mantener los osciladores sincronizados
en fase y suelen aparecer saltos de fase que ensanchan el espectro, por lo que un mejor esquema es

160
el conocido como ’Continuous-Phase FSK’ (CPFSK). Aquı́ lo que hacemos es generar una señal
FM como las que vimos en comunicaciones analógicas, esto es,
 Z t 
sCP F SK (t) = Ac cos 2πfc t + θc + 2πfd u(λ)dλ (28)

donde la información que introducimos en frecuencia, es decir u(t), es una señal PAM M-aria polar,
esto es X
u(t) = a(i)p(t − iT ) (29)
i
con a(i) ∈ {±1, ±3, . . . ± M − 1} para poder equipararla al caso FSK.

Ancho de banda de la señal FSK

La señal FSK o CPFSK no deja de ser una modulación FM y por similitud con lo que estudiamos en la
parte de analógicas, la interpretaremos según (28). En este caso no estudiaremos la densidad espectral
de la señal, pues como vimos en su dı́a no tiene una solución simple, y nos centraremos únicamente
en el ancho de banda de transmisión. Recordando lo visto en el tema 5 (apartado 3), éste depende
esencialmente del ı́ndice de desviación D = ∆f /Bx , donde ∆f era la máxima desviación en frecuencia
(que vale (M − 1)fd en nuestro caso) y Bx era el ancho de banda de la señal moduladora (en nuestro
caso Bx = Bp , es decir, el ancho de banda del pulso p(t)). Recordemos que para calcular el ancho de
banda deberemos ver cuánto vale D exactamente y aplicar el caso que corresponda entre D ≤ 0, 3,
D ≥ 1 y D ≥ 10. Sin saber nada más podemos usar ahora el caso D ≥ 1, esto es

BT = 2(D + 2)Bp = 2(M − 1)fd + 4Bp (30)

pero si disponemos de más datos recurriremos al resultado que corresponda. Para D ≤ 0, 3, BT =


2Bx = 2Bp y para D ≥ 10, BT = 2∆f = 2(M − 1)fd .

3. Representación vectorial de las señales digitales paso banda: el


espacio de señal
Hasta el momento hemos visto las modulaciones principales y sus caracterı́sticas fundamentales. Ahora
presentaremos un marco de trabajo general que nos permitirá tratarlas todas bajo el mismo paraguas
y, lo que es más importante, diseñar el receptor óptimo para cada una de ellas. La idea principal es
definir un espacio de señal dónde se representarán los distintos sı́mbolos (forma temporal completa)
como elementos en dicho espacio de señal. La teorı́a que desarrollaremos a continuación es válida tanto
para paso banda como banda base.

Empecemos con un ejemplo para situarnos. Consideremos una señal paso banda s(t) modulada en
4QAM. Recordemos su expresión temporal, que es
+∞
! +∞
!
X X
s4QAM (t) = Ac I(i)p(t − iT ) cos (2πfc t + θc ) − Ac Q(i)p(t − iT ) sin (2πfc t + θc )
i=−∞ i=−∞
(31)

161
Dicha señal también se puede expresar como
+∞
X
s4QAM (t) = Ac I(i)p(t − iT ) cos (2πfc (t − iT ) + θc ) (32)
i=−∞
− Ac Q(i)p(t − iT ) sin (2πfc (t − iT ) + θc )

ya que hemos considerado fc = N r = N/T y por lo tanto T = N/fc ası́ que cos (2πfc (t − iT ) + θc ) =
cos (2πfc t − 2πfc i N/fc + θc ) = cos(2πfc t + θc ). Ahora ya podemos expresar s4QAM (t) como
+∞
X
s4QAM (t) = si (t − iT ), si (t) = Ac p(t) [I(i) cos (2πfc t + θc ) − Q(i) sin (2πfc t + θc )] (33)
i=−∞

Nótese que en 4QAM habrá sólo 4 posibilidades para si (t) correspondientes a los 4 sı́mbolos que se
envı́an en 4QAM, es decir,
si (t) ∈ {ŝ1 (t), ŝ2 (t), ŝ3 (t), ŝ4 (t)} (34)
y se escogerá uno de ellos en función de los valores que tomen I(i) y Q(i) como se muestra en la
siguiente tabla.

b(n) b(n − 1) I(i) Q(i) ŝi (t)


√ √  √ √ 
0 0 1/ 2 1/ 2 ŝ1 = Ac p(t) 1/ 2 cos (2πfc t + θc ) − 1/ 2 sin (2πfc t + θc )
√ √  √ √ 
0 1 1/ 2 −1/ 2 ŝ2 = Ac p(t) 1/ 2 cos (2πfc t + θc ) + 1/ 2 sin (2πfc t + θc )
√ √  √ √ 
1 0 −1/ 2 1/ 2 ŝ3 = Ac p(t) −1/ 2 cos (2πfc t + θc ) − 1/ 2 sin (2πfc t + θc )
√ √  √ √ 
1 1 −1/ 2 −1/ 2 ŝ4 = Ac p(t) −1/ 2 cos (2πfc t + θc ) + 1/ 2 sin (2πfc t + θc )

Como podemos ver, todo se reduce a transmitir de forma concatenada uno de los pulsos modulados
ŝi (t) en función del valor de los bits de entrada b(n) b(n − 1). Si nos fijamos un poco más en el ejemplo,
veremos que podemos simplificar algo más ya que, por ejemplo, ŝ1 (t) y ŝ4 (t) tienen la misma forma
temporal salvo por un cambio de signo al igual que sucede con ŝ2 (t) y ŝ3 (t). Entonces tendrı́a sentido
trabajar sólo con las señales ŝ1 (t) y ŝ2 (t), a las que llamaremos ϕ1 (t) y ϕ2 (t), de forma que

ŝ1 (t) = 1 · ϕ1 (t) (35)


ŝ2 (t) = 1 · ϕ2 (t) (36)
ŝ3 (t) = (−1) · ϕ2 (t) (37)
ŝ4 (t) = (−1) · ϕ1 (t) (38)

Esto nos puede recordar el álgebra lineal, donde ŝi (t) jugarı́a el papel de vector y ϕi (t) el papel de
elemento de la base del subespacio. En este ejemplo sencillo cada sı́mbolo ŝi (t) es función de un único
elemento de la base, pero en general puede ser combinación lineal de todos ellos. Nótese también que
en este caso los escalares que han acompañado a los elementos de la base del espacio de señal han sido
1 y −1 pero en general puede ser cualquier número real. A continuación formalizamos este marco de
trabajo que acabamos de ver.

162
3.1. El espacio de señal
Se puede ver el espacio de señal como un subespacio dentro del espacio vectorial de las funciones
continuas de energı́a finita. Como subespacio vectorial que es, los distintos elementos que lo forman,
en este caso ŝi (t), se pueden expresar como combinación lineal de los elementos de la base generadora
del espacio de señal (ϕl (t), l = 1, . . . , L), esto es
L
X
ŝi (t) = αi,l ϕl (t) (39)
l=1

donde los coeficientes αi,l (el ı́ndice l indexa los L elementos de la base y el ı́ndice i el sı́mbolo) son
escalares y permiten generar todos los sı́mbolos de la modulación. Al igual que hacemos en el álgebra
lineal, podemos expresar ŝi (t) de forma compacta a partir de los escalares y obviando los elementos
de la base (quedan implı́citos), ası́ que tendremos
L
X
ŝi (t) = αi,l ϕl (t) ←→ ŝi = [αi,1 , αi,2 , . . . , αi,L ]T (40)
l=1

Por lo tanto, cuando queramos trabajar con una modulación determinada en el marco del espacio
de señal, lo primero que hay que hacer es encontrar su base generadora, o sea, la funciones ϕl (t). El
siguiente paso es encontrar los conjuntos de escalares {αi,l } que definen cada uno de los sı́mbolos ŝi .
Por comodidad y utilidad práctica (como veremos luego), escogeremos las funciones base ortonormales
(ortogonales por ser base pero también de norma uno), es decir

Z +∞  1, m = n
ϕm (t)ϕn (t)dt = (41)
−∞  0, m 6= n

o lo que es lo mismo, que el producto escalar de dos funciones base (definido como la integral de su
producto) debe valer 0 si son distintas o bien 1 si son la misma. Bajo esta premisa, los escalares αi,l
se calculan como Z +∞
αi,l = ŝi (t)ϕl (t)dt (42)
−∞
Comprobación:

Z Z L
! L Z
+∞ +∞ X X +∞
ŝi (t)ϕl (t)dt = αi,n ϕn (t) ϕl (t)dt = αi,n ϕn (t)ϕl (t)dt = αi,l (43)
−∞ −∞ n=1 n=1 −∞

donde la última igualdad es debida a la condición de ortonormalidad de la base, es decir, la integral


vale 0 si n 6= l y 1 cuando n = l.


163
Producto escalar y energı́a

Como acabamos de decir, se define el producto escalar entre dos señales como
Z +∞
hŝm (t), ŝn (t)i = ŝm (t)ŝn (t)dt (44)
−∞

Si desarrollamos un poco más la expresión anterior llegamos a


Z +∞ X
L
! L 
L X
L Z
X X +∞
hŝm (t), ŝn (t)i = αm,i ϕi (t)  
αn,j ϕj (t) dt = αm,i αn,j ϕi (t)ϕj (t) (45)
−∞ i=1 j=1 i=1 j=1 −∞

y aplicando de nuevo la propiedad de ortonormalidad de las funciones base nos queda


L
X
hŝm (t), ŝn (t)i = αm,i αn,i = ŝTm ŝn (46)
i=1

ya que dentro del doble sumatorio únicamente sobreviven los términos con i = j. Además, como vemos
en la última igualdad, esta definición de producto escalar se corresponde con el producto escalar de
los vectores que representan a los sı́mbolos según se ha visto en (40).

Dado que las señales son de duración finita, la integral de su producto que aparece en (44) se puede ver
como la energı́a cruzada de las señales (o correlación cruzada evaluada en el origen) que denotaremos
Em,n , esto es
Z +∞
Em,n = hŝm (t), ŝn (t)i = ŝm (t)ŝn (t)dt = ŝTm ŝn (47)
−∞
En el caso m = n se corresponde con la energı́a de la señal y tenemos
Z +∞ L
X
En = hŝn (t), ŝn (t)i = ŝn (t)ŝn (t)dt = ŝTn ŝn 2
= ||ŝn || = 2
αn,i (48)
−∞ i=1

Téngase en cuenta que la energı́a calculada es para un único sı́mbolo de la modulación, ası́ que si
queremos calcular la energı́a media de sı́mbolo Ēs deberemos hacer el siguiente promedio sobre los M
sı́mbolos de la modulación
M
1 X
Ēs = En (49)
M
n=1

De igual modo, la energı́a media de bit Eb valdrá

Ēs
Eb = (50)
log2 M

Distancia euclı́dea y energı́a

Acabamos de ver que a través del producto escalar, ya se defina éste como el producto de dos fun-
ciones continuas ŝi (t) de duración T o como el producto escalar de dos vectores ŝi (las dos posibles

164
representaciones de los sı́mbolos de una modulación), da lugar a la energı́a de un sı́mbolo o la energı́a
cruzada entre sı́mbolos. Definimos ahora la distancia eculı́dea entre dos sı́mbolos como
sZ
+∞
d(ŝm (t), ŝn (t)) = (ŝm (t) − ŝn (t))2 dt (51)
−∞

o, alternativamente, como
d(ŝm , ŝn ) = ||ŝm − ŝn || (52)
Se calcule como se calcule, existe una relación entre distancia (cuadrado de la distancia para ser
exactos) y energı́as, especı́ficamente

d2 (ŝm (t), ŝn (t)) = d2 (ŝm , ŝn ) = Em + En − 2 Em,n (53)

Comprobación:

Si usamos la definición como función tenemos


Z +∞ Z +∞ Z T
d2 (ŝm (t), ŝn (t)) = (ŝm (t) − ŝn (t))2 dt = ŝ2m (t) dt + ŝ2n (t) dt (54)
−∞ −∞ 0
Z +∞
− 2 ŝm (t)ŝn (t) dt = Em + En − 2 Em,n
−∞

Si usamos la definición como vector tenemos

d2 (ŝm , ŝn ) = ||ŝm − ŝn ||2 = (ŝm − ŝn )T (ŝm − ŝn ) = ŝTm ŝm + ŝTn ŝn − 2ŝTm ŝn (55)
= Em + En − 2 Em,n

A continuación vemos un par de ejemplos sobre la representación de modulaciones en el espacio de


señal. En concreto, vemos la señal PAM digital (banda base) y la señal QPSK.

Ejemplo 1: señal 4PAM polar con pulso p(t) rectangular

Recordemos en primer lugar la expresión de la señal PAM digital, esto es


+∞
X
sP AM (t) = a(i)p(t − iT ) (56)
i=−∞
P
En este caso, si queremos expresar la señal de la forma sP AM (t) = +∞ i=−∞ si (t − iT ), queda claro que
necesariamente si (t) = a(i)p(t). Vemos pues que con una sola función base podemos generar  todos
t−T /2
los sı́mbolos y que esta función base debe tomar la forma de p(t), que vale p(t) = Π T . Sin
embargo, debemos asegurar que la función base ϕ1 (t) sea ortonormal y por lo tanto debe cumplir
R +∞ 2
−∞ ϕ1 (t)dt = 1, es decir, que la energı́a de la función base debe ser 1. Esto se consigue haciendo

1 1
ϕ1 (t) = p p(t) = √ p(t) (57)
Ep T

165
donde Ep = T es la energı́a del pulso. Habiendo determinado la base, se pueden conseguir los sı́mbolos

si (t) haciendo que el escalar que acompaña el elemento de la base sea a(i) T . Ası́, los 4 sı́mbolos
posibles de la modulación son
−3∆ √ −3∆ √
ŝ1 (t) = T ϕ1 (t) ←→ ŝ1 = T
2 2
−∆ √ −∆ √
ŝ2 (t) = T ϕ1 (t) ←→ ŝ2 = T
2 2
∆√ ∆√
ŝ3 (t) = T ϕ1 (t) ←→ ŝ3 = T
2 2
3∆ √ 3∆ √
ŝ4 (t) = T ϕ1 (t) ←→ ŝ4 = T
2 2

Ejemplo 2: señal 4QAM con pulso p(t) rectangular


 
En este caso y cogiendo p(t) = t−T T
/2
como en el caso anterior, los pulso transmitidos toman la
forma
si (t) = Ac I(i) cos (2πfc t + θc )p(t) − Ac Q(i) sin (2πfc t + θc )p(t) (58)
Para poder expresar dichos sı́mbolos como combinación lineal de funciones base, vemos que deberemos
trabajar con dos funciones base ϕ1 (t) y ϕ2 (t) realcionadas con el coseno y el seno, respectivamente.
Además, deberán ser ortonormales. En este caso las funciones base son
r r
2 2
ϕ1 (t) = cos (2πfc t + θc )p(t), ϕ2 (t) = − sin (2πfc t + θc )p(t) (59)
T T
Comprobemos en primer lugar si son ortogonales,
Z +∞ Z T
2
ϕ1 (t)ϕ2 (t) dt = − cos (2πfc t + θc ) sin (2πfc t + θc ) dt (60)
−∞ T 0

1
Ahora, haciendo uso de la identidad trigonométrica cos x sin x = 2 sin 2x, llegamos a
Z +∞ Z T
1
ϕ1 (t)ϕ2 (t) dt = − sin (4πfc t + 2θc ) dt = 0 (61)
−∞ T 0

ya que integramos el seno en 2N periodos enteros pues T = N Tc o fc = N/T . Por lo tanto sı́ son fun-
ciones ortogonales. Nos falta comprobar que tengan energı́a unidad. Para ello usaremos las identidades
cos2 x = 1/2(1 + cos 2x) y sin2 x = 1/2(1 − cos 2x), ası́ que
Z +∞ Z T Z
21 T

21 
ϕ21 (t) dt = dt + cos (4πf
 c t + 2θc ) dt = 1
  (62)
−∞ 0 T2 T 20
Z +∞ Z T Z
21 T

21 
ϕ22 (t) dt = dt − cos (4πf
c t + 2θc ) dt = 1
 (63)
−∞ 0 T2 T 20

Por último nos


q falta ver los valores de los coeficientes. Si volvemos a (34) veremos que deben tomar va-
lores ±Ac √12 T
2 para que todo encaje. Ası́, los 4 sı́mbolos posibles que tenemos en 4QAM (expresados

166
como vector) son
" r r #T
1 T 1 T
ŝ1 = Ac √ , Ac √
2 2 2 2
" r r #T
1 T 1 T
ŝ2 = Ac √ , −Ac √
2 2 2 2
" r r #T
1 T 1 T
ŝ3 = −Ac √ , Ac √
2 2 2 2
" r r #T
1 T 1 T
ŝ4 = −Ac √ , −Ac √
2 2 2 2

Por último, en la siguiente figura vemos la representación gráfica de los sı́mbolos, donde ahora las
funciones base toman el papel de los valores en fase y cuadratura I y Q.

4QAM

ϕ2 (t)
ŝ2 ŝ1

ϕ1 (t)

ŝ4 ŝ3

4. Filtro receptor óptimo


En el extremo receptor de un sistema de comunicaciones digitales el objetivo es recuperar las com-
ponentes en fase y cuadratura enviadas para convertirlas posteriormente en bits y con el objetivo de
minimizar la probabilidad de error de bit. Por lo tanto, consideraremos el esquema de la siguiente
figura.

ˆ
I(k)
FILTRO
r(t) RECEPTOR

Q̂(k)
w(t)

167
Supondremos canal ideal, es decir hc (t), y ruido gaussiano de media nula y densidad espectral Sw (f ) =
N0 /2. Además, consideraremos que los sı́mbolos enviados si (t) tienen duración temporal T , de forma
que si cogemos la señal de entrada en ventanas de duración T centradas en si (t), únicamente veremos
contribución de ese sı́mbolo y no de los anteriores y posteriores. Con todo esto, nuestro modelo de
señal a la entrada del receptor es
L
X
r(t) = ŝi (t) + w(t), 0 ≤ t ≤ T, ŝi (t) = αi,l ϕl (t) (64)
l=1

donde consideramos que se ha enviado uno de los M posibles sı́mbolos de la modulación empleada.
Recordemos que si (t) representa el sı́mbolo emitido en el i-ésimo periodo (de infinitos periodos) mien-
tras que ŝi (t) representa el i-ésimo sı́mbolo de la modulación (de entre los M posibles).

! T
( · ) dt y1
0

ϕ1 (t)
! T
( · ) dt y2
0

r(t) ϕ2 (t)

! T
( · ) dt yL
0

ϕL (t)

Bajo estas condiciones, la primera etapa necesaria para extraer el sı́mbolo emitido es pasar r(t) por
un banco de correladores como se muestra en la figura anterior, en la que cada una de las ramas
lleva a cabo el producto escalar de ŝi (t) con cada una de las L funciones base. De esta forma, si sólo
tenemos en cuenta la parte de señal (sin ruido), en cada rama obtendremos el coeficiente de ŝi (t)
correspondiente a la función base en cuestión debido a la ortonormalidad de los elementos de la base.
Visto matemáticamente, la salida k-ésima vale
Z T Z +∞ Z +∞ XL
!
yk = r(t)ϕk (t) dt = r(t)ϕk (t) dt = αi,l ϕl (t) + w(t) ϕk (t) dt
0 −∞ −∞ l=1
L
X Z +∞ Z +∞
= αi,l ϕl (t)ϕk (t) dt + w(t)ϕk (t) dt
l=1 −∞ −∞
Z +∞
= αi,k + w(t)ϕk (t) dt
−∞
| {z }
nk

168
donde hemos pasado de la integral en T a la integral en todo R dado que suponemos que ŝi (t) tiene
duración T . Nótese que en la rama k-ésima del banco de correladores no estamos haciendo otra cosa
que aplicar un filtro adaptado a la función base ϕk (t) y muestrear en el máximo de la salida. Como
ϕk (t) va de 0 a T , su filtro adaptado deberá retrasarse como mı́nimo T para que sea causal, ası́ que
será ϕk (T − t) y por lo tanto la salida en el instante t = T valdrá
Z +∞ Z +∞


ϕk (t) ∗ ϕk (T − t) = ϕk (λ)ϕk (T − t + λ) dλ = ϕ2k (λ) dλ (65)
t=T −∞ t=T −∞

es decir, la energı́a de ϕk (t) como sucedı́a en el filtro adaptado1 .

No obstante, el ruido juega un papel muy importante que debemos analizar. Ya hemos visto que en
R +∞
cada rama, la contribución de ruido se encuentra en el término nk = −∞ w(t)ϕk (t) dt. También que
la contribución de señal es αi,k . Para poder trabajar de forma más ágil, tendremos en cuenta las M
ramas del correlador a la vez usando notación vectorial, esto es
y = [y1 , y2 , . . . , yL ]T = [αi,1 , αi,2 , . . . , αi,L ]T + [n1 , n2 , . . . , nL ]T = ŝi + n (66)

Distribución del ruido

Lo primero que debemos hacer es ver cómo se distribuye el vector de ruido n. De entrada, po-
demos decir que cada una de sus componentes nk tendrá una distribución gaussiana. A falta de una
demostración formal, sı́ que podemos ver intuitivamente que si interpretamos la integral como una
suma finita, estamos ante la suma de variables con distribución gaussiana e independientes ponderadas
por los valores de ϕk (t) y ya sabemos que la suma de variables gaussianas independientes es también
gaussiana. Veamos los momentos de primer y segundo orden de nk . Para la media tenemos
Z +∞  Z +∞
nk = E{nk } = E w(t)ϕk (t) dt = E{w(t)} ϕk (t) dt = 0 (67)
−∞ −∞ | {z }
0

y para el momento de segundo orden calculamos


Z +∞ Z +∞ 
E{nk nl } = E w(t)ϕk (t) dt w(t0 )ϕl (t0 ) dt0 (68)
−∞ −∞
Z +∞ Z +∞
= E{w(t)w(t0 )}ϕk (t)ϕl (t0 ) dt dt0
−∞ −∞

El término E{w(t)w(t0 )} corresponde a la autocorrelación de w(t) evaluada en t−t0 , esto es, E{w(t)w(t0 )} =
Rw (t − t0 ) = N0 /2 δ(t − t0 ). Aplicando este resultado llegamos a
Z +∞ Z +∞
N0
E{nk nl } = δ(t − t0 )ϕk (t)ϕl (t0 ) dt dt0 (69)
−∞ −∞ 2
Integramos primero en t0 , lo que dará como resultado evaluar el integrando en t0 = t debido a la delta,
esto es 
Z +∞  N0 , k = l
N0 2
E{nk nl } = ϕk (t)ϕl (t) dt = (70)
2 −∞  0, k 6= l

1
Téngase en cuenta también que aquı́ estamos estudiando qué sucede con un sólo sı́mbolo enviado a fin de simplificar
el problema pero que en el caso de enviar una señal completa sólo habrı́a que ir replicando el proceso de recepción.

169
donde hemos aplicado la propiedad de ortonormalidad de las funciones base.

Recopilando lo que hemos visto, podemos afirmar que n está formado por L variables aleatorias
gaussianas de media 0 e incorreladas. Además, como sus componentes provienen de distintas combina-
ciones de un mismo proceso de ruido, el vector n presenta una distribución gaussiana multivariable y
en el caso particular de esta distribución, incorrelación implica independencia. Con todo esto podemos
afirmar que
L L −n2
Y Y 1 2
i
2σn
n ∼ fn (n) = fn1 ,...,nL (n1 , . . . , nL ) = fni (ni ) = √ e i (71)
i=1 i=1
2πσni

Teniendo en cuenta que σn2 k = N0 /2 y aplicando las propiedades de la función exponencial podemos
decir que
L
Y −n2
i
 L Y
L −n2 2
||n||2
1 2 1 i 1 − L
P ni
1 − N
fn (n) = √ e 2σni = √ e N0 = e i=1 N0
= e 0 (72)
i=1
2πσni πN0 i=1
(πN0 )L/2 (πN0 )L/2

A continuación usaremos este resultado para ver cuál es la estadı́stica de la señal y a la salida del
banco de correladores.

Estadı́stica de la señal a la salida del banco de correladores y estimador de Máxima


Verosimilitud (ML)

Conocida la distribución del vector de ruido n y teniendo en cuenta y = ŝi + n según hemos visto
en (66), no resulta difı́cil extraer la estadı́stica de y si sabemos cuál ha sido el sı́mbolo enviado ŝi .
En este caso la distribución de y es la misma que la del ruido pero la media deja de ser el origen de
coordenadas para pasar a ser ŝi , esto es
(yk −αk,i ) 2 2
1 − L
P
1 ||y−ŝ ||
− Ni
fy|ŝi (y|ŝi ) = e k=1 N0 = e 0 (73)
(πN0 )L/2 (πN0 )L/2

Nótese que si lo miramos componente a componente, yk es gaussiana de media αi,k y varianza N0 /2.

Con este resultado ya podemos obtener el estimador ML o de máxima verosimilitud (’maximum like-
lihood’ en inglés). Dicho estimador usa la función de probabilidad de la señal recibida condicionada al
parámetro que queremos estimar, en este caso el sı́mbolo emitido que denotaremos ŝm . Este parámetro
debe interpretarse como determinista aunque desconocido para nosotros. Entonces el estimador ML
busca, de entre todos los parámetros posibles (en este caso los M sı́mbolos de la modulación), cuál es
más verosı́mil. Matemáticamente lo expresamos como
 ||y−ŝm ||2

ˆ 1 −
ŝ = argmax {fy|ŝm (y|ŝm )} = argmax e N 0 = argmin {||y − ŝm ||} (74)
ŝm ŝm (πN0 )L/2 ŝm

El concepto verosı́mil debe distinguirse de la idea de probable. Aquı́ no estamos diciendo que ŝˆ sea el
sı́mbolo que ha sido transmitido con mayor probabilidad, sino el sı́mbolo que más nos convence a la
luz de y únicamente. Para poder decidir qué sı́mbolo ha sido transmitido con mayor probabilidad, de-
berı́amos conocer también sus probabilidades de transmisión. Para ilustrarlo con un ejemplo sencillo,

170
imaginemos que se transmiten dos sı́mbolos ŝ1 y ŝ2 , el primero con probabilidad 99,9 % y el segundo
con probabilidad 0,01 %. Bajo esta condición, recibimos un vector y que se encuentra más próximo
a ŝ2 que a ŝ1 . Como hemos visto en la formulación anterior, la distancia entre y y cada uno de los
sı́mbolos posibles es lo que determina su verosimilitud. Volviendo al ejemplo, el segundo sı́mbolo es
más verosı́mil que el primero pero muy probablemente se haya transmitido el primero, caso en el que
la decisión ML nos darı́a error. No obstante, cuando los sı́mbolos transmitidos son equiprobables, el
estimador ML es óptimo. En caso contrario, deberı́amos recurrir al estimador ’Maximum a Poste-
riori’ (MAP) que trabaja con fŝm |y (ŝm |y). Con esta información sı́ que podrı́amos decidir cuál es el
sı́mbolo más probable de haber sido transmitido una vez recibimos y, pero en este curso vemos sólo
el estimador ML.

Con esto ya podemos completar el esquema de receptor óptimo, que es el el que podemos ver en la
siguiente figura. Después del banco de correladores que nos permite obtener el vector y, aplicamos
un bloque comparador donde se calcula la distancia de y respecto de cada uno de los sı́mbolos de la
modulación y tiene por lo tanto L entradas y M salidas. Por último, escogemos el sı́mbolo que más
verosı́mil parece.

! T ||y − ŝ1 ||
( · ) dt
0

ϕ1 (t)
! ||y − ŝ2 ||
COMPARADOR

T
( · ) dt
0

ARGMIN
r(t) ϕ2 (t) ŝˆ

! T ||y − ŝM ||
( · ) dt
0

ϕL (t)

5. Probabilidad de error
El último punto de este tema lo dedicaremos al cálculo de la probabilidad de error, que puede ser de
sı́mbolo o de bit como en la señal PAM digital. Lo primero que hay que ver, como entonces, es cuando
nos podemos equivocar de sı́mbolo debido a la contribución del ruido. Para ello supondremos que
trabajamos con el receptor que acabamos de ver (figura anterior) y seguiremos empleando el mismo
modelo vectorial para la señal a la salida de los correladores, es decir, y = ŝi + n.

171
Empecemos con el ejemplo de la siguiente figura, donde hemos dibujado la constelación de sı́mbolos de
una modulación 4QAM (posibles sı́mbolos emitidos) junto con el valor y recibido. En este caso, como
el sı́mbolo más próximo a y es ŝ1 , el estimador ML nos dirá ŝˆ = ŝ1 . Si realmente se ha transmitido el
sı́mbolo 1 no ha habido error; en caso contrario sı́.

4QAM

ϕ2 (t)
ŝ2 ŝ1


ϕ1 (t)

ŝ4 ŝ3

En lo que sigue, trataremos primero los casos binarios y luego nos centraremos en los casos M-arios.

Casos binarios

Supondremos que trabajamos únicamente con una función base ϕ1 (t) de forma que los dos sı́mbolos
transmitidos se situarı́an sobre esta base como muestra la figura siguiente. Esta situación aplica a
todos los casos binarios excepto en 2FSK, donde habrı́a que considerar dos funciones base (una para
cada frecuencia). El análisis de la probabilidad se complica en términos de cálculo y además debe
considerarse la posible memoria de la modulación (p.ej. en la implementación CPFSK), ası́ que en este
curso nos centraremos en el resto de casos.

ŝ2 ŝ1
y ϕ1 (t)

El modelo que tendremos a la salida del correlador es


 
N0
y = ŝi + n, n ∼ N 0, (75)
2
y la probabilidad de error Pe (aunque en este caso b = 1 y por lo tanto Pe = Pb ) es
Pe = P (e|ŝ1 )P (ŝ1 ) + P (e|ŝ2 )P (ŝ2 ) (76)
Al igual que sucedı́a en PAM digital, habrá error habiendo transmitido ŝ1 si y queda más cerca de
ŝ2 que de ŝ1 . Esto se da cuando n > d/2 en el caso de tener una sola función base2 . Por lo tanto,
2
Si hay 2 funciones base como en el caso de 2FSK habrá que tener en cuenta las dos componentes de ruido y que la
frontera de decisión será una lı́nea inclinada situada enmedio de los ejes correspondientes a ϕ1 (t) y ϕ2 (t).

172
repitiendo los cálculos hechos cuando evaluamos la señal PAM digital, tenemos
Z +∞ Z +∞ 2
1 − n2
P (e|ŝ1 ) = P (y > ŝ1 + d/2) = P (n > d/2) = fn (n) dn = p e n dn
2σ (77)
d/2 d/2 2πσn2
R +∞ λ 2
Si lo expresamos a través de la función Q(x) = √1 e− 2 dλ al igual que hicimos en el tema 7
x 2π
(apartado 4) nos queda
s ! s 
 
d d2 d2
P (e|ŝ1 ) = Q =Q = Q  (78)
2σn 4σn2 2N0

Del mismo modo


s 
Z −d/2
d2
P (e|ŝ2 ) = P (y < ŝ2 − d/2) = P (n < −d/2) = fn (n) dn = Q   (79)
−∞ 2N0

y juntando resultados llegamos a


s  s 
d2 d2
Pe = Q   P (ŝ1 ) + Q   P (ŝ2 ) (80)
2N0 2N0

Si los sı́mbolos son equiprobables (P (ŝ1 ) = P (ŝ2 ) = 1/2), entonces


s 
2
d 
Pe = Q  (81)
2N0

E1 +E2
Finalmente, usando el resultado de (53) y teniendo en cuenta que Eb = Ēs = 2 ya que b = 1,
llegamos a d2 = 2Eb − 2E1,2 y podemos escribir la probabilidad de error como
r !
Eb − E1,2
Pb = Pe = Q (82)
N0

Ejemplo 1: BPSK

En 2PSK, más conocida como BPSK, tenemos los dos siguientes sı́mbolos posibles correspondientes a
transmitir con fases φ0 = 0 y φ0 = π, esto es

ŝ1 (t) = Ac cos (2πfc t + θc )p(t) (83)


ŝ2 (t) = Ac cos (2πfc t + θc + π)p(t) = −Ac cos (2πfc t + θc )p(t) (84)
q
En este caso la base es ϕ1 (t) = T2 cos (2πfc t + θc )p(t) y la represntación vectorial de los sı́mbolos es
r
T
ŝ1 = Ac (85)
2
r
T
ŝ2 = −Ac (86)
2

173
Para calcular la probabilidad de error calculamos
Z +∞ Z +∞
E1,2 = ŝ1 (t)ŝ2 (t) dt = − ŝ21 (t) dt = −E1 = −Eb (87)
−∞ −∞

donde la última igualdad viene dada por el hecho de que E1 = E2 en este caso. Ası́ pues, nos queda
r !
2Eb
BER = Pb = Pe = Q (88)
N0

Ejemplo 2: OOK

En 2ASK, más conocida como OOK, tenemos dos sı́mbolos con amplitud 0 y Ac , respectivamente. Los
dos sı́mbolos posibles son

ŝ1 (t) = Ac cos (2πfc t + θc )p(t) (89)


ŝ2 (t) = 0 (90)

y la base es la misma que en el caso anterior. En forma vectorial los sı́mbolos son
r
T
ŝ1 = Ac (91)
2
ŝ2 = 0 (92)

La energı́a cruzada vale Z +∞


E1,2 = ŝ1 (t)ŝ2 (t) dt = 0 (93)
−∞
ası́ que la probabilidad de error vale
r !
Eb
BER = Pb = Pe = Q (94)
N0

Nótese que con el mismo valor de Eb /N0 la modulación BPSK tiene menor BER que la modulación

OOK. Esto es debido a que transmitiendo la misma potencia, la distancia entre sı́mbolos es 2 veces
mayor en BPSK.


174
Casos M-arios

En los casos M-arios, al igual que sucedı́a con la señal PAM digital, deberemos tener en cuenta más
de una posibilidad de error para cada sı́mbolo transmitido. Aquı́ trataremos un ejemplo concreto
(4QAM) para ver la mecánica de cálculo de la Pe . Luego veremos la probabilidad de error en M-QAM
y trataremos por encima la de M-PSK.

Empecemos pues con el ejemplo de 4QAM (M = 4 y b = 2)qque podemos ver en la siguien-


2
te figura, donde como ya vimos, las funciones base son ϕ1 (t) = T cos (2πfc t + θc )p(t) y ϕ2 (t) =
q
− T2 sin (2πfc t + θc )p(t).

ϕ2 (t)
ŝ2 d ŝ1

d
ϕ1 (t)

ŝ4 ŝ3

Ahora expresamos los distintos sı́mbolos de la modulación en forma vectorial y en función de la


distancia entre ellos d, esto es

ŝ1 = [d/2, d/2]T (95)


ŝ2 = [−d/2, d/2]T (96)
T
ŝ3 = [d/2, −d/2] (97)
ŝ4 = [−d/2, −d/2]T (98)
d2 d2 d2
Podemos apreciar que todos los sı́mbolos tienen igual energı́a Ei = 4 + 4 = 2 , ası́ que la energı́a
media de sı́mbolo y la energı́a media de bit valen

d2 Ēs d2
Ēs = , Eb = = (99)
2 b 4
El cálculo de la probabilidad de error deberá hacerse como siempre, esto es

Pe = P (e|ŝ1 )P (ŝ1 ) + P (e|ŝ2 )P (ŝ2 ) + P (e|ŝ3 )P (ŝ3 ) + P (e|ŝ4 )P (ŝ4 ) (100)

y en general habrá que estudiar cada caso por separado (aunque a menudo existen simetrı́as y muchos
de los casos se repiten). Empecemos por el término P (e|ŝ4 ) donde el señal recibido será y = ŝ4 + n.
Como vemos en la siguiente figura, tendremos error siempre que el vector de ruido nos haga desplazar
a la zona sombreada.

175
ϕ2 (t)
ŝ2 ŝ1

ϕ1 (t)

ŝ4 ŝ3

Teniendo en cuenta que n = [n1 , n2 ]T , podemos calcular la probabilidad de error para ŝ4 de dos formas
equivalentes: i) viendo la probabilidad de caer en la zona de error o bien ii) viendo la probabilidad de
caer en la zona de detección correcta y considerar Pe = 1 − Pd . Consideremos la primera opción, con
lo que tendremos

P (e|ŝ4 ) = P (y1 > 0) + P (y2 > 0) − P (y1 > 0, y2 > 0) (101)


= P (n1 > d/2) + P (n2 > d/2) − P (n1 > d/2, n2 > d/2)

Si nos fijamos en la siguiente figura donde se dibuja cada una de las zonas que se han tenido en cuenta,
vemos que el primer cuadrante se ha tenido en cuenta dos veces con los dos primeros sumandos y es
por eso que hay que restar la probabilidad de dicha zona.

P (y2 > 0) P (y1 > 0) P (y1 , y2 > 0)

ϕ2 (t) ϕ2 (t) ϕ2 (t)


ŝ2 ŝ1 ŝ2 ŝ1 ŝ2 ŝ1

ϕ1 (t) ϕ1 (t) ϕ1 (t)

ŝ4 ŝ3 ŝ4 ŝ3 ŝ4 ŝ3

Como n1 y n2 son independientes,

P (e|ŝ4 ) = P (n1 > d/2) + P (n2 > d/2) − P (n1 > d/2)P (n2 > d/2) (102)
       
d d d d
= Q +Q −Q Q
2σn1 2σn2 2σn1 2σn2
p
y teniendo en cuenta que σn1 = σn2 = N0 /2 junto con Eb = d2 /4 llegamos a
r ! r !
2Eb 2 2Eb
P (e|ŝ4 ) = 2Q −Q (103)
N0 N0

176
Alternativamente, podemos escoger la segunda opción (Pe = 1 − Pd ) y calcular

P (e|ŝ4 ) = 1 − P (y1 < 0, y2 < 0) = 1 − P (n1 < d/2, n2 < d/2) (104)
     
d d
= 1 − P (n1 < d/2)P (n2 < d/2) = 1 − 1 − Q 1−Q
2σn1 2σβ2
r !! r !!
2Eb 2Eb
= 1− 1−Q 1−Q
N0 N0
r ! r !
2Eb 2Eb
= 2Q − Q2
N0 N0

obteniendo el mismo resultado.

Por último y suponiendo sı́mbolos equiprobables obtenemos una probabilidad de error de sı́mbolo, a
veces también denominada SER (’Symbol Error Rate’), de
4 r ! r !
1X 2Eb 2 2Eb
Pe = P (e|ŝi ) = 2Q −Q (105)
4 N0 N0
i=1
q 
2Eb
Además, si Eb /N0 es suficientemente grande podremos considerar Q2 N0 despreciable, ası́ que la
Pe en M-PAM será r !
2Eb
Pe ≈ 2Q (106)
N0
y en caso de usar codificación Gray la BER será
r !
Pe 2Eb
Pb ≈ ≈Q (107)
2 N0

Nótese que la Pb obtenida es la misma que en BPSK para una misma relación Eb /N0 y también
para una misma distancia entre sı́mbolos. Aquı́ nos beneficiamos del hecho de transmitir en dos bases
ortogonales aventajando en todo a la modulación BPSK salvo en complejidad de hardware.

Probabilidad de error en M-QAM

Consideremos de entrada el caso 16-QAM que ya tratamos y que podemos ver en la siguiente figura.
En este caso hay que considerar 4 tipos distintos de sı́mbolos en términos de error y que han sido
marcados en distinto color en la figura. Nótese que dentro de cada grupo, la distancia del sı́mbolo
al origen, el número de sı́mbolos que lo rodean y la distancia a estos últimos es la misma. Ası́ pues,
los sı́mbolos ŝ1 , ŝ2 y ŝ4 son representativos de todos los sı́mbolos posibles de la modulación. Téngase
en cuenta que en la figura se ha marcado la zona de detección correcta del sı́mbolo ŝ1 y que las
zonas correspondientes a ŝ2 y ŝ4 son cada vez mayores. Si queremos hacer el cálculo exacto de la Pe
deberemos estudiar cada caso por separado como hemos hecho en el ejemplo anterior y, suponiendo
sı́mbolos equiprobables, calcular la Pe como
1
Pe = (4P (e|ŝ1 ) + 8P (e|ŝ2 ) + 4P (e|ŝ4 )) (108)
16

177
ϕ2 (t)
ŝ8 ŝ7 ŝ3 ŝ4

ŝ6 ŝ5 ŝ1 ŝ2

ϕ1 (t)
ŝ13 ŝ14 ŝ9 ŝ10

ŝ15 ŝ16 ŝ11 ŝ12

Como habrı́a que repetir este cálculo para cada posible M , aquı́ lo que haremos será hacer una
aproximación que nos permita trabajar de forma más ágil. En concreto, interpretaremos la modulación

M-QAM como si se tratase de dos modulaciones PAM digitales de M sı́mbolos sobre las bases ϕ1 (t)
y ϕ2 (t) como muestra la siguiente figura, es decir, sobre la base ϕ1 (t) consideraremos que la señal
recibida es y1 = αi,1 + n1 e, independientemente, sobre la base ϕ2 (t) consideraremos que la señal
recibida es y2 = αi,2 + n2 .

ϕ2 (t)
ϕ2 (t)
ŝ8 ŝ7 ŝ3 ŝ4

ŝ6 ŝ5 ŝ1 d ŝ2


d
d
ϕ1 (t) ≈ ϕ1 (t)
× d

ŝ13 ŝ14 ŝ9 ŝ10

ŝ15 ŝ16 ŝ11 ŝ12

Bajo esta simplificación, podemos aproximar la Pe para la modulación M-QAM como

Pe ≈ 1 − Pdϕ1 (t) Pdϕ2 (t) = 1 − (1 − Peϕ1 (t) )(1 − Peϕ2 (t) ) (109)

donde Pdϕi (t) y Peϕi (t) representan la probabilidad de detección correcta e incorrecta en la i-ésima base,
respectivamente. Desarrollando un poco más llegamos a

Pe ≈ Peϕ1 (t) + Peϕ2 (t) − Peϕ1 (t) Peϕ2 (t) ≈ Peϕ1 (t) + Peϕ2 (t) = 2Peϕi (t) (110)

donde la última aproximación supone que ambas Peϕi (t) tienen un valor muy pequeño y la última igual-
 
dad que Peϕ1 (t) = Peϕ2 (t) . Ahora recordando que la Pe de la PAM digital M-aria es Pe = 2(MM−1) Q 2σdn
(ver tema 7, apartado 4) y aplicado al caso que nos ocupa obtenemos
√ s !
4( M − 1) d2
Pe ≈ √ Q (111)
M 4σn2

Por último, nos interesarı́a expresar Pe en función de Eb /N0 . Ya sabemos que σn2 = N0 /2, ası́ que
nos falta expresar d2 en función de Ēs primero y luego Eb . Para ello consideramos la representación

178
vectorial de los sı́mbolos en función de la distancia d entre ellos. Por ejemplo, para el caso 16QAM
(ver figura anterior) tendrı́amos por ejemplo

ŝ1 = [d/2, d/2]T , ŝ2 = [3d/2, d/2]T , ŝ4 = [3d/2, 3d/2]T (112)

y si nos fijamos en cada una de los componentes de los sı́mbolos por separado (considerando el conjunto
de los M sı́mbolos posibles) vemos que tenemos los valores correspondientes a una señalización M-aria

polar donde d juega el papel de ∆ y con M valores en cada componente. Del tema 7 (apartado
2
4) sabemos que la varianza del conjunto de valores vale σa2 = M12−1 ∆2 . Sustituyendo ∆ por d y M

por M vemos que la varianza en cada componente de la modulación M-QAM vale M12−1 d2 . Como
la media es nula, varianza equivale a la media de los valores al cuadrado, justo lo que necesitamos
para obtener la energı́a media de sı́mbolo. Únicamente falta tener en cuenta que un sı́mbolo M-QAM
está formado por dos componentes independientes, ası́ que hay que multiplicar el resultado anterior
por 2, con lo que llegamos a
M −1 2 M −1 2
Ēs = 2 d = d (113)
12 6
Ahora teniendo en cuenta que Eb = Ēs / log2 M ya podemos escribir
M −1 2 Eb 6 log2 M
Ēb = d −→ d2 = (114)
6 log2 M M −1
Esto ya nos permite representar Pe en función de Eb /N0 como pretendı́amos, esto es
√ s ! √ s !
4( M − 1) Eb 6 log2 M 2 4( M − 1) 3Eb log2 M
Pe ≈ √ Q = √ Q (115)
M 4(M − 1)N0 M (M − 1)N0

y el BER, en caso de usar codificación de Gray, como


√ s !
4( M − 1) 3Eb log2 M
Pb ≈ √ Q (116)
M log2 M (M − 1)N0

Probabilidad de error en M-PSK

En el caso de M-PSK los sı́mbolos (interpretados como vectores) presentan todos el mismo módulo y
lo que cambia es su fase, que vale
2π π
φi = (i − 1) + , i = 1, . . . , M (117)
M M
En la siguiente figura podemos ver la constelación de sı́mbolos y la zona de detección correcta para
el primer sı́mbolo sombreada. Vemos que dicha zona deja de ser rectangular y alineada con los ejes
como sucedı́a en M-QAM. Como siempre, debemos calcular la probabilidad de que el ruido (en sus
dos componentes) nos lleve fuera de dicha zona. No obstante, es evidente que el cálculo se complica.
Aunque no lo haremos aquı́, hay que trabajar en coordenadas polares para acabar obteniendo, a partir
de la distribución del ruido, la función densidad de probabilidad de la fase del vector recibido y, esto
es fφ (φ). Entonces para el primer sı́mbolo, por ejemplo, se calcuları́a P (e|ŝ1 ) haciendo
Z 2π/M
P (e|ŝ1 ) = 1 − fφ (φ) dφ (118)
0

179
ϕ2 (t)

! π
ŝ1 = Ēs ej M

! d
Ēs ϕ1 (t)

El resultado de este cálculo3 es


s  r !
2Ēs π 2Eb log2 M π
P (e|ŝ1 ) ≈ 2Q  sin  = 2Q sin (119)
N0 M N0 M

y como la probabilidad de error es idéntica para todos los sı́mbolos (ver figura) llegamos a
s  r !
2Ēs π 2E b log M π
Pe ≈ 2Q  sin  = 2Q 2
sin (120)
N0 M N0 M

Si suponemos codificación de Gray, el BER es


r !
2 2Eb log2 M π
Pb ≈ Q sin (121)
log2 M N0 M

Por último, nótese que en este caso se cumple que (ver figura)

d p π
= Ēs sin (122)
2 M
y la probabilidad de error acaba siendo
 
d
Pe = 2Q (123)
2σn
d
es decir, la misma que en M-QAM salvo por el factor 2. Por lo tanto queda claro que la relación 2σn
es determinante en la probabilidad de error de las modulaciones digitales (salvo en MFSK).

3
Se puede consultar en A.B. Carlson, “Sistemas de Comunicaciones”, sección 14.4.

180

También podría gustarte