03 Compresion de Imagen

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 38

INTRODUCCION A LA COMPRESION

DE IMAGEN

Constantino Pérez Vega


Dpto. de Ingeniería de Comunicaciones
Curso 2009-2010

Inicio de
línea digital
T(ns) = 1000/13.5
inicio de activa
blanking
horizontal

OH

12T 132T 720T


Línea activa de vídeo
Blanking digital digital

Muestras de lum inancia

Muestras de crominancia

SAV
EAV
(Start of Active Video)
(End of Active Video)

Intervalo de borrado (blanking) horizontal La señal TRS utiliza sólo cuatro


144 muestras (bytes) símbolos (bytes) del intervalo de
borrado

1
Ancho de Banda requerido por la señal digital:

Radiodifusión Terrestre de TV y Cable: 6 MHz (NTSC) y 7 u 8 MHz (PAL)

Señal digital en el entorno del estudio, sin modulación digital:


216 MHz (4:2:2) 27 canales PAL de 8 MHz
324 MHz (4:4:4) 40 canales PAL de 8 MHz

PARA UNA SOLA SEÑAL


DE VÍDEO

Satélite: 9 canales de satélite (4:2:2)


Suponiendo transpondedores
de 36 MHz : 6 canales de satélite (4:4:4)

FORMATOS DE CODIFICACION

2
Debido al desarrollo de otros sistemas de transmisión de imágenes
digitales, aparte de la televisión, se han establecido diversos formatos
para codificación digital, con diferentes números de elementos, por
ejemplo para televisión de “alta definición”, televisión de definición
estándard, videoconferencia, transmisión a imágenes en dispositivos
móviles, etc. designados genéricamente como multimedia.

Formatos de codificación (no deben confundirse con formatos de compresión)

CIF (Common Intermediate Format) Usado para estandarizar las resoluciones


horizontal y vertical en píxels de secuencias de vídeo en componentes YCbCr.
Se diseñó para convertir fácilmente PAL  NTSC y se propuso inicialmente en
el estándard H.261.
Define una secuencia de vídeo con resolución de 352(H)x288(V) y una
frecuencia de cuadro de 30000/1100 (aprox. 29.97 cuadros/seg) con
codificación de color YCbCr 4:2:0.

QCIF (Quarter CIF). Significa "un cuarto de CIF" y ocupa la cuarta parte del
área en CIF. La altura y el ancho se reducen a la mitad.

También se utilizan SQCIF (Sub Quarter CIF), 4CIF (4× CIF) and 16CIF
(16× CIF).

3
Formato Resolution (HxV)

SQCIF 128 × 96

QCIF 176 × 144

CIF 352 × 288

4CIF 704 × 576

16CIF 1408 × 1152

Todos los formatos XCIF resultan en imágenes con relación de


aspecto 4:3

Los tamaños de imágen XCIF son múltiplos de macrobloques


(16x16 píxels)

Por ejemplo, una imagen CIF (352x288) corresponde a 22x18


macrobloques.

4CIF es adecuado para SDTV (TV estándard) y DVD


16CIF para imágenes de alta definición
CIF y QCIF se usan generalmente para videoconferencia
QCIF o SQCIF son adecuados para aplicaciones multimedia
móviles

4
1408x1056
16CIF

704 x 528
4CIF

352 x 264
CIF

176 x132
QCIF

Estas imágenes, en general, se


128 x 96
someten a compresión subsecuente SQCIF

3. CRITERIOS DE CALIDAD

5
Sin compresión

138 kbit

18 kbit

6
18 kbits

18 kbits

QCIF (176 x 132)

Misma imagen ampliada

7
Muestreo 4:4:4

8
Esto se debe a que la respuesta espectral del ojo es
menor a la información de color que a la de luminancia,
lo que permite prescindir de la mitad o más de las
muestras de color o crominancia.

Muestreo 4:2:2 : Se tiran la mitad de las muestras horizontales (línea)


de crominancia.

9
Muestreo 4:2:0: Se tiran la mitad de las muestras horizontales de
crominancia y la mitad de las verticales

10
Tasas binarias según el formato de muestreo.

Vídeo digital

4:4:4 324 Mbit/s RGB


Señal
analógica
Recomendación 4:2:2 216 Mbit/s YCrCb
UIT BT.601-5

4:2:0 162 Mbit/s YCrCb

COMPRESION
H.261 MPEG1, MPEG2, H.263
MPEG4 Visual, H.264/MPEG4 AVC
VC-1 (WMV9)

La unidad básica para el procesado y compresión de imágenes


digitalizadas en MPEG-1 y MPEG-2 es el bloque de 8 x 8
elementos de imagen y el macrobloque de 16 x 16 elementos de
imagen.

Los estándares desarrollados recientemente (H.264, MPEG-4,


VC-1 y otros), pueden trabajar con bloques de 4 x 4 y otros
tamaños, mejorando la eficiencia de compresión.

11
12
Generación y CAD Producción/Postproducción

4:4:4 Audio
4:2:2 comprimido
4:2:0

Flujo MPEG-2
Flujo de transporte
de programa
Compresión
MUX Audio digital

Otros datos

13
Contexto de la compresión en televisión digital

3. CODIFICACION DE FUENTE:
COMPRESION DE VIDEO
Aspectos comunes a todos los
sistemas

14
Los esquemas anteriores corresponden a
imágenes digitales de televisión no comprimidas,
independientemente del formato de codificación.

De ellas es necesario eliminar una gran cantidad


de información para conseguir la compresión

Arquitectura general de un sistema de transmisión digital

Paquetes de
transporte MPEG

Video analógico
de programa CODIFICACION
CODIFICACION
DE CANAL
DE MULTIPLEXADO
Y
FUENTE
MODULACION

Conversión A/D
Compresión

Otros programas
en el mismo canal
de RF

15
Compresión de vídeo:
Se basa en aprovechar las propiedades de las imágenes y las
características perceptuales del sistema visual humano:
• Redundancia espacial
• Redundancia temporal
• Compactación de energía
• Eliminación de información irrelevante
• Respuesta visual humana

Compresión de audio
Se basa principalmente en la explotación de las características
psicofisiológicas del sistema auditivo humano:
• Enmascaramiento
• Respuesta en frecuencia del oído interno (cóclea)
• Compactación de energía

Compresión:
Es la reducción del flujo o tasa binaria:
• Reduciendo la información redundante
• Eliminando la información irrelevante

Información redundante:
Información superflua, presente varias veces en el flujo binario, o que no
contiene información, o que puede recuperarse fácilmente sin pérdidas,
mediante un proceso matemático simple en el receptor.

Información irrelevante:

Es la que no puede ser percibida por el sistema visual humano, de modo


que puede ser eliminada sin pérdida de la calidad subjetiva.

16
Procesos en MPEG que permiten alcanzar elevados
niveles de compresión

Resolución a 8 bits/muestra en lugar de 10 (reducción de


irrelevancia)
Omisión de intervalos de blanking H & V (reducción de
redundancia)
Reducción de resolución de color H & V (4:2:0) (reducción de
irrelevancia)
Codificación DPCM de imágenes en movimiento (redundancia).
DCT seguida de cuantificación perceptual (irrelevancia).
Barrido en zig-zag con VLC (redundancia)
Codificación Huffman (redundancia).

Redundancia Espacial

Zonas con elementos de


imagen similares, aunque con
algunas variaciones más
notorias perceptualmente

Zonas en que los elementos de


imagen son prácticamente
iguales con muy pocas
variaciones entre uno y otro

17
Redundancia temporal

Cuadros sucesivos

Objetos en movimiento

Entre cuadros sucesivos la información entre


cuadros es la misma, excepto en la posición de
los objetos en movimiento. La información
redundante entre cuadros se puede eliminar

La unidad básica para el procesamiento de la imagen es el bloque de


8x8 elementos de imagen, tanto para luminancia como para crominancia.
Un macrobloque (16x16) está formado por cuatro bloques de luminancia
y dos bloques de crominancia.

Los bloques de la señal original constituyen matrices de 8x8 elementos


cuyos valores corresponden a los niveles de brillo (luminancia) de la
escena o imagen original. La correlación entre esos valores suele ser
elevada y la distribución de energía es bastante uniforme. Esta señal no
está comprimida.

Para comprimir la señal es necesario utilizar alguna técnica que


compacte la energía en unos pocos coeficientes.

Las transformadas, como Fourier, DCT y otras tienen esa propiedad.

18
Transformadas:

Transformada del coseno discreto (DCT)


Cuantificación Perceptual
Codificación de longitud variable (VLC) - Entropía
Estimación y compensación de movimiento

Transformadas: Propiedades de compactación de energía de


los coeficientes transformados

Imagen original Fourier

DCT Seno discreto

Hadamard Karhunen-Loeve

19
Transformada del Coseno Discreto (DCT)

 (2 x  1)u    (2 y  1)v  
7 7
1
F (u , v )  C (u ) C (v )   f ( x , y ) cos   cos  
4 x 0 y 0  16   16

1
C (w )  para w  0
2
1 para w  1, 2 ,...,7

1 7 7  (2 x  1)u    (2 y  1)v  
f (x , y )   
4 u 0 v 0
C (u ) C (v ) F (u , v ) cos 
 16 

cos 
 16 

la DCT parte el área de la imagen en frecuencias


discretas en dos dimensiones

20
Imagen Original 1 pixel = 1 muestra Y+ Cr + Cb

Dominio de la
Dominio transformada
espacial
8x8 coeficientes
8x8 pixels

DCT

Procesado en el Estudio Cuantificación perceptual


Calidad de contribución Algoritmos de compresión
Señal comprimida

Cuantificación perceptual

: =

Matriz Matriz de Matriz cuantificada


transformada coeficientes perceptualmente
perceptuales

21
DCT

Cuantificación

Codificación de
recorrido

Coeficientes de cuantificación perceptual de luminancia

22
Codificación de recorrido (RLC)

Secuencia de codificación

Grupo de imágenes (GOP)

I P B B B P B B P B B I

23
Jerarquía de los datos de video

8x8

Bloque Segmento Cuadro

Macrobloque

Grupo de Imágenes (GOP)

Secuencia de vídeo

Segmentación (slicing)
Macrobloque
Segmento (slice): secuencia de macrobloques
contiguos en orden del barrido

24
Flujo de Transporte

Estructura de un macrobloque MPEG

16 x 16 muestras

8 x 8 muestras c/u

Cr Cb

Crominancia
Luminancia (Y)

25
Compensación de movimiento

tiempo

Imagen de referencia Imagen actual Imagen de referencia


Predicción hacia Predicción hacia
adelante atrás

Reducción de redundancia temporal

26
Codificación híbrida

Vídeo digital no Coeficientes


comprimido Residuo

Modelo Modelo Codificador


temporal espacial de entropia
Salida
codificada

Vectores de movimiento
(códigos binarios cortos)

Imágenes previas y
futuras

Typical MC+DCT Video Coder


DCT,
Quantize, Encoded Residual
Input Entropy Encode (To Channel)
Frame
Entropy Decode,
Motion Quant. Recon.,
Compensated Inverse DCT
Prediction
(Dotted Box Approximated
Shows Decoder) Input Frame
Prior Coded (To Display)
Motion Comp. Frame Approx Frame Buffer
Predictor (Delay)

Motion Vector and


Motion Block Mode Data
Estimation (To Channel)

27
Flujo óptico

Cuadro n Cuadro n ± k

Diferencia

28
Residuos

bloques de 16 x 16 bloques de 8 x 8

El residuo es la resta de la predicción


del codificador y de la señal actual de
entrada

bloques de 4 x 4

Vectores de movimiento

bloques de 4 x 4
bloques de16 x 16
vectores de ¼ pixel

Fuente: Richardson, I.E.G. H.264 and MPEG-4 Video Compression. John Wiley & Sons, 2003.

29
Evolución de los estándares de compresión

Evolucion de la capacidad de compresión

30
Formatos de Compresión UIT

H.261
Diseñado para comunicación bidireccional sobre líneas ISDN.
Emplea compresión intracuadro e intercuadro y soporta
resoluciones CIF y QCIF. Fue el primer estándard práctico de
codificación de vídeo

H.262 – El estándard es prácticamente igual a MPEG-2

H.263
Diseñado en 1995. Basado en H.261 con prestaciones que
mejoran la calidad de vídeo. Soporta resoluciones CIF, QCIF,
SQCIF, 4CIF y 16CIF. Se utiliza en video conferencia y en clips
de vídeo como YouTube, Google Video, etc.

MPEG-1
Diseñado para tasas binarias hasta de 1.5 Mbit/s.
Basado en aplicaciones de CD-ROM, es un estándard popular para
vídeo sobre Internet, transmitidos como archivos “.mpg”.
El nivel 3 de MPEG-1 (MP3), se ha convertido en el estándard más
popular para compresión de audio. Cuadros de 352 x 240 píxeles. 20
Mbit/s sin compresión y de 1 a 3 Mbps con compresión.

MPEG-2
Diseñado para tasas binarias entre 1.5 y 15 Mbit/s.
Es el estándard adoptado para televisión digital en el que se basan
todas las terminales de abonado. También se emplea para
grabación en DVD. LL (Low Level) 352 x 240 píxeles. Main Level
(Rec. 601 UIT-R): 720 x 480 píxeles luminancia y 352 x 480
crominancia.

31
MPEG-4
Inicialmente MPEG-4 tuvo como objetivo la codificación de audio y
vídeo a tasas binarias muy bajas. El estándard se optimizó
explícitamente para tres rangos:
• <64 kbit/s
• 64 a 384 kbit/s
• 384 kbit/s a 4 Mbit/s

La primera versión de MPEG-4 (1999) se designa como MPEG-4


Visual, MEG-4 Parte 2 y no debe confundirse con MPEG-4 AVC

MPEG-4 no es compatible con MPEG-2

H.264/AVC (MPEG-4 Parte 10


H.264 se inició por el VCEG (Video Coding Experts Group) en el seno de la
UIT (Unión Internacional de Telecomunicaciones).
Las etapas finales de H.264 se desarrollaron conjuntamente por los grupos
MPEG y VCEG. El estándard final fue designado como H.264/AVC
(Advanced Video Coding) y se incorporó al estándar MPEG-4 como Parte
10 o MPEG-4 AVC
H.264/MPEG-4 Parte 10 se publicó en 2003.

MPEG-4 Visual y H.264 tienen aspectos relacionados pero


significativamente diferentes.
MPEG-4 hace énfasis en la flexibilidad.
H.264 enfatiza la eficiencia y fiabilidad.

H.264/AVC no es compatible con MPEG-2

32
Todos los sistemas anteriores tienen semejanzas en el algoritmo
de codificación que emplea:

• Estimación y predicción de movimiento inter-cuadro


• Codificación espacial por transformada (DCT)
• Cuantificación escalar
• Exploración en zig-zag
• Codificación por entropía (VLC)

Sin embargo hay diferencias entre MPEG-2 y MPEG-4 y en las


propias implementaciones de las versiones de cada uno

OBJETO VISUAL
Parte de la escena a la que se puede
acceder o manipular independientemente

OBJETO DE VIDEO OBJETO MALLADO


Area de textura que (MESH)
cambia con el tiempo Superficie 2D o 3D que
cambia con el tiempo

OBJETO DE OBJETO DE ANIMACION


TEXTURA FIJA DE CARA Y CUERPO
Area de textura que no Objeto mallado humanoide que
cambia con el tiempo puede cambiar con vectores de
expresión y postura

Textura: Apariencia de la escena Mallado: Con estructura de malla, coordinado de forma tal
que todas las partes funcionen juntas en armonía

33
Codificación en MPEG-4 y H.264

Bloques

FONDO

Objeto 2

Objeto 1

Cuadro compuesto

34
35
Originales

Compuestas

36
Mallado.

37
38

También podría gustarte