JPEG

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

Joint Photographic Experts Group 1

Joint Photographic Experts Group


JPEG

Desarrollador

'Joint Photographic Experts Group'

Información general

Extensión de archivo .jpeg, .jpg, .jpe


.jfif, .jfi, .jif
(contenedores)

Tipo de MIME image/jpeg

Type code JPEG

Uniform Type public.jpeg


Identifier

Número mágico ff d8

Tipo de formato Gráfico con compresión con pérdida

JPEG significa "Joint Photographic Experts Group", Grupo conjunto de expertos en fotografía, nombre de la
comisión que creó la norma, la cual fue integrada desde sus inicios por la fusion de varias agrupaciones en un intento
de compartir y desarrollar su experiencia en la digitalización de imágenes. La ISO, tres años antes (abril de 1983),
había iniciado sus investigaciones en el área.
JPEG además de ser un metodo de compresión, es a menudo considerado como un formato de archivo. JPEG/Exif
es el formato de imagen más común utilizado por las cámaras fotográficas digitales y otros dispositivos de captura de
imagen, junto con JPEG/JFIF, que también es otro formato para el almacenamiento y la transmisión de imágenes
fotográficas en la World Wide Web. JPEG/JFIF es el formato más utilizado para almacenar y transmitir archivos de
fotos en Internet. Estas variaciones de formatos a menudo no se distinguen, y se llaman JPEG.

Compresión del JPEG


Es un algoritmo de compresión con pérdida. Esto significa que al descomprimir la imagen no obtenemos
exactamente la misma imagen que teníamos antes de la compresión.
Una de las Características que hacen muy flexible el JPEG es el poder ajustar el grado de compresión. Si
especificamos una compresión muy alta se perderá una cantidad significativa de calidad, pero obtendremos archivos
de pequeño tamaño. Con una tasa de compresión baja obtenemos una calidad muy parecida a la del original, y un
archivo menor.
Esta pérdida de calidad se acumula. Esto significa que si comprime una imagen y la descomprime obtendrá una
calidad de imagen, pero si vuelve a comprimirla y descomprimirla otra vez obtendrá una pérdida mayor. Cada vez
que comprima y descomprima la imagen, ésta perderá algo de calidad. La compresión con pérdida no es conveniente
en imágenes o gráficos que tengan textos o líneas y sobre todo para archivos que contengan grandes áreas de colores
sólidos.
El algoritmo de compresión JPEG se basa en dos defectos visuales del ojo humano, uno es el hecho de que es mucho
más sensible al cambio en la luminancia que en la crominancia, es decir, notamos más claramente los cambios de
brillo que de color. El otro es que notamos con más facilidad pequeños cambios de brillo en zonas homogéneas que
en zonas donde la variación es grande, por ejemplo en los bordes de los cuerpos de los objetos.
Joint Photographic Experts Group 2

Codificación
Muchas de las opciones del estándar JPEG se
usan poco. Esto es una descripción breve de
uno de los muchos métodos usados
comúnmente para comprimir imágenes
cuando se aplican a una imagen de entrada
con 24 bits por pixel (ocho por cada rojo,
verde, y azul, o también dicho "8 bits por
canal"). Esta opción particular es un método
de compresión con pérdida.

Transformación del espacio de


color
Comienza convirtiendo la imagen desde su
modelo de color RGB a otro llamado YUV ó
YCbCr. Este espacio de color es similar al que
usan los sistemas de color para televisión PAL
y NTSC, pero es mucho más parecido al
sistema de televisión MAC. El algoritmo JPEG, transforma la imagen en cuadrados de 8×8 y luego almacena
cada uno de estos como una combinación lineal o suma de los 64 recuadros que
Este espacio de color (YUV) tiene tres forman esta imagen, esto permite eliminar detalles de forma selectiva, por
componentes: ejemplo, si una casilla tiene un valor muy próximo a 0, puede ser eliminada sin
que afecte mucho a la calidad.
• La componente Y, o Luminancia
(información de brillo), es decir, la imagen
en escala de grises.
• Las componentes U o Cb y V o Cr,
respectivamente diferencia del azul
(relativiza la imagen entre amarillo y azul)
y diferencia del rojo (relativiza la imagen
entre verde y rojo); ambas señales son
conocidas como crominancia (información
de color).

El resultado es una imagen en la que la


luminancia está separada de la crominancia.
Las ecuaciones que realizan este cambio de
base de RGB a YUV son las siguientes:
Esquema del modelo RGB.
Joint Photographic Experts Group 3

Esquema del modelo YUV.

Y = 0.257 * R + 0.504 * G + 0.098 * B + 16


Cb = U = -0.148 * R - 0.291 * G + 0.439 * B + 128
Cr = V = 0.439 * R - 0.368 * G - 0.071 * B + 128

Las ecuaciones para el cambio inverso se pueden obtener despejando de las anteriores y se obtienen las siguientes:

B = 1.164 * (Y - 16) + 2.018 * (U - 128)


G = 1.164 * (Y - 16) - 0.813 * (V - 128) - 0.391 * (U - 128)
R = 1.164 * (Y - 16) + 1.596 * (V - 128)

NOTA: Estas ecuaciones están en continua investigación, por lo que se pueden encontrar en libros y en la red otras
ecuaciones distintas pero con coeficientes muy parecidos.
Si se analiza el primer trío de ecuaciones veremos que las tres componentes toman como valor mínimo el 16. El
canal de luminancia (canal Y) tiene como valor máximo el 235, mientras que los canales de crominancia el 240,
todos estos valores caben en un byte haciendo redondeo al entero más próximo. Durante esta fase no hay pérdida de
información.
NOTA: Esta última afirmación no es del todo cierta ya que debido a los redondeos se introduce un pequeño margen
de error aunque imperceptible para el ojo humano.
Joint Photographic Experts Group 4

Submuestreo
Una opción que se puede aplicar al guardar la imagen, es reducir la
información del color respecto a la de brillo (debido al defecto en
el ojo humano comentado anteriormente). Hay varios métodos: si
este paso no se aplica, la imagen sigue en su espacio de color
YUV, (este submuestreo se entiende como 4:4:4), con lo que la
imagen no sufre pérdidas. Puede reducirse la información
cromática a la mitad, 4:2:2 (reducir en un factor de 2 en dirección
horizontal), con lo que el color tiene la mitad de resolución (en
horizontal), y el brillo sigue intacto. Otro método, muy usado, es
reducir el color a la cuarta parte, 4:2:0, en el que el color se reduce
Ligera explicación visual sobre el submuestreo, la
en un factor de 2 en ambas direcciones, horizontal y vertical. Si la imagen de arriba a la izquierda es la original, las otras
imagen de partida estaba en escala de grises (blanco y negro), sufren unos submuestreos de color salvajes que dan
puede eliminarse por completo la información de color, quedando idea de los efectos de esta técnica. Ampliar para mejor
visualización.
como 4:0:0.

Algunos programas que permiten el guardado de imágenes en JPEG (como el que usa GIMP) se refieren a estos
métodos con 1×1,1×1,1×1 para YUV 4:4:4 (no perder color), 2×1,1×2,1×1 para YUV 4:2:2 y 2×2,1×1,1×1 para el
último método, YUV 4:2:0.
Las técnicas algorítmicas usadas para este paso (para su reconstrucción exactamente) suelen ser interpolación
bilineal, vecino más próximo, convolución cúbica, Bezier, b-spline y Catmun-Roll.rh

Transformación discreta de coseno o DCT


Entonces, cada componente de la imagen se divide en pequeños bloques de 8×8
píxeles, que se procesan de forma casi independiente, de esto resulta la formación
de los bloques, que se hace notable en imágenes guardadas con altas
compresiones. Si la imagen sufrió un submuestreo del color, los colores quedarían
en la imagen final en bloques de 8×16 y 16×16 pixeles, según fuese 4:2:2 o 4:2:0.
Después cada pequeño bloque se convierte al dominio de la frecuencia a través de
la transformación discreta de coseno bidimensional, abreviadamente llamada DCT.
Un ejemplo de uno de esos pequeños bloques de 8×8 inicial es este:
"Antes de", en un bloquecillo 8×8
(ampliación ×16).
Joint Photographic Experts Group 5

"Después de", en un bloquecillo


8×8, se notan errores respecto a la
primera imagen, como en la
esquina inferior izquierda, que está
más clara.

El siguiente proceso es restarles 128 para que queden números entorno al 0, entre -128 y 127.

Se procede a la transformación por DCT de la matriz, y el redondeo de cada elemento al número entero más cercano.

Nótese que el elemento más grande de toda la matriz aparece en la esquina superior izquierda, este es el coeficiente
DC.
NOTA: Se ha comprobado que los resultados anteriormente expuestos están correctos.
Como ya habíamos comentado, el ojo humano es muy bueno detectando pequeños cambios de brillo en áreas
relativamente grandes, pero no cuando el brillo cambia rápidamente en pequeñas áreas (variación de alta frecuencia),
esto permite eliminar las altas frecuencias, sin perder excesiva calidad visual. Esto se realiza dividiendo cada
Joint Photographic Experts Group 6

componente en el dominio de la frecuencia por una constante para ese componente, y redondeándolo a su número
entero más cercano. Este es el proceso en el que se pierde la mayor parte de la información (y calidad) cuando una
imagen es procesada por este algoritmo. El resultado de esto es que los componentes de las altas frecuencias, tienden
a igualarse a cero, mientras que muchos de los demás, se convierten en números positivos y negativos pequeños.
Una matriz de cuantificación típica es la matriz de Losheller que se usa opcionalmente en el estándar JPEG:

Dividiendo cada coeficiente de la matriz de la imagen transformada entre cada coeficiente de la matriz de
cuantificación, se obtiene esta matriz, ya cuantificada:

Por ejemplo, cuantificando el primer elemento, el coeficiente DC, sería así:

Codificación entrópica
La codificación entrópica es una forma especial de la compresión sin pérdida de datos. Para ello se toman los
elementos de la matriz siguiendo una forma de zig-zag, poniendo grupos con frecuencias similares juntos, e
insertando ceros de codificación, y usando la codificación Huffman para lo que queda. También se puede usar la
codificación aritmética, superior a la de Huffman, pero que rara vez se usa, ya que está cubierta por patentes, esta
compresión produce archivos un 5% menores, pero a costa de un mayor tiempo de codificación y decodificación,
esta pequeña ganancia, puede emplearse también en aplicar un menor grado de compresión a la imagen, y obtener
más calidad para un tamaño parecido.
En la matriz anterior, la secuencia en zig-zag, es esta:
−26, −3, 0, −3, −2, −6, 2, −4, 1 −4, 1, 1, 5, 1, 2, −1, 1, −1, 2, 0, 0, 0, 0, 0, −1, −1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
JPEG tiene un código Huffman para cortar la cadena anterior en el punto en el que el resto de coeficientes sean
ceros, y así, ahorrar espacio:
−26, −3, 0, −3, −2, −6, 2, −4, 1 −4, 1, 1, 5, 1, 2, −1, 1, −1, 2, 0, 0, 0, 0, 0, −1, −1, EOB
Joint Photographic Experts Group 7

Ruido producido por la compresión


El resultado tras la compresión, puede variar, en función de la agresividad de los divisores de la matriz de
cuantización, a mayor valor de esos divisores, más coeficientes se convierten en ceros, y más se comprime la
imagen. Pero mayores compresiones producen mayor ruido en la imagen, empeorando su calidad. Una imagen con
una fuerte compresión (1%-15%) puede tener un tamaño de archivo mucho menor, pero tendrá tantas imperfecciones
que no será interesante, una compresión muy baja (98%-100%) producirá una imagen de muy alta calidad, pero,
tendrá un tamaño tan grande que quizás interese más un formato sin pérdida como PNG.
La mayoría de personas que naveguen por Internet estarán familiarizadas con estas imperfecciones, son el resultado
de lograr una buena compresión; para evitarlos, se tendrá que reducir el nivel de compresión o aplicar compresión
sin pérdida, produciendo mayores ficheros después.

Decodificación
El proceso es similar al seguido hasta ahora, sólo que de forma inversa. En este caso, al haber perdido información,
los valores no coincidirán.
Se coge la información de la matriz, se decodifica, y se pone cada valor en su casilla correspondiente. Después se
multiplica cada uno de estos valores por el valor correspondiente de la matriz de cuantización usada, como muchos
valores son ceros, sólo se recuperan ( y de forma aproximada) los valores de la esquina superior izquierda.
Después se deshace la transformación DCT:

Errores producidos por una compresión excesiva:


Antes de y después de.
Joint Photographic Experts Group 8

Y finalmente se suma 128 a cada entrada:

Para comparar las diferencias entre el bloque original y el


comprimido, se halla la diferencia entre ambas matrices, la media de
sus valores absolutos, da una ligera idea de la calidad perdida:

Tras la compresión, suelen quedar a veces bloques


como estos, en este caso en un trozo de una imagen
ampliado.
Joint Photographic Experts Group 9

Se puede observar que las mayores diferencias están cerca de la mancha, y por la parte inferior, entre la esquina
izquierda y el centro, notándose más esta última, ya que corre una mancha clara que antes estaba más hacia la
esquina. La media de los valores absolutos de las restas es 4.8125, aunque en algunas zonas es mayor.
• JPEG2000, basado en wavelets.
Enlaces externos
• Página web del grupo JPEG [1]
• JPEG Standard (JPEG ISO/IEC 10918-1 ITU-T Recommendation T.81) en PDF [2] o http://www.digicamsoft.
com/itu/itu-t81-1.html HTML]
• Seminario de Imagen y Sonido Digital: Compresión de imagen [3]
• Página web de la asignatura Multimedia de la ULPGC, explicación en vídeo del proceso de compresión JPEG [4]

Referencias
[1] http:/ / www. jpeg. org
[2] http:/ / www. w3. org/ Graphics/ JPEG/ itu-t81. pdf
[3] http:/ / pub. ufasta. edu. ar/ SISD/ jpeg/ jpg. htm
[4] http:/ / serdis. dis. ulpgc. es/ multimedia/ claseT03. htm
Fuentes y contribuyentes del artículo 10

Fuentes y contribuyentes del artículo


Joint Photographic Experts Group  Fuente: http://es.wikipedia.org/w/index.php?oldid=40545601  Contribuyentes: Akhram, Alexav8, Amanuense, Anabel3v, Anabexon, Ascánder, AstroNomo,
Avm, Beaire1, Carlos Humberto, Carlx3, Comae, Daniel G., Dark, DevilishFreak, Ejmeza, Elwikipedista, Emijrp, Eric, Faelomx, Fotodng, FrancoGG, Gatmibo, GermanX, ICrash, J.delanoy,
Javi1977, Javicivil, Javierito92, Joanju, Joseaperez, KeLopez CL, Klemen Kocjancic, Klystrode, Laura Fiorucci, Linfocito B, Llull, Loco085, Luisexino, Macar, Magnus Colossus, Mansoncc,
Matdrodes, Methoz, MisterWiki, Mnts, Montgomery, Mr Trukit0, Mrexcel, Mstreet linux, Nachojr99, Octavio, Pacoqueen, Paintman, Pati, Platonides, PoLuX124, Qwertyytrewqqwerty,
RHGuille, Retama, Rorduna, Shooke, Tano4595, Teytor, Tomatejc, Tostadora, Triku, Txo, Vanbasten 23, Wikinombre, Xavirema, Xinokina, Yearofhtedragon, Yrithinnd, conversion script,
proxy1.unizar.es, 146 ediciones anónimas

Fuentes de imagen, Licencias y contribuyentes


Archivo:Dctjpeg.png  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Dctjpeg.png  Licencia: Public Domain  Contribuyentes: AnonMoos, FelixH, Stephantom, WikipediaMaster, 1
ediciones anónimas
Archivo:Cubo RGB con las capas de color.png  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Cubo_RGB_con_las_capas_de_color.png  Licencia: Creative Commons
Attribution-Sharealike 2.5  Contribuyentes: Jusjih, Magnus Colossus, Paddy, 1 ediciones anónimas
Archivo:Cubo YUV con las capas de color.png  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Cubo_YUV_con_las_capas_de_color.png  Licencia: GNU Free Documentation
License  Contribuyentes: Chaddy, Magnus Colossus, Paddy, Rfc1394, SharkD, WikipediaMaster, 3 ediciones anónimas
Archivo:Submuestreo subsampling zamora 4img.JPG  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Submuestreo_subsampling_zamora_4img.JPG  Licencia: Creative Commons
Attribution-Sharealike 2.5  Contribuyentes: Yo mismo
Archivo:JPEG example image.png  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:JPEG_example_image.png  Licencia: GNU Free Documentation License  Contribuyentes:
User:Orgullomoore
Archivo:JPEG example image decompressed.png  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:JPEG_example_image_decompressed.png  Licencia: GNU Free Documentation
License  Contribuyentes: User:Orgullomoore
Archivo:Jpegartefakt jpegartefact.jpg  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Jpegartefakt_jpegartefact.jpg  Licencia: GNU Free Documentation License  Contribuyentes:
User:Andreas -horn- Hornig
Archivo:Jpegvergroessert.jpg  Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Jpegvergroessert.jpg  Licencia: GNU Free Documentation License  Contribuyentes: User:FelixH

Licencia
Creative Commons Attribution-Share Alike 3.0 Unported
http:/ / creativecommons. org/ licenses/ by-sa/ 3. 0/

También podría gustarte