Audio Analogico Digital PDF

AUDIO ANALÓGICO / AUDIO DIGITAL
1- LAS SEÑALES 3- EL SISTEMA BINARIO: BIT, BYTE, WORD

El concepto de señal es aplicado en numerosas áreas. En Estudiar algunos de los aspectos fundamentales del sistema
semiótica una señal es considerada como un paso de información binario permite comprender mejor los procesos de codificación y
entre una fuente/emisor y un receptor/destinatario. Así mismo, decodificación que se lleva a cabo durante la conversión de una
una señal puede ser también la variación de una corriente eléctrica u señal analógica en señal digital y viceversa, es decir, cuando se
otra magnitud física que se utiliza para transmitir información. Por quiere “hacer audible el audio digital”, y también para comprender
ejemplo, en telefonía existen diferentes señales, que consisten en un determinados comportamiento de los programas, máquinas y
tono continuo o intermitente, en una frecuencia característica, que periféricos.
permite conocer al usuario en qué situación se encuentra la llamada. En el sistema binario la unidad mínima es el bit, el cual
En el libro “Signals and systems”1, una señal está definida como el admite dos valores: 0 y 1, que representan dos estados: apagado
producto de la función de una o mas variables independientes que (no) y encendido (si), respectivamente. Todas las cifras de este
contienen información acerca del comportamiento de ciertos sistema representan valores que dependen del valor que exprese en
fenómenos. Pueden describir una gama muy amplia de fenómenos sí cada cifra y del lugar que ocupen dentro del número.
físicos diversos y también pueden ser representadas de distintas
maneras. En todos los casos, la información en una señal está DECIMAL BINARIO DECIMAL BINARIO
contenida de alguna forma dentro de un patrón de variaciones. 0 0 11 1011
1=2º 1 12 1100
2- LO ANALÓGICO Y LO DIGITAL 2=2¹ 10 13 1101
Una señal analógica es un tipo de señal generada por 3 11 14 1110
algún tipo de fenómeno electromagnético y que es representable 4=2² 100 15 1111
por una función matemática continua en la que es variable 5 101 16=2 10000
su amplitud y periodo (representando un dato de información) 6 110 32 100000
en función del tiempo. En la naturaleza, el conjunto de señales que 7 111 64 1000000
percibimos son analógicas, así la luz, el sonido, la energía etc., son 8=2³ 1000 128 10000000
señales que tienen una variación continua. 9 1001 256 100000000
La señal digital es un tipo de señal generada por algún 10 1010 512 1000000000
tipo de fenómeno electromagnético en que cada signo que
codifica el contenido de la misma puede ser analizado en
término de algunas magnitudes que representan
valores discretos, en lugar de valores dentro de un cierto rango.
Los sistemas digitales, como por ejemplo las computadoras, usan
lógica de dos estados representados por dos niveles de tensión
eléctrica, uno alto, H y otro bajo, L (de High y Low, respectivamente,
en inglés). Por abstracción, dichos estados se sustituyen por ceros y
unos, lo que facilita la aplicación de la lógica y la aritmética binaria.
1
Alan Oppenheim, Alan Willsky e Ian Young: Signals and systems.
Englewood Cliffs. New Jersey. USA. Prentice hall, Inc.
1
mantisa y el exponente. Si el número anterior se expresa como
Tabla 1: Equivalencias entre el sistema decimal y binario
0,1416x102, la mantisa sería 31416 y el exponente 2.
Los números binarios que un ordenador manipula pueden
Un byte es un grupo de 8 bits. Con un byte se puede
representar no sólo números sino también programas y datos de
representar cualquier valor dentro de un rango de 256 unidades (de 0
cualquier tipo. Los caractéres del alfabeto y los signos de puntuación
a 255 ó de -128 a 127 del sistema decimal) Cada uno de los ocho
se representan codificados en forma de números, para lo cual hay
bits de un byte, de acuerdo a su ubicación dentro del grupo,
varios sistemas, siendo el código ASCII el más extendido, en éste
representa un valor. De derecha a izquierda los valores
cada carácter corresponde a un byte determinado, por ejemplo la A
representados son 1, 2, 4, 8, 16, 32, 64, 128. Por lo tanto, si el valor o
es 11000001, la B11000010, etc. también hay normas como la MIDI
estado de los ocho bits es 1 (11111111, en binario), esta cifra binaria
para codificar la música.
representa el valor 255 del sistema decimal, como resultado de cada
uno de los ocho valores representados. Por el contrario el numero
4- AUDIO ANALÓGICO / AUDIO DIGITAL
00000000 representa el 0 del sistema decimal. El byte se utiliza
también como medida de almacenamiento de información, sus Los aparatos que generan o procesan el sonido operan
múltiplos son: el Kilobyte= 1024 bytes, el Megabyte= 1024 Kilobytes, siempre sobre una representación del mismo. En la actualidad los
el Gigabyte= 1024 Megabyte, el terabyte y el Petabyte. dos métodos más comunes para esta representación son el
analógico y el digital.
Byte 8 bits En el caso de los aparatos analógicos, la variación de presión
Word 2 bytes 16 bits en el tiempo se representa como variación de otra magnitud también
Dword 4 bytes 32 bits continua, normalmente la tensión o intensidad eléctrica. Se llama
Kilobyte 1024 bytes analógico porque las mismas oscilaciones de la presión se
Megabyte 1.048.576 bytes reproducen de manera análoga en forma de oscilaciones de tensión
Gigabyte 1.073.741.824 bytes eléctrica. También es analógico un disco de vinilo, en el cual las
Terabyte 1.099.511.622.776 bytes
oscilaciones de los surcos se corresponden con las del sonido, o un
Petabyte 1015 bytes
casette en la que se representa por la mayor o menor magnetización
Tabla 2: bits y bytes de la cinta.
Para representar números en la computadora se agrupan los En un aparato digital el sonido es representado como una
bits en unidades mas grandes llamadas words (palabras: grupo de serie de números, llamados muestras, que son las medidas de la
bits que representan una única muestra). Si se utilizan por ejemplo onda en instantes sucesivos. Es decir, el audio digital es
palabras de 2 bits sólo se pueden representar cuatro números (00, la codificación digital de una señal eléctrica que representa
01, 10 y 11), es decir, 22, en general, la cantidad de números que se una onda sonora. Consiste en una secuencia de números
pueden representar es 2 elevado al número de bits. Para los binarios y se obtiene del muestreo y cuantificación de la señal
números enteros se suelen utilizar palabras de 2 bytes (16 bits), analógica. Posteriormente se puede codificar o comprimir, dando
dejando un bit para el signo (positivo o negativo) se pueden lugar a formatos más compactos (compresión de audio).
representar 215 valores, es decir desde -32768 a +32767. Para Es decir que para registrar y manipular sonidos con un
representar números mayores se emplean 4 bytes. Para los números sistema digital es necesario que las ondas sonoras transformadas en
fraccionarios, como el 3,1416, se utiliza la representación en coma señales análogas (voltaje eléctrico) se conviertan en señales
flotante, que consiste en descomponer el número en dos partes, la digitales, las señales de audio analógicas deben ser codificadas de
2
acuerdo a los métodos y patrones de los sistemas digitales. La onda
analógica, por tanto, es convertida en datos que la representan
mediante dígitos binarios o bits.
- Digitalización (conversión AD/DA)

La digitalización es el proceso de conversión de una señal
analógica en información digital. En este proceso la señal analógica
llega en forma de corriente eléctrica a través de un cable hasta el
dispositivo donde se aloja el conversor A/D (CAD).
Los cambios de voltaje en el flujo de corriente eléctrica,
propios de la señal analógica, son medidos por el conversor A/D
mediante una toma de muestras a intervalos regulares, a las que le
corresponde un valor de tensión, que se obtienen con el fin de
convertirlas en valores digitales.
El proceso inverso, y complementario con el anterior, es el de
convertir una señal digital en una señal analógica, y lo realiza el
conversor D/A (CDA). El mismo recibe la señal digital y convierte los
valores binarios en niveles de voltaje continuos, generando una
nueva señal analógica.
Una de las técnicas de digitalización más adecuadas y
utilizadas para la música es la modulación de código de pulsos,
conocida como PCM lineal (Pulse Code Modulation). Debido a su
eficacia frente a sonidos que, con cualquier nivel de amplitud pueden
estar en cualquier punto de todo rango de frecuencias audibles.
El proceso de modulación de códigos de pulsos consta de
varias etapas, comenzando con la llegada de la señal analógica al
dispositivo digitalizador. En la figura 1 observamos un diagrama que
grafica la conversión de audio analógico a digital.
Figura 1: diagrama de bloques de los procesos de conversión Analógico-

Digital/Digital-Analógico
Filtro pasa bajos: la señal es procesada por un Filtro Pasa bajos
(FPB o LPF (low pass filter)); un filtro de corte de frecuencias que se
encarga de filtrar todas aquellas que estén por encima de un umbral
determinado. El objetivo es eliminar todos los componentes del
espectro del sonido que se encuentren situados por encima de
3
20.000 Hz (colas espectrales). Esto se debe a que, aunque son La Frecuencia (o Tasa) de muestreo (Sample rate, en inglés) es la
inaudibles, su presencia hace posible la aparición por batimiento de velocidad con que se toman las muestras. Indica la cantidad de ellas
frecuencias inferiores a la frecuencia de corte, que se ubican dentro tomadas en la unidad de tiempo que es el segundo. Se mide en Hz.
del rango de frecuencias audibles. Este fenómeno es conocido como La teoría del muestreo o Teorema de Nyquist-Shannon dice que para
aliasing. Se evita, precisamente, por medio de la utilización de un poder muestrear fielmente una señal, la frecuencia más aguda de su
FPB. espectro ha de ser menor que la mitad de la velocidad de muestreo,
conocida como frecuencia Nyquist. Ésta es la mayor frecuencia que
puede muestrearse con esa velocidad sin que se genere aliasing. Por
FILTRO PASA BAJOS (FPB) ejemplo en los CDs, que reproducen hasta 20 kHz, emplean una tasa
de muestreo de 44,1 kHz (frecuencia Nyquist de 22,05 kHz).
Cuando la frecuencia de muestreo es menor al doble de la
frecuencia muestreada, aparece una frecuencia nueva aliasing, cuyo
valor es igual a la diferencia entre la frecuencia de muestreo y la
20 kHz frecuencia muestreada (frecuencia diferencial). En el caso de los
sonidos complejos, los parciales agudos que superen la frecuencia
Figura 2: FPB. Elimina las frecuencias que están por encima del umbral
indicado en Hz. Nyquist se convertirán en otros más graves, con lo que se origina una
distorsión en el timbre. Es absolutamente necesario prevenir la
aparición de estas frecuencias alis, debido a que una vez que
Muestreo: durante el proceso de digitalización se toman muestras a aparecen no existe posibilidad de eliminarlas sin anular otras
intervalos regulares de tiempo (tasa de muestreo), y con cada una se frecuencias que forman parte de la señal útil.
obtiene el valor del nivel de voltaje de la señal analógica (amplitud de
la señal eléctrica) en el momento de hacer la muestra. Ese valor se
mantiene constante hasta la próxima muestra (con la consiguiente FRECUENCIAS DE
pérdida de información que se produce entre muestra y muestra en MUESTREO
comparación con la señal continua. Esta pérdida se atenúa en los NORMALIZADAS
pasos subsiguientes. 8.000 Hz
11.000 Hz
MUESTREO 22.050 Hz
32.000 Hz
44.100 Hz
48.000 Hz
88.200 Hz
96.000 Hz
Figura 3: durante el muestreo se toman muestras de la señal a intervalos 192.000 Hz

regulares de tiempo
Tabla 3: los valores de frecuencia de muestreo están estandarizados de
acuerdo a usos y medios
4
La cuantización y codificación: consiste en convertir el valor de las produce ningún tipo de degradación. El formato más usado de audio
muestra obtenidas en el proceso de muestreo, normalmente un nivel digital PCM lineal es el del CD de audio: 44,1 kHz de tasa de
de tensión, en un valor entero de rango finito y predeterminado (o lo muestreo y cuantificación lineal de 16 bits (que mide 65536 niveles
que es lo mismo, asignar un valor más próximo en una escala de de señal diferentes) y que, en la práctica, permite registrar señales
niveles discretos de amplitud). Cuantos mayores niveles de analógicas con componentes hasta los 20 kHz y con relaciones señal
cuantización tenga la escala, menor será el error o el ruido de a ruido de más de 90 dB.
cuantización, es decir, el grado de ajuste o corrección sobre el valor
original de las muestras. Depende de la cantidad de bits utilizados en - Conversión DA
la digitalización que dicha escala discreta posea mayor o menor
cantidad de grados. Por ejemplo, utilizando cuantización lineal, una Una vez que se ha llevado a cabo la conversión AD, la señal
codificación lineal de 8 bits discriminará entre 256 niveles de señal digital es plausible de ser manipulada de diversas maneras por medio
equidistantes (28). El parámetro para ajustar este valor se denomina de la implementación de procesadores digitales.
comúnmente resolución, profundidad o ancho de la muestra (en
inglés: Resolution, Sample Size o Bit Depth) en la codificación, el Para escuchar cualquiera de los procesos llevados a cabo en
valor cuantizado de cada muestra es representado por una secuencia la computadora es necesario que se realice con la señal el camino
de bits. inverso, es decir convertirla de digital a analógico. Para lograr esto el
conversor DA recibe sucesiva y regularmente las muestras
cuantificadas y codificadas y luego las transforma en un flujo de
ANCHO DE corriente por medio de un factor de escala. Como resultado se
RANGO obtiene una onda escalonada, gracias a que cada muestra
LA DEFINICIÓN VALORES
DINÁMICO representa un valor de tensión estable que se mantiene hasta la
MUETSRA
siguiente muestra. Por este motivo, la onda obtenida no es idéntica a
8 BITS 48 dB 256 niveles De -128 a 127
la onda analógica original (que es de fluctuaciones constantes) se
12 BITS 72 dB 896 niveles De -2.648 a 2.647
introduce de esta manera un ruido de digitalización, cuyas
16 BITS 96 dB 65.536 niveles De -32.768 a 32.767 consecuencias se atenúan a medida que aumenta la resolución en
De -524.288 a bits en la conversión AD.
20 BITS 120 dB
524.287
16.777.216 De -8.388.608 a
24 BITS 144 dB
niveles 8.388.607 Filtrado de la señal: para atenuar los efectos del escalonamiento de
la onda y evitar la aparición de frecuencias que produzcan batidos, se
Tabla 4: cuanto mayor cantidad de bits se asignen a la Resolución, más
precisión se logra para representar la dinámica de la onda sonora, es decir vuelve a filtrar la señal con un filtro FPB. La señal analógica obtenida
sus matices de amplitud. no es igual a la original, aunque sus diferencias pueden llegar a no
ser percibidas auditivamente si se utilizan valores altos en los
Existen en la actualidad dispositivos que internamente llevan a cabo parámetros de digitalización.
operaciones con 32 y 64 bits en coma flotante. Estas resoluciones se
utilizan en audio digital con el fin de efectuar procesos complejos que
requieren enormes cantidades de operaciones de cálculo, con el Dither: recibe este nombre un tipo de ruido aleatorio que se utiliza en
objetivo de alcanzar resultados más precisos. A la salida del determinados casos para ser agregado con un nivel muy bajo a una
conversor A/D se obtiene la señal PCM, a partir de la cual ya no se
5
señal, con el propósito de enmascarar y reducir el ruido de que permiten a uno o varios programas descifrar o interpretar el
digitalización o error de cuantificación. contenido de un determinado tipo de archivo multimedia. Cada Códec
define la manera en que está codificada una señal y cómo se
Duración del Tamaño decodifica. También se denominan de este modo las técnicas de
frecuencia tamaño de cantidad de
archivo X X X = del
de muestreo la muestra canales compresión y descompresión de datos
(en segundos) archivo
Este proceso de codificación puede lograrse mediante
882.000 bits programas (softwares), por medio de dispositivos físicos (hardware) o
5” X 22.050 Hz X 8 bits X 1 mono =
= 861,3 Kb
por una combinación de ambos.
El formato, en tanto, sirve para organizar los datos y para que
Figura 3: Fórmula para calcular el espacio de un archivo de audio sin
comprimir
su estructura pueda ser identificada por los programas y por el
hardware.
RUIDO DIGITAL
Wave (Microsoft) (*.wav)
En las señales de poca amplitud el ruido de digitalización se hace
más notorio debido a que puede ocurrir que los saltos entre grados Soun Forge Project File(*.frg)
contiguos de la escala de cuantificación (que varían según la resolución) Audio Interchange File Format AIFF(*.aif)
superen la amplitud de la onda digitalizada introduciendo distorsión.
Dolby Digital AC3 (*.ac3)
También aparece ruido de cuantificación cuando se trucan bits,
por ejemplo, al reducir la resolución de 24 a 16. Intervoice (*.ivc)
MainConcept MPEG-1 (*.mpg)
MainConcept MPEG-2 (*.mpg)
5- ARCHIVOS DE AUDIO: MP3 Audio(*.mp3)
CÓDECS Y FORMATOS: PCM (uncompressed) Next/Sun (Java)(*.au)
CC1TT A-Law Quick Time 6 (*.mov)
El audio digitalizado se CC1TT u-Law Raw Audio (*.raw)
almacena en forma de archivos. DSP Group TrueSpeech(TM) Real Media 9 (*.rm)
Resulta necesario que los datos GSM 6.10 Scott Studios Wave (*.wav)
que hay en ellos estén organizados IEEE Float (uncompressed) Sony Perfect Clarity Audio (*.pca)
de alguna manera en particular. IMA ADPCM
SonyWave 64 (*.w64)
Las diferentes formas de guardar Sound Designer 1(*.dig)
Microsoft ADPCM
los datos que conforman un Video for Windows (*.avi)
MPEG Layer-3
archivo de sonido se conocen Wave Microsoft (*.wav)
PCM (uncompressed)
como FORMATOS. Existen Windows Media Audio V9(*.wma)
diversos formatos que se ajustan a distintas normas o que son Windows Media Video V9(*.wmv)
específicos para diferentes plataformas, entornos, aplicaciones o
soportes. Los formatos son conocidos por la extensión que sigue al
nombre del archivo; por ejemplo .wav (formato wave), .aiff (formato
Aiff), .mp3 (Formato MP3 Layer 3). Cada formato puede, a su vez, Figura 4: listado de formatos y codec´s del
admitir varios CÓDECs. menú Save del programa sound Forge
CÓDEC: apócope del inglés derivado de Coder/decoder
(codificador/decodificador). Son archivos residentes en el ordenador
6
En los archivos de sonido se pueden diferenciar la cabecera Existen distintos métodos de compresión, los más utilizados
(header), que es la primera parte del documento, en la que se se basan en modelos psicoacústicos, cuyo principio es el de eliminar
establece su resolución, tasa de muestreo, duración y cantidad de datos que el oído no es capaz de distinguir. Características
canales (mono o estéreo) entre otros aspectos; a continuación se perceptuales y fenómenos como el enmascaramiento y la división del
encuentran las muestras (samples). Así, las distintas formas en que rango de frecuencias audibles en bandas críticas son especialmente
se organizan los datos determinan los distintos formatos. estudiados para definir algoritmos que permitan eliminar información
que en forma un tanto imprecisa se podría denominar redundante.
SIN COMPRIMIR Y COMPRIMIDOS Uno de los pasos, como se da en uno de los métodos más difundidos
de compresión: el MPEG (Motion Picture Expert Group), consiste en
Se pueden diferenciar los formatos de audio que analizar los componentes del espectro del sonido y dividir la señal en
comprimen los datos para generar archivos más livianos, de los sub bandas (codificación sub banda – sub band coding) el propósito
formatos que almacenan audio sin comprimir. En este último caso es lograr codificaciones con menores cantidades de bits a partir de
no hay pérdidas en la información, lo que permite trabajar en alta una señal PCM, teniendo en cuenta que el largo de la palabra en la
calidad. Se utilizan en audio profesional, y es recomendable emplear codificación PCM está determinado por el rango dinámico de la
este tipo de formatos cuando no hay limitaciones para almacenar o componente espectral más alta. El resultado es que disminuye el
para transmitir y distribuir. ancho de banda debido a la eliminación de frecuencias
Con los formatos comprimidos, el objetivo consiste en lograr enmascaradas.
archivos más livianos, que ocupen menos espacio de Estudios demuestran que la distorsión generada es
almacenamiento y que sean más fáciles de mover y de compartir. imperceptible para el oído experimentado en un ambiente óptimo
Los formatos comprimidos mejor logrados son aquellos que desde los 256 kbps y en condiciones normales. Para el oído no
equilibran la menor pérdida de calidad con la máxima compresión experimentado, o común, con 128 kbps o hasta 96 kbps basta para
posible. Un parámetro importante para estos formatos es el bit rate, que se oiga "bien" (a menos que se posea un equipo de audio de alta
que está referido al ancho de banda con que se puede transmitir la calidad donde se nota excesivamente la falta de graves y se destaca
información. el sonido de "fritura" en los agudos). En personas que escuchan
mucha música o que tienen experiencia en la parte auditiva, desde
192 o 256 kbps basta para oír bien. La música que circula por
Internet, en su mayoría, está codificada entre 128 y 192 kbps.
ARQUITECTURAS DE DIGITALIZACIÓN Actualmente, el formato de audio comprimido más popular es
PCM lineal (Pulse Code Modulation o modulación de código de pulso) el MP3 o MPEG 1 layer 3. Se puede optar entre relaciones de
es la calificación estándar de audio no comprimido (Lossless)
mantienen constantes los parámetros para todo el proceso. compresión que van de 4:1 a 70:1. En una relación de compresión
PCM no lineal. Aumenta la resolución en las partes en las que se 10:1 se logran niveles aceptables de calidad (cerca de 128kbps). El
incrementa la amplitud. formato MP3 se convirtió en el estándar utilizado para streaming de
audio y compresión de audio de alta calidad (con pérdida en equipos
de alta fidelidad) gracias a la posibilidad de ajustar la calidad de la
compresión, proporcional al tamaño por segundo (bitrate), y por tanto
el tamaño final del archivo, que podía llegar a ocupar 12 e incluso 15
veces menos que el archivo original sin comprimir. Fue el primer
formato de compresión de audio popularizado gracias a Internet, ya
LA COMPRESIÓN que hizo posible el intercambio de ficheros musicales. Tras el
7
desarrollo de reproductores autónomos, portátiles o integrados en medida cuya unidad, el Kbps (kilo bits por segundo), expresa el flujo
cadenas musicales (estéreos), el formato MP3 llega más allá del de datos con que se puede transmitir un archivo. Para anchos de
mundo de la informática. bandas mayores se utiliza Mbps o Gbps (M= mega; G= giga).
- Tasa de bits constante (CBR Constant Bit Rate). Es un control

CÓDECS EN LA PC
utilizado en la compresión de archivos de audio -aparece entre las
Para conocer cuáles son los códecs instalados en una computadora se
opciones de algunos formatos cuando se comprime- para
pueden observar en los programas de grabación o edición de sonido las
establecer un mismo valor de bit rate para todo el archivo,
opciones dentro del menú FORMAT, que se encuentra al guardar independientemente del nivel de compresión que cada una de las
un archivo cualquiera (comando SAVE) allí aparece una lista completa partes requiere. Permite predecir con exactitud el peso final del
con los codecs disponibles, como PCM, MPEG Layer 3, etc. archivo después de la compresión.
- Tasa de bits variable (VBR Variable Bit Rate). Este control –
alternativa contrapuesta a la opción anterior- establece un tipo de
bit rate que se ajusta a las características del audio del archivo a
A principios de 2002 otros formatos de audio comprimido comprimir. Su peso final depende de cada archivo.
como Windows Media Audio, AAC (Advanced Audio Coding, basado - Flujo de bits (Bitstream): flujo de datos codificados y organizados
en técnicas de codificación similares a las del mp3, aunque presenta que se obtiene a la salida del proceso de compresión de archivos
mejoras en la relación calidad/tamaño), y Ogg Vorbis (un formato de audio, de acuerdo al algoritmo de compresión. En la
abierto para codificar sin pagar patente, de mejor calidad que el mp3 codificación de audio comprimido para el flujo de bits adopta un
para bit rates bajos, se puede escuchar mientras se descarga formato para su almacenamiento y/o transmisión que,
(streaming), y tiene bit rate variable) empiezan a ser masivamente posteriormente el decodificador recibe y debe interpretar. El
incluidos en programas, sistemas operativos y reproductores decodificador tiene que recibir este flujo de bits para procesarlo
autónomos, lo que hizo prever que el MP3 fuera paulatinamente reconstruir la señal PCM.
cayendo en desuso, en favor de otros formatos, como los
mencionados, de mucha mejor calidad. Uno de los factores que CODIFICACIÓN MP3
influye en el declive del MP3 es que tiene patente. Técnicamente no
significa que su calidad sea inferior ni superior, pero impide que la MPEG-1 Audio Layer 3, más conocido como MP3, es un
comunidad pueda seguir mejorándolo y puede obligar a pagar por la formato de audio digital comprimido con pérdida. Desarrollado por el
utilización de algún códec, esto es lo que ocurre con los Moving Picture Experts Group (MPEG) para formar parte de la
reproductores de MP3. Aun así, a inicios del 2008, el formato mp3 versión 1 (y posteriormente ampliado en la versión 2) del formato de
continua siendo el más usado y el que goza de más éxito. vídeo MPEG. El mp3 estándar es de 44 KHz y un bitrate de 128 kbps
por la relación de calidad/tamaño. Su nombre es el acrónimo
TASA DE BITS (BIT RATE) de MPEG-1 Audio Layer 3 y el término no se debe confundir con el
de reproductor MP3.
Un parámetro importante para el intercambio de archivos por
redes o sistemas de comunicación es la Tasa de Bits o Bit Rate. Se La codificación MP3 soporta uno o dos canales dentro de
refiere a la velocidad de bits, es decir la cantidad de bits que se alguna de las siguientes opciones:
transmiten en la unidad de tiempo que es el segundo. Ésta es una
8
- Mono: un solo canal de sonido 6a1 256
Layer 2
- Dual chanel (canal doble): dos canales mono independienes. 8a1 192
- Stereo: los canales izquierdo y derecho se codifican 10 a 1 128
Layer 3
independientemente 12 a 1 112
- Join Stereo: aprovecha la redundancia de datos entre los canales
izquierdo y derecho que muchas veces contienen la misma En el siguiente cuadro vemos los datos del MP3 para diversas
información para reducir la tasa de bits. acepta dos codificaciones calidades:
posibles: Mid/side stereo e Intensity stereo:
ancho
- La técnica M/S stereo, en vez de codificar los canales calidad
banda
canales Kb/seg proporción %
izquierdo y derecho, codifica la información de un canal
central (la que es igual en los canales izquierdo y derecho) y teléfono 2.5 mono 8 96 a 1 1.04 %
de uno lateral, que es el que contiene la información onda corta 4.5 mono 16 48 a 1 2.08 %
diferencial entre ambos canales. Es decir, lo que queda en onda
cada canal después de restarle a cada uno la información 7.5 mono 32 24 a 1 4.16 %
media
que va al canal central. Los canales izquierdo y derecho se
56 26 a 1 3.84 %
reconstruyen durante la decodificación. radio FM 11 estéreo
64 24 a 1 4.16 %
- La técnica Intensity Stereo se vale de la limitación del
oído humano para reconocer la ubicación espacial de casi CD 15 estéreo 96 16 a 1 6.25 %
determinadas frecuencias, por lo que estas son reducidas a 112 14 a 1 7.14 %
una señal mono. CD 15 estéreo
128 12 a 1 8.33 %
¿Cuánto espacio ahorra el MP3? Como podemos ver en la tabla anterior, para grabar locución
Aplicando las técnicas de MP3, se consigue reducir el (voz hablando), podemos conseguir una proporción de 96 a 1, o, lo
tamaño que ocupa una pieza musical en un factor entre 10 y 12 a 1, que es lo mismo, reducir el tamaño de la grabación a casi el 1% del
es decir, que se reduce a menos de una décima parte. Así, un minuto original. Estas mejoras van reduciéndose, como es lógico, si
de música estéreo de alta calidad ocuparía alrededor de 1 Mb el queremos aumentar la calidad resultante.
formato MP3 consigue lo que los especialistas denominan "calidad En muchas ocasiones, cuando vamos a efectuar la descarga
casi CD". Es decir, dado que sabemos que se ha eliminado parte de de un archivo de audio en mp3 o queremos llevar a cabo la
la información sonora, de hecho tiene que sonar algo peor que el conversión de un wav a este formato nos preguntamos ¿Cuánto
original. puede ocupar?.
Existen algunas páginas que ofrecen la misma canción o
Los otros formatos MPEG 1
archivo sonoro en diferentes calidades o con distintos ratios de bits.
Si el MP3 es el MPEG 1 Layer 3, ¿cómo son los Layer 1 y Layer 2? Obviamente, no ocupará igual un archivo que tenga más bitrate que
Veamos una comparativa, para obtener sonido estéreo en calidad uno que disponga de menos. Por lo tanto, ¿Cómo saber qué tamaño
"casi CD": puede tener un archivo en mp3? Es fácil, tan sólo hay que realizar
una sencilla fórmula: Hay que dividir el ratio de bits del archivo en
formato compresión Kb/seg cuestión entre 8 y multiplicarlo por los segundos de duración de la
Layer 1 4a1 384 canción. Por ejemplo, si tenemos un archivo que dispone de una
9
calidad o ratio de bits de 96 Kbps (frecuente para voz y música) con BIBLIOGRAFÍA:
una duración de 5 minutos (300 segundos) su tamaño sería el
Bas, Pablo (2005): Audio Digital. Ed. Manual Users. Bs.As.
siguiente: 96:8=12... 12x300=3600 KB o lo que es lo mismo 3,51 MB
(resultado de dividir 3600/1024). Nuñez, Adolfo: Informática y Electrónica Musical. Editorial Paraninfo.
España.
STREAMING
Valenzuela, José: Audio Digital. Conceptos Básicos y Aplicaciones.
La traducción literal del término es corriente o flujo. Se Editorial: Miller Freeman Books. USA.
denomina de este modo al método utilizado para transferir archivos
de audio y video con el fin de que se reproduzcan mientras se
descargan. Antes de que la tecnología "streaming" apareciera en
abril de 1995 (con el lanzamiento de RealAudio 1.0), la reproducción
de contenido Multimedia a través de internet necesariamente
implicaba tener que descargar completamente el "archivo
contenedor" al disco duro local. Como los archivos de audio —y
especialmente los de video— tienden a ser grandes, su descarga y
acceso como paquetes completos se vuelve una operación muy
lenta. La tecnología de streaming se utiliza para aligerar la descarga
y ejecución de audio y vídeo en la web. Se hace streaming, por
ejemplo, cuando se transmite una radio, o un canal de televisión en
vivo por internet. Los formatos para streaming, como rm o wma,
posibilitan reproducir audio sin tener que esperar a descargar la
totalidad del archivo en el disco rígido. La información baja
segmentada en “paquetes” o “trenes” ordenados, que se alojan en el
buffer y comienzan a reproducirse mientras siguen descargándose
sucesivamente los paquetes restantes hasta completarse la totalidad
del archivo. Cuando cada paquete termina de reproducirse desde el
buffer, es reemplazado por los siguientes.
La calidad de los archivos comprimidos depende del Códec y
del ancho de banda disponible para la conexión.
Los archivos que no son para streaming son “bajables”
(dounloables), es decir, si no utilizamos streaming para mostrar un
contenido multimedia en la Red tenemos que descargar primero el
archivo entero en nuestra PC y más tarde ejecutarlo, para finalmente
ver y oír lo que el archivo contenía.
Mgter. Hernán Conen – Lic. Paula Asís
10

Audio Analogico Digital PDF

Cargado por

Copyright:

Formatos disponibles

Audio Analogico Digital PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Audio Analogico Digital PDF

Cargado por

Copyright:

Formatos disponibles

AUDIO ANALÓGICO / AUDIO DIGITAL

1- LAS SEÑALES 3- EL SISTEMA BINARIO: BIT, BYTE, WORD

- Digitalización (conversión AD/DA)

Figura 1: diagrama de bloques de los procesos de conversión Analógico-

Figura 3: durante el muestreo se toman muestras de la señal a intervalos 192.000 Hz

- Tasa de bits constante (CBR Constant Bit Rate). Es un control

Mgter. Hernán Conen – Lic. Paula Asís

También podría gustarte