CODIFICADOR MP3 EN MATLAB

Este sitio está dedicado al formato de audio MPEG-1 Capa III


Contenido

Principal

Psicoacústica
Definición
Aspectos relevantes
Conclusión

Grupo MPEG
Historia
Estándares MPEG
Audio MPEG

Codificación MP3
La Capa III
Análisis psicoacústico
Filtro híbrido
Cuantización
Formato
Encabezado
Información secundaria
Datos principales

Descargas

Links


CODIFICACIÓN MP3

EL ENCABEZADO DE LAS TRAMAS

No existe encabezado principal de archivo en el formato de audio MPEG. En éste el encabezado es individual para cada trama (fragmento de archivo).

Cuando se quiere leer información de un archivo MP3, usualmente es suficiente encontrar la primera trama, leer su encabezado y asumir que las otras tramas son iguales. Pero éste no es siempre el caso; por ejemplo, existen algunos archivos con tasas de bits variables, donde cada trama posee su propia tasa de bits. Esto se hace con el fin de mantener constante la calidad del sonido durante todo el archivo. Otro método usado para mantener constante la calidad de sonido es emplear más bits (con ayuda del búfer bit reservoir) en las partes donde se necesite.

El encabezado de la trama tiene la siguiente presentación, con las posiciones para cada uno de los 32 bits:


A: syncword. Con 12 bits de longitud, todos en '1' para identificar el comienzo de la trama.

B: ID. Un (1) bit usado para identificación del audio. Siempre en '1', para indicar que se trata de audio MPEG-1.

C: Layer. Dos (2) bits usados para descripción de la capa. Para identificar cuál esquema (léase capa) fue usado durante la codificación del audio.

D: protection_bit. Un (1) bit de protección. Si está en '0' indica que la trama está protegida por un código de redundancia cíclica para detección de errores.

E: bitrate_index. Cuatro (4) bits para proporcionar el índice de la tasa de bits, de acuerdo con la siguiente tabla.

F: sampling_frequency. Dos (2) bits que indican la tasa de muestreo.

G: padding_bit. Un (1) bit usado para relleno. Si está en '1' la trama se rellena con una ranura extra. Únicamente se usa para frecuencias de 44.1 KHz. Por ejemplo, un sonido 128 Kbps 44.1 KHz Capa II usa muchas tramas de 418 bytes de largo y unas pocas de 417 bytes para cumplir exactamente la tasa de transferencia de 128 Kbps. La ranura consume 8 bits (1 byte) para las Capas II y III.

H: private_bit. Un (1) bit para uso privado. No se usa generalmente.

I: mode. Dos (2) bits que indican el modo de canal, tal y como se muestra a continuación.

En el modo Stereo indica que el canal comparte bits, pero no usa codificación Joint Stereo. En el modo Joint Stereo sí se saca provecho de la correlación existente entre los dos canales para representar más eficientemente la señal. El modo Dual Channel está conformado por dos canales mono totalmente independientes (cada uno es un archivo de audio diferente); cada canal usa exactamente media tasa de bits del archivo. La mayoría de los decodificadores los procesan como estéreo, pero no es siempre el caso. Single Channel consiste en un único canal de audio.

J: mode_extension. Dos (2) bits indicando extensión al modo; sólo se usa en modo Joint Stereo. La extensión al modo se usa para información que no es de ninguna utilidad en el efecto estéreo. Estos bits se determinan dinámicamente por un codificador en el modo Joint Stereo, y este modo puede cambiar entre tramas, o incluso se puede dejar de usar en algunas tramas. En la Capa III, estos dos bits indican qué tipo de codificación Joint Stereo se está usando, Intensidad estéreo o Estéreo M/S. Estéreo M/S se refiere a transmitir los canales normalizados Middle/Side (Suma/Diferencia) de los canales izquierdo y derecho en lugar de los habituales Izquierdo/Derecho. En el lado del codificador los canales habituales se reemplazan usando la fórmula:


Mi = Middle; Si = Side; Li = Izquierdo; Ri = Derecho

Los valores Mi se transmiten por el canal izquierdo y los valores Si se transmiten por el canal derecho.

En el lado del decodificador los canales izquierdo y derecho se reconstruyen así:


Intensidad estéreo se refiere a retener en las frecuencias superiores a 2 KHz sólo la envolvente de los canales izquierdo y derecho.

El código indica que tipo de extensión al modo se está usando de la siguiente manera:

K: copyrigth. Un (1) bit usado para copyright. Tiene el mismo significado que el bit de copyright en CD y cintas DAT, indicar que es ilegal copiar el contenido del archivo si el bit está en '1'.

L: original/copy. Un (1) bit usado para indicar si se trata de un medio original, si el bit está puesto en '1'. En '0' indica que es una copia del medio original.

M: emphasis. Dos (2) bits usados para información del énfasis. Le indica al decodificador que el sonido debe ser "re-ecualizado" después de una supresión de ruido tipo Dolby. Se usa raramente.


CHEQUEO DE ERRORES

Si el bit de protección en el encabezado es igual a '0', se incluye un CRC de 16 bits después del encabezado. Si el bit de protección está en '1', no hay chequeo de errores y estos bits pueden ser usados para los datos de audio. El método para detección de errores que se utiliza es CRC-16, cuyo polinomio generador es:

CRC-16 = x16 + x15 + x2 + 1


[ Principal ]
Psicoacústica: [
Definición | Aspectos relevantes | Conclusión ]
Grupo MPEG: [
Historia | Estándares MPEG | Audio MPEG ]
Codificación MP3: [
La Capa III | Análisis psicoacústico | Filtro híbrido | Cuantización | Formato
Encabezado | Información secundaria | Datos principales ]
[
Descargas ]
[
Links ]