Diferencias RMS de WAV a MP3

#1 por DanielDC el 30/06/2007
Diferencia de RMS entre WAVs y MP3s

OBJETIVO:
Determinar la si hay diferencia RMS entre WAVs y MP3s

MATERIAL, METODO y DISEÑO:

Selección de discos originales.

CD1: "Enrique Guzman 20 de colección". 1993
CD2: "Enrique Guzman grabaciones orginales". 1991
CD3: "Los cinco latinos 20 grandes canciones". 1993

Todas las canciones se extrajeron digitalmente con el adobe audition.
En total n=52
Se guardaron como WAV (Windows PCM mismo que llamamos "Audio sin compresión para efectos del trabajo")
Se tomó nota del "Average RMS power" de cada lado (L y R) del WAV y se sacó el promedio usando Exell.
Se guardo como MP3 usando el codec MP3PRO desarrollado por Fraunhofer IIS y Thomson que viene con el nombre MP3/mp3PRO. a 128 hbps, 44100 Hz, Stereo (11.0:1)
Se cerraron todas los archivos
Se cargaron los MP3 previamente mencionados
Se tomó nota del "Average RMS power" de cada lado (L y R) del MP3 y se sacó el promedio usando Exell.

Se usó la prueba T de student pareada (para evitar artefactos motivo de ser discos distintos) para determinar si hay diferencia entre el nivel RMS de las canciones antes y después de la conversión.

RESULTADOS

Muestra = 52
Average RMS de los WAV = -18.76
Average RMS de los MP3 = -18.84
Resultado de la t de Student: p=0.001314

DISCUSION
Me da pereza revisar bibliografía al respecto. Aún no lo hago. Es más, aquí entramos todos nosotros.

Entonces estadísticamente hablando el MP3 cambia los RMS promedio haciéndolo más bajo por 0.08. Lo que no se nota al oído (al menos yo no lo noto, aparte del hecho que suena feo...)
Revisando las frecuencias que se ven en el análisis de espectro del adobe audition usando un FTT size de 8192 se ve un corte de frecuencias 15.8 KHz con rezagos hasta 16.2 KHz. Más allá de eso no hay nada. En los bajos no veo nada distinto.
Asumo que ese recorte de frecuencias es el responsable de la pérdida de tal cantidad de RMS.

El asunto es que en relación de cada medida individual los cambios en los datos "RMS promedio" son tanto para arriba como para abajo. Simplemente varían sin poder predecir hacia donde ni cuanto.

¿Acaso el codec hace algo más que cortar frecuencias?
¿Tendrá una compensanción amplificando todo el wav de acuerdo a lo que corta?
¿Algunas frecuencias influyen más en el valor promedio de RMS que otras? supongo que siguiendo la curva de Fletchen (o algo así) será cierto pero no sé...
(justo aquí viene la revisión de literatura que no he hecho.. jeje)
De todo esto... ¿Cuandos RMS promedio debe variar un tema para que sea perceptible?
Espero sus comentarios.

Datos curiosos
Average RMS CD1 = -19.89
Average RMS CD2 = -21.43
Average RMS CD3 = -16.03
Como lo hacían antes ¿no?

CONCLUSION:
La transformación a MP3 de 128 kbps disminuye el volumen de los tracks, pero esta disminución es practicamente imperceptible para la oreja.


Espero sus comentarios porque no soy experto en el tema ni mucho menos...

http://soundcloud.com/danieldc
https://www.youtube.com/watch?v=awwQCG4rWSw

Subir
#3 por chevy59 el 01/07/2007
Yo soy un analfabeto en esos terminos pero por alguien hay que empezar.Ojala se sumen otros para que este post no sea uno de los tanzos "Post Difuntos".Yo solo quisiera preguntarte algo para entender en terminos.Que son los RMS?
Que es FTT?
Y eso de la Prueba T???
Por ultimo cual es la aplicasion digamos practica de todo esto y
que quieres averiguar-digo para aprender..-.Tambien me gustaria saber que bibliografia se pudiera comprar sobre el tema....
Saludos y suerte :D

La civilización moderna está basada en la violencia,la esclavitud y las frases bellas.Pero todas las frases bellas sobre la civilización y el progreso no son más que palabras.Gurdjief...(y yo agregaría):"que canciones"...

Subir
#4 por DanielDC el 01/07/2007
Hola Havanna73.

Estos supongo son los últimos aletas de este post agonizante! :D

1) Los RMS significa Root Mean Square (Raíz media cuadrática) y en términos de sonido significa el volumen de una canción... osea que tan fuerte percibe la persona el sonido...

2) El FTT significa Fast Fourier Transform (Transformación rápida de Fourier) en, para efectos prácticos, me dice en cuantas bandas divido mi espectro para analizarlo (en este caso se dividió en 8192 banda)... Digo para efectos prácticos porque para teóricos no sé como es el asunto :p

3) La prueba T es una prueba estadística que demuestra que en los resultados optenidos hay una participación de 1.314% de azar. Osea que es "confiable" en un 98.686% de que realmente hay diferencia entre los valores y no es mera coincidencia que halla salido eso...
La aplicación práctica no la sé... sin embargo me animé a hacer ese trabajillo... Sólo por curiosidad...

4) Yo también estoy buscando bibliografía... je :P

5) ¿Enterramos el post?

http://soundcloud.com/danieldc
https://www.youtube.com/watch?v=awwQCG4rWSw

Subir
--705--
#5 por --705-- el 01/07/2007
enhorabuena por tu dedicación, gracias por compartir tu experimento!
Subir
#7 por JuanVilchez el 02/07/2007
Bastante interesante. Nada que objetar.

Resultados lógicos para un múndo ilógico :)
Subir
#8 por chevy59 el 02/07/2007
Viste compa.La gente se sumo.No hay que peder la fe... :D

La civilización moderna está basada en la violencia,la esclavitud y las frases bellas.Pero todas las frases bellas sobre la civilización y el progreso no son más que palabras.Gurdjief...(y yo agregaría):"que canciones"...

Subir
#9 por epsilide el 02/07/2007
Supongo que es una pérdida lógica, se capa tanto un mp3...
Subir
#10 por Angeluisalcedo el 06/07/2007
Consideran importante esa perdida de RMS?
Hay quien dice que se nota una gran perdida de calidad al pasar canciones a Mp3.

No soy un experto, pero en una compresion al 13%, con unos auriculares medio decentes, no noto la diferencia ni queriendo.

Alguien sabe algo al respecto, me interesa bastante

¿Escuchaba musica pop porque estaba deprimido? ¿O estaba deprimido por escuchar musica pop?

Subir
#11 por undercore el 06/07/2007
los rms solo es volumen percibido, la compresion a mp3 se nota distorcion o falta de definicion en algunos sonidos, sobretodo agudos, y en la separacion stereo

We all are the same nation under the rhythm.
Mi My Space
"El arte esta hecho para ser sentido y no para ser comprendido. P

Subir
#12 por epsilide el 06/07/2007
Si pero la pérdida de RMS es muy poco detectable, 0.08 db es muy poco!
Se dice que el oido humano es capaz de escuchar incrementos de aproximadamente 1 db.
No estoy nada a favor del mp3 simplemente porque hoy día nuestra capacidad de flujo de datos y de almacenaje nos permite tener y escuchar música sin compresión.
Ahora bien, el algoritmo de compresión mp3 está muy bien hecho porque la relación ratio/calidad es muy buena.
Subir
#13 por Zeke el 08/07/2007
La relación ratio/calidad no es buena, lo único que al parecer no se pierde apenas es el RMS, pero es sólo un factor entre muchos como para sentar cátedra diciendo que no se merma la calidad. Echa un vistazo a un espectrografo y me hablas de la pérdida en agudos, o pérdidas en la imagen estéreo etc...

Tú buscas "el sonido", debes estar un paso delante de mi... de momento sólo busco "la composición"

Subir
--705--
#14 por --705-- el 09/07/2007
disiento totalmente:
el mp3 nació por dos motivos, por la proximidad de la televisión digital y la necesidad de desarrollar algoritmos de compresión para broadcast, tanto en audio como en video.
y por otro lado por la extensión de internet y el comienzo de redes de banda ancha, por la necesidad de poder transmitir audio para ser reproducido en unos altavoces típicos de ordenador de sobremesa.

no hace mucho escuchábamos musica de cassette con un walkman y nos parecia estupendo.

el mp3 es genial para reproducirlo en un mp3 portatil, con sus pequeños auriculares, también en radio (¿creen que se reproduce desde cd?)
no debe pensarse que el mp3 reemplazará al audio "en calidad cd", de hecho, se supone que ya deberia estar implantado el SACD y esto no ha ocurrido.
Subir
--32611--
#15 por --32611-- el 09/07/2007
Recomiendo hacer pruebas a ciegas con distintas calidades de MP3 y una vez hechas, después de pasarlas canutas para encontrar diferencias y saber qué pista era la buena seguro que se critica menos el formato.

8192 es el número de muestras que analiza la FFT para decir si existe una frecuencia (no el nº de bandas) es lo que se llama tamaño de ventana aunque otro parámetro importante es la forma de ventana ¿Hanning?. Creo que no encuentras diferencias en el grave 1º porque la ventana es muy pequeña y 2º porque no debe haberlas :D

No me acuerdo demasiado de estadística pero no entiendo para qué sirve la t de Student aquí.

Sería interesante que hubieras hecho más pruebas para ver si siempre se pierde RMS (perdona si las has hecho y entendí mal). Como ya han comentado 0,08dB es una diferencia inaudible.

Saludos.
Subir
Respuesta rápida

Regístrate o para poder postear en este hilo