Diferencias RMS de WAV a MP3 : Equipo home studio página 5

No tengo nada decente para escuchar, cuando vuelva de las vacaciones lo probaré. Los 5 que he puesto no los comprimí ni colgué yo pero lo hizo un amiguete y le puedo preguntar el resultado.

Yo recuerdo haberlo pasado mal para decidir entre los dos que sonaban mejor, igual no me sonaban pero no sabía cuál mejor. Ninguno es VBR y es una pena porque el VBR me parece muy bueno a oreja.

Saludos.

Entonces te pasa como a mí, algo diferente hay, pero no tan diferente para llegar a mojarse el culo sabiendo que aciertas.

Rafa1981 escribió:

"Aum" escribió:
Pues nada, si estais tan convencidos de que el mp3 suena mejor que el wav cuando vayais a llevar maquetas a planchar en CD llevadlas en mp3, también.

A mi de momento ningún sello me ha dicho que le entregue las mezclas de los tracks en mp3, la verdad es que sería bastante raro. Lo primero que me dicen es que les envíe los wavs o aiff (según como trabajen) para llevar a masterizar.

En el ámbito doméstico el mp3 es un buen formato. Los profesionales trabajan con wav o aiff.

Humildemente, creo que tienes un buen lio de conceptos.

La razón de que te diga esto es porque cuando vas a hacer una mastering, te tienen que aplicar muchos procesos a la canción, correcto, también sabemos que el MP3 se come las frecuencias que el no cree audibles para la mayoría de equipos, correcto, lógicamente si quieren realzar algo que se ha comido el codec del MP3 mal van. El MP3 sería la últimísimo que se debe aplicar a una canción (también se acepta nunca).

Para que te hagas una idea lo que has dicho es como si ahora alguien preguntara:

¿ Si el wav es tan bueno porque no os lo piden al masterizar a 16 bits en vez de a 24?
¿ Si poner un dither es tan bueno porque no lo poneis en todas las pistas ?
¿ Si el hueso de jamón queda tan bien en el cocido porque no os lo comeis solo ?

Lo que yo he dicho no es nada de eso. Mi respuesta era un poco sarcástica. Yo pienso que todo el que se dedica a producir música sabe perfectamente que no puede enviar mp3 a masterizar. Siento mucho si te lo has tomado mal.

Baneado

Ufffff, vaya topicazo, y yo con estos pelos, bien si en la primera pagina alguien hubiese explicado como funciona el Mp3 quizas no hubiese hecho falta seguir con el tema

Diferencias RMS: Inapreciables, xq???? por lo siguiente

MP3 o mpeg 2 layer III conocido entre los asiduos a la transferencia de archivos sonoros en internet, debido a sus grandes bonanzas y pequeñas perdidas ( claro esta a 320 Kbps ). La matriz del asunto se basa en la codificacion perceptual. Estudios psicoacusticos desvelan que tonos puros en baja frecuencias son capaces de enmascar otros tonos de menor amplitud y de mayor frecuencia. El algoritmo del mp3 divide el espectro sonoro en un determinado numero de bandas. La señal de entrada es enventanada en periodos muy pequeños y bien es pasada por una transformada en forma de algoritmo o bien por una serie bastante grande de filtros en paralelo que son capaces de dividir la señal de entrada en diferentes bandas de frecuencias. Tras esta division el algoritmo de Mp3 analiza las posibles bandas enmascaradas. Tras analizar las bandas enmascarantes y las bandas enmascaradas el algoritmo empieza como decimos los paganos a meter hachazos de la siguiente manera: cada vez que una banda es detectada como enmascarable por otra la banda enmascarable es RECUANTIFICADA :shock:

de tal manera que el numero de bits a emplear en la nueva recuantificacion dependera del grado de compresion seleccionado. Cuando una señal es recuantificada independientemente de usar dither o no el escalon de cuantificacion se hace mas grande y por lo tanto el error de cuantificacion crece ( error que se produce fruto del redondeo de una determinada señal en medio de dos escalones, y que sera como maximo en el peor de los casos medio escalon ). Bien supongamos que tenemos un nivel generoso y que nuestra señal es musical y puramente aleatoria, entonces podemos pensar que la recuantificacion y su incremento en el error de cuantificacion sobre dicha banda incrementara el ruido de fondo que en este caso sera ruido blanco. Bien un aumento en el ruido de fonoo en la banda enmascarada no es algo tragico. Lo unico que hace es reducir el margen señal ruido, de una señal que practicamente es enmascarada por otra. Aun haciendo grandes truncamientos en esta banda, normalmente la banda enmascarante tiene la sufienciente potencia como para enmascara el ruido generado y por tanto este ruido pasara desapercibido para el oyente, aun metiendo el hacha a saco, el nivel de ruido jamas va a conseguir sobre salir por encima del nivel de enmascaramiento.
Una vez tenemos nuestra codificacion espectral esta la metemos en una archivo mp3 en el cual ya entran tan solo las bandas que en cada momento enmascaran a las demas. Las enviamos por internet y nos llegan a nuestro ordenador, en nuestro ordenador con el algoritmo de descompresion sucede un tratamiento similar inverso, a partir de la señal codificada espectralmente se realiza la transformacion inversa la cual convierte nuestro dominio frecuencial en dominio temporal y voila reconstruimos nuestra señal original con menos bits, dado que los hemos pegado hachazos al recuantificar los bandas enmascaradas.
Ni que decir tiene que Mp3 es un formato universal y tanto el codec de emision como el de recepcion estan recogidos y estandarizados por la industria, si esto no fuese asi entonces junto a los datos de la codificacion de audio habria que enviar otro buen chorro de metadatos que le fuese explicando al codec de recepcion que es lo que tiene que hacer con el chorizo de bits que se le envian, gracias a que es un estandar nos ahorramos un monton de metadatos.

Bueno esto es asi en plan paisano como funciona el mp3. Ahora yo pregunto, despues de esta explicacion a alguien le cabe aun la duda de si van a existir diferencias en el nivel RMS realmente apreciables por el usuario final.

Buen provecho

Con el peso en disco duro que gastamos mezclando canciones, uno correria a comprimir el audio que esté listo... si la diferencia es tan minima... pues no lo comprimamos tanto!!!!!

256 estaria bien?

El tema es interesante y dificil para tomar posicion... pero se me antoja arriesgado convertirlo todo...

Divertido seria tomar una misma cancion compuesta por nosotros (ejercicio individual) en wav y mp3 (256)... y compararlas en varios buenos monitores, y porque no...en el auto y en donde se pueda... recuerden que tanto numero nos convierte en robots... y todos sabemos que los artistas no lo somos...

saludos.

Baneado

Hay un ejercicio muy diver para ilustrar la teoria del mp3, consiste en cojerse una cancion y comprimirla a 64 kbits/s, bien los efectos audibles son los siguientes:
Segun se ha comentado antes, las bajas frecuencias enmascaran a las altas frecuencias, luego es logico que la recuantificacion sea en altas frecuencias, luego tambien es conocido por todos que si recuantificamos señales a 12 bits e incluso 8 y 4 bits lo que oiremos sera una señal totalmente distorsionada y aspera y un resultado final como si se tratase de una señal pasada a traves un instrumento de metal.
Bueno uniendo estos dos efectos si comprimimos a 64 kbits/s podremos perfectamente notar, unas frecuencias agudas que van desde timbres nasales hasta timbres mas metalicos. Algunas personas son capaces de oir hasta gorgoritos de gorriones debido a los productos de intermodulacion de las frecuencias nuevas que a veces se originan ( si no se usa dither y es una señal de relativa baja amplitud ) junto a una modulacion en amplitud debido a los saltos que se producen en las muestras al ir cambiando de escalon segun la cuantificacion.
Bajo mi punto de vista ya es un crimen el formato cd para determinados estilos de musica, se esta demostrando ultimamente que 44.100 y 16 no es suficiente, y sin embargo otros formatos aun con determinadas compresiones retornables a un estado inicial de 192 KHz y 24 bits sin compresion provocan en el oyente una mayor satisfaccion y fidelizacion.
Un mp3 para casa lo veo francamente denunciable, un mp3 para el metro o autobus lo veo bastante aceptable y desde luego para casa 192 KHz y 24 bits sin compresiones ni artificios, que menos

fourier escribió:
Bueno esto es asi en plan paisano como funciona el mp3. Ahora yo pregunto, despues de esta explicacion a alguien le cabe aun la duda de si van a existir diferencias en el nivel RMS realmente apreciables por el usuario final.

Me parece que no hay por aquí muchos paisanos que sepan lo que es el enmascaramiento, sus umbrales, frecuencias y relación temporal entre señal enmascarante y enmascarada, en cambio una pruebita a ciegas la puede hacer cualquiera.

De todas formas se agradece que subas un poquito el nivel de complejidad del foro.
Un saludo.

Baneado

Hombre me refiero a que una vez que se conoce la teoria ( hipotesis ) se puede comprobar empiricamente y verificar que el planteamiento teorico se confirma ( tesis ). Yo creo que es fundamental conocer un pelin de teoria, el mp3 es un sistema estadarizado y tabulado en documentos de varias decenas de paginas, como veras yo he resumido en plan redaccion de 500 palabras la idea fundamental. Y digo que es necesario, porque del planteamiento practico saldran ciertos resultados, que si conocemos previamente la teoria podremos tener el suficiente juicio como para conocer la veracidad de nuestros resultados obtenidos, si no iriamos dando palos de ciego a ver que conclusiones sacariamos, y dependeriamos explicitamente de que todos los experimentos hayan llegado a buen puerto.
Conociendo la teoria incluso podemos hacer experimentos mas interesantes. Os dejo uno a continuacion. Crearos una par de tracks, en el primero poner un bombo ( con un nivel generoso ) y unos platillos ( tipo charles o sucedaneos con menos nivel ) y comprimirlo a 64 kbits segundo. En el segundo track poner solo los platillos y comprimirlo a 64 Kbits/segundo, y contarme que es lo que sucede.

Para todos los amantes de los numeros sigamos haciendo calculos ( leer solo en caso de que quieras aprender nociones teoricas )

Bueno pues eso unos numeritos con calculadora, supongamos que cojemos la salida de bits a la salida de las etapas de muestreo ( PAM ) y cuantificacion ( PCM ) pero que aun no lo hacemos pasar por el codificador de canal. La codificacion de canal en un sistema consiste en la modulacion de los datos obtenidos a la salida del PCM, con una señal previamente conocida y con unas determinadas caracteristicas ( favorables a nuestro sistema de transmision ) de tal manera que la salida obtenida de esta modulacion es una señal mucho mas robusta y resistente a errores en los sistemas, una señal PCM no se puede escribir tal cual en un sistema fisico ya que las posibles errores que se podria suceder serian realmente alarmantes. La codificacion de canal a menudo aumenta el flujo de bits mediante una redundancia y una serie de metadatos para que los siguientes sistemas de deteccion y correccion de errores sepan como han de trabajar. La codificacion de canal y los metodos de correccion de errores es un tema como los campos de castilla, que ves el principio, pero a saber hasta donde llegan :lol:

es mas son numerosisimos los metodos para hacer mas robustas determinadas señales y en muchas ocasiones se utilizan varios de estos metodos para añadirle mas robustez si cabe, por eso para no meter mas tedio al tema, obviaremos la codificacion de canal, si alguien le interesa le puedo citar bibliografia para conocer acerca del tema.
Bueno pues teniendo claro que hemos decidido medir nuestra señal antes del codificador de canal ( que añade redundancia y produce un mayor numero de bits ) cojamos calculadora en mano para conocer el regimen binario de una señal por ejemplo de un cd en cuanto a PAM y PCM.
Tenemos 44.100 muestras de 16 bits por 2 canales esto produce un regimen binario de 1410 Kbits/s, si los comparamos con la mejor tasa binaria del mp3 tendremos una relacion de reduccion media de 4,4 lo cual ya es significativo, y con la peor tasa binaria tendremos de 22 :shock:

joer esto es ya metiendo el hacha a lo Atila.
Si mal no me falla la memoria el regimen de 64 Kbits/s es un regimen estatico, lo cual hace que nuestro sistema utilice unos valores de compresion o mejor dicho de recuantificacion totalmente dinamicos, es decir puede suceder que durante una determinada transmision de datos, solo haya frecuencias agudas y por tanto no se produzca un enmascaramiento por lo tanto el algoritmo de mp3 debera dejar pasar esta trama sin poder hacer nada, la trama llega a un buffer intermedio y el buffer le dice al algoritmo " macho que aqui no has reducido nada, aplicate un poco en las siguientes tramas " con lo cual el algoritmo va a tener que recuantificar con el doble de esfuerzo las siguientes tramas puesto que hay tramas que no las ha podido recuantificar, la salida del buffer es siempre en este caso de 64 Kbits/s por lo tanto si ha habido una trama que no se ha recuantificado la siguiente trama se recuantificara mas duramente para acercar el valor de salida del buffer a la tasa prefijada, realmente es el buffer el que nos dice cuales han de ser los siguientes valores de recuantificacion para obtener la deseada tasa binaria. Con lo cual vemos que la compresion no es estatica, si no que es dinamica y que el grado de recuantificacion es variable con respecto a las tramas anteriores, pudiendo incluso superar los 22 antes citados. Para reducir un 22 necesitaremos despreciar al menos 5 bits, por lo tanto la recuantificacion a veces puede ser incluso inferior a los 12 bits. Con esto nos podemos imaginar como sonaran las frecuencias agudas.
Para comprobarlo empiricamente ya que la teoria en si es un rollete podeis generaros dos tonos puros uno de baja frecuencia con un buen nivel y otro de alta frecuencia de bajo nivel, le aplicais una compresion de 64 Kbits/s y luego volveis a descomprimirlo, para obtener otra vez el archivo en wav. Al archivo en wav lo filtrais paso banda en la zona del tono agudo y escuchar tan solo el tono y lo comparais con el original a ver que os parece.

Creo que os he citado algunos ejemplos bastantes interesantes acerca del mp3, intentar hacerlos en casa, y tras conocer la breve teoria que os he puesto sacar vuestras propias conclusiones.
Suerte

fourier escribió:

Un mp3 para casa lo veo francamente denunciable, un mp3 para el metro o autobus lo veo bastante aceptable y desde luego para casa 192 KHz y 24 bits sin compresiones ni artificios, que menos

Hostia tio!, supongo que ironizabas, eso para un Dumbo con un sistema con buena acústica y un equipo de sonido elitista, perfecto, pero desde luego si triunfa un 192/24 en cadena musical con LEDs y Displays de colorines, con el volumen a saturar me pongo a estudiar marketing como loco.

Baneado

Rafa1981 escribió:
desde luego si triunfa un 192/24 en cadena musical con LEDs y Displays de colorines, con el volumen a saturar me pongo a estudiar marketing como loco.

Bueno yo no tengo una cadena musical.... ehmmmm tengo una unidad de cd, una unidad dsp, un conversor digital analogico y una etapa de potencia con unos altavoces :oops:

y ninguno de estos lleva lucecitas ni artificios

Así sin saber exactamente que tienes, lo anterior lo decía porque el error más grande de esa cadena de audio, supongo que será bastante más grande que lo que ganas de calidad entre la diferencia de un 44100/16 al 192/24, entre jitter de la unidad de CD, distorsión de los altavoces, problemas de acústica y algunos parametros más.

Lo que si que estoy seguro es que tu no pones el equipo a saturar.

Esto anterior es una suposición mia, sin haberlo mirado, y lógicamente para un audio que sea un producto final.

fourier escribió:
tengo una unidad de cd, una unidad dsp, un conversor digital analogico y una etapa de potencia con unos altavoces y ninguno de estos lleva lucecitas ni artificios

Y un oído que sufre enmascaramiento :twisted:

Baneado

que va que va, soy divino, oigo hasta el aliasing a cientos de KHz

Sabemos tu truco: descompones una onda compleja en series de senoidales de distinta frecuencia...

Baneado