Muestreo y Rango dinámico : Grabación y mezcla

Buenas tardes.
Duda 1:
Muestreo (eje horizontal): Si se muestrea al doble de frecuencia (pasando de 48kHz a 96kHz), se ve en el dibujo que aumenta la cantidad de muestras de la onda: nyquist,etc..está claro.

Profundidad de bits (eje vertical): Pero en la profundidad de bits, pasar de 16bits a 24bits, ¿en qué modifica el rango dinámico de una señal de audio existente?
La onda sigue siendo la misma, y sus dB máximos no han cambiado. Sí veo que se toman más muestras en el eje vertical
(quizás esto permita más sutilezas en los cambios de dinámica). Pero no veo que eso cambie los dB escuchados:
16bits (=96dB); 24bits (144dB) ¿Qué significa esto? ¿no veo que por aumentar el muestreo en el eje vertical se incrementen los máximos de la onda?

Duda 2:
¿Cuál es la operación matemática para pasar de "kHz y bits" a Bitrate(kbps)?: CD: 1411,2Kbps = (44100 Hz * 16 Bits * 2 canales)
Pero suele decirse que el mp3 a 320kbps es calidad similar a CD.
¡Hay mucha diferencia entre 320kbps y 1411,2Kbps! ¿Cómo puede considerarse que son calidades similares? La realidad es que se escuchan muy parecido, pero parece mucha diferencia numérica.
Algo parecido pasa con Bluetooth LDAC (990kbps), ¿mejor que mp3-320kbps? (no me suena mejor), ¿cómo calculan esos 990kbps?

Adjunto sencilla foto de la onda con la duda.

Muchas gracias,

Archivos adjuntos ( para descargar)

mod

Sobre tu duda 1)
Esas figuras de 96dB y 144dB se refieren a un cálculo teórico en el que sólo consideras qué 'ruido' introduce la cuantización (mal llamado así, porque es distorsión). Cada vez que añades un bit, allí donde había un único escalón entre niveles ya cuantizados, pasa a haber dos. Por tanto el 'tamaño' (amplitud) del error por cuantización baja a la mitad. La mitad en amplitud es el cuádruple en potencia, y por tanto una mejora de 6dB por cada bit. Cuando usas 16 bit hay un límite teórico de 6x16 = 96 dB entre el mámimo y el nivel del 'error' por cuantización. COn 24 bits serían 24x6 = 144dB.

Sobre tu duda 2)
Lo que indicas para obtener los Kbps de la señal audio contenida en el CD es correcto. En ese caso es una codificación binaria directa de las muestras audio. Pero en otros sistemas como MP3 hay por medio una 'recodificación' que usa conceptos de psicoacústica para ahorrar bits sin mermar en exceso la calidad percibida (la calidad objetiva sí se ve afectada). No se usan las muestras tal cual, sino que hay una transformación importante. Sin entrar en mucho detalle, se descompone el audio en varias bandas y a través de diferentes reglas a cada banda se le da un número de bits (de los que haya disponibles: hay menos en MP3 a 128kbps que a 320 kbps, por ejemplo). Todo ello de forma dinámica, atendiendo a cómo es la señal en cada momento. En las bandas en que hay señal fuerte se necesitan 'menos' bits (la presencia de señal fuerte hace más insensible la inyección de ruido/error). Las que son más débiles reciben más (para que no queden enterradas en ruido). Insisto que es una descripción muy burda que deja fuera muchos detalles. Los puedes consultar en muchas fuentes, si tienes curiosidad. Pero al nivel al que preguntas, esta explicación simplista puede quizá bastarte. El caso es que de esa forma se consigue un resultado razonablemente audible, sin exceso de impacto en la calidad percibida, a pesar de llegar a reducir la tasa binaria mucho.
MP3 es solo una de muchas técnicas de codificación perceptual que logran esas reducciones sorprendentes.
En el caso de FLAC, otro tipo de codificación audio, el sistema opera sin introducir errores (un poco al estilo de los 'zip' para entendernos, aunque usa otras técnicas propias de audio). Pero las reducciones de tasa binaria no pueden en esos casos ser tan elevadas.

pablofcid escribió:
llamado así, porque es distorsión)

Te me has adelantado (y para mejor, como casi siempre), iba a responder a esta duda (que mira que se ha descrito veces), más que nada para enmendarle al usuario sobre lo de profundidad de bit (por más que sea significativo en el inglés; no pasa de ser otra traducción más por acatamiento cateto), en nuestro universo semántico: resolución. Profundidad la de los sentimientos del flamenco jondo o la de las inmersiones de Cousteau (gran submarinista y descubridor de la mandanga).

Respecto a lo que comentas de la mejora de 1 bit de resolución por cada 6 db de señal (que no exactamente de rango dinámico), estoy más que cansado de señalarlo al revés, que cada 6 db. de menos de volumen hay una pérdida de un bit (tórico y real, luego abundamos) en el rango dinámico, y, lo que es peor, en lo que se percibe, en el puto resultado.
Este enfado, como sabes, no me viene de ningún empeño furibundo en favor de los números (ya quisiera, anumérico descerebrado como sabes que soy); me viene de haber realizado mastering en mi etapa reciente a grabaciones temerosas, al miedo al rojo (en la escala digital, claro), a mezclas cuyo resultado era una chistorrita del Dia, y no a chorizos culares de Salamanca o a salchichones de Vich, (es que para mayor inri, hace poco leía en otro hilo que acercarse al máximo es irrelevante), que quería una forma de onda representada bien gorda, vamos. Y no era por el exceso de proceso con procedimientos lógicos (programas), que también algo (también menos ruido de equipos), era porque el temor lleva a la falta de garra, eso no creo que beneficie ni al britt Pop.

Lo que describes como distorsión, frente al ruido cuando nos referimos a la cuantización, me parece que ya lo hemos discutido, y, si bien es cierto que se asemeja a la distorsión (o, siendo más vago, a la rotura y puteo de la senoide original, sea del tipo que sea esa distorsión), es conveniente en este caso, o eso me parece, que no nos alejemos demasiado del concepto mismo de cuantización (en el PCM, al menos) y me resulta más descriptivo referirnos a ruido que a distorsión (en el caso del DSD es muy elocuente y el solapamiento propuesto en el DSD es claro, o en las estrategias que se emplean en fotografía, de libro).

En cuanto a la explicación que ofreces para la segunda duda de Fj, de acuerdo, auqnue añado que no creo que sea sólo debido a la irrupción de la psico acústica en esa descripción, recuerdo cuando se estaba cocinando (tú eras muy joven...) y esa traslación hacia el kilobaudio la consagraron los periodistas de informática de la época (prensa de imprenta, Pc actual y compañía) y es que en aquella época, entre este siglo y el anterior, todo era anhelo de velocidad, había que expresar los logros del proceso en valores de velocidad (megahercios o kilobaudios, que andábamos con módems o, como mucho con doble rdsi, alguno se cortaría la venas).

Vamos, que hay que defender que se siga usando frecuencia de muestreo (o de mosqueo en mi caso y en el del maño), resolución, y ruido de cuantización.
Y, ante la duda, el teorema de Nyquist, la base de conocimientos de Hispasonic y la sección de aparición próxima pregunta a Pablo (o a Vagar).

Carmelopec (huevos artificiales, qué pesadilla) escribió:
mezclas cuyo resultado era una chistorrita del Dia, y no a chorizos culares de Salamanca o a salchichones de Vich

Carmelo, si alguna vez te mando algo será un morcón, prometido :desdentado:

pablofcid escribió:
Pero al nivel al que preguntas, esta explicación simplista puede quizá bastarte

Las explicaciones, si son para tontos, mejor, por lo menos en mi caso, que si me quedo con ganas de información más precisa, haré preguntas precisas. Se agradece la visión general y comprensible.

Un saludo!

Lucas escribió:
si alguna vez te mando algo será un morcón, prometido

Mientras sea entre pan y pan (para engordarlo aún más...)

Pero espero dos cosas:
-Que haya transmitido esa idea de resolución (y no una venérea).

-El morcón (ibérico, eh), incluso sin pan con tal de no veros con apnea por las profundidades.

El Cousteao ya lo aporto yo.

Muchas gracias por las respuestas, se empieza a entender algo,...pero...

Ejemplo: Si la onda que genera el músico con una trompeta tiene la (amplitud "A")=Volumen. Al cuantizar verticalmente en 2^16 valores o en 2^24 valores: no veo que en el gráfico
de la senoide esta cambie su amplitud=volumen=dB.
1º. Entonces, ¿por qué se dice en foros y Youtube que al incrementar el muestreo de la onda que sale de la trompeta dicen que aumentan los dB de 96 a 144? La amplitud de la onda analógica no
ha variado, solo la (Resolución)=(Profundidad)=Muestreo=(Cuantización vertical). (algo básico no estoy entendiendo).
2º. Sobre la onda del dibujo, ¿Cómo afecta el muestrear con 2^8 ó 2^16 ó 2^24 para que aparezca ruido?
3º. Ese 1bit=6dB, ¿Cómo se representa esto sobre la gráfica adjunta?, es decir, ¿Qué tiene que ver ir añadiendo bits con que la onda inicial siga siendo la misma en amplitud?
(creo que estoy preguntado cosas parecidas de distinta manera).

(adjunto dibujo)

Saludos y gracias

Archivos adjuntos ( para descargar)

Lo que aumenta realmente ese rango a 144 (que no conozco ningún equipo que los alcance) es la resolución. La frecuencia de muestreo lo que incrementa es la perfección (frente a errores) del muestro. Pero ésto Pablo lo va a explicar mejor, que yo soy de letras.

#7 Gracias,
Cuando digo (Resolución)=(Profundidad)=(Muestreo)=(Cuantización vertical) me refiero solo al eje Y.
El Muestreo en el eje X está claro (creo; en el presente hilo no pregunto nada del Muestreo en X).
El (Muestreo en el EJE Y)=Resolución=Profundidad=Cuantización vertical=....o como lo quiera llamar cada persona es donde surgen las dudas.

Es decir, las dudas que nunca he visto resueltas, SOLO tratan del eje Y. Independientemente de que le llamemos (Muestreo en el EJE Y)=Resolución=Profundidad=Cuantización vertical=...

Muchas gracias por vuestro interés. Poco a poco voy entendiendo cosas.

FJ escribió:
o como lo quiera llamar cada persona

"Carmelopec (huevos artificiales, qué pesadilla)" escribió:
lo que incrementa es la perfección

Y sobreponerse al solapamiento (en inglés, aliasing)

Creo que el error es que concibes los ejes de la senoide (representada) como lo que no es; cuando lo que representan es amplitud y tiempo.

mod

Para un mismo valor de pico en la entrada (para entendernos, para una misma amplitud en la señal, sea A por ejemplo), pasar de los 2^16 niveles posibles a los 2^24 en la cuantización (la representación del valor real de cada muestra sujeta a los finitos valores posibles con ese número de bits) lo que hace es que existan menos o más valores posibles, una representación menos o más precisa, o sea, un valor cuantizado cuyo error (distancia) frente al real es mayor con los 16 bits (menos niveles, salto mayor entre ellos) que con los 24 bits (más niveles, salto menor entre ellos, una mejor cercanía entre el valor real y el cuantizado).
Como resultado en 16 bits el ruido de cuantización (que yo insisto aunque le pese a Carmelo en que es realmente distorsión por cuantización aunque en la práctica a menudo su resultado sea asimilable a ruido) es mayor.
Y tal como decía antes es 6dB menor por cada bit mas de precisión que añadimos.

Lo de los dientes de sierra gordos o finos, vamos...

pablofcid escribió:
Como resultado en 16 bits el ruido de cuantización (que yo insisto aunque le pese a Carmelo en que es realmente distorsión por cuantización aunque en la práctica a menudo su resultado sea asimilable a ruido) es mayor.

Ahora me haces dudar; en realidad yo no estaba pensando en la práctica; priorizaba la lógica (eso que me atenaza).
Pero en la pura realidad ese puteo al que me refería es más asimilable a la distorsión.

Respecto al modelo de senoide del que se ha valido el compañero (y en ese plano le has contestado perfectamente) es que acabo de caer en que hay dos senoides que son casi sinónimas, la del ciclo que sirve para ejemplificar un modelo matemático (lo de los dientes de sierra que pregonaba el consorcio DSD hace unos cuantos años) y la típica representación gráfica en un programa de ordenador (que también denominamos senoide y quizás sería mejor forma de onda) en lo que si se explica con el eje de tiempo y el de amplitud, ¿no?.

Buenas tardes, ante todo gracias por vuestro interés. En segundo lugar me disculpo por no saber expresarme en la duda.

Adjunto imagen a ver si logro hacer la pregunta correctamente.

Esto 6x16 = 96 dB y esto 24x6 = 144dB, lo cuentan en distintos foros de forma más o menos extendida. Pero adjunto imagen con la duda y gráfico a ver si logro explicar cual es la duda.

Saludos y gracias,
Javier

Archivos adjuntos ( para descargar)

mod

Esos dB no miden el tamaño de A sino la relación entre el tamaño de A y el tamaño del error. Cuanto menor error (o sea, cuantos más bits) mayor es la diferencia.

No es una medida de la señal, sino del margen dinámico teórico. La diferencia entre el nivel máximo de señal admisible antes de incurrir en distorsión y el nivel de ruido propio del sistema (en este caso asimilado a la distorsión por cuantización).

Carmelopec (huevos artificiales, qué pesadilla) escribió:
y la típica representación gráfica en un programa de ordenador (que también denominamos senoide y quizás sería mejor forma de onda) en lo que si se explica con el eje de tiempo y el de amplitud, ¿no?.

¿Y esto?, ¿es cabal o es una flipada mía?