Duda con respecto a los bits. : Grabación y mezcla

Buenas noches.

Tengo cierto run-rún en la cabeza con respecto a la profudidad de bits. Un bit (binary digit) lo entiendo como una unidad que proporciona información de forma clara e inequívoca: ¿Hoy llueve? Sí (1) - No (0) - Quizá si se levanta viento gallego (?). Está claro que para poder expresar esto último, no me vale un 0 ó un 1. Es entonces cuando necesito una palabra más larga para poder expresar "quizá sí si se levanta viento gallego". Queda clarísimo que, cuantos más bits, más precisa es la información proporcionada: 16 bits es una palabra compuesta por una combinación de 16 "0" y "1", 24 bits la forman combinaciones de 24 "0" y "1", y así sucesivamente con 32, 64..., etc.

Ahora bien; en audio, y siguiendo a Nyquist, cada bit se corresponde más o menos a 6 dBs, lo que nos da una idea de que, a más profundidad de bits, mayor rango dinámico (mayor diferencia entre el sonido más fuerte y el más suave).

Mi duda es: si yo grabo a cualquier profundidad superior a 16 bits, y luego debo aplicar ditter para poder grabar en el formato estándar de CD, voy a tener compresión por narices, ¿no?, ya que pierdo los 144 dBs que me daría como máximo una grabación a 24 bits, y encima estoy acercando el punto más fuerte y el más suave... Es decir, tengo una grabación más piano y más apretada. ¿Esto es así?

Otra duda: Si yo grabo todo a 24, 32, 64... lo que sea mayor que 16 bits, lo proceso de forma normal (ecualizo, comprimo, ajusto volúmenes... en definitiva: mezclo), y luego lo paso a 16 bits para poder tostar un CD, me parece que por lógica debería sonar mucho mejor que el mismo proceso hecho a 16 desde el comienzo, ¿no? Es decir: si yo cojo algo que tiene unas diferencias bien marcadas (un rango dinámico potente), aunque lo empequeñezca, esas diferencias seguirán notándose, pero si parto de algo ya "capao", mal lo llevo. Me recuerda unos pasatiempos que hacía de pequeño: "copia el dibujo en la siguiente cuadrícula". Lógicamente, cuanto más rallado estuviera el motivo, más fácil era de agrandar o empequeñecer, pero como hubiera pocas cuadrículas....

Veo lo relativo a los bits de forma muy similar: cuantos más bits, aunque empequeñezcas, el detalle sigue ahí, pero si no hay bits y empequeñeces, tendrás un manchurrón... Yo lo veo así, pero no estudié nada de eso. ¿Alguien que me lo pueda explicar? A mí parece que así debería ser, pero...¿suena mejor un archivo grabado a 32 y luego pasado a 16 que uno grabado directamente a 16?

[ Imagen externa no disponible ]

Por otra parte (y seguro que será una burrada), ¿por que no hay profundidades de bit de 19? (es por poner un ejemplo). Frecuencias de muestreo las hay múltiplos de 44.1 y de 48, pero profundidades de bit sólo hay los cuadrados de 2 (4, 8, 16, 32, 64...). ¿Por qué?

Gracias por la ayuda.

Empiezo por el final....
Son cosas del código binario. Por ejemplo :
En dos casillas binarias; _ _ pueden haber 4 combinaciones (00,01,10,11). por tanto procesa 4 bits distintos.
Y en 3 casillas binarias (_ _ _) ? haz la cuenta (000,001,010,011,100,101,110,111)
tenemos 8 bits distintos ...
para tener 16 bits, tendremos palabras de 4 casillas (_ _ _ _) ... para 24 bits tendremos palabras de 5 casillas (_ _ _ _ _) ... entiendes? se aprovechan todas las conbinaciones, por lo que tener 23, 17 etc bits de resolución es un atraso.

Luego, haces alusión a 144 dBs que te daría una grabación de 24 bits... y yo pregunto:
No influye la capacidad de la tarjeta y sus conversores, para hacer esto posible, o quedarse un poco por debajo?

Un saludete

Iba abrir un post ahora mismo sobre este tema y me salio en las coincidencias,tengo ese run run tambien..jeje

Puedo exportar un archivo wav a 16 bit cuantas veces quiera y permanecera intacto?

Siempre he pensado que si,que no habria perdidas...pero el run run

David Valdés escribió:

Mi duda es: si yo grabo a cualquier profundidad superior a 16 bits, y luego debo aplicar ditter para poder grabar en el formato estándar de CD, voy a tener compresión por narices, ¿no?, ya que pierdo los 144 dBs que me daría como máximo una grabación a 24 bits, y encima estoy acercando el punto más fuerte y el más suave... Es decir, tengo una grabación más piano y más apretada. ¿Esto es así?

No, no es asi, es mas sencillo. Al grabar a 16bit tenemos mas ruido de cuantizacion por la mayor inexactitud (lo de "copia el dibujo en la cuadricula" es bastante acertado, como simil), el rango dinamico es la diferencia entre el ruido de fondo y el valor maximo, al ser el valor de ruido mayor en 16 q en 24 el rango dinamico es menor, pero no quiere decir q se comprima el rango dinamico, si no q simplemente no se registran con precision valores bajos de la señal.

David Valdés escribió:

Si yo grabo todo a 24, 32, 64... lo que sea mayor que 16 bits, lo proceso de forma normal (ecualizo, comprimo, ajusto volúmenes... en definitiva: mezclo), y luego lo paso a 16 bits para poder tostar un CD, me parece que por lógica debería sonar mucho mejor que el mismo proceso hecho a 16 desde el comienzo, ¿no?

Si, es asi de simple, si grabamos a 24bit los procesos q apliquemos a la señal tendran mas precision q aplicandolos sobre señal de 16bit. Ademas, y aparte de la precision del procesado, si al truncado (pasar de una resolucion en bit a otra mas baja, en este caso de 24 a 16) le añadimos Dither (ruido de muy bajo nivel con unas propiedades muy especificas), conservaremos un poco de la calidad del fichero de 24bit. O lo q es lo mismo: Entrega mas calidad grabar a 24bit y luego truncar con dither a 16bit, q grabar directamente a 16bit (independientemente del procesado de la señal, q tambien seria mas preciso a 24bit)

Es simpatico q con la frecuencia de muestreo no pasa lo mismo y hay q intentar evitar los SRCs.

slds

superlimon escribió:
Empiezo por el final....
Son cosas del código binario. Por ejemplo :
En dos casillas binarias; _ _ pueden haber 4 combinaciones (00,01,10,11). por tanto procesa 4 bits distintos.
Y en 3 casillas binarias (_ _ _) ? haz la cuenta (000,001,010,011,100,101,110,111)
tenemos 8 bits distintos ...
para tener 16 bits, tendremos palabras de 4 casillas (_ _ _ _) ... para 24 bits tendremos palabras de 5 casillas (_ _ _ _ _) ... entiendes? se aprovechan todas las conbinaciones, por lo que tener 23, 17 etc bits de resolución es un atraso.

Luego, haces alusión a 144 dBs que te daría una grabación de 24 bits... y yo pregunto:
No influye la capacidad de la tarjeta y sus conversores, para hacer esto posible, o quedarse un poco por debajo?

Un saludete

Supogno que más vale tarde que nunca... eso no es correcto.

Eso de las casillas no se donde lo habrás leido o quien te lo habrá contado pero es una burrada. Te digo que es una burrada porque ¿me estás diciendo que un CD por ejemplo (que trabaja a 16 bits) solo puede tener 16 valores distintos?

Cuando trabajamos a 16 bits estamos trabajando con "16 casillas", es decir, podemos tener 2^16 (2 elevado a 16) valores distintos, es decir: 65.535 valores distintos, lo cual dista mucho que los 16 que podíamos tener según tu teoría. Cuando trabajamos a 24 bits estaremos trabajando con 16.777.216 valores distintos, y ahi es donde podemos ver la diferencia tan grande en usar 16 o 24 bits.

Un abrazo.

Hola... Tienes todísima razón... Fuí yo solito....

Me colé del todo ... al no hablar en años de ésto con nadie, me puse a recordar y fallé. Menos mal que andabas por ahí...

Un saludo

Nada hombre, si yo te contara las veces que se me va la pinza...

Puse la rectificación por si alguien que empiece busca info sobre el tema y lo leía y se empezaba a hacer la picha un lío desde el principio.

Un abrazo.

Hola a todos, tengo una duda respecto a los bits y la manera mas adecuada de trabajar el audio en relacion a eso, no se si sea correcto ponerlo en este hilo, tengo claro que cuando uno va a quemar una cancion a un cd esta bien que este a 16 bits porque asi es como lo lee un cd, ahora cuando uno realiza una grabacion de voces o cuando finalizas el audio es decir haces e master de una cancion, que seria lo correcto?, no me queda claro, dicen por ejm: lo mejor es hacer una grabacion a 24 con 48, o 24 con 44, no entiendo muy bien esos terminos, o no estoy seguro si los estoy poniendo correctamente, y tambien hablan de 64, 96, 120 (o algo cercano a 120) y etc, entonces, cual es el standar con el que la mayoria en el caso de produccion musical trabaja? que es lo mas adecuado?

Tengo algunas dudas más, pero primero quisiera que alguien sea amable de aclararme estas dudas, si algo no me entendieron bien tratare de explicarlo mejor, (no tengo mucha teoria y hay cosas que no puedo explicar bien) gracias !!

Hola elaprendiz.

Yo cuando son producciones que van a tener como mayor difusión un CD de audio recomiendo siempre trabajar en todo momento a 44'1kHz de frecuencia de muestreo y 24bits (o 32 bits en coma flotante si el secuenciador lo permite). Yo como trabajo en Protools trabajo siempre a 24 bits, aunque los procesos internos y tal se hacen a doble precisión (48bits).

Creo que trabajar con frecuencias de muestreo de 48kHz es un error, ya que luego hay que bajar por huevos a 44'1Khz y ya las muestras no van a coincidir con la que teniamos durante todo el proceso de producción y postpro. A 88Khz no es mal asunto trabajar,pero yo tampoco veo ninguna ventaja en ello. Yo prefiero trabajar con una buena longitud de palabra (bits) que con una alta frecuencia de muestreo. Pienso que la frecuencia siempre se debe ajustar a la frecuencia que va a tener el producto final.

En los bits no ocurre eso. Cuantos más bits se tenga durante la mezcla, más precisión se va a tener al procesar el audio, menos trancamientos de datos,...

Siempre debes mantener la longitud de palabra alta hasta el final del proceso de mastering. Una vez que has procesado todos los archivos estereo en el mastering, montas el CD de forma secuencial, haces los fades in y los fades outs, ajustas las distancias entre los temas,... y justamente al final aplicar un dither y reduces la longitud de palabra a 16 bits.

Es un tema complicado. Espero haberme explicado bien.

Un abrazo.

Eso de los bits y las frecuencias de muestreo siempre han sido algo complicado de entender, pero un ejemplo puede aclararlo bastante a quien no lo entiende.

El mundo es analógico, no digital. El sonido y nuestro oído son analógicos, esto es, el sonido se representa como una curva y no con ceros y unos. La digitalización (transformar esa curva en ceros y unos) se hace porque así es más fácil transformarla, procesarla, hacerle mil perrerías. ¿Y cómo se hace? Veamos una curva cualquiera:

El sonido es la curva roja y nuestro tímpano se mueve según dicha curva. El eje vertical representa el valor de la curva en cada momento y el eje horizontal el tiempo. Para transformar esa curva en ceros y unos lo que se hace es dividir una fracción de tiempo (un segundo, normalmente) en miles de trocitos y entonces tomamos el valor de la curva en cada trocito. En la curva de la imagen, supongamos que las divisiones en trocitos son las líneas verticales. Pues bien, se toma el valor de la curva en cada línea vertical, y dicho valor se transforma a base 2 (o sea, en binario, .... ceros y unos).

Ya la tenemos digitalizada. Ahora podemos hacer con ella mil cosas con plugins y aparatos: amplificarla, invertirla, comprimirla, meterle un reverb.... lo que sea, y fácil y barato. Tratar la señal analógica implica aparatos muy caros.

Vale, en la curva de la imagen hemos tomado, como se ve, 16 valores (16 líneas verticales). Si cogemos esos 16 valores en binario y hacemos el proceso inverso, o sea, construir la curva, no obtendremos una curva exacta, obviamente, sino algo parecido a esa curva pero el perfil no es curvilíneo sino en forma de escalones, porque sólo tenemos los valores que alcanza en las 16 líneas verticales. La gráfica sería, más que una bonita curva, una recta con muchos quiebros.

Todos sabemos lo que es la resolución y huelga explicarlo. Entenderéis que si en lugar de coger 16 valores hubiera tomado 32 la forma de esa línea llena de quiebros se parecería más a la curva original. Y ya no os digo si hubiera tomado 32 millones de valores.... casi sería la curva original perfecta. O sea, cuantos más valores tome a la hora de digitalizar, más se aproximará al valor original. Eso es la frecuencia de muestreo, y 44 Khz siginifica que tomo 44.000 valores por segundo.

Y ahora el valor en cada punto. Dicho valor, antes de pasarlo a binario (ceros y unos), será un valor con decimales. Si somos muy quisquillosos y queremos que sea el valor más aproximado a la realidad tomaremos más decimales, pero llega un momento en que tenemos que parar y los decimales que siguen se desechan. Eso es lo que conocemos como redondeo, que no es más que asumir un cierto error. Vale.... cuantos más decimales tomo más me aproximo a la realidad. Cuando cogemos la curva y la empezamos a transformar (amplificarla, comprimirla, distorsionarla, ....) ese redondeo es acumulativo, o sea, el error se va haciendo más gordo. Cuantos más decimales hayamos tomado más pequeño será ese error. Como el precio de la energía eléctrica: viene con muchos decimales. Si el kw cuesta 1,581887 no es que tengamos que pagar milésimas de céntimo, porque el redondeo se hace al final de la factura. Si se hiciera al principio (1,58) el montante final sería muy diferente. Todas las operaciones se hacen con su valor real y al final redondeas. Los bits sería los decimales que coges. Si tomas 24 bits desde el principio el error es mucho más pequeño que si tomas 16, y los cambios que le vas haciendo a la curva acumula menos errores. Una vez hecho todo lo que querías hacerle, entonces redondeas (la pasas a 16 bits.... eso es el dithering), la grabas en un cd y por último la escuchas en tu equipo de música, que tiene que analogizarla, esto es, devolverla a su estado inicial analógico. Como hemos cogido muchos decimales/bits para el proceso de transformación, la curva restaurada será casi una curva perfecta. Si hubiéramos tomado 16 bits desde el principio el error acumulado al final sería mayor... la curva restaurada ya no será tan perfecta.

Saludos,

Esto me lo tengo que volver a leer más detenidamente

Gracias

Intentando hacer una chuletilla guarrera, sin entrar en profundas explicaciones:

-Grabar con buen equipo, máxima resolución y frecuencia de muestreo igual a la final.
-Grabar con tarjeta flojilla, máxima resolución y frecuencia de muestreo múltiple de la final.
-Procesar/generar ITB con plugins muy buenos, frecuencia final, profundidad de bit indiferente.
-Procesar/generar ITB con plugins free o no muy buenos, o oversampling ( frecuencias de muestreo múltiples de la fm final) o esto en los plugins que lo requieran:
http://chris.r.walton.googlepages.com/oversampler

José A. Medina escribió:

Creo que trabajar con frecuencias de muestreo de 48kHz es un error, ya que luego hay que bajar por huevos a 44'1Khz y ya las muestras no van a coincidir con la que teniamos durante todo el proceso de producción y postpro. A 88Khz no es mal asunto trabajar,pero yo tampoco veo ninguna ventaja en ello.

Hola MedII, creo q habria q aclarar lo siguiente, y supongo q estaras deacuerdo conmigo.

El problema de usar una frecuencia de muestreo diferente de la de nuestro formato final (en este caso 44.1Khz/CD audio) es q va a haber un punto en el q tengamos q pasar de la frecuencia de muestreo q usemos a 44.1Khz, pero esto solo es problema si hacemos la conversion de frecuencia de muestreo (SRC) en el dominio digital, si lo hacemos en el dominio analogico no hay ningun problema.

Me explico con un ejemplo practico:

Si realizamos la grabacion de un tema a 96Khz y realizamos la mezcla en digital (en un DAW), le tendriamos q entregar a nuestro tecnico de mastering un fichero de 96Khz si no queremos realizar un SRC. Nuestro tecnico de mastering es muy posible q convierta esta señal a analogico para utilizar equipo de mastering analogico, en este caso, normalmente, el tecnico de mastering aprovechara esta conversion DA/AD para realizar la conversion de frecuencia de muestreo en el dominio analogico, osea q reproducira el fichero de 96Khz (DA), pero cuando vuelva a convertir a digital lo hara a 44.1Hz (AD), habiendo "convertido" la frecuencia de muestreo en el dominio analogico, sin aplicar un dañino algoritmo de SRC.

Como es facil darnos cuenta si la mezcla se hace en el dominio analogico tambien podriamos hacer lo mismo, grabando el master a 44.1 mientras reproducimos las pistas a 96Khz. El unico requisito es un grabador independiente para el master para poder usar otra frecuencia de muestreo q la del multipista.

De hecho hoy en dia es bastante habitual en grandes producciones q se grabe a 96Khz (mayor linealidad q a 44.1)
por q la mezcla y el mastering en este tipo de producciones casi siempre se realiza en analogico.

Alguien escribió:

A 88Khz no es mal asunto trabajar

Creo q te refieres a q al ser 88.2Khz el doble exacto de 44.1Khz la matematicas implicadas en el SRC son mas simples y dan como resultado un SRC mas lineal. No soy yo ningun experto en estas profundidades digitales pero explicaba Mr Weiss en una entrevista q esto no es asi, creo q alguien aki en hispasonic en su dia explicaba la teoria destras de esto. La verdad q hasta q lei la entrevista de Weiss pensaba lo mismo q tu.

teniente_powell escribió:

Si cogemos esos 16 valores en binario y hacemos el proceso inverso, o sea, construir la curva, no obtendremos una curva exacta, obviamente, sino algo parecido a esa curva pero el perfil no es curvilíneo sino en forma de escalones, porque sólo tenemos los valores que alcanza en las 16 líneas verticales. La gráfica sería, más que una bonita curva, una recta con muchos quiebros.

Esto es totalmente erroneo y pone en evidencia q no se entiende a Nyquist, ni un minimo del funcionamiento teorico del filtro de reconstruccion de un conversor DA. El concepto de "copia el dibujo en la cuadricula" del q antes hablabamos no es mal simil si hablamos de la resolucion en Bit, pero para hablar de la frecuencia de muestreo no es para nada un buen simil. Una onda senoidal se puede reconstruir perfectamente con tener unicamente dos puntos de muestreo por ciclo, es por esto q con el doble de la frecuencia maxima a capturar es suficiente, teoricamente no hace falta 3 ni cuatro veces la frecuencia maxima, otra cosa es q en la practica el tener una F de muestreo mayor nos permita usar filtros con pendientes menos abruptas y por lo tanto mas lienales (enfoque Weiss) o mover la frecuencia de corte del filtro mas arriba alejando del umbral de escucha las alinealidades del mismo (enfoque Lavry).

En cualkier caso el mismo Dan Lavry opina q pasar de 96Khz introduce mas alinealidades de las necesarias por la imprecision de la electronica a esas velocidades. En cualquier caso las peleas entre diseñadores de convertidores se me escapan teoricamente, pero creo q hasta 96Khz estan todos deacuerdo en q existe una mejora en linealidad cuanta mayor es la frecuencia de muestreo, aunq mas bien por la implementacion practica de los filtros q por conseguir una mayor respuesta en frecuencia.

slds

"Chus" escribió:
Esto es totalmente erroneo y pone en evidencia q no se entiende a Nyquist ni un minimo del funcionamiento teorico del filtro de reconstruccion de un conversor DA. El concepto de "copia el dibujo en la cuadricula" del q antes hablabamos no es mal simil si hablamos de la resolucion en Bit, pero para hablar de la frecuencia de muestreo no es para nada un buen simil. Una onda senoidal se puede reconstruir perfectamente con tener unicamente dos puntos de muestreo por ciclo, es por esto q con el doble de la frecuencia maxima a capturar es suficiente, teoricamente no hace falta 3 ni cuatro veces la frecuencia maxima, otra cosa es q en la practica el tener una F de muestreo mayor nos permita usar filtros con pendientes menos abruptas y por lo tanto mas lienales (enfoque Weiss) o mover la frecuencia de corte del filtro mas arriba alejando del umbral de escucha las alinealidades del mismo (enfoque Lavry).

Bueno.... como he dicho al principio de mi intervención mi pretensión era únicamente "ponerle un ejemplo a quien no lo entiende" (sic). Y a quien no lo entiende se le hace difícil meterse a estudiar a Nyquist o Weiss.

Con todo, es cierto que una onda senoidal se puede reconstruir perfectamente con tener únicamente dos puntos de muestreo por ciclo... por eso si las frecuencias superiores a 20 kHz son inaudibles a los humanos, una frecuencia de muestreo de 40 kHz serían suficientes. Otra cosa son las onda senoidales distorsionadas....

Saludos,

teniente_powell escribió:

por eso si las frecuencias superiores a 20 kHz son inaudibles a los humanos, una frecuencia de muestreo de 40 kHz serían suficientes.

Como ya he explicado, no seria suficiente por la necesaria implementacion practica de un filtro de reconstruccion analogico, como ya he explicado, exponiendo dos tipos de filosofias en la implementacion de estos filtros. De todas formas yo personalmente no creo q el ser humano no sea sensible a frecuencias por encima de 20Khz, hay un estudio de un japones q demostro sensibilidad a frecuencias bastante por encima (no en la tipica audiometria de tonos puros, si no actividad cerebral), , y ademas hay instrumentos q generan energia hasta los 100Khz.

Alguien escribió:

Otra cosa son las onda senoidales distorsionadas....

¿?