Informática musical

¿Por qué 44.100 Hz y no cualquier otro número?

He pensado aprovechar este arranque de julio para contaros una de esas curiosidades propias para animar las charlas de verano, al menos cuando os reunáis con colegas audiomusicales (mejor no con la familia y amigos para que no sigan tildándonos de 'rara avis').

Es una pregunta habitual para muchos de nosotros:  ¿por qué se adoptó para el CD la velocidad de muestreo de 44.1 kHz? Suficiente para albergar los 20kHz de contenido audio y para poder contener aprox. 80 minutos de audio en el disco óptico previsto de 12 cm. de diámetro, claro. Pero, ¿por qué no simplemente 44 o el más redondo 45 o incluso 50? Las razones profundas de esa cifra obligan a recordar (como se está haciendo en los comentarios de los lectores) sistemas que permitían aprovechar grabadoras de vídeo para contener audio digital. Codificando mediante el uso del blanco y el negro los bits, se guardaban 3 muestras en cada línea de los sistemas NTSC y PAL, y 44100 resultaba ser una cifra que podía encajarse en ambos sistemas pese a las diferencias en número de filas y de cuadros.

Pero más allá de esa sesuda ingeniería ampliamente documentada, el prometido entretenimiento veraniego y poco conocido detalle es este: tirando de calculadora podréis ver que esa cifra, 44100 Hz, es el resultado de multiplicar 2 al cuadrado por 3 al cuadrado por 5 al cuadrado y por 7 al cuadrado.  El producto de los 4 primeros números primos elevados cada uno de ellos al cuadrado, dejando aparte el peculiar '1' que nada aporta al multiplicar. Una combinación que le otorgaba cierto atractivo. Es divisible entre otros por 2, 3, 4, 5, 6, y 7. Un valor útil por tanto para poder obtener subdivisiones enteras.

El origen del valor 44100

No es el único caso de este tipo. Los 24 o 48 pulsos por tiempo del sync analógico, o los 24 clocks por tiempo en MIDI, son valores que admiten divisiones binarias y ternarias y por tanto útiles musicalmente. Eso sí, no les pidáis cinquillos ni septillos.

Pablo Fernández-Cid
EL AUTOR

Pablo no puede callar cuando se habla de tecnologías audio/música. Doctor en teleco. Ha creado diversos dispositivos hard y soft y realizado programaciones para músicos y audiovisuales. Toca ocasionalmente en grupo por Madrid (teclados, claro).

¿Te gustó este artículo?
28
Comentarios
  • 1
  • 2
  • 3
  • #1 por el 02/07/2016
    Más frikadas para este verano... Abre un blog semanal con contenido de este tipo :mrgreen:
    3
  • #2 por vagar el 02/07/2016
    Ah, pues mira, no lo sabía, cuando he leído la pregunta he pensado que a lo mejor tenía que ver con las pendientes típicas de los filtros de reconstrucción.

    Pero sí, para hacer remuestreo minimizando la necesidad de interpolar es la mar de conveniente que la frecuencia sea producto de factores primos pequeños. ¡Qué ingenioso!
  • #3 por jBetances el 02/07/2016
    "Suficiente para albergar los 20kHz"

    Hay quien dice que con 44.1 no es suficiente para llegar a 20kHz. Yo siempre digo: "Busca el teorema de Nyquist-Shannon".
  • #4 por marvin600 el 02/07/2016
    Pablocid , me gustaria que nos explicara porque 440 hertz para la nota la y no 440.5???
    1
  • #5 por el 02/07/2016
    :comer:
    1
  • #6 por pablofcid el 02/07/2016
    #3
    Sobre esa cuestión, ¿viste mi artículo sobre 'muestreo crítico'? No todo es la cuetión de si 20kHz o más, hay otras razones para el sobremuestreo.
  • #7 por Abraham el 02/07/2016
    Yo sabía que era por el Teorema de Nyquist, también (y)
    1
  • #8 por BlahBlah el 02/07/2016
    #4

    Es que tampoco es verdad lo de 440 Hz. O mejor dicho, no estrictamente verdad.

    Hay muchas afinaciones alternativas dependiendo del tipo de música. En orquestas que tocan música romántica es común afinar por encima de 440, mientras que en las de música barroca suele estar en torno a los 435 Hz si no recuerdo mal.

    El estándar de 440 es relativamente moderno (bien entrado el S. XX) y si se escogió 440 es por comodidad (es más cómodo que 440.5), y porque aprox. era el promedio o centro del rango típico de afinaciones que tradicionalmente han ido desde 435 hasta 445.
    2
  • #9 por Hoperman el 02/07/2016
    Top
  • #10 por Carlos360 el 02/07/2016
    Tenia entendido que tenia que ver tambien con el VHS y la frecuencia que era mas adecuada para este formato, no tiene nada que ver?
    1
  • #11 por Creati el 02/07/2016
    Fueron los Nazis para controlar el mundo :loco:
  • #12 por dsn el 02/07/2016
    #4

    Aunque no de la forma ordenada y cuidadosa en la que pablofcid escribe sus artículos, ese tema salió ya varias veces en los foros. Concretamente en cada ocasión que aparecía un hilo de los de "Teoría de la conspiración de la afinación", que hubo una época en la que estaban bien de moda :mrgreen: .

    Recuerdo alguna intervención mía (que me ha sido más fácil de encontrar) que igual te ayuda a despejar tus dudas, pero ya te digo que el tema dio para mucho:

    http://www.hispasonic.com/foros/componer-432-hz/401981/pagina6#post3626185
    http://www.hispasonic.com/foros/porque-440/457740#post3825256
    http://www.hispasonic.com/foros/porque-440/457740/pagina2#post3825540

    Saludos.
    2
  • #13 por BlahBlah el 03/07/2016
    #12

    ¡Jesús! Ya no me acordaba de eso.

    Sólo se pueden encontrar semejantes majaderías a las de ese hilo si te metes a leer los trolls que escriben los comentarios en las páginas de JM Mulet o de LA Gámez.
  • #14 por Optimuff Prime el 03/07/2016
    #4 Eso ocurrió porque Hitler sabía (vía annunakis y reptilianos) que la vibración a 440 ciclos por segundo estimula nuestras zonas de control mental (igual que el fúrbol, el reggaetón y los programas del corazón).

    En cambio, si utilizásemos el La a 442, las áreas de la corteza cerebral especializadas en crear levantamientos y despertares sociales y proletarios serían estimuladas hasta niveles insospechados, creando así una ruptura para con el sistema capitalista anticomunista ideado por los reptilianos, los duques de York y el Club Bildelberg.

    Yo creo que era muy evidente, pero nunca está de más repartir cultura general, historia de la música y conocimientos científicos absolutamente probados y demostrados.
    xDDD
    7
  • #15 por Carlos S el 03/07/2016
    Siento ser prosaico, pero los 44100 son una herencia de un sistema pre-existente de Sony. Se trataba de un sistema que había en algunos estudios para guardar en formato digital algunas grabaciones valiosas (supongo que los "máster" de grabación) y evitar que el paso del tiempo perjudicase las grabaciones analógicas.

    La idea (muy ingeniosa) consistía en grabar el audio digital como imagen de vídeo: se usaba un trozo de imagen en color negro para los ceros y otro de imagen en blanco para los unos (o al revés, nunca lo he sabido). Usaban magnetoscopios NTSC con frecuencia "non-drop", o sea: 30 "frames" por segundo. Usaban 490 líneas de cada "frame" (si no recuerdo mal el NTSC tenía 525 líneas por "frame" incluyendo las de borrado vertical). Grababan 3 muestras por línea (a 16 bits, 48 bits por línea). O sea, que se grababan un máximo de 48 trocitos de señal blanca/negra en cada línea de imagen, y esa información era el audio.

    Multiplicando: 30x490x3= 44100.

    Alguien ha comentado lo del VHS... bueno, iba bien tirado, pero en realidad se usaba un formato de magnetoscopios un poco más profesional. Creo que se usaba U-Matic. El VHS creo que no estaba inventado por entonces, y aun así, no creo que el VHS sea capaz de guardar 48 transiciones blanco/negro por línea.

    Como el CD fue un desarrollo conjunto de Sony y Philips, los primeros aprovecharon y colaron esa frecuencia, lo que permitió a muchos estudios sacar la señal digital almacenada de sus másteres directamente en un formato compatible con el CD sin más procesado.

    En cuanto a lo de los 440 Hz... pues tampoco hay nada romántico ni conspiranoico por mucho que a veces esas cosas nos gusten. Aquí hay una pequeña recopilación de cómo hemos llegado a esa frecuencia de afinación:

    http://www.guitarristas.info/foros/historia-oculta-afinacion-moderna-info/242588#post1826540
    5
  • #16 por BlahBlah el 03/07/2016
    #15

    Hasta donde yo sé, se usaban con este fin magnetoscopios Beta (el doméstico, no el Betacam profesional que es otra cosa) y se usaba lo que Sony llamaba "PCM Adaptor" para grabar dicha información.

    Carlos Vaso contó en alguna ocasión que el disco de Azul y Negro llamado "Digital" se llamó así porque el master fue grabado en uno de estos Beta con el adaptador de audio digital.

    Lo que desconozco es si la frecuencia de muestreo de ese Beta se corresponde con los 44.100 y con el mismo sistema al que tú haces referencia, o si Sony usó también U-Matic o C para tal propósito.
  • #17 por BlahBlah el 03/07/2016
    #15

    Añado (no me deja editar ya):

    lo que además no me cuadra es el cálculo que has hecho. Primero, sería un cálculo para guardar sonido monoaural, pese a que sabemos que en esas cintas se grababa estéreo.

    Segundo, ninguno de los formatos citados tenía tanta resolución de líneas.
    El C de 1" eran 300 líneas; el U-Matic y Betacam de alta banda (modelos SP) llegaban hasta las 350 líneas si no recuerdo mal.

    No fue hasta los formatos digitales de los 90 que se llegó a las 480 reales del NTSC (el resto hasta 525 son para Teletexto y otros datos).

    Así que debían meter bastante más de 48 muestras en cada línea para que todo cuadre...
  • #18 por the_can_opener el 03/07/2016
    #15 en cuestiones técnicas no te queda otra que serlo. (prosáico)

    Lo de los números primos es la primera vez que lo leo.
  • #19 por Rosa Mari P. el 04/07/2016
    Dada la contante afluencia de jóvenes, este tipo de datos que debían de ser conocidos (lamentablemente creo que no se enseñan mucho en las escuelas), son muy de agradecer.
    Gracias Pablo.
  • #20 por Julius@Wikter el 04/07/2016
    Probablemente se usasen tantas series de cuadros como pistas se tuviesen que digitalizar y la frecuencia original no fuese 44100, sinó algún múltiple de 2 y 5 (24000, 32000)... no?
    Lo curioso es que todos habéis obviado un factor muy importante en el transporte de datos digitales, que es la corrección de errores de lectura/transmisión y suele usar una fracción importante.
  • #21 por pablofcid el 04/07/2016
    Tenéis razón en que los 44100 ya existían anteriormente para grabación de audio en formatos digitales aprovechando los sistemas de vídeo, más o menos 10 años antes del CD. Pero lo que quería recalcar, porque no se suele ver ni en libros, al menos en castellano, sobre audio o vídeo (tampoco en la wikipedia :-)), es esta curiosidad de lo de los números primos.

    Los 44100 ya se aplicaban en grabación en cintas vídeo con equipos Sony (los adaptadores PCM que habéis citado). El valor resulta de un compromiso con varios requisitos.
    El número de líneas es distinto en NTSC y en PAL, como también lo es el número de cuadros (60 vs 50). Además del total de líneas de cada sistema, no todas eran útiles para contenido, algunas eran marcas de fin de cuadro y otras sincronías.
    Entre pitos y flautas hacían falta unas 3 muestras por línea para poder acomodar una frecuencia de muestreo algo superior al doble de 20 kHz.

    Total, que buscando un número que pudiera tener encaje exacto en ambas formas de codificación (NTSC y PAL), y que permitiera una holgura suficiente en la frecuencia de muestreo para poder permitir filtros antialias en el A/D y filtros de reconstrucción en el D/A que no fueran excesivamente selectivos (lo que los haría más caros y más tendentes a problemas de diferencias de fase), se llegó a ese 44100.

    No fue la única velocidad que se usó para forzar el registro de audio digital dentro de sistemas pensados para vídeo. Como curiosidad, algunos recordaréis que había sistemas a 44056 Hz. de hecho algunos másters registrados en ese formato fueron luego llevados a CD sin corregir a la nueva frecuencia de muestreo con el resultado de que suenan un poco desafinados.
    1
  • #22 por jBetances el 04/07/2016
    #6 Cual? Pasa enlace please!
  • #23 por Angelo Martins el 04/07/2016
    Teorema de Nyquist.

    Todo lo relacionado con los armónicos y la conversión analógica digital (AD / DA).
    un poco de investigación y encontrar todas las explicaciones sobre el "porqué se 44.100kHz.

    Saludos ...
  • #25 por Carlos S el 04/07/2016
    Pues sí. Había unas cuantas impprecisiones en mi post anterior. Lo siento, escribía de memoria. Al parecer no solo se usaban sistemas de frecuencia NTSC, sino también sistemas de frecuencia PAL. Y supongo que eran 3 muestras estéreo por línea (96 bits). Aquí cuentan algo (en un correcto inglés, claro):
    https://en.m.wikipedia.org/wiki/PCM_adaptor

    Lo bueno de este tipo de hilos es que te obligan a buscar información y te hacen revisar cosas que creías que sabías y resulta que había algo más por ahí que se te escapaba.

    Gracias, Pablo.
    3
  • 1
  • 2
  • 3