Sonido e imagen

Desarrollan un micrófono visual en el MIT

Un grupo de investigadores del Massachusetts Institute of Technology, con la ayuda de Microsoft y Adobe, ha creado un sistema que convierte cualquier objeto en un micrófono. La base es un algoritmo que transforma en datos las pequeñas vibraciones que causa el sonido sobre los objetos.

El pilar de la investigación son unas cámaras especiales que registran 5000 frames por segundo y son capaces de detectar detalles imperceptibles para el ojo humano. Por ejemplo: si una de estas cámaras apunta a un vaso, y hay una canción sonando en la estancia, las leves vibraciones del vaso quedarían registradas, y luego podrían convertirse de nuevo en la música que sonaba.

Micrófono MIT

Lógicamente, el sonido que se consigue con esta técnica está lejos de la calidad del original. Pero en una de las pruebas que han realizado, se recuperó una canción que luego fue identificada por Shazam. Este trabajo puede llevarnos, a medio plazo, a saber qué suena en un vídeo del que no conservamos el audio.

El equipo ya ha hecho pruebas con grabaciones realizadas con un teléfono inteligente y han conseguido acceder a cierta información. Aquí va un vídeo donde se pueden ver —y escuchar— algunas de sus pruebas:

 

Más información | The Visual Microphone

Calros
EL AUTOR

Me dedico al periodismo, vivo en Galicia y lo que más me interesa es hablar de las nuevas formas de pagar, manipular y relacionarse con la música que han traído Internet y las facilidades para acceder a cierta tecnología.

¿Te gustó este artículo?
10
Comentarios
  • 1
  • 2
  • #1 por Malve el 05/08/2014
    Esta técnica la utilizaban en una película en la que un súper ordenador "leía" una conversación por las vibraciones de un vaso de agua que había sobre una mesa. Yo pensé: "Sí, claro, y qué más".

    Pues hale.
    6
  • #2 por CumbiaLenta el 05/08/2014
    A ver si entiendo... Filman con una cámara sin micrófono y, al ver los micro movimientos de los objetos, un software o hardware convierte esa imagen en el sonido que había en la habitación?
  • #3 por Poeta el 05/08/2014
    mas juguetes para las agencias de espionaje, nos van a leer hasta el pensamiento...

    para los James bond low cost..
    4
  • #4 por mataliebres el 05/08/2014
    si, y voy yo y me lo creo
  • MOD
    #5 por Teo Tormo el 05/08/2014
    #1 el caso es que también recuerdo eso de una película reciente y no recuerdo de cual... Podría ser Trascendencia?
    1
  • #6 por Mister Carrington el 05/08/2014
    Los trabajos anteriores partían del análisis de un láser y las interferencias de las ondas de presión. Esto tiene buena pinta y desde luego que asustan sus posibilidades.
    1
  • #7 por Milinko el 05/08/2014
    #5 Stealth, amenaza invisible
  • #8 por Malve el 05/08/2014
    #5

    Yo lo vi en 'Eagle Eye' ('La conspiración del pánico' en España).

    Del 2008 con Shia Labeouf y la deliciosa Michelle Monaghan.

    No sé si será la misma que dices tú.

    P.D.: Puede que en lugar de un vaso de agua fuese una taza de café, pero vamos, es anecdótico.
  • #9 por BlahBlah el 06/08/2014
    Cierto. Yo en la peli pensé que, aunque científicamente tuviese sentido, era una exageración por la precisión necesaria.

    Parece que una vez más la ficción se adelantó a la realidad.
  • #10 por Malve el 06/08/2014
    #9

    Claro, yo pensé lo mismo. Lo que a mí me parecía una exageración era que la voz, en una conversación a un volumen normal, modulase el líquido lo suficiente como para que pudiera ser reconocible. Pues parece ser que sí que es posible.

    Manda eggs.
  • #11 por Noraz el 06/08/2014
    Eso no es relativamente nuevo. Adobe puede convertir el audio en imagen (la típica visualización del espectro).

    Con esa camara se convierte toda oscilación a un espectro visual y luego lo reproduces. De hecho hay artistas que han usado imágenes en canciones ( aunque no es común creo).

    En si lo que me resulta realmente interesante es que se desarrollara y cualquier cámara convencional podrá en un futuro captar esas micro vibraciones. Al margen de usarlo como un nuevo shazam puede ser realmente interesante en cuanto al diseño y trabajo con sonidos.
  • #12 por Malve el 06/08/2014
    #11

    ¿Cualquier cámara convencional 5000 trames por segundo?

    Me da que eso vamos a tardar en verlo. Si es que lo llegamos a ver en cámaras comerciales para el gran público.
    1
  • #13 por Noraz el 06/08/2014
    Como tu dices si. Tardaremos un tiempo. Pero la tecnología avanza. Y la idea puede que se desarrolle en un futuro y no se requiera 5000 frames.

    Esto, clado esta es una suposición mía. De hacerse, como dije sera en un futuro.

    Pero vamos, tienes razón, es algo descabellado.
  • #14 por Atilio el 06/08/2014
    Leo Theremin desarrollo algo similar hace un siglo casi. En el documental sobre Theremin lo explica
  • #15 por undercore el 06/08/2014
    yo recuerdo algo parecido de un programa de hace ya unos 15 o 20 años (¿qué apostamos?), en uno de los programas un tipo era capaz de adivinar que canción de su colección estaba sonando simplemente viendo el titileo de la llama de una vela provocada por la vibración de la música.
  • #16 por DeLoreal el 06/08/2014
    Dicen que la realidad supera la ficción, y es cierto... ayer vi Alien y cuando termino, yo aun seguía "aquí" :-D
    1
  • #17 por sapristico el 06/08/2014
    Jajjajajjajaja...la aportación de undercore se lleva la copa y la liga!!

    "Quiáaaah...tanta chorraera con esos del MIT...mi cuñao er Jose Luis, con la punta el velorio, y la radio a transistores del agüelo te clava si suena el dúo cromodinámico o Bety Misiego en espacio de Minkowski"

    A mí con algún tipo de interferómetro modificado para percibir desplazamientos vibratorios de la luz, o un láser de interferencias...me podía parecer asumible...pero con cámaras.. aunque sean de 5000 fps (que es escala de tiempo y no amplitud ni frecuencia de lo retratado)...suena más scifi. Eso sí, sigo pensando que sólo va a funcionar bajo determinadas condiciones...no cualquier sonido produce vibraciones detectables sobre cualquier objeto.
  • #18 por fanfan el 06/08/2014
    "a medio plazo, a saber qué suena en un vídeo del que no conservamos el audio."

    claro, las cámaras del futuro grabarán a 5000 fotogramas por segundo pero no tendrán micrófono

    el iPhone 5S graba a 120fps así que para que llegue a casa falta un poco,

    eso sí, como experimento para echarte unas risas mola, pero... ¿cuanto costará una de esas cámaras 5000fps?
    1
  • #19 por BlahBlah el 06/08/2014
    #18 Eso es cierto, no se podrá usar esta técnica con grabaciones de imagen antiguas como dice la noticia, porque si están, pongamos a 24 fps, sólo habría información de audio con una resolución de 24fps, que aplicando Nyquist nos da la mitad en el caso más ideal (cómo mucho se podría capturar una onda de 12 Hz, y además un video antiguo no tendría esa resolución como para detectar esas vibraciones).

    De ser posible (que aún tengo cierto escepticismo) lo sería sólo con imágenes captadas por esta cámara pero nunca de grabaciones de video o cine convencionales.
  • #20 por Mister Carrington el 06/08/2014
    Quizás otro aspecto interesante del invento, y repito más preocupante, es que con las técnicas anteriores había que echar mano de elementos activos como los láseres; pero ahora la cámara es pasiva y "no se nota". (¡Glups!)

    Respecto del tema de las cámaras que graben a alta velocidad es cuestión de tres años o cuatro años. Ya hay algunas cámaras domésticas de vídeo que graban hasta 500 imágenes por segundo con calidad pobre. Pensad en el último teléfono-cámara de Sony: Calidad 4K, sumergible... ¿Alguien pensaba en esto hace sólo tres años?
    1
  • #21 por Malve el 06/08/2014
    #20

    "¿Alguien pensaba en esto hace sólo tres años?"


    No tiene nada que ver una tecnología de consumo con una tecnología profesional.

    La tecnología de consumo está enfocada al gran público y siempre tiene mucha demanda, así que los costes se abaratan rápido.

    La gente de calle (en su mayoría) no necesita ni quiere una cámara que grabe a 5.000 frames por segundo, y a los fabricantes les iba a costar convencerles de ello.

    Además, no es una cuestión aritmética. De esos 500 frames de los que hablas a los 5000, hay una diferencia tecnológica enorme.
    1
  • #22 por Raimon Aranyó Camprodon el 06/08/2014
    El analisis del interlineado en los videos oferece la possibilidad de sacar mucha informacion en video en fps mucho mas bajos que 3000 , a ver si atendemos mejor al video. Cheers
    1
  • #23 por BlahBlah el 06/08/2014
    A mí no me salen las cuentas de algunos detalles que salen en el video...
  • #24 por Creati el 06/08/2014
    También sirve para avisar cuando se acerca un dinosaurio
    giphy.gif
    4
  • #25 por Luis Iturbe el 06/08/2014
    Nada que no supiera la CIA desde hace décadas. Jjajajaja!
  • 1
  • 2