Microfonos, tipos y utilización práctica.

#1 el 10/01/2003
Publicidad
Navegando en la red encontre esto, espero les sirva a los que empiezan como yo. :D (faltan los graficos)

Micrófonos, tipos y utilizacion practica.



Realmente si hay un punto importante a la hora de estudiar el sonido, es el de su captacion. Normalmente hoy en día la mayoría de los Técnicos dedicados al sonido realizan la mayor parte de su trabajo realizando tomas de sonido, bien sea para grabar un disco, como para un reportaje de noticias, la banda sonora de una película, una actuación en directo, o simplemente para la realización de una biblioteca sonora.
Para poder captar los sonidos que nos rodean en nuestra vida diaria, necesitamos de algún sistema que nos permita transformar las variaciones de presión en el aire (ondas sonoras), en ondas eléctricas, de manera que estas las podamos manipular y almacenar sobre algún soporte bien sea en formato analógico o digital.
Los micrófonos cumplen este cometido. El micrófono es un transductor que nos permite realizar esta conversión entre las variaciones de presión y variaciones de nivel en una corriente electrica. A la hora de estudiar los diferentes tipos de micrófonos, podemos hacerlo, bien sea por su tipo de funcionamiento, o bien por la forma en que recoge el sonido, dado que no presentan la misma sensibilidad en todos los ángulos con respecto a la fuente sonora, forma que se representa por medio de un diagrama polar.
En primer lugar vamos a ver lo que es cada parámetro en relación a un micrófono, y posteriormente veremos los diferentes tipos de funcionamiento y sus aplicaciones practicas.



EL DIAGRAMA POLAR


El diagrama polar de un micrófono refleja la sensibilidad con que es capaz de captar un sonido según el ángulo con que le incida este. para determinar el diagrama polar de un micrófono, se utiliza una cámara anecoica (cámara aislada y que no tiene reverberación) en la que se coloca el micrófono y frente a el una fuente sonora que genera un tono a una frecuencia determinada. Teniendo el micrófono en el eje de 0º sobre la fuente sonora, se mide la tensión de salida del mismo. A esta tensión se le llama "tensión de referencia a 0 dBs" y se toma como tensión de referencia. A continuación se va rotando el micrófono sobre su eje variando el ángulo de incidencia con respecto a la fuente sonora, y se van anotando los valores de tensión que obtenemos en su salida. En el Gráfico 1 podemos ver una muestra mas clara de la forma en se realiza un diagrama polar de un micrófono.



Gráfico 1




Utilizando este sistema hay que repetir la misma operación para diferentes frecuencias y así poder saber el comportamiento que tiene en varias bandas de frecuencias. También se puede realizar el diagrama polar mediante el sistema de espectrometria de retardo de tiempos, donde se realiza una medida de la respuesta en frecuencia del micrófono cada 10º y después se procesa obteniendose los diagramas a las frecuencias deseadas.

Como hemos podido ver el diagrama polar de un micrófono nos da la información necesaria para saber de que forma se va a comportar el micrófono con los sonidos dependiendo de donde le vengan estos. Los diagramas polares se pueden dividir básicamente en tres, el omnidireccional, el bidireccional y el unidirecional (estos a su vez se dividen en cardioides, supercardioides e hipercadioides). Ver Gráfico 2 .
El micrófono unidireccional se puede clasificar como aquel que tiene una mayor sensibilidad a los sonido que el vienen de frente a la cápsula con un ángulo relativamente amplio. Este tipo de diagrama polar, se puede subdividir en tres que son, el cardiode, el supercadioide y el hipercardioide. Cada uno de ellos va presentando un diagrama polar cada vez mas estrecho y por tanto se van haciendo mas insensibles a los sonidos que les llegan desde la parte posterior así como del lateral. Ver Gráfico 2.


Gráfico 2









En el caso del diagrama polar omnidireccional, tal y como su nombre lo indica, este recibe prácticamente con la misma sensibilidad cualquier sonido independientemente del punto donde proceda el mismo, su diagrama es por tanto circular. El bidireccional presenta una gran sensibilidad en el frente, con un ángulo amplio, y una imagen simétrica en la parte posterior, o sea que es menos sensible a los sonido que le llegan desde los laterales y mas sensible a los que le llegan desde el frente y la parte posterior.

Un factor importante es que el micrófono, con un diagrama polar determinado, lo mantenga los mas igualado posible en todas las frecuencias, dado que si no, se presentan coloraciones en el sonido debido al acercamiento o separación desde o hacia la fuente sonora. Si tenemos unos diagramas polares uniformes para diferentes frecuencias, sabremos que la respuesta en frecuencia del micrófono no variara en exceso según los ángulos de incidencia del sonido.
Una vez visto lo que es el diagrama polar del micrófono y los diferentes tipos que hay, vamos a ver para que podemos utilizar cada uno de ellos.


Los micrófonos omnidireccionales son recomendables cuando se necesite alguno o varios de los siguientes usos:

- Captacion del sonido en todas las direcciones.
- Captacion de reverberaciones en locales, camaras etc.
- Exclusión máxima del ruido mecánico generado por viento etc.
- Respuesta amplia en las frecuencias mas bajas, sobre todo con micrófonos de condensador.

Los micrófonos direccionales (Cardioides, SuperCardioides e HipoerCardioides) los usaremos en los siguientes casos:

- Rechazar al máximo la acústica que tenga el recinto donde se realiza la toma.
- Rechazar el ruido de fondo.
- Utilizar técnicas especiales de grabación con parejas de micrófonos (estéreo coincidente)
- Captacion de sonidos lejanos.










LA SENSIBILIDAD



La sensibilidad de un micrófono es la relación entre la tensión de salida obtenida en el mismo y la tensión de referencia que provoca dicha salida en el micrófono. Normalmente se mide en decibelios referenciados a 1 voltio con una presión de 1 dina/cm2 y la señal de referencia usada es un tono de 1000 Hz a 74 dB SPL.
Como es lógico cuanto mayor sea la sensibilidad de un micrófono, mejor.
La sensibilidad del micrófono no influye en su calidad sonora, ni en su respuesta en frecuencia, únicamente es importante a la hora de su uso ya que un micrófono de baja sensibilidad nos fuerza, al utilizar un preamplificador para el micrófono, a utilizar un nivel mayor de ganancia de entrada para dicho micrófono, aumentando de esta manera el ruido de fondo que produce la electrónica de los preamplificadores.
Para las mismas condiciones si tenemos un micrófono con una sensibilidad mayor, necesitaremos menos ganancia en la entrada del preamplificador con lo que reduciremos el nivel de ruido de fondo.
Puede parecer que esto no tiene excesiva importancia, y puede que no la tenga cuando únicamente se utiliza un micrófono y lo que se trata de grabar o amplificar no es muy importante.
Sin embargo cuando se utilizan muchos micrófonos, caso muy típico en grabaciones y actuaciones en directo, el nivel de ruido de fondo producido en cada canal se va sumando y el resultado puede ser realmente problemático, sobre todo cuando grabamos en soporte digital.



RUIDO PROPIO

El ruido propio de un micrófono es el que produce cuando no hay ninguna señal externa que excite el micrófono. Esta medida se realiza normalmente en una cámara anecoica y se especifica como una medida de presión sonora y por tanto en dB SPL, equivalente a una fuente sonora que hubiese generado la misma tensión de salida que el ruido producido por el micrófono.
El nivel indicado en dB SPL se especifican con la ponderación A incluida, de forma que se adapta a la curva de nuestro oído ajustando las frecuencias mas graves y mas agudas.
Se puede considerar como excelente un nivel de ruido de 20 dBA SPL, como valor bueno sobre unos 30 dBA SPL, y como malo 40 dBA SPL.
A la hora de comparar varios micrófonos es importante tener en cuenta este valor de ruido propio. Cuanto menos ruido tengamos mejor. Hay que acordase que después, e la practica no usaremos un micrófono solo, usaremos varios y los niveles de ruido se van sumando.



RELACION SEÑAL/RUIDO (S/R)

La relación señal ruido (S/R) representa realmente la diferencia entre el nivel SPL y el ruido propio del micrófono. Cuanto mayor sea la SPL y menor el ruido mejor será la relación señal ruido, y por contra si el nivel de SPL es menor y el ruido propio aumenta, la relación será menor y por tanto peor.
Cuanto mayor sea la relación señal ruido mejor.
Nos indica que porcentaje de la señal SPL esta por encima del ruido de fondo. Si tenemos una SPL de 100 dB y un ruido propio en el micrófono de 30 dB, la relación señal/ruido será de 70 dB.
Para una seña de 100 dB una relación señal/ruido de 80 dB es muy buena y 70 dB es buena.



RESPUESTA DE FRECUENCIAS.

La respuesta en frecuencia de un micrófono indica la sensibilidad del mismo a cada frecuencia. Como hemos visto al principio al hablar de los diagramas polares, los micrófonos no tienen la misma sensibilidad para cada ángulo de incidencia ni para cada frecuencia, por tanto es difícil conseguir una respuesta uniforme en todo el espectro.
Como es lógico hay que observar que la longitud de un sonido influye o tiene una relación en el comportamiento del diafragma según la relación de tamaño que haya entre ambos.
Con todos los micrófonos se entrega una hoja con la curva de respuesta en frecuencia del micrófono, teniendo en un eje (x) la frecuencia de 20 Hz a 20 Khz y en el otro eje (y) los decibelios.Ver Grafico 3.
Como es lógico depende lo que deseemos grabar buscaremos el micrófono que sea mas plano en la zona del espectro que estemos tratando de grabar.





Grafico 3










LA IMPEDANCIA

La impedancia en un micrófono es la propiedad de limitar el paso de la corriente, como ya sabemos se mide en Ohmios. Normalmente en los micrófonos se mide sobre una frecuencia de 1Khz y en micrófonos de baja impedancia, esta, suele valer 200 Ohmios.
Los micrófonos mas habituales son los de baja impedancia, considerados hasta unos 600 Ohmios. También existen los de alta impedancia que suelen tener un valor tipo de 3000 Ohmios y mas.
La diferencia entre uno y otro radica en que a la hora de conectar un cable para unirlo a la mesa de mezclas o al amplificador, los de baja impedancia al oponer poca resistencia a la corriente que circula, permiten utilizar cables de longitud muy grande mientras que los de alta impedancia al restringir de forma mayor el paso de la corriente, solo se pueden usar con cables de corta distancia.
Hoy en día prácticamente nadie usa micrófonos de alta impedancia salvo en gamas muy baratas de precio o en casos específicos.



CLASIFICACIÓN DE LOS MICRÓFONOS SEGÚN SU TRANSDUCTOR.



BOBINA MÓVIL

Son los llamados normalmente como "dinámicos". Estos micrófonos consisten en un diafragma de plástico "mylar", unido a una bobina que se desplaza dentro de un campo magnético creado por un imán polarizado. Cuando la membrana se mueve como consecuencia de la presión del aire sobre ella, la bobina que es solidaria se mueve también dentro del campo magnético y produce una corriente que es proporcional al desplazamiento de la membrana.
Este tipo de micrófono es muy utilizado dada su robustez y que no necesita alimentación externa para su funcionamiento.
Por contra su sensibilidad y linealidad de respuesta no es tan buena como en otros tipos de micrófonos como ahora veremos.
Hay micrófonos de bobina móvil que utilizan dos membranas, una en la parte frontal y otra en la parte posterior, ambas señales se separan mediante un divisor de frecuencias. De esta forma se consigue mejorar mucho la respuesta en frecuencia del microfono.



DE CINTA.

En este sistema se utiliza una cinta metálica muy ligera que esta expuesta a las ondas sonoras tanto por delante como por detrás. Dicha cinta se halla montada dentro de un campo magnético permanente creado por un imán.
Cuando la cinta vibra como consecuencia de las presiones de las ondas sonoras, se crea una corriente que similar a la velocidad de desplazamiento de dichas ondas sonoras, por esto a veces se les llama también micrófonos de velocidad.
Su diagrama polar suele ser bidireccional aunque se pueden conseguir cardioides también. Su respuesta en frecuencia es muy buena. Únicamente hay que señalar que son muy sensibles a los golpes y malos tratos por lo que únicamente se utilizan en estudio y con buen trato.



ELECTROSTÁTICOS O DE CONDENSADOR.

Los micrófonos electrostáticos utilizan otro tipo de transductor basado en el funcionamiento de un condensador.
Para ello utilizan dos membranas, una fija, la posterior, y otra separada de la primera por una capa de aire que es la que se mueve cuando le inciden las ondas sonoras. El condensador que forman ambas placas aisladas por el aire se alimenta con una tensión externa al micrófono llamada alimentación Phantom o fantasma. Cuando la membrana superior se desplaza como consecuencia de las ondas sonoras, la distancia entre ambas placas varia y por tanto varia también la capacidad del supuesto condensador, al variar esta, también varia la tensión se circula por el. Para poder aprovechar estas variaciones de tensión se necesita montar un preamplifiador junto a la cápsula de forma que por una parte adapte la impedancia, dado que la del condensador es muy alta, y por otra el nivel de la señal para poder ser útil. El preamplificador también hace uso de la alimentación externa para poder funcionar.
Hay micrófonos electrostáticos que tienen un diafragma plástico con una carga permanente y que por ello no necesitan alimentación externa para funcionar, sin embargo el preamplificador que sigue siendo necesario siq ue los necesita. Esto a veces se resuelve con una pequeña pila incluida en el mismo micrófono, así se evitan utilizar la alimentación Phantom o Fantasma.
Al no tener que cargar con la bobina el diafragma de estos micrófono es mucho mas sensible y por tanto son capaces de recoger sonidos muy tenues sin ningún problema.
Son micrófonos de excelente calidad y únicamente hay que tener en cuenca que la humedad puede dejar gotas de rocío sobre lamembrana y generar un ruido tipo a fritura que se ira cuando desaparezca toda la humedad.
En un principio, antiguamente, para realizar la electrónica del preamplicador y de la fuente de alimentación se utilizaban lamparas, ya que no había transistores ni mucho menos circuitos integrados. Por ello ambas, alimentación y preamplificador eran muy voluminosas y tenían los inconvenientes ya conocidos de la utilización de las lamparas. Sin embargo tenían un sonido muy especial que aun hoy en día se busca y por ello existen modelos hoy en día a lamparas, aunque su precio suele ser elevado, su calidad sonora es muy "especial" registran el sonido de una forma mas "cálida".



UTILIZACIÓN PRACTICA DE LOS MICRÓFONOS.



En primer lugar debo señalar que este apartado es meramente orientativo. Cada técnico de sonido debe realizar sus pruebas para cada instrumento, probando diferentes micrófonos y sobre todo diferentes colocaciones de este frente al instrumento que se debe grabar. Las salas influyen de forma considerable en la grabación, y donde un micrófono nos ha ido muy bien es posible que para el mismo instrumento en otra sala diferente no nos suene también. Así que lo dicho, probar.



EL PIANO.

El piano es un instrumento que tiene un registro muy amplio, tiene notas muy graves y notas muy agudas. Por ello es muy recomendable la utilización de al menos dos micrófonos, una para las cuerdas graves y otro para las cuerdas medias/agudas.
La colocación de los micrófonos es muy importante dependiendo el tipo de sonido que deseamos conseguir si acercamos el micrófono de los medios/agudos excesivamente a la zona de los martillos, conseguiremos un sonido mas brillante y percusivo, sonido mas utilizado normalmente en música moderan. Si por el contrario deseamos un sonido mas natural, separando los micrófonos del arpa del instrumento conseguiremos un sonido con mas armónicos de la caja y con menos agresividad resultando mas natura. En esta posición el sonido de la sala influye de forma importante.
Los micrófonos deberán estar separados entre si para poder conseguir la separación de frecuencias a captar cada uno.
Micrófonos: U87, U89 y TLM170 de Neumann - C451, C300, C414 AKG - 4006 y 4004 Brüel&Kjaer - SM-81 y SM91 Shure

CUERDAS.

Dentro de las cuerdas debemos de notar que los violes generan un sonido mas agudo y mas directivo que las violas y estas mas que los chelos y estos mas que los contrabajos. Por tanto no hay que tratarlos por igual aunque aquí los veamos de forma generica.
Siempre hay que dejar una distancia suficiente entre el micrófono y el instrumento para poder recoger los armónicos que generan las cajas de estos, en las cuerdas es muy importante.
Micrófonos: D222, D12 AKG - MKH 40,60, MD-421, 431, 441 Senheisser - 4004 Brüel&Kjaer - 451, 300 y C-3000 AKG.



VIENTOS.

Se necesitan micrófonos que tengan algún sistema de atenuación dado que los vientos generan presiones relativamente elevadas y pueden llegar a saturar el micrófono. también se debe buscar micrófonos con buenas repuestas no tanto en graves si no en las zonas de medios agudos.
En la colocación hay que tener cuidad de que no recojamos el sonido generado por las llaves al tocar el músico.
Micrófonos: D22, D224 AKG - U 87 Neumann - MD 421, 431 441 Senheisser -RE20 Electro Voice.



BATERIA ACUSTICA.

La batería acústica cambia mucho si la vamos a grabar en un estudio o si la vamos a sonorizar para una actuación en directo, por lo que dependiendo de los medios que dispongas en cada caso hay que elegir unos u otro micrófonos.

- Bombo. El bombo genera el sonido mas grave de la batería y ademas el que mas presión acústica, por lo que necesitamos un micrófono con un diafragma grande para que aguante bien la presión generada y con una respuesta en graves lo mejor posible. La colocaion también influye mucho. Yo normalmente lo meto dentro, entre los dos parches, si lo acercas mucho al parche delantero oirás la pegada de la maza sobre el parche, tendrás un sonido mas definido, pero con menos peso en la zona grave. Si lo retiras demasiado te ocurrirá lo contrario ademas de recoger sonidos no deseados del escenario.
Micrófonos: D112 AKG - MD-421 Senheisser - M91 Shure.



- Caja . Una gran parte del sonido de la caja lo da el bordonero de esta (la cinta metálica que se sujeta sobre el parche inferior). Por ello hay técnicos que utilizan dos micrófonos para la caja, uno para el parche superior, y otro para el inferior con el bordon. Esto, a ala hora de mezclar presenta algunos problemas con la fase de ambos micrófonos. Yo personalmente siempre uso un único micrófono para el parche superior. En directo el micrófono debe estar los mas próximo al parche y los mas separado del charles .
Micrófonos: SM-57 BETA-57 SM-98 Shure - MD-441 Senheisser.

- Timbales. Los timbales no suelen presentar muchos problemas por lo que normalmente se toman con el MD 421 de Senheisser o con SM-57 de Shure.

- Platos y Charles. Para estos usaremos micrófonos eléctricos, para el charles es recomendable uno mas cerrado que para los platos de forma que no cojamos en exceso el sonido de la caja por este micrófono.
Micrófonos: 451 + CK1 o CK3 , Serie 300 AKG - SM81 Shure. - MD 441 Senheisser - RE-20 Electro Voice.



VOCES.

Las voces son a veces difíciles de tomar y varían mucho entre un cantante y otro, la sala en la que se realiza la toma etc. Es importante en estudio interponer entre el micrófono y el cantante una pantalla filtro que elimine los "pos" y siseos de la voz. En directo interesa mas un micrófono dinámico que no presente tanta facilidad a la realimentacion como los eléctricos aun a consta de perder algo de calidad.
Micrófonos: Shure SM-58 BETA-58, SM-57 BETA-57 SM5 - U87 U457 Neummann - C-422, C-414- C12, Tube AKG -
Subir
#2 el 11/01/2003
Tá muy bien! :)
Yo si lo llego a saber, no me hacía con la cantidad de libros y apuntes que tengo sobre eso y mucho más...Mola internet y navegar por que te encuentras con cosillas como eso y o esta página 8)

Abures y a continuar con tu aprendizaje, que no se debería frenar nunca.
Subir
#3 el 12/01/2003
Un tutorial acojonante, de utilidad para muchos, estoy seguro...
Ya que lo encontraste en la red, no podrías pasarnos la dirección de Internet y así vamos a la fuente y cargamos los gráficos???

Gracias de nuevo.

Viajerosonico
Subir
#4 el 12/01/2003
Con todo gusto aqui esta la direccion, aunque creo que no hay mucho, Claro HISPASONIC es la # 1. http://personal.redestb.es/azpiroz/curso2.htm
Subir
#5 el 12/01/2003
En formato pdf

http://roble.pntic.mec.es/~ddoncel/Acus ... ica_II.pdf


Un mini curso completo :lol:


http://roble.pntic.mec.es/~ddoncel/download.html


Un poco mas gracias a la marca AUDIX:


http://www.eaudio.com.mx/assets/manuales/microf.pdf


Y a se que me paso, pero para los entendidos ahi VA: 8)

http://www.atvs.diac.upm.es/publicaciones/docs/Gon99d.pdf


En esta contribución, presentaremos un esquema basado en el procesado por separado de las componentes de fase mínima y paso todo de las señales de entrada al array, obteniendo de este modo una reducción significativa de la reverberación presente en la señal grabada, junto a un esquema de postfiltrado Wiener que nos permite cancelar los efectos tanto del ruido difuso, debido fundamentalmente a la reverberación, y del ruido coherente debido a las fuentes de ruido presentes en el recinto. Para demostrar la efectividad de este algoritmo, presentaremos resultados reales sobre señales multicanal grabadas en presencia de ruido y reverberación con los algoritmos descritos anteriormente. 1. INTRODUCCIÓN La adquisición de señal de voz en presencia de ruido y reverberación es un campo de gran interés, donde el objetivo es lograr establecer comunicaciones "manos-libres" entre el hablante y el sistema receptor. Para aprovechar las características espaciales del campo acústico generado por el hablante, se han venido usando desde hace tiempo los arrays (o cadenas) de micrófonos [1][2][3] para realizar un filtrado espacial de la señal, de forma que apuntamos el haz directivo de recepción a la dirección estimada del locutor, mejorando por tanto en recepción la relación entre señal directa y señal reverberante.
--------------------------------------------------------------------------------
Page 2
Sin embargo, esta mejora sólo se hace apreciable para grandes cantidades de micrófonos, y además se encuentra limitada por la presencia de reverberación en el recinto. Con el objetivo de reducir el ruido remanente debido al campo difuso que se introduce en el sistema, se han propuesto diversas estructuras basadas en la realización de un filtrado de Wiener posterior a la etapa de conformación de haz [4]. Nuevamente, esta estructura reduce fuertemente el ruido difuso presente a la entrada del array, pero no es capaz de cancelar fuentes de ruido que lleguen al array con alto grado de coherencia espacial (fuentes próximas y/ó muy sonoras), lo que puede resolverse mediante estimación de dichas componentes en ausencia de la señal de voz mediante un detector automático de actividad hablada, y su inclusión en el postfiltro modificado de Wiener [5], como ya presentaron los autores en [6]. La novedad que presentamos en este trabajo es la posibilidad de juntar en un único sistema la capacidad de reducción tanto de ruido coherente como difuso recién expuesta, con la extraordinaria capacidad de reducir la reverberación presente en la señal grabada en un recinto mediante el procesado por separado de las componentes de fase mínima y paso todo de las señales de entrada al array [7][8], las cuales se ven afectadas de forma muy diferente por la reverberación existente en el recinto. 2. COMPONENTES FASE-MÍNIMA Y PASO-TODO DE LA RESPUESTA IMPULSIVA DE UN RECINTO Solemos representar H(w), transformada de Fourier (FFT) de la respuesta al impulso del recinto h(n) entre el transmisor y el receptor en un recinto reverberante, en la forma módulo-fase, es decir: []H wH wj w( )( ) exp( )=fNosotros, sin embargo, representaremos H(w) factorizada en sus componentes fase-mínima y paso-todo: H wHw HwminAll( )( )( )=donde Hwmin( )y HwAll( )son respectivamente, las componentes fase-mínima y paso-todo de H(w). Se dice que una señal es de fase-mínima cuando su Transformada-Z(TZ) no contiene ningún polo o cero fuera del circulo unidad en el dominio Z. Las señales fase-mínima son especialmente interesantes ya que su señal inversa es causal y estable. Por desgracia, las respuestas al impulso de los recintos no son, por lo general, de fase-mínima ya que poseen ceros fuera del circulo unidad [10], quedando estos ceros representados en la componente paso-todo. La componente fase-mínima, Hwmin( ), puede expresarse de la forma siguiente: []HwH wjwminmin( )( ) exp( )=fVemos cómo Hwmin( )depende sólo de la magnitud de H(w) y no de su fase. La información sobre la fase de H(w) está totalmente contenida en la componente paso-todo, HwAll( ), que puede obtenerse sencillamente dividiendo H(w) por Hwmin( ): []{}H wj wwAllmin( ) exp( )( )=-ffdonde podemos comprobar cómo la componente paso-todo sólo tiene término de fase, es decir, tiene módulo unidad.
--------------------------------------------------------------------------------
Page 3
Si observamos en la figura 1el aspecto que tienen las componentes fase mínima y paso todo correspondientes a una función de transferencia entre dos puntos de un recinto, podemos extraer dos importantes conclusiones: * La componente fase-mínima se ve mucho menos afectada por la reverberación que la componente paso­todo e incluso que la respuesta impulsiva original. Así, toda la información correspondiente a la señal original se conserva en la componente fase-mínima de la señal recibida. * La componente paso-todo conserva intacta la información relativa al retardo de la señal directa y por tanto de la localización de la fuente emisora. Figura 1.-Representación temporal de la respuesta impulsiva entre dos puntos de un recinto, y sus componentes fase-mínima y paso-todo. 3. IMPLEMENTACIÓN DEL ALGORITMO El sistema completo de procesado en array que hemos utilizado está compuesto por las siguientes tres etapas situadas en cascada: i. Conformación robusta de haz: para lograr el apuntamiento del haz de banda ancha del array, debemos ser capaces de estimar correctamente los retardos entre canales adyacentes en presencia de reverberación. En este trabajo, esta estimación robusta se consigue haciendo uso de la fase del espectro cruzado de potencia, como se describe en [9][11]. ii. Descomposición y procesado en componentes fase-mínima y paso-todo: partiendo de la apreciación de que el cepstrum complejo de la señal de voz se encuentra concentrado en las bajas quefrencies, y que la información de los ecos se encuentra bastante separada sobre este eje, se realiza la descomposición de las señales de entrada al array en sus componentes de fase mínima y paso todo, utilizando un procesado diferente para cada una de dichas componentes [8]: ¸ Procesado fase-mínima: la componente de fase mínima, directamente relacionada con el cepstrum real, se ve afectada en pequeña medida por la reverberación. De este modo, en cada una de las componentes de fase mínima del array, se encontrará la misma información de señal y una información característica de la función de transferencia 05 0 01 0 0 01 5 0 02 0 0 002468 x 1 0-3F u n c i ó n d e t r a n s f e r e n c i a d e l r e c i n t o05 0 01 0 0 01 5 0 02 0 0 0-5051 01 5x 1 0-3C o m p o n e n t e d e f a s e m í n i m a05 0 01 0 0 01 5 0 02 0 0 000 . 20 . 4m u e s t r a sC o m p o n e n t e p a s o t o d o
--------------------------------------------------------------------------------
Page 4
entre la fuente y cada uno de los micrófonos, que cambia canal a canal. Así, el procesado propuesto consiste en realizar un promediado espacial de las mismas, de forma que la información de señal se ve realzada. Además, este procesado es equivalente a un promediado geométrico en el plano Z, por lo que se conserva la propiedad de secuencia de fase mínima (ceros y polos dentro de la circunferencia unidad). Este promediado es seguido de un proceso de lifteringpaso bajo que selecciona únicamente la parte de señal, concentrada en la parte de bajas quefrencies, eliminando componentes debidas a la reverberación. ¸ Procesado paso-todo: en las componentes paso todo se conserva totalmente la información de fase de cada uno de los canales, y por tanto la información de posición de la fuente, de forma que lo que se realiza es un proceso de filtrado espacial mediante suma en frecuencia de cada una de las componentes. La señal resultante no es paso todo, por lo que nos quedamos únicamente con la componente paso todo de la señal resultante para combinarla con la componente fase mínima recién calculada. iii. Post-filtrado modificado de Wiener: con el objetivo de reducir el ruido residual que permanece en la señal de voz resultante del proceso anterior, se diseña un filtro óptimo a la salida del `de-reverberador', basado en la teoría de filtrado óptimo de Wiener. Así, si suponemos que las componentes de ruido, debido a la separación entre micrófonos, se encuentran incorreladas entre sí, podemos utilizar un filtro como el que se muestra en [4]. Sin embargo, y como se demuestra en [6], existen componente correladas de ruido, debidas tanto a la separación espacial de los micrófonos [12], como a fuentes de ruido próximas ó muy sonoras, y que al ser consideradas componentes coherentes, atravesarán el filtro sin problema al suponer éste que toda componente coherente entre micrófonos es debida a señal deseada. Para evitar este problema, en [5] se hace uso de un detector de actividad hablada, para estimar en ausencia de voz las componentes coherentes de ruido y poder así incluirlas en el filtro según: Hf kf kff kLBFx xn nx x( , )( , ) $ ( )( , )=-ggg11 21 22Con el objetivo de obtener una mejora aún mayor, los autores proponen en [6] el uso de un filtro basado en coherencia: Cf kf kf kf kx xx xx xx xi ji ji ji j( , )( , )( , )( , )=gggen las subbandas de baja coherencia espacial, de forma que usamos finalmente:( )( )( )( )akfCkfHTCifkfHkfHTCifmmmLBFmm,,,,=4. BASE DE DATOS DE EVALUACIÓN Para este trabajo, hemos usado una base de datos multicanal real grabada por T.M. Sullivan y R.M. Stern en la Universidad de Carnegie Mellon (Pittsburg, PA., USA). Esta base de datos está formada por grabaciones simultáneas tanto de voz limpia, grabada mediante un micrófono de alta calidad montado sobre la cabeza del hablante, como de la voz recogida por un array de micrófonos a una cierta distancia del locutor, con lo que obtenemos una referencia exacta de los efectos introducidos por la propagación de la señal de voz por el recinto. Esta base de datos, muestreada a 16 kHz y con 16 bits por muestra, contiene diferentes subcorpora: * arrA: 10 locutores varones hablando a una distancia de 1 metro desde el centro de un array de 8 elementos espaciados linealmente 7 centímetros, grabado en un laboratorio ruidoso debido fundamentalmente a múltiples ordenadores y equipos encendidos.
--------------------------------------------------------------------------------
Page 5
Los 6 subcorpora restantes fueron grabados por el mismo locutor con un array de 15 elementos espaciados de forma que se disponga de tres subarrays intercalados de 7 elementos cada uno, con espaciamientos lineales respectivos de N, 2N y 4N centímetros, como podemos ver en la figura siguiente: Figura 2.-Disposición del array de micrófonos con espaciamientos de N, 2N y 4N para cada subarray de 7 micrófonos. * arr3A: mismo laboratorio ruidoso anterior, con espaciamiento mínimo (N) de 3 cm., y con el locutor sentado a 1 metro (d=1 m.) del centro del array. * arr4A: laboratorio ruidoso, N=4 cm., d=1 m. * arrC1A: grabado en una sala de reuniones, más grande que el laboratorio ruidoso pero mucho más tranquilo, N=4 cm. y d=1m. * arrC3A: misma sala anterior, N=4 cm., pero ahora d=3 m. * arrCR1A: misma sala anterior, N=4 cm., d=1 m., pero incluyendo junto a la voz del locutor una señal de voz interferente procedente de una emisora de radio AM, llegando al array aproximadamente a 45º de su eje. * arrCR3A: igual que el anterior, pero con d=3 m. Para este trabajo, hemos usado únicamente los subcorpus arr4(laboratorio ruidoso) y arrC1A/arrC3A(sala de reuniones, d=1m./3m.). Así, para el espaciado mínimo elegido de N=4 cm., cada uno de los subarrays de 4N, 2N y N cubrirán las subbandas de 0-1 kHz, 1-2 kHz y 2-8 kHz respectivamente. 5. EXPERIMENTOS Y RESULTADOS Para la evaluación del algoritmo propuesto, se han realizado pruebas con todos los ficheros de los subcorpus arr4A, arrC1Ay arrC3Ade la base de datos CMU. Por limitaciones de espacio, no podemos exponer aquí tanto los resultados objetivos (distancia LAR, mejora en SNR) como subjetivos (tests perceptuales) que se encuentran publicados en [9], y mostramos únicamente un ejemplo de los espectrogramas de la señal de entrada a uno de los micrófonos del array, con gran cantidad de ruido y reverberación, y la señal a la salida tras procesar las señales de entrada al array con la estructura propuesta: Figura 3.- Espectrogramas de entrada (voz con ruido y reverberación) y de salida. 1 2 3 5 4 6 13 7 8 10 9 11 12 15 14 T i m eFrequency00.511.522.53x 1 0400.51T i m eFrequency00.511.522.53x 1 0400.51t (seg.) t (seg.) f (kHz) f (kHz) 004884
--------------------------------------------------------------------------------
Page 6
6. CONCLUSIONES En este trabajo hemos presentado una estructura de procesado en array capaz de reducir de forma apreciable tanto la reverberación, mediante el procesado separado de las componentes fase-mínima y paso-todo de las señales de entrada, como el ruido residual, ya sea éste de naturaleza difusa (debido a la reverberación) o coherente (debido a fuentes de ruido). Los resultados, tanto objetivos como subjetivos, obtenidos sobre ficheros multicanal reales grabados en recintos con dirferentes características acústicas, son excelentes, especialmente en la compleja tarea de reducción de la reverberación. Debemos destacar que en estos momentos nos encontramos realizando la implementación en tiempo real de estos algoritmos en un ordenador personal tipo PC mediante una tarjeta de adquisición multicanal de alta velocidad de transferencia y una tarjeta de procesado de señal (DSP) de última generación. AGRADECIMIENTOS Los autores quieren expresar su especial agradecimiento a Dña. Mª Teresa Chamorro Calvo, por el excelente trabajo desarrollado durante la realización de su proyecto fín de carrera en el diseño y evaluación de sistemas de procesado en array de micrófonos. 7. REFERENCIAS BIBLIOGRÁFICAS [1]J.L. Flanagan et al., "Computer Steered Microphone Arrays for Sound Transduction in Large Rooms", J. Acoust. Soc. Am., vol. 78 (5), Noviembre 1985. [2]J.L. Flanagan, A.C. Surendran and E.E. Jan, "Spatially Selective Sound Capture for Speech and Audio Processing", Speech Communication, vol. 13, pp. 207-222, 1993. [3]J. González Rodríguez and J. Ortega García, "Robust Speaker Recognition through Acoustic Array Processing and Spectral Normalization", Proc. of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP'97), vol. 2, pp. 1103-1106, Munich, Alemania, Abril 1997. [4]R. Zelinski, "A Microphone Array with Adaptive Postfiltering for Noise Reduction in Reverberant Rooms", Proc. IEEE Intl. Conf. Acoust. Speech and Signal Proc. (ICASSP'88), pp. 2578-2581, 1988. [5]R. Le Bouquin et al., "Enhancement of Speech Degraded by Coherent and Incoherent Noise Using a Cross-Spectral Estimator", IEEE Trans. on Speech and Audio Processing, vol. 5, No. 5, pp. 484-487, Septiembre 1997. [6]J. González Rodríguez et al., "Coherence-based Subband Decompositon for Robust Speech and Speaker Recognition in Noisy and Reverberant Rooms", Proc. of the International Conference on Spoken Language Processing (ICSLP'98), pp. 385-388, Sydney, 1998. [7]M. Tohyama, The Nature and Technology of Acoustic Space, apdo. 6.3, Academic Press, 1995. [8]Q.G. Liu, B. Champagne and P. Kabal, "A Microphone Array Processing Technique for Speech Enhancement in a Reverberant Space", Speech Communication, vol. 18, pp. 317-334, 1996. [9]Mª T. Chamorro Calvo, Implementación y evaluación de sistemas de procesado en array para señal de voz, Proyecto Fín de Carrera, SSR-ETSIT-UPM, Madrid, Junio 1999. [10]S.T. Neely and J.B. Allen, "Invertibility of a room impulse response", Journal of the Acoustical Society of America, vol. 66 (1), pp. 165-169, Julio 1979. [11]M. Omologo and P. Svaizer, "Use of the Cross-Power Spectrum Phase in Acoustic Event Localization", IEEE Trans. on Speech and Audio Processing, vol. 5, No. 3, pp. 288-292, Septiembre 1997. [12]F. Jacobsen and T.G. Nielsen, "Spatial Correlation and Coherence in a Reverberant Sound Field", Journal of Sound and Vibration, vol. 118 (1), pp. 175-180, 1987.
Subir
#6 el 22/04/2014
Zack23 me ayudaste un montón posteando ese 'manual', porque yo soy un novato en este tema y me aclaró muchas cosas.
Estoy empezando a utilizar una loopeadora (la Boss RC-30) y querría pediros consejo sobre qué micro me recomendáis.
No utilizo tanto la voz como instrumentos de percusión, flautas, sonajas...
He visto que en este vídeo: https://www.youtube.com/watch?v=7HJqtGEp1kM el tipo utiliza un Rode NT2A. ¿Qué tal es? Me valdría alguno algo más económico sin que se notase mucho la diferencia?

Muchas gracias amigos!!
Subir
Respuesta rápida
Identíficate o regístrate para poder responder en este hilo.