Grabación

Fase: la cara oculta del audio (II)

12/02/2013 por Pablo Fernández-Cid | 18 min de lectura

En este artículo...

La compensación del retardo
Compensación del retardo medio
Compensación de la distorsión temporal
Sistemas ‘en paralelo’
Los sistemas multibanda
Ejemplo: EQ gráfico
Filtros de fase lineal: evitando la distorsión temporal
Enmascaramiento temporal y filtros de fase lineal
Para ponerlo en práctica
Una curiosidad: el filtro de fase lineal ‘casero’
Cierre de la serie, que no del tema

Comenzaremos esta segunda parte con algunas opciones para compensación del retardo. Consideraremos las situaciones que se dan con efectos ‘en envío’ (en lugar de en inserción) y en los sistemas multibanda. Describiremos la utilidad y los problemas de los filtros de fase lineal. Sugeriré algunas herramientas para que podáis poner en práctica estas ideas (y de paso os ofreceré un pequeño truco que os hará gracia).

Quedarán para ocasión posterior los filtros paso todo, que se emplean (entre otras cosas) para jugar con la fase con carácter correctivo o creativo.

Cerramos así esta mini-serie en dos partes dedicada a la fase (que iniciamos aquí) y podremos abordar otros temas no menos interesantes (¡eso espero!) en las próximas semanas.

La compensación del retardo

Cualquier sistema introduce retardo. Ya veíamos en la primera parte como ningún filtro opera de forma instantánea, sino con cierta latencia. Además veíamos que esa latencia no es idéntica para todas las frecuencias (siendo notablemente mayor cerca de las frecuencias de corte o allí donde el filtro tiene mayor pendiente en la respuesta en amplitud, allí donde es más selectivo).

Como consecuencia tenemos que distinguir con claridad dos cuestiones: el retardo ‘medio’ y la ‘distorsión temporal’ (diferencias de retardo entre unas y otras frecuencias). Recuperemos una figura del anterior artículo:

Vemos (línea azul) un retardo medio en la banda de paso que se sitúa entorno a las 4 muestras, pero vemos también que en realidad el retardo se mueve entre 3 y 11 muestras. No hay razón para no acometer la compensación del retardo medio (esas 4 muestras). Desgraciadamente, tratar de corregir la distorsión temporal (los diferentes retrasos en cada frecuencia alrededor de el valor medio, que oscilan en el ejemplo entre 3 y 11) es tremendamente difícil (tanto como lo es retirar una reverberación ya grabada).

Hablemos de ambas cuestiones.

Compensación del retardo medio

La compensación del retardo medio consiste en ‘adelantar’ el audio en el valor correspondiente al retardo esperado en el tratamiento, para volverlo a lo que debería ser su posición correcta/deseable en el tiempo. Lo de ‘adelantar’, lógicamente, sólo es posible cuando hablamos de material grabado (en vivo no podemos anticipar lo que aún no ha sucedido). En algunas situaciones en vivo lo que podremos hacer es retrasar artificialmente los canales ‘rápidos’ para que todos estén sincronizados con el más lento (un truco bien conocido en las grabaciones multimicrofónicas para conseguir la mejor combinación de señales, o al preparar una mezcla).

Pensemos primero en sistemas software (tipo ‘plugin’). Cada vez más, ofrecen opciones de ‘compensación’ del retardo. Uno de los valores que el plugin comunica al DAW es su retardo de procesamiento. El DAW puede usar este valor para realizar una compensación automática (leyendo los ficheros de audio necesarios con el adelanto preciso). No todos los plug-ins informan a su DAW del valor de retardo. En los que sí lo hacen solemos tener la opción de activar o no la compensación. Si la lectura adelantada no es posible, el DAW puede retrasar el resto de los canales.

P.ej. podéis leer al respecto en esta página del manual de Logic (es idéntico en otros).

Pese a todo conviene estar atentos. Muchos plugins (y algunas DAWs -especialmente en versiones reducidas, LE y semejantes-) no hacen uso de esta capacidad. E incluso en las que lo hacen a menudo sólo se toma en cuenta el retardo debido a la ejecución del código. Una cosa es lo que tarda en ejecutarse el código en el procesador y otra la latencia propia del filtrado (por ejemplo, el valor de ‘latencia’ de un filtro paramétrico, que dependerá muchísimo del ajuste de sus parámetros -como el Q-).

¿Qué podemos hacer cuando usamos plug-ins que no ofrecen opción de compensación del retardo? ¿O cuando la compensación es insuficiente, porque deja fuera esa ‘latencia’ inherente al filtrado, que además varía según los ajustes? ¿O cuando estamos aplicando sistemas hardware externos –digitales o analógicos- en vez de plugins?

En todos esos casos nos toca realizar el realineamiento de las pistas ‘a ojo’ o ‘a oreja’. Podemos grabar el resultado procesado de cada pista y dedicar un tiempo a realinear el audio visualmente aprovechando los parámetros de pista en el DAW (adelantar un poco las pistas afectadas -o retrasar las demás-). Es a menudo más rápido realizar la compensación de esta forma que abrir los ficheros audio para insertar/retirar muestras.

Otra opción interesante puede ser la de usar plug-ins (que existen en el mercado) pensados sólo para realizar la función de atrasar/adelantar el audio de la pista (por ejemplo).

Insertando uno de esos plug-ins en la o las pistas que más lo necesiten, tendremos una forma cómoda de realizar el realineamiento. En este caso el adelantamiento o retraso puede realizarse no sólo en muestras enteras sino también por fracción de muestras (estos plug-ins cuentan con filtros interpoladores que pueden calcular el valor intermedio entre dos muestras).

En definitiva, puede ser más o menos trabajoso, pero la compensación del retardo ‘medio’ (que es normalmente la más importante y necesaria) es factible. Nos falta atender la distorsión temporal.

Compensación de la distorsión temporal

Cuando el material audio es especialmente crítico frente a la distorsión temporal (audio de marcado carácter impulsivo) puede hacerse evidente dicha distorsión en una escucha atenta ('burbujas' y 'láseres' mencionados en el artículo anterior).

Generalmente lo único que cabe en la práctica es modificar el tratamiento (escogiendo otro filtro, variando los ajustes, etc.), o como mucho introducir algún filtro paso-todo (de los que hablaremos en otra ocasión) para compensar la banda que esté sujeta a un mayor desplazamiento temporal respecto a la media.

Pero existe una opción mucho más ‘garantizada’ y completa: aplicar filtros de tipo ‘fase lineal’ (en ellos el retardo es idéntico para cualquier frecuencia y por tanto están exentos de distorsión temporal -será suficiente compensar el retardo medio-). Hablamos más adelante de ellos, sus pros y posibles contras.

Sistemas ‘en paralelo’

En el primer artículo planteábamos el estudio sobre casos en los que tenemos el sistema o filtro insertado ‘en serie’ dentro de la cadena audio (como inserción). Reflexionaremos ahora sobre sistemas que (a conciencia o no) aplicamos ‘en paralelo’, y que son por ello semejantes (en sus problemas) a las bien conocidas situaciones ‘multicamino’ en acústica.

Se dan estas situaciones multicamino, por ejemplo, cuando se aplican varios micrófonos en la captura del sonido o cuando se tiene amplificación distribuida. La variedad de caminos implica retardos diferentes, y las señales audio llegarán a la mezcla (en el caso de los micros) o al oído del público (otro ‘mezclador’) desfasadas en el tiempo. Según el valor de ese desfase algunas frecuencias resultarán rebajadas, otras ampliadas, y se desvirtuará (a veces de forma muy significativa) la calidad del sonido.En definitiva un problema que tiene origen en una cuestión de desfases, se acaba manifestando como modificaciones de la respuesta en amplitud, con picos y valles, cuando las señales se combinan.

Pero no son esas situaciones (ya muy estudiadas y conocidas) las que vamos a tratar aquí. Tal como hicimos en el primer artículo, queremos reflexionar sobre cómo nos afecta la fase a la hora de procesar audio dentro nuestros magníficos e inmaculados estudios.

Cualquier arquitectura ‘en paralelo’ (como un EQ gráfico, o la mera mezcla del sonido original y el sonido ‘con efecto’ que tan a menudo realizamos) acaba sumando diferentes versiones procesadas de la señal de entrada. Los desfases variables en cada una de ellas dan lugar en la combinación a cancelaciones y realces que afectan de forma difícil de predecir, y sobre los que tenemos que saber interpretar y actuar cuando sea necesario.

Los sistemas multibanda

Es frecuente (yo de hecho soy muy partidario) el realizar tratamientos mutibanda. Ahora que tenemos arsenales de equipos y de plugins a nuestro alcance deseamos mejorar el tratamiento actuando separadamente y con ajustes específicos en cada banda (a menudo 3 o 4, a veces más).

Si las señales en cada canal fueran realmente independientes, al combinarlas cada una de ellas habría seguido un camino diferente y habría posibles desplazamientos temporales entre una y otra banda. Es decir, retardos distintos para cada frecuencia. Eso nos llevaría a las situaciones ya descritas en la primera parte del artículo: deberíamos estar atentos en la escucha por si se producen ‘burbujeos’ o ‘láseres’ en los ataques.

Pero además, siendo realistas, esas bandas no son nunca perfectamente independientes, los crossovers y los bancos de filtros nunca son perfectos. Las bandas laterales suelen ser amplias y como resultado habrá contribuciones de varios canales para una misma frecuencia. Y cada una de esas contribuciones llevará un retardo diferente.

La figura muestra una banda y sus dos adyacentes. Además del solapamiento de las respuestas en amplitud (en fondo gris y línea roja) apreciamos como cada contribución llega con un retardo diferente (línea y fondo azul).

Estamos por tanto en una situación equiparable al ‘multicamino’ (de hecho un patrón multicamino diferente para cada frecuencia), y que conllevará desajustes inesperados de nivel (que si son importantes podremos escuchar y deberemos tratar de corregir, variando las decisiones de tratamiento).

Ejemplo: EQ gráfico

Lo ilustraremos pensando en un sistema multibanda que todos conocemos bien: un EQ gráfico, de 15 o de 30 bandas. Si paso una señal por el EQ puesto 'plano' (todas las bandas a 0dB) espero que salga la misma señal (quizá con un poco más de ruido, etc.), ¿verdad? Nada más lejos de la realidad en un buen número de EQs. El culpable, nuevamente la fase.

Cualquier tono que entre al ecualizador acabará saliendo por más de una banda del banco de filtros (son filtros ‘suaves’ y con un amplio solapamiento. En el artículo anterior mencionábamos que el retardo de un filtro depende principalmente de cómo sea de selectivo. Afortunadamente, los EQ gráficos usan bandas de tipo Q-constante. En esencia todas las bandas del EQ son por ello de una selectividad parecida (y de un retardo medio parecido por tanto).

Pero pese al Q constante tampoco es cierto que se llegue a un tratamiento totalmente 'neutro'. Ya hemos visto en la figura que hay variaciones en cada canal en torno al retardo medio. En nuestro EQ gráfico las componentes de audio que caigan el centro de cada banda saldrán velozmente, pero las que estén 'a los lados' de la campana de ecualización (en las zonas de transición entre canales) saldrán algo más retrasadas. Y cuanto más finas y selectivas sean las bandas tanto mayores serán los retardos medios y los desequilibrios dentro de la propia banda de paso del filtro.

Como cada frecuencia del audio saldrá en realidad por varios canales, al final se combinan varias versiones de esa misma componente pero con diferentes retrasos.

Como ejemplo podéis ver este vídeo, que seguramente sorprenda a más de uno (está en inglés, pero el comentario que realizo a continuación os permitirá seguirlo):

El vídeo muestra dos EQs gráficos diferentes que reciben un tono de 1KHz. En el EQ más ‘convencional’ se modifica de forma importante el nivel de ese tono a la salida incluso cuando se actúa sobre bandas alejadas de 1KHz. Mover el control de 5KHz acaba afectando a las señales que están en la banda de 1KHz. Y se debe a que el canal de 5KHz deja pasar un poco de la señal de 1KHz pero desfasada. Cuando esa señal desfasaada se combina con la salida del canal de 1KHz, el nivel de la señal de 1KHz se verá afectado. La reconstrucción de la señal (en un buen número de EQs gráficos) dista de ser perfecta.

El problema (tal como muestra el vídeo) desaparece cuando se aplica un EQ con filtros de tipo fase lineal.

Filtros de fase lineal: evitando la distorsión temporal

Con estos antecedentes podemos todos tener mucho interés en conocer qué son los filtros de fase lineal, que parecen facilitar el que los ajustes que realicemos en cada banda realmente se apliquen tal como los definamos, sin introducir descompensaciones. Sin entrar en excesivos detalles, un filtro de fase lineal tiene un retardo de grupo exactamente igual para todas las frecuencias. Como ya mencionamos en el primer artículo, el retardo de grupo establece el ‘tiempo’ que gasta cada frecuencia en atravesar el filtro.

Hablar de ‘fase lineal’ por tanto es la forma matemática de decir ‘retardo idéntico para cualquier frecuencia’. En definitiva, un filtro de fase lineal es un filtro que no introduce desfases relativos entre unas frecuencias y otras. Trata todas con estrictamente el mismo retardo.Parecería por tanto la piedra filosofal: para evitar problemas de desfase basta usar filtros de fase lineal. Veamos los pros y contras.

Con cualquier diseño convencional de filtro (Butterworth, Chebychev, elípticos, y un largo etc. de diseños que se usan habitualmente, ya sea aislados o combinados en un banco de filtros como el de un EQ gráfico) cada vez que realzamos o rebajamos la ganancia de unas frecuencias respecto a otras estamos también introduciendo diferencias en el tiempo de respuesta del filtro para cada frecuencia. Por contra, un filtro de fase lineal permite ajustar la ganancia con la tranquilidad de saber que no vamos a desfasar entre sí las diferentes frecuencias: si entran síncronas, saldrán síncronas. Es decir evitará los sonidos de ‘burbuja’ y de ‘rayo láser’, permitirá un proceso límpio y cristalino sobre sonidos que tengan transitorios muy destacados, sin desdibujar, colorear ni debilitar su marcado carácter impulsivo.

“¡Mañana vendo en Mercasonic todos mis EQs y filtros y me compro de estos!” parece que querríamos decir más de uno (por cierto: el de la figura es gratuito). Pero no es todo miel sobre ojuelas.

Hay dos problemas: uno de carácter tecnológico (y por tanto superable –y de hecho superado ya-) y otro de carácter esencial (y por tanto insoslayable, tenemos que ‘tragar’ con él).

Un filtro de fase lineal tiene mayor complejidad interna (para una misma respuesta en amplitud) que los otros diseños más tradicionales. La complejidad en sistemas analógicos no puede ser excesivamente grande, no sólo porque significa más componentes, más precio, más consumo, etc. sino porque en las soluciones analógicas cada nuevo componente añadido contribuye también su propio ruido y otros problemas. En un sistema analógico la complejidad actúa en contra de la calidad. En el dominio digital 2+2 siempre son cuatro (mientras en analógico 2Voltios+2Voltios siempre son 4Voltios más algo de ruido y un poco de distorsión). Ese problema de ‘incompatibilidad tecnológica con la complejidad’ sólo sucede en la tecnología analógica y por tanto a día de hoy está solucionado. Si buscáis en Internet ‘filtro audio de fase lineal’ veréis referencias y productos digitales. Por tanto salvo para los ‘anclados’ (sí, yo tomo partido a favor de lo digital) en el mundo analógico, esto no es un freno.
La otra cuestión no puede superarse con ninguna tecnología: para poder realizar un retardo idéntico a cualquier frecuencia, el filtro de fase lineal lo que hace (por expresarlo de algún modo) es ‘retrasar’ las frecuencias que podrían adelantarse y así las realinea con las demás. El resultado es que el retardo que ofrece un filtro de fase lineal es grande, comparativamente muy grande. Eso pasa con los filtros de fase lineal sea cual sea su realización (analógica, digital o lo que venga dentro de unos años). Es física que no podemos saltarnos.

Ese retardo pronunciado actúa como ‘latencia’: introducimos señal y será filtrada de forma nítida y purísima, pero el resultado lo oiremos pasados unos cuantos milisegundos. Impensable por tanto para procesado en tiempo real.

No pidáis por tanto que un filtro de los que lleva un sintetizador o un músico en vivo sea de fase lineal. No puede ser (ni hoy ni dentro de 100 años). Sin embargo acudid a cualquier centro postproducción o ‘mastering’ y muy posiblemente tengan en su arsenal dispositivos (plug-ins o racks digitales) de tipo fase lineal.

En mezcla multipista, y si no hubiera opciones de compensación del retardo (ya mencionadas) podremos procesar pista a pista y ‘congelar’ efectos, con lo que no hay razón para no usarlos. Hacéis el tratamiento, que queda registrado (y puede ser compensado), y a partir de ahí continuáis con la mezcla. Con la tranquilidad de saber que no existirá distorsión temporal.

Enmascaramiento temporal y filtros de fase lineal

Otra cuestión que conviene conocer en relación con los filtros de fase lineal (y que a veces puede resultar problemática y a veces no, en función del tipo de material sonoro que estemos tratando) es la siguiente:

Al igual que la cola reverberante extiende un sonido, cualquier filtro siempre ‘alarga’ (muy ligeramente) la duración de los eventos sonoros. La forma en la que los filtros habituales producen ese alargamiento es como ‘cola’ esto es, ‘detrás’ del original. Sin embargo los filtros de fase lineal reparten esa ampliación al 50% delante y detrás.

Estamos hablando de colas generalmente muy cortas y la llegada del impulso real hace que el breve pre-eco pase desapercibido (hay un fenómeno de enmascaramiento temporal, no oímos el pre-eco si el original –mucho más fuerte en nivel- está suficientemente próximo). Pero cuando la actuación del filtrado sea muy severa (muy selectiva) esas colas se alargan. Puede llegar un momento en el que el efecto de ‘pre-eco’ (con duración mitad del total) que cause un filtro de fase lineal pase a ser demasiado llamativo en comparación con el efecto de ‘post-eco’ (y duración completa) de un filtro tradicional. Esto es así porque los fenómenos de enmascaramiento temporal se producen principalmente ‘hacia delante’: el impulso fuerte nos impide (enmascara) oír lo que viene detrás. El fenómeno a la inversa (enmascarar lo que precede al impulso) es menos eficaz y sólo funciona si el pre-eco no es demasiado extenso.

Conocer estas evidencias psicoacústicas nos ayudará a decidir cuándo aplicar o no unas técnicas u otras, a estar atentos a los posibles impactos de su aplicación, y a cambiar de decisión cuando veamos que el uso de un filtrado de fase lineal nos está defraudando en sus resultados. Puede perfectamente tener sentido en casos de filtrado extremo acudir a filtros más tradicionales en detrimento de los de fase lineal.

Por tanto, filtros de fase lineal: a menudo excelentes para tratamiento de señales críticas por su carácter impulsivo, pero no pueden ser aplicados para tratamiento en tiempo real por tener una latencia inherente apreciable.Adecuados por tanto para procesos no en tiempo real o tolerantes a latencia como ‘mastering’, mezcla no en vivo, o diseño sonoro y de librerías. Y como siempre, pendientes de la escucha de los resultados (por si se evidencian fenómenos de pre-eco que nos lleven a escoger otros sistemas de tratamiento más tradicional).

Para ponerlo en práctica

Una lista los filtros y EQs de fase lineal existentes en el mercado sería extensísima, pues quien más quien menos todos los desarrolladores quieren ofrecer esa posibilidad. Buscad en Internet “linear phase audio filter plug in” (o bien comentad con respuestas al artículo vuestras experiencias al respecto -me encantará leerlas-). Sólo para que podáis empezar a probar ya mismo, encontraréis ampliamente comentados varios en esta página.

Como es lógico, muchos dispositivos multibanda ofrecen también soluciones fase lineal para el diseño del cross-over (p.ej. un compresor multibanda con diseño ‘fase lineal’ del banco de filtros).

Una curiosidad: el filtro de fase lineal ‘casero’

Como curiosidad contaré una forma de convertir cualquier filtro que tengáis en un filtro de fase lineal (demostrable matemáticamente):

Tomáis una señal ‘A’ (un fichero audio cualquiera) y la filtráis obteniendo ‘B’. Invertís ‘B’ en el tiempo (para que suene ‘hacia atrás’) y lo volvéis a filtrar con el mismo filtro anterior obteniendo ‘C’. Ahora invertís ‘C’ obteniendo ‘D’ (para que vuelva a sonar ‘hacia delante’).

¿Qué es ‘D’? una versión de ‘A’ que ha sido filtrada doblemente (si el filtro era de 12 dB/octava, en ‘D’ el filtro resultante equivale a 24dB/octava) pero en la que está garantizado que el retardo de grupo es igual para todas las frecuencias (es decir, equivale a haber usado un filtro de fase lineal de doble orden). Tampoco es tan difícil de entender: lo que en la primera pasada se retrasa en la segunda se adelanta, y por tanto se compensa exactamente. Eso sí, dejad suficiente silencio antes y después del audio a tratar (para que ‘quepan’ las colas del filtrado).

Ahora ya no hay excusa: vuestro filtro o EQ favorito puede aplicarse en versión ‘fase lineal’. Incluso si es analógico: grabáis el resultado de filtrar, dais la vuelta a la grabación, filtráis de nuevo, volvéis a darle la vuelta, y ¡listo!. ¿Divertido, verdad?

Cierre de la serie, que no del tema

Podríamos (y podremos en el futuro) continuar por la línea iniciada en estos dos artículos (por ejemplo nos ha quedado sin tratar la cuestión de los filtros paso-todo), pero también es bueno que cambiemos un poco de temática. Así que el próximo artículo abordará un área bien diferente.

Fase

Pablo Fernández-Cid

EL AUTOR

Pablo Fernández-Cid

Pablo no puede callar cuando se habla de tecnologías audio/música. Doctor en teleco. Ha creado diversos dispositivos hard y soft y realizado programaciones para músicos y audiovisuales. Toca ocasionalmente en grupo por Madrid (teclados, claro).

¿Te gustó este artículo?

62

-20%

Moog Messenger

749 €

Ver oferta
-13%

Steinberg UR24C

199 €

Ver oferta
-31%

Behringer X-Touch Compact

222 €

Ver oferta

Regístrate o identifícate para poder comentar