Grabación

Review de Xtrax Stems: separando en tres pistas una mezcla ya realizada

19/12/2017 por Pablo Fernández-Cid | 8 min de lectura

7

Veredicto

La magia sólo sigue estando en los teatros. No se trata de una separación perfecta pero sí, en muchas ocasiones, perfectamente válida para un buen número de utilidades. Para separar específicamente voz y estando dispuesto a lidiar con algunos controles más, Trax y Trax Pro podrían tener mayor interés. Pero si te interesa la separación fácil y a tres que ofrece Xtrax Stems, no hay mucho más donde mirar.

Pros

La separación es todo lo eficaz que puede pedirse a una estrategia ciega y automática, sin aprendizaje ni guía de ningún tipo.
Uso extremadamente sencillo, sin necesidad de ajustes.
No es voz+resto, sino voz+batería+resto
No es ‘center cancel/isolation’, es mucho más elaborado.
La exportación a ficheros individuales permite seguir editando con otras herramientas y con contornos de automatización o aplicación de efectos.

Contras

Los resultados no son mágicos, como era de esperar
No eres ‘dueño’ al 100% de la aplicación, actúa de cliente hacia los servicios de separación ‘en línea’ de Audionamix
Sólo para Mac OS (10.11 – 10.13) [edito 20-dic-2017, sobre versión Windows: están en ello y me dicen que si alguno queréis hacer de beta tester contactéis -mirad comentario #12-]

En este artículo...

Qué es Xtrax Stems
En uso
Resultados
Valoración
- Pros
- Contras

Qué es Xtrax Stems

[Índice]

Aislar partes de una mezcla ya realizada no es nada fácil. La separación de fuentes en audio es todo un campo de investigación en el que los avances son lentos por lo descomunal de la tarea, a veces irresoluble. La separación ‘ciega’, sin contar con ninguna pista sobre el contenido (como podría serlo una partitura, o un modelo de las características de la voz buscada, etc.) hace todo aún más difícil. Y ese es el reto que enfrenta Xtrax Stems (99 dólares USA), nuevo producto de Audionamix que ya son viejos conocidos en estas lides através de Trax y Trax Pro, enfocados a separar la señal de voz desde una grabación de un arreglo completo.

Con Xtrax Stems se generan tres pistas (voz, batería y el resto) de forma totalmente automatizada. Sin poder esperar la perfección en tan ardua tarea, no deja de ser bien útil. Una descomposición reversible: la mezcla de las tres pistas a los niveles de referencia devuelve la señal original. Pero el interés proviene de las posibilidades de realizar retoques en los balances de nivel y panorámica, así como producir finalmente tres ficheros estéreo en descomposición del original.

Xtrax Stems

audionamix.com

En uso

[Índice]

Desde luego se ha buscado en Xtrax Stem reducir al mínimo la complejidad de uso: no hay ninguna. No se requiere ningún ajuste. Basta cargar un fichero audio (mono o stereo de hasta 96 kHz y 32 bits) y aplicar cualquiera de las 4 estrategias de separación que ofrece.

En el vídeo veréis al comienzo cómo se usa. Una vez instalado, al lanzar Xtrax Stems abre su ventana, sorprendentemente sencilla. Arrastrando un archivo audio comenzará la transmisión hacia Audionamix… Sí, eso es algo no precisamente esperado: el procesamiento no es en local sino haciendo uso vía Internet de los servicios de Audionamix. Chocante en un producto que se compra no tener la posibilidad de uso autónomo, pero este desarrollador ha recurrido al procesamiento en sus propios cuarteles en otros productos orientados a la separación (los citados Trax y Trax Pro), así que es marca de la casa. En este caso, lo que se ‘compra’, hay que entenderlo así, más que la aplicación completa, es la posibilidad de usar los servicios de descomposición de Audionamix a través de esta aplicación como enlace con sus servidores.

Una vez enviado el fichero, podremos pulsar los botones de aquella/s formas de separación que queramos aplicar (hay 4 disponibles). Todas ellas tienden para la pista de voz a seleccionar una sola línea (por ejemplo en voz principal + segunda voz, atenderán a la protagonista, dejando la otra en la pista ‘music’).

Automatic: busca y separa señal de voz (a veces toma por tal otras cuando hay silencios de voz)
Automatic HQ: una estrategia ligeramente diferente, que recomiendan aplicar sólo si automatic ha ofrecido una identificación ya buena de la voz
Generic: en este caso el modelo se abre para atender una señal protagonista que no sea específicamente de voz, dando cabida a alguna intervención solista con otro instrumento melódico.
Generic HQ: de Nuevo aplica una estretagia ligeramente diferente para intentar mejorar una separación que ya sea razonablemente exitosa.

El tiempo de espera suele ser largo mientras el fichero se envía y se procesa y se recuperan los resultados hacia nuestra máquina. He tenido la sensación de que ese tiempo es variable, lo que hablaría de una posible dependencia de la carga que esté atendiendo el servidor. Pero en todo caso no se trata de una aplicación que vayamos a usar nunca en directo y estamos hablando de unos minutos. Como resultado dispondremos de las tres pistas estéreo para ‘drums’, ‘music’ y ‘vocals’.

La comparación entre el audio original (pulsando ‘Source’) y las 4 separaciones es fácil porque todas permanecen cargadas en su interfaz una vez se han ejecutado. Las 3 pistas estéreo de cada una de las estrategias que hayamos aplicado pueden ser exportadas a nuevos ficheros para usarlos según nuestras necesidades. También podemos usar funciones de solo/mute y controles básicos de mezcla (volumen y panorámica) para preparar versiones alteradas.

Resultados

[Índice]

En el vídeo veréis algunos resultados, aplicándolo a 4 temas bien diferentes entre sí. Los resultados son destacables, y aunque siempre dejan mostrar restos de unos y otros contenidos en cada una de las pistas, se abren varias posibilidades.

Desde luego hay una fuerte dependencia con el tipo de arreglo y producción de la que partamos, que los distintos ejemplos del vídeo reflejan. No son ejemplos buscados por sus buenos resultados, sino 4 elegidos ‘a priori’. La decisión de qué temas iba a procesar estaba tomada antes de abrir Xtrax Stems, y basada en tener temas muy diferentes. El primero tiene un arreglo y una producción sencillo y limpio, con abundancia de sonidos cortos. El segundo tiene ya en el original una voz fuertemente procesada y no natural por un ‘exceso’ de chorus/phaser muy propio de los 80 y un arreglo denso con mucho relleno/pegamento a base de pads. El tercero gira hacia lo acústico y minimalista, con un jazz de voz, guitarra y una batería limitada al mínimo con bombo y frotado sobre la caja con escobillas que genera ese ruido de fondo habitual a este tipo de jazz intimista y que a algunos puede recordar al sonido de un disco de vinilo gastado. El cuarto pone en aprietos a cualquier técnica de este tipo con abundancia de ecos y reverb en muchos de los planos que componen la canción, voz incluida, y abundancia de sonidos atmosféricos y de colas largas.

Los resultados, lógicamente, varían mucho entre esas diferentes señales de prueba. Cuando existe una voz clara y fuerte lógicamente hay más éxito. La presencia de señales que compiten en nivel y en color/timbre con la voz puede hacer que Xtrax Stems bascule entre ellas, pero es pedir peras al olmo. Aún así, cuando hay claramente una voz principal y una secundaria, acostumbra a acertar y enfocar su atención sobre la auténtica principal, dejando esos 'coros' en la pista 'music'. Por parecido argumento, reverberación y ecos intensos son fáciles generadores de problemas.

La extracción de la pista de batería, que es terriblemente difícil tanto en cuanto a evitar restos de otras señales en ella como en evitar que algo de batería se cuele en las demás, me ha sorprendido. Ciertamente esas contaminaciones cruzadas están ahí, pero las esperaba a mayores niveles.

En conjunto se ofrece una vía para acercarnos a un imposible, que ya es mucho, y con la que se pueden acometer varias tareas de forma útil, pese a los posibles artefactos.

Preparar versiones ‘minus one’ para poder crear bases sin la voz, realizar versiones batería+voz que sirvan para guía al ensayar las partes de piano o guitarra, facilitar la escucha con menos elementos a la hora de transcribir una canción… Esas son utilidades posibles en las que no es fácil encontrar competencia que combine esta facilidad de uso con cierta calidad en los resultados.

Usando sus propios controles de mezcla permite reforzar o rebajar un poco el nivel de la voz y o la batería si eso nos encaja mejor con el uso previsto. Puede también sernos útil para corregir alguna grabación en la necesitemos recentrar la voz porque aparezca desplazada en panorámica.

Exponer ‘en crudo’ los resultados de cada una de las pistas resultantes por separado revela sin duda las dificultades de este tipo de tarea. Pero en combinación con otros contenidos, como puede ser un nuevo arropamiento musical, o una remezcla, o para realizar fusión entre dos temas con algo que no sea un simple crossfade, son las más de las veces usables.

Valoración

[Índice]

Si quieres magia, me temo que sólo sigue estando en los teatros. No se trata de una separación perfecta pero sí, en muchas ocasiones, perfectamente válida para un buen número de utilidades. Para separar específicamente voz y estando dispuesto a lidiar con algunos controles más, Trax y Trax Pro podrían tener mayor interés. Pero si te interesa la separación fácil y a tres que ofrece Xtrax Stems, no hay mucho más donde mirar.

Pros

[Índice]

La separación es todo lo eficaz que puede pedirse a una estrategia ciega y automática, sin aprendizaje ni guía de ningún tipo.
Uso extremadamente sencillo, sin necesidad de ajustes.
No es voz+resto, sino voz+batería+resto
No es ‘center cancel/isolation’, es mucho más elaborado.
La exportación a ficheros individuales permite seguir editando con otras herramientas y con contornos de automatización o aplicación de efectos.

Contras

[Índice]

Los resultados no son mágicos, como era de esperar
No eres ‘dueño’ al 100% de la aplicación, actúa de cliente hacia los servicios de separación ‘en línea’ de Audionamix
Sólo para Mac OS (10.11 – 10.13) [edito 20-dic-2017, sobre versión Windows: están en ello y me dicen que si alguno queréis hacer de beta tester contactéis -mirad comentario #12-]

Más información | audionamix.com

EL AUTOR

Pablo Fernández-Cid

Pablo no puede callar cuando se habla de tecnologías audio/música. Doctor en teleco. Ha creado diversos dispositivos hard y soft y realizado programaciones para músicos y audiovisuales. Toca ocasionalmente en grupo por Madrid (teclados, claro).

¿Te gustó este artículo?

8