Sintetizadores

PPG Phonem, el sintetizador cantante

Dentro de una semana llegará PPG Phonem, un nuevo sintetizador de la mano (más bien del cerebro, no deja de ser soft) de Wolfgang Palm. Un plugin con un modelo de síntesis centrado en 12 resonadores configurables y nacido de la intención de crear un sintetizador cantante.

La página web oficial ya incluye información, aunque no todavía demostraciones audio/vídeo que se esperan en breve. Sí se conoce el precio, que será de 119€.

Este nuevo plugin (VST y AU, para Win y OSX) marca claramente su concepto desde su nombre: Phonem. Orientado su diseño hacia la creación de un sintetizador con capacidad para recrear la voz humana y realizar canto, las herramientas que contiene abundan en recursos para ese objetivo. Pero el modelo que aporta puede extenderse fuera de los rangos propios de ese ámbito y servir otros propósitos de creación y manipulación de sonidos.

Hay un sistema de entrada de texto que facilita una primera conversión a parámetros que 'canten' lo escrito, y sobre la que luego podemos editar para terminar de impartir los giros y detalles necesarios para mejorar la credibilidad si es ese nuestro objetivo, o bien para deformar al extremo el resultado. Se anuncia que puede tratar el texto desde un susurro leve hasta un grito feroz, habrá que ver hasta qué punto los controles contienen ya esa semántica o bien obligan a atender parámetros desgranados y que interaccionan complejamente para conseguir un determinado resultado.

El elemento más distintivo lo aporta un juego de 12 resonadores. Como veíamos en nuestro tutorial sobre síntesis centrado en el tema de filtros de formantes, sólo 3 resonadores ya conseguían una ilusión vocálica, así que imaginad completando la docena. El grado de control sobre la evolución individual de los resonadores permite igualmente crear todo tipo de barridos y filtrados complejos y sobre varias regiones del espectro simultáneamente.

Pero los filtros no son nada sin algo en su entrada. Además de excitaciones modeladas a partir de la señal de la glotis, y por tanto enfocadas a la reconstrucción de sonidos de tipo habla / canto, Phonem cuenta con otras fuentes posibles, entre las que no podían faltar los 'wavetables' marca de la casa en PPG, incluyendo la importación de aquellas creadas con WaveGenerator, así como las 'Time Corrected Samples' de WaveMapper 2.

Nace con 46 fonemas ingleses, 5 alemanes y 4 franceses, y una buena colección de recursos para modular y alterar los parámetros incluso fonema a fonema que hacen prever que no ha de ser fácil la tarea. Por supuesto se dispone de LFOs, envolventes, o pads X/Y. Se menciona que cuenta con varios tipos de voz y dialectos ya parametrizados, así como la existencia de unas pistas específicamente destinadas al diseño de la evolución del pitch y de diversos recursos prosódicos y relacionados con el canto.

Más información | Phonem

Pablo Fernández-Cid
EL AUTOR

Pablo no puede callar cuando se habla de tecnologías audio/música. Doctor en teleco. Ha creado diversos dispositivos hard y soft y realizado programaciones para músicos y audiovisuales. Toca ocasionalmente en grupo por Madrid (teclados, claro).

¿Te gustó este artículo?
5
Comentarios
  • #1 por Senoide de wonder bra el 10/11/2015
    Si logran que los fonemas sean con distintos acentos y sin estrellitis, un gran paso en el proceso de sustitución humana.

    No sólo somos prescindibles, es que es mejor que trabajen (inventen) ellos, el futuro como el paradigma de hidalguía española del siglo de oro, somos precursores.
  • #2 por pablofcid el 10/11/2015
    Habrá que ver como suena. No termino de tenerlo claro. Nunca he visto que W. Palm fuera un experto / interesado en síntesis de habla / canto, ni que haya adquirido conocimiento de otros al respecto.
    Ahí está Vocaloid de Yamaha (con tecnología de la Univ. Pompeu Fabra de Barcelona) demostrando que ni es fácil ni es rápido crear algo creíble en ese terreno. Veo difícil acercarse a ese nivel.

    Me da que tendremos nuevos cantantes robot, pero quien sabe...
  • #3 por Rafa El el 10/11/2015
    Cualquier cosa en ese campo bienvenida sea. Pendiente del demo.
  • #4 por Senoide de wonder bra el 10/11/2015
    En el vocaloid he pensado, claro, que por cierto los últimos cantantes no lo hacen tan mal.
    1
  • #5 por BlahBlah el 10/11/2015
    #4

    Lo que pasa es que las demos de Vocaloid están muy muy muy estudiadas para que no se vean los puntos débiles de la herramienta.

    Algo así como cuando te ponen una comparativa entre un sinte analógico y su emulación VST. Te muestran sólo aquellos patches que ellos te quieren mostrar, que son donde se minimizan las diferencias entre real y emulado.

    A mí me gustan las herramientas de síntesis vocal que son imperfectas. Porque hacen algo nuevo, distinto, original, robótico, futurista...

    Habiendo cantantes reales veo innecesario el empeño en recrearles con un software.
    3
  • #6 por Lisboetas el 10/11/2015
    #5
    +1

    De hecho no creo que los tiros vayan por el rollo vocaloid, si no mas bien por eld e voces roboticas
    Que mola mucho mas
    2
  • #7 por pablofcid el 10/11/2015
    #5 #6
    Ahí, ahí. No pasa nada si no es realista, con tal de que sea divertido / exótico / expresivo / salvaje en sus deformaciones /... o todo eso combinado.
    Eso sí, nos veo aprendiendo notación fonética a marchas forzadas, porque el interfaz es lo que muestra. Fonemas y fonemas.
    1
  • #8 por neomad el 10/11/2015
    Exacto, fonemas y fonemas en el interface y en el nombre.

    Si mal no recuerdo, uno de los sintes de este genio para el Ipad permite 'hablar', al mejor estilo Waldorf Nave. Claro que cantar es otra cosa...

    Se me ocurre que se pueden imitar cantantes roboticos como los de Air por ejemplo.
  • #9 por Juan Bauti (aka Skinny) el 10/11/2015
    Promete. veremos.
  • #10 por Hexagon Sun el 11/11/2015
    Ojalá vayan por aquí los tiros

    https://youtu.be/0rAyrmm7vv0?t=23s
  • #11 por BlahBlah el 11/11/2015
    #7

    A los que hemos programado a bajo nivel el SSI263 eso no nos cogerá de sorpresa ;-)
  • #12 por wmrhapsodies el 13/11/2015
    Ya hay demos y eso:

    http://www.synthtopia.com/content/2015/11/13/wolfgang-palm-intros-ppg-phonem-vocal-synthesizer/

    Horrible la adaptación de Koyaanisquatsi...

    Respecto de algo así quizá habría que tomar prestado de la robótica el concepto de "uncanny valley":

    https://es.wikipedia.org/wiki/Valle_inquietante

    El Ater Ego de Plogue sin embargo me resulta muy simpático y me lo he pasado muy bien con él, y es gratis.
  • #13 por supervari el 19/11/2015
    Creo que el problema de vocaloid es que para conseguir un resultado decente lleva demasiado tiempo y trabajo, en parte porque la interface deja mucho que desear desde mi punto de vista. Si de alguna forma el programa pudiera avanzar la configuración de los parámetros, por ejemplo detectando frases, o en función de la longitud de las sílabas y ritmo que siguen, sería una herramienta muy útil. Hoy por hoy por mal que cante uno es mucho más práctico y rápido hacerse con un micro y el melodyne.

    Este phonem sin duda por lo menos aparenta estar más desarrollado en ese sentido que el vocaloid (aunque no sería el primero que se queda solo en eso) lo que tengo claro es que solo tendrá éxito si facilita la rapidez de trabajo para obtener resultados naturales.
  • #14 por Rafa El el 19/11/2015
    para crear texturas, fx y poco mas. Nada, a ver si aparece algo por el estilo vocaloid.