Vocaloid: Prima vs. IA

#1 por Emilio Galsán el 18/10/2014
La versión 3 de Vocaloid incluye una voz femenina llamada IA que, en tesituras altas, me parece mucho mejor que Prima, más "enérgica" o dramática, por así decirlo. Se pueden comparar las dos voces en tesitura de soprano en la famosa aria Der Hölle Rache, de La Flauta Mágica de Mozart:

Para los que necesiten una voz de soprano en sus composiciones, un truco: si se graba la voz tal cual y luego en un wav studio (por ejemplo en Audacity) se baja un tono la onda, la voz es mucho más real, menos "infantil". El truco consiste en grabar la voz un tono más alto del deseado y luego bajarlo.

La interpretación de Vocaloid Prima:



La de Vocaloid 3 IA :






Y, por último os adjunto un archivo MP3 con IA en la que he bajado un tono:
Subir
#2 por Emilio Galsán el 18/10/2014
Vaya, parece que no puedo enviar el archivo adjunto. Voy a intentarlo de nuevo:
Subir
#3 por raat el 18/10/2014
Espero no tener nunca a una tía así de vecina.
Subir
#4 por Emilio Galsán el 18/10/2014
#3 :-)
Para determinados géneros musicales (música sinfónico-coral, bandas sonoras, documentales, new age, etc.) va bien, me parece. ¿Has oído el archivo adjunto? Es bastante realista.
Subir
#5 por raat el 18/10/2014
La primera y la segunda me gustan, mas la primera, pero la del MP3 suena raro.
Subir
#6 por Emilio Galsán el 18/10/2014
#5 Vocaloid Prima es inadecuada para la voz -del personaje y de este aria en concreto.-, que es dramática. Prima está bien en otras arias pero no en ésta.Es una voz más dulce.

El MP3, bajando un tono hace la voz más "gruesa", más pesada, y por lo tanto, menos infantil, más dramática y adulta. Lo que intentaba explicar es que el timbre de esa voz, cuando se baja la onda un tono, hace que la voz sea más madura y dramática.
Subir
#7 por Emilio Galsán el 18/10/2014
En la comparación entre Vocaloid Prima y Vocaloid IA, en este aria, IA se parece más a una voz real, por ejemplo la de Diana Damrau:



Por supuesto, la expresividad de la voz humana es muy dificil de imitar...
Subir
#8 por RaulMX el 19/10/2014
La verdad es que por lo menos lograste hacer cantar al Vocaloid que eso es digno de aplaudirse, yo por ahí tengo la versión 1 Miriam y jamás puede hacer que cantara algo.

HP AMD A10-5800K Trinity 3.8GHz, Motu2408mk3, Tascam DM-24, Yamaha MSP7, Behringer Ada8000, Aphex Tubessence, LaunchBox Radial, PreAmps, EQ, Comp, Capi, Pearce BC1, Marshall Valvestate, Micrófonos Shure y AKG.

http://publicidadendisco.com.mx/

.

Subir
#9 por Emilio Galsán el 19/10/2014
RaulMX escribió:
lograste hacer cantar al Vocaloid


:oops: Nooooo... :lol: ..Yo sólo me bajé el mp3 y bajé un tono la onda en Audacity. No tengo el programa. El motivo de este topic era explicar que si se baja un tono o un semitono la onda de la "cantante" Vocaloid3 IA se logra un timbre de voz que me parece más realista. Por otro lado, en tesituras más bajas me sigue pareciendo infantiloide y artificial.

En el siguiente archivo adjunto, he bajado el MP3 un semitono en vez de un tono y he cambiado algo el tempo (además de algúnos rittardando) y he aumentado el volumen en algunas notas, cambiando algo las dinámicas. Se puede comparar la diferencia con el video de mi primer mensaje.
Subir
#10 por supervari el 06/11/2014
Bueno Emilio si no conoces el programa te comento que trae un piano roll en el que puedes mover las notas (sílabas) se puede jugar con los tonos y ajustar a la escala en la que estés, aparte de muchos otros parámetros. La voz cambia radicalmente de una octava a otra, hasta el extremo que parece modificarse el género y edad del cantante. Imagino que es porque la voz humana a pesar de toda su expresividad está limitado a un rango de frecuencias mucho más pequeño que un instrumento virtual y cuando sale de las mismas se desnaturaliza. El problema que he encontrado con vocaloid es que no he encontrado referencias sobre cómo funciona la voz humana y su expresividad al cantar para intentar ajustar los parametros que trae el programa a esas propiedades, por ejemplo, sobre el ritmo de las respiraciones, en qué momento de las frases se expira mayor aire o no, la apertura de la boca qué relacion tiene con el énfasis o el ritmo, en qué momento aplicar vibrato a la voz, así como su medida, duración, etc.. son parámetros que el programa te deja controlar pero que, el quid de la cuestión es conocer como funciona la voz real, para ajustarlos en una sintética.
Si alguien sabe de algun vínculo o documentación sobre el tema o iniciación al cante (comprensible para los que nunca hemos tenido una aproximación), agradecería la ayuda :)
Subir
Respuesta rápida

Regístrate o para poder postear en este hilo