Magacín

Videoclips y edición musical con IA: Gemini Omni Flash llega a Flow Music

A finales del pasado mes de marzo os hablábamos sobre el desembarco de Google en la producción musical generativa con Gemini Lyria. Y como todo esto de la inteligencia artificial va tan rápido, el panorama ha dado un vuelco absoluto en apenas unas semanas. La plataforma no solo ha consolidado su entorno de creación bajo la marca Google Flow Music (fruto de la adquisición de ProducerAI), sino que en el reciente Google I/O 2026 acaba de ser dotada de un nuevo y potente cerebro multimodal: Gemini Omni Flash. Según Google, esta actualización promete cambiar el paradigma de la creación musical asistida por IA, pasando de la simple generación mediante prompts a un flujo de trabajo interactivo en el estudio.

Google Flow Music: del prompt aislado al ecosistema multimodal

Hasta ahora, y por lo general, las herramientas de generación musical por IA funcionaban a través de un sistema de prompts por el que el usuario escribía una descripción en texto, esperaba unos minutos y recibía un archivo de audio cerrado y difícil de editar. Pero el salto a Gemini Omni Flash rompe este flujo tan lineal.

Al tratarse de un modelo de IA multimodal nativo, Omni Flash unifica texto, audio, imagen y vídeo en un mismo proceso. Esto significa que el motor musical especializado de Google, Gemini Lyria, ya no trabaja de forma aislada. En el caso concreto de Flow Music, la primera aplicación visible de Omni Flash llega por el lado del vídeo musical: a partir de tu pista, puedes dirigir conversacionalmente el videoclip que la acompaña, indicando estilos visuales, protagonistas y escenas que se ajusten a la narrativa y el ritmo del tema. Una de las virtudes que Google destaca es la consistencia entre escenas, preservando identidad, voz y continuidad visual a lo largo del clip.

Google Flow Music
Captura de la página web Google Flow Music
Google

Edición conversacional en el estudio a velocidad "Flash"

Para los músicos, productores y diseñadores de sonido, el apellido "Flash" de este nuevo modelo es probablemente el dato más relevante, ya que significa que el sistema está optimizado para ofrecer una latencia ultrabaja. En la práctica, esto abre la puerta a un flujo de trabajo iterativo, donde cada instrucción se construye sobre la anterior sin necesidad de empezar de cero —algo a medio camino entre el prompt clásico y ese diálogo fluido al estilo Tony Stark y Jarvis en Iron Man—.

El otro gran avance que llega a Flow Music con esta actualización es la edición de la canción sección por sección. Tal como lo describe Google, ahora artistas, compositores y productores tienen un control mucho más detallado sobre lo que crean: es posible seleccionar cualquier parte de una canción y modificarla sin tocar el resto de la pista. Entre las acciones disponibles se incluyen:

  • Reescribir o traducir las letras al instante.
  • Cambiar el estilo del ritmo en una sección concreta.
  • Tomar un fragmento específico y desarrollarlo en una dirección completamente nueva.
  • Generar versiones tipo "cover" que transforman el estilo completo del tema (por ejemplo, pasar un tema rock a lo-fi) manteniendo melodía y estructura.

Es un movimiento que acerca la herramienta a un flujo de trabajo mucho más cercano al de un estudio real: no es edición de audio en sentido estricto (no hay timeline, no hay control fino de parámetros), pero sí supone un paso considerable respecto al paradigma anterior de "prompt y reza".

Derechos de autor y el estándar SynthID

Como ya os adelantamos en el articulo de marzo, la intención de Google con este ecosistema es la de ofrecer un "lienzo inteligente" para esbozar ideas, pero nunca sustituir al compositor. Por eso, la seguridad y los derechos de autor siguen ocupando un lugar central. Google insiste en que Lyria ha sido entrenada con datos de alta calidad y música con licencia para aprender estructuras y timbres sin vulnerar derechos de autor. Además, vuelven a hacer hincapié en la integración de SynthID. Una marca de agua digital inaudible que añade una huella imperceptible para el oído humano que se "incrusta" en el archivo para evitar usos engañosos, y que será de gran utilidad para la gestión de autorías e identificación de contenido sintético en plataformas de streaming.

Google Flow Music y el motor Omni Flash ya han comenzado a implementarse a través de los planes avanzados de Google AI (Plus, Pro y Ultra) y plataformas integradas como YouTube Shorts. También se han anunciado aplicaciones móviles nativas para Google Flow y Flow Music, así como un nuevo Flow Agent (asistente de planificación y edición por lotes) y Flow Tools (creación de flujos de trabajo personalizados sin código).

Más información: Blog de Google | Google Flow Music

EL AUTOR

Comunicador incansable en materia de tecnología musical. Dicen por ahí que de niño se cayó en una marmita llena de osciladores de baja frecuencia.

¿Te gustó este artículo?
1
Comentarios

Regístrate o para poder comentar

Música
Temas