De texto a canción: Gemini ahora genera pistas de 30 segundos con portadas de álbum.

Tras haber destacado en la generación de imágenes, video y código, Google ha dado un paso ambicioso en el terreno del audio. A través de la actualización del modelo Lyria 3 de Google DeepMind, la inteligencia artificial Gemini ahora permite a cualquier usuario crear pistas de música de alta calidad, con letras y melodías complejas, utilizando simplemente una descripción de texto o una imagen.

Hasta ahora, la tecnología de audio de Google se limitaba a experimentos como MusicFX o funciones breves para YouTube Shorts. Con esta actualización, el modelo Lyria 3 se integra directamente en las aplicaciones móviles y la interfaz web de Gemini.

A diferencia de las versiones anteriores, que producían fragmentos instrumentales para fondo, Gemini ahora es capaz de generar pistas de 30 segundos que replican música real, con mezclas melódicas de varios instrumentos y capas profesionales, posicionándose como un competidor directo de plataformas como Suno que ha dominado este segmento.

Creatividad visual y personalización total

Una de las funciones más innovadoras es la capacidad de subir una imagen para que Gemini la convierta en un concepto musical. Además, el sistema genera letras automáticas mientras compone la música. Los usuarios pueden modificar el tempo, el estilo musical o incluso el tipo de canto mediante nuevas instrucciones. También se permite añadir pistas existentes para que la IA las tome como referencia y como complemento, cada canción viene acompañada de una carátula generada por el modelo Gemini Nano.

Ética y protección del Copyright

Google ha subrayado su compromiso con la industria musical y los derechos de autor. Para evitar infracciones, la compañía ha implementado varias medidas de seguridad como:

  • SynthID: Cada pista incluye una marca de agua digital invisible para identificar que ha sido creada por IA.
  • Filtros de imitación: El modelo ha sido entrenado para no imitar a artistas existentes y las pistas finales se cotejan con bases de datos musicales para evitar plagios.
  • Sistema de reportes: Los usuarios podrán informar sobre cualquier contenido que parezca infringir derechos de autor.

Disponibilidad

La función ya está funcionando en fase Beta y está disponible tanto para usuarios gratuitos como suscriptores de pago (con límites basados en créditos). El servicio es multilingüe, cubriendo idiomas como el español, inglés, francés, alemán, japonés y coreano, entre otros. Además de Gemini, la herramienta también estará disponible a través de Dream Track para YouTube Shorts.

Visítanos diariamente para que no te pierdas ninguna noticia. Suscríbete al canal de YouTube donde verás El Recuento y reviews de smartphones. Además, no olvides escuchar esta misma sección a través de podcasts por Spotify.

Fuente: androidauthority

Deja un comentario

Descubre más desde Isa Marcial

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo