Ir al contenido
Gratis · +1.000 lectores
Gratis · Independiente
El diario de la inteligencia artificial
← Volver
IA

Google lanzó Gemini Omni Flash para suscriptores y YouTube

La herramienta multimodal, anunciada en Google I/O el 19 de mayo, sustituye a Veo en la aplicación Gemini y lleva la edición conversacional de vídeo a Google Flow y YouTube Shorts, aunque el acceso a la API sigue a semanas vista.

Domingo, 24 de mayo de 2026 · min

El 19 de mayo, Google anunció Gemini Omni Flash en su conferencia de desarrolladores I/O. El modelo, el primero de una nueva familia multimodal de vídeo, empezó a desplegarse ese mismo día para los suscriptores de pago de Gemini y para los creadores de YouTube sin coste, sustituyendo a Veo dentro de la aplicación Gemini y ampliando la edición de vídeo con IA a Google Flow y YouTube Shorts.

El lanzamiento marca un giro desde la generación de una sola toma hacia una edición conversacional de varios turnos que responde a instrucciones en lenguaje natural. Al integrar la capacidad directamente en el asistente y en la cadena de herramientas para creadores de Google, la compañía lleva el vídeo generativo a los flujos de trabajo de millones de consumidores y youtubers, aunque el acceso completo para desarrolladores requiere una API que aún no se ha lanzado. Refleja una estrategia para convertir el vídeo generativo en una herramienta rutinaria dentro de los servicios más utilizados de Google, en lugar de una demostración aislada.

Gemini Omni Flash acepta texto, imágenes, vídeo y referencias de voz como entradas. En las demostraciones, Google mostró cómo un usuario podía cargar un clip de vídeo y pedir al modelo que alterara objetos, cambiara escenas, ajustara ángulos de cámara o modificara estilos visuales en varios turnos: edición iterativa dentro de un único diálogo, en lugar de una serie de instrucciones separadas. La compañía describió este flujo conversacional como el principal factor diferencial.

El despliegue es global para los suscriptores de Google AI Plus, Pro y Ultra a través de la aplicación Gemini y Google Flow. Esa misma semana, el acceso gratuito se activó para los usuarios mayores de 18 años con una cuenta de Google mediante YouTube Shorts Remix y YouTube Create. Google no publicó de inmediato una lista de idiomas o países admitidos más allá de la etiqueta genérica de “global”. Las claves de API para desarrolladores y empresas se esperan en las próximas semanas; en el momento del lanzamiento, no existe acceso programático.

Todos los vídeos generados por Omni llevan la marca de agua digital SynthID y las Credenciales de Contenido C2PA, un estándar de metadatos diseñado para rastrear la procedencia del material. La verificación es posible a través de la aplicación Gemini, y Google dijo que el soporte en Chrome y Search está disponible o llegará pronto. La compañía presentó estas medidas como herramientas de transparencia, no como salvaguardas que impidan la creación de deepfakes.

La capacidad de audio de Omni Flash es limitada: inicialmente solo se admiten referencias de voz, y está prevista una entrada de audio más amplia más adelante. Los reportes de medios y las propias demostraciones de Google mostraron vídeos de 10 segundos, pero la compañía no publicó un límite técnico universal. Faltan evaluaciones de rendimiento independientes; VentureBeat informó de que Google no emitió comparaciones públicas en el lanzamiento. Competidores como Sora de OpenAI ocupan el mismo espacio, pero aún no hay datos de calidad comparativos. La resolución, la tasa de fotogramas y los límites de generación del modelo tampoco se han especificado. La ausencia de una API activa significa que los clientes empresariales todavía no pueden evaluar el modelo con sus propias cargas de trabajo.

Google describió Omni como el sucesor de Veo dentro de la aplicación Gemini, aunque la compañía no dijo que Veo vaya a retirarse de todos los servicios de Google. Veo había sido el modelo de generación de vídeo dentro del asistente desde finales de 2024; Omni asume ahora ese papel, transformando la interacción de una instrucción única a una conversación. Para YouTube, el movimiento sitúa la creación asistida por IA directamente en dos herramientas de edición integradas, reduciendo la barrera para el contenido de Shorts. El lanzamiento se produce en un momento en que varios laboratorios de IA compiten por integrar la generación de vídeo en aplicaciones cotidianas, aunque sin evaluaciones independientes cualquier ventaja es solo una afirmación del proveedor. El lanzamiento también supone una integración más profunda de la IA generativa en el ecosistema de suscripción de Google, donde el vídeo se une a las capacidades de texto e imagen.

Con el acceso a la API previsto para las próximas semanas, el producto comercial afrontará pronto las exigencias de los desarrolladores y la fijación de precios para empresas. Por ahora, el despliegue limitado pone a prueba si la edición conversacional de vídeo puede pasar de ser una promesa de laboratorio a una utilidad integrada en el ecosistema de suscripción de pago de Google. El lanzamiento controlado también ofrece a Google la oportunidad de recabar comentarios de los usuarios antes de una distribución más amplia.

— Fin —