Google anunció la familia Gemini 3.5 y lanzó su primer modelo, Gemini 3.5 Flash, el 19 de mayo, presentándolo como una base para el trabajo agentivo en lugar de una actualización de un chatbot convencional. El modelo se convirtió de inmediato en la opción predeterminada en la aplicación Gemini y en el modo IA de Search a nivel global.
El lanzamiento, que coincidió con la conferencia de desarrolladores I/O 2026 de la compañía, integra la variante Flash, orientada a la velocidad, en el corazón de la infraestructura de IA de consumo y empresarial de Google. Está concebido para impulsar flujos de trabajo de programación, tareas de larga duración y una nueva categoría de agentes persistentes en segundo plano, no solo para responder consultas.
Google describió el modelo como el más potente hasta la fecha para flujos de trabajo agentivos complejos, programación y tareas de largo alcance. Una ficha de modelo publicada por Google DeepMind enumera los usos previstos en procesos empresariales, programación y aplicaciones agentivas, y detalla las evaluaciones de seguridad realizadas en el marco del Frontier Safety Framework de la compañía.
Los desarrolladores pueden acceder a Gemini 3.5 Flash a través de Google Antigravity, la API de Gemini disponible en Google AI Studio y Android Studio, y los clientes empresariales pueden desplegarlo mediante la Gemini Enterprise Agent Platform y los productos Gemini Enterprise. El precio de la API en el nivel de pago es de 1,50 dólares por millón de tokens de entrada y 9,00 dólares por millón de tokens de salida, que incluyen tokens de pensamiento; los precios por lotes y flexibles reducen ambas tarifas a la mitad. El rastreador independiente Artificial Analysis midió el modelo a 284,2 tokens de salida por segundo, lo que lo sitúa segundo entre 147 modelos en velocidad y séptimo en un resumen de inteligencia, aunque señaló que algunas puntuaciones de calidad son declaradas por el laboratorio y que el modelo puede ser verboso.
Junto al modelo, Google presentó Gemini Spark, un agente de IA personal impulsado por 3.5 Flash y diseñado para funcionar de forma continua en segundo plano. Comenzó a desplegarse entre probadores de confianza el 19 de mayo, con una beta prevista para la semana siguiente para los suscriptores estadounidenses del plan Google AI Ultra.
Las afirmaciones de rendimiento de Google son ambiciosas. La compañía asegura que 3.5 Flash supera al anterior Gemini 3.1 Pro en pruebas de referencia como Terminal-Bench 2.1 (76,2 %), GDPval-AA (1656 Elo), MCP Atlas (83,6 %) y CharXiv Reasoning (84,2 %). También afirma que el modelo es cuatro veces más rápido que otros modelos frontera y que a menudo completa tareas agentivas a menos de la mitad del coste, pero la compañía no ha hecho pública la metodología detallada ni el conjunto completo de modelos con los que se compara. Aún no se dispone de una verificación independiente de las pruebas.
Google prevé lanzar Gemini 3.5 Pro, un modelo hermano más capaz que ya se utiliza internamente, el próximo mes. El movimiento apunta a una rápida expansión de la familia incluso mientras la compañía concentra su ofensiva inmediata en agentes en una variante flash de gama media.
Las divulgaciones de seguridad siguen siendo autoinformadas. No se ha realizado ninguna auditoría externa del perfil de riesgo agentivo, y los peligros que introducen los agentes autónomos de larga duración —como la acumulación de errores o acciones imprevistas a lo largo del tiempo— aún no han sido examinados por terceros.
Los nombres de socios como Shopify, Macquarie Bank, Salesforce, Ramp, Xero y Databricks aparecieron en el anuncio de Google, pero no han sido confirmados de forma independiente. Se desconoce el precio empresarial exacto más allá de los niveles públicos de la API, y la disponibilidad global puede variar según la región y el tipo de cuenta. Para los desarrolladores y operadores que consideran la adopción, la brecha entre la narrativa agentiva de Google y las pruebas reproducibles de forma independiente es la cuestión inmediata.
