Google lanzó Gemini 3.5 Flash y lo convirtió en modelo por defecto para flujos agentivos

El nuevo modelo pasa a ser el predeterminado en Gemini y Búsqueda IA, y Google anuncia Gemini Spark, un agente 24/7 que empieza con probadores, afirmando ser cuatro veces más rápido y costar menos de la mitad que otros sistemas punteros.

Miércoles, 20 de mayo de 2026 · min

Google lanzó Gemini 3.5 Flash y lo convirtió en modelo por defecto para flujos agentivos

El 19 de mayo de 2026, durante el Google I/O, Google lanzó Gemini 3.5 Flash, el primer modelo de la familia Gemini 3.5, y lo convirtió en el predeterminado en la aplicación Gemini y en el Modo IA de Búsqueda a nivel mundial. El consejero delegado, Sundar Pichai, enmarcó el lanzamiento como el inicio de la "era Gemini agentiva", situando al modelo en torno a la codificación compleja, las tareas en varios pasos y la capacidad de coordinar subagentes.

El lanzamiento es más que una actualización de modelo. Al incrustar el modelo pensado primero para agentes como opción por defecto en las superficies que utilizan miles de millones de consumidores y miles de desarrolladores empresariales, Google está redefiniendo cómo los usuarios y las empresas se encuentran con su IA.

El modelo sucede a Gemini 3 Flash, lanzado en diciembre de 2025, y a Gemini 3.1 Flash-Lite, de marzo de 2026. Google ha presentado 3.5 Flash no como una mejora lineal, sino como un modelo construido desde cero para flujos de trabajo agentivos, donde un sistema debe planificar, usar herramientas y actuar durante horizontes temporales prolongados sin necesidad de indicaciones humanas constantes.

Gemini 3.5 Flash está disponible a través de la API de Gemini en Google AI Studio y Android Studio, la Plataforma de Agentes Empresariales Gemini, Gemini Enterprise y el servicio para consumidores Antigravity. La página de producto de Google DeepMind etiqueta el modelo como "Vista previa", pero Google afirmó que está disponible de forma general en esos canales citados. El precio estándar de la API es de 1,50 dólares por millón de tokens de entrada y 9 dólares por millón de tokens de salida; el precio por lotes reduce esas tarifas a la mitad. En Búsqueda, el modelo es el predeterminado solo para el Modo IA, no para los resultados web estándar.

Técnicamente, el modelo admite una ventana de contexto de entrada de un millón de tokens, un límite de salida de 64.000 tokens y un corte de conocimiento en enero de 2025. Google lo describe como su "modelo agentivo y de codificación más potente hasta la fecha", diseñado para llamadas a funciones, salida estructurada, ejecución de código y Búsqueda como Herramienta, capacidades que le permiten orquestar el trabajo entre subagentes y datos externos.

Pichai también anunció Gemini Spark, un agente personal 24/7 impulsado por Gemini 3.5 Flash. Spark comenzará con probadores de confianza y después se lanzará en beta para los suscriptores de Google AI Ultra en Estados Unidos la semana siguiente. Aún no está disponible de forma generalizada.

Google proporcionó puntuaciones de referencia que, según afirma, muestran que 3.5 Flash supera al anterior Gemini 3.1 Pro en Terminal-Bench 2.1, GDPval-AA, MCP Atlas y CharXiv Reasoning. No se han publicado evaluaciones independientes. La compañía también asegura que el modelo es cuatro veces más rápido que otros modelos de vanguardia en tokens de salida por segundo y cuesta menos de la mitad; no detalló qué modelos se utilizaron en la comparación ni la metodología de medición.

En materia de seguridad, Google declaró que el modelo se desarrolló bajo su Frontier Safety Framework, con salvaguardas reforzadas contra riesgos cibernéticos y NBQ, y un comportamiento de rechazo mejorado. No se ha identificado ninguna auditoría de seguridad independiente.

El ángulo empresarial quedó subrayado por una lista de nombres que Google presentó —Shopify, Macquarie Bank, Salesforce, Ramp, Xero y Databricks—, pero ninguna había emitido confirmaciones públicas de despliegue en el lanzamiento. Pichai ofreció un ejemplo de ahorro hipotético: si las grandes empresas trasladaran el 80% de sus cargas de trabajo, que suman alrededor de un billón de tokens al día, al nuevo modelo, podrían ahorrar más de 1.000 millones de dólares anuales. La cifra se presentó como ilustrativa, no como una garantía.

La compañía reveló que se espera que sus gastos de capital en 2026 alcancen los 180.000-190.000 millones de dólares, lo que refleja la magnitud de su ofensiva en infraestructura de IA. Google también dijo que Gemini 3.5 Pro, que ya se usa internamente, se lanzaría el mes siguiente, y adelantó funciones de agente adicionales para Búsqueda y otros productos sin dar plazos concretos.

Al estandarizar un único modelo agentivo en los canales de consumo, desarrollo y empresa, Google eleva las apuestas competitivas. Los rivales deberán igualar no solo el rendimiento del modelo, sino también la profundidad de integración, la velocidad y el coste. Si la fiabilidad en el mundo real, las tasas de fallo en el uso de herramientas y las medidas de seguridad declaradas pueden seguir el ritmo de esa ambición sigue siendo una pregunta abierta.

— Fin —

Google lanzó Gemini 3.5 Flash y lo convirtió en modelo por defecto para flujos agentivos

Relacionados

Decart levantó 300 millones de dólares liderados por Radical Ventures con Nvidia como inversor

Anthropic adquirió Stainless y cierra su generador de SDK usado por OpenAI y Cloudflare

Anthropic restringió su IA Claude Mythos; un test del Reino Unido logró 11 de 20 ataques

OpenAI compró Weights.gg en enero, según informaciones de prensa