Alibaba lanzó Qwen3.7-Max a finales de mayo de 2026, un gran modelo de lenguaje propietario diseñado para flujos de trabajo agentivos, lo que marca un giro estratégico para el equipo Qwen desde modelos de investigación de pesos abiertos hacia sistemas cerrados de frontera solo por API. El modelo está orientado a tareas de codificación, depuración, automatización de oficina y uso de herramientas en horizontes largos, y Alibaba Cloud lo acompaña con infraestructura en Model Studio, precios iniciales con fuertes descuentos e integración con herramientas externas de agentes como Claude Code de Anthropic.
El lanzamiento es el paso más explícito hasta ahora en la ofensiva de Alibaba por comercializar agentes de IA de pila completa, al vincular la capacidad del modelo directamente con los servicios en la nube. Para los compradores empresariales, indica una apuesta por que la próxima ola de gasto en IA se dirija a la ingeniería de software autónoma y la automatización de procesos de negocio, no solo a la fluidez conversacional.
Qwen3.7-Max es propietario y solo por API, accesible a través de Model Studio de Alibaba Cloud. El precio oficial es de 2,50 dólares por millón de tokens de entrada y 7,50 dólares por millón de tokens de salida, con un descuento promocional del 50 % que los reduce a 1,25 y 3,75 dólares hasta el 22 de junio de 2026. La configuración de agente de ejemplo de la compañía utiliza una ventana de contexto de 1 millón de tokens y una salida máxima de 65.536 tokens. Alibaba afirma que el modelo puede integrarse con marcos de agentes como Claude Code de Anthropic, OpenClaw y Qwen Code. El 26 de mayo, Alibaba Cloud anunció la disponibilidad en su región de Singapur, aunque la entrada inicial del blog describía el acceso como “próximamente”; los detalles del despliegue global más amplio siguen siendo escasos.
Alibaba informó de puntuaciones en pruebas de referencia que sitúan a Qwen3.7-Max entre los modelos de frontera de alto rendimiento: 92,4 en GPQA Diamond, 80,4 en SWE-Verified (que la compañía dijo que está a la par con Opus-4.6 Max de Anthropic con 80,8 y DS-V4-Pro Max de DeepSeek con 80,6), 69,7 en Terminal-Bench 2.0-Terminus, 60,8 en MCP-Mark y 76,4 en MCP-Atlas. En el Índice de Inteligencia versión 4.0 de Artificial Analysis, el modelo obtuvo 56,6, lo que Alibaba dijo que lo sitúa quinto a nivel mundial y primero entre los modelos chinos. Artificial Analysis señala, sin embargo, que algunas subpuntuaciones pueden ser declaradas por el laboratorio en lugar de medidas de forma independiente, y que muchos de los puntos de referencia detallados proceden de los propios informes de Alibaba.
Alibaba también describió una demostración interna en la que Qwen3.7-Max funcionó de forma autónoma durante unas 35 horas, ejecutó 432 evaluaciones de kernel, realizó 1.158 llamadas a herramientas y logró una aceleración media geométrica de 10,0x respecto a una referencia Triton en una PPU T-Head ZW-M890. La compañía no ha publicado registros públicos, código ni detalles del hardware que permitan una auditoría independiente.
El lanzamiento forma parte de una ofensiva más amplia del ecosistema de IA agentiva que incluye habilidades, orquestación multiagente y herramientas empresariales. En su informe anual del ejercicio fiscal 2026 presentado ante la bolsa de Hong Kong, Alibaba calificó a Qwen3.7-Max como el modelo de lenguaje de gran tamaño de última generación diseñado para agentes y dijo que la familia Qwen recibió tres actualizaciones en los tres meses anteriores. Ese ritmo rápido contrasta con el despliegue más lento y de pesos abiertos de los modelos Qwen anteriores y refleja una tendencia del sector en la que los laboratorios de frontera protegen sus sistemas más capaces tras API de pago. La mención de Alibaba de tres actualizaciones ha sido interpretada por algunos observadores, incluido el medio tecnológico chino LeiPhone, como prueba de un ciclo de lanzamiento de producto insignia de 30 días, pero la compañía no se ha comprometido públicamente con ese ritmo.
Persisten varias incertidumbres. Terceros independientes aún no han reproducido por completo las puntuaciones de las pruebas de referencia. La demostración de optimización de kernel de 35 horas carece de pruebas verificables. Aunque se confirmó la disponibilidad en Singapur, Alibaba no ha revelado la cobertura de regiones más amplia, las políticas de residencia de datos ni los acuerdos de nivel de servicio empresarial. Las versiones de vista previa anteriores —Qwen3.5-Max-Preview y Qwen3.6-Max-Preview, que fuentes secundarias sitúan como lanzadas en marzo y abril de 2026— carecen de confirmación de fuente primaria.
Qwen3.7-Max señala la determinación de Alibaba de competir en agentes de IA empresariales en capacidad del modelo, infraestructura en la nube y herramientas para desarrolladores. Pero las afirmaciones de paridad con GPT y Claude se basan en gran medida en pruebas de referencia comunicadas por el proveedor, y la compañía aún no ha proporcionado las pruebas independientes que consolidarían la posición del modelo entre los líderes mundiales.
