Ir al contenido
Gratis · +1.000 lectores
Gratis · Independiente
El diario de la inteligencia artificial
← Volver
IA

Anthropic lanzó Claude Opus 4.8 con agentes de programación dinámicos y un modo rápido

El nuevo Opus llegó 41 días después del anterior, mantuvo precios estándar y añadió flujos de agentes paralelos y modo rápido, mientras Anthropic dijo que las ganancias en pruebas eran moderadas y no verificadas.

Sábado, 30 de mayo de 2026 · min

Anthropic lanzó el 28 de mayo Claude Opus 4.8, la última versión de su modelo de lenguaje de gran escala, con nuevas herramientas dirigidas a desarrolladores de software y usuarios empresariales. La actualización llegó 41 días después de Opus 4.7 y mantuvo los precios estándar de la API sin cambios: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida. El lanzamiento refleja una cadencia de publicación más rápida y un enfoque cada vez más marcado en la programación agéntica, una categoría en la que los laboratorios de vanguardia compiten con intensidad.

Anthropic describió la mejora de rendimiento como "modesta pero tangible", y señaló avances en tareas de programación de largo alcance, uso de herramientas y honestidad. Sin embargo, el lanzamiento importa menos por las puntuaciones brutas de las pruebas de referencia —todas ellas proporcionadas por la compañía y no verificadas de forma independiente— que por las funciones para desarrolladores que lo acompañan, entre ellas una vista previa de investigación de flujos de trabajo de agentes paralelos y un nivel de inferencia más rápido.

El modelo, denominado claude-opus-4-8, está disponible a través de la API de Anthropic, su interfaz web claude.ai y la aplicación de escritorio Cowork. Amazon Web Services confirmó su disponibilidad en Bedrock en cuatro regiones: Este de EE. UU., Asia-Pacífico (Tokio), Europa (Irlanda) y Europa (Estocolmo). Google Cloud Vertex AI y Microsoft Foundry también figuran como plataformas, aunque Foundry limita la ventana de contexto a 200.000 tokens, frente al máximo de 1.048.576 tokens en otros servicios. Un nuevo modo rápido, ofrecido como vista previa de investigación con acceso restringido, cobra 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida, y ofrece hasta 2,5 veces la velocidad de tokens de salida. Anthropic señaló que el modo rápido aún no está disponible en nubes de terceros.

Anthropic afirmó que Opus 4.8 mejora a su predecesor en programación agéntica de largo alcance, manejo de contextos extensos, activación de herramientas, recuperación de compactación y calibración de razonamiento. En pruebas de ingeniería de software, la compañía informó puntuaciones del 88,6 % en SWE-bench Verified (frente al 87,6 % de Opus 4.7), del 69,2 % en SWE-bench Pro (frente al 64,3 %) y del 74,6 % en Terminal-Bench 2.1 (frente al 66,1 %). Ninguna de estas cifras ha sido confirmada por evaluadores independientes. La empresa también afirmó una reducción de aproximadamente cuatro veces en la tendencia del modelo a pasar por alto fallos en su propio código, y señaló que es más propenso a señalar incertidumbre y menos propenso a hacer afirmaciones sin respaldo.

Junto con el modelo, Anthropic introdujo varios controles nuevos. Los ajustes de esfuerzo, que ya estaban en Claude Code, ahora se extienden a claude.ai y Cowork. Los mensajes del sistema ahora pueden insertarse a mitad de una conversación a través de la API de Messages, lo que permite a los desarrolladores actualizar instrucciones sin reiniciar una sesión. Claude Code incorporó una vista previa de investigación de flujos de trabajo dinámicos, capaz de generar desde decenas hasta cientos de subagentes paralelos para tareas complejas. Anthropic advirtió que los flujos de trabajo dinámicos siguen siendo experimentales y todavía no están disponibles de forma general.

El ciclo de 41 días —observado por TechCrunch— subraya la velocidad con la que Anthropic está iterando su línea enfocada en desarrolladores. La compañía presentó Opus 4.8 como un paso disponible públicamente, mientras que sus modelos más potentes de la clase Mythos, actualmente en vista previa limitada para flujos de trabajo de ciberseguridad, se espera que lleguen a todos los clientes "en las próximas semanas" tras un refuerzo adicional de seguridad. Sin embargo, esa declaración prospectiva no constituye una fecha de entrega firme.

Todas las afirmaciones de rendimiento y seguridad se basan en la tarjeta de sistema y las evaluaciones internas de Anthropic; el archivo PDF de 244 páginas de la tarjeta de sistema no pudo ser examinado directamente. La replicación de las pruebas por parte de terceros aún no se ha producido, y un informe independiente de GIGAZINE señaló que GPT-5.5 obtuvo una puntuación más alta en Terminal-Bench, aunque esa afirmación también carece de verificación independiente. El alcance real de la disponibilidad de los flujos de trabajo dinámicos y el modo rápido podría ser más limitado de lo que sugiere el anuncio. Para los compradores empresariales y los desarrolladores, el lanzamiento indica que Anthropic está comprimiendo su ciclo de modelos e incorporando capacidades agénticas directamente en sus herramientas para desarrolladores, al tiempo que mantiene abierta la puerta para una actualización más sustancial con Mythos. La cuestión a corto plazo es si las ganancias modestas y las funciones en vista previa de investigación son suficientes para mantener la atención mientras los competidores aceleran.

— Fin —