Ir al contenido
Gratis · +1.000 lectores
Gratis · Independiente
El diario de la inteligencia artificial
← Volver
IA

Anthropic lanzó Claude Opus 4.8 con controles de esfuerzo y un modo rápido de vista previa

El precio estándar se mantuvo en 5/25 dólares por millón de tokens; el modo rápido ofrece hasta 2,5× la velocidad de salida por 10/50 dólares, y los controles de esfuerzo permiten intercambiar razonamiento por velocidad y coste.

Martes, 2 de junio de 2026 · min

Anthropic lanzó Claude Opus 4.8 el 28 de mayo de 2026, incorporando controles de esfuerzo para el usuario, una vista previa de investigación del modo rápido y flujos de trabajo dinámicos para su herramienta Claude Code. La actualización, disponible de inmediato a través de la API de Anthropic y las principales plataformas de nube, prioriza los controles para desarrolladores frente a un salto brusco en el rendimiento bruto del modelo.

El lanzamiento profundiza en la práctica emergente de la inferencia ajustable, en la que la profundidad de razonamiento se convierte en una variable explícita del producto. Para los equipos empresariales, eso se traduce en un control granular del consumo de tokens, la latencia y el coste dentro de una misma familia de modelos, ampliando el abanico de casos de uso que un solo modelo puede cubrir con viabilidad económica.

El control de esfuerzo, disponible en claude.ai, Cowork y como parámetro de la API, permite a los desarrolladores elegir entre cinco niveles —bajo, medio, alto, muy alto (xhigh) y máximo—, con “alto” como opción predeterminada. Un esfuerzo menor busca respuestas más rápidas y menos tokens, mientras que un esfuerzo mayor recurre a un razonamiento más profundo que puede consumir más recursos. La función no llega a ser un dial de precisión directa; Anthropic la plantea como un equilibrio entre exhaustividad y velocidad.

El precio estándar de la API se mantuvo sin cambios en 5 dólares por cada millón de tokens de entrada y 25 dólares por cada millón de tokens de salida. Junto a él, la compañía presentó una vista previa de investigación del modo rápido con un precio de 10 dólares por millón de tokens de entrada y 50 dólares por millón de salida, un tercio del coste del anterior modo rápido de Opus, que era de 30 y 150 dólares, respectivamente. El modo afirma ofrecer hasta 2,5 veces más tokens de salida por segundo, aunque la métrica mide el rendimiento de tokens más que la finalización garantizada de tareas de extremo a extremo.

El modo rápido está limitado a la API de Anthropic; no se puede utilizar en Amazon Bedrock, Google Cloud Vertex AI ni Microsoft Foundry. Esta restricción de plataforma reduce su alcance inmediato para las empresas que se han estandarizado en un proveedor de nube concreto.

La compañía también lanzó flujos de trabajo dinámicos en Claude Code como vista previa de investigación, lo que permite a la herramienta planificar y ejecutar tareas entre decenas y cientos de subagentes paralelos. Disponible en los planes Max, Team, Enterprise y API/nube —Enterprise desactivado por defecto—, la función puede consumir sustancialmente más tokens que una sola sesión de Claude, lo que podría elevar los costes para equipos que no estén prevenidos.

Anthropic afirmó que el modelo es unas cuatro veces menos propenso que su predecesor a pasar por alto los fallos en el código que él mismo escribe, según las evaluaciones internas de la compañía. En el lanzamiento no se disponía de evaluaciones independientes que corroborasen esa afirmación ni que midieran el rendimiento de Opus 4.8 en tareas de programación y agénticas en comparación con otros modelos de vanguardia.

El modelo admite una ventana de contexto de 1 millón de tokens en la API de Anthropic, Amazon Bedrock y Vertex AI, pero solo de 200.000 tokens en Microsoft Foundry. AWS confirmó la disponibilidad el mismo día en su servicio Bedrock y en Claude Platform.

Para los responsables de operaciones e ingeniería, Opus 4.8 afina el conjunto de herramientas de control de costes sin redefinir el suelo de precios de la inferencia. La ausencia de datos independientes sobre latencia y precisión deja a los primeros adoptantes con una pregunta abierta: cuánto ahorran realmente las palancas de esfuerzo en cargas de trabajo reales, y a costa de qué calidad.

— Fin —