DeepSeek anunció el sábado que el descuento promocional del 75 % en su API V4-Pro —que originalmente vencía a finales de mayo— se convertirá en el precio de lista permanente del modelo, consolidando un recorte que reduce el costo de acceder a uno de los grandes modelos de lenguaje más capaces a una fracción de su nivel de lanzamiento.
La decisión, adelantada por Reuters y confirmada en las propias páginas de precios de DeepSeek, supone la última escalada en una guerra de precios que domina el sector chino de la inteligencia artificial desde 2024 y que condiciona cada vez más la economía de la adopción empresarial en todo el mundo. Para los desarrolladores que utilizan el modelo de 1,6 billones de parámetros en tareas de contexto largo, las nuevas tarifas permanentes implican que la ventaja de precio del período promocional no se desvanecerá.
Según la documentación actualizada, los precios más bajos —que entran en vigor después del 31 de mayo a las 15:59 UTC— serán de 0,003625 dólares por millón de tokens para entradas con acierto en caché, 0,435 para entradas que no aciertan en caché y 0,87 para salida. Los precios de lista originales, ya tachados, eran 0,0145, 1,74 y 3,48 dólares. En yuanes, las cifras cayeron de 0,1, 12 y 24 a 0,025, 3 y 6. El modelo más pequeño, V4-Flash, de 284.000 millones de parámetros, no resultó afectado por el cambio.
DeepSeek presentó la serie V4 en vista previa el 24 de abril, situando a V4-Pro como el modelo de mayor rendimiento de la familia. Cuenta con 1,6 billones de parámetros totales —49.000 millones activos— y admite una ventana de contexto de un millón de tokens, características adecuadas para codificación con agentes, análisis de grandes documentos y otras cargas de trabajo de inferencia extendida. Su límite de concurrencia de 500 refleja las mayores exigencias de cómputo en comparación con los 2.500 de la variante V4-Flash.
El laboratorio tiene un historial de precios agresivos. En febrero de 2025 ofreció a los desarrolladores descuentos en horas valle de hasta el 75 % en sus modelos V3 y R1, y una guerra de precios más amplia entre los LLM chinos estalló en mayo de 2024 cuando Tencent, iFlytek, ByteDance y otros recortaron tarifas. El recorte temporal del 75 % en V4-Pro, aplicado el 26 de abril, se esperaba inicialmente que terminara —algunos rastreadores externos habían situado la expiración a principios de mayo—, pero la última actualización de DeepSeek elimina esa incertidumbre al formalizar el descuento como tarifa base.
Por qué DeepSeek puede mantener el recorte de forma permanente sigue sin explicación. Reuters informó de que la compañía no vinculó la decisión a una mayor disponibilidad de los chips Huawei Ascend 950, a pesar de que Tom’s Hardware había sugerido anteriormente que los precios caerían significativamente una vez que los supernodos Ascend 950 entraran en producción masiva. Las ganancias derivadas de la optimización de la inferencia, los menores costes de cómputo o un impulso estratégico por ganar cuota de mercado son razones plausibles, pero no se ha proporcionado ninguna justificación oficial.
La decisión ejerce presión inmediata sobre competidores como OpenAI, Anthropic y Google, cuyos modelos comparables pueden costar varias veces más. También acelera el cálculo de precios para las empresas que utilizan pasarelas de API y revendedores, aunque los ahorros reales dependerán de las tasas de acierto en caché y del consumo de salida. A falta de una respuesta de los rivales, la reducción permanente profundiza el giro del sector hacia una inferencia cada vez más barata, poniendo a prueba los supuestos de margen que sustentan el mercado de LLM como servicio.