La página oficial de precios de DeepSeek indica que el descuento del 75 % en la API de su modelo V4-Pro se convertirá en el nuevo precio de lista cuando la promoción expire el 31 de mayo, fijando así un coste de inferencia de frontera equivalente a un cuarto del precio original. Reuters adelantó la decisión el 23 de mayo citando un comunicado de la compañía y señaló que el modelo más avanzado del laboratorio chino mantendrá sus tarifas promocionales actuales, sujetas a ajustes futuros.
La reducción permanente prolonga la ola de precios agresivos en el mercado chino de IA y establece un nuevo suelo para los costes de inferencia de un modelo que, según DeepSeek, compite con las mejores alternativas de código cerrado. Para los desarrolladores que utilizan la API del propio laboratorio, el movimiento reduce de forma significativa los costes de entrada y salida y aumenta la presión sobre los competidores occidentales y chinos para que respondan.
El precio actual del V4-Pro, que pasará a ser el estándar el 1 de junio, fija las entradas con acierto de caché en 0,003625 dólares por millón de tokens, las entradas con fallo de caché en 0,435 dólares y la salida en 0,87 dólares, cada una exactamente un cuarto del precio de lanzamiento. En yuanes, la horquilla va de 0,025 a 6 yuanes por millón de tokens, frente a los 0,1‑24 yuanes anteriores, según Reuters. Un recorte adicional para las entradas con acierto de caché en todos los modelos, que las reduce a una décima parte del precio de lanzamiento, entró en vigor el 26 de abril.
DeepSeek lanzó V4-Pro el 24 de abril como la opción de gama alta dentro de su lanzamiento preliminar V4, un modelo de 1,6 billones de parámetros con 49.000 millones de parámetros activos y una ventana de contexto de un millón de tokens. La firma independiente de evaluación Artificial Analysis lo situó después como el más eficiente en costes tras el descuento del 75 %, según informó el South China Morning Post el 24 de mayo.
La página de precios incluye un aviso de que los precios de los productos pueden variar y que DeepSeek se reserva el derecho a modificarlos, por lo que las nuevas tarifas constituyen el precio oficial vigente y no una garantía irrevocable. El descuento se introdujo inicialmente como una promoción temporal que debía expirar el 5 de mayo; después se amplió hasta el 31 de mayo y, finalmente, la compañía decidió mantener los niveles reducidos.
Reuters señaló que DeepSeek no reveló si el recorte estaba vinculado a una mayor disponibilidad de los chips Ascend 950 de Huawei, un posible catalizador para reducir los costes de inferencia. La compañía no ofreció ninguna justificación para mantener el precio más bajo.
Quedan preguntas abiertas. La página de límites de uso de DeepSeek fija un tope de concurrencia de 500 para V4‑Pro, lo que podría restringir el acceso bajo cargas de trabajo intensas. No existen datos independientes sobre latencia, disponibilidad o fiabilidad con los nuevos precios, y no está claro si los revendedores o los mercados de nube trasladarán el descuento íntegro. Tampoco se han comunicado reacciones de precios confirmadas por parte de OpenAI, Anthropic, Google, Alibaba o ByteDance.
Para los desarrolladores que sopesan los costes de los modelos de frontera, la nueva referencia ofrece un punto de comparación que rebaja muchas alternativas, aunque su sostenibilidad depende de la capacidad y de futuros ajustes. El movimiento intensifica la presión sobre los proveedores de modelos de todo el mundo para que justifiquen sus tarifas premium.
