El 31 de mayo de 2026 a las 15:59 UTC, expiró la promoción del 75% de descuento en DeepSeek V4 Pro. Los precios debían volver a los niveles originales. Pero no lo hicieron. DeepSeek decidió que el descuento no era una oferta temporal — era el nuevo precio, y punto. Desde entonces, el modelo insignia de la compañía china cuesta una cuarta parte de lo que costaba antes, y los competidores tienen un problema serio.
El movimiento es extraordinario por su audacia. DeepSeek no anunció un descuento renovable ni una oferta de lanzamiento extendida. Simplemente ajustó su página de precios oficial para mostrar las tarifas reducidas como los precios estándar, con los originales tachados. Una nota al pie lo aclara sin ambigüedad: “El precio de la API del modelo deepseek-v4-pro se ajustará oficialmente a 1/4 del precio original después de que termine la promoción del 75% de descuento.” La promoción terminó, y el ajuste se volvió permanente.
¿Cuánto estamos hablando? V4 Pro cuesta ahora $0.003625 por millón de tokens en input con acierto de caché, $0.435 en input sin caché, y $0.87 en output. El output antes costaba $3.48. Esa cifra — $0.87 por millón de tokens de output — coloca a DeepSeek V4 Pro en un territorio de precios que hasta hace meses era impensable para un modelo de clase fronteriza. Para ponerlo en contexto, es aproximadamente diez veces más barato que los modelos Opus de Anthropic en output, y compite directamente con modelos mucho más pequeños y menos capaces.
DeepSeek atribuye esta eficiencia a su arquitectura de atención híbrida, un diseño que reduce los costos computacionales por token sin sacrificar la calidad del modelo. No es una optimización marginal: es un rediseño fundamental de cómo el modelo procesa información, y los resultados en precios hablan por sí solos. Mientras otros laboratorios compiten por hacer modelos más grandes, DeepSeek encontró una vía para hacerlos más baratos sin achicarlos.
El V4 Pro no está solo en esta estrategia. Su hermano menor, el V4 Flash, ofrece precios aún más agresivos — $0.28 por millón de tokens en output — ideal para cargas de trabajo más ligeras. Ambos modelos comparten especificaciones técnicas impresionantes: un contexto de 1 millón de tokens y una capacidad de output de hasta 384 mil tokens. Son números que ningún otro modelo fronteriza iguala a estos precios. Y vienen con soporte para modos de thinking y no-thinking, llamadas a herramientas, output JSON, y finalización FIM en beta.
Hay un detalle adicional que pocos están notando. DeepSeek ya había reducido el precio del input con acierto de caché a 1/10 del precio de lanzamiento para todos sus modelos desde el 26 de abril de 2026. Es decir, la compañía viene bajando precios de forma consistente, no como una promoción única sino como una estrategia estructural. El mensaje es claro: DeepSeek quiere ser el proveedor de infraestructura de IA más barato del mercado, y está dispuesto a mantener esa promesa.
Por qué importa
Esto no es solo una guerra de precios. Es un replanteamiento de lo que significa ser un modelo fronterizo. Hasta ahora, la frontera era sinónimo de caro. Los modelos más capaces costaban más porque eran difíciles de entrenar y ejecutar. DeepSeek V4 Pro rompe esa ecuación: ofrece capacidades de primer nivel a precios de commodity. Para los desarrolladores, esto significa que construir aplicaciones nativas de IA deja de ser un lujo. Para los competidores — Anthropic, OpenAI, Google — significa que la presión por bajar precios o diferenciarse en capacidad se intensifica de golpe.
El V4 Pro no solo es barato: es barato permanentemente. Y eso cambia las reglas del juego.
Fuente principal: DeepSeek API Documentation — Models & Pricing