Em 31 de maio de 2026 às 15:59 UTC, expirou a promoção de 75% de desconto no DeepSeek V4 Pro. Os preços deveriam voltar aos níveis originais. Mas não voltaram. A DeepSeek decidiu que o desconto não era uma oferta temporária — era o novo preço, e ponto. Desde então, o modelo carro-chefe da empresa chinesa custa um quarto do que custava antes, e os concorrentes têm um problema sério.
A jogada é extraordinária pela sua audácia. A DeepSeek não anunciou um desconto renovável nem uma oferta de lançamento estendida. Simplesmente ajustou sua página de preços oficial para mostrar as tarifas reduzidas como os preços padrão, com os originais riscados. Uma nota de rodapé esclarece sem ambiguidade: “O preço da API do modelo deepseek-v4-pro será oficialmente ajustado para 1/4 do preço original após o término da promoção de 75% de desconto.” A promoção terminou, e o ajuste se tornou permanente.
De quanto estamos falando? O V4 Pro custa agora $0,003625 por milhão de tokens em input com acerto de cache, $0,435 em input sem cache, e $0,87 em output. O output antes custava $3,48. Esse número — $0,87 por milhão de tokens de output — coloca o DeepSeek V4 Pro em um território de preços que até meses atrás era impensável para um modelo de classe fronteiriça. Para contextualizar, é aproximadamente dez vezes mais barato que os modelos Opus da Anthropic em output, e compete diretamente com modelos muito menores e menos capazes.
A DeepSeek atribui essa eficiência à sua arquitetura de atenção híbrida, um design que reduz os custos computacionais por token sem sacrificar a qualidade do modelo. Não é uma otimização marginal: é um redesenho fundamental de como o modelo processa informações, e os resultados nos preços falam por si. Enquanto outros laboratórios competem para fazer modelos maiores, a DeepSeek encontrou um caminho para torná-los mais baratos sem diminuí-los.
O V4 Pro não está sozinho nessa estratégia. Seu irmão menor, o V4 Flash, oferece preços ainda mais agressivos — $0,28 por milhão de tokens em output — ideal para cargas de trabalho mais leves. Ambos os modelos compartilham especificações técnicas impressionantes: um contexto de 1 milhão de tokens e uma capacidade de output de até 384 mil tokens. São números que nenhum outro modelo de fronteira iguala a esses preços. E vêm com suporte para modos de thinking e não-thinking, chamadas a ferramentas, output JSON, e finalização FIM em beta.
Há um detalhe adicional que poucos estão notando. A DeepSeek já havia reduzido o preço do input com acerto de cache para 1/10 do preço de lançamento para todos os seus modelos desde 26 de abril de 2026. Ou seja, a empresa vem baixando preços de forma consistente, não como uma promoção única, mas como uma estratégia estrutural. A mensagem é clara: a DeepSeek quer ser o provedor de infraestrutura de IA mais barato do mercado, e está disposta a manter essa promessa.
Por que isso importa
Isso não é apenas uma guerra de preços. É uma reconsideração do que significa ser um modelo de fronteira. Até agora, a fronteira era sinônimo de caro. Os modelos mais capazes custavam mais porque eram difíceis de treinar e executar. O DeepSeek V4 Pro quebra essa equação: oferece capacidades de primeiro nível a preços de commodity. Para os desenvolvedores, isso significa que construir aplicações nativas de IA deixa de ser um luxo. Para os concorrentes — Anthropic, OpenAI, Google — significa que a pressão para baixar preços ou se diferenciar em capacidade se intensifica de repente.
O V4 Pro não é apenas barato: é barato permanentemente. E isso muda as regras do jogo.
Fonte principal: DeepSeek API Documentation — Models & Pricing