IA al Día
高效了解 AI 的方式
返回归档
行业 2026年6月2日 分析 4 分钟阅读

Token短缺的时代

2023和2024年间,AI行业向你兜售了一个想法:你可以按月固定费率无限使用最先进的模型。这当然是骗人的——但它奏效了。数百万开发者以每月10、20或30美元的价格订阅了GitHub Copilot、Claude和ChatGPT。感觉就像自助餐。问题是,当食客学会大吃特吃时,自助餐总有终结的一天。

Token短缺的时代
作者 IA al Día

2023和2024年间,AI行业向你兜售了一个想法:你可以按月固定费率无限使用最先进的模型。这当然是骗人的——但它奏效了。数百万开发者以每月10、20或30美元的价格订阅了GitHub Copilot、Claude和ChatGPT。感觉就像自助餐。问题是,当食客学会大吃特吃时,自助餐总有终结的一天。

而食客们确实学会了。自主代码智能体——Claude Code、Cursor、Copilot智能体——发现它们可以比人类对话消耗多10倍、50倍、100倍的token。推理成本因此飙升。

短短几个月内,整个行业来了个180度大转弯。多年来一直采用无限制固定订阅模式的GitHub Copilot,于2026年6月1日转向了基于token的信用点系统。他们称之为”GitHub AI Credits”:1信用点 = 0.01美元,每个模型每token消耗不同数量的信用点。每月10美元的Pro计划提供1,500信用点;39美元的Pro+提供7,000;100美元的Max提供20,000。代码自动补全仍然不限量,但其他所有功能——聊天、终端、云端智能体——都要计量收费。

Anthropic从更早就在做同样的事。自2025年11月起,它开始将其Claude企业客户从按席位计费模式迁移到按token定价。到2026年4月,迁移已完成。自2026年6月15日起,Claude的智能体工具和第三方集成商将按完整的API费率计费。补贴时代结束了。

最能说明这场地震的案例是Uber。2026年2月,其32%的工程师在使用Claude Code。3月,84%。到4月时,近95%的人每月使用AI工具,70%的提交代码由AI生成。这听起来像是生产力上的成功——除了成本在短短四个月内就吃掉了整个2026年的AI预算。CTO Praveen Neppalli Naga向The Information证实了这一点。COO Andrew Macdonald说得更直白:他在接受Fortune采访时表示,AI支出与用户可见功能之间的关联”还不存在”。每位工程师的月成本在500到2,000美元之间。重度用户同时运行10个或更多worktree,每个都在不停地消耗Claude的token。

微软也感受到了冲击。2026年5月,它开始取消为Windows、Teams、Outlook和Surface工程师配备的Claude Code许可证,将他们转向GitHub Copilot CLI。原因不是技术问题——而是成本问题。基于token的计费模式使得Anthropic的工具明显比微软自己的工具更贵。到6月30日,访问将被切断。

这一切都是杰文斯悖论在AI领域的体现:随着每token价格下降——Anthropic将Opus从每百万token 15/75美元降至5/25美元;Nvidia承诺借助Vera Rubin平台实现50倍改进——消费量的增长速度超过了价格下降的速度。结果是:尽管单价在下降,总账单却在上升。Nvidia CEO黄仁勋在GTC 2026上将其总结为将数据中心描述为”Token工厂”。它们不再是文件仓库;而是推理生产车间。

打击不仅限于企业。OpenAI每收入1美元就损失约1.35美元。据Yahoo Finance报道,其内部预测预计2026年亏损140亿美元,2023至2028年间累计亏损440亿美元,直到2029年才能实现盈利。Deloitte预测,2026年推理将占AI总计算量的三分之二,而2023年这一比例仅为三分之一。Gartner预计今年仅AI基础设施支出就达4,010亿美元。

然而,还有一个令人不安的细节。VentureBeat报道称,企业的GPU利用率平均仅为5%。企业购买了远超所需的硬件,却未充分利用,现在面临3至5年的折旧周期。问题并不完全是token不够——而是当前的消费架构极其低效,市场正从补贴模式转向反映真实成本模式。

为什么重要

无限量固定订阅时代已经结束。对初创公司和独立开发者来说,这意味着使用AI工具的成本现在是可变的,并且可能不可预测地飙升。对企业而言,这意味着采用AI不再仅仅是生产力决策——它是一项需要预算、监控和优化的财务决策。

这一转变的受益者是基础设施供应商(Nvidia、云服务商)、优化平台以及能够实现高效大规模推理的模型。其他所有人——企业、开发者、初创公司——将不得不学会生活在一个每个token都算数的世界。

自助餐结束了。欢迎来到短缺时代。


主要来源:Uber burned through its entire 2026 AI budget in four months — Fortune

同分类更多文章