分类

模型

语言模型、基准测试、发布、评估与对比。

模型 2026年6月5日分析 3 分钟

Nemotron 3 Ultra 与 Odysseus：开源AI史上最重大的一周

NVIDIA 发布了 Nemotron 3 Ultra，一个面向自主智能体优化的 5500 亿参数开源模型。PewDiePie 发布了 Odysseus，一个在 GitHub 上爆火的自托管 AI 工作空间。两者代表了同一场走向开放、本地化 AI 运动的两面。

NVIDIA Research — Nemotron 3 Ultra

Nemotron 3 Ultra 与 Odysseus：开源AI史上最重大的一周

模型 2026年6月3日分析 6 分钟

Qwen 3.7 Plus 对比 3.6 Plus、3.7 Max、DeepSeek V4 Pro 和 Opus 4.8：编程与智能体终极对比评测

2026年6月1日，阿里巴巴发布了 Qwen 3.7 Plus，瞬间彻底重新洗牌了关于哪款模型适合用于智能体编程的讨论。并不是因为它在所有基准测试中都是最好的——事实并非如此——而是因为它将三个此前从未共存于单一模型中的特性结合在了一起：低廉的价格、多模态视觉能力，以及长达35小时的自主运行上限。十一天前，纯文本旗舰模型 Qwen 3.

Qwen 3.7 Plus vs Qwen 3.7 Max — ofox.ai

Qwen 3.7 Plus 对比 3.6 Plus、3.7 Max、DeepSeek V4 Pro 和 Opus 4.8：编程与智能体终极对比评测

模型 2026年6月2日分析 4 分钟

Claude Opus 4.8：Anthropic打造了一个更诚实的模型……但这带来了意想不到的问题

2026年5月28日，距Opus 4.7发布仅六周后，Anthropic发布了Claude Opus 4.8，其定位对于正处于商业竞争白热化阶段的人工智能实验室来说非同寻常：该公司宣称其旗舰模型首先是更加诚实。数据也支持这一点——但完整的故事远比一份简单的新闻稿复杂得多。

Claude Opus 4.8 System Card (244-page PDF)

Claude Opus 4.8：Anthropic打造了一个更诚实的模型……但这带来了意想不到的问题

模型 2026年6月2日分析 3 分钟

NVIDIA Cosmos 3：首个理解物理世界的开放模型

2026年5月31日，在COMPUTEX台北国际电脑展上的GTC Taipei活动中，NVIDIA发布了Cosmos 3，一个有望改变机器人和自动驾驶车辆理解世界方式的模型。这并非Cosmos家族的又一次迭代：这是一次完整的架构跃迁，并且它带着一个没有其他人能够声称的标签——首个完全开放的物理AI"全能模型"（omnimodel）。

模型 2026年6月1日分析 2 分钟

Claude Opus 4.8：Anthropic 押注于自我质疑的模型

Anthropic 于 2026 年 5 月 28 日发布了 Claude Opus 4.8。虽然这不是一次代际飞跃，但这一举措充分说明了行业的发展方向。

Introducing Claude Opus 4.8 — Anthropic