IA al Día
高效了解 AI 的方式
返回归档
模型 2026年6月5日 分析 3 分钟阅读

Nemotron 3 Ultra 与 Odysseus:开源AI史上最重大的一周

NVIDIA 发布了 Nemotron 3 Ultra,一个面向自主智能体优化的 5500 亿参数开源模型。PewDiePie 发布了 Odysseus,一个在 GitHub 上爆火的自托管 AI 工作空间。两者代表了同一场走向开放、本地化 AI 运动的两面。

Nemotron 3 Ultra 与 Odysseus:开源AI史上最重大的一周
作者 IA al Día

2026 年 6 月的第一周带来了两个消息,放在一起看,它们讲述了一个清晰的故事:开放且可本地运行的 AI 不再是承诺,而是触手可及的现实。

6 月 4 日,NVIDIA 在 GTC San José 2026 上发布了 Nemotron 3 Ultra。这是其迄今为止最大的开源模型:总计 5500 亿参数,每 token 激活 550 亿参数,采用混合 Mamba-Attention MoE 架构,上下文长度达 100 万 token。这不是一个通用聊天模型——NVIDIA 专门为长期运行的自主智能体设计了它。

三天前的 5 月 31 日,Felix Kjellberg(PewDiePie)发布了 Odysseus,一个采用 MIT 许可证的自托管 AI 工作空间。短短几天内,它在 GitHub 上获得了超过 52,000 颗星和 6,100 个 fork。这是一个完整的平台:多模态聊天、带工具的智能体、深度研究、文档编辑器、日历、电子邮件等——全部通过 Docker 或原生安装在用户自己的硬件上运行。

这是两个不同的世界——一个企业研究实验室和一个个人内容创作者——汇聚在了同一个方向上。

Nemotron 3 Ultra:为智能体构建的模型

Nemotron 3 Ultra 并非又一个大型开源模型。其 LatentMoE 架构将 Mamba-2 状态空间模型层与传统注意力和混合专家相结合,实现了 90% 的稀疏激活——5500 亿参数中每 token 仅激活 550 亿。这使得它在长上下文基准测试中的吞吐量比 GLM-5.1-754B-A40B 高 5.9 倍,比 Qwen-3.5-397B-17B 高 1.6 倍。

该模型在 HuggingFace 上以 OpenMDW-1.1 许可证提供,包含多个检查点:BF16(后训练)、NVFP4(量化)、Base BF16 和 GenRM(用于答案评判的奖励模型)。可通过 NVIDIA NIM、vLLM(首发支持)、SGLang、Ollama、Together AI 和 AWS SageMaker JumpStart 运行。

关键信息就在 NVIDIA 官方博客的标题中:“Nemotron 3 Ultra Powers Faster, More Efficient Reasoning for Long-Running Agents”。它不是为快速聊天回复设计的模型,而是为需要维持上下文、规划、执行工具并推理数分钟乃至数小时的智能体设计的。

硬件需求较高:至少 8 块 GB200/B200/GB300/B300 GPU,或 16 块 H100/8 块 H200。这不是一个能在笔记本电脑上运行的模型。但 Ollama 和 vLLM 的支持表明,更小或量化版本将很快进入本地生态。

Odysseus:在 GitHub 上爆火的 AI 工作空间

Odysseus 是一个难以简单归类的项目。YouTube 视频称其为”AI 智能体”,但更准确的说法是,它是一个自管理的 AI 工作空间,包含一个智能体系统以及许多其他功能。

其界面提供多模态聊天(vLLM、llama.cpp、Ollama、OpenRouter、OpenAI、GitHub Copilot)、带工具调用的智能体系统(MCP、网络、文件、Shell、技能、通过 ChromaDB 实现的记忆)、扫描硬件并根据可用 VRAM 推荐模型的”食谱”、带网络来源的深度研究、模型盲测对比、文档编辑器、邮件分类、笔记和任务、CalDAV 日历同步以及移动端 PWA 支持。

一切都在本地运行。推荐使用 Docker,但也支持 Linux 和 macOS(包括 Apple Silicon)的原生安装。

采用规模立竿见影:五天 52,000+ 颗星是 2026 年最快的开源发布之一。仓库位于 GitHub 的 pewdiepie-archdaemon 组织下,不过 Kjellberg 个人与社区的贡献比例尚未完全明确。该项目建立在现有开源代码(opencode、llmfit、Tongyi DeepResearch)之上,这与项目理念一致。

这一切意味着什么

模式清晰可见。在同一五天时间内:

  • 一个拥有数十年历史的研究实验室发布了其最强大的模型,采用开放权重,为自主智能体优化。
  • 一个拥有 1.2 亿订阅者的内容创作者发布了一个在功能上与 ChatGPT 和 Claude 竞争的本地 AI 工作空间。

两者押注于同一件事:开放模型、本地运行、带工具的智能体,以及用户掌握数据和基础设施控制权的生态。

对于开发者来说,信息是实用的:构建自己自管理 AI 环境的组件已经存在。Nemotron 3 Ultra 提供了模型。Odysseus 提供了界面和智能体。一切都是开源的,无需依赖外部 API 即可运行。

接下来的问题不再是”本地 AI 是否可行”,而是”它能走多远”。


主要来源:NVIDIA Nemotron 3 Ultra · Odysseus GitHub · NVIDIA Developer Blog

同分类更多文章