Nemotron 3 Ultra 与 Odysseus：开源AI史上最重大的一周

NVIDIA 发布了 Nemotron 3 Ultra，一个面向自主智能体优化的 5500 亿参数开源模型。PewDiePie 发布了 Odysseus，一个在 GitHub 上爆火的自托管 AI 工作空间。两者代表了同一场走向开放、本地化 AI 运动的两面。

2026 年 6 月的第一周带来了两个消息，放在一起看，它们讲述了一个清晰的故事：开放且可本地运行的 AI 不再是承诺，而是触手可及的现实。

6 月 4 日，NVIDIA 在 GTC San José 2026 上发布了 Nemotron 3 Ultra。这是其迄今为止最大的开源模型：总计 5500 亿参数，每 token 激活 550 亿参数，采用混合 Mamba-Attention MoE 架构，上下文长度达 100 万 token。这不是一个通用聊天模型——NVIDIA 专门为长期运行的自主智能体设计了它。

三天前的 5 月 31 日，Felix Kjellberg（PewDiePie）发布了 Odysseus，一个采用 MIT 许可证的自托管 AI 工作空间。短短几天内，它在 GitHub 上获得了超过 52,000 颗星和 6,100 个 fork。这是一个完整的平台：多模态聊天、带工具的智能体、深度研究、文档编辑器、日历、电子邮件等——全部通过 Docker 或原生安装在用户自己的硬件上运行。

这是两个不同的世界——一个企业研究实验室和一个个人内容创作者——汇聚在了同一个方向上。

Nemotron 3 Ultra：为智能体构建的模型

Nemotron 3 Ultra 并非又一个大型开源模型。其 LatentMoE 架构将 Mamba-2 状态空间模型层与传统注意力和混合专家相结合，实现了 90% 的稀疏激活——5500 亿参数中每 token 仅激活 550 亿。这使得它在长上下文基准测试中的吞吐量比 GLM-5.1-754B-A40B 高 5.9 倍，比 Qwen-3.5-397B-17B 高 1.6 倍。

该模型在 HuggingFace 上以 OpenMDW-1.1 许可证提供，包含多个检查点：BF16（后训练）、NVFP4（量化）、Base BF16 和 GenRM（用于答案评判的奖励模型）。可通过 NVIDIA NIM、vLLM（首发支持）、SGLang、Ollama、Together AI 和 AWS SageMaker JumpStart 运行。

关键信息就在 NVIDIA 官方博客的标题中：“Nemotron 3 Ultra Powers Faster, More Efficient Reasoning for Long-Running Agents”。它不是为快速聊天回复设计的模型，而是为需要维持上下文、规划、执行工具并推理数分钟乃至数小时的智能体设计的。

硬件需求较高：至少 8 块 GB200/B200/GB300/B300 GPU，或 16 块 H100/8 块 H200。这不是一个能在笔记本电脑上运行的模型。但 Ollama 和 vLLM 的支持表明，更小或量化版本将很快进入本地生态。

Odysseus：在 GitHub 上爆火的 AI 工作空间

Odysseus 是一个难以简单归类的项目。YouTube 视频称其为”AI 智能体”，但更准确的说法是，它是一个自管理的 AI 工作空间，包含一个智能体系统以及许多其他功能。

其界面提供多模态聊天（vLLM、llama.cpp、Ollama、OpenRouter、OpenAI、GitHub Copilot）、带工具调用的智能体系统（MCP、网络、文件、Shell、技能、通过 ChromaDB 实现的记忆）、扫描硬件并根据可用 VRAM 推荐模型的”食谱”、带网络来源的深度研究、模型盲测对比、文档编辑器、邮件分类、笔记和任务、CalDAV 日历同步以及移动端 PWA 支持。

一切都在本地运行。推荐使用 Docker，但也支持 Linux 和 macOS（包括 Apple Silicon）的原生安装。

采用规模立竿见影：五天 52,000+ 颗星是 2026 年最快的开源发布之一。仓库位于 GitHub 的 pewdiepie-archdaemon 组织下，不过 Kjellberg 个人与社区的贡献比例尚未完全明确。该项目建立在现有开源代码（opencode、llmfit、Tongyi DeepResearch）之上，这与项目理念一致。

这一切意味着什么

模式清晰可见。在同一五天时间内：

一个拥有数十年历史的研究实验室发布了其最强大的模型，采用开放权重，为自主智能体优化。
一个拥有 1.2 亿订阅者的内容创作者发布了一个在功能上与 ChatGPT 和 Claude 竞争的本地 AI 工作空间。

两者押注于同一件事：开放模型、本地运行、带工具的智能体，以及用户掌握数据和基础设施控制权的生态。

对于开发者来说，信息是实用的：构建自己自管理 AI 环境的组件已经存在。Nemotron 3 Ultra 提供了模型。Odysseus 提供了界面和智能体。一切都是开源的，无需依赖外部 API 即可运行。

接下来的问题不再是”本地 AI 是否可行”，而是”它能走多远”。

主要来源：NVIDIA Nemotron 3 Ultra · Odysseus GitHub · NVIDIA Developer Blog

Nemotron 3 Ultra 与 Odysseus：开源AI史上最重大的一周

Nemotron 3 Ultra：为智能体构建的模型

Odysseus：在 GitHub 上爆火的 AI 工作空间

这一切意味着什么

同分类更多文章