Nemotron 3 Ultra e Odysseus: a maior semana do open-source em IA

NVIDIA lançou Nemotron 3 Ultra, um modelo aberto de 550B parâmetros otimizado para agentes autônomos. PewDiePie lançou Odysseus, um workspace de IA self-hosted que explodiu no GitHub. Duas faces do mesmo movimento em direção à IA aberta e local.

A primeira semana de junho de 2026 trouxe dois anúncios que, vistos juntos, contam uma história clara: a IA aberta e executável localmente já não é uma promessa, é uma realidade tangível.

Em 4 de junho, a NVIDIA apresentou o Nemotron 3 Ultra na GTC San José 2026. É seu modelo aberto maior até a data: 550 bilhões de parâmetros totais, 55 bilhões ativos por token, arquitetura MoE híbrida Mamba-Attention e um contexto de até 1 milhão de tokens. E não é um modelo de chat genérico — a NVIDIA o projetou explicitamente para agentes autônomos de longa duração.

Três dias antes, em 31 de maio, Felix Kjellberg (PewDiePie) lançou o Odysseus, um workspace de IA self-hosted sob licença MIT. Em questão de dias acumulou mais de 52.000 estrelas no GitHub e 6.100 forks. É uma plataforma completa: chat multimodal, agentes com ferramentas, deep research, editor de documentos, calendário, e-mail e mais — tudo rodando no hardware do usuário via Docker ou instalação nativa.

São dois mundos distintos — um laboratório de pesquisa empresarial e um criador de conteúdo individual — convergindo na mesma direção.

Nemotron 3 Ultra: um modelo construído para agentes

Nemotron 3 Ultra não é simplesmente outro modelo open-source grande. Sua arquitetura LatentMoE combina camadas Mamba-2 (state space models) com atenção tradicional e mistura de especialistas, alcançando 90% de sparse active — apenas 55B dos 550B parâmetros são ativados por token. Isso lhe dá um throughput 5,9x superior ao GLM-5.1-754B-A40B e 1,6x superior ao Qwen-3.5-397B-17B em benchmarks de contexto longo.

O modelo está disponível no HuggingFace sob licença OpenMDW-1.1, com vários checkpoints: BF16 (pós-treinado), NVFP4 (quantizado), Base BF16 e GenRM (reward model para julgamento de respostas). Pode ser executado via NVIDIA NIM, vLLM (suporte dia 1), SGLang, Ollama, Together AI e AWS SageMaker JumpStart.

O dado chave está no título do blog oficial da NVIDIA: “Nemotron 3 Ultra Powers Faster, More Efficient Reasoning for Long-Running Agents”. Não é um modelo para respostas rápidas de chat. É um modelo para agentes que precisam manter contexto, planejar, executar ferramentas e raciocinar durante minutos ou horas.

Os requisitos de hardware são elevados: mínimo 8 GPUs GB200/B200/GB300/B300 ou 16 H100/8 H200. Não é um modelo para seu laptop. Mas o suporte em Ollama e vLLM sugere que versões menores ou quantizadas chegarão em breve ao ecossistema local.

Odysseus: o workspace de IA que explodiu no GitHub

Odysseus é um projeto que desafia categorias fáceis. Os vídeos do YouTube o chamam de “um agente de IA”, mas é mais preciso descrevê-lo como um workspace de IA autogerenciado que inclui um sistema de agentes entre muitas outras funções.

A interface oferece chat multimodal (vLLM, llama.cpp, Ollama, OpenRouter, OpenAI, GitHub Copilot), um sistema de agentes com tool-calling (MCP, web, arquivos, shell, skills, memória via ChromaDB), um “cookbook” que escaneia o hardware e recomenda modelos conforme a VRAM disponível, deep research com fontes web, comparação cega de modelos, editor de documentos, triagem de e-mail, notas e tarefas, calendário com sincronização CalDAV e suporte PWA para celulares.

Tudo roda localmente. Docker é o método recomendado, mas também funciona com instalação nativa em Linux e macOS (incluindo Apple Silicon).

A escala de adoção foi imediata: 52.000+ estrelas em cinco dias é um dos lançamentos open-source mais rápidos de 2026. O repositório está sob a organização pewdiepie-archdaemon no GitHub, embora o grau de contribuição pessoal de Kjellberg vs. a comunidade não esteja completamente documentado. O projeto é construído sobre código aberto existente (opencode, llmfit, Tongyi DeepResearch), o que é coerente com a filosofia do projeto.

O que tudo isso significa

O padrão é inconfundível. No mesmo período de cinco dias:

Um laboratório de pesquisa com décadas de história libera seu modelo mais potente como open-weight, otimizado para agentes autônomos.
Um criador de conteúdo com 120 milhões de inscritos lança um workspace de IA local que compete funcionalmente com ChatGPT e Claude.

Ambos apostam no mesmo: modelos abertos, execução local, agentes com ferramentas e um ecossistema onde o usuário tem controle sobre seus dados e sua infraestrutura.

Para desenvolvedores, a mensagem é prática: já existem as peças para montar seu próprio ambiente de IA autogerenciado. Nemotron 3 Ultra te dá o modelo. Odysseus te dá a interface e os agentes. E tudo é open-source, executável sem depender de APIs externas.

A pergunta que segue não é “se” a IA local é viável, mas “até onde ela pode chegar”.

Fontes principais: NVIDIA Nemotron 3 Ultra · Odysseus GitHub · NVIDIA Developer Blog

Nemotron 3 Ultra e Odysseus: a maior semana do open-source em IA

Nemotron 3 Ultra: um modelo construído para agentes

Odysseus: o workspace de IA que explodiu no GitHub

O que tudo isso significa

Mais nesta categoria