NVIDIA запускает семейство открытых моделей для агентного ИИ
Линейка Nemotron 3, в которую входят модели Nano, Super и Ultra, обеспечивает высокую производительность для мультиагентных систем искусственного интеллекта, сочетая в себе передовые возможности рассуждения, ведения диалога и коллективного взаимодействия агентов. Модели используют гибридную архитектуру Mamba-Transformer mixture-of-experts (MoE), обеспечивая лучшую в своем классе скорость инференса и поддержку контекста объемом до 1 миллиона токенов.
Nemotron 3 Nano – самая маленькая модель в семействе. Она оптимизирована для экономичного инференса и таких задач, как отладка программного обеспечения, обобщение контента, работа ИИ-ассистентов и поиск информации. Несмотря на наличие 30 миллиардов параметров, модель динамически активирует только около 3 миллиардов параметров на токен. Благодаря уникальной гибридной MoE-архитектуре Nano обеспечивает до 4 раз более высокую пропускную способность по сравнению с предыдущей версией модели и сокращает генерацию токенов рассуждения на 60%, сохраняя при этом высокую точность. Ранние тесты показывают, что Nano превосходит сопоставимые открытые модели, в частности GPT-OSS-20B и Qwen3-30B, в задачах логического мышления и работы с длинным контекстом.
Модели Nemotron 3 Super и Ultra расширяют эти возможности для коллаборативных ИИ-агентов и сложных приложений искусственного интеллекта. Они используют такие инновации, как latent MoE – аппаратное обеспечение, которое повышает качество модели без потери эффективности, а также multi-token prediction (MTP), что улучшает генерацию длинных текстов и многошаговое мышление. Обе модели обучаются с помощью формата NVFP4 от NVIDIA, который обеспечивает более быстрое обучение и снижает требования к памяти.
Все модели Nemotron 3 проходят постобучение с помощью обучения с подкреплением (reinforcement learning, RL) во множестве сред. Это позволяет им эффективно работать с математическими и научными задачами, участвовать в соревнованиях по программированию, выполнять инструкции, разрабатывать ПО, вести диалоги и использовать инструменты мультиагентных систем. Также поддерживается детальный контроль бюджета во время инференса, что дает разработчикам возможность точно балансировать между точностью ответов и вычислительными затратами.
Компания NVIDIA также опубликовала комплексный набор датасетов, библиотеки для обучения и инструментов оценки, включая более трех триллионов токенов данных для предварительного обучения и обучения с подкреплением, библиотеки с открытым кодом NeMo Gym и NeMo RL, а также набор данных Nemotron Agentic Safety Dataset для оценки безопасности агентных систем в реальных сценариях.
Семейство Nemotron 3 призвано предоставить разработчикам, стартапам и предприятиям возможность прозрачно и эффективно создавать специализированных AI-агентов. Модель Nano уже доступна на платформах Hugging Face, через микросервисы NVIDIA NIM, а также на основных облачных и ИИ-платформах, в частности AWS, Google Cloud и Microsoft Foundry. Выпуск моделей Super и Ultra ожидается в первой половине 2026 года.
Первые пользователи, среди которых Accenture, ServiceNow, Perplexity и Palantir, уже интегрируют модели Nemotron 3 в свои рабочие процессы производства, кибербезопасность, разработку программного обеспечения, медиа и корпоративные системы.
С помощью Nemotron 3 компания NVIDIA работает над новым стандартом для эффективных и точных моделей искусственного интеллекта с открытым исходным кодом. Это позволит разработчикам масштабировать агентские AI-решения от прототипа до внедрения на предприятии, сохраняя при этом прозрачность, экономическую эффективность и высочайшие показатели производительности.