NVIDIA запускає сімейство відкритих моделей для агентного ШІ
Лінійка Nemotron 3, до якої входять моделі Nano, Super та Ultra, забезпечує високу продуктивність для мультиагентних систем штучного інтелекту, поєднуючи в собі передові можливості міркування, ведення діалогу та колективної взаємодії агентів. Моделі використовують гібридну архітектуру Mamba-Transformer mixture-of-experts (MoE), забезпечуючи найкращу у своєму класі швидкість інференсу та підтримку контексту обсягом до 1 мільйона токенів.
Nemotron 3 Nano – найменша модель у сімействі. Вона оптимізована для економічного інференсу та таких завдань, як налагодження програмного забезпечення, узагальнення контенту, робота AI-асистентів і пошук інформації. Попри наявність 30 мільярдів параметрів, модель динамічно активує лише близько 3 мільярдів параметрів на токен. Завдяки унікальній гібридній MoE-архітектурі Nano забезпечує до 4 разів вищу пропускну здатність у порівнянні з попередньою версією моделі і скорочує генерацію токенів міркування на 60%, зберігаючи при цьому високу точність. Ранні тести показують, що Nano перевершує відповідні відкриті моделі, зокрема GPT-OSS-20B та Qwen3-30B, у завданнях логічного мислення та роботи з довгим контекстом.
Моделі Nemotron 3 Super та Ultra розширюють ці можливості для колаборативних ШІ-агентів і складних застосунків штучного інтелекту. Вони використовують такі інновації, як latent MoE – апаратне забезпечення, яке підвищує якість моделі без втрати ефективності, а також multi-token prediction (MTP), що покращує генерацію довгих текстів і багатокрокове міркування. Обидві моделі навчаються за допомогою формату NVFP4 від NVIDIA, що забезпечує швидше навчання та зменшує вимоги до пам’яті.
Усі моделі Nemotron 3 проходять постнавчання за допомою навчання з підкріпленням (reinforcement learning, RL) в багатьох середовищах. Це дозволяє їм ефективно працювати з математичними та науковими задачами, брати участь у змаганнях з програмування, виконувати інструкції, розробляти ПЗ, вести діалоги та використовувати інструменти мультиагентних систем. Також підтримується детальний контроль бюджету під час інференсу, що дає розробникам можливість точно балансувати між точністю відповідей та обчислювальними витратами.
Компанія NVIDIA також оприлюднила комплексний набір датасетів, бібліотек для навчання та інструментів оцінювання, у тому числі понад три трильйони токенів даних для попереднього навчання та навчання з підкріпленням, бібліотеки з відкритим кодом NeMo Gym та NeMo RL, а також набір даних Nemotron Agentic Safety Dataset для оцінювання безпеки агентних систем у реальних сценаріях.
Сімейство Nemotron 3 покликане надати розробникам, стартапам і підприємствам можливість прозоро та ефективно створювати спеціалізованих AI-агентів. Модель Nano вже доступна на платформах Hugging Face, через мікросервіси NVIDIA NIM, а також на основних хмарних і ШІ-платформах, зокрема AWS, Google Cloud і Microsoft Foundry. Випуск моделей Super та Ultra очікується у першій половині 2026 року.
Перші користувачі, серед яких Accenture, ServiceNow, Perplexity та Palantir, уже інтегрують моделі Nemotron 3 у свої робочі процеси виробництва, кібербезпеку, розробку програмного забезпечення, медіа та корпоративні системи.
За допомогою Nemotron 3 компанія NVIDIA працює над новим стандартом для ефективних і точних моделей штучного інтелекту з відкритим вихідним кодом. Це дозволить розробникам масштабувати агентні AI-рішення від прототипу до впровадження на підприємстві, зберігаючи при цьому прозорість, економічну ефективність і найвищі показники продуктивності.