У новій статті представлено Parallax — параметризовану версію локальної лінійної уваги (LLA) для трансформерів, яка підвищує ефективність без скорочення обчислювальних витрат. Parallax замінює обчислювач лінійних систем у LLA на навчену матрицю проекції, що спрощує алгоритм, підвищує його ефективність та полегшує реалізацію.
Розгортання великих мовних моделей на інстансах AWS з графічними процесорами може бути трудомістким процесом, але Amazon FSx for Lustre та NVIDIA GPUDirect Storage дозволяють значно скоротити час завантаження — з хвилин до секунд. Завдяки новій архітектурі NVIDIA Blackwell сервери AWS P6e UltraServer забезпечують величезну обчислювальну потужність для масштабного навчання, оптимізуючи
Amazon Bedrock тепер пропонує GPT-5.5, GPT-5.4 та Codex для виробничих додатків штучного інтелекту. GPT-5.5 демонструє високу ефективність у програмуванні та роботі з інформацією, а також відрізняється покращеною здатністю виконувати багатоетапні завдання та підвищеною автономністю.
Регресія на ядровому риджі (KRR) та регресія на опорних векторах (SVR) — це методи машинного навчання, які можна поєднати для створення розрідженої моделі KRR, що апроксимує модель SVR. Цей гібридний підхід поєднує в собі переваги KRR щодо обробки великих наборів даних та ефективність SVR у зберіганні моделей, демонструючи високу точність прогнозування в демонстраційному прикладі з використанн...
На конференції GTC Taipei компанія NVIDIA представила ПК RTX Spark для персональних агентів, оснащені новими обчислювальними потужностями та можливостями пам'яті для штучного інтелекту. Партнерство з Microsoft дозволяє впровадити безпечні вбудовані агенти в систему Windows, а також оновлення для Hermes Agent та OpenClaw.
Система Amazon Bedrock AgentCore Payments, що працює у партнерстві з Coinbase та Stripe, дозволяє агентам отримувати доступ до платних ресурсів від імені кінцевих користувачів. Ризики безпеки, такі як неконтрольовані витрати та відсутність згоди кінцевого користувача, усуваються завдяки встановленню лімітів витрат та обов’язковому отриманню явного дозволу на транзакції.
Компанія Genesis AI випустила Genesis World 1.0, що включає в себе модулі Nyx і Quadrants, а також інтерфейс моделювання, призначений для прискорення розробки робототехнічних моделей за допомогою симуляції. Оцінка, що займає менше 0,5 години, дає результати з точністю до біта, демонструючи кореляцію 0,8996 між результатами моделювання та результатами розгортання на апаратному забезпеченні.
Компанія Hexo Labs випустила SIA (Self-Improving AI) як фреймворк з відкритим кодом. SIA редагує як каркас агента, так і ваги моделі з метою постійного вдосконалення. Оновлення ваг підвищують ефективність у різних сферах, перевершуючи результати, досягнуті лише за рахунок редагування каркаса.
Лінійна регресія прогнозує значення за допомогою ваг і зміщення. Такі методи, як SGD та L-BFGS, відрізняються за підходом до обробки складних даних.
Розгортання великих мовних моделей (LLM) на платформі Amazon SageMaker AI Inference вимагає комплексного контролю для моніторингу як стану інфраструктури, так і якості роботи LLM. Моніторинг таких показників, як затримка, кількість помилок і точність відповідей, має вирішальне значення для оптимізації витрат, продуктивності та якості результатів у довгостроковій перспективі.
Hermes Agent від Nous Research впроваджує функцію Tool Search для усунення вузьких місць у системах штучного інтелекту, спричинених надмірною кількістю інструментів MCP. Tool Search оптимізує завантаження інструментів, підвищуючи точність і знижуючи витрати; значне підвищення точності було продемонстровано під час внутрішніх оцінок, проведених компанією Anthropic.
Метод дистиляції знань забезпечує передачу «прихованої інформації» від великих моделей до малих за допомогою дивергенції KL для кожної позиції. Розробка NVIDIA під назвою X-Token усуває недоліки міжтокенізаторної дистиляції знань, пропонуючи більш ефективний та дієвий метод, що базується на вирівнюванні проміжків та додаткових формулюваннях втрат.
Моделі машинного навчання прогнозують такі показники, як дохід, статева приналежність, вік, штат проживання та політичні погляди. Заповнення пропущених даних для прогнозування може призвести до оманливих результатів у машинному навчанні.
Amazon SageMaker MLflow пропонує комплексні можливості відстеження експериментів у галузі машинного навчання та управління моделями. Підприємства можуть безпечно інтегрувати MLflow з існуючими системами за допомогою проксі-сервісу на базі Flask, що забезпечує відповідність вимогам та спрощує процес.
Оцінка агентів стає ефективнішою завдяки поєднанню онлайн-сигналів зі стабільними офлайн-базовими показниками. Amazon Bedrock AgentCore підтримує використання тестових наборів з версіями, що забезпечує послідовність та перевірюваність вимірювань для вдосконалення агентів. Набори даних з версіями слугують еталоном, завдяки чому результати оцінювання є значущими як для розробників, так і для кон...