Field Advisor на платформі Amazon Bedrock AgentCore оптимізує координацію роботи агентів у відділі продажів AWS, зменшуючи когнітивне навантаження та покращуючи взаємодію з клієнтами. Цей внутрішній діалоговий помічник підвищує продуктивність, перенаправляючи запити до спеціалізованих агентів, що дозволяє торговим представникам зосередитися на потребах клієнтів.
Дослідники з компанії Sakana AI та Токійського університету представляють DiffusionBlocks — метод навчання мереж на основі трансформерів, який передбачає навчання по одному блоку за раз, що дозволяє зменшити споживання пам'яті у B разів. Завдяки застосуванню дискретизації Ейлера до зв'язків залишків цей метод дає змогу навчати кожен блок окремо з використанням власної локальної функції цільово...
Компанія Stability AI випустила Stable Audio 3 з відкритими вагами та технічним документом. Моделі латентної дифузії підтримують вихідні дані змінної довжини та редагування на основі відновлення пропущених фрагментів для генерації стереоаудіо.
Для створення додатків на основі штучного інтелекту більше не потрібні глибокі знання в галузі машинного навчання. За допомогою Strands Agents та сервісів AWS можна створювати інтелектуальних агентів, написавши всього 30 рядків коду, що спрощує розробку штучного інтелекту для середовищ AWS.
Amazon Quick пропонує централізоване рішення для моніторингу корпоративних платформ штучного інтелекту, об’єднуючи дані про використання для більш ефективного відстеження та аналізу. Завдяки інтеграції зі службами AWS Amazon Quick забезпечує моніторинг, аналітику та управління за допомогою захищеного сховища даних, Amazon Athena та інформаційної панелі Quick Sight.
Amazon Quick дає змогу фахівцям створювати відформатовані документи та візуальні матеріали на основі даних у реальному часі, заощаджуючи час на рутинні завдання. Результати можна експортувати у формати Word, Excel, PowerPoint, PDF та у вигляді бізнес-візуалізацій, які можна повністю редагувати для подальшої роботи без необхідності повторного створення.
Розробка функції обернення матриці з використанням розкладу Холеського: коротший код проти більшої ефективності. Аналітика в галузі розробки програмного забезпечення з використанням коду, згенерованого штучним інтелектом, та дизайн персонажів в анімаційних фільмах.
Кеш KV є значною статтею витрат при обслуговуванні великих мовних моделей (LLM); його стиснення за допомогою квантування на основі обертань, реалізованого в OSCAR, підвищує ефективність при точності INT2. OSCAR обчислює обертання на основі статистичних даних уваги, щоб зменшити похибки квантування, покращуючи якість уваги та продуктивність моделі.
Компанія NVIDIA представляє модель Gated DeltaNet-2 з лінійною увагою для покращення редагування пам'яті. Модель оснащена двома каналними шлюзами, що забезпечує їй кращі результати порівняно з попередніми моделями в дослідницьких тестах.
У новому дослідженні команди Nous представлено модель CNA, яка дозволяє точно визначити нейрони MLP, відповідальні за «шлюзи відхилення» в моделях, що навчаються на інструкціях. Видалення лише 0,1 % активацій MLP знижує рівень відхилень більш ніж на 50 % без погіршення якості вихідних даних.
Інструмент Bumblebee від Perplexity сканує комп'ютери розробників на наявність вразливих пакетів, розширень та конфігурацій інструментів штучного інтелекту. Він заповнює прогалину в існуючих інструментах, перевіряючи стан локальних систем розробників на наявність потенційних ризиків безпеки.
Для регресорів нейронних мереж, що працюють з категоріальними даними, слід використовувати кодування «one-hot»; кодування «drop-first» є зайвим і дещо менш ефективним. Результати демонстрації не дають підстав розглядати можливість використання кодування «drop-first» для нейронних мереж, що підтверджує переваги кодування «one-hot».
Лабораторія AI Frontiers компанії Microsoft Research випустила Fara1.5 — сімейство моделей комп'ютерних агентів для веб-браузерів, інтегрованих із MagenticLite. Модель Fara1.5-27B демонструє 72% успішності виконання завдань на наборі даних Online-Mind2Web, випереджаючи таких конкурентів, як Operator від OpenAI та Gemini 2.5 від Google.
Command A+ від Cohere — це модель MoE з відкритим кодом, оптимізована для агентських робочих процесів, яка поєднує в собі можливості чотирьох попередніх моделей. Завдяки трьом доступним варіантам квантування Command A+ демонструє значне підвищення продуктивності порівняно з попередніми моделями Command A при виконанні різних корпоративних завдань.
Інженер на місці (FDE) працює безпосередньо з клієнтами, пишучи реальний код для виробничих систем. Модель FDE від Palantir кидає виклик традиційним SaaS-рішенням у сфері впровадження складних систем штучного інтелекту.