Дослідники Google представили Auto-Diagnose — інструмент на базі великої мови (LLM), який визначає першопричини невдач інтеграційних тестів із точністю 90,14 %. Цей інструмент вирішує поширену проблему надмірних витрат часу на налагодження під час інтеграційних тестів, заощаджуючи час розробників і позбавляючи їх зайвих клопотів.
Компанія Anthropic випустила версію Claude Opus 4.7, яка розширює можливості штучного інтелекту для розробників завдяки вдосконаленим функціям програмної інженерії та покращеним можливостям обробки зображень. Opus 4.7 самостійно перевіряє результати, підвищує продуктивність кодування на 13% та забезпечує втричі вищу точність виконання складних завдань, встановлюючи новий стандарт у сфері модел...
Amazon Bedrock тепер пропонує детальну атрибуцію витрат, автоматично розподіляючи витрати на обчислення між суб’єктами IAM, такими як користувачі IAM, ролі або федеративні ідентичності від постачальників, наприклад Okta. Теги розподілу витрат дозволяють легко агрегувати дані за командами, проектами або власними параметрами в AWS Cost Explorer та CUR 2.0, що спрощує фінансове планування та опти...
Семантичний пошук у відео змінює підхід до поширення контенту в різних галузях, забезпечуючи швидкий і точний доступ до конкретних моментів у відео. Amazon Nova Multimodal Embeddings пропонує уніфіковану модель, яка обробляє текст, зображення, відео та аудіо, перетворюючи їх на спільний семантичний векторний простір, що забезпечує найвищу точність пошуку та економічну ефективність.
Доценти Массачусетського технологічного інституту (MIT) Джейкоб Андреас і Бретт Макгуайр отримали премію імені Гарольда Е. Еджертона за видатні досягнення викладачів 2026 року за новаторські роботи в галузі обробки природної мови та астрохімії. Новаторські дослідження Андреаса поєднують фундаментальну теорію з практичним впливом на вивчення мов та штучний інтелект.
Команда Qwen компанії Alibaba представляє Qwen3.6-35B-A3B — розріджену модель MoE з 35 мільярдами параметрів, яка демонструє вражаючу продуктивність у різних тестах, зокрема SWE-bench та Terminal-Bench 2.0, та свідчить про значний прогрес у сфері агентного кодування та генерації коду інтерфейсу.
Команда TAA з відділу маркетингу AWS у співпраці з Gradial розробила рішення на основі агентного штучного інтелекту на платформі Amazon Bedrock, що дозволило скоротити час формування веб-сторінок більш ніж на 95%. Ця інновація оптимізує робочі процеси публікації контенту, даючи змогу маркетинговим командам зосередитися на створенні більш ефективного клієнтського досвіду.
Новий алгоритм RL на основі стратегії «розділяй і володарюй» кидає виклик традиційному навчанню методом TD, забезпечуючи масштабованість для завдань із тривалим горизонтом. Політика «поза політикою» (Off-policy RL) забезпечує гнучкість у роботі зі старими даними, що має вирішальне значення для таких складних галузей, як робототехніка та охорона здоров’я.
Дослідники розкрили динаміку навчання алгоритму word2vec, виявивши його лінійну структуру та послідовні етапи. Мінімальна нейронна модель алгоритму дає уявлення про процес навчання ознак у складних мовних задачах.
PLAID — модель, що генерує послідовності та структури білків, — відображає роль штучного інтелекту в біології. Модель вирішує такі завдання, як моделювання всіх атомів та врахування специфіки організмів, маючи на меті ефективне створення корисних білків.
Перевірки автоматизованого міркування в Amazon Bedrock Guardrails забезпечують математично обґрунтовані та піддаються аудиту результати роботи ШІ для галузей, що підлягають регулюванню. Використовуючи методи формальної верифікації, команди з питань дотримання нормативних вимог можуть отримувати результати, правильність яких можна довести, усуваючи обмеження ймовірнісної валідації ШІ.
Навчання сучасної великої мовної моделі передбачає попереднє навчання загальним мовним шаблонам, а потім — контрольоване точне налаштування для виконання конкретних завдань. Такі методи, як LoRA та RLHF, дозволяють вдосконалити модель, що дає змогу впроваджувати її в реальні системи для досягнення оптимальної продуктивності та забезпечення максимальної користі.
ChatGPT демонструє упереджене ставлення до «нестандартних» різновидів англійської мови, а його відповіді містять стереотипи та зверхність. У рамках дослідження GPT-3.5 Turbo та GPT-4 отримали запити з 10 різновидами англійської мови, що виявило збереження рис стандартної американської англійської.
Google впроваджує функцію Skills in Chrome у рамках Gemini, що дозволяє користувачам зберігати запити до штучного інтелекту як робочі процеси, які можна використовувати повторно. Ця функція спрощує виконання завдань у декількох вкладках, даючи уявлення про майбутнє агентів штучного інтелекту на рівні браузера.
Роздрібні продавці стикаються з проблемами, пов’язаними з онлайн-покупками, що призводить до зростання кількості повернень та зниження довіри споживачів. Впровадження технології віртуальної примірки за допомогою Amazon Nova Canvas та Rekognition може сприяти підвищенню прибутковості