Табличні дані відіграють ключову роль у машинному навчанні, а деревоподібні моделі, такі як TabPFN, кидають виклик традиційним підходам, перевершуючи за ефективністю XGBoost та CatBoost. TabPFN-2.5 забезпечує кращу продуктивність, зменшує обсяг ручної роботи та прискорює процес інференції для практичного впровадження.
Дослідники Google представили Auto-Diagnose — інструмент на базі великої мови (LLM), який визначає першопричини невдач інтеграційних тестів із точністю 90,14 %. Цей інструмент вирішує поширену проблему надмірних витрат часу на налагодження під час інтеграційних тестів, заощаджуючи час розробників і позбавляючи їх зайвих клопотів.
Компанія Anthropic випустила версію Claude Opus 4.7, яка розширює можливості штучного інтелекту для розробників завдяки вдосконаленим функціям програмної інженерії та покращеним можливостям обробки зображень. Opus 4.7 самостійно перевіряє результати, підвищує продуктивність кодування на 13% та забезпечує втричі вищу точність виконання складних завдань, встановлюючи новий стандарт у сфері модел...
Доценти Массачусетського технологічного інституту (MIT) Джейкоб Андреас і Бретт Макгуайр отримали премію імені Гарольда Е. Еджертона за видатні досягнення викладачів 2026 року за новаторські роботи в галузі обробки природної мови та астрохімії. Новаторські дослідження Андреаса поєднують фундаментальну теорію з практичним впливом на вивчення мов та штучний інтелект.
Команда TAA з відділу маркетингу AWS у співпраці з Gradial розробила рішення на основі агентного штучного інтелекту на платформі Amazon Bedrock, що дозволило скоротити час формування веб-сторінок більш ніж на 95%. Ця інновація оптимізує робочі процеси публікації контенту, даючи змогу маркетинговим командам зосередитися на створенні більш ефективного клієнтського досвіду.
Команда Qwen компанії Alibaba представляє Qwen3.6-35B-A3B — розріджену модель MoE з 35 мільярдами параметрів, яка демонструє вражаючу продуктивність у різних тестах, зокрема SWE-bench та Terminal-Bench 2.0, та свідчить про значний прогрес у сфері агентного кодування та генерації коду інтерфейсу.
Amazon Bedrock тепер пропонує детальну атрибуцію витрат, автоматично розподіляючи витрати на обчислення між суб’єктами IAM, такими як користувачі IAM, ролі або федеративні ідентичності від постачальників, наприклад Okta. Теги розподілу витрат дозволяють легко агрегувати дані за командами, проектами або власними параметрами в AWS Cost Explorer та CUR 2.0, що спрощує фінансове планування та опти...
Семантичний пошук у відео змінює підхід до поширення контенту в різних галузях, забезпечуючи швидкий і точний доступ до конкретних моментів у відео. Amazon Nova Multimodal Embeddings пропонує уніфіковану модель, яка обробляє текст, зображення, відео та аудіо, перетворюючи їх на спільний семантичний векторний простір, що забезпечує найвищу точність пошуку та економічну ефективність.
Кодер перетворює зображення об’єктів на зображення без шуму, кількісно оцінюючи, наскільки точно вимірювання дозволяють розрізнити об’єкти. Штучний інтелект здатний виокремлювати корисну інформацію навіть у тих випадках, коли вона закодована у формі, яку людина не може розтлумачити, оптимізуючи системи візуалізації з урахуванням їхнього інформаційного наповнення.
ChatGPT демонструє упереджене ставлення до «нестандартних» різновидів англійської мови, а його відповіді містять стереотипи та зверхність. У рамках дослідження GPT-3.5 Turbo та GPT-4 отримали запити з 10 різновидами англійської мови, що виявило збереження рис стандартної американської англійської.
PLAID — модель, що генерує послідовності та структури білків, — відображає роль штучного інтелекту в біології. Модель вирішує такі завдання, як моделювання всіх атомів та врахування специфіки організмів, маючи на меті ефективне створення корисних білків.
Останні досягнення у сфері великих мовних моделей (LLM) відкривають можливості для створення цікавих інтегрованих додатків, однак атаки типу «prompt injection» становлять серйозну загрозу. StruQ та SecAlign — це запропоновані засоби захисту, покликані зменшити ризики, пов’язані з атаками «prompt injection» у системах LLM, таких як Google Docs та ChatGPT.
Перевірки автоматизованого міркування в Amazon Bedrock Guardrails забезпечують математично обґрунтовані та піддаються аудиту результати роботи ШІ для галузей, що підлягають регулюванню. Використовуючи методи формальної верифікації, команди з питань дотримання нормативних вимог можуть отримувати результати, правильність яких можна довести, усуваючи обмеження ймовірнісної валідації ШІ.
Завдання з перетворення тексту в SQL вирішуються за допомогою моделей Amazon Bedrock та Nova Micro, що забезпечують економічно ефективні індивідуальні рішення. Точне налаштування адаптерів LoRA під конкретні діалекти SQL гарантує високу продуктивність без постійних витрат на хостинг.
Google DeepMind представляє Gemini Robotics-ER 1.6 — оновлену версію, що розширює можливості роботів у сфері логічного мислення для виконання завдань у реальних умовах. Ця модель виконує роль стратега високого рівня, керуючи фізичними діями за допомогою вдосконаленого просторового мислення та аналізу показань приладів.