Табличні дані відіграють ключову роль у машинному навчанні, а деревоподібні моделі, такі як TabPFN, кидають виклик традиційним підходам, перевершуючи за ефективністю XGBoost та CatBoost. TabPFN-2.5 забезпечує кращу продуктивність, зменшує обсяг ручної роботи та прискорює процес інференції для практичного впровадження.
Дослідники Google представили Auto-Diagnose — інструмент на базі великої мови (LLM), який визначає першопричини невдач інтеграційних тестів із точністю 90,14 %. Цей інструмент вирішує поширену проблему надмірних витрат часу на налагодження під час інтеграційних тестів, заощаджуючи час розробників і позбавляючи їх зайвих клопотів.
Компанія Anthropic випустила версію Claude Opus 4.7, яка розширює можливості штучного інтелекту для розробників завдяки вдосконаленим функціям програмної інженерії та покращеним можливостям обробки зображень. Opus 4.7 самостійно перевіряє результати, підвищує продуктивність кодування на 13% та забезпечує втричі вищу точність виконання складних завдань, встановлюючи новий стандарт у сфері модел...
Доценти Массачусетського технологічного інституту (MIT) Джейкоб Андреас і Бретт Макгуайр отримали премію імені Гарольда Е. Еджертона за видатні досягнення викладачів 2026 року за новаторські роботи в галузі обробки природної мови та астрохімії. Новаторські дослідження Андреаса поєднують фундаментальну теорію з практичним впливом на вивчення мов та штучний інтелект.
Команда TAA з відділу маркетингу AWS у співпраці з Gradial розробила рішення на основі агентного штучного інтелекту на платформі Amazon Bedrock, що дозволило скоротити час формування веб-сторінок більш ніж на 95%. Ця інновація оптимізує робочі процеси публікації контенту, даючи змогу маркетинговим командам зосередитися на створенні більш ефективного клієнтського досвіду.
Семантичний пошук у відео змінює підхід до поширення контенту в різних галузях, забезпечуючи швидкий і точний доступ до конкретних моментів у відео. Amazon Nova Multimodal Embeddings пропонує уніфіковану модель, яка обробляє текст, зображення, відео та аудіо, перетворюючи їх на спільний семантичний векторний простір, що забезпечує найвищу точність пошуку та економічну ефективність.
Команда Qwen компанії Alibaba представляє Qwen3.6-35B-A3B — розріджену модель MoE з 35 мільярдами параметрів, яка демонструє вражаючу продуктивність у різних тестах, зокрема SWE-bench та Terminal-Bench 2.0, та свідчить про значний прогрес у сфері агентного кодування та генерації коду інтерфейсу.
Amazon Bedrock тепер пропонує детальну атрибуцію витрат, автоматично розподіляючи витрати на обчислення між суб’єктами IAM, такими як користувачі IAM, ролі або федеративні ідентичності від постачальників, наприклад Okta. Теги розподілу витрат дозволяють легко агрегувати дані за командами, проектами або власними параметрами в AWS Cost Explorer та CUR 2.0, що спрощує фінансове планування та опти...
Перевірки автоматизованого міркування в Amazon Bedrock Guardrails забезпечують математично обґрунтовані та піддаються аудиту результати роботи ШІ для галузей, що підлягають регулюванню. Використовуючи методи формальної верифікації, команди з питань дотримання нормативних вимог можуть отримувати результати, правильність яких можна довести, усуваючи обмеження ймовірнісної валідації ШІ.
Останні досягнення у сфері великих мовних моделей (LLM) відкривають можливості для створення цікавих інтегрованих додатків, однак атаки типу «prompt injection» становлять серйозну загрозу. StruQ та SecAlign — це запропоновані засоби захисту, покликані зменшити ризики, пов’язані з атаками «prompt injection» у системах LLM, таких як Google Docs та ChatGPT.
Завдання з перетворення тексту в SQL вирішуються за допомогою моделей Amazon Bedrock та Nova Micro, що забезпечують економічно ефективні індивідуальні рішення. Точне налаштування адаптерів LoRA під конкретні діалекти SQL гарантує високу продуктивність без постійних витрат на хостинг.
ChatGPT демонструє упереджене ставлення до «нестандартних» різновидів англійської мови, а його відповіді містять стереотипи та зверхність. У рамках дослідження GPT-3.5 Turbo та GPT-4 отримали запити з 10 різновидами англійської мови, що виявило збереження рис стандартної американської англійської.
Саме дані, а не алгоритми, визначають цінність штучного інтелекту. Такі компанії, як Amazon, Google та Microsoft, досягають успіху завдяки власним високоякісним наборам даних. Якість даних має вирішальне значення для успіху штучного інтелекту, що робить їх стратегічним активом, який забезпечує конкурентну перевагу у XXI столітті.
Дослідники з Каліфорнійського університету в Сан-Дієго та компанії Together AI представляють Parcae — архітектуру трансформера з циклічною структурою, яка демонструє кращі результати, ніж попередні моделі, при використанні тих самих параметрів і навчальних даних. Конструкція Parcae дозволяє вирішити проблему обмеженості пам’яті та забезпечує більшу обчислювальну потужність за один прохід, усув...
PLAID — модель, що генерує послідовності та структури білків, — відображає роль штучного інтелекту в біології. Модель вирішує такі завдання, як моделювання всіх атомів та врахування специфіки організмів, маючи на меті ефективне створення корисних білків.