Command A+ від Cohere — це модель MoE з відкритим кодом, оптимізована для агентських робочих процесів, яка поєднує в собі можливості чотирьох попередніх моделей. Завдяки трьом доступним варіантам квантування Command A+ демонструє значне підвищення продуктивності порівняно з попередніми моделями Command A при виконанні різних корпоративних завдань.
Lance від ByteDance об'єднує в одній моделі функції розпізнавання, генерації та редагування зображень і відео, що є важливою віхою в архітектурі штучного інтелекту. Lance об'єднує всю екосистему роботи із зображеннями та відео, виконуючи завдання від створення підписів до багатоетапного редагування з дотриманням стилістичної узгодженості в обох модальностях.
Alibaba представляє Qwen3.7-Max для виконання автономних багатоетапних завдань. Qwen3.7-Max пропонує режим розширеного мислення з контекстним вікном розміром 1 млн токенів, що підвищує можливості міркування.
Дослідник з Массачусетського технологічного інституту (MIT) Коннор Колі використовує штучний інтелект для виявлення потенційних низькомолекулярних лікарських препаратів серед величезної кількості можливих сполук, поєднуючи хімічну інженерію та інформатику. У своїй роботі Колі поєднує машинне навчання та хемоінформатику з метою оптимізації автоматизованих хімічних реакцій для розробки нових лік...
Amazon SageMaker AI тепер підтримує API, сумісний з OpenAI, для кінцевих точок інференції в режимі реального часу, що спрощує виклик моделей за допомогою стандартних SDK. Такі користувачі, як Caffeine.AI, можуть безперешкодно інтегрувати SageMaker як готову кінцеву точку, сумісну з OpenAI, без необхідності внесення змін у власний код.
Команда Qwen компанії Alibaba вдосконалила систему синхронного перекладу за допомогою Qwen3.5-LiveTranslate-Flash, скоротивши затримку до 2,8 секунди та розширивши мовне покриття до 60 мов. Серед інноваційних функцій — клонування голосу в режимі реального часу та використання зображень як основного джерела вхідних даних для підвищення точності перекладу.
З листопада 2025 року Amazon SageMaker AI запроваджує двосторонню потокову передачу даних для обробки мовлення в режимі реального часу з перетворенням у текст. API vLLM Realtime від Mistral AI забезпечує безперебійну двосторонню потокову передачу даних між клієнтом і сервером для розгортання компактних моделей розпізнавання мовлення в режимі реального часу, пропонуючи повністю керований сервіс...
Використання моделі StackingRegressor із декількома базовими моделями для прогнозування може виявитися надто складним через величезну кількість параметрів. Демонстрація роботи моделі StackingRegressor на наборі даних про діабет показала, що точно передбачити рівень діабету у пацієнтів досить складно.
Нові оцінювачі MLLM-as-a-Judge у Strands Evals SDK покращують виконання завдань з перетворення зображень у текст, при цьому прогнозується, що до 2030 року 80 % корпоративного програмного забезпечення стане мультимодальним. Автоматизована мультимодальна оцінка підвищує точність та ефективність розробки програмного забезпечення.
Amazon SageMaker Feature Store пропонує нові можливості, зокрема інтеграцію з Lake Formation та властивості таблиць Iceberg. Це допомагає організаціям оптимізувати контроль доступу та зменшити витрати на зберігання моделей машинного навчання.
Kiro CLI тепер пропонує розширену функцію запам'ятовування діалогів завдяки інтеграції з Amazon Bedrock AgentCore Memory. Спеціально розроблений сервер MCP забезпечує збереження контексту та персоналізований досвід під час різних сеансів.
Програмне виклик інструментів (PTC) зменшує затримку та споживання токенів, дозволяючи великим мовним моделям писати код, який програмно викликає декілька інструментів у ізольованому середовищі виконання. PTC ефективно застосовується для обробки даних, чисельних обчислень, оркестрування процесів та у сценаріях, що вимагають дотримання конфіденційності, пропонуючи незалежне від моделі рішення д...
Моделі мов стикаються з проблемами оптимізації через нерівномірний розподіл лемматів. Адаптивна оптимізація Adam допомагає рідкісним лемматам навчатися швидше, ніж при використанні стандартного алгоритму SGD.
Регресія AdaBoost використовує дерева рішень, навчені на зважених даних, для підвищення точності прогнозів. Результати свідчать про перенавчання: висока точність на навчальних даних, але нижча точність на нових тестових даних.
Amazon Bedrock AgentCore Evaluations пропонує індивідуальні оцінювачі на основі коду для аналізу агентських додатків у спеціалізованих галузях, таких як фінансові послуги. Ці оцінювачі забезпечують контроль над логікою підрахунку балів, що дозволяє проводити індивідуальну оцінку якості агентів та забезпечує безперебійну інтеграцію в робочі процеси розробки.