У новому дослідженні команди Nous представлено модель CNA, яка дозволяє точно визначити нейрони MLP, відповідальні за «шлюзи відхилення» в моделях, що навчаються на інструкціях. Видалення лише 0,1 % активацій MLP знижує рівень відхилень більш ніж на 50 % без погіршення якості вихідних даних.
Інструмент Bumblebee від Perplexity сканує комп'ютери розробників на наявність вразливих пакетів, розширень та конфігурацій інструментів штучного інтелекту. Він заповнює прогалину в існуючих інструментах, перевіряючи стан локальних систем розробників на наявність потенційних ризиків безпеки.
Для регресорів нейронних мереж, що працюють з категоріальними даними, слід використовувати кодування «one-hot»; кодування «drop-first» є зайвим і дещо менш ефективним. Результати демонстрації не дають підстав розглядати можливість використання кодування «drop-first» для нейронних мереж, що підтверджує переваги кодування «one-hot».
Лабораторія AI Frontiers компанії Microsoft Research випустила Fara1.5 — сімейство моделей комп'ютерних агентів для веб-браузерів, інтегрованих із MagenticLite. Модель Fara1.5-27B демонструє 72% успішності виконання завдань на наборі даних Online-Mind2Web, випереджаючи таких конкурентів, як Operator від OpenAI та Gemini 2.5 від Google.
Традиційні системи робочих списків у радіології спричиняють затримки та збільшення витрат, оскільки не враховують важливий контекст, що призводить до неефективного розподілу випадків. Використовуючи агентів штучного інтелекту на базі Amazon Bedrock AgentCore, компанія Radiology Partners прагне скоротити затримки в діагностиці та оптимізувати організацію робочих процесів завдяки інтелектуальном...
Компанія NVIDIA відзначилася на виставці COMPUTEX 2026: її суперкомп’ютер на базі штучного інтелекту Vera Rubin NVL72 та платформа Jetson Thor отримали найвищі нагороди. Vera Rubin NVL72 встановлює нові стандарти масштабованості та екологічності в галузі штучного інтелекту, забезпечуючи виняткову продуктивність та економічну ефективність для автономних додатків на базі штучного інтелекту.
Дослідження Массачусетського технологічного інституту (MIT) під керівництвом Девіда Аутора показує, що нові форми зайнятості приносять користь молодим освіченим людям у міських районах. Державні інвестиції стимулюють розвиток нових видів зайнятості, заснованих на інноваціях, створюючи можливості для застосування спеціалізованих знань.
Ізотонічна регресія — це складний метод машинного навчання. Автор висвітлює поширені помилки та демонструє приклад на практиці з використанням scikit-learn.
CopilotKit перетворює штучний інтелект у програмному забезпеченні з пасивного на активний, а AG-UI заповнює прогалину між агентами та користувачами в додатках. Такі великі компанії, як Google та AWS, активно впроваджують цей протокол, що свідчить про його зрілість та готовність до використання у виробничих умовах.
Command A+ від Cohere — це модель MoE з відкритим кодом, оптимізована для агентських робочих процесів, яка поєднує в собі можливості чотирьох попередніх моделей. Завдяки трьом доступним варіантам квантування Command A+ демонструє значне підвищення продуктивності порівняно з попередніми моделями Command A при виконанні різних корпоративних завдань.
Alibaba представляє Qwen3.7-Max для виконання автономних багатоетапних завдань. Qwen3.7-Max пропонує режим розширеного мислення з контекстним вікном розміром 1 млн токенів, що підвищує можливості міркування.
Інженер на місці (FDE) працює безпосередньо з клієнтами, пишучи реальний код для виробничих систем. Модель FDE від Palantir кидає виклик традиційним SaaS-рішенням у сфері впровадження складних систем штучного інтелекту.
Amazon Nova Act, що тепер відповідає вимогам HIPAA, автоматизує робочі процеси в галузі охорони здоров’я за допомогою штучного інтелекту, зменшуючи обсяг ручної роботи для організацій, що надають медичні послуги. Ця система інтегрується із зовнішніми інструментами, здійснює навігацію веб-сайтами та виконує багатоетапні робочі процеси, підвищуючи ефективність та забезпечуючи дотримання норматив...
Lance від ByteDance об'єднує в одній моделі функції розпізнавання, генерації та редагування зображень і відео, що є важливою віхою в архітектурі штучного інтелекту. Lance об'єднує всю екосистему роботи із зображеннями та відео, виконуючи завдання від створення підписів до багатоетапного редагування з дотриманням стилістичної узгодженості в обох модальностях.
З листопада 2025 року Amazon SageMaker AI запроваджує двосторонню потокову передачу даних для обробки мовлення в режимі реального часу з перетворенням у текст. API vLLM Realtime від Mistral AI забезпечує безперебійну двосторонню потокову передачу даних між клієнтом і сервером для розгортання компактних моделей розпізнавання мовлення в режимі реального часу, пропонуючи повністю керований сервіс...