Дослідники з Microsoft Research та Університету Чжецзян представляють World-R1 — фреймворк, який за допомогою підкріплювального навчання узгоджує генерацію відео з 3D-обмеженнями. World-R1 покращує якість відео, використовуючи приховані 3D-дані, не змінюючи базову архітектуру та не збільшуючи витрати на інференцію.
При лінійній регресії з категоріальними предикторами для навчання у замкнутій формі слід використовувати кодування «drop-first». Кодування «drop-first» є кращим варіантом з точки зору інтерпретованості та простоти моделі в лінійній регресії.
Організації повинні забезпечувати гнучкість своїх моделей для оптимізації штучного інтелекту. Систематизована структура для міграції або оновлення великих мовних моделей (LLM) спрощує перехідні процеси та сприяє постійному вдосконаленню.
Cursor робить програмування на основі штучного інтелекту доступнішим для всіх завдяки своєму SDK, що дозволяє розробникам програмно інтегрувати потужні агенти кодування у свої системи. SDK використовує те саме середовище виконання та інфраструктуру, що й власні продукти Cursor, спрощуючи процес створення та обслуговування агентів кодування.
Президент Массачусетського технологічного інституту (MIT) Саллі Корнблут наголошує на важливості фундаментальної науки та вирішальній ролі університетів у наукових дослідженнях. Вона застерігає про можливі негативні наслідки для США, якщо розвиток фундаментальної науки опиниться під загрозою через невизначеність із фінансуванням.
Метод «Регулювання підкріплення» (RFT) вдосконалює великі мовні моделі (LLM) за допомогою автоматизованих сигналів винагороди, підвищуючи точність і надійність. Використання LLM у ролі «судді» в RFT забезпечує зворотний зв'язок з урахуванням контексту, пояснюваність та прискорює ітерації для кращого узгодження.
Упередженість штучного інтелекту в медичних моделях ШІ може призвести до помилкових діагнозів. Новий підхід до усунення упередженості під назвою WRING покликаний вирішити проблему упередженості у великих мовних моделях (VLM), таких як OpenCLIP, уникнувши при цьому «дилеми Whac-A-Mole».
IBM та MIT відкривають дослідницьку лабораторію MIT-IBM Computing Research Lab, яка зосередиться на штучному інтелекті та квантових обчисленнях з метою переосмислення майбутнього обчислювальної техніки. Лабораторія має на меті прискорити розвиток алгоритмів штучного інтелекту, квантових суперкомп’ютерів та гібридних обчислювальних систем для застосування у реальних умовах.
Лабораторія FAIR компанії Meta випустила NeuralSet — фреймворк на Python, що вирішує проблеми з обробкою даних у галузі нейронауки. NeuralSet розділяє структуру та дані, спрощуючи складне вирівнювання нейронних часових рядів для фреймворків штучного інтелекту.
Штучний інтелект, що використовує протокол Model Context Protocol (MCP), отримує широкий спектр можливостей. Amazon Bedrock AgentCore Gateway забезпечує централізоване управління інтеграцією агентів та інструментів, а безсерверний проксі-сервер MCP на AgentCore Runtime дозволяє налаштовувати контроль трафіку MCP.
Компанія Poolside AI представляє моделі Laguna M. 1 та Laguna XS. 2, що відрізняються високою ефективністю та унікальними функціями. Модель Laguna XS. 2 має інноваційну архітектуру з технологією SWA та глобальними шарами уваги, що робить її ідеальною для локального використання на комп’ютерах.
Рішення PwC для анотації на основі штучного інтелекту (AIDA), створене на базі AWS, оптимізує аналіз договорів, скорочуючи час ручної перевірки на 90%. AIDA поєднує великі мовні моделі з автоматизованими робочими процесами вилучення даних для отримання структурованих висновків та надання відповідей з урахуванням контексту, що кардинально змінює підхід до управління договорами.
Дослідники з Массачусетського технологічного інституту (MIT) розробили метод, який підвищує ефективність федеративного навчання на 81%, що дозволяє безпечно навчати штучний інтелект на периферійних пристроях з обмеженими ресурсами. Цей прорив може розширити сферу застосування штучного інтелекту в галузі охорони здоров’я та фінансів, забезпечивши потужними моделями навіть невеликі пристрої.
Автор протестував регресійну модель «випадкового лісу» на наборі даних про діабет, що, як і очікувалося, дало низьку точність прогнозування. Для навчання моделі використовувалися нормалізовані дані, при цьому точність як на навчальному, так і на тестовому наборах становила приблизно 0,24.
Розробники стикаються з труднощами в організації пам'яті для агентів штучного інтелекту, що призводить до вразливостей у системі безпеки. Amazon Bedrock AgentCore Memory використовує простори імен для впорядкованого, доступного та безпечного зберігання даних у пам'яті. Простори імен забезпечують ієрархічний доступ до даних та контроль доступу, що є необхідним для створення ефективних систем па...