Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Повышение геометрической согласованности в Wan 2.1 с помощью Flow-GRPO и 3D Rewards

Исследователи из Microsoft Research и Университета Чжэцзяна представляют World-R1 — платформу, которая с помощью методов обучения с подкреплением согласовывает генерацию видео с 3D-ограничениями. World-R1 повышает качество видео за счет извлечения скрытых 3D-знаний без изменения базовой архитектуры и без увеличения затрат на вычисления.

Безопасное обучение ИИ на повседневных устройствах

Исследователи из Массачусетского технологического института (MIT) разработали метод, позволяющий повысить эффективность федеративного обучения на 81% и обеспечить безопасное обучение ИИ на периферийных устройствах с ограниченными ресурсами. Этот прорыв может расширить сферу применения ИИ в здравоохранении и финансах, сделав мощные модели доступными для небольших устройств.

Формируя будущее: вычислительная лаборатория MIT-IBM

IBM и Массачусетский технологический институт (MIT) открывают исследовательскую лабораторию MIT-IBM Computing Research Lab, которая будет заниматься исследованиями в области искусственного интеллекта и квантовых вычислений с целью переосмысления будущего вычислительной техники. Лаборатория ставит перед собой цель ускорить развитие алгоритмов искусственного интеллекта, квантовых супервычислений...

Новые модели искусственного интеллекта для задачи Poolside демонстрируют высокую точность на наборе данных SWE-bench

Компания Poolside AI представляет модели Laguna M. 1 и Laguna XS. 2, отличающиеся высокой эффективностью и уникальными функциями. Модель Laguna XS. 2 демонстрирует инновационную архитектуру с использованием SWA и глобальных слоёв внимания, что делает её идеальным решением для локального использования на устройствах.

Представляем NeuralSet: лучший пакет для нейронных сетей и искусственного интеллекта на Python

Лаборатория FAIR компании Meta выпустила NeuralSet — фреймворк на языке Python, предназначенный для устранения узких мест в обработке данных в области нейробиологии. NeuralSet разделяет структуру и данные, упрощая сложную задачу выравнивания нейронных временных рядов для фреймворков искусственного интеллекта.

Масштабирование памяти агента: шаблоны проектирования пространств имён

Разработчики сталкиваются с трудностями при организации памяти для агентов искусственного интеллекта, что приводит к появлению уязвимостей в системе безопасности. Amazon Bedrock AgentCore Memory использует пространства имён для упорядоченного, доступного и безопасного хранения данных в памяти. Пространства имён обеспечивают иерархический поиск и контроль доступа, что является необходимым услов...

Разочаровывающие результаты: регрессия методом «случайного леса» на наборе данных по диабету

Автор протестировал регрессионную модель «случайного леса» на наборе данных по диабету, что, как и ожидалось, привело к низкой точности прогнозирования. Для обучения модели использовались нормализованные данные, при этом точность как на обучающем, так и на тестовом наборах составила около 0,24.

Бессерверные прокси MCP на Amazon Bedrock

ИИ-агенты, использующие протокол Model Context Protocol (MCP), получают широкий спектр возможностей. Amazon Bedrock AgentCore Gateway обеспечивает централизованное управление интеграцией агентов и инструментов, а бессерверный прокси-сервер MCP в среде AgentCore Runtime позволяет настраивать контроль трафика MCP.

Устранение систематических ошибок в моделях искусственного интеллекта для обработки изображений: более эффективный подход

Предвзятость в медицинских моделях искусственного интеллекта может приводить к ошибочным диагнозам. Новый подход к устранению предвзятости под названием WRING призван решить проблему предвзятости в моделях VLM, таких как OpenCLIP, избегая при этом «дилеммы Whac-A-Mole».

Аналитика контрактов на базе искусственного интеллекта от PwC на AWS

Решение PwC для аннотирования на основе искусственного интеллекта (AIDA), созданное на платформе AWS, оптимизирует анализ договоров, сокращая время ручной проверки на 90 %. AIDA сочетает в себе крупные языковые модели с автоматизированными рабочими процессами извлечения информации, что позволяет получать структурированные аналитические данные и давать ответы с учетом конкретного контекста, кар...

NVIDIA Nemotron 3 Nano Omni: выпуск Amazon SageMaker JumpStart

NVIDIA Nemotron 3 Nano Omni в рамках Amazon SageMaker JumpStart представляет собой мультимодальную модель для интеллектуальных приложений, обеспечивающую понимание видео, аудио, изображений и текста за один проход. Она упрощает рабочие процессы агентов за счет обработки экранов, документов, аудио и видео в рамках единого цикла вывода, что позволяет сократить задержки и снизить затраты.

От текстового агента до голосового помощника: руководство по работе с Amazon Nova 2 Sonic

Переход от текстовых агентов к голосовым помощникам с помощью Amazon Nova 2 Sonic обеспечивает естественное взаимодействие в режиме реального времени в сфере финансов, здравоохранения и розничной торговли. Разработка голосовых агентов требует лаконичных, разговорных ответов, адаптированных для восприятия в режиме реального времени, что отличается от подхода текстовых агентов, основанного на ис...

Освоение линейной регрессии на C#

Модели регрессии на основе машинного обучения позволяют прогнозировать числовые значения, такие как кредитные рейтинги. Для обучения могут использоваться различные методы, например линейная регрессия и нейронные сети. Демонстрационный пример на языке C# иллюстрирует различные методы обучения моделей линейной регрессии.

Amazon Nova: вдохновляющие персональные рекомендации по названиям от Popsa

Popsa использует искусственный интеллект и автоматизацию дизайна для создания персонализированных фотокниг за считанные минуты, что повышает качество обслуживания и удовлетворенность пользователей. Благодаря внедрению моделей Amazon Bedrock и Amazon Nova в 2025 году было создано более 5,5 миллиона персонализированных изданий, что привело к росту вовлеченности пользователей и показателей продаж.

Представляем MOSS-Audio: революция в области аудиоанализа

MOSS-Audio, разработанная OpenMOSS, MOSI. AI и Шанхайским институтом инноваций, представляет собой модель с открытым исходным кодом, объединяющую в себе функции распознавания речи, звуков, музыки и многое другое. Она состоит из четырёх вариантов, оптимизированных для различных задач, и основана на модульной архитектуре, включающей аудиокодер, адаптер модальности и крупную языковую модель.