Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Ускорение работы NeMo RL с помощью спекулятивного декодирования: достигнуто беспрецедентное увеличение скорости

Исследователи из NVIDIA предлагают интегрировать спекулятивное декодирование в цикл обучения NeMo RL для ускорения генерации роллаутов с сохранением точного распределения выходных значений. Данный метод позволяет значительно уменьшить узкое место при генерации роллаутов, повышая эффективность без ущерба для точности обучения.

Раскрытие тайн сна с помощью Beacon Biosignals

Компания Beacon Biosignals, основанная Джейком Донохью (доктор наук, выпускник 2019 года) и бывшим научным сотрудником Массачусетского технологического института Джарреттом Ревелсом, использует технологию ЭЭГ для мониторинга мозговой активности во время сна в домашних условиях. Устройство компании, получившее одобрение Управления по санитарному надзору за качеством пищевых продуктов и медикаме...

Qwen AI представляет Qwen-Scope: преобразование функций больших языковых моделей в инструменты разработки

Команда Qwen представляет Qwen-Scope — набор решений с открытым исходным кодом, состоящий из разреженных автокодировщиков, обученных на различных семействах моделей, который помогает диагностировать и направлять работу крупных языковых моделей, таких как Qwen3. Используя разреженные автокодировщики для разложения активаций на интерпретируемые концепции, инженеры могут влиять на поведение модел...

Революционные изменения в организациях с помощью агентов OpenClaw

OpenClaw, автономный ИИ-помощник, быстро стал сенсацией на GitHub, набрав более 250 000 звездочек за 60 дней. Компания NVIDIA сотрудничает с разработчиками проекта с целью повышения его безопасности и отказоустойчивости, представив NemoClaw для более безопасного длительного выполнения

Повышение геометрической согласованности в Wan 2.1 с помощью Flow-GRPO и 3D Rewards

Исследователи из Microsoft Research и Университета Чжэцзяна представляют World-R1 — платформу, которая с помощью методов обучения с подкреплением согласовывает генерацию видео с 3D-ограничениями. World-R1 повышает качество видео за счет извлечения скрытых 3D-знаний без изменения базовой архитектуры и без увеличения затрат на вычисления.

Безопасный доступ к частным ресурсам с помощью Amazon Bedrock AgentCore Gateway

Функция подключения Amazon Bedrock AgentCore к Amazon VPC упрощает развертывание агентов искусственного интеллекта за пределами Amazon VPC. Она обеспечивает доступ к частной сети без вывода трафика в общедоступный Интернет, предлагая управляемый и самостоятельный режимы развертывания для подключения к частным конечным точкам.

Sun Finance: извлечение идентификационных данных и выявление мошенничества с помощью искусственного интеллекта

Компания Sun Finance в партнерстве с AWS создала конвейер проверки личности на базе искусственного интеллекта, повысив точность до 90,8 % и сократив время обработки с 20 часов до 5 секунд. Решение, объединяющее сервисы Amazon Bedrock, Textract и Rekognition, позволило сократить затраты на 91 % и улучшить эффективность выявления мошенничества.

Создавайте агентов кодирования с помощью SDK TypeScript от Cursor

Cursor делает программирование с помощью ИИ доступным для всех благодаря своему SDK, позволяющему разработчикам программно интегрировать в свои системы мощные агенты-программисты. Этот SDK использует ту же среду выполнения и инфраструктуру, что и собственные продукты Cursor, что упрощает процесс создания и обслуживания агентов-программистов.

Сила любознательности в науке

Президент Массачусетского технологического института Салли Корнблут подчеркивает важность фундаментальной науки и ключевую роль университетов в научных исследованиях. Она предупреждает о возможных негативных последствиях для США, если развитие фундаментальной науки окажется под угрозой из-за неопределенности с финансированием.

Преимущества кодирования «Drop-First» в линейной регрессии

При линейной регрессии с категориальными предикторами для обучения с использованием замкнутых форм следует применять кодирование «drop-first». Кодирование «drop-first» является предпочтительным вариантом для линейной регрессии с точки зрения интерпретируемости и простоты модели.

Освоение миграции генеративного ИИ с помощью AWS

Организации должны поддерживать гибкость моделей для оптимизации ИИ. Систематическая структура для миграции или обновления больших языковых моделей (LLM) упрощает переход и способствует постоянному совершенствованию.

Революция в области аналитики на базе искусственного интеллекта с Amazon SageMaker

ИИ-помощник Amazon Quick преобразует процесс анализа данных для современных предприятий, предоставляя возможности самообслуживания и поддержку запросов на естественном языке. Интегрированная архитектура использует Amazon S3, SageMaker и AWS Glue для реализации модели «lakehouse», что делает доступ к данным более доступным для широкого круга пользователей, одновременно обеспечивая безопасность ...

LLM: высшая инстанция

Метод «Регулировка с помощью подкрепления» (RFT) усовершенствует крупные языковые модели (LLM) за счет автоматических сигналов вознаграждения, повышая точность и надежность. Использование LLM в качестве «судьи» в рамках RFT обеспечивает контекстную обратную связь, объясняемость и ускоряет итерационный процесс для более эффективной адаптации.

Формируя будущее: вычислительная лаборатория MIT-IBM

IBM и Массачусетский технологический институт (MIT) открывают исследовательскую лабораторию MIT-IBM Computing Research Lab, которая будет заниматься исследованиями в области искусственного интеллекта и квантовых вычислений с целью переосмысления будущего вычислительной техники. Лаборатория ставит перед собой цель ускорить развитие алгоритмов искусственного интеллекта, квантовых супервычислений...

Аналитика контрактов на базе искусственного интеллекта от PwC на AWS

Решение PwC для аннотирования на основе искусственного интеллекта (AIDA), созданное на платформе AWS, оптимизирует анализ договоров, сокращая время ручной проверки на 90 %. AIDA сочетает в себе крупные языковые модели с автоматизированными рабочими процессами извлечения информации, что позволяет получать структурированные аналитические данные и давать ответы с учетом конкретного контекста, кар...