Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Революция в области обучения и вывода с помощью TSP: увеличение пропускной способности в 2,6 раза

Разработанная Zyphra технология «Тензорный и последовательный параллелизм» (TSP) снижает объем памяти, используемый на один графический процессор, и превосходит по эффективности стандартные схемы параллелизма. TSP сочетает в себе тензорный параллелизм (TP) и последовательный параллелизм (SP) для оптимизации управления памятью в больших трансформерных моделях.

Эффективная рефакторинг псевдообратной матрицы на C#

Машинное обучение предлагает различные методы обучения линейных моделей, такие как стохастический градиентный спуск и алгоритмы псевдообратной матрицы, например, метод «ослабленного» Мура-Пенроуза и метод левой псевдообратной матрицы через нормальные уравнения. Метод разложения Холески для левой псевдообратной матрицы проще, но может быть уязвим при плохом

Лучшие инструменты для создания ИИ-агентов: ведущие API для поиска и извлечения данных в 2026 году

В 2026 году TinyFish станет одним из ведущих API для поиска и извлечения данных, отличающимся архитектурой, оптимизированной для ИИ-агентов, и эффективным использованием токенов. Сервис предлагает бесплатные конечные точки с низкой задержкой поиска и чистым выводом данных для разработки ИИ-агентов.

Освоение методов систематического стимулирования в процессе развития

В настоящее время разработчики уделяют приоритетное внимание подсказкам в больших языковых моделях (LLM) для обеспечения надежности в производственных системах. Пять методов, включая подсказки с учетом конкретной роли и подсказки в формате JSON, позволяют повысить качество результатов без изменения модели.

Представляем KAME: преобразование речи в речь в режиме реального времени с использованием знаний из больших языковых моделей

Sakana AI представляет KAME — гибридную модель диалогового искусственного интеллекта, обеспечивающую баланс между скоростью и глубиной для более естественного взаимодействия. KAME сочетает в себе преобразование речи в речь в режиме реального времени с крупномасштабной языковой моделью, что позволяет сократить задержку ответа без ущерба для качества предоставляемой информации.

Устранение смещения токенизации

Сдвиг токенизации возникает, когда незначительные изменения форматирования приводят к непредсказуемым изменениям в поведении модели. Пробелы в начале строки приводят к созданию разных идентификаторов токенов, что сказывается на вычислении внимания и производительности модели.

Революция в сфере удаленных агентов: Mistral AI достиг результата 77,6 % по тесту SWE-Bench

Mistral AI представляет удаленных агентов в Vibe — платформе-помощнике по программированию, работающей на базе новой плотной модели Mistral Medium 3.5. Эти облачные агенты могут самостоятельно выполнять задачи, повышая производительность и эффективность рабочего процесса при программировании.

Qwen AI представляет Qwen-Scope: преобразование функций больших языковых моделей в инструменты разработки

Команда Qwen представляет Qwen-Scope — набор решений с открытым исходным кодом, состоящий из разреженных автокодировщиков, обученных на различных семействах моделей, который помогает диагностировать и направлять работу крупных языковых моделей, таких как Qwen3. Используя разреженные автокодировщики для разложения активаций на интерпретируемые концепции, инженеры могут влиять на поведение модел...

Раскрытие тайн сна с помощью Beacon Biosignals

Компания Beacon Biosignals, основанная Джейком Донохью (доктор наук, выпускник 2019 года) и бывшим научным сотрудником Массачусетского технологического института Джарреттом Ревелсом, использует технологию ЭЭГ для мониторинга мозговой активности во время сна в домашних условиях. Устройство компании, получившее одобрение Управления по санитарному надзору за качеством пищевых продуктов и медикаме...

Освоение силы языка

Исследования Оливии Ханикатт, студентки последнего курса Массачусетского технологического института (MIT), посвящены взаимосвязи между человеческим мышлением, изучением языков, технологиями и взаимодействием в социальных группах. Она изучает, как язык формирует наше восприятие мира и самих себя, углубляясь в такие области, как нейролингвистика и искусственный интеллект, в рамках своей работы в...

Ускорение работы NeMo RL с помощью спекулятивного декодирования: достигнуто беспрецедентное увеличение скорости

Исследователи из NVIDIA предлагают интегрировать спекулятивное декодирование в цикл обучения NeMo RL для ускорения генерации роллаутов с сохранением точного распределения выходных значений. Данный метод позволяет значительно уменьшить узкое место при генерации роллаутов, повышая эффективность без ущерба для точности обучения.

Autodata: модели искусственного интеллекта как автономные специалисты по данным

Команда RAM из Meta AI решает проблему низкого качества данных с помощью Autodata, демонстрируя более высокую эффективность по сравнению с методами, основанными на синтетических данных. Autodata позволяет ИИ-агентам самостоятельно создавать, оценивать и дорабатывать обучающие данные в рамках итеративного процесса, основанного на обратной связи.

Сила любознательности в науке

Президент Массачусетского технологического института Салли Корнблут подчеркивает важность фундаментальной науки и ключевую роль университетов в научных исследованиях. Она предупреждает о возможных негативных последствиях для США, если развитие фундаментальной науки окажется под угрозой из-за неопределенности с финансированием.

Революционные изменения в организациях с помощью агентов OpenClaw

OpenClaw, автономный ИИ-помощник, быстро стал сенсацией на GitHub, набрав более 250 000 звездочек за 60 дней. Компания NVIDIA сотрудничает с разработчиками проекта с целью повышения его безопасности и отказоустойчивости, представив NemoClaw для более безопасного длительного выполнения

Повышение геометрической согласованности в Wan 2.1 с помощью Flow-GRPO и 3D Rewards

Исследователи из Microsoft Research и Университета Чжэцзяна представляют World-R1 — платформу, которая с помощью методов обучения с подкреплением согласовывает генерацию видео с 3D-ограничениями. World-R1 повышает качество видео за счет извлечения скрытых 3D-знаний без изменения базовой архитектуры и без увеличения затрат на вычисления.