Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Улучшение локального линейного внимания с помощью коррекции ковариации

В новой статье представлена система Parallax — параметризованная версия алгоритма Local Linear Attention для трансформеров, которая повышает эффективность без ущерба для вычислительной мощности. В Parallax линейный решатель, используемый в LLA, заменен обученной матрицей проекции, что упрощает алгоритм, повышает его эффективность и облегчает реализацию.

Ускорение загрузки моделей LLM с помощью GPUDirect на Amazon FSx

Развертывание крупных языковых моделей на инстансах AWS с графическими процессорами может занимать много времени, однако Amazon FSx for Lustre и NVIDIA GPUDirect Storage позволяют значительно сократить время загрузки с нескольких минут до нескольких секунд. Благодаря новой архитектуре NVIDIA Blackwell серверы AWS P6e UltraServer обеспечивают огромную вычислительную мощность для масштабного обу...

Революция в области искусственного интеллекта: OpenAI и Codex теперь доступны на Amazon Bedrock!

Amazon Bedrock теперь предлагает модели GPT-5.5, GPT-5.4 и Codex для производственных ИИ-приложений. GPT-5.5 отлично справляется с программированием и интеллектуальной работой, демонстрируя улучшенную способность выполнять многоэтапные задачи и повышенную автономность.

Эффективная аппроксимация SVR с помощью регрессии с обрезанным ядром

Регрессия с ядром (KRR) и регрессия на опорных векторах (SVR) — это методы машинного обучения, которые можно объединить для построения разреженной модели KRR, аппроксимирующей модель SVR. Этот гибридный подход сочетает в себе преимущества KRR в обработке больших наборов данных и эффективность SVR в хранении моделей, демонстрируя высокую точность прогнозирования в демонстрационном примере с исп...

Расширение возможностей ИИ-агентов с помощью новейших технологий NVIDIA

На конференции GTC Taipei компания NVIDIA представила ПК серии RTX Spark для персональных агентов, оснащенные новыми вычислительными и памятью для искусственного интеллекта. Благодаря партнерству с Microsoft в Windows появились безопасные локальные агенты, а также были выпущены обновления для Hermes Agent и OpenClaw.

Безопасные платежи стали проще с Amazon Bedrock AgentCore

Платформа Amazon Bedrock AgentCore, реализованная в партнерстве с Coinbase и Stripe, позволяет агентам получать доступ к платным ресурсам от имени конечных пользователей. Проблемы безопасности, такие как неконтролируемые расходы и отсутствие согласия конечных пользователей, решаются за счет установления лимитов расходов и требования явного разрешения на проведение транзакций.

Genesis AI представляет революционную платформу для оценки робототехнических систем

Компания Genesis AI выпустила Genesis World 1.0, включающий в себя Nyx, Quadrants и интерфейс моделирования, предназначенный для ускорения разработки моделей робототехники с помощью симуляции. Оценка, занимающая менее 0,5 часа, дает результаты с битовой точностью, демонстрируя корреляцию 0,8996 между результатами моделирования и результатами внедрения на аппаратном обеспечении.

SIA: самосовершенствующийся агент от Hexo Labs

Компания Hexo Labs выпустила SIA (Self-Improving AI) в качестве фреймворка с открытым исходным кодом. SIA корректирует как структуру агента, так и веса модели для обеспечения непрерывного совершенствования. Обновление весов повышает эффективность в различных областях, превосходя результаты, достигаемые при использовании только корректировки структуры.

Оптимизация производительности модели большого языкового модели (LLM) на базе искусственного интеллекта в Amazon SageMaker

Развертывание крупных языковых моделей (LLM) в среде Amazon SageMaker AI Inference требует комплексной системы мониторинга, позволяющей отслеживать как состояние инфраструктуры, так и качество работы LLM. Отслеживание таких показателей, как задержка, количество ошибок и точность ответов, имеет решающее значение для оптимизации затрат, производительности и качества результатов в долгосрочной пе...

Революционный агент Hermes повышает точность Opus 4 на 74%

Hermes Agent от Nous Research представляет функцию Tool Search, призванную устранить узкие места в системах ИИ-агентов, вызванные чрезмерным количеством инструментов MCP. Tool Search оптимизирует загрузку инструментов, повышая точность и сокращая затраты; значительное повышение точности было продемонстрировано в ходе внутренних оценок, проведенных компанией Anthropic.

Революционный кросс-токенизатор X-Token доминирует в задаче GOLD на модели Llama-3.2-1B

Метод дистилляции знаний позволяет переносить «скрытые знания» из больших моделей в малые с помощью позиционной KL-дивергенции. Технология X-Token от NVIDIA устраняет недостатки межтокенной дистилляции знаний, предлагая более эффективный и результативный подход, основанный на выравнивании интервалов и использовании дополнительных формулировок потерь.

«Разгадка секрета»: пропущенные данные в машинном обучении

Модели машинного обучения прогнозируют такие показатели, как доход, на основе пола, возраста, штата и политических взглядов. Вставка отсутствующих данных для прогнозирования может привести к вводящим в заблуждение результатам в машинном обучении.

Расширение возможностей Amazon SageMaker MLflow с помощью прокси-сервера REST API

Amazon SageMaker MLflow предоставляет широкие возможности по отслеживанию экспериментов в области машинного обучения и управлению моделями. Предприятия могут безопасно интегрировать MLflow с существующими системами с помощью прокси-сервиса на базе Flask, что обеспечивает соблюдение нормативных требований и снижает сложность.

Управление масштабируемыми наборами тестов в Amazon Bedrock AgentCore

Оценка агентов становится более эффективной благодаря сочетанию онлайн-сигналов со стабильными офлайн-эталонными значениями. Amazon Bedrock AgentCore поддерживает использование тестовых наборов с версионным управлением, что обеспечивает согласованность и проверяемость результатов измерений при доработке агентов. Наборы данных с версионным управлением служат в качестве эталонных значений, благо...