Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Революционный кросс-токенизатор X-Token доминирует в задаче GOLD на модели Llama-3.2-1B

Метод дистилляции знаний позволяет переносить «скрытые знания» из больших моделей в малые с помощью позиционной KL-дивергенции. Технология X-Token от NVIDIA устраняет недостатки межтокенной дистилляции знаний, предлагая более эффективный и результативный подход, основанный на выравнивании интервалов и использовании дополнительных формулировок потерь.

Оптимизация производительности модели большого языкового модели (LLM) на базе искусственного интеллекта в Amazon SageMaker

Развертывание крупных языковых моделей (LLM) в среде Amazon SageMaker AI Inference требует комплексной системы мониторинга, позволяющей отслеживать как состояние инфраструктуры, так и качество работы LLM. Отслеживание таких показателей, как задержка, количество ошибок и точность ответов, имеет решающее значение для оптимизации затрат, производительности и качества результатов в долгосрочной пе...

Обучение моделей азербайджанского языка с помощью SageMaker AI

Компания «Azercell Telecom» сотрудничает с AWS в целях создания азербайджанской большой языковой модели (LLM) и чат-бота, что позволяет добиться значительной оптимизации и улучшений. Платформа на базе Amazon SageMaker AI обеспечивает более высокую производительность обучения, меньшее потребление памяти и удвоенный объем текстовых данных, а также предоставляет аналитические данные для работы со...

Управление масштабируемыми наборами тестов в Amazon Bedrock AgentCore

Оценка агентов становится более эффективной благодаря сочетанию онлайн-сигналов со стабильными офлайн-эталонными значениями. Amazon Bedrock AgentCore поддерживает использование тестовых наборов с версионным управлением, что обеспечивает согласованность и проверяемость результатов измерений при доработке агентов. Наборы данных с версионным управлением служат в качестве эталонных значений, благо...

MIT открывает центр по квантовым технологиям

Массачусетский технологический институт (MIT) и штат Массачусетс создадут Лабораторию квантовых систем (QSL) с целью содействия развитию квантовых исследований и инноваций. QSL станет передовым научно-исследовательским центром, занимающимся разработкой революционных квантовых технологий для применения в различных практических областях.

Расширение возможностей Amazon SageMaker MLflow с помощью прокси-сервера REST API

Amazon SageMaker MLflow предоставляет широкие возможности по отслеживанию экспериментов в области машинного обучения и управлению моделями. Предприятия могут безопасно интегрировать MLflow с существующими системами с помощью прокси-сервиса на базе Flask, что обеспечивает соблюдение нормативных требований и снижает сложность.

Представляем LFM2.5-8B-A1B: мощную модель MoE для внедрения на устройстве

Компания Liquid AI выпустила LFM2.5-8B-A1B — разреженную модель MoE для вызова инструментов на устройстве. Она улучшает способность к логическому мышлению и демонстрирует впечатляющие результаты в тестах по сравнению с предыдущей версией.

«Разгадка секрета»: пропущенные данные в машинном обучении

Модели машинного обучения прогнозируют такие показатели, как доход, на основе пола, возраста, штата и политических взглядов. Вставка отсутствующих данных для прогнозирования может привести к вводящим в заблуждение результатам в машинном обучении.

Преодолевая границы: революция в робототехнике от NVIDIA

Робототехника развивается: исследовательский центр NVIDIA Research демонстрирует технологию переноса результатов моделирования в реальные условия, позволяющую роботам адаптироваться и надежно работать в динамичных средах. Среди инноваций — координация действий нескольких манипуляторов с помощью ScheduleStream и набора правил COMPASS для различных типов роботов, что обеспечивает значительное по...

007 First Light: запуск на GeForce NOW

GeForce NOW запускает «007: Первый свет», предлагая подписчикам узнать историю происхождения Джеймса Бонда и получить бесплатный набор «Элитный». Оцените высококачественные облачные игры с новыми релизами и эксклюзивными наградами, включая демо-версию Resident Evil Requiem.

Раскрытие потенциала искусственного интеллекта в сфере продаж с помощью Amazon Bedrock AgentCore

Field Advisor на платформе Amazon Bedrock AgentCore оптимизирует координацию работы агентов в отделе продаж AWS, снижая когнитивную нагрузку и улучшая взаимодействие с клиентами. Этот внутренний диалоговый помощник повышает производительность за счет перенаправления запросов специализированным агентам, что позволяет торговым представителям сосредоточиться на потребностях клиентов.

Неутешительные результаты: регрессия с градиентным бустингом на наборе данных по диабету

Практикуя навыки программирования, разработчик тестирует модель регрессии с градиентным бустом на наборе данных по диабету, демонстрируя изящную технику, лежащую в основе этой ансамблевой модели. Реализуя 100 деревьев решений на языке C#, разработчик исследует тонкий, но эффективный подход к прогнозированию остаточных значений с целью повышения точности.

Оптимизируйте обработку финансовой документации с помощью Amazon Bedrock

Amazon Bedrock Data Automation оптимизирует извлечение данных из финансовых документов с помощью настраиваемых шаблонов, обеспечивающих точность и эффективность. Базовые модели, такие как Anthropic Claude, расширяют возможности OCR для извлечения структурированных и пригодных к использованию данных.

ПРИМЕЧАНИЕ: Обучение специализированной модели памяти для новых знаний

Исследователи из Национального университета Сингапура и Массачусетского технологического института (MIT) предлагают систему MEMO для обновления больших языковых моделей (LLM) без потери качества, используя отдельные модели памяти и логического вывода. Уникальный конвейер обучения MEMO генерирует разнообразные пары «вопрос-ответ», что позволяет модели усваивать знания для логического вывода на ...