Автор протестировал регрессионную модель «случайного леса» на наборе данных по диабету, что, как и ожидалось, привело к низкой точности прогнозирования. Для обучения модели использовались нормализованные данные, при этом точность как на обучающем, так и на тестовом наборах составила около 0,24.
Исследователи из Массачусетского технологического института (MIT) разработали метод, позволяющий повысить эффективность федеративного обучения на 81% и обеспечить безопасное обучение ИИ на периферийных устройствах с ограниченными ресурсами. Этот прорыв может расширить сферу применения ИИ в здравоохранении и финансах, сделав мощные модели доступными для небольших устройств.
Компания Poolside AI представляет модели Laguna M. 1 и Laguna XS. 2, отличающиеся высокой эффективностью и уникальными функциями. Модель Laguna XS. 2 демонстрирует инновационную архитектуру с использованием SWA и глобальных слоёв внимания, что делает её идеальным решением для локального использования на устройствах.
Лаборатория FAIR компании Meta выпустила NeuralSet — фреймворк на языке Python, предназначенный для устранения узких мест в обработке данных в области нейробиологии. NeuralSet разделяет структуру и данные, упрощая сложную задачу выравнивания нейронных временных рядов для фреймворков искусственного интеллекта.
IBM и Массачусетский технологический институт (MIT) открывают исследовательскую лабораторию MIT-IBM Computing Research Lab, которая будет заниматься исследованиями в области искусственного интеллекта и квантовых вычислений с целью переосмысления будущего вычислительной техники. Лаборатория ставит перед собой цель ускорить развитие алгоритмов искусственного интеллекта, квантовых супервычислений...
Разработчики сталкиваются с трудностями при организации памяти для агентов искусственного интеллекта, что приводит к появлению уязвимостей в системе безопасности. Amazon Bedrock AgentCore Memory использует пространства имён для упорядоченного, доступного и безопасного хранения данных в памяти. Пространства имён обеспечивают иерархический поиск и контроль доступа, что является необходимым услов...
NVIDIA Nemotron 3 Nano Omni в рамках Amazon SageMaker JumpStart представляет собой мультимодальную модель для интеллектуальных приложений, обеспечивающую понимание видео, аудио, изображений и текста за один проход. Она упрощает рабочие процессы агентов за счет обработки экранов, документов, аудио и видео в рамках единого цикла вывода, что позволяет сократить задержки и снизить затраты.
Переход от текстовых агентов к голосовым помощникам с помощью Amazon Nova 2 Sonic обеспечивает естественное взаимодействие в режиме реального времени в сфере финансов, здравоохранения и розничной торговли. Разработка голосовых агентов требует лаконичных, разговорных ответов, адаптированных для восприятия в режиме реального времени, что отличается от подхода текстовых агентов, основанного на ис...
Модели регрессии на основе машинного обучения позволяют прогнозировать числовые значения, такие как кредитные рейтинги. Для обучения могут использоваться различные методы, например линейная регрессия и нейронные сети. Демонстрационный пример на языке C# иллюстрирует различные методы обучения моделей линейной регрессии.
Рефакторинг псевдообратной матрицы с помощью нормальных уравнений упрощает код для машинного обучения. Разложение Холески снижает сложность обработки матриц обучающих данных в задачах машинного обучения.
Конечные точки Amazon SageMaker AI позволяют организациям управлять вычислительными ресурсами и размещением инфраструктуры, одновременно используя преимущества управляемого операционного уровня AWS. SDK Strands Agents упрощает создание ИИ-агентов, интеграцию с моделями SageMaker AI и проведение A/B-тестирования для постоянного совершенствования.
Развитие искусственного интеллекта приведет к росту энергопотребления в дата-центрах США; Массачусетский технологический институт (MIT) и IBM разрабатывают инструмент для оперативного прогнозирования энергопотребления с целью обеспечения устойчивой эффективности ИИ. Этот инструмент позволяет быстро оценивать энергопотребление, что помогает операторам дата-центров и разработчикам алгоритмов.
LoRA эффективно осуществляет финнастройку крупных моделей, но испытывает трудности с обработкой сложных фактических знаний. RS-LoRA обеспечивает стабильность обучения при более высоких рангах с помощью простой настройки масштабирования.
Компания Deloitte использовала Amazon EKS и vCluster для модернизации своей инфраструктуры тестирования. Автоматизированное решение синхронизирует данные из S3 с базами знаний Amazon Bedrock с учетом квот на использование сервисов и ограничений по скорости.
MOSS-Audio, разработанная OpenMOSS, MOSI. AI и Шанхайским институтом инноваций, представляет собой модель с открытым исходным кодом, объединяющую в себе функции распознавания речи, звуков, музыки и многое другое. Она состоит из четырёх вариантов, оптимизированных для различных задач, и основана на модульной архитектуре, включающей аудиокодер, адаптер модальности и крупную языковую модель.