Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Эффективная оценка мощности ИИ

Развитие искусственного интеллекта приведет к росту энергопотребления в дата-центрах США; Массачусетский технологический институт (MIT) и IBM разрабатывают инструмент для оперативного прогнозирования энергопотребления с целью обеспечения устойчивой эффективности ИИ. Этот инструмент позволяет быстро оценивать энергопотребление, что помогает операторам дата-центров и разработчикам алгоритмов.

Эффективный расчет псевдообратной матрицы на C#

Рефакторинг псевдообратной матрицы с помощью нормальных уравнений упрощает код для машинного обучения. Разложение Холески снижает сложность обработки матриц обучающих данных в задачах машинного обучения.

Расширьте возможности агентов Strands с помощью ИИ и машинного обучения

Конечные точки Amazon SageMaker AI позволяют организациям управлять вычислительными ресурсами и размещением инфраструктуры, одновременно используя преимущества управляемого операционного уровня AWS. SDK Strands Agents упрощает создание ИИ-агентов, интеграцию с моделями SageMaker AI и проведение A/B-тестирования для постоянного совершенствования.

Проблемы использования LoRA в производственной среде

LoRA эффективно осуществляет финнастройку крупных моделей, но испытывает трудности с обработкой сложных фактических знаний. RS-LoRA обеспечивает стабильность обучения при более высоких рангах с помощью простой настройки масштабирования.

Оптимизация синхронизации базы знаний Amazon Bedrock

Компания Deloitte использовала Amazon EKS и vCluster для модернизации своей инфраструктуры тестирования. Автоматизированное решение синхронизирует данные из S3 с базами знаний Amazon Bedrock с учетом квот на использование сервисов и ограничений по скорости.

PageIndex: Переосмысление поиска без использования векторов

PageIndex революционизирует процесс поиска документов благодаря использованию деревовидного индекса и моделей большого языкового обучения (LLM) для логического вывода, превосходя по эффективности векторные системы, такие как RAG. Проиндексировав статью о Transformer без использования векторов, PageIndex демонстрирует свою точность и способность к глубокому пониманию, что делает его настоящим п...

Революция в области генерации изображений с Vision Banana

В новой статье Google представлена модель Vision Banana — универсальная модель, которая демонстрирует высокую эффективность при решении различных задач компьютерного зрения, сохраняя при этом способность генерировать изображения. Этот прорыв ставит под сомнение традиционное разделение на генеративные и дискриминативные модели в области компьютерного зрения.

Decoupled DiLoCo: достижение коэффициента полезной пропускной способности 88 % несмотря на высокую частоту отказов оборудования

Google DeepMind представляет Decoupled DiLoCo — архитектуру распределенного обучения, которая устраняет узкие места, связанные с синхронизацией, и позволяет проводить предварительное обучение крупных языковых моделей в географически удаленных дата-центрах. Decoupled DiLoCo снижает требования к пропускной способности межцентровой сети с 198 Гбит/с до всего 0,84 Гбит/с, что делает обучение в гло...

Обширная библиотека математических задач Массачусетского технологического института теперь доступна всем

MathNet, созданный исследователями из MIT, KAUST и HUMAIN, представляет собой крупнейший набор данных, содержащий математические задачи с доказательствами, охватывающий 47 стран и 17 языков. Он представляет собой централизованную коллекцию высококачественных задач и решений из международных математических олимпиад, предлагая моделям искусственного интеллекта и учащимся богатый ресурс для изуче...

DeepSeek AI представляет революционную функцию обработки контекста объемом в один миллион токенов

DeepSeek-AI представляет серию DeepSeek-V4 с инновационными моделями MoE, поддерживающими контекстные окна объемом в миллион токенов. Гибридная архитектура внимания и гиперсвязи с ограничением многообразия (Manifold-Constrained Hyper-Connections) кардинально меняют подход к решению задач с длинным контекстом.

Революция в области ухода за пациентами благодаря мультимодальным биологическим моделям

Достижения в области искусственного интеллекта в здравоохранении позволяют объединять разрозненные потоки данных, что способствует принятию более обоснованных решений в сфере персонализированной медицины. Мультимодальные системы BioFM, такие как Latent-X1 и Evo 2, кардинально меняют подход к открытию новых лекарственных препаратов и клиническим испытаниям благодаря моделям искусственного интел...

Представляем ReasoningBank: фреймворк Google для искусственного интеллекта в области памяти

Исследователи из Google Cloud AI, Университета Иллинойса в Урбана-Шампейне и Йельского университета представляют ReasoningBank — систему памяти, которая выделяет причины успеха или неудачи задач, выполняемых агентами искусственного интеллекта. Существующие системы памяти агентов имеют серьезные «слепые зоны», однако ReasoningBank извлекает релевантные воспоминания для повышения эффективности р...

Разочаровывающие результаты: регрессионный анализ с использованием нейронной сети на наборе данных по диабету на языке C#

Автор делится опытом применения набора данных по диабету в регрессионной модели на основе нейронной сети на языке C#, которая позволяет точно прогнозировать показатели диабета. Благодаря нормализации данных и настройкам нейронной сети были получены результаты, сопоставимые с результатами других регрессионных моделей.

Раскрытие потенциала корпоративной памяти с помощью Amazon Neptune и Mem0

TrendMicro расширяет возможности своего чат-бота на базе искусственного интеллекта, добавив функцию «корпоративной памяти» в Amazon Bedrock, которая работает на базе Amazon Neptune и Mem0. Такая архитектура позволяет чат-боту анализировать историю взаимодействий, извлекать корпоративные знания и давать персонализированные ответы, что способствует улучшению пользовательского опыта.