Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Неутешительные результаты: регрессия с градиентным бустингом на наборе данных по диабету

Практикуя навыки программирования, разработчик тестирует модель регрессии с градиентным бустом на наборе данных по диабету, демонстрируя изящную технику, лежащую в основе этой ансамблевой модели. Реализуя 100 деревьев решений на языке C#, разработчик исследует тонкий, но эффективный подход к прогнозированию остаточных значений с целью повышения точности.

ПРИМЕЧАНИЕ: Обучение специализированной модели памяти для новых знаний

Исследователи из Национального университета Сингапура и Массачусетского технологического института (MIT) предлагают систему MEMO для обновления больших языковых моделей (LLM) без потери качества, используя отдельные модели памяти и логического вывода. Уникальный конвейер обучения MEMO генерирует разнообразные пары «вопрос-ответ», что позволяет модели усваивать знания для логического вывода на ...

Создание интеллектуальных помощников для научных исследований с помощью Strands

Для создания приложений на базе ИИ больше не требуются глубокие знания в области машинного обучения. С помощью Strands Agents и сервисов AWS можно создавать интеллектуальных агентов всего за 30 строк кода, что упрощает разработку решений на базе ИИ для сред AWS.

Революция в создании документов с Amazon Quick

Amazon Quick позволяет специалистам создавать отформатированные документы и визуальные материалы на основе актуальных данных, что позволяет сэкономить время на рутинных задачах. Результаты могут быть выведены в форматах Word, Excel, PowerPoint, PDF, а также в виде бизнес-визуализаций, причем все они полностью доступны для редактирования, что позволяет продолжать работу без необходимости повтор...

Создание эффективного решения для мониторинга Amazon Quick

Amazon Quick представляет собой централизованное решение для мониторинга корпоративных платформ искусственного интеллекта, которое объединяет данные об использовании для более эффективного отслеживания и анализа. Благодаря интеграции с сервисами AWS Amazon Quick обеспечивает мониторинг, аналитику и управление с помощью защищенного хранилища данных, Amazon Athena и панели инструментов Quick Sight.

Представляем Stable Audio 3: искусственный интеллект нового поколения для генерации аудио

Компания Stability AI выпустила Stable Audio 3 с открытыми весами и техническим документом. Модели латентной диффузии поддерживают вывод данных переменной длины и редактирование на основе ретуширования для генерации стереозвука.

Прорыв в области ИИ: OSCAR — революция в обслуживании моделей с большим объемом контекста (LLM)

Кэш KV является значительной статьёй затрат при обслуживании больших языковых моделей (LLM); его сжатие с помощью квантования на основе поворотов, реализованного в OSCAR, повышает эффективность при точности INT2. OSCAR вычисляет повороты на основе статистики внимания, чтобы уменьшить ошибки квантования, что позволяет улучшить качество внимания и повысить производительность модели.

Эффективное вычисление обратной матрицы на C#

Разработка функции обратного матричного преобразования с использованием разложения Холески: более лаконичный код или более высокая эффективность. Анализ методов разработки программного обеспечения с использованием кода, сгенерированного ИИ, и дизайна персонажей в анимационных фильмах.

Gated DeltaNet-2: революция в области нейронных сетей благодаря линейному вниманию

Компания NVIDIA представляет модель Gated DeltaNet-2 с линейным механизмом внимания, предназначенную для улучшения обработки данных в памяти. Модель оснащена двумя канальными гейтами и демонстрирует более высокую производительность по сравнению с предыдущими моделями в исследовательских тестах.

Bumblebee: сканер цепочки поставок с открытым исходным кодом

Инструмент Bumblebee от Perplexity сканирует рабочие станции разработчиков на наличие уязвимых пакетов, расширений и настроек инструментов искусственного интеллекта. Он восполняет пробел в существующих инструментах, проверяя локальную среду разработчика на наличие потенциальных угроз безопасности.

Раскрытие потенциала разреженных MLP-схем с помощью CNA

В новом исследовании команды Nous представлена модель CNA, позволяющая точно определять нейроны MLP, ответственные за «барьеры отклонения» в моделях с инструкциями. Удаление всего 0,1 % активаций MLP снижает частоту отклонений более чем на 50 % без ущерба для качества выходных данных.

Fara 1.5 от Microsoft: лучшие браузерные агенты доминируют в онлайн-пространстве — Mind2Web

Лаборатория AI Frontiers компании Microsoft Research выпустила Fara1.5 — семейство моделей компьютерных агентов для браузеров, интегрированных с MagenticLite. Модель Fara1.5-27B демонстрирует 72 % успешности выполнения задач на наборе данных Online-Mind2Web, превосходя по результатам таких конкурентов, как Operator от OpenAI и Gemini 2.5 от Google.

Скажите «нет» кодированию с приоритетом удаления в нейронных сетях

Для регрессоров нейронных сетей, работающих с категориальными данными, следует использовать кодирование «one-hot»; кодирование «drop-first» не является необходимым и оказывается несколько менее эффективным. Результаты демонстрации показывают, что нет оснований рассматривать кодирование «drop-first» для нейронных сетей, что подтверждает преимущества кодирования «one-hot».

Инженер по искусственному интеллекту: будущее трудоустройства в сфере высоких технологий

Инженер по внедрению на месте (FDE) работает непосредственно с клиентами, занимаясь разработкой реального кода для производственных систем. Модель FDE компании Palantir бросает вызов традиционным SaaS-решениям при внедрении сложных систем искусственного интеллекта.

Lance: Революция в области редактирования изображений и видео

Lance от ByteDance объединяет в одной модели функции распознавания, генерации и редактирования изображений и видео, что стало важной вехой в развитии архитектуры искусственного интеллекта. Lance объединяет всю экосистему работы с изображениями и видео, выполняя задачи от создания подписей до многоэтапного редактирования с обеспечением согласованности в обоих форматах.