Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Создание интеллектуальных помощников для научных исследований с помощью Strands

Для создания приложений на базе ИИ больше не требуются глубокие знания в области машинного обучения. С помощью Strands Agents и сервисов AWS можно создавать интеллектуальных агентов всего за 30 строк кода, что упрощает разработку решений на базе ИИ для сред AWS.

Создание эффективного решения для мониторинга Amazon Quick

Amazon Quick представляет собой централизованное решение для мониторинга корпоративных платформ искусственного интеллекта, которое объединяет данные об использовании для более эффективного отслеживания и анализа. Благодаря интеграции с сервисами AWS Amazon Quick обеспечивает мониторинг, аналитику и управление с помощью защищенного хранилища данных, Amazon Athena и панели инструментов Quick Sight.

Прорыв в области ИИ: OSCAR — революция в обслуживании моделей с большим объемом контекста (LLM)

Кэш KV является значительной статьёй затрат при обслуживании больших языковых моделей (LLM); его сжатие с помощью квантования на основе поворотов, реализованного в OSCAR, повышает эффективность при точности INT2. OSCAR вычисляет повороты на основе статистики внимания, чтобы уменьшить ошибки квантования, что позволяет улучшить качество внимания и повысить производительность модели.

Эффективное вычисление обратной матрицы на C#

Разработка функции обратного матричного преобразования с использованием разложения Холески: более лаконичный код или более высокая эффективность. Анализ методов разработки программного обеспечения с использованием кода, сгенерированного ИИ, и дизайна персонажей в анимационных фильмах.

Gated DeltaNet-2: революция в области нейронных сетей благодаря линейному вниманию

Компания NVIDIA представляет модель Gated DeltaNet-2 с линейным механизмом внимания, предназначенную для улучшения обработки данных в памяти. Модель оснащена двумя канальными гейтами и демонстрирует более высокую производительность по сравнению с предыдущими моделями в исследовательских тестах.

Bumblebee: сканер цепочки поставок с открытым исходным кодом

Инструмент Bumblebee от Perplexity сканирует рабочие станции разработчиков на наличие уязвимых пакетов, расширений и настроек инструментов искусственного интеллекта. Он восполняет пробел в существующих инструментах, проверяя локальную среду разработчика на наличие потенциальных угроз безопасности.

Раскрытие потенциала разреженных MLP-схем с помощью CNA

В новом исследовании команды Nous представлена модель CNA, позволяющая точно определять нейроны MLP, ответственные за «барьеры отклонения» в моделях с инструкциями. Удаление всего 0,1 % активаций MLP снижает частоту отклонений более чем на 50 % без ущерба для качества выходных данных.

Fara 1.5 от Microsoft: лучшие браузерные агенты доминируют в онлайн-пространстве — Mind2Web

Лаборатория AI Frontiers компании Microsoft Research выпустила Fara1.5 — семейство моделей компьютерных агентов для браузеров, интегрированных с MagenticLite. Модель Fara1.5-27B демонстрирует 72 % успешности выполнения задач на наборе данных Online-Mind2Web, превосходя по результатам таких конкурентов, как Operator от OpenAI и Gemini 2.5 от Google.

Скажите «нет» кодированию с приоритетом удаления в нейронных сетях

Для регрессоров нейронных сетей, работающих с категориальными данными, следует использовать кодирование «one-hot»; кодирование «drop-first» не является необходимым и оказывается несколько менее эффективным. Результаты демонстрации показывают, что нет оснований рассматривать кодирование «drop-first» для нейронных сетей, что подтверждает преимущества кодирования «one-hot».

Lance: Революция в области редактирования изображений и видео

Lance от ByteDance объединяет в одной модели функции распознавания, генерации и редактирования изображений и видео, что стало важной вехой в развитии архитектуры искусственного интеллекта. Lance объединяет всю экосистему работы с изображениями и видео, выполняя задачи от создания подписей до многоэтапного редактирования с обеспечением согласованности в обоих форматах.

Повышение эффективности радиологии с помощью искусственного интеллекта

Традиционные системы рабочих списков в радиологии приводят к задержкам и увеличению затрат, поскольку игнорируют важный контекст, что ведет к неэффективному распределению случаев. Используя ИИ-агенты на платформе Amazon Bedrock AgentCore, компания Radiology Partners стремится сократить задержки в диагностике и оптимизировать координацию рабочих процессов за счет интеллектуального распределения...

Command A+: мощная разреженная модель MoE для агентных рабочих процессов

Command A+ от Cohere — это модель MoE с открытым исходным кодом, оптимизированная для агентных рабочих процессов и объединяющая в себе возможности четырёх предыдущих моделей. Благодаря наличию трёх вариантов квантования Command A+ демонстрирует значительное повышение производительности по сравнению с предыдущими моделями Command A при решении различных корпоративных задач.

Инженер по искусственному интеллекту: будущее трудоустройства в сфере высоких технологий

Инженер по внедрению на месте (FDE) работает непосредственно с клиентами, занимаясь разработкой реального кода для производственных систем. Модель FDE компании Palantir бросает вызов традиционным SaaS-решениям при внедрении сложных систем искусственного интеллекта.

Представляем Qwen 3.7-Max: совершенный агент, способный к логическому мышлению

Alibaba представляет Qwen3.7-Max для выполнения автономных многоэтапных задач. Qwen3.7-Max предлагает режим расширенного мышления с контекстным окном объемом 1 млн токенов, что значительно повышает возможности модели в области логического мышления.