Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

API Grok: революция в сфере разработки корпоративных голосовых решений

xAI, компания Илона Маска, занимающаяся искусственным интеллектом, запускает API-интерфейсы для преобразования речи в текст и текста в речь, которые составляют конкуренцию ведущим игрокам на рынке речевых API. API-интерфейсы Grok предлагают такие расширенные функции, как идентификация говорящих, временные метки на уровне слов и высокая точность транскрипции.

Anthropic представляет Opus 4.7: революция в области агентного программирования и автономных задач

Компания Anthropic выпустила версию Claude Opus 4.7, которая расширяет возможности ИИ для разработчиков за счет усовершенствованных функций программной инженерии и улучшенных возможностей обработки изображений. Opus 4.7 самостоятельно проверяет результаты, повышает производительность при написании кода на 13 % и обеспечивает в 3 раза более высокую точность при решении сложных задач, устанавлив...

Автодиагностика: искусственный интеллект Google революционизирует диагностику сбоев при интеграционном тестировании

Исследователи Google представили Auto-Diagnose — инструмент на базе большого языкового модели (LLM), который с точностью 90,14 % выявляет основные причины сбоев при проведении интеграционных тестов. Этот инструмент решает распространенную проблему, связанную с трудоемкостью отладки интеграционных тестов, экономя время разработчиков и избавляя их от лишних хлопот.

Раскрытие потенциала мультимодальных встраиваемых моделей Amazon Nova

Семантический поиск по видео меняет подход к предоставлению контента во всех отраслях, обеспечивая быстрый и точный доступ к конкретным моментам в видео. Amazon Nova Multimodal Embeddings предлагает унифицированную модель, которая обрабатывает текст, изображения, видео и аудио, преобразуя их в единое семантическое векторное пространство, что обеспечивает высочайшую точность поиска и экономичес...

Агентный ИИ: революция в эффективности маркетинга

Команда TAA отдела маркетинга AWS в сотрудничестве с Gradial разработала решение на базе агентного ИИ на платформе Amazon Bedrock, что позволило сократить время сборки веб-страниц более чем на 95 %. Эта инновация оптимизирует рабочие процессы публикации контента, позволяя маркетинговым командам сосредоточиться на создании более эффективного клиентского опыта.

«Динамический дуэт» удостоен премии Эджертона

Доценты Массачусетского технологического института (MIT) Джейкоб Андреас и Бретт Макгуайр удостоены премии имени Гарольда Э. Эджертона за достижения в научной деятельности 2026 года за новаторские работы в области обработки естественного языка и астрохимии. Инновационные исследования Андреаса объединяют фундаментальную теорию с практическим применением в сфере изучения языков и искусственного ...

Представляем систему детальной атрибуции затрат для Amazon Bedrock

Amazon Bedrock теперь предлагает детализированную атрибуцию затрат, автоматически распределяя затраты на вычисления между субъектами IAM, такими как пользователи IAM, роли или федеративные идентификаторы от поставщиков, например Okta. Теги распределения затрат позволяют легко агрегировать данные по командам, проектам или пользовательским параметрам в AWS Cost Explorer и CUR 2.0, что упрощает ф...

Представлена революционная модель «зрение-язык» с разреженным весовым коэффициентом (MoE) на базе открытого исходного кода

Команда Qwen компании Alibaba представляет Qwen3.6-35B-A3B — разреженную модель MoE с 35 миллиардами параметров, демонстрирующую впечатляющую производительность в различных тестах, включая SWE-bench и Terminal-Bench 2.0, что свидетельствует о значительных достижениях в области агентного кодирования и генерации кода на уровне интерфейса.

Оптимизация систем визуализации на основе информационно-ориентированного проектирования

Кодировщик преобразует объекты в изображения без шума, количественно оценивая, насколько точно измерения позволяют различать объекты. Искусственный интеллект способен извлекать полезную информацию даже из кодированных данных, которые человек не может интерпретировать, оптимизируя системы визуализации с учетом их информационного содержания.

Gemini Robotics от DeepMind: прорыв в области физического ИИ

Google DeepMind представляет Gemini Robotics-ER 1.6 — обновление, расширяющее возможности роботов в области логического мышления при решении реальных задач. Модель выступает в роли стратега высокого уровня, управляя физическими действиями на основе усовершенствованного пространственного мышления и анализа показаний приборов.

Parcae: Усовершенствование языковых моделей с циклической структурой в Калифорнийском университете в Сан-Диего

Исследователи из Калифорнийского университета в Сан-Диего и компании Together AI представляют Parcae — архитектуру трансформатора с циклической структурой, которая демонстрирует более высокую производительность по сравнению с предыдущими моделями при использовании тех же параметров и обучающих данных. Конструкция Parcae позволяет преодолеть ограничения по объему памяти и обеспечивает более выс...

Защита запросов: StruQ и SecAlign

Последние достижения в области крупных языковых моделей (LLM) открывают возможности для создания интересных интегрированных приложений, однако атаки с подстановкой подсказок представляют собой серьезную угрозу. StruQ и SecAlign — это предлагаемые средства защиты, призванные снизить риск атак с подстановкой подсказок в системах LLM, таких как Google Docs и ChatGPT.

Раскрытие потенциала взаимодействия с LLM

Понимание сложных систем машинного обучения, таких как крупные языковые модели (LLM), имеет решающее значение для искусственного интеллекта. Новые алгоритмы, такие как SPEX и ProxySPEX, призваны выявлять ключевые взаимодействия в масштабе, измеряя влияние с помощью абляции и выделяя факторы, определяющие принятие решений, с минимально возможными возмущениями.

Революция в сфере розничной торговли с помощью искусственного интеллекта AWS

Ритейлеры сталкиваются с проблемами в сфере онлайн-покупок, что приводит к росту количества возвратов и снижению доверия со стороны покупателей. Внедрение технологии виртуальной примерки с помощью Amazon Nova Canvas и Rekognition может повысить рентабельность и уровень удовлетворенности клиентов. Это основанное на искусственном интеллекте бессерверное решение для розничной торговли на базе AWS...

Революция в области обучения с подкреплением: новый подход

Новый алгоритм RL по принципу «разделяй и властвуй» бросает вызов традиционному обучению с целевым функцией, обеспечивая масштабируемость для задач с длительным горизонтом. Обучение RL без использования политики обеспечивает гибкость при работе со старыми данными, что имеет решающее значение для таких сложных областей, как робототехника и здравоохранение.