Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

API Grok: революция в сфере разработки корпоративных голосовых решений

xAI, компания Илона Маска, занимающаяся искусственным интеллектом, запускает API-интерфейсы для преобразования речи в текст и текста в речь, которые составляют конкуренцию ведущим игрокам на рынке речевых API. API-интерфейсы Grok предлагают такие расширенные функции, как идентификация говорящих, временные метки на уровне слов и высокая точность транскрипции.

TabPFN: Обучение работе с табличными наборами данных с помощью контекстного обучения

Табличные данные играют ключевую роль в машинном обучении, а модели на основе деревьев, такие как TabPFN, бросают вызов традиционным подходам, превосходя по эффективности XGBoost и CatBoost. TabPFN-2.5 обеспечивает более высокую производительность, сокращает объем ручной работы и ускоряет процесс вывода, что делает его пригодным для внедрения в реальных условиях.

Автодиагностика: искусственный интеллект Google революционизирует диагностику сбоев при интеграционном тестировании

Исследователи Google представили Auto-Diagnose — инструмент на базе большого языкового модели (LLM), который с точностью 90,14 % выявляет основные причины сбоев при проведении интеграционных тестов. Этот инструмент решает распространенную проблему, связанную с трудоемкостью отладки интеграционных тестов, экономя время разработчиков и избавляя их от лишних хлопот.

Anthropic представляет Opus 4.7: революция в области агентного программирования и автономных задач

Компания Anthropic выпустила версию Claude Opus 4.7, которая расширяет возможности ИИ для разработчиков за счет усовершенствованных функций программной инженерии и улучшенных возможностей обработки изображений. Opus 4.7 самостоятельно проверяет результаты, повышает производительность при написании кода на 13 % и обеспечивает в 3 раза более высокую точность при решении сложных задач, устанавлив...

Раскрытие потенциала мультимодальных встраиваемых моделей Amazon Nova

Семантический поиск по видео меняет подход к предоставлению контента во всех отраслях, обеспечивая быстрый и точный доступ к конкретным моментам в видео. Amazon Nova Multimodal Embeddings предлагает унифицированную модель, которая обрабатывает текст, изображения, видео и аудио, преобразуя их в единое семантическое векторное пространство, что обеспечивает высочайшую точность поиска и экономичес...

«Динамический дуэт» удостоен премии Эджертона

Доценты Массачусетского технологического института (MIT) Джейкоб Андреас и Бретт Макгуайр удостоены премии имени Гарольда Э. Эджертона за достижения в научной деятельности 2026 года за новаторские работы в области обработки естественного языка и астрохимии. Инновационные исследования Андреаса объединяют фундаментальную теорию с практическим применением в сфере изучения языков и искусственного ...

Агентный ИИ: революция в эффективности маркетинга

Команда TAA отдела маркетинга AWS в сотрудничестве с Gradial разработала решение на базе агентного ИИ на платформе Amazon Bedrock, что позволило сократить время сборки веб-страниц более чем на 95 %. Эта инновация оптимизирует рабочие процессы публикации контента, позволяя маркетинговым командам сосредоточиться на создании более эффективного клиентского опыта.

Представляем систему детальной атрибуции затрат для Amazon Bedrock

Amazon Bedrock теперь предлагает детализированную атрибуцию затрат, автоматически распределяя затраты на вычисления между субъектами IAM, такими как пользователи IAM, роли или федеративные идентификаторы от поставщиков, например Okta. Теги распределения затрат позволяют легко агрегировать данные по командам, проектам или пользовательским параметрам в AWS Cost Explorer и CUR 2.0, что упрощает ф...

Представлена революционная модель «зрение-язык» с разреженным весовым коэффициентом (MoE) на базе открытого исходного кода

Команда Qwen компании Alibaba представляет Qwen3.6-35B-A3B — разреженную модель MoE с 35 миллиардами параметров, демонстрирующую впечатляющую производительность в различных тестах, включая SWE-bench и Terminal-Bench 2.0, что свидетельствует о значительных достижениях в области агентного кодирования и генерации кода на уровне интерфейса.

Рабочие процессы с искусственным интеллектом от Google в Chrome, запускаемые одним щелчком мыши

Google представляет функцию «Skills» в Chrome в рамках проекта Gemini, которая позволяет пользователям сохранять запросы к ИИ в виде повторно используемых рабочих процессов. Эта функция упрощает выполнение задач на нескольких вкладках и дает представление о будущем ИИ-агентов на уровне браузера.

Parcae: Усовершенствование языковых моделей с циклической структурой в Калифорнийском университете в Сан-Диего

Исследователи из Калифорнийского университета в Сан-Диего и компании Together AI представляют Parcae — архитектуру трансформатора с циклической структурой, которая демонстрирует более высокую производительность по сравнению с предыдущими моделями при использовании тех же параметров и обучающих данных. Конструкция Parcae позволяет преодолеть ограничения по объему памяти и обеспечивает более выс...

Раскрытие потенциала взаимодействия с LLM

Понимание сложных систем машинного обучения, таких как крупные языковые модели (LLM), имеет решающее значение для искусственного интеллекта. Новые алгоритмы, такие как SPEX и ProxySPEX, призваны выявлять ключевые взаимодействия в масштабе, измеряя влияние с помощью абляции и выделяя факторы, определяющие принятие решений, с минимально возможными возмущениями.

Революция в моделях сворачивания белков

PLAID — модель, генерирующая аминокислотные последовательности и структуры белков, — отражает роль искусственного интеллекта в биологии. Модель решает такие задачи, как построение моделей с полным атомным разрешением и учетом видовой специфичности, стремясь к эффективному созданию полезных белков.

Сила данных в искусственном интеллекте

Ценность ИИ определяют не алгоритмы, а данные. Такие компании, как Amazon, Google и Microsoft, достигают успеха благодаря собственным высококачественным наборам данных. Качество данных имеет решающее значение для успеха ИИ, что делает их стратегическим активом, обеспечивающим конкурентное преимущество в XXI веке.

Дискриминация по диалекту: выявление лингвистических предубеждений в ChatGPT

ChatGPT демонстрирует предвзятое отношение к «нестандартным» разновидностям английского языка, при этом его ответы содержат стереотипы и носят снисходительный характер. В ходе исследования GPT-3.5 Turbo и GPT-4 были предоставлены 10 разновидностей английского языка, что позволило выявить сохранение черт стандартного американского английского.