xAI, компания Илона Маска, занимающаяся искусственным интеллектом, запускает API-интерфейсы для преобразования речи в текст и текста в речь, которые составляют конкуренцию ведущим игрокам на рынке речевых API. API-интерфейсы Grok предлагают такие расширенные функции, как идентификация говорящих, временные метки на уровне слов и высокая точность транскрипции.
Табличные данные играют ключевую роль в машинном обучении, а модели на основе деревьев, такие как TabPFN, бросают вызов традиционным подходам, превосходя по эффективности XGBoost и CatBoost. TabPFN-2.5 обеспечивает более высокую производительность, сокращает объем ручной работы и ускоряет процесс вывода, что делает его пригодным для внедрения в реальных условиях.
Компания Anthropic выпустила версию Claude Opus 4.7, которая расширяет возможности ИИ для разработчиков за счет усовершенствованных функций программной инженерии и улучшенных возможностей обработки изображений. Opus 4.7 самостоятельно проверяет результаты, повышает производительность при написании кода на 13 % и обеспечивает в 3 раза более высокую точность при решении сложных задач, устанавлив...
Исследователи Google представили Auto-Diagnose — инструмент на базе большого языкового модели (LLM), который с точностью 90,14 % выявляет основные причины сбоев при проведении интеграционных тестов. Этот инструмент решает распространенную проблему, связанную с трудоемкостью отладки интеграционных тестов, экономя время разработчиков и избавляя их от лишних хлопот.
Команда TAA отдела маркетинга AWS в сотрудничестве с Gradial разработала решение на базе агентного ИИ на платформе Amazon Bedrock, что позволило сократить время сборки веб-страниц более чем на 95 %. Эта инновация оптимизирует рабочие процессы публикации контента, позволяя маркетинговым командам сосредоточиться на создании более эффективного клиентского опыта.
Amazon Bedrock теперь предлагает детализированную атрибуцию затрат, автоматически распределяя затраты на вычисления между субъектами IAM, такими как пользователи IAM, роли или федеративные идентификаторы от поставщиков, например Okta. Теги распределения затрат позволяют легко агрегировать данные по командам, проектам или пользовательским параметрам в AWS Cost Explorer и CUR 2.0, что упрощает ф...
Команда Qwen компании Alibaba представляет Qwen3.6-35B-A3B — разреженную модель MoE с 35 миллиардами параметров, демонстрирующую впечатляющую производительность в различных тестах, включая SWE-bench и Terminal-Bench 2.0, что свидетельствует о значительных достижениях в области агентного кодирования и генерации кода на уровне интерфейса.
Доценты Массачусетского технологического института (MIT) Джейкоб Андреас и Бретт Макгуайр удостоены премии имени Гарольда Э. Эджертона за достижения в научной деятельности 2026 года за новаторские работы в области обработки естественного языка и астрохимии. Инновационные исследования Андреаса объединяют фундаментальную теорию с практическим применением в сфере изучения языков и искусственного ...
Семантический поиск по видео меняет подход к предоставлению контента во всех отраслях, обеспечивая быстрый и точный доступ к конкретным моментам в видео. Amazon Nova Multimodal Embeddings предлагает унифицированную модель, которая обрабатывает текст, изображения, видео и аудио, преобразуя их в единое семантическое векторное пространство, что обеспечивает высочайшую точность поиска и экономичес...
Новый алгоритм RL по принципу «разделяй и властвуй» бросает вызов традиционному обучению с целевым функцией, обеспечивая масштабируемость для задач с длительным горизонтом. Обучение RL без использования политики обеспечивает гибкость при работе со старыми данными, что имеет решающее значение для таких сложных областей, как робототехника и здравоохранение.
Понимание сложных систем машинного обучения, таких как крупные языковые модели (LLM), имеет решающее значение для искусственного интеллекта. Новые алгоритмы, такие как SPEX и ProxySPEX, призваны выявлять ключевые взаимодействия в масштабе, измеряя влияние с помощью абляции и выделяя факторы, определяющие принятие решений, с минимально возможными возмущениями.
Ритейлеры сталкиваются с проблемами в сфере онлайн-покупок, что приводит к росту количества возвратов и снижению доверия со стороны покупателей. Внедрение технологии виртуальной примерки с помощью Amazon Nova Canvas и Rekognition может повысить рентабельность и уровень удовлетворенности клиентов. Это основанное на искусственном интеллекте бессерверное решение для розничной торговли на базе AWS...
ChatGPT демонстрирует предвзятое отношение к «нестандартным» разновидностям английского языка, при этом его ответы содержат стереотипы и носят снисходительный характер. В ходе исследования GPT-3.5 Turbo и GPT-4 были предоставлены 10 разновидностей английского языка, что позволило выявить сохранение черт стандартного американского английского.
Последние достижения в области крупных языковых моделей (LLM) открывают возможности для создания интересных интегрированных приложений, однако атаки с подстановкой подсказок представляют собой серьезную угрозу. StruQ и SecAlign — это предлагаемые средства защиты, призванные снизить риск атак с подстановкой подсказок в системах LLM, таких как Google Docs и ChatGPT.
Исследователи из Калифорнийского университета в Сан-Диего и компании Together AI представляют Parcae — архитектуру трансформатора с циклической структурой, которая демонстрирует более высокую производительность по сравнению с предыдущими моделями при использовании тех же параметров и обучающих данных. Конструкция Parcae позволяет преодолеть ограничения по объему памяти и обеспечивает более выс...