xAI, компания Илона Маска, занимающаяся искусственным интеллектом, запускает API-интерфейсы для преобразования речи в текст и текста в речь, которые составляют конкуренцию ведущим игрокам на рынке речевых API. API-интерфейсы Grok предлагают такие расширенные функции, как идентификация говорящих, временные метки на уровне слов и высокая точность транскрипции.
Табличные данные играют ключевую роль в машинном обучении, а модели на основе деревьев, такие как TabPFN, бросают вызов традиционным подходам, превосходя по эффективности XGBoost и CatBoost. TabPFN-2.5 обеспечивает более высокую производительность, сокращает объем ручной работы и ускоряет процесс вывода, что делает его пригодным для внедрения в реальных условиях.
Исследователи Google представили Auto-Diagnose — инструмент на базе большого языкового модели (LLM), который с точностью 90,14 % выявляет основные причины сбоев при проведении интеграционных тестов. Этот инструмент решает распространенную проблему, связанную с трудоемкостью отладки интеграционных тестов, экономя время разработчиков и избавляя их от лишних хлопот.
Компания Anthropic выпустила версию Claude Opus 4.7, которая расширяет возможности ИИ для разработчиков за счет усовершенствованных функций программной инженерии и улучшенных возможностей обработки изображений. Opus 4.7 самостоятельно проверяет результаты, повышает производительность при написании кода на 13 % и обеспечивает в 3 раза более высокую точность при решении сложных задач, устанавлив...
Amazon Bedrock теперь предлагает детализированную атрибуцию затрат, автоматически распределяя затраты на вычисления между субъектами IAM, такими как пользователи IAM, роли или федеративные идентификаторы от поставщиков, например Okta. Теги распределения затрат позволяют легко агрегировать данные по командам, проектам или пользовательским параметрам в AWS Cost Explorer и CUR 2.0, что упрощает ф...
Команда TAA отдела маркетинга AWS в сотрудничестве с Gradial разработала решение на базе агентного ИИ на платформе Amazon Bedrock, что позволило сократить время сборки веб-страниц более чем на 95 %. Эта инновация оптимизирует рабочие процессы публикации контента, позволяя маркетинговым командам сосредоточиться на создании более эффективного клиентского опыта.
Доценты Массачусетского технологического института (MIT) Джейкоб Андреас и Бретт Макгуайр удостоены премии имени Гарольда Э. Эджертона за достижения в научной деятельности 2026 года за новаторские работы в области обработки естественного языка и астрохимии. Инновационные исследования Андреаса объединяют фундаментальную теорию с практическим применением в сфере изучения языков и искусственного ...
Семантический поиск по видео меняет подход к предоставлению контента во всех отраслях, обеспечивая быстрый и точный доступ к конкретным моментам в видео. Amazon Nova Multimodal Embeddings предлагает унифицированную модель, которая обрабатывает текст, изображения, видео и аудио, преобразуя их в единое семантическое векторное пространство, что обеспечивает высочайшую точность поиска и экономичес...
Команда Qwen компании Alibaba представляет Qwen3.6-35B-A3B — разреженную модель MoE с 35 миллиардами параметров, демонстрирующую впечатляющую производительность в различных тестах, включая SWE-bench и Terminal-Bench 2.0, что свидетельствует о значительных достижениях в области агентного кодирования и генерации кода на уровне интерфейса.
Ритейлеры сталкиваются с проблемами в сфере онлайн-покупок, что приводит к росту количества возвратов и снижению доверия со стороны покупателей. Внедрение технологии виртуальной примерки с помощью Amazon Nova Canvas и Rekognition может повысить рентабельность и уровень удовлетворенности клиентов. Это основанное на искусственном интеллекте бессерверное решение для розничной торговли на базе AWS...
Исследователи из Калифорнийского университета в Сан-Диего и компании Together AI представляют Parcae — архитектуру трансформатора с циклической структурой, которая демонстрирует более высокую производительность по сравнению с предыдущими моделями при использовании тех же параметров и обучающих данных. Конструкция Parcae позволяет преодолеть ограничения по объему памяти и обеспечивает более выс...
PLAID — модель, генерирующая аминокислотные последовательности и структуры белков, — отражает роль искусственного интеллекта в биологии. Модель решает такие задачи, как построение моделей с полным атомным разрешением и учетом видовой специфичности, стремясь к эффективному созданию полезных белков.
Проверки автоматизированного вывода в Amazon Bedrock Guardrails гарантируют математически доказанные и поддающиеся аудиту результаты ИИ для отраслей, подпадающих под регулирование. Используя методы формальной верификации, специалисты по обеспечению соответствия могут получать результаты с доказанной корректностью, устраняя ограничения вероятностной валидации ИИ.
Последние достижения в области крупных языковых моделей (LLM) открывают возможности для создания интересных интегрированных приложений, однако атаки с подстановкой подсказок представляют собой серьезную угрозу. StruQ и SecAlign — это предлагаемые средства защиты, призванные снизить риск атак с подстановкой подсказок в системах LLM, таких как Google Docs и ChatGPT.
Исследователи раскрыли динамику обучения модели word2vec, выявив её линейную структуру и последовательные этапы. Минимальная нейронная модель алгоритма позволяет лучше понять процесс обучения признакам при решении сложных языковых задач.