Исследователи из Массачусетского технологического института (MIT) разработали метод RLCR для повышения точности оценок уверенности моделей искусственного интеллекта, что позволяет сократить количество ошибок на 90 % без ущерба для общей точности. Данная методика обучает модели выдавать откалиброванные оценки уверенности, решая проблему завышенной уверенности в моделях искусственного интеллекта...
Команды, занимающиеся машинным обучением (ML), сталкиваются с проблемами отслеживаемости моделей, однако объединение DVC, SageMaker AI и приложений MLflow позволяет решить эту проблему. Такой интегрированный рабочий процесс гарантирует, что каждая модель будет связана с конкретными обучающими данными, что имеет решающее значение для отраслей, подпадающих под регулирование, таких как здравоохра...
Программа объединяет несколько вариантов псевдообратной матрицы Мура-Пенроуза, используя алгоритмы QR-разложения. Варианты Хаусхолдера, Грамма-Шмидта и Гивенса прошли тщательное тестирование на случайных матрицах.
ml-intern от Hugging Face автоматизирует рабочие процессы после обучения для больших языковых моделей (LLM), превосходя существующие передовые результаты на PostTrainBench. Он использует генерацию синтетических данных и GRPO для эффективного обучения и оценки.
Обучению мощных моделей искусственного интеллекта мешает нехватка специализированных данных, однако платформа Simula, разработанная Google и EPFL, предлагает прозрачное и масштабируемое решение. Simula решает проблему генерации синтетических данных за счет одновременного контроля качества, разнообразия и сложности с помощью таксономий, мета-подсказок и двойных критериев оценки.
Оптимизация омниканального процесса оформления заказов с помощью AgentCore и Nova 2 Sonic от Amazon
Создайте многоканальную систему голосового заказа с использованием Amazon Bedrock AgentCore и Amazon Nova 2 Sonic для естественного голосового взаимодействия. Разверните инфраструктуру, подключите ИИ-агента к бэкэнд-сервисам и проведите тестирование с использованием реалистичных сценариев для обеспечения эффективности голосовых ИИ-приложений.
Инстансы G7e с графическими процессорами NVIDIA RTX PRO 6000 в Amazon SageMaker AI представляют собой высокопроизводительные и экономичные решения для развертывания крупных языковых моделей, обладая вдвое большим объемом памяти графического процессора по сравнению с предыдущими поколениями. Эти инстансы обеспечивают производительность инференции, превышающую предыдущие модели в 2,3 раза,
ToolSimulator в Strands Evals позволяет безопасно тестировать агенты искусственного интеллекта с использованием внешних инструментов в больших масштабах, избегая рисков, связанных с реальными вызовами API и статическими имитациями. Это помогает выявлять ошибки на ранних этапах, тщательно тестировать крайние случаи и обеспечивать беспроблемную интеграцию агентов, готовых к производственному исп...
xAI, компания Илона Маска, занимающаяся искусственным интеллектом, запускает API-интерфейсы для преобразования речи в текст и текста в речь, которые составляют конкуренцию ведущим игрокам на рынке речевых API. API-интерфейсы Grok предлагают такие расширенные функции, как идентификация говорящих, временные метки на уровне слов и высокая точность транскрипции.
Табличные данные играют ключевую роль в машинном обучении, а модели на основе деревьев, такие как TabPFN, бросают вызов традиционным подходам, превосходя по эффективности XGBoost и CatBoost. TabPFN-2.5 обеспечивает более высокую производительность, сокращает объем ручной работы и ускоряет процесс вывода, что делает его пригодным для внедрения в реальных условиях.
Компания Anthropic выпустила версию Claude Opus 4.7, которая расширяет возможности ИИ для разработчиков за счет усовершенствованных функций программной инженерии и улучшенных возможностей обработки изображений. Opus 4.7 самостоятельно проверяет результаты, повышает производительность при написании кода на 13 % и обеспечивает в 3 раза более высокую точность при решении сложных задач, устанавлив...
Исследователи Google представили Auto-Diagnose — инструмент на базе большого языкового модели (LLM), который с точностью 90,14 % выявляет основные причины сбоев при проведении интеграционных тестов. Этот инструмент решает распространенную проблему, связанную с трудоемкостью отладки интеграционных тестов, экономя время разработчиков и избавляя их от лишних хлопот.
Семантический поиск по видео меняет подход к предоставлению контента во всех отраслях, обеспечивая быстрый и точный доступ к конкретным моментам в видео. Amazon Nova Multimodal Embeddings предлагает унифицированную модель, которая обрабатывает текст, изображения, видео и аудио, преобразуя их в единое семантическое векторное пространство, что обеспечивает высочайшую точность поиска и экономичес...
Доценты Массачусетского технологического института (MIT) Джейкоб Андреас и Бретт Макгуайр удостоены премии имени Гарольда Э. Эджертона за достижения в научной деятельности 2026 года за новаторские работы в области обработки естественного языка и астрохимии. Инновационные исследования Андреаса объединяют фундаментальную теорию с практическим применением в сфере изучения языков и искусственного ...
Команда Qwen компании Alibaba представляет Qwen3.6-35B-A3B — разреженную модель MoE с 35 миллиардами параметров, демонстрирующую впечатляющую производительность в различных тестах, включая SWE-bench и Terminal-Bench 2.0, что свидетельствует о значительных достижениях в области агентного кодирования и генерации кода на уровне интерфейса.