Command A+ от Cohere — это модель MoE с открытым исходным кодом, оптимизированная для агентных рабочих процессов и объединяющая в себе возможности четырёх предыдущих моделей. Благодаря наличию трёх вариантов квантования Command A+ демонстрирует значительное повышение производительности по сравнению с предыдущими моделями Command A при решении различных корпоративных задач.
Lance от ByteDance объединяет в одной модели функции распознавания, генерации и редактирования изображений и видео, что стало важной вехой в развитии архитектуры искусственного интеллекта. Lance объединяет всю экосистему работы с изображениями и видео, выполняя задачи от создания подписей до многоэтапного редактирования с обеспечением согласованности в обоих форматах.
Alibaba представляет Qwen3.7-Max для выполнения автономных многоэтапных задач. Qwen3.7-Max предлагает режим расширенного мышления с контекстным окном объемом 1 млн токенов, что значительно повышает возможности модели в области логического мышления.
Исследователь из Массачусетского технологического института (MIT) Коннор Коули использует искусственный интеллект для выявления потенциальных низкомолекулярных лекарственных препаратов из огромного множества возможных соединений, сочетая в своей работе достижения химической инженерии и информатики. В своей работе Коули объединяет методы машинного обучения и хемоинформатики с целью оптимизации ...
Amazon SageMaker AI теперь поддерживает API, совместимый с OpenAI, для конечных точек инференса в реальном времени, что упрощает вызов моделей с помощью стандартных SDK. Такие пользователи, как Caffeine.AI, могут легко интегрировать SageMaker в качестве готового к использованию конечной точки, совместимой с OpenAI, без необходимости внесения изменений в код.
Команда Qwen компании Alibaba усовершенствовала систему синхронного перевода с помощью Qwen3.5-LiveTranslate-Flash, сократив задержку до 2,8 секунд и расширив языковой охват до 60 языков. Среди инновационных функций — клонирование голоса в режиме реального времени и использование визуальных данных в качестве полноценного источника входных данных для повышения точности перевода.
С ноября 2025 года в Amazon SageMaker AI будет внедрена функция двунаправленной потоковой передачи данных для преобразования речи в текст в режиме реального времени. API vLLM Realtime от Mistral AI обеспечивает бесперебойную двунаправленную потоковую передачу данных между клиентом и сервером для развертывания компактных моделей распознавания речи в режиме реального времени, предлагая полностью...
Использование модели StackingRegressor с несколькими базовыми моделями для прогнозирования может оказаться чрезмерно сложной задачей из-за огромного количества задействованных параметров. Демонстрация, в которой модель StackingRegressor применялась к набору данных по диабету, продемонстрировала сложности, связанные с точным прогнозированием целевого значения уровня сахара у пациентов.
Новые средства оценки MLLM-as-a-Judge в Strands Evals SDK оптимизируют задачи преобразования изображений в текст, при этом прогнозируется, что к 2030 году 80 % корпоративного программного обеспечения будет мультимодальным. Автоматизированная мультимодальная оценка повышает точность и эффективность разработки программного обеспечения.
Amazon SageMaker Feature Store предлагает новые возможности, в том числе интеграцию с Lake Formation и свойства таблиц Iceberg. Это помогает организациям оптимизировать контроль доступа и сократить расходы на хранение моделей машинного обучения.
Kiro CLI теперь предлагает расширенную функцию запоминания контекста благодаря интеграции с Amazon Bedrock AgentCore Memory. Настраиваемый сервер MCP обеспечивает сохранение контекста и персонализированный подход к пользователям в разных сеансах.
Программный вызов инструментов (PTC) сокращает задержки и снижает потребление токенов, позволяя крупным языковым моделям писать код, который программно вызывает несколько инструментов в изолированной среде выполнения. PTC эффективно применяется для обработки данных, численных вычислений, оркестрации процессов и задач, требующих соблюдения конфиденциальности
Языковые модели сталкиваются с проблемами оптимизации из-за неравномерного распределения токенов. Адаптивная оптимизация Adam позволяет редким токенам обучаться быстрее, чем при использовании стандартного алгоритма SGD.
Регрессия AdaBoost использует деревья решений, обученные на взвешенных данных, для повышения точности прогнозов. Результаты показывают переобучение: высокая точность на обучающих данных, но более низкая точность на невиданных тестовых данных.
Amazon Bedrock AgentCore Evaluations предлагает настраиваемые оценочные алгоритмы на основе собственного кода для оценки агентных приложений в таких специализированных областях, как финансовые услуги. Эти алгоритмы обеспечивают контроль над логикой подсчета баллов, что позволяет проводить индивидуальную оценку качества агентов и легко интегрировать их в рабочие процессы разработки.