Lance от ByteDance объединяет в одной модели функции распознавания, генерации и редактирования изображений и видео, что стало важной вехой в развитии архитектуры искусственного интеллекта. Lance объединяет всю экосистему работы с изображениями и видео, выполняя задачи от создания подписей до многоэтапного редактирования с обеспечением согласованности в обоих форматах.
Alibaba представляет Qwen3.7-Max для выполнения автономных многоэтапных задач. Qwen3.7-Max предлагает режим расширенного мышления с контекстным окном объемом 1 млн токенов, что значительно повышает возможности модели в области логического мышления.
Command A+ от Cohere — это модель MoE с открытым исходным кодом, оптимизированная для агентных рабочих процессов и объединяющая в себе возможности четырёх предыдущих моделей. Благодаря наличию трёх вариантов квантования Command A+ демонстрирует значительное повышение производительности по сравнению с предыдущими моделями Command A при решении различных корпоративных задач.
CopilotKit превращает искусственный интеллект в программном обеспечении из пассивного в активный, а AG-UI устраняет барьер между агентами и пользователями в приложениях. Такие крупные компании, как Google и AWS, активно внедряют этот протокол, что свидетельствует о его зрелости и готовности к использованию в производственной среде.
Компания NVIDIA блестяще выступила на выставке COMPUTEX 2026: суперкомпьютер Vera Rubin NVL72 на базе ИИ и платформа Jetson Thor получили высшие награды. Vera Rubin NVL72 устанавливает новые стандарты масштабируемости и экологичности в сфере ИИ, обеспечивая исключительную производительность и экономическую эффективность для приложений с автономным ИИ.
Amazon Nova Act, теперь соответствующий требованиям HIPAA, автоматизирует рабочие процессы в сфере здравоохранения с помощью ИИ-агентов, сокращая объем ручной работы для организаций, оказывающих медицинские услуги. Система интегрируется с внешними инструментами, осуществляет навигацию по веб-сайтам и выполняет многоэтапные рабочие процессы, повышая эффективность и обеспечивая соблюдение нормат...
С ноября 2025 года в Amazon SageMaker AI будет внедрена функция двунаправленной потоковой передачи данных для преобразования речи в текст в режиме реального времени. API vLLM Realtime от Mistral AI обеспечивает бесперебойную двунаправленную потоковую передачу данных между клиентом и сервером для развертывания компактных моделей распознавания речи в режиме реального времени, предлагая полностью...
Новые средства оценки MLLM-as-a-Judge в Strands Evals SDK оптимизируют задачи преобразования изображений в текст, при этом прогнозируется, что к 2030 году 80 % корпоративного программного обеспечения будет мультимодальным. Автоматизированная мультимодальная оценка повышает точность и эффективность разработки программного обеспечения.
Amazon SageMaker AI теперь поддерживает API, совместимый с OpenAI, для конечных точек инференса в реальном времени, что упрощает вызов моделей с помощью стандартных SDK. Такие пользователи, как Caffeine.AI, могут легко интегрировать SageMaker в качестве готового к использованию конечной точки, совместимой с OpenAI, без необходимости внесения изменений в код.
Команда Qwen компании Alibaba усовершенствовала систему синхронного перевода с помощью Qwen3.5-LiveTranslate-Flash, сократив задержку до 2,8 секунд и расширив языковой охват до 60 языков. Среди инновационных функций — клонирование голоса в режиме реального времени и использование визуальных данных в качестве полноценного источника входных данных для повышения точности перевода.
Исследователь из Массачусетского технологического института (MIT) Коннор Коули использует искусственный интеллект для выявления потенциальных низкомолекулярных лекарственных препаратов из огромного множества возможных соединений, сочетая в своей работе достижения химической инженерии и информатики. В своей работе Коули объединяет методы машинного обучения и хемоинформатики с целью оптимизации ...
Использование модели StackingRegressor с несколькими базовыми моделями для прогнозирования может оказаться чрезмерно сложной задачей из-за огромного количества задействованных параметров. Демонстрация, в которой модель StackingRegressor применялась к набору данных по диабету, продемонстрировала сложности, связанные с точным прогнозированием целевого значения уровня сахара у пациентов.
Программный вызов инструментов (PTC) сокращает задержки и снижает потребление токенов, позволяя крупным языковым моделям писать код, который программно вызывает несколько инструментов в изолированной среде выполнения. PTC эффективно применяется для обработки данных, численных вычислений, оркестрации процессов и задач, требующих соблюдения конфиденциальности
Kiro CLI теперь предлагает расширенную функцию запоминания контекста благодаря интеграции с Amazon Bedrock AgentCore Memory. Настраиваемый сервер MCP обеспечивает сохранение контекста и персонализированный подход к пользователям в разных сеансах.
Amazon SageMaker Feature Store предлагает новые возможности, в том числе интеграцию с Lake Formation и свойства таблиц Iceberg. Это помогает организациям оптимизировать контроль доступа и сократить расходы на хранение моделей машинного обучения.