Новые средства оценки MLLM-as-a-Judge в Strands Evals SDK оптимизируют задачи преобразования изображений в текст, при этом прогнозируется, что к 2030 году 80 % корпоративного программного обеспечения будет мультимодальным. Автоматизированная мультимодальная оценка повышает точность и эффективность разработки программного обеспечения.
Amazon SageMaker AI теперь поддерживает API, совместимый с OpenAI, для конечных точек инференса в реальном времени, что упрощает вызов моделей с помощью стандартных SDK. Такие пользователи, как Caffeine.AI, могут легко интегрировать SageMaker в качестве готового к использованию конечной точки, совместимой с OpenAI, без необходимости внесения изменений в код.
Компания Google представила модель Gemini 3.5 Flash на конференции Google I/O в мае 2026 года, превзойдя предыдущий премиальный уровень благодаря более высокой скорости и сниженной стоимости. Gemini 3.5 Flash демонстрирует отличные результаты в области программирования, выполнении задач, надежности использования инструментов и понимании мультимодальных данных, обеспечивая более быструю обработк...
Программный вызов инструментов (PTC) сокращает задержки и снижает потребление токенов, позволяя крупным языковым моделям писать код, который программно вызывает несколько инструментов в изолированной среде выполнения. PTC эффективно применяется для обработки данных, численных вычислений, оркестрации процессов и задач, требующих соблюдения конфиденциальности
Amazon SageMaker Feature Store предлагает новые возможности, в том числе интеграцию с Lake Formation и свойства таблиц Iceberg. Это помогает организациям оптимизировать контроль доступа и сократить расходы на хранение моделей машинного обучения.
Kiro CLI теперь предлагает расширенную функцию запоминания контекста благодаря интеграции с Amazon Bedrock AgentCore Memory. Настраиваемый сервер MCP обеспечивает сохранение контекста и персонализированный подход к пользователям в разных сеансах.
Технология MemPrivacy, разработанная MemTensor, HONOR Device и Университетом Тунцзи, заменяет конфиденциальные данные пользователей структурированными токенами, обеспечивая защиту конфиденциальности при управлении памятью в облаке без ущерба для функциональности или качества отклика. Эта локальная обратимая система псевдонимизации гарантирует семантически неискаженное взаимодействие при одновр...
Aderant оптимизирует работу службы поддержки с помощью Amazon Quick, сократив время поиска на 90 % и ускорив подготовку документации на 75 %. Функции на базе искусственного интеллекта объединяют поиск по шести системам, что позволяет инженерам обеспечивать более быструю и оперативную поддержку.
Регрессия AdaBoost использует деревья решений, обученные на взвешенных данных, для повышения точности прогнозов. Результаты показывают переобучение: высокая точность на обучающих данных, но более низкая точность на невиданных тестовых данных.
Компания NVIDIA представляет NVFP4 для обучения с использованием 4-битной плавающей запятой, достигая точности 62,58 % на модели Mamba-Transformer и превосходя базовые показатели FP8. NVFP4 оптимизирует динамический диапазон и точность, обеспечивая ускорение выполнения операций GEMM в 2–3 раза по сравнению с FP8 на тензорных ядрах Blackwell.
Узнайте, как настроить Amazon Nova для задач модерации контента с использованием структурированных и свободных подсказок. Проведите сравнительный анализ Amazon Nova 2 Lite и базовых моделей на общедоступных наборах данных с помощью стандарта оценки MLCommons AILuminate.
Amazon Bedrock AgentCore Evaluations предлагает настраиваемые оценочные алгоритмы на основе собственного кода для оценки агентных приложений в таких специализированных областях, как финансовые услуги. Эти алгоритмы обеспечивают контроль над логикой подсчета баллов, что позволяет проводить индивидуальную оценку качества агентов и легко интегрировать их в рабочие процессы разработки.
Языковые модели сталкиваются с проблемами оптимизации из-за неравномерного распределения токенов. Адаптивная оптимизация Adam позволяет редким токенам обучаться быстрее, чем при использовании стандартного алгоритма SGD.
FlashAttention решила проблему высоких вычислительных затрат при использовании механизма внимания в больших языковых моделях, но Lighthouse Attention от Nous Research обеспечивает более быструю тренировку с меньшим объемом используемой памяти, что ставит под сомнение эффективность существующих методов разреженной обработки. Инновационная четырехступенчатая архитектура Lighthouse оптимизирует си...
Технология SANA-WM от NVIDIA решает задачи синтеза видео с помощью модели DiT, содержащей 2,6 млрд параметров, что позволяет генерировать высококачественное изображение с разрешением 720p в режиме реального времени на одном графическом процессоре. К ключевым особенностям относятся механизм внимания Gated DeltaNet и управление камерой с двумя ветвями для точного отслеживания траектории при моде...