Кэш KV является значительной статьёй затрат при обслуживании больших языковых моделей (LLM); его сжатие с помощью квантования на основе поворотов, реализованного в OSCAR, повышает эффективность при точности INT2. OSCAR вычисляет повороты на основе статистики внимания, чтобы уменьшить ошибки квантования, что позволяет улучшить качество внимания и повысить производительность модели.
Разработка функции обратного матричного преобразования с использованием разложения Холески: более лаконичный код или более высокая эффективность. Анализ методов разработки программного обеспечения с использованием кода, сгенерированного ИИ, и дизайна персонажей в анимационных фильмах.
Компания NVIDIA представляет модель Gated DeltaNet-2 с линейным механизмом внимания, предназначенную для улучшения обработки данных в памяти. Модель оснащена двумя канальными гейтами и демонстрирует более высокую производительность по сравнению с предыдущими моделями в исследовательских тестах.
В новом исследовании команды Nous представлена модель CNA, позволяющая точно определять нейроны MLP, ответственные за «барьеры отклонения» в моделях с инструкциями. Удаление всего 0,1 % активаций MLP снижает частоту отклонений более чем на 50 % без ущерба для качества выходных данных.
Инструмент Bumblebee от Perplexity сканирует рабочие станции разработчиков на наличие уязвимых пакетов, расширений и настроек инструментов искусственного интеллекта. Он восполняет пробел в существующих инструментах, проверяя локальную среду разработчика на наличие потенциальных угроз безопасности.
Лаборатория AI Frontiers компании Microsoft Research выпустила Fara1.5 — семейство моделей компьютерных агентов для браузеров, интегрированных с MagenticLite. Модель Fara1.5-27B демонстрирует 72 % успешности выполнения задач на наборе данных Online-Mind2Web, превосходя по результатам таких конкурентов, как Operator от OpenAI и Gemini 2.5 от Google.
Для регрессоров нейронных сетей, работающих с категориальными данными, следует использовать кодирование «one-hot»; кодирование «drop-first» не является необходимым и оказывается несколько менее эффективным. Результаты демонстрации показывают, что нет оснований рассматривать кодирование «drop-first» для нейронных сетей, что подтверждает преимущества кодирования «one-hot».
Amazon Nova Act, теперь соответствующий требованиям HIPAA, автоматизирует рабочие процессы в сфере здравоохранения с помощью ИИ-агентов, сокращая объем ручной работы для организаций, оказывающих медицинские услуги. Система интегрируется с внешними инструментами, осуществляет навигацию по веб-сайтам и выполняет многоэтапные рабочие процессы, повышая эффективность и обеспечивая соблюдение нормат...
Инженер по внедрению на месте (FDE) работает непосредственно с клиентами, занимаясь разработкой реального кода для производственных систем. Модель FDE компании Palantir бросает вызов традиционным SaaS-решениям при внедрении сложных систем искусственного интеллекта.
Изотоническая регрессия — это сложный метод машинного обучения. Автор указывает на распространенные заблуждения и демонстрирует пример использования библиотеки scikit-learn.
CopilotKit превращает искусственный интеллект в программном обеспечении из пассивного в активный, а AG-UI устраняет барьер между агентами и пользователями в приложениях. Такие крупные компании, как Google и AWS, активно внедряют этот протокол, что свидетельствует о его зрелости и готовности к использованию в производственной среде.
Компания NVIDIA блестяще выступила на выставке COMPUTEX 2026: суперкомпьютер Vera Rubin NVL72 на базе ИИ и платформа Jetson Thor получили высшие награды. Vera Rubin NVL72 устанавливает новые стандарты масштабируемости и экологичности в сфере ИИ, обеспечивая исключительную производительность и экономическую эффективность для приложений с автономным ИИ.
Alibaba представляет Qwen3.7-Max для выполнения автономных многоэтапных задач. Qwen3.7-Max предлагает режим расширенного мышления с контекстным окном объемом 1 млн токенов, что значительно повышает возможности модели в области логического мышления.
Исследование Массачусетского технологического института (MIT) под руководством Дэвида Аутора показывает, что новые формы занятости приносят пользу молодым, образованным людям, проживающим в городских районах. Государственные инвестиции стимулируют развитие инновационных форм занятости, создавая возможности для применения специализированных знаний.
Традиционные системы рабочих списков в радиологии приводят к задержкам и увеличению затрат, поскольку игнорируют важный контекст, что ведет к неэффективному распределению случаев. Используя ИИ-агенты на платформе Amazon Bedrock AgentCore, компания Radiology Partners стремится сократить задержки в диагностике и оптимизировать координацию рабочих процессов за счет интеллектуального распределения...