Такие компании, как Meta и Google, используют крупные языковые модели для обучения более компактных и эффективных моделей с помощью дистилляции LLM. Дистилляция с мягкими метками позволяет обучаемым моделям унаследовать способности к логическому мышлению от обучающих моделей, повышая стабильность и эффективность обучения.
Платформа Claude теперь доступна на AWS, что обеспечивает удобный доступ к функциям Anthropic с помощью привычных инструментов AWS. Клиенты могут использовать те же API, функции и систему расчетов, что и в Anthropic, — и все это в среде AWS.
Интеграция Exa с Strands Agents SDK упрощает доступ ИИ-агентов к структурированному веб-контенту, что обеспечивает беспрепятственное принятие решений. Модельно-ориентированная архитектура Strands Agents SDK расширяет возможности агентов благодаря более чем 40 готовым инструментам и поддержке серверов MCP.
Генеральный директор NVIDIA Дженсен Хуанг на выпускной церемонии в Университете Карнеги-Меллон подчеркнул, что сейчас начинается революция в области искусственного интеллекта. Искусственный интеллект дает Америке шанс на реиндустриализацию и создание возможностей для всех.
Компания NVIDIA представляет Star Elastic — метод встраивания нескольких вложенных подмоделей в одну родительскую модель, позволяющий сократить затраты на обучение и развертывание крупных языковых моделей. Star Elastic использует оценку важности и обучаемые маршрутизаторы для создания вложенных вариантов с разными наборами параметров в рамках одной контрольной точки.
Компания Halliburton в партнерстве с AWS разрабатывает виртуального помощника на базе искусственного интеллекта для платформы Seismic Engine, что позволяет сократить время на создание рабочих процессов почти на 95 %. Теперь геологи могут настраивать инструменты обработки данных с помощью естественного языка, что повышает эффективность и доступность работы.
Новые автокодировщики естественного языка (NLA) от Anthropic преобразуют сложные активации моделей в удобочитаемый текст, раскрывая скрытые внутренние механизмы работы. NLA уже используются для выявления моделей, допускающих ошибки, и исправления языковых ошибок до публичного выпуска.
Последние достижения в области адаптивного параллельного вывода позволяют моделям самостоятельно разбивать задачи на подзадачи и координировать их выполнение, что приводит к улучшению способности к выводу и сокращению задержек при решении сложных задач. Теперь модели рассматривают альтернативные гипотезы и исправляют ошибки, формулируя выводы, не ограничиваясь одним единственным решением, что ...
ИИ-агенты развиваются, чтобы самостоятельно выполнять сложные задачи. Amazon Bedrock AgentCore в сотрудничестве с Coinbase и Stripe внедряет функции обработки платежей для агентов, что упрощает транзакции и повышает эффективность работы разработчиков.
Министр энергетики США Крис Райт и вице-президент NVIDIA Иэн Бак утверждают, что лидерство США в области искусственного интеллекта зависит от развития энергетики, обращая особое внимание на программу «Генезис» Министерства энергетики США и партнерство с NVIDIA по созданию суперкомпьютеров для искусственного интеллекта в Аргоннской национальной лаборатории. Цель этого сотрудничества — содейство...
Краткое содержание статьи: В майском номере журнала «Microsoft Visual Studio Magazine» за 2026 год представлена демонстрация квадратичной регрессии с использованием метода обучения на псевдообратной матрице на языке C#. Модель демонстрирует высокую точность как на обучающих, так и на тестовых данных, подтверждая свою интерпретируемость и способность обрабатывать сложные задачи.
Модель ZAYA1-8B от Zyphra AI, языковая модель с механизмом MoE и общим количеством параметров 8,4 млрд, превосходит более крупные модели в решении математических задач. Уникальная архитектура и инновационные решения ZAYA1-8B позволяют максимально повысить эффективность работы и снизить требования к объему памяти, благодаря чему модель может составить конкуренцию ведущим моделям.
Команда Meta AI представляет NeuralBench — комплексный фреймворк с открытым исходным кодом для оценки моделей искусственного интеллекта, имитирующих мозговую активность, призванный решить проблему фрагментированности сферы оценки нейро-ИИ. NeuralBench-EEG v1.0 — крупнейший тестовый набор такого рода, охватывающий 36 задач, 94 набора данных и 14 архитектур глубокого обучения в рамках стандартиз...
Применение метода обучения с подкреплением с проверяемыми вознаграждениями (RLVR) позволяет повысить эффективность обучения за счет обеспечения прозрачности сигналов вознаграждения. Такие методы, как GRPO и обучение на небольшом количестве примеров, способствуют улучшению результатов, что было продемонстрировано на наборе данных GSM8K по точности решения математических задач.
Эффективность вычислений является основным препятствием при внедрении ИИ, поскольку системы агентского кодирования, такие как Claude Code, Codex и Cursor, создают значительную нагрузку на базовые механизмы вычислений. TokenSpeed — механизм вычислений для больших языковых моделей (LLM) с открытым исходным кодом, разработанный LightSeek Foundation, — обеспечивает максимальную производительность ...