Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

TwELL: повышение скорости работы больших языковых моделей с помощью Sakana AI и NVIDIA CUDA

Исследователи из компаний Sakana AI и NVIDIA стремятся снизить высокую стоимость крупных языковых моделей, устраняя неэффективность в слоях прямого прохождения. Используя неструктурированную разреженность, они стремятся повысить эффективность вычислений в этих слоях, уделяя особое внимание пакетному обучению и высокопроизводительному выводу.

Освоение методов дистилляции моделей LLM

Такие компании, как Meta и Google, используют крупные языковые модели для обучения более компактных и эффективных моделей с помощью дистилляции LLM. Дистилляция с мягкими метками позволяет обучаемым моделям унаследовать способности к логическому мышлению от обучающих моделей, повышая стабильность и эффективность обучения.

Amazon Bedrock: революция в системе обработки ошибок для Miro

Компания Miro в партнерстве с AWS разрабатывает BugManager — решение на базе искусственного интеллекта для автоматической классификации ошибок, позволяющее сократить количество перенаправлений и время устранения неполадок. BugManager использует оптимизированные подсказки и технологию RAG (Retrieval Augmented Generation) для повышения точности классификации ошибок.

Раскрытие потенциала производственной аналитики с Amazon Nova

Мультимодальные вложения Amazon Nova кардинально меняют подход к поиску производственной документации, объединяя текст, изображения и диаграммы в единое векторное пространство. Эта система обеспечивает беспрепятственный поиск и извлечение информации из различных источников, повышая точность и эффективность работы в производственной отрасли.

Эффективный расчет псевдообратной матрицы на C#

Левая псевдообратная матрица широко используется в машинном обучении, тогда как правая псевдообратная матрица применяется редко, но оказывается полезной в научных задачах. Этот процесс включает в себя сложные алгоритмы и обращение матриц, причем основная сложность заключается в вычислении At A или A At.

Раскройте весь потенциал платформы Claude на AWS

Платформа Claude теперь доступна на AWS, что обеспечивает удобный доступ к функциям Anthropic с помощью привычных инструментов AWS. Клиенты могут использовать те же API, функции и систему расчетов, что и в Anthropic, — и все это в среде AWS.

Революционный трансформатор Byte Latent сокращает пропускную способность памяти вдвое!

Исследователи из Meta, Стэнфордского университета и Вашингтонского университета усовершенствовали модель Byte Latent Transformer с помощью трёх новых методов. BLT-D заменяет побайтовое декодирование блочным диффузионным подходом, что позволяет ускорить генерацию текста.

Начало карьеры в эпоху революции в области искусственного интеллекта

Генеральный директор NVIDIA Дженсен Хуанг на выпускной церемонии в Университете Карнеги-Меллон подчеркнул, что сейчас начинается революция в области искусственного интеллекта. Искусственный интеллект дает Америке шанс на реиндустриализацию и создание возможностей для всех.

Раскрытие потенциала ИИ NVIDIA: модели логического вывода объёмом 30 млрд, 23 млрд и 12 млрд параметров в одной контрольной точке

Компания NVIDIA представляет Star Elastic — метод встраивания нескольких вложенных подмоделей в одну родительскую модель, позволяющий сократить затраты на обучение и развертывание крупных языковых моделей. Star Elastic использует оценку важности и обучаемые маршрутизаторы для создания вложенных вариантов с разными наборами параметров в рамках одной контрольной точки.

Преобразование мыслей ИИ в человеческий язык

Новые автокодировщики естественного языка (NLA) от Anthropic преобразуют сложные активации моделей в удобочитаемый текст, раскрывая скрытые внутренние механизмы работы. NLA уже используются для выявления моделей, допускающих ошибки, и исправления языковых ошибок до публичного выпуска.

Эффективное масштабирование вывода: будущее адаптивного параллельного вывода

Последние достижения в области адаптивного параллельного вывода позволяют моделям самостоятельно разбивать задачи на подзадачи и координировать их выполнение, что приводит к улучшению способности к выводу и сокращению задержек при решении сложных задач. Теперь модели рассматривают альтернативные гипотезы и исправляют ошибки, формулируя выводы, не ограничиваясь одним единственным решением, что ...

Революция в сейсмических рабочих процессах благодаря ИИ и Amazon Bedrock

Компания Halliburton в партнерстве с AWS разрабатывает виртуального помощника на базе искусственного интеллекта для платформы Seismic Engine, что позволяет сократить время на создание рабочих процессов почти на 95 %. Теперь геологи могут настраивать инструменты обработки данных с помощью естественного языка, что повышает эффективность и доступность работы.

«Заправляя будущее Америки»: миссия в области энергетики и инноваций

Министр энергетики США Крис Райт и вице-президент NVIDIA Иэн Бак утверждают, что лидерство США в области искусственного интеллекта зависит от развития энергетики, обращая особое внимание на программу «Генезис» Министерства энергетики США и партнерство с NVIDIA по созданию суперкомпьютеров для искусственного интеллекта в Аргоннской национальной лаборатории. Цель этого сотрудничества — содейство...

Представляем TokenSpeed: революция в области инференса больших языковых моделей с производительностью на уровне TensorRT

Эффективность вычислений является основным препятствием при внедрении ИИ, поскольку системы агентского кодирования, такие как Claude Code, Codex и Cursor, создают значительную нагрузку на базовые механизмы вычислений. TokenSpeed — механизм вычислений для больших языковых моделей (LLM) с открытым исходным кодом, разработанный LightSeek Foundation, — обеспечивает максимальную производительность ...

Amazon Bedrock AgentCore: революция в сфере платежей с Coinbase и Stripe

ИИ-агенты развиваются, чтобы самостоятельно выполнять сложные задачи. Amazon Bedrock AgentCore в сотрудничестве с Coinbase и Stripe внедряет функции обработки платежей для агентов, что упрощает транзакции и повышает эффективность работы разработчиков.