Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Раскрытие потенциала взаимодействия с LLM

Понимание сложных систем машинного обучения, таких как крупные языковые модели (LLM), имеет решающее значение для искусственного интеллекта. Новые алгоритмы, такие как SPEX и ProxySPEX, призваны выявлять ключевые взаимодействия в масштабе, измеряя влияние с помощью абляции и выделяя факторы, определяющие принятие решений, с минимально возможными возмущениями.

Оптимизация преобразования текста в SQL с помощью Amazon Nova Micro и Bedrock

Задачи преобразования текста в SQL решаются с помощью моделей Amazon Bedrock и Nova Micro, которые предлагают экономичные индивидуальные решения. Тонкая настройка адаптеров LoRA для пользовательских диалектов SQL обеспечивает высокую производительность без постоянных затрат на хостинг.

Parcae: Усовершенствование языковых моделей с циклической структурой в Калифорнийском университете в Сан-Диего

Исследователи из Калифорнийского университета в Сан-Диего и компании Together AI представляют Parcae — архитектуру трансформатора с циклической структурой, которая демонстрирует более высокую производительность по сравнению с предыдущими моделями при использовании тех же параметров и обучающих данных. Конструкция Parcae позволяет преодолеть ограничения по объему памяти и обеспечивает более выс...

Оптимизация систем визуализации на основе информационно-ориентированного проектирования

Кодировщик преобразует объекты в изображения без шума, количественно оценивая, насколько точно измерения позволяют различать объекты. Искусственный интеллект способен извлекать полезную информацию даже из кодированных данных, которые человек не может интерпретировать, оптимизируя системы визуализации с учетом их информационного содержания.

Революция в сфере розничной торговли с помощью искусственного интеллекта AWS

Ритейлеры сталкиваются с проблемами в сфере онлайн-покупок, что приводит к росту количества возвратов и снижению доверия со стороны покупателей. Внедрение технологии виртуальной примерки с помощью Amazon Nova Canvas и Rekognition может повысить рентабельность и уровень удовлетворенности клиентов. Это основанное на искусственном интеллекте бессерверное решение для розничной торговли на базе AWS...

Дискриминация по диалекту: выявление лингвистических предубеждений в ChatGPT

ChatGPT демонстрирует предвзятое отношение к «нестандартным» разновидностям английского языка, при этом его ответы содержат стереотипы и носят снисходительный характер. В ходе исследования GPT-3.5 Turbo и GPT-4 были предоставлены 10 разновидностей английского языка, что позволило выявить сохранение черт стандартного американского английского.

Освоение процессов обучения и развертывания крупных языковых моделей

Обучение современной крупномасштабной языковой модели включает в себя предварительное обучение общим языковым паттернам, за которым следует контролируемая настройка под конкретные задачи. Такие методы, как LoRA и RLHF, позволяют доработать модель, что впоследствии обеспечивает её внедрение в реальные системы для достижения оптимальной производительности и получения максимальной пользы.

Рабочие процессы с искусственным интеллектом от Google в Chrome, запускаемые одним щелчком мыши

Google представляет функцию «Skills» в Chrome в рамках проекта Gemini, которая позволяет пользователям сохранять запросы к ИИ в виде повторно используемых рабочих процессов. Эта функция упрощает выполнение задач на нескольких вкладках и дает представление о будущем ИИ-агентов на уровне браузера.

Раскрывая тайны word2vec: секреты семантического обучения

Исследователи раскрыли динамику обучения модели word2vec, выявив её линейную структуру и последовательные этапы. Минимальная нейронная модель алгоритма позволяет лучше понять процесс обучения признакам при решении сложных языковых задач.

Защита запросов: StruQ и SecAlign

Последние достижения в области крупных языковых моделей (LLM) открывают возможности для создания интересных интегрированных приложений, однако атаки с подстановкой подсказок представляют собой серьезную угрозу. StruQ и SecAlign — это предлагаемые средства защиты, призванные снизить риск атак с подстановкой подсказок в системах LLM, таких как Google Docs и ChatGPT.

Революция в моделях сворачивания белков

PLAID — модель, генерирующая аминокислотные последовательности и структуры белков, — отражает роль искусственного интеллекта в биологии. Модель решает такие задачи, как построение моделей с полным атомным разрешением и учетом видовой специфичности, стремясь к эффективному созданию полезных белков.

Ускорение инференса моделей большого языкового обучения (LLM) с помощью спекулятивного декодирования на AWS Trainium

Развертывание моделей Qwen3 с использованием vLLM, Kubernetes и чипов AWS AI позволяет снизить стоимость каждого выводимого токена и повысить пропускную способность. Спекулятивное декодирование на AWS Trainium ускоряет генерацию токенов в 3 раза, сокращая задержку и затраты на инференцию в приложениях искусственного интеллекта.

Мониторинг с помощью ИИ в цикле получения доходов в сфере здравоохранения с помощью Amazon Bedrock AgentCore

Rede Mater Dei de Saúde преобразует процессы оказания медицинских услуг с помощью 12 ИИ-агентов на платформе Amazon Bedrock AgentCore, сокращая количество отказов в выплатах и повышая эффективность цикла получения доходов. Это бразильское учреждение сотрудничает с A3Data и AWS для внедрения ИИ-агентов, таких как «Контракты» и «Параметризация», с целью оптимизации процессов и повышения точности.