Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Оптимизация преобразования текста в SQL с помощью Amazon Nova Micro и Bedrock

Задачи преобразования текста в SQL решаются с помощью моделей Amazon Bedrock и Nova Micro, которые предлагают экономичные индивидуальные решения. Тонкая настройка адаптеров LoRA для пользовательских диалектов SQL обеспечивает высокую производительность без постоянных затрат на хостинг.

Освоение процессов обучения и развертывания крупных языковых моделей

Обучение современной крупномасштабной языковой модели включает в себя предварительное обучение общим языковым паттернам, за которым следует контролируемая настройка под конкретные задачи. Такие методы, как LoRA и RLHF, позволяют доработать модель, что впоследствии обеспечивает её внедрение в реальные системы для достижения оптимальной производительности и получения максимальной пользы.

Оптимизация систем визуализации на основе информационно-ориентированного проектирования

Кодировщик преобразует объекты в изображения без шума, количественно оценивая, насколько точно измерения позволяют различать объекты. Искусственный интеллект способен извлекать полезную информацию даже из кодированных данных, которые человек не может интерпретировать, оптимизируя системы визуализации с учетом их информационного содержания.

Революция в моделях сворачивания белков

PLAID — модель, генерирующая аминокислотные последовательности и структуры белков, — отражает роль искусственного интеллекта в биологии. Модель решает такие задачи, как построение моделей с полным атомным разрешением и учетом видовой специфичности, стремясь к эффективному созданию полезных белков.

Защита запросов: StruQ и SecAlign

Последние достижения в области крупных языковых моделей (LLM) открывают возможности для создания интересных интегрированных приложений, однако атаки с подстановкой подсказок представляют собой серьезную угрозу. StruQ и SecAlign — это предлагаемые средства защиты, призванные снизить риск атак с подстановкой подсказок в системах LLM, таких как Google Docs и ChatGPT.

Дискриминация по диалекту: выявление лингвистических предубеждений в ChatGPT

ChatGPT демонстрирует предвзятое отношение к «нестандартным» разновидностям английского языка, при этом его ответы содержат стереотипы и носят снисходительный характер. В ходе исследования GPT-3.5 Turbo и GPT-4 были предоставлены 10 разновидностей английского языка, что позволило выявить сохранение черт стандартного американского английского.

Раскрытие потенциала взаимодействия с LLM

Понимание сложных систем машинного обучения, таких как крупные языковые модели (LLM), имеет решающее значение для искусственного интеллекта. Новые алгоритмы, такие как SPEX и ProxySPEX, призваны выявлять ключевые взаимодействия в масштабе, измеряя влияние с помощью абляции и выделяя факторы, определяющие принятие решений, с минимально возможными возмущениями.

Рабочие процессы с искусственным интеллектом от Google в Chrome, запускаемые одним щелчком мыши

Google представляет функцию «Skills» в Chrome в рамках проекта Gemini, которая позволяет пользователям сохранять запросы к ИИ в виде повторно используемых рабочих процессов. Эта функция упрощает выполнение задач на нескольких вкладках и дает представление о будущем ИИ-агентов на уровне браузера.

Parcae: Усовершенствование языковых моделей с циклической структурой в Калифорнийском университете в Сан-Диего

Исследователи из Калифорнийского университета в Сан-Диего и компании Together AI представляют Parcae — архитектуру трансформатора с циклической структурой, которая демонстрирует более высокую производительность по сравнению с предыдущими моделями при использовании тех же параметров и обучающих данных. Конструкция Parcae позволяет преодолеть ограничения по объему памяти и обеспечивает более выс...

Обнародованы возрастные рейтинги спин-оффов «Питта» и «Игры престолов»

Инструмент на базе искусственного интеллекта помогает BBFC классифицировать британские сериалы HBO Max, такие как «Питт» и спин-офф «Игры престолов», выделяя спорные сцены для последующей проверки специалистами. Инструмент помогает выявлять нарушения норм, такие как насилие, обнаженность и нецензурная лексика.

Стоимость токена: ключевой показатель совокупной стоимости владения (TCO) в сфере ИИ

Центры обработки данных превратились в «фабрики токенов» на базе ИИ, уделяя внимание не столько исходной вычислительной мощности, сколько стоимости производства одного токена. NVIDIA предлагает самую низкую в отрасли стоимость производства одного токена, что позволяет максимально увеличить выручку и рентабельность.

Ускорение инференса моделей большого языкового обучения (LLM) с помощью спекулятивного декодирования на AWS Trainium

Развертывание моделей Qwen3 с использованием vLLM, Kubernetes и чипов AWS AI позволяет снизить стоимость каждого выводимого токена и повысить пропускную способность. Спекулятивное декодирование на AWS Trainium ускоряет генерацию токенов в 3 раза, сокращая задержку и затраты на инференцию в приложениях искусственного интеллекта.

Неутешительные результаты: регрессия на основе дерева решений на языке C# на наборе данных по диабету

Разработчик применил набор данных по диабету к регрессионной модели на основе дерева решений на языке C#, что выявило низкую точность прогнозирования из-за крайней степени переобучения. Нормализация данных и параметров модели сыграла ключевую роль в достижении результатов, сопоставимых с результатами, полученными с помощью класса DecisionTreeRegressor из библиотеки scikit.