Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Сила данных в искусственном интеллекте

Ценность ИИ определяют не алгоритмы, а данные. Такие компании, как Amazon, Google и Microsoft, достигают успеха благодаря собственным высококачественным наборам данных. Качество данных имеет решающее значение для успеха ИИ, что делает их стратегическим активом, обеспечивающим конкурентное преимущество в XXI веке.

Gemini Robotics от DeepMind: прорыв в области физического ИИ

Google DeepMind представляет Gemini Robotics-ER 1.6 — обновление, расширяющее возможности роботов в области логического мышления при решении реальных задач. Модель выступает в роли стратега высокого уровня, управляя физическими действиями на основе усовершенствованного пространственного мышления и анализа показаний приборов.

Parcae: Усовершенствование языковых моделей с циклической структурой в Калифорнийском университете в Сан-Диего

Исследователи из Калифорнийского университета в Сан-Диего и компании Together AI представляют Parcae — архитектуру трансформатора с циклической структурой, которая демонстрирует более высокую производительность по сравнению с предыдущими моделями при использовании тех же параметров и обучающих данных. Конструкция Parcae позволяет преодолеть ограничения по объему памяти и обеспечивает более выс...

Преобразование системы обеспечения соответствия требованиям в сфере ИИ с помощью автоматизированного логического вывода

Проверки автоматизированного вывода в Amazon Bedrock Guardrails гарантируют математически доказанные и поддающиеся аудиту результаты ИИ для отраслей, подпадающих под регулирование. Используя методы формальной верификации, специалисты по обеспечению соответствия могут получать результаты с доказанной корректностью, устраняя ограничения вероятностной валидации ИИ.

Дискриминация по диалекту: выявление лингвистических предубеждений в ChatGPT

ChatGPT демонстрирует предвзятое отношение к «нестандартным» разновидностям английского языка, при этом его ответы содержат стереотипы и носят снисходительный характер. В ходе исследования GPT-3.5 Turbo и GPT-4 были предоставлены 10 разновидностей английского языка, что позволило выявить сохранение черт стандартного американского английского.

Оптимизация систем визуализации на основе информационно-ориентированного проектирования

Кодировщик преобразует объекты в изображения без шума, количественно оценивая, насколько точно измерения позволяют различать объекты. Искусственный интеллект способен извлекать полезную информацию даже из кодированных данных, которые человек не может интерпретировать, оптимизируя системы визуализации с учетом их информационного содержания.

Освоение процессов обучения и развертывания крупных языковых моделей

Обучение современной крупномасштабной языковой модели включает в себя предварительное обучение общим языковым паттернам, за которым следует контролируемая настройка под конкретные задачи. Такие методы, как LoRA и RLHF, позволяют доработать модель, что впоследствии обеспечивает её внедрение в реальные системы для достижения оптимальной производительности и получения максимальной пользы.

Защита запросов: StruQ и SecAlign

Последние достижения в области крупных языковых моделей (LLM) открывают возможности для создания интересных интегрированных приложений, однако атаки с подстановкой подсказок представляют собой серьезную угрозу. StruQ и SecAlign — это предлагаемые средства защиты, призванные снизить риск атак с подстановкой подсказок в системах LLM, таких как Google Docs и ChatGPT.

Революция в области обучения с подкреплением: новый подход

Новый алгоритм RL по принципу «разделяй и властвуй» бросает вызов традиционному обучению с целевым функцией, обеспечивая масштабируемость для задач с длительным горизонтом. Обучение RL без использования политики обеспечивает гибкость при работе со старыми данными, что имеет решающее значение для таких сложных областей, как робототехника и здравоохранение.

Революция в моделях сворачивания белков

PLAID — модель, генерирующая аминокислотные последовательности и структуры белков, — отражает роль искусственного интеллекта в биологии. Модель решает такие задачи, как построение моделей с полным атомным разрешением и учетом видовой специфичности, стремясь к эффективному созданию полезных белков.

Раскрытие потенциала взаимодействия с LLM

Понимание сложных систем машинного обучения, таких как крупные языковые модели (LLM), имеет решающее значение для искусственного интеллекта. Новые алгоритмы, такие как SPEX и ProxySPEX, призваны выявлять ключевые взаимодействия в масштабе, измеряя влияние с помощью абляции и выделяя факторы, определяющие принятие решений, с минимально возможными возмущениями.

Раскрывая тайны word2vec: секреты семантического обучения

Исследователи раскрыли динамику обучения модели word2vec, выявив её линейную структуру и последовательные этапы. Минимальная нейронная модель алгоритма позволяет лучше понять процесс обучения признакам при решении сложных языковых задач.

Обнародованы возрастные рейтинги спин-оффов «Питта» и «Игры престолов»

Инструмент на базе искусственного интеллекта помогает BBFC классифицировать британские сериалы HBO Max, такие как «Питт» и спин-офф «Игры престолов», выделяя спорные сцены для последующей проверки специалистами. Инструмент помогает выявлять нарушения норм, такие как насилие, обнаженность и нецензурная лексика.

Реклама с сексистским ИИ вызвала возмущение

Британская компания Narwhal Labs, занимающаяся искусственным интеллектом, подверглась резкой критике из-за сексистской рекламы, в которой утверждается, что «сотрудник-ИИ» работает больше всех, не прося при этом повышения зарплаты. В Управление по стандартам рекламы поступили жалобы на рекламную кампанию с этим спорным слоганом.

Стоимость токена: ключевой показатель совокупной стоимости владения (TCO) в сфере ИИ

Центры обработки данных превратились в «фабрики токенов» на базе ИИ, уделяя внимание не столько исходной вычислительной мощности, сколько стоимости производства одного токена. NVIDIA предлагает самую низкую в отрасли стоимость производства одного токена, что позволяет максимально увеличить выручку и рентабельность.