Новости

Свежие новости и полезные статьи про искусственный интеллект и машинное обучение

Llama 3: последние достижения среди больших языковых моделей

Недавно мы обсуждали последние модели искусственного интеллекта, в частности, Grok-1 от xAI, а также Gemini и Gemmaот Google. Теперь пришло время уделить внимание Meta AI. На прошлой неделе компания с гордостью представила свое новое творение среди больших языковых моделей (LLM): Llama 3. Этот релиз, созданный на основе предыдущих итераций, знаменует значительный прогресс для технологий ИИ.

Модель Llama 3 доступна в двух размерах для разных потребностей:

  • Llama 3 8B: предназначена для эффективного развертывания и разработки на графических процессорах потребительского класса.
  • Llama 3 70B: разработана для крупномасштабных приложений ИИ.

Обе версии модели включают в себя базовые (предварительно обученные) модели и доработанные модели, которые могут похвастаться длиной контекста в 8 тыс. токенов и имеют адаптивную совместимость с различным оборудованием для простых потребителей.

Llama 3 отличается непревзойденным пониманием речи, способностью различать детали контекста и мастерством в выполнении сложных задач, таких как перевод и написание диалогов. Она выходит за рамки традиционной обработки естественной языка, отлично проявляет себя во время размышлений, генерации кода и выполнении инструкций.

Обученная на большом наборе данных из более 15 триллионов токенов, что в семь раз больше, чем у предыдущей модели Llama 2, Llama 3 расширяет пределы возможностей, легко решая многоэтапные задачи. Независимо от того, разрабатываете ли вы диалоговые агенты, системы поддержки или генераторы контента, масштабируемость Llama 3 гарантирует ее универсальность.

Новые возможности Llama 3:

  • Расширенный словарный запас: Llama 3 представляет новый токенизатор с размером словаря 128 256, что улучшает эффективность кодирования текста и многоязычность.
  • Увеличенные матрицы ввода и вывода: увеличенный размер словаря повышает производительность и расширяет возможности встраивания матриц ввода и вывода.
  • Llama Guard 2: эта точно настроенная модель безопасности классифицирует входные данные и ответы модели, обеспечивая безопасную систематизацию рисков.

Оснащенная самыми современными алгоритмами машинного обучения Llama 3 постоянно совершенствуется и адаптируется на основе взаимодействия и отзывов пользователей. Эта способность к самообучению гарантирует, что Llama 3 со временем станет более опытной, предоставляя все более точные и персонализированные результаты.

Компания Meta уже начала интегрировать Llama 3 в свои продукты и услуги. В частности, Llama 3 обеспечивает работу ИИ-ассистента от Meta, который помогает пользователям и облегчает взаимодействие, предоставляя полезные советы и отвечая на все вопросы.

Llama 3 от Meta – это большая языковая модель с открытым исходным кодом. Компания объявила, что в скором времени она будет доступна на платформах AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM и Snowflake.