Llama 3: останні досягнення серед великих мовних моделей
Нещодавно ми обговорювали останні моделі штучного інтелекту, зокрема Grok-1 від xAI та Gemini і Gemmaвід Google. Тепер настав час приділити увагу Meta AI. Минулого тижня компанія з гордістю представила своє нове творіння серед великих мовних моделей (LLM): Llama 3. Цей реліз, створений на основі попередніх ітерацій, знаменує собою значний прогрес для технологій ШІ.
Модель Llama 3 доступна у двох розмірах, щоб задовольнити різні потреби:
- Llama 3 8B: створено для ефективного розгортання та розробки на графічних процесорах споживчого класу.
- Llama 3 70B: розроблено для великомасштабних застосунків ШІ.
Обидві версії включають базові (попередньо навчені) моделі та допрацьовані моделі, які можуть похвалитися довжиною контексту у 8 тис. токенів та мають адаптивну сумісність з різним обладнанням для простих споживачів.
Llama 3 вирізняється неперевершеним розумінням мови, здатністю осмислювати деталі контексту та майстерністю у виконанні складних завдань, таких як переклад і написання діалогів. Вона виходить за рамки традиційної обробки природної мови, відмінно проявляє себе у процесах міркування, генерації коду та виконанні інструкцій.
Навчена на великому наборі даних з понад 15 трильйонів токенів, що у сім разів більше, ніж у попередньої моделі Llama 2, Llama 3 розширює межі можливостей, легко вирішуючи багатоетапні задачі. Незалежно від того, чи розробляєте ви діалогові агенти, системи підтримки або генератори контенту, масштабованість Llama 3 гарантує її універсальність.
Нові можливості Llama 3:
- Розширений словниковий запас: Llama 3 представляє новий токенізатор із розміром словника 128 256, що покращує ефективність кодування тексту та багатомовність.
- Збільшені матриці введення та виведення: збільшений розмір словника підвищує продуктивність і розширює можливості вбудовування вхідних і вихідних матриць.
- Llama Guard 2: запропонована точно налаштована модель безпеки класифікує вхідні дані та відповіді моделі, забезпечуючи безпечну систематизацію ризиків.
Оснащена найсучаснішими алгоритмами машинного навчання, Llama 3 постійно вдосконалюється і адаптується на основі взаємодії та відгуків користувачів. Ця здатність до самонавчання гарантує, що Llama 3 з часом стане більш досвідченою, надаючи все більш точні та персоналізовані результати.
Компанія Meta вже почала інтегрувати Llama 3 у свої продукти та сервіси. Зокрема, Llama 3 забезпечує роботу ШІ-помічника від Meta, який допомагає користувачам і покращує взаємодію, надаючи корисні поради і відповідаючи на запитання.
Llama 3 від Meta – це велика мовна модель з відкритим вихідним кодом. Компанія оголосила, що незабаром вона буде доступна на платформах AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM та Snowflake.