Компанія Google випустила масштабні оновлення для моделей Gemini
Компанія Google оголосила про значні оновлення своїх моделей Gemini, які мають на меті зробити сучасні можливості штучного інтелекту більш доступними та економічно вигідними для розробників по всьому світу. Дві нові моделі вже готові до використання: Gemini-1.5-Pro-002 та Gemini-1.5-Flash-002, і пропонують суттєві покращення швидкості та продуктивності.
Головні покращення:
- Знижена вартість: ціна на вхідні токени знижена на 64%, на вихідні – на 52%, а також на додаткові кешовані токени – на 64% для Gemini 1.5 Pro.
- Підвищені ліміти запитів: обмеження для 1.5 Flash збільшено вдвічі – до 2 000 запитів на хвилину, а для 1.5 Pro – майже втричі – до 1 000 запитів на хвилину.
- Покращена швидкість: моделі Gemini тепер забезпечують вдвічі швидший вивід даних і втричі нижчу затримку відповіді, що дозволяє розробникам ефективніше впроваджувати високопродуктивний штучний інтелект в реальному часі.
Серія моделей Gemini 1.5 призначена для широкого спектра завдань, зокрема роботи з текстом, кодом і мультимодальними додатками. Ці моделі здатні обробляти великі обсяги інформації, такі як PDF-файли довжиною в 1 000 сторінок та годинні відео, пропонуючи покращену продуктивність у ключових сферах:
- Покращення на 7% в результатах проходження тесту MMLU-Pro, який оцінює процес сприйняття штучного інтелекту.
- Покращення на 20% у вирішенні складних математичних завдань.
- Кращі результати в задачах на розуміння зображень і генерацію коду на Python.
У відповідь на відгуки користувачів, моделі Gemini 1.5 тепер генерують більш лаконічні результати – приблизно на 5-20% коротші відповіді, ніж у попередніх версіях. Це особливо корисно для узагальнення текстів та вилучення інформації, зменшуючи загальні витрати при збереженні ясності та точності.
Нові моделі також оснащені оновленими фільтрами безпеки, що дозволяє розробникам налаштовувати їх залежно від конкретних потреб. За замовчуванням фільтри були скориговані для балансу між виконанням інструкцій користувача та дотриманням стандартів безпеки.
An improved experimental version, Gemini-1.5-Flash-8B-Exp-0924, has also been released. This model includes significant upgrades in both text and multimodal capabilities and is available via Google AI Studio and the Gemini API.
Останні апдейти роблять моделі Gemini 1.5 швидшими, економічно ефективнішими та краще пристосованими для широкого спектру застосувань. Розробники можуть безкоштовно отримати доступ до цих моделей через Google AI Studio, а великі організації та клієнти Google Cloud можуть використовувати їх через Vertex AI.