Компания Google выпустила масштабные обновления для моделей Gemini
Компания Google объявила о значительных обновлениях своих моделей Gemini, которые направлены на то, чтобы сделать современные возможности искусственного интеллекта более доступными и экономически выгодными для разработчиков по всему миру. Две новые модели уже готовы к использованию: Gemini-1.5-Pro-002 и Gemini-1.5-Flash-002, и предлагают существенные улучшения скорости и производительности.
Главные улучшения:
- Сниженная стоимость: цена на входные токены снижена на 64%, на выходные – на 52%, а также на дополнительные кэшированные токены – на 64% для Gemini 1.5 Pro.
- Повышенные лимиты запросов: ограничение для 1.5 Flash увеличено вдвое – до 2 000 запросов в минуту, а для 1.5 Pro – почти втрое – до 1 000 запросов в минуту.
- Улучшенная скорость: модели Gemini теперь обеспечивают вдвое быстрее вывод данных и втрое ниже задержку ответов, что позволяет разработчикам эффективнее внедрять высокопроизводительный искусственный интеллект в реальном времени.
Серия моделей Gemini 1.5 предназначена для широкого спектра задач, в частности, работы с текстом, кодом и мультимодальными приложениями. Эти модели могут обрабатывать большие объемы информации, такие как PDF-файлы длиною в 1 000 страниц и часовые видео, предлагая улучшенную производительность в ключевых сферах:
- Улучшение на 7% в результатах прохождения теста MMLU-Pro, который оценивает восприятие искусственного интеллекта.
- Улучшение на 20% в решении сложных математических задач.
- Лучшие результаты в задачах понимания изображений и генерации кода на Python.
В ответ на отзывы пользователей, модели Gemini 1.5 теперь генерируют более лаконичные результаты – примерно на 5-20% более короткие ответы, чем в предыдущих версиях. Это особенно полезно для обобщения текстов и извлечения информации, уменьшая общие затраты при сохранении ясности и точности.
Новые модели также оснащены обновленными фильтрами безопасности, что позволяет разработчикам настраивать их в зависимости от конкретных потребностей. По умолчанию фильтры были скорректированы для баланса между выполнением инструкций пользователя и соблюдением стандартов безопасности.
Последние апдейты делают модели Gemini 1.5 более быстрыми, экономически эффективными и лучше приспособленными для широкого спектра приложений.
Разработчики могут бесплатно получить доступ к этим моделям через Google AI Studio, а крупные организации и клиенты Google Cloud могут использовать их через Vertex AI.
Больше информации размещено в блоге Google для разработчиков.