Новий апогей штучного інтелекту від Google
Google не просто вдосконалює технології – компанія визначає нову еру обчислень. Слідом за такими значними розробками, як Quantum Echoes, технологічний гігант знову опинився в центрі уваги. Цього разу Google одночасно запустив Gemini 3, свою найрозумнішу та найпотужнішу модель штучного інтелекту на сьогодні, а також Google Antigravity – новаторську платформу для агентного програмування. Разом ці інновації мають на меті кардинально змінити спосіб взаємодії користувачів зі штучним інтелектом, незалежно від того, чи вивчають вони складні предмети, пишуть код або керують багатоетапними робочими процесами.
Спираючись на досягнення Gemini 1 і 2, Gemini 3 поєднує мультимодальне розуміння, покращене мислення та можливості агентів в єдину потужну модель. Google описує її як найсучасніший штучний інтелект, здатний розуміти текст, зображення, відео, аудіо та код з неймовірною глибиною та точністю.
Основні характеристики Gemini 3 за результатами різних бенчмарків:
- Неперевершене мислення: Gemini 3 Pro очолює рейтинг LMArena з показником Elo 1501 і демонструє мислення на рівні доктора наук у тестах Humanity’s Last Exam (37,5%) та GPQA Diamond (91,9%).
- Мультимодальне розуміння: модель набирає 81% на MMMU-Pro, 87,6% на Video-MMMU, а також 72,1% на SimpleQA Verified у точності фактів.
- Агентне програмування та вайб-кодинг: Gemini 3 показала відмінні результати в zero-shot кодуванні та складній веб-розробці. Модель очолює WebDev Arena (1487 Elo) та набирає 76,2% на SWE-bench Verified, який перевіряє здатність системи генерувати код.
- Режим Deep Think: для складних завдань з логічного мислення режим Deep Think ще більше підвищує продуктивність, досягаючи 41% на Humanity’s Last Exam та 93,8% на GPQA Diamond.
З контекстним вікном на 1 мільйон токенів модель Gemini 3 може аналізувати великий обсяг інформації: від наукових статей і лекцій до рукописних сімейних рецептів, і генерувати інтерактивні візуалізації, код чи навчальні матеріали. Вона також може надавати практичні поради для повсякденного життя: планування робочих процесів, організація поштових скриньок чи оптимізація особистої рутини.
Інтелект Gemini 3 відразу доступний користувачам через нові генеративні інтерфейси у Google Search та застосунку Gemini. Функції Visual Layout та Dynamic View дозволяють ШІ створювати інтерфейси у стилі журналу або інтерактивні інструменти (симуляції, веб-додатки) на льоту, перетворюючи статичні відповіді на інтерактивний досвід.
Разом із Gemini 3 Google представив платформу Antigravity (Integrated Development Environment, IDE), створену на основі агентного ШІ. На відміну від традиційних середовищ розробки, Antigravity ставить AI-агентів у роль активних співпрацівників, а не пасивних інструментів. Агенти можуть самостійно планувати та виконувати комплексні завдання на різних платформах: редактор, термінал, браузер – одночасно інформуючи користувачів за допомогою артефактів (Artifacts), які підсумовують прогрес, результати перевірки та практичні результати.
Дві основні робочі області Antigravity:
- Режим редактора (Editor view) – звичний синхронний IDE-досвід для безпосереднього кодування, що працює на базі Gemini 3.
- Режим менеджера (Manager view) – панель управління для координації та моніторингу декількох агентів, які працюють асинхронно над різними завданнями або проєктами, що збільшує продуктивність розробників.
Основні принципи Antigravity:
- Довіра: агенти створюють артефакти, які можна перевірити (списки завдань, скріншоти, записи браузера), замість необроблених логів, що дозволяє розробникам миттєво переглядати логіку.
- Автономність: агенти контролюють редактор, термінал та браузер, керуючи багатокроковими процесами самостійно.
- Зворотний зв’язок: розробники можуть залишати асинхронні коментарі (наприклад, коментарі в Google Doc) безпосередньо на артифакт або знімок екрана, а агент враховує їх без зупинки процесу.
- Самовдосконалення: агент постійно навчається на виконаних завданнях та зворотному зв’язку, додаючи код і стратегії до бази знань для майбутнього використання.
Antigravity також інтегрує модель генерації зображень Nano Banana Pro, що дозволяє агентам створювати макети інтерфейсу, діаграми та інші візуальні ресурси в межах робочих процесів розробників.
Завдяки Gemini 3 та Antigravity компанія Google наближається до своєї мети – створення загального штучного інтелекту (artificial general intelligence, AGI). Користувачі можуть не лише навчатися та досліджувати, а й самостійно будувати, автоматизувати та реалізовувати складні проєкти.