Gemini 3.5 Live Translate: миттєвий переклад реальним голосом

Нова технологія ШІ від Google забезпечує миттєвий аудіо переклад більш ніж 70 мовами, зберігаючи природний голос співрозмовника

12 Червня, 2026

Gemini 3.5 Live Translate: миттєвий переклад реальним голосом

Компанія Google представила Gemini 3.5 Live Translate – нову модель перекладу “голос у голос” на базі штучного інтелекту, створену для забезпечення майже миттєвого спілкування між людьми, які розмовляють різними мовами. Ця технологія є вагомим внеском у сферу перекладу в режимі реального часу, забезпечуючи більш природне та плавне спілкування та зберігаючи при цьому ключові елементи голосу мовця, зокрема інтонацію, темп та висоту голосу.

Запуск моделі став черговою віхою у багаторічних зусиллях Google з удосконалення машинного перекладу за допомогою штучного інтелекту. За даними компанії, Gemini 3.5 Live Translate може автоматично розпізнавати понад 70 мов і генерувати перекладене мовлення лише за кілька секунд після оригінального висловлювання, створюючи більш плавний досвід, ніж традиційні покрокові системи перекладу.

На відміну від звичайних перекладачів, які чекають завершення фрази перед тим, як видати переклад, Gemini 3.5 Live Translate обробляє мовлення безперервно під час розмови. Такий підхід робить спілкування більш природним, зменшує незручні паузи та покращує синхронізацію між співрозмовниками.

Google зазначає, що модель поєднує швидкість перекладу з розумінням контексту, допомагаючи зберігати точність і водночас не відставати від живої розмови. Система також розроблена для надійної роботи в шумних умовах завдяки фільтрації сторонніх звуків та автоматичній обробці багатомовного мовлення без необхідності ручного налаштування.

Нова модель перекладу впроваджується в низці продуктів і сервісів Google. Розробники вже можуть почати тестувати Gemini 3.5 Live Translate через публічну прев’ю-версію в Gemini Live API та Google AI Studio. Компанія зазначає, що технологію можна використовувати для створення рішень для багатомовних зустрічей, прямих трансляцій, онлайн-уроків, служби підтримки клієнтів та сервісів синхронного перекладу.

Google також уклав партнерські угоди з кількома платформами для розробників, зокрема Agora, Fishjam, LiveKit, Pipecat та Vision Agents, щоб спростити впровадження застосунків для голосового перекладу.

Одним із перших прикладів використання стала компанія Grab, яка тестує технологію для полегшення спілкування між водіями та пасажирами. Платформа обробляє понад 10 мільйонів голосових дзвінків щомісяця і сподівається, що нова модель допоможе подолати мовні бар’єри під час поїздок пасажирів та взаємодії з клієнтами.

Незабаром корпоративні користувачі побачать інтеграцію Gemini 3.5 Live Translate у Google Meet. Компанія планує розширити підтримку з п’яти мов до понад 70, що дозволить використовувати понад 2000 мовних комбінацій в межах однієї наради.

Google також оновлює інтерфейс Meet, щоб забезпечити швидший доступ до функцій живого перекладу. Оновлення вже переходить у фазу приватного тестування для окремих бізнес-клієнтів Google Workspace, а ширший запуск очікується пізніше цього року.

Користувачі також отримають доступ до нової технології через застосунок Google Translate на Android та iOS. Живий голосовий переклад працюватиме практично з будь-якими навушниками, тож потреба у спеціальному обладнанні, як-от Pixel Buds, зникає.

Для користувачів Android Google додає новий режим “прослуховування”, який дозволяє відтворювати перекладене аудіо безпосередньо через динамік телефону. Достатньо прикласти смартфон до вуха, як під час звичайного дзвінка, щоб слухати переклад приватно без навушників.

Оскільки голос, створений штучним інтелектом, стає дедалі реалістичнішим, Google впроваджує додаткові механізми безпеки. Кожен аудіопотік, згенерований Gemini 3.5 Live Translate, містить водяний знак SynthID – непомітний маркер, вбудований безпосередньо в аудіосигнал.

Такий водяний знак дозволяє ідентифікувати контент, створений ШІ, залишаючись при цьому нечутним для слухачів. У Google зазначають, що цей захід покликаний допомогти вирішити проблеми, пов’язані з дезінформацією, та забезпечити більшу прозорість у міру поширення синтезованого аудіо.

Завдяки підтримці десятків мов, низькій затримці перекладу та інтеграції в сервіси Google, Gemini 3.5 Live Translate може наблизити компанію до давньої мети – забезпечити безперешкодне спілкування між людьми незалежно від того, якою мовою вони розмовляють.