“Очі не малювати!” – Як ми вчили ШІ бути дизайнером ігор
“Штучний інтелект не допоможе, якщо є проблеми з природним”.
Народна мудрість
Все почалося зі звичайнісінької щотижневої наради геймдев компанії, на якій відділ маркетингу запропонував додати в одну з ігор картинки в стилі “Italian Brainrot” (Італійський брейнрот). Як приклади на слайдах були показані Bombardiro Crocodilo і Ballerina Cappuccina.
Поки маркетологи обговорювали з програмістами технічні нюанси впровадження “брейнротів” в гру, головний дизайнер замислився: а чому саме Балерина Капучина, а не, скажімо, Балерина Сардина… і вже через десять хвилин колективного мозкового штурму був розроблений концепт нової казуальної гри.
Ідея нової гри
Механіка нової гри виявилася дуже простою: гравцеві пропонується картинка, на якій зображено об’єкт, який поєднує в собі два поняття. Наприклад: bat – mat, time – crime, box – paradox… Завдання гравця – відгадати, що намальовано на картинці.
В якості підказок були обрані наступні умови:
- Поняття повинні обов’язково римуватися.
- На картці із завданням обидва поняття позначені символами підкреслення, щоб гравець знав кількість літер у загаданих словах.
Також рівні з поняттями, які важко зобразити (почуття і явища), ми вирішили позначати як складні. Наприклад, для візуалізації пари knight – plight, було потрібно набагато більше винахідливості, і такі картинки виходили метафоричними і навіть сюрреалістичними.

При цьому головна складність у виробництві гри полягала в тому, що більшість картинок можна розгадати менше ніж за хвилину. Тому для повноцінної гри необхідно було придумати і створити КІЛЬКА СОТЕНЬ унікальних зображень.
Так народилася ідея проєкту, в якому можливості штучного інтелекту поєдналися з досвідом геймдеву. Створення гри стало спільною роботою QuData – компанії з розробки ШІ рішень і геймдев компанії Absolutist, де кожна сторона внесла свій вклад:
- Команда Absolutist відповідала за ігрову механіку, дизайн та реалізацію геймплею.
- Команда QuData – за дослідження та використання генеративних моделей для створення контенту, промптів і візуальних рішень.
Ми поєднали технологічну експертизу та креативний підхід, перетворивши просту ідею на повноцінний проєкт нової гри.
Вибір інструменту для дизайну рівнів
Процес генерації рівнів було розділено на дві частини:
- Створити цікаві римовані пари слів
- Згенерувати за ними картинки
Головним креатором для виконання першого етапу був призначений ChatGPT-4o. Незважаючи на усі його недоліки, здавалося, він непогано справлявся з генерацією римованих пар слів. Основними перевагами цього підходу були:
- Можливість генерувати слова кількома мовами
- Великий список рим (понад 700 пар)
- Можливість підбору рим для корекції словосполучень
Для вирішення другого завдання команда планувала використовувати популярні графічні генеративні інструменти ШІ. Але, зробивши кілька прототипів картинок в ChatGPT-4o, ми переконалися, що він цілком підходить і для цієї задачі. На його користь спрацювали такі фактори:
- Обмеження за максимальним розміром картинки в 1024х1024 пікселів (для гри потрібна була квадратна картинка) нас цілком влаштовувало.
- Явні помилки при генерації зображень (у порівнянні з іншими генераторами) додавали їм особливого шарму і “брейнротності”.
- Навіть незрозумілі зміни графічного стилю картинок призвели до того, що ми отримали різноманітність і неповторність рівнів.
Особливості роботи з промптами для рим
Ми не очікували, що ChatGPT створить тисячу цікавих римованих сполучень за один запит. Максимум, що нам вдалося отримати – близько 700 пар, які вручну відбирали наші дизайнери (носії мови).
Напиши два відомі усім об’єкти англійською мовою, які римуються. Видай список із 20 варіантів.
Якщо при запиті 20-30 варіантів ChatGPT ще справляється, то далі він починав повторюватися або видавати комбінації з дивним змістом навіть для брейнротів. За один промпт за якістю результату ШІ краще справляється з невеликими порціями (по 10-20 словосполучень), ніж відразу зі 100+. Також ми помітили, що корисно скористатися пропозиціями ChatGPT “видати результати по темі”.
Однак на наступному етапі відбору з’ясувалося, що поняття “рими” у ChatGPT є досить умовним. Він дійсно видав 700 пар, але далеко не всі з них можна було вважати справжніми римами. Наприклад, ось лише кілька “вдалих” варіантів, за версією ChatGPT:
gull – bull
sardina – balerina
sushi – plushie
igloo – canoe
З точки зору фонетики, лише частина слів з 700 пар дійсно звучали як рима, а інші вимагали правок або повної заміни. Крім того, було проведено фільтрацію непідходящих слів: ми виключили пари з негативним або образливим підтекстом, такі як cat – brat
Результат:
Враховуючи всі фактори, можна вважати, що ChatGPT допоміг у 10% генерації римованих словосполучень. 90% з 1000 використаних в грі комбінацій були придумані, перевірені та відкориговані нашими дизайнерами.
Приклади фінальних комбінацій:
coffee – trophy
riddle – needle
jam – gem
ocean – potion
Особливості роботи з промптами для картинок
Коли прийшов час переходити від слів до візуалу, ми вирішили в цьому завданні повністю покластися на креатив ChatGPT. Придумати і намалювати кілька сотень на перший погляд несумісних понять – для людини практично нездійсненне завдання. А ось для штучного інтелекту – чудовий творчий виклик.
Однак потрібно визнати, що і ChatGPT справлявся з цим не з першого разу. В середньому кожну другу картинку нам доводилося перегенерувати двічі, а кожну п’яту – більше трьох разів. Промпти для генерації картинок постійно вдосконалювалися: від коротких інструкцій до детальних описів з уточненнями і обмеженнями.
Створи картинку, на якій знаходиться об’єкт (A), схожий на (B). Це повинен бути один об’єкт, який складається з цих двох понять. Фон картинки абстрактний, картинка квадратна. Не використовувати текст як підпис для позначення поняття. Зображення має бути у векторному псевдо-3D-стилі графіки. Не використовувати обведення в зображенні. Зображення має бути цікавим. Не використовувати намальовані очі та посмішку на зображеному об’єкті.
Модифікації промпта в основному були пов’язані з уточненнями. Незважаючи на значний досвід роботи із зображеннями, ChatGPT досить часто ігнорував задані умови: то домальовував неживим об’єктам “очі” і “посмішку”, то підписував на зображенні, що саме він намалював. Іноді доводилося буквально “пояснювати” ШІ значення понять: те, що людині здається очевидним, він інтерпретував по-своєму.
Особливо часто модель плутала контекст і переносила елементи з попередніх завдань. В результаті кожна десята картинка могла містити частини попередніх асоціацій.
Крім того, анатомія все ще залишається слабким місцем у генерації зображень нейромережами. ШІ досі помиляється в кількості кінцівок і пальців, “зливаючи” або дублюючи частини тіла, створюючи неприродні суглоби і деформації. Наприклад, при створенні зображення лінивця модель видала результат з трилапою твариною.

Ми спробували виправити помилку, використовуючи уточнюючий промпт:
На цій картинці у лінивця 3 лапи, якими він тримається за гілку (лінивець звисає з гілки, вхопившись за гілку), але у лінивця має бути 4 лапи, не вистачає однієї задньої лапи – додай її, будь ласка.
Здавалося б, завдання просте. Однак результат виявився... ще гіршим. ChatGPT додав які завгодно лапи, але тільки не ту, що потрібно.

Виправити картинку вдалося лише після втручання дизайнера, який акуратно домалював відсутню лапу.

Крім творчих складнощів, виникли й технічні: обмеження на генерацію близько 200 зображень на місяць значно сповільнювало процес. Довелося ретельно планувати чергу завдань і розподіляти запити між командами, щоб не втрачати темп роботи.
Результат:
Незважаючи на всі труднощі, всі 100% з 1000 рівнів були згенеровані ChatGPT. Лише кілька десятків картинок були підправлені нашими художниками, щоб виправити невеликі візуальні неточності.
Приклади фінальних картинок

Резюме
Цей проєкт став чудовим прикладом того, як штучний інтелект і людина можуть доповнювати один одного в креативних процесах. Використання ШІ в якості провідного дизайнера рівнів абстрактної казуальної гри цілком можливе.
Ігрові механіки дозволяють перетворити існуючі недоліки ШІ – спонтанність, алогічність і дивні асоціації – на художні переваги. Там, де художнику потрібно шукати натхнення, нейромережа вже створює несподівані образи, які задають тон всій грі.
Ви можете протестувати результати спільної роботи ШІ та нашої геймдев-команди в новій мобільній грі Guess Mess!
Окремо була створена українська версія гри Словограй з власними римованими парами слів і унікальними картинками.
Команда Absolutist