“Глазки не рисовать!” – Как мы учили ИИ быть дизайнером игр
“Искусственный интеллект не поможет, если есть проблемы с естественным”.
Народная мудрость
Все началось с самого обычного еженедельного совещания геймдев компании, на котором отдел маркетинга предложил добавить в одну из игр картинки в стиле “Italian Brainrot” (Итальянский брейнрот). В качестве примеров на слайдах были показаны Bombardiro Crocodilo и Ballerina Cappuccina.
Пока маркетологи обсуждали с программистами технические нюансы внедрения “брейнротов” в игру, ведущий дизайнер задался вопросом, а почему именно Балерина Капучина, а не, скажем, Балерина Сардина… и уже через десять минут коллективного мозгового штурма был набросан концепт новой казуальной игры.
Идея новой игры
Механика новой игры получилась очень простой: игроку предлагается картинка, на которой изображен объект, объединяющий в себе два понятия. Например: bat – mat, time – crime, box – paradox… Задача игрока – угадать, что нарисовано на картинке.
В качестве подсказок были выбраны следующие условия:
- Понятия должны обязательно рифмоваться.
- На карточке с заданием оба понятия обозначены символами подчеркивания, чтобы игрок знал количество букв в загаданных словах.
Также уровни с понятиями, которые трудно изобразить (чувства и явления), мы решили помечать как сложные. Например, для визуализации пары knight – plight, требовалось гораздо большей изобретательности, и такие картинки получались метафоричными и даже сюрреалистичными.

При этом главная сложность в производстве игры состояла в том, что большинство картинок можно разгадать меньше чем за минуту. Поэтому для полноценной игры необходимо было придумать и создать НЕСКОЛЬКО СОТЕН уникальных картинок.
Так родилась идея проекта, в котором возможности искусственного интеллекта объединились с опытом геймдева. Создание игры стало совместной работой QuData – компании по разработке ИИ решений и геймдев компании Absolutist, где каждая сторона внесла свой вклад:
- Команда Absolutist отвечала за игровую механику, дизайн и реализацию геймплея.
- Команда QuData – за исследование и использование генеративных моделей для создания контента, промптов и визуальных решений.
Мы соединили технологическую экспертизу и креативный подход, превратив простую идею в полноценный игровой проект.
Выбор инструмента для дизайна уровней
Задача генерации уровней разбивалась на 2 части:
- Создать забавные рифмующиеся словосочетания
- Сгенерировать по ним картинки
Главным креатором, решающим первую часть, был назначен ChatGPT-4o. При всех своих недостатках, казалось, он неплохо справлялся с генерацией рифмованных пар слов. Основными достоинствами этого подхода были:
- Возможность генерации слов на нескольких языках
- Большой список рифм (более 700 пар)
- Возможность подбора рифм для коррекции словосочетаний
Для решения второй задачи команда планировала использовать популярные графические генеративные ИИ инструменты. Но сделав несколько прототипов картинок в ChatGPT-4o, мы пришли к выводу, что и для данной задачи он вполне подходит. В его пользу сработали такие факторы:
- Ограничение по максимальному размеру картинки в 1024х1024 пикселя (для игры нужна была квадратная картинка) нас вполне устраивало.
- Явно выраженные ляпы при генерации картинок (по сравнению с другими генераторами) придавали больше шарма и “брейнротости” картинкам.
- Даже необъяснимые смены графического стиля картинок привели к тому, что мы получили разнообразие и неповторимость уровней.
Особенности работы с промптами для рифм
У нас не было иллюзий, что ChatGPT создаст нам условную тысячу интересных рифмованных словосочетаний одним запросом. Максимум, что мы смогли из него выжать – это около 700 понятий, которые были вручную отобраны нашими дизайнерами (носителями языка).
Предоставь рифмованные два известных всем предмета на английском языке, рифма должна быть четкая, выдай список из 20 вариантов.
Если при запросе 20-30 вариантов ChatGPT еще худо-бедно справляется, то дальше он начинает повторяться или выдавать сочетания со странным смыслом даже для брейнротов. За один промпт по качеству результата ИИ лучше справляется с небольшими порциями (по 10-20 словосочетаний), чем сразу со 100+. Также мы заметили, что имеет смысл воспользоваться предложениями ChatGPT “выдать результаты по теме”.
Однако на следующем этапе отбора выяснилось, что понятие “рифмы” у ChatGPT весьма условное. Он действительно выдал 700 пар, но далеко не все из них можно было считать настоящими рифмами. Например, вот лишь несколько “удачных” примеров, по версии ChatGPT:
gull – bull
sardina – balerina
sushi – plushie
igloo – canoe
С точки зрения фонетики, из 700 пар слов только часть из них действительно звучала как рифма, а другие требовали правки или полной замены. Кроме того, была проведена фильтрация неподходящих слов: мы исключили пары с негативным или оскорбительным подтекстом, такие как cat – brat
Результат:
Учитывая все факторы, можно считать, что ChatGPT помог в 10% генерации рифмованных словосочетаний. 90% из 1000 использованных в игре комбинаций были придуманы, проверены и откорректированы нашими дизайнерами.
Примеры итоговых сочетаний:
coffee – trophy
riddle – needle
jam – gem
ocean – potion
Особенности работы с промптами для картинок
Когда пришло время переходить от слов к визуалу, мы решили в этой задаче полностью положиться на креатив ChatGPT. Сочинить и нарисовать несколько сотен на первый взгляд не сочетающихся понятий – для человека практически неподъемная задача. А вот для искусственного интеллекта – отличный творческий вызов.
Нужно признать, что и ChatGPT справлялся с этим не с первого раза. В среднем каждую вторую картинку нам приходилось перегенерировать два раза, а каждую пятую – больше трех раз. Промпты для генерации картинок постоянно дорабатывались: от коротких инструкций до детальных описаний с уточнениями и запретами.
Создай картинку, на которой находится (A), похожий на (B). Это должен быть один объект, состоящий из этих двух понятий. Фон картинки абстрактный, картинка квадратная. Не использовать текст в качестве подписи для обозначения понятия. Картинка должна быть в векторном псевдо-3D-стиле графики. Не использовать оконтуривание в картинке. Картинка должна быть привлекательна. Не использовать нарисованные глаза и улыбку на полученном объекте.
Модификации промпта в основном связаны с уточнениями. Несмотря на внушительный опыт работы с изображениями, достаточно часто ChatGPT игнорировал заданные условия: то пририсовывал неодушевленным объектам “глазки” и “улыбку”, то подписывал на картинке, что именно он нарисовал. Иногда приходилось буквально “объяснять” ИИ смысл понятий: то, что человеку кажется очевидным, он интерпретировал по-своему.
Особенно частыми были случаи, когда модель путала контекст и переносила элементы из предыдущих заданий. В результате каждая десятая картинка могла содержать части предыдущих ассоциаций.
Кроме того, анатомия все также остается слабым местом в генерации изображений нейросетями. ИИ все еще ошибается в числе конечностей и пальцев, “сливая” или дублируя части тела, создавая неестественные суставы и деформации. Например, при создании изображения ленивца модель выдала результат с трехлапым животным.

Мы попытались исправить ошибку, используя уточняющий промпт:
На этой картинке у ленивца 3 лапы, которыми он держится за ветку (ленивец свисает с ветки, ухватившись за ветку), но у ленивца должно быть 4 лапы, не хватает одной задней лапы – добавь ее, пожалуйста.
Казалось бы, задача проста. Однако результат оказался… еще хуже. ChatGPT добавил какие хочешь лапы, но только не ту, что нужно.

Исправить картинку удалось лишь после вмешательства дизайнера, который аккуратно дорисовал недостающую лапу.

Помимо творческих сложностей, возникли и технические: ограничение на генерацию около 200 изображений в месяц значительно замедляло процесс. Пришлось тщательно планировать очередь задач и распределять запросы между командами, чтобы не терять темп работы.
Результат:
Несмотря на все трудности, все 100% из 1000 уровней были сгенерированы ChatGPT. Лишь несколько десятков картинок были подправлены нашими художниками, чтобы исправить небольшие визуальные неточности.
Примеры итоговых картинок

Резюме
Этот проект стал отличным примером того, как искусственный интеллект и человек могут дополнять друг друга в креативных процессах. Использование ИИ в качестве ведущего дизайнера уровней абстрактной казуальной игры вполне возможно.
Игровые механики позволяют превратить текущие недостатки ИИ – спонтанность, алогичность и странные ассоциации – в художественные достоинства. Там, где художнику нужно искать вдохновение, нейросеть уже создает неожиданные образы, которые задают тон всей игре.
Вы можете протестировать результаты совместной работы ИИ и нашей геймдев команды в новой мобильной игре Guess Mess!
Отдельно была создана украинская версия игры Словограй с собственными рифмующимися парами слов и уникальными картинками.
Команда Absolutist