Казуальний арт без ілюзій: що насправді вміє ШІ

Практичний досвід від артстудії Absolutist: як інтегрувати штучний інтелект в пайплайн створення казуального ігрового арту

Казуальний арт без ілюзій: що насправді вміє ШІ

Світ геймдеву змінюється швидше, ніж будь-коли. Якщо ще нещодавно дискусії навколо штучного інтелекту зводилися до питання, чи здатен він замінити людину, то сьогодні фокус змістився. ШІ перестав бути темою для філософських роздумів і став інструментом конкурентної боротьби.

Ми вже аналізували, чому сучасний геймдев більше не працює без ШІ, а також ділилися власним практичним і подекуди курйозним досвідом у статті “Очі не малювати! – Як ми вчили ШІ бути дизайнером ігор”. Тепер настав час розібратися, як саме штучний інтелект інтегрується в реальний арт-пайплайн – зокрема виробництво казуального ігрового арту.

ШІ дедалі активніше використовується у створенні ігрової графіки, але його реальна цінність стає очевидною лише тоді, коли чітко розумієш межі можливостей інструментів. На прикладі досвіду артстудії Absolutist ми розглянемо роботу з Leonardo AI та з’ясуємо, де ШІ дійсно економить час і приносить користь, а де все ще потребує обов’язкової ручної роботи художника.

Загальні принципи роботи з Leonardo AI

Для отримання результатів, максимально відповідних бажаному стилю, рекомендуємо завантажувати референси в чат з AI (наприклад, ChatGPT) з проханням чітко та конкретно описати стиль спеціально для Leonardo AI. Це дозволяє генерувати контент, який ідеально вписується в проєкт. Результати обмежуються лише рівнем креативності та навичками користувача: від логотипів і колекційних об’єктів до ізометричних карт, ігрових інтерфейсів та бекграундів.

Leonardo AI як інструмент швидкого старту

Головна цінність Leonardo AI – прискорення початкового етапу роботи. Він добре підходить для швидкого пошуку ідей, перебору силуетів, ракурсів, кольорових схем і формування загального настрою сцени або персонажа. Замість тривалого ручного скетчингу або збирання референсів художник може за короткий час отримати кілька візуальних напрямів і зрозуміти, в який бік рухатися далі.

Але інструментів так багато, який же працює найкраще? Давайте спробуємо подивитися на результати на конкретному прикладі. Задамо ШІ складну задачу і напишемо промт:

Промпт:

Сюрреалістичне романтичне мистецтво, стилізоване під Сальвадора Далі та Йошітаку Амано. Серед вулиць великого мегаполісу та високих хмарочосів вдень пролітає золота сюрреалістична гігантська риба, яка складається з колажу програмного коду, фрагментів цифрового мистецтва, іконок документів, електронних годинників та фаст-фуду. Внизу індіанець майя пролітає на клавіатурі, як на скейтборді, а з іншого боку за банкіром на дипломаті слідує вихор документів.

Стандартні режими Concept Art та Illustrative Albedo зовсім не впоралися з поставленим завданням.

Але ми не здаємося і намагаємося далі створити потрібний арт: перебираємо доступні режими Flux.1.Kontext, Lucid Realism і Phoenix.1.0. І так, це вже набагато ближче до промту, всі сюжетні лінії відображені, але вони не об’єднуються в єдину гармонійну злагоджену композицію.

І, нарешті, спробуємо застосувати найновіший інструмент Nano Banana\Nano Banana Pro. Результат вражає, це вже повноцінний концепт, з яким можна працювати далі.

Робимо висновок, що найкраще для концепту підходить режим Nano Banana, тому що він поєднує в собі і логіку, і креативність, але наразі єдиний його недолік в тому, що він потребує багато токенів для генерації.

Робота з бекграундами

Leonardo AI здатний створювати якісні бекграунди як за абстрактними, так і за детально прописаними промптами. ШІ добре відтворює атмосферу (емоційні стани, напруга, спокій, драматизм), освітлення і загальну композицію сцени.

Сам принцип генерації не відрізняється від роботи над концепт-артом, тому спочатку працюйте за порадами створення концептів. Якщо хочемо внести зміни в зображення, заходимо у власну бібліотеку робіт і натискаємо на зображення для перегляду. А далі у вікні редагування вбиваємо потрібні нам зміни. Наприклад, даємо команду прибрати все зайве: дрібні об’єкти, UI елементи тощо – і насолоджуємося результатом.

Генерація персонажів

Створюючи ідею для персонажа, краще одразу вказувати в промпті генерацію від 6 штук, оскільки ШІ іноді дублює пози в генерації без значних змін. Створити одразу 6-8 варіантів одного формату вийде більш успішно, ніж намагатись на базі одного створити додаткові. Також буде корисним вказувати динамічність, дії, емоції, додаткові об’єкти, колір фону (для більш зручного вирізання потім у фотошопі) тощо.

Можливе “перевдягання” персонажа за допомогою Image Reference, створення варіацій у різних позах, настроях чи діях. Для отримання додаткових поз конкретного персонажа завантажте базове зображення в Image Reference. Леонардо не завжди підхватує референс і може створювати взагалі ні з чим не пов’язані генерації, але якщо повторювати дію (до 6 разів), то нарешті отримаєте бажаний результат. Наприклад, при проханні перефарбувати светр в зелений, він виповнив запит лише з другого разу.

Щодо генерації декількох варіантів поз на базі персонажа, створеного не Леонардо – це цілком посильна задача для штучного інтелекту. Так само беремо бажаного персонажа і завантажуємо в Image Reference. Далі бачимо, що в перших трьох генераціях Леонардо взагалі не підхопив прикладений арт по стилю, але з четвертої спроби (промпт при цьому не змінювався) була максимальна відповідність.

Утім, фінальні образи майже завжди потребують доопрацювання через артефакти та стилістичні неточності.

Створення інтерфейсів у Leonardo AI

Leonardo AI ефективно генерує арт для інтерфейсу користувача (UI), дозволяючи створювати цілі вікна чи екрани в стилі конкретного жанру гри (match-3, hidden objects, mahjong тощо). За допомогою детальних промптів з референсами можна отримати стилізовані панелі, меню та фони з атмосферою, яка відповідає тематиці: від казкового до дарк фентезі.

Однак повні інтерфейси часто мають проблеми з розміщенням: іконки, кнопки навігації та елементи керування генеруються некоректно чи мають різні відстані між собою, що вимагає ручного редагування в Photoshop.

Кращий підхід – генерація окремих сетів асетів: кнопок, іконок, індикаторів прогресу, рамок. Як і у випадку з генераціями персонажів, об’єкти (наприклад рамки) краще створювати одразу по декілька штук, вказуючи в промпті: “декілька варіантів, окреме розташування, сірий фон, game asset, тематика, матеріал, стиль зображення”. Стиль зображення: “казуальний, 3d рендер, мультяшний”.

Інструмент Upscaler гарно покращує деталізацію, а далі їх вже можна інтегрувати у прототипи. Це дійсно прискорює пайплайн для казуальних ігор, але для комерційної стабільності треба комбінувати ШІ арт з постобробкою, щоб забезпечити функціональність та єдність стилю.

Проблема стабільності стилю

Найбільший виклик при роботі з Leonardo AI – нестабільне влучання в казуальний стиль. Навіть при чітких промптах результати можуть зміщуватися у бік надмірної мультяшності або напівреалізму.

Модель Nano Banana наразі найкраще справляється з казуальним стилем, особливо при використанні стилістичних референсів. Проте й вона не гарантує стабільний результат з першої спроби.

Stable Diffusion як альтернатива

Для великих проєктів перспективним є створення власної моделі Stable Diffusion, навченої під конкретний стиль. Це забезпечує кращу послідовність, але потребує окремих технічних рішень, часу та ресурсів.

Чому без художника не обійтись

Генерації майже завжди містять проблеми анатомічного характеру, пропорційні помилки, проблеми надмірної чи недостатньої деталізації, розмиті або “зламані” зони. Фінальний арт зазвичай складається з кількох генерацій, фрагменти яких комбінуються й допрацьовуються вручну. Саме художник відповідає за чистоту рендеру та єдність стилю.

Інтеграція штучного інтелекту в пайплайн створення казуального арту – це не натискання кнопки “зробити красиво” і не автоматизація творчості. Це складний ітеративний процес, у якому художник переходить від ролі виконавця до ролі артдиректора нейромережі, контролюючи стиль, якість і доцільність кожного результату.

Практика показує, що ШІ найефективніший там, де важлива швидкість: на етапах розробки концепцій і прототипів, пошуку візуальних напрямів і кольорових палітр та створення асетів другого плану. Водночас фінальний рендер, анатомічна коректність персонажів, композиційна цілісність та зручність інтерфейсів залишаються виключно зоною відповідальності людини. Без ручного доопрацювання та постобробки отримати стабільний комерційний продукт наразі неможливо.

Навіть найсильніші моделі, такі як Nano Banana, демонструють вражаючі результати в казуальній стилістиці, але потребують досвідченого ока для підтримання єдиного стилю всієї гри. Саме баланс між можливостями ШІ та експертизою художника визначає якість кінцевого продукту.

Команда артстудії Absolutist