Художник вперше змусив ШІ Midjourney намалювати комікс: ось, що вийшло (відео)

Комікс, Midjourney
Фото: Скриншот | Фрагмент коміксу Goats, створеного Елвісом Діном за допомогою Midjourney

Штучному інтелекту виявилося важко зрозуміти, що від нього вимагає людина, тому робота вийшла не ідеальною.

Related video

Канадський художник та продюсер Елвіс Дін використовував нейромережу Midjourney для створення коміксу. Своїм досвідом він поділився у ролику на YouTube.

Midjourney — це сервіс на базі штучного інтелекту, що створює зображення за текстовим описом від користувача. Автор оформив передплату за $10 на місяць, очікуючи, що вкладеться у 200 спроб, але цього виявилося замало, і він заплатив ще $30 за безлімітний тариф.

Спочатку Елвіс Дін намагався обмежитися тільки текстовим описом зовнішності персонажів, але вони щоразу виходили різними, тоді він змінив підхід і взяв як прообраз акторів. Справа в тому, що Midjourney, як і інші подібні нейромережі, навчався на зображеннях з Інтернету і використовує їх під час роботи. З акторами справа пішла простіше, і персонажі залишалися схожими на себе в різних ситуаціях і позах. Потім з'явилася ідея та сюжет коміксу під назвою "Козли", пізніше опублікованого на сайті WebToon.

За кілька годин Елвіс Дін за допомогою Midjourney намалював зображення для перших 10 сторінок і зібрав їх у комікс за допомогою спеціальної програми. Сюжет оповідає про дівчину, що пасе у своїх мріях стадо козлів, кожен з яких має унікальну зовнішність і характер. Якоїсь миті з'явилися жителі сусіднього селища, які вирішили забрати тварин задля принесення їх у жертву богам. Крім того, чоловіки влаштували пожежу, і дівчина не змогла їм завадити. Зрештою, все виявилося сном.

Наступного дня Елвіс Дін продовжив свою роботу, незважаючи на складнощі. Головна проблема полягає в тому, як ШІ розуміє вимоги користувача. За словами художника, робота з Midjourney схожа на спілкування з собакою, яка намагається, але не завжди розуміє, що ж від неї хоче господар. Як ще одну аналогію він навів імпровізаційний театр, де акторам доводиться розуміти один одного через брак сценарію. Іноді нейромережа дуже прямолінійно сприймає запити, які складно сформулювати інакше.

"Ви ніколи не можете отримати передбачуваний результат, ви не бачите напряму, в якому все розвиватиметься. Ви можете дати опис, який видається ідеальним, але зображення не вийде таким, як ви хотіли", — підкреслив автор коміксу.

Крім того, штучному художнику Midjourney складно даються сцени з рухом, наприклад, вбивство чи втеча — картинка виходить дуже розмитою та неточною. Елвіс Дін припустив, що це пов'язано із забороною на певні слова, на які реагують вбудовані механізми безпеки, що запобігають появі шокуючого чи образливого контенту.

Раніше писали, як ШІ Stable Diffusion осучаснив шедеври світового мистецтва, такі як "Мона Ліза" Леонардо да Вінчі. Художниця використовувала нейромережу, щоб змінити деякі деталі.

Писали також, що ШІ об'єднав відомі картини Ван Гога, Моне, Мунка та Хокусая в одне спільне полотно. Для цього йому довелося домалювати відсутні фрагменти.