Искусственному интеллекту оказалось сложно понять, что от него требует человек, поэтому работа получилась не идеальной.
Канадский художник и продюсер Элвис Дин использовал нейросеть Midjourney для создания комикса. Своим опытом он поделился в ролике на YouTube.
Midjourney — это сервис на базе искусственного интеллекта, который создает изображения по текстовому описанию от пользователя. Автор оформил подписку за $10 в месяц, ожидая, что уложится в 200 попыток, но этого оказалось мало, и он заплатил еще $30 за безлимитный тариф.
Поначалу Элвис Дин пытался ограничиться только текстовым описанием внешности персонажей, но они каждый раз получались разными, тогда он изменил подход и взял в качестве прообраза актеров. Дело в том, что Midjourney, как и другие подобные нейросети, обучалась на изображениях из Интернета, и использует их во время работы. С актерами дело пошло проще, и персонажи оставались похожими на самих себя в разных ситуациях и позах. Затем появилась идея и сюжет комикса под названием "Козлы", позднее опубликованного на сайте WebToon.
Спустя несколько часов Элвис Дин при помощи Midjourney нарисовал изображения для первых 10 страниц и собрал их в комикс при помощи специальной программы. Сюжет повествует о девушке, пасущей в своих мечтах стадо козлов, каждый из которых обладает уникальной внешностью и характером. В какой-то момент появились жители соседнего поселка, которые решили забрать животных ради принесения их в жертву богам. Вдобавок, мужчины устроили пожар, и девушка не смогла им помешать. В конце концов все оказалось сном.
На следующий день Элвис Дин продолжил свою работу, несмотря на сложности. Главная проблема заключается в том, как ИИ понимает требования пользователя. По словам художника, работа с Midjourney похожа на общение с собакой, которая пытается, но не всегда понимает, что же от нее хочет хозяин. В качестве еще одной аналогии он привел импровизационный театр, где актерам приходится понимать друг друга за неимением сценария. Иногда нейросеть слишком прямолинейно воспринимает запросы, которые сложно сформулировать иначе.
"Вы никогда не можете получить предсказуемый результат, вы не видите направление, в котором все будет развиваться. Вы можете дать описание, которые кажется идеальным, но изображение не получится таким, как вы хотели", — подчеркнул автор комикса.
Кроме того, искусственному художнику Midjourney сложно даются сцены с движением, например, убийство или побег — картинка получается очень смазанной и неточной. Элвис Дин предположил, что это связано с запретом на определенные слова, на которые реагируют встроенные механизмы безопасности, предотвращающие появление шокирующего или оскорбительного контента.
Ранее писали, как ИИ Stable Diffusion осовременила шедевры мирового искусства, такие как "Мона Лиза" Леонардо да Винчи. Художница использовала нейросеть, чтобы изменить некоторые детали.
Писали также, что ИИ объединил известные картины Ван Гога, Моне, Мунка и Хокусая в одно общее полотно. Для этого ему пришлось дорисовать недостающие фрагменты.