Иллюстрация
January 11, 2023

Дрессировка нейросетей

Пока художники ворчат на нейросети, мой сын (софтвер архитерктор) их полюбил всей душой. Он не пытается уговорить нейрочат написать дурных пожеланий врагу, или порнографический роман. Он поговорил с ним о чем-то простеньком, а потом они сели вместе программировать. Говорит, что нейросеть - как обычный сотрудник, который что-то пишет, ошибается, ему говоришь об ошибке, он исправляется. и так далее. Только пишет и переписывает очень быстро, и между этимс не обижается и не огрызается.

А я несколько раз попыталась чего-то добиться от рисующей нейросети, не вышло. Я правда думала - ну, попробую извлечь из нее пользу. Вот, некоторые коллеги говорят, что "по крайней мере можно от нее получить дельные эскизы". Подумала - ну мало ли, я видела местами довольно интересные картинки в исполнении нейросетей. Они были явно не по заказанному сюжету, а просто "загрузили туда много слов и посмотрели, что она выплюнула", но местами встречаются неожиданные и интересные комбинации.

У меня были две задачи, обе я пыталась решить при помощи Midjourney и Dal-e.

Первая: я хотела получить эскиз интересной иллюстрации, где участвует кролик и вода (потому что наступил год водяного кролика, и я хотела что-то такое новогоднее с отсылкой к китайскому гороскопу). И чтобы бам была киса. Потому что какая у меня картинка без кисы. Еще мне привидилось, что может быть было бы интересно нарисовать водопад в орме кролика? Это я и попыталась заказать нейросети: водопад в форме кролика, и кошечка, которая играет с водой.

Для начала я не получила отдельно кошечку и кролика в одной картинке. Ну хоть убей. Я пробовала так и эдак. Сначала запросы про кошку разделяла только запятыми. Потом разновила на разные концы запроса. Сначала - водопад в форме зайца, потом много разных условий, потом в конце - и киса играет с водой. НЕТ. Обе нейросети в 90% случаев нарисовали мне гибрид из кошки и кролика, либо кошку и кролика, слитых воедино в какую-то неприятную форму, вроде неудачных сиамских близнецов. Либо просто кису с кошачьими ушами, оибо кролика с двумя парами ушей - кошачьими и заячьими.

В остальном - попробовала убрать кису - ладно. Попробовала уже убрать все. Просто - нарисуй мне водопад в форме кролика. Ну как угодно. Ну хоть попробуй. Нет. Везде вотопад тут, кролик там, либо самый обычный водопад, и где-то над ним возвышаются зачяьи уши. Как-то эту самую интересмную. часть задачи оно тоже не собиралось решать красиво.

Между тем я попробовала добиться от нейросетки, чтобы она рисовала хоть немного контурами (а не живописно и реалистично). Когда пишешь "комикс" и "манга" она сильно упрощает, "вектор" - тоже. Даже если между этим много пишкшь про детализацию и много мелочей.

Вообще я хочу сказать, что я довольно быстро сообразила, что написание этих промтов - искусство. Пошла нашла сервер "лучшие промты для рисующей нейронки", записалась, и давай смотреть работы. Нашла из примерно ста штук 6 таких, которые были как-то похожи на лайн-арт. Отметила про себя, что линии там так себе - все запутанное и полуабстрактное опять. Ну ладно. Копировала у них все, что только можно. (Там пишут, какие слова сказали нейросети.) Все перепробовала - и много, и мало, и разные слова, имена художников, которые рисуют в нужном стиле, и "studio ghibli" и "Миядзаки". Не очень.

В итоге оно задачу не решило, я сдалась после примерно 20 запросов. Потому что оно даже близко не выруливало куда-нибудь в сторону какого-то результата, который хоть как-то бы мне понравился. Абсолютно все результаты - мимо кассы, по моим ощущениям.

Задание второе: мне привидилась картинка, где черная кошечка и белая лошадка стоят в романтической туманной местности и смотрят вдаль. Я хотела, чтобы они стояли в середине картинки, чтобы по краям, как виньетка, располагался лес или какие-то деревья. В середине чтобы рядом с ними была вода - озеро или река, чтобы они стояли на берегу. Ну и чтобы было красиво. (Я прямо как моя учительница рисования из советской школы пишу уже.)

И что вы думаете. Ничего. Во-первых - оно ровно один раз нарисовало мне черную кошку и белую лошадь. ВСЕ остальное время она рисовала белую кошку и черную лошадь, либо обоих - звухцветными. Например, перед черный, зад вдруг белый. ПОЧЕМУ? Что случилось? Никто хэтот запрос не отменял. И не понятно, как его еще перефлрмулировать. Я уже даже пыталась писать черное и белое по несколько раз, или с восклицательным знаком, или с тремя восклицательными знаками.

Кстати, примерно треть работ и здесь оказались с гибридами из кошки и коня. Ну хоть нав двух третях животные оказались раздельными. И я не понимаю, почему? Почему кошку и кролика оно вообще не в силах нарисовать отдельно, а кошку и лошажь таки умеет нарисовать, как отдельные жва зверя? Формулировала я так же (по-разному, но однозначно: одно животное такое-то делает то, второе делает это). И кстати тут оно пару раз даже нарисовало кошку и лошадь отдельно, несмотря на то, что я написала их рядом.

Но идем дальше. Оно НИ РАЗУ не разместило их в середине. Я так и эдак пробовала = подсматривала у других, писала "симметрия" и "сентральная композиция", и "в центре", и всякое такое. Все время кошак в одном углу картинки, лошадь в другом, часто еще фрагментом и как-то совсем в углу.

Про виньетку: мне виньетку не дали. Ни разу. Вообще. Деревьев кстати не дали тоже. Когда пишешь просто (без животных, без воды, без тумана ТОЛЬКО деревья), оно рисует деревья, в середине. Даже при таких условиях НИКАК не делает деревья по краям, или рамку из деревьев, или обрамление, виньетку или что-то еще из деревьев. Либо только они везде, либо их нет. Точка.

Воду дали три раза из примерно 20 попыток. В остальные попытки просьбу о воде полностью проигнорировали. Т.е. я получила кучу картинок, где просто разные олшади и коты не того цвета раскиданы по разным унлам картинки. Ни одна из них не была хоть как-нибудь красивой или симпатичной. (Я уж думала, что ладно, бог с ней, с моей задумкой, но может просто красивое что-то выдаст?) Нет.

Думаю, что не надо отдельно писать, что кошки везде были уродливыми. Лошадь еще куда ни шло - пока она там силуэтм и не видно глаз и вообще деталей, она местами вполне сносная. Но коты все - уродцы.

В общем вот. На это я тоже потратила около часа. Потом бросила.

Вывод: я нормальный эскиз рисую минут за 40. Это - если картинка сложная, и над деталями надо хорошо подумать. Если совсем трудная картинка, могу и два часа потратить на эскиз. Но после этого там не будет никакой абстрактной размазни, будет решено совершенно четко, что именно где находится, какой оно формы и с какими деталями. И даже если я плохо представляю, что рисовать, за эти 40 минут я переберу несколько вариантов, покручу так и эдак, поменяю пропорции и перспективу, и выберу себе то, что действительно может стать красивой картинкой. Похоже на то, что я задумала. Вот эту вазу я думала поручить нейросетке. Что не отменило бы отрисовки и раскрашивания. Плс, вероятно прибавило бы еще одну фазу: по эскизу от нейросети "уточнить" и додумать, дорисовать нормально все детали, которые у нее только намечены, и как-то криво и нелогично не сходятся. А это - примерно все. Кроме просто больших симметричных фронтальных портретов, на всех картинках с людьми лича и другие части тела поковерканы. Везде, где архитектура - лестницы упимраются в стены, разнообразные балки переползают из одинх этажей в другие, окна не понятно куда ведут, и все разные и.т.д. В общем, такой эскиз еще весь перебрать надо, потом может быть использовать.

Но пока я даже с учетом такого сценария ничего не смогла сделать нормального.

Вопросы к тем, кто уже рисовал нейросетками, или еще лучше - с ними работает (не как художник, а как специалист по ним): что я делаю не так? Есть люди, которые в состоянии получить лучший результат. Не просто про "нарисуй что-то в стиле киберпанк", а именно по ТЗ, как у меня?

Почему я не могу от нее добиться даже того, чтобы оно двух зверей нарисовала по-отдельности, или разместило что-то в середине или по краям?

Какие вы знаете нейросети которые хорошо рисуют? Какие вы знаете места, кроме https://prompthero.com/, где люди не просто публикуют картинки, сделанные нейросетями, но еще и подробно пишут, какими ключевыми словами они это сделали? (Хорошо бы еще, чтобы писали, какой сетью сделали, если это сервис не для одной конкретной сетки.)

А кто-нибудь видел где-то какие-то инструкции, как им писать задания, чтобы вышло что-то более осмысленное? Особенно меня интересует, что нужно написать, чтобы вышло что-то в каком-то конкретном стиле, отличном от того, в котором нарисовано 99% всех картинок.

Меня просто "зло берет", я хочу разобраться, почему у меня там такие плохие результаты. Однако уже сейчас могу сказать, что это выходит вот на что: видимо в какой-то момент можно будет часть рисования (или у кого-то - весь процесс) заменить на вот это сидение и отдавание команд нейросети, и попытки выпросить у нее что-то похожее на свои мечты. Понимаю, что мне проще за это время нарисовать то, что хочется и видится, и на своем же рисунке допилить, чего не хватает. Это - разные процессы. Это как дизайнеры и иллюстраторы - кто-то понял, что ему больше нравится сайты строить, а кто-то - наоборот, хочет только рисовать, все перепробовал, и с рисованием остался.