Дрессировка нейросетей
Пока художники ворчат на нейросети, мой сын (софтвер архитерктор) их полюбил всей душой. Он не пытается уговорить нейрочат написать дурных пожеланий врагу, или порнографический роман. Он поговорил с ним о чем-то простеньком, а потом они сели вместе программировать. Говорит, что нейросеть - как обычный сотрудник, который что-то пишет, ошибается, ему говоришь об ошибке, он исправляется. и так далее. Только пишет и переписывает очень быстро, и между этимс не обижается и не огрызается.
А я несколько раз попыталась чего-то добиться от рисующей нейросети, не вышло. Я правда думала - ну, попробую извлечь из нее пользу. Вот, некоторые коллеги говорят, что "по крайней мере можно от нее получить дельные эскизы". Подумала - ну мало ли, я видела местами довольно интересные картинки в исполнении нейросетей. Они были явно не по заказанному сюжету, а просто "загрузили туда много слов и посмотрели, что она выплюнула", но местами встречаются неожиданные и интересные комбинации.
У меня были две задачи, обе я пыталась решить при помощи Midjourney и Dal-e.
Первая: я хотела получить эскиз интересной иллюстрации, где участвует кролик и вода (потому что наступил год водяного кролика, и я хотела что-то такое новогоднее с отсылкой к китайскому гороскопу). И чтобы бам была киса. Потому что какая у меня картинка без кисы. Еще мне привидилось, что может быть было бы интересно нарисовать водопад в орме кролика? Это я и попыталась заказать нейросети: водопад в форме кролика, и кошечка, которая играет с водой.
Для начала я не получила отдельно кошечку и кролика в одной картинке. Ну хоть убей. Я пробовала так и эдак. Сначала запросы про кошку разделяла только запятыми. Потом разновила на разные концы запроса. Сначала - водопад в форме зайца, потом много разных условий, потом в конце - и киса играет с водой. НЕТ. Обе нейросети в 90% случаев нарисовали мне гибрид из кошки и кролика, либо кошку и кролика, слитых воедино в какую-то неприятную форму, вроде неудачных сиамских близнецов. Либо просто кису с кошачьими ушами, оибо кролика с двумя парами ушей - кошачьими и заячьими.
В остальном - попробовала убрать кису - ладно. Попробовала уже убрать все. Просто - нарисуй мне водопад в форме кролика. Ну как угодно. Ну хоть попробуй. Нет. Везде вотопад тут, кролик там, либо самый обычный водопад, и где-то над ним возвышаются зачяьи уши. Как-то эту самую интересмную. часть задачи оно тоже не собиралось решать красиво.
Между тем я попробовала добиться от нейросетки, чтобы она рисовала хоть немного контурами (а не живописно и реалистично). Когда пишешь "комикс" и "манга" она сильно упрощает, "вектор" - тоже. Даже если между этим много пишкшь про детализацию и много мелочей.
Вообще я хочу сказать, что я довольно быстро сообразила, что написание этих промтов - искусство. Пошла нашла сервер "лучшие промты для рисующей нейронки", записалась, и давай смотреть работы. Нашла из примерно ста штук 6 таких, которые были как-то похожи на лайн-арт. Отметила про себя, что линии там так себе - все запутанное и полуабстрактное опять. Ну ладно. Копировала у них все, что только можно. (Там пишут, какие слова сказали нейросети.) Все перепробовала - и много, и мало, и разные слова, имена художников, которые рисуют в нужном стиле, и "studio ghibli" и "Миядзаки". Не очень.
В итоге оно задачу не решило, я сдалась после примерно 20 запросов. Потому что оно даже близко не выруливало куда-нибудь в сторону какого-то результата, который хоть как-то бы мне понравился. Абсолютно все результаты - мимо кассы, по моим ощущениям.
Задание второе: мне привидилась картинка, где черная кошечка и белая лошадка стоят в романтической туманной местности и смотрят вдаль. Я хотела, чтобы они стояли в середине картинки, чтобы по краям, как виньетка, располагался лес или какие-то деревья. В середине чтобы рядом с ними была вода - озеро или река, чтобы они стояли на берегу. Ну и чтобы было красиво. (Я прямо как моя учительница рисования из советской школы пишу уже.)
И что вы думаете. Ничего. Во-первых - оно ровно один раз нарисовало мне черную кошку и белую лошадь. ВСЕ остальное время она рисовала белую кошку и черную лошадь, либо обоих - звухцветными. Например, перед черный, зад вдруг белый. ПОЧЕМУ? Что случилось? Никто хэтот запрос не отменял. И не понятно, как его еще перефлрмулировать. Я уже даже пыталась писать черное и белое по несколько раз, или с восклицательным знаком, или с тремя восклицательными знаками.
Кстати, примерно треть работ и здесь оказались с гибридами из кошки и коня. Ну хоть нав двух третях животные оказались раздельными. И я не понимаю, почему? Почему кошку и кролика оно вообще не в силах нарисовать отдельно, а кошку и лошажь таки умеет нарисовать, как отдельные жва зверя? Формулировала я так же (по-разному, но однозначно: одно животное такое-то делает то, второе делает это). И кстати тут оно пару раз даже нарисовало кошку и лошадь отдельно, несмотря на то, что я написала их рядом.
Но идем дальше. Оно НИ РАЗУ не разместило их в середине. Я так и эдак пробовала = подсматривала у других, писала "симметрия" и "сентральная композиция", и "в центре", и всякое такое. Все время кошак в одном углу картинки, лошадь в другом, часто еще фрагментом и как-то совсем в углу.
Про виньетку: мне виньетку не дали. Ни разу. Вообще. Деревьев кстати не дали тоже. Когда пишешь просто (без животных, без воды, без тумана ТОЛЬКО деревья), оно рисует деревья, в середине. Даже при таких условиях НИКАК не делает деревья по краям, или рамку из деревьев, или обрамление, виньетку или что-то еще из деревьев. Либо только они везде, либо их нет. Точка.
Воду дали три раза из примерно 20 попыток. В остальные попытки просьбу о воде полностью проигнорировали. Т.е. я получила кучу картинок, где просто разные олшади и коты не того цвета раскиданы по разным унлам картинки. Ни одна из них не была хоть как-нибудь красивой или симпатичной. (Я уж думала, что ладно, бог с ней, с моей задумкой, но может просто красивое что-то выдаст?) Нет.
Думаю, что не надо отдельно писать, что кошки везде были уродливыми. Лошадь еще куда ни шло - пока она там силуэтм и не видно глаз и вообще деталей, она местами вполне сносная. Но коты все - уродцы.
В общем вот. На это я тоже потратила около часа. Потом бросила.
Вывод: я нормальный эскиз рисую минут за 40. Это - если картинка сложная, и над деталями надо хорошо подумать. Если совсем трудная картинка, могу и два часа потратить на эскиз. Но после этого там не будет никакой абстрактной размазни, будет решено совершенно четко, что именно где находится, какой оно формы и с какими деталями. И даже если я плохо представляю, что рисовать, за эти 40 минут я переберу несколько вариантов, покручу так и эдак, поменяю пропорции и перспективу, и выберу себе то, что действительно может стать красивой картинкой. Похоже на то, что я задумала. Вот эту вазу я думала поручить нейросетке. Что не отменило бы отрисовки и раскрашивания. Плс, вероятно прибавило бы еще одну фазу: по эскизу от нейросети "уточнить" и додумать, дорисовать нормально все детали, которые у нее только намечены, и как-то криво и нелогично не сходятся. А это - примерно все. Кроме просто больших симметричных фронтальных портретов, на всех картинках с людьми лича и другие части тела поковерканы. Везде, где архитектура - лестницы упимраются в стены, разнообразные балки переползают из одинх этажей в другие, окна не понятно куда ведут, и все разные и.т.д. В общем, такой эскиз еще весь перебрать надо, потом может быть использовать.
Но пока я даже с учетом такого сценария ничего не смогла сделать нормального.
Вопросы к тем, кто уже рисовал нейросетками, или еще лучше - с ними работает (не как художник, а как специалист по ним): что я делаю не так? Есть люди, которые в состоянии получить лучший результат. Не просто про "нарисуй что-то в стиле киберпанк", а именно по ТЗ, как у меня?
Почему я не могу от нее добиться даже того, чтобы оно двух зверей нарисовала по-отдельности, или разместило что-то в середине или по краям?
Какие вы знаете нейросети которые хорошо рисуют? Какие вы знаете места, кроме https://prompthero.com/, где люди не просто публикуют картинки, сделанные нейросетями, но еще и подробно пишут, какими ключевыми словами они это сделали? (Хорошо бы еще, чтобы писали, какой сетью сделали, если это сервис не для одной конкретной сетки.)
А кто-нибудь видел где-то какие-то инструкции, как им писать задания, чтобы вышло что-то более осмысленное? Особенно меня интересует, что нужно написать, чтобы вышло что-то в каком-то конкретном стиле, отличном от того, в котором нарисовано 99% всех картинок.
Меня просто "зло берет", я хочу разобраться, почему у меня там такие плохие результаты. Однако уже сейчас могу сказать, что это выходит вот на что: видимо в какой-то момент можно будет часть рисования (или у кого-то - весь процесс) заменить на вот это сидение и отдавание команд нейросети, и попытки выпросить у нее что-то похожее на свои мечты. Понимаю, что мне проще за это время нарисовать то, что хочется и видится, и на своем же рисунке допилить, чего не хватает. Это - разные процессы. Это как дизайнеры и иллюстраторы - кто-то понял, что ему больше нравится сайты строить, а кто-то - наоборот, хочет только рисовать, все перепробовал, и с рисованием остался.