Блог
Искуственный интеллект

Как я полюбил Midjourney и теперь делаю картинки, которые расходятся по всему интернету

Цифровой художник превращает «Бригаду» ваниме, а «Простоквашино»— в американский ситком.

Десяток проектов со сгенерированными нейросетями картинками уже увидел свет благодаря его труду. Подписчики канала Доброкотова Ai Molodca достигли 17 тысяч, но его работы часто можно встретить в популярных пабликах, соцсетях, СМИ и вообще повсюду на просторах рунета. Этот талантливый художник большую часть своих изображений создает с помощью Midjourney. Для работы с нейросетью не требуются навыки программирования или глубокие знания, но для достижения признаваемого стиля требуется значительное время и усилия в поиске подходящих запросов.

Недавно мы беседовали с Александром Доброкотовым, который поделился своим уникальным опытом в области нейросетей и создании оригинального метода генерации изображений, который активно используют другие ИИ-художники. А это лишь подчеркивает необходимость нашего всего общества в близком знакомстве и дружбе с этими инновационными нейросетями.

УЧЕБНИК Т⁠—⁠ЖH3: Новинка: курс отом, как получить права

За счёт бесплатного курса вы сможете приобрести навыки, необходимые для успешного управления автомобилем как на учебной площадке, так и на дороге. Подробную программу можно ознакомиться ниже.

Как я познакомился с нейросетями

В моем роли креативного директора в ведущем рекламном агентстве DADA, я энергично руковожу командой, стремясь к созданию такой рекламы, которая вызывает положительные эмоции у людей. Более того, в свободное время я всегда находил время для своих творческих проектов: иллюстрации, блогов, видео и арт-пабликов.
Реализация всегда претерпевала изменения, так как для меня суть идеи всегда превышала форму. Однако, сейчас мы наступили на порог нового эпохального периода креативности: нейросети предоставили абсолютно идеальный инструмент для того, чтобы воплощать идеи в любой форме.

Работа в сфере рекламы требует быть в курсе последних тенденций и технологий. Поэтому еще в 2015 году, при выпуске DeepDream компанией Google, я увлекся превращением обычных изображений в удивительные сюрреалистические фракталы с помощью их сервиса. Однако со временем я ушел от нейросетей и не обращал на них внимание в течение нескольких лет, лишь периодически просматривая информацию о новинках в этой области.
Пример работы DeepDream

В начале 2022 года я стал свидетелем удивительных достижений в телеграм-канале Denis Sexy IT. Там я смог увидеть удивительные произведения искусства, сотворенные благодаря технологии Dall-E от компании OpenAI. Эта инновационная нейросеть обладает уникальной способностью "рисовать" высококачественные изображения по текстовому описанию.

В то время использование нейросети было невозможно, так как она находилась в закрытой бета-версии. Тем не менее, даже презентация ее возможностей, таких как преобразование текста "avocado armchair" в "авокадное кресло", выглядела как настоящая волшебная сила.
Авокадное кресло вDall-E

Понятие о том, что картиночные нейросети произведут настоящую революцию в мире интернета, стало очевидным. Однако, я никак не ожидал, что это произойдет настолько быстро. В апреле появилась и быстро распространившаяся модель Dall-E mini, способная создавать девять изображений, которые, хотя и имели некоторые ограничения в качестве, всё же были легко узнаваемыми.

Возникшая потребность в доступности и низком качестве вполне нашла свое признание в интернет-сообществе. Люди активно начали экспериментировать, создавая абсурдные и, казалось бы, невозможные сочетания, такие как Саурон с газетой, пицца в посудомоечной машине или даже Карл Маркс на церемонии вручения премии MTV. Именно здесь и появился наш популярный канал, предназначенный для публикации уникальных экспериментов и овладения искусством создания текстовых команд для нейросетей - промптинг.
Летом 2022 года я получил возможность познакомиться с второй версией Midjourney. Этот продукт находился только в закрытом бета-тестировании и был известен лишь небольшому числу энтузиастов. Качество этой версии, мягко говоря, было далеко от уровня, который представляет пятое поколение продукта, но нельзя отрицать, что оно было впечатляющим для своего времени.

Представленная пятая версия Midjourney способна создавать удивительно гиперреалистичные изображения, которые с трудом отличить от настоящих фотографий.

Меня вдохновили возможности искусственной нейронной сети, и я с радостью решился на свой первый творческий проект – преобразовать обычный бургер в произведение искусства, вдохновленное стилем известных художников, таких как Винсент Ван Гог, Иван Шишкин, Рене Магрит и другие. Серия изображений, созданных мной, была разослана среди пабликов и привлекла внимание СМИ.

С третьей версией Midjourney подборка "Нейропанельки" стала настоящим хитом. В процессе тестирования я представил, как могли бы выглядеть дома в различных стилях, включая не только художественные. Были созданы пиксельные, вафельные, шоколадные, киберпанковые и даже адские панельки. Моя работа не осталась незамеченной, и о ней написали РБК и даже известный англоязычный развлекательный сайт BoredPanda.

Почему из всех нейросетей я выбрал Midjourney

Midjourney и Stable Diffusion являются двумя ведущими сервисами по генерации картинок. Midjourney отличается удобством использования, в то время как Stable Diffusion предлагает широкий спектр возможностей настройки и является бесплатным.

Midjourney, благодаря своему низкому порогу входа и постоянному повышению качества, семимильными шагами превратилась в настоящий феномен. Конечно же, за это частично отвечают талантливые авторы контента. Как только креативщик-трендсеттер создает вирусный прикол и попадает в заголовки новостей с названием "Midjourney показала...", люди видят это и безоговорочно хотят оказаться на его волне. И так рост продолжается экспоненциально. Даже сейчас, когда время бесплатных возможностей заканчивается, порог входа в Midjourney становится все сложнее, однако этот медийный поезд непрерывно движется вперед и ничто не может его остановить.

Я был счастлив получить доступ к закрытой бете модели Stable Diffusion 1.4 в то же время, когда Midjourney стала популярной. Я был в чате энтузиастов канала "Нейроэстетика" и разделял восхищение всеми остальными. В то время Midjourney, главным образом, предлагала высокий уровень абстракции, но также ограничивала возможности для тестирования.

Узнайте, как использовать нейросеть Stable Diffusion без необходимости программирования.
Stable Diffusion has always been a free platform with plenty of customizable options. Today, it has evolved into a powerful open-source model that can meet all your visual needs with just a little magic. Train the neural network to mimic a certain style or object, stylize videos and create animations, retouch images, pose subjects, and even integrate its generating capabilities into popular software like "Photoshop" or "Figma" - all made possible by a multitude of plugins developed by talented enthusiasts.

Однако, существует одно препятствие - сложность входа. Непонятно, как двигаться вперед и какие кнопки нажимать. О системе Stable Diffusion пишут повсюду, но нигде не объясняют, как ею пользоваться. Весь необходимый инструментарий доступен только через интерфейс Automatic1111 и его аналоги. Но для новичка, который ждет кнопку "Сделать красиво", потребуется немало усилий, чтобы добраться туда и изучить все нюансы.

Если говорить о сравнении двух нейросетей, то Midjourney можно сравнить с Mac, а Stable Diffusion с Linux.

У Midjourney все просто и удобно. Вам лишь необходимо пройти регистрацию в Discord и ознакомиться с системой каналов. Все общение происходит в общих чатах, и если возникают вопросы, всегда можно взглянуть на то, что создают другие участники сообщества. Единственным сложным моментом может быть оплата из России.

Таким образом, Midjourney предлагает кнопку "Сделать красиво", которая делает процесс промптинга еще более простым и удобным. С помощью этой функции нейросеть автоматически создает изображение с различными украшательствами, при этом исключая возможность получить неэстетичный результат, даже при специально заданных параметрах. Даже простые запросы, состоящие из нескольких слов, проходят обработку на высоком уровне качества благодаря Midjourney и его способности создавать прекрасные и вдохновляющие изображения.

У Stable Diffusion представляет собой абсолютно новую концепцию. Получить качественный результат с простыми запросами и базовой моделью становится проблематично. Чтобы достичь желаемых результатов, приходится использовать дополнительные модели, специализированные на фотореализме, либо вносить коррективы в промпты.
В моем творческом пути большую часть проектов я успешно воплотил с помощью Midjourney, ведь она отвечает самым высоким стандартам качества и оперативности. Однако, в некоторых случаях я предпочитаю воспользоваться гибкостью Stable Diffusion.

Обучение является одной из моих любимых функций нейросети. Я уже несколько раз проводил тренировку, используя свои фотографии, кулинарные эксперименты и ЖЭК-арт. Это позволяет мне открыть бесконечные возможности для экспериментов и создания в стиле Клода Моне самых удивительных и оригинальных работ.

Как обучить Stable Diffusion

Обучиться Stable Diffusion не представляется слишком сложным, хотя имеется некоторая нюансность. Мы все знакомы с процессом обучения, который включает в себя использование приложения Lensa для создания персонализированных аватарок. Существует два пути, которые можно выбрать:

* Первый — через интерфейс Automatic1111. Этот вариант предоставляется бесплатно, но в то же время он достаточно сложный. Потребуется мощный компьютер или Google Collab. Интернет предлагает множество обучающих материалов, которые могут быть вам полезны.

* Второй путь — через сервис Astria. Здесь все предельно просто, но услуга является платной. За небольшую сумму вы сможете обучить Stable Diffusion, получить модель и загрузить ее в Automatic1111 или любой другой удобный интерфейс. Для оплаты необходима международная банковская карта.

Dall-E 2 исходно представляла собой потенциального конкурента для двух ведущих нейросетей. Она впереди времени появилась на сцене еще до того, как Midjourney и Stable Diffusion стали широко обсуждаться, и их способности в генерации она опередила. Тем не менее, несмотря на это, модель проиграла в маркетинговой гонке. Она провела слишком много времени в режиме закрытого тестирования и упустила свой шанс привлечь внимание широкой аудитории, как это сделали Midjourney и Stable Diffusion. В связи с этим, количество упоминаний о Dall-E 2 гораздо меньше, по сравнению с Midjourney и Stable Diffusion, хотя она также обладает высоким потенциалом, особенно благодаря функции Outpainting.

Модель, созданная Microsoft, внедрена во все сервисы компании. Например, в Bing с использованием Dall-E 2 генерируются картинки.

Мы провели тестирование нейросети ИИ-поисковика Bing от Microsoft, чтобы понять, какие возможности она предоставляет.

Как я нашел свой стиль

Я прошел детство в эпоху 90-х, когда западные тренды проникали в нашу советскую реальность. В результате этого, в моем внутреннем мире сочетаются элементы панельных домов, рушащиеся ковры и так называемые "гопники", с французской новой волной кино, захватывающим аниме и неподражаемым Арнольдом Шварценеггером. Эта необычная мозаика культурных влияний явно отражается в моем творческом работе.

Средство Midjourney, начиная с его четвертой версии, предоставляет возможность сочетать различные образы и стили путем объединения нескольких изображений. На моем канале даже можно найти рубрику "мешалка", где я создаю необычные комбинации, например, смешиваю котов с хлебом, Гигачаду с Шреком или даже соединяю сыр с колбасой. Несмотря на то, что получаются забавные результаты, этот инструмент является потрясающим. Он олицетворяет сущность креативности на основном уровне: объединять то, что никто ранее не соединял.
Часто мне приходится использовать визуальные образы в качестве источника вдохновения, поскольку в наборе данных Midjourney, разумеется, отсутствуют персонажи советской и постсоветской поп-культуры. Западные мемы и известности создаются с легкостью, но нарисовать по текстовому запросу, например, Якубовича или голубя из покрышек, просто невозможно.

Ностальгия – могучий и эффективный инструмент. В наше время бури и тревоги, каждому из нас особенно сильно присуще желание вернуться к знакомому и уютному. Узнаваемые символы всегда были востребованы, но, по моему мнению, сегодня существует особый спрос на них.
У нас есть множество креативных методик для генерации идей, и я рад поделиться с вами одной из них. Эта простая техника называется 3B и включает в себя три места: ванная комната, ванна и кровать. В этих местах, где обычно мы скучаем и не имеем внешних стимулов, наш мозг начинает работать на пассиве, соединяя различные концепции, образы и идеи. Именно здесь рождаются новые идеи. Так что не стесняйтесь скучать - это действительно продуктивно. Но помните, что лучше оставить телефон в стороне, чтобы не отвлекаться.

На осуществление каждого проекта требуется примерно четыре дня, однако это может варьироваться в зависимости от сложности идеи. Самым вызывающим значительные трудности оказался проект "Простоквашино" в ситком-стиле. Ранее я преобразовывал сериалы с живыми актерами в аниме, но в данном случае я должен был сделать наоборот: создать реалистичное шоу в стиле 80-х, основанное на мультфильме.
«Простоквашино» в стиле американского ситкома

В отличие от компании Stable Diffusion, Midjourney представляет собой сложную платформу, которая требует особого контроля. Однако, есть надежный подход к направлению нейросети - использование скетчей. В индустрии кино и игр активно используется создание концепт-артов. Midjourney позволяет точно так же генерировать персонажей, одежду и сетапы, которые могут быть использованы в качестве референсов.

Как генерировать по методу глубокого референса

Метод глубокого референса открывает новые возможности в создании уникальных персонажей для Midjourney. Его использование просто. Вам всего лишь нужно взять изображение героя и вставить ссылку в Midjourney, чтобы оно стало отправной точкой для запроса. После этого, добавьте описание картинки в вашем запросе. Например, если на изображении герой сидит на берегу реки, просто напишите: "Мужчина сидит у реки". Вы можете описывать его внешний вид, одежду и другие важные детали, чтобы создать нужный образ. Затем выберите понравившееся изображение и увеличьте его разрешение. Добавьте это изображение, а также оригинальное изображение и текст промпта в новый запрос. Запустите генерацию еще раз. Постепенно уточняйте детали в текстовом запросе до достижения желаемого результат. Если вам интересно узнать больше о использовании этого метода с примерами, вы можете посмотреть мой ролик на YouTube.

Даже при использовании глубокого референсирования возникают сложности. Например, чтобы получить картинку аниме-Парфенова, потребовалось провести 50 итераций. Мне нужны были зеленые шкафы, которые были показаны в шоу «Намедни» на НТВ, но Midjourney покрасила все вокруг в зеленый цвет: одежду, лицо, волосы. Единственный способ решить эту проблему - метод проб и ошибок.
Для каждого моего проекта создается от 200 до 400 различных изображений, причем на каждую отдельную картинку требуется от 20 до 50 повторных изменений. Я тщательно подбираю каждое изображение, не останавливаясь на приемлемом варианте, но всегда стремлюсь достичь совершенства.

При работе в программе «Фотошоп» я стараюсь не добавлять ничего лишнего, но время от времени такие моменты случаются. Например, при создании проекта «Тайна третьей планеты» в стиле «Звездных войн», я столкнулся с трудностями в создании каноничного образа Громозеки. Нейросеть не могла представить себе создание существа, сочетающего в себе черты и слона, и осьминога. В итоге мне пришлось добавлять недостающие руки самостоятельно.

У подписчиков в тематическом челлендже тоже не получилось: Громозеки просто невозможно добиться от Midjourney.
«Тайна третьей планеты» в стиле «Звездных войн»

Что будет дальше

Мы встречаем новую эру искусственного интеллекта с ошеломляющей скоростью, и она пропитана абсолютно разными перспективами. Одной из них является эра "постправды", когда текстовые фейковые новости уже не являются единственной проблемой. Теперь мы сталкиваемся с появлением генеративных фото, столь реалистичных, что сложно отличить их от реальных: так, например, папа римский появляется на фото в пуховике Balenciaga. Ко всему этому добавляется доступность технологий клонирования голоса, создания дипфейков и влияние людей с неоднозначными намерениями.

В то время как пользователи продолжают шутить и создавать прикольные контенты, кажется, что рано или поздно мы столкнемся с неприятным инцидентом, связанным с использованием генеративного контента. Это может привести к возникновению движения, требующего маркировки всего искусственного интеллекта в интернете.

Узнайте, как использовать генеративную заливку в программе "Фотошоп", чтобы дополнять и дорисовывать изображения при помощи нейросети.

Сегодня всё чаще становится сложно отличить реальность от вымысла. Недавно я решил продвигать свой канал, разместив рекламу на щите в Урюпинске. Однако некоторые мои подписчики почему-то подумали, что это всего лишь фейк. Чуть ли не мои фоловеры лично пришли к щиту, чтобы запечатлеться рядом с ним. А в ответ им было сказано: "Да, и это тоже фейк, созданный на основе запроса 'девушка пред стендом с фиолетовыми волосами'".
Реклама моего канала набилборде вУрюпинске

В данной отрасли развитие правовых норм происходит медленно, подобно черепахе, которая пытается догнать зайца, однако уже наметился определенный тренд. Недавно компания Stability AI столкнулась с судебными исками из-за использования контента для обучения без согласия правообладателей. С другой стороны, Adobe активно движется в направлении "экологичности", осуществляя обучение своей системы Firefly с согласия авторов и компенсируя им роялти.

Мне было бы приятно, если бы я стал известным иллюстратором, и мои работы бы попали в датасеты, а в результате генерации картинок появлялись бы промпты с моим именем вместо Грега Рутковски. Однако, важно и правильно, когда есть возможность выбора: использовать мои работы для обучения или нет. Эта проблема особенно актуальна на корпоративном уровне. Если речь идет о Stable Diffusion и других открытых моделях, то их можно обучать на любых данных, даже на надписях в подъездах. Однако стиль концепт-художника Грега Рутковски так популярен в генерациях, что при поиске его работ в Интернете чаще встречаются сгенерированные картинки в его стиле, а не оригинальные работы.

Прогресс картинных нейросетей не замедляет свое развитие и почти достиг своего пика. Удивительная реалистичность Midjourney и возможность полного контроля с помощью Stable Diffusion просто поражают воображение. Однако, для массовой аудитории все еще существуют трудности в использовании их возможностей. Поэтому, на данный момент, важными становятся интерфейсы, которые были бы более удобными и дружелюбными для пользователей, а также интеграции с уже существующими и привычными экосистемами, как это делают лидеры рынка Adobe с Firefly и Google с текстовыми моделями.

Год 2023 грядущий будет отмечен стремительным прогрессом генеративного видео и трехмерных моделей, подобным тому, что происходило с изображениями в предыдущем году.

Многие переживают, что нейросети заменят людей. Ноэто врядли случится.

Здесь можно ожидать появления новой тенденции: если вы не используете искусственный интеллект, то рискуете уступить конкуренту, который владеет нейронными сетями.

Если талантливый художник создает масляными картины для самоутверждения, значит ему необходимо неизбежное изучение своего искусства и последующее совершенствование своих навыков в счастливой гармонии. Однако, если вы выбрали деловую стезю и продолжаете творить в коммерческой сфере, будь то иллюстрации, копирайтинг или креативное направление, умение использовать искусственный интеллект и взаимодействовать с нейросетями будет вашим громадным конкурентным преимуществом.

В нашей работе мы постоянно воспользуемся возможностями и преимуществами нейронных сетей. Мы используем их для создания сторибордов, раскадровок, презентаций, дизайна и текстов. В прошлом году мы начали вести социальные сети бренда Epica с использованием нейросетей, и теперь мы открыли специальный отдел, который занимается разработкой проектов и продуктов на основе искусственного интеллекта. Владение ИИ - это уже новая норма. Капитализм ясно показывает, что эффективность становится преимуществом для специалистов. Не нужно бояться, нужно только учиться и развиваться.

Мы наступаем на порог новой эры, где оригинальность, идеи и концепции играют решающую роль. Значимость внешнего облика постепенно теряет свою силу, так как с помощью искусственного интеллекта каждый может создать такое же визуальное оформление. Однако, растет важность индивидуального концептуального мышления и эмоционального интеллекта.

Как использовать нейросетевых ботов ChatGPT и Midjourney в Telegram — и стоит ли вообще это делать.

Представьте себе фильм, где потрясающая графика сливается с захватывающим сюжетом и увлекательными персонажами. Каждая сцена оживает перед вашими глазами, сохраняя ваш интерес на протяжении всего фильма. Вам не придется беспокоиться о том, что вам быстро надоест – этот фильм обладает великолепной креативностью и концептуальным мышлением. Подобные навыки будут самыми ценными в будущем, вместе с умением быстро обучаться, не ограничиваясь старыми знаниями.