Блог
Искуственный интеллект

Вышла Midjourney v5: нейросеть теперь создает фотореалистичные картинки

Midjourney представили новую версию своей нейросети - уже пятую по счету. Обновленная модель теперь намного эффективнее в генерации фотореалистичных изображений.

Новая модель v5 представляет собой инновационную нейронную архитектуру, совмещенную с передовыми технологиями создания стилей и эстетики. Разработка последней версии Midjourney заняла целых пять месяцев, что было объявлено командой разработчиков на официальном дискорд-сервере проекта.

В настоящее время ведется альфа-тестирование пятого поколения. Разработчики сообщают, что возможны значительные изменения в нейросети перед ее полноценным выпуском. Тем не менее, пользователи уже могут наслаждаться ее генерацией. Мы провели обстоятельное тестирование модели и хотим поделиться с вами тем, что в ней появилось нового.

Что такое Midjourney и почему нейросеть настолько популярна

Midjourney - это уникальная платформа, позволяющая генерировать потрясающие картинки всего лишь на основе текстового описания. Ее результаты настолько реалистичны, что их можно легко спутать с искусством, созданным самими людьми. В отличие от своих конкурентов, таких как Dall-E и Stable Diffusion, Midjourney обладает значительными преимуществами. Например, доступ к Dall-E закрыт для публичного использования, а для работы с Stable Diffusion требуется мощный компьютер. Однако Midjourney отличается своей простотой и доступностью. Эта платформа позволяет создавать прекрасные изображения всего лишь с помощью простых запросов, в то время как в случае с Stable Diffusion потребуется много времени и тщательно подобранные модели и промпты, чтобы получить аналогичные результаты. Более того, Midjourney предлагает огромное количество настроек, таких как уровень детализации и соотношение сторон, что позволяет пользователям иметь полный контроль над своими результатами. Если вы интересуетесь использованием этой нейросети, мы рекомендуем ознакомиться с подробным гайдом, где мы детально рассказываем о ее использовании. Бесплатная версия Midjourney предлагает 25 попыток, что более чем достаточно для создания десятка высококачественных изображений. Однако, существует возможность расширить эти ограничения, выбрав платную подписку. К сожалению, оплата российской банковской картой недоступна. Альтернативным вариантом является создание новых аккаунтов в Discord, но имейте в виду, что это может сопряжено с риском быть забаненным.

Как включить Midjourneyv5

По умолчанию Midjourney все еще в настоящее время использует четвертую версию своей нейросети. Однако, для активации пятой версии предусмотрены два способа:

Введите команду /settings в текстовом поле приложения "Дискорд" и выберите опцию MJ, затем нажмите кнопку "Ввод". В настройках, которые откроются, выберите MJ версии 5. При генерации изображения добавьте к текстовому запросу --v 5.

При переходе на пятую версию Midjourney возможны некоторые ограничения в функционале, на которые пользователи были привыкли в предыдущих версиях. Например, популярная опция -niji для создания аниме может быть недоступна. Кроме того, необходимо учесть, что текстовые запросы могут требовать адаптации, так как не все имеют такое же функционирование, как прежде.
Как составлять запросы к Midjourney, Stable Diffusion и другим нейросетям

Как богатеть

Получайте главные публикации, которые раскрывают влияние на вашу финансовую ситуацию и жизнь, прямо в ваш почтовый ящик по средам и субботам. Абсолютно бесплатно.

Что изменилось в Midjourneyv5

Вот что сильно изменилось всравнении счетвертой версией.

Визуальные стили. В пятой версии алгоритма нейросети наблюдается значительное расширение визуального диапазона, что дает возможность еще точнее удовлетворять потребности пользователей. Важно упоминать имя художника или стиль ваших предпочтений, чтобы подчеркнуть необходимость определенной визуальной концепции. Если такие указания отсутствуют, искусственный интеллект будет ориентироваться на создание фотореалистичных изображений по умолчанию.

Наша команда работала над проблемой качества и разрешения и в результате мы смогли улучшить их в два раза. Теперь ваши картинки будут генерироваться сразу в высоком качестве, без необходимости вручную апскейливать каждое изображение и ждать его обработки. Мы добавили специальную кнопку Upscale, которая мгновенно открывает увеличенную картинку, делая процесс еще более удобным и быстрым для вас.

Мастерская деталей. Нейросеть проявляет большую точность в обработке дробных деталей. К примеру, она безупречно создает пять пальцев на каждой руке, исключая возможность появления чрезмерно ровных зубов. Однако разработчики также сообщили о захватывающем совершенствовании в области детализации лиц.
Раскройте потенциал вашей фотографии с помощью передовой технологии нейросети Midjourney! Теперь вы можете создавать уникальные и стильные аватарки в любом желаемом стиле. Однако разработчики этой уникальной платформы предупреждают, что короткие запросы в пару слов могут не давать такие потрясающие результаты, как раньше. Именно поэтому настоятельно рекомендуется придумывать длинные и детальные продуманные промпты. Воплощайте ваши самые смелые и оригинальные идеи и позвольте нейросети Midjourney вдохнуть жизнь в ваши фотографии!

Для получения более предсказуемых результатов рекомендуется формулировать запросы в виде предложений, а не перечислений. Например, вместо фразы "астронавт, летит, открытый космос" лучше использовать конструкцию "астронавт, который летит в открытом космосе".

Примеры Midjourneyv5

Существует явная разница между сценариями, в которых нейросеть попыталась создать реальность, особенно в фотографиях, пейзажах и интерьерах. В пятой версии мы видим значительное улучшение в генерации образов людей, особенно знаменитостей и персонажей поп-культуры. Отличительная особенность этой версии заключается в том, что если мы напишем "Илон Маск играет в гольф", то немедленно узнаем основателя Tesla. Кроме того, правильное количество пальцев и зубов также придает созданным образам реалистичность.

Midjourney также освоила навык профессионального рисования изображений с обилием персонажей. Предыдущая нейросеть не могла справиться с изображениями, на которых присутствовало несколько людей. Сегодня артефакты все еще присутствуют, однако они уже значительно заметны только на заднем плане изображения.

Для наглядного представления отличий, мы создали изображения на основе одинаковых запросов в четвертой и пятой версии Midjourney. На левой стороне представлены результаты в версии v4, а на правой - в версии v5.
Девушка в киберпанк-городе
Фото из оживленного московского метро
Пожилая женщина проводит время с ретривером в парке
Девушки на вечеринке, фото на «Полароид»
Киберпанк-город
Илон Маск играет в гольф

Какие функции добавили в Midjourneyv5

В течение экспериментального периода разработчики успешно интегрировали три новых функции в систему, однако они отметили, что возможны некоторые неполадки в их работе.

Поддержка бесшовных картинок. Для генерации текстуры в конце запроса нужно добавить ⁠-⁠⁠-⁠tile.

Данная функция не эффективно обрабатывает реалистичные изображения, однако отлично создает простые рисунки, подходящие для фона и текстуры.
Неудачная генерация летающих денег и удачная генерация рыбок

Независимо от выбранного формата отображения, при использовании Midjourney версии 4, было возможно настроить соотношение сторон от 1:2 до 2:1. В пятой версии, однако, вы получаете еще больше гибкости - теперь вы можете генерировать изображения с любым желаемым соотношением сторон, даже с таким экстравагантным, как 1:100.

Благодаря такой опции нейросеть неплохо справляется с панорамами и 360⁠-⁠градусными фотографиями.
Панорама смосковскими панельками

В пятой версии программы «Весы» была добавлена новая функция, которая позволяет пользователю настраивать степень сходства генерируемого изображения с референсом. Для этого необходимо указать значение параметра ⁠-⁠⁠-⁠iw в конце команды. Диапазон возможных значений составляет от 0,5 до 2, причем значение по умолчанию равно 1. С помощью этой функции пользователь сможет точно контролировать результаты генерации изображений и достигать желаемого эффекта.

Для создания картинки, которая будет менее похожа на исходное изображение, можно воспользоваться параметром --iw 0.5. Если же вы стремитесь достичь противоположного результата, попробуйте задать значение --iw 2.