Блог
Искуственный интеллект

Как пользоваться нейросетью Stable Diffusion без навыков программирования

Stable Diffusion— одна из самых продвинутых нейросетей для генерации изображений.

В августе 2022 года была выпущена публичная версия программы от группы Stability AI. С помощью нейросети теперь возможно генерировать высококачественные изображения по текстовому запросу. Кроме того, программа способна дорисовывать наброски и вносить свои изменения в картинки-референсы. И самое привлекательное в этом всем - программа абсолютно бесплатна и доступна для скачивания с открытым исходным кодом, позволяя установить Stable Diffusion на свой компьютер и использовать собственные вычислительные мощности.

У любой монеты есть и другая сторона: не все гаджеты соответствуют системным требованиям, а для использования полноценной версии Stable Diffusion требуются навыки программирования. Тем не менее, энтузиасты уже поработали над несколькими вариантами, которые включают в себя сайты, приложения, боты и программы. Теперь каждый может узнать, что делает Stable Diffusion таким уникальным и как можно попробовать эту нейросеть даже без владения программированием.

Что вы узнаете

  • Возможности, предоставляемые Stable Diffusion
  • Собственные опыты с использованием Stable Diffusion
  • Удобные способы генерации через веб-сайт или мобильное приложение Stable Diffusion
  • Эффективная генерация с использованием ПК при помощи Stable Diffusion
  • Как правильно формулировать запросы в Stable Diffusion

УЧЕБНИК Т⁠—⁠ЖH3: Новинка: курс о том, как получить права

Получите возможность овладеть знаниями и навыками, которые сделают вас уверенным водителем как во время обучения в автошколе, так и на дороге. Ознакомьтесь с программой курса, абсолютно бесплатным для вас.

🎨 Что можно делать в Stable Diffusion

Создание уникальных изображений основывается на принципе скрытой диффузии, что делает Stable Diffusion предпочтительным выбором среди других конкурирующих нейросетей. В отличие от стандартной диффузионной модели, она представляет основу для работы современных нейросетей, которые способны воспроизводить изображения по текстовому описанию.

Современные модели искусственных нейронных сетей, такие как DALL-E 2 и Midjourney, имеют определенные ограничения, такие как работа с отдельными пикселями, что требует значительного времени и вычислительных ресурсов для создания изображений. Однако Stable Diffusion предлагает инновационный подход, позволяющий значительно сократить время и использование вычислительной мощности. Вместо работы с пикселями, Stable Diffusion оперирует с их сжатыми версиями, что позволяет значительно повысить эффективность процесса создания картинок.

Уникальной методологией обучения, базирующейся на нейронных сетях, добились значительных результатов в создании картинок. После того, как нейросеть была обучена на базе данных, в которой каждое изображение было связано с детальным описанием, Stable Diffusion была в состоянии изучить ассоциации, определяющие взаимное расположение пикселей. Даже изначально «шумные» пиксели не препятствовали нейросети постепенно генерировать впечатляющие изображения.

Как создать и распознать фальшивую личность в онлайн-мире, чтобы обеспечить себе анонимность

Возможности современных технологий не перестают удивлять нас. Благодаря быстрым инновациям в области компьютеров и мобильных устройств, наша жизнь стала намного комфортнее и удобнее. Сегодня мы можем делать покупки из дома, общаться с людьми по всему миру и получать доступ к огромному объему информации всего за несколько кликов. Вместе с этим, интернет развивается и предоставляет нам новые возможности, к которым еще недавно мы не имели доступа.
Описание работы Stable Diffusion. Источник: paepper.com

Stable Diffusion, эксперт в области художественного творчества, позволяет вам использовать вдохновение от настоящих мастеров. Благодаря широкому знанию стилей художников, наш сервис способен воссоздать изображение в неповторимом стиле любого художественного периода — от эпохи Возрождения до современных авторов, работающих в жанре концептуального искусства в видеоиграх. Теперь вы можете создать картину, объединяющую образы, вдохновленные Ван Гогом и творчеством NFT-артиста Beeple.

Однако, возникает основная проблема: при обучении нейросети использовалось множество артов без получения разрешения от их авторов. Это затрагивает как известных художников, так и любительские работы с популярных сайтов Pinterest и DeviantArt, которые были обнаружены при анализе набора данных. Даже появился интернет-ресурс под названием "Have I Been Trained", который позволяет узнать, были ли использованы ваши работы в обучении проектов Stable Diffusion или Midjourney.

Например, пользователи платформы Stable Diffusion предпочитают генерировать изображения в стиле известного польского художника Грега Рутковски, чьи фэнтези-арты стали популярными в мире видеоигр. Имя Рутковски упоминается более 93 тысяч раз в поисковых запросах пользователей. Однако, при попытке найти работы самого художника, чаще всего мы сталкиваемся с сгенерированными в его стиле картинками, а не с оригинальными произведениями искусства.
Работа Грега Рутковски. Источник: technologyreview.com
На страницах technologyreview.com можно найти потрясающие и вдохновляющие картины, созданные благодаря использованию метода Stable Diffusion и воплощенные в стиле неподражаемого Грега Рутковски. Эти произведения искусства не только вызывают восхищение своей эстетикой, но и являются примером передовых достижений в сфере технологий.

Создание ассетов для игр достигло нового уровня благодаря возможности пользователей сети интегрировать нейросеть в игровой движок Unreal Engine. Теперь игроки могут генерировать внутриигровые предметы всего лишь по описанию и без затрат времени мгновенно размещать их в игровом пространстве.

Дальнейший прогресс в области интеграции виртуальной реальности достигается с помощью Stable Diffusion и других нейросетей, что позволяет создавать локации в режиме реального времени.

Индивидуальные проекты визуализации. Пользователи научились не только создавать отдельные изображения, но и анимировать их кадр за кадром, объединяя сгенерированные картинки в полноценные видео.

Теперь угадайте, какая известная картина изображена на этом рисунке, созданном нейросетью?

Приятно сообщить, что в онлайн пространстве получил огромную популярность видеоролик, созданный талантливым блогером из Бельгии, Ксандером Стенбрюгге, который прекрасно иллюстрирует эволюцию всего живого на нашей планете. Благодаря взаимодействию с инновационной системой Stable Diffusion, разработанной Ксандером, ему удалось сформулировать 36 ключевых запросов, на основе которых искусственный интеллект сгенерировал ряд изображений. После этого автор ролика грамотно объединил эти изображения в трехминутный видеоролик, создав поразительно интересное и познавательное произведение искусства.
Stable Diffusion имеет уникальные возможности Inpainting и Outpainting, которыми не обладают другие нейросети. Функция Inpainting позволяет безупречно заменить любой объект на изображении на сгенерированный нейросетью аналог, например, заменить кота на собаку.

С помощью функции Outpainting возможно бесконечно расширять готовое изображение, добавляя дополнительные детали и создавая фон вокруг исходной картинки. К примеру, один из пользователей Reddit использовал эту функцию, чтобы дорисовать платье главной героине знаменитой картины «Девушка с жемчужной сережкой».

Использование функции Outpainting Источник: reddit.com

Оживление набросков. В сервисе Stable Diffusion возможно сделать первоначальный набросок, а искусственный интеллект самостоятельно дополнит его деталями и фоном. Это значит, что родители с легкостью превращают детские рисунки в фотореалистичные произведения искусства, в то время как художники могут воспользоваться этой функцией для сокращения времени, затрачиваемого на создание произведений.

Возможен и более продвинутый подход к созданию изображений — использование нейросети для отрисовки отдельных элементов и последующее объединение их в единое целое с помощью мощных инструментов редактирования, таких как "Фотошоп". Для удобства пользователей, разработчики уже интегрировали функционал Stable Diffusion в программу, что делает весь процесс более эффективным и интуитивно понятным.

Одним из мощных инструментов, доступных в программе "Фотошоп", является плагин Stable Diffusion. Этот плагин позволяет создавать захватывающие и неповторимые изображения, в которых используется техника стабильной диффузии. Благодаря нему, творческие возможности обрастают новыми горизонтами, позволяя создавать уникальные и впечатляющие работы. Источник вдохновения и конкретная задача при работе с этим плагином могут варьироваться в зависимости от ваших потребностей и творческого видения.

👨‍🎨 Как самому попробовать Stable Diffusion

У команды Stable Diffusion заложены принципы прозрачности и доступности: исходный код нейросети они обнародовали на известном ресурсе «Гитхаб». И хотя для запуска его не требуется обладать навыками программирования, благодаря огромному сообществу энтузиастов были разработаны еще более удобные методы использования.

Есть три основных способа пользоваться Stable Diffusion, вот они.

Создавайте свои проекты легко и удобно с помощью нашего сайта или приложения. Отличительные особенности: не требуется специальные знания в области кодирования или доступ к мощным вычислительным ресурсам – все вычисления выполняются на наших серверах, вам нужно только отправить запрос. Однако, стоит учитывать некоторые ограничения онлайн-версий Stable Diffusion, такие как ограниченные функциональности, разрешение изображений и качество генерации. Приобретение платной версии позволяет получить доступ ко всем возможностям.

С помощью программы, обладающей графическим интерфейсом, можно значительно снизить ограничения и достичь более высокого качества результатов. В то же время, нет необходимости самостоятельно писать код. Все же, стоит отметить, что для использования этой программы необходим компьютер, соответствующий системным требованиям.

С использованием консоли и ввода кода. Преимущества: абсолютно бесплатный доступ ко всем функциям Stable Diffusion, высокое качество и разнообразие. Недостатки: не подходит для новичков без навыков программирования, требуется достаточная мощность ПК.

"Писали код на бумажке": 5 причин, по которым обучение в вузе может быть разочарованием.

При выборе Stable Diffusion важно обратить внимание на доступные версии. Кроме официальных моделей от Stability AI, существует множество неофициальных вариантов, которые настраивали и дообучали пользователи сами. Ниже представлены три основные официальные версии, из которых можно выбрать:

Stable Diffusion 1.5 стала популярной после ее выпуска, благодаря своей гибкости и способности создавать качественные изображения. Эта версия была обучена на обширном наборе данных, включая NSFW-контент. Она остается самой популярной версией в сообществе и часто используется в качестве основы для дообучения моделей.

Stable Diffusion 2.1 является последним официальным релизом и улучшает предыдущую версию. Она генерирует меньше артефактов, более точно соответствует запросам и способна создавать текст. Однако весь NSFW-контент был удален из набора данных, поэтому эта версия не так популярна в сообществе.

Stable Diffusion XL - это последняя версия, которая находится в бета-тестировании и еще не завершена полностью. Она лучше стилизует изображения, распознает имена знаменитостей, успешно справляется с простыми запросами и способна создавать фотореализм. В настоящее время эту версию можно опробовать только на сайтах Stability AI, установка на компьютер недоступна.

Я с радостью поделюсь всей необходимой информацией о том, как с легкостью запустить Stable Diffusion. Независимо от того, хотите ли вы использовать сайты, приложения или программы, я изложу все подробности. Кроме того, для тех, кто обладает навыками программирования, я также расскажу, как воспользоваться нейросетью через консоль.

📱 Как генерировать в Stable Diffusion через сайт или приложение

ClipDrop - это инновационное программное обеспечение, предлагаемое официальным сайтом Stability AI, которое упрощает работу с изображениями при помощи технологии Stable Diffusion XL. С его помощью вы можете быстро и легко создать четыре различных варианта изображения, при этом имеется возможность увеличить разрешение одного из них. Кроме того, на сайте вы можете выбрать один из множества стилей, включая аниме, оригами, цифровой арт, комиксы и многое другое.

Stability AI активно вовлекает пользователей этого веб-сайта, чтобы собрать обратную связь при выборе наилучшей картинки из четырех предложенных. Таким же образом, Midjourney получает ценную обратную связь в процессе тестирования новых версий.
Интерфейс Dream Studio. Источник: Результат генераxции вClipDrop

Dream Studio предлагает официальную упрощенную версию Stable Diffusion, которая позволяет выбрать одну из трех моделей. Бонусом является возможность бесплатной генерации около 400 изображений, пока не закончатся кредиты. Вам будет необходимо пополнить свой аккаунт тысячей кредитов, которые стоят всего 10 $⁣ (820 Р), что позволит вам создать целых четыре тысячи картинок. Для использования этого сервиса вам необходимо зарегистрироваться на сайте или авторизоваться через «Гугл» или «Дискорд».

После успешной регистрации на нашей платформе, у вас открывается удобное окно, где вы можете создать уникальное изображение по вашему запросу. Вам нужно лишь ввести ваш запрос в специальное поле, расположенное внизу окна. Кроме того, у вас есть возможность выбрать желаемый размер изображения и настроить степень соответствия изображения вашему запросу. Наша нейросеть генерирует изображение, выполняя до 150 шагов, чтобы добиться наилучшего результата. Более того, по умолчанию, наш сервис предоставляет вам сразу четыре различных варианта сгенерированных изображений.

"В наше время все больше людей осознают важность здорового образа жизни. Правильное питание, регулярные физические нагрузки и отказ от вредных привычек становятся неотъемлемой частью нашей жизни. Однако, среди множества существующих диет и тренировок, найти подходящие для себя можно лишь после тщательного изучения и анализа. Для того чтобы вы смогли сделать осознанный выбор, наша команда специалистов тщательно отбирает только проверенные и эффективные методики, которые помогут вам достичь желаемых результатов. Мы предлагаем не просто продукт или услугу, а настоящий инструмент для изменения вашей жизни к лучшему. Начните преображение прямо сейчас."
Интерфейс DreamStudio. Источник: dreamstudio.ai

Google Collab - сервис от Google, позволяющий бесплатно воспользоваться вычислительной мощностью других пользователей. Однако, следует учитывать, что при каждом запуске необходимо потратить время на загрузку требуемых библиотек и моделей.

Выберите одно из двух доступных вариантов: версия 1.5 или 2.1. Чтобы перейти к подключению, просто щелкните на кнопке "Подключиться", расположенной справа на странице. Затем выберите "Среда выполнения" и нажмите "Выполнить все". Всего через 5-10 минут начнется загрузка моделей. Когда она будет завершена, просто прокрутите страницу с кодом до самого конца и выберите любую из представленных ссылок.

Перейдя в веб-интерфейс Automatic 1111, вы попадаете в мощный инструмент для установки локального Stable Diffusion. Здесь предоставлено множество настроек, позволяющих вам контролировать процесс генерации изображений. Вы можете легко настроить разрешение картинки, количество шагов и выбрать подходящий метод сэмплирования. Кроме того, в модель встроен удобный плагин ControlNet, который позволяет генерировать изображения на основе готовых картинок, набросков или поз.

На Tinkoff Journal представлен полностью бесплатный сервис ControlNet, который позволяет вам создавать изображения с помощью нейросети. Важно отметить, что количество генераций ограничено временным периодом – несколькими часами. Однако после истечения срока вы всегда можете загрузить модель заново и продолжить использование сервиса. ControlNet – это инструмент для контролируемой генерации качественных изображений.

Быть хорошим копирайтером – значит обладать навыками качественного написания текстов для рекламных целей. Копирайтер должен быть креативным и уметь заинтересовать своей работой потенциальных клиентов, привлекая их внимание. Копирайтер может создавать тексты для различных форматов рекламы – от баннеров и лендингов до социальных сетей и печатных материалов. Он должен быть в состоянии адаптироваться под требования каждой конкретной задачи и эффективно передавать информацию о продукте или услуге, заинтересовывая целевую аудиторию. Копирайтер должен также хорошо знать основы маркетинга и понимать, как привлечь и удержать внимание потенциальных покупателей.
Нажмите, например, на первую ссылку

Ниже представлен пример рерайтинга абзаца:

"Я страстно верю в важность хорошего копирайтинга. Он является средством, позволяющим передать информацию и выразить идеи таким образом, чтобы они привлекали и вовлекали аудиторию. Как копирайтер, моя цель - создать привлекательные и убедительные тексты, которые подхватят интерес целевой аудитории, вызовут желание действовать и помогут достичь поставленных целей. Я стремлюсь к тому, чтобы каждая фраза и каждое слово в тексте были точными, креативными и мощными, чтобы они не только привлекали внимание, но и оставались в памяти читателя."
Веб-интерфейс Stable Diffusion

HuggingFace - это уникальная платформа, предлагающая пользователям доступ к разнообразным моделям Stable Diffusion, которые можно опробовать всего в один клик. Просто выберите интересующую вас модель, напишите свой запрос и нажмите кнопку «Generate». Более того, сервис предоставляется бесплатно, а количество генераций неограничено. Правда, настройки, обычно, не подлежат изменению.

Хотите облегчить себе жизнь при создании графических изображений? Вам необходим Mage.Space! Этот онлайн-сервис является самым простым в использовании - достаточно зайти на сайт и сразу начать создавать без необходимости регистрации. Хотя версия 1.5 компромиссно влияет на качество генерируемого контента, Mage.Space все равно предоставляет бесплатный и безлимитный доступ к своим возможностям. Вы можете создавать до 25 или 50 шагов генерации без ограничений. После регистрации все сгенерированные изображения сохраняются в вашу галерею, чтобы вы могли легко получить к ним доступ в любое время. Если вы хотите пойти еще дальше, вам доступен продвинутый режим с дополнительными настройками. Mage.Space - ваш надежный инструмент для создания высококачественных графических изображений!

PlaygroundAi - это уникальная платформа, которая комбинирует возможности социальной сети с генерацией удивительных картинок. Здесь вы можете подписываться на интересных пользователей и наслаждаться их творчеством прямо в своей ленте. И самое привлекательное - все бесплатно и без ограничений. Здесь нет цензуры, вы можете наслаждаться свободой самовыражения. Еще одно преимущество PlaygroundAi - доступность двух версий с различными функциональными возможностями: 1,5 и 2,1. Для начала пользования требуется удобная авторизация через аккаунт Google. Количество искусных шагов генерации составляет впечатляющие 150, что позволяет создавать поистине уникальные произведения. Вы также можете выбрать размер изображения, добавить фильтр и сразу сгенерировать целых четыре картины. И самое замечательное - генерация доступна не только по текстовому запросу, но и по изображению, что позволяет вам совершать настоящие визуальные чудеса.

Dezgo: интуитивный инструмент для создания изображений с минималистичным дизайном. Создавайте картины по выбранным изображениям с легкостью благодаря удобному интерфейсу. И самое лучшее - это бесплатно и безлимитно. Здесь нет никаких цензурных фильтров, что позволяет вам воплотить в жизнь даже самые смелые идеи. Выбирайте из нескольких версий, включая 1,5 и 2,1, а также наслаждайтесь аниме-вариациями. Радует и то, что не требуется регистрация, а также пользователи не ограничены настройками, даже размером картинки.

Stable Diffusion Generator - это бесплатный телеграм-бот, предлагающий неограниченное число генераций текстов на русском языке. Он основан на модели mdjrny-v4, которая является четвертой версией генератора Midjourney. Возможно сгенерировать тексты, состоящие из максимально 100 шагов. Бот предоставляет несколько стилей и сэмплеров для настройки генерации. Одной из уникальных возможностей является генерация текста на основе изображения - достаточно просто отправить картинку в чат.

Познайте творчество на новом уровне с приложением Draw Things, доступным для пользователей устройств iOS. Это удивительное приложение использует потенциал вашего телефона для генерации великолепных произведений искусства. Скорость создания зависит от мощности вашего устройства, поэтому готовьтесь получить впечатляющие результаты. При установке приложение автоматически загружает все необходимые файлы, включая самую модель Stable Diffusion, чтобы вы могли наслаждаться безупречным функционированием и полным визуальным восхищением.

По умолчанию в нашем приложении создаются изображения размером 384 × 384 пикселей. Однако, если вы решите увеличить размер, вам будет выдано предупреждение о возможной нехватке ресурсов вашего телефона. Кроме того, у нас имеется базовый редактор, который позволяет вам вручную дорисовывать изображение по своему вкусу.
Картинка на iPhone 13 генерировалась примерно пять минут

👩‍💻 Как скачать программу со Stable Diffusion на ПК

Для работы программы необходим компьютер с операционной системой Windows или Linux, а также видеокартой объемом памяти 4 или 8 Гб. Эти требования являются минимальными. Как правило, чем мощнее ресурсы, тем быстрее программа будет генерировать изображения. Если у вас устройство с операционной системой MacOS, то для работы требуется версия не ниже 12.3, а также наличие процессора М1 или М2.

Форки, или программы-клонирования, как обычно называют их члены сообщества Stable Diffusion. Давайте рассмотрим несколько удобных установщиков, разработанных авторами этого проекта.

Хотите установить Stable Diffusion на Windows или Linux? Воспользуйтесь CMDR2’s 1-Click Installer - самым удобным способом установки! Просто скачайте папку с 'Гитхаба', переместите ее на нужный диск (например, С:\stable-diffusion-ui), а затем дважды кликните на Start Stable Diffusion UI.cmd. Всего два простых шага, и вы уже можете наслаждаться программой! Занимает всего 25 Гб на вашем жестком диске.

CMDR2 предлагает широкий спектр базовых функций генератора, что позволяет пользователю легко настроить свой опыт. Вы можете точно указать количество изображений по запросу, установить количество шагов, задать размер и формат изображения, применить различные модификации и воспользоваться продвинутой моделью Stable Diffusion. Более того, CMDR2 поддерживает поиск изображений по разнообразным критериям.

В данной программе доступно множество дополнительных опций, позволяющих сгенерировать особые части изображения, исключить определенные элементы с использованием негативного запроса, а также привлечь внимание нейросети к выбранным деталям. Кроме того, вы можете установить очередность генерации запросов, чтобы они выполнялись последовательно.

Рерайт:

Вы наверняка знаете, что в наше время практически каждая компания имеет свой собственный веб-сайт. Однако для того, чтобы он привлекал внимание потенциальных клиентов и был успешным, необходимо создать уникальное и оригинальное содержание. Профессиональные копирайтеры могут помочь вам в этом важном процессе, создавая привлекательные и информативные тексты для вашего сайта. Используя свои навыки и опыт, они смогут заинтересовать и удержать внимание посетителей, а также рассказать о ваших товарах и услугах. Доверьтесь профессионалам и увидите, как ваш веб-сайт станет более привлекательным и успешным.
Интерфейс CM2RD. Источник: github.com

A1111. Установка самой востребованной оболочки на операционную систему Windows никогда не была такой простой. Для этого достаточно загрузить лаунчер с платформы GitHub, запустить его и следовать простому процессу установки. Он автоматически установит базовую модель Stable Diffusion, хотя для доступа к дополнительным моделям потребуется их загрузка и добавление вручную.

Настройки и возможности оболочки предоставляют полную свободу действий. Технически подкованные пользователи также могут использовать интерфейс Stable Diffusion для установки с помощью навыков программирования.

Ниже представлен переработанный вариант абзаца:

Запасные части являются неотъемлемой частью обслуживания вашего автомобиля. Без правильно работающих запасных частей, ваш автомобиль может столкнуться с проблемами, которые могут привести к поломке или дорогостоящим ремонтным работам. Мы предлагаем широкий ассортимент запасных частей, которые соответствуют самым высоким стандартам качества и обеспечат надежную и безопасную езду. С нашими запасными частями вы можете быть уверены, что ваш автомобиль будет работать эффективно и сохранит свою надежность на долгое время.
Интерфейс A1111. Источник: github.com

Diffusion Bee. Легкий метод установки программы на MacOS. Просто скачайте файл установки и запустите приложение. При этом занимается минимальное пространство на жестком диске - всего 274 Мб.

Программа имеет простой и интуитивно понятный интерфейс, который позволяет пользователю сразу ввести запрос и получить результат. Пять разделов позволяют осуществлять текстовые запросы, искать по картинкам, генерировать содержимое внутри картинки, создавать фон вокруг изображения и просматривать историю запросов. Особенностью Diffusion Bee является возможность улучшать качество изображений. Кроме того, программа обладает фильтрами, блокирующими NSFW контент и другой контент, который запрещен лицензией Stable Diffusion.
Интерфейс Diffusion Bee. Источник: github.com

NMKD GUI. Еще один популярный вариант программного обеспечения для операционной системы Windows. При загрузке с официального веб-сайта разработчики предлагают вам возможность заплатить любую сумму, однако, чтобы отказаться от этого, достаточно выбрать опцию "No, thanks, just take me to the downloads". После этого вам потребуется распаковать архив и запустить установочный файл. В процессе установки рекомендуется активировать все доступные параметры. Обратите внимание, что размер программы составляет 11 Гб на вашем жестком диске.

NMKD способен обрабатывать запросы через картинку-референс, одновременно работая с несколькими запросами, и улучшать качество изображений путем восстановления некорректно сгенерированных лиц. Кроме того, он предлагает возможность создавать бесшовные изображения, что является полезным для текстур в видеоиграх. В программе также имеется множество настроек, поэтому пользователь может легко освоить все ее функции, помощь в этом можно найти в подробном гайде, доступном на странице проекта на "Гитхабе".

"Держаться в форме – это важно. Регулярные тренировки помогут вам поддерживать физическую форму и улучшать здоровье. Занятия спортом не только придают энергию и силу, но и способствуют укреплению иммунной системы, снижению риска различных заболеваний и повышению общего тонуса организма. Не отказывайте себе в этом приятном и полезном занятии – начните тренировки уже сегодня!"
Интерфейс NMKD. Источник: nmkd.itch.io

🕶 Как создавать стабильные различия в развитии с использованием программирования

Любой пользователь с соответствующими навыками может запустить исходный код нейросети. Используя базовую версию, проще внедрить методы генерации изображений, которые постоянно обновляются, а также добавить сторонние инструменты, такие как Midjourney, без необходимости ждать обновлений от разработчиков сторонних форков или приложений.

Для запуска кода необходимо иметь знания языка программирования Python, инструмент Git и программу с библиотеками для Python Miniconda3. Пользователи "Пикабу" подробно описали процесс установки Stable Diffusion на русском языке. Существует более простой способ использования Stable Diffusion, чем через консоль - это установить форк, который не является стандартной версией. Однако, для этого все же потребуется навык программирования. Установка форков сложнее, чем установка приложений, которые требуют всего одного клика. Однако, они позволяют получить больше возможностей и отличаются частыми обновлениями, наличием множества настроек и браузерным интерфейсом. Мы собрали несколько популярных форков для вашего выбора.

Automatic1111 Webgui - форк для Windows и MacOS. Он предоставляет доступ к более чем 30 настройкам для генерации изображений. Он улучшает качество лиц, создает текстуры, смешивает изображения и выполняет последовательность действий с разными настройками. Кроме того, он поддерживает негативные запросы. Сгенерированные изображения можно загрузить, чтобы Stable Diffusion предоставил запрос, по которому они были созданы. Руководство по установке доступно на английском языке на "Гитхабе".

Invoke AI - форк для Windows, MacOS и Linux. Он также поддерживает негативные запросы и имеет упрощенный API для генерации текстовых запросов. Руководство по установке также доступно на английском языке на "Гитхабе".

Onnyx Diffusers UI - форк для Windows с видеокартами AMD. Руководство по установке также доступно на английском языке на "Гитхабе".

Помимо этого, пользователи "Гитхаба" разработали плагины для "Дискорда", "Фотошопа", Blender, Gimp и Krita, которые добавляют возможности Stable Diffusion к соответствующим программам.

На сайте CitivAI доступны модели, которые пользователи сами дообучали. Они чаще всего обучены на определенных стилях, таких как ультрареализм, научная фантастика, аниме или иллюстрации. Также есть модели, которые генерируют определенных персонажей. Подберите ту модель, которая лучше всего подходит под вашу задачу.

🙊 Как составить запрос в Stable Diffusion

Если вы уже попробовали Midjourney, вы сможете легко применить те же навыки в создании промптов для Stable Diffusion. Мы подробно объяснили, как это сделать. Однако здесь нет команд с двумя тире, наподобие "--beta" и "--s", а также отделение частей запроса двоеточиями "::" заменено на использование запятой.

Что означают настройки в генераторах Stable Diffusion

Шаги - это количество шагов, которые нейросеть делает в процессе генерации изображения. Чем больше шагов, тем более качественный результат можно получить, однако это требует больше времени на обработку запроса. По умолчанию установлено 50 шагов.

Classifier Free Guidance - это параметр, определяющий насколько свободно нейросеть может интерпретировать запрос. По умолчанию установлено значение 7, что означает, что нейросеть будет иметь возможность самостоятельно дополнять примерно половину запроса. При значении менее 6 нейросеть принимает решения самостоятельно. При значении 16 нейросеть полностью учтет ваш запрос без дополнений. Если вы уверены в своем запросе, рекомендуется использовать более высокое значение.

Seed - это стартовая точка, из которой нейросеть начинает формировать изображение. По умолчанию используется случайный параметр, что позволяет получать разные результаты при одинаковом запросе. Однако, если вы используете конкретное числовое значение сида, композиция изображения останется схожей даже при изменении запроса. Всего доступно около 16 миллиардов сидов.

Resolution - это размер изображения. Чем больше размер, тем дольше будет длиться процесс генерации. Например, для версии Stable Diffusion 1.5, рекомендуется выбирать размер 512x512, а для версии 2.1 - 768x768.

Sampler - это процессы, которые влияют на результат генерации. Некоторые изображения могут быть сгенерированы за 8 шагов, в то время как другие требуют 50-80 шагов. Процесс работы сэмплеров на сгенерированных изображениях можно изучить здесь.

Если вы не хотите разбираться во всех настройках, пользователь Reddit рекомендует использовать универсальную комбинацию: CFG - 7, Steps - 30, Sampler - EulerA, Random seed.

Несколько советов для составления запроса.

Придумайте оригинальную идею. Сформулируйте свой запрос на создание картинки, следуя стандартной схеме: указывайте объект, фон, стиль, а также дополнительные описания, характеризующие качество изображения, тип освещения и другие характеристики. Например: «кот с длинной шерстью, в стиле киберпанк, при ярком неоновом освещении в городской среде, требуется высокое качество и детализация».
Важно следить за порядком слов. Он имеет огромное значение. Stable Diffusion алгоритм будет уделять большее внимание первым словам, но, возможно, пропустит то, что вы указали в конце. Изменяя порядок частей вашего запроса, вы можете получить совершенно разные результаты. Например, если вам не нравится качество изображения человеческого лица, переместите его описание ближе к началу.

Разделите влияние каждого элемента. Возможность ручной настройки "веса" каждого элемента в запросе доступна: например, в DreamStudio это осуществляется путем указания значения после двоеточия, которое может варьироваться от 0 до 100. Пример использования: sun:50, clouds:50. Веб-интерфейсы используют другой формат: (sun:1.5) и (clouds:0.1). Общий "вес" должен составлять 100.