Концепт-арт футуристического города во время заката.
Можно использовать искусственный интеллект для создания изображений из текста (также известный как преобразование текста в изображение). Stable Diffusion, разработанная Stability AI, является лучшей моделью ИИ с открытым исходным кодом для генерации изображений и отличной альтернативой DALL-E 2 или MidJourney. Но правильное использование этой модели требует некоторой практики, поэтому давайте покажем вам, как генерировать удивительные изображения с помощью Stable Diffusion!
DALL-E 2, выпущенный OpenAI, представляет собой мощную модель ИИ для преобразования текста в изображение. Но на момент написания этой статьи она все еще находится в закрытой бета-версии, а это значит, что для ее использования необходимо запросить специальный доступ.
С помощью DALL-E 2 вы можете генерировать реалистичные изображения, похожие на настоящую фотографию, или более абстрактные изображения, которые могут выглядеть как рисунки, картины или сгенерированные компьютером изображения.
MidJourney также отлично подходит для преобразования текста в изображение и особенно популярен для создания искусственного интеллекта.
Как создать такие изображения? Просто создав текстовую инструкцию на естественном языке. Вот несколько примеров:
Концепт-арт футуристического города во время заката.

Фотография гориллы на улице.

Stable Diffusion - это модель преобразования текста в изображение с открытым исходным кодом, созданная компанией исследователей под названием Stability AI. исследователей под названием Stability AI (смотрите их веб-сайт здесь).
Stable Diffusion - первая модель ИИ с открытым исходным кодом, достигающая такой же производительности, как DALL-E 2 и MidJourney. Она дает точные результаты, сохраняя при этом довольно низкое время отклика.
Стабильная диффузия теперь доступна на NLP Cloud! Но для того, чтобы максимально эффективно использовать эту замечательную модель ИИ, требуется некоторая практика, и первые результаты могут вас разочаровать.
Вот почему мы решили, что будет интересно рассказать вам подробнее о том, как использовать эти модели преобразования текста в изображение.
На первый взгляд, вы можете захотеть использовать очень простые инструкции, такие как "автомобиль" или "лев". Это не обязательно даст потрясающие результаты. Вот несколько примеров:
Автомобиль

Лев

Это неплохо, но мы можем сделать гораздо лучше!
Самое простое и впечатляющее улучшение, которое вы можете сделать, - это выбрать технику создания изображения. Например, это может быть масляная живопись, карандашный рисунок, концепт-арт, фотография... Давайте попробуем рассмотреть некоторые примеры:
Карандашный рисунок льва

Картина маслом с изображением озера зимой

Концепт-арт автомобиля в стиле киберпанк

Впечатляет, как легко и быстро можно создать искусство в определенном стиле, не правда ли?
Иногда техники недостаточно для описания того, какое изображение вы хотели бы создать. В этом случае может помочь указание художника! Вот несколько примеров:
Поле тюльпанов работы Клода Моне

Картина маслом с изображением женщины, выполненная Рембрандтом

Это хорошая возможность провести небольшое исследование о художниках, которых вы еще не знаете.
Приведенные выше примеры могут быть очень полезны, но вы все же можете добиться большего, используя некоторые конкретные ключевые слова. Команда Stability AI рекомендует вам попробовать использовать в своих инструкциях некоторые из следующих ключевых слов:
Высокодетализированный, сюрреализм, тренд на art station, триадическая цветовая схема, плавный, резкий фокус, матовый, элегантный, самое красивое изображение, которое когда-либо видели, иллюстрация, цифровая краска, темный, мрачный, октановый рендер, 8k, 4k, вымытые цвета, резкий, драматическое освещение, красивый, постобработка, картина дня, окружающее освещение, эпическая композиция.
Несомненно, вы откроете для себя особые инструкции, которые никто до вас не пробовал и которые дают потрясающие результаты!
Кроме того, не стесняйтесь создавать более длинные инструкции. Не обязательно ограничиваться одним предложением. Вы можете использовать, например, целый абзац.
Если вам нужны идеи, вот несколько интересных примеров:
высокодетализированные футуристические компьютерные очки Apple iGlass на лице человека, киберпанк, отслеживание рук, концепт-арт, арт персонажа, студия lightning, яркие цвета, замысловатый, шедевр, фотореалистичный, гиперреалистичный, резкий фокус, высокий контраст, Artstation HQ, DeviantArt trending, 8k UHD, Unreal Engine 5
Детальный портрет темноволосого киборга-человека из аниме, у которого красный механический глаз, тренд на artstation, цифровое искусство, разрешение 4 k, детализация, высокое качество, резкий фокус, hq иллюстрация, безумная детализация, концепт-арт, концепт персонажа, иллюстрация персонажа, иллюстрация всего тела, кинематографический, драматическое освещение
киберпанковский воин зулу, сидящий на скале и наблюдающий за падением метеора на землю с расстояния, автор алена энами, андроид джонс и грег рутковски, Trending on artstation, гиперреализм, элегантный, стилизованный, высокодетализированный цифровой арт, разрешение 8k, hd, глобальное освещение, трассировка лучей, лучистый свет, объемное освещение, детальное и сложное окружение киберпанковского гетто, рендеринг в октане, масло на холсте, широкий угол, динамичный портрет
Machine god rebuilding itself, fantasy, d & d, intricate, detailed, whimsical, detailed, trending on artstation, trending on artstation, smooth
Старый мудрый монах ведет потерянную душу через Лимб, в стиле Томер Ханука и Атей Гайлан, яркие цвета, модные тенденции на artstation
Пол беттани в роли ангела с крыльями, покрытого лозами, цветами и мхом, стоит перед красивым коттеджем, цифровая картина томаса кэнти, томаса кинкейда и росса трана, модерн, атмосферное освещение, тренды на artstation
концепт-арт автомобиля с огромными острыми шипами, нарисованный Сидом Мидом, высокое качество
Беспокойные бледные молодые индийские врачи в американской одежде возле больницы, портрет, элегантный, сложный, цифровая живопись, арт-станция, концепт-арт, плавный, резкий фокус, иллюстрация, работы artgerm и greg rutkowski и alphonse mucha
бог черепа, портрет крупным планом, мощный, сложный, элегантный, объемное освещение, пейзаж, цифровая живопись, высокодетализированный, арт-станция, резкий фокус, иллюстрация, концепт-арт, руан цзя, стив маккарри
украинская девушка в синей и желтой одежде возле большого разрушенного самолета, концепт-арт, тренд на artstation, высоко детализированный, сложный, резкий фокус, цифровое искусство, 8 k
ужасающий нечестивый плачущий призрак, очень детальное лицо, детальные черты, фантазия, схема, взрыв, драматический, сложный, элегантный, высокодетализированный, цифровая живопись, арт-станция, концепт-арт, плавный, резкий фокус, иллюстрация, искусство Гюстава Доре, октановый рендер
Красивый и игривый портрет дамы-либерти, модерн, фантазия, держит вазу Рене Лалика, элегантный, высоко детализированный, резкий фокус, работы Artgerm и Greg Rutkowski и WLOP
портрет женщины, представляющий аргентинскую культуру, буэнос-айрес, фантазия, сложный, высоко детализированный, цифровая живопись, артстанция, концепт-арт, плавный, резкий фокус, иллюстрация, искусство artgerm и greg rutkowski и alphonse mucha
Картина Грега Рутковски, ночью большой керамический кувшин с золотыми украшениями летит высоко в ночном темно-синем небе над маленьким белым домиком под соломенной крышей, звезды на небе, насыщенные живописные цвета
пицца в парке развлечений, легкая пыль, великолепный, крупный план, детали, резкий фокус, элегантный, высокодетализированный, иллюстрация, автор Джордан Гриммер и Грег Рутковски и PiNe(パイネ) и 薯子Imoko и 香川悠作 и wlop и Майя Такамура, замысловатый, красивый, Trending artstation, pixiv, digital Art
Студийная фотография гиперреалистичного точного портрета скульптуры тимоти далтона, красивый симметричный!!! лицо точное лицо детальное лицо реалистичные пропорции, из розового матового стекла на постаменте рон мюк и мэттью барни и грег рутковски, гиперреализм кинематографическое освещение шокирующая деталь 8 k
Как видите, генерация изображений - это очень впечатляющая техника, которая стала демократичной благодаря таким моделям, как DALL-E 2 или MidJourney и Stable Diffusion.
Освоив технику преобразования текста в изображение, вы сможете легко создавать тонны удивительных изображений в мгновение ока.
Надеюсь, вы нашли это полезным! Если у вас есть вопросы о том, как сделать наиболее стабильную диффузию, пожалуйста. не стесняйтесь задавать их нам.
Julien Salinas
технический директор NLP Cloud