Концепт-арт футуристичного міста на заході сонця.
Можна використовувати ШІ для того, щоб генерувати зображення з тексту (також відоме як перетворення тексту в зображення). Stable Diffusion від Stability AI - це найкраща модель ШІ з відкритим вихідним кодом для генерації зображень і чудова альтернатива DALL-E 2 або MidJourney. Але правильне використання цієї моделі вимагає певної практики, тому давайте покажемо вам, як генерувати дивовижні зображення за допомогою Stable Diffusion!
DALL-E 2, випущений OpenAI, є потужною моделлю ШІ для перетворення тексту в зображення. Але на момент написання цієї статті вона все ще перебуває в закритій бета-версії, тобто для її використання потрібно отримати спеціальний доступ.
За допомогою DALL-E 2 ви можете генерувати реалістичні зображення, які виглядають як справжня фотографія, або генерувати більш абстрактні зображення, які можуть виглядати як малюнки, картини або комп'ютерні зображення.
MidJourney також є чудовим кандидатом для перетворення тексту в зображення, і він особливо популярний для генерації мистецтва ШІ.
Як генеруються такі зображення? Просто створивши текстову інструкцію на природній мові. Наведемо кілька прикладів:
Концепт-арт футуристичного міста на заході сонця.

Фотографія горили на вулиці.

Stable Diffusion - це модель перетворення тексту в зображення з відкритим вихідним кодом, створена компанією дослідників під назвою Stability AI (див. їх сайт тут).
Stable Diffusion - це перша модель ШІ з відкритим вихідним кодом, яка досягає такої ж продуктивності, як DALL-E 2 і MidJourney. Вона повертає точні результати, зберігаючи при цьому досить низький час відгуку.
Стабільна дифузія тепер доступна в NLP Cloud! Але для того, щоб максимально ефективно використовувати цю чудову модель ШІ, потрібна певна практика, і ви можете бути розчаровані своїми першими результатами.
Саме тому ми вирішили, що буде цікаво розповісти вам більше про те, як використовувати ці тексти для зображення моделей.
На перший погляд, ви можете використовувати дуже прості інструкції, такі як "машина" або "лев". Це не обов'язково дасть дивовижні результати. Ось кілька прикладів:
Автомобіль

Лев

Це непогано, але ми можемо зробити набагато більше!
Найпростіше і найбільш вражаюче поліпшення, яке ви можете зробити, - це вибрати техніку створення вашого зображення. Наприклад, це може бути олійний живопис, малюнок олівцем, концепт-арт, фотографія... Спробуємо на прикладах:
Малюнок олівцем лева

Картина олійними фарбами "Озеро взимку

Концепт-арт кіберпанк автомобіля

Вражає, як легко і швидко можна створити мистецтво, що відповідає певному стилю, чи не так?
Іноді техніки недостатньо, щоб описати тип зображення, яке ви хочете створити. В такому випадку, вказівка художника може допомогти! Ось кілька прикладів:
Тюльпанове поле роботи Клода Моне

Картина Рембрандта "Жінка", виконана олією

Це гарна можливість провести дослідження про художників, яких ви ще не знаєте.
Наведені вище приклади можуть бути дуже корисними, але ви все одно можете зробити краще, використовуючи деякі конкретні ключові слова. Команда Stability AI рекомендує вам спробувати використовувати деякі з наступних ключових слів у ваших інструкціях:
Високодеталізований, сюрреалізм, тренд на арт-станції, тріадна кольорова гама, плавний, різкий фокус, матовий, елегантний, найкрасивіше зображення, яке коли-небудь бачили, ілюстрація, цифрова фарба, темний, похмурий, октан-рендеринг, 8к, 4к, розмиті кольори, різкий, драматичне освітлення, красивий, пост-обробка, картина дня, навколишнє освітлення, епічна композиція.
Без сумніву, ви відкриєте для себе особливі інструкції, які до вас ніхто не пробував і які дають приголомшливі результати!
Також не соромтеся створювати довші інструкції. Вам не обов'язково дотримуватися одного речення. Ви можете використовувати, наприклад, цілий абзац.
Якщо вам потрібні ідеї, ось кілька цікавих прикладів:
високодеталізовані футуристичні комп'ютерні окуляри Apple iGlass на обличчі людини, кіберпанк, відстеження рук, концепт-арт, персонаж-арт, студійне освітлення, яскраві кольори, складні, шедевр, фотореалістичні, гіперреалістичні, різкий фокус, високий контраст, Artstation HQ, тренд DeviantArt, 8k UHD, Unreal Engine 5
Детальний манга ілюстрація персонажа повний портрет тіла темноволосого кіборга аніме чоловік, який має червоне механічне око, тренд на artstation, цифрове мистецтво, дозвіл 4 k, детальний, висока якість, різкий фокус, hq ілюстрація, божевільні деталі, концепт-арт, концепція персонажа, ілюстрація персонажа, повна ілюстрація тіла, кінематографічний, драматичне освітлення
кіберпанк зулуський воїн сидячи на скелі спостерігає здалеку за падінням метеорита на землю, автор Олена Аенамі та Андроїд Джонс і Грег Рутковський, Тренд на artstation, гіперреалізм, елегантне, стилізоване, високодеталізоване цифрове мистецтво, роздільна здатність 8k, hd, глобальне освітлення, трасування променів, променисте світло, об'ємне освітлення, деталізоване і складне середовище кіберпанк гетто, виконане в октані, олія на полотні, широкий кут, динамічний портрет.
Machine god rebuilding itself, fantasy, d & d, хитромудрий, детальний, химерний, детальний, тренд на artstation, тренд на artstation, плавний
Старий мудрий Монах веде Загублену Душу через Лімб, в стилі Томера Ханука і Атея Гайлана, яскраві кольори, тренд на арт-станції
Пол Беттані в образі ангела з крилами оповитий виноградною лозою, квітами та мохом і стоїть перед красивим котеджем, цифрова картина thomas canty and thomas kincade and ross tran, арт-нуво, атмосферне освітлення, тренд на artstation
концепт-арт для автомобіля величезні гострі шипи, намальовані Сідом Мідом, висока якість
Тривожні бліді молоді індійські лікарі в американському одязі біля лікарні, портрет, елегантний, складний, цифровий живопис, artstation, концепт-арт, плавний, різкий фокус, ілюстрація, мистецтво Artgerm and Greg rutkowski and alphonse mucha
череп бога, портрет крупним планом, потужний, складний, елегантний, об'ємне освітлення, декорації, цифровий живопис, високодеталізований, арт-станція, різкий фокус, ілюстрація, концепт-арт, Руан Цзя, Стів МакКеррі
українська дівчина в синьо-жовтому одязі біля великого зруйнованого літака, концепт-арт, тренд на artstation, високодеталізований, складний, різкий фокус, цифрове мистецтво, 8 k
жахливий нечестивий привид, що плаче, дуже деталізоване обличчя, детальні риси, фантазія, схема, вибух, драматичний, складний, елегантний, високодеталізований, цифровий живопис, арт-станція, концепт-арт, плавний, різкий фокус, ілюстрація, мистецтво Гюстава Доре, октан-рендеринг
Красивий і грайливий жіночий портрет свободи, модерн, фантазія, тримаючи вазу Рене Лалика, елегантний, високо деталізований, різкий фокус, мистецтво Artgerm і Грега Рутковського і WLOP
портрет жінки, що є представником аргентинської культури, буенос-айрес, фентезі, складний, високодеталізований, цифровий живопис, арт-станція, концепт-арт, плавний, різкий фокус, ілюстрація, мистецтво artgerm and greg rutkowski and alphonse mucha
Картина Грега Рутковського, вночі великий керамічний глечик з золотим орнаментом летить високо в нічному темно-синьому небі над маленьким білим будиночком під солом'яною стріхою, зірки на небі, насичені мальовничі фарби
піца-вечірка в тематичному парку, легкий пил, чудовий, крупним планом, деталі, різкий фокус, елегантний, високодеталізований, ілюстрація, Джордан Гріммер і Грег Рутковський і PiNe(パイネ) і 薯子Imoko і 香川悠作 і Wlop і Майя Такамура, складний, красивий, Trending artstation, pixiv, цифрове мистецтво
Студійна фотографія гіперреалістичної точної портретної скульптури Тімоті Далтона, красиве симетричне!!! обличчя точне обличчя деталізоване обличчя реалістичних пропорцій, виконане з рожевого матового скла на постаменті авторства Рона Мюка і Метью Барні і Грега Рутковського, гіперреалізм кінематографічне освітлення шокуюча деталізація 8 k
Як бачите, генерація зображень є дуже вражаючою технікою, яка була демократизована такими моделями, як DALL-E 2 або MidJourney і Stable Diffusion.
Опанувавши техніку перетворення тексту в зображення, ви зможете легко створювати тонни дивовижних зображень за мить.
Сподіваємось, вам було корисно! Якщо у вас виникли питання про те, як зробити дифузію максимально стабільною, будь ласка не соромтеся запитувати нас.
Julien Salinas
CTO в NLP Cloud