正在为人工智能或全栈开发而苦恼?我们的专家将为您提供指导:量身定制的建议、技术整合等。联系我们 [email protected].

利用稳定的扩散有效地将文本转化为图像,《达利2》/《中程》的替代方案

可以利用人工智能,以便从文本中生成图像(也称为文本到图像)。Stability AI的Stable Diffusion是生成图像的最佳开源AI模型,也是DALL-E 2或MidJourney的最佳替代方案。但正确使用这个模型需要一些练习,所以让我们告诉你如何用稳定扩散法生成令人惊奇的图像

DALL-E 2和MidJourney

由OpenAI发布的DALL-E 2是一个强大的文本转图像的AI模型。但截至本文写作时,它仍处于封闭测试阶段,这意味着你需要申请一个特殊的权限才能使用它。

使用DALL-E 2,您可以生成看起来像真实照片的现实图像,或生成更抽象的图像,看起来像图画、绘画或计算机生成的图像。

MidJourney也是文本转图像的一个伟大的候选者,它在AI艺术生成方面特别受欢迎。

你如何生成这样的图像?只需通过创建一个自然语言的文本指令。这里有几个例子。

日落时分的未来城市的概念艺术。

日落时分的未来城市的概念艺术,由稳定扩散生成

街道上的大猩猩照片。

街头大猩猩的照片,由稳定扩散法生成

稳定的扩散

稳定扩散是一个开源的文本到图像模型,由一家名为 "稳定AI "的公司创建。 研究人员创建的,名为 "稳定性AI (请看他们的网站).

稳定扩散是第一个达到与DALL-E 2和MidJourney相同性能的开源AI模型。它正在返回准确的结果,同时保持相当低的响应时间。

稳定扩散 "现在可以在NLP云上使用!但充分利用这个伟大的人工智能模型需要一些实践,你可能会对你的第一个结果感到失望。

这就是为什么我们认为给你更多关于如何使用这些文本到图像模型的细节会很有趣。

天真烂漫的方法

乍一看,你可能想使用非常简单的指令,如 "一辆车",或 "一头狮子"。这不一定会返回惊人的结果。这里有一些例子。

一辆汽车

一辆汽车,由稳定的扩散产生

一头狮子

一头狮子,由稳定的扩散产生

这还不错,但我们可以做得更好。

选择一种技术

你可以做的最简单和最令人印象深刻的改进是为你的图像选择一种创作技术。例如,它可以是油画、铅笔画、概念艺术、照片......让我们尝试一些例子。

铅笔画的狮子

铅笔画的狮子,由稳定扩散法生成

冬天的湖泊的油画

冬天的湖泊的油画,由稳定扩散产生的

一辆赛博朋克汽车的概念艺术

一辆赛博朋克汽车的概念艺术,由稳定扩散公司生成。

看到在短时间内产生一些遵循特定风格的艺术是多么容易,令人印象深刻,不是吗?

选择一种风格

有时,一种技术不足以描述你想生成的那种图像。在这种情况下,指定一个艺术家会有帮助!这里有一些例子。这里有一些例子。

克劳德-莫奈制作的郁金香花田

克劳德-莫奈制作的郁金香花田,由稳定扩散法生成

伦勃朗创作的一幅女人的油画

伦勃朗创作的一幅女人油画,由稳定扩散法生成

这是一个很好的机会,可以对你还不了解的艺术家做一些研究。

探索

上面的例子可能非常有用,但你仍然可以通过使用一些特定的关键词做得更好。稳定AI团队建议你在指令中尝试以下一些关键词。

高度的细节,超现实主义,艺术站的趋势,三段式配色方案,平滑,锐利的焦点,哑光,优雅,有史以来最美丽的图像,插图,数字绘画,黑暗,阴郁,辛烷渲染,8K,4K,洗净的颜色,锐利,戏剧性的照明,美丽,后期处理,今天的图片,环境照明,史诗般的构图。

毫无疑问,你会发现在你之前没有人尝试过的特殊指令,创造出惊人的效果!你会发现,你的工作是非常重要的。

此外,请自由创作更长的说明。你不一定要坚持用一句话。例如,你可以用一整段来代替。

如果你需要想法,这里有一些有趣的例子。

高度详细的未来主义苹果iGlass电脑眼镜的人脸,赛博朋克,手部追踪,概念艺术,人物艺术,工作室闪电,明亮的颜色,错综复杂,杰作,逼真,超现实,锐利的焦点,高对比度,Artstation HQ,DeviantArt趋势,8k UHD,虚幻引擎5
一个详细的漫画插图人物全身肖像,一个有红色机械眼的黑发半机械人,artstation上的趋势,数字艺术,4K分辨率,详细,高质量,锐利的焦点,HQ艺术品,疯狂的细节,概念艺术,人物概念,人物插图,全身插图,电影,戏剧性的灯光
一个赛博朋克祖鲁战士坐在悬崖上,从远处看一颗流星坠落到地球上,作者是Alena Aenami和android jones和Greg rutkowski,Artstation上的趋势,超现实主义,优雅,风格化,高度详细的数字艺术,8K分辨率,高清,全局照明,光线追踪,辐射光,体积照明,详细和复杂的赛博朋克贫民区环境,在辛烷中渲染,油画,宽角度,动态肖像
机器神重建自己, 幻想, d & d, 复杂, 详细, 异想天开, 详细, artstation上的趋势, artstation上的趋势, 顺利
智慧的老和尚引导迷失的灵魂穿越地狱,采用Tomer Hanuka和Atey Ghailan的风格,色彩鲜艳,在artstation上流行。
保罗-贝坦尼饰演的带翅膀的天使被藤蔓、花朵和苔藓覆盖,站在一个美丽的小屋前,这是一幅由托马斯-坎蒂、托马斯-金凯德和罗斯-陈创作的数字画,新艺术主义,大气的照明,在艺术站的趋势
汽车的概念艺术,巨大的尖刺,由Syd Mead绘制,质量高。
焦虑的好看的苍白的年轻印度医生穿着美国衣服在医院外,肖像,优雅,复杂,数字绘画,艺术站,概念艺术,光滑,锐利的焦点,插图,艺术由artgerm和Greg Rutkowski和Alphonse Mucha
骷髅神,近距离肖像,强大的,复杂的,优雅的,体积照明,风景,数字绘画,高度详细,艺术工作站,锐利的焦点,插图,概念艺术,阮佳,史蒂夫-麦考利
乌克兰女孩与蓝色和黄色的衣服附近的大废墟的飞机,概念艺术,在艺术站的趋势,高度详细,复杂,锐利的焦点,数字艺术,8 k
恐怖的邪恶的哭鬼,非常详细的脸,详细的特征,幻想,电路,爆炸,戏剧性的,复杂的,优雅的,高度详细的,数字画,艺术站,概念艺术,光滑,锐利的焦点,插图,艺术由Gustave Dore,辛烷渲染
美丽和俏皮的女士自由肖像,新艺术,幻想,拿着Rene Lalique的花瓶,优雅,高度详细,焦点鲜明,艺术由Artgerm和Greg Rutkowski和WLOP提供。
一个代表阿根廷文化的女人的肖像,布宜诺斯艾利斯,幻想,复杂,高度详细,数字绘画,艺术站,概念艺术,光滑,锐利的焦点,插图,艺术由artgerm和Greg Rutkowski和Alphonse Mucha创作。
格雷格-鲁特科夫斯基的画作,晚上,一个带有金色装饰的大陶瓷壶在深蓝色的夜空中高高飞起,在茅草屋顶下的白色小房子上方,天空中星星点点,色彩丰富如画。
主题公园的比萨饼派对, 光尘, 宏伟, 特写, 细节, 锐利的焦点, 优雅, 高度详细, 插图, 由Jordan Grimmer 和 greg rutkowski 和 PiNe(パイネ) 和 薯子Imoko 和 香川悠作 和 wlop 和 maya takamura, 复杂, 美丽, Trending artstation, pixiv, 数字艺术
工作室拍摄的蒂莫西-道尔顿的超现实主义精确肖像雕塑,美丽的对称性!脸部精确的脸部详细的脸部现实比例,由Ron Mueck和Matthew Barney和Greg Rutkowski在基座上用粉红色磨砂玻璃制成,超现实主义电影照明震撼的细节8K

总结

正如你所看到的,图像生成是一个非常令人印象深刻的技术,它已经被像DALL-E 2或MidJourney和稳定扩散这样的模型民主化了。

一旦你掌握了从文本到图像的技术,你就可以在眨眼间轻松地生成大量令人惊叹的图像。

希望你能发现它的作用!如果你对如何进行最稳定的扩散有一些问题,请 不要犹豫,请问我们。

Julien Salinas
NLP云的首席技术官