【Stable Diffusion】AI图像生成:清醒可见的迷幻空间【附多图】

可口可乐的AI生成广告是如此,看了BAD APPLE的AI生成影像也觉得与迷幻空间有很高的亲和性。如果要活用AI,迷幻空间是绝佳的选择。
Stable Diffusion真是厉害。
特别是在CG行业似乎非常有用。
因此,我将贴上一些迷幻图片,然后是人物生成和绘画生成。


指定吉米·亨德里克斯。

鲍勃·迪伦

鲍勃·迪伦

我没有指定任何东西,但它看起来像保罗·麦卡特尼。
过去的艺术技法有成为“欧帕兹”(out-of-place artifacts)的倾向,所以我希望通过AI的力量让它们复活。
那么,真实的人物呢?


直到不久前,手指的造型还有些粗糙,但现在质量已经相当高了。
那么,绘画呢?

这是我开始使用Stable Diffusion后首次生成的东西,我觉得赛博朋克风格的画风与AI这种事物有很高的亲和性,所以尝试制作了一下。有点粗糙。
那么,让我们来生成具有大量开源元素的重音Teto吧。


如果是不同的画风会怎么样呢?

变成了2000年代左右的氛围呢。
想法与目的
我原本是想生成一些从未处理过的物品或商品图片作为概念图,但文字生成效果特别差,而且针对人物的信息很多,针对“物品”的AI仍然是未开发的领域。
文字问题或许可以用Photoshop等工具解决吧。
这次我尝试了一下,之前有人讨论过提示工程师(prompt engineer)以及AI生成是否真的能成为一种职业,现在我明白了。顺便说一下,如果想用重音Teto生成大约147个短语,并且在不指定角色的情况下创建迷幻的AI自由空间,那么提示词越少越好。
从事音乐或CG创作者的Pastime的人的作品可能很有参考价值。
Pastime工廠
从域名追溯历史,这个网站本身似乎从2000年代初就开始做角色CG设计了,所以他们的工作可能也是如此吧。
总有一天,亚马逊和谷歌会提供云GPU(价格相当昂贵),所以我认为也许可以利用AI和云上的GPU算力来开发下一代搜索引擎。毕竟,只要不是狂热爱好者,无论谁写的东西,只要能获得包含所需信息的文章或图片等等,那就足够了。
如果每个人都是狂热爱好者,就会追求人性化和有情趣的东西;否则,未来的结果可能会让人觉得“真的还需要人类吗?”。
某种意义上,这可能是一种“人类再努力点!”的感觉吧。
我想起了The Clash的《White Riot》,这首歌在当时是用来指代种族问题的。(笔者对任何对象都没有歧视性意见。)
我支持摄影师、艺术家等具有历史价值的事物,但我认为积极接触这类AI,或许能发现人类固有的价值。
……话虽如此,我生成的东西也太可爱了。