前一阵子在京阪電車车站看到吉野山金峯山寺的广告海报,于是就顺手查了下那里的本尊蔵王権現。看起来很可怕的这位神明,据说是日本修験道原创的神明,并没有对应的海外传来的神佛对应。
那一阵子正好在尝试AI绘图,于是就用StableDiffusion试了一下。我没想到,竟然很快就能生成一张体态姿势如此吻合的AI蔵王権現!难道这个姿势其实在印度神话图像里是一个典型的姿势吗?总之很神奇。
不过今年还是没有在御開帳期间去吉野山,有点遗憾。
前一阵子在京阪電車车站看到吉野山金峯山寺的广告海报,于是就顺手查了下那里的本尊蔵王権現。看起来很可怕的这位神明,据说是日本修験道原创的神明,并没有对应的海外传来的神佛对应。
那一阵子正好在尝试AI绘图,于是就用StableDiffusion试了一下。我没想到,竟然很快就能生成一张体态姿势如此吻合的AI蔵王権現!难道这个姿势其实在印度神话图像里是一个典型的姿势吗?总之很神奇。
不过今年还是没有在御開帳期间去吉野山,有点遗憾。
AnimagineXL是用于AI绘图工具Stable Diffusion的一款模型,风格主要为日本ACGN的插画,也就是所谓的二次元画风。在之前的一篇文章《比较AnimagineXL模型对于游戏风格、游戏主机以及奇幻世界职业相关标签的表现》中,我比较了该模型对于不同的游戏风格(3D、像素画艺术、MMORPG等)以及游戏主机平台,还有就是奇幻职业等标签的反应及表现。在之前的比较中,我注意到了该模型对于3D和像素画艺术(pixel art)有较为明显的反应。
这一次,我尝试用不同的方法来融合这两个要素,即既3D,又像素。此外,我还比较了Stable Diffusion WebUI下4种不同的采样器对于同样提示词的画面表现。
在比较过程中我生成了许多图片,并构成了一系列的对比图表。其中我最喜欢的是这一张:
AnimagineXL是用于AI绘图工具Stable Diffusion的一款模型,风格主要为日本ACGN的插画,也就是所谓的二次元画风。
最近,我尝试了一下该模型对于游戏风格、游戏主机,以及奇幻世界职业相关标签,具有怎样的表现倾向,以及其对于不同标签、不同词汇的提示词,在保持其他参数不变的情况下,仅改变其中1~2个参数,会有怎样的差异。
我使用的比较方法是AUTOMATIC1111所开发的stable-diffusion-webui中Script模块下的X/Y/Z plot功能,比较的形式是Prompt S/R。我尝试改变两个参数进行比较。这两个参数是人为设定的,大志可以归类为:【游戏风格、游戏主机】、【奇幻职业】。顺便一说,之所以会想到尝试该模型对于不同游戏主机的表现,是因为最近我在逛二手商店,找一些过去的游戏光盘和卡带。
在比较测试中,用到的正面提示词:(masterpiece), ((best quality)), detailed,fantasy world,1girl,human,a cute slime,dungeon,looking at viewer,3D
负面提示词:(worst quality:1.6),(low quality:1.6), easynegative,extra limbs,(2girls),NSFW
其他参数选项可以查看本文内图片的png info信息。
我构想出了一种功能方法,仅利用StableDiffusion(这里以Automatic1111所开发的WebUI为例)的文生图功能,就能连续产生许多画面内容大体上一致的、不同表情的角色。
效果(以3张图为例):
继前两次创作《AI佛画:龙女成佛图》与《AI佛画:法华经药草喻图》后,我想尝试一下使用AI绘图工具创作出一组各图之间内容有所关联的图像作品。于是就参考了佛教禅宗的组图《十牛图》创作了这一组作品,具体参考的是廓庵思远的版本。
至于图片的内容和想要传达的意思,我就不多介绍了。禅意嘛,就是要大家自己悟的。
本作品第8幅(就是那个圈带一个牛角的)是用到了Microsoft Bing的AI绘图工具,其余的则是用到了Stable Diffusion(AUTOMATIC1111版Webui)进行创作。文字表现用到了Long Cang这款字体。我主张对这一组图像作品《AI佛画:十牛图》的著作权。
一、寻牛
我又用AI创作佛画了,而且这次还是一组。
其实,我是想做植物精灵的,不过仅仅是做植物精灵好像没什么意思,为了给作品增加一些故事性,我在思考的时候就想到了《妙法莲华经》中七个比喻(法华七喻)中的药草喻。
简单来说,这个比喻是将佛法比喻成大雨普降,滋润到植物。有些植物大,接到的雨就多一些;有些植物小,接到的雨就少一些。换言之,佛法说给每个人听,但各人因缘不同,接受的程度、收获的成果也不同……
还是来看植物精灵吧!
这是一幅我使用AI绘图工具Stable Diffusion(AUTOMATIC1111版Webui)创作的佛画。对,你没看错,这是一副佛教画像(认真脸)。
一句话故事简介:8岁的龙女小萝莉在一瞬间变成了可爱的男孩子,然后成佛了。(出典:《妙法莲华经》之《提婆达多品第十二》。)
稍微详细一些的故事简介:文殊师利去海中龙宫传法,回来后,众人问他成果如何。文殊师利说自己在海中龙宫的传法讲授《妙法莲华经》的效果很不错,很多众生都得到了教化。他还特别举了个例子,说是有一位裟竭罗龙王女,才八岁,已经很厉害了,了悟诸法,功德很高,口才也很棒,已经成为菩萨了。
这时候现场有2个人,一个叫智积菩萨,一个叫舍利弗,他们不太信,先是智积菩萨提出质疑,而就在这时八岁的龙女忽然现身现场。这时舍利弗就上前直接对她表达了自己的疑惑和不信:女性身体很污秽,怎么能成佛呢?
这时龙女拿出一个宝珠,递给在现场的佛陀。佛陀就这样收下了。龙女便问智积菩萨和舍利弗:「刚才我把宝珠交给佛陀,佛陀收下了,这个过程快不快呀?」两人答:「很快。」龙女接着说:「你们看好了,我要成佛,比这个动作还要快。」
于是,现场所有人都看到这个龙女忽然之间变成了男子,然后成佛了。那两个质疑的人也看到了,便也只能默然相信了。
这个故事告诉我们:可爱的男孩子最棒了!《妙法莲华经》是经中之王。
幻化秋叶原成功!!!
下面这张是我实际拍的照片——2023年3月12日是周日,当天秋叶原实施「步行者天国」,也就是禁止车辆通行,行人可以随意走到马路上。
简单介绍一下所用到的AI的步骤吧。其实这是我成功地用Stable Diffusion(AUTOMATIC1111的webui)做出这么一张由图生图(img2img)的图,因此还有许多尚在熟悉和调试的步骤及参数,许多都是试验多次然后碰巧成功的。简单来说,一共分为2个主要步骤。
这是一个有关从满是男孩子的矩阵中找出一位女装子的游戏试验。
这是一个有关AI绘图工具Stable Diffusion(AUTOMATIC1111版WebUI)的插件Latent Couple中,weights这一参数效果的测试。
Stable Diffusion是个AI绘图的工具软件,AUTOMATIC1111开发并分享了一个基于网页端的运行方式,被称为Stable Diffusion WebUI。有许多开发者为该网页运行方式打造了各种功能的插件,而本文中主要分析的就是一款名为Latent Couple extension (two shot diffusion port)的插件,由opparco提供。
由于整个AI绘图工具的世界都正在发生着日新月异的变化,因此本文也只涵盖当下时间点(2023年3月下旬)的测试效果。
Latent Couple,从其标题中的括号来看,是双人合影插件。其实不仅限于此,其实这是一个用于分割画面、分区域指定AI绘图的插件。至少我第一天上手,就已经很容易地做出三人图绘,乃至人+人+物的分割区域绘图了。
目前,在Latent Couple模块界面上,共有如下几个数值区域:Divisions、Positions、Weights、end at this step。前两个应该是有关分割区域的比例,以及指定区域位置,这两个参数已经有一些人给出了研究成果,甚至还有人做了Latent Couple 助手这样方便好用的辅助分割工具。我这里就不加赘述了。Weights似乎是分区域的权重,而end at this step则从字面上看,应该是停止步骤的意思。
本文主要是以一个实际例子,来研究Weights中参数对画面的影响。