AnimagineXL是用于AI绘图工具Stable Diffusion的一款模型,风格主要为日本ACGN的插画,也就是所谓的二次元画风。
最近,我尝试了一下该模型对于游戏风格、游戏主机,以及奇幻世界职业相关标签,具有怎样的表现倾向,以及其对于不同标签、不同词汇的提示词,在保持其他参数不变的情况下,仅改变其中1~2个参数,会有怎样的差异。
我使用的比较方法是AUTOMATIC1111所开发的stable-diffusion-webui中Script模块下的X/Y/Z plot功能,比较的形式是Prompt S/R。我尝试改变两个参数进行比较。这两个参数是人为设定的,大志可以归类为:【游戏风格、游戏主机】、【奇幻职业】。顺便一说,之所以会想到尝试该模型对于不同游戏主机的表现,是因为最近我在逛二手商店,找一些过去的游戏光盘和卡带。
在比较测试中,用到的正面提示词:(masterpiece), ((best quality)), detailed,fantasy world,1girl,human,a cute slime,dungeon,looking at viewer,3D
负面提示词:(worst quality:1.6),(low quality:1.6), easynegative,extra limbs,(2girls),NSFW
其他参数选项可以查看本文内图片的png info信息。
在提示词的Prompt S/R比较上,在X方向上,我填入的一系列代替指示词是:human,sorceress,warrior,archer,knight,priest,assassin,maid,
这意味着stable-diffusion-webui在进行绘图推理时,将依次用human后各个被半角逗号分隔的词语,替换到正面提示词中的human。也就是说,这里将依次绘制并比较人类、女魔术师、战士、弓箭手、骑士、圣职者、杀手、女仆以及(留空)。
而在Y方向上的比较,我填入的是:3D,photo,Playstation,XBOX,FamilyComputer,OnlineRPG,MMORPG,8bit game,TRPG,pixel art,
这里的替换比较用于观察该模型对于游戏风格(3D、照片、8位游戏机、TRPG等)以及游戏主机平台(Playstation、XBOX等)是否会有较为明显的风格特征表现。
结果如下(如果在网页中显示图片过小的话,请复制图片URL并在网页浏览器里新标签页中打开,这样就能看到大图了):
我比较了几张生成结果,发现以下几个特点:
- 该模型对于3D(三维)、pixel art(像素艺术)有着十分明显的风格表现。在3D那一行,往往会表现出类似FF14等3D日式MMORPG的画面风格。
- 换上了pixel art提示词则会表现出相当明显的像素艺术风格。而且在pixel art提示词的时候,更倾向于没有人物,只有场景和史莱姆。
- 在一些生成结果比较图中,我也注意到8bit game这个提示词在一些罕见的情况下,也会表现出类似pixel art那样的像素艺术,但出现的概率并不高。
- 相比于Playstation、XBOX等标签,8bit game、TRPG、pixel art这几个标签似乎更倾向于表现角色的整体图、全身图,而Playstation、XBOX等往往会表现半身图,忽略脚部。
- 另外在一些结果图中,我注意到FamilyComputer(也就是任天堂的「红白机」)这一个指示词中容易出现电脑(Computer),也就是说,FamilyComputer并没有作为一个画面表现的风格被识别,而是被解读为了Family+Computer。这可能与红白机在欧美地区的名称是Nintendo Entertainment System(NES)而非日本地区的FamilyComputer有关。
纵向比较(游戏风格、游戏主机)整体来说:该模型对于3D、pixel art有着很明显的风格特征表现。特别是对于pixel art的表现让我很惊讶。我记得在一年前左右的时候,要用SD进行像素图的创作,还需要使用专用的像素风格的模型。我没想到到了如今,用一款ACGN风格的模型加上特定的指示词,就可以实现像素艺术风格了。
下面来看看横向比较(奇幻世界职业)。不同的职业在画面风格表现上并没有明显的差异(那是当然的)。目前我发现的只有一点:当使用archer(弓箭手)时,图像中倾向于出现红色服装的角色,这可能是受了《Fate》系列中某个Archer阶级角色衣服颜色的影响吧?
以上,就是我针对用于Stable Diffusion的AnimagineXL模型,使用不同游戏风格、游戏主机以及奇幻世界职业相关标签作为提示词时,画面呈现出的风格以及画面表现上的差异的结果汇总和观察。下一次,我将尝试仅以混合提示词的方式来融合2个风格。