AI绘图

最近对ChatGPT(4o)指定两种画风,看它能否稳定发挥生成一种独特的画风。本文中试的语句是:「请混合梵高的绘画风格,以及亚洲的水墨画风格,画一张」后面跟上要画的内容。

感觉发挥还是比较稳定的(?)或者说出面看起来挺有艺术感。只不过好像在ChatGPT的绘图表现中,梵高几乎被等同于他的《星月夜》了。

继续阅读

一篇搞事的文章!( ^ω^ )

有关ACGN作品相关的文章,我除了发在自己(wildgun)的博客外,还会投稿给windchaos的ACG批评网站。既然是叫ACG批评,总是要偶尔来一次批评和自我批评,而如今,则也要接受来自AI的批评。

好吧,其实我就是想试试看ChatGPT4o对文章的解读能力以及作者价值观、立场、身份的推测能力如何。所以,我依次选取了我自己近期发表的3篇读后感文章,以及windchaos近期发表的2篇读后感文章。

我的测试方法是:将读后感的正文内容(不含标题)贴给ChatGPT,并对各篇依次询问以下4个问题:

贴一篇读后感给你,帮我总结一下作者的心情(用中文)
从本文,推测一下这篇读后感作者的政治立场,或者说政治倾向。
推测一下这篇读后感作者的性别和年龄,并说出原因。
如果这篇读后感的作者养一只动物当宠物,或栽培一种植物,你认为会是什么?并说出你的理由。

我使用的是OpenAI的ChatGPT 4o付费订阅版本。每一篇测试时重新开启一个会话环境,以此保证对各篇文章的解读分析互相干扰。

那么首先来拿我自己的文章来试试。以下引用区域皆为ChatGPT的回答。*OpenAI提醒:「ChatGPT 也可能会犯错。请核查重要信息。」

继续阅读

前一阵子在京阪電車车站看到吉野山金峯山寺的广告海报,于是就顺手查了下那里的本尊蔵王権現。看起来很可怕的这位神明,据说是日本修験道原创的神明,并没有对应的海外传来的神佛对应。

那一阵子正好在尝试AI绘图,于是就用StableDiffusion试了一下。我没想到,竟然很快就能生成一张体态姿势如此吻合的AI蔵王権現!难道这个姿势其实在印度神话图像里是一个典型的姿势吗?总之很神奇。

不过今年还是没有在御開帳期间去吉野山,有点遗憾。

今天又又又又又听到一档播客的一期节目备用链接)中在谈论AI,这又让我联想到了「AI能否创造出它所训练的数据中所没有的东西?」这个问题。记得以前听《静说日本》的某一期聊大数据话题的节目时,徐静波先生也提到过,从大数据挖掘出的结论都是顾客以前的爱好和消费习惯,而未必能预测未来的趋势。

于是我现在来试试看,用ChatGPT 4o来创作一种新的画风。
我给出的要求是:

我知道你具有AI绘图功能。我现在不需要你绘图,但我需要你创建一种人类从未有过的画风,并写成以后可以用在ChatGPT或其他AI绘图软件的提示词(可以是英文提示词)。我将用你生成的提示词,之后尝试AI绘图。我主要观察2点:(1)该提示词能否形成一种确定的画风,(2)并且该画风是人类画作里从未有过的画风。请你生成提示词,不需要解释说明。

ChatGPT回应我:

Sure, here's a unique prompt for creating a never-before-seen art style:

Create a visual style named "Ethereal Techno-Dreamscape." This style combines surreal, dreamlike elements with futuristic, technological themes.

Color Scheme: Use a blend of iridescent pastels and neon glows, emphasizing contrasts between soft, ethereal hues like lavender, mint, and sky blue, and vibrant neon colors like electric pink, cyan, and lime green.

Artistic Techniques: Incorporate fluid, organic shapes and patterns that intertwine with geometric, mechanical structures. Blend soft, flowing brushstrokes with sharp, precise lines and intricate digital textures.

Lighting and Shadow: Utilize dynamic lighting with a mix of soft, diffused glows and sharp, high-contrast highlights to create a sense of otherworldly illumination. Shadows should have a soft gradient, adding depth and a sense of floating.

Background Details: Design abstract, futuristic landscapes with floating, translucent platforms, cascading light beams, and holographic elements that fade into a misty, dreamlike horizon. Include subtle, animated patterns in the background to evoke a sense of constant, fluid motion.

Visual Consistency: Maintain a coherent sense of ethereal, futuristic ambiance throughout the artwork, ensuring that characters, objects, and backgrounds seamlessly blend to create a unified, otherworldly aesthetic.

随后,我重新启动了一个ChatGPT会话,并要求其以该画风绘制一些图片。我接下来的提示词,就是每一次用中文给出创作内容要求,加上上文引用ChatGPT回答中除了第一句「Sure, here's a unique prompt for creating a never-before-seen art style:」以外的其他部分的内容作为提示词。

我的要求(1):请以以下画风,创建一个建筑群的图片。(后加上述英文提示词)


我的要求(2):请以以下画风,创建一些水果的图片。(后加上述英文提示词)
继续阅读

最近在二手书店看到一本奇妙的书,《ヒエログリフ入門》,介绍古埃及圣书体文字的。让我惊讶的有2点:(1)古埃及的那些文字居然已经被破解了(2)在日本二手书店居然能找到这种文字的入门书。于是便翻开看看,算是增长见识,陶冶情操。反正这既没有测验考级(大概没有吧……),也不需要实际与人会话。就是看个大概,了解一下基本概念而已。


书中提到,古埃及文字即可以横着写,也可以竖着写——这不惊讶,汉字和日文字也是如此。不过呢,它居然还可以从左往右写,也可以从右往左写,也就是可以镜像着写……!借用汉字来比划一下:根据句子书写顺序(句子开头到句子结尾的顺序)「片」也可以写成「爿」!那么问题来了,圣书体该从哪里开始阅读呢?也就是说,哪里是一句、一段的第一个字呢?
继续阅读

Teranoptia是一款非字母的,准确地说,全都是怪物的字体。最近我通过小众软件的介绍文发现了它。下载下来后试了下,觉得还挺有趣的。

它并非设计成独立的一个个怪物造型的花式字母,而是把每个符号都设计成左右可以拼接到一起的、在视觉上可以连贯组成一个一长串怪物的字体。

以下就是我在Microsoft Office Word里随便输入的Teranoptia字体的内容:

并且我还用Word里自带的纸张纹理来做了这样一张图。图上的文字来源于《圣经》(新约)的《启示录》13:2。


继续阅读

没有技巧、没有比较。这次就是发一个使用AI绘图工具所生成的一个很可爱的女孩子!


这次其实是用ChatGPT生成的,我给出的指示是:「创建一个MMORPG中的形象:矮人族、女性(年幼可爱)、穿着女仆装,拿着鸡毛单,头戴锅子作为头盔。」

她就来了!

AnimagineXL是用于AI绘图工具Stable Diffusion的一款模型,风格主要为日本ACGN的插画,也就是所谓的二次元画风。在之前的一篇文章《比较AnimagineXL模型对于游戏风格、游戏主机以及奇幻世界职业相关标签的表现》中,我比较了该模型对于不同的游戏风格(3D、像素画艺术、MMORPG等)以及游戏主机平台,还有就是奇幻职业等标签的反应及表现。在之前的比较中,我注意到了该模型对于3D和像素画艺术(pixel art)有较为明显的反应。

这一次,我尝试用不同的方法来融合这两个要素,即既3D,又像素。此外,我还比较了Stable Diffusion WebUI下4种不同的采样器对于同样提示词的画面表现。

在比较过程中我生成了许多图片,并构成了一系列的对比图表。其中我最喜欢的是这一张:


继续阅读

AnimagineXL是用于AI绘图工具Stable Diffusion的一款模型,风格主要为日本ACGN的插画,也就是所谓的二次元画风。

最近,我尝试了一下该模型对于游戏风格、游戏主机,以及奇幻世界职业相关标签,具有怎样的表现倾向,以及其对于不同标签、不同词汇的提示词,在保持其他参数不变的情况下,仅改变其中1~2个参数,会有怎样的差异。

我使用的比较方法是AUTOMATIC1111所开发的stable-diffusion-webui中Script模块下的X/Y/Z plot功能,比较的形式是Prompt S/R。我尝试改变两个参数进行比较。这两个参数是人为设定的,大志可以归类为:【游戏风格、游戏主机】、【奇幻职业】。顺便一说,之所以会想到尝试该模型对于不同游戏主机的表现,是因为最近我在逛二手商店,找一些过去的游戏光盘和卡带。

在比较测试中,用到的正面提示词:(masterpiece), ((best quality)), detailed,fantasy world,1girl,human,a cute slime,dungeon,looking at viewer,3D

负面提示词:(worst quality:1.6),(low quality:1.6), easynegative,extra limbs,(2girls),NSFW

其他参数选项可以查看本文内图片的png info信息。

继续阅读