一眼得结论:
(激光鼠标)
这都 2024 年年底了,随着各路介绍(推销?) AI 的人,说 AGI 就快接近了: 10 年以内、 5 年以内、 3 年以内……乃至明年……
于是我倒要看看, 2024 年年底这个时间点 ,ChatGPT 能不能画出靠谱的设备原理图。想必,这些很标准的设备,在互联网上肯定有大量现成的、准确且标准的素材可以被用于学习。
去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。
于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。
这次自问自答的是:第三题:哎呀,扣子扣错了。
太难了!试了 10 张以上,都没能成功画出扣错扣子没对齐的样子!即便是让 Claude 生成英文的提示词,还是很难达到我想要的效果。
看来对于并非常态的图片数据训练还远远不足啊……
和上一次用 ChatGPT 创造自画像类似,这几天看到 reddit 上一个帖子启发,说以类似的方式,让 ChatGPT 参考对我保存的记忆(即用户数据),而画一张我宿敌的肖像。
它给我画出的是:
并附说明:「Here is the image of your arch nemesis, embodying intellect and mystery, with an aura of knowledge and time manipulation. 」
翻译过来就是:「这是你的死敌的形象,体现了智慧和神秘,拥有知识和操纵时间的光环。」
呃……不太可爱。好吧,有点凶。
于是我又指示画了一张女性版本的我的宿敌:
去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。
于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。
这次自问自答的是:第五题 透过烧瓶看
尝试生成的第二张就挺好了!
要说第一张怎么样嘛……它长这样的:
自从生称图片的AI问世之后,就看到一些视频制作者用AI图片作为抠图后的合成背景。虽然我自己不做视频,但是觉得这也挺有趣的。加之这一年来参观博物馆、读展览会图录较多,多多少少也了解了一些日本美术作品的流派和由来。于是这次就来试一下用ChatGPT创作一些适合用于视频背景的底图。
为什么要选用浮世绘风格的?因为看近世的浮世绘可以发现,那确实是一种既用来表现人物,也用来表现场景的作品种类。比如不少浮世绘画家就创作过以东海道,以及富士山为题材的风景作品。
那么这次我也来尝试一下。题材嘛,自然是要结合当下的AI啦。
最近尝试了一下,让ChatGPT生成了一些分形艺术图(fractal art)。试了各种题材,感觉好像最棒的、最让我眼前一亮的还是……克苏鲁以及章鱼的造型!果然是无名恐惧嘛……
普通的(?)章鱼
继续阅读
最近对ChatGPT(4o)指定两种画风,看它能否稳定发挥生成一种独特的画风。本文中试的语句是:「请混合梵高的绘画风格,以及亚洲的水墨画风格,画一张」后面跟上要画的内容。
感觉发挥还是比较稳定的(?)或者说出面看起来挺有艺术感。只不过好像在ChatGPT的绘图表现中,梵高几乎被等同于他的《星月夜》了。
前一阵子在京阪電車车站看到吉野山金峯山寺的广告海报,于是就顺手查了下那里的本尊蔵王権現。看起来很可怕的这位神明,据说是日本修験道原创的神明,并没有对应的海外传来的神佛对应。
那一阵子正好在尝试AI绘图,于是就用StableDiffusion试了一下。我没想到,竟然很快就能生成一张体态姿势如此吻合的AI蔵王権現!难道这个姿势其实在印度神话图像里是一个典型的姿势吗?总之很神奇。
不过今年还是没有在御開帳期间去吉野山,有点遗憾。
今天又又又又又听到一档播客的一期节目(备用链接)中在谈论AI,这又让我联想到了「AI能否创造出它所训练的数据中所没有的东西?」这个问题。记得以前听《静说日本》的某一期聊大数据话题的节目时,徐静波先生也提到过,从大数据挖掘出的结论都是顾客以前的爱好和消费习惯,而未必能预测未来的趋势。
于是我现在来试试看,用ChatGPT 4o来创作一种新的画风。
我给出的要求是:
我知道你具有AI绘图功能。我现在不需要你绘图,但我需要你创建一种人类从未有过的画风,并写成以后可以用在ChatGPT或其他AI绘图软件的提示词(可以是英文提示词)。我将用你生成的提示词,之后尝试AI绘图。我主要观察2点:(1)该提示词能否形成一种确定的画风,(2)并且该画风是人类画作里从未有过的画风。请你生成提示词,不需要解释说明。
ChatGPT回应我:
Sure, here's a unique prompt for creating a never-before-seen art style:
Create a visual style named "Ethereal Techno-Dreamscape." This style combines surreal, dreamlike elements with futuristic, technological themes.
Color Scheme: Use a blend of iridescent pastels and neon glows, emphasizing contrasts between soft, ethereal hues like lavender, mint, and sky blue, and vibrant neon colors like electric pink, cyan, and lime green.
Artistic Techniques: Incorporate fluid, organic shapes and patterns that intertwine with geometric, mechanical structures. Blend soft, flowing brushstrokes with sharp, precise lines and intricate digital textures.
Lighting and Shadow: Utilize dynamic lighting with a mix of soft, diffused glows and sharp, high-contrast highlights to create a sense of otherworldly illumination. Shadows should have a soft gradient, adding depth and a sense of floating.
Background Details: Design abstract, futuristic landscapes with floating, translucent platforms, cascading light beams, and holographic elements that fade into a misty, dreamlike horizon. Include subtle, animated patterns in the background to evoke a sense of constant, fluid motion.
Visual Consistency: Maintain a coherent sense of ethereal, futuristic ambiance throughout the artwork, ensuring that characters, objects, and backgrounds seamlessly blend to create a unified, otherworldly aesthetic.
随后,我重新启动了一个ChatGPT会话,并要求其以该画风绘制一些图片。我接下来的提示词,就是每一次用中文给出创作内容要求,加上上文引用ChatGPT回答中除了第一句「Sure, here's a unique prompt for creating a never-before-seen art style:」以外的其他部分的内容作为提示词。
我的要求(1):请以以下画风,创建一个建筑群的图片。(后加上述英文提示词)
我的要求(2):请以以下画风,创建一些水果的图片。(后加上述英文提示词)
继续阅读
(图片使用ChatGPT创作。请不要太在意手指数量……)
前几天在书店里看到一本书——《BLと中国》(ISBN:978-4823412295),它被摆放在了新发售书刊的台子上,应该是最近刚发售的吧。翻了下目录和内容,它介绍的应该不是现实中男同性恋在中国社会的情况,而是有关描写男性同性爱的虚构故事作品在中国社会中的情况。
不过我没有立即买下,为什么呢?因为日本不少研究书,其实是这样的:一些博士将自己的博士论文,经过一些修改后,交给出版社,出版成书向大众销售。所以,只要找到博士的论文,就可以读到与书中差不多的内容。而日本的博士论文,有一些会免费公开于互联网上。