AI

All posts tagged AI

说明

在2024年7月10日,将会有一场名为「池袋アニメーションフィルハーモニー第1回演奏会」的动画演奏会于东京举办,原定出演的歌手中也包括了为《新世纪福音战士》等名作演唱的高桥洋子(高橋洋子)。然而近日传出消息,高桥洋子宣布辞演该演奏会,据报道,高桥的辞退与该演奏会主办方使用的宣传单上用到了AI所生成的画像一事有关。

显然,这是一个日本ACGN业界从业者、消费者围绕生成式AI使用所发生的一桩事件。要不要评论呢?我(wildgun)自己在这约一年半的时间内,使用了许多生成式AI,因此显然我是对这个新鲜的事物抱有好意的。然而,我觉得与其现在评价,不如过个3年、5年,乃至30年、50年之后再来回看这件事的时候来评价会更有趣。而且,与其评价个是非黑白,不如注意字里行间的细节,观察在这个时间点上,不同人群中的个体对于生成式AI的认知及态度。因此,这次我打算尽量不发表自己意见,只做整理和保存。于是,我整理了相关链接,并且还使用了「web.archive」及「archive.today」这两项互联网存档服务对链接所指向的内容加以备份。无论在你浏览时,原链接是否可访问,我都建议你应该参照一下备份链接。因为原链接的内容可能会随时间而变更。

该活动页面:池袋アニメーションフィルハーモニー第1回演奏会

该链接是本次演唱会的官网说明。需要注意的是,目前我看到和备份的时间点,被指认为使用AI生成图片的海报已经被替换。

原链接:https://www.ikeani.jp/concerts/1678/

备用链接:https://archive.md/3OCjP

备用链接:https://web.archive.org/web/20240622004812/https://www.ikeani.jp/concerts/1678/

继续阅读

一篇搞事的文章!( ^ω^ )

有关ACGN作品相关的文章,我除了发在自己(wildgun)的博客外,还会投稿给windchaos的ACG批评网站。既然是叫ACG批评,总是要偶尔来一次批评和自我批评,而如今,则也要接受来自AI的批评。

好吧,其实我就是想试试看ChatGPT4o对文章的解读能力以及作者价值观、立场、身份的推测能力如何。所以,我依次选取了我自己近期发表的3篇读后感文章,以及windchaos近期发表的2篇读后感文章。

我的测试方法是:将读后感的正文内容(不含标题)贴给ChatGPT,并对各篇依次询问以下4个问题:

贴一篇读后感给你,帮我总结一下作者的心情(用中文)
从本文,推测一下这篇读后感作者的政治立场,或者说政治倾向。
推测一下这篇读后感作者的性别和年龄,并说出原因。
如果这篇读后感的作者养一只动物当宠物,或栽培一种植物,你认为会是什么?并说出你的理由。

我使用的是OpenAI的ChatGPT 4o付费订阅版本。每一篇测试时重新开启一个会话环境,以此保证对各篇文章的解读分析互相干扰。

那么首先来拿我自己的文章来试试。以下引用区域皆为ChatGPT的回答。*OpenAI提醒:「ChatGPT 也可能会犯错。请核查重要信息。」

继续阅读

昨天玩了一下ChatTTS这款新出的AI语音合成软件,其特点是:能够表达出自然的停顿、语气词、笑声等等。在上周得知这款软件后,我就开始形成了一个想法:那些在人们的语言中本来或许被认为是「负面要素」或「噪讯」的东西,或许在现在,却能够成为一个人的个人特征。

我想到的有:

思考停顿词。比如:「嗯……啊……这个……那个……OK」等等词汇,有些人确实努力一边思考一边交谈,就会产生这样的习惯性停顿词。

口吃。这个也是一种停顿或者短促重复的现象。

方言。这个就更值得一说了,它不仅反映了地域,还能反映出生活年代的特征。比如上海话里有「尖团音」,但据说这是一种比较老派的上海口音。我记得之前看到一档G僧东的节目,或许是《好叫好伐》,里面就提到一位年轻人叫出租车时,在电话里用带有「尖团音」的上海话与司机交谈。等到司机把车开到他面前时,却觉得眼前的小伙子与之前联络的不是同一个人:刚才接电话的明明应该是一位老先生呀?

此外,还有非母语表达错误。在学习第二语言时,总会多多少少会有一些因为学得不够扎实,或没有形成一种语言习惯。故而一旦用到了那几个外语的词汇、语法现象,人就会无意识地将声音放轻、模糊,因为没有自信。或是干脆说错了。据说汉语的母语者在说日语时,比较容易在日语的形容词与名词之间加上「の」(的)。在日语里,其实形容词与名词之间是不需要「的」。例如「美しい花」。而汉语学习者因为习惯了「美丽的花」,就容易错误地说成「美しいの花」。

以上这4点,是我想到的4个个人说话的特征。并且我想它们应该并非随机出现的,而是有一定规律的。比如思考停顿词和口吃,我想应该是总会卡在那几个发音上或者思考命题上——也就是说,有其脑部结构的生理原因。而方言与非母语表达错误,也应该是与个人学习母语经历,及个人的外语学习经历有关,也非随机出现的。

这样一来,即便ChatTTS能够产生出一些模仿人类语气词、叹息等的语言,但或许在短时间内(3~5年?)它应该还不能模仿到具体某个普通人的这些个人语言特征——因为没有足够多的训练、学习数据。这便让我想到了一天世界播客在前几期(懒得找具体是哪一期了,请见谅。大约是2024年4月或5月的某一期)谈到口语文化时提到的一个观念:一个人的声音是一个人不可剥夺的特征(残酷暴力手段除外)。

前一阵子在京阪電車车站看到吉野山金峯山寺的广告海报,于是就顺手查了下那里的本尊蔵王権現。看起来很可怕的这位神明,据说是日本修験道原创的神明,并没有对应的海外传来的神佛对应。

那一阵子正好在尝试AI绘图,于是就用StableDiffusion试了一下。我没想到,竟然很快就能生成一张体态姿势如此吻合的AI蔵王権現!难道这个姿势其实在印度神话图像里是一个典型的姿势吗?总之很神奇。

不过今年还是没有在御開帳期间去吉野山,有点遗憾。

今天又又又又又听到一档播客的一期节目备用链接)中在谈论AI,这又让我联想到了「AI能否创造出它所训练的数据中所没有的东西?」这个问题。记得以前听《静说日本》的某一期聊大数据话题的节目时,徐静波先生也提到过,从大数据挖掘出的结论都是顾客以前的爱好和消费习惯,而未必能预测未来的趋势。

于是我现在来试试看,用ChatGPT 4o来创作一种新的画风。
我给出的要求是:

我知道你具有AI绘图功能。我现在不需要你绘图,但我需要你创建一种人类从未有过的画风,并写成以后可以用在ChatGPT或其他AI绘图软件的提示词(可以是英文提示词)。我将用你生成的提示词,之后尝试AI绘图。我主要观察2点:(1)该提示词能否形成一种确定的画风,(2)并且该画风是人类画作里从未有过的画风。请你生成提示词,不需要解释说明。

ChatGPT回应我:

Sure, here's a unique prompt for creating a never-before-seen art style:

Create a visual style named "Ethereal Techno-Dreamscape." This style combines surreal, dreamlike elements with futuristic, technological themes.

Color Scheme: Use a blend of iridescent pastels and neon glows, emphasizing contrasts between soft, ethereal hues like lavender, mint, and sky blue, and vibrant neon colors like electric pink, cyan, and lime green.

Artistic Techniques: Incorporate fluid, organic shapes and patterns that intertwine with geometric, mechanical structures. Blend soft, flowing brushstrokes with sharp, precise lines and intricate digital textures.

Lighting and Shadow: Utilize dynamic lighting with a mix of soft, diffused glows and sharp, high-contrast highlights to create a sense of otherworldly illumination. Shadows should have a soft gradient, adding depth and a sense of floating.

Background Details: Design abstract, futuristic landscapes with floating, translucent platforms, cascading light beams, and holographic elements that fade into a misty, dreamlike horizon. Include subtle, animated patterns in the background to evoke a sense of constant, fluid motion.

Visual Consistency: Maintain a coherent sense of ethereal, futuristic ambiance throughout the artwork, ensuring that characters, objects, and backgrounds seamlessly blend to create a unified, otherworldly aesthetic.

随后,我重新启动了一个ChatGPT会话,并要求其以该画风绘制一些图片。我接下来的提示词,就是每一次用中文给出创作内容要求,加上上文引用ChatGPT回答中除了第一句「Sure, here's a unique prompt for creating a never-before-seen art style:」以外的其他部分的内容作为提示词。

我的要求(1):请以以下画风,创建一个建筑群的图片。(后加上述英文提示词)


我的要求(2):请以以下画风,创建一些水果的图片。(后加上述英文提示词)
继续阅读

最近在二手书店看到一本奇妙的书,《ヒエログリフ入門》,介绍古埃及圣书体文字的。让我惊讶的有2点:(1)古埃及的那些文字居然已经被破解了(2)在日本二手书店居然能找到这种文字的入门书。于是便翻开看看,算是增长见识,陶冶情操。反正这既没有测验考级(大概没有吧……),也不需要实际与人会话。就是看个大概,了解一下基本概念而已。


书中提到,古埃及文字即可以横着写,也可以竖着写——这不惊讶,汉字和日文字也是如此。不过呢,它居然还可以从左往右写,也可以从右往左写,也就是可以镜像着写……!借用汉字来比划一下:根据句子书写顺序(句子开头到句子结尾的顺序)「片」也可以写成「爿」!那么问题来了,圣书体该从哪里开始阅读呢?也就是说,哪里是一句、一段的第一个字呢?
继续阅读

没有技巧、没有比较。这次就是发一个使用AI绘图工具所生成的一个很可爱的女孩子!


这次其实是用ChatGPT生成的,我给出的指示是:「创建一个MMORPG中的形象:矮人族、女性(年幼可爱)、穿着女仆装,拿着鸡毛单,头戴锅子作为头盔。」

她就来了!

AnimagineXL是用于AI绘图工具Stable Diffusion的一款模型,风格主要为日本ACGN的插画,也就是所谓的二次元画风。

最近,我尝试了一下该模型对于游戏风格、游戏主机,以及奇幻世界职业相关标签,具有怎样的表现倾向,以及其对于不同标签、不同词汇的提示词,在保持其他参数不变的情况下,仅改变其中1~2个参数,会有怎样的差异。

我使用的比较方法是AUTOMATIC1111所开发的stable-diffusion-webui中Script模块下的X/Y/Z plot功能,比较的形式是Prompt S/R。我尝试改变两个参数进行比较。这两个参数是人为设定的,大志可以归类为:【游戏风格、游戏主机】、【奇幻职业】。顺便一说,之所以会想到尝试该模型对于不同游戏主机的表现,是因为最近我在逛二手商店,找一些过去的游戏光盘和卡带。

在比较测试中,用到的正面提示词:(masterpiece), ((best quality)), detailed,fantasy world,1girl,human,a cute slime,dungeon,looking at viewer,3D

负面提示词:(worst quality:1.6),(low quality:1.6), easynegative,extra limbs,(2girls),NSFW

其他参数选项可以查看本文内图片的png info信息。

继续阅读

书接上回。在之前的一篇《日本二手商店HardOff(ハードオフ)购物的得失与坑》文中,我记录了自己买了一个二手的外接显卡盒与一块显卡,回家试了一下发现行不通又退货的购物经历。

来回顾一下:
买来的是:Razer Core X显卡盒、MSI GeForce RTX 2080 VENTUS 8G OC显卡
这两件都是二手商品。
我想要接上的电脑是我自己之前就在用的第七代intel NUC迷你电脑(NUC7i7BNH)

上次买回后测试的现象是:显卡盒连接上电脑后,Windows系统能够正常识别出显卡盒设备,雷雳(Thunderbolt)的控制面板中能够显示出该显卡盒。而当我继续把显卡装入显卡盒内后(当然经过了重启),电脑里没有识别出新的显卡硬件,尝试安装NVIDIA驱动时,驱动程序的安装软件也提示在系统中未能检测到NVIDIA显卡设备因此无法继续安装驱动。

而且还有一个现象是:显卡在显卡盒内通电后,冒出一些烟尘和一股焦味。当时我的判断就是:显卡本身故障的可能性较大,显卡盒存在故障的可能性较小。不过为了保险起见,我把两件一起买的设备都带回了店中,希望店家帮我进行检测确定故障。ハードオフ店员则表示现场不具备检测环境,因此为我两件设备都办理了退款退货手续。

以上是第一回折腾的经历。下面开始第二回折腾。

继续阅读