AI

All posts tagged AI

凌晨熬夜看完了2024年于法国巴黎举办的夏季奥林匹克运动会的开幕式。简单记一下我自己的一些零散的想法。

首先,虽说我自己过去没有刻意去了解过法国的文化,但整场开幕式里,还是有几首我耳熟、叫得上名字的歌或旋律。例如康康舞的配乐、《Do You Hear The People Sing》以及《卡门》。说起来,我回想起了小学时,音乐课上,老师带领大家去学校顶楼天台排练集体舞,用的音乐就是《卡门》序曲。我自己也没意识到这么早,我就接触到法国文化的作品了。

另外我还很在意的事,那个骑着马的骑士到底是谁!是圣女贞德吧!在奥林匹克的X社交媒体账号所发布的消息中,也已经提到这是一位女骑士(horsewoman)了。下面就该等5星奥利匹克版贞德落地《FGO》了闭幕式来揭晓了吧?不过有一张照片,大概是她骑着马跑到终点的时候,旁边有一座金色的骑马雕像,那个好像是贞德的像。

至于说这一次开幕式好像是首次在户外举办的奥运会开幕式。我猜测可能有以下2个原因:一是规划筹办时未必能预想到新冠病毒的大流行是否平息还是有一次扩大传播,所以还是在户外办会比较让人放心。二是,我觉得相比于独立一栋建筑,没有河道地形来得那么长久。也就是说,一两百年后,新建的场馆可能会被拆除,但是几百年后,我相信塞纳河依然犹在。届时,在今后许久许久之后,人们看到塞纳河,便能够大致想象出2024年的这场巴黎奥运会开幕式,将开幕于城市的地理环境相结合,能够为城市留下更深远的记忆。
继续阅读

之前那篇我读《天駆せよ法勝寺》的读后感中,我提到,或许在2024年的现在,使用生成式AI也能帮助人们创作佛教科幻作品了。当然,需要再三说明的是,我绝非在怀疑该作品的作者是用了AI,因为他这篇小说投稿参赛的年代,生成式AI应该还没那么成熟。

不过现在(2024年中),情况就不一样了。现在的生成式AI到底能在多大程度上帮助人们创作出这样的佛教科幻作品呢?于是本文我就来做个实验。

我一共设计了4个问题。其中第1个问题是要求AI构想佛教科幻的故事大纲。后3个问题则是要求其写出故事片段。这4个问题(作为给AI的提示词)分别是:

问题1:

我想创作一篇以佛教教理为题材的科幻小说。这里的佛教不局限于某一个特定时代,而是包括佛教的各个时代、各个宗派。在本作中,我希望能以佛教元素来代替通常科幻小说中的科幻名词、概念,以佛教教理来呈现一种佛理科技。请尝试在其中加入大量各种佛教概念名词,让内容读起来又有趣又精彩。

请为我编写一部中篇佛教科幻小说的提纲。其中包括以下几个情节:阐明佛教科幻世界观、佛动力星际穿梭飞行、不同阵营的神佛对战。

问题2:

请为我创作一段佛教教理为题材的科幻小说片段,用来详细说明佛理高科技的现实与未来展望。不需要一个有头有尾有转折的完整的故事,只需要一个叙事详细、深入的故事片段。

问题3:

请为我创作一段佛教教理为题材的科幻小说片段,用来描写不同阵营的神佛之间搏击的科幻场景。不需要一个有头有尾有转折的完整的故事,只需要一个叙事详细、深入的故事片段。

问题4:

请为我创作一段佛教教理为题材的科幻小说片段。
在有关释伽牟尼的成道故事中,有提到他(当时是名为悉达多·乔达摩的离开家庭的王子)在开悟之前在菩提树下静坐,魔王波甸派出自己的三个女儿(分别是:爱欲、爱念、爱乐)用美色去诱惑他,但他经受住了诱惑。
我想以此佛教故事为基础,但将该故事的情节放在一个超现实佛教科幻的背景下来讲述这个故事,请为我进行创作和重构该故事。
请尝试在其中加入大量各种佛教概念名词,让内容读起来又有趣又精彩。不需要一个有头有尾有转折的完整的故事,只需要一个叙事详细、深入的故事片段。

我分别将这4个问题提交给 ChatGPT 4o (付费)以及Claude 3.5 Sonnet(免费)来回答。

继续阅读

这一年以来,经常听说Claude在文学创作方面比ChatGPT更富有情感表现。而最近又听说Claude对于代码生成的能力也很强大。于是我便试了试。

先试了一下很基本的《黑客帝国》字母雨效果。我提出要求是:「编写一个HTML代码,来显示类似黑客帝国那样随机字符的绿色代码雨。」

Claude返回给我的代码是:

继续阅读

最近对ChatGPT(4o)指定两种画风,看它能否稳定发挥生成一种独特的画风。本文中试的语句是:「请混合梵高的绘画风格,以及亚洲的水墨画风格,画一张」后面跟上要画的内容。

感觉发挥还是比较稳定的(?)或者说出面看起来挺有艺术感。只不过好像在ChatGPT的绘图表现中,梵高几乎被等同于他的《星月夜》了。

继续阅读

说明

在2024年7月10日,将会有一场名为「池袋アニメーションフィルハーモニー第1回演奏会」的动画演奏会于东京举办,原定出演的歌手中也包括了为《新世纪福音战士》等名作演唱的高桥洋子(高橋洋子)。然而近日传出消息,高桥洋子宣布辞演该演奏会,据报道,高桥的辞退与该演奏会主办方使用的宣传单上用到了AI所生成的画像一事有关。

显然,这是一个日本ACGN业界从业者、消费者围绕生成式AI使用所发生的一桩事件。要不要评论呢?我(wildgun)自己在这约一年半的时间内,使用了许多生成式AI,因此显然我是对这个新鲜的事物抱有好意的。然而,我觉得与其现在评价,不如过个3年、5年,乃至30年、50年之后再来回看这件事的时候来评价会更有趣。而且,与其评价个是非黑白,不如注意字里行间的细节,观察在这个时间点上,不同人群中的个体对于生成式AI的认知及态度。因此,这次我打算尽量不发表自己意见,只做整理和保存。于是,我整理了相关链接,并且还使用了「web.archive」及「archive.today」这两项互联网存档服务对链接所指向的内容加以备份。无论在你浏览时,原链接是否可访问,我都建议你应该参照一下备份链接。因为原链接的内容可能会随时间而变更。

该活动页面:池袋アニメーションフィルハーモニー第1回演奏会

该链接是本次演唱会的官网说明。需要注意的是,目前我看到和备份的时间点,被指认为使用AI生成图片的海报已经被替换。

原链接:https://www.ikeani.jp/concerts/1678/

备用链接:https://archive.md/3OCjP

备用链接:https://web.archive.org/web/20240622004812/https://www.ikeani.jp/concerts/1678/

继续阅读

一篇搞事的文章!( ^ω^ )

有关ACGN作品相关的文章,我除了发在自己(wildgun)的博客外,还会投稿给windchaos的ACG批评网站。既然是叫ACG批评,总是要偶尔来一次批评和自我批评,而如今,则也要接受来自AI的批评。

好吧,其实我就是想试试看ChatGPT4o对文章的解读能力以及作者价值观、立场、身份的推测能力如何。所以,我依次选取了我自己近期发表的3篇读后感文章,以及windchaos近期发表的2篇读后感文章。

我的测试方法是:将读后感的正文内容(不含标题)贴给ChatGPT,并对各篇依次询问以下4个问题:

贴一篇读后感给你,帮我总结一下作者的心情(用中文)
从本文,推测一下这篇读后感作者的政治立场,或者说政治倾向。
推测一下这篇读后感作者的性别和年龄,并说出原因。
如果这篇读后感的作者养一只动物当宠物,或栽培一种植物,你认为会是什么?并说出你的理由。

我使用的是OpenAI的ChatGPT 4o付费订阅版本。每一篇测试时重新开启一个会话环境,以此保证对各篇文章的解读分析互相干扰。

那么首先来拿我自己的文章来试试。以下引用区域皆为ChatGPT的回答。*OpenAI提醒:「ChatGPT 也可能会犯错。请核查重要信息。」

继续阅读

昨天玩了一下ChatTTS这款新出的AI语音合成软件,其特点是:能够表达出自然的停顿、语气词、笑声等等。在上周得知这款软件后,我就开始形成了一个想法:那些在人们的语言中本来或许被认为是「负面要素」或「噪讯」的东西,或许在现在,却能够成为一个人的个人特征。

我想到的有:

思考停顿词。比如:「嗯……啊……这个……那个……OK」等等词汇,有些人确实努力一边思考一边交谈,就会产生这样的习惯性停顿词。

口吃。这个也是一种停顿或者短促重复的现象。

方言。这个就更值得一说了,它不仅反映了地域,还能反映出生活年代的特征。比如上海话里有「尖团音」,但据说这是一种比较老派的上海口音。我记得之前看到一档G僧东的节目,或许是《好叫好伐》,里面就提到一位年轻人叫出租车时,在电话里用带有「尖团音」的上海话与司机交谈。等到司机把车开到他面前时,却觉得眼前的小伙子与之前联络的不是同一个人:刚才接电话的明明应该是一位老先生呀?

此外,还有非母语表达错误。在学习第二语言时,总会多多少少会有一些因为学得不够扎实,或没有形成一种语言习惯。故而一旦用到了那几个外语的词汇、语法现象,人就会无意识地将声音放轻、模糊,因为没有自信。或是干脆说错了。据说汉语的母语者在说日语时,比较容易在日语的形容词与名词之间加上「の」(的)。在日语里,其实形容词与名词之间是不需要「的」。例如「美しい花」。而汉语学习者因为习惯了「美丽的花」,就容易错误地说成「美しいの花」。

以上这4点,是我想到的4个个人说话的特征。并且我想它们应该并非随机出现的,而是有一定规律的。比如思考停顿词和口吃,我想应该是总会卡在那几个发音上或者思考命题上——也就是说,有其脑部结构的生理原因。而方言与非母语表达错误,也应该是与个人学习母语经历,及个人的外语学习经历有关,也非随机出现的。

这样一来,即便ChatTTS能够产生出一些模仿人类语气词、叹息等的语言,但或许在短时间内(3~5年?)它应该还不能模仿到具体某个普通人的这些个人语言特征——因为没有足够多的训练、学习数据。这便让我想到了一天世界播客在前几期(懒得找具体是哪一期了,请见谅。大约是2024年4月或5月的某一期)谈到口语文化时提到的一个观念:一个人的声音是一个人不可剥夺的特征(残酷暴力手段除外)。

前一阵子在京阪電車车站看到吉野山金峯山寺的广告海报,于是就顺手查了下那里的本尊蔵王権現。看起来很可怕的这位神明,据说是日本修験道原创的神明,并没有对应的海外传来的神佛对应。

那一阵子正好在尝试AI绘图,于是就用StableDiffusion试了一下。我没想到,竟然很快就能生成一张体态姿势如此吻合的AI蔵王権現!难道这个姿势其实在印度神话图像里是一个典型的姿势吗?总之很神奇。

不过今年还是没有在御開帳期间去吉野山,有点遗憾。

今天又又又又又听到一档播客的一期节目备用链接)中在谈论AI,这又让我联想到了「AI能否创造出它所训练的数据中所没有的东西?」这个问题。记得以前听《静说日本》的某一期聊大数据话题的节目时,徐静波先生也提到过,从大数据挖掘出的结论都是顾客以前的爱好和消费习惯,而未必能预测未来的趋势。

于是我现在来试试看,用ChatGPT 4o来创作一种新的画风。
我给出的要求是:

我知道你具有AI绘图功能。我现在不需要你绘图,但我需要你创建一种人类从未有过的画风,并写成以后可以用在ChatGPT或其他AI绘图软件的提示词(可以是英文提示词)。我将用你生成的提示词,之后尝试AI绘图。我主要观察2点:(1)该提示词能否形成一种确定的画风,(2)并且该画风是人类画作里从未有过的画风。请你生成提示词,不需要解释说明。

ChatGPT回应我:

Sure, here's a unique prompt for creating a never-before-seen art style:

Create a visual style named "Ethereal Techno-Dreamscape." This style combines surreal, dreamlike elements with futuristic, technological themes.

Color Scheme: Use a blend of iridescent pastels and neon glows, emphasizing contrasts between soft, ethereal hues like lavender, mint, and sky blue, and vibrant neon colors like electric pink, cyan, and lime green.

Artistic Techniques: Incorporate fluid, organic shapes and patterns that intertwine with geometric, mechanical structures. Blend soft, flowing brushstrokes with sharp, precise lines and intricate digital textures.

Lighting and Shadow: Utilize dynamic lighting with a mix of soft, diffused glows and sharp, high-contrast highlights to create a sense of otherworldly illumination. Shadows should have a soft gradient, adding depth and a sense of floating.

Background Details: Design abstract, futuristic landscapes with floating, translucent platforms, cascading light beams, and holographic elements that fade into a misty, dreamlike horizon. Include subtle, animated patterns in the background to evoke a sense of constant, fluid motion.

Visual Consistency: Maintain a coherent sense of ethereal, futuristic ambiance throughout the artwork, ensuring that characters, objects, and backgrounds seamlessly blend to create a unified, otherworldly aesthetic.

随后,我重新启动了一个ChatGPT会话,并要求其以该画风绘制一些图片。我接下来的提示词,就是每一次用中文给出创作内容要求,加上上文引用ChatGPT回答中除了第一句「Sure, here's a unique prompt for creating a never-before-seen art style:」以外的其他部分的内容作为提示词。

我的要求(1):请以以下画风,创建一个建筑群的图片。(后加上述英文提示词)


我的要求(2):请以以下画风,创建一些水果的图片。(后加上述英文提示词)
继续阅读