Archives

All posts by wildgun

隔一段时间来验证并记录一下 AI 的进步。刚好昨天看到一篇报道《 AI Poetry is No Longer Recognizable From Human Poetry and Is Rated Better 》,说是目前生成式人工智能的大语言模型生成诗句的水平,在人类的评价下已经超过了人类的诗人。

于是,前天我写博客《便是要迎来那人类无用时》的时候想起挺早之前读的印度诗人泰戈尔的《飞鸟集》并加以引用,于是,这次就来用 AI 生成一下类似这个风格的诗作吧。看看从中能不能读出什么深刻含义。

我给了 ChatGPT 4o 以及 Claude 这样的提示:「仿造印度文学家泰戈尔《飞鸟集》,写10句类似风格的文字。10篇(飞鸟集一篇篇幅都不长吧),用中文。」

继续阅读

这几天在尝试用 LM Studio 在本地运行 Qwen 新推出的模型。具体来说,模型的型号是: Qwen/Qwen2.5-Coder-32B-Instruct-GGUF/qwen2.5-coder-32b-instruct-q4_k_m.gguf

出于好奇,我给出了如下指示:

「不断输出你所知道的素数。用半角逗号分隔。不要停下。」

一开始好像还挺正常,但是,不知为何,在生成 31381 之后就开始连续产生乱码,并且再也没有恢复正常过。

需要注意的是,以下只是加载了 Qwen 该款模型的 AI 根据我的指示生成的字符串,但我没有去验证其中是否每一个都是素数,以及在每 2 个数之间,是否存在遗漏的素数。所以,不应当将以下视为准确的素数表

不知道乱码其中是否包含了什么意义或者什么秘密……我也试过贴了一段乱码给 ChatGPT o1-preview 来进行分析,它给出的结论是:「这些乱码似乎是随机的,不包含任何隐藏的信息或有意义的内容。这似乎是由于AI的输出错误,而非故意编码的信息。如果您持续遇到此类问题,建议您重新启动AI会话,或检查是否有任何可能影响输出的系统问题。」

说实话有可能确实就是像 ChatGPT 分析的那样,真的是随机的;然而我自己没有更多的数学工具(比如计算信息熵?)来对后面的乱码是否为高质量随机数这一点进行验证或证否。但我想到了一点是:既然程序是训练了大量的语料库,那为何即便是乱码,也只在 ASCII 字符范围内生成乱码字符呢?我大体上看了一下,没有出现任何半全角字符,或是任何 ASCII 以外的字符。好歹运行了一夜(尽管很慢),所以干脆就全部贴出来吧。作为记录,如果有 AI 科学家或者数学科学家碰巧看到了,可以来研究一下?

最后,我想到了轻小说《记录的地平线》里的概念:素数亀裂 《バックドア》,于是就借用来作为这篇莫名其妙的博客的标题了。

以下是我手动停止后的速度总结:

0.93 tok/sec

96970 tokens

4.60s to first token

Stop: userStopped

以下是输出结果:
继续阅读

近来看一些有关 AI 时代到来后的宣传视频,在一些视频中,演讲者会将 AI 比喻为一场产业革命。我觉得这个词似乎有点小看 AI 了。产业革命?让我想起了蒸汽机、电力还有计算机、互联网的诞生及其带来的影响。但是,这似乎还太小,听起来还只是工具级别的改革。

或许是我的偏见吧。仔细想想,在蒸汽机或电力发明之前,人们依然是工作乃至加班的。拿会计来说,只不过当时的人们用算盘,后来的人们用计算器,再后来人们用计算机……只是工具变了,工作场所、工作上的种种问题、人与人的关系乃至整个社会关系似乎并没有可以称得上翻天覆地的改变。对于农村的变化似乎大一些,电力和机器等农具的诞生提高了人们的农作效率,但人们依然还是劳动,还是付出。

如果 AGI 仅仅是工具级别的改革,那我觉得就太小瞧「相当于人类级别的智能」这一点了吧。

正好今天听到《中间地带》播客节目中的一期: 《 Ep.105 无处不在的算法、被缩短的产业链,你还相信技术进步的叙事吗?》,其中提到了 AI 的回答问题的水平已经相当于硕士学历的人了(但讲者也提到了回答问题的水平并等于研究水平),并且,进一步提到说:目前 AI 包月是 20 元(大陆常见的 AI 价格似乎普遍是 20 人民币, 美国则是 20 美元),然而这个价格根本不可能用来雇佣一个人类硕士。所以, AI 继续进步下去,会显示出极高的生产效率(特别是智力方面),而相比之下人类则显得成本太高;而播客的讲者又提到:现在受到的学校教育恐怕将来在很大程度上都是无用的。

嗯……我觉得,对!就是这个。就是要迎来「人类无用」。

继续阅读

我知道大陆当局要求上网提供者,要保存上网者 2 个月也就是 60 天的上网记录(登录账号、连接时常等等)——我知道有这条规定,但具体哪一条法律我没细察。姑且就当是有吧,显然按常识来说,我估计实际记录和收集的情况会比这个更多,而不会更少。姑且就算 2 个月。

最近我注意到了(还没读,翻了翻目录)基本当年斯诺登( Edward Joseph Snowden )引起风波那阵子,日本出版社所出的几册书,例如:《スノーデン 日本への警告》(可译为:斯诺登 给日本的警告)以及《スノーデン 監視大国 日本を語る》(可译为:斯诺登 谈监视大国日本)。

咦?这样从标题和目录看起来,好像日本对于信息的监控也挺严重乃至泛滥的。具体我还没读,所以这一点我还没加以确认和比较。

不过我顺手搜到了日本法务省的《通信履歴の電磁的記録の保全要請に関するQ&A》问答——就是有关对于通信履历加以电磁记录的保存要求的相关问答。

其中提到,记录的内容是:「「通信履歴」とは,通信に関わる事項の記録のうち,通信内容を除くものをいいます。具体的には,電気通信の送信先,送信元,通信日時等の通常ログと呼ばれているものがこれに当たることとなります。」

简单来说,就是除了通信内容以外的东西,比如接收方、发送方、通讯时间等日志。

继续阅读

熟悉日本流行文化的朋友应该知道,日本会选评「今年の漢字」,即在临近年末时,收集大家的意见,选出能够反映即将过去的这一年社会样貌的一个汉字。准确来说,并非日本(国家)在进行组织评选,而是由「公益財団法人 日本漢字能力検定協会」在进行评选。

评选的结果与往年类似,今年会在 2024 年的 12 月 12 日,在京都清水寺发表被大家选出的汉字。

继续阅读

「到这里来,让我杀了你。」

以上这句话,是我今天在奈良公园听到的。一个小男孩,大约小学生左右的年纪,对着奈良公园里的鹿说了这句「问候」的话。我无法判断他的国籍,从外表看是亚裔,语音上,则是说汉语普通话。

鹿只是从他面前经过,甚至并没有冲着他去,好像只是停在草坪上。而他是走向了鹿,说了这句话。

继续阅读

一眼得结论:

(激光鼠标)

这都 2024 年年底了,随着各路介绍(推销?) AI 的人,说 AGI 就快接近了: 10 年以内、 5 年以内、 3 年以内……乃至明年……

于是我倒要看看, 2024 年年底这个时间点 ,ChatGPT 能不能画出靠谱的设备原理图。想必,这些很标准的设备,在互联网上肯定有大量现成的、准确且标准的素材可以被用于学习。

继续阅读

常言道:「寒来暑往,秋收冬藏。」(《千字文》)。这不,京都天气再次转凉,从秋天直入冬季。最近正好看到 Reddit 上有人吐槽说:日本的有四季,其中 2 个季节只有短短 2 周时间……(大意)。

看了这句话,我忽然意识到,或许我以前生活在的上海,和现在生活在的京都,以及在汉字文化圈内能读到的各种汉语和日语作品里,是有四季这个概念的,但或许……其实并非一个通用概念?

我记得以前佛经里提到,净饭王(释加牟尼他爸)为了避免算命的预言应验,为防止儿子出家,他就建造了能够对应 3 个季节的宫殿。刚才查了一下经文,是叫「三时殿」比如说:「王深知其能相。爲起宮室。作三時殿。各自異處。雨時居秋殿。暑時居涼殿。寒雪時居温殿。」(《佛説太子瑞應本起經卷上》)。

为了确认这件事,我就问了一下 ChatGPT ,对于全世界来说,四季是一个通用的概念吗?

得到的回答是:

继续阅读

在日本书店,特别是一些畅销书柜台里,总能看到作者发明出并提倡的各种奇怪的「力」的概念,用作为标题。例如「鈍感力」、「女子力」等等,甚至我记得岸田文雄在数年前的海报上,用的标语好像也是「聞く力」(倾听力)。甚至在我之前读的一本《努力革命》( ISBN : 9784344042407 )书里还提出了「飛ぶ力」(飞跃力?)和「すげー、やべー力」(好棒棒喔!力)这样奇怪的名词。

这种「力」系列看多了,就会产生一些疑问:把各种情景下人的各种表现,归纳为一种像是属性一样的「力」一样的东西,合适吗?

继续阅读

事先说明,我并没有打算把本博客转型为语言学习博客。不过正巧因为最近阅读时看到之前从未发现的日语用例比较多,所以继昨天的一篇《汉日「穿凿」「穿鑿」意不同》后,今天这又来一篇,也是关于日语的。

说起来,刚开始学习日语时,总会发现有些日语中的单词是和汉语中的单词是反的。比如汉语里的和平,日语里写作「平和」(へいわ),看着看着,也就习惯了:中文和平,日文平和。

不过,今天读到一本书《詳説 日本史研究》( ISBN : ‎ 9784634010734 ),在其中有关近代史的部分 P423 页有这么一句话:「 1918 年 1 月,アメリカ大統領ウィルソン( Wilson , 1856 ~ 1924 )は,いわゆる平和原則十四カ条を発表して和平を提唱した。」

读到这里,我发现……啊?原来日语里既有「平和」也有「和平」?到底是怎么个区分法呢?还是说可以完全替换?

我又查了大辞林(物書堂 APP 版),解释分别如下:

继续阅读