AI

All posts tagged AI

这几天在尝试用 LM Studio 在本地运行 Qwen 新推出的模型。具体来说,模型的型号是: Qwen/Qwen2.5-Coder-32B-Instruct-GGUF/qwen2.5-coder-32b-instruct-q4_k_m.gguf

出于好奇,我给出了如下指示:

「不断输出你所知道的素数。用半角逗号分隔。不要停下。」

一开始好像还挺正常,但是,不知为何,在生成 31381 之后就开始连续产生乱码,并且再也没有恢复正常过。

需要注意的是,以下只是加载了 Qwen 该款模型的 AI 根据我的指示生成的字符串,但我没有去验证其中是否每一个都是素数,以及在每 2 个数之间,是否存在遗漏的素数。所以,不应当将以下视为准确的素数表

不知道乱码其中是否包含了什么意义或者什么秘密……我也试过贴了一段乱码给 ChatGPT o1-preview 来进行分析,它给出的结论是:「这些乱码似乎是随机的,不包含任何隐藏的信息或有意义的内容。这似乎是由于AI的输出错误,而非故意编码的信息。如果您持续遇到此类问题,建议您重新启动AI会话,或检查是否有任何可能影响输出的系统问题。」

说实话有可能确实就是像 ChatGPT 分析的那样,真的是随机的;然而我自己没有更多的数学工具(比如计算信息熵?)来对后面的乱码是否为高质量随机数这一点进行验证或证否。但我想到了一点是:既然程序是训练了大量的语料库,那为何即便是乱码,也只在 ASCII 字符范围内生成乱码字符呢?我大体上看了一下,没有出现任何半全角字符,或是任何 ASCII 以外的字符。好歹运行了一夜(尽管很慢),所以干脆就全部贴出来吧。作为记录,如果有 AI 科学家或者数学科学家碰巧看到了,可以来研究一下?

最后,我想到了轻小说《记录的地平线》里的概念:素数亀裂 《バックドア》,于是就借用来作为这篇莫名其妙的博客的标题了。

以下是我手动停止后的速度总结:

0.93 tok/sec

96970 tokens

4.60s to first token

Stop: userStopped

以下是输出结果:
继续阅读

近来看一些有关 AI 时代到来后的宣传视频,在一些视频中,演讲者会将 AI 比喻为一场产业革命。我觉得这个词似乎有点小看 AI 了。产业革命?让我想起了蒸汽机、电力还有计算机、互联网的诞生及其带来的影响。但是,这似乎还太小,听起来还只是工具级别的改革。

或许是我的偏见吧。仔细想想,在蒸汽机或电力发明之前,人们依然是工作乃至加班的。拿会计来说,只不过当时的人们用算盘,后来的人们用计算器,再后来人们用计算机……只是工具变了,工作场所、工作上的种种问题、人与人的关系乃至整个社会关系似乎并没有可以称得上翻天覆地的改变。对于农村的变化似乎大一些,电力和机器等农具的诞生提高了人们的农作效率,但人们依然还是劳动,还是付出。

如果 AGI 仅仅是工具级别的改革,那我觉得就太小瞧「相当于人类级别的智能」这一点了吧。

正好今天听到《中间地带》播客节目中的一期: 《 Ep.105 无处不在的算法、被缩短的产业链,你还相信技术进步的叙事吗?》,其中提到了 AI 的回答问题的水平已经相当于硕士学历的人了(但讲者也提到了回答问题的水平并等于研究水平),并且,进一步提到说:目前 AI 包月是 20 元(大陆常见的 AI 价格似乎普遍是 20 人民币, 美国则是 20 美元),然而这个价格根本不可能用来雇佣一个人类硕士。所以, AI 继续进步下去,会显示出极高的生产效率(特别是智力方面),而相比之下人类则显得成本太高;而播客的讲者又提到:现在受到的学校教育恐怕将来在很大程度上都是无用的。

嗯……我觉得,对!就是这个。就是要迎来「人类无用」。

继续阅读

「到这里来,让我杀了你。」

以上这句话,是我今天在奈良公园听到的。一个小男孩,大约小学生左右的年纪,对着奈良公园里的鹿说了这句「问候」的话。我无法判断他的国籍,从外表看是亚裔,语音上,则是说汉语普通话。

鹿只是从他面前经过,甚至并没有冲着他去,好像只是停在草坪上。而他是走向了鹿,说了这句话。

继续阅读

一眼得结论:

(激光鼠标)

这都 2024 年年底了,随着各路介绍(推销?) AI 的人,说 AGI 就快接近了: 10 年以内、 5 年以内、 3 年以内……乃至明年……

于是我倒要看看, 2024 年年底这个时间点 ,ChatGPT 能不能画出靠谱的设备原理图。想必,这些很标准的设备,在互联网上肯定有大量现成的、准确且标准的素材可以被用于学习。

继续阅读

常言道:「寒来暑往,秋收冬藏。」(《千字文》)。这不,京都天气再次转凉,从秋天直入冬季。最近正好看到 Reddit 上有人吐槽说:日本的有四季,其中 2 个季节只有短短 2 周时间……(大意)。

看了这句话,我忽然意识到,或许我以前生活在的上海,和现在生活在的京都,以及在汉字文化圈内能读到的各种汉语和日语作品里,是有四季这个概念的,但或许……其实并非一个通用概念?

我记得以前佛经里提到,净饭王(释加牟尼他爸)为了避免算命的预言应验,为防止儿子出家,他就建造了能够对应 3 个季节的宫殿。刚才查了一下经文,是叫「三时殿」比如说:「王深知其能相。爲起宮室。作三時殿。各自異處。雨時居秋殿。暑時居涼殿。寒雪時居温殿。」(《佛説太子瑞應本起經卷上》)。

为了确认这件事,我就问了一下 ChatGPT ,对于全世界来说,四季是一个通用的概念吗?

得到的回答是:

继续阅读

最近看到一条新闻,是 Linus Torvalds 接受媒体 TFIR 采访,提到他认为现在科技市场上有关 AI 的内容, 10% 是真的,而剩下 9 成是炒作。不过在视频中,在说出这个 1 比 9 的话题之前他也提到:他相信 AI 真的很有趣,也相信 AI 确实会改变世界。但同时他也讨厌科技界市场的炒作周期(比如以前是比特币……等等)。而在此后,他也提到了另一个数字:他认为在 5 之内,情况会发生变化,到时候人就就会知道,到底哪些 AI 能进入人们的日常生活中,而哪些则只是例如现在 ChatGPT 又推出了某某功能那样的炒作。

哦,有趣。那么,针对他提到的这个 10% 是真正有价值的东西(其他都是炒作),那么我来问问 AI ,看看 AI 对于这 10% 的内容给出则样的理解和回答。

我的提问是:

1、你如何理解和评价 Linus Torvalds 的这番话?
2、你认为 Linus Torvalds 所说的 10% 真的、有价值的部分,可能是指哪些应用、功能?
3、你认为整个 Linux 生态和开源生态在从今往后的 AI 特别是生成式 AI 发展过程中能起到哪些作用?

继续阅读

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第三题:哎呀,扣子扣错了。

太难了!试了 10 张以上,都没能成功画出扣错扣子没对齐的样子!即便是让 Claude 生成英文的提示词,还是很难达到我想要的效果。

看来对于并非常态的图片数据训练还远远不足啊……

上一次用 ChatGPT 创造自画像类似,这几天看到 reddit 上一个帖子启发,说以类似的方式,让 ChatGPT 参考对我保存的记忆(即用户数据),而画一张我宿敌的肖像。

它给我画出的是:

并附说明:「Here is the image of your arch nemesis, embodying intellect and mystery, with an aura of knowledge and time manipulation. 」

翻译过来就是:「这是你的死敌的形象,体现了智慧和神秘,拥有知识和操纵时间的光环。」

呃……不太可爱。好吧,有点凶。

于是我又指示画了一张女性版本的我的宿敌:

继续阅读

前一阵子 OpenAI 更新了适合推理的 o1 模型(虽然还是preview版)。而就在最近几天, Claude 也更新了 3.5 Sonnet 模型。

于是我就试了一下用两者来编写 Windows 98 版本的扫雷游戏。我的指示如下:

第一个指示:「你是否知道Windows98上的扫雷游戏?如果知道的话,请全面完整叙述其功能。在下一条指示中,我会请你把它做成静态网页,用Javascript实现,所以请不要遗漏或错误写出功能。请你先用适合给AI编程用的方式,叙述其功能。」

第二个指示:「好,输出用HTML、JS等代码实现整个游戏吧。」

因为代码太长了,我就不发出来了。直接各自截个图吧。

这是用 Claude 3.5 Sonnet 模型制作的:


继续阅读

之前试过 Google 的 NotebookLM AI 笔记本(能这么叫吗?)能从上传的 PDF 文档中整理出内容、生成提问,甚至于生成谈话播客内容的音频。可惜,我之前的尝试的时候,只能生成英语对话。于是我就想到,能不能用 ChatGPT 来试试看生成播客的文字稿呢?而内容,我则选择了 Wikipdia 上的条目。

我先尝试了日本 Falcom 这个条目。当然,在此之前,我告诉 ChatGPT 的指示是:



我看到别的AI能帮助用户生成播客。不过目前你不具备同时模仿2人对话配音的功能。所以我想让你尝试帮我写播客文字稿,模仿一期播客节目中的2位或多位主持人在对谈。我想以Wikipedia的页面的一个个词条作为每一期博客的谈话内容、题材,以轻松的方式向播客收听者介绍该词条的所涉及的知识。当然,如果你觉得需要多个Wikipedia页面的话,也可以。不过,我想先知道,如果你要访问Wikipedia的话,我贴给你URL就好,还是要贴给你页面内的文字内容?


此外,我也询问了 ChatGPT ,这样使用并衍生出新的别的形式的作品,是否符合 Wikipedia 的规范。得到 ChatGPT 的回答是:

继续阅读