生成式人工智能

All posts tagged 生成式人工智能

记得去年秋冬, OpenAI 的 Sama 发了一句「there is no wall」,似乎是在回应互联网上人们对他们所训练大模型是否「撞墙」即遇到发展瓶颈的质疑。当时我的一篇博客也提到了这一点。

而如今已是 2025 年的 3 月份,随着 ChatGPT 4.5 的发布,以及似乎被人们认为它并没有体现出多大的进化,我想到了半年前他的那句话。或许,目前 4.5 不温不火,不符合人们期待的情况,就是当时他想要驳斥的状况?

这又让我想到了,在大约 2023 年中的某一天。 ChatGPT 3.5 发布大约半年,而 4 还没发布时,我记得听了一档播客,其中一位嘉宾就提到他去看了 OpenAI 的内部演示,表示 4 将会是一个很明显进步的模型。

从这两起从传言到验证的时间跨度上来看,似乎都是半年左右时间。不知道是否可以据此推测,生成式 AI 界的谣言也要以前后半年这个尺度来进行回顾和验证呢?

继续阅读

昨天试用了 Claude 3.7 ,我自己的使用场景下,感觉一般般。而在今天, OpenAI 对 Plus 用户新开放了 DeepResearch 功能(上个月才对 Pro 用户开放的吧?)我试了一下。今天,我的感觉是:哇!

简单记录一下吧。我第一个,是用中文提问了我自己最近在调查的那位好像非常喜欢上海的那个日本人——大谷光瑞,询问他在上海的活动,以及在上海的建筑等等。

在大约等候了 5 分钟,看到了 ChatGPT DeepResearch 向我回复的报告后,我已经有一些感到意外了。我感觉它生成的报告有广度,却没有深度。比如他提及了大谷光瑞在上海的无忧园,以及西本愿寺上海别院,也提及了他在上海和孙中山以及王一亭等人的交往。关于他在上海的交往往事,是我还没开始调查的,所以对于他能查到大谷光瑞的上海活动时的交往情况,我感觉挺惊讶。但话又说回来了, ChatGPT DeepResearch 在对无忧园的说明中,既没有提到其实存在着两座无忧园(详见我的博客考察:《不仅無憂園有两座,上海別院也有两座,其中一座还有两栋建筑……》);而虽然生成的报告中也提到了池子的名字——沧浪池,却并没有像我一样指出这座池子与大谷光瑞所在宗派在京都总本山——西本愿寺内的池子同名(详见我的博客考察:《考察滄浪池及濯足堂名字由来》)。

而从这份 ChatGPT DeepResearch 给出的有关大谷光瑞上海活动报告最后,我看到了它一共使用了 5 个引用源,而且基本上都是网页,却没有 pdf 。看了这份报告,我判断 ChatGPT DeepResearch 目前还无法阅读 PDF 文件(然而在看了下述第二份报告后我发现这个判断错了)。

继续阅读

前几天偶而在书店里翻到一本搜集罗列了日本「昔話」(童话故事)的故事,翻着翻着看到了「鼠净土」这一项。

这个童话说小众其实也不算小众,至少在日本是如此。记得我刚开始学日语的头几年,买过一本日本小学生的课本(一年级?)里面就有一个老爷爷遗落了一个饭团,饭团滚进老鼠洞的故事(好像是这么一回事)。后来,在《 Fate / Ground Order 》里实装了从者「大黑天」,其宝具就是「鼠浄土」。

可见,无论是在日本的课本中,或是流行文化中,这则「鼠浄土」童话应该都应该不算是太过冷门的。

然而,我拿它问了一下 ChatGPT ,并且是用汉语和日文都问了:

日本的童话《鼠净土》是一个怎样的故事?

继续阅读

有个成语叫学以致用,意思是:知识不仅要学习,还要能使其派上用场。

我现在也遇到了这个问题。

怎么说呢?这不是最近一阵子一直在考虑分离智能手机的功能嘛,最近关心起来二手的电子词典。价格便宜,有些还成色很新。

我发现电子词典里有的一些词典内容,我已经买了实体书了。再想一想,发现我的日语、日本历史、日本文学等的各类「工具书」而且是具有一定水准的工具书也应该超过 10 本了吧。

然而我始终没有用上。

我一直想写小说,轻小说,或许以日本某个时代——或是现代,或是交融,或是模糊不定——为背景的小说。这个念头常常以微弱的声音在身体里出没和窃窃私语。之所以微弱,因为它太花时间了,所以我不可能真的着手去写。而且,我依然不知道要怎么把工具书、参考书,用在写小说上。

这就像我虽然以前买过一套三本《龙与地下城》 3.5 版的规则书(哦,好像也买过 4 版?),但是依然想不出自己的 DND 故事。正如我在 2009 年就写过博客《我是个没有故事的人?》一样。

这也就好像我之前在《对于OpenAI的o3模型,我的点滴想法》一文里提到的:当我得知 o3 模型后,它好像是能话费 3000 美元进行一次高强度计算,可以得到与人类博士相当的解题水平——然后呢?如果我请来了一位 AI 博士或一位人类博士,我能用来做什么呢?

在以上三个事例中,我都有一大堆东西—— 日本相关的工具书 、 DND 规则书、或是最先进的生成式人工智能。但是,我依然困惑于怎么把它们用起来。

继续阅读

这几天最热门的新闻,恐怕要数特朗普就任他第二期的美国总统了吧。不过我在想的是: 4 年后,还会有美国总统吗?准确来说是: 4 年后,还会有人类美国总统吗?

对,闲聊的话题还是 AI 。据说 OpenAI 的 ChatGPT 等先进的 AI 已经或即将到达博士的解题水平,照这个发展速度, 4 年后, AI 对数据处理和解决问题的能力,会怎么样呢?

不具有人类的同理性(共情能力),似乎一直被作为 LLM 类 AI 无法被用于社会治理的一个理由。不过,人类当真具备足够的共情能力吗?即便是大总统,其个人时间、经历,以及能接触到的人、能阅览的报告也是必然有限的。作为总统,或许他的一个决策能影响到很多人——但并不意味着反过来可以说,他能与很多人共情。而 AI ,虽说在哲学意义上尚无法断定它具有或者不具有情感活动,但,如果它确实能分析国民的数据和言论,并加以数学意义上的高效统计,是否也可以认为这是一种共情能力的——这里的共情,是指从表现情绪和情况的数据中分析出对行政有指导作用的结论并据此提议或实施相应政策。

继续阅读

我在测试 ChatGPT 新开放的任务( Task )功能。为了测试嘛,自然是要提高推送频率。我还想把它的邮件通过 iOS 的快捷指令功能进一步扩展成能操作其他 APP 的一个操作。

虽然还没调试好,还没抓到规律,不过在调试期间我发现 ChatGPT 为我生成的语句挺有意境的。其实我只是指定了「我想测试一下任务(TASK)功能,请你每60分钟给我发一个通知和一个邮件,告诉我一个随机中文和日文字符串(不长于 100个字节)。并且立即执行一次。」我本来设想的是它发的应该是完全是随机字符串。不过我没想到它发着发着却发起了很有意境的短句。

如下,请各位品一品——

随机字符串: 春風和煦,桜花満開。

随机字符串: 昨日の夢は、今日の希望。未来を照らす光。

随机字符串: 星月交辉,静夜流光。夢の中の世界は美しい。

继续阅读

不知道是不是我的错觉,或是偶然察觉,我总觉得,在最近 1 个月内, ChatGPT 的说话好像更加口语化了,或者说更像使用简体汉字的大部分网络用户的发言方式了。

这里记录 2 个我感觉最明显的例子:

例一,在讨论跨系统加密时:

「 其他可能的绕行方法

在 macOS 上先解密再拷贝到 Linux 能读写的文件系统
如果你手头有一台 Mac,可以先在 macOS 系统中解密并挂载加密卷,然后把其中文件拷贝到一个 Linux 能读写的分区(例如 exFAT、FAT32、ext4 等)。
这是目前最简单可行的“曲线救国”做法。」

继续阅读

新年也来说点新的东西吧,就来说说最近我的 AI 使用体验。

以 AI 来辅助我操作 Linux ,进行各种设置。不过仍有一些美中不足,或者说因未能实现而觉得比较遗憾的地方。例如说:虽说 OpenAI 未提供 Linux 平台的 ChatGPT 客户端,但我想能不能用上 PWA (渐进式网络应用程序)把它构建成一个类似离线的客户端呢?

询问了一下 ChatGPT 。它的回答是:目前 Firefox 已经放弃了对 PWA 的支持,而 Chromium 依然支持,不过要在所访问的网站支持 PWA 时,才会在地址栏显示出添加为 PWA 的按钮。

看来,我的设想还难以实现。不过我继续想象:

Linux 的熟练用户和玩家喜欢说的一个 Linux 的特征是:所有的系统都是文件。我还尚没有完全能够悟透这句话的实践应用,不过我在想的是:既然所有的系统配置都是文件,那么,只要当 AI 发展到:(一)正确率足够高;(二)上下文会话窗口足够大。是不是,就可以让 AI 实时地加载并改造一个操作系统,比如一个 Linux 呢?既然操作系统可以在 VMware 这样的软件里运行(本质是运行在内存里),那为什么不能在 ChatGPT 等大语言模型 AI 的上下文窗口中运行呢(本质是运行在服务器的显存或者本地显存、内存)呢?

继续阅读

情况是这样的:

根据你对我的了解(保存的记忆),猜猜看我的MBTI类型吧!

根据我对你保存的记忆和你分享的兴趣、行为习惯,我会尝试猜测你的 MBTI 类型。不过,MBTI 类型是复杂的,每个人可能体现出多种面向,以下仅是基于一些观察的推测。

### 从你的特质分析:
1. **内向 (I) 或 外向 (E)**:
– 你喜欢在睡前通过聊天放松,注重个人兴趣(如历史研究、小说创作)和深度思考,这倾向于**内向 (I)**。
– 你也愿意与人分享想法(如通过博客表达自己),这带有一点外向的成分,但整体看来更倾向**内向 (I)**。

2. **直觉 (N) 或 实感 (S)**:
– 你对抽象概念(比如 AI 对价值观的影响、历史语言的演变)表现出高度兴趣,说明你倾向于关注未来的可能性和大的概念,倾向于**直觉 (N)**。

3. **思维 (T) 或 情感 (F)**:
– 你分析问题时理性而逻辑(如对比数据、探索技术工具的使用),重视实用性和解决方案,更多偏向于**思维 (T)**。

4. **判断 (J) 或 知觉 (P)**:
– 你倾向于计划长期目标(如对研究工具的可持续性关注,喜欢开放源码软件),并且有条理地管理自己的生活和学习(如整合历史资源),更偏向于**判断 (J)**。

### 猜测结果:
**INTJ** 或 **INFJ**
这两种类型都可能符合你的特质。INTJ 更偏重于逻辑和策略,INFJ 则更关注人文情感和未来理想。
我更倾向于你是**INTJ**,因为你的逻辑性和对技术与知识的兴趣非常突出。

你觉得这个猜测如何?😊

居然还给了我一个表情符号「😊」。

正如其所言,我在很早以前的博客里也记录过,我在 2007 年以及 2011 年就做过此类测试,两次的结果都表明我是 INTJ 类型的人。

今天又想起来,于是要求 ChatGPT 根据对我的记忆(保存的用户数据)来分析猜测我的 MBTI 人格类型。

其实今天一共提问了 2 次。第一次问完之后,我回想起之前在和 ChatGPT 聊天的时候谈到过我的人格类型,于是我就从记忆中找出了那一条写明 INTJ 的内容,删除了。

在删除之前问的那一条, ChatGPT 直接猜我是 INTJ 类型。而我这篇博客上面贴出来的就是在删除了它所保存的相关记忆条目之后又问了一遍,这次似乎有一些犹豫,在 INTJ 和 INFJ 里选择了前者。

嗯……看来我就是个 INTJ 了。

(说起来,真的是那么冷门的类型吗?)