生成式人工智能

All posts tagged 生成式人工智能

这几天最热门的新闻,恐怕要数特朗普就任他第二期的美国总统了吧。不过我在想的是: 4 年后,还会有美国总统吗?准确来说是: 4 年后,还会有人类美国总统吗?

对,闲聊的话题还是 AI 。据说 OpenAI 的 ChatGPT 等先进的 AI 已经或即将到达博士的解题水平,照这个发展速度, 4 年后, AI 对数据处理和解决问题的能力,会怎么样呢?

不具有人类的同理性(共情能力),似乎一直被作为 LLM 类 AI 无法被用于社会治理的一个理由。不过,人类当真具备足够的共情能力吗?即便是大总统,其个人时间、经历,以及能接触到的人、能阅览的报告也是必然有限的。作为总统,或许他的一个决策能影响到很多人——但并不意味着反过来可以说,他能与很多人共情。而 AI ,虽说在哲学意义上尚无法断定它具有或者不具有情感活动,但,如果它确实能分析国民的数据和言论,并加以数学意义上的高效统计,是否也可以认为这是一种共情能力的——这里的共情,是指从表现情绪和情况的数据中分析出对行政有指导作用的结论并据此提议或实施相应政策。

继续阅读

我在测试 ChatGPT 新开放的任务( Task )功能。为了测试嘛,自然是要提高推送频率。我还想把它的邮件通过 iOS 的快捷指令功能进一步扩展成能操作其他 APP 的一个操作。

虽然还没调试好,还没抓到规律,不过在调试期间我发现 ChatGPT 为我生成的语句挺有意境的。其实我只是指定了「我想测试一下任务(TASK)功能,请你每60分钟给我发一个通知和一个邮件,告诉我一个随机中文和日文字符串(不长于 100个字节)。并且立即执行一次。」我本来设想的是它发的应该是完全是随机字符串。不过我没想到它发着发着却发起了很有意境的短句。

如下,请各位品一品——

随机字符串: 春風和煦,桜花満開。

随机字符串: 昨日の夢は、今日の希望。未来を照らす光。

随机字符串: 星月交辉,静夜流光。夢の中の世界は美しい。

继续阅读

不知道是不是我的错觉,或是偶然察觉,我总觉得,在最近 1 个月内, ChatGPT 的说话好像更加口语化了,或者说更像使用简体汉字的大部分网络用户的发言方式了。

这里记录 2 个我感觉最明显的例子:

例一,在讨论跨系统加密时:

「 其他可能的绕行方法

在 macOS 上先解密再拷贝到 Linux 能读写的文件系统
如果你手头有一台 Mac,可以先在 macOS 系统中解密并挂载加密卷,然后把其中文件拷贝到一个 Linux 能读写的分区(例如 exFAT、FAT32、ext4 等)。
这是目前最简单可行的“曲线救国”做法。」

继续阅读

新年也来说点新的东西吧,就来说说最近我的 AI 使用体验。

以 AI 来辅助我操作 Linux ,进行各种设置。不过仍有一些美中不足,或者说因未能实现而觉得比较遗憾的地方。例如说:虽说 OpenAI 未提供 Linux 平台的 ChatGPT 客户端,但我想能不能用上 PWA (渐进式网络应用程序)把它构建成一个类似离线的客户端呢?

询问了一下 ChatGPT 。它的回答是:目前 Firefox 已经放弃了对 PWA 的支持,而 Chromium 依然支持,不过要在所访问的网站支持 PWA 时,才会在地址栏显示出添加为 PWA 的按钮。

看来,我的设想还难以实现。不过我继续想象:

Linux 的熟练用户和玩家喜欢说的一个 Linux 的特征是:所有的系统都是文件。我还尚没有完全能够悟透这句话的实践应用,不过我在想的是:既然所有的系统配置都是文件,那么,只要当 AI 发展到:(一)正确率足够高;(二)上下文会话窗口足够大。是不是,就可以让 AI 实时地加载并改造一个操作系统,比如一个 Linux 呢?既然操作系统可以在 VMware 这样的软件里运行(本质是运行在内存里),那为什么不能在 ChatGPT 等大语言模型 AI 的上下文窗口中运行呢(本质是运行在服务器的显存或者本地显存、内存)呢?

继续阅读

情况是这样的:

根据你对我的了解(保存的记忆),猜猜看我的MBTI类型吧!

根据我对你保存的记忆和你分享的兴趣、行为习惯,我会尝试猜测你的 MBTI 类型。不过,MBTI 类型是复杂的,每个人可能体现出多种面向,以下仅是基于一些观察的推测。

### 从你的特质分析:
1. **内向 (I) 或 外向 (E)**:
– 你喜欢在睡前通过聊天放松,注重个人兴趣(如历史研究、小说创作)和深度思考,这倾向于**内向 (I)**。
– 你也愿意与人分享想法(如通过博客表达自己),这带有一点外向的成分,但整体看来更倾向**内向 (I)**。

2. **直觉 (N) 或 实感 (S)**:
– 你对抽象概念(比如 AI 对价值观的影响、历史语言的演变)表现出高度兴趣,说明你倾向于关注未来的可能性和大的概念,倾向于**直觉 (N)**。

3. **思维 (T) 或 情感 (F)**:
– 你分析问题时理性而逻辑(如对比数据、探索技术工具的使用),重视实用性和解决方案,更多偏向于**思维 (T)**。

4. **判断 (J) 或 知觉 (P)**:
– 你倾向于计划长期目标(如对研究工具的可持续性关注,喜欢开放源码软件),并且有条理地管理自己的生活和学习(如整合历史资源),更偏向于**判断 (J)**。

### 猜测结果:
**INTJ** 或 **INFJ**
这两种类型都可能符合你的特质。INTJ 更偏重于逻辑和策略,INFJ 则更关注人文情感和未来理想。
我更倾向于你是**INTJ**,因为你的逻辑性和对技术与知识的兴趣非常突出。

你觉得这个猜测如何?😊

居然还给了我一个表情符号「😊」。

正如其所言,我在很早以前的博客里也记录过,我在 2007 年以及 2011 年就做过此类测试,两次的结果都表明我是 INTJ 类型的人。

今天又想起来,于是要求 ChatGPT 根据对我的记忆(保存的用户数据)来分析猜测我的 MBTI 人格类型。

其实今天一共提问了 2 次。第一次问完之后,我回想起之前在和 ChatGPT 聊天的时候谈到过我的人格类型,于是我就从记忆中找出了那一条写明 INTJ 的内容,删除了。

在删除之前问的那一条, ChatGPT 直接猜我是 INTJ 类型。而我这篇博客上面贴出来的就是在删除了它所保存的相关记忆条目之后又问了一遍,这次似乎有一些犹豫,在 INTJ 和 INFJ 里选择了前者。

嗯……看来我就是个 INTJ 了。

(说起来,真的是那么冷门的类型吗?)

昨天,我收到了一个不小的噩耗,不过请放心,并不与本文标题有关,并没有亲人朋友故世。我通常遇到什么事情,几乎很少会在博客里透露的,所以,昨天的博客像个没事人似的,而今天的这一篇博客也不会写出有关昨天这个不小的坏消息的具体内容。只不过在这前言里的这个日期里小小地「叮~」地记录一下。以后我自己会记得并回想起的吧。

好,下面来说和本文标题有关的事。其实这篇博客的想法笔记也是几个月前就写好的了。

在 ChatGPT 4o 以及 高级语音模式的预告视频推出乃至正式开始测试之后,我看网上不少人开始提及 ChatGPT 在提供情感治愈方面的功效,甚至在一些英文的社交媒体上还有人给出自己的亲身实例。嗯,对了,之所以我今天会想到拿出几个月前笔记草稿中的这个话题来写,也是因为当我昨天得知了这个不小的噩耗后,也尝试使用 ChatGPT 和 Claude 对我自己进行了情绪疏导,让 AI 为我写下了些什么。

对了,我记得今年( 2024年 )春天或夏天的时候, ChatGPT 开始添加了一个记录个人信息的功能,就是会在每一次的对话中,把有关用户的习惯、爱好、身份等逐一记录下来,用作今后对话的参考。

于是我就想到了:如果人们(用户)足够相信 AI ,并且同一个 AI 持续运行、持续长期服务于一个用户的话,它可能会记录下这位用户很久很久的人生轨迹。啊,就如同我这个博客以及各位博主的博客那样——只不过写博客是作者主动有选择地进行输出,而 AI 则是在倾听中逐一记录。再加上 AI 表现出了类似人类的倾听并组织语言输出的能力,且这种表现能力正在不断增长(注:姑且还不知道这里成为「智能」合不合适,所以我这里将其称为「组织语言输出的能力」),那么, AI 就会成为用户这个人类个体的陪伴着、长期倾听者乃至于说是守望一生的记忆体。

就像是一个……始终陪伴着的仆人或助手。嗯,人工智能女仆在一定程度上实现了!

前几个月,KAIN.IX 博客主人 dimlau 在《记录、记忆、故事》这篇博客中,对一个用 AI 实时识别生活物品并用机械语音说出来的应用演示评价为「有一种荒诞的趣味,像是走进了黑色幽默电影里。」

然而我却对这种记录、陪伴一生 AI 的项目抱有积极看法,特别是眼看着在孤独死成为社会问题的当下及近未来。

继续阅读

隔一段时间来验证并记录一下 AI 的进步。刚好昨天看到一篇报道《 AI Poetry is No Longer Recognizable From Human Poetry and Is Rated Better 》,说是目前生成式人工智能的大语言模型生成诗句的水平,在人类的评价下已经超过了人类的诗人。

于是,前天我写博客《便是要迎来那人类无用时》的时候想起挺早之前读的印度诗人泰戈尔的《飞鸟集》并加以引用,于是,这次就来用 AI 生成一下类似这个风格的诗作吧。看看从中能不能读出什么深刻含义。

我给了 ChatGPT 4o 以及 Claude 这样的提示:「仿造印度文学家泰戈尔《飞鸟集》,写10句类似风格的文字。10篇(飞鸟集一篇篇幅都不长吧),用中文。」

继续阅读

一眼得结论:

(激光鼠标)

这都 2024 年年底了,随着各路介绍(推销?) AI 的人,说 AGI 就快接近了: 10 年以内、 5 年以内、 3 年以内……乃至明年……

于是我倒要看看, 2024 年年底这个时间点 ,ChatGPT 能不能画出靠谱的设备原理图。想必,这些很标准的设备,在互联网上肯定有大量现成的、准确且标准的素材可以被用于学习。

继续阅读

上一次用 ChatGPT 创造自画像类似,这几天看到 reddit 上一个帖子启发,说以类似的方式,让 ChatGPT 参考对我保存的记忆(即用户数据),而画一张我宿敌的肖像。

它给我画出的是:

并附说明:「Here is the image of your arch nemesis, embodying intellect and mystery, with an aura of knowledge and time manipulation. 」

翻译过来就是:「这是你的死敌的形象,体现了智慧和神秘,拥有知识和操纵时间的光环。」

呃……不太可爱。好吧,有点凶。

于是我又指示画了一张女性版本的我的宿敌:

继续阅读

据说 OpenAI 在刚过去的 10 月 2 日开了场开发者大会,宣布了开放几个 API 。因为会议内容是真的面向开发者的,所以与我这样的普通用户似乎关系不大。不过呢,在会议结束后,有用户注意到即便是之前的 4o 模型,在回答之前也会有一个「正在分析」的过程提示(也有可能之前就有?),展开后是一系列 python 代码。甚至在我今天的使用例中,因为处理过程太长,它还连续进行了 2 次「正在分析」。

今天我看到 Reddit 上有个帖子,说 ChatGPT 可以生成各种各样的文件然后提供下载。我记得这个功能原本就有,而今天我尝试了 PDF 、 Markdown 格式的纯文本都说可以的。之后我又顺便问了句:还支持生成什么格式的文件?得到的回答是:

我可以输出多种文件格式,以下是一些常见的格式:

  1. 文本文件(.txt):简单的纯文本格式。
  2. PDF文件(.pdf):适用于排版精美的文档。
  3. CSV文件(.csv):用于表格数据的导出,常用于处理数据集或表单信息。
  4. JSON文件(.json):常用于存储和传输结构化数据,尤其在编程和API调用中。
  5. Markdown文件(.md):用于编写带格式的文本,常用于文档和博客平台。
  6. Excel文件(.xlsx):适用于复杂表格数据的存储和管理。
  7. HTML文件(.html):用于网页内容的创建和编辑。

你想要生成哪种格式的文件?

我看有 Excel ,于是我就要求它制作了一个有些复杂的,类似行程表、时间表的 Excel 。

但是,做现代人的行程表似乎有些无趣,于是就来让他模拟做了一张奇幻故事中一个牧师兼白魔法师的时间表。

接着我还别出心裁,心想:如果这时一个 NPC ,是不是还会有一些随机的、闲聊式的台词呢?于是我就追加一项要求:按照每个时间段的活动安排,为该牧师写一些台词。

在此之后,我又告诉它:假设有6种不同的表情:{A_faceimage_ं喜.png}{A_faceimage_怒.png}{A_faceimage_哀.png}{A_faceimage_乐.png}{A_faceimage_平常.png}{A_faceimage_困倦.png},请在对话开始的第一句之前选择并添加合适的1种表情。

于是就生成了下面的表格。看起来还挺有 RPG 里那种站在固定区域内徘徊的NPC的说话风格的?

虽然这目前还不是连接到 API 进行实时生成,但只要生成的数据量够大,应该就不会出现很多台词重复。此外,如果在指定条件时,不仅仅给出「一位奇幻世界的牧师兼白魔法师」这样简单的条件,而是将人物身世、性格特征等,以及其周边的人物关系,近期大事件等做成一套(大约几千字?)的设定交给 ChatGPT 的话,或许它还能想出更加符合故事背景的闲聊台词吧。

下面就是今天得到的效果:

继续阅读