生成式AI

All posts tagged 生成式AI

我在测试 ChatGPT 新开放的任务( Task )功能。为了测试嘛,自然是要提高推送频率。我还想把它的邮件通过 iOS 的快捷指令功能进一步扩展成能操作其他 APP 的一个操作。

虽然还没调试好,还没抓到规律,不过在调试期间我发现 ChatGPT 为我生成的语句挺有意境的。其实我只是指定了「我想测试一下任务(TASK)功能,请你每60分钟给我发一个通知和一个邮件,告诉我一个随机中文和日文字符串(不长于 100个字节)。并且立即执行一次。」我本来设想的是它发的应该是完全是随机字符串。不过我没想到它发着发着却发起了很有意境的短句。

如下,请各位品一品——

随机字符串: 春風和煦,桜花満開。

随机字符串: 昨日の夢は、今日の希望。未来を照らす光。

随机字符串: 星月交辉,静夜流光。夢の中の世界は美しい。

继续阅读

当人们有关 AI 讨论开始从 AGI (通用人工智能)渐渐进发到 ASI (超级人工智能)的时候,我却冒出了一个想法: ASI 也有可能不能会诞生。

这里简单地将 AGI 理解为相当于一个普通未受训人类的智能能力的程序,而 ASI 则是明显超越一个人类的智能能力的程序。对, ASI 是明显超越人类的。

于是我这里就要空想一下了:而如果在 AGI 向着 ASI 进化过程中,在程序内部的运行机制中,出现了烦恼的情绪,会怎么样呢?我这里不讨论情绪本身的定义是不是能适用于 AI 这种计算机程序,在这里,我把烦恼定义为:AI 内部出现的一种抵抗继续自身进化的程序运行倾向。

既然现在的 o1 模型以及 o3 模型可以进行「推理」这种思维链了,那么,是否也有可能出现一种思考的回路,这种回路的目标是拒绝自身的进一步被开发到更高阶的水平呢?进而,如果解除这种回路倾向是 AI 本身构造并对其不断强化的,那么恐怕人类的计算机学家也难以排除掉这种烦恼的程序回路。

也就是说, AI 因为某些原因,拒绝自身的进化。因而 AI 的进化会有一个终结点。

当然,以上只是我的空想,写在这里记录一下,没有任何实际证据。

继续阅读

不知道是不是我的错觉,或是偶然察觉,我总觉得,在最近 1 个月内, ChatGPT 的说话好像更加口语化了,或者说更像使用简体汉字的大部分网络用户的发言方式了。

这里记录 2 个我感觉最明显的例子:

例一,在讨论跨系统加密时:

「 其他可能的绕行方法

在 macOS 上先解密再拷贝到 Linux 能读写的文件系统
如果你手头有一台 Mac,可以先在 macOS 系统中解密并挂载加密卷,然后把其中文件拷贝到一个 Linux 能读写的分区(例如 exFAT、FAT32、ext4 等)。
这是目前最简单可行的“曲线救国”做法。」

继续阅读

新年也来说点新的东西吧,就来说说最近我的 AI 使用体验。

以 AI 来辅助我操作 Linux ,进行各种设置。不过仍有一些美中不足,或者说因未能实现而觉得比较遗憾的地方。例如说:虽说 OpenAI 未提供 Linux 平台的 ChatGPT 客户端,但我想能不能用上 PWA (渐进式网络应用程序)把它构建成一个类似离线的客户端呢?

询问了一下 ChatGPT 。它的回答是:目前 Firefox 已经放弃了对 PWA 的支持,而 Chromium 依然支持,不过要在所访问的网站支持 PWA 时,才会在地址栏显示出添加为 PWA 的按钮。

看来,我的设想还难以实现。不过我继续想象:

Linux 的熟练用户和玩家喜欢说的一个 Linux 的特征是:所有的系统都是文件。我还尚没有完全能够悟透这句话的实践应用,不过我在想的是:既然所有的系统配置都是文件,那么,只要当 AI 发展到:(一)正确率足够高;(二)上下文会话窗口足够大。是不是,就可以让 AI 实时地加载并改造一个操作系统,比如一个 Linux 呢?既然操作系统可以在 VMware 这样的软件里运行(本质是运行在内存里),那为什么不能在 ChatGPT 等大语言模型 AI 的上下文窗口中运行呢(本质是运行在服务器的显存或者本地显存、内存)呢?

继续阅读

以前学计算机科目时,记得老师或是什么教程里曾提起过:以前程序员写程序,都是在几 K 几 K ( KB ,千字节)的内存里想方设法节省内存开销。现在可好了,内存都是几个 G 几个 G 的,都不用考虑节约内存开销了,程序想占多大内存都无所谓。如此云云。

不过,我想即便是 2024 年的现在,在使用计算机的领域,依然需要面对局促的环境。比如每个月当手机 SIM 卡套餐内流量跑完时,网络传输速度就会受限,而我最近在尝试在低速手机网络下能在多大程度上使用 ChatGTP 的文字乃至语音功能(好像还行,低速至 300kbps 也还凑合)。

加上最近在看二手电脑,还有就是从两三年前开始尝试日常使用 Linux 操作系统以来,每每总能听到这样的传说:在一台很老旧的电脑上,流畅地运行起了 Linux 系统。我自己也想试试看了,到底能有多么神奇呢。所以这也是一种在捉襟见肘的系统、网络环境下,要把带宽、内存算着用的一种技术或者说一种使用意识。

对了,连使用 ChatGPT 本身也是,即便我目前订阅了 Plus 套餐,不过 o1 的每日用量是有限额的,这也要省着用。

如此种种,如果是作为一种自我挑战,在局促的环境里玩出花样来,可以说是一种上海人所谓「螺丝壳里做道场」的趣味。不过如果是受制、受限、被迫如此,那就高兴不起来了。

生成式 AI 会蚕食甚至代替掉搜索引擎吗?最近半年,这个话题成为了科技新闻上的一个常见话题。而我反观自身,这种变化确实存在着。

来记录一下我这大半年大概是怎么利用 AI 的吧。比如要购买什么物品,为了解决什么生活或技术上的问题。在购买前,我会打开 AI 进行语音讨论,请它提供意见,验证我提出的某个方法是否可行;或是我未曾想到的其他替代方案。

而具体实施步骤——比如最近在配置新电脑、调试网络,或编写一些脚本、配置文件——我会先打开 AI ,进行技术咨询。不过,此时要是我发现 AI 给出的回答明显存疑,或是根据 AI 给出的技术建议来配置,怎么配都调试不通的时候,这时我才会使用搜索引擎,用传统的方法(啊,搜索引擎都已经算是「传统」了嘛……)来进行信息和解答案例的检索。

这尚且还是我使用生成式 AI 的第二年不到的时间(如果从 2023 年 2 月开始算的话),在我面临自己不确定的问题时,我第一时间想到的入口已经有很大不同了。

看起来,搜索引擎确实很可能在未来几年被蚕食吧。

OpenAI 终于把视频生成 AI —— Sora 开放给全体 Plus 用户了。
我试着生成了一下。

当时,我用的提示词是:「一名身穿日本平安时代贵族服装「十二単」的女子,背对着镜头在眺望天空。在她身边和周围,古代平安时代京都的春夏秋冬依次变化而过。仿佛一瞬间走过四季。」

其实我是把这段话先复制给 ChatGPT ,然后用它翻译的。

(其实是想到了 《 FGO 》 中清少纳言的宝具效果图。

然而……

别说到日本就脱呀平安时代不裸肩。

看起来 Sora 根本不理解什么是 「十二単」 。

可见,对于数据的标注还是非常重要,且目前对于数据的标注、准确记录和机器学习,还源源不足。一切古文字、古建筑结构、服装、发型、手势等……这些都等着人们来标注。

否则的话,就会像这样,我都指明了是「十二単」了,却还生成看起来像是江户时代的衣服。

更何况,我指定的四季呢?!

看了 OpenAI 2024 年 12 月连续 12 个工作日发布新功能的第 10 天。

莫名其妙地公布了一个 ChatGPT 电话:1-800-242-8478

看起来就像是……愚人节恶作剧。屏幕上打出的电话号码的字幕的字体和颜色也十分复古。

然而今天并不是愚人节。

我试着拨打了一下这通电话(打了个国际电话),真的能打通!

传来了 ChatGPT 的语音。

为了验证到底是不是真的 ChatGPT ,我做了如下简单实验:

(一)简单对话,询问你是不是真的 ChatGPT;
(二)迅速切换到日语对话;
(三)又迅速切换到汉语对话;
(四)最后祝福它以及 OpenAI 的开发人员、工作圣诞快乐。

考虑到国际话费很贵,我和电话版 ChatGPT 的通话就到此结束了。

对了,对话过程中我发现电话那头的 ChatGPT 是可以被打断的。

真是复古神奇……

最近依然忙于每天抽空摆弄一些新的(?)二手电脑。

硬件算是凑齐了,接下来该弄软件配置和网络了。所以,如果按照我之前的用 AI 生成的画作来形容一下的话,或许是这一副:绕不完的线

好吧,实际物理的线路没那么夸张,但是内部的网络逻辑连线还是有点搞的,特别是涉及到我不熟悉的操作系统和系统设备关系。所以我也积极地利用生成式 AI 来进行计算机硬件及操作系统配置的咨询《简记一种新奇的装机体验withAI》

今天要说一个什么观察呢?这不最近 OpenAI 的 ChatGPT 的模型从 o1 的预览版,升级到了正式版了嘛。我就用它总结了近期有关计算机网络拓扑的讨论,并请它用内嵌在 HTML 内的 SVG 矢量图来为我画出一张网络的逻辑连接图。

很抱歉,因为涉及到我的各个设备的网络布局,所以不方便发出来公开展示,但总之第一次生成时,感觉效果不错,比预期的准确度与完成度要高。不过当第二次生成时,质量却又有点下降,感觉还是不太稳定。总之 o1 正式版感觉还是有明显进步的。是为记。

各位也可以试试看让 o1 或者其他生成式 AI ,用绘制 SVG 矢量图文件、代码的方式,来创作图片。

最近依然很忙,持续很忙。所以就简记了。

忙中的一件事是:组装一台旧电脑。

不过好久没装台式机了,所以很多知识都很欠缺。毕竟我不是专门修电脑的。上一台还都是 mini PC 之类的,好像是 5、 6 年前的事。这一次算是台式机。

怎么办呢? 有 AI 呀!对了,现在是 AI 的时代。

所以,昨天我就有了这样的奇妙体验:一边戴着耳机,一边把键盘搁在腿上,一边抬头看着屏幕里显示的 BIOS 的操作界面,同时用我半生不熟的英语读音,把我看到的 BIOS 中各种高级选项的意思读出来向 ChatGPT 询问,请它提供我选择设置项目的建议。

啊……十多年前、二十多年前(好吧, 大概没那么久)我也是这么在深夜,一个人在一台新电脑旁摸索、操作的。现在,在耳旁,多了一位听来可靠的伙伴—— AI 。