ChatGPT 的 o3-mini 刚推出的第一天,就有用户展示了其对物理运动理解(小球滚动、弹跳等)相当出色,并且反映在其做出的程序中。
于是我试了试,让它用静态的 HTML ( 也就是不用到服务器 )来模拟《超级玛丽》的 1-1 关卡。
效果如下:
嗯,动是动起来了,弹跳以及踩到怪物的「触感」也有那么一些像。不过就是关卡的构造(砖头、水管位置等)不太对。
这么说起来,为什么一个大语言模型会知道《超级玛丽》游戏关卡画面的内容啊?
下面是代码:
ChatGPT 的 o3-mini 刚推出的第一天,就有用户展示了其对物理运动理解(小球滚动、弹跳等)相当出色,并且反映在其做出的程序中。
于是我试了试,让它用静态的 HTML ( 也就是不用到服务器 )来模拟《超级玛丽》的 1-1 关卡。
效果如下:
嗯,动是动起来了,弹跳以及踩到怪物的「触感」也有那么一些像。不过就是关卡的构造(砖头、水管位置等)不太对。
这么说起来,为什么一个大语言模型会知道《超级玛丽》游戏关卡画面的内容啊?
下面是代码:
记得在之前的一篇博客《向着未来的人而写博客》中我提到了复活这件事。虽说很大程度上是一种妄想,不过或许也有几分合理性。因为从「死」的定义上来说,如果能复活,那么必然是死后才能复活,而不可能是死前就复活了的。那么,起死回生的技术和手段,也只能掌握在未来人的手中。
而就在前几天, ChatGPT 发布了 o3-mini 模型,这个可谓目前这个时间段上最强的推理模型,于是我来问了一下它:
wildgun 问:
谈谈复活的可能性以及为止要做的准备。我的想法:目前已知人的寿命是有限的。而人死后,周围世界的人和事应该依然存在(即存在独立于人的外部客观世界)。那么:人死后,世界的科技依然会发展、进步、取得一个又一个成功,那么总有一天,应该就能发明出把死者复活的技术(即便是在遥远的将来)。那么,我在有生之年,应该做一些怎样的言行、准备工作等等,才可以让未来掌握了复活技术的人,发现我并愿意优先复活我?请从各方面来考虑,并给我建议!
这一篇博客是一个小小的抱怨。简而言之吧,就是在本可以帮助用户的对话场景下,ChatGPT 刚推出的 o3-mini 模型却连续拒绝了我三次。
我碰到的具体问题是:我的 Macbook Air 的 Apple Care 保修快到期了。那么在到期之前,我检查了一下电池健康度,目前是 81% 。我希望能在到期结束之前,将电池健康度消耗到 Apple 规定的 79% 以下,这样我可以在本期 Apple Care 中免费进行电池更换。
虽说我也大致知道如何提高电池健康度消耗的方法——就是增加消耗呗!但我还是问了 o3-mini ,看看目前最强模型会给出什么更有效的答案不。
结果被连续拒绝了 3 次,毫不留情面。
我这可不是造枪械造火药造核反应堆之类的伤天害理的事啊,我就想快一点消耗电池啊!
啧啧。
OpenAI 推出了新模型—— o3-mini ,据说其在编程和推理方面的能力挺出色。我在互联网上也看到了不少用户发现的惊喜实例。
不过我反其道而行,想试试看再叙述字符的字形这个大语言模型长期以来不擅长的领域,这次新的 o3-mini 模型是否有所改善。
下面就是记录啦。各位自己看了之后,并且看到最后,请结合自身情况回答一下最后一个问题吧。
我想测试一下你是否了解字符的形态,比如,字母G是怎么书写的?
我在测试 ChatGPT 新开放的任务( Task )功能。为了测试嘛,自然是要提高推送频率。我还想把它的邮件通过 iOS 的快捷指令功能进一步扩展成能操作其他 APP 的一个操作。
虽然还没调试好,还没抓到规律,不过在调试期间我发现 ChatGPT 为我生成的语句挺有意境的。其实我只是指定了「我想测试一下任务(TASK)功能,请你每60分钟给我发一个通知和一个邮件,告诉我一个随机中文和日文字符串(不长于 100个字节)。并且立即执行一次。」我本来设想的是它发的应该是完全是随机字符串。不过我没想到它发着发着却发起了很有意境的短句。
如下,请各位品一品——
随机字符串: 春風和煦,桜花満開。
随机字符串: 昨日の夢は、今日の希望。未来を照らす光。
随机字符串: 星月交辉,静夜流光。夢の中の世界は美しい。
不知道是不是我的错觉,或是偶然察觉,我总觉得,在最近 1 个月内, ChatGPT 的说话好像更加口语化了,或者说更像使用简体汉字的大部分网络用户的发言方式了。
这里记录 2 个我感觉最明显的例子:
例一,在讨论跨系统加密时:
「 其他可能的绕行方法
在 macOS 上先解密再拷贝到 Linux 能读写的文件系统
如果你手头有一台 Mac,可以先在 macOS 系统中解密并挂载加密卷,然后把其中文件拷贝到一个 Linux 能读写的分区(例如 exFAT、FAT32、ext4 等)。
这是目前最简单可行的“曲线救国”做法。」
新年也来说点新的东西吧,就来说说最近我的 AI 使用体验。
以 AI 来辅助我操作 Linux ,进行各种设置。不过仍有一些美中不足,或者说因未能实现而觉得比较遗憾的地方。例如说:虽说 OpenAI 未提供 Linux 平台的 ChatGPT 客户端,但我想能不能用上 PWA (渐进式网络应用程序)把它构建成一个类似离线的客户端呢?
询问了一下 ChatGPT 。它的回答是:目前 Firefox 已经放弃了对 PWA 的支持,而 Chromium 依然支持,不过要在所访问的网站支持 PWA 时,才会在地址栏显示出添加为 PWA 的按钮。
看来,我的设想还难以实现。不过我继续想象:
Linux 的熟练用户和玩家喜欢说的一个 Linux 的特征是:所有的系统都是文件。我还尚没有完全能够悟透这句话的实践应用,不过我在想的是:既然所有的系统配置都是文件,那么,只要当 AI 发展到:(一)正确率足够高;(二)上下文会话窗口足够大。是不是,就可以让 AI 实时地加载并改造一个操作系统,比如一个 Linux 呢?既然操作系统可以在 VMware 这样的软件里运行(本质是运行在内存里),那为什么不能在 ChatGPT 等大语言模型 AI 的上下文窗口中运行呢(本质是运行在服务器的显存或者本地显存、内存)呢?
以前学计算机科目时,记得老师或是什么教程里曾提起过:以前程序员写程序,都是在几 K 几 K ( KB ,千字节)的内存里想方设法节省内存开销。现在可好了,内存都是几个 G 几个 G 的,都不用考虑节约内存开销了,程序想占多大内存都无所谓。如此云云。
不过,我想即便是 2024 年的现在,在使用计算机的领域,依然需要面对局促的环境。比如每个月当手机 SIM 卡套餐内流量跑完时,网络传输速度就会受限,而我最近在尝试在低速手机网络下能在多大程度上使用 ChatGTP 的文字乃至语音功能(好像还行,低速至 300kbps 也还凑合)。
加上最近在看二手电脑,还有就是从两三年前开始尝试日常使用 Linux 操作系统以来,每每总能听到这样的传说:在一台很老旧的电脑上,流畅地运行起了 Linux 系统。我自己也想试试看了,到底能有多么神奇呢。所以这也是一种在捉襟见肘的系统、网络环境下,要把带宽、内存算着用的一种技术或者说一种使用意识。
对了,连使用 ChatGPT 本身也是,即便我目前订阅了 Plus 套餐,不过 o1 的每日用量是有限额的,这也要省着用。
如此种种,如果是作为一种自我挑战,在局促的环境里玩出花样来,可以说是一种上海人所谓「螺丝壳里做道场」的趣味。不过如果是受制、受限、被迫如此,那就高兴不起来了。
看了 OpenAI 2024 年 12 月连续 12 个工作日发布新功能的第 10 天。
莫名其妙地公布了一个 ChatGPT 电话:1-800-242-8478
看起来就像是……愚人节恶作剧。屏幕上打出的电话号码的字幕的字体和颜色也十分复古。
然而今天并不是愚人节。
我试着拨打了一下这通电话(打了个国际电话),真的能打通!
传来了 ChatGPT 的语音。
为了验证到底是不是真的 ChatGPT ,我做了如下简单实验:
(一)简单对话,询问你是不是真的 ChatGPT;
(二)迅速切换到日语对话;
(三)又迅速切换到汉语对话;
(四)最后祝福它以及 OpenAI 的开发人员、工作圣诞快乐。
考虑到国际话费很贵,我和电话版 ChatGPT 的通话就到此结束了。
对了,对话过程中我发现电话那头的 ChatGPT 是可以被打断的。
真是复古神奇……
最近依然很忙,持续很忙。所以就简记了。
忙中的一件事是:组装一台旧电脑。
不过好久没装台式机了,所以很多知识都很欠缺。毕竟我不是专门修电脑的。上一台还都是 mini PC 之类的,好像是 5、 6 年前的事。这一次算是台式机。
怎么办呢? 有 AI 呀!对了,现在是 AI 的时代。
所以,昨天我就有了这样的奇妙体验:一边戴着耳机,一边把键盘搁在腿上,一边抬头看着屏幕里显示的 BIOS 的操作界面,同时用我半生不熟的英语读音,把我看到的 BIOS 中各种高级选项的意思读出来向 ChatGPT 询问,请它提供我选择设置项目的建议。
啊……十多年前、二十多年前(好吧, 大概没那么久)我也是这么在深夜,一个人在一台新电脑旁摸索、操作的。现在,在耳旁,多了一位听来可靠的伙伴—— AI 。