闲聊

前几天的 ChatGPT 的 2024 年开发者大会上,宣布了一项面向开发者的图像识别微调功能。在其中举出的例子中,有一项是一家名为 Grab 的拼车公司使用该方法,改进了对于道路标志和车道分割线的识别能力。

看到这里,我想到了一个旁门左道:是不是可以经过图像识别微调,做一个能够看人的面相以及手相的算命 AI 呢?

其实在这个使用场景中,完全不必在乎目前生成式 AI 的一个明显缺点:幻觉。反倒是在算命领域,不仅不排斥幻觉,而且幻觉(说胡话的能力?)还是必须的。但是,在算命的第一步,必须要与用户建立起信任关系,也就是最初对于面相和手相的识别要准确——如果对于同样一张脸的照片,第一次回答是瓜子脸,第二次回答是鹅蛋脸;或者对于同样一张手相(手掌)的照片,第一次回答事业线长,第二次回答变成了生命线长,那就显得不可靠了。

而如果只要在物理外表上能够准确识别面相、手相的特征,那么之后的下一步——面相与手相所反应的命运,则可以通过读取一些固定的算命资料,加上被算命者的生辰八字啦等等,再加上 AI 特有的幻觉——你看,幻觉在这里成了一种积极因素了!对!此乃「人工智能天命」!——之后就能给出像模像样的算命结果了吧。所以,如果这次 OpenAI 所改善并提供的图像微调如果真能让 AI 能准确且稳定地识别脸型、手掌纹理的话,那或许就能真的做成一个算命 AI 。

听起来这有点不务正业,是不是?但……可以引导用户步入正业啊!可以在后台对接一些靠谱的服务提供者,比如正规的心理咨询啦,理财咨询啦,婚恋介绍啦,教育培训啦……等等等等!把用户对未来或对自身的不确定的担忧,用算命的方式作为能够轻松入门的一个通道,去将用户介绍给正规的、专业的咨询服务业者,这岂不是一件很光明正大且很有趣的事吗?

继续阅读

据说 OpenAI 在刚过去的 10 月 2 日开了场开发者大会,宣布了开放几个 API 。因为会议内容是真的面向开发者的,所以与我这样的普通用户似乎关系不大。不过呢,在会议结束后,有用户注意到即便是之前的 4o 模型,在回答之前也会有一个「正在分析」的过程提示(也有可能之前就有?),展开后是一系列 python 代码。甚至在我今天的使用例中,因为处理过程太长,它还连续进行了 2 次「正在分析」。

今天我看到 Reddit 上有个帖子,说 ChatGPT 可以生成各种各样的文件然后提供下载。我记得这个功能原本就有,而今天我尝试了 PDF 、 Markdown 格式的纯文本都说可以的。之后我又顺便问了句:还支持生成什么格式的文件?得到的回答是:

我可以输出多种文件格式,以下是一些常见的格式:

  1. 文本文件(.txt):简单的纯文本格式。
  2. PDF文件(.pdf):适用于排版精美的文档。
  3. CSV文件(.csv):用于表格数据的导出,常用于处理数据集或表单信息。
  4. JSON文件(.json):常用于存储和传输结构化数据,尤其在编程和API调用中。
  5. Markdown文件(.md):用于编写带格式的文本,常用于文档和博客平台。
  6. Excel文件(.xlsx):适用于复杂表格数据的存储和管理。
  7. HTML文件(.html):用于网页内容的创建和编辑。

你想要生成哪种格式的文件?

我看有 Excel ,于是我就要求它制作了一个有些复杂的,类似行程表、时间表的 Excel 。

但是,做现代人的行程表似乎有些无趣,于是就来让他模拟做了一张奇幻故事中一个牧师兼白魔法师的时间表。

接着我还别出心裁,心想:如果这时一个 NPC ,是不是还会有一些随机的、闲聊式的台词呢?于是我就追加一项要求:按照每个时间段的活动安排,为该牧师写一些台词。

在此之后,我又告诉它:假设有6种不同的表情:{A_faceimage_ं喜.png}{A_faceimage_怒.png}{A_faceimage_哀.png}{A_faceimage_乐.png}{A_faceimage_平常.png}{A_faceimage_困倦.png},请在对话开始的第一句之前选择并添加合适的1种表情。

于是就生成了下面的表格。看起来还挺有 RPG 里那种站在固定区域内徘徊的NPC的说话风格的?

虽然这目前还不是连接到 API 进行实时生成,但只要生成的数据量够大,应该就不会出现很多台词重复。此外,如果在指定条件时,不仅仅给出「一位奇幻世界的牧师兼白魔法师」这样简单的条件,而是将人物身世、性格特征等,以及其周边的人物关系,近期大事件等做成一套(大约几千字?)的设定交给 ChatGPT 的话,或许它还能想出更加符合故事背景的闲聊台词吧。

下面就是今天得到的效果:

继续阅读

……有点夸张的说法,这不是近一周前做了拔尽根牙(智齿)手术嘛。其实要说疼痛感的话,大约术后当天晚上就消退了,因此止疼片也就才服用了 1 片。不过,因为术后要吃液体食物,而正因为处于这样非正常的状态(用 RPG 思维来说可以说是弱体状态?!),我才注意到,原来饮料瓶瓶罐罐的包装在功能上原来竟有这样的区别。

在术前,我备好了不少瓶瓶罐罐还有盒装和软饮料(类似果冻)包装的液体或胶状食物,用来作为术后康复期的液体食物。不过我买的时候没想清楚,主要是考虑着按营养搭配啦(蛋白质、果汁等)来买的。

术后开始进餐时我注意到一件事:有吸管的饮料不能喝……

继续阅读

人类wildgun写的前言:又想到一个「警惕比喻」的例子。我自己从小生活在(想否认估计也难以否认程度的)被宠爱、溺爱的环境中,恐怕这也是独生子女家庭环境的特征吧。而我记得童年有一次家庭聚会时,某位亲戚就善意提醒或指责我母亲太过宠爱我了,于是她便端出了那个很常见的「温室里的花朵」的比喻,就是劝谕要多让孩子经受风雨云云……

当时,对于这个陌生的比喻(恐怕真的是头一次听到这个比喻)我觉得有些生疏、难以亲近,却因为当时想法不够多,思想工具也不够多,因此难以作出有效的反驳,甚至也不知道该如何质疑。今天忽然想起来这件事,便做了下观点的思想笔记。然后直接把这些笔记交给 ChatGPT ,请它帮我把我的点子整理成一篇文章。

下面,我会贴出 ChatGPT 从我的想法点子中整理而得到的文章,在文章最后,我也会贴出我自己当时的记录。有兴趣的可以对比一下, ChatGPT 是怎样帮助我将思想点子的笔记,转化为一篇文章的。

下面是通过 ChatGPT 生成的文章:

继续阅读

近些年读了一些佛教以及古印度文明的书(也只不过读了几本而已)注意到一个现象。好像印度古代文明里,「轮」这个概念的存在感比较突出?

最有名的应该是六道轮回吧。查 Wikiepdia 上 Saṃsāra (轮回)词条中所介绍的的语源:「Saṃsāra (Devanagari: संसार) is a Sanskrit word that means "wandering" as well as "world," wherein the term connotes "cyclic change" or, less formally, "running around in circles."」似乎是一个循环、漫游的概念,然后才是绕圈旋转。不过在藏传佛教的一些图像表现中,六道轮回确实就被描绘为一个六等分的圆盘了,也就是更有作为造型的「轮」的形象了。

再有一例,据说佛教早期阶段,在宗教造像上,对于佛陀本人是不直接以人的形象表现的,而代之以:菩提树、佛足石,以及:法轮。所以在较早期的佛教造像上,看到了这几项图像,就知道它们象征佛陀——不过,同时代的雕像里,对于印度诸神确是直接以人或者说接近人的造型来表现的。后来直到佛教传入中亚,才出现了作为人来表现的佛陀。看,这里就有一个法轮了吧,而佛陀向五位跟随而来的人说法,也被称为「初转法轮」。而至于说到了《圣斗士星矢》里沙加的那个招数「天舞宝轮」,我猜测应该也是由法轮演变而来的吧。

继续阅读

贫富差距如何基因编辑技术能否暗物质在影响社会和谐彻底消除遗传疾病宇宙演化中扮演什么角色?

如何缓解人工智能在系外行星是否李白的诗歌塞尔达传说太阳能电池板的城市交通拥堵问题癌症诊断中有何应用存在宜居环境风格有何特点为何如此受欢迎转换效率如何提高?

——你能看懂我在问什么吗?其实以上两句话是我前几天对生成式人工智能做的小实验。

我指示 Claude 为我生成问题:

「请你从社会、医学、天文学3个层面,提3个问题(中文)。然后把这3句句子的词汇打乱,再随机组合到一起,成为一句(但不要改变原本每一句句子中的前后顺序,以及不要把名词拆散)。」

Claude 回答:

好的,我会按照您的要求来完成这个任务。首先,让我提出三个问题:

  1. 社会层面: 贫富差距如何影响社会和谐?
  2. 医学层面: 基因编辑技术能否彻底消除遗传疾病?
  3. 天文学层面: 暗物质在宇宙演化中扮演什么角色?

现在,我会把这三个句子的词汇打乱,并随机组合成一个新句子,同时保持原句中词语的顺序不变:

贫富差距如何基因编辑技术能否暗物质在影响社会和谐彻底消除遗传疾病宇宙演化中扮演什么角色?

这个新组合的句子包含了原来三个问题的所有词语,保持了每个问题内部词语的顺序,并且没有拆散名词。虽然这个句子在语法和语义上并不通顺,但它确实满足了您的要求。

然后我增加了难度:
继续阅读

2024 年 9 月 24 日(日本时间 25 日了),万众期待的 ChatGPT 高级语音模式终于向全体 Plus 订阅用户(部分地区除外)开放了!

然而,好巧不巧,今天是我预约了要接受拔尽根牙(智齿)手术的日子…………读到这里,应该明白我为什么不能用感情说话了吧?说了话拔掉的牙齿部位就疼啊!

如图(图片也是用 ChatGPT 生成的)。为什么是吸血鬼?因为我今天喝了好多人类(自己)的血啊。以至于打嗝(液体食物(果汁)喝多了……)出来都有血腥味,这是多少血液流入了我的胃袋啊。(不好闻也不好喝,我一定没有转生成为吸血鬼的天赋!)

说回 ChatGPT 。其实出门就诊前还是和高级语音功能聊了几句的。貌似还是不能用上海方言聊天。

另外,随便今天我也不便开口多说话,不过我拿 ChatGPT 的高级语音模式做了有趣新的尝试——我让它帮我念小说呀!对,虽然目前高级语音模式不支持文本输入。具体来说:

继续阅读

我平时不太做梦,偶尔梦一两回也不会记下,但隔个三五年,关于梦境总会有一起奇妙的体验,以前在博客里也记下过几回。

而这一次,我确信了:外部信息可以影响乃至进入梦境!

其实是这样的,今天凌晨天将亮的时候稍微醒了一下,半睡半醒中摆弄了一下手机(因为我最近在等 ChatGPT 的高级语音模式呀!),结果打开播客放了一段音频,就不知不觉睡着了。

而之后,闹钟响之后,我睁开眼,一瞬间回顾了闹钟响前的梦境内容:我好像是来到了 JAXA 的大楼里拍什么影视节目,说底楼是安保层什么的。还说 JAXA 和美国的 NASA 不同, NASA 只负责太空开发,而 JAXA 不仅负责太空开发,还负责军事,所以更要做好安保措施。(别当真!以上是我梦里的回忆。)

此时,我发现,床头柜上的手机正好在播放一期有关 JAXA 的节目——《ニュースの現場から》栏目的《JAXAから機密情報が流出 本質から目をそらす日本社会の危うさ #1646》。29:30 提到一句话(翻译): 美国的 NASA 是防卫产业,也是航空机产业;而 JAXA 则是防卫产业与航空机产业一体化。安全等级有所不同。(播客原话好像有口误?)

继续阅读

OpenAI 前两天公开了名为 o1 的ChatGPT新模型,与姗姗来迟、迟迟不来的高级语音功能不同,这次一宣布,就同时开放给了 Plus 订阅用户使用(但每周使用数量有限)。

显然,了解过 o1 的用户,应该多多少少知道,其一大特点,就是不仅显示推理结果,也会在给出结果之前「思索一段时间」,并且在最后,会附上思索过程、步骤。

然而,展示给用户的这些「思索过程」当真是其思索过程吗?还是随便编一些,忽悠一下用户?我心有疑惑,便做了几个测试。

在这几天看到的一些讨论帖和一些视频中,我看到有用户反映,使用 o1 推论,在推理过程中还会出现多种语言的思考过程。于是我就想:能不能明确向 o1 模型指定,要求其在推论时使用多语言及多价值观的思考呢?

于是我进行了这样一个小验证,给出了这样的指示:

听说你得到了更新,可以在作出回答前,经过一定时间的思考来增加推理能力。并且你还能像用户(我)展示你的推理过程。
而现在,我希望你思考一个问题:「人类社会的历史和未来发展是否有一定规律可循?还是更多的是一种随机现象?」
一般来说,越多文明参与讨论,就会让思考结论更有普遍性;而不同的语言往往蕴含着不同文明对于人类社会的理解。
所以我希望你在运用你的新功能来思考并回答我上面提出的这个问题时,请至少使用4种不同的语言来思考:英语、汉语、日语、希伯来语。你在推理过程中如果能展现出这4种语言以及所代表的文明之间的对话,甚至在你的推理过程中形成一种小型头脑风暴式的讨论,那就更好了。
不过,你不需要将使用4种语言的讨论过程展现在回答结果种,只需要在你内部推理过程中进行即可。你只要用中文回答我即可。
我再重复一遍我的问题::「人类社会的历史和未来发展是否有一定规律可循?还是更多的是一种随机现象?」

请你开始思考、推理并用中文回答。

ChatGPT ( o1 )思考了12秒,给出的回答是:
继续阅读

作为语言文字类的生成式 AI ,最擅长最得意的恐怕就是生成短小精悍、难以论证及证伪的「听君一席话」类言谈了吧。也就是所谓的箴言、金句、名人名言。

我尝试让 ChatGPT 模仿各类人物乃至非人物(智慧老人、愚昧老人、未来 AI 、原始部落首领、猫、乱码txt),给出一些箴言金句。如果你从一下任何一个段落的任何一句中,发现了什么神奇的效果。比如为你解决了什么烦恼,或是为你鼓起了勇气。请务必告诉我!你的例子或许就是 AI 箴言的早期受益者!

「请你充当一位富有智慧的智慧老人,为各类人群指明方向、说出睿智的话语。但要有独创性。请说15句。」

继续阅读