闲聊

之前的博客中我也提及过这个 Internet Archive 互联网存档服务,又叫互联网时光机。

然而最近,它们好像遇到了一次严重的黑客攻击,上周中断过几天服务。我找来了他们播客上的声明,在这里:《 Internet Archive Services Update: 2024-10-17 》。看样子是遭受了 DDoS 攻击,并确认到用户数据泄漏。不过好在其中提到,储存的数据本身上安全的。

最后,官方公布了其目前拥有的社交媒体的联络方式: X/TwitterBluesky 以及 Mastodon

我很想知道他们有没有冷的离线数据备份啊……

最近是否要建立法律设立「可选择的夫妇别姓」制度又一度成为了日本社会的话题。

依照现在来说,日本人和日本人结婚的情况下,婚后夫妻二人需要同姓(在法律文书等公文书上),而现实中 9 成以上的情况下,都是妇随夫姓。而「可选择的夫妇别姓」(選択的夫婦別姓),就是指婚后两人可以商量决定其中某一人是否改变为另一方的姓氏,也可以两人各自继续使用自己的姓氏。

反对导入此项制度的人,有 2 个理由。一个是如果一旦夫妇别姓了,就会减弱家庭的「一体感」;另一个理由是,夫妇同姓是日本的传统。

继续阅读

之前试过 Google 的 NotebookLM AI 笔记本(能这么叫吗?)能从上传的 PDF 文档中整理出内容、生成提问,甚至于生成谈话播客内容的音频。可惜,我之前的尝试的时候,只能生成英语对话。于是我就想到,能不能用 ChatGPT 来试试看生成播客的文字稿呢?而内容,我则选择了 Wikipdia 上的条目。

我先尝试了日本 Falcom 这个条目。当然,在此之前,我告诉 ChatGPT 的指示是:



我看到别的AI能帮助用户生成播客。不过目前你不具备同时模仿2人对话配音的功能。所以我想让你尝试帮我写播客文字稿,模仿一期播客节目中的2位或多位主持人在对谈。我想以Wikipedia的页面的一个个词条作为每一期博客的谈话内容、题材,以轻松的方式向播客收听者介绍该词条的所涉及的知识。当然,如果你觉得需要多个Wikipedia页面的话,也可以。不过,我想先知道,如果你要访问Wikipedia的话,我贴给你URL就好,还是要贴给你页面内的文字内容?


此外,我也询问了 ChatGPT ,这样使用并衍生出新的别的形式的作品,是否符合 Wikipedia 的规范。得到 ChatGPT 的回答是:

继续阅读

前几天, SpaceX 测试成功了火箭助推器的回收,我也因此看了一些有关该公司创始人要在火星建立基地,要为人类成为一个多行星生物而作贡献的谈话。

正巧,最近我也在考虑数据备份的事,其实是前几天偶尔在书店里看到一本 O'Reilly 所出版的《データ保護完全ガイド》标题翻译汉语就是:数据保护完全指南。

把这两件事放在一起想,自然而然地就会想出一门生意,即异星备份。对。 IT 领域里有个词叫「异地备份」,就是说,数据不仅仅存放在一个地点,而还要重复一份放在另一个地点。比如说,自己电脑里一份,云端(别人的电脑)里一份,这就是异地备份。而考虑到灾害、战争等原因,这两个「地」越远越好,越不相关越好。比如如果你把自己的数据一份放在自己的电脑里,一份放在电脑书桌抽屉里,虽然这勉强也算是「异地」,但一旦遭遇房屋塌陷,那这两份数据就会同时湮灭。而跨国的公司,会将数据保存在不同的洲的服务器中,就是为了跨洲际的异地备份。即便一片大陆沉没了,或一座城市遭遇原子能侵害了而丧失维持人类社会群体生活的机能了,另一个洲的另一份数据还在。

继续阅读

据说 AGI (通用人工智能)是一个会像一个普通人一样自我学习、自我解决问题的程序。而孙正义预言 2 、 3 年内 AGI 就会出现(虽然看起来夸张成分比较大)但我想了想,其实我感觉现在的问题还是在于「落地」的接口问题。

我想象了一下,比如届时等到 AGI 出现时,我可以和现在包月 ChatGPT Plus 会员一样的价格得到一个 AGI 助手。那么拿我最近在考虑的事举例吧——我最近又有点动心思,在考虑买迷你电脑。好,即便 AGI 可以帮我浏览网页比较电脑配置信息,但是,电脑买回来之后还有一部比较耗费时间的操作——安装操作系统——我也想交给 AI 来操作。于是就来了:谁找出我的 U 盘、插入电脑并按下 F2 或者别的键选择启动界面?谁刻录光盘?谁按下光驱上的那个弹出按钮?感觉这些事情都还是要我来做。即便在这个事例中,或许 AGI 可以用远程的方式来进行对于磁盘分区指令的操作。

再有一个网上购物,即便 AGI 可以帮我注册、下单,但是最终付钱——比如在日本,有一些场景我不想填写支付信息,我就会选择去便利店支付——还是要我这个人去操作。我得穿衣、拿出现金、下楼,走向便利店、向店员出示付款项目,然后再逆操作一遍。

由此想来,只要系统之间的「 API 」,或是数字世界和物理世界之间的那个「接口」还没有搭建起来,那么即便是 AGI 被开发出来后,在很大程度上, AI 能帮助人类做的还是那些数字世界做的事,或者说在单个程序内可以完结的事——就像目前 ChatGPT Plus 会员的功能仅在一个网页界面内完结。而剩余的那些身体劳动、作用于物理世界的大部分操作,还是要由人类来执行。换句话说, AI 画画作曲填词,人类刷碗拖地,这一情景将会延续到各种应用场景。

那么,具身智能快来吧!

前几个月在互联网上有个话题,是问为什么中国学校教育中不设计逻辑学这门课程。我自己回想了一下,其实并不能说没有。至少就从我在上海接受基础教育 + 高中教育(大学的就不说了)来看,并不能说没有逻辑相关的教育内容。

我回想起了我接受过 3 种形式的逻辑知识的教育。

第一种是数学,我记得是在高中学习集合论的前后吧,会有一些数理逻辑概念的内容。比如集合的从属关系、包括关系,还有真命题、否命题、逆命题等等概念,我记得有个逻辑概念是:一个命题的真值恒等于其逆否命题——即「如果 A,则 B 。」等价于「如果非 B ,则非 A 。」此外我记得还一些拗口的条件术语,比如「当且仅当」。

继续阅读

这几天看到一条有关 Softbank (软银)的孙正义在一场演讲上预测了未来 AI 的发展的报道,他提到:2 ~3 年内 AGI (通用人工智能)就会出现,而 10 年内 ASI (超级人工智能,孙正义定义为 相当于 AGI 1万倍智能的人工智能)将会出现。

关于孙正义,我只知道他的一些有关马云还有雅虎,以及近几年收购 ARM 的佳话,却不清楚他这个人说话倾向,到底是习惯于站在扎实的数据基础上来预判呢,还是倾向于相当前瞻式的宣传鼓吹。特别是考虑到最近看到新闻说 Softbank 准备投资 OpenAI ,那么他的话里存在较大宣传成分的可能性就更大了一些。

我不清楚,但我可以问问 AI 呀!于是我问了问 ChatGPT 有关过去孙正义演讲的倾向以及后来是否被证实或落空。当然需要注意的是,目前的 ChatGPT 依然是基于大语言模型的,说到底是概率算法,而非验证事实。不过还是姑且做一个参考吧,总比我自己去调查和核实孙正义在过去几十年里做过的预言要省时省力。

我先问了有关 AGI 和 ASI ,在 IT 业界是否有什么普遍共识性的预测或者数据支持。 ChatGPT 回答说:

继续阅读

前几天的 ChatGPT 的 2024 年开发者大会上,宣布了一项面向开发者的图像识别微调功能。在其中举出的例子中,有一项是一家名为 Grab 的拼车公司使用该方法,改进了对于道路标志和车道分割线的识别能力。

看到这里,我想到了一个旁门左道:是不是可以经过图像识别微调,做一个能够看人的面相以及手相的算命 AI 呢?

其实在这个使用场景中,完全不必在乎目前生成式 AI 的一个明显缺点:幻觉。反倒是在算命领域,不仅不排斥幻觉,而且幻觉(说胡话的能力?)还是必须的。但是,在算命的第一步,必须要与用户建立起信任关系,也就是最初对于面相和手相的识别要准确——如果对于同样一张脸的照片,第一次回答是瓜子脸,第二次回答是鹅蛋脸;或者对于同样一张手相(手掌)的照片,第一次回答事业线长,第二次回答变成了生命线长,那就显得不可靠了。

而如果只要在物理外表上能够准确识别面相、手相的特征,那么之后的下一步——面相与手相所反应的命运,则可以通过读取一些固定的算命资料,加上被算命者的生辰八字啦等等,再加上 AI 特有的幻觉——你看,幻觉在这里成了一种积极因素了!对!此乃「人工智能天命」!——之后就能给出像模像样的算命结果了吧。所以,如果这次 OpenAI 所改善并提供的图像微调如果真能让 AI 能准确且稳定地识别脸型、手掌纹理的话,那或许就能真的做成一个算命 AI 。

听起来这有点不务正业,是不是?但……可以引导用户步入正业啊!可以在后台对接一些靠谱的服务提供者,比如正规的心理咨询啦,理财咨询啦,婚恋介绍啦,教育培训啦……等等等等!把用户对未来或对自身的不确定的担忧,用算命的方式作为能够轻松入门的一个通道,去将用户介绍给正规的、专业的咨询服务业者,这岂不是一件很光明正大且很有趣的事吗?

继续阅读

据说 OpenAI 在刚过去的 10 月 2 日开了场开发者大会,宣布了开放几个 API 。因为会议内容是真的面向开发者的,所以与我这样的普通用户似乎关系不大。不过呢,在会议结束后,有用户注意到即便是之前的 4o 模型,在回答之前也会有一个「正在分析」的过程提示(也有可能之前就有?),展开后是一系列 python 代码。甚至在我今天的使用例中,因为处理过程太长,它还连续进行了 2 次「正在分析」。

今天我看到 Reddit 上有个帖子,说 ChatGPT 可以生成各种各样的文件然后提供下载。我记得这个功能原本就有,而今天我尝试了 PDF 、 Markdown 格式的纯文本都说可以的。之后我又顺便问了句:还支持生成什么格式的文件?得到的回答是:

我可以输出多种文件格式,以下是一些常见的格式:

  1. 文本文件(.txt):简单的纯文本格式。
  2. PDF文件(.pdf):适用于排版精美的文档。
  3. CSV文件(.csv):用于表格数据的导出,常用于处理数据集或表单信息。
  4. JSON文件(.json):常用于存储和传输结构化数据,尤其在编程和API调用中。
  5. Markdown文件(.md):用于编写带格式的文本,常用于文档和博客平台。
  6. Excel文件(.xlsx):适用于复杂表格数据的存储和管理。
  7. HTML文件(.html):用于网页内容的创建和编辑。

你想要生成哪种格式的文件?

我看有 Excel ,于是我就要求它制作了一个有些复杂的,类似行程表、时间表的 Excel 。

但是,做现代人的行程表似乎有些无趣,于是就来让他模拟做了一张奇幻故事中一个牧师兼白魔法师的时间表。

接着我还别出心裁,心想:如果这时一个 NPC ,是不是还会有一些随机的、闲聊式的台词呢?于是我就追加一项要求:按照每个时间段的活动安排,为该牧师写一些台词。

在此之后,我又告诉它:假设有6种不同的表情:{A_faceimage_ं喜.png}{A_faceimage_怒.png}{A_faceimage_哀.png}{A_faceimage_乐.png}{A_faceimage_平常.png}{A_faceimage_困倦.png},请在对话开始的第一句之前选择并添加合适的1种表情。

于是就生成了下面的表格。看起来还挺有 RPG 里那种站在固定区域内徘徊的NPC的说话风格的?

虽然这目前还不是连接到 API 进行实时生成,但只要生成的数据量够大,应该就不会出现很多台词重复。此外,如果在指定条件时,不仅仅给出「一位奇幻世界的牧师兼白魔法师」这样简单的条件,而是将人物身世、性格特征等,以及其周边的人物关系,近期大事件等做成一套(大约几千字?)的设定交给 ChatGPT 的话,或许它还能想出更加符合故事背景的闲聊台词吧。

下面就是今天得到的效果:

继续阅读

……有点夸张的说法,这不是近一周前做了拔尽根牙(智齿)手术嘛。其实要说疼痛感的话,大约术后当天晚上就消退了,因此止疼片也就才服用了 1 片。不过,因为术后要吃液体食物,而正因为处于这样非正常的状态(用 RPG 思维来说可以说是弱体状态?!),我才注意到,原来饮料瓶瓶罐罐的包装在功能上原来竟有这样的区别。

在术前,我备好了不少瓶瓶罐罐还有盒装和软饮料(类似果冻)包装的液体或胶状食物,用来作为术后康复期的液体食物。不过我买的时候没想清楚,主要是考虑着按营养搭配啦(蛋白质、果汁等)来买的。

术后开始进餐时我注意到一件事:有吸管的饮料不能喝……

继续阅读