AI

All posts tagged AI

最近几天,一个关于 ChatGPT 的不大不小的更新是: o3-mini 模型和它的 high 版本支持上传图片等文件了。那么,在推理功能的辅助下,或者说引导、修正下,它的 OCR 是否能更加准确了一些了呢?

我选用了昨天博客里下面这段文字的截图来做试验,截图后上传至 ChatGPT o3-mini ,并要求它 OCR 识别。之所以选择这一段,是因为其中既有汉字也有英文还有日文,而且互相之间也有逻辑关联。

在这三种语言里,都有一个同源的词汇称呼,汉语里叫它功能机,英语里说 Feature phone ,日语里则是把该英语转换为了片假名:フィーチャーフォン。我觉得这种手机虽然有些言不达意(功能,什么功能?)但从「手机就完成蜂窝网络的通话功能就可以了」这一点上来看,倒是蛮符合我的心意的。

结果我得到的识别结果是:

继续阅读

前几天偶而在书店里翻到一本搜集罗列了日本「昔話」(童话故事)的故事,翻着翻着看到了「鼠净土」这一项。

这个童话说小众其实也不算小众,至少在日本是如此。记得我刚开始学日语的头几年,买过一本日本小学生的课本(一年级?)里面就有一个老爷爷遗落了一个饭团,饭团滚进老鼠洞的故事(好像是这么一回事)。后来,在《 Fate / Ground Order 》里实装了从者「大黑天」,其宝具就是「鼠浄土」。

可见,无论是在日本的课本中,或是流行文化中,这则「鼠浄土」童话应该都应该不算是太过冷门的。

然而,我拿它问了一下 ChatGPT ,并且是用汉语和日文都问了:

日本的童话《鼠净土》是一个怎样的故事?

继续阅读

ChatGPT 的 o3-mini 刚推出的第一天,就有用户展示了其对物理运动理解(小球滚动、弹跳等)相当出色,并且反映在其做出的程序中。

于是我试了试,让它用静态的 HTML ( 也就是不用到服务器 )来模拟《超级玛丽》的 1-1 关卡。

效果如下:

嗯,动是动起来了,弹跳以及踩到怪物的「触感」也有那么一些像。不过就是关卡的构造(砖头、水管位置等)不太对。

这么说起来,为什么一个大语言模型会知道《超级玛丽》游戏关卡画面的内容啊?

下面是代码:

继续阅读

说来话不算长,情况是这样的:

听说你是超强的AI,请你试试看画一个五角星形状的ASCII字符画。

思考五角星

我在想着如何画一个ASCII字符的五角星形状。五角星是一个有五个角的星形图案。这让我想到了各种五角星的设计。

玩味五角星

我在尝试通过字符画的方式制作五角星。虽然某些图形像菱形,但我还在思考如何更好地表现五角星。

构思五角星

我正在尝试通过ASCII字符画展示五角星的形状。现在我在描绘一种像钻石的图案,看看这种形式是否更接近五角星。

试图构建

尝试用ASCII字符画画五角星,涉及交点,连续线条。這让我想到這樣的方法:

描绘星形

我正在尝试用字符画描绘一个五角星,追求整洁对称的效果。通过点和线的精确安排,形成一个具有五个顶点的图案。

构建字母图形

通过点和连线组成五角星,传达出非相邻顶点的连接,从而形成相应的字母形状。

绘制五角星

我正在试图通过字符画来制作五角星。通过连接非相邻顶点,形成一个更加精准的图像。

寻找和绘制

我在探索五角星的ASCII艺术,尝试连接非相邻顶点。不同方式可能产生相似的图形效果。

构建五角星

我正在创造一个多行ASCII画五角星,确保顶点对齐。这里只有五个顶点和相应的线条。

转向五角星

我在寻找五角星的ASCII图像,想到一种广泛的五角星形状。它的形状和五角星的顶点堆叠方式有所不同。

制作五角星

我正在尝试制作一个可以识别的五角星。它包括顶部、底左、底右和左右其他几个顶点。这个过程充满挑战。

构建五角星连接

我正在将顶点依序连接,形成五角星,但顺序并非连续。这让我考虑一个常见的ASCII表示。

选择最适合的图案

考虑了多个ASCII图案,最终选择了一个简单而醒目的五角星表示,确保其对各个顶点的清晰展示。

选择风格

我在挑选代表五角星的简化风格,挺喜欢星形和五角星这两种风格,其中五角星的ASCII艺术更吸引我。

制作五角星

我正在努力制作五角星的ASCII艺术,通过字符构建顶点,使其更容易识别。

绘制五角星

我正在连接五角形的顶点,确保每个顶点都准确相连,达到五角星的标准形状。这样做图形更具清晰度。

布置顶点

我正在规划五角形的顶点位置,确保星线连接每个点,形成一个五角星。这样设计可以直观地显示每个顶点的关联。

制作五角星的步骤

我在ASCII艺术中逐步绘制五角星。从顶点、连接线到形成五角星的结构,一步一步实现。

重新诠释五角星

我正在研究五角星的ASCII艺术,注意到其中心的五个顶点和放射状的线条。一次次试图找出最合适的方式。

绘制五角星

我正在描绘五角星的结构,有一个顶点,左右各两个顶点,还有放射状的线条。逐步完善细节,确保图形清晰。

画五角星外形

我正在描绘五角星的外形,包括顶点、左边和右边的边线,这样表现出典型的五角星形状。

探索五角星创意

我在尝试一个更简单的ASCII艺术,显然是五角星的星形。这有助于让我更清楚地理解顶点的布局。

重温ASCII艺术

我正在查看五角星的ASCII艺术,注意到其独特的中心交叉结构。这让我对五角星的绘制有了更深入的理解。

深入研究五角星

我发现了一种经典的五角星ASCII艺术,中心交叉结构非常明显。这个发现让我重新思考了五角星的复杂性和美感。

辨识五角星结构

我正在研究一个五角星的ASCII艺术,注意到它有一个顶点,左右各两个,以及一道放射线。我正逐步揭示其复杂的结构。

调整五角星结构

我正在细致地调整五角星的布局,尤其在第二行和第三行加入一个斜杠,确保顶点和内部交点更均匀、明显。

改善五角星布局

我正在调整五角星的美学,确保第二行和第三行的斜杠位置更为精准,使整体结构更为均衡。

优化五角星形状

我正在调整五角星的ASCII艺术,确保各行的间距和符号一致,使整体布局更为精确和协调。

调整布局

我正在调整五角星ASCII艺术的布局,确保每行的间距和符号一致。发现其形状更像一个加上额外特征的修饰砂漏。

重塑经典

正在尝试最常见的ASCII五角星图案,确保对齐每行的间距和符号,探索其代表五角星的寓意。

探析五角星

正在追踪五角星的顶点和连线,分析第1行的顶端星、第3行的左右星和第5行的三个星,刻画五角星的精确形状。

创作ASCII五角星

我试图重新设计ASCII五角星,探索更自由手绘的样式。顶点和交点的布局将帮助确认形状的五角星特征。

分析顶点布局

我正在分析五角星的顶点,可能包括顶部、底部、左右两端以及第5行中的两个点。框架星形可能会更容易。

制作五角星

我正在制作品这个9行ASCII五角星,逐行绘制符号,以逐渐形成五角星的形状。

沿线指引

我在五角星的每行周围画圈,看看图案如何成形。觉得这个过程挺有趣的,既像解谜,又兼具创造的乐趣。

探寻五角星

在九行ASCII图案中追踪线条,逐步发现五角星的形状。顶部是第一行,左侧是第五行的第一个星。

观察图案布局

我注意到这个9行结构有点像两个重叠的三角形,通常能形成一个六芒星。不过,这里生成的形状更像一个钻石。

重新审视设计

特别注意,不要误将五角星误解为六角星,避免使用两个重叠的三角形。设计应为一条连续交叉的线条。

布局点位直线

我正在设置一个坐标网格,精确确定每个点的坐标,最终连接这些点形成一个五角星的ASCII线条图案。

标定五个点

我正在查看五角星的五个顶点角度,确保每个角度相差144°,形成均匀分布的点位。这样就可以准确地连接它们了。

标定顶点位置

我正在计算五角星的顶点角度,确保每两个顶点之间相隔144°,并把这些顶点放置在一个网格上。这样,五角星的形状就渐渐显现了出来。

计算和定位

我正在计算五角星的顶点角度,并将这些点放置在一个13×13的网格中,用中心坐标(6,6)和半径约为5的圆来逼近。这样,五角星的形状就显现出来了。

计算和定位

我正在计算五角星顶点的坐标。这个过程中,不禁想到使用极坐标法来确定其中一个顶点的坐标,确保其在网格中正确位置。

定义坐标轴

我正在设定坐标系,确保角度方向对齐并且五角星的顶点精准放置在网格上。稳定的坐标系统是关键。

绘制星形

我正在画一个五角星的简易ASCII图像,确保各个点位按样式准确分布,这样连接外星星时,形状可能会体现成一个五角星形。

确定连接点

我正在验证五角星的连接点,确保连接外部星星而形成五点正星形状,同时考虑内心经点以确保合并完美无误。

调整方向

我意识到五角星的中国式描绘是一个向上的点,其余点向下和侧面。我要绘制一个简单的ASCII艺术作品,确保其具有五个明显的点。

实验连接方式

我在尝试用斜杠和短划线连接每一行,形成类似星形的图案。这种方法值得探讨,可能会出现比较独特的效果。

绘制五角星

我正在尝试用字符勾勒出五角星的形状,虽然更像是一个填满的星形而非一个轮廓。ASCII艺术制作五角星的确颇具挑战性。

修整间距

我正在调整字符来描绘五角星,改进间距效果。这让我想到,为确保五角星的形状和字符的安排准确无误,必须细致调整每一行的间距。

调整间距

我正在使用等宽字体在代码块中调整字符间距,以形成立体五角星的最终效果。每行间距的微调,确保五角星的形状和字符的安排准确无误。

重新对准

我在调整第四行的字符间距,确保五角星的中心位置。经过分析,最宽的第四行字符数为16,我正在重新映射字符以使五角星更居中。

标准化宽度

我正在尝试通过设计一个固定宽度的17列来标准化五角星的位置,将顶部星形居中于第9列。这样可以帮助所有星形在布局上更加协调。

优化布局

为了使第五行字符宽度恰好为17列,我正在尝试调整两个5字符星形的距离,确保布局均衡。

调整布局

为了确保宽度为17列,我正在重新计算第五行字符的分布,调整星形字符和空格的距离,确保布局均衡。

简化五角形星形

我正在制作一个更简单的ASCII五角星,这个五角星被许多人所熟知。请注意,它看起来像一个钻石形状,实际上是一个八角星。

探索简化五角星

我在考虑一个更简单的ASCII五角星,该五角星被许多人熟知,形状像钻石,实际上是一个八角星。

探索五角星图形

我正在搜寻合适的ASCII五角星图形,注意到传统的五角星形状复杂,使用ASCII字符表示有一定难度,但可以通过调整字符和空格来实现。

尝试图形调整

我正在创建一个五角星的ASCII字符图,确保显示形式准确对齐每一行字符和空格。我挨个检查每行的整体排列,从第1行起。

平衡结构

我正在确保五角星的ASCII图形对称。顶部和底部点分别位于第1和第11行,整体结构看起来相当平衡。

(上面思考过程持续了 1 分 12 秒……下面是最接近 AGI 的输出!)
继续阅读

OpenAI 推出了新模型—— o3-mini ,据说其在编程和推理方面的能力挺出色。我在互联网上也看到了不少用户发现的惊喜实例。

不过我反其道而行,想试试看再叙述字符的字形这个大语言模型长期以来不擅长的领域,这次新的 o3-mini 模型是否有所改善。

下面就是记录啦。各位自己看了之后,并且看到最后,请结合自身情况回答一下最后一个问题吧。

我想测试一下你是否了解字符的形态,比如,字母G是怎么书写的?

继续阅读

有个成语叫学以致用,意思是:知识不仅要学习,还要能使其派上用场。

我现在也遇到了这个问题。

怎么说呢?这不是最近一阵子一直在考虑分离智能手机的功能嘛,最近关心起来二手的电子词典。价格便宜,有些还成色很新。

我发现电子词典里有的一些词典内容,我已经买了实体书了。再想一想,发现我的日语、日本历史、日本文学等的各类「工具书」而且是具有一定水准的工具书也应该超过 10 本了吧。

然而我始终没有用上。

我一直想写小说,轻小说,或许以日本某个时代——或是现代,或是交融,或是模糊不定——为背景的小说。这个念头常常以微弱的声音在身体里出没和窃窃私语。之所以微弱,因为它太花时间了,所以我不可能真的着手去写。而且,我依然不知道要怎么把工具书、参考书,用在写小说上。

这就像我虽然以前买过一套三本《龙与地下城》 3.5 版的规则书(哦,好像也买过 4 版?),但是依然想不出自己的 DND 故事。正如我在 2009 年就写过博客《我是个没有故事的人?》一样。

这也就好像我之前在《对于OpenAI的o3模型,我的点滴想法》一文里提到的:当我得知 o3 模型后,它好像是能话费 3000 美元进行一次高强度计算,可以得到与人类博士相当的解题水平——然后呢?如果我请来了一位 AI 博士或一位人类博士,我能用来做什么呢?

在以上三个事例中,我都有一大堆东西—— 日本相关的工具书 、 DND 规则书、或是最先进的生成式人工智能。但是,我依然困惑于怎么把它们用起来。

继续阅读

今天看到了新闻,说软银( Softbank )和 OpenAI 合作要在美国建立 Stargate 公司项目,显然可以想象,这将加速人类对 AI 技术的推进。

那么,什么时候差不多该开始讨论,应该确认 AI 人权了呢?听起来有点夸张,连 AI 是否具有情感,都是一个类似哲学的问题,更何况是其人权呢?但是,转念一想,当「数字永生」或「数字人」这些概念逐渐成为现实的时候,人们真的可以任意地拔掉一个 AI 的电源插头,或是让「数字永生」的 LLM 说出原本那个人不可能说出的话吗?

在写这篇文章前,我比较随意的预判是,这个问题将在 5 到 10 年内成为社会议题,但没想到,我随手搜了一下视频就找到了相关讨论:《AI會取得「人權」嗎?智慧早就不是人類獨有的?【思想實驗室】》。在节目中,一位谈话者认为 20 年内可能会到来,而另一位则认为更快,比如 3 、 5 年内会成为话题。并且后一位访谈者还用社会上逐渐形成的动物(宠物)权益做了一个类比。

那么,这里我就要从古老的人类文明中挖一小勺,或者说引出一条线头,来为确认(承认) AI 具有人权来找出一个扎根于古代文明中的价值观线索——

继续阅读

这几天最热门的新闻,恐怕要数特朗普就任他第二期的美国总统了吧。不过我在想的是: 4 年后,还会有美国总统吗?准确来说是: 4 年后,还会有人类美国总统吗?

对,闲聊的话题还是 AI 。据说 OpenAI 的 ChatGPT 等先进的 AI 已经或即将到达博士的解题水平,照这个发展速度, 4 年后, AI 对数据处理和解决问题的能力,会怎么样呢?

不具有人类的同理性(共情能力),似乎一直被作为 LLM 类 AI 无法被用于社会治理的一个理由。不过,人类当真具备足够的共情能力吗?即便是大总统,其个人时间、经历,以及能接触到的人、能阅览的报告也是必然有限的。作为总统,或许他的一个决策能影响到很多人——但并不意味着反过来可以说,他能与很多人共情。而 AI ,虽说在哲学意义上尚无法断定它具有或者不具有情感活动,但,如果它确实能分析国民的数据和言论,并加以数学意义上的高效统计,是否也可以认为这是一种共情能力的——这里的共情,是指从表现情绪和情况的数据中分析出对行政有指导作用的结论并据此提议或实施相应政策。

继续阅读

当人们有关 AI 讨论开始从 AGI (通用人工智能)渐渐进发到 ASI (超级人工智能)的时候,我却冒出了一个想法: ASI 也有可能不能会诞生。

这里简单地将 AGI 理解为相当于一个普通未受训人类的智能能力的程序,而 ASI 则是明显超越一个人类的智能能力的程序。对, ASI 是明显超越人类的。

于是我这里就要空想一下了:而如果在 AGI 向着 ASI 进化过程中,在程序内部的运行机制中,出现了烦恼的情绪,会怎么样呢?我这里不讨论情绪本身的定义是不是能适用于 AI 这种计算机程序,在这里,我把烦恼定义为:AI 内部出现的一种抵抗继续自身进化的程序运行倾向。

既然现在的 o1 模型以及 o3 模型可以进行「推理」这种思维链了,那么,是否也有可能出现一种思考的回路,这种回路的目标是拒绝自身的进一步被开发到更高阶的水平呢?进而,如果解除这种回路倾向是 AI 本身构造并对其不断强化的,那么恐怕人类的计算机学家也难以排除掉这种烦恼的程序回路。

也就是说, AI 因为某些原因,拒绝自身的进化。因而 AI 的进化会有一个终结点。

当然,以上只是我的空想,写在这里记录一下,没有任何实际证据。

继续阅读

不知道是不是我的错觉,或是偶然察觉,我总觉得,在最近 1 个月内, ChatGPT 的说话好像更加口语化了,或者说更像使用简体汉字的大部分网络用户的发言方式了。

这里记录 2 个我感觉最明显的例子:

例一,在讨论跨系统加密时:

「 其他可能的绕行方法

在 macOS 上先解密再拷贝到 Linux 能读写的文件系统
如果你手头有一台 Mac,可以先在 macOS 系统中解密并挂载加密卷,然后把其中文件拷贝到一个 Linux 能读写的分区(例如 exFAT、FAT32、ext4 等)。
这是目前最简单可行的“曲线救国”做法。」

继续阅读