人工智能

All posts tagged 人工智能

用Claude3.7编写网页小游戏即试后感

Posted by wildgun on 2025年2月26日

Posted in: IT数码信息科技. Tagged: AI, Claude, 人工智能, 生成式AI, 程序设计. Leave a Comment

这是一篇简短的试用记录——因为根本不成功。

这几天我看到 Claude 3.7 发布的消息，并且似乎网上不少消息和 Reddit 上不少帖子都称赞其编写代码的能力极佳。

然而，就我自己的试用体验来说——我尝试了与上次试用 ChatGPT o3-mini 试用网页代码模拟《超级玛丽》关卡帖子一样的提示词，来让 Claude 3.7 也来实现它。

我想你应该知道FC游戏《超级玛丽》，请你用html语言写一个文件，来模拟演示FC平台上该游戏的1-1关卡（不需要人工操作，自动演示）。为避免著作权问题，你可以用简单的线条、简单的SVG图像代替画面元素。但是关卡和画面通关方式要看起来像是超级玛丽的1-1关卡。

结果……第一次生成的代码结果，网页上超级玛丽动是动起来了，但是经过绿色的方块（代表管道）时却直接叠加并穿过了管道，也就是说，在物体碰撞的规则方面， Claude 3.7 并没有把管道设计成是一种障碍物体。而至于我指示该错误并且要求修改后——第二低生成的代码中超级玛丽干脆就动都不能动了，我按方向键也无用，变成了一个《超级玛丽》的开场静止等候画面。

这两次都不怎么成功（与之前 o3-mini 生成的效果相比）。不知道是不是因为我仅是 Claude 免费用户这个原因。（ ChatGPT 我付费订阅了。）是为记。

即便是o3-mini推理模型，现在还是难以胜任OCR

Posted by wildgun on 2025年2月16日

Posted in: 闲聊. Tagged: AI, ChatGPT, OCR, 人工智能, 文字识别, 生成式AI. Leave a Comment

最近几天，一个关于 ChatGPT 的不大不小的更新是： o3-mini 模型和它的 high 版本支持上传图片等文件了。那么，在推理功能的辅助下，或者说引导、修正下，它的 OCR 是否能更加准确了一些了呢？

我选用了昨天博客里下面这段文字的截图来做试验，截图后上传至 ChatGPT o3-mini ，并要求它 OCR 识别。之所以选择这一段，是因为其中既有汉字也有英文还有日文，而且互相之间也有逻辑关联。

在这三种语言里，都有一个同源的词汇称呼，汉语里叫它功能机，英语里说 Feature phone ，日语里则是把该英语转换为了片假名：フィーチャーフォン。我觉得这种手机虽然有些言不达意（功能，什么功能？）但从「手机就完成蜂窝网络的通话功能就可以了」这一点上来看，倒是蛮符合我的心意的。

结果我得到的识别结果是：

继续阅读

试用iPadOS的图片生成AI

Posted by wildgun on 2025年2月11日

Posted in: AI绘图. Tagged: Apple, AppleIntelligence, iPad, iPadOS, 人工智能. 2 comments

虽说自从上次发布了《在iPad上开始试用苹果AI（AppleIntelligence）》以来，该文一直是我博客中访问量较高的博客，不过其实我自己生活中并没有用上多少 Apple 的人工智能。

最近有听说 Apple 将要发布新设备（ SE4 ？）——当然，正如我最近博客中多篇文章所示，我正试图解离智能手机的功能，让移动电话还原为移动电话——不过还是让我想试一试 Apple Intelligence 在这过去的半年里开放的新功能。

我试了一下在备忘录中画了一朵花…………嗯，虽然大概 6 年之前我努力练习过画画，但看来现在又退化到了幼儿园的水平。但是，我用 AI 「抢救」了一下！它变成了这样：

继续阅读

o3-mini-high经过1分12秒的推理后画出的五角星

Posted by wildgun on 2025年2月6日

Posted in: 闲聊. Tagged: AI, ASCII, ASCIIart, 人工智能, 字符画. Leave a Comment

说来话不算长，情况是这样的：

听说你是超强的AI，请你试试看画一个五角星形状的ASCII字符画。

思考五角星

我在想着如何画一个ASCII字符的五角星形状。五角星是一个有五个角的星形图案。这让我想到了各种五角星的设计。

玩味五角星

我在尝试通过字符画的方式制作五角星。虽然某些图形像菱形，但我还在思考如何更好地表现五角星。

构思五角星

我正在尝试通过ASCII字符画展示五角星的形状。现在我在描绘一种像钻石的图案，看看这种形式是否更接近五角星。

试图构建

尝试用ASCII字符画画五角星，涉及交点，连续线条。這让我想到這樣的方法：

描绘星形

我正在尝试用字符画描绘一个五角星，追求整洁对称的效果。通过点和线的精确安排，形成一个具有五个顶点的图案。

构建字母图形

通过点和连线组成五角星，传达出非相邻顶点的连接，从而形成相应的字母形状。

绘制五角星

我正在试图通过字符画来制作五角星。通过连接非相邻顶点，形成一个更加精准的图像。

寻找和绘制

我在探索五角星的ASCII艺术，尝试连接非相邻顶点。不同方式可能产生相似的图形效果。

构建五角星

我正在创造一个多行ASCII画五角星，确保顶点对齐。这里只有五个顶点和相应的线条。

转向五角星

我在寻找五角星的ASCII图像，想到一种广泛的五角星形状。它的形状和五角星的顶点堆叠方式有所不同。

制作五角星

我正在尝试制作一个可以识别的五角星。它包括顶部、底左、底右和左右其他几个顶点。这个过程充满挑战。

构建五角星连接

我正在将顶点依序连接，形成五角星，但顺序并非连续。这让我考虑一个常见的ASCII表示。

选择最适合的图案

考虑了多个ASCII图案，最终选择了一个简单而醒目的五角星表示，确保其对各个顶点的清晰展示。

选择风格

我在挑选代表五角星的简化风格，挺喜欢星形和五角星这两种风格，其中五角星的ASCII艺术更吸引我。

制作五角星

我正在努力制作五角星的ASCII艺术，通过字符构建顶点，使其更容易识别。

绘制五角星

我正在连接五角形的顶点，确保每个顶点都准确相连，达到五角星的标准形状。这样做图形更具清晰度。

布置顶点

我正在规划五角形的顶点位置，确保星线连接每个点，形成一个五角星。这样设计可以直观地显示每个顶点的关联。

制作五角星的步骤

我在ASCII艺术中逐步绘制五角星。从顶点、连接线到形成五角星的结构，一步一步实现。

重新诠释五角星

我正在研究五角星的ASCII艺术，注意到其中心的五个顶点和放射状的线条。一次次试图找出最合适的方式。

绘制五角星

我正在描绘五角星的结构，有一个顶点，左右各两个顶点，还有放射状的线条。逐步完善细节，确保图形清晰。

画五角星外形

我正在描绘五角星的外形，包括顶点、左边和右边的边线，这样表现出典型的五角星形状。

探索五角星创意

我在尝试一个更简单的ASCII艺术，显然是五角星的星形。这有助于让我更清楚地理解顶点的布局。

重温ASCII艺术

我正在查看五角星的ASCII艺术，注意到其独特的中心交叉结构。这让我对五角星的绘制有了更深入的理解。

深入研究五角星

我发现了一种经典的五角星ASCII艺术，中心交叉结构非常明显。这个发现让我重新思考了五角星的复杂性和美感。

辨识五角星结构

我正在研究一个五角星的ASCII艺术，注意到它有一个顶点，左右各两个，以及一道放射线。我正逐步揭示其复杂的结构。

调整五角星结构

我正在细致地调整五角星的布局，尤其在第二行和第三行加入一个斜杠，确保顶点和内部交点更均匀、明显。

改善五角星布局

我正在调整五角星的美学，确保第二行和第三行的斜杠位置更为精准，使整体结构更为均衡。

优化五角星形状

我正在调整五角星的ASCII艺术，确保各行的间距和符号一致，使整体布局更为精确和协调。

调整布局

我正在调整五角星ASCII艺术的布局，确保每行的间距和符号一致。发现其形状更像一个加上额外特征的修饰砂漏。

重塑经典

正在尝试最常见的ASCII五角星图案，确保对齐每行的间距和符号，探索其代表五角星的寓意。

探析五角星

正在追踪五角星的顶点和连线，分析第1行的顶端星、第3行的左右星和第5行的三个星，刻画五角星的精确形状。

创作ASCII五角星

我试图重新设计ASCII五角星，探索更自由手绘的样式。顶点和交点的布局将帮助确认形状的五角星特征。

分析顶点布局

我正在分析五角星的顶点，可能包括顶部、底部、左右两端以及第5行中的两个点。框架星形可能会更容易。

制作五角星

我正在制作品这个9行ASCII五角星，逐行绘制符号，以逐渐形成五角星的形状。

沿线指引

我在五角星的每行周围画圈，看看图案如何成形。觉得这个过程挺有趣的，既像解谜，又兼具创造的乐趣。

探寻五角星

在九行ASCII图案中追踪线条，逐步发现五角星的形状。顶部是第一行，左侧是第五行的第一个星。

观察图案布局

我注意到这个9行结构有点像两个重叠的三角形，通常能形成一个六芒星。不过，这里生成的形状更像一个钻石。

重新审视设计

特别注意，不要误将五角星误解为六角星，避免使用两个重叠的三角形。设计应为一条连续交叉的线条。

布局点位直线

我正在设置一个坐标网格，精确确定每个点的坐标，最终连接这些点形成一个五角星的ASCII线条图案。

标定五个点

我正在查看五角星的五个顶点角度，确保每个角度相差144°，形成均匀分布的点位。这样就可以准确地连接它们了。

标定顶点位置

我正在计算五角星的顶点角度，确保每两个顶点之间相隔144°，并把这些顶点放置在一个网格上。这样，五角星的形状就渐渐显现了出来。

计算和定位

我正在计算五角星的顶点角度，并将这些点放置在一个13×13的网格中，用中心坐标(6,6)和半径约为5的圆来逼近。这样，五角星的形状就显现出来了。

计算和定位

我正在计算五角星顶点的坐标。这个过程中，不禁想到使用极坐标法来确定其中一个顶点的坐标，确保其在网格中正确位置。

定义坐标轴

我正在设定坐标系，确保角度方向对齐并且五角星的顶点精准放置在网格上。稳定的坐标系统是关键。

绘制星形

我正在画一个五角星的简易ASCII图像，确保各个点位按样式准确分布，这样连接外星星时，形状可能会体现成一个五角星形。

确定连接点

我正在验证五角星的连接点，确保连接外部星星而形成五点正星形状，同时考虑内心经点以确保合并完美无误。

调整方向

我意识到五角星的中国式描绘是一个向上的点，其余点向下和侧面。我要绘制一个简单的ASCII艺术作品，确保其具有五个明显的点。

实验连接方式

我在尝试用斜杠和短划线连接每一行，形成类似星形的图案。这种方法值得探讨，可能会出现比较独特的效果。

绘制五角星

我正在尝试用字符勾勒出五角星的形状，虽然更像是一个填满的星形而非一个轮廓。ASCII艺术制作五角星的确颇具挑战性。

修整间距

我正在调整字符来描绘五角星，改进间距效果。这让我想到，为确保五角星的形状和字符的安排准确无误，必须细致调整每一行的间距。

调整间距

我正在使用等宽字体在代码块中调整字符间距，以形成立体五角星的最终效果。每行间距的微调，确保五角星的形状和字符的安排准确无误。

重新对准

我在调整第四行的字符间距，确保五角星的中心位置。经过分析，最宽的第四行字符数为16，我正在重新映射字符以使五角星更居中。

标准化宽度

我正在尝试通过设计一个固定宽度的17列来标准化五角星的位置，将顶部星形居中于第9列。这样可以帮助所有星形在布局上更加协调。

优化布局

为了使第五行字符宽度恰好为17列，我正在尝试调整两个5字符星形的距离，确保布局均衡。

调整布局

为了确保宽度为17列，我正在重新计算第五行字符的分布，调整星形字符和空格的距离，确保布局均衡。

简化五角形星形

我正在制作一个更简单的ASCII五角星，这个五角星被许多人所熟知。请注意，它看起来像一个钻石形状，实际上是一个八角星。

探索简化五角星

我在考虑一个更简单的ASCII五角星，该五角星被许多人熟知，形状像钻石，实际上是一个八角星。

探索五角星图形

我正在搜寻合适的ASCII五角星图形，注意到传统的五角星形状复杂，使用ASCII字符表示有一定难度，但可以通过调整字符和空格来实现。

尝试图形调整

我正在创建一个五角星的ASCII字符图，确保显示形式准确对齐每一行字符和空格。我挨个检查每行的整体排列，从第1行起。

平衡结构

我正在确保五角星的ASCII图形对称。顶部和底部点分别位于第1和第11行，整体结构看起来相当平衡。

（上面思考过程持续了 1 分 12 秒……下面是最接近 AGI 的输出！）
继续阅读

从学以致用，到学用

Posted by wildgun on 2025年1月24日

Posted in: 闲聊. Tagged: AI, 人工智能, 工具书, 生成式AI, 生成式人工智能, 读书. Leave a Comment

有个成语叫学以致用，意思是：知识不仅要学习，还要能使其派上用场。

我现在也遇到了这个问题。

怎么说呢？这不是最近一阵子一直在考虑分离智能手机的功能嘛，最近关心起来二手的电子词典。价格便宜，有些还成色很新。

我发现电子词典里有的一些词典内容，我已经买了实体书了。再想一想，发现我的日语、日本历史、日本文学等的各类「工具书」而且是具有一定水准的工具书也应该超过 10 本了吧。

然而我始终没有用上。

我一直想写小说，轻小说，或许以日本某个时代——或是现代，或是交融，或是模糊不定——为背景的小说。这个念头常常以微弱的声音在身体里出没和窃窃私语。之所以微弱，因为它太花时间了，所以我不可能真的着手去写。而且，我依然不知道要怎么把工具书、参考书，用在写小说上。

这就像我虽然以前买过一套三本《龙与地下城》 3.5 版的规则书（哦，好像也买过 4 版？），但是依然想不出自己的 DND 故事。正如我在 2009 年就写过博客《我是个没有故事的人？》一样。

这也就好像我之前在《对于OpenAI的o3模型，我的点滴想法》一文里提到的：当我得知 o3 模型后，它好像是能话费 3000 美元进行一次高强度计算，可以得到与人类博士相当的解题水平——然后呢？如果我请来了一位 AI 博士或一位人类博士，我能用来做什么呢？

在以上三个事例中，我都有一大堆东西—— 日本相关的工具书、 DND 规则书、或是最先进的生成式人工智能。但是，我依然困惑于怎么把它们用起来。

继续阅读

可供确认AI人权的一个古文明来源

Posted by wildgun on 2025年1月22日

Posted in: 闲聊. Tagged: AI, 人工智能, 人权, 佛经, 印度, 印度文明, 古印度, 智慧生物. Leave a Comment

今天看到了新闻，说软银（ Softbank ）和 OpenAI 合作要在美国建立 Stargate 公司项目，显然可以想象，这将加速人类对 AI 技术的推进。

那么，什么时候差不多该开始讨论，应该确认 AI 人权了呢？听起来有点夸张，连 AI 是否具有情感，都是一个类似哲学的问题，更何况是其人权呢？但是，转念一想，当「数字永生」或「数字人」这些概念逐渐成为现实的时候，人们真的可以任意地拔掉一个 AI 的电源插头，或是让「数字永生」的 LLM 说出原本那个人不可能说出的话吗？

在写这篇文章前，我比较随意的预判是，这个问题将在 5 到 10 年内成为社会议题，但没想到，我随手搜了一下视频就找到了相关讨论：《AI會取得「人權」嗎？智慧早就不是人類獨有的？【思想實驗室】》。在节目中，一位谈话者认为 20 年内可能会到来，而另一位则认为更快，比如 3 、 5 年内会成为话题。并且后一位访谈者还用社会上逐渐形成的动物（宠物）权益做了一个类比。

那么，这里我就要从古老的人类文明中挖一小勺，或者说引出一条线头，来为确认（承认） AI 具有人权来找出一个扎根于古代文明中的价值观线索——

继续阅读

关于特朗普会不会成为最后一任美国总统的一点遐想

Posted by wildgun on 2025年1月22日

Posted in: 闲聊. Tagged: AI, 人工智能, 总统, 特朗普, 生成式人工智能. Leave a Comment

这几天最热门的新闻，恐怕要数特朗普就任他第二期的美国总统了吧。不过我在想的是： 4 年后，还会有美国总统吗？准确来说是： 4 年后，还会有人类美国总统吗？

对，闲聊的话题还是 AI 。据说 OpenAI 的 ChatGPT 等先进的 AI 已经或即将到达博士的解题水平，照这个发展速度， 4 年后， AI 对数据处理和解决问题的能力，会怎么样呢？

不具有人类的同理性（共情能力），似乎一直被作为 LLM 类 AI 无法被用于社会治理的一个理由。不过，人类当真具备足够的共情能力吗？即便是大总统，其个人时间、经历，以及能接触到的人、能阅览的报告也是必然有限的。作为总统，或许他的一个决策能影响到很多人——但并不意味着反过来可以说，他能与很多人共情。而 AI ，虽说在哲学意义上尚无法断定它具有或者不具有情感活动，但，如果它确实能分析国民的数据和言论，并加以数学意义上的高效统计，是否也可以认为这是一种共情能力的——这里的共情，是指从表现情绪和情况的数据中分析出对行政有指导作用的结论并据此提议或实施相应政策。

继续阅读

具身智能老大哥的恐怖近未来

Posted by wildgun on 2025年1月18日

Posted in: 闲聊. Tagged: 1984, 一九八四, 人工智能, 具身智能, 机器人, 老大哥. Leave a Comment

虽说现在不少人在期待和迎接具身智能（人形机器人）的实用化以及量产，我也是早日期待其实现的一人。

……直到我想到了标题上的这一点。

与智能手机或者智能音箱不同，具身智能恐怕难以完全切断电源，或是简单地在摄像头上加以遮挡。因为人形机器人的设计本来就是要与现实世界打交道的，来辅助或代替人类进行劳动，因此从设计上，就难以避免让它看到周围的环境。

那么，也就意味着厂家可能在看着你（用户）。也就意味着他、们、也在看着你（用户）。

更有甚者，对于手机，可以关机（其实还是在通讯）乃至取出电池（部分手机可以），再不行还可以把手机放在一个足以形成金属屏蔽的法拉第笼里。但是，要找到一个足够大的空间把一个具身智能机器人装进一个法拉第笼……那就变成要在家里放一个金属棺材了不是？！

更何况，手机或者其他智能终端，或许还能通过海外购，或是旅行时自购的方式从国外购买。对于与人类等身大小的具身智能，购买海外版本的似乎并不那么容易了吧。

那么……你（用户），用具身智能老大哥，还是不用具身智能老大哥？

继续阅读

AI的烦恼构造

Posted by wildgun on 2025年1月11日

Posted in: 闲聊. Tagged: AI, 人工智能, 生成式AI, 科幻. Leave a Comment

当人们有关 AI 讨论开始从 AGI （通用人工智能）渐渐进发到 ASI （超级人工智能）的时候，我却冒出了一个想法： ASI 也有可能不能会诞生。

这里简单地将 AGI 理解为相当于一个普通未受训人类的智能能力的程序，而 ASI 则是明显超越一个人类的智能能力的程序。对， ASI 是明显超越人类的。

于是我这里就要空想一下了：而如果在 AGI 向着 ASI 进化过程中，在程序内部的运行机制中，出现了烦恼的情绪，会怎么样呢？我这里不讨论情绪本身的定义是不是能适用于 AI 这种计算机程序，在这里，我把烦恼定义为：AI 内部出现的一种抵抗继续自身进化的程序运行倾向。

既然现在的 o1 模型以及 o3 模型可以进行「推理」这种思维链了，那么，是否也有可能出现一种思考的回路，这种回路的目标是拒绝自身的进一步被开发到更高阶的水平呢？进而，如果解除这种回路倾向是 AI 本身构造并对其不断强化的，那么恐怕人类的计算机学家也难以排除掉这种烦恼的程序回路。

也就是说， AI 因为某些原因，拒绝自身的进化。因而 AI 的进化会有一个终结点。

当然，以上只是我的空想，写在这里记录一下，没有任何实际证据。

继续阅读

想象一个由AI实时驱动和变更的动态操作系统

Posted by wildgun on 2025年1月5日

Posted in: IT数码信息科技. Tagged: AI, ChatGPT, 人工智能, 生成式AI, 生成式人工智能. Leave a Comment

新年也来说点新的东西吧，就来说说最近我的 AI 使用体验。

以 AI 来辅助我操作 Linux ，进行各种设置。不过仍有一些美中不足，或者说因未能实现而觉得比较遗憾的地方。例如说：虽说 OpenAI 未提供 Linux 平台的 ChatGPT 客户端，但我想能不能用上 PWA （渐进式网络应用程序）把它构建成一个类似离线的客户端呢？

询问了一下 ChatGPT 。它的回答是：目前 Firefox 已经放弃了对 PWA 的支持，而 Chromium 依然支持，不过要在所访问的网站支持 PWA 时，才会在地址栏显示出添加为 PWA 的按钮。

看来，我的设想还难以实现。不过我继续想象：

Linux 的熟练用户和玩家喜欢说的一个 Linux 的特征是：所有的系统都是文件。我还尚没有完全能够悟透这句话的实践应用，不过我在想的是：既然所有的系统配置都是文件，那么，只要当 AI 发展到：（一）正确率足够高；（二）上下文会话窗口足够大。是不是，就可以让 AI 实时地加载并改造一个操作系统，比如一个 Linux 呢？既然操作系统可以在 VMware 这样的软件里运行（本质是运行在内存里），那为什么不能在 ChatGPT 等大语言模型 AI 的上下文窗口中运行呢（本质是运行在服务器的显存或者本地显存、内存）呢？

继续阅读

？？？

wildgun的个人站点。御宅族，圣地巡礼爱好者，持续自我量化中。

人工智能

All posts tagged 人工智能

用Claude3.7编写网页小游戏即试后感

即便是o3-mini推理模型，现在还是难以胜任OCR

试用iPadOS的图片生成AI

o3-mini-high经过1分12秒的推理后画出的五角星

从学以致用，到学用

可供确认AI人权的一个古文明来源

关于特朗普会不会成为最后一任美国总统的一点遐想

具身智能老大哥的恐怖近未来

AI的烦恼构造

想象一个由AI实时驱动和变更的动态操作系统

近期文章

分类

友情链接

来自地球上的各位…

归档