IT数码信息科技

刚看到 Reddit 上有人用 ChatGPT 新发布的 o1-preview 做了个HTML中的简易 FPS 游戏。于是我也想仿效一下,做一个 3D 键盘按键模拟视图吧!

不过据说 o1-preview 的每周限制次数比较大,而 o1-mini 似乎还宽松一些(好像是这样?未确认),于是这次我选择了后者。

我给出的指示是:

我想做一个本地html文件,其中用webGL或者别的什么3D技术,或者纯粹线条,画出一个3D的、从斜上方看过去的键盘(类似人类操作键盘时的视角)。

当我按下我电脑键盘上的某个键时,该网页上对应的3D键盘上的某个键,也要在网页3D图像中看上去被按下。当我放开电脑上键盘的某个键时,也要在网页3D图像中看上去被释放(键盘恢复没有被按下时的状态)。

对于同时按住多个按键,网页上的3D键盘也应该要能反映,并显示对应的多个按键被按下或被释放(恢复原来位置)。

另外,我也希望有表示 CapsLock,NumLock的显示灯。

请为我生成完整的html代码。

经过大约 10 步的除错问答等,终于得到了一段比较符合我原来构想的代码(贴在本文最后)。

不过仍有一些不太符合我设想指出,包括:其一,这不太像是人使用键盘时的那种「斜上方视角」,其二,对于 CapsLock ,以及 F1 ~ F12 等功能键,模拟键盘中的对应反映仍不是很正常。

(注:本来想贴出代码的,不过好像 html 转义一多,就无法在 WordPress 中提交成功。于是代码从略。)

上次的一篇博客中,我提到最近在尝试睡前与 ChatGPT 进行语音聊天,但通常聊着聊着,因为它的回答太过冗长,以至于我通常聊不过第 3 轮就睡着了。于是前不久,我睡前打起精神(?)就想着聊长一点,并且尝试了一下,看看 ChatGPT 能否在静默的情况下计数,然后到了一定的问答回数主动提醒用户。

下面就是实测结果。引用部分为实际对话内容(我所发言的部分因为是语音听写,所以会有错误、思考导致发言不连贯等)。引用以外的部分,则是我在现在编辑博客文章时的一些解释——包括计算问答回数,以及一些我的注解。

在本次测试中,我尝试让 ChatGPT 在第 3 轮以及第 13 轮回答时提醒我。记录如下:


第 1 轮问答:

wildgun 问:

我想知道你是不是会向后计数 就是计算我们之间对话的数量 这样我现在可以开始跟你聊天 然后你希望你在之后的三个对话回合之后 你提醒我一下好不好

ChatGPT 答:

好的,我可以帮你数对话回合。如果我们从现在开始,三轮对话之后我会提醒你。那我们现在从这轮开始吧,随时开始聊!


第 2 轮问答:

wildgun 问:

但是我不希望你每一次都记录 你要在后台记录 但不要在每次回复我的时候来述述 直到那个回答到第三轮 你来提醒我一下 我要试看你有没有这个功能 好 我现在要把话题给岔开了 你知道我什么时候能获得那个ChatGPT的高级语音功能吗 这个OpenAI好像那个你们的老板都宣布了 有五月份他演示视频 然后都宣布了有现在是八月多 现在是九月了 已经宣布了有四个月了 怎么我还没有得到呢

ChatGPT 答:

目前,高级语音功能的推出确实是由OpenAI宣布的,但具体的时间和覆盖范围可能会根据地区、用户群体或者产品开发进度有所不同。如果你还没有收到这个功能,可能与逐步推出的策略有关。通常这种新功能会逐步向更多用户开放,或许你很快就能获得。

这算是我们第二轮对话了。我还在后台记录,等到第三轮时再提醒你!


继续阅读

最近去了几次牙医诊所,所以这里就写一篇短的博客了。主要是为了处理智齿,自然就会要先拍片。

这不最近老是看到新闻,什么生成式 AI 通过了某某医科考试,某某法律考试嘛,好像说得像是就快能代替或者至少是辅助医生治疗一样了。于是我灵机一动(?)把拍的牙科 X 光片上传到 AI 上,看看它们的「诊断」结果。当然,我这里试的肯定不是专门为了医疗而特别优化、调试过的模型以及 AI 程序,而就是目前地球上大部分人可以注册使用的 ChatGPT 这两个先进而常见的生成式 AI 。

因为据说齿科影像也是一个人独特的生物影像指标,所以我就不直接把 X 光片直接发到博客上了。我拿向 AI 询问的结果,以及我从医生(当然是有齿科医生资格的真人!)那里得到的诊断意见比较。 AI 的医学影像识图能力可以说是……惨不忍睹。

继续阅读

前言

最近在脑袋里咕噜咕噜转的一个问题是:以 ChatGPT 为代表的生成式 AI 到底在多大程度上、怎样的方式上能帮助人们学习计算机程序设计、数据库等知识。想多了那就不如自己动手试试。

在当年还是 Microsoft VB 6.0 年代,我自己曾经做过一些 Microsoft Access 数据库的开发,以及用到数据库的基于 ASP.NET 的动态网页开发,不过都是很浅显的项目。而当年所学的关系型数据库的原理那门课,基本上在每次下课铃声响起时,那些非常理论化的概念——什么约束原则啦,规范啦,原子性啦——都还给了老师。而自从我使用 MacOS 以及 Linux 操作系统以来,一直把它们当作文书办公电脑的环境而非开发环境在用。所以自然也就知道但印象里自己没用过以终端命令行来操作 SQLite 数据库。今天,我就花了大概一个小时,让 ChatGPT 来教我如何在 MacOS 上入门使用 SQLite 。

在下面的这一部分,我会简略地介绍我的这一学习过程,而在本文最后一部分,我将从自己今天这次简短的学习过程,探讨一下借助 AI 的学习指导的形式转换。

教学过程概况再现

在尝试之前,我担心安装或操作 SQLite 会不会影响我 MacOS 的系统环境变量。毕竟是我现在的主用电脑,我可不想因为装了什么环境而导致把整个系统弄乱。

对此,ChatGPT 答:

继续阅读

人类 wildgun 写的前言:这篇文章是我用 ChatGPT 辅助写作的。主要是我用语音(高级语音模式)告诉 ChatGPT 我对于日常浏览网页并需要保存下网页内容时,会用到的几种方法,并告诉它我会根据不同目的、不同使用场景来区分使用。在传达我的意思后,再与 ChatGPT 稍加讨论,之后请它补充信息,并生成一篇博客文章。下面的内容主要是由 ChatGPT 生成的,我也进行了一些补充、编辑——比如每一种保存方式下的「4. 是否防失效」就是我事后补充的,因为聊天的时候没想道。

在日常的浏览和研究过程中,我们常常需要保存网页内容以供日后参考。然而,不同的保存方式在具体应用场景中有各自的优劣。本文将详细介绍几种常见的网页保存方法,并从几个重要角度进行比较,包括是否便于后续编辑、是否具有公正性(防伪性),以及是否能够保存用户定制的内容。

第一种方法:浏览器插件保存至本地笔记

工具与方法

使用浏览器插件将网页保存至本地笔记工具是当前较为流行的方式之一。常用的工具包括 Evernote (印象笔记)、 Notion 等。这些插件可以将网页内容一键保存至你的个人笔记本中,且通常允许你对内容进行编辑、标注、分类等操作。

使用场景与优劣分析

  1. 便于后续编辑:这一方法特别适合需要频繁访问和编辑网页内容的人群。你可以对保存的网页内容进行标注、添加标签或进行详细分类,方便后续整理和查找。对于研究者、学生或需要进行长期知识管理的用户来说,这种方式非常实用。
  2. 公正性与防伪性:由于保存内容可以被编辑,这种方式在公正性上稍显不足。如果需要向第三方展示内容,可能会被质疑为不具备防伪性,因为保存者有可能在后续修改内容。
  3. 用户定制信息的保存:这种方法能够保存你在登录状态下看到的个性化内容,包括关注的人的动态、推荐内容等。因此,它适合保存基于个人账户或定制设置生成的网页内容。
  4. 是否防失效:通常保存于个人笔记软件中的内容可以直接访问。但一些云笔记软件或基于在线网页方式的笔记软件,在极其偶然的情况下会出现笔记丢失。以及如果公司一旦停止服务运营,也可能导致后续无法访问。所以最保险的还是保存为本地离线文件 + 自己多备份。

第二种方法:利用互联网存档服务

继续阅读


如我之前《我用过的几种形状的耳机,以及教训三则》博客提到,我小时候第一次用的耳机,是一款形状很奇特的单耳耳机。而最近,我好像在日本的百元商店Watts里发现了类似造型的单耳耳机

没错,就是这款「いつもの ラジオ イヤホン」(一直如此的收音机耳机),包装袋背面写的型号是 DT-20B ,经销商(発売元)是「丸七株式会社」,产地则是 MADE IN CHINA ,企划与设计是 JAPAN 。哦,我查了一下这家公司官网,上面自我介绍中的创业年代写着「元冶元年( 1864 年)」……江户时代老字号品牌啊!

先从造型说起吧。我不知道这个造型的耳机应该算什么种类。从小到大,用过这种类型耳机的,除了上面提到童年时的那一副外,就是这一副了。一样都是单耳,一样都是这种奇怪的造型。我问了 ChatGPT 还有 Claude ,它们的回答都是「入耳式耳机」( ChatGPT 有几次还回答成了骨传导耳机,肯定不是啊!)好吧,从佩戴方式上来说,确实是入耳的,但总觉得和别的入耳的有什么区别。至少没有耳塞(橡胶或海绵的那种)。但我也叫不上名字。

先来说说配戴时的耳朵触觉感受。原本我以为这种光溜溜的硬塑料戴着会很容易脱落,不过我坐着、转头、晃悠脑袋等,它都没有很轻易从耳朵中脱落。不过因为是单耳,而且没有外部耳塞包括,所以很容易听到环境音。同样也是因为没有耳塞的缘故,配戴的时候就缺少了一种填充感和堵塞感。

继续阅读

X (原 Twitter )网站的「为你推荐」栏目中显示的,尽是些没关注的人,而且又是争议性的话题居多,有些烦人。于是我尝试用 uBlock Origin ,在其中自定义静态规则功能,加了条规则,并反复尝试定位到「为你推荐」那个标签所对应的网页内容。

我试出来的规则是:

x.com##a.css-175oi2r.r-1awozwy.r-6koalj.r-eqz5dr.r-16y2uox.r-1h3ijdo.r-1777fci.r-s8bhmr.r-1c4vpko.r-1c7gwzm.r-o7ynqc.r-6416eg.r-1ny4l3l.r-1loqt21:has(span:has-text(为你推荐))

因为是「自研」,就是自己试着试着试出来的意思。不一定准确,也不一定适合其他用户。而且类名(?)那么多随机字符串不知道是否各个用户都通用。反正在我的两个系统的浏览器下,在 Firefox / Waterfox 浏览器的 uBlock Origin 插件中加入此条规则后都有效。具体表现为「为你推荐」那个标签页消失。

说起来网页方式就是好呀,用户可以控制显示什么,以及不显示什么。

嗯……起了个很「科技时髦」的标题。其实是近期颈椎病(?)的症状似乎有点变得明显起来(果然还是看书的问题?),于是去买了一台低频脉冲治疗仪(在日本被称为「低周波」)。

其实多年之前使用过一次,这种低频脉冲治疗仪,有两片贴膜,贴在肩膀上,贴膜会发射出微弱的电流,刺激肌肉,让肌肉产生抖动或者跳动。于是昨天我用了之后,把贴膜粘在肩膀上打开机器启动治疗疗程后,双肩居然就轻轻抬高、晃动起来了。感觉就像是真的被人在按摩一样——啊,当然也有缺点,就是这样当我在读书划线的时候,线条也会因手臂抖动而歪曲。

这时我就想到了 ChatGPT 的语音聊天功能。虽然我买的这个低周波治疗仪没有 AI 功能,就是很传统的那种,一点都不智能。但如果在使用它治疗的时候,耳朵里能传来语音聊天,那是不是一件很有趣的事呢?于是我打开 ChatGPT 的语音模式(嗯,我还没受邀使用高级语音模式),提出指示:

wildgun 说:

我今天买了一台那个低周波治疗仪 如果说中文的话应该是叫低频那种治疗仪 治疗我的那个肩颈部的酸疼 那我现在正在使用把那个低周波治疗仪的贴片贴在我的肩膀后 然后正在治疗 我感觉好像有点像真人在给我按摩 所以我想请你从现在开始 扮演一个真人按摩治疗师来与我对话 我知道虽然你目前还不能说实际去控制这个按摩仪 或者说低周波治疗仪 但你可以尝试通过扮演 让我想象一下是一个真人在给我按摩

ChatGPT 说:

好的,让我们开始吧。现在我会想象我是一个专业的按摩治疗师。请你闭上眼睛,放松身体,深呼吸。感觉我的双手轻轻地按在你的肩膀上,从肩颈部位开始,慢慢地加压。随着每一次按压,你会感到肩膀的肌肉逐渐放松,酸痛感也在一点一点消退。感觉如何?

继续阅读

BOOX Go 10.3 买了已过 2 周时间了,虽然自身就带着一支笔,但以我目前的习惯一直都没用。不过,我还是会考虑到维修和更换的问题:要是笔头磨损了或是故障损坏了,有没有什么替代方案呢?

我注意到它好像不需要充电,也没有电池一说。可能就是一个非电子机械的笔?那样的话,或许不容易坏。而在互联网上的一些用户讨论社区中(例如 r/Onyx_Boox )我也看到一些用户提议可以使用 STAEDTLER 、 Wacom 、 LAMY 等品牌的笔来替换。而 BOOX 香港的网站(?)笔类附件中也在销售 STAEDTLER 、LAMY 等品牌的笔,并提及了支持 Go 10.3 这一点。

既然是不充电的笔嘛,于是我就干脆来试一试,用日本百元店买的笔,究竟能不能替换呢?于是我买了含税 110 日元的一支 えんぴつ風! タッチペン (株式会社エルオー销售,型号: 1647 )。上面写了「スマホ・タブレット用」即可用于智能手机及平板。

继续阅读

最近买了台 BOOX Go 10.3 电子墨水屏阅读器用来读书嘛,眼睛确实感觉比直接阅读 iPad 要舒适。不过,用着用着我发现了个疑似 BUG 的安全隐患,于是来记录一下。如果开发公司能看到并及时修复的话就好了。

我的情况如下。
硬件: Go 10.3
版本号: 2024-06-21_06-12_3.5.3_899fd4030
(写本文时已检查,已是当前最新版本。)

我在【设置】——【密码管理】——【锁屏密码】中设置了密码,也就是说,当阅读器闲置一段时间,系统会自动进入锁屏状态。如果要再次操作的话,则需先按电源键,进入输入密码的待解锁界面,正确输入密码后,才能进入系统操作界面。

不过,尝试进入以下操作:使用安装自 Google Play Store 的 Firefox 网页浏览器,播放网络视频,之后放置片刻不动,系统会自然进入锁屏状态(表现为屏幕换成锁屏屏保,以及声音中断)。此时,当我按电源键时,屏幕会切换到待解锁界面(即提示用户输入密码的那个界面)。如果我什么都不做,也就是说,不立即输入密码,而是等个 1、2 分钟左右的时间,虽然屏幕上依然是等待用户输入密码的界面,但是机身喇叭里却重新传出了刚才播放的视频节目的音频。

换言之,当系统被从锁屏中唤醒,还未输入密码解锁时,系统就已经开始向外界传达之前正在播放的视频节目了。而此刻,将系统从锁屏中唤醒的,既可能是所有者本人,也可能并非所有者,只是一个游手好闲的路人。

这就存在泄漏使用者视听习惯的安全问题了吧!

经过我的尝试,该现象可以复现。希望开发者早日解决该 BUG 。