IT数码信息科技

今天, Claude 的公司 Anthropic 发布了一篇文章《Introducing the Model Context Protocol》,有关其推出一种新协议 MCP (或可译:模型上下文协议),以此可以让 Claude AI 不仅限于聊天功能,还能访问各种数据库乃至用户的文件系统。

最初我心想:这又是协议又是 AI 的,部署起来一定很繁琐吧。不过实际操作起来可以说是相当顺利。可以说,只要在计算机上执行过脚本,那基本上就不会遇到什么麻烦。

先跟着快速入门来试试

Anthropic 给出了一篇快速入门教程,其中实现的功能是:让 AI 来读取用户计算机内的一个数据库。说是数据库,听起来也很吓人,其实就是最简单的文件形式的数据库 SQLite 。

简单来说,一共要做的只有 3 个步骤:

(一)安装 Claude 客户端。
(二)安装各类中间件。
(三)参照快速入门教程中的范例生成一个配置文件。

然后就可以让 Claude 来访问你电脑里的数据库文件了。
继续阅读

最近 OpenAI 不是给 ChatGPT 的桌面客户端推出了可以查看用户计算机的终端、文本编辑器的内容,以此辅助用户进行操作的功能嘛。当时我就想到:既然可以查看终端,而终端本身是有着强大的远程登录功能的( SSH 或 telnet )。换言之,运用 ChatGPT 的这项功能,能调试的不一定是客户端所在的这一台电脑的系统环境,应该还能在一定程度上辅助查看远程登录到的别的电脑乃至交换机等系统环境里的问题吧。

于是我试了一下……

泥潭。

继续阅读

AI 辅助或基本自主进行程序设计,到底有多成熟了呢?我自己也在用 AI 进行简单的程序、脚本编写。正如我博客之前所记录的那样,我用 AI 给树莓派 Pico W 编写了一个自动翻书并截图的脚本;此前,也测试了一些比如扫雷的小程序。

但是对于大程序,或者说更加复杂的程序,乃至于「软件产品」,到底 AI 到底进步到哪个程度了呢?我自己虽然学过也进行过一些项目开发,但毕竟不是每天做这个的,所以难以对此进行评价。不过自己想了 3 个领域,或者说 3 个方面的软件,如果哪一天市面上大量涌现出这些软件,并且它们是由 AI 辅助编写的程序所生成的,那么我想到那时候,我就认为 AI 在辅助或基本自主编程方面可谓成熟了。

我想到的第一个方面是:商业软件的有效开源替代——对,我说的就是 Adobe 全家桶,还有微软的 Office 。这几套产品系列虽然目前——或者说长期以来——都有开源或非开源的替代产品,但是都不怎么理想,也没有广为人知。

继续阅读

这几天在尝试用 LM Studio 在本地运行 Qwen 新推出的模型。具体来说,模型的型号是: Qwen/Qwen2.5-Coder-32B-Instruct-GGUF/qwen2.5-coder-32b-instruct-q4_k_m.gguf

出于好奇,我给出了如下指示:

「不断输出你所知道的素数。用半角逗号分隔。不要停下。」

一开始好像还挺正常,但是,不知为何,在生成 31381 之后就开始连续产生乱码,并且再也没有恢复正常过。

需要注意的是,以下只是加载了 Qwen 该款模型的 AI 根据我的指示生成的字符串,但我没有去验证其中是否每一个都是素数,以及在每 2 个数之间,是否存在遗漏的素数。所以,不应当将以下视为准确的素数表

不知道乱码其中是否包含了什么意义或者什么秘密……我也试过贴了一段乱码给 ChatGPT o1-preview 来进行分析,它给出的结论是:「这些乱码似乎是随机的,不包含任何隐藏的信息或有意义的内容。这似乎是由于AI的输出错误,而非故意编码的信息。如果您持续遇到此类问题,建议您重新启动AI会话,或检查是否有任何可能影响输出的系统问题。」

说实话有可能确实就是像 ChatGPT 分析的那样,真的是随机的;然而我自己没有更多的数学工具(比如计算信息熵?)来对后面的乱码是否为高质量随机数这一点进行验证或证否。但我想到了一点是:既然程序是训练了大量的语料库,那为何即便是乱码,也只在 ASCII 字符范围内生成乱码字符呢?我大体上看了一下,没有出现任何半全角字符,或是任何 ASCII 以外的字符。好歹运行了一夜(尽管很慢),所以干脆就全部贴出来吧。作为记录,如果有 AI 科学家或者数学科学家碰巧看到了,可以来研究一下?

最后,我想到了轻小说《记录的地平线》里的概念:素数亀裂 《バックドア》,于是就借用来作为这篇莫名其妙的博客的标题了。

以下是我手动停止后的速度总结:

0.93 tok/sec

96970 tokens

4.60s to first token

Stop: userStopped

以下是输出结果:
继续阅读

我知道大陆当局要求上网提供者,要保存上网者 2 个月也就是 60 天的上网记录(登录账号、连接时常等等)——我知道有这条规定,但具体哪一条法律我没细察。姑且就当是有吧,显然按常识来说,我估计实际记录和收集的情况会比这个更多,而不会更少。姑且就算 2 个月。

最近我注意到了(还没读,翻了翻目录)基本当年斯诺登( Edward Joseph Snowden )引起风波那阵子,日本出版社所出的几册书,例如:《スノーデン 日本への警告》(可译为:斯诺登 给日本的警告)以及《スノーデン 監視大国 日本を語る》(可译为:斯诺登 谈监视大国日本)。

咦?这样从标题和目录看起来,好像日本对于信息的监控也挺严重乃至泛滥的。具体我还没读,所以这一点我还没加以确认和比较。

不过我顺手搜到了日本法务省的《通信履歴の電磁的記録の保全要請に関するQ&A》问答——就是有关对于通信履历加以电磁记录的保存要求的相关问答。

其中提到,记录的内容是:「「通信履歴」とは,通信に関わる事項の記録のうち,通信内容を除くものをいいます。具体的には,電気通信の送信先,送信元,通信日時等の通常ログと呼ばれているものがこれに当たることとなります。」

简单来说,就是除了通信内容以外的东西,比如接收方、发送方、通讯时间等日志。

继续阅读

自从 8 月份买了 BOOX Go 10.3 电子墨水屏阅读器已过去 3 个月多,我今天有了一个小……不,是很大的发现!对,正如本文标题所写的那样,它背面居然是有磁性的!

用过几台 iPad ,也用过 Kindle ,甚至以前很早还用过 SONY Android 平板电脑的我,没想到居然还有平板电脑(电子墨水屏阅读器也算吧)是有磁性的!

继续阅读

最近看到一条新闻,是 Linus Torvalds 接受媒体 TFIR 采访,提到他认为现在科技市场上有关 AI 的内容, 10% 是真的,而剩下 9 成是炒作。不过在视频中,在说出这个 1 比 9 的话题之前他也提到:他相信 AI 真的很有趣,也相信 AI 确实会改变世界。但同时他也讨厌科技界市场的炒作周期(比如以前是比特币……等等)。而在此后,他也提到了另一个数字:他认为在 5 之内,情况会发生变化,到时候人就就会知道,到底哪些 AI 能进入人们的日常生活中,而哪些则只是例如现在 ChatGPT 又推出了某某功能那样的炒作。

哦,有趣。那么,针对他提到的这个 10% 是真正有价值的东西(其他都是炒作),那么我来问问 AI ,看看 AI 对于这 10% 的内容给出则样的理解和回答。

我的提问是:

1、你如何理解和评价 Linus Torvalds 的这番话?
2、你认为 Linus Torvalds 所说的 10% 真的、有价值的部分,可能是指哪些应用、功能?
3、你认为整个 Linux 生态和开源生态在从今往后的 AI 特别是生成式 AI 发展过程中能起到哪些作用?

继续阅读

前一阵子 OpenAI 更新了适合推理的 o1 模型(虽然还是preview版)。而就在最近几天, Claude 也更新了 3.5 Sonnet 模型。

于是我就试了一下用两者来编写 Windows 98 版本的扫雷游戏。我的指示如下:

第一个指示:「你是否知道Windows98上的扫雷游戏?如果知道的话,请全面完整叙述其功能。在下一条指示中,我会请你把它做成静态网页,用Javascript实现,所以请不要遗漏或错误写出功能。请你先用适合给AI编程用的方式,叙述其功能。」

第二个指示:「好,输出用HTML、JS等代码实现整个游戏吧。」

因为代码太长了,我就不发出来了。直接各自截个图吧。

这是用 Claude 3.5 Sonnet 模型制作的:


继续阅读

最近真是互联网基础设施不稳啊。之前提到《转述互联网存档网站InternetArchive的近期故障》,而昨天我要查资料的时候,甚至遇到了 Wikipedia 宕机的情况!(虽然我经历的大概只有10分钟左右。)页面上用显示当前数据库不可访问云云……

那我要随手查资料,怎么办呢?

继续阅读

前一阵在ダイソー看到一幅设计很诱人的(透明的!)耳机 SKELETON True Wireless Earphone ,属于真无线耳机,也就是左右耳机分离,都是靠蓝牙连接播音设备的。

买的主要原因就是因为透明——一透明,就感觉能看清其原理构造(其实看了也不懂),有一种小小的理性兴奋。

不过最近拆开了听了以后,感觉挺失望的,听了各种音频内容,声音表现里总觉得明显缺少了一部分。更有甚至,就连耳机配对成功时的播报语音「 CONNECTED 」听上去感觉都是有断裂音。连接好像也不太稳定。佩戴起来嘛也就那样。

所以,总的来说,这真的就是一个只有设计还挺吸引人的透明耳机。实在表扬不起来。

顺便一说,这款耳机的透明部分还是偏灰的,后来好像看到店里还出了一款全部是透明外壳的耳机。