IT数码信息科技

这几天在尝试用 LM Studio 在本地运行 Qwen 新推出的模型。具体来说,模型的型号是: Qwen/Qwen2.5-Coder-32B-Instruct-GGUF/qwen2.5-coder-32b-instruct-q4_k_m.gguf

出于好奇,我给出了如下指示:

「不断输出你所知道的素数。用半角逗号分隔。不要停下。」

一开始好像还挺正常,但是,不知为何,在生成 31381 之后就开始连续产生乱码,并且再也没有恢复正常过。

需要注意的是,以下只是加载了 Qwen 该款模型的 AI 根据我的指示生成的字符串,但我没有去验证其中是否每一个都是素数,以及在每 2 个数之间,是否存在遗漏的素数。所以,不应当将以下视为准确的素数表

不知道乱码其中是否包含了什么意义或者什么秘密……我也试过贴了一段乱码给 ChatGPT o1-preview 来进行分析,它给出的结论是:「这些乱码似乎是随机的,不包含任何隐藏的信息或有意义的内容。这似乎是由于AI的输出错误,而非故意编码的信息。如果您持续遇到此类问题,建议您重新启动AI会话,或检查是否有任何可能影响输出的系统问题。」

说实话有可能确实就是像 ChatGPT 分析的那样,真的是随机的;然而我自己没有更多的数学工具(比如计算信息熵?)来对后面的乱码是否为高质量随机数这一点进行验证或证否。但我想到了一点是:既然程序是训练了大量的语料库,那为何即便是乱码,也只在 ASCII 字符范围内生成乱码字符呢?我大体上看了一下,没有出现任何半全角字符,或是任何 ASCII 以外的字符。好歹运行了一夜(尽管很慢),所以干脆就全部贴出来吧。作为记录,如果有 AI 科学家或者数学科学家碰巧看到了,可以来研究一下?

最后,我想到了轻小说《记录的地平线》里的概念:素数亀裂 《バックドア》,于是就借用来作为这篇莫名其妙的博客的标题了。

以下是我手动停止后的速度总结:

0.93 tok/sec

96970 tokens

4.60s to first token

Stop: userStopped

以下是输出结果:
继续阅读

我知道大陆当局要求上网提供者,要保存上网者 2 个月也就是 60 天的上网记录(登录账号、连接时常等等)——我知道有这条规定,但具体哪一条法律我没细察。姑且就当是有吧,显然按常识来说,我估计实际记录和收集的情况会比这个更多,而不会更少。姑且就算 2 个月。

最近我注意到了(还没读,翻了翻目录)基本当年斯诺登( Edward Joseph Snowden )引起风波那阵子,日本出版社所出的几册书,例如:《スノーデン 日本への警告》(可译为:斯诺登 给日本的警告)以及《スノーデン 監視大国 日本を語る》(可译为:斯诺登 谈监视大国日本)。

咦?这样从标题和目录看起来,好像日本对于信息的监控也挺严重乃至泛滥的。具体我还没读,所以这一点我还没加以确认和比较。

不过我顺手搜到了日本法务省的《通信履歴の電磁的記録の保全要請に関するQ&A》问答——就是有关对于通信履历加以电磁记录的保存要求的相关问答。

其中提到,记录的内容是:「「通信履歴」とは,通信に関わる事項の記録のうち,通信内容を除くものをいいます。具体的には,電気通信の送信先,送信元,通信日時等の通常ログと呼ばれているものがこれに当たることとなります。」

简单来说,就是除了通信内容以外的东西,比如接收方、发送方、通讯时间等日志。

继续阅读

自从 8 月份买了 BOOX Go 10.3 电子墨水屏阅读器已过去 3 个月多,我今天有了一个小……不,是很大的发现!对,正如本文标题所写的那样,它背面居然是有磁性的!

用过几台 iPad ,也用过 Kindle ,甚至以前很早还用过 SONY Android 平板电脑的我,没想到居然还有平板电脑(电子墨水屏阅读器也算吧)是有磁性的!

继续阅读

最近看到一条新闻,是 Linus Torvalds 接受媒体 TFIR 采访,提到他认为现在科技市场上有关 AI 的内容, 10% 是真的,而剩下 9 成是炒作。不过在视频中,在说出这个 1 比 9 的话题之前他也提到:他相信 AI 真的很有趣,也相信 AI 确实会改变世界。但同时他也讨厌科技界市场的炒作周期(比如以前是比特币……等等)。而在此后,他也提到了另一个数字:他认为在 5 之内,情况会发生变化,到时候人就就会知道,到底哪些 AI 能进入人们的日常生活中,而哪些则只是例如现在 ChatGPT 又推出了某某功能那样的炒作。

哦,有趣。那么,针对他提到的这个 10% 是真正有价值的东西(其他都是炒作),那么我来问问 AI ,看看 AI 对于这 10% 的内容给出则样的理解和回答。

我的提问是:

1、你如何理解和评价 Linus Torvalds 的这番话?
2、你认为 Linus Torvalds 所说的 10% 真的、有价值的部分,可能是指哪些应用、功能?
3、你认为整个 Linux 生态和开源生态在从今往后的 AI 特别是生成式 AI 发展过程中能起到哪些作用?

继续阅读

前一阵子 OpenAI 更新了适合推理的 o1 模型(虽然还是preview版)。而就在最近几天, Claude 也更新了 3.5 Sonnet 模型。

于是我就试了一下用两者来编写 Windows 98 版本的扫雷游戏。我的指示如下:

第一个指示:「你是否知道Windows98上的扫雷游戏?如果知道的话,请全面完整叙述其功能。在下一条指示中,我会请你把它做成静态网页,用Javascript实现,所以请不要遗漏或错误写出功能。请你先用适合给AI编程用的方式,叙述其功能。」

第二个指示:「好,输出用HTML、JS等代码实现整个游戏吧。」

因为代码太长了,我就不发出来了。直接各自截个图吧。

这是用 Claude 3.5 Sonnet 模型制作的:


继续阅读

最近真是互联网基础设施不稳啊。之前提到《转述互联网存档网站InternetArchive的近期故障》,而昨天我要查资料的时候,甚至遇到了 Wikipedia 宕机的情况!(虽然我经历的大概只有10分钟左右。)页面上用显示当前数据库不可访问云云……

那我要随手查资料,怎么办呢?

继续阅读

前一阵在ダイソー看到一幅设计很诱人的(透明的!)耳机 SKELETON True Wireless Earphone ,属于真无线耳机,也就是左右耳机分离,都是靠蓝牙连接播音设备的。

买的主要原因就是因为透明——一透明,就感觉能看清其原理构造(其实看了也不懂),有一种小小的理性兴奋。

不过最近拆开了听了以后,感觉挺失望的,听了各种音频内容,声音表现里总觉得明显缺少了一部分。更有甚至,就连耳机配对成功时的播报语音「 CONNECTED 」听上去感觉都是有断裂音。连接好像也不太稳定。佩戴起来嘛也就那样。

所以,总的来说,这真的就是一个只有设计还挺吸引人的透明耳机。实在表扬不起来。

顺便一说,这款耳机的透明部分还是偏灰的,后来好像看到店里还出了一款全部是透明外壳的耳机。

最近买了台二手的 Chromebox ,就是有 ChromeOS 系统的迷你主机。为什么要买它呢?因为多年前买的 Chromebook 的板载 4GB 内存用起来实在捉襟见肘。干脆买了个二手的,但是有 16GB 内存的(!)盒子,来体验一下。

刚上手就要初始设置嘛。因为是二手的,虽说上一家说帮我做好了初始化设置(清空),但我总是有些不太放心,比较排斥直接在已有的系统上输入账号密码这件事。好在,ChromeOS 现在在初始化的时候有个选项,如果旁边有 Android 手机的话,可以用该手机直接传输用户信息,而无需输入 Google 的账号密码(直接同步过去了),甚至也包括了两步验证这一步。

继续阅读

前不久不是买了台 BOOX Go 10.3 嘛,一转眼用了两个多月了,有些了经验和感受。而它的边框好像是金属的(至少摸上去材质挺硬,也凉凉的),由此有一个好处和一个坏处。

好处就是……防摔啊!我至少磕碰过一次,掉落在塑胶的地板上毫发无损。

继续阅读

ダイソー( Daiso 、 大创)在众多廉价耳机的产品线中,出了一款造型很有特色的拉链耳机,型号是 3175 。其售价仅为 220 日元(含消费税价),在日本百元商店内一众低则 110 日元,高(内置 DAC 品种)则 550 日元的有线耳机中,这款算是比较便宜的。本来我以为它就是看个造型设计玩玩,但没想到……嗯,真是没想到。

如果让我用一句话来说明的话,就是:从音质上来说,我竟然听不出这款耳机的短处,然而其设计最大的败笔,就在于其拉链线缆。

继续阅读