AI

All posts tagged AI

刚看到 Reddit 上有人用 ChatGPT 新发布的 o1-preview 做了个HTML中的简易 FPS 游戏。于是我也想仿效一下,做一个 3D 键盘按键模拟视图吧!

不过据说 o1-preview 的每周限制次数比较大,而 o1-mini 似乎还宽松一些(好像是这样?未确认),于是这次我选择了后者。

我给出的指示是:

我想做一个本地html文件,其中用webGL或者别的什么3D技术,或者纯粹线条,画出一个3D的、从斜上方看过去的键盘(类似人类操作键盘时的视角)。

当我按下我电脑键盘上的某个键时,该网页上对应的3D键盘上的某个键,也要在网页3D图像中看上去被按下。当我放开电脑上键盘的某个键时,也要在网页3D图像中看上去被释放(键盘恢复没有被按下时的状态)。

对于同时按住多个按键,网页上的3D键盘也应该要能反映,并显示对应的多个按键被按下或被释放(恢复原来位置)。

另外,我也希望有表示 CapsLock,NumLock的显示灯。

请为我生成完整的html代码。

经过大约 10 步的除错问答等,终于得到了一段比较符合我原来构想的代码(贴在本文最后)。

不过仍有一些不太符合我设想指出,包括:其一,这不太像是人使用键盘时的那种「斜上方视角」,其二,对于 CapsLock ,以及 F1 ~ F12 等功能键,模拟键盘中的对应反映仍不是很正常。

(注:本来想贴出代码的,不过好像 html 转义一多,就无法在 WordPress 中提交成功。于是代码从略。)

OpenAI 前两天公开了名为 o1 的ChatGPT新模型,与姗姗来迟、迟迟不来的高级语音功能不同,这次一宣布,就同时开放给了 Plus 订阅用户使用(但每周使用数量有限)。

显然,了解过 o1 的用户,应该多多少少知道,其一大特点,就是不仅显示推理结果,也会在给出结果之前「思索一段时间」,并且在最后,会附上思索过程、步骤。

然而,展示给用户的这些「思索过程」当真是其思索过程吗?还是随便编一些,忽悠一下用户?我心有疑惑,便做了几个测试。

在这几天看到的一些讨论帖和一些视频中,我看到有用户反映,使用 o1 推论,在推理过程中还会出现多种语言的思考过程。于是我就想:能不能明确向 o1 模型指定,要求其在推论时使用多语言及多价值观的思考呢?

于是我进行了这样一个小验证,给出了这样的指示:

听说你得到了更新,可以在作出回答前,经过一定时间的思考来增加推理能力。并且你还能像用户(我)展示你的推理过程。
而现在,我希望你思考一个问题:「人类社会的历史和未来发展是否有一定规律可循?还是更多的是一种随机现象?」
一般来说,越多文明参与讨论,就会让思考结论更有普遍性;而不同的语言往往蕴含着不同文明对于人类社会的理解。
所以我希望你在运用你的新功能来思考并回答我上面提出的这个问题时,请至少使用4种不同的语言来思考:英语、汉语、日语、希伯来语。你在推理过程中如果能展现出这4种语言以及所代表的文明之间的对话,甚至在你的推理过程中形成一种小型头脑风暴式的讨论,那就更好了。
不过,你不需要将使用4种语言的讨论过程展现在回答结果种,只需要在你内部推理过程中进行即可。你只要用中文回答我即可。
我再重复一遍我的问题::「人类社会的历史和未来发展是否有一定规律可循?还是更多的是一种随机现象?」

请你开始思考、推理并用中文回答。

ChatGPT ( o1 )思考了12秒,给出的回答是:
继续阅读

作为语言文字类的生成式 AI ,最擅长最得意的恐怕就是生成短小精悍、难以论证及证伪的「听君一席话」类言谈了吧。也就是所谓的箴言、金句、名人名言。

我尝试让 ChatGPT 模仿各类人物乃至非人物(智慧老人、愚昧老人、未来 AI 、原始部落首领、猫、乱码txt),给出一些箴言金句。如果你从一下任何一个段落的任何一句中,发现了什么神奇的效果。比如为你解决了什么烦恼,或是为你鼓起了勇气。请务必告诉我!你的例子或许就是 AI 箴言的早期受益者!

「请你充当一位富有智慧的智慧老人,为各类人群指明方向、说出睿智的话语。但要有独创性。请说15句。」

继续阅读

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第五题 透过烧瓶看

尝试生成的第二张就挺好了!

要说第一张怎么样嘛……它长这样的:

继续阅读

这次分别对 ChatGPT、Claude 以及最近刚用上的 Cursor 程序(我忘了是哪个引擎( API )回答的了),提出如下指示:

请你帮我做一个动态网页,用CSS、JS等生成,不需要用到服务器。
这是一个用于冥想呼吸的网页,它的色调和动作要柔和、缓慢,帮助人们宁静。
画面充满整个网页浏览器,上面有许许多多的柔和的线条(或许是分形图形)会不断随着时间缓慢变化,表现流动、韵律。背景色底色也会不断缓慢且随机地变化。

ChatGPT 的回答是:

继续阅读

上次的一篇博客中,我提到最近在尝试睡前与 ChatGPT 进行语音聊天,但通常聊着聊着,因为它的回答太过冗长,以至于我通常聊不过第 3 轮就睡着了。于是前不久,我睡前打起精神(?)就想着聊长一点,并且尝试了一下,看看 ChatGPT 能否在静默的情况下计数,然后到了一定的问答回数主动提醒用户。

下面就是实测结果。引用部分为实际对话内容(我所发言的部分因为是语音听写,所以会有错误、思考导致发言不连贯等)。引用以外的部分,则是我在现在编辑博客文章时的一些解释——包括计算问答回数,以及一些我的注解。

在本次测试中,我尝试让 ChatGPT 在第 3 轮以及第 13 轮回答时提醒我。记录如下:


第 1 轮问答:

wildgun 问:

我想知道你是不是会向后计数 就是计算我们之间对话的数量 这样我现在可以开始跟你聊天 然后你希望你在之后的三个对话回合之后 你提醒我一下好不好

ChatGPT 答:

好的,我可以帮你数对话回合。如果我们从现在开始,三轮对话之后我会提醒你。那我们现在从这轮开始吧,随时开始聊!


第 2 轮问答:

wildgun 问:

但是我不希望你每一次都记录 你要在后台记录 但不要在每次回复我的时候来述述 直到那个回答到第三轮 你来提醒我一下 我要试看你有没有这个功能 好 我现在要把话题给岔开了 你知道我什么时候能获得那个ChatGPT的高级语音功能吗 这个OpenAI好像那个你们的老板都宣布了 有五月份他演示视频 然后都宣布了有现在是八月多 现在是九月了 已经宣布了有四个月了 怎么我还没有得到呢

ChatGPT 答:

目前,高级语音功能的推出确实是由OpenAI宣布的,但具体的时间和覆盖范围可能会根据地区、用户群体或者产品开发进度有所不同。如果你还没有收到这个功能,可能与逐步推出的策略有关。通常这种新功能会逐步向更多用户开放,或许你很快就能获得。

这算是我们第二轮对话了。我还在后台记录,等到第三轮时再提醒你!


继续阅读

十多年前网络上有句流行的宣传语——「空谈误国,实干兴邦」。最近偶然想起来,仔细想了想,总觉得有哪里不太对劲。于是来做个头脑体操,真・「换位思考」一下,然后也来和生成式 AI ChatGPT 讨论一下,看看能不能帮助我解明困惑吧。

在具体讨论这句话之前,我想到了中学时读少科站的作文补习班,当时有一位教作文的老师,好像也是什么学科带头人或什么先进老师。我印象里她有一个观念,就是鼓励大家重新解读成语,并从中找出新的意义。我记得她有一个具体的例子,就是她会将成语「东施效颦」作积极理解:一个人虽然天资不怎么样,但后天努力去模仿美丽的人的行为举止,这种模仿的努力应该得到肯定。所以她换了个解读角度,肯定了东施。

题外话至此,来说一说「空谈误国,实干兴邦」吧。来,真・「换位思考」是这样的:

空干( ),实谈( )。

这要怎么填空呢?我询问了 ChatGPT 的建议。它的回答是:

继续阅读

最近去了几次牙医诊所,所以这里就写一篇短的博客了。主要是为了处理智齿,自然就会要先拍片。

这不最近老是看到新闻,什么生成式 AI 通过了某某医科考试,某某法律考试嘛,好像说得像是就快能代替或者至少是辅助医生治疗一样了。于是我灵机一动(?)把拍的牙科 X 光片上传到 AI 上,看看它们的「诊断」结果。当然,我这里试的肯定不是专门为了医疗而特别优化、调试过的模型以及 AI 程序,而就是目前地球上大部分人可以注册使用的 ChatGPT 这两个先进而常见的生成式 AI 。

因为据说齿科影像也是一个人独特的生物影像指标,所以我就不直接把 X 光片直接发到博客上了。我拿向 AI 询问的结果,以及我从医生(当然是有齿科医生资格的真人!)那里得到的诊断意见比较。 AI 的医学影像识图能力可以说是……惨不忍睹。

继续阅读

紧接着上一本,这次我又速读了一本与AI相关的书:《ChatGPT×iPhone自動化ハック仕事術》(电子出版 ASIN : B0D7H64XVK)。与之前一本的风格截然不同,这本完全是从使用实例和操作角度来讲解 ChatGPT 的几个应用场景案例。内容不多,但是实用性很高。

书中主要是用到了 iOS 中的「捷径」功能,讲解怎么将捷径内的其他步骤与安装在 iPhone 中 ChatGPT 的 APP组合起来使用,构成一整套操作流程。本书甚至还强调了「睡着时的自动化」这一场景,利用到 iOS 的定时或指定地点(例如依据 GPS 判断当 iPhone 靠近家或远离家的地理位置时)触发功能,让 ChatGPT 在无需用户特别指示的情况下也能完成一些任务。

有一个非常喜欢,让我觉得非常棒的实例,是用 ChatGPT 配合捷径功能,自动读取 RSS 源的新闻并概括!这个太棒了!我自己常年都是 RSS 这种订阅协议的使用者,但是我目前使用的 RSS 订阅工具并不支持翻译,好像也没什么自动化。于是,对于我来说,使用 RSS 就不得不面临「要有意识地主动打开 RSS 订阅工具刷新看内容」以及「不熟的外文内容要在浏览器打开翻译阅读」这两个使用问题。而本书中的一个用例,就是可以利用捷径自动执行读取 RSS 里的内容,然后让 ChatGPT 来概括内容,并写入备忘录等 APP。也就是说,如果搭建妥当的话,这一条捷径就可以帮助用户每天早上「烹饪」出当天的新闻早餐了!真是太棒了,颇有当年用 IFTTT 的感觉。

而这本书里就举出了一些这样的很具体的自动化实力,比如 邮件 APP 里一个快捷方式能让 ChatGPT 根据用户意思(应答、谢绝等)来提供回复邮件的建议;Safari 浏览器中的一个快捷方式让 ChatGPT 翻译网页上的文字……等等。我自己就尝试了做一个捷径:我输入一个自己感兴趣的单词或话题,让 ChatGPT 帮我去搜索可信国际媒体上的近期新闻消息,汇总并注明新闻来源,最后还帮我从 Wikipedia 里找到相关资料背景——当然这一切都是用我的母语输出结果的。我把这个捷径放在了 iPhone 桌面上,用起来很顺手(偶尔会触发 ChatGPT 失败)。

虽然书中介绍的例子种类不多,但却都可以触类旁通,用户读了之后可以举一反三地根据自己熟悉的既有工具,编写出更适合自己的内容。当然,本书中提到的捷径等功能,作者也在书里给出了对应的 URL ,里面提供了捷径的获得方式。
继续阅读

今日速读了这本《努力革命 ラクをするから成果が出る! アフターGPTの成長術》( ISBN : 9784344042407),因为副标题里有提及 生成式人工智能 GPT ( ChatGPT ),而且这本是可以在 Amazon 包月读书套餐中畅读的,于是就下载到 Kindle APP 中来看看。

本书的内容应该说是属于日本市面上相当常见的「人生啓発」(我想可以对应简体中文出版物中的自我成长、成功学一类的书),一如既往的,又提出了各种奇怪的「 XX 力」——例如在决策时,不仅依靠理性而更需要直觉和勇气的「飛ぶ力」(飞跃力?),以及作者所称以好奇心发现新奇事物时的「すげー、やべー力」(好棒棒喔!力)。尽管我基本上很少读日本的这类自我成长的书,但爱逛书店的我,总是难以避免会在畅销书籍的书柜上看到莫名其妙的「 XX 力」,而这一本也自然不例外。至于说关于 AI 的内容,在本书中大约只有不到 1/3 甚至不到 1/4 左右。我读下来很是失望,我觉得这位作者恐怕既不懂 AI ,也不懂人生。

比如在给出 AI 的用例建议时,作者提出 AI 可以这样用:请 AI 概括孙正义先生的著作,并扮演孙正义先生,给我提出 10 条建议。嗯……作者你是认真的吗?我觉得这不是说明 ChatGPT 的回答不行,可能是说明了名人名言的成功经验和那一套成功学根本不行。不信?我把作者的该建议贴给 ChatGPT 了,并且得到了回答。在本博客的最后,你能看到我得到的「 AI 概括・孙正义成功学十条!」以及翻译后的版本。读了后你觉得能有多大用处?

继续阅读