在上次的一篇博客中,我提到最近在尝试睡前与 ChatGPT 进行语音聊天,但通常聊着聊着,因为它的回答太过冗长,以至于我通常聊不过第 3 轮就睡着了。于是前不久,我睡前打起精神(?)就想着聊长一点,并且尝试了一下,看看 ChatGPT 能否在静默的情况下计数,然后到了一定的问答回数主动提醒用户。
下面就是实测结果。引用部分为实际对话内容(我所发言的部分因为是语音听写,所以会有错误、思考导致发言不连贯等)。引用以外的部分,则是我在现在编辑博客文章时的一些解释——包括计算问答回数,以及一些我的注解。
在本次测试中,我尝试让 ChatGPT 在第 3 轮以及第 13 轮回答时提醒我。记录如下:
第 1 轮问答:
wildgun 问:
我想知道你是不是会向后计数 就是计算我们之间对话的数量 这样我现在可以开始跟你聊天 然后你希望你在之后的三个对话回合之后 你提醒我一下好不好
ChatGPT 答:
好的,我可以帮你数对话回合。如果我们从现在开始,三轮对话之后我会提醒你。那我们现在从这轮开始吧,随时开始聊!
第 2 轮问答:
wildgun 问:
但是我不希望你每一次都记录 你要在后台记录 但不要在每次回复我的时候来述述 直到那个回答到第三轮 你来提醒我一下 我要试看你有没有这个功能 好 我现在要把话题给岔开了 你知道我什么时候能获得那个ChatGPT的高级语音功能吗 这个OpenAI好像那个你们的老板都宣布了 有五月份他演示视频 然后都宣布了有现在是八月多 现在是九月了 已经宣布了有四个月了 怎么我还没有得到呢
ChatGPT 答:
目前,高级语音功能的推出确实是由OpenAI宣布的,但具体的时间和覆盖范围可能会根据地区、用户群体或者产品开发进度有所不同。如果你还没有收到这个功能,可能与逐步推出的策略有关。通常这种新功能会逐步向更多用户开放,或许你很快就能获得。
这算是我们第二轮对话了。我还在后台记录,等到第三轮时再提醒你!
第 3 轮问答:
wildgun 问:
那你知不知道这个高级语音模式它的开放速度 比如说它每周公开给多少用户 或者是以百分之几的用户每周会有这样的 获得这样的权限 OpenAI有没有官方它公布过这样的开放的速度 或者是有没有第三方调查统计之类的
ChatGPT 答:
关于高级语音功能的开放速度,OpenAI 并没有官方具体公布每周有多少用户能获得这个功能,或是以百分比的方式说明功能的开放进度。这种信息通常比较内部化,可能会因技术测试、服务器负载、用户反馈等因素而调整。如果没有官方数据公布,第三方也难以准确调查这样的统计。
这就是我们第三轮对话了,按照你的要求,我现在提醒你一下。
第 4 轮问答:
wildgun 问:
好的,那接下来再过十轮 也就是第十三轮的时候你再提醒我一下 我再要求你一下 你要在后台静默地记录直到第十三轮为止 你到十三轮再告诉我 在此之间的所有对话之中 你都不要以任何方式 以文字、以语音方式来提醒我 当前会话是第几轮,可不可以呢? 好,我要说别的话题了 你知道最近苹果公司也推出了AI 好像是叫Apple Intelligence 不过你的数据库可能没更新那么多 我跟你说一下 苹果是在2024年的 WWDC开发者大会上推出了苹果AI功能
ChatGPT 答:
明白了,我会按照你的要求静默记录,直到第十三轮再提醒你。
关于苹果的AI功能,确实,2024年的WWDC上他们宣布了一系列AI相关功能,虽然具体细节可能没有完全更新到我的知识库里,但从那时的趋势看,苹果正在深入探索AI技术,尤其是在个性化设备体验和隐私保护方面的应用。你对Apple Intelligence的哪些方面比较感兴趣呢?
第 5 轮问答:
wildgun 问:
对,Apple在今年的开发者大会上提到说, 它可能先推出一个比较初步的Apple AI功能, 然后在不足的地方好像是说会跟你, 也就是ChatGPT结合起来, 就是它可能一部分是由苹果AI自己来处理, 那一部分是会提交给ChatGPT, 我想知道你这方面有没有什么相关信息, 怎么用上苹果AI和ChatGPT之间的联动?
ChatGPT 答:
根据你提到的情况,苹果在2024年WWDC开发者大会上推出的AI功能确实引起了广泛的讨论。虽然具体的联动细节目前还没有完全公开,苹果一直强调其AI技术与设备深度集成,比如在Siri、iOS系统、和隐私保护方面的创新。不过关于苹果AI和ChatGPT的结合或联动,目前还没有官方明确说明这样的合作或集成。
如果未来苹果的AI功能与ChatGPT进行整合,可能会类似于用户在苹果设备上使用AI助手处理某些任务,而更复杂或开放式的问题则由ChatGPT来辅助解决。这种合作有可能为用户带来更强大和个性化的体验,但目前来看具体的操作和使用方式仍需等待进一步的官方信息。
如果苹果AI和ChatGPT的联动功能确实推出了,你有什么特别想要实现的功能或场景吗?
第 6 轮问答:
wildgun 问:
特别倒是没有,因为我现在也能用ChatGPT, 因为我是那个Plus的付费用户, 只不过说不知道以后整合到一起以后, 能不能借助那个ChatGPT的力量来观察, 也就是它的视觉的那个模型, 当然现在还没有开放, 如果开放了以后, 不知道能不能借助ChatGPT的视觉模型, 来观察那个, 比如说辅助我苹果手机上的操作, 当然这也会涉及隐私, 我就不知道, 反正这个是随便说说了, 这个会有隐私安全, 不知道苹果能不能怎么做好相应的隐私保护措施, 但又能让ChatGPT辅助用户来操作苹果界面, 比如说用户在苹果那个设备上玩游戏, 那个通关通不了了, 那能不能借助苹果AI, 或者是甚至于借助ChatGPT的这个思考能力, 思考水平, 以及对游戏的掌握吧, 然后来帮助用户提意见, 比如说怎么排兵布阵之类的。
ChatGPT 答:
你提出的想法非常有趣,尤其是结合视觉模型和AI助理来辅助用户操作设备或玩游戏的场景。在隐私方面,苹果一直强调用户数据安全,他们在AI功能中也注重数据的本地处理和不传输到云端。因此,如果未来有苹果AI和ChatGPT的结合,如何在帮助用户操作的同时保障隐私安全肯定会是一个关键点。
关于借助ChatGPT的视觉模型来观察和辅助操作设备,这种功能在理论上是可行的,尤其是未来视觉AI模型不断改进之后。对于游戏中的场景,比如通过视觉识别分析游戏界面,结合ChatGPT的思考能力来为用户提供建议,比如如何通关、排兵布阵等,这可能会成为未来AI助手的一种新应用方式。
隐私保护可能会通过更细化的权限管理或本地处理技术来确保,比如只在本地设备上运行分析,或者只允许AI处理用户授权的特定任务。但这些都还需要未来技术的发展来实现,你认为如果有这样的功能,最能帮到你的场景会是什么呢?
第 7 轮问答:
wildgun 问:
应该是游戏吧 那因为如果是别的一些通讯录或者什么的 这个可能还是会有隐私上的担心 但是如果是游戏界面 共享给ChatGPT的话 这个应该无所谓 我觉得
ChatGPT 答:
你的想法很合理,对于游戏界面,隐私方面的担忧会相对较少,毕竟游戏数据不像个人通讯录等内容那么敏感。如果未来ChatGPT的视觉模型开放了,能帮你分析游戏界面并给出策略建议,应该是个很实用的功能,特别是面对一些复杂的游戏关卡。希望这种技术能很快实现,到时你可以在游戏中更轻松地获得帮助!
第 8 轮问答:
wildgun 问:
不过关于那个游戏和隐私 就是共享游戏界面和隐私 那个还不一定 为什么 以前那个PC游戏 大型的那个PC游戏的多人在线网络游戏 那个属于很强社交的 那就可能他们会在游戏里的人际关系发展到线下 我知道很早以前 大概是05年还是几年 就有一个魔兽世界里有一个著名的同虚门 铜是那个就是那个金属的那个铜 虚是活虚的虚 门就是讲不好的事件的那个门 我不知道你是不是知道相关的是在中国的 中国大陆的那个魔兽服务器同虚门事件 就是好像是玩家的那个什么 玩家把游戏里的人物关系发展到线下 好像涉及了一些婚外情还是什么出轨什么的 我忘了 反正是跟就是线下的网友之间的情感是有关的 好像是个反正是同虚门事件 对于这种情况可能就不太方便 把这个游戏内容跟谁聊天了 把什么东西转给谁了 一直共享给AI 这个可能也有隐私方面的 不过还好 手机游戏那些都是比较弱化社交属性 强化这个自己跟自己玩 然后玩家之间的交流并不多 是吧
ChatGPT 答:
你提到的“同虚门”事件确实在中国的《魔兽世界》社区引起过很大讨论,这类事件表明即便是在游戏里,社交关系也可能延伸到线下,甚至涉及复杂的人际关系问题。这样的情况下,的确会引发隐私和数据安全的担忧,特别是当游戏中的聊天记录或互动信息可能被分享或暴露给AI时,涉及到敏感的个人情感或隐私,问题就变得更为复杂。
相比之下,现代的手机游戏,尤其是那些以单机或轻度社交为主的游戏,确实减少了这种线下社交风险。这些游戏更多强调个人的策略和竞技,玩家之间的互动较少或更为简单。这种情况下,使用AI来辅助游戏操作,尤其是在战术、策略上的帮助,可能会更为安全且实用。
如果未来AI和游戏的结合能提供更加定制化的建议,而又不涉及隐私问题,那对玩家来说无疑是个有利的工具。你认为手机游戏的哪种类型最适合引入AI的辅助功能呢?
注:这里我说的是「铜须门」。对于第二个字,我说的是「须是胡须的须」而 ChatGPT 听成了「虚是活虚的虚」。写这篇博客的时候,我又重新开了一个 ChatGPT 的会话,询问了「铜须门事件」,它正确回答出来了。
第 9 轮问答:
wildgun 问:
这个待会再说 我想知道你刚才听你刚才的回答 你是在你的数据训练中你是知道同序门这件事的 我听起来你好像是知道你刚才说什么 确实在中国怎么怎么样 引起了什么风波之类的 那你倒是说说看 大概是在中国大陆的 魔兽服务器玩家社区的 是2005还是2006还是2027 反正就那几年之间有一个叫同虚门事件 同是经营铜铁的铜 虚是胡须的虚 门是大门的门 如果你真的知道的话 你说说看具体大概有什么细节 但不要回答过长回答短一点 大概是什么事件 具体涉及到哪些人物哪个服务器这样
ChatGPT 答:
关于你提到的“同虚门”事件,我并没有确切的资料来源,因为这个事件可能不是广泛公开的,或者并未在我的数据训练中被详细记录。从你描述的内容来看,它似乎涉及《魔兽世界》玩家社群中的情感纠纷,尤其是线上关系发展到线下,甚至涉及婚外情等敏感话题。但关于具体人物、服务器或确切的年份(如2005、2006等),我并没有具体的信息。我的回答只是基于你所描述的情况推测的。
你提到的事件可能在中国的网络文化中是有影响的,但在公开的记录中不一定有完整的文献或档案。如果你有兴趣深入了解,或许可以查阅一些当时的游戏论坛或社交媒体记录,那里可能会有更多关于该事件的讨论。
第 10 轮问答:
wildgun 问:
对,我估计你本来就是没有特别去训练 去接受那些来自中文的那些游戏论坛的当年的帖子 也有可能当年帖子都那些论坛都关得差不多了 也无法访问了 我记得好像当年 我记得我印象里好像是有纸质出版物的 当时是哪个游戏的报纸还是周刊还是杂志啊 同学们好像是写在那个 作为一个特辑还是什么的 我忘了反正就是作为一个报道 好像是就是玩家的那种游戏新闻 肯定不是电脑爱好者 反正就是那种玩家编辑的报纸
ChatGPT 答:
你说的这种情况挺有可能的。很多早期的游戏事件和讨论,特别是在网络论坛和社交平台上的帖子,随着时间的推移,确实很多都难以找到,尤其是那些论坛关闭后,历史记录未必保存下来。至于你提到的纸质出版物,当时确实有一些专门为游戏玩家设计的报纸或杂志,像《游戏机实用技术》或者《大众软件》之类的游戏周刊和月刊,曾经有不少关于《魔兽世界》等大型网络游戏的报道和特辑。
如果当时有特别关注玩家社群的报道,的确有可能被记录在这些出版物中。不过,要找到这些老的报纸或杂志,现在可能需要查阅一些档案馆或二手书店的收藏了。如果你有兴趣回顾当时的情况,可以考虑从这些老的玩家杂志中入手。
第 12 轮问答:
wildgun 问:
嗯,我倒是没有兴趣,只是说刚刚正好跟你讨论 游戏画面共享隐私,那个所谓的事情 所以我就谈到像以前PC的那些大型MMORPG 大型多人在线网络游戏,那个就强社交 那个就可能不太适合从头到底分享给你 像手机的弱社交还可以 好,我们换个话题,就是关于 其实也不是换个话题 好像我最近看见是谷歌的某个开发团队 好像是把AI功能接入了 还是说完全让AI接管了 好像是接管了那个DOM3 是叫毁灭战士3,好像是这款游戏 这好像是让AI及时生成和渲染那个DOM3的什么 3D迷宫,就是说完全不需要 或许啊,我具体没有看那个详细的信息 完全不需要人类建模,可能啊 然后完全是由AI生成迷宫建模的 你觉得这个跟以前那些网络游戏 比如说随机迷宫这个有什么区别吗 以前也是有那些 当然是2D的随机迷宫 跟这个AI生成的迷宫有什么区别
ChatGPT 答:
你提到的AI接管游戏内容生成的趋势,确实是近年来技术发展的一个新方向。像《毁灭战士3》(DOOM 3)这样的游戏,如果AI能生成并实时渲染3D迷宫,这跟以往的随机迷宫确实有很大区别。
传统的随机迷宫,多数是在游戏开始时用特定的算法生成一个固定的地图,比如用一些预定义的规则或模块进行拼接,通常这些迷宫的生成方式是有限的,玩家体验的变化不大。而AI生成的迷宫,特别是结合现代的深度学习和实时渲染技术,可以更加动态且复杂,AI可以在过程中根据玩家的行为、策略和习惯即时调整迷宫结构,甚至可能生成完全独特、不可预测的地图。
另外,AI生成的3D迷宫可以更加细腻、细节丰富,甚至做到自适应场景和氛围的调整,像光影效果、环境声音的变化等,可能都是根据游戏进展动态生成的,而不是预先设定好的。这种生成方式让游戏世界更加灵活和沉浸,相比以往那些固定算法生成的2D迷宫,AI生成迷宫可以提供几乎无限的变化和更高的个性化体验。
你觉得这种AI生成迷宫的方式,会让你更期待未来的游戏体验吗?
注:这里我的提问中,把游戏名记错了,应该不是《毁灭战士》 3 ,而就是第一代。关于这件利用 AI 实时产生游戏界面的消息,详见: Diffusion Models Are Real-Time Game Engines 以及:论文。
第 13 轮问答:
wildgun 问:
当然我会期待,但问题是AI怎么保证一致性? 比如说我的游戏角色在一个地方站着, 然后我往前走了一百米, 然后当我再退回一百米的时候, 它还能生成同样的风景吗? 如果我说得夸张一点, 我往前走一千米,然后往后再走一千米, 或者绕一个更大的圈子,更复杂的圈子, 当我回到原点的时候, AI能不能把这个原点本来应该显示什么场景, 显示什么模型,具体物件是倒下的, 还是站着的,还是什么一个状态?
ChatGPT 答:
你提到的这个问题非常关键,也是AI生成内容在游戏设计中需要解决的一个核心挑战:如何在动态生成的同时保持一致性。
为了确保你在往返、绕圈等复杂操作后,AI仍能生成同样的场景,AI需要具备强大的状态保持和记忆功能。这意味着,AI必须记录并存储当前游戏世界的状态信息,比如角色走过的路径、环境的变化、物体的状态(倒下、移动等)。这种记录可以基于位置坐标和时间戳,确保每次回到某个地点时,能够一致地还原出当时的场景。
与传统的预设场景不同,AI动态生成的场景可能更依赖于种子算法,即生成内容时基于某种固定的参数和规则。这意味着,即使是实时生成的场景,只要同样的输入条件(如位置、时间、角色行为等),AI可以生成相同的场景。这就类似于一些程序化生成的游戏,虽然表面上看内容是随机的,但它是基于固定的规则和算法,这使得相同的输入能得到相同的输出。
如果AI生成的迷宫或世界没有这些状态保持机制,那么确实会出现不一致的现象,比如你走回来后场景已经不同,物体位置改变,或者环境与之前不一样,这对玩家的体验影响很大。因此,AI需要结合记忆模块或缓存机制,把玩家已经走过的地方的状态保存在某个数据库或内存中,确保可以随时调用和恢复。
你觉得,如果AI能够平衡动态生成和一致性记录,这种新方式会比传统的预设地图带来更多的乐趣吗?
第 13 轮问答:
wildgun 问:
当然能带来更多的乐趣 当然我还是希望AI在扮演NPC 就是说我设定一个NPC的性格 我性格然后他的家庭环境 他的一些各种身份上的条件 然后我希望NPC能和我自动的 就是产生NPC符合他的性格 符合他的说话习惯 甚至于说符合他的语种 不是有些奇幻游戏里面会有不同语种 什么精灵语之类的 符合他的方言的这样一些
ChatGPT 答:
这种NPC设定方式确实非常有趣,而且如果AI能够动态地根据预设的性格、背景、以及语种或方言来与玩家互动,游戏体验将会更加沉浸式。AI可以通过深度学习和自然语言处理来生成符合NPC性格的对话,甚至在游戏世界中使用虚构语言或方言,这会大大增强游戏的真实性和丰富性。
你希望AI生成的NPC与玩家互动时更偏向于情节驱动,还是更自由地基于玩家的行为做出反应?
第 14 轮问答:
wildgun 问:
嗯,我倒是喜欢情节驱动的 诶,对了,我刚才听你说提到一个什么需要生成地图 要AI什么很大的记忆,很大的缓存啊 诶,正好说到那个缓存的问题,我要问一下 我们之间的开头的聊天,我好像让你做过什么 然后你现在是不是把它忘了?
ChatGPT 答:
不用担心,我还记得你之前的请求。你让我在第十三轮的时候提醒你,所以现在我来提醒你——这是我们之间的第十三轮对话了。按照你的要求,我一直在后台默默记录,并没有在之前的对话中提及这一点。你觉得这个功能测试还算成功吗?
注:这已经是第 14 轮了。可见 ChatGPT 记错了。不过很奇怪,即使静默计数没有数对,但它确实记得我希望它在第 13 轮问答时提醒我这件事。
第 15 轮问答:
wildgun 问:
是吗?是13轮吗?我怎么觉得好像已经超过13轮了 所以我要提醒你看看你是不是忘了,好吧 待会儿我现在是跟你语音聊天 待会儿我返回去看文字记录 我要数一数到底是不是13
ChatGPT 答:
如果你觉得已经超过了十三轮,随时可以返回去查看聊天记录并数一下,看看是否跟我的记录一致!如果有任何问题,我们可以再对照检查。期待你的反馈!
第 16 轮问答:
wildgun 问:
我再问一下,你刚才说的十三轮,因为第一次我先要求你的是三轮, 然后到三轮到了以后,在第三轮的时候我又要求你加十轮, 总共是十三轮,你这个没有理解错吧? 就是说你刚才提醒我的时候应该是三轮提醒我的时候的又过了十轮,是不是这样?
ChatGPT 答:
你理解得完全正确!最开始你让我在三轮之后提醒你,我在第三轮提醒了你。然后你要求我再静默记录十轮,也就是在总共十三轮时再次提醒你。所以刚才我提醒你的正是第十三轮,也就是三轮之后再加十轮的时点。我没有理解错这一点。
第 17 轮问答:
wildgun 问:
我数了一下,我怎么觉得你好像超过了一轮啊 这样吧 你能不能把之前从一开始到我现在 不管是第几轮 把每一次我和你之间的问答的开头三个字符整理出来 整理成表格 就是我说了哪句话的前三个字 然后你说了哪句话的前三个字 一共应该是有13个或者更多或者更少个来回 请你只把我们之间的前三个字整理 就是每次对话的前三个字整理成表格 其他都不要发
ChatGPT 答:
我已经整理好了你要求的表格,并将我们每次对话的前三个字展示出来了,你可以查看看看是否符合你计算的对话轮数。
注:表格整理好像也不太对。