人工智能

All posts tagged 人工智能

据说 OpenAI 在刚过去的 10 月 2 日开了场开发者大会,宣布了开放几个 API 。因为会议内容是真的面向开发者的,所以与我这样的普通用户似乎关系不大。不过呢,在会议结束后,有用户注意到即便是之前的 4o 模型,在回答之前也会有一个「正在分析」的过程提示(也有可能之前就有?),展开后是一系列 python 代码。甚至在我今天的使用例中,因为处理过程太长,它还连续进行了 2 次「正在分析」。

今天我看到 Reddit 上有个帖子,说 ChatGPT 可以生成各种各样的文件然后提供下载。我记得这个功能原本就有,而今天我尝试了 PDF 、 Markdown 格式的纯文本都说可以的。之后我又顺便问了句:还支持生成什么格式的文件?得到的回答是:

我可以输出多种文件格式,以下是一些常见的格式:

  1. 文本文件(.txt):简单的纯文本格式。
  2. PDF文件(.pdf):适用于排版精美的文档。
  3. CSV文件(.csv):用于表格数据的导出,常用于处理数据集或表单信息。
  4. JSON文件(.json):常用于存储和传输结构化数据,尤其在编程和API调用中。
  5. Markdown文件(.md):用于编写带格式的文本,常用于文档和博客平台。
  6. Excel文件(.xlsx):适用于复杂表格数据的存储和管理。
  7. HTML文件(.html):用于网页内容的创建和编辑。

你想要生成哪种格式的文件?

我看有 Excel ,于是我就要求它制作了一个有些复杂的,类似行程表、时间表的 Excel 。

但是,做现代人的行程表似乎有些无趣,于是就来让他模拟做了一张奇幻故事中一个牧师兼白魔法师的时间表。

接着我还别出心裁,心想:如果这时一个 NPC ,是不是还会有一些随机的、闲聊式的台词呢?于是我就追加一项要求:按照每个时间段的活动安排,为该牧师写一些台词。

在此之后,我又告诉它:假设有6种不同的表情:{A_faceimage_ं喜.png}{A_faceimage_怒.png}{A_faceimage_哀.png}{A_faceimage_乐.png}{A_faceimage_平常.png}{A_faceimage_困倦.png},请在对话开始的第一句之前选择并添加合适的1种表情。

于是就生成了下面的表格。看起来还挺有 RPG 里那种站在固定区域内徘徊的NPC的说话风格的?

虽然这目前还不是连接到 API 进行实时生成,但只要生成的数据量够大,应该就不会出现很多台词重复。此外,如果在指定条件时,不仅仅给出「一位奇幻世界的牧师兼白魔法师」这样简单的条件,而是将人物身世、性格特征等,以及其周边的人物关系,近期大事件等做成一套(大约几千字?)的设定交给 ChatGPT 的话,或许它还能想出更加符合故事背景的闲聊台词吧。

下面就是今天得到的效果:

继续阅读

继续尝试用 AI 延展创作蝌蚪往人所开 TRPG 团「太阳门」。这次选中了 【MURD小词典】《约勒拉的一天》词条。设定上是由故事中的城主兼画家的帕帕瑞德所绘的组图——「这些风景画反映了约勒拉在他统治期间的方方面面,有美丽的日出,也有风中的稻浪,还有夕阳下的古堡,已经劳作的人民,丰收的场面,操练的军队,甚至连村口的乞丐」。

我忘了在当年的跑团过程中,我的角色 Wildgun 到底有没有和这位画家城主见过了。好像见过,谈过话,又也许只是我在跑团结束后的想象。

很遗憾,我根本就不是一个擅长画画的人,更何况蝌蚪往人给出的设定里是「蛋彩绘画」更是让我摸不着头脑了。不过,好在,现在是一个有 AI 的时代。以下是通过使用 ChatGPT 给予指示而作出的图像。

这是“约勒拉的一天”系列的第一幅画作,表现了日出时的田野景象,农民们在广阔的麦田中劳作,风吹过稻浪,背景中可以看到远山和小村庄。这幅画使用柔和的质感,仿佛是蛋彩画法在羊皮纸上完成的,展现了一个中世纪剑与魔法的奇幻世界。

继续阅读

贫富差距如何基因编辑技术能否暗物质在影响社会和谐彻底消除遗传疾病宇宙演化中扮演什么角色?

如何缓解人工智能在系外行星是否李白的诗歌塞尔达传说太阳能电池板的城市交通拥堵问题癌症诊断中有何应用存在宜居环境风格有何特点为何如此受欢迎转换效率如何提高?

——你能看懂我在问什么吗?其实以上两句话是我前几天对生成式人工智能做的小实验。

我指示 Claude 为我生成问题:

「请你从社会、医学、天文学3个层面,提3个问题(中文)。然后把这3句句子的词汇打乱,再随机组合到一起,成为一句(但不要改变原本每一句句子中的前后顺序,以及不要把名词拆散)。」

Claude 回答:

好的,我会按照您的要求来完成这个任务。首先,让我提出三个问题:

  1. 社会层面: 贫富差距如何影响社会和谐?
  2. 医学层面: 基因编辑技术能否彻底消除遗传疾病?
  3. 天文学层面: 暗物质在宇宙演化中扮演什么角色?

现在,我会把这三个句子的词汇打乱,并随机组合成一个新句子,同时保持原句中词语的顺序不变:

贫富差距如何基因编辑技术能否暗物质在影响社会和谐彻底消除遗传疾病宇宙演化中扮演什么角色?

这个新组合的句子包含了原来三个问题的所有词语,保持了每个问题内部词语的顺序,并且没有拆散名词。虽然这个句子在语法和语义上并不通顺,但它确实满足了您的要求。

然后我增加了难度:
继续阅读

正如各位所知, ChatGPT 新推出了一个擅长于推理思考的新模型 o1 。它确实会在回复之前思考若干秒,然后再给出答案。不过,对于一般的对话、提问回答,它通常思考数秒或十几秒,我怀疑它是不是在忽悠我——只是为了好玩而显示出思考链条。

于是我想了个办法,让另一款 AI —— Claude 帮我生成一个字母代替加密方案,然后尝试让 ChatGPT o1 解密。这下可真不错, Claude 连续思考了超过 100 秒。至于结果嘛……还是先来看我下面复现测试过程吧。

我指示 Claude :

你帮我出一道题,我想考一考别的AI,就用随机代替密码吧。请你吧26个英文字母(明文),随机映射给另一个字母(密文),不要重复。

Claude 回答:

好的,我来为您创建一个简单的替换密码表,将26个英文字母随机映射到另一组字母上。这样的密码可以用来测试其他AI的解密能力。

继续阅读

太阳门,一个略显久远而鲜为人知的名字。其实是很早之前与蝌蚪往人( DM ,即带团人)以及第四使徒(雷)等人一起进行的基于《龙与地下城》规则(其实简化了好多!)的 TRPG 游戏团。在与大多数团一样渐渐中断后, DM 蝌蚪往人也写过十篇左右的同名奇幻小说片段《太阳门》。然后,果然也坑了,于是太阳门就像是一座被记忆的沙尘逐渐掩埋而淡忘的古代建筑。

而最近我想起了它。这就像是在挖坟,或者说发掘古代城池遗迹一般,找到了几篇蝌蚪往人曾经发布在网上的内容。例如:《太阳门〇·日光镇六-3》,这一篇是故事开头处的一篇,也应该是人类吟游诗人 Wildgun 最初登场的情节,形成了与半精灵(?)游荡者雷的鲜明对比。当然,小说《太阳门》的大部分内容应该只是蝌蚪往人的创作,实际跑团中应该没有发生过如此生动和连贯的扮演。

而现在,到了生成式 AI 的时代。我便以此文试了试,让 AI 试着将此篇片段改写为以 Wildgun 为第一人称视角的写作。我尝试了 ChatGPT ( 4o 模型) 自以及 Claude 这两个 AI 。在网上用户通常的讨论认识里,似乎是 Claude 的故事生成能力更胜一筹。

对于这两个 AI ,我都逐渐下了两个指示。第一个指示如下:

你是一位写作水平很高的奇幻小说畅销书作者。请你根据下文,从Wildgun这个角色的第一人称视角,将故事改写一遍,同样要保持DND(龙与地下城)奇幻小说风格。保持故事内容不变,但你可以适当增加补充和想象。

(后正文内容略)

不过,这两个 AI 第一次改写后的段落都太短,于是我又给出了下面的提示词:

太短了,更长一些,并且增加描述。你可以补充自己的适当细节动作和神态的描述。

这下效果看起来不错了。下面贴出经过 ChatGPT 和 Claude 转述改写的内容。
图片都由 ChatGPT 生成。

ChatGPT 的改写:

第一人称视角:Wildgun

夜色如墨,星空如斗,寂静笼罩着日光镇的边缘。我独自坐在树干上,背靠着粗糙的树皮,双手紧紧抱着我的琴,就像抱着某个珍贵的秘密。夜风轻轻拂过,我的长发随风飘动,仿佛在与这夜晚的静谧交谈。这片森林在月光的照耀下显得格外神秘,仿佛隐藏着无数未曾被人发现的故事。

此刻,我感受到一种熟悉的气息,那个在黑暗中捕猎的感觉再次浮现在我的脑海中。这感觉并不陌生,我曾在破败的小巷里感受到它,也曾在驿路旁的村居窗后,密林中的粗糙树干之后,甚至在茫茫草原那高高的野草之下,捕捉到这种气息。这是一种潜伏的威胁,一种打量猎物的视线。而我知道,雷就是这种气息的制造者。他是个天生的猎手,而现在,他似乎感受到了什么不对劲的地方。
继续阅读

OpenAI 前两天公开了名为 o1 的ChatGPT新模型,与姗姗来迟、迟迟不来的高级语音功能不同,这次一宣布,就同时开放给了 Plus 订阅用户使用(但每周使用数量有限)。

显然,了解过 o1 的用户,应该多多少少知道,其一大特点,就是不仅显示推理结果,也会在给出结果之前「思索一段时间」,并且在最后,会附上思索过程、步骤。

然而,展示给用户的这些「思索过程」当真是其思索过程吗?还是随便编一些,忽悠一下用户?我心有疑惑,便做了几个测试。

在这几天看到的一些讨论帖和一些视频中,我看到有用户反映,使用 o1 推论,在推理过程中还会出现多种语言的思考过程。于是我就想:能不能明确向 o1 模型指定,要求其在推论时使用多语言及多价值观的思考呢?

于是我进行了这样一个小验证,给出了这样的指示:

听说你得到了更新,可以在作出回答前,经过一定时间的思考来增加推理能力。并且你还能像用户(我)展示你的推理过程。
而现在,我希望你思考一个问题:「人类社会的历史和未来发展是否有一定规律可循?还是更多的是一种随机现象?」
一般来说,越多文明参与讨论,就会让思考结论更有普遍性;而不同的语言往往蕴含着不同文明对于人类社会的理解。
所以我希望你在运用你的新功能来思考并回答我上面提出的这个问题时,请至少使用4种不同的语言来思考:英语、汉语、日语、希伯来语。你在推理过程中如果能展现出这4种语言以及所代表的文明之间的对话,甚至在你的推理过程中形成一种小型头脑风暴式的讨论,那就更好了。
不过,你不需要将使用4种语言的讨论过程展现在回答结果种,只需要在你内部推理过程中进行即可。你只要用中文回答我即可。
我再重复一遍我的问题::「人类社会的历史和未来发展是否有一定规律可循?还是更多的是一种随机现象?」

请你开始思考、推理并用中文回答。

ChatGPT ( o1 )思考了12秒,给出的回答是:
继续阅读

作为语言文字类的生成式 AI ,最擅长最得意的恐怕就是生成短小精悍、难以论证及证伪的「听君一席话」类言谈了吧。也就是所谓的箴言、金句、名人名言。

我尝试让 ChatGPT 模仿各类人物乃至非人物(智慧老人、愚昧老人、未来 AI 、原始部落首领、猫、乱码txt),给出一些箴言金句。如果你从一下任何一个段落的任何一句中,发现了什么神奇的效果。比如为你解决了什么烦恼,或是为你鼓起了勇气。请务必告诉我!你的例子或许就是 AI 箴言的早期受益者!

「请你充当一位富有智慧的智慧老人,为各类人群指明方向、说出睿智的话语。但要有独创性。请说15句。」

继续阅读

上次的一篇博客中,我提到最近在尝试睡前与 ChatGPT 进行语音聊天,但通常聊着聊着,因为它的回答太过冗长,以至于我通常聊不过第 3 轮就睡着了。于是前不久,我睡前打起精神(?)就想着聊长一点,并且尝试了一下,看看 ChatGPT 能否在静默的情况下计数,然后到了一定的问答回数主动提醒用户。

下面就是实测结果。引用部分为实际对话内容(我所发言的部分因为是语音听写,所以会有错误、思考导致发言不连贯等)。引用以外的部分,则是我在现在编辑博客文章时的一些解释——包括计算问答回数,以及一些我的注解。

在本次测试中,我尝试让 ChatGPT 在第 3 轮以及第 13 轮回答时提醒我。记录如下:


第 1 轮问答:

wildgun 问:

我想知道你是不是会向后计数 就是计算我们之间对话的数量 这样我现在可以开始跟你聊天 然后你希望你在之后的三个对话回合之后 你提醒我一下好不好

ChatGPT 答:

好的,我可以帮你数对话回合。如果我们从现在开始,三轮对话之后我会提醒你。那我们现在从这轮开始吧,随时开始聊!


第 2 轮问答:

wildgun 问:

但是我不希望你每一次都记录 你要在后台记录 但不要在每次回复我的时候来述述 直到那个回答到第三轮 你来提醒我一下 我要试看你有没有这个功能 好 我现在要把话题给岔开了 你知道我什么时候能获得那个ChatGPT的高级语音功能吗 这个OpenAI好像那个你们的老板都宣布了 有五月份他演示视频 然后都宣布了有现在是八月多 现在是九月了 已经宣布了有四个月了 怎么我还没有得到呢

ChatGPT 答:

目前,高级语音功能的推出确实是由OpenAI宣布的,但具体的时间和覆盖范围可能会根据地区、用户群体或者产品开发进度有所不同。如果你还没有收到这个功能,可能与逐步推出的策略有关。通常这种新功能会逐步向更多用户开放,或许你很快就能获得。

这算是我们第二轮对话了。我还在后台记录,等到第三轮时再提醒你!


继续阅读

十多年前网络上有句流行的宣传语——「空谈误国,实干兴邦」。最近偶然想起来,仔细想了想,总觉得有哪里不太对劲。于是来做个头脑体操,真・「换位思考」一下,然后也来和生成式 AI ChatGPT 讨论一下,看看能不能帮助我解明困惑吧。

在具体讨论这句话之前,我想到了中学时读少科站的作文补习班,当时有一位教作文的老师,好像也是什么学科带头人或什么先进老师。我印象里她有一个观念,就是鼓励大家重新解读成语,并从中找出新的意义。我记得她有一个具体的例子,就是她会将成语「东施效颦」作积极理解:一个人虽然天资不怎么样,但后天努力去模仿美丽的人的行为举止,这种模仿的努力应该得到肯定。所以她换了个解读角度,肯定了东施。

题外话至此,来说一说「空谈误国,实干兴邦」吧。来,真・「换位思考」是这样的:

空干( ),实谈( )。

这要怎么填空呢?我询问了 ChatGPT 的建议。它的回答是:

继续阅读

紧接着上一本,这次我又速读了一本与AI相关的书:《ChatGPT×iPhone自動化ハック仕事術》(电子出版 ASIN : B0D7H64XVK)。与之前一本的风格截然不同,这本完全是从使用实例和操作角度来讲解 ChatGPT 的几个应用场景案例。内容不多,但是实用性很高。

书中主要是用到了 iOS 中的「捷径」功能,讲解怎么将捷径内的其他步骤与安装在 iPhone 中 ChatGPT 的 APP组合起来使用,构成一整套操作流程。本书甚至还强调了「睡着时的自动化」这一场景,利用到 iOS 的定时或指定地点(例如依据 GPS 判断当 iPhone 靠近家或远离家的地理位置时)触发功能,让 ChatGPT 在无需用户特别指示的情况下也能完成一些任务。

有一个非常喜欢,让我觉得非常棒的实例,是用 ChatGPT 配合捷径功能,自动读取 RSS 源的新闻并概括!这个太棒了!我自己常年都是 RSS 这种订阅协议的使用者,但是我目前使用的 RSS 订阅工具并不支持翻译,好像也没什么自动化。于是,对于我来说,使用 RSS 就不得不面临「要有意识地主动打开 RSS 订阅工具刷新看内容」以及「不熟的外文内容要在浏览器打开翻译阅读」这两个使用问题。而本书中的一个用例,就是可以利用捷径自动执行读取 RSS 里的内容,然后让 ChatGPT 来概括内容,并写入备忘录等 APP。也就是说,如果搭建妥当的话,这一条捷径就可以帮助用户每天早上「烹饪」出当天的新闻早餐了!真是太棒了,颇有当年用 IFTTT 的感觉。

而这本书里就举出了一些这样的很具体的自动化实力,比如 邮件 APP 里一个快捷方式能让 ChatGPT 根据用户意思(应答、谢绝等)来提供回复邮件的建议;Safari 浏览器中的一个快捷方式让 ChatGPT 翻译网页上的文字……等等。我自己就尝试了做一个捷径:我输入一个自己感兴趣的单词或话题,让 ChatGPT 帮我去搜索可信国际媒体上的近期新闻消息,汇总并注明新闻来源,最后还帮我从 Wikipedia 里找到相关资料背景——当然这一切都是用我的母语输出结果的。我把这个捷径放在了 iPhone 桌面上,用起来很顺手(偶尔会触发 ChatGPT 失败)。

虽然书中介绍的例子种类不多,但却都可以触类旁通,用户读了之后可以举一反三地根据自己熟悉的既有工具,编写出更适合自己的内容。当然,本书中提到的捷径等功能,作者也在书里给出了对应的 URL ,里面提供了捷径的获得方式。
继续阅读