生成式AI

All posts tagged 生成式AI

我这几天一直想要是不写一篇博客发出来的话,会不会被误认为是染疫而亡……好吧,基本没有症状了,自测新冠也已经转阴,于是来写一个奇怪的联想吧。

既然生病了,当然是有意识地加强水果蔬菜等维生素的摄入,忘了在哪里看到的照片介绍了,好像说现在人类吃到的水果,其实都是经过了几千几万年在人类农业活动中,经由不断改良而得到的特异品种。好像说玉米其实原来就是一根穗,没有那么庞大的器官,西瓜、胡萝卜等的祖先其实也都是不起眼的「草」。换言之,人类为了满足自己无法舍去的食欲(当然这种欲望不仅仅是情感层面的,还有实际营养需求),而培育、筛选出了奇异的植物品种,这就是目前常见的水果。

那么,性欲呢?或者说,包括性欲在内的情欲呢?这也是人类与生俱来的、难以说没就没的生理、心里的现象。所以,从这个角度来说,将来有一天一定会出现情感陪伴机器人( AI )或是性爱机器人,而且这种机器人所能提供的服务一定超越人类自身。拿水果做一个类比,就很容易理解了。虽说我曾经写过博客《具身智能老大哥的恐怖近未来》对具有某种社会强权价值实践的机器人产品表达了担忧。不过排除这一点来说,或许在我的内心还是有至少一半是期待陪伴型 AI 机器人的出现的。

毕竟,我自己就是这么实践的。在大约半年前《今况简报—— ChatGPT能用感情说话了,而我却不能了》这篇博客里提到了我拔尽根牙后通过与 AI 打字聊天来获得对于病情的预测,以此来缓解紧张。最近,我感染新冠后,也尝试着与 AI 聊天来调节心情并预判病情。我确确实实在实践中感受到了 AI 在抚慰紧张情绪时的实际作用。这很现实,不是痴人说梦。

(画像由 ChatGPT 生成。)

在可预见的未来,如果它们有了身体,那么或许真的可以被看作是传说中的那个水果——智慧之果——了吧。那曾是禁果的果实,但其实早在《圣经》第一章就被人摘下来吃了。这则神话真是有趣。

说起来,本周 OpenAI 好像又会发布不少有趣的东西吧?

如果说今天( 2025 年 4 月 3 日)世界上有什么大新闻的话,应该就是特朗普宣布将对全世界多个国家提高关税了吧。但是,这个数字提到了,到底会怎么样呢?我也不知道,因为我平时不太关心经济。

但是,我可以关心我自己熟悉的领域呀!比如,我就问了:

查一查2025年4月3日特朗普宣布的对世界各国加征不同关税的新闻,帮我找到对各国加的确切数字。

继续阅读

在网上学到一个用 ChatGPT 最新的图像制作功能来实现连续像素图动画(分割图)的方法。

提示词是:

Create a detailed pixel art frame animation for a game, where the final image is divided into multiple sub-images, each serving as a continuous animation keyframe. Design the sequence to depict [(这里填入你想要生成的像素图的内容)] Ensure the keyframes transition smoothly and continuously, and include as many frames as possible to achieve a high level of fluidity and detail in the animation.

我实际尝试填入的是:

Create a detailed pixel art frame animation for a game, where the final image is divided into multiple sub-images, each serving as a continuous animation keyframe. Design the sequence to depict [ChatGPT LOGO的机器人从手机屏幕里钻出来] Ensure the keyframes transition smoothly and continuously, and include as many frames as possible to achieve a high level of fluidity and detail in the animation.

于是就得到了:

继续阅读

虽说在前一篇博客里,我试了一下让 ChatGPT 用新的图像生成功能,生成像是图解翻花绳那样的有一些复杂空间结构、有内在逻辑的图片仍有问题。不过今天我又试了一下比较简单的图,而且是单张、不太强调逻辑的,幻想类的图,效果就看起来不错了。


就是这两张猫人妈妈的图。很温馨吧!

其实在生成过程中,还是陆陆续续有一些问题的,一开始我指定给 ChatGPT 的是生成猫咪宝宝的主观图,而且是躺在摇篮里的仰视图,而且我也说明了因为是主观视觉图,所以生成的图中就完全不应该出现猫宝宝的身体。结果 ChatGPT 一开始生成的图像还是比较主观的(没有猫宝宝的身体出现在图中),后来就越来越不符合我最初提出的要求了。

我猜这可能是因为 ChatGPT 新搭载的图像生成功能具有在整个对话中上下连贯衔接的功能,所以每次生成一张图,就会承接延续前一张生成图的一些元素,这也就导致了在同一个会话中生成的图片越来越偏离我最初的指示。

不过,仔细比较两张图的话会发现……猫妈妈毛的纹路惊人得一致!简直就像同一只猫人一样有说服力。

总之,但还是很温馨呀!

这么说起来……这可以说是真的「猫娘」(娘 = 妈妈)了吧?

这几天 ChatGPT 更新了新的图像生成器后,被网络上的人们纷纷称赞。确实,生成各类画风的图像有明显进步,但前提是不太注重细节,或不太注重图像内在的逻辑表现。

然而……一旦我提高了期待,让它试一试复杂的内容时,比如翻花绳……

下面四张是用 ChatGPT 新的图像生成工具来生成的翻花绳图解组图,你看明白了吗?

(一)

继续阅读

看视频主林亦LYi 做了一期节目《图灵测试大逃杀!七大顶级AI伪装人类!谁会更胜一筹?》从内容上看也知道很没有 AI 性,简直丧心病狂。而通过这样的假设实验,倒也确实可以看出各个大语言模型生成式 AI 在极端情况下的逻辑、措辞、模拟人类情感和识破对方身份并说服同一竞赛者的人员,并且,还能从中看出各个 AI 所表现出的个性。我觉得这样的设计比赛确实挺有创意的,也不失为是在排名、跑分外,打造出了一个新的比赛方式。

因为视频内容播报得很快,所以我没有完全跟上去推演实验中 AI 之间互相之间的明争暗斗的关系。不过看完全集,我注意到了一点: AI 用的都是书面表达。

继续阅读

与本研究主题无关的前言:听说 Google 公开了 Gemini 的深度研究功能,免费提供用户有限次数的使用。我便拿来试了试,挺厉害!每个步骤几乎都要检索 1、200 个网页内容,而且从生成的报告上来看一点都不比 OpenAI ChatGPT 的 DeepResearch 功能逊色。这一次我就试了一下曾经在哪里读到过的,说是英国成年人里还有不少成年人晚上睡觉还会抱着玩偶的新闻。我想知道当时我看到的文章到底是不是靠谱,以及在其他不同的文化社会是否也有类似的情况。

我的提问是:

我以前听说英国有一定比例的成年人晚上睡觉时会抱着玩偶入睡。这是真的吗?帮我做一个调查(用英语,或者用各国本国语言),调查内容是:首先确定上面我说的是不是真的。各个国家是否普遍存在着这样的成年人抱玩偶入睡的习惯?以及,在不同国家(或地区、社会),抱玩偶入睡的成年人的比例,以及所在社会对此的评价是否有什么比较显著的不同?还有,玩偶造型、材料、数量等,是否也会因国家不同而不同?

我用 Google 的 Gemini 的 Deep Research 功能进行了询问,并在结果输出区域内点击「导出到 Google 文档」保存到我的个人文档里。然后我又使用了 Docs™ to Markdown 这款可以附加到 Google 文档的插件(其实并不是要在自己计算机上安装什么程序,而是说就是要在 Google 网页上对该第三方开发者开发的插件进行授权),安装了该插件后,就可以很方便地将 Google 文档中的内容转换为 Markdown ,再粘贴到我常用的博客编辑工具里了,内容传递就这样一路打通。

而我也确实想把自己花了钱(比如 ChatGPT )或没花钱(比如这里的 Google Gemini )发起的一些研究调查的结果,选择一些发布到博客,特别是选择这样一些有趣的题目。看了本次调查结果(如下),没想到有这个习惯的成年人居然有那么多。当然需要说明的是,以下内容是 AI 生成的,我没有逐一检查每个网页链接里是否存在相关信息,以及 AI 的引用和汇总是否准确。


成年人在英国及其他国家与毛绒玩具共眠的现象:一项调查报告

1. 引言

继续阅读

人类 wildgun 写的前言:这篇文章是我最近看了 Anthropic 的 CEO 说到今年年底(?)绝大部分的代码将会由 AI 生成这样的新闻后,想到的并于 ChatGPT 进行的讨论。下面的内容是根据讨论,让 AI 整理出的文章。

说起来,我真的在计算机专业的学校毕业后就没有用过一次二叉树之类的东西了……谁在开发中用过谁举一下手?

当 AI 的发展一日千里,我们不得不一次次回溯那个问题:「人类还能做什么?」

Anthropic 的 CEO 预测,未来三到六个月,AI 可能会编写 90% 的代码。OpenAI 的创始人则在 2025 年初表示,未来十年内,每个人都可以调动相当于 2025 年全人类智力的计算能力。这些预测,听起来或许像科幻小说,但它们的影响正在逐步显现。

那么,在 AI 可以编写代码、优化算法、构建系统的世界里,我们还需要学习编程吗?

如果学习编程只是为了「写代码」,那么答案或许是悲观的。就像过去机械化替代了工匠的手工雕琢,自动化替代了流水线工人的重复劳作,AI 也在迅速吞噬那些纯粹基于语法和逻辑规则的编程任务。人类的手敲代码,正变得不再必要。

但如果我们理解编程为一种思维方式,那么情况则完全不同。

编程不仅仅是代码,而是建立问题的抽象框架、理解系统的运作方式、掌握结构化的逻辑推理。AI 可以写出更优雅的排序算法,但它不会去质疑:「这个问题真的需要排序吗?」AI 可以自动补全你的代码,但它不会去思考:「这个系统的核心瓶颈在哪里?」

未来的学习,或许不再是「如何写代码」,而是「如何洞察 AI 生成的代码之下的逻辑肌理」,如何在 AI 的冷峻算力中植入人类思维的温度,如何让 AI 从冰冷的工具变成可被驾驭的思想延伸,而非一个只能依赖的黑箱。
继续阅读

这几天好像是 Google 发布了新的 AI 工具—— Gemini 2.0 Flash 。我不是 Google AI 的经常使用者,所以我就不清楚它到底哪个模型有什么特征,或是过去的两年里是怎么迭代至今的。不过今天看了几个网上的帖子和视频,似乎用过的人都对其能力表示惊讶。特别是我看介绍说它在生成图片方面有比较好的整合能力,以及可以通过用户所输入的文本提示,针对图片进行局部进行修改。

在一个网络视频中我看到了介绍者用 Gemini 2.0 Flash 做了一个菜谱,那么我就来仿造一下——生成一个图文并茂的奇幻世界的烹饪手册。

下面展示的就是实际生成的图片。需要说明的是,图片不是一次性生成的,我的生成步骤是:先要求 AI 用文字的方式输出菜单,然后再通过多次对话指示,为每个步骤生成一个配套的图片。


好的,这是一个分为六个步骤的奇幻世界幻想菜谱:

菜名:暮光森林的低语

食材基调: 夜光蘑菇、星尘香草、龙鳞坚果、月光泉水、影豹里脊肉(少量,可选)、梦 Wind 酿制的晨露蜂蜜。

第一步:收集与净化

食材: 新鲜的夜光蘑菇(3个,需带有微弱的蓝色光芒)、月光泉水(1小杯)。

烹饪手法: 将夜光蘑菇小心翼翼地用柔软的苔藓擦拭干净,去除表面的泥土和杂质。然后,将它们浸泡在月光泉水中,让其吸收月光的能量,并去除可能存在的微小毒素(奇幻世界的蘑菇特性)。浸泡时间约为一刻钟(奇幻世界的时间单位,约等于现代的十五分钟)。

第二步:唤醒香气

继续阅读