AI绘图

在网上学到一个用 ChatGPT 最新的图像制作功能来实现连续像素图动画(分割图)的方法。

提示词是:

Create a detailed pixel art frame animation for a game, where the final image is divided into multiple sub-images, each serving as a continuous animation keyframe. Design the sequence to depict [(这里填入你想要生成的像素图的内容)] Ensure the keyframes transition smoothly and continuously, and include as many frames as possible to achieve a high level of fluidity and detail in the animation.

我实际尝试填入的是:

Create a detailed pixel art frame animation for a game, where the final image is divided into multiple sub-images, each serving as a continuous animation keyframe. Design the sequence to depict [ChatGPT LOGO的机器人从手机屏幕里钻出来] Ensure the keyframes transition smoothly and continuously, and include as many frames as possible to achieve a high level of fluidity and detail in the animation.

于是就得到了:

继续阅读

虽说在前一篇博客里,我试了一下让 ChatGPT 用新的图像生成功能,生成像是图解翻花绳那样的有一些复杂空间结构、有内在逻辑的图片仍有问题。不过今天我又试了一下比较简单的图,而且是单张、不太强调逻辑的,幻想类的图,效果就看起来不错了。


就是这两张猫人妈妈的图。很温馨吧!

其实在生成过程中,还是陆陆续续有一些问题的,一开始我指定给 ChatGPT 的是生成猫咪宝宝的主观图,而且是躺在摇篮里的仰视图,而且我也说明了因为是主观视觉图,所以生成的图中就完全不应该出现猫宝宝的身体。结果 ChatGPT 一开始生成的图像还是比较主观的(没有猫宝宝的身体出现在图中),后来就越来越不符合我最初提出的要求了。

我猜这可能是因为 ChatGPT 新搭载的图像生成功能具有在整个对话中上下连贯衔接的功能,所以每次生成一张图,就会承接延续前一张生成图的一些元素,这也就导致了在同一个会话中生成的图片越来越偏离我最初的指示。

不过,仔细比较两张图的话会发现……猫妈妈毛的纹路惊人得一致!简直就像同一只猫人一样有说服力。

总之,但还是很温馨呀!

这么说起来……这可以说是真的「猫娘」(娘 = 妈妈)了吧?

这几天 ChatGPT 更新了新的图像生成器后,被网络上的人们纷纷称赞。确实,生成各类画风的图像有明显进步,但前提是不太注重细节,或不太注重图像内在的逻辑表现。

然而……一旦我提高了期待,让它试一试复杂的内容时,比如翻花绳……

下面四张是用 ChatGPT 新的图像生成工具来生成的翻花绳图解组图,你看明白了吗?

(一)

继续阅读

这几天好像是 Google 发布了新的 AI 工具—— Gemini 2.0 Flash 。我不是 Google AI 的经常使用者,所以我就不清楚它到底哪个模型有什么特征,或是过去的两年里是怎么迭代至今的。不过今天看了几个网上的帖子和视频,似乎用过的人都对其能力表示惊讶。特别是我看介绍说它在生成图片方面有比较好的整合能力,以及可以通过用户所输入的文本提示,针对图片进行局部进行修改。

在一个网络视频中我看到了介绍者用 Gemini 2.0 Flash 做了一个菜谱,那么我就来仿造一下——生成一个图文并茂的奇幻世界的烹饪手册。

下面展示的就是实际生成的图片。需要说明的是,图片不是一次性生成的,我的生成步骤是:先要求 AI 用文字的方式输出菜单,然后再通过多次对话指示,为每个步骤生成一个配套的图片。


好的,这是一个分为六个步骤的奇幻世界幻想菜谱:

菜名:暮光森林的低语

食材基调: 夜光蘑菇、星尘香草、龙鳞坚果、月光泉水、影豹里脊肉(少量,可选)、梦 Wind 酿制的晨露蜂蜜。

第一步:收集与净化

食材: 新鲜的夜光蘑菇(3个,需带有微弱的蓝色光芒)、月光泉水(1小杯)。

烹饪手法: 将夜光蘑菇小心翼翼地用柔软的苔藓擦拭干净,去除表面的泥土和杂质。然后,将它们浸泡在月光泉水中,让其吸收月光的能量,并去除可能存在的微小毒素(奇幻世界的蘑菇特性)。浸泡时间约为一刻钟(奇幻世界的时间单位,约等于现代的十五分钟)。

第二步:唤醒香气

继续阅读

虽说自从上次发布了《在iPad上开始试用苹果AI(AppleIntelligence)》以来,该文一直是我博客中访问量较高的博客,不过其实我自己生活中并没有用上多少 Apple 的人工智能。

最近有听说 Apple 将要发布新设备( SE4 ?)——当然,正如我最近博客中多篇文章所示,我正试图解离智能手机的功能,让移动电话还原为移动电话——不过还是让我想试一试 Apple Intelligence 在这过去的半年里开放的新功能。

我试了一下在备忘录中画了一朵花…………嗯,虽然大概 6 年之前我努力练习过画画,但看来现在又退化到了幼儿园的水平。但是,我用 AI 「抢救」了一下!它变成了这样:

继续阅读

OpenAI 终于把视频生成 AI —— Sora 开放给全体 Plus 用户了。
我试着生成了一下。

当时,我用的提示词是:「一名身穿日本平安时代贵族服装「十二単」的女子,背对着镜头在眺望天空。在她身边和周围,古代平安时代京都的春夏秋冬依次变化而过。仿佛一瞬间走过四季。」

其实我是把这段话先复制给 ChatGPT ,然后用它翻译的。

(其实是想到了 《 FGO 》 中清少纳言的宝具效果图。

然而……

别说到日本就脱呀平安时代不裸肩。

看起来 Sora 根本不理解什么是 「十二単」 。

可见,对于数据的标注还是非常重要,且目前对于数据的标注、准确记录和机器学习,还源源不足。一切古文字、古建筑结构、服装、发型、手势等……这些都等着人们来标注。

否则的话,就会像这样,我都指明了是「十二単」了,却还生成看起来像是江户时代的衣服。

更何况,我指定的四季呢?!

最近依然忙于每天抽空摆弄一些新的(?)二手电脑。

硬件算是凑齐了,接下来该弄软件配置和网络了。所以,如果按照我之前的用 AI 生成的画作来形容一下的话,或许是这一副:绕不完的线

好吧,实际物理的线路没那么夸张,但是内部的网络逻辑连线还是有点搞的,特别是涉及到我不熟悉的操作系统和系统设备关系。所以我也积极地利用生成式 AI 来进行计算机硬件及操作系统配置的咨询《简记一种新奇的装机体验withAI》

今天要说一个什么观察呢?这不最近 OpenAI 的 ChatGPT 的模型从 o1 的预览版,升级到了正式版了嘛。我就用它总结了近期有关计算机网络拓扑的讨论,并请它用内嵌在 HTML 内的 SVG 矢量图来为我画出一张网络的逻辑连接图。

很抱歉,因为涉及到我的各个设备的网络布局,所以不方便发出来公开展示,但总之第一次生成时,感觉效果不错,比预期的准确度与完成度要高。不过当第二次生成时,质量却又有点下降,感觉还是不太稳定。总之 o1 正式版感觉还是有明显进步的。是为记。

各位也可以试试看让 o1 或者其他生成式 AI ,用绘制 SVG 矢量图文件、代码的方式,来创作图片。

一眼得结论:

(激光鼠标)

这都 2024 年年底了,随着各路介绍(推销?) AI 的人,说 AGI 就快接近了: 10 年以内、 5 年以内、 3 年以内……乃至明年……

于是我倒要看看, 2024 年年底这个时间点 ,ChatGPT 能不能画出靠谱的设备原理图。想必,这些很标准的设备,在互联网上肯定有大量现成的、准确且标准的素材可以被用于学习。

继续阅读