AI绘图

一眼得结论:

(激光鼠标)

这都 2024 年年底了,随着各路介绍(推销?) AI 的人,说 AGI 就快接近了: 10 年以内、 5 年以内、 3 年以内……乃至明年……

于是我倒要看看, 2024 年年底这个时间点 ,ChatGPT 能不能画出靠谱的设备原理图。想必,这些很标准的设备,在互联网上肯定有大量现成的、准确且标准的素材可以被用于学习。

继续阅读

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第三题:哎呀,扣子扣错了。

太难了!试了 10 张以上,都没能成功画出扣错扣子没对齐的样子!即便是让 Claude 生成英文的提示词,还是很难达到我想要的效果。

看来对于并非常态的图片数据训练还远远不足啊……

上一次用 ChatGPT 创造自画像类似,这几天看到 reddit 上一个帖子启发,说以类似的方式,让 ChatGPT 参考对我保存的记忆(即用户数据),而画一张我宿敌的肖像。

它给我画出的是:

并附说明:「Here is the image of your arch nemesis, embodying intellect and mystery, with an aura of knowledge and time manipulation. 」

翻译过来就是:「这是你的死敌的形象,体现了智慧和神秘,拥有知识和操纵时间的光环。」

呃……不太可爱。好吧,有点凶。

于是我又指示画了一张女性版本的我的宿敌:

继续阅读

前几个月, ChatGPT 增加了记忆功能,在对话中,能明确看到它自动记下了与我有关的信息(比如我的兴趣爱好、我最近买了什么、我最近遇到了什么事)。我自己也会有意识地去检查并适当删除记忆内容。其操作方法是:网页版【设置】——【个性化】——【记忆】下的【管理】按钮。此外,之后的对话中,我有时也会提示 ChatGPT 不要对我提到的某个内容进行记忆。

当然渐渐地, ChatGPT 对我的记忆就增多了,也就是说,它逐渐开始了解我这个人了。刚好前几天在 Reddit 的 r/ChatGPT 板块看到一个帖子,是发帖者提议用户们让自己的 ChatGPT 为用户自己画一幅肖像图的。于是我也试了一下,便生成了这张图:

继续阅读

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第二题 用用看旧设备

一共试了 2 张。打字机这张可谓马马虎虎。虽说仔细看的话,打字机的那个金属字母的部分(就是实际敲打在纸上的那一个个小金属片)有点凌乱,看上去不像有完整字母的样子。

另一张……铅笔绕磁带,嗯,看来这一题对于现在的 AI 来说,还有点太早,难度太高……我试了大概 7 、 8 张,没有成功表现笔杆穿过磁带孔洞的。

以前有个耳熟能详的故事:《达芬奇画蛋》。说是大画家达芬奇在童年时刚开始学习绘画时,老师让他什么都不要问,先画一万个鸡蛋。他画啊画地,就这样水平见长,成为了了一代绘画大师。

我不确定达芬奇画蛋的故事是不是真有其事,但现在仔细想起来这种学习指导思想可谓相当原始。如果当真「读书千遍其义自现」的话,那是不是一切的教育理论、教育家和教育实践都白搭了?更何况,这种「先画一万个鸡蛋」的学习方法,其有一个前提条件,这个前提条件如果未被确实证明,那么这个学习方法也就是无稽之谈。这个前提条件就是:人脑确实适合于在这样在反复练习中,进行观测,从中增长经验,并反馈、体现在下一次练习中。可是,有谁证实了人脑是具有这样观察-反馈的机制吗?如果被证实的话,有没有定量的分析呢?

诸如此类种种悬而未决的事项,在我看来,人脑未必就是适合这样反复练习并能从中有效提高技能的。

然而,峰回路转,现在来到了机器学习的时代。人脑不行,但机器或许行啊,因为机器可以被设计成这样,而机器学习大概就是被这么设计的。

继续阅读

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第一题 绕不完的线


结论:相当出色!!!

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第五题 透过烧瓶看

尝试生成的第二张就挺好了!

要说第一张怎么样嘛……它长这样的:

继续阅读

这次分别对 ChatGPT、Claude 以及最近刚用上的 Cursor 程序(我忘了是哪个引擎( API )回答的了),提出如下指示:

请你帮我做一个动态网页,用CSS、JS等生成,不需要用到服务器。
这是一个用于冥想呼吸的网页,它的色调和动作要柔和、缓慢,帮助人们宁静。
画面充满整个网页浏览器,上面有许许多多的柔和的线条(或许是分形图形)会不断随着时间缓慢变化,表现流动、韵律。背景色底色也会不断缓慢且随机地变化。

ChatGPT 的回答是:

继续阅读

自从生称图片的AI问世之后,就看到一些视频制作者用AI图片作为抠图后的合成背景。虽然我自己不做视频,但是觉得这也挺有趣的。加之这一年来参观博物馆、读展览会图录较多,多多少少也了解了一些日本美术作品的流派和由来。于是这次就来试一下用ChatGPT创作一些适合用于视频背景的底图。

为什么要选用浮世绘风格的?因为看近世的浮世绘可以发现,那确实是一种既用来表现人物,也用来表现场景的作品种类。比如不少浮世绘画家就创作过以东海道,以及富士山为题材的风景作品。

那么这次我也来尝试一下。题材嘛,自然是要结合当下的AI啦。


继续阅读