AI绘图

OpenAI 终于把视频生成 AI —— Sora 开放给全体 Plus 用户了。
我试着生成了一下。

当时,我用的提示词是:「一名身穿日本平安时代贵族服装「十二単」的女子,背对着镜头在眺望天空。在她身边和周围,古代平安时代京都的春夏秋冬依次变化而过。仿佛一瞬间走过四季。」

其实我是把这段话先复制给 ChatGPT ,然后用它翻译的。

(其实是想到了 《 FGO 》 中清少纳言的宝具效果图。

然而……

别说到日本就脱呀平安时代不裸肩。

看起来 Sora 根本不理解什么是 「十二単」 。

可见,对于数据的标注还是非常重要,且目前对于数据的标注、准确记录和机器学习,还源源不足。一切古文字、古建筑结构、服装、发型、手势等……这些都等着人们来标注。

否则的话,就会像这样,我都指明了是「十二単」了,却还生成看起来像是江户时代的衣服。

更何况,我指定的四季呢?!

最近依然忙于每天抽空摆弄一些新的(?)二手电脑。

硬件算是凑齐了,接下来该弄软件配置和网络了。所以,如果按照我之前的用 AI 生成的画作来形容一下的话,或许是这一副:绕不完的线

好吧,实际物理的线路没那么夸张,但是内部的网络逻辑连线还是有点搞的,特别是涉及到我不熟悉的操作系统和系统设备关系。所以我也积极地利用生成式 AI 来进行计算机硬件及操作系统配置的咨询《简记一种新奇的装机体验withAI》

今天要说一个什么观察呢?这不最近 OpenAI 的 ChatGPT 的模型从 o1 的预览版,升级到了正式版了嘛。我就用它总结了近期有关计算机网络拓扑的讨论,并请它用内嵌在 HTML 内的 SVG 矢量图来为我画出一张网络的逻辑连接图。

很抱歉,因为涉及到我的各个设备的网络布局,所以不方便发出来公开展示,但总之第一次生成时,感觉效果不错,比预期的准确度与完成度要高。不过当第二次生成时,质量却又有点下降,感觉还是不太稳定。总之 o1 正式版感觉还是有明显进步的。是为记。

各位也可以试试看让 o1 或者其他生成式 AI ,用绘制 SVG 矢量图文件、代码的方式,来创作图片。

一眼得结论:

(激光鼠标)

这都 2024 年年底了,随着各路介绍(推销?) AI 的人,说 AGI 就快接近了: 10 年以内、 5 年以内、 3 年以内……乃至明年……

于是我倒要看看, 2024 年年底这个时间点 ,ChatGPT 能不能画出靠谱的设备原理图。想必,这些很标准的设备,在互联网上肯定有大量现成的、准确且标准的素材可以被用于学习。

继续阅读

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第三题:哎呀,扣子扣错了。

太难了!试了 10 张以上,都没能成功画出扣错扣子没对齐的样子!即便是让 Claude 生成英文的提示词,还是很难达到我想要的效果。

看来对于并非常态的图片数据训练还远远不足啊……

上一次用 ChatGPT 创造自画像类似,这几天看到 reddit 上一个帖子启发,说以类似的方式,让 ChatGPT 参考对我保存的记忆(即用户数据),而画一张我宿敌的肖像。

它给我画出的是:

并附说明:「Here is the image of your arch nemesis, embodying intellect and mystery, with an aura of knowledge and time manipulation. 」

翻译过来就是:「这是你的死敌的形象,体现了智慧和神秘,拥有知识和操纵时间的光环。」

呃……不太可爱。好吧,有点凶。

于是我又指示画了一张女性版本的我的宿敌:

继续阅读

前几个月, ChatGPT 增加了记忆功能,在对话中,能明确看到它自动记下了与我有关的信息(比如我的兴趣爱好、我最近买了什么、我最近遇到了什么事)。我自己也会有意识地去检查并适当删除记忆内容。其操作方法是:网页版【设置】——【个性化】——【记忆】下的【管理】按钮。此外,之后的对话中,我有时也会提示 ChatGPT 不要对我提到的某个内容进行记忆。

当然渐渐地, ChatGPT 对我的记忆就增多了,也就是说,它逐渐开始了解我这个人了。刚好前几天在 Reddit 的 r/ChatGPT 板块看到一个帖子,是发帖者提议用户们让自己的 ChatGPT 为用户自己画一幅肖像图的。于是我也试了一下,便生成了这张图:

继续阅读

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第二题 用用看旧设备

一共试了 2 张。打字机这张可谓马马虎虎。虽说仔细看的话,打字机的那个金属字母的部分(就是实际敲打在纸上的那一个个小金属片)有点凌乱,看上去不像有完整字母的样子。

另一张……铅笔绕磁带,嗯,看来这一题对于现在的 AI 来说,还有点太早,难度太高……我试了大概 7 、 8 张,没有成功表现笔杆穿过磁带孔洞的。

以前有个耳熟能详的故事:《达芬奇画蛋》。说是大画家达芬奇在童年时刚开始学习绘画时,老师让他什么都不要问,先画一万个鸡蛋。他画啊画地,就这样水平见长,成为了了一代绘画大师。

我不确定达芬奇画蛋的故事是不是真有其事,但现在仔细想起来这种学习指导思想可谓相当原始。如果当真「读书千遍其义自现」的话,那是不是一切的教育理论、教育家和教育实践都白搭了?更何况,这种「先画一万个鸡蛋」的学习方法,其有一个前提条件,这个前提条件如果未被确实证明,那么这个学习方法也就是无稽之谈。这个前提条件就是:人脑确实适合于在这样在反复练习中,进行观测,从中增长经验,并反馈、体现在下一次练习中。可是,有谁证实了人脑是具有这样观察-反馈的机制吗?如果被证实的话,有没有定量的分析呢?

诸如此类种种悬而未决的事项,在我看来,人脑未必就是适合这样反复练习并能从中有效提高技能的。

然而,峰回路转,现在来到了机器学习的时代。人脑不行,但机器或许行啊,因为机器可以被设计成这样,而机器学习大概就是被这么设计的。

继续阅读

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第一题 绕不完的线


结论:相当出色!!!

去年上半年 AI 作画(主要是 Stable Diffusion Webui )刚刚走入大众视野,同时也是刚引发我的兴趣时,我独自发起过一个《百度贴吧NovelAI吧txt2img七题挑战赛》但基本上没有收到什么回答。

于是,现在我就来自问自答一下,看看现在用 ChatGPT 能做到什么程度,以及需要反复试几才能出现一张比较像样的作品。

这次自问自答的是:第五题 透过烧瓶看

尝试生成的第二张就挺好了!

要说第一张怎么样嘛……它长这样的:

继续阅读