AI

All posts tagged AI

人类wildgun写的前言:与之前的一篇类似,这一篇博客也是由我与 ChatGPT 进行语音交流(目前我还不是高级语音模式),然后指示它将对话内容整理为博客文章的。我想到了一旦 ChatGPT 开启了 OpenAI 在5月份演示的视频模式,或许就可以将其他电脑的视频输出接入到 iPadOS 中来,然后通过视频共享的方式,来让 ChatGPT 「看到」,并对视频做出反应。比如游戏攻略指导、操作系统使用帮助等等。当然,以下仅仅是我基于目前的想象来请 ChatGPT 写一篇技术指南文章。具体能不能这样操作,让 ChatGPT 「看到」,当然要等视频功能实装了以后,测试了才知道。下面是 ChatGPT 整理的内容,我这次要求它写的是一篇技术指导型的文章

实现跨平台视频输入与高级语音模式结合的技术指导

随着AI技术的发展,ChatGPT的高级语音模式和实时视频处理功能将带来全新的交互体验。本文将详细介绍如何利用现有设备和软件,将没有ChatGPT客户端的设备(如Windows、Linux电脑或游戏机)的视频输出,通过采集卡传输到iPadOS上,并利用即将推出的视频分析功能进行处理。

设备与硬件需求

  1. 视频输出设备
    • Windows或Linux电脑
    • 游戏机(如PlayStation或Nintendo Switch)
    • 任何具备视频输出功能的设备
  2. 视频采集卡
    • Elgato HD60 S+
    • AVerMedia Live Gamer Portable 2 Plus
    • 其他兼容USB-C的采集卡
  3. iPad
    • 运行iPadOS 17或更新版本的iPad
    • 建议使用iPad Pro以获得最佳性能
  4. 连接线
    • HDMI线:用于连接视频输出设备和采集卡
    • USB-C线:用于连接采集卡和iPad

继续阅读


(该图片由ChatGPT生成,印象图。)

前言

今天( 2024 年 8 月 4 日),在京都大学有一场京都大学現代史研究会所召开的年度大会(第29次)。我跑去听了一下上午的学术发表会,由李宗軒先生(博士生在读)发表,报告的题目是《テレビアニメ『新世紀エヴァンゲリオン』の中国受容から見る海賊版とアニメファンの関係》——我擅自翻译一下,可译作:《从电视动画《新世纪福音战士 EVANGELION 》的中国普及展开,看出盗版与动画粉丝之间的关系》。

这场报告会就是今年 5 月我在自己博客写下感想《读京都大学有关中国早期EVA传播硕士毕业论文,来自被研究群体中个体的一点点回音和回忆》中的那篇研究生论文作者,今天他在京都大学所发表的演讲。今天的演讲基于该研究生毕业论文,不过现场内容侧重于该论文前半,即有关 VCD 、电视播放、杂志、 DVD 等媒介传播对 EVA 在中国大陆认知度的扩散所作出的影响,而较少展开谈及论文后半,即通过不同媒介接触到 EVA 的各人群对电视改编《天鹰战士》提出的或负面或正面评价的温差。

需要说明的是,该主题的发表会只是这次年度大会的一个环节,而除了上午的这一场演讲外,下午还有 3 场由别的研究者所做的学术报告演讲。

现场情况

说一下现场环境吧。举行地点正如通知所写,是在京都大学総合研究2号館第8講義室,位于地下室。我坐在较前排,因此未能把握来场听众的人数,印象里大约是 20~30 人,且其中也不都是 20 岁的听众,大约有 1/4 是中年以上的听众。

对于参加者身份,我并不清楚。因为本次报告会算是对公众开放的,但也并没有对社会大规模宣传,因此我估计听众中多数是关西地区的学界人士。至于我?我是……擅自来的。对,我事先甚至都没有知会一下李先生(笑)。所以我进场的时候就是:

[壁]ω・`)入ッテモィィ?

「我不是京都大学的人,可以来听吗?」——就是如此。

会议的流程大约是这样的(我不认识现场的每一位,以下是根据会议通知中的名单整理):
继续阅读

人类 wildgun 写的前言

这篇博客是我尝试这样一种创作方式:我与 ChatGPT 进行语音聊天,交流想法,然后我先想出若干个点子,再请 ChatGPT 想出另外其他一些点子,最后,语音让 ChatGPT 帮我组织成一篇博客文章的形式(这一段「前言」以及「后记」部分不算)。起因是最近 2024 年 7 月底, OpenAI 总算开始陆陆续续向 Plus 订阅用户中的一小部分开放之前 5 月份的发布会中演示的那个带有丰富情感变化的高级语音模式嘛,我记得在演示中,还展示了 ChatGPT 对于摄像头视频能力以及共享屏幕中的视频的理解和分析。于是我就此「 ChatGPT 可以接受视频了,接下来能做些什么?」为开端,思考并与 ChatGPT 语音(普通语音,我还没收到高级语音模式的使用邀请)进行了聊天。请大家猜猜看,以下几个应用场景,哪几个是我提出的,哪几个是 ChatGPT 提出的,在本文的最后「人类 wildgun 写的后记」部分将揭晓答案。

正文

随着技术的不断进步,人工智能( AI )在语音处理和视频分析领域取得了显著的突破。特别是即将推出的高级语音模式和实时视频处理功能,让人们对其应用场景充满了无限的想象和期待。在这篇文章中,我们将探讨几个有趣且实用的应用场景,让您了解这种技术的巨大潜力。

一、跨平台协作助手

利用视频采集卡将其他设备(如 Windows 、 Linux 、 Mac 等)的画面输入到 iPad 上,并通过 ChatGPT 的高级语音模式进行分析。这样, ChatGPT 可以实时查看和分析来自其他设备的画面,帮助用户解决技术问题、提供游戏攻略,甚至进行实时互动指导。这种跨平台协作不仅提升了工作效率,还扩展了 AI 助手的应用范围。

继续阅读

在iPad上开始试用苹果AI(AppleIntelligence)

终于用上苹果 AI ( Apple Intelligence )了,不过目前功能还很简单,而且为了用上它,所需满足的使用条件颇多。本文就算是一篇简单的实践指南,来记录一下我是怎么一步一步打开 iPad Pro 上 Apple Intelligence ( Siri )的功能的。

第 1 步:确认自己所持机型是否支持

首先,请阅读《AppleIntelligence AI for the rest of us.》这篇文章,确保自己的机型是否在所支持的机种列表中。

我目前看到文中提及的机种列表有:

「iPhone 15 Pro Max:A17 Pro
iPhone 15 Pro:A17 Pro
iPad Pro:M1 and later
iPad Air:M1 and later
MacBook Air:M1 and later
MacBook Pro:M1 and later
iMac:M1 and later
Mac mini:M1 and later
Mac Studio:M1 Max and later
Mac Pro:M2 Ultra」

我自己是 M1 芯片的 iPad Pro ,因此是可以使用的。

第 2 步:加入 Beta 更新通道,并更新软件

请查看《Apple Beta 版软件计划》这篇文章,了解如何申请成为 Beta 测试计划的一员。需要注意的是, Beta 测试毕竟只是一个不稳定的测试版,因此可能会导致 iPad 中的程序无法使用等问题。请务必审慎将测试版用于生产环境。
继续阅读

自从生称图片的AI问世之后,就看到一些视频制作者用AI图片作为抠图后的合成背景。虽然我自己不做视频,但是觉得这也挺有趣的。加之这一年来参观博物馆、读展览会图录较多,多多少少也了解了一些日本美术作品的流派和由来。于是这次就来试一下用ChatGPT创作一些适合用于视频背景的底图。

为什么要选用浮世绘风格的?因为看近世的浮世绘可以发现,那确实是一种既用来表现人物,也用来表现场景的作品种类。比如不少浮世绘画家就创作过以东海道,以及富士山为题材的风景作品。

那么这次我也来尝试一下。题材嘛,自然是要结合当下的AI啦。


继续阅读

凌晨熬夜看完了2024年于法国巴黎举办的夏季奥林匹克运动会的开幕式。简单记一下我自己的一些零散的想法。

首先,虽说我自己过去没有刻意去了解过法国的文化,但整场开幕式里,还是有几首我耳熟、叫得上名字的歌或旋律。例如康康舞的配乐、《Do You Hear The People Sing》以及《卡门》。说起来,我回想起了小学时,音乐课上,老师带领大家去学校顶楼天台排练集体舞,用的音乐就是《卡门》序曲。我自己也没意识到这么早,我就接触到法国文化的作品了。

另外我还很在意的事,那个骑着马的骑士到底是谁!是圣女贞德吧!在奥林匹克的X社交媒体账号所发布的消息中,也已经提到这是一位女骑士(horsewoman)了。下面就该等5星奥利匹克版贞德落地《FGO》了闭幕式来揭晓了吧?不过有一张照片,大概是她骑着马跑到终点的时候,旁边有一座金色的骑马雕像,那个好像是贞德的像。

至于说这一次开幕式好像是首次在户外举办的奥运会开幕式。我猜测可能有以下2个原因:一是规划筹办时未必能预想到新冠病毒的大流行是否平息还是有一次扩大传播,所以还是在户外办会比较让人放心。二是,我觉得相比于独立一栋建筑,没有河道地形来得那么长久。也就是说,一两百年后,新建的场馆可能会被拆除,但是几百年后,我相信塞纳河依然犹在。届时,在今后许久许久之后,人们看到塞纳河,便能够大致想象出2024年的这场巴黎奥运会开幕式,将开幕于城市的地理环境相结合,能够为城市留下更深远的记忆。
继续阅读

之前那篇我读《天駆せよ法勝寺》的读后感中,我提到,或许在2024年的现在,使用生成式AI也能帮助人们创作佛教科幻作品了。当然,需要再三说明的是,我绝非在怀疑该作品的作者是用了AI,因为他这篇小说投稿参赛的年代,生成式AI应该还没那么成熟。

不过现在(2024年中),情况就不一样了。现在的生成式AI到底能在多大程度上帮助人们创作出这样的佛教科幻作品呢?于是本文我就来做个实验。

我一共设计了4个问题。其中第1个问题是要求AI构想佛教科幻的故事大纲。后3个问题则是要求其写出故事片段。这4个问题(作为给AI的提示词)分别是:

问题1:

我想创作一篇以佛教教理为题材的科幻小说。这里的佛教不局限于某一个特定时代,而是包括佛教的各个时代、各个宗派。在本作中,我希望能以佛教元素来代替通常科幻小说中的科幻名词、概念,以佛教教理来呈现一种佛理科技。请尝试在其中加入大量各种佛教概念名词,让内容读起来又有趣又精彩。

请为我编写一部中篇佛教科幻小说的提纲。其中包括以下几个情节:阐明佛教科幻世界观、佛动力星际穿梭飞行、不同阵营的神佛对战。

问题2:

请为我创作一段佛教教理为题材的科幻小说片段,用来详细说明佛理高科技的现实与未来展望。不需要一个有头有尾有转折的完整的故事,只需要一个叙事详细、深入的故事片段。

问题3:

请为我创作一段佛教教理为题材的科幻小说片段,用来描写不同阵营的神佛之间搏击的科幻场景。不需要一个有头有尾有转折的完整的故事,只需要一个叙事详细、深入的故事片段。

问题4:

请为我创作一段佛教教理为题材的科幻小说片段。
在有关释伽牟尼的成道故事中,有提到他(当时是名为悉达多·乔达摩的离开家庭的王子)在开悟之前在菩提树下静坐,魔王波甸派出自己的三个女儿(分别是:爱欲、爱念、爱乐)用美色去诱惑他,但他经受住了诱惑。
我想以此佛教故事为基础,但将该故事的情节放在一个超现实佛教科幻的背景下来讲述这个故事,请为我进行创作和重构该故事。
请尝试在其中加入大量各种佛教概念名词,让内容读起来又有趣又精彩。不需要一个有头有尾有转折的完整的故事,只需要一个叙事详细、深入的故事片段。

我分别将这4个问题提交给 ChatGPT 4o (付费)以及Claude 3.5 Sonnet(免费)来回答。

继续阅读

这一年以来,经常听说Claude在文学创作方面比ChatGPT更富有情感表现。而最近又听说Claude对于代码生成的能力也很强大。于是我便试了试。

先试了一下很基本的《黑客帝国》字母雨效果。我提出要求是:「编写一个HTML代码,来显示类似黑客帝国那样随机字符的绿色代码雨。」

Claude返回给我的代码是:

继续阅读

最近对ChatGPT(4o)指定两种画风,看它能否稳定发挥生成一种独特的画风。本文中试的语句是:「请混合梵高的绘画风格,以及亚洲的水墨画风格,画一张」后面跟上要画的内容。

感觉发挥还是比较稳定的(?)或者说出面看起来挺有艺术感。只不过好像在ChatGPT的绘图表现中,梵高几乎被等同于他的《星月夜》了。

继续阅读