AI

All posts tagged AI

前言

最近在脑袋里咕噜咕噜转的一个问题是:以 ChatGPT 为代表的生成式 AI 到底在多大程度上、怎样的方式上能帮助人们学习计算机程序设计、数据库等知识。想多了那就不如自己动手试试。

在当年还是 Microsoft VB 6.0 年代,我自己曾经做过一些 Microsoft Access 数据库的开发,以及用到数据库的基于 ASP.NET 的动态网页开发,不过都是很浅显的项目。而当年所学的关系型数据库的原理那门课,基本上在每次下课铃声响起时,那些非常理论化的概念——什么约束原则啦,规范啦,原子性啦——都还给了老师。而自从我使用 MacOS 以及 Linux 操作系统以来,一直把它们当作文书办公电脑的环境而非开发环境在用。所以自然也就知道但印象里自己没用过以终端命令行来操作 SQLite 数据库。今天,我就花了大概一个小时,让 ChatGPT 来教我如何在 MacOS 上入门使用 SQLite 。

在下面的这一部分,我会简略地介绍我的这一学习过程,而在本文最后一部分,我将从自己今天这次简短的学习过程,探讨一下借助 AI 的学习指导的形式转换。

教学过程概况再现

在尝试之前,我担心安装或操作 SQLite 会不会影响我 MacOS 的系统环境变量。毕竟是我现在的主用电脑,我可不想因为装了什么环境而导致把整个系统弄乱。

对此,ChatGPT 答:

继续阅读

在扭蛋机转了个三阶魔方。当然不是给我自己玩(我记得自己玩魔方那还是幼儿园时候吧……),而是想用来给 ChatGPT 等 AI 做实验,看 AI 能不能帮助人类解魔方。

目前( 2024 年 8 月)我既没有等来 ChatGPT 的高级语音模式,也就更没有 5 月份 OpenAI 所展示的视频视觉功能了。只有上传图片→ AI 识别并分析图片的基础能力。

到底能不能解魔方呢?

于是上手,实录如下:

wildgun 问:


怎么解?

继续阅读

嗯……起了个很「科技时髦」的标题。其实是近期颈椎病(?)的症状似乎有点变得明显起来(果然还是看书的问题?),于是去买了一台低频脉冲治疗仪(在日本被称为「低周波」)。

其实多年之前使用过一次,这种低频脉冲治疗仪,有两片贴膜,贴在肩膀上,贴膜会发射出微弱的电流,刺激肌肉,让肌肉产生抖动或者跳动。于是昨天我用了之后,把贴膜粘在肩膀上打开机器启动治疗疗程后,双肩居然就轻轻抬高、晃动起来了。感觉就像是真的被人在按摩一样——啊,当然也有缺点,就是这样当我在读书划线的时候,线条也会因手臂抖动而歪曲。

这时我就想到了 ChatGPT 的语音聊天功能。虽然我买的这个低周波治疗仪没有 AI 功能,就是很传统的那种,一点都不智能。但如果在使用它治疗的时候,耳朵里能传来语音聊天,那是不是一件很有趣的事呢?于是我打开 ChatGPT 的语音模式(嗯,我还没受邀使用高级语音模式),提出指示:

wildgun 说:

我今天买了一台那个低周波治疗仪 如果说中文的话应该是叫低频那种治疗仪 治疗我的那个肩颈部的酸疼 那我现在正在使用把那个低周波治疗仪的贴片贴在我的肩膀后 然后正在治疗 我感觉好像有点像真人在给我按摩 所以我想请你从现在开始 扮演一个真人按摩治疗师来与我对话 我知道虽然你目前还不能说实际去控制这个按摩仪 或者说低周波治疗仪 但你可以尝试通过扮演 让我想象一下是一个真人在给我按摩

ChatGPT 说:

好的,让我们开始吧。现在我会想象我是一个专业的按摩治疗师。请你闭上眼睛,放松身体,深呼吸。感觉我的双手轻轻地按在你的肩膀上,从肩颈部位开始,慢慢地加压。随着每一次按压,你会感到肩膀的肌肉逐渐放松,酸痛感也在一点一点消退。感觉如何?

继续阅读

今天看到日本新闻报道,说岸田文雄表达了自己将不会出马下一次日本自由民主党总裁选举的新闻。不过本篇博客不是一篇政治话题的内容,而是介绍一下我就此事与 ChatGPT 闲聊过程中,发现它推理(思考)中的一个不足之处,或者说不那么像人类的地方。

我所说的闲聊,是指使用语音功能与 ChatGPT 进行对话。不过我还没受邀使用高级语音功能,因此该对话只是基于 ChatGPT-4o 模型。

因为不是打字,而是谈话,因此我的发言会显得比较凌乱。下面是节选的对话内容:
(前略)

wildgun :那麼他支持率一直是不高 這個也是事實 那我想問你的是 那據你所知 或者在你的訓練的預料數據庫裡 如果岸田不參選自民黨總裁 也就是意味著他沒法擔任下一屆總理的話 那你覺得誰 日本的政壇誰 就是說自民黨內誰比較可能成為下一任自民黨總裁 也就是說間接的說是將成為下一任日本總理大臣

ChatGPT :
如果岸田文雄决定不参加自民党总裁选举,那么自民党内部可能会出现几位有潜力的候选人来接替他的位置。以下是一些在自民党内具有较高知名度和影响力的人物,他们可能会成为下一任总裁的热门人选:

首先是**河野太郎**,他曾经担任过外务大臣和防卫大臣,并且在党内和公众中都有相当的知名度和支持。他的直率风格和对改革的承诺使他成为党内改革派的重要代表人物。

其次是**茂木敏充**,现任自民党干事长,曾任外务大臣和经济再生大臣。他在党内具有深厚的根基和广泛的支持,同时在外交和经济政策上也有丰富的经验。

另一位值得注意的是**岸信夫**,虽然他在健康状况方面曾有一些问题,但作为前防卫大臣和现任首相安倍晋三的弟弟,他在党内的影响力和支持也是不容忽视的。

当然,政治局势总是变化莫测,其他有潜力的候选人也可能在竞选过程中崭露头角。最终的结果将取决于自民党内部的权力平衡以及公众对候选人的支持度。

你对这些潜在候选人有特别的看法或关注吗?

wildgun :

请你不要讲鬼故事好不好 你说的岸信夫好像是安倍晋三的弟弟还是什么的 但是你说现任首相安倍晋三 你是不是搞错了 你不要说鬼故事

ChatGPT :

抱歉,确实是我说错了。安倍晋三已经不再担任首相,他在2020年因健康问题辞职,后来由菅义伟接任,再后来是岸田文雄担任首相。我刚才不小心混淆了时间线,再次为这个错误向你道歉。

至于潜在的下一任自民党总裁候选人,我前面提到的河野太郎和茂木敏充仍然是非常有可能的竞争者。如果你有其他具体的候选人感兴趣,我也可以进一步讨论他们的背景和优势。

wildgun :

诶,我刚才说你说错的时候,我说你说的是鬼故事,你没有理解这一点吗?

继续阅读

人类wildgun写的前言:与之前的一篇类似,这一篇博客也是由我与 ChatGPT 进行语音交流(目前我还不是高级语音模式),然后指示它将对话内容整理为博客文章的。我想到了一旦 ChatGPT 开启了 OpenAI 在5月份演示的视频模式,或许就可以将其他电脑的视频输出接入到 iPadOS 中来,然后通过视频共享的方式,来让 ChatGPT 「看到」,并对视频做出反应。比如游戏攻略指导、操作系统使用帮助等等。当然,以下仅仅是我基于目前的想象来请 ChatGPT 写一篇技术指南文章。具体能不能这样操作,让 ChatGPT 「看到」,当然要等视频功能实装了以后,测试了才知道。下面是 ChatGPT 整理的内容,我这次要求它写的是一篇技术指导型的文章

实现跨平台视频输入与高级语音模式结合的技术指导

随着AI技术的发展,ChatGPT的高级语音模式和实时视频处理功能将带来全新的交互体验。本文将详细介绍如何利用现有设备和软件,将没有ChatGPT客户端的设备(如Windows、Linux电脑或游戏机)的视频输出,通过采集卡传输到iPadOS上,并利用即将推出的视频分析功能进行处理。

设备与硬件需求

  1. 视频输出设备
    • Windows或Linux电脑
    • 游戏机(如PlayStation或Nintendo Switch)
    • 任何具备视频输出功能的设备
  2. 视频采集卡
    • Elgato HD60 S+
    • AVerMedia Live Gamer Portable 2 Plus
    • 其他兼容USB-C的采集卡
  3. iPad
    • 运行iPadOS 17或更新版本的iPad
    • 建议使用iPad Pro以获得最佳性能
  4. 连接线
    • HDMI线:用于连接视频输出设备和采集卡
    • USB-C线:用于连接采集卡和iPad

继续阅读


(该图片由ChatGPT生成,印象图。)

前言

今天( 2024 年 8 月 4 日),在京都大学有一场京都大学現代史研究会所召开的年度大会(第29次)。我跑去听了一下上午的学术发表会,由李宗軒先生(博士生在读)发表,报告的题目是《テレビアニメ『新世紀エヴァンゲリオン』の中国受容から見る海賊版とアニメファンの関係》——我擅自翻译一下,可译作:《从电视动画《新世纪福音战士 EVANGELION 》的中国普及展开,看出盗版与动画粉丝之间的关系》。

这场报告会就是今年 5 月我在自己博客写下感想《读京都大学有关中国早期EVA传播硕士毕业论文,来自被研究群体中个体的一点点回音和回忆》中的那篇研究生论文作者,今天他在京都大学所发表的演讲。今天的演讲基于该研究生毕业论文,不过现场内容侧重于该论文前半,即有关 VCD 、电视播放、杂志、 DVD 等媒介传播对 EVA 在中国大陆认知度的扩散所作出的影响,而较少展开谈及论文后半,即通过不同媒介接触到 EVA 的各人群对电视改编《天鹰战士》提出的或负面或正面评价的温差。

需要说明的是,该主题的发表会只是这次年度大会的一个环节,而除了上午的这一场演讲外,下午还有 3 场由别的研究者所做的学术报告演讲。

现场情况

说一下现场环境吧。举行地点正如通知所写,是在京都大学総合研究2号館第8講義室,位于地下室。我坐在较前排,因此未能把握来场听众的人数,印象里大约是 20~30 人,且其中也不都是 20 岁的听众,大约有 1/4 是中年以上的听众。

对于参加者身份,我并不清楚。因为本次报告会算是对公众开放的,但也并没有对社会大规模宣传,因此我估计听众中多数是关西地区的学界人士。至于我?我是……擅自来的。对,我事先甚至都没有知会一下李先生(笑)。所以我进场的时候就是:

[壁]ω・`)入ッテモィィ?

「我不是京都大学的人,可以来听吗?」——就是如此。

会议的流程大约是这样的(我不认识现场的每一位,以下是根据会议通知中的名单整理):
继续阅读

人类 wildgun 写的前言

这篇博客是我尝试这样一种创作方式:我与 ChatGPT 进行语音聊天,交流想法,然后我先想出若干个点子,再请 ChatGPT 想出另外其他一些点子,最后,语音让 ChatGPT 帮我组织成一篇博客文章的形式(这一段「前言」以及「后记」部分不算)。起因是最近 2024 年 7 月底, OpenAI 总算开始陆陆续续向 Plus 订阅用户中的一小部分开放之前 5 月份的发布会中演示的那个带有丰富情感变化的高级语音模式嘛,我记得在演示中,还展示了 ChatGPT 对于摄像头视频能力以及共享屏幕中的视频的理解和分析。于是我就此「 ChatGPT 可以接受视频了,接下来能做些什么?」为开端,思考并与 ChatGPT 语音(普通语音,我还没收到高级语音模式的使用邀请)进行了聊天。请大家猜猜看,以下几个应用场景,哪几个是我提出的,哪几个是 ChatGPT 提出的,在本文的最后「人类 wildgun 写的后记」部分将揭晓答案。

正文

随着技术的不断进步,人工智能( AI )在语音处理和视频分析领域取得了显著的突破。特别是即将推出的高级语音模式和实时视频处理功能,让人们对其应用场景充满了无限的想象和期待。在这篇文章中,我们将探讨几个有趣且实用的应用场景,让您了解这种技术的巨大潜力。

一、跨平台协作助手

利用视频采集卡将其他设备(如 Windows 、 Linux 、 Mac 等)的画面输入到 iPad 上,并通过 ChatGPT 的高级语音模式进行分析。这样, ChatGPT 可以实时查看和分析来自其他设备的画面,帮助用户解决技术问题、提供游戏攻略,甚至进行实时互动指导。这种跨平台协作不仅提升了工作效率,还扩展了 AI 助手的应用范围。

继续阅读

在iPad上开始试用苹果AI(AppleIntelligence)

终于用上苹果 AI ( Apple Intelligence )了,不过目前功能还很简单,而且为了用上它,所需满足的使用条件颇多。本文就算是一篇简单的实践指南,来记录一下我是怎么一步一步打开 iPad Pro 上 Apple Intelligence ( Siri )的功能的。

第 1 步:确认自己所持机型是否支持

首先,请阅读《AppleIntelligence AI for the rest of us.》这篇文章,确保自己的机型是否在所支持的机种列表中。

我目前看到文中提及的机种列表有:

「iPhone 15 Pro Max:A17 Pro
iPhone 15 Pro:A17 Pro
iPad Pro:M1 and later
iPad Air:M1 and later
MacBook Air:M1 and later
MacBook Pro:M1 and later
iMac:M1 and later
Mac mini:M1 and later
Mac Studio:M1 Max and later
Mac Pro:M2 Ultra」

我自己是 M1 芯片的 iPad Pro ,因此是可以使用的。

第 2 步:加入 Beta 更新通道,并更新软件

请查看《Apple Beta 版软件计划》这篇文章,了解如何申请成为 Beta 测试计划的一员。需要注意的是, Beta 测试毕竟只是一个不稳定的测试版,因此可能会导致 iPad 中的程序无法使用等问题。请务必审慎将测试版用于生产环境。
继续阅读

自从生称图片的AI问世之后,就看到一些视频制作者用AI图片作为抠图后的合成背景。虽然我自己不做视频,但是觉得这也挺有趣的。加之这一年来参观博物馆、读展览会图录较多,多多少少也了解了一些日本美术作品的流派和由来。于是这次就来试一下用ChatGPT创作一些适合用于视频背景的底图。

为什么要选用浮世绘风格的?因为看近世的浮世绘可以发现,那确实是一种既用来表现人物,也用来表现场景的作品种类。比如不少浮世绘画家就创作过以东海道,以及富士山为题材的风景作品。

那么这次我也来尝试一下。题材嘛,自然是要结合当下的AI啦。


继续阅读

凌晨熬夜看完了2024年于法国巴黎举办的夏季奥林匹克运动会的开幕式。简单记一下我自己的一些零散的想法。

首先,虽说我自己过去没有刻意去了解过法国的文化,但整场开幕式里,还是有几首我耳熟、叫得上名字的歌或旋律。例如康康舞的配乐、《Do You Hear The People Sing》以及《卡门》。说起来,我回想起了小学时,音乐课上,老师带领大家去学校顶楼天台排练集体舞,用的音乐就是《卡门》序曲。我自己也没意识到这么早,我就接触到法国文化的作品了。

另外我还很在意的事,那个骑着马的骑士到底是谁!是圣女贞德吧!在奥林匹克的X社交媒体账号所发布的消息中,也已经提到这是一位女骑士(horsewoman)了。下面就该等5星奥利匹克版贞德落地《FGO》了闭幕式来揭晓了吧?不过有一张照片,大概是她骑着马跑到终点的时候,旁边有一座金色的骑马雕像,那个好像是贞德的像。

至于说这一次开幕式好像是首次在户外举办的奥运会开幕式。我猜测可能有以下2个原因:一是规划筹办时未必能预想到新冠病毒的大流行是否平息还是有一次扩大传播,所以还是在户外办会比较让人放心。二是,我觉得相比于独立一栋建筑,没有河道地形来得那么长久。也就是说,一两百年后,新建的场馆可能会被拆除,但是几百年后,我相信塞纳河依然犹在。届时,在今后许久许久之后,人们看到塞纳河,便能够大致想象出2024年的这场巴黎奥运会开幕式,将开幕于城市的地理环境相结合,能够为城市留下更深远的记忆。
继续阅读