高级语音模式

All posts tagged 高级语音模式

2024 年 9 月 24 日(日本时间 25 日了),万众期待的 ChatGPT 高级语音模式终于向全体 Plus 订阅用户(部分地区除外)开放了!

然而,好巧不巧,今天是我预约了要接受拔尽根牙(智齿)手术的日子…………读到这里,应该明白我为什么不能用感情说话了吧?说了话拔掉的牙齿部位就疼啊!

如图(图片也是用 ChatGPT 生成的)。为什么是吸血鬼?因为我今天喝了好多人类(自己)的血啊。以至于打嗝(液体食物(果汁)喝多了……)出来都有血腥味,这是多少血液流入了我的胃袋啊。(不好闻也不好喝,我一定没有转生成为吸血鬼的天赋!)

说回 ChatGPT 。其实出门就诊前还是和高级语音功能聊了几句的。貌似还是不能用上海方言聊天。

另外,随便今天我也不便开口多说话,不过我拿 ChatGPT 的高级语音模式做了有趣新的尝试——我让它帮我念小说呀!对,虽然目前高级语音模式不支持文本输入。具体来说:

继续阅读

人类 wildgun 写的前言

这篇博客是我尝试这样一种创作方式:我与 ChatGPT 进行语音聊天,交流想法,然后我先想出若干个点子,再请 ChatGPT 想出另外其他一些点子,最后,语音让 ChatGPT 帮我组织成一篇博客文章的形式(这一段「前言」以及「后记」部分不算)。起因是最近 2024 年 7 月底, OpenAI 总算开始陆陆续续向 Plus 订阅用户中的一小部分开放之前 5 月份的发布会中演示的那个带有丰富情感变化的高级语音模式嘛,我记得在演示中,还展示了 ChatGPT 对于摄像头视频能力以及共享屏幕中的视频的理解和分析。于是我就此「 ChatGPT 可以接受视频了,接下来能做些什么?」为开端,思考并与 ChatGPT 语音(普通语音,我还没收到高级语音模式的使用邀请)进行了聊天。请大家猜猜看,以下几个应用场景,哪几个是我提出的,哪几个是 ChatGPT 提出的,在本文的最后「人类 wildgun 写的后记」部分将揭晓答案。

正文

随着技术的不断进步,人工智能( AI )在语音处理和视频分析领域取得了显著的突破。特别是即将推出的高级语音模式和实时视频处理功能,让人们对其应用场景充满了无限的想象和期待。在这篇文章中,我们将探讨几个有趣且实用的应用场景,让您了解这种技术的巨大潜力。

一、跨平台协作助手

利用视频采集卡将其他设备(如 Windows 、 Linux 、 Mac 等)的画面输入到 iPad 上,并通过 ChatGPT 的高级语音模式进行分析。这样, ChatGPT 可以实时查看和分析来自其他设备的画面,帮助用户解决技术问题、提供游戏攻略,甚至进行实时互动指导。这种跨平台协作不仅提升了工作效率,还扩展了 AI 助手的应用范围。

继续阅读