OCR

All posts tagged OCR

最近几天,一个关于 ChatGPT 的不大不小的更新是: o3-mini 模型和它的 high 版本支持上传图片等文件了。那么,在推理功能的辅助下,或者说引导、修正下,它的 OCR 是否能更加准确了一些了呢?

我选用了昨天博客里下面这段文字的截图来做试验,截图后上传至 ChatGPT o3-mini ,并要求它 OCR 识别。之所以选择这一段,是因为其中既有汉字也有英文还有日文,而且互相之间也有逻辑关联。

在这三种语言里,都有一个同源的词汇称呼,汉语里叫它功能机,英语里说 Feature phone ,日语里则是把该英语转换为了片假名:フィーチャーフォン。我觉得这种手机虽然有些言不达意(功能,什么功能?)但从「手机就完成蜂窝网络的通话功能就可以了」这一点上来看,倒是蛮符合我的心意的。

结果我得到的识别结果是:

继续阅读

大约 2 年前起,某次 MacOS 大版本更新后,好像是实装了文字识别 OCR 功能,但是对于汉字、日文,特别是竖排的文章,在「预览」里直接选中图片中的文字并拷贝后,总会变成每个字符之间出现空格间隔的情况。

于是我使用 MacOS 的脚本编辑器,在 ChatGPT 的协助下,创建了一项「服务」并登记到系统的右键菜单。这样一来,就可以一下子把选中的文本里的所有空格都去掉了。

第一步是选择
「工作流程收到当前」选择「文本」
「位于」选择「任何应用程序」

第二步是拖拽一个「运行 AppleScript」操作到第一步的下方其中代码是:
继续阅读