试了下 ChatGPT 的图像理解,比预期好,效果还是很赞的。
现在能想到的一些用途包括:
其他还要啥好的使用场景吗?
1
whatv3 2023-10-09 09:54:19 +08:00
验证码...
|
2
jimrok 2023-10-09 10:02:27 +08:00
去除水印
|
6
zealotxxxx 2023-10-09 13:11:42 +08:00 3
你直接看微软发的那个论文,基本说的很全了。
[2309.17421.pdf]( https://browse.arxiv.org/pdf/2309.17421.pdf) |
7
maxxfire 2023-10-09 13:38:03 +08:00
大家来找茬游戏,可以玩通关了
|
8
JayZXu 2023-10-09 14:15:00 +08:00
如果速度能提升的话,对视障人士还是挺有用的
|
9
jimrok 2023-10-09 14:16:48 +08:00
修改设计图可能行,把老王 p 掉,把老王 p 好看点
|
10
xuelang OP @zealotxxxx 感谢,我瞅下
|
11
tuutoo 2023-10-09 15:22:09 +08:00
有人能使用这个图像识别功能了没?上次看了介绍,但啥时候有这功能啊。
|
12
iorilu 2023-10-09 15:36:23 +08:00
这么说打码问题可以解决了?
|
18
qiany 2023-10-09 22:54:20 +08:00
检测员工摸鱼时长
|
19
youthfire 2023-10-10 10:06:56 +08:00
其实应用场景可以有很多,但是限制权在别人手里。比如说,interpretor (Advanced Data Analyze),出来的时候可以进行复杂的表格结构分析,然后完成 ocr ,最后排版。当时我经常用在业务上。但是现在只剩“告诉你逻辑/思路”,连 ocr 都不能顺利完成,不是告诉你环境缺失相关组件,就是一顿分析后质量很低,又或者提供惨不忍睹的部分结果。所以这个问题,回到图像理解能力上也是一样,它能懂,但是对于能不能做到你的需求,一直是变量。能力是有,但是服务商略微调整,你这边的结果,或者应用能力就变动很明显。
|
20
MelodyZhao 2023-10-10 10:47:44 +08:00
看图讲故事,还是挺不错的
|
22
xuelang OP |