目前那个 ai 支持对于图片的识别

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 801 天前的主题，其中的信息可能已经有所发展或是发生改变。

需求：
我有一个图片，我想在想让 ai 帮我识别出几个标记的位置。

尝试：
ChatGPT3 和 4 好像都不支持

问题：
1 我对于 gpt 的用法不对吗？它支持识别图片吗？
2 有哪些可以关于图片信息识别的 ai 工具？
3 目前大家都用了哪些生产力 ai 工具？

识别

图片

chatgpt3

GPT

8 条回复 • 2023-06-30 18:06:36 +08:00

SWALLOWW

2023-06-30 14:30:16 +08:00

某人吗

tangtang369

2023-06-30 14:38:42 +08:00

你这要用计算机视觉的方案用目标检测或者传统的 cv 算法

SWALLOWW

2023-06-30 14:39:23 +08:00

@tangtang369 我感觉现在应该有成熟的 ai 帮我做这个事了- -

lithiumii

2023-06-30 15:22:30 +08:00 via Android

sam （ segment anything ）可以吗

old9

2023-06-30 15:58:10 +08:00

yolo 自己训练一个

picone

2023-06-30 16:02:59 +08:00

segment anything 不是做主体识别的吗，切割主体。
识别图片内容，我了解的是可以用 GoogleLens 、百度识图、搜狗识图这几个，有更多产品可以补充。

Gavin999

2023-06-30 17:57:10 +08:00

这个需求如果有成熟的，那大多数做视觉的算法工程师都要失业了

love060701

2023-06-30 18:06:36 +08:00

Bing 聊天支持发图片给他，然后识别内容，不确定能否识别指定标记，识别指定物体肯定没问题。
另外，多模态 LLM 都支持这个功能，在我的日报里搜了一下，至少有这些：
清华的 ChatGLM 发布的 VisualGLM-6B
META 开源的多模态 LLM：ImageBind
基于 LLaMA 的多模态模型：OpenFlamingo
基于 MPT-7B 实现的多模态 LLM：LLaVA-MPT
MiniGPT-4

宣传一下自己的 AI 资讯日报，每天整理，简洁有效： https://gorden-sun.notion.site/527689cd2b294e60912f040095e803c5?v=4f6cc12006c94f47aee4dc909511aeb5&pvs=4