V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
becomesilent
V2EX  ›  程序员

Java 怎么样使用 yolov8 进行图片、视频识别

  •  1
     
  •   becomesilent ·
    ScienceNoBorders · 167 天前 · 1487 次点击
    这是一个创建于 167 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近在搞图片识别,了解到了 roboflow 和 opencv ,但是现在不知道怎样能进行结合,有没有大佬有经验,小弟想请教学习一下 🙏
    11 条回复    2024-07-10 17:45:07 +08:00
    mainjzb
        1
    mainjzb  
       167 天前
    当然是换 python 。。。每个语言都有适合的领域。。
    ExplodingFKL
        2
    ExplodingFKL  
       167 天前
    没有实时性要求的话就拿 python 摸个 web api, 要不然就得上 jna 了
    a33291
        3
    a33291  
       167 天前
    微软有一个叫 onnx 的东西,提供了很多语言的 sdk
    将 py 其他框架训练的模型转为 onnx 后,就可以用 sdk 直接 run,这样可以减少一层胶水代码
    javak
        4
    javak  
       167 天前
    java 搞这个,能搞,但是问题很多,我研究过一段时间(模型转成 onnx 之后效果总是比 python 差点),放弃了。 还是老老实实用 python 了。
    pecokie
        5
    pecokie  
       166 天前
    之前有用 djl 搞过 yolov5 的,可以看看这个框架 https://github.com/deepjavalibrary/djl
    becomesilent
        6
    becomesilent  
    OP
       166 天前
    @a33291 是的,我之前就是用 onnx 弄的,但是识别出来的准确度相比于 python 低了很多,不知道是为什么
    becomesilent
        7
    becomesilent  
    OP
       166 天前
    @javak 对,准确度比 python 的差,我也是想这样做
    a33291
        8
    a33291  
       166 天前
    @becomesilent 现在比较流行的模型比如 yolo 系列都自带了 cli 支持模型之间的转换,有些转换可能需要额外配置参数
    随着 onnx 的发展,不一定能 1:1 提供原模型的翻译,但是应该是误差在可接受范围内的
    据我自己之前的测试来看,速度和准确度都有一定程度下级,但是没有差到不可用的地步
    furacas
        9
    furacas  
       166 天前
    提供一个排查思路,不知道你是否在输入给模型之前对图片进行了处理,比如 resize 之类的操作。如果有的话,可以检查相关的代码在两个语言之间的实现,算法差一点,最后 resize 出来的图片肉眼看不出来差距,但是实际上差很多。
    @becomesilent
    becomesilent
        10
    becomesilent  
    OP
       165 天前
    @furacas 我用的默认 640 ,但是我的原图是 4000*3000 的,使用 onnx 确实会有点准度下降,但是识别出来的数量差别不大。
    becomesilent
        11
    becomesilent  
    OP
       165 天前
    @a33291 是的,我打算用 python 进行识别然后调用 API 把数据存储到本地
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   874 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:41 · PVG 05:41 · LAX 13:41 · JFK 16:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.