V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
zictos
V2EX  ›  Python

Python 识别图片文字的效果是不是很差?

  •  
  •   zictos · 2021-12-06 00:34:34 +08:00 · 10568 次点击
    这是一个创建于 864 天前的主题,其中的信息可能已经有所发展或是发生改变。

    试了一下 pytesseract 模块,好像很多文字都识别不了,只有一些纯色背景并且颜色反差比较大的才比较容易识别出来。
    用百度的文字识别 api 接口大部分文字都能识别出来,效果挺好的,但有点担心图片内容的安全问题。
    利用程序识别最多只能达到 pytesseract 模块这种程度的效果了吗?

    129 条回复    2021-12-17 14:28:06 +08:00
    1  2  
    zictos
        101
    zictos  
    OP
       2021-12-06 16:34:07 +08:00
    @lakehylia #96 你从哪里看出我怪 python 了?我有说 python 很垃圾吗?
    那按语文的阅读理解来说是不会得出你这样的结论的,你得出来这样结论,还是我的问题?
    hutoer
        102
    hutoer  
       2021-12-06 16:34:30 +08:00   ❤️ 1
    哪些个指责楼主的人,说白了还是自己心眼太小
    anjianshi
        103
    anjianshi  
       2021-12-06 16:35:46 +08:00   ❤️ 1
    楼主挽尊,这年头想说话不被带节奏不被喷是真难。因为回复的人,大部分都并没有想提供有价值的信息,只是想抒发自己的情绪而已。
    zictos
        104
    zictos  
    OP
       2021-12-06 16:45:44 +08:00
    @anjianshi #103 嗯,其实网上也不是什么非常正式的场合,有的时候语言真的要那么严谨吗?其实有时候在网上看一些东西的时候也经常可以找到别人话语的漏洞,但如果一定要去说的话是会被人认为抬杠的,有时候为了简单省事肯定言语不可能很严谨。其实我这个情况是非常类似的,跟其他言语漏洞没有太多本质区别,最关键是因为涉及到了编程语言,毕竟一般情况下说哪门编程语言不好是会被喷的,拿两门编程语言比较也是算引战。
    其实知道意思就行了,稍微有点疑问,后面有解释了,其他楼层就没必要那样了。
    就跟看到有人打了一个错别字一样,真没必要那么严谨,就算有人提一句也问题不大,可以解释一下不小心打错了。但总不至于大部分楼层都一直在说错别字这个事。
    zictos
        105
    zictos  
    OP
       2021-12-06 16:49:08 +08:00
    @huntzhan #99 好的
    enrolls
        106
    enrolls  
       2021-12-06 16:49:17 +08:00
    Python 识别图片文字的效果是不是很差?
    C 识别图片文字的效果是不是很差?
    Java 识别图片文字的效果是不是很差?
    C++ 识别图片文字的效果是不是很差?
    C# 识别图片文字的效果是不是很差?
    Visual Basic 识别图片文字的效果是不是很差?
    JavaScript 识别图片文字的效果是不是很差?
    Assembly 识别图片文字的效果是不是很差?
    SQL 识别图片文字的效果是不是很差?
    Swift 识别图片文字的效果是不是很差?

    (数据来源 TIOBE)
    twinsant
        107
    twinsant  
       2021-12-06 16:56:58 +08:00
    回复楼主,Python OCR 文字识别效果非常好,请看我使用 Pythonista 调用苹果设备神经网络能力的代码:

    https://gist.github.com/twinsant/8737fa611fe71b4ab436b43605b71776
    twinsant
        108
    twinsant  
       2021-12-06 17:02:39 +08:00
    zhw2590582
        109
    zhw2590582  
       2021-12-06 17:09:27 +08:00
    哈哈,我想 10 个人里有 9.5 个人看了楼主你的标题,都会以为你在说 Python 不行,而不是 pytesseract 不行
    zictos
        110
    zictos  
    OP
       2021-12-06 17:19:30 +08:00
    @twinsant #108 图片打不开
    zictos
        111
    zictos  
    OP
       2021-12-06 17:21:13 +08:00
    @zhw2590582 #109 难道只看标题吗?
    标题不是一个观点,而是一个疑问,至于为什么会有疑问,描述中就已经用 pytesseract 解释了。所以连贯起来结合上下文自然就是在说 pytesseract
    jy02201949
        112
    jy02201949  
       2021-12-06 17:39:17 +08:00
    牛逼牛逼,楼主舌战群雄
    Kelan
        113
    Kelan  
       2021-12-06 17:47:15 +08:00   ❤️ 5
    都闲的吧,lz 只因为是新手,并且恰好是一个喜欢存在感的新手。你们在这里认真解释什么。

    越回复 lz 越兴奋啊。
    2i2Re2PLMaDnghL
        114
    2i2Re2PLMaDnghL  
       2021-12-06 19:23:03 +08:00   ❤️ 4
    @zictos 我只是夸张、诙谐且生动形象地描写,在理解机器学习且理解了你说的是什么的情况下,你说的话显得有多可笑。
    不过打火机烤肉确实有可行性的,但对于食材有限制,外加不能直接上明火罢了(不完全燃烧的碳颗粒很多),这块是比较粗糙的比方,或许用太阳灶作比方会好一点。
    但你实在要抓住这个不够精确的比喻,真的『有故意杠的意思了』(原样引自 #9 )

    我就明说了,其实众人与你抬杠了这么多楼,主要的原因是你在拼命咬文嚼字,却又阻止别人咬文嚼字。
    irainsoft
        115
    irainsoft  
       2021-12-06 19:31:19 +08:00   ❤️ 1
    为什么标题不能写 [pytesseract 识别图片文字的效果是不是很差?]
    alexchinatests
        116
    alexchinatests  
       2021-12-06 19:39:46 +08:00
    这群人闲的,搁我早就不回复了,楼主可以的。上面那群人戾气太重
    icy37785
        117
    icy37785  
       2021-12-06 20:17:12 +08:00 via iPhone
    @dlsflh 你是楼主的小号么?我不信世界上存在两个看不懂底下一票回复的人。
    zooo
        118
    zooo  
       2021-12-06 20:34:48 +08:00
    @huntzhan 项目挺牛! 也在做 cv 相关,大佬可以给个联系方式么
    mxT52CRuqR6o5
        119
    mxT52CRuqR6o5  
       2021-12-06 20:37:50 +08:00   ❤️ 2
    什么叫 [难道只看标题吗]
    知道标题党为什么讨人厌吗
    huntzhan
        120
    huntzhan  
       2021-12-06 21:13:53 +08:00
    @zooo d2VjaGF0OnpoYW5oYW94dW4=
    zictos
        121
    zictos  
    OP
       2021-12-06 22:24:19 +08:00
    @2i2Re2PLMaDnghL #114
    你这样绕来绕去就没意思了。
    别人不针对我咬文嚼字,我会针对他咬文嚼字吗?我就活该被怼得一败涂地?就算我咬文嚼字也是有一个前提的。
    我前面开始的几个楼层解释了那么多,其他人听了吗?会就此打住吗?如果我不回复一点,这样我只会被骂得更惨。我回复相当于是一种震慑,其他回复的人就得掂量掂量,小心被回怼。其实在 v2 上经常看到有楼主被骂得很惨的帖子,那些楼主就什么都不回复了,结果就被骂得惨不惹睹。
    你用那个比喻试图证明我的话很可笑,那我不能反驳了?你到底理不理解“杠”的意思?你不开始,那我难道还主动找上你?主动打人和被打还手是一个概念吗?虽说你举的例子有一定相似性,但实在过于夸张了。事实上一开始我还真的感觉无话可反驳,后面想了一下才找到一点突破口,但是也没别的恶意,就是相互辩论一下嘛。其实被回复不是挺好的吗?中途那么多回帖我都没回复,刚好到你那个回帖我才又开始回复,其实从另一个角度来说是对你的言论一种肯定啊!因为其他的人都话并没太多亮点。
    q409195961
        122
    q409195961  
       2021-12-06 23:23:55 +08:00   ❤️ 1
    网上有人推荐 cnocr 这个库,试试看

    不得不说,苹果 iOS15 那个 OCR 功能真的是 YYDS
    LPeJuN6lLsS9
        123
    LPeJuN6lLsS9  
       2021-12-07 10:09:22 +08:00
    imn1 的回复说的好,看这楼主杠他的回复,自己缺乏常识还打死不承认,反而说别人抬杠,打一堆字在那绕来绕去,
    zxCoder
        124
    zxCoder  
       2021-12-07 10:52:27 +08:00
    你可以用 python 调公开接口啊。。。。那识别率杠杆的,这样 python 不就 nb 起来了。。。
    zxCoder
        125
    zxCoder  
       2021-12-07 10:58:16 +08:00
    或者可以自己用 python 训练一个像百度一样的模型程序,这样 python 也就硬起来了
    zhw2590582
        126
    zhw2590582  
       2021-12-07 12:32:02 +08:00
    你不要那么激动嘛,假如你在后面回复个标题写得不准确,然后更正一个新标题,大家都不会扯那么远了
    Kinnice
        127
    Kinnice  
       2021-12-07 15:21:04 +08:00

    对的,程序识别只能做到这样,在高一点就得人工识别了
    :)
    qiany
        128
    qiany  
       2021-12-08 10:03:39 +08:00
    python 做这种识别的都很差 java 也不太行 好一点的应该都是 c 语言写的
    GrayXu
        129
    GrayXu  
       2021-12-17 14:28:06 +08:00
    @zhw2590582 所以只是纯钛合金嘴而已。。
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5520 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 01:29 · PVG 09:29 · LAX 18:29 · JFK 21:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.