V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
netpi
V2EX  ›  分享创造

百度 OCR 服务 , 效果杠杠的 .

  •  
  •   netpi ·
    netpi · 2016-07-20 13:32:51 +08:00 · 17476 次点击
    这是一个创建于 3055 天前的主题,其中的信息可能已经有所发展或是发生改变。

    源码地址 https://github.com/netpi/baidu-ocr-api

    亲测:

    • 支持本地图片 外部图片(速度取决图片大小)
    • 识别简单的验证码
    • 平时相机拍摄书本的文字,基本能达到 95%
    • 支持 shell/nodejs 全局安装可在控制台直接运行

    Baidu-OCR-API for nodejs

    NPM version Build Status Coveralls Status

    Downloads

    Install & Usage

    1. Global

    npm install baidu-ocr-api -g
    
    
    ocr --help
    
    # 远程图片
    ocr http://7pun4e.com1.z0.glb.clouddn.com/test.jpg
    
    # 本地图片
    ocr ./test.jpg
    
    
    效果图

    的早期世界观是建立在《魔兽争霸 3 :冰封王座》的基础上的,因此与现在暴雪公司的《魔兽世界》的背景设定有一定的联系,但由于版本更迭又略有不同。整个地图中地形名费伍德森林,费伍德森林是网络游戏《魔兽世界》中的游戏地图,位于卡利姆多境内的一片森林。这片由森林和草场构成的繁荣动荡的土地曾经由卡尔多雷掌管,并曾经处于半神塞纳留斯的保护下。燃烧军团的铁蹄践踏了这片土地,没有被毁灭的树木和生物则被恶魔的暴行永远的诅咒着

    2. nodejs

    npm install baidu-ocr-api --save
    
    

    FYI examples

    /**
    
    登陆 百度 bcs 控制台中心 申请 access key
    https://console.bce.baidu.com/iam/#/iam/accesslist
    
    **/
    var ak = 'your ak';
    var sk = 'your sk';
    var ocr = require('../').create(ak,sk);
    // 外部图片
    ocr.scan({
      url:'http://7pun4e.com1.z0.glb.clouddn.com/test.jpg', // 支持本地路径
      type:'text',
    }).then(function (result) {
      return console.log(result)
    }).catch(function (err) {
      console.log('err', err);
    })
    
    

    test

    make test
    make cov # Coverage rate
    

    license MIT

    第 1 条附言  ·  2017-02-01 13:31:32 +08:00
    33 条回复    2016-07-22 09:07:28 +08:00
    SourceMan
        1
    SourceMan  
       2016-07-20 13:46:32 +08:00
    README 我都看得懂,就是为什么要发到“问与答”节点
    netpi
        2
    netpi  
    OP
       2016-07-20 13:49:40 +08:00
    @SourceMan 我 TM 发错了 改不了了
    netpi
        3
    netpi  
    OP
       2016-07-20 14:21:37 +08:00
    如何把这篇帖子 分类到 `技术` 下
    oott123
        4
    oott123  
       2016-07-20 15:18:28 +08:00   ❤️ 1
    netpi
        5
    netpi  
    OP
       2016-07-20 16:19:59 +08:00
    @oott123 thx
    WildCat
        6
    WildCat  
       2016-07-20 16:34:08 +08:00 via iPhone
    诶?我记得之前百度 API Store 提供的百度 OCR 服务被关闭了啊!
    netpi
        7
    netpi  
    OP
       2016-07-20 16:41:28 +08:00   ❤️ 1
    @WildCat 之前的版本确实关闭了因为权限校验太弱, 现在是新版 加入了 ak sk 的权限校验. 返回结果结构等都变了
    https://bce.baidu.com/doc/OCR/ProductDescription.html#.E4.BB.8B.E7.BB.8D
    zpvip
        8
    zpvip  
       2016-07-20 17:09:54 +08:00
    现在是免费,不知道把它集成到产品后,变成很贵,那就尴尬了。
    dexterzzz
        9
    dexterzzz  
       2016-07-20 17:28:48 +08:00
    office lens 谁用谁知道
    est
        10
    est  
       2016-07-20 17:52:20 +08:00
    能破解百度贴吧 10 个汉字验证码么。
    shiny
        11
    shiny  
       2016-07-20 17:53:55 +08:00
    @est 用其矛攻其盾啊 😂😂😂
    xylitolLin
        12
    xylitolLin  
       2016-07-20 17:57:55 +08:00
    能识别 I 和 l ?
    WJackson
        13
    WJackson  
       2016-07-20 18:42:25 +08:00
    netpi
        14
    netpi  
    OP
       2016-07-20 19:01:17 +08:00
    @zpvip 估计会推广很久 , 到时候收费估计也是每个月有一定的免费额度
    netpi
        15
    netpi  
    OP
       2016-07-20 19:03:01 +08:00
    @xylitolLin 结合语意也许可以 : )
    TheCure
        16
    TheCure  
       2016-07-20 19:09:49 +08:00
    感谢大家对百度开放云的关注!
    还有 BOS CDN BCC 等很多产品哦
    boro
        17
    boro  
       2016-07-20 20:00:46 +08:00 via iPhone
    识别率百分之几?
    netpi
        18
    netpi  
    OP
       2016-07-20 20:06:35 +08:00
    @boro
    官方说法 :
    国内首个公有云 OCR 产品,基于百度深度学习研究院( IDL )强大的深度学习算法和中文检测识别技术,整图中文识别准确率达 85%以上,英文 91%以上。
    yincheng
        19
    yincheng  
       2016-07-20 20:12:36 +08:00 via iPhone
    巨硬的 Office Lens 和 ABBYY 的 TextGrabber 识别率也不错,日常使用足够了。不过 Office Lens 似乎只能搭着 OneDrive 用,挺奇怪的。
    fcicq
        20
    fcicq  
       2016-07-20 20:40:46 +08:00
    就是个 api 签名工具啊...
    netpi
        21
    netpi  
    OP
       2016-07-20 20:43:06 +08:00
    @fcicq 对呀 算法是百度提供的
    duola
        22
    duola  
       2016-07-20 21:29:52 +08:00
    刚才测试了一下,阿里云的 OCR 产品,唉。被完爆,根本就用不了。
    netpi
        23
    netpi  
    OP
       2016-07-20 21:42:52 +08:00
    @duola 图像识别 深度学习这块 百度还是挺给力的 .
    cheneydog
        24
    cheneydog  
       2016-07-20 23:21:58 +08:00
    没有源码,卵用
    netpi
        25
    netpi  
    OP
       2016-07-20 23:33:31 +08:00
    @cheneydog 深度学习是需要不断训练 Model 的 ,想要识别率提升 不同字体都要训练。不存在`源码` 一说
    cheneydog
        26
    cheneydog  
       2016-07-20 23:37:46 +08:00
    @netpi 训练完了还是别人的
    netpi
        27
    netpi  
    OP
       2016-07-21 00:00:15 +08:00
    @cheneydog 要啥自行车
    aksoft
        28
    aksoft  
       2016-07-21 09:11:57 +08:00
    其实就是让你们免费给他测试。。当然你也用了。。
    heiybb
        29
    heiybb  
       2016-07-21 10:41:00 +08:00
    netpi
        30
    netpi  
    OP
       2016-07-21 10:44:34 +08:00
    @heiybb 你想干啥 😄
    heiybb
        31
    heiybb  
       2016-07-21 11:16:37 +08:00
    大概试了下,对繁体字的识别效果非常差,而且缺字漏字,效果还不及 FineReader 。
    netpi
        32
    netpi  
    OP
       2016-07-21 11:57:01 +08:00
    @heiybb 繁体字就复杂了 比划太多了
    lytofb
        33
    lytofb  
       2016-07-22 09:07:28 +08:00
    稍微试了一下发现 100kb 的 png 图片就识别不出来了……想发车也发不了[doge]
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2465 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 15:57 · PVG 23:57 · LAX 07:57 · JFK 10:57
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.