V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
qiayue
V2EX  ›  分享创造

新鲜出炉的一个小游戏: 12306 验证码识别大赛,比比看谁识别的验证码多

  •  1
     
  •   qiayue · 2015-12-09 22:09:27 +08:00 · 6190 次点击
    这是一个创建于 3304 天前的主题,其中的信息可能已经有所发展或是发生改变。
    验证码来自于 12306 截图,界面是我司设计师妹子设计的,代码是我根据我司之前的一款小游戏改的,所以代码比较乱
    不过还是挺好玩的,60 秒内,看看你能识别出多少个 12306 的验证码来。
    另有好友排行榜和总排行榜,高分即可上榜。
    (只做了微信授权登录,所以你懂的)



    http://app.linkmob.com/yanzhengma/
    第 1 条附言  ·  2015-12-09 23:08:03 +08:00
    上面的链接写错了
    http://app.linkmobapp.com/yanzhengma/
    32 条回复    2015-12-14 17:46:06 +08:00
    qw7692336
        1
    qw7692336  
       2015-12-09 22:45:26 +08:00
    然后所有的用户都变成了免费的人肉打码
    yangqi
        2
    yangqi  
       2015-12-09 22:46:32 +08:00
    这个主意不错,众筹人肉打码
    qiayue
        3
    qiayue  
    OP
       2015-12-09 22:53:31 +08:00 via Android
    @yangqi
    @qw7692336
    你们这么一说还真可以,不过我没有这么做,就是看到最近验证码话题挺火,就截了 300 张图,我手工截的,自己人肉识别出答案之后放出来的。
    wangluowangwang
        4
    wangluowangwang  
       2015-12-09 22:59:16 +08:00 via Android
    Not Found

    The requested URL /yanzhengma/ was not found on this server.

    Apache/2.2.22 (Ubuntu) Server at app.linkmob.com Port 80
    techyan
        5
    techyan  
       2015-12-09 23:30:24 +08:00
    不知道这个思路能不能破 12306 的验证码:

    已知 12306 会给定一个物品,然后放出数个备选图片,在这些图片中有一些是 12306 给定的,还有一些不是。那么首先 OCR 处理出 12306 给定的物品是什么(比如 12306 让用户在所有备选图片中挑出所有猫的照片),之后抓取所有备选图片,扔到百度 Google 里面的识图搜索(即给定图片,然后搜索引擎能找出包含该图片的网页),比对哪些结果里出现 12306 给定物品 的次数相对较多,那么哪些照片就是验证码。

    不过貌似这么做成本很高。。
    wong2
        6
    wong2  
       2015-12-09 23:34:12 +08:00
    手工截 300 张。。楼主很有毅力
    xmh51
        7
    xmh51  
       2015-12-09 23:45:55 +08:00
    @techyan 没用的, 12306 图片特意经过模糊化处理,保证任何识图都失效的。看色块的话,你会发现几张图片色块非常相似的。机器是无法识别的。而且多选,多问,放新题,新照,保证任何机器无法匹配答案和图片的关系。只能人工打码了。 12306 可封锁一切自动化抢票。
    way2explore2
        8
    way2explore2  
       2015-12-09 23:46:37 +08:00 via Android
    有才
    ilotuo
        9
    ilotuo  
       2015-12-10 00:01:32 +08:00
    @xmh51
    只是百度谷歌的搜索引擎还不够强.
    使用机器学习的 imagenet 能识别图片的物体甚至能识别出像"一个小孩在草地上跑"这样的语义.
    我觉得理论上是可破的.但是 imagenet 那个训练库都全球范围搜集了好几年,成本太高了

    @techyan
    qw7692336
        10
    qw7692336  
       2015-12-10 00:18:46 +08:00
    手动截 300 张不如搞个爬虫
    gamexg
        11
    gamexg  
       2015-12-10 00:23:13 +08:00
    @techyan 之前刷过一个投票系统,用的好像是极验证,就是给出几个图片要求选择给定类型的图片。当时直接丢 google 图片搜索,然后查看结果页 html 源码里面是否包含给定的词,成功率挺高的。当时试过百度的搜图,发现基本搜不到。
    zonghua
        12
    zonghua  
       2015-12-10 00:32:28 +08:00 via iPhone
    @ilotuo 好厉害的感觉
    Phariel
        13
    Phariel  
       2015-12-10 00:39:16 +08:00 via iPhone
    为了你手工截 300 张图特意来兹瓷一下
    aprikyblue
        14
    aprikyblue  
       2015-12-10 00:46:08 +08:00   ❤️ 1
    ykjsw
        15
    ykjsw  
       2015-12-10 02:25:03 +08:00 via iPad
    真正抢过票的人是不会碰这个游戏的
    qiayue
        16
    qiayue  
    OP
       2015-12-10 07:42:17 +08:00 via Android
    @ykjsw 我也抢过啊,不过我抢到了。直接在官网,事先把选项都填好,设置为自动提交,然后就抢到了。
    cxbig
        17
    cxbig  
       2015-12-10 08:36:11 +08:00
    第一反应:“这不会是黄牛党的人肉验证工具吧”
    princeofwales
        18
    princeofwales  
       2015-12-10 08:51:04 +08:00
    真正抢过票的人就知道,什么 google 百度图形搜索,时间完全不够,选择验证码只有 1 次机会,最多快速刷新再来一次,多余 2 次提交失败票票就没了,连排队的份都没有

    每天抢武广、京广线的真实体会
    loading
        19
    loading  
       2015-12-10 09:00:45 +08:00 via Android
    知乎有个答主,一个大约耗时 125ms !!!!!
    glchaos
        20
    glchaos  
       2015-12-10 09:08:26 +08:00
    @cxbig 我第一感觉也想到了这个,有点被利用的感觉。之前 google 的验证码还为了图书扫描识别做贡献,这个估计只是为了黄牛做贡献吧。。。
    qiayue
        21
    qiayue  
    OP
       2015-12-10 09:21:28 +08:00 via Android
    @glchaos
    @cxbig
    你们就尽情的瞎猜吧!
    我要是公开代码,你们能赔礼道歉吗?
    exch4nge
        22
    exch4nge  
       2015-12-10 09:28:49 +08:00
    手工 300 张,铜币收好!
    mortal
        23
    mortal  
       2015-12-10 09:50:10 +08:00
    不怀疑 LZ 的动机,然而希望结果不要被黄牛利用了…
    xmh51
        24
    xmh51  
       2015-12-10 09:53:32 +08:00
    @aprikyblue 你看下图片分辨率吧,现在 12306 的图片分辨率已经大幅度降低了。
    mcone
        25
    mcone  
       2015-12-10 10:19:00 +08:00   ❤️ 1
    @aprikyblue 昨天刚在知乎回复过一个无脑丢链接的,没想到在 V 站也见到了……

    麻烦你发链接之前跑跑看看好么,这是代码是一个知乎答主今年 3 月的写了,当时绝对是高清无码,验证起来爽爽的,现在的图片分辨率已经渣到人肉看半天都看不出来的程度了,更何况这个…………(上周周末我利用这个代码类似的技术,人肉跑过,我的程序还有去噪之类的预处理,事实表明准确率堪忧……)


    @ilotuo 你说的那个技术不知你是否在做,我们组有个同学在搞这个,简单的讲就是图片转文字。你这个例子好多年前都有了,但是你只见到了贼吃肉,没见到贼挨打——抛开失败的样本想谈实用都是耍流氓。

    这技术真能实用的话,黄牛也不会费那么大事儿人肉打码了
    superbear
        26
    superbear  
       2015-12-10 13:24:01 +08:00
    铁友已经有这种社工模式,一张图 3 分。。。 促使验证码升级
    ihciah
        27
    ihciah  
       2015-12-10 13:59:41 +08:00 via iPhone
    爬虫抓大量图片,配合 imagenet 的数据集,随机仿射变换后扔进去训练,感觉可行
    DT27
        28
    DT27  
       2015-12-10 16:41:35 +08:00
    又是二维码。。。真麻烦
    d8
        29
    d8  
       2015-12-10 18:35:53 +08:00 via Android
    summoon
        30
    summoon  
       2015-12-11 15:46:57 +08:00
    哈哈哈哈好游戏~
    已转发朋友圈!感觉确实像是黄牛人工打码的好创意!
    aprikyblue
        31
    aprikyblue  
       2015-12-13 12:50:11 +08:00 via Android
    @mcone 好吧。。其实我就是从知乎看到的。。
    这几天没碰电脑, so 更不用说跑代码试试了
    jayzhong
        32
    jayzhong  
       2015-12-14 17:46:06 +08:00
    手工帝
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1053 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 19:37 · PVG 03:37 · LAX 11:37 · JFK 14:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.