V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
skyim
V2EX  ›  程序员

抓取网址内容,发现是图片,有啥解决方案部

  •  
  •   skyim · 2016-07-28 21:21:46 +08:00 · 3281 次点击
    这是一个创建于 3047 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我想抓取一个网址的内容,发现是图片,不知道有啥解决方案不

    http://27.17.15.195:803/show/YPBJ.aspx

    15 条回复    2016-07-31 14:23:34 +08:00
    knightdf
        1
    knightdf  
       2016-07-28 22:11:40 +08:00
    OCR ![]( )
    eoo
        2
    eoo  
       2016-07-28 22:55:52 +08:00 via Android
    C#写的?
    aaronzjw
        3
    aaronzjw  
       2016-07-28 22:58:13 +08:00
    python 的话直接用 PIL 读取就好了吧
    izoabr
        4
    izoabr  
       2016-07-29 00:31:54 +08:00
    这个防抓思路不错
    aeshfawre
        5
    aeshfawre  
       2016-07-29 07:47:04 +08:00
    @knightdf ocr 的话需要人工再校验一次,里面错误还是很多的.
    skyim
        6
    skyim  
    OP
       2016-07-29 10:49:08 +08:00
    @eoo 是的,有啥思路
    skyim
        7
    skyim  
    OP
       2016-07-29 10:50:14 +08:00
    @izoabr 有啥思路吗
    vitovan
        8
    vitovan  
       2016-07-29 11:06:45 +08:00
    r#5 @aeshfawre 没看到 OCR 有什么错误,这字体如此清晰明了, OCR 的完美使用场景呀~
    izoabr
        9
    izoabr  
       2016-07-29 11:11:32 +08:00
    @skyim
    Nmap scan report for 27.17.15.195
    Host is up (0.033s latency).
    Not shown: 983 closed ports
    PORT STATE SERVICE
    80/tcp open http
    135/tcp filtered msrpc
    139/tcp filtered netbios-ssn
    445/tcp filtered microsoft-ds
    593/tcp filtered http-rpc-epmap
    901/tcp filtered samba-swat
    1025/tcp filtered NFS-or-IIS
    1026/tcp filtered LSA-or-nterm
    1027/tcp filtered IIS
    1068/tcp filtered instl_bootc
    3128/tcp filtered squid-http
    3333/tcp filtered dec-notes
    4444/tcp filtered krb524
    5800/tcp filtered vnc-http
    5900/tcp filtered vnc
    6129/tcp filtered unknown
    6667/tcp filtered irc
    skyim
        10
    skyim  
    OP
       2016-07-29 14:01:41 +08:00
    @izoabr 谢谢你的回复,但是不是很明白
    izoabr
        11
    izoabr  
       2016-07-29 15:03:39 +08:00
    @skyim 不一定要去抓呀,没准数据库能直接连上去 select 呢,换换思路
    aeshfawre
        12
    aeshfawre  
       2016-07-30 03:22:15 +08:00   ❤️ 1
    skyim
        13
    skyim  
    OP
       2016-07-30 14:58:24 +08:00
    skyim
        14
    skyim  
    OP
       2016-07-30 15:02:40 +08:00
    @aeshfawre 真的非常感谢,我去试试看
    SmiteChow
        15
    SmiteChow  
       2016-07-31 14:23:34 +08:00
    这个反扒技术很变态
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1020 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 19:50 · PVG 03:50 · LAX 11:50 · JFK 14:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.