V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
manualplus
V2EX  ›  程序员

求问:这是用什么方式转换的图片站?

  •  
  •   manualplus · 2015-08-11 15:41:23 +08:00 · 2522 次点击
    这是一个创建于 3173 天前的主题,其中的信息可能已经有所发展或是发生改变。

    就这个http://oeeee.cc/qSUavR
    用什么东东做的?很想知道这是一种好方法还是一种折中办法?

    9 条回复    2015-08-14 08:23:59 +08:00
    learnshare
        1
    learnshare  
       2015-08-11 15:47:58 +08:00
    并不知道你在说什么
    402645707
        2
    402645707  
       2015-08-11 15:49:17 +08:00 via Android
    爬虫爬的垃圾站
    402645707
        3
    402645707  
       2015-08-11 15:49:56 +08:00 via Android
    好吧当我没说,
    pango
        4
    pango  
       2015-08-11 15:51:52 +08:00
    难道是ocr自动识别的?
    Agromania
        5
    Agromania  
       2015-08-11 15:55:35 +08:00
    这个大概是人工或自动去收集了很多说明书的pdf,转成图片,很不错的点子

    以PHP为例,pdf转图片很简单:

    <?php
    $im = new imagick('file.pdf[0]');
    $im->setImageFormat('jpg');
    header('Content-Type: image/jpeg');
    echo $im;
    ?>
    pimin
        6
    pimin  
       2015-08-11 16:10:20 +08:00
    只是解析pdf吧
    manualplus
        7
    manualplus  
    OP
       2015-08-11 22:23:57 +08:00
    @Agromania 转成图片这个好理解,方法也很多,但它这个解析提取出文本内容(按页提取并自动加上超链接和做分行处理)思路很好。可能就是不知用什么方法和技术方案实现的?
    paperpeper
        8
    paperpeper  
       2015-08-12 13:22:11 +08:00
    manualplus
        9
    manualplus  
    OP
       2015-08-14 08:23:59 +08:00 via Android
    @Agromania 点子很好吧,我们也在做说明书服务,欢迎交流
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5299 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 06:56 · PVG 14:56 · LAX 23:56 · JFK 02:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.