V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
t1518968889
V2EX  ›  问与答

如何自建以图搜图?

  •  
  •   t1518968889 · 2017-10-11 18:14:24 +08:00 · 3340 次点击
    这是一个创建于 2359 天前的主题,其中的信息可能已经有所发展或是发生改变。

    可能我搜索关键词用不准,但我找了多次,完全没头绪. 像谷歌识图那样,提交图片,然后返回相似的图片. 电脑上图片太多,用去重软件每次都要扫描很久,1 万张图差不多就要 1 小时左右,无法想象 10 万张图时的工作量. 有这方面现成的"搜索引擎"么?

    第 1 条附言  ·  2017-10-11 18:53:06 +08:00
    我说的直白点吧.
    这有一个例子 http://konachan.com/post/similar
    他应该是索引了他拥有的所有图片的指纹,然后我提交 /上传一张图片,他就返回他拥有的图片里是否存在相似的图片给我,我就想弄一个这样的功能,方便自己查重,也提供这个服务给浏览者,绝不是简单的查找重复图片,不管速度多快,像我说的查重软件和 @azh7138m 给的链接,应该都是需要先扫描所有图片一次,下次查重时又要扫,很费时间,并且这也不是重点,重点是,我想弄一个这样的网页服务,而不是桌面程序什么的.
    6 条回复    2017-10-12 00:19:59 +08:00
    lizhijun
        2
    lizhijun  
       2017-10-11 18:40:59 +08:00   ❤️ 3
    刚好最近在研究这个。写个程序生成图片的 phash 指纹,然后算两张图片指纹 phash 的汉明距离,如果这个汉明距离小于 5 说明这两张图片非常相似。附获取图片 phash 指纹的代码:
    ```python

    from PIL import Image
    import imagehash
    import sys

    img = Image.open('./images/1.jpg')
    print imagehash.phash(img)

    ```
    qiayue
        3
    qiayue  
       2017-10-11 18:43:28 +08:00
    搜索引擎也要先索引你电脑上的所有图片啊
    weifding
        4
    weifding  
       2017-10-11 18:45:09 +08:00 via Android   ❤️ 1
    用特征的,你可以搜索下 surf 和 sift 算法。算法还好,速度才是最大问题。整套系统我以前建过。代码量不大,要设计的很巧妙才行。
    weifding
        5
    weifding  
       2017-10-11 21:02:57 +08:00 via Android
    桌面还是 web 服务,核心都是一样啊。我前面回复提示的够明显了吧。。
    t1518968889
        6
    t1518968889  
    OP
       2017-10-12 00:19:59 +08:00 via Android
    @weifding 够明显了~不过我还在找有没有现成的开源工具什么的,造轮子心累。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5439 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 08:38 · PVG 16:38 · LAX 01:38 · JFK 04:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.