V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
zzxworld
V2EX  ›  问与答

有没有按标签相关性排序的方法或资料?

  •  
  •   zzxworld · 2012-05-09 20:29:20 +08:00 · 2567 次点击
    这是一个创建于 4368 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如有三篇文章:A,B,C

    A的标签有:apple,iphone,iphone4s
    B的标签有:apple,ipod touch
    C的标签有:apple,iphone

    如果我现在查看A相关的文章时,B和C都有,但C的权重要高于B。

    用一个比较愚笨的方法就是取出与包含A标签的所有文章,然后再遍历所有文章的标签与A的标签进行比对并分配一个权重的值, 再按权重值进行排序。

    但是当数据达到一定量,比如一万条的时候,这个方法就见鬼了。想询问下有没有更好的方法,或是在DB端查询的时候就可以达到这个目的?
    2 条回复    1970-01-01 08:00:00 +08:00
    kafka0102
        1
    kafka0102  
       2012-05-09 21:02:43 +08:00
    这个放到全文搜索会比较合适。。。
    virushuo
        2
    virushuo  
       2012-05-09 22:04:58 +08:00
    用余弦定理计算夹角,然后排序。这是相关度计算的办法,和搜索引擎计算页面相关是一样道理,只是你的tag等于已经做完了分词。

    可以参考吴军06年发表在google黑板报的文章: http://www.googlechinablog.com/2006/07/12.html



    http://www.google.com.hk/ggblog/googlechinablog/2006/06/blog-post_3066.html
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1102 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 18:57 · PVG 02:57 · LAX 11:57 · JFK 14:57
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.