V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cevincheung
V2EX  ›  互联网

浴室沉思:所谓精准搜索就是一个完美的词库?

  •  
  •   cevincheung · 2015-09-08 16:19:25 +08:00 · 2463 次点击
    这是一个创建于 3367 天前的主题,其中的信息可能已经有所发展或是发生改变。

    以下内容无脑发布:

    假设,有个脚本,实时获取搜狗的最新词库和微博热搜内容整理成搜索词库。
    假设,有 N 台性能强悍的 Elastic 组成的搜索集群。

    然而是不是就是说现在可以得到一个近乎完美的“精准”搜索结果了?比如根据社会热度排序,网络搜索多的靠前……等

    4 条回复    2015-09-09 10:34:09 +08:00
    kslr
        1
    kslr  
       2015-09-08 16:32:57 +08:00
    这个我觉得你可以去看百度指数
    dbfox
        2
    dbfox  
       2015-09-08 16:34:06 +08:00
    我觉得搜索,需要收集用户习惯,所在场景,还有当前用户的状态(用户在什么地方,用户在干嘛,用户的周边环境等),才能达到精准搜索
    xunyu
        3
    xunyu  
       2015-09-08 16:40:43 +08:00
    很遗憾这不可能实现,数据多了会打架,加上人的主观因素不可能有个完备的解决
    ssaul
        4
    ssaul  
       2015-09-09 10:34:09 +08:00
    最早的搜索引擎,应该就是根据关键字来查找,最近的 10 年,似乎大家都开始使用一些其他的因素来关联,试图获得输入者“原本想要得到的结果”。
    其实对比 google 和百度这样的搜索引擎,作为一个技术人员,我觉得 google 的结果,明显关联度与我的本意更加接近。
    我一直在想:这是为毛呢?
    初步的想法是 google 有一个后台的搜索历史数据库,根据关键字来存储,然后根据后续的点击来判断属于某个关键字的大群输入者,到底是想获得一个什么样的链接作为结果。
    当然,我不是研究搜索引擎的,其实根本就是瞎想。
    所谓的精准,无非就是输入者得到的结果,基本都是自己想要的。但是这很难,因为任何人 /程序都无法预计某一个具体的输入者,在输入某个关键字的时候,他想要获得的结果。 google 和百度的差异,也许只是那个后台的搜索历史数据库和具体的排序算法的区别。当然,百度还收钱,搞排名......
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1064 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 20:19 · PVG 04:19 · LAX 12:19 · JFK 15:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.