V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
chenjunqiang
V2EX  ›  搜索引擎技术研究

如何区分词库的哪些词是 事务搜索词,信息搜索词,导航搜索词

  •  
  •   chenjunqiang · 2020-05-30 17:04:43 +08:00 · 3760 次点击
    这是一个创建于 1643 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前小弟正在处理大批量的词,想问问,这些词是否有什么快捷的方法来分类出来。

    因为有几十万个词,不奢求全自动化处理完全部的词。

    希望有一个策略告知如何分类出来。

    目前我已经处理的是:

    导航词这个比较容易处理,就是别人品牌词,自己品牌词,之类的。好处理,但是没有策略自动化处理

    事务搜索词,目前我用了价格词处理了一波

    信息搜索词,还没有想到招怎么处理。

    弱弱的问问各个大大如何处理

    2 条回复    2020-06-01 11:14:59 +08:00
    TimePPT
        1
    TimePPT  
       2020-05-30 18:23:15 +08:00 via Android
    你的需求是啥?做词聚类?
    chenjunqiang
        2
    chenjunqiang  
    OP
       2020-06-01 11:14:59 +08:00
    @TimePPT 你好,是的,

    用途:1.提取核心词。2.根据核心词聚类(算对于词库的分类)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3413 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 00:07 · PVG 08:07 · LAX 16:07 · JFK 19:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.