V2EX › heihe 的所有回复 › 第 1 页 / 共 1 页

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

228 天前

回复了 doraemon0711 创建的主题 › Elasticsearch › 现在用 ES 还推荐通过分词插件的方式对 query 和 doc 进行处理吗？

@HetFrame 可以看下这个系列的文章。https://www.zhihu.com/column/c_1345405459457736704

235 天前

回复了 liox 创建的主题 › 分享发现 › 京东 APP 搜索《夜》，是自身功能？

所有的电商搜索场景都有关键词跳转运营功能，估计是这个关键词配置的跳转链接有问题。

257 天前

回复了 doraemon0711 创建的主题 › Elasticsearch › 现在用 ES 还推荐通过分词插件的方式对 query 和 doc 进行处理吗？

@doraemon0711 对的。

257 天前

回复了 doraemon0711 创建的主题 › Elasticsearch › 现在用 ES 还推荐通过分词插件的方式对 query 和 doc 进行处理吗？

@doraemon0711 你这个规模没必要了，直接放 es 里面就可以了。

257 天前

回复了 doraemon0711 创建的主题 › Elasticsearch › 现在用 ES 还推荐通过分词插件的方式对 query 和 doc 进行处理吗？

@doraemon0711 一般在召回之前，会对关键词做意图识别，实体识别的处理，然后拿到这些数据作为召回的条件，这些处理规则一般是算法测的模型在处理，工程这边只是拿到结果，当然具体怎么玩，依据你们公司有无对应的团队呢。

260 天前

回复了 doraemon0711 创建的主题 › Elasticsearch › 现在用 ES 还推荐通过分词插件的方式对 query 和 doc 进行处理吗？

@doraemon0711 你的目的是干什么呢？当时我们是大数据场景，集群每天几十亿数据写入，集群 TB 级别数据，分词器做了改造，目的是为了减轻 es 集群 CPU 的压力且 ES 只用来检索，如果你数据量不大，像楼下这种偏电商场景，直接用 ES 本身处理即可，至于实体识别，意图识别这个和 ES 本身分词没什么关系，一般是算法测处理，他们存储好，工程测通过关键词直接去拿。

262 天前

回复了 doraemon0711 创建的主题 › Elasticsearch › 现在用 ES 还推荐通过分词插件的方式对 query 和 doc 进行处理吗？

你这样又多依赖了一个组件，可以尝试把分词直接放到你们数据写入服务里面，将分词的结果用空格拼接，es 里面保留空格分词。

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 5629 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 15ms · UTC 06:32 · PVG 14:32 · LAX 22:32 · JFK 01:32
Developed with CodeLauncher
♥ Do have faith in what you're doing.