如题,对于产品名有什么好的命名实体识别算法?
如:
“提到安卓系统的车机手机互联方案,可能你首先想到的就是谷歌的 Android Auto ,当然,还有百度家的 CarLife 、乐视的 ecolink 以及 MirrorLink 等,但是在全球范围内能和 CarPlay 一战的,恐怕只有 Android Auto 了,基于谷歌强大的生态系统, Android Auto 在使用体验和功能上并不比 CarPlay 差,而且,苹果和谷歌在车载领域的竞争,也能从这两个系统里面直接看出”
Android Auto , CarLife , ecolink , MirrorLink 应该被识别出来
再如:
“从 9 月 6 日开始,细心地用户应该能发现,滴滴打车 APP 的启动界面有了变化,此前的“滴滴打车,再见”的载入界面已经消失,取而代之的是“滴滴打车全新品牌升级倒计时”字样。根据滴滴内部人士透露,此番动作并不像外界猜测的那样涉及多项业务调整,而只是将更换品牌名称,从“滴滴打车”改变为“滴滴出行”。滴滴将不再只是打车,而是要做移动出行的综合性入口。”
滴滴打车,滴滴出行 应该被识别出来
发现目前开源的 NLP 库都无法进行产品名的命名实体识别, bosonnlp 有这项服务,准确度也还可以 但是究竟是什么样的算法呢?
1
zix 2017-07-05 08:52:17 +08:00
暴力的办法:用检索或自动机的办法,自己收集好大量的产品名,直接匹配。
模型的方法:收集你要处理的实际场景里带产品名的文本(人工标注,或者上述匹配方法的日志数据),上序列标注模型,LSTM+CRF。 |