V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
neurocomputing
V2EX  ›  自然语言处理

命名实体识别产品名的方法?

  •  
  •   neurocomputing · 2017-01-25 15:42:50 +08:00 · 4326 次点击
    这是一个创建于 2857 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题,对于产品名有什么好的命名实体识别算法?

    如:

    “提到安卓系统的车机手机互联方案,可能你首先想到的就是谷歌的 Android Auto ,当然,还有百度家的 CarLife 、乐视的 ecolink 以及 MirrorLink 等,但是在全球范围内能和 CarPlay 一战的,恐怕只有 Android Auto 了,基于谷歌强大的生态系统, Android Auto 在使用体验和功能上并不比 CarPlay 差,而且,苹果和谷歌在车载领域的竞争,也能从这两个系统里面直接看出”

    Android Auto , CarLife , ecolink , MirrorLink 应该被识别出来

    再如:

    “从 9 月 6 日开始,细心地用户应该能发现,滴滴打车 APP 的启动界面有了变化,此前的“滴滴打车,再见”的载入界面已经消失,取而代之的是“滴滴打车全新品牌升级倒计时”字样。根据滴滴内部人士透露,此番动作并不像外界猜测的那样涉及多项业务调整,而只是将更换品牌名称,从“滴滴打车”改变为“滴滴出行”。滴滴将不再只是打车,而是要做移动出行的综合性入口。”

    滴滴打车,滴滴出行 应该被识别出来

    发现目前开源的 NLP 库都无法进行产品名的命名实体识别, bosonnlp 有这项服务,准确度也还可以 但是究竟是什么样的算法呢?

    1 条回复    2017-07-05 08:52:17 +08:00
    zix
        1
    zix  
       2017-07-05 08:52:17 +08:00
    暴力的办法:用检索或自动机的办法,自己收集好大量的产品名,直接匹配。

    模型的方法:收集你要处理的实际场景里带产品名的文本(人工标注,或者上述匹配方法的日志数据),上序列标注模型,LSTM+CRF。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3768 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 10:28 · PVG 18:28 · LAX 02:28 · JFK 05:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.