V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wb13
V2EX  ›  分享发现

基于深度学习的分词系统(pullword)开放 API,永久免费。

  •  
  •   wb13 · 2014-07-01 13:13:08 +08:00 · 11721 次点击
    这是一个创建于 3833 天前的主题,其中的信息可能已经有所发展或是发生改变。
    开发者: @梁斌penny
    网站: pullword.com
    API链接: api.pullword.com (支持POST/GET以及telnet)

    原微博: http://www.weibo.com/1497035431/BbxAQ0TZF
    7 条回复    2015-07-10 09:39:04 +08:00
    ryon
        1
    ryon  
       2014-07-01 13:37:07 +08:00
    这是之前@livid 说的那个分词解决方案么?
    Livid
        2
    Livid  
    MOD
       2014-07-01 13:47:38 +08:00
    @ryon 不是。

    而且这个 API 目前看起来只能分词,还无法提取关键词列表。
    ryon
        3
    ryon  
       2014-07-01 13:58:55 +08:00
    @Livid 是的,目前功能感觉不够用。期待v2ex所用方案的发布。到时候记得@下,谢谢:)
    kisshere
        4
    kisshere  
       2014-07-01 14:21:17 +08:00 via Android
    三个问题,1.这个和SCWS有何区别? 2.能提取关键词么,比如"小苹果这首歌是中国的神曲"那么能不能提取小苹果和神曲作为关键词,3.既然api永久免费,为何不开放源码?
    wb13
        5
    wb13  
    OP
       2014-07-01 14:29:03 +08:00
    @kisshere 为什么人们都知道 ‘一味索取’ 呢?
    fanghui
        6
    fanghui  
       2014-07-01 17:06:04 +08:00
    收藏了,谢谢
    zzzvvvxxxd
        7
    zzzvvvxxxd  
       2015-07-10 09:39:04 +08:00
    @kisshere
    1. 首先SCWS全称就是Simple Chinese Word Segmentation,而pullword是使用了Bengio的模型改了一些trick,算是深度学习的应用。两者的分词准确度不可比,另外pullword是可以根据反馈优化模型的。完全不是一个层面的产品,从技术含量和价值,pullword是显然胜过前者的。

    2. 提取关键词是完全另外的模型算法和学术方向,一个个人作品,而且专注于分词的产品,都每必要实现所谓的关键词。而且短文本抽取关键词,和实体识别(NER)还有热词发现其实区别不大。

    3. 免费什么时候等价于开源了
    你要注意,这个项目学术价值也很足,加上作者并没有在一开始靠这个骗论文和钱,很难保证其他人不会
    而且,也许代码可以开源,里面一些学术和模型可能是不适合开源的。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2551 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 11:23 · PVG 19:23 · LAX 03:23 · JFK 06:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.