首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Coding
V2EX  ›  算法

实现了一个拼音分割的算法

  •  
  •   fantasticfears · 245 天前 · 1351 次点击
    这是一个创建于 245 天前的主题,其中的信息可能已经有所发展或是发生改变。

    按照“刘政怡, 吴建国 and 刘慧婷, 2008. 音节切分歧义方法研究. 计算机技术与发展, 18(8), pp.35-38.”论文,用 C++17 实现了一个拼音分割算法。

    https://github.com/fantasticfears/pinyin-syllable-segmentation

    算法只有一个 syllable_segmentation.hppsyllable_list.csv 是一个音节的文件。SyllableIndex 存了音节的信息。SyllableSegmentor 实现了 AppendPhoneGetSyllableListPopLastPhone,分别可以添加音符、获得分割好的音符字符串和删除最后一个字符。

    现在已经没有多少研究去做音节分割了。搜狗可能做得比研究都好了。

    4 回复  |  直到 2019-04-12 08:29:12 +08:00
        1
    lotem   245 天前
    恭喜
        2
    fantasticfears   245 天前
    @lotem 谢谢,写它的契机其实是落格输入法可以用上。其他能用上的地方就只有生成 slug 了。输入法这样顶尖的应用有能降低心智的负担,但重要的点还是在于数据的分析。能提高一个量级的水平。还是商业化好做到这个目标吧
        3
    Tumblr   245 天前
    @lotem #1 公子好早啊

    恭喜啊,先学为敬
        4
    0312birdzhang   244 天前
    第一次离大佬们这么近(一直没静下心来研究一下 rime😂
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1542 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 28ms · UTC 23:58 · PVG 07:58 · LAX 15:58 · JFK 18:58
    ♥ Do have faith in what you're doing.