首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
laoni
V2EX  ›  程序员

业务时间用 golang 写了个 脏词过滤服务。golang 大法好呀

  •  
  •   laoni · 2016-06-12 08:42:27 +08:00 · 2641 次点击
    这是一个创建于 1321 天前的主题,其中的信息可能已经有所发展或是发生改变。

    支持多脏词组合 比如: 哇哈哈+蛋蛋蛋 只有同时存在哇哈哈和蛋蛋蛋 才会 hit 到。 还支持简繁体等一般的畸形纠正。 之前用 PHP 和 lua 都实现过。。但性能不行。最后 golang 靠谱

    https://github.com/nixuehan/rabbit

    golang 大法好呀。 哈哈

    laoni
        1
    laoni   2016-06-12 08:54:57 +08:00
    全部 API 实现,很方便接入自己的项目中

    POST /filter

    参数: contents=蒙汗药

    返回格式:json

    具体返回值说明: {"category":"9","categoryName":"违法信息","hit":"1","id":"38509","rate":"2","word":"蒙汗药"}

    hit 是否命中, 0 否 1 是 category 脏词的分类 id categoryName 脏词所属分类名 id 脏词 ID,利用这个 ID 就可以编辑脏词 rate 黑名单或白名单, 1 黑名单 2 灰名单(自己 review 内容) word 脏词
    fising
        2
    fising   2016-06-12 09:18:50 +08:00
    老逆你好,这个项目还在呀
    laoni
        3
    laoni   2016-06-12 10:08:11 +08:00 via iPhone
    @fising 在呀
    pandachow
        4
    pandachow   2016-06-12 11:40:51 +08:00
    你可以隔几天再来的。。。。。 https://www.v2ex.com/t/284795
    laoni
        5
    laoni   2016-06-12 13:31:41 +08:00 via iPhone
    @pandachow 😅 不好意思
    zwh8800
        6
    zwh8800   2016-06-12 15:32:38 +08:00
    有源码给观摩一下吗😄
    laoni
        7
    laoni   2016-06-12 15:38:33 +08:00
    @zwh8800 没什么特别的原理 就是通常的做法 字典树 不复杂 合适的时候我就开源
    realpg
        8
    realpg   2016-06-12 22:12:20 +08:00
    @livid 举报 自问自答型 推广 /t/284795


    另外对很多人说,自己做个好产品,这里都是程序员,直接发来 github ,老老实实我分享个好东西,多简单点事儿
    非得整那些耍猴戏有意思么。
    palxie
        9
    palxie   2016-06-12 23:11:30 +08:00
    道高一尺,魔高一丈,中国语言博大精深,过滤这个有点难啊....
    laoni
        10
    laoni   2016-06-12 23:23:38 +08:00
    @realpg 这个帖子 我没有 自问自答吧? 当然可以交流更好的 过滤方案
    laoni
        11
    laoni   2016-06-12 23:24:12 +08:00
    @palxie 恩是难 但国内环境 没办法把
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   888 人在线   最高记录 5168   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 25ms · UTC 23:48 · PVG 07:48 · LAX 15:48 · JFK 18:48
    ♥ Do have faith in what you're doing.