首页注册登录

canwushuang 最近的时间轴更新

canwushuang

V2EX 第 22480 号会员，加入于 2012-06-21 18:22:02 +08:00

canwushuang 提问技术话题好玩工作信息交易信息城市相关

求好心人赐予红米手机F码一个。

问与答 • canwushuang • 2013-12-02 22:16:08 PM

» canwushuang 创建的更多主题

canwushuang 最近回复了

2023-10-28 23:45:48 +08:00

回复了 BaseException 创建的主题 › 生活 › 骑电瓶车未戴头盔被摄像头拍到，收到短信了

小区附近适当放宽。关键是自己提升安全意识，而不是靠罚款。

2022-11-11 21:42:58 +08:00

回复了 x1024m 创建的主题 › 分享发现 › 老年版才是并夕夕的正确打开方式

pdd 红包和支付券的叠加 buff 才是精髓。

2022-02-14 00:41:59 +08:00

回复了 miyuki 创建的主题 › 分享发现 › [真官方出品] 微软电脑管家

总喜欢被管是什么心理？

2022-02-14 00:37:20 +08:00

回复了 louchenabc 创建的主题 › 分享发现 › ⚙️ IFTTT 和 Zapier 使用对比、最好的效率系统、投入产出比最高的 3 件事

还是 tg 好用，tg 不够那就 tg 机器人。

2022-02-12 20:41:57 +08:00

回复了 redtech 创建的主题 › 分享发现 › 发现油管一个宝藏女孩 CAN YOU FEEL THE LOVE TONIGHT (OST)

宝藏啥。。。细听本身声音很一般，后期调音很明显。视频和音频且不一致

2022-01-19 14:18:24 +08:00

回复了 jifengg 创建的主题 › 分享发现 › 体验了开源的离线语音识别模型 wenetspeech，准确度很高。分享一些使用心得。

@jifengg 恩语音 decode 部分还是不错的，要适配各种场景可能需要调整源码的 attention.py 这块。

2022-01-19 10:36:34 +08:00

回复了 jifengg 创建的主题 › 分享发现 › 体验了开源的离线语音识别模型 wenetspeech，准确度很高。分享一些使用心得。

要么字回拼音，然后用相似度对应行业专业名词去匹配。。

2022-01-19 10:17:13 +08:00

回复了 jifengg 创建的主题 › 分享发现 › 体验了开源的离线语音识别模型 wenetspeech，准确度很高。分享一些使用心得。

@jifengg 开始是用 ws 接口测试，发现较新的模型会较敏感，可能需要加入环境音降噪会比较好。后面就直接 docker_main 去跑音频切片，单从发音上成字已经较好了，但模型整体基于字的发音结构，成词准确率还不知道需要怎么提高。现在大概思路是想把分片结果再塞入一个上下文的类隐马尔可夫链模型去纠正词语。不知道您是怎么解决的？

2022-01-14 21:36:23 +08:00

回复了 jifengg 创建的主题 › 分享发现 › 体验了开源的离线语音识别模型 wenetspeech，准确度很高。分享一些使用心得。

11 月 2 日这个是不是很敏感，容易乱出字，是否有解决办法？ ps. 我还是用官方 docker 跑。

» canwushuang 创建的更多回复

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 5018 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 15ms · UTC 03:49 · PVG 11:49 · LAX 19:49 · JFK 22:49
♥ Do have faith in what you're doing.