一款语音输入工具,后台运行脚本后,按下大写锁定键超过 0.3 秒后,开始语音识别,松开按键之后,自动输入识别结果。
上面打包下载的链接在 V2EX 可能用不了,可以到 我在 Hacpai 的帖子 中查看下载
我就气抖冷,为什么直到现在,仍然没有开发者做过一个好用的语音输入工具?
有人建议用搜狗输入法、讯飞输入法的语音输入,但这几个方面是真让人受不了:
Ctrl + Shift + A/B/C……
,有以下槽点:
为了在电脑上语音输入,我之前是用的 Quicker 的手机端进行语音识别,输入到电脑上,需要两个设备,非常麻烦。今天终于做好我心目中最好用的电脑端语音输入工具了!
本工具( Caps Writer )是一个电脑端的语音输入工具,使用了阿里云的一句话识别 api
(有兴趣的可以改成百度、腾讯、讯飞的 api 试试)。
使用方法很简单:用 python 运行 run.py
后,按下 Caps Lock
(也就是大写锁定键)超过 0.3 秒后,就会开始用阿里云的 api 进行语音识别,松开按键后,会将识别结果自动输入。
对于聊天时候进行快捷输入、写代码时快速加入中文注释非常的方便。
上面的 mp4 视频链接在 V2EX 可能播放不了,可以到 我在 Hacpai 的帖子 中播放查看
无需编译,clone 下来将依赖安装上、api 填上就可以用了。
本工具是一个 python 脚本,依赖于以下模块:
其中:
另外,需要在 run.py
中填入阿里云拥有 管理智能语音交互( NLS ) 权限的 RAM 访问控制 用户的 accessID、accessKey 和智能语音交互语音识别项目的 appkey 。
做完以上步骤后,只要运行 run.py
就可以用了!
本文件夹内有一个 安装指南
文件夹,在里面可以找到详细的安装指南,还包括了提前下载的 alibabacloud-nls-python-sdk 和 pyaudio 的 whl 文件。
因为作者就是本着凑合能用就可以了的心态做这个工具的,所以图形界面什么的也没做,整个工具单纯就一个脚本,功能也就一个,按住大写锁定键开始语音识别,松开后输入结果。目前作者本人已经很满意。
欢迎有想法有能力的人将这个工具加以改进,比如加入讯飞、腾讯、百度的语音识别 api,长按 0.3 秒后开始识别时加一个提示等等等等。
1
kele999 2020-07-10 22:25:28 +08:00
黑客派牛逼啊
|
2
Themyth 2020-07-10 22:34:53 +08:00
MAC 下自带的语音识别按两下 fn 也挺好用的。
|
3
dioxide 2020-07-11 00:56:26 +08:00
想问: 目前的“语言识别”的实现能达到产品级的只有这些“巨头”的私有 API 么? 可否有开源的轮子?
|
5
laycher 2020-07-11 01:52:47 +08:00
果然再怎么用都不如自己做的好。
果然黑客派! |
6
666orz 2020-07-21 16:55:28 +08:00
试了一下,也没报错,也没有输入……
|