1
Soar360 2022-06-23 09:21:11 +08:00
语言转文字,分词,然后自动归类?
|
2
0x2CA 2022-06-23 09:21:54 +08:00
行的通,但是你开发一个花费时间找就分好了,除非你量大,而且后面经常用
|
3
shilianmlxg 2022-06-23 09:31:44 +08:00
不如用 sony 的 mediago 。记得它的分类是自带。只是解析很慢
|
4
jhjguxin 2022-06-23 09:41:18 +08:00
写个程序主要做下面几件事情
第一步遍历需要处理的文件列表 第二步截取每个文件的前 10 秒(如果文件数量并不大,长度也小可以忽略此步骤) 第三步调用类似科大讯飞语音转写 API 接口( https://www.xfyun.cn/doc/asr/lfasr/API.html ) 第四步在提取出的文字中匹配你所需的分类关键字,如果成功进行第五步 第五部根据匹配到的关键字将对应文件进行分类处理 第六步将前面第 2-5 步操作失败的文件单独标记进行人工处理即可 |
5
snoopyhai 2022-06-23 10:01:39 +08:00
网上有语音质检的能力. 找找看. 能不能基于质检去做一些特别设定.
|
7
darkengine 2022-06-23 10:08:07 +08:00
speech to text ,再接个自然语言处理,然后分类
|
8
fyxtc OP @Soar360
@shilianmlxg @snoopyhai @jhjguxin 感谢提供建议,不过分词是铁定不行的,有时候还需要联系上下句语义才能处理,而且有的还包含外语,所以只能人工听才能分。 |
9
Buges 2022-06-23 10:29:14 +08:00 via Android
如果隐私能接受,直接买讯飞的转文字(中文)
|
10
tfdetang 2022-06-23 11:00:29 +08:00
突然让我想到前段时接很火的那个电视剧 <人生切割术>
其实我很好奇,人是怎么分类的? 标准是什么? 因为只要听 10 秒 感觉应该也不是特别复杂的上下文理解 其实用 AI 分类不一定非要转文字啥的,也可以直接拿着音频数据作为一个序列信息来进行分类啊。 也不需要写任何规则只需要先人工分一部分数据就行了。 只是一共就几千条数据上 AI 显然是不太划算的,得是一个持续性的长期工作才有价值 |
11
Juszoe 2022-06-23 11:21:13 +08:00
几千个还是人工处理吧,但 OP 有些小看 AI 了,这种分类是标准的 AI 适用场景,不需要写规则,打上类别标签就好了,难点就在于数据集要自己收集。
如果要求 100%准确率,可能 AI 确实不合适 |
12
wudicgi 2022-06-23 11:43:18 +08:00
如果机器识别不可行的话, 楼主需要的是一个可以在界面上当场进行文件重命名操作的音频播放器?
|
13
yufeng0681 2022-06-23 12:14:01 +08:00 2
原始诉求 还得往前回溯。 目前看是你想要的一个解决方案。
1 、如果是长期工作,能不能让负责提供素材的人,就按照要求格式提供素材; 2 、如果是自己采集的素材,也是临时工作,那就看看有没有其他规律可以寻觅,不行的话就只能人工分拣。 3 、人工分拣,建议用阿里云盘。 它能在线播放音频。 3.1 你听到 1 类的,你就收藏, 进入收藏库 3.2 你听到 2 类的,你就下载,再次下载到本地目录 2 3.3 如果是 3 累的,你不用处理, 等全部处理完毕, 把收藏 1 类的下载到本地第二个目录 1 3.4 你把本地音频和下载的 1 2 类音频 放一起,全部排序,按同名排序,把孤单的 3 类文件,ctrl 选中,然后复制一份到新的目录 3 里, 就成了。 |
14
yufeng0681 2022-06-23 12:16:29 +08:00
注 :阿里云盘的音乐播放界面, 有上一项,下一项, 收藏,下载,分享,按钮。
重命名和移动按钮在 more 里面,要多点击一下,麻烦。。 |
15
fyxtc OP @yufeng0681 谢谢,很有收获。我试了一下云盘下一项的时候并不会自动播放而是顺序播完才播的下一项,而且按空格也不会触发播放,这一点挺难受的,不知可有解决方案。
|
16
libook 2022-06-23 14:49:05 +08:00
加个撤销机制以防按错,然后我觉得就可以做个 MVP 方案让负责分类的人员试用一下了,看是否提升了效率,然后根据反馈再优化。
|
17
dddd1919 2022-06-23 14:51:53 +08:00
100 块钱,雇个人
|
18
yufeng0681 2022-06-23 16:38:05 +08:00
@fyxtc 感觉是阿里云盘的一个 bug ,或者说体验不合理的地方, 要不给阿里云盘提个问题单,让他修复一下?
下一项,如果不想动。 那就在播放器那边增加 上一曲,下一曲 的功能,切换快捷键 是 播放器的必须项目。 |
19
XimuTao 2022-06-24 10:10:20 +08:00
根据按键分类这个思路, 我写过一个用来分类图片的[photo-classification]( https://github.com/ximu-tao/photo-classification), 需要的话我可以帮你改一个音频版本的
|
21
XimuTao 2022-06-24 13:46:08 +08:00 1
@fyxtc https://github.com/ximu-tao/photo-classification/releases ,下载 audio-classification ,因为一直只有自己在用,所以有些小问题一直没修复,使用的时候注意一下
|