829939 最近的时间轴更新
829939

829939

V2EX 第 254314 号会员,加入于 2017-09-14 12:21:03 +08:00
全球音频领域哪家强?盘点常用的相关 Python 库
  •  1   
    程序员  •  829939  •  2 小时 34 分钟前  •  最后回复来自 ManxCat
    7
    开源一个跨平台可用于机器学习的音频特征提取库
  •  2   
    iDev  •  829939  •  5 天前  •  最后回复来自 CMLab
    1
    audioFlux - 一个系统的音频特征提取库,可用于深度学习
  •  4   
    分享创造  •  829939  •  9 天前  •  最后回复来自 lbingl
    10
    Python 音频分析、特征提取的开源库
  •  2   
    Python  •  829939  •  20 天前  •  最后回复来自 zephyr1
    7
    有没有社区类开源小程序项目?
    问与答  •  829939  •  2019-07-08 23:42:24 PM  •  最后回复来自 zxih123
    1
    829939 最近回复了
    @CMLab 和弦识别算法传统数字信号领域算法通常的使用 chroma 特征做类似模板匹配,还有一些 NMF 相关的算法,这些传统经典算法和深度学习相结合,在这块目前发表的一些 paper 都有不错的识别效果。
    @chatWell1 你说的问题类似谐波打击乐分离(HPSS),项目中的 hpss 相关算法可以测试下效果。
    @chancat
    @SevenElevenZ

    感谢支持!
    如果你对这个项目感兴趣或有意向加入其中,非常欢迎你的加入,和我一起完善这个项目。
    @yingdashi 计算机人工智能方向,业务上使用的话不需要,深度开发的要掌握一些
    @james0517 大佬提的这个业务属于音源分离,一般常用的做法是频域掩码,最简单的就是二值化掩码,有很多这块定向算法的研究,典型的如 NMF 算法相关的有很多种,很多也取得不错的效果,但效果好的还是使用深度学习训练频域掩码,也是这些年音频领域研究的热点之一。
    腾讯是真流氓。
    我以前的域名邮箱 没转成企业微信 早已不能用了。
    @stanwanng ECG 属于时序信号,频率非常低,侦测上突变相关的特征非常重要,可以采用 CWT(分析突变的好手)二维频谱数据直接走 CNN 卷积网络分类训练。

    至于是否可用项目中 audio 特征,从信号领域来看都是一样,但 ECG 和 audio 本身而言差异还是比较明显,具体这块我也不太专业,推荐比较有名的,针对生物信号的 NeuroKit 开源项目可以研究下。
    @beneo 我用的 PPT 。 工具了解的不多。app.diagrams.net 这个在线工具可以试下
    @butterls 1. “希望通过音频数据生成基础触感数据”,音频有很多特征数据可以驱动马达,如果要求是特定强度的频率震动跟随音乐鼓点的话,端点和当前范围内功率谱就可以, 是否类似音乐播放可视化震动这种效果?

    2. “非规律音频” 有很多,如你所说枪声,脚步这些的区分,时域上典型的有包络,频域上有频谱、mfcc 等,如果短时突变信号多的话,可以用 CWT ,至于如何映射,这个具体和你的业务测试情况相关了,可以尝试常见的 mel/bark/erb 这些听觉刻度模型映射测验小效果。
    @602120734 清华镜像目前看起来同步的比较慢,请先使用官方源或者阿里镜像。
    关于   ·   帮助文档   ·   博客   ·   nftychat   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   实用小工具   ·   3337 人在线   最高记录 5556   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 04:37 · PVG 12:37 · LAX 21:37 · JFK 00:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.