V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
jiaqiliu
V2EX  ›  云计算

寻找飞书妙记(语音转文本)平替?

  •  
  •   jiaqiliu · 21 天前 · 1741 次点击

    飞书妙记的免费版开始限制 ASR 的时长了(每月 300 分钟)。有没有其他免费的替代品?或者本地部署的也可以。

    https://imgur.com/a/AzL3e7i

    16 条回复    2024-11-13 19:42:47 +08:00
    wkla
        1
    wkla  
       20 天前
    openai whisper.
    阿里达摩院 funasr.
    jiaqiliu
        2
    jiaqiliu  
    OP
       20 天前
    自己简单研究了下,有几个工具,都是离线方案:

    https://github.com/CheshireCC/faster-whisper-GUI
    faster-whisper 的 GUI ,bug 有点多,任务经常卡死,弃

    https://github.com/chidiwilliams/buzz
    也是一些 asr 引擎的 GUI ,比 faster-whisper 稳定,但是在我电脑上无法正常调用 GPU ,弃

    https://github.com/SubtitleEdit/subtitleedit
    主要是一个字母编辑软件,但是其中可以调用自选的底层引擎进行 ASR ,可以正常使用 GPU ,缺点是 ASR 没有进度条,其他还不错目前用的这个。笔记本 4060 ,用 largev3 模型处理一个 90 分钟的视频耗时 15 分钟。
    cyp0633
        3
    cyp0633  
       20 天前
    实现随便你,但是搭配的模型可以试试 belle-large-v3-punct ,在 whisper 基础上微调过效果好多了
    simonsww
        4
    simonsww  
       20 天前
    同找,妙记日常用的还挺多
    janpun
        5
    janpun  
       20 天前
    我也在找,妙记用的很多,企业级应用就是这点不好,我可以接受付款,但绑定了整个大平台的付费我就不想买了,因为我只用这个功能
    pozhenzi998
        6
    pozhenzi998  
       20 天前
    JensenQian
        7
    JensenQian  
       20 天前
    有黄老板显卡的话我用的这个 https://github.com/chidiwilliams/buzz
    JensenQian
        8
    JensenQian  
       20 天前
    @JensenQian https://github.com/chidiwilliams/buzz/blob/main/CONTRIBUTING.md#gpu-support
    默认用的 cpu ,gpu 的话自己看他文档设置,不过得有 cuda

    https://github.com/Const-me/Whisper
    这个支持 amd 的 gpu ,我的 6800H 的核显也能跑,但是好久没更新了
    steelshadow39
        9
    steelshadow39  
       20 天前
    最近看了阿里云的通义听悟,可以试试
    wulv
        10
    wulv  
       20 天前
    通义听悟、钉钉闪记
    Xi
        11
    Xi  
       20 天前
    通义听悟
    linxi7
        12
    linxi7  
       20 天前
    600 块一年,还有 1500 GB 云存储,平时再用用云文档之类的,感觉能回本。
    juicy
        13
    juicy  
       20 天前
    iorilu
        14
    iorilu  
       20 天前
    太多了, 自己折腾可以用 whisper

    或者我开发得 ai 字幕机 (www.aizimuji.com)
    ladeo
        15
    ladeo  
       20 天前
    通义听悟
    s4d
        16
    s4d  
       20 天前
    我用三星手机自带的录音,AI 转录能识别音色,体验很棒。

    这个叫 Galaxy AI 。

    没有使用限制,但是貌似不能上传录音,必须用手机录。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3097 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 14:28 · PVG 22:28 · LAX 06:28 · JFK 09:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.