V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
juicy
V2EX  ›  分享创造

青梧字幕 - AI 音视频字幕自动提取工具

  •  
  •   juicy · 329 天前 · 2047 次点击
    这是一个创建于 329 天前的主题,其中的信息可能已经有所发展或是发生改变。
    作为一个老 v2exer ,好几年没发言了。这次重新出现是为了给大家推荐一下我们开发的一款产品:青梧字幕,它是一款利用 whisper 来提取视频中字幕的软件。虽然貌似已经有很多类似的产品了,但是因为很早就有这个想法,而且市面上已有的软件侧重点可能跟我们认为的不太一样,所以我们最终还是开发出来了。

    我们的项目主页:

    https://c8lzozw51w.feishu.cn/docx/XOyrdvCmwoUhboxrcT0csCP5nRf

    它目前的 0.9.2 版本有以下一些特点:

    1.相对友好不至于太 Geek 的交互
    2.支持 Windows 下使用 GPU 加速提速字幕
    3.支持多任务排队执行
    4.目前支持国内的 3 个翻译渠道:百度、有道、阿里
    5.支持下载 srt 和 vtt
    6.支持简单的行内字幕编辑保存

    欢迎大家下载体验,有任何问题和建议,都可以加群给我们反馈。关于 GPU ,我个人台式机用的是一款老古董 GeForce 1060 显卡。。提取的速度甚至远比不上苹果的 M2 CPU 。迫切地希望各位拥有超高性能显卡的大佬们能尝试一下,看看字幕提取性能究竟能达到什么样的程度:)

    另外,今天正值七夕节,愿你与心爱的人牵手共度,甜蜜如诗,幸福如画:)
    19 条回复    2023-08-24 17:49:58 +08:00
    MemoHQ
        1
    MemoHQ  
       329 天前
    坦白说,同是开发者,抄袭 Memo.ac 的文档格式、界面样式有一些不厚道。https://mxmefbp9p0g.feishu.cn/docx/ZI3ldweTXorTvMxYLbucT00Un5n
    juicy
        2
    juicy  
    OP
       329 天前
    @MemoHQ 。。。飞书就这些样式 feature ,要弄得好看一点就看上去很雷同啊
    MemoHQ
        3
    MemoHQ  
       329 天前
    @juicy 所以,文档格式恰好和我们雷同了?界面也雷同了?抄袭还这么要强属实没必要。说真的,同是开发者,认真备注一下参考我们也行啊。
    MemoHQ
        4
    MemoHQ  
       329 天前
    以及:![青梧字幕抄袭 Memo.ac 的截图]( https://vip2.loli.io/2023/08/22/v68yIDXG7feAiNS.png)
    lailaileem
        5
    lailaileem  
       328 天前
    @MemoHQ 哪里雷同的,你们不都用的飞书吗
    zagfai
        6
    zagfai  
       328 天前
    @MemoHQ 硬推也不能像你这样的。。。抄袭文档格式都能说出来。。。
    ningshen8
        7
    ningshen8  
       328 天前
    不错不错
    yuanchao
        8
    yuanchao  
       328 天前
    @MemoHQ 讲真,确实没看出来哪里抄袭了,这些不都是飞书自带的吗
    MemoAI
        9
    MemoAI  
       328 天前
    @yuanchao @lailaileem @zagfai 因为我提完问题就修改了啊,我截图留了,我觉得可以复制,但是标注来源就行了。

    - 复制我们模板: https://vip2.loli.io/2023/08/23/4CJ3wXoa5IFkyAS.png
    - Memo 的导航栏界面,转换的界面: https://vip2.loli.io/2023/08/23/UGnfoeOYMv7Pyrd.pnghttps://vip2.loli.io/2023/08/23/p3Dqc4SaWVK6b1F.png
    - 贵产品界面: https://vip2.loli.io/2023/08/23/emkTWnJEFQZoCAx.png
    MemoAI
        10
    MemoAI  
       328 天前
    MemoAI
        11
    MemoAI  
       328 天前
    Memo 界面: https://vip2.loli.io/2023/08/23/9dHsDFvp8OyLERq.png
    贵产品界面: https://vip2.loli.io/2023/08/23/emkTWnJEFQZoCAx.png

    @juicy 我只需要一个声明,你可以抄,但是可以声明一下。
    MemoAI
        12
    MemoAI  
       328 天前
    @juicy 我的诉求:请在你的产品首页中,声明一下你的行为,如果后续保持样式框架一样,请在首页保持好声明。同是开发者,你也不希望你辛苦做的产品被人扒皮过去了吧?
    juicy
        13
    juicy  
    OP
       328 天前
    @MemoAI 我这边一一回应一下

    1.关于模版,下载一个副本的原因是对其中的飞书的两栏和三栏布局的展示觉得非常适合三个平台和两类模型的应用下载,我们曾经也想最好不要做成跟你们雷同,但是找遍飞书的格式,两栏三栏并列展示的只能是跟你们类似的展示方式,没有其他方式了。但凡飞书提供其他的样式,我们不会做的跟你们雷同。但你们觉得两栏三栏并列展示是你们的“创意”,那我也表示很无奈,现在我已经改回一级二级三级标题了,不想跟你们在这个问题上在争论了。

    2.字幕提取的界面:用户需要先选一个视频文件,需要一个入口,用户需要看曾经提取过历史记录,所以需要一个列表,这中交互都成了你们单独的特权了吗?

    3.提取设置里:选择模型,选择语言,添加提示词,这个都是开源的 whisper 软件要求的输入项,很多的利用 whisper 开发的应用都必须要有这些选项,我们的产品不让用户选择这些内容,怎么利用 whisper ?现在我们支持了 GPU ,但是 Memo 还没开发 GPU 的部分,未来你们也开发了这个功能,我们是不是可以说你们抄袭我们的利用 GPU 提取的功能?

    你们的代码难道是全部公开然后我们直接复制粘贴过来的么?我们也是一行一行写出来的!这些样式和交互并不是你们独有的专利,淘宝有购物车功能,京东和拼多多都有,而且都很类似,难道就因为淘宝先做出来,然后京东就不能开发购物车功能了?

    与其在这里争吵,我们还是各自还是抓紧时间回去打磨自己的产品吧,做好产品让用户支持才是真的实力。
    MemoAI
        14
    MemoAI  
       328 天前
    @juicy 大哥,导航栏 logo ,设置都一样的布局,真没见过直接参考还理直气壮的,真牛逼。复制我们模板,参考布局,一句谢谢都没?
    MemoAI
        15
    MemoAI  
       328 天前
    @juicy 以及,我表达的是:你拿别人的东西,一句谢谢没有,反而理直气壮觉得自己应该拿?真不害臊。
    juicy
        16
    juicy  
    OP
       327 天前
    v0.9.3 发布
    增加了 [火山翻译]

    到目前为止总共有百度、阿里、有道、火山四个国内翻译渠道
    除了有道只有刚注册时的 10 元代金券,其他的三个每个月都有免费的翻译额度:
    百度每月免费额度:未实名-5 万字符,已实名-100 万字符
    阿里每月免费额度:100 万字符
    火山每月免费额度:200 万字符

    p.s. 有高性能显卡的小伙伴可以试试用 GPU 提取看看,0.9.2 开始支持 GPU ,效果应该会很不错
    go522000
        17
    go522000  
       327 天前
    看不出界面上有什么相同的。
    zagfai
        18
    zagfai  
       327 天前
    @MemoHQ 恕我不敢苟同你的观点,但凡有一段超过 50 字一样的文字,我也认可是有抄袭,就算你的截图怎样看也只能说是。。。参考。。。
    zagfai
        19
    zagfai  
       327 天前
    更好的其实你们可以合作 哈哈哈
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2340 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 15:47 · PVG 23:47 · LAX 08:47 · JFK 11:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.