V2sub 是基于最新 ASR (自动语音识别)技术开发的一款 AI 智能字幕生成软件, 可将任意视频 转换为各种语言的字幕, 软件操作简单, 任何人可以轻松一键生成。 从此看剧不用愁 支持十几种语言, 支持 GPU 加速, 基于 OpenAI 技术构建
软件主要功能:
邮箱: [email protected] 微信:aizimuji QQ 群:157222123
![]() |
1
Microi 176 天前 ![]() 优秀,支持。
|
2
dawe 176 天前 via iPhone ![]() 这个是只是把 whisper 用 gui 包装了一下还是有什么改进?
|
3
closedevice 176 天前
自己训练的模型?
|
![]() |
4
sytao 176 天前 via iPhone
下载试试!
|
5
renmu 176 天前 via Android
盲猜 whisper 包装了一下,然后用 chatgpt 进行翻译😂
|
6
imicksoft 176 天前
前几天用 subtitle-edit 生成字幕,6 分钟中文影片生成字幕用了半天时间
而同事用剪影就很快,可惜我的电脑 aero 效果不能开了,无法用剪影 |
![]() |
9
Wenbobobo 176 天前 via Android ![]() 不是,whipser.cpp 有 GPU 版本的 gui 吖
Const-me/Whisper: High-performance GPGPU inference of OpenAI's Whisper…https://github.com/Const-me/Whisper |
11
CRipple 176 天前
支持,下载试一试
|
![]() |
12
xzheng 176 天前
不支持 OSX ?
|
![]() |
14
makelove 176 天前
之前看过一个 whisper 评测 https://blog.lopp.net/openai-whisper-transcription-testing/
cpu 的性能几乎不能忍,gpu 的性能几十倍于 cpu |
![]() |
15
xzheng 176 天前
CPU 版能打包个 OSX 版本吗? V2EX 社区 OSX 用户可能比较主流。
|
16
vokins 176 天前 via iPhone
很高级收藏了
|
![]() |
18
shiqueb 176 天前 via Android ![]() https://github.com/abdeladim-s/subsai
同样的功能,GPL 开源 |
20
loli 176 天前
用过 whisper,效果不错
但有个很严重的问题,时长较久的视频会产生大量重复的内容 甚至会从某个时间段完全重复到结尾 以下 issues 也提到了 https://github.com/Const-me/Whisper/issues/26 想了一些方法但都是用户侧的,最后还是决定等待更新 不知道 up 作为开发有什么解决方案没 |
21
yunyuyuan 176 天前
闭源产品?那和字节的剪映相比有什么优势吗,剪映还不需要自己的 GPU
|
![]() |
22
javaluo 176 天前
可以设置为中英双语么
中英两行放在一起 |
![]() |
23
guoyan 176 天前
这么厉害。太棒了。
|
![]() |
24
Wpaengd 176 天前
优秀
|
![]() |
27
iorilu OP @loli 是的,目前还有重复, 或者模型自己幻想出来都有,就是其实视频是杂音非人声,但模型有产出
我看了一些资料,目前据我所知没有很完善的方案 我最近想先发布一个初始版本 后面会关注这些问题,有合适方案会更新的 |
30
Death 176 天前 ![]() |
31
KasonKwok 176 天前
可以尝试下 [buzz]( https://github.com/chidiwilliams/buzz) 跨平台,支持在线 api 和离线模型转换,可以导出字幕,如果是影片的话可以用 ffmpeg 先取音频
|
![]() |
33
luckyswag 176 天前
感觉最近搭配 whisper + 翻译会有不少产品出现
|
![]() |
34
JCZ2MkKb5S8ZX9pq 176 天前
@loli #20
同遇到过这个问题,大段重复,发生原因不详。 |
35
XiaoBaiYa 176 天前
大段重复解决了吗,这个解决了基本就可以商用了
|
38
hanguofu 176 天前
有没有人试过用哪个 离线的 ASR (自动语音识别)技术对普通话 有比较高的识别率 ?
|
![]() |
39
KousukeSakurako 176 天前
居然不支持 mp3
|
![]() |
41
ViolaH 176 天前 via iPhone
个人目前做字幕(日-英&中)的方案是在 colab 上面跑 whisper ,然后将生成的日语字幕文件在本地进行内容和时间轴校对( whisper 的时间轴有时候会很错乱,以及上面提到的重复问题,但是内容识别准确度还是极其高的,基本不用改),校对后再用 ChatGPT 翻译
|
![]() |
44
iorilu OP chatgpt 翻译字幕有个对齐得问题
我前段时间本来想把 chatgpt 翻译器加上, 后来发现没解决这个对齐问题 比如说我发十句话, 希望 chatgpt 返回十句话, 不要自行进行合并处理 找了下没看到好的方案, 后来暂时搁置了 除非一句一句发, 但效率太低 |
![]() |
46
lemonda 175 天前
可以转音频么?
因为我做视频时直接录音总是脑子有点转不过来,后期配音从容些。 能根据字幕生成 ffmpeg 裁剪命令么? 能的话可以一定程度替代 descript 了 |
47
mayq0422 175 天前 via Android
|
![]() |
48
EndDream 175 天前
我试了一下,和 buzz 一样,识别出来的的时间轴有问题,有时候会强行连在一起,明明就一句话,中间还有一段时间不说话,但是时间轴却一直延伸到下一句话,我问了 buzz 那边的作者是说是模型问题
|
49
lylmydear 175 天前
试了一下,后期可以考虑加入简英 繁英和 ass 效果这些, NAS 党是很需要的,很多片源都没有对应的字幕.
|
50
NeedforV2 175 天前
先试试效果
|
![]() |
51
witcherhope 175 天前
你在 i2ex 论坛不支持 macOS ,推广有点困难哈哈
|
![]() |
52
muchenlou 175 天前
很酷
|
![]() |
53
iorilu OP @witcherhope 暂没, 会尽快搞一个看看
有人试过如果用老 macbook ,intel 芯片的, 编译打包软件, 能在新 macbook m1 ,m2 用吗 我有个老 macbook ,intel 芯片的 |
![]() |
54
snowish 175 天前
不错不错,当年我学习英语的时候很想要一个这样的软件。后来我的英语听力上去了,就直接看美剧了,美其名曰啃生肉。
|
![]() |
56
zcf0508 175 天前 via Android
|
![]() |
57
iorilu OP |
58
ColoThor 175 天前
免费版只支持前 10 分钟。。
|
60
shaojz2005 175 天前
如何收费呢
|
![]() |
61
iorilu OP |
64
lamquan 174 天前
已经文稿了,能实现自动打轴功能吗
|
65
fenglingyu 174 天前
@mayq0422 这个也不行,试了下,30 行字幕,合并成 25 行,有时候加的限制多了,chatgpt 为了保证行数,直接变成复读机,重复输出几行。
|
66
zky001 174 天前
我自己也做了一个自用 代码基本上是 gpt 生成的,我调试了一下 主要用在看岛国的爱情片上 效果挺不错的 也是 whisper+gpt api
|
![]() |
69
iorilu OP |
![]() |
70
iorilu OP V2sub - AI 字幕机 新版本 0.4.0 发布
文件已上传至网盘 该版本新增若干功能, 具体如下 - 增加音频处理 , 可处理 mp3 ,wav 等众多格式 (专业版独享) - 增加单独字幕翻译功能(专业版独享) - 增加双语字幕生成功能 - 增加双语字幕设置, 可控制源语言在上或在下 - 增加智能跳过已生成字幕功能, 避免重复劳动 网盘也有升级包下载, 请各位根据自己版本进行升级, 也有完整完整包 |
![]() |
71
fengtalk 167 天前
看了 B 站演示视频,效果不错。
|
![]() |
72
iorilu OP V2sub - AI 字幕机 0.5.0 发布文档 发布时间:
### 发布时间:2023-04-21 ### 该版本新增若干功能, 具体如下 - 主窗口支持文件拖拽 - 翻译增加语言设置, 设定中文输出为简体中文或繁体中文 - 翻译器换为 google 翻译, 翻译更稳定, 速度大幅提高 - 语言支持增加印地语, 乌克兰语 |
![]() |
73
iorilu OP V2sub - AI 字幕机 0.6.0 发布文档
发布时间:2023-05-13 AI 字幕机官网已上线 AI 字幕机产品网站 ( https://www.aizimuji.com) AI 字幕机注册码销售网站 ( https://buy.aizimuji.com) 该版本有重大更新, 具体如下 模型计算框架更换, 实现更快转录速度, 更少显存占用 CPU 版, GPU 版速度提升 30-50% GPU 版显存占用大幅降低, 中模型仅需不到 4G 显存, 大模型仅需不到 6G 显存 转录准确性也有相应提高, 但还有优化空间 修复部分 Bug 因该版本变化巨大, 和老版本不兼容, 故不提供升级包, 请大家下载完整包使 用, 注册码有效期内可在新版本重新注册, 不影响 重大提示 该版本模型也完全更新, 和旧模型不兼容, 请重新下载新模型使用, 安装方法也有部分变化 ## 软件下载 - 百度盘 ( https://pan.baidu.com/s/1Btn3shMcs_5Z-zYh7P4c9w?pwd=3ev6 提取码:3ev6 ) - 123 网盘 ( https://www.123pan.com/s/toZZVv-b7TGA) |
![]() |
74
iorilu OP macOS 版开发完成, 已经上传了
- AI 字幕机产品网站 ([https://www.aizimuji.com]( https://www.aizimuji.com)) - AI 字幕机注册码销售网站 ([https://buy.aizimuji.com]( https://buy.aizimuji.com)) 软件下载 百度盘 ( https://pan.baidu.com/s/1Btn3shMcs_5Z-zYh7P4c9w?pwd=3ev6 提取码:3ev6 ) 123 网盘 ( https://www.123pan.com/s/toZZVv-b7TGA |
![]() |
76
iorilu OP |
77
XiaoBaiYa 117 天前
LZ 重复的问题解决了吗?
|
![]() |
78
iorilu OP V2sub - AI 字幕机 0.7.0 发布文档
### 发布时间:2023-06-05 ### 该版本有重大更新, 具体如下 功能更新: - 增加 ChatGPT 翻译器, 以及翻译配置菜单功能 (仅供专业版) - 增加 cpu 全速模式开关, 使用 cpu 计算时可以提高 30%-50%性能, 主要针对没有 GPU 的用户(仅供专业版) - 翻译增加中途保存功能, 便于发生错误后继续上次进度 - 优化模型转录字幕方式, 很好提升了生成字幕的时间轴准确性, 可用程度大幅提高, 已基本接近人工做的字幕 - 使用新的打包方式, 体积大幅减小 - 合并 CPU 和 GPU 版, 以后 Windows 只发布一个版本, 方便用户使用, 软件自动判断系统是否支持 GPU , 会优先使用 GPU , 没有 GPU 自动使用 CPU - 增加注册码过期后, 可以继续使用免费版功能, 避免重新安装 Bug 修复: - 修复模型不支持中文路径 bug , 现在软件可以随便放置在中文或英文目录 |
83
jsshwqz 90 天前
支持直接转中文发音不?网上有款,但收费太高,
|
85
Rrrrrr 78 天前
我觉得卖给视频播放软件会好很多,这样使用太麻烦
|
![]() |
86
qqjt 77 天前
厉害,实践出真钱
|
87
mstephenses9531 34 天前
没看懂
|