V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
alexkkaa
V2EX  ›  问与答

现在的 tts 竟然已经成熟到主播可以失业了

  •  
  •   alexkkaa · 152 天前 · 3589 次点击
    这是一个创建于 152 天前的主题,其中的信息可能已经有所发展或是发生改变。

    头条的语音朗读已经可以完全媲美真人了,不光语句断句自然,而且还有声调,感情,角色模拟。 我听了十分钟小说才分辨出来这是 tts 简直惊呆了,感觉比很多主播念的都好。 以前很多平台的 tts 听起来很好,但是没有角色模拟,没有感情识别,听起来很生硬,但是现在竟然已经进化到这种地步了。不知道背后是头条自己开发的还是买的哪家的服务?

    第 1 条附言  ·  152 天前
    我很确定不是真人。因为几万本小说不可能一个人去录,你随便找本书,点开来听,温柔大叔和温柔大姐的最逼真。我还特地找了本汉字易错词的书去测,虽然很逼真,但是对多音字还是识别不准。
    28 条回复    2021-12-15 18:18:22 +08:00
    Woood
        1
    Woood  
       152 天前   ❤️ 1
    我觉得背后是真人
    hronro
        2
    hronro  
       152 天前
    没用过头条,有没有视频展示一下有多真实?
    alexkkaa
        3
    alexkkaa  
    OP
       152 天前 via Android
    @Woood 绝对不是 前几天有人发微软的 tts ,虽然很好,但是缺乏感情还是有点生硬,但是头条这个完全是跟真人没啥区别。
    alexkkaa
        4
    alexkkaa  
    OP
       152 天前 via Android
    @hronro 你下个番茄小说就可以了 这是头条旗下的
    fengxing
        5
    fengxing  
       152 天前 via Android
    讯飞的 tts ,比起真人还是不如的,也不如小娜这种,不过现在已经非常好了。
    Tianyan
        6
    Tianyan  
       152 天前
    是不是 提前人录音好的
    wu67
        7
    wu67  
       152 天前
    感觉是提前录好的. 或者你找本冷门的看能不能听? 验证一下
    IvanLi127
        8
    IvanLi127  
       152 天前
    得看啥样的主播,有的主播还不是几年前的 TTS 呢。
    mzlzero
        9
    mzlzero  
       152 天前
    很多短视频的背景音就是这样合成的呀,音色音调都很真实
    oreoiot
        10
    oreoiot  
       152 天前 via iPhone
    Woood
        11
    Woood  
       152 天前
    @alexkkaa 本身在这个行业,现在还是只有真人录音的会出色点,tts 头部的厂商是科大
    Rheinmetal
        12
    Rheinmetal  
       152 天前
    确定不是 提前录制好的有声小说么...
    zhuangjia
        13
    zhuangjia  
       152 天前
    部分阅读 APP 如我了解的“起点”,在你点击收听书籍的时候,如果存在对应有声书资源,会自动切换为播放有声书,而不是使用 TTS 。
    建议楼主按照 #7 楼的方式验证一下。毕竟 [角色模拟] 这个功能各家 TTS 都没有见宣传过
    cmdOptionKana
        14
    cmdOptionKana  
       152 天前
    @alexkkaa 没看懂,你用的是番茄小说还是哪个 app ,为什么会认为是 tts 而不是真人?现在小说很多真人录音的呀。
    cmdOptionKana
        15
    cmdOptionKana  
       152 天前
    @alexkkaa 下载了,明白了,是 tts ,那个温柔淑女音确实非常像真人,另外几种角色还是不太行。
    cmdOptionKana
        16
    cmdOptionKana  
       152 天前
    @alexkkaa 不对,就是真人,写着“AI 朗读”,但其实混入了真人…… 我真是服了头条
    wd
        17
    wd  
       152 天前 via iPhone
    @cmdOptionKana 想起来洗衣机里面有一个人帮你洗衣服那个漫画了
    p2pCoder
        18
    p2pCoder  
       152 天前
    一堆清北加上一堆显卡
    投入很大,智能创作这块还是有些成果
    @zhuangjia 抖快腾讯都在 AI 会议上展示过相关产品,不过一般不在 c 端暴露形态
    整体来说 tts 以及整个智能创作,这两年随着短视频的兴起,进步的速度是飞快的,不过,人力和显卡的投入是否已经完全能 cover 还是个问题
    cmdOptionKana
        19
    cmdOptionKana  
       152 天前
    @p2pCoder 原来如此,可能那个“温柔淑女音”真是 AI ,但由于成本问题只优化了一种音色,质量明显比其他音色好很多,真假难辨。
    adeng
        20
    adeng  
       152 天前   ❤️ 3
    @oreoiot 我在车站自助机取票,记不清干什么了,从里边传出来一个声音:你等会,我给你拿出来 然后钻出来一个工作人员 😂
    ronman
        21
    ronman  
       152 天前 via Android
    试试微软的 xiaoxiao
    Cielsky
        22
    Cielsky  
       152 天前 via Android
    @alexkkaa 微软的也很难听出来啊,不过的自己稍微调一下
    ClericPy
        23
    ClericPy  
       152 天前
    公交车上听那些开抖音的每次都是同一个声音说话, 是 TTS 发出来的么, 感觉很烦
    documentzhangx66
        24
    documentzhangx66  
       152 天前
    楼主对主播可能有一些误解。主播一般是播游戏,或才艺展示,或颜值展示。目前顶流主播大多是游戏主播,这些与 TTS 是没什么关联的。

    而且就拿配音行业来说,职业的配音行业,也没 TTS 啥事,因为 TTS 目前做不到职业配音的程度。

    TTS 目前主要是方便了抖音或 B 站这类普通视频制作者,以及小说朗读等。在这个方向上,能以很低的成本,获取质量还不错的机械化配音。虽然是机械化配音,但对于大部分普通人来说,足够了。
    alexkkaa
        25
    alexkkaa  
    OP
       152 天前 via Android
    @documentzhangx66 我说的主播是喜马拉雅这种有声书 不是 b 站那种。听小说确实不需要那么专业,但是这样的表现已经可以满足 80%使用情景了。
    zingl
        26
    zingl  
       152 天前
    能离线本地使用么?不然怎么听小黄书
    Zien
        27
    Zien  
       152 天前 via iPhone
    微信读书有一次我都没听出来, 还有一次营销电话也是。
    liaoliaojun
        28
    liaoliaojun  
       151 天前
    声音拟合
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4071 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 08:36 · PVG 16:36 · LAX 01:36 · JFK 04:36
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.