V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
nonfu
V2EX  ›  OpenAI

给我的 ChatGPT 加了语音功能,貌似效果还行

  •  1
     
  •   nonfu · 2023-03-10 09:58:43 +08:00 · 4684 次点击
    这是一个创建于 649 天前的主题,其中的信息可能已经有所发展或是发生改变。

    昨天给我的克隆版 ChatGPT - GeekChat 加了语音支持(语音识别由 OpenAI Whisper 模型驱动):

    貌似效果还行,感兴趣的可以试试:GeekChat - 免费体验版 ChatGPT

    另外,大家有什么好的靠谱的中文语音 API 欢迎给我推荐,之前没怎么接触过这块。

    第 1 条附言  ·  2023-03-10 15:03:15 +08:00
    大家测试下就好 能少用少用哈 手下留情 这个 API 费用估计这个月得好几百美金。。。
    第 2 条附言  ·  2023-03-13 10:41:20 +08:00

    周末把前端 UI 重构了一下:

    30 条回复    2023-03-13 09:27:55 +08:00
    xujinkai
        1
    xujinkai  
       2023-03-10 10:11:41 +08:00 via Android
    🤣离涩涩聊天机器人又近了一步
    tianyou666shen
        2
    tianyou666shen  
       2023-03-10 10:29:11 +08:00
    拿来练习英语是不是也蛮好用的
    nonfu
        3
    nonfu  
    OP
       2023-03-10 10:41:47 +08:00
    @tianyou666shen 嗯 是的
    laixy9527
        4
    laixy9527  
       2023-03-10 11:10:37 +08:00
    题主是用的哪款语音软件或接口?方便透露么
    vsitebon
        5
    vsitebon  
       2023-03-10 11:14:00 +08:00
    @laixy9527 #4 题主的帖子里面说了,用的 OpenAi Whisper
    Metre
        6
    Metre  
       2023-03-10 11:20:49 +08:00   ❤️ 1
    结果也搞成语音~
    redditer
        7
    redditer  
       2023-03-10 11:35:53 +08:00
    考虑开源吗?
    AoEiuV020CN
        8
    AoEiuV020CN  
       2023-03-10 12:06:52 +08:00
    现在看 chatGPT 的回复都会脑补出老高與小茉的声音,感觉他们小茉念 chatGPT 的回复声音非常合适,
    shuxiaokai
        9
    shuxiaokai  
       2023-03-10 13:53:33 +08:00 via Android
    lambdaq
        10
    lambdaq  
       2023-03-10 14:22:12 +08:00
    真好。没有叫 geeker
    Depth
        11
    Depth  
       2023-03-10 14:44:50 +08:00
    我已经看到基于 ChatGPT 的英语口语对话练习程序了。很好,很强大!
    nonfu
        12
    nonfu  
    OP
       2023-03-10 14:55:10 +08:00
    @laixy9527 我用的 OpenAI 接口啊 speech to text 基于最近发布的 Whisper 模型
    nonfu
        13
    nonfu  
    OP
       2023-03-10 14:56:44 +08:00
    @Metre 可以的啊 把文本生成语音就好了 这种 AI 软件也挺多的 不过成本就上去了 个人扛不住。。。OpenAI 都用不起 我看已经超免费限额了
    nonfu
        14
    nonfu  
    OP
       2023-03-10 14:57:45 +08:00
    @redditer 已经开源 在 Github 上 你可以关注我的博客: https://geekr.dev ,这两天会把开发过程更新进去 之前写了一篇没有语音的
    nonfu
        15
    nonfu  
    OP
       2023-03-10 14:58:48 +08:00
    @AoEiuV020CN 哈哈 同好
    nonfu
        16
    nonfu  
    OP
       2023-03-10 15:00:51 +08:00
    @lambdaq kr 多有感觉 氪星人 化学元素 还有这不能少写一个字母嘛
    nonfu
        17
    nonfu  
    OP
       2023-03-10 15:01:54 +08:00
    @Depth 理论上没啥问题 个人扛不住这个成本 做个玩具可以 公司就随意了
    runliuv
        18
    runliuv  
       2023-03-10 15:16:30 +08:00
    和小爱同学差不多了。
    cuicuiv5
        19
    cuicuiv5  
       2023-03-10 15:22:12 +08:00   ❤️ 1
    我正准备做一个类似的语音助手, 搭配微软 Azure 的 TTS, 效果一定很棒
    微软的 api 似乎可以流式传输, 这样可以让他逐字读出来, 体验更好, 不会卡顿
    icatme
        20
    icatme  
       2023-03-10 15:22:29 +08:00
    我想用 ESP32 开发板做一个聊天玩具, 语音->文字->GPT API->TTS 输出
    nonfu
        21
    nonfu  
    OP
       2023-03-10 15:37:37 +08:00
    @runliuv 小爱同学这种没啥技术含量 API 应该都是调用别人的 自己买个树莓派是不是也能做 😂
    nonfu
        22
    nonfu  
    OP
       2023-03-10 15:38:18 +08:00
    @cuicuiv5 嗯 我也试试
    nonfu
        23
    nonfu  
    OP
       2023-03-10 15:38:46 +08:00
    @icatme 没毛病 我最近也想倒腾个硬件玩玩
    aogg
        24
    aogg  
       2023-03-10 15:52:16 +08:00
    输入框要支持 shift + enter 功能进行换行
    nonfu
        25
    nonfu  
    OP
       2023-03-10 16:41:20 +08:00
    @aogg 嗯 后面可以优化 这个只是体验版 不是 ChatGPT 的替代品 也不打算这么做 所以不会做的很重
    sniperhgy
        26
    sniperhgy  
       2023-03-10 17:51:15 +08:00
    感觉和 Chatgpt 有相同的特性:张嘴就来😂



    盟军敢死队一共有几代


    GeekChat
    盟军敢死队游戏共有三代。



    盟军敢死队一共有几代,每一代叫什么


    GeekChat
    盟军敢死队游戏共有三代,每一代分别叫做:

    Command & Conquer: Red Alert - Allied Disc
    Command & Conquer: Red Alert 2 - Allied Campaign
    Command & Conquer: Red Alert 3 - Allied Campaign


    commandos behind enemy line 在中国叫什么


    GeekChat
    《无声敌线》( Wú Shēng Dí Xiàn )是 Commandos: Behind Enemy Lines 在中国的官方翻译名称。
    nonfu
        27
    nonfu  
    OP
       2023-03-10 20:23:10 +08:00
    @sniperhgy 就是调用 chatgpt api 接口 能不一样吗 😂
    poyanhu
        28
    poyanhu  
       2023-03-10 21:55:35 +08:00
    要是答案也是读出来的语音。那可以拿来学习外语了。
    nonfu
        29
    nonfu  
    OP
       2023-03-11 00:06:06 +08:00
    @poyanhu 目前 OpenAI 没有提供相关接口 不过其他厂商有这种 API 的
    busuzhike
        30
    busuzhike  
       2023-03-13 09:27:55 +08:00
    赞,相当好,问了好几个问题,拜票了,谢谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2677 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 15:22 · PVG 23:22 · LAX 07:22 · JFK 10:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.