V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ggp1ot2
V2EX  ›  程序员

B 站那种 @一下 就给你总结视频内容的账号是咋做的?

  •  
  •   ggp1ot2 · 2023-08-12 10:28:33 +08:00 · 10296 次点击
    这是一个创建于 475 天前的主题,其中的信息可能已经有所发展或是发生改变。

    就是你只需要在 b 站评论区下面 @xxx

    就会有个机器人,在这个视频下面总结这个视频的内容

    看起来是 ai 生成的,但是很好奇后面的技术流转,想做一个玩玩

    所以整个流程是在服务器后台挂一个程序,然后注册一个 b 站账号

    1 、实时监控 b 站账号的艾特提醒 2 、如果有艾特,就提取艾特我的那个视频 3 、ai 生成视频总结,发送到评论区

    看起来好像也不难?主要是第 3 步,如何用 ai 生成视频总结? chatgpt 好像没有这个功能啊,而且一个账号一直在 b 站发评论,不会被限制吗?

    33 条回复    2023-08-14 11:21:08 +08:00
    amon
        1
    amon  
       2023-08-12 10:30:24 +08:00
    没了解过。
    我的理解是提取并总结字幕吧。现在 AI 主要还是文本这块。
    hscui
        2
    hscui  
       2023-08-12 10:44:06 +08:00
    @amon 不一定,目前 B 站自己都已经用上 AI 语音转字幕了,所以那个估计可能也是自己处理语音再总结。
    bollld607
        3
    bollld607  
       2023-08-12 11:04:25 +08:00 via Android   ❤️ 1
    其实半年前还是多久不记得了,B 站几乎所有的新上传视频都附带 AI 自动生成字幕,默认是关闭的,所以只要抓取字幕进行总结即可;
    后来 B 站屏蔽了未登录用户抓取 AI 字幕的功能,不过这并不能难倒爬虫。
    现在新上传视频都不会附带 AI 字幕了,大概这时开始走语音识别的路线了。
    locoz
        4
    locoz  
       2023-08-12 11:07:08 +08:00   ❤️ 1
    “ chatgpt 好像没有这个功能啊”
    GPT 本身只是个语言模型,你给它视频内容文本、要求它总结,那它自然就能总结。
    Katrol
        5
    Katrol  
       2023-08-12 11:08:04 +08:00
    正常流程应该是类似 whisper 提取语音识别信息然后再让 gpt 总结,但是 whisper 使用需要 gpu 训练,可能是直接拿的 B 站字幕
    DigitalG
        6
    DigitalG  
       2023-08-12 11:24:04 +08:00 via iPhone   ❤️ 1
    at 一个 bot 让他总结白噪音视频看看?
    shalingye
        7
    shalingye  
       2023-08-12 11:24:38 +08:00   ❤️ 1
    bilibiliapi+ai 字幕+gpt3.5 ,成本几乎为零
    myon
        8
    myon  
       2023-08-12 11:33:55 +08:00   ❤️ 1
    就是总结文本,B 站有字幕接口
    ladypxy
        9
    ladypxy  
       2023-08-12 11:55:24 +08:00 via iPhone
    简单
    抓取字幕,然后调用 ChatGPT 总结文字内容
    good1uck
        10
    good1uck  
       2023-08-12 12:01:40 +08:00 via Android
    @shalingye 那么你可以 0 成本的把开源地址发出来吗
    wyd011011daniel
        11
    wyd011011daniel  
       2023-08-12 12:04:42 +08:00
    wyd011011daniel
        12
    wyd011011daniel  
       2023-08-12 12:06:27 +08:00
    就是拿字幕。写个提示词总结的。刚出 3.5 的时候就玩过了,现在这个算是搞了个账号总结,也没啥大用处。 还有账号识别视频音乐的。
    good1uck
        13
    good1uck  
       2023-08-12 12:07:39 +08:00 via Android
    @wyd011011daniel 这个我知道,但是光凭这个还不够。
    shalingye
        14
    shalingye  
       2023-08-12 12:49:50 +08:00 via Android
    @good1uck 我只是觉得流程应该是这样子的,算力的话搞一个 az100 不就是 0 成本么
    gcgj72
        15
    gcgj72  
       2023-08-12 12:51:46 +08:00
    就是抓取字幕然后 gpt 生成总结 一般的 b 站视频发布选择可以自动生成字幕
    good1uck
        16
    good1uck  
       2023-08-12 12:57:27 +08:00 via Android
    @shalingye 有道理
    wayne3602
        17
    wayne3602  
       2023-08-12 12:57:47 +08:00 via Android
    分享一个机器人看看,没见过
    guog
        18
    guog  
       2023-08-12 13:16:24 +08:00 via Android
    @wayne3602 AI 视频小助理,总结的很烂,没必要看。总有人乐此不疲的艾特
    PlsDontStop
        19
    PlsDontStop  
       2023-08-12 13:43:08 +08:00 via iPhone
    先把视频内容语音识别成文字再 gpt 总结
    Exgirlfriends
        20
    Exgirlfriends  
       2023-08-12 15:17:38 +08:00
    ytb 不也有吗,chrome 插件,通过 chatgpt
    em70
        21
    em70  
       2023-08-12 15:55:36 +08:00
    请将三引号内的字幕内容生成 200 字左右的摘要
    '''
    B 站视频字幕文本
    '''
    565656
        22
    565656  
       2023-08-12 16:17:07 +08:00
    语音识别成文字+chatgpt 做的, 没语音的就不行
    x86
        23
    x86  
       2023-08-12 16:22:08 +08:00
    造垃圾的工具
    KeepCoding
        24
    KeepCoding  
       2023-08-12 17:13:28 +08:00 via iPhone   ❤️ 1
    迟早要被封,大大降低完播率
    m1nm13
        25
    m1nm13  
       2023-08-12 19:40:29 +08:00
    这有一个手动的轮子
    1.下载 b 站视频
    2.塞进这个里面,转成文字 https://github.com/Const-me/Whisper
    3.塞给 gpt
    Alias4ck
        26
    Alias4ck  
       2023-08-12 20:49:22 +08:00
    最快的轮子实现方式应该是用 langchain

    https://python.langchain.com/docs/integrations/document_loaders/bilibili
    Alias4ck
        27
    Alias4ck  
       2023-08-12 20:58:40 +08:00
    一直发评论不会被限制 1: 他有一个账号池 有一个不行了就切换到别的帐号上了 2:同 url 视频内容会有缓存

    另外说一点,它这个还是基于在视频有字幕的情况下会很快,如果没有字幕的话
    你得自己生成字幕 而且如果视频很长的话 会很费时间 虽然有一些开源模型比如 whisper 可以 stt ,
    但是也是吃 gpu/cpu 资源的,成本会收不回来哈哈
    所以 b 站我也没看到有人在几个小时的视频下总结哈哈
    bojackhorseman
        28
    bojackhorseman  
       2023-08-12 23:48:42 +08:00 via iPhone
    @Alias4ck 难怪,🌚,老半天没看到 ai 小助手回复
    74123gzy
        29
    74123gzy  
       2023-08-13 01:12:57 +08:00
    能不能直接把链接发给 gpt4 让它看让它总结,(我没试过 gpt4 啊,但不是说他能看网页么
    lxiian
        30
    lxiian  
       2023-08-13 02:24:49 +08:00 via iPhone
    就调用 bili 的 api ,然后有字幕的话就获取字幕,没的话,就识别视频的声音转为文本再交给 gpt ,没啥难度。 虽然我也用过一次,也挺好用,但迟早会出事的吧。 那些 up 主应该不喜欢这个东西
    sweat89
        31
    sweat89  
       2023-08-13 08:23:46 +08:00
    @Katrol whisper 还训练个啥啊,直接拿来推理翻译了
    biubiuF
        32
    biubiuF  
       2023-08-13 11:28:57 +08:00
    1.有字幕的直接提取字幕总结
    2.没有字幕的情况 b 站可以单独下载音频
    luomao
        33
    luomao  
       2023-08-14 11:21:08 +08:00
    抓字幕抓弹幕抓标题抓标签
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4640 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 04:02 · PVG 12:02 · LAX 20:02 · JFK 23:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.