V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zhengfan2016
V2EX  ›  职场话题

面试官问晚上生产出 bug 怎么办这种一般怎么回答啊

  •  
  •   zhengfan2016 · 1 天前 · 5214 次点击

    背景:2 年前端仔,面一个全栈岗,重前端 轻 golang 的

    如题,第一次碰到问这种问题,我的回答是如果我能独立解决比如 0-2 小时内一般会处理,如果问题很棘手超过 2 小时我会倾向明天和其他同事到公司讨论解决方案。

    不知道回答的对不对 hh ,v 友们一般是怎么回答的呢

    47 条回复    2025-11-14 23:19:49 +08:00
    BruceXu
        1
    BruceXu  
       1 天前
    生产 bug 有对应的流程.发版更不是一个人的事.

    你偷偷解决和推到明天解决都是错误的.

    别的就不多说了,第一时间通知领导总没错~
    huang86041
        2
    huang86041  
       1 天前
    不是互联网公司.
    按我理解生产端的 bug 和研发有什么关系,第一时间不是找运维吗?
    zhengfan2016
        3
    zhengfan2016  
    OP
       1 天前
    @BruceXu 对哦。我居然忘记我小卡拉米根本就没有发生产环境的权限
    wonderfulcxm
        4
    wonderfulcxm  
       1 天前 via iPhone
    能处理就爬起来处理啊,我们小公司是这样的,没有运维,或者我就是运维,在家直接就能 ssh 进入生产环境。
    aptupdate
        5
    aptupdate  
       1 天前 via iPhone
    先解决问题再追责,保证第一时间恢复生产服务。
    winglight2016
        6
    winglight2016  
       1 天前   ❤️ 2
    lz 呆过的公司都没有 SOP 吗?我进前司的第一件事就是建立研发 SOP ,包括正式发版和线上问题,线上问题一般都是测试/QA 首先验证、记录到飞书项目里,然后和运营确认问题等级和解决方案,他们解决不了了才会找研发。大部分线上问题都是业务不走正常流程导致的,研发一般都有现成的解决办法给到运营,很少会走到研发这边加班解决。
    lidongyooo
        7
    lidongyooo  
       1 天前
    这明显是压力测试,还在这正经答呢。要我说:晚上不属于工作时间,非要修复额外打钱。否则公司倒闭了也得第二天再说。
    levelworm
        8
    levelworm  
       1 天前 via iPhone
    有 oncall 啊,先给他解决,不行就呼人。
    zhengfan2016
        9
    zhengfan2016  
    OP
       23 小时 55 分钟前
    @winglight2016 没,我基本呆的都是 0-20 人左右的初创公司,想去 100 人以上的基本就只有大厂外包这一个选项了 hh
    Pastsong
        10
    Pastsong  
       23 小时 45 分钟前
    晚上不是工作时间,小问题不用处理,大问题走 oncall 流程
    chainzhao188
        11
    chainzhao188  
       23 小时 27 分钟前
    建议老板花点钱取消晚上,永远只过白天
    catazshadow
        12
    catazshadow  
       23 小时 15 分钟前 via Android
    拔机房电源,第二天再说
    spacebound
        13
    spacebound  
       23 小时 6 分钟前
    重点是晚上呀,面试官想听到的是接到 bug 通知,里面组织(配合相关人员进行排查),发布修复的版本。
    也就是,加班!
    wqhui
        14
    wqhui  
       23 小时 5 分钟前
    紧急的就处理,不紧急的上班再说
    dongzhuo777
        15
    dongzhuo777  
       22 小时 54 分钟前
    肯定事 call 领导了
    adimn
        16
    adimn  
       22 小时 40 分钟前
    安抚客户, 推卸责任, 阿里云服务器的问题, 我们正在找阿里人解决问题
    54xavier
        17
    54xavier  
       22 小时 36 分钟前
    不是应该先分析 bug 等级吗?

    如果不会造成资金、资产损失,只是用户体验差那就拖到第二天,如果会有资金损失,能修复就尽快修复,修复不了考虑暂时下线功能,第二天有时间了好好解决。
    HotieCutie
        18
    HotieCutie  
       22 小时 35 分钟前
    起床,修改 bug ,测试,更新上线,然后继续睡
    layxy
        19
    layxy  
       22 小时 31 分钟前
    出现问题第一时间上报啊,和领导反馈 bug 的影响,根据影响范围和等级确定是立即解决还是后续修复
    paopjian
        20
    paopjian  
       22 小时 26 分钟前
    除非是本次更新的致命 bug, 优先回退保证使用, 其他情况都重走开发流程 做 bugfix 开发
    yhxx
        21
    yhxx  
       22 小时 20 分钟前   ❤️ 2
    如果是个普通国内公司,并且你是真的很想要这份工作,建议你直接背:

    **立刻** 上报安全生产负责人/值班分管领导等,同时判断严重级别,经领导确认后向相关人员(研发、运营、安全、公关、政府事务等)同步
    同时分析事故原因,确认影响面,提供止血方案,如回滚、降级、关闭开关等供负责人决策(啥都没有?等死吧 :doge: 但是既然这是面试,就提前准备一下啊,“为了预防这种情况,我领导建设了整套发布流程,遇到故障可 xx 秒内做到 xxxx”)

    成立故障响应小组,确认处理方案,定时同步进展、风险、预估恢复时间

    问题解决后,等大家休息好,复盘,查原因、补文档、补监控、补测试,避免同类问题再次发生。
    nuansediao
        22
    nuansediao  
       22 小时 11 分钟前
    谁好人家晚上还看钉钉阿?
    fao931013
        23
    fao931013  
       22 小时 2 分钟前
    回滚 即答
    blackmatch
        24
    blackmatch  
       22 小时 1 分钟前
    公司肯定要有一套执行流程,建议了解一下这方面。
    总的原则是:先尽快让业务恢复正常。

    一般的流程是:oncall -> 值班人员评估影响 -> 摇人(包括测试、研发等)-> 给出解决方案 -> 执行修复 -> SIT/staging 验证 -> 发版 -> 生产环境验证 -> 输出报告、复盘优化。

    如果影响很小,可以第二天处理,按照公司制定的 SOP 流程走。
    z327774948
        25
    z327774948  
       22 小时 0 分钟前
    跟你有啥关系,项目和代码都属于老板,出 bug 也是老板的 bug ,不是你的 bug[dog 狗头保命]
    banmuyutian
        26
    banmuyutian  
       21 小时 57 分钟前
    问出这种问题的基本都是小作坊。。
    mosesyou
        27
    mosesyou  
       21 小时 55 分钟前
    1. 线上故障平时要有 sop
    2. 1 分钟发现问题,5 分钟定位问题,10 分钟解决问题;对应做好日志、监控、告警、devops
    lifei6671
        28
    lifei6671  
       21 小时 47 分钟前
    @huang86041 互联网公司没有独立运维,开发者本身就兼职运维了。
    0x663
        29
    0x663  
       21 小时 43 分钟前
    看是什么情况,toB 的业务先安抚客户情绪,然后关掉手机睡觉,明天起来把问题抛群里。
    公司自营业务的话,问问他们有没有按照规范走流程,先把 BUG 提禅道,然后关掉手机睡觉,明天起来再说。
    DrakezZ
        30
    DrakezZ  
       21 小时 42 分钟前
    下班不看工作群 上班再说吧
    iixy
        31
    iixy  
       21 小时 29 分钟前
    给领导打电话,逐级上报请示。
    yongp
        32
    yongp  
       21 小时 27 分钟前
    一般都是先回滚版本止损,再复现问题,修复 Bug
    dudubaba
        33
    dudubaba  
       21 小时 8 分钟前   ❤️ 1
    面试时:第一时间定位解决,解决不了主动找相关责任人协助,先保证系统功能正常。
    实际上:大半夜的关我屁事啊,天塌了第二天不能解决吗?关机睡觉!
    korvin
        34
    korvin  
       21 小时 6 分钟前
    生产 bug 怎么会报先到我这个小透明身上来,工作流程有问题,领导你怎么回事
    Hidetodong
        35
    Hidetodong  
       20 小时 57 分钟前
    先回滚保证服务起来
    duuu
        36
    duuu  
       20 小时 44 分钟前
    看面试官想考你什么,要区分很多不同的情景。

    1.面试官想知道你对上线流程有没有概念,前面楼里有很多回答都可以参考,不过也要分情况,比如刚上线的晚上可以回滚,上线了一个月突然出 bug 还能回滚吗?那还是需要走流程,上报,判断 bug 级别

    2.面试官想知道你的到来能给团队带来什么,比如是一个初创团队,上线不规范,经常生产遇到 bug ,就会想知道你怎么解决,你这个回答没问题,是解决短期问题的情形,然后再考虑长期解决,你可以最后再附带上说,如果经常遇到这个问题,你会推进建立上线流程规范,来完善这个问题。

    3.面试官只是机械性的问你一些问题面试,正好问到这个,或者说你判断不出来面试官是什么想法。你就结合公司规模自己来判断,来选择 1 还是 2 ,结合自己以前公司的经验,也可以结合 1 和 2 来一起回答。反正就是答的全一点
    geminikingfall
        37
    geminikingfall  
       20 小时 23 分钟前
    该怎么办怎么办,他们公司没有规范吗?
    ryd994
        38
    ryd994  
       18 小时 25 分钟前 via Android
    面试是双向选择。
    如果你可以不去这家公司,那就硬气地告诉他,下班时间不处理工作问题。业务受影响?你知道业务会受影响为什么不提前安排 oncall ?
    如果你没得选,那就捏着鼻子告诉他,你愿意立刻起来工作,并叫醒全部同事一起
    unused
        39
    unused  
       18 小时 16 分钟前
    先把老板叫起来开会
    chenluo0429
        40
    chenluo0429  
       17 小时 14 分钟前 via Android
    你这个几乎是零分回答了。整体的处理流程其实都差不多了,只是根据你的角色不同,在不同的阶段措施有差异而已,基本就是自己执行或者上报推动其他人执行的区别。
    首先肯定是确定问题现象,恶性程度,影响范围。然后初步分析大致原因,解决难度,能否回滚,并结合之前的问题信息,来选择修复/回滚/不修复。如果问题较为严重,但是选择修复的话,视情况让另一拨人同时评估回滚影响,随时准备回滚。
    sakeven
        41
    sakeven  
       16 小时 28 分钟前
    先评估影响,影响小的慢慢看。影响大的先止血,具体怎么止血看故障的直接原因,同时上报到主管和相关团队。止完血之后,慢慢查根因和修复。后续再来一个故障复盘啥的,除了 bug 本身,看看哪些环节可以优化。
    sakeven
        42
    sakeven  
       16 小时 19 分钟前
    @sakeven 这个过程中要注意及时同步进展给相关人员,能够展示你或者公司的责任心
    bk201
        43
    bk201  
       16 小时 17 分钟前
    你应该问他公司规定是啥?按规定来。
    arischow
        44
    arischow  
       16 小时 13 分钟前
    bug 又不是 outage ,当然是上班再看(
    tangping
        45
    tangping  
       14 小时 29 分钟前
    当然是先把领导喊起来再说
    zhangpulin
        46
    zhangpulin  
       14 小时 26 分钟前
    不应该是先分析,再判断优先级,严重 bug ,摇参与人一起干,自己干,锅自己承担
    feller
        47
    feller  
       9 小时 23 分钟前 via iPhone
    做个提示页面(出事了把页面开关打开。),提示系统正在维护,禁止使用。处理后,关闭开关,恢复正常。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2284 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 00:42 · PVG 08:42 · LAX 16:42 · JFK 19:42
    ♥ Do have faith in what you're doing.