背景:2 年前端仔,面一个全栈岗,重前端 轻 golang 的
如题,第一次碰到问这种问题,我的回答是如果我能独立解决比如 0-2 小时内一般会处理,如果问题很棘手超过 2 小时我会倾向明天和其他同事到公司讨论解决方案。
不知道回答的对不对 hh ,v 友们一般是怎么回答的呢
1
BruceXu 1 天前
生产 bug 有对应的流程.发版更不是一个人的事.
你偷偷解决和推到明天解决都是错误的. 别的就不多说了,第一时间通知领导总没错~ |
2
huang86041 1 天前
不是互联网公司.
按我理解生产端的 bug 和研发有什么关系,第一时间不是找运维吗? |
3
zhengfan2016 OP @BruceXu 对哦。我居然忘记我小卡拉米根本就没有发生产环境的权限
![]() |
4
wonderfulcxm 1 天前 via iPhone
|
5
aptupdate 1 天前 via iPhone
先解决问题再追责,保证第一时间恢复生产服务。
|
6
winglight2016 1 天前 lz 呆过的公司都没有 SOP 吗?我进前司的第一件事就是建立研发 SOP ,包括正式发版和线上问题,线上问题一般都是测试/QA 首先验证、记录到飞书项目里,然后和运营确认问题等级和解决方案,他们解决不了了才会找研发。大部分线上问题都是业务不走正常流程导致的,研发一般都有现成的解决办法给到运营,很少会走到研发这边加班解决。
|
7
lidongyooo 1 天前
这明显是压力测试,还在这正经答呢。要我说:晚上不属于工作时间,非要修复额外打钱。否则公司倒闭了也得第二天再说。
|
8
levelworm 1 天前 via iPhone
有 oncall 啊,先给他解决,不行就呼人。
|
9
zhengfan2016 OP @winglight2016 没,我基本呆的都是 0-20 人左右的初创公司,想去 100 人以上的基本就只有大厂外包这一个选项了 hh
|
10
Pastsong 23 小时 45 分钟前
晚上不是工作时间,小问题不用处理,大问题走 oncall 流程
|
11
chainzhao188 23 小时 27 分钟前
建议老板花点钱取消晚上,永远只过白天
|
12
catazshadow 23 小时 15 分钟前 via Android
拔机房电源,第二天再说
|
13
spacebound 23 小时 6 分钟前
重点是晚上呀,面试官想听到的是接到 bug 通知,里面组织(配合相关人员进行排查),发布修复的版本。
也就是,加班! |
14
wqhui 23 小时 5 分钟前
紧急的就处理,不紧急的上班再说
|
15
dongzhuo777 22 小时 54 分钟前
肯定事 call 领导了
|
16
adimn 22 小时 40 分钟前
安抚客户, 推卸责任, 阿里云服务器的问题, 我们正在找阿里人解决问题
|
17
54xavier 22 小时 36 分钟前
不是应该先分析 bug 等级吗?
如果不会造成资金、资产损失,只是用户体验差那就拖到第二天,如果会有资金损失,能修复就尽快修复,修复不了考虑暂时下线功能,第二天有时间了好好解决。 |
18
HotieCutie 22 小时 35 分钟前
起床,修改 bug ,测试,更新上线,然后继续睡
|
19
layxy 22 小时 31 分钟前
出现问题第一时间上报啊,和领导反馈 bug 的影响,根据影响范围和等级确定是立即解决还是后续修复
|
20
paopjian 22 小时 26 分钟前
除非是本次更新的致命 bug, 优先回退保证使用, 其他情况都重走开发流程 做 bugfix 开发
|
21
yhxx 22 小时 20 分钟前 如果是个普通国内公司,并且你是真的很想要这份工作,建议你直接背:
**立刻** 上报安全生产负责人/值班分管领导等,同时判断严重级别,经领导确认后向相关人员(研发、运营、安全、公关、政府事务等)同步 同时分析事故原因,确认影响面,提供止血方案,如回滚、降级、关闭开关等供负责人决策(啥都没有?等死吧 :doge: 但是既然这是面试,就提前准备一下啊,“为了预防这种情况,我领导建设了整套发布流程,遇到故障可 xx 秒内做到 xxxx”) 成立故障响应小组,确认处理方案,定时同步进展、风险、预估恢复时间 问题解决后,等大家休息好,复盘,查原因、补文档、补监控、补测试,避免同类问题再次发生。 |
22
nuansediao 22 小时 11 分钟前
谁好人家晚上还看钉钉阿?
|
23
fao931013 22 小时 2 分钟前
回滚 即答
|
24
blackmatch 22 小时 1 分钟前
公司肯定要有一套执行流程,建议了解一下这方面。
总的原则是:先尽快让业务恢复正常。 一般的流程是:oncall -> 值班人员评估影响 -> 摇人(包括测试、研发等)-> 给出解决方案 -> 执行修复 -> SIT/staging 验证 -> 发版 -> 生产环境验证 -> 输出报告、复盘优化。 如果影响很小,可以第二天处理,按照公司制定的 SOP 流程走。 |
25
z327774948 22 小时 0 分钟前
跟你有啥关系,项目和代码都属于老板,出 bug 也是老板的 bug ,不是你的 bug[dog 狗头保命]
|
26
banmuyutian 21 小时 57 分钟前
问出这种问题的基本都是小作坊。。
|
27
mosesyou 21 小时 55 分钟前
1. 线上故障平时要有 sop
2. 1 分钟发现问题,5 分钟定位问题,10 分钟解决问题;对应做好日志、监控、告警、devops |
28
lifei6671 21 小时 47 分钟前
@huang86041 互联网公司没有独立运维,开发者本身就兼职运维了。
![]() |
29
0x663 21 小时 43 分钟前
看是什么情况,toB 的业务先安抚客户情绪,然后关掉手机睡觉,明天起来把问题抛群里。
公司自营业务的话,问问他们有没有按照规范走流程,先把 BUG 提禅道,然后关掉手机睡觉,明天起来再说。 |
30
DrakezZ 21 小时 42 分钟前
下班不看工作群 上班再说吧
|
31
iixy 21 小时 29 分钟前
给领导打电话,逐级上报请示。
|
32
yongp 21 小时 27 分钟前
一般都是先回滚版本止损,再复现问题,修复 Bug
|
33
dudubaba 21 小时 8 分钟前 面试时:第一时间定位解决,解决不了主动找相关责任人协助,先保证系统功能正常。
实际上:大半夜的关我屁事啊,天塌了第二天不能解决吗?关机睡觉! |
34
korvin 21 小时 6 分钟前
|
35
Hidetodong 20 小时 57 分钟前
先回滚保证服务起来
|
36
duuu 20 小时 44 分钟前
看面试官想考你什么,要区分很多不同的情景。
1.面试官想知道你对上线流程有没有概念,前面楼里有很多回答都可以参考,不过也要分情况,比如刚上线的晚上可以回滚,上线了一个月突然出 bug 还能回滚吗?那还是需要走流程,上报,判断 bug 级别 2.面试官想知道你的到来能给团队带来什么,比如是一个初创团队,上线不规范,经常生产遇到 bug ,就会想知道你怎么解决,你这个回答没问题,是解决短期问题的情形,然后再考虑长期解决,你可以最后再附带上说,如果经常遇到这个问题,你会推进建立上线流程规范,来完善这个问题。 3.面试官只是机械性的问你一些问题面试,正好问到这个,或者说你判断不出来面试官是什么想法。你就结合公司规模自己来判断,来选择 1 还是 2 ,结合自己以前公司的经验,也可以结合 1 和 2 来一起回答。反正就是答的全一点 |
37
geminikingfall 20 小时 23 分钟前
该怎么办怎么办,他们公司没有规范吗?
|
38
ryd994 18 小时 25 分钟前 via Android
面试是双向选择。
如果你可以不去这家公司,那就硬气地告诉他,下班时间不处理工作问题。业务受影响?你知道业务会受影响为什么不提前安排 oncall ? 如果你没得选,那就捏着鼻子告诉他,你愿意立刻起来工作,并叫醒全部同事一起 |
39
unused 18 小时 16 分钟前
先把老板叫起来开会
|
40
chenluo0429 17 小时 14 分钟前 via Android
你这个几乎是零分回答了。整体的处理流程其实都差不多了,只是根据你的角色不同,在不同的阶段措施有差异而已,基本就是自己执行或者上报推动其他人执行的区别。
首先肯定是确定问题现象,恶性程度,影响范围。然后初步分析大致原因,解决难度,能否回滚,并结合之前的问题信息,来选择修复/回滚/不修复。如果问题较为严重,但是选择修复的话,视情况让另一拨人同时评估回滚影响,随时准备回滚。 |
41
sakeven 16 小时 28 分钟前
先评估影响,影响小的慢慢看。影响大的先止血,具体怎么止血看故障的直接原因,同时上报到主管和相关团队。止完血之后,慢慢查根因和修复。后续再来一个故障复盘啥的,除了 bug 本身,看看哪些环节可以优化。
|
43
bk201 16 小时 17 分钟前
你应该问他公司规定是啥?按规定来。
|
44
arischow 16 小时 13 分钟前
bug 又不是 outage ,当然是上班再看(
|
45
tangping 14 小时 29 分钟前
当然是先把领导喊起来再说
|
46
zhangpulin 14 小时 26 分钟前
不应该是先分析,再判断优先级,严重 bug ,摇参与人一起干,自己干,锅自己承担
|
47
feller 9 小时 23 分钟前 via iPhone
做个提示页面(出事了把页面开关打开。),提示系统正在维护,禁止使用。处理后,关闭开关,恢复正常。
|