来源:OSCHINA 时间:2023-06-06 15:21:16
【资料图】
今年3月29日,“唯品会崩了”登上热搜,由于崩溃时间太长,影响了很多消费者无法正常下单。唯品会官方对此回应称,因系统短时故障,主站“加购”等功能或出现异常。
6月5日,唯品会发布“关于329机房宕机故障处理的公告”。公告称,3月29日(00:14-12:01)南沙IDC冷冻系统故障,导致机房设备温度快速升高宕机,造成线上商城停止服务。此次事故影响时间持续12个小时,导致唯品会业绩损失超亿元,影响客户达800万,唯品会将此次故障判定为P0级故障。
公告指出,唯品会决定对此次事件严肃处理,对应部门的直接管理者承担此次事故责任,基础平台部负责人予以免职作相应处理。
据了解,P0 属于最高级别事故,比如崩溃、页面无法访问、主流程不通、主功能未实现,或在影响面上影响很大(即使 Bug 本身不严重)。
就在3月29日同一天,腾讯旗下的微信和 QQ 等业务也曾出现崩溃状况,包括微信语音对话、朋友圈、微信支付,以及 QQ 文件传输、QQ 空间和 QQ 邮箱在内的多个功能无法使用。据称本次事故由广州电信机房冷却系统故障导致,腾讯将它定义为公司一级事故。
腾讯管理层同样对大量相关领导做出了处罚。其中包含公司高级执行副总裁、TEG(技术工程事业群)总裁卢山(LS)和 WXG(微信事业群)副总裁周颢(harveyzhou)在内的管理者承担领导责任,被予以通报批评。 此外,TEG 华南数据中心的两位总经理和总监被处以降级和免职处罚,WXG 技术架构部的两位总监和组长当期绩效考核给予 Underperform 等评级(二星级别,最高为五星)。