从运维角度谈谈炉石这次事故


  自己也是一个运维人员,对于炉石这次事故感觉是莫名其妙的,电力故障我认为对于机房来说是最不是事儿的了,一台服务器有两个电源模块,一个坏了或者插头松了之类的完全不影响,而两个电源又被分别接在两个插排上,两个插排会接两组ups,两组ups会接两路市电。所以说不管是电源坏了插头松了,ups坏了甚至整栋大楼停电了。对服务器不会有任何影响。网易作为一个只招211 985的互联网公司如果真的如公告所说。他们的运维不管是技术还是能力还是规范实在是太差了,这真是完完全全的人祸,运维部门完全背锅。PS:还招人吗?

  即便如此我还是不能理解为何备机也故障了,而且数据库都是至少两个备机,如果有异地灾备至少有3个备机,我实在不能理解一个运维团队要多出色才能让所有的应急方案全部失效。

  最后加个官方公告

  我仔细看了看,歪歪斜斜的每行上都写着“抱歉”“理解”“支持”几个字,我横竖睡不着,仔细看了半夜,才从字缝里看出来,满本上都写着四个字“我是你爹”!