阿里云发布可用区C服务中断事件说明,称将尽快处理赔偿事宜

聂枝舒
导读 12月25日阿里云发布Region可用区C服务中断给客户造成的不便,公开道歉,并且对于目前该事件的处理正在进行对于后续的赔偿事宜将会积极的和客户进行协商。
12月25日阿里云发布Region可用区C服务中断给客户造成的不便,公开道歉,并且对于目前该事件的处理正在进行对于后续的赔偿事宜将会积极的和客户进行协商,这次事件是发生在12月18日上午9:00许阿里云监控到Region可用区C机房包间通道出现了温度报警工程师迅速进入应急处理机制同时通知了机房服务商进行现场的排查。
令人没想到的是,在仅仅过了5分钟后,阿里云监控到该机房多个包间都出现了温度急剧上升的警告,并且工程师也排查到了冷机出现异常,工程师紧急按照应急预案提供了4+4,准备切换让系统重启,但是操作失败机房的冷水机组无法恢复正常,并且启动了智能异常的应急预案并且手动进行逐个的隔离和恢复操作但是问题仍然没有被排除,由于机房的持续高温造成了服务器受到了影响。 
由于机房出现高温,导致了服务器停止工作在12:30左右,冷机设备的供应商到达现场经过工程师的排查仍然没有解决问题反而造成了因为高温引起的强制消防喷淋在经过了近10个小时的抢修后,在晚上的9:30左右,大部分机房的温度处于正常范围之内,这也导致了Region可用区 C区出现了1CS服务器出现停机,造成了大面积的客户出现了停止服务的现象。
Region可用区 C区的故障虽然没有对的客户造成严重的影响,由于大量的可用区,c客户在也有其他的ecs服务商,由于此次可用区C的部分储存服务开始,受到了停机的影响,导致了磁盘坏道影响客户的数据存储安全,所以工程师对服务器进行停机操作,并且停机长达6个小时。

标签: 阿里云,香港

版权声明:本文由用户上传,如有侵权请联系删除!