首页 > 业界 > 正文

腾讯云:磁盘静默错误+不规范操作造成用户数据丢失

时间:2018-08-08 10:52:39 来源:新浪科技 评论:0 点击:0
   8月8日上午消息 针对“前沿数控”数据完整性受损一事,腾讯云今天在其公众号再次回应,称该故障缘起于因磁盘静默错误导致的单副本数据错误,再加上数据迁移过程中的两次不规范的操作,导致云盘的三副本安全机制失效,并最终导致客户数据完整性受损。

  腾讯云称,当天上午11:57,其运维人员收到仓库Ⅰ空间使用率过高告警,准备发起搬迁扩容;在14:05时,运维人员从仓库Ⅰ选择了一批云盘搬迁至新仓库Ⅱ,为了加速搬迁,手动关闭了迁移过程中的数据校验;在20:27 搬迁完成之后,运维人员将客户的云盘访问切至仓库Ⅱ,同时为了释放空间,对仓库Ⅰ中的源数据发起了回收操作;到20:30 监控发现仓库Ⅱ部分云盘出现IO异常。

  并称本次事故起源自因磁盘静默错误导致的单副本数据错误,再由于数据迁移过程中的不规范操作,导致异常数据扩散至三副本,进而导致客户数据完整性受损。

  此外,腾讯云还称,数据搬迁过程中的违规操作主要如下两点:

  • 第一是正常数据搬迁流程默认开启数据校验,开启之后可以有效发现并规避源端数据异常,保障搬迁数据正确性,但是运维人员为了加速完成搬迁任务,违规关闭了数据校验;

  • 第二是正常数据搬迁完成之后,源仓库数据应保留24小时,用于搬迁异常情况下的数据恢复,但是运维人员为了尽快降低仓库使用率,违规对源仓库进行了数据回收。

  因这些错误操作的连续影响,导致该客户数据完整性受损,给客户的正常业务运行造成影响。

文章排行榜更多
最近更新更多