近日 , 一场模拟单个数据中心完全不可用的灾难恢复演练在微众银行顺利完成。本次演练中 , 微众银行关闭了同城五个多活生产数据中心中的一个 , 数据中心失联后 , 全量业务 ” 秒级切换 ” 到其他数据中心 , 真正实现了业务 ” 零感知 “, 在金融行业内尚属首次。

微众银行于 2015 年 8 月上线全球首个基于安全可控技术架构的分布式银行核心系统。经过多年发展 , 微众银行已建成同城多数据中心多活架构 , 所有业务在多中心之间动态流量调控 , 所有业务产品 7*24 小时服务。截至 2020 年底 , 该系统已服务 2.7 亿个人客户、188 万小微企业客户 , 支持单日金融交易峰值 7.5 亿笔 , 系统可靠性超过 99.999%。在业务连续性方面 , 已实现同城 RPO ( Recovery Point Objective, 恢复点目标 ) =0、同城 RTO ( Recovery Time Objective, 恢复时间目标 ) ≈ 0 的水平 , 在行业内已达到领先的水平。

图 : 微众银行数据中心断网演练现场

为验证同城多数据中心多活机制的有效性和健壮性 , 提高信息系统突发事件的处置能力 , 此次演练在容灾场景上首次对承载全行业务的关键数据中心断网切换。在演练中 , 为了模拟单个中心故障的场景 , 运维人员关闭一个数据中心的所有内外网出口 , 用户流量立刻自动切换到正常的数据中心 , 全行所有业务和渠道正常提供服务 , 用户未感受到任何中断。各业务产品稳定运行 24 小时后 , 模拟故障的数据中心重新投入运行 , 用户流量顺利回切 , 全程业务无感知。本次演练成功验证了多活架构的关键目标 :” 两个自动 “” 两个零 “, 即流量自动调控、应急管理故障自动恢复 , 灾难恢复后数据零丢失、业务零中断。

此次演练的顺利实施 , 验证了微众银行在面临单个数据中心级异常时的处理机制和处理能力 , 标志着微众银行业务连续性能力和灾备实战水平再上一个新台阶。未来 , 微众银行将持续发挥科技优势 , 进一步优化容灾架构 , 夯实运维基础 , 不断提升业务连续性能力。