导语:传统备份三十年未变,恢复备份集的RTO不可预期性是备份技术的“癌症”,原格式副本CDM方式的RTO趋向0,革命性的改变备份技术体系,这是终极发展方向。目前备份技术正处于激烈动荡的变革期,笔者把这个变革和美国南北战争进行类比分析,欢迎读者不吝指正。

长期以来快速数据恢复是备份行业核心诉求,而难以突破的根因在于:备份厂商都在基于私有备份集格式进行数据备份恢复。

笔者认为:通过使用原格式备份副本来快速恢复数据的方式,将会引领备份行业走向新的阶段,即传统备份的未来方向是CDM(Copy Data Management,副本数据管理)。

数据备份是由来已久的信息化基础设施,备份行业在Veritas定义市场情况下,历经三十年的稳步发展,备份技术取得一些迭代改进,但本质上传统备份还停留在三十年前采用备份集方式对数据进行备份和恢复。如今新IT技术层出不穷快速发展,数字化转型如火如荼展开落地,传统备份技术已严重滞后于行业发展。

过去十年除了引入磁盘作为一级备份载体外,备份行业架构体系没有任何改进。磁盘/SSD成本大大降低并在备份系统中大量普及使用,通过硬件加快恢复速度的天花板已出现。在云计算、大数据、中台等新技术变革推动下,对数据的需求场景越来越频,使用生产数据副本的场景越来越多。传统的备份技术仅能做到备份和恢复,不能满足DBA/SA对数据的调度管理和数据服务等需求场景。因此,传统备份呈日落西山趋势,在企业信息化发挥的价值很鸡肋,传统备份技术退出历史舞台成了时间问题。

美国历史上南北战争促进美国统一,给美国带来一百六十年的持续高速发展,奠定美国在国际社会一哥的江湖地位。根据笔者长期对数据备份保护行业观察分析,该行业已进入到类似南北战争的变革期,新的备份技术(CDM)对取代传统备份摩拳擦掌,传统备份技术为维持江湖地位顽死相争。籍此分析数据备份行业的“南北战争”已徐徐拉开帷幕,这场技术革命将影响未来数十年的备份技术发展方向和市场归属,这是一个伟大且持久的技术转折点。

下文我就数据备份保护行业的“南北战争”进行分析分享,欢迎读者斧正。

南北战争背景

1861年4月~1865年4月,美国南方与北方之间进行的战争。北方领导战争的是资产阶级。在南方坚持战争的只是种植场奴隶主,他们进行战争的目的是把奴隶制度扩大到全国, 而北方资产阶级的目的在于打败南方,以便恢复全国的统一。

第一阶段 1860年共和党人A.林肯当选为总统,美国民主党遭到惨败,这就成为南方奴隶主脱离联邦和发动叛乱的信号。南部蓄奴州南卡罗来纳首先脱离联邦,接着佐治亚、亚拉巴马、佛罗里达、密西西比、路易斯安那和得克萨斯诸州相继脱离, 并于1861年2月宣布成立“南部同盟”,另立以J.戴维斯为总统的政府。1861年4月12日叛乱政府军开始炮轰在南卡罗来纳的联邦萨姆特要塞,14日被攻陷。林肯政府于4月15日发布讨伐令,内战爆发 。不久,弗吉尼亚、北卡罗来纳、田纳西、阿肯色4州退出联邦参加南部联盟。

第二阶段 1862年9月22日,林肯发表预备性的《解放宣言》。宣布:假如在1863年1月1日以前南方叛乱者不放下武器,叛乱诸州的奴隶将从那一天起获得自由。消息传到南方后,成千上万的奴隶逃往北方。英国工人阶级也展开了支持北方的运动,迫使英国政府放弃了原来的干涉计划。

1863年,北方在军事上出现转机。同年7月1日葛底斯堡大捷,歼灭南军2.8万人 ,成为内战的转折点。战场上的主动权转到北方军队手中。1864年,北方最高统帅采用新的战略方针:在东,西两线同时展开强大攻势。在东线以消耗敌人的力量为主要目标;在西线用强大兵力深入敌方腹地,切断“南部同盟”的东北部与西南部的联系。1864年9月,W.T.谢尔曼将军麾下的北军一举攻下亚特兰大,两个月后开始著名的“向海洋进军”,在进军中彻底摧毁了敌人的各种军事设施,使南方经济陷于瘫痪。在东线,格兰特将军统率北军把敌军驱逼到叛乱“首都”里士满附近。1865年初,奴隶纷纷逃亡,种植场经济濒于瓦解。

美国南北战争的全面分析

  • 矛盾焦点:废除农奴制

  • 南方:奴隶制种植园经济

  • 北方:资本主义工商业经济

  • 南方优势:工业原料多、庞大的消费市场、有大量劳动力

  • 北方劣势:缺乏工业原料、缺乏销售市场、缺乏工业生产的劳动力

战争结果:北方的先进技术和制度通过《解放宣言》吸引大量劳动力,把南方原材料强制输送到北方进行加工生产、并占据南方大部分市场。北方资产主义工商业经历初期战争失利逐步转化成后期的战场主动性,赢得最终战争的胜利。奠定了美国100多年的繁荣发展。

在南北战争中矛盾的焦点是废除农奴制,废除农奴制可以瓦解南方的劳动力优势,同时削弱了南方的生产原料优势,也给北方的市场增长带来生机。

南北战争中林肯总统于1862年颁布解放宣言,剑指废除农奴制,同时北方资产阶级又动员各种力量帮助农奴逃离南方,加速了战争态势的转变。在对原材料(棉花等)的政策上,北方资产阶级在南方的港口围堵原材料往英国的出口,把原材料部分运到北方。在获得农奴劳动力资源,原材料逐步增加,市场规模逐步扩大等局面下,北方的资产阶级利用工业化的技术优势,逐步掌握了战争的主动权,最终北方取得了南北战争的胜利。

战争结果是先进的生产力和制度打败了落后的生产力和制度,完成了美国南北统一,获得美国最好的发展时期,经过几十年的发展奠定了美国在一战和二战均大获全胜的局面。

数据备份保护行业“南北战争”的全面分析

矛盾焦点:废除备份集

南方:传统备份,只对数据进行备份和惰性恢复的旧平台

北方:CDM,把数据资产保护、副本管理、副本的快速恢复和多重利用综合管理平台

传统备份(南方)优势:兼容数据源多(材料)、庞大的市场份额(市场)、拥有大量DBA/SA的认知和支持(劳动力)

CDM(北方)劣势:缺乏成熟数据源兼容性(材料)、缺乏市场份额(市场)、缺乏DBA/SA的认知和支持(劳动力)

预测备份保护行业“南北战争”结果:CDM领先的副本数据保护理念、对副本的多维管理和快速利用场景能大幅提升DBA/SA的管理效率,提升数据副本在企业的综合利用能力。在DBA/SA得到普遍认知情况下,CDM厂家加快数据源的广泛兼容性适配,得到DBA/SA支持后CDM会势如破竹的占据广泛的传统备份市场。预测CDM在经历初期战争不利局面逐步转化成后期的战场主动性,赢得战争的胜利,未来CDM技术完全取代传统备份技术。

笔者把新一代备份(CDM)类比为北方资产阶级,把传统备份类比为南方农奴主阶级。传统备份集格式的工作原理是恢复数据前先对备份集进行解包操作,解包时间和待恢复数据量呈线性关系,恢复数据量大时解包时间就长,这严重影响RTO指标,参考下图。因此,制约备份技术发展的矛盾焦点是备份集格式,备份集格式影响最大的是恢复速度,恢复速度慢是备份行业的顽疾,这导致备份数据难以用在企业的业务场景上,备份设施成为企业信息化的成本中心,不能给企业的业务发展带来任何直接收益。换言之备份集格式是传统备份技术的痛点和软肋。

新一代备份技术CDM通过原格式副本完全治愈传统备份的痛点,采用原格式的方式把数据备份和副本的再次使用融为一体,既能数据瞬间恢复(RTO趋近0),又拓展了备份基础架构在企业信息化的数据副本利用场景,为企业信息化存储基础设施的管理和应用进行优化赋能。

在数据备份保护这个战场上,废除备份集格式后将实现数据的快速恢复,极大的提高数据副本的快速利用能力,提升DBA/SA对数据资产的统一管理和调度的能力,在企业的数字化转型时数据资产的合理管理和快速利用能最大化的帮企业信息化部门节省资源和提升效率。因此,废除备份集是数字化转型道路上对数据资产管理提升的一个革命性改进。因此CDM正是废除备份集格式向原生数据格式转型的前进方向。

在CDM技术普及之前,“南方传统备份”有着绝大部分市场占有率(市场);传统备份有成熟的数据源,这是多年沉淀的局面(原材料);有DBA/SA(劳动力)对传统备份的支持,因DBA/SA已熟稔传统备份的技术和运维。DBA/SA人群是南北战争中“北方CDM”需要极力争取的劳动力资源。总之,目前传统备份仍集原材料、市场、和劳动力优势于一身,从现实市场表现来看,传统备份在市场销售份额的占比也比较大。

“北方CDM”觊觎传统备份的市场蛋糕已久,需要争取DBA/SA对CDM技术能力的认知和支持,同时加快数据源适配,拓展副本应用场景等,以此来提升市场占有率。

数据备份保护行业的“南北战争”已经打响!

数据备份保护行业的“南北双方”还需要围绕三个要因展开战斗,通过这三场战斗角逐战争的主动权。“北方CDM”要取得三场关键战役的胜利才能奠定江湖霸主地位:
A:拉拢DBA/SA

B: 挖掘副本再利用的业务场景

C: 适配数据源

就A战役拉拢DBA/SA来说,类似南北战争中宣布解放宣言的高层政策,并提供各种便利措施把南方农奴拉拢到北方进行工业生产和参加南北战争。在当前数据备份行业的南北战争中,通过政策引导或技术方向学习等改变DBA/SA对CDM价值的理解认知是关键事件,CDM厂家肩负着给DBA/SA进行多维宣传的责任,把DBA/SA根深蒂固的传统备份恢复意识转变到副本保护和管理使用的思路上,把DBA/SA从传统备份繁琐恢复的事务中解放出来,有精力做推动业务发展的事情。2020年我国颁布了《中华人民共和国数据安全法》,对数据保护立法势必会让DBA/SA更加规范的做好数据保护和快速恢复,规避无意识碰触的法律风险。

就B战役挖掘副本再利用的业务场景来说,类似把南方的近千万人口作为北方的广袤市场类似。CDM和DBA/SA需要挖掘更多的利用数据副本的业务场景,把数据资产的副本再利用渗透到企业的各个业务环节中,打造对业务有价值的数据资产底座,最终形成CDM统一管理数据资产的局面。

就C战役阶段适配数据源来说,CDM的可用数据源还远远不够丰富,相当一部分数据源还没有传统备份的兼容性好。这是一场硬仗,必须把广泛使用的数据源纳管在CDM平台下,这就类似南北战争中北方把南方的生产资料围堵在港口直接输送到北方进行加工使用。数据源越来越多时,CDM对生产数据的保护就可以完全取代传统备份技术,把传统备份的市场蛋糕揽入怀中,并逐步扩展到数据副本快速利用场景。

下图是美国南北战争和“数据备份南北战争”的关键事件对照,有兴趣者不妨自行分析体验。

数据备份行业“南北战争”分水岭的标志是五大行开始采用CDM技术,五大行作为OLTP/OLAP的典型业务场景,其数据备份基础设施的选择非常慎重,必然选择符合当前应用且面向未来技术演进发展的技术路线。如果五大行未来三年选定CDM作为数据备份的技术方向进行替代,则标志着这场战争的分水岭走向CDM领域,否则传统备份仍继续抗大旗。五大行的决策动作会引起数据备份业的“南北”双方的高度关注,让我们对此技术方向革新和发展拭目以待!

数字化转型是横跨所有行业的大革命,应运而生的CDM能够起到数据底座的重大作用。但要彻底发挥副本数据的价值,还需要DevOps、DataOps、数据可视化、商业智能、数据治理等多维度全生态来参与,这样才会把数字化时代的数据市场撑大。目前国内CDM行业发展来看,真正入局CDM的厂商也就云信达,下一个入局的是哪个方向的玩家?留给读者思考分析。