您好, 访客   登录/注册

基于云计算的数据容灾备份方案

来源:用户上传      作者:

  摘要:自然灾害发生时,如何减少数据丢失是数据容灾备份的重要研究内容。传统的容灾备份方案主要是通过人工的方式对存储的数据进行备份,这类方案最大的缺点就是不能动态快速地响应数据丢失的情况。基于云计算的数据备份方法是一种新的数据存储方法。该方法通过互联网将服务器互联,将数据分散存储在各个数据分中心,具有数据备份和实时共享的功能。结合该技术特点,本文提出了一种基于云计算的数据容灾备份方案,当灾祸发生导致数据丢失时,该方案能够快速应急响应,并且动态恢复丢失的数据,减少因数据缺失带来的社会经济影响。
  关键词:云计算;数据灾害;容灾备份;分布式存储
  中图分类号:TP311 文献标识码:A 文章编号:1007-9416(2020)03-0039-04
  0 引言
  云计算[1]、大数据背景下,多元化的数据应运而生,人们将数据与模型结合,挖掘数据背后潜藏的规律,如:行为感知预测[2,3]、气象预测、疾病检测等。模型的训练离不开海量的标签数据,数据存储安全变得尤为重要。近年来,各种自然灾害频繁发生,火灾、台风、地震、海啸等无时无刻的威胁着数据安全。
  针对随时可能发生的自然灾害对存储数据产生的影响,单一地将数据存储在一个服务器已不能满足生产生活的要求。比如:地震引起的服务器故障中,本地服务器中存储的数据不能被远程访问,导致远程的数据获取失败,造成各种经济损失。又如:数据中心起火时,数据中心的数据可能被永久的摧毁了,若不能快速的恢复这些数据,那么与这些数据相关的事宜将无法进行,可能产生严重的社会问题,造成严重的社会危机。
  当灾祸发生时,传统解决数据缺失的方法主要是通过人工进行操作,人工对服务器进行故障排除和数据恢复。人工对服务器的数据维护不仅耗时长、成本高,而且特定情况下一些服务器数据有可能没有及时进行备份和保存,产生数据丢失的情况。现阶段来说,一些重要的数据,都会进行数据备份。其一,将数据进行双份保存,即一台服务器配置两个数据库对数据进行保存。当主用数据库出现问题时,可以启用备用数据,但该方案不能应对大型灾祸发生导致的本地两个数据库被损毁的情况。双数据库备份方案如图1所示。
  为了应对本地双数据库备份的不足,异地备份方案可以有效缓解本地备份的缺陷。该方法主要是将数据保存在两台异地服务器上达到数据备份的目的,如图2所示。该方案有如下优势:
  当没有灾祸发生时,所有的数据都是通过服务器1进行交互,并且服务器1与服务器2保持数据同步更新;当服务器1发生灾祸时,服务器2就会启动以保证正常的服务。这种方式存在一些缺点:首先,该方法需要同时维护两台服务器,其次,需要每时每刻同步更新两台服务器的数据信息。这样才能确保一台服务器出现问题时,另一台能够快速准确响应,为用户提供不间断的服务。这种容灾备份方案的实现通长是在两地架设两台相同的服务器,在维护的时候需要同时维护两台服务器,在线路搭建的时候,需要同时保证两台服务器能够单独运行,成本非常高;而且这种容灾备份方法最致命的缺陷是,若短期内两台服务器同时出现故障或数据丢失,则用户的访问将会被终止,用户的数据可能永远丢失。
  为了解决传统容灾备份方案存在的问题,人们迫切需要一个能够快速响应数据丢失的应急方案,该方案能够在服务器故障数据丢失时,不仅能够快速的对数据进行恢复,而且还能够继续响应用户的数据请求。
  1 相关工作
  云计算是一种新型的计算方式,其主要的思想是分布式计算,通过将云端任务分配下发到处于云端边缘的计算机,再将各个位于云端边缘计算机的计算结果进行返回,达到分布式并行计算的目的[4-6]。通过这种计算方式,一个庞大的任务可以被划分为许许多多不同的小任务,这样在短期内,就能够实现完成一个庞大的计算任务[7]。云计算中,数据不仅存储在云端,而且数据也分散的下发存储到了各个处于云端边缘的用户端[8],这样数据的保存形式就以“总-分”或“分-总”的形式保存在了不同邏辑空间的不同端上[9]。
  容灾备份方案主要是为了解决在灾难发生时,数据的安全性、数据的完整性和数据的可持续访问性的问题。傅思达等人[10]提出,一般的容灾备份方案存在许多安全性问题;因此,数据备份应该具有多点多备的特点,这样能有效提升数据的安全特性。倪凯等人[11]在容灾备份方案的数据安全性方面进行了讨论设计,有效提升了生产中数据容灾备份的安全性。陈小建[12]将OS中的技术方法运用在了数据库中,有效的提升了数据库中容灾备份资源的利用率。基于容灾备份方案的社会需求,Shi等人[13]提出了一种新颖的数据恢复机制,提升了容灾备份的效率。
  将云计算的特点与容灾本分相结合,本文提示一种基于云计算的数据容灾备份方案,该方案不仅具有动态恢复数据的特性和保持数据持续访问的特点,而且不需要同时对多台服务器进行维护,具有成本低,安全性高的特点。
  2 基于云计算的数据容灾备份方案特点
  基于云计算的数据容灾备份方案技术实现是可行的,主要在于几个方面:(1)基于云计算的设计方案简单明了,利于相关数据备份协议的设计;基于云计算的数据容灾备份方案主要是通过数据在使用传递过程中对数据进行动态的备份,数据在使用传递的过程中,不同的端之间会对数据采取不同的存储方式,基于这些不同的存储方式使数据具备了容灾备份的特性,提升了数据的安全性。(2)数据备份代价小,数据恢复速度快,符合现阶段对数据存储代价与数据动态恢复的要求;该方案将数据划分,当数据产生丢失时,保证了用户在不同时间不同地点能够继续的访问数据,并且数据中心也可以通过用户端对数据进行恢复。(3)数据安全性高,保证了现阶段的数据安全的需求;通过控制中心对数据的暂时备份保存和用户端数据冗余备份的设计,能够保证在各种大型灾祸发生时,数据依然能够动态恢复和数据访问的特性。
  基于以上的分析,基于云计算的数据容灾备份方案实现成本低,运行效率高,可以有效地运用到各类数据的容灾备份中,包括:医疗数据、生物数据、气象数据、农业数据和海洋数据等,满足人们对数据容灾备份的需求。   3 基于云计算的数据容灾备份方案
  基于云计算的容灾备份方案主要是通过云计算的数据流通手段,将数据分别存储在了不同的用户端上,这样我们的数据保存形式不仅有云端保存的所有数据,而且还将所有数据进行分割保存在了各个不同的用户端上。无论是云端的数据丢失还是用户端的数据丢失,我们都可以利用网络进行数据的恢复和数据的访问。
  基于云计算的数据容灾备份系统中主要由几部分构成:(1)云端服务器:用于存储数据交互中的所有数据;(2)控制中心:用于控制数据传输、数据访问、数据存储和保存数据存储列表等;(3)局域网:用于连接不同用户和控制中心的介质;(4)用户端:处于云端边缘的各个用户,用于对分割的数据进行分布式存储。
  现实生活中,数据丢失主要包含以下三种情况:
  情况1:云端数据丢失的数据恢复;当云端数据产生丢失,云端就会发送请求给控制中心,告诉控制中心有哪些数据缺失,控制中心对请求做出响应,进行相关的计算,然后控制中心会根据数据缺失的情况对客户端发出相应的请求,用户端收到请求后对请求做出响应,发送相应的数据给控制端,控制端再将相应的数据返回云端,这样,云端就可以恢复丢失的数据。具体如算法表1所示。
  情况2:云端数据丢失的数据访问持续性;云端的数据丢失后,若用户端i对云端丢失的数据发出请求,控制中心在收到该请求后,发现该请求的数据在云端已经缺失,这时控制中心会进行云端数据缺失的响应,控制中心找到用户端i请求的数据所在的用户端j,并且给用户端j发送请求,获取响应的数据并且发送给用户端i,这样用户端i的数据请求不会被迫终止。
  情况3:用户端数据丢失的数据恢复;当用户端的数据丢失,用户端可以直接发送响应的请求给控制中心,控制中心响应请求,从云端获取相关数据发送给用户端,解决用户端数据缺失的情况。具体如算法见表2。
  基于云计算的容灾备份方案具有动态恢复数据的特点,且在数据丢失时,用户的数据访问也不会被迫终止。云计算的数据容灾备份方案如图3所示。
  基于云计算的数据容灾备份方案主要有以下特点:数据的自动恢复与数据访问不被终止;但是在大型灾难发生时,很有可能发生数据中心和用户端的数据在短时间内都遭到破坏,针对这个问题,我们设计了两个策略以应对大型灾害对数据的损害。
  策略1:控制中心数据备份,在用户对服务器数据进行请求时,控制端会对请求的数据进行短期存储,这个期限根具数据安全的等级可以设定不同的时间值;这不仅能够有效地提升容灾备份的安全性,而且一般来说用户端对数据进行请求后短期内还可能对相同数据进行请求,控制中心将这部分数据进行短期保存可以减少数据中心的响应次数,提升数据访问的效率。
  策略2:用户端数据冗余备份,用户端的数据冗余备份是指:服务器在数据下发时,对一个用户端下发两份数据,其中一份数据是当前用户端需要的数据,另一份是其它用户端需要的数据。比如:服务器下发数据时,A用户端同时收到了A用户端的数据和D用户端的数据;D用户端也同时收到了D用户端的数据和A用户端的数据;这样一个用户端收到了两份数据;在发生灾祸时,由于A与D用户是相隔很远的两个用户端,它们的数据很难在同一较短时间被破坏,这样,A与D的数据备份多了一份保障,并且这份保障的代价也是很小的。因为,每一个用户只保存了一份其它用户的数据,用户只花费了较小的代价,就能有效的提升数据容灾备份的安全性。
  4 结语
  由于人们对数据容灾备份要求的提升,本文动态地结合云计算的特点,将云计算中分布式存储的特点巧妙地结合在了数据容灾备份方案中,该方案有效地解决了灾难发生时,数据丢失的动态恢复和数据丢失后的数据访问持续性的问题。考虑到大型灾难对云端服务器和用户端数据同时造成的数据丢失影响;本文还提出两种应对策略,极大地提高了數据容灾备份的安全等级。该方案不仅有效地运用了云计算技术的优点,而且为数据容灾备份提供了新的方向。
  参考文献
  [1] 陈建尧.云计算下的一种关联挖掘算法的研究[J].科技通报,2018,34(7):188-192.
  [2] Shao Q,Nan H,Yun G,Rong L,Jian H,Jun G and Louis G.A Fast Parallel Community Discovery Model on Complex Networks Through Approximate Optimization[J].IEEE Transactions on Knowledge and Data Engineering,2018,30(9):1638-1651.
  [3] Shao Q,Nan H,Jun W,Rong L,Louis G and Xin W.Predicting Long-term Trajectories of Connected Vehicles Via Prefix-projection Technique[J].IEEE Transactions on Intelligent Transportation Systems,2017,19(7):2305-2315.
  [4] 王鹏.云计算技术下的数据挖掘平台建构探讨[J].自动化与仪器仪表,2018(11):236-243.
  [5] Mengistu T,Alahmadi A,Albuali A,Alsenani Y and Che D.A "No Data Center" Solution to Cloud Computing[C].Proceedings of the 2017 IEEE 10th International Conference on Cloud Computing, Honolulu,CA,USA,2017:714-717.   [6] 张光亚.基于ICS的云计算资源预测负载的研究[J].科技通报,2019,35(4):93-98.
  [7] Shen J,Zhou T,He D,Zhang Y,Sun X,and Xiang Y.Block Design-Based Key Agreement for Group Data Sharing in Cloud Computing[J].IEEE Transactions on Dependable and Secure Computing,2019,16(6):996-1010.
  [8] 崔艳鹏,冯璐铭,闫峥,等.基于程序切片技术的云计算软件安全模型研究[J].信息网络安全,2019,19(7):31-41.
  [9] Bahrami M.Cloud Computing for Emerging Mobile Cloud Apps[C]. Proceedings of the 2015 3rd IEEE International Conference on Mobile Cloud Computing,Services,and Engineering,San Francisco,CA,USA,2015:4-5.
  [10] 傅思达,王福喜,高彬娜.多点多备的容灾备份技术研究与实现[J].軟件,2016,37(9):101-104.
  [11] 倪凯,李焱,陈石灵.安全生产数据的灾难备份技术方法研究[J].信息与电脑,2016(3):18-21.
  [12] 陈小建.基于OS及存储的数据库容灾技术研究[J].华东交通大学学报,2015,32(5):110-115.
  [13] Shi Z,Wang C,Wen Q,Su W,Zhou H and Gao S.A Transmission Mechanism of the Backup for Disaster Recovery in DCNs[C].The Proceedings of 2017 International Conference on Networking and Network Applications,Kathmandu,Nepal,2017:214-219.
  Abstract:How to reduce data loss is an important research content of data disaster recovery and backup, when natural disasters occur. Traditional disaster recovery backup solutions mainly use manual methods to back up stored data, the biggest disadvantage of such solution is that they cannot dynamically and quickly respond to data loss. Cloud computing-based data disaster recovery and backup strategy is a new solution on data storage. This method connects the servers through the Internet, stores the data in each data sub center, and has the function of data backup and real-time sharing. Combining the technical characteristics of cloud computing, this paper proposes a cloud computing-based data disaster recovery backup solution, when the disaster occurs and results in data loss, this solution can provide a quick emergency response, dynamically recover lost data and reduce the society and economic impact caused by data loss.
  Key words:cloud computing; data disaster; disaster recovery backup; distribute storage
转载注明来源:https://www.xzbu.com/8/view-15232940.htm