连续数据保护单元、用于数据保护的恢复单元及其方法与流程
未命名
08-17
阅读:88
评论:0
1.本发明大体上涉及数据备份和容灾领域;并且更具体地,涉及连续数据保护单元、恢复单元和数据保护方法。
背景技术:
2.通常,数据备份用于在主存储(如块存储设备)中发生数据丢失时保护和恢复数据。数据丢失事件的举例包括但不限于:数据损坏、主存储中的硬件或软件故障、数据意外删除、黑客攻击或恶意攻击。出于安全考虑,单独的备份系统或辅助存储被广泛用于存储主存储中的数据的备份。通常,对于辅助存储,随着时间的推移,由于不断变化的数据以及新数据,辅助存储的大量存储空间被占用。这不是理想的情况,因为它会降低辅助存储的性能。此外,数据存储的成本,以及包括存储硬件成本在内的所有关联成本,仍然是一个负担。
3.在一些实现方式中,会定期拍摄主存储中数据的快照,并与主存储中数据的上一个快照进行比较。此外,仅从最近的快照中读取两个快照之间差异,并仅将该差异发送到辅助存储。但是,由于快照是计算资源密集型的,因此它们的成本效益低,通常不适合主存储。此外,快照是临时的,并且会被频繁删除,这使得进程的计算资源更加密集。导致恢复点目标(recovery point objective,rpo)更大,这是快照不能频繁拍摄的主要原因之一。如果数据丢失,rpo越大,可能会导致从辅助存储到主存储的数据传输效率低下。此外,当快照挂载在阵列上,由辅助存储读取时,快照会降低阵列为生产工作负载提供的带宽。另一种实现方式中,使用了连续数据保护(continuous data protection,cdp),其中,分离器拦截接收到的数据(用于主存储),并将接收到的数据镜像到辅助存储中的数据移动器。但是,这种实现方式存在若干限制。有更高的带宽要求,而且由于数据是实时镜像的,带宽经常会因为数据峰值而波动。因此,用于在辅助存储中存储数据的这种实现方式取决于工作负载和数据容量对存储和性能的需求。如果使用cdp将数据传输到云,那么所有的数据都会连续传输到云,但仍然存在带宽波动问题。通常,在将数据写入本地辅助存储时,带宽较高,但在写入云时,带宽可能更低。此外,当辅助存储和云存储的rpo相同时,带宽波动可能会导致数据传输到云时出错,并且无法保持连续复制到云。例如,根据数据备份到辅助存储的频率,辅助存储可能不提供过去几个小时的备份数据。
4.因此,根据上述讨论,需要克服与具有cdp的传统数据备份相关的上述缺点。
技术实现要素:
5.本发明寻求提供一种连续数据保护(continuous data protection,cdp)单元、恢复单元、数据保护组件和数据保护方法。本发明寻求提供一种方案,解决cdp和与cdp相关联的云存储的相同恢复点目标(recovery point objective,rpo)的现有问题,所述问题具有导致数据丢失的风险,并且使得将数据检索到主存储时低效且易出错。本发明的目的是提供一种至少部分克服现有技术中遇到的问题的方案,并通过在cdp和与cdp相关联的云存储中实现可变恢复点目标来提供改进的数据备份和检索。
6.本发明的目的是通过所附独立权利要求中提供的方案实现的。本发明的有利实现方式在从属权利要求中进一步定义。
7.一方面,本发明提供了一种连续数据保护(continuous data protection,cdp)单元,用于从主分离器接收以输入变更集的形式发送到主存储的输入数据的副本,所述cdp单元包括cdp数据移动器和cdp存储单元,所述cdp数据移动器用于接收输入变更集,并将基于一个或多个变更集的恢复数据写入cdp存储单元和用于保存恢复数据的副本的恢复单元。
8.本发明的cdp单元和恢复单元通过实现用于cdp单元和恢复单元的可变rpo来提供改进的数据备份、数据安全和检索。cdp单元和恢复单元的rpo可以根据要求改进(例如优化)。恢复单元的rpo根据数据写入恢复单元的方式而变化。数据可以由cdp单元直接发送到恢复单元,以实现用于恢复单元的低rpo。此外,数据可以先发送到cdp日志单元,然后通过应用写入合并从cdp日志读取,然后将数据发送到恢复单元,以实现用于恢复单元的更高的rpo。此外,可以通过合并的方式从cdp存储单元读取变更集,以实现大幅节省带宽。因此,本发明能够在主存储中发生数据丢失的情况下将数据从cdp单元和恢复单元有效地传输到主存储。
9.一种实现方式中,cdp数据移动器用于将输入变更集作为恢复数据转发到恢复单元。
10.cdp数据移动器以不同的方式将输入变更集作为恢复数据转发到恢复单元,以便实现用于cdp单元和恢复单元的不同的(或可变的)恢复点目标。
11.另一种实现方式中,cdp数据移动器用于通过合并来自两个或更多的cdp变更集的数据来创建恢复数据。
12.通过合并来自两个或更多的cdp变更集的数据,cdp单元的带宽实现显著节省,进一步提高了计算过程的效率。
13.另一种实现方式中,cdp日志单元用于临时存储输入变更集,其中,cdp数据移动器用于将输入数据集转发给cdp日志单元,cdp数据移动器还用于从cdp日志单元读取一个或多个输入变更集,并且恢复数据是基于一个或多个cdp变更集的数据。
14.通过将数据转发到cdp日志单元,然后从cdp日志单元读取,使用写入合并对输入变更集进行合并。因此,cdp单元的带宽实现了显著节省。
15.另一种实现方式中,cdp单元包括cdp存储单元的一个或多个cdp快照,每个cdp快照是所述cdp存储单元在特定时间点的副本,其中,cdp数据移动器用于根据来自所述一个或多个cdp快照中的至少一个的数据创建恢复数据。
16.cdp快照存储不同时间点的数据。因此,cdp单元可以合并几个小时的数据,然后发送到恢复单元,以节省带宽。
17.另一方面,本发明提供了一种用于数据保护的恢复单元,所述恢复单元包括用于从cdp单元中的cdp数据移动器接收恢复数据的恢复单元日志、用于从恢复单元日志接收恢复数据的恢复单元数据移动器以及用于保存恢复数据的副本的恢复单元存储。
18.本发明的恢复单元和cdp单元通过实现用于恢复单元和cdp单元的可变rpo来提供改进的数据备份和检索。cdp单元和恢复单元的rpo可根据要求优化。恢复单元的rpo根据数据写入恢复单元的方式而变化。数据可以由cdp单元直接发送到恢复单元,以实现用于恢复单元的低rpo。此外,数据可以先发送到cdp日志单元,然后通过应用写入合并从cdp日志读
取,然后将数据发送到恢复单元,以实现用于恢复单元的更高的rpo。此外,可以通过合并的方式从cdp存储单元读取变更集,以实现大幅节省带宽。因此,本发明能够在主存储中发生数据丢失的情况下将数据从cdp单元和恢复单元有效地传输到主存储。
19.一种实现方式中,恢复单元还包括一个或多个恢复单元快照单元,所述恢复单元快照单元用于保存所述恢复单元存储的瞬时快照。
20.恢复单元快照单元存储不同时间点的恢复单元存储的数据。因此,在将数据检索到主存储的情况下,可以检索不同时间点的数据。
21.另一方面,本发明提供了一种数据保护组件,包括cdp单元和恢复单元,其中,cdp数据移动器用于将恢复数据转发到恢复单元数据移动器。
22.包括恢复单元和cdp单元的数据保护组件通过实现用于恢复单元和cdp单元的可变rpo来提供改进的数据备份和检索。数据保护组件实现了本发明的cdp单元和恢复单元的所有优点和效果。
23.另一方面,本发明提供了一种数据保护方法,涉及包括cdp数据移动器和cdp存储单元的cdp单元,所述方法包括以一个或多个输入变更集的形式从主分离器接收输入数据到cdp数据移动器的步骤。所述方法还包括将基于输入变更集的恢复数据从cdp数据移动器转发到cdp存储单元和用于保存恢复数据的副本的恢复单元。
24.在数据保护方法中,恢复单元和cdp单元通过实现用于恢复单元和cdp单元的可变rpo来提供改进的数据备份和检索。数据保护方法实现了本发明的cdp单元和恢复单元的所有优点和效果。
25.另一种实现方式中,cdp单元还包括cdp日志单元,所述方法还包括以下步骤:将来自cdp数据移动器的输入变更集写入cdp日志单元,由所述cdp数据移动器从cdp日志单元读取一个或多个输入变更集,在cdp数据移动器中创建基于从cdp日志单元读取的一个或多个输入变更集的恢复数据。
26.通过将数据转发到cdp日志单元,然后从cdp日志单元读取,使用写入合并对输入变更集进行合并。因此,cdp单元的带宽实现了显著节省。
27.另一种实现方式中,cdp单元还包括cdp存储单元的一个或多个快照,每个cdp快照是所述cdp存储单元在特定时间点的副本,所述方法还包括由cdp数据移动器读取所述快照中的至少一个,并根据来自至少一个快照的数据创建恢复数据,例如通过确定在不同时间点拍摄的两个快照之间的差异,或计算到达所述恢复单元的恢复单元快照单元的最后副本与所述cdp快照之间的差异。
28.cdp快照存储不同时间点的数据。因此,cdp单元可以合并几个小时的数据,然后发送到恢复单元,以节省带宽。
29.另一方面,本发明提供了一种用于控制cdp存储单元的计算机程序产品,所述计算机程序产品包括计算机可读代码装置,当在控制单元中执行时,所述计算机可读代码装置将使控制单元控制cdp存储单元来执行上一方面的方法。
30.通过计算机程序产品,cdp单元和恢复单元通过实现用于恢复单元和cdp单元的可变rpo来提供改进的数据备份和检索。计算机程序产品实现了本发明的cdp单元和恢复单元的所有优点和效果。
31.另一种实现方式中,一种用于控制数据保护组件的计算机程序产品,所述计算机
程序产品包括计算机可读代码装置,当在控制单元中执行时,所述计算机可读代码装置将使控制单元控制cdp存储单元来执行上一方面的方法。
32.通过计算机程序产品中的计算机可读代码,cdp单元和恢复单元通过实现用于恢复单元和cdp单元的可变rpo来提供改进的数据备份和检索。
33.另一种实现方式中,一种用于cdp存储单元的控制单元,包括保存上一方面的计算机程序产品的程序存储器。
34.计算机程序实现了本发明的cdp单元的所有优点和效果。
35.应当理解,可以组合所有上述实现方式。应当注意,本技术中描述的所有设备、元件、电路、单元和装置可以在软件或硬件元件或其任何类型的组合中实现。本技术中描述的各种实体所执行的所有步骤以及所描述的各种实体要执行的功能均意在指相应实体用于执行相应步骤和功能。虽然在以下具体实施例的描述中,外部实体要执行的具体功能或步骤没有在执行具体步骤或功能的实体的具体详述元件的描述中反映,但是技术人员应清楚,这些方法和功能可以通过相应硬件或软件元件或其任何组合实现。应当理解,本发明的特征易于以各种组合进行组合,而不脱离由所附权利要求书所界定的本发明的范围。
36.本发明的其它方面、优点、特征和目的从附图和结合以下所附权利要求书解释的说明性实现方式的详细描述中变得显而易见。
附图说明
37.当结合附图阅读时,可以更好地理解以上发明内容以及说明性实施例的以下详细描述。为了说明本发明,本发明的示例性结构在附图中示出。但是,本发明不限于本文公开的具体方法和工具。此外,本领域技术人员应理解,附图不是按比例绘制的。在可能的情况下,相似的元件用相同的数字表示。
38.现在参考下图仅作为示例来描述本发明的实施例,其中:
39.图1是示出根据本发明的实施例的连续数据保护单元的方框图;
40.图2是示出根据本发明的实施例的用于数据保护的恢复单元的方框图;
41.图3是示出根据本发明的实施例的数据保护组件的方框图;
42.图4是根据本发明的实施例的数据保护方法的流程图;
43.图5是根据本发明的实施例的数据保护组件的图示。
44.在附图中,带下划线的数字用于表示带下划线的数字所在的项目或与带下划线的数字相邻的项目。不带下划线的数字与项目有关,该项目由该不带下划线的数字通过线连接而进行标识。当一个数字不带下划线并具有关联的箭头时,该不带下划线的数字用于标识箭头指向的一般项目。
具体实施方式
45.以下详细描述说明了本发明的实施例以及可以实现这些实施例的方式。虽然已经公开了实施本发明的一些模式,但本领域技术人员应认识到,也可以存在用于实施或实践本发明的其它实施例。
46.图1是示出根据本发明的实施例的连续数据保护单元的方框图。参考图1,示出了连续数据保护(continuous data protection,cdp)单元100。连续数据保护单元100包括
cdp数据移动器102和cdp存储单元104。连续数据保护单元100还包括cdp日志单元106。另外,还示出了恢复单元108和主分离器110。
47.一方面,本发明提供了一种连续数据保护(continuous data protection,cdp)单元100,用于从主分离器110接收以输入变更集的形式发送到主存储的输入数据的副本,所述cdp单元100包括cdp数据移动器102和cdp存储单元104,所述cdp数据移动器102用于接收输入变更集,并将基于一个或多个变更集的恢复数据写入cdp存储单元104和用于保存恢复数据的副本的恢复单元108。
48.连续数据保护单元100用于从主分离器110接收以输入变更集的形式发送到主存储的输入数据的副本。连续数据保护单元100是用于向数据存储系统提供连续数据保护服务的硬件、软件、固件或其组合。cdp单元100用于存储从主分离器110接收的输入变更集,并在需要时进一步将输入变更集提供给计算系统。在一个示例中,这里的输入变更集是指与先前存储的数据相比是新的数据,或与先前存储的数据相比是更新后的数据。输入变更集的示例可以包括但不限于输入/输出(input/output,i/o)写入请求数据、由块存储接收的数据等,与cdp单元100中先前存储的数据相比,这些数据可以是新数据。
49.主分离器110是输入/输出过滤器软件(例如驱动程序),可以安装在例如虚拟机管理程序等和主存储之间的数据路径上。换句话说,所有输入/输出都通过主分离器110实现流式传输。在一个示例中,当完整的服务器受到保护时,主分离器110可以安装在裸机服务器内的数据路径中的任何位置。在另一个示例中,当客vm受到保护时,主分离器110可以安装在客虚拟机(virtual machine,vm)内核中。在另一个示例中,主分离器110可以安装在虚拟机管理程序内核中,拦截所有vm的虚拟磁盘(vdisk)的输入/输出。在另一个示例中,主分离器110可以安装在存储阵列内,在其端点处拦截所有输入/输出。主分离器110拦截接收到的输入/输出(即输入数据),并将它们(以输入变更集的形式)镜像到数据移动器,例如cdp单元100中的cdp数据移动器102。主分离器110和cdp单元100之间的协议可以是同步的,也可以是异步的。当协议同步时,主分离器110保存输入/输出,向cdp单元100发送副本,等待确认,并且只有接收到确认后,才允许继续沿数据路径输入/输出。当协议异步时,主分离器110累积输入/输出,并定期(例如每5秒)将它们打包在一个对象中以发送到cdp单元100,而不等待确认。主存储可以包括适当的逻辑、电路和接口,用于存储输入数据。主存储的实现方式示例包括但不限于服务器、生产环境系统、连接到服务器的瘦客户端、主存储系统以及用户设备(例如计算设备)。主存储中的输入数据的备份存储在cdp单元100和恢复单元108中,以在主存储中发生数据丢失的情况下能够恢复数据。
50.cdp数据移动器102用于接收输入变更集,并将基于一个或多个变更集的恢复数据写入cdp存储单元104和用于保存恢复数据的副本的恢复单元108。cdp数据移动器102为一种设备或微服务,从主分离器110接收输入/输出,并以例如恢复单元日志的形式将输入/输出发送到cdp存储单元104和恢复单元108。cdp存储单元104包括适当的逻辑、电路和接口,用于存储输入变更集。由cdp单元100接收的输入变更集用于在发生任何数据损坏、主存储的硬件或软件故障、数据的意外删除、黑客攻击或恶意攻击的情况下恢复数据,因此一个或多个输入变更集会被写入作为恢复数据。恢复数据被写入cdp存储单元104,恢复数据的副本被写入恢复单元108,以实现cdp单元100和恢复单元108的可变恢复点目标(recovery point objective,rpo),并进一步显著节省带宽。cdp单元100的rpo可以称为本地rpo。这里
的恢复单元108是指存储恢复数据副本的存储,例如云存储。换句话说,恢复数据被复制到恢复单元108。
51.rpo可以称为用户或与存储cdp单元100中数据备份的用户设备或用户设备的网络相关联的组织所能接受的数据丢失的时间间隔。换句话说,rpo是系统在发生故障时丢失的数据量,即,如果rpo为一小时,rpo是指故障前最后一个小时丢失的数据。
52.cdp单元100还可以包括控制单元112。控制单元112也可以称为控制器,例如处理器。控制单元112可以包括计算机可读代码装置,当在控制单元112中执行时,所述装置使控制单元112控制cdp存储单元104。用于cdp存储单元104的控制单元112包括程序存储器114。程序存储器114用于保存计算机程序产品。
53.根据一个实施例,cdp数据移动器102用于通过合并来自两个或更多的cdp变更集的数据来创建恢复数据。cdp数据移动器102用于应用写入合并(也可以称为智能写入合并),其中,一批变更集被合并为一个比该批次小得多的变更集。这样做的好处是,如果特定块范围被多次盖写,则仅使用最近写入的数据来创建恢复数据。这显著减少了变更量并节省了带宽。
54.根据一个实施例,cdp单元100还包括用于临时存储输入变更集的cdp日志单元106,cdp数据移动器102用于将输入数据集转发到cdp日志单元106,cdp数据移动器102还用于从cdp日志单元106读取一个或多个输入变更集,并且恢复数据是基于一个或多个cdp变更集的数据。cdp日志单元106也可以称为cdp日志。cdp日志单元106用于存储应用于输入数据变更集的变更日志。输入变更集的临时存储使得cdp数据移动器102能够在两个或更多的输入变更集上执行写入合并。此外,基于执行写入合并的一个或多个cdp变更集,恢复数据由恢复单元108创建。因此,cdp单元的带宽实现了显著节省。日志还用于实现任何时间点恢复。通过将日志数据应用于上一时间点的快照,可以获得更加新的时间点,以及对时间点的细粒度访问。
55.根据一个实施例,cdp单元100包括cdp存储单元104的一个或多个cdp快照,每个cdp快照是cdp存储单元104在特定时间点的副本,其中,cdp数据移动器102用于根据来自所述一个或多个cdp快照中的至少一个的数据创建恢复数据。cdp快照是指cdp存储单元104在不同时间点的完整副本,使得能够恢复到多个时间点。在一个示例中,cdp快照可以每隔1小时、每3小时或每6小时等创建。因此,能够根据cdp快照实现数据恢复。cdp数据移动器102创建用于从一个或多个cdp快照中的至少一个发送到恢复单元108的恢复数据。因此,cdp单元100可以合并几个小时的数据,然后发送到恢复单元108以节省带宽。利用快照使得能够直接从卷(即数据)读取数据,而不是从cdp日志单元106读取数据。
56.根据一个实施例,cdp数据移动器102用于将输入变更集作为恢复数据转发到恢复单元108。cdp数据移动器102以不同的方式将输入变更集作为恢复数据转发到恢复单元,以便实现用于cdp单元100和恢复单元108的不同的恢复点目标。输入变更集作为恢复数据转发到恢复单元108,以在发生例如网络攻击或数据损坏等灾难时能够恢复。在一个示例中,恢复数据的完整副本在恢复单元108中存档非常长的时间。在另一个示例中,数据的副本在恢复单元108中连续保存和更新,以在发生例如网络攻击或数据损坏等灾难时能够恢复。cdp单元100和恢复单元108的这种用法可以称为级联cdp单元。
57.向恢复单元108发送变更集的方式有多种。在一个示例中,变更集可以在将其写入
cdp日志单元106之前直接发送到恢复单元108,因而能获得低rpo。在另一个示例中,在从cdp日志单元106读取一组变更集并使用写入合并进行合并之后,可以将变更集发送到恢复单元108,与将变更集写入cdp存储单元104并行执行。在另一个示例中,可以从cdp快照读取变更集,在这种情况下,所述变更集可以是cdp日志单元106中几个小时的变更集的合并。
58.与cdp单元100类似,恢复单元108还可以包括恢复单元日志、恢复单元数据移动器和恢复单元存储。因此,恢复单元108还可以具有rpo,该rpo还称为远程rpo的。
59.因此,在本发明中,启用cdp单元100的本地rpo和恢复单元108的远程rpo的配置,使得恢复单元108的远程rpo可以是本地rpo的任意倍数(即,在将数据发送到恢复单元108之前合并了多少变更集)。合并可以显著节省带宽。
60.此级联cdp单元实现了从连续移动数据到从cdp快照读取数据的平滑过渡。从cdp快照读取数据使得能够创建更多顺序工作负载,这能够在cdp单元100处进行重复数据删除以及减少负载。在cdp单元100从cdp快照将数据传输到恢复单元108的情况下,可以通过从第一快照获取差异或通过维护变更的位图来跟踪未传输的变更。由于数据也保存在cdp日志单元106中,因此cdp单元100可以移动到任何一点以将数据从cdp日志单元106传输到恢复单元108,从而实现对cdp单元100的本地rpo的完全动态控制。
61.本发明的cdp单元100和恢复单元108通过实现用于cdp单元100和恢复单元108的可变rpo来提供改进的数据备份和检索。cdp单元100和恢复单元108的rpo可根据要求优化。恢复单元108的rpo根据数据写入恢复单元108的方式而变化。数据可以由cdp单元100直接发送到恢复单元108,以实现用于恢复单元108的低rpo。此外,数据可以先发送到cdp日志单元106,然后通过应用写入合并从cdp日志单元106读取,然后将数据发送到恢复单元108,以实现用于恢复单元108的更高的rpo。此外,可以通过合并的方式从cdp存储单元106读取变更集,以大幅节省带宽。因此,本发明能够在主存储中发生数据丢失的情况下将数据从cdp单元100和恢复单元108有效地传输到主存储。例如,如果恢复单元的rpo更高,则数据可以每隔1分钟写入cdp存储单元,但每隔5分钟发送到恢复单元。
62.图2是示出根据本发明的实施例的用于数据保护的恢复单元的方框图。参考图2,示出了恢复单元108。恢复单元108包括恢复单元日志202、恢复单元数据移动器204和恢复单元存储206。此外,还示出了包括cdp数据移动器102的cdp单元100。
63.另一方面,本发明提供了一种用于数据保护的恢复单元108,所述恢复单元包括用于从cdp单元100中的cdp数据移动器102接收恢复数据的恢复单元日志202、用于从恢复单元日志202接收恢复数据的恢复单元数据移动器204以及用于保存恢复数据的副本的恢复单元存储206。
64.恢复单元108是指用于存储由存储cdp单元100提供的来自于例如计算系统的数据(即恢复数据)的硬件、软件、固件或其组合。恢复单元108也可以称为云存储。在一个示例中,恢复单元108用于将恢复数据的完整副本存储非常长的时间。在另一个示例中,恢复单元108用于连续存储和更新数据的副本,以在发生例如网络攻击或数据损坏等灾难时能够恢复。
65.恢复单元日志202用于从cdp单元100中的cdp数据移动器102接收恢复数据。根据接收到的恢复数据,恢复单元日志202用于存储应用于恢复数据的变更日志。通过恢复单元日志202接收恢复数据的方式可以有多种。在一个示例中,由cdp单元100接收的变更集可以
在将其写入cdp日志单元106之前,作为恢复数据直接发送到恢复单元108。在另一个示例中,在从cdp日志单元106读取一组变更集并在cdp单元100处使用写入合并进行合并之后,可以将变更集作为恢复数据发送到恢复单元108。在另一个示例中,cdp数据移动器102可以从cdp快照读取变更集,然后发送到恢复单元日志202。
66.恢复单元数据移动器204用于从恢复单元日志202接收恢复数据。换句话说,恢复单元数据移动器204从恢复单元日志202读取恢复数据,并将它们应用于恢复单元副本,即恢复单元108中的恢复数据的副本。
67.恢复单元存储206用于保存恢复数据的副本。恢复单元存储206包括适当的逻辑、电路和接口,用于存储恢复数据。恢复单元存储206的实现方式示例包括但不限于电可擦除可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、随机存取存储器(random access memory,ram)、只读存储器(read only memory,rom)、硬盘驱动器(hard disk drive,hdd)、闪存、固态驱动器(solid-state drive,ssd)或cpu高速缓存存储器。
68.根据一个实施例,数据可以从cdp数据移动器102发送到恢复单元数据移动器204,所述远程数据移动器204将数据写入恢复单元日志202,随后远程数据移动器204从恢复单元日志202读取数据并将数据写入恢复单元存储206。
69.根据一个实施例,恢复单元108还包括一个或多个恢复单元快照单元,用于保存恢复单元存储206的瞬时快照。在恢复单元108中会周期性地创建恢复单元存储206中恢复数据的副本的快照,使得能够快速恢复到几乎任何时间点。通过恢复最新的恢复单元快照单元并应用恢复单元日志202在恢复单元快照单元之后接收的变更集,则可以使得特定的时间点总是可用的。因此,在将数据检索到主存储的情况下,可以检索不同时间点的数据。
70.根据一个实施例,恢复单元108还可以包括容灾协调服务,以将数据恢复到请求的时间点,并实例化例如虚拟机等。
71.这样做的好处是,在本发明中,启用cdp单元100的本地rpo和恢复单元108的远程rpo的配置,使得恢复单元108的远程rpo可以是本地rpo的任意倍数(即,在把数据发送到恢复单元108之前合并了多少变更集)。合并可以显著节省带宽。此外,根据从cdp单元100发送到恢复单元108的恢复数据获得可变rpo。在一个示例中,变更集可以在将其写入cdp日志单元106之前直接发送到恢复单元108,因而能获得低恢复点目标(recovery point objective,rpo)。
72.本发明的恢复单元和cdp单元通过实现用于恢复单元和cdp单元的可变rpo来提供改进的数据备份和检索。cdp单元和恢复单元的rpo可根据要求优化。恢复单元的rpo根据数据写入恢复单元的方式而变化。数据可以由cdp单元直接发送到恢复单元,以实现用于恢复单元的低rpo。此外,数据可以先发送到cdp日志单元,然后通过应用写入合并从cdp日志读取,然后将数据发送到恢复单元,以实现用于恢复单元的更高的rpo。此外,可以通过合并的方式从cdp存储单元读取变更集,以大幅节省带宽。因此,本发明能够在主存储中发生数据丢失的情况下将数据从cdp单元和恢复单元有效地传输到主存储。
73.图3是示出根据本发明的实施例的数据保护组件的方框图。参考图3,示出了数据保护组件300。数据保护组件300包括cdp单元100和恢复单元108。cdp单元100包括cdp数据移动器102、cdp存储单元104和cdp日志单元106。恢复单元108包括恢复单元日志202、恢复
单元数据移动器204和恢复单元存储206。
74.另一方面,本发明提供了数据保护组件300,包括cdp单元100和恢复单元108,其中,cdp数据移动器102用于将恢复数据转发到恢复单元数据移动器204。
75.这里的数据保护组件300是指cdp单元100(图1)和恢复单元108(图2)的级联布置,其中,cdp单元100的cdp数据移动器102用于将恢复数据转发到恢复单元数据移动器204。通过级联布置,获得了rpo的优化,使得cdp单元100和恢复单元108与传统数据保护系统相比可以具有不同的(可变的)rpo。在传统数据保护系统中rpo不能优化,因为传统连续数据保护无法用于与云存储级联。
76.数据保护组件300中的cdp单元100从主分离器110接收输入变更集。此外,cdp单元100的cdp数据移动器102接收输入变更集,并将恢复数据写入cdp存储单元104和恢复单元108的恢复单元数据移动器204。在数据保护组件300中,恢复单元108和cdp单元100通过实现用于恢复单元108和cdp单元100的可变rpo来提供改进的数据备份和检索。
77.根据一个实施例,cdp数据移动器102通过合并来自两个或更多的cdp变更集的数据来创建恢复数据。cdp数据移动器102用于应用写入合并,其中,一批变更集被合并成一个比该批次小得多的变更集。这显著减少了变更量并节省了带宽。
78.根据一个实施例,cdp数据移动器102用于将输入数据集转发到cdp日志单元106,并进一步从cdp日志单元106读取一个或多个输入变更集。输入变更集的临时存储使得cdp数据移动器102能够在两个或更多的输入变更集上执行写入合并。
79.根据一个实施例,cdp单元100包括cdp存储单元104的一个或多个cdp快照,每个cdp快照是cdp存储单元104在特定时间点的副本。cdp数据移动器102创建用于从一个或多个cdp快照中的至少一个发送到恢复单元108的恢复数据。利用快照使得能够直接从卷(即数据)读取数据,而不是从cdp日志单元106读取数据。
80.根据一个实施例,cdp数据移动器102用于将输入变更集作为恢复数据转发到恢复单元108。输入变更集作为恢复数据转发到恢复单元108,以在发生例如网络攻击或数据损坏等灾难时能够恢复。
81.向恢复单元108发送变更集的方式有多种。在一个示例中,变更集可以在将其写入cdp日志单元106之前直接发送到恢复单元108,因而能获得低rpo。在另一个示例中,在从cdp日志单元106读取一组变更集并使用写入合并进行合并之后,可以将变更集发送到恢复单元108,与将变更集写入cdp存储单元104并行执行。在另一个示例中,可以从cdp快照读取变更集,在这种情况下,所述变更集可以是cdp日志单元106中几个小时的变更集的合并。
82.恢复单元108的恢复单元日志202用于从cdp单元100中的cdp数据移动器102接收恢复数据。根据接收到的恢复数据,恢复单元日志202用于存储应用于恢复数据的变更日志。恢复单元108的恢复单元数据移动器204用于从恢复单元日志202接收恢复数据。换句话说,恢复单元数据移动器204从恢复单元日志202读取恢复数据,并将它们应用于恢复单元副本,即恢复单元108中的恢复数据的副本。恢复单元存储206用于保存恢复数据的副本。根据一个实施例,恢复单元108还包括一个或多个恢复单元快照单元,用于保存恢复单元存储206的瞬时快照。在恢复单元108中会周期性地创建恢复单元存储206中恢复数据的副本的快照,使得能够快速恢复到几乎任何时间点。
83.图4是根据本发明的实施例的数据保护方法的流程图。参考图4,示出了数据保护
方法400。数据保护方法400例如在图1描述的cdp单元100中执行。数据保护方法400包括步骤402和404。
84.另一方面,本发明提供了一种数据保护方法400,涉及包括cdp数据移动器102和cdp存储单元104的cdp单元100,所述方法400包括以下步骤:
85.以一个或多个输入变更集的形式从主分离器110接收输入数据到cdp数据移动器102;
86.将基于输入变更集的恢复数据从cdp数据移动器102转发到cdp存储单元104和用于保存恢复数据的副本的恢复单元108。
87.在步骤402,数据保护方法400包括以一个或多个输入变更集的形式从主分离器110接收输入数据到cdp数据移动器102。输入数据由cdp数据移动器102从主分离器110接收,使得能够向例如计算系统提供连续数据保护服务。从主分离器110接收的输入变更集被存储,并在需要时进一步提供给计算系统。
88.在步骤404,数据保护方法400包括将基于输入变更集的恢复数据从cdp数据移动器102转发到cdp存储单元104和用于保存恢复数据的副本的恢复单元108。由cdp单元100接收的输入变更集作为恢复数据被转发,以在发生任何数据损坏、主存储的硬件或软件故障、数据的意外删除、黑客攻击或恶意攻击的情况下能够恢复数据。恢复数据被转发到cdp存储单元104和恢复单元108,以实现cdp单元100和恢复单元108的可变rpo,并进一步显著节省带宽。在数据保护方法400中,恢复单元108和cdp单元100通过实现用于恢复单元108和cdp单元100的可变rpo来提供改进的数据备份和检索。
89.根据一个实施例,数据保护方法400包括在cdp数据移动器102中合并来自两个或更多的输入变更集的数据以创建恢复数据的步骤。通过将两个或更多的输入变更集合并到一个所述批次小得多的变更集,将写入合并步骤应用于两个或更多的输入变更集。这样做的好处是,如果特定块范围被多次盖写,则仅使用最近写入的数据来创建恢复数据。这显著减少了变更量并节省了带宽。
90.根据一个实施例,数据保护方法400包括将来自cdp数据移动器102的输入变更集写入cdp日志单元106,由cdp数据移动器102从cdp日志单元106读取一个或多个输入变更集,在cdp数据移动器102中创建基于从cdp日志单元106读取的一个或多个输入变更集的恢复数据。根据接收到的输入变更集,cdp日志单元106存储应用于输入数据变更集的变更日志。从cdp日志单元106写入和读取输入变更集使得能够在一个或多个输入变更集上执行写入合并。根据从cdp日志单元106接收的恢复数据,执行写入合并并创建恢复数据以发送到恢复单元108。因此,cdp单元的带宽实现了显著节省。
91.根据一个实施例,在数据保护方法400中,cdp单元100还包括cdp存储单元104的一个或多个快照,每个cdp快照是cdp存储单元104在特定时间点的副本,方法400还包括由cdp数据移动器102读取所述快照中的至少一个,并根据来自至少一个快照的数据创建恢复数据,例如通过确定在不同时间点拍摄的两个所述快照之间的差异,或计算到达恢复单元108的恢复单元快照单元的最后副本与所述cdp快照之间的差异。如果数据是以连续方式发送的,最后一个副本可以是cdp快照,而不是恢复单元快照单元。cdp快照支持恢复到多个时间点。cdp快照被读取,并由cdp数据移动器102创建恢复数据,以发送到恢复单元108。在一个示例中,在不同时间点拍摄的两个快照之间的差异使得能够创建具有变更或变更后的输入
数据的恢复数据。利用快照使得能够直接从卷(即数据)读取数据,而不是从cdp日志单元106读取数据。cdp单元100可以合并几个小时的数据,然后发送到恢复单元108以节省带宽。
92.步骤402至404仅仅是说明性的,还可以提供其它替代方案,其中添加一个或多个步骤,删除一个或多个步骤,或以不同的顺序提供一个或多个步骤,而不脱离本文权利要求的范围。
93.另一方面,提供了一种用于控制cdp存储单元104的计算机程序产品,包括计算机可读代码装置,当在控制单元112中执行时,所述计算机可读代码装置将使控制单元112控制cdp存储单元104来执行方法400。用于控制cdp存储单元104的计算机程序产品包括非瞬时性计算机可读存储介质,所述存储介质具有可由控制单元112执行以执行方法400的计算机可读代码装置。通过计算机程序产品,cdp单元100和恢复单元108通过实现用于恢复单元108和cdp单元100的可变rpo来提供改进的数据备份和检索。
94.另一方面,提供了一种用于控制数据保护组件300的计算机程序产品,包括计算机可读代码装置,当在控制单元112中执行时,所述计算机可读代码装置将使控制单元112控制cdp存储单元104来执行方法400。用于控制数据保护组件300的计算机程序产品包括非瞬时性计算机可读存储介质,所述存储介质具有可由控制单元112执行以执行方法400的计算机可读代码装置。通过计算机程序产品中的计算机可读代码,cdp单元100和恢复单元108通过实现用于恢复单元108和cdp单元100的可变rpo来提供改进的数据备份和检索。非瞬时性计算机可读存储介质的实现方式示例包括但不限于电可擦除可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、随机存取存储器(random access memory,ram)、只读存储器(read only memory,rom)、硬盘驱动器(hard disk drive,hdd)、闪存、安全数字(secure digital,sd)卡、固态硬盘(solid-state drive,ssd)、计算机可读存储介质或cpu高速缓冲存储器。
95.用于cdp存储单元104的控制单元112包括保存计算机程序产品的程序存储器114。程序存储器114包括适当的逻辑、电路和接口,用于存储计算机程序产品。通过将计算机程序产品保存在控制单元112中的程序存储器114,cdp单元100和恢复单元108通过实现用于恢复单元108和cdp单元100的可变rpo来提供改进的数据备份和检索。程序存储器114的实现方式示例包括但不限于电可擦除可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、随机存取存储器(random access memory,ram)、只读存储器(read only memory,rom)、硬盘驱动器(hard disk drive,hdd)、闪存、固态驱动器(solid-state drive,ssd)或cpu高速缓存存储器。
96.图5是根据本发明的实施例的数据保护组件的图示。参考图5,示出了数据保护组件500。数据保护组件500包括cdp单元502和恢复单元504。cdp单元502包括cdp数据移动器506、cdp存储单元508和cdp日志单元510。恢复单元504包括恢复单元日志512、恢复单元数据移动器514和恢复单元存储516。此外,还示出了虚拟机管理程序518、主分离器520和主存储522。
97.主分离器520用于向cdp单元502提供以输入变更集的形式发送到主存储522的输入数据的副本。主分离器520安装在虚拟机管理程序518上的虚拟机(virtual machine,vm)中。输入集被发送到主存储522的虚拟机文件系统(virtual machine file system,vmfs)中的虚拟机磁盘(virtual machine disk,vmdk)或网络文件系统(network file system,
nfs)。
98.cdp数据移动器506用于接收输入变更集,并将基于一个或多个变更集的恢复数据写入cdp存储单元508和用于保存恢复数据的副本的恢复单元504。
99.根据一个实施例,cdp数据移动器506用于通过合并来自两个或更多的cdp变更集的数据来创建恢复数据。根据一个实施例,cdp日志单元510用于临时存储输入变更集,所述cdp数据移动器506用于将输入数据集转发到cdp日志单元510,cdp数据移动器102还用于从cdp日志单元510读取一个或多个输入变更集,并且恢复数据是基于一个或多个cdp变更集的数据。根据一个实施例,cdp单元502包括cdp存储单元508的一个或多个cdp快照524,每个cdp快照是cdp存储单元508在特定时间点的副本,其中,cdp数据移动器506用于根据来自所述一个或多个cdp快照524中的至少一个的数据创建恢复数据。根据一个实施例,cdp数据移动器506用于将输入变更集作为恢复数据转发到恢复单元504。
100.恢复单元日志512用于从cdp单元502中的cdp数据移动器506接收恢复数据。恢复单元数据移动器514用于从恢复单元日志512接收恢复数据。恢复单元存储516用于保存恢复数据的副本。
101.根据一个实施例,恢复单元504还包括一个或多个恢复单元快照单元526,用于保存恢复单元存储516的瞬时快照。根据一个实施例,恢复单元504还可以包括容灾协调服务528,以将数据恢复到请求的时间点,并实例化虚拟机等。
102.在不脱离所附权利要求所定义的本发明范围的情况下,可以对上文描述的本发明的实施例进行修改。如“包括”、“包含”、“并入”、“是/为”等用于描述和要求保护本发明的表述旨在以非排他性的方式解释,即允许未明确描述的项目、组件或元件也存在。对单数的引用也被理解为涉及复数。本文使用的词语“示例性”表示“作为一个示例、实例或说明”。任何被描述为“示例性的”实施例不一定解释为比其它实施例更优选或更有利,和/或排除其它实施例的特征的结合。本文使用的词语“可选地”表示“在一些实施例中提供且在其它实施例中没有提供”。应当理解,为了清楚起见而在单独实施例的上下文中描述的本发明的某些特征还可以通过组合提供在单个实施例中。相反地,为了清楚起见而在单个实施例的上下文中描述的本发明的各种特征也可以单独地或通过任何合适的组合或作为本发明的任何其它描述的实施例提供。
技术特征:
1.一种连续数据保护(continuous data protection,cdp)单元(100,502),用于从主分离器(110,520)接收以输入变更集的形式发送到主存储(522)的输入数据的副本,所述cdp单元(100,502)包括cdp数据移动器(102,506)和cdp存储单元(104,508),所述cdp数据移动器(102,506)用于接收输入变更集,并将基于一个或多个变更集的恢复数据写入cdp存储单元(104,508)和用于保存恢复数据的副本的恢复单元(108,504)。2.根据权利要求1所述的cdp单元(100,502),其特征在于,所述cdp数据移动器(102,506)用于将所述输入变更集作为恢复数据转发到所述恢复单元(108,504)。3.根据权利要求1所述的cdp单元(100,502),其特征在于,所述cdp数据移动器(102,506)用于通过合并来自两个或更多的cdp变更集的数据来创建所述恢复数据。4.根据权利要求1所述的cdp单元(100,502),其特征在于,还包括用于临时存储所述输入变更集的cdp日志单元(106,510),所述cdp数据移动器(102,506)用于将所述输入数据集转发到所述cdp日志单元(106,510),所述cdp数据移动器(102,506)还用于从cdp日志单元(106,510)读取一个或多个输入变更集,其中,恢复数据是基于一个或多个cdp变更集的数据。5.根据上述权利要求中任一项所述的cdp单元(100,502),其特征在于,所述cdp单元(100,502)包括所述cdp存储单元(104,508)的一个或多个cdp快照(524),每个cdp快照是所述cdp存储单元(104,508)在特定时间点的副本,所述cdp数据移动器(102,506)用于根据来自所述一个或多个cdp快照(524)中的至少一个的数据创建恢复数据。6.一种用于数据保护的恢复单元(108,504),其特征在于,所述恢复单元(108,504)包括恢复单元日志(202,512),用于从cdp单元(100,502)中的cdp数据移动器(102,506)接收恢复数据,恢复单元数据移动器(204,514)用于从恢复单元日志(202,512)接收恢复数据,以及用于保存恢复数据的副本的恢复单元存储(206,516)。7.根据权利要求6所述的恢复单元(108,504),其特征在于,所述恢复单元(108,504)还包括一个或多个恢复单元快照单元(526),用于保存所述恢复单元存储(206,516)的瞬时快照。8.一种数据保护组件(300,500),其特征在于,包括根据权利要求1至5中任一项所述的cdp单元(100,502)和根据权利要求6至7中任一项所述的恢复单元(108,504),所述cdp数据移动器(102,506)用于将所述恢复数据转发到所述恢复单元数据移动器(204,514)。9.一种数据保护方法(400),涉及包括cdp数据移动器(102,506)和cdp存储单元(104,508)的cdp单元(100,502),所述方法(400)包括以下步骤:-以一个或多个输入变更集的形式从主分离器(110,520)接收输入数据到cdp数据移动器(102,506);-将基于输入变更集的恢复数据从cdp数据移动器(102,506)转发到cdp存储单元(104,508)和用于保存恢复数据的副本的恢复单元(108,504)。10.根据权利要求9所述的方法(400),其特征在于,包括在cdp数据移动器(102,506)中合并来自两个或更多的输入变更集的数据以创建恢复数据的步骤。11.根据权利要求9或10所述的方法(400),其特征在于,所述cdp单元(100,502)还包括cdp日志单元(106,510),所述方法(400)还包括以下步骤:-将来自cdp数据移动器(102,506)的输入变更集写入cdp日志单元(106,510),
‑
由cdp数据移动器(102,506)从cdp日志单元(106,510)读取一个或多个输入变更集,-根据从cdp日志单元(106,510)读取的一个或多个输入变更集,在cdp数据移动器(102,506)中创建恢复数据。12.根据权利要求9或10所述的方法(400),其特征在于,所述cdp单元(100,502)还包括所述cdp存储单元(104,508)的一个或多个快照,每个cdp快照是所述cdp存储单元(104,508)在特定时间点的副本,所述方法(400)还包括由cdp数据移动器(102,506)读取所述快照中的至少一个,并根据来自所述至少一个快照的数据创建恢复数据,例如通过确定在不同时间点拍摄的两个快照之间的差异,或计算到达恢复单元(108,504)的恢复单元快照单元(526)的最后副本与所述cdp快照(524)之间的差异。13.根据权利要求1至5中任一项所述的用于控制cdp存储单元(104,508)的计算机程序产品,其特征在于,所述计算机程序产品包括计算机可读代码装置,当在控制单元(112)中执行时,所述计算机可读代码装置将使得控制单元(112)控制cdp存储单元(104,508)来执行根据权利要求9至12中任一项所述的方法(400)。14.根据权利要求8所述的用于控制数据保护组件(300,500)的计算机程序产品,其特征在于,所述计算机程序产品包括计算机可读代码装置,当在控制单元(112)中执行时,所述计算机可读代码装置将使得控制单元(112)控制cdp存储单元(104,508)来执行根据权利要求9至12中任一项所述的方法(400)。15.一种用于cdp存储单元(104,508)的控制单元(112),包括保存根据权利要求13或14所述的计算机程序产品的程序存储器(114)。
技术总结
提供了一种连续数据保护(continuous data protection,CDP)单元,用于从主分离器接收以输入变更集的形式发送到主存储的输入数据的副本。所述CDP单元包括CDP数据移动器和CDP存储单元。所述CDP数据移动器用于接收输入变更集,并将基于一个或多个变更集的恢复数据写入所述CDP存储单元和用于保存恢复数据的副本的恢复单元。通过在所述CDP单元和所述恢复单元中实现可变恢复点目标(recovery point objective,RPO),可以实现改进的数据备份和检索。所述CDP单元可以通过不同的方式将数据发送到所述恢复单元,以实现所述恢复单元的RPO的优化。此外,执行写入合并能够显著节省所述CDP单元的带宽。CDP单元的带宽。CDP单元的带宽。
技术研发人员:阿萨夫
受保护的技术使用者:华为技术有限公司
技术研发日:2020.12.23
技术公布日:2023/8/16
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:电池操作的手持式装置的制作方法 下一篇:挖掘机和用于控制挖掘机的方法和装置与流程
