检测数据副本之间的一致性的方法和装置制造方法及图纸

技术编号:14853115 阅读:105 留言:0更新日期:2017-03-18 20:12
本发明专利技术涉及检测数据副本之间的一致性的方法和装置,其中该方法包括:分别获取第一数据副本和第二数据副本的特征信息,所述特征信息与相应的数据副本的键相关联,并用于表征相应的数据副本;基于判断次数的预定阈值,判断第一数据副本的特征信息与第二数据副本的特征信息是否相同,响应于在判断次数未超过所述预定阈值的情况下出现特征信息相同的判断结果,确定检测到第一数据副本和第二数据副本一致。

【技术实现步骤摘要】

本专利技术涉及数据存储领域,更具体地,涉及一种检测基于键-值存储的数据副本之间的一致性的方法和装置。
技术介绍
基于键-值(Key-Value)的数据存储机制被广泛应用于数据存储领域。在这种存储机制中,数据以键值对(key-valuepairs)方式存储。键值对可认为是一种映射,即键(key)是与每条数据唯一对应的唯一关键字,值(value)是该数据实际存储的内容。基于Key-Value的数据存储机制典型采用散列函数(HASH函数,也称为哈希函数)来实现“键”到“值”的映射。查询时,基于“键”经散列函数变换后得到的散列值来定位数据,以实现快速查询。通常,每个要存储的数据块包含多个键值对。此外,为了通过数据冗余来提高数据可靠性,同一数据块又可被复制为多个副本(replica)来进行存储。在这种情况下,保证同一数据块的副本之间的一致性十分重要,而高效准确地检测副本之间是否一致通常是保证一致性的基础。检测副本之间是否一致的过程的速度、准确性、是否需要锁定或中断系统操作等会显著影响整个存储系统的性能。在现有技术中,提出了通过对各数据副本中的数据进行逐一比对,来检测数据副本之间的一致性,这种方法具有较高的准确性,但由于其需要从硬盘中读取数据并对数据进行逐一比对,因此检测速度较慢,导致在比对过程中可能需要锁定或中断系统操作。在现有技术中,还提出了通过比较数据副本的版本信息等取代数据的逐一比对,来判断数据副本之间的一致性,即如果数据副本的版本信息一致,则认为数据副本一致。然而版本信息一致但数据副本的内容不一致的可能性仍然较大,因此这种方法的准确性相对较低。
技术实现思路
本公开要解决的问题之一是如何在不影响存储系统正常操作的情况下,高效、准确地在线检测副本之间的一致性。根据本专利技术的一方面,提出了一种检测基于键-值存储的数据副本之间的一致性的方法,该方法包括:分别获取第一数据副本和第二数据副本的特征信息,所述特征信息与相应的数据副本的键相关联,并用于表征相应的数据副本;基于判断次数的预定阈值,判断第一数据副本的特征信息与第二数据副本的特征信息是否相同,响应于在判断次数未超过所述预定阈值的情况下出现特征信息相同的判断结果,确定检测到第一数据副本和第二数据副本一致。根据本专利技术的另一方面,提出了一种检测基于键-值存储的数据副本之间的一致性的装置,该装置包括:第一部件,被配置为分别获取第一数据副本和第二数据副本的特征信息,所述特征信息与相应的数据副本的键相关联,并用于表征相应的数据副本;第二部件,被配置为基于判断次数的预定阈值,判断第一数据副本的特征信息与第二数据副本的特征信息是否相同,响应于在判断次数未超过所述预定阈值的情况下出现特征信息相同的判断结果,确定检测到第一数据副本和第二数据副本一致。本专利技术的各方面能够在不影响存储系统正常操作的情况下,高效、准确地在线检测副本之间的一致性。附图说明通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。图2示出了根据本专利技术的第一实施例的检测基于键-值存储的数据副本之间的一致性的方法的流程图。图3示出了根据本专利技术的第一实施例的检测基于键-值存储的数据副本之间的一致性的装置的框图。图4示出了根据本专利技术的第一实施例的一个示例的检测基于键-值存储的数据副本之间的一致性的方法的流程图。图5示出了根据本专利技术的第二实施例的检测基于键-值存储的数据副本之间的一致性的方法的流程图。图6示出了根据本专利技术的第二实施例的检测基于键-值存储的数据副本之间的一致性的装置的框图。具体实施方式下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本专利技术各实施例的功能。具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本专利技术所描述的实<本文档来自技高网
...

【技术保护点】
一种检测基于键‑值存储的数据副本之间的一致性的方法,该方法包括:分别获取第一数据副本和第二数据副本的特征信息,所述特征信息与相应的数据副本的键相关联,并用于表征相应的数据副本;基于判断次数的预定阈值,判断第一数据副本的特征信息与第二数据副本的特征信息是否相同,响应于在判断次数未超过所述预定阈值的情况下出现特征信息相同的判断结果,确定检测到第一数据副本和第二数据副本一致。

【技术特征摘要】
1.一种检测基于键-值存储的数据副本之间的一致性的方法,该方法包
括:
分别获取第一数据副本和第二数据副本的特征信息,所述特征信息与相
应的数据副本的键相关联,并用于表征相应的数据副本;
基于判断次数的预定阈值,判断第一数据副本的特征信息与第二数据副
本的特征信息是否相同,响应于在判断次数未超过所述预定阈值的情况下出
现特征信息相同的判断结果,确定检测到第一数据副本和第二数据副本一致。
2.根据权利要求1所述的方法,其中基于判断次数的预定阈值,判断第
一数据副本的特征信息与第二数据副本的特征信息是否相同还包括:
响应于在判断次数已达到所述预定阈值的情况下未出现特征信息相同的
判断结果,确定检测到第一数据副本和第二数据副本不一致。
3.根据权利要求1所述的方法,其中,基于判断次数的预定阈值,判断
第一数据副本的特征信息与第二数据副本的特征信息是否相同还包括:
响应于在判断次数未达到所述预定阈值的情况下出现特征信息不相同的
判断结果,重新执行分别获取第一数据副本和第二数据副本的特征信息的步
骤以及基于判断次数的预定阈值,判断第一数据副本的特征信息与第二数据
副本的特征信息是否相同的步骤。
4.根据权利要求1所述的方法,其中,所述特征信息是相应的数据副本
的各键经散列函数运算后得到的散列值之和。
5.根据权利要求3所述的方法,其中,重新执行分别获取第一数据副本
和第二数据副本的特征信息的步骤以及基于判断次数的预定阈值,判断第一
数据副本的特征信息与第二数据副本的特征信息是否相同的步骤包括:
在等待预定时间后,重新执行分别获取第一数据副本和第二数据副本的
特征信息的步骤以及基于判断次数的预定阈值,判断第一数据副本的特征信
息与第二数据副本的特征信息是否相同的步骤。
6.根据权利要求1所述的方法,还包括:
按照预定周期,对第一数据副...

【专利技术属性】
技术研发人员:曾春光李媛媛纪海杨晓阳
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1