数据节点存活的检测方法及装置制造方法及图纸

技术编号:14964663 阅读:69 留言:0更新日期:2017-04-02 19:10
本发明专利技术公开了一种数据节点存活的检测方法及装置,所述方法包括:对于每个数据节点:判断与待检测数据节点之间当前的网络连接是否成功;若网络连接失败,从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息;若未收到待检测数据节点返回的数据节点处于存活状态的消息,间隔第二预设时间向待检测数据节点发送数据节点存活检测消息;重复执行此步骤n次,若在第一预设时间与n个第二预设时间之和的时间段内,未收到待检测数据节点返回的数据节点处于存活状态的消息,将待检测数据节点确定为未处于存活状态。上述方案可以精确地检测出数据节点是否处于存活状态。

【技术实现步骤摘要】

本专利技术涉及计算机
,具体涉及一种数据节点存活的检测方法及装置
技术介绍
随着计算技术的发展,分布式数据存储系统已经成为了一种重要的现代计算架构。分布式数据存储系统就是将数据分散存储在多台独立的设备上。分布式数据存储系统为具有很多数据节点的集群系统,每个数据节点可以理解为一个数据存储服务器。在做数据存储时,将若干条数据存储到对应的数据节点中,这是分布式系统核心的概念。为了保证分布式数据存储系统的高可用性,需要对系统中的所有数据节点进行存活监控,现有技术方案中,主要是通过检测数据节点间的网络连接情况来确定数据节点的存活情况,例如当检测到网络连接处于断开时,则认定为数据节点未处于存活状态,然而这种检测方法的准确率太低,有可能是由于网络抖动而造成网络连接暂时性断开,而数据节点却处于存活状态。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的数据节点存活的检测方法和相应的数据节点存活的检测装置。根据本专利技术的一个方面,提供了一种数据节点存活的检测方法,应用于包括通过网络连接的多个数据节点的数据存储系统,方法包括:对于每个数据节点:判断与待检测数据节点之间当前的网络连接是否成功;若网络连接失败,则从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息;若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔第二预设时间向待检测数据节点发送数据节点存活检测消息;重复执行此步骤n次,若在第一预设时间与n个第二预设时间之和的时间段内,未收到待检测数据节点返回的数据节点处于存活状态的消息,则将该待检测数据节点确定为未处于存活状态。根据本专利技术的另一方面,提供了一种数据节点存活的检测装置,应用于包括通过网络连接的多个数据节点的数据存储系统,装置包括:判断模块、发送模块和确定模块;其中,对于每个数据节点:判断模块,适于判断与待检测数据节点之间当前的网络连接是否成功;发送模块,适于在判断模块判断出网络连接失败的情况下,从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息;若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔第二预设时间向待检测数据节点发送数据节点存活检测消息;发送模块重复运行n次;确定模块,适于在第一预设时间与n个第二预设时间之和的时间段内,未收到待检测数据节点返回的数据节点处于存活状态的消息的情况下,将该待检测数据节点确定为未处于存活状态。根据本专利技术提供的方案,为了能够及时地检测出待检测数据节点的存活情况,需要判断与待检测数据节点之间当前的网络连接是否成功,若网络连接失败,则从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息,若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔第二预设时间向待检测数据节点发送数据节点存活检测消息;重复执行此步骤n次,若在第一预设时间与n个第二预设时间之和的时间段内,未收到待检测数据节点返回的数据节点处于存活状态的消息,则将该待检测数据节点确定为未处于存活状态,从而更为精确地检测出数据节点是否处于存活状态,克服因网络问题而错误地将数据节点认定为未处于存活状态的缺陷,提高了检测的准确率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的数据节点存活的检测方法的流程示意图;图2示出了根据本专利技术另一个实施例的数据节点存活的检测方法的流程示意图;图3示出了根据本专利技术一个实施例的数据节点存活的检测装置的功能框图;图4示出了根据本专利技术另一个实施例的数据节点存活的检测装置的功能框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了根据本专利技术一个实施例的数据节点存活的检测方法的流程示意图。该方法应用于包括通过网络连接的多个数据节点的数据存储系统,如图1所示,对于每个数据节点,该方法包括以下步骤:步骤S100,判断与待检测数据节点之间当前的网络连接是否成功。数据存储系统中的各数据节点之间通过网络连接,并通过网络进行通信,例如可以发送数据节点存活检测消息、数据节点处于存活状态的消息等。当某一数据节点未处于存活状态时,其与其他数据节点之间的网络连接处于断开状态,也就无法有效通信。为了能够及时地检测出待检测数据节点的存活情况,在本专利技术实施例中,首先判断与待检测数据节点之间当前的网络连接是否成功,若当前的网络连接成功,说明数据节点间能够正常通信,待检测数据节点处于存活状态;若当前的网络连接失败,则需要检测待检测数据节点是否处于存活状态,以排除由于网络抖动而导致网络连接失败而非待检测数据节点未处于存活状态造成的网络连接失败的问题,或者由于待检测数据节点侧的请求过多而导致阻塞,造成数据节点间通信中断的问题。步骤S101,若网络连接失败,则从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息。具体地,数据节点存活指该数据节点目前处于可操作状态或有效工作状态。第一预设时间指从上一次成功的网络连接结束时间开始,到向待检测数据节点发送数据节点存活检测消息所经过的时间,举例说明,若从上一次成功的网络连接结束时间为1秒,第一预设时间为5秒,则在第6秒时向待检测数据节点发送数据节点存活检测消息,本领域技术人员可以根据实际需要设置第一预设时间。为了克服由于网络抖动而导致数据节点存活检测消息或数据节点处于存活状态的消息未能被及时地接收,或者由于待检测数据节点侧的请求过多而导致阻塞,进而错误地将待检测数据节点认定为未本文档来自技高网...

【技术保护点】
一种数据节点存活的检测方法,应用于包括通过网络连接的多个数据节点的数据存储系统,对于每个数据节点,所述方法包括:判断与待检测数据节点之间当前的网络连接是否成功;若网络连接失败,则从上一次成功的网络连接结束后,间隔第一预设时间向所述待检测数据节点发送数据节点存活检测消息;若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔第二预设时间向所述待检测数据节点发送数据节点存活检测消息;重复执行此步骤n次,若在第一预设时间与n个第二预设时间之和的时间段内,未收到待检测数据节点返回的数据节点处于存活状态的消息,则将该待检测数据节点确定为未处于存活状态。

【技术特征摘要】
1.一种数据节点存活的检测方法,应用于包括通过网络连接的多个数据
节点的数据存储系统,对于每个数据节点,所述方法包括:
判断与待检测数据节点之间当前的网络连接是否成功;
若网络连接失败,则从上一次成功的网络连接结束后,间隔第一预设时
间向所述待检测数据节点发送数据节点存活检测消息;
若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔
第二预设时间向所述待检测数据节点发送数据节点存活检测消息;重复执行
此步骤n次,若在第一预设时间与n个第二预设时间之和的时间段内,未收
到待检测数据节点返回的数据节点处于存活状态的消息,则将该待检测数据
节点确定为未处于存活状态。
2.根据权利要求1所述的方法,所述待检测数据节点为多个;
在间隔第一预设时间向待检测数据节点发送数据节点存活检测消息之
前,所述方法还包括:
统计所述多个待检测数据节点的业务访问量,根据所述业务访问量设置
第一预设时间。
3.根据权利要求1或2所述的方法,在间隔第一预设时间向待检测数据
节点发送数据节点存活检测消息之前,所述方法还包括:
检测数据节点间的网络状况,根据检测结果设置第一预设时间。
4.根据权利要求3所述的方法,网络状况包括:网络正常和网络抖动。
5.根据权利要求1-4任一项所述的方法,n的取值是根据所述多个待检
测数据节点的业务访问量和/或数据节点的网络状况设置的。
6.一种数据...

【专利技术属性】
技术研发人员:陈宗志
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1