一种分布式锁故障隔离方法、装置、计算机存储器及设备制造方法及图纸

技术编号:19778166 阅读:31 留言:0更新日期:2018-12-15 11:15
本申请提供一种分布式锁故障隔离方法、装置、计算机存储器及设备,所述方法包括当sanlock的delta leases下发IO累计超时时间大于或等于预设的时间阈值时,检查存储池是否由于压力过大导致sanlock的delta leases无法下发IO;若存储池由于压力过大导致sanlock的delta leases无法下发IO,则杀死主机上IO压力最大的进程。在本申请实施例中,当存储池压力较大时候启用IO检查装置,通过检查存储池IO的性能,除去IO压力较大的进程,从而保证sanlock的delta leases能够正常的下发IO,减少sanlock因为存储池压力较大,误杀全部进程的问题。

【技术实现步骤摘要】
一种分布式锁故障隔离方法、装置、计算机存储器及设备
本申请涉及计算机
,特别涉及一种分布式锁故障隔离方法、装置、计算机存储器及设备。
技术介绍
随着计算机技术和网络技术的快速发展,大型集群在实际生产环境中使用,通过虚拟化,组成云计算,在虚拟化系统中,常常需要协调动作,不同系统或者是在同一个系统不同主机之间共享同一个或一组资源,往往需要互斥来防止彼此的干扰,保证一致性,因此需要分布式锁来保证上述情况。分布式锁实现方案大致分两种,一种是依赖于网络,通过网络通信来保证获取资源的一致性,但是对于网络的稳定性依赖,比如DLM(DistributedLockManager,一种分布式锁管理器);第二种实现方案是依赖共享存储,通过对共享存储的读写保证多方的协商,实现方案如sanlock(一种分布式锁软件)。sanlock的实现方案是依赖于diskpaxos算法。两种方案各有优劣,对于DLM来说,如果网络环境比较复杂时候或者网络环境不稳定时候容易造成dlm速度下降,严重影响dlm的速度,同时,如果节点比较多时候,dlm消息传递容易造成网络阻塞,一般来说dlm用于小型的集群中进行锁的管理;分布式本文档来自技高网...

【技术保护点】
1.一种分布式锁故障隔离方法,所述方法包括:当sanlock的delta leases下发IO累计超时时间大于或等于预设的时间阈值时,检查存储池是否由于压力过大导致sanlock的delta leases无法下发IO;若存储池由于压力过大导致sanlock的delta leases无法下发IO,则杀死主机上IO压力最大的进程。

【技术特征摘要】
1.一种分布式锁故障隔离方法,所述方法包括:当sanlock的deltaleases下发IO累计超时时间大于或等于预设的时间阈值时,检查存储池是否由于压力过大导致sanlock的deltaleases无法下发IO;若存储池由于压力过大导致sanlock的deltaleases无法下发IO,则杀死主机上IO压力最大的进程。2.根据权利要求1所述的方法,其特征在于,所述当sanlock的deltaleases下发IO累计超时时间大于或等于预设的时间阈值时,检查存储池是否由于压力过大导致sanlock的deltaleases无法下发IO,包括:sanlock在连接存储时制定IO超时时间,并在k倍IO超时时间下发一次IO;若第m次IO无法下发,则检查存储池是否由于压力过大导致sanlock的deltaleases无法下发IO。3.根据权利要求2所述的方法,其特征在于,所述若存储池由于压力过大导致sanlock的deltaleases无法下发IO,则杀死主机上IO压力最大的进程,包括:若存储池由于压力过大导致sanlock的deltaleases无法下发IO,且第n次IO无法下发,则杀死主机上IO压力最大的进程,其中,m≤n。4.根据权利要求3所述的方法,其特征在于,所述k=2,m=3,n=4。5.一种分布式锁故障隔...

【专利技术属性】
技术研发人员:马怀旭
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1