一种虚拟机容错系统、方法及装置制造方法及图纸

技术编号:34291234 阅读:8 留言:0更新日期:2022-07-27 09:31
本申请属于通信技术领域,公开了一种虚拟机容错系统、方法及装置,该方法包括,通过主终端设备将主虚拟机当前的虚拟机数据写入至分布式存储系统;通过从终端设备基于分布式存储系统中的虚拟机数据确定主虚拟机状态异常时,基于分布式存储系统中的虚拟机数据,对从虚拟机进行文件系统级重放,以及控制更新后的从虚拟机从静默状态切换为运行状态;这样,通过分布式存储系统实现主虚拟机和从虚拟机之间的数据同步,并通过分布式存储系统中的同步数据,对从虚拟机进行文件系统级重放,以解决虚拟机容错时从虚拟机容易崩溃的问题。拟机容错时从虚拟机容易崩溃的问题。拟机容错时从虚拟机容易崩溃的问题。

【技术实现步骤摘要】
一种虚拟机容错系统、方法及装置


[0001]本申请涉及通信
,具体而言,涉及一种虚拟机容错系统、方法及装置。

技术介绍

[0002]随着虚拟化技术运用于服务器中,越来越多的企业选择在虚拟化服务器上运行关键业务,以提高关键业务运行效率。人们在广泛使用虚拟机的同时,开始对虚拟机提出更高的要求,高可靠性正是其中一个重要要求,虚拟机容错技术目前得到了广泛的应用。
[0003]现有技术下,将两台虚拟机形成主从关系(即主备关系),控制主虚拟机处于运行状态,从虚拟机处于静默状态,并将主虚拟机和从虚拟机进行数据同步,以及当主虚拟机出现故障时,暂停主虚拟机,并将从虚拟机从静默状态切换至运行状态。
[0004]但是,现有技术下为避免数据拷贝,主虚拟机和从虚拟机通常共用同一虚拟磁盘。由于主虚拟机向虚拟磁盘写入数据时,从虚拟机的文件系统是无法感知到的,因此,这通常会导致从虚拟机崩溃。

技术实现思路

[0005]本申请实施例的目的在于提供一种虚拟机容错系统、方法及装置,用以解决虚拟机容错时从虚拟机容易崩溃的问题。
[0006]一方面,提供一种虚拟机容错方法,包括主终端设备和从终端设备,主终端设备和从终端设备均与同一分布式存储系统连接,分布式存储系统为分布式的多个存储设备的集群,用于为主终端设备和从终端设备提供存储空间;主终端设备设置有主虚拟机,从终端设备设置有从虚拟机,主虚拟机当前处于运行状态;
[0007]主终端设备,用于将主虚拟机当前的虚拟机数据写入至分布式存储系统,虚拟机数据为主虚拟机运行相关的数据;
[0008]从终端设备,用于基于分布式存储系统中的虚拟机数据确定主虚拟机状态异常时,基于分布式存储系统中的虚拟机数据,对从虚拟机进行文件系统级重放,以及控制更新后的从虚拟机从静默状态切换为运行状态。
[0009]一种实施方式中,虚拟机数据中至少包括输入输出操作日志,分布式存储系统包括主虚拟机的主系统盘、从虚拟机的从系统盘以及主状态同步空间,主状态同步空间的存储空间是由分布式存储系统在从终端设备内的存储设备提供的;
[0010]主终端设备用于:基于对主系统盘的修改操作,生成输入输出操作日志,以及将输入输出操作日志写入主状态同步空间;
[0011]从终端设备用于:读取主状态同步空间中的输入输出操作日志,并基于输入输出操作日志,对从虚拟机的从系统盘进行文件系统级重放。
[0012]一种实施方式中,分布式存储系统还包括数据盘;
[0013]主终端设备用于:在加载数据盘后,基于接收的数据修改指令,针对数据盘执行修改操作;
[0014]从终端设备用于:在加载数据盘后,确定主虚拟机状态异常时,卸载数据盘和文件系统,并重新加载数据盘和文件系统。
[0015]一种实施方式中,主虚拟机的虚拟机数据还包括设备运行数据和虚拟机状态;
[0016]主终端设备还用于:将主虚拟机的设备运行数据和主虚拟机的虚拟机状态写入主状态同步空间;
[0017]从终端设备还用于:确定达到虚拟机更新条件时,基于主状态同步空间中的设备运行数据,更新从虚拟机的设备运行数据。
[0018]一种实施方式中,设备运行数据包括以下参数中的至少一种:中央处理器信息、输入输出设备信息以及内存数据;
[0019]分布式存储系统中的各存储设备之间通过存储网络进行数据传输,分布式存储系统中的至少一个存储设备为持久化内存设备。
[0020]一方面,提供一种虚拟机容错方法,包括:
[0021]通过主终端设备,将主虚拟机当前的虚拟机数据写入至分布式存储系统,主虚拟机当前处于运行状态,虚拟机数据为主虚拟机运行相关的数据;
[0022]通过从终端设备,基于分布式存储系统中的虚拟机数据确定主虚拟机状态异常时,基于分布式存储系统中的虚拟机数据,对从虚拟机进行文件系统级重放,以及控制更新后的从虚拟机从静默状态切换为运行状态;
[0023]其中,分布式存储系统为分布式的多个存储设备的集群,用于为主终端设备和从终端设备提供存储空间;主终端设备设置有主虚拟机,从终端设备设置有从虚拟机。
[0024]在上述实现过程中,通过分布式存储系统实现主虚拟机和从虚拟机之间的数据同步,并通过分布式存储系统中的同步数据,对从虚拟机进行文件系统级重放,以解决虚拟机容错时从虚拟机容易崩溃的问题。
[0025]一种实施方式中,主虚拟机的虚拟机数据包括输入输出操作日志,分布式存储系统包括主虚拟机的主系统盘、从虚拟机的从系统盘以及主状态同步空间,主状态同步空间的存储空间是由分布式存储系统在从终端设备内的存储设备提供的;将主虚拟机当前的虚拟机数据写入至分布式存储系统包括:
[0026]基于对主系统盘的修改操作,生成输入输出操作日志,以及将输入输出操作日志写入主状态同步空间;
[0027]基于分布式存储系统中的虚拟机数据,对从虚拟机进行文件系统级重放,包括:
[0028]读取主状态同步空间中的输入输出操作日志,并基于输入输出操作日志,对从虚拟机的从系统盘进行文件系统级重放。
[0029]在上述实现过程中,主终端设备可以将数据直接写入从终端设备内的主状态同步空间,提高了数据同步效率,以及通过主状态同步空间中的同步数据,对从虚拟机的从系统盘进行文件系统级重放,解决了虚拟机容错时从虚拟机容易崩溃的问题。
[0030]一种实施方式中,分布式存储系统还包括数据盘,方法还包括:
[0031]通过主终端设备,在加载数据盘后,基于接收的数据修改指令,针对数据盘执行修改操作;
[0032]通过从终端设备,在加载数据盘后,确定主虚拟机状态异常时,卸载数据盘和文件系统,并重新加载数据盘和文件系统。
[0033]在上述实现过程中,在主从虚拟机切换时,将数据盘重新加载,解决了虚拟机容错时从虚拟机容易崩溃的问题。
[0034]一种实施方式中,主虚拟机的虚拟机数据还包括设备运行数据和虚拟机状态,方法还包括:
[0035]通过主终端设备,将主虚拟机的设备运行数据和主虚拟机的虚拟机状态写入主状态同步空间;
[0036]通过从终端设备,确定达到虚拟机更新条件时,基于主状态同步空间中的设备运行数据,更新从虚拟机的设备运行数据。
[0037]在上述实现过程中,通过主状态同步空间同步设备运行数据和虚拟机状态,提高了数据同步效率,实现了主虚拟机和从虚拟机之间的运行参数同步。
[0038]一种实施方式中,设备运行数据包括以下参数中的至少一种:中央处理器信息、输入输出设备信息以及内存数据;分布式存储系统中的各存储设备之间通过存储网络进行数据传输,分布式存储系统中的至少一个存储设备为持久化内存设备。
[0039]在上述实现过程中,采用持久化内存设备组成分布式存储系统,提高了数据读写效率。
[0040]一方面,提供一种虚拟机容错装置,包括:
[0041]写入单元,用于通过主终端设备,将主虚拟机当前的虚拟机数据写入至分布本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚拟机容错系统,其特征在于,包括主终端设备和从终端设备,所述主终端设备和所述从终端设备均与同一分布式存储系统连接,所述分布式存储系统为分布式的多个存储设备的集群,用于为所述主终端设备和所述从终端设备提供存储空间;所述主终端设备设置有主虚拟机,所述从终端设备设置有从虚拟机,所述主虚拟机当前处于运行状态;所述主终端设备,用于将所述主虚拟机当前的虚拟机数据写入至所述分布式存储系统,所述虚拟机数据为所述主虚拟机运行相关的数据;所述从终端设备,用于基于所述分布式存储系统中的虚拟机数据确定所述主虚拟机状态异常时,基于所述分布式存储系统中的虚拟机数据,对所述从虚拟机进行文件系统级重放,以及控制更新后的从虚拟机从静默状态切换为运行状态。2.如权利要求1所述的系统,其特征在于,所述虚拟机数据中至少包括输入输出操作日志,所述分布式存储系统包括所述主虚拟机的主系统盘、所述从虚拟机的从系统盘以及主状态同步空间,所述主状态同步空间的存储空间是由所述分布式存储系统在所述从终端设备内的存储设备提供的;所述主终端设备用于:基于对所述主系统盘的修改操作,生成输入输出操作日志,以及将所述输入输出操作日志写入所述主状态同步空间;所述从终端设备用于:读取所述主状态同步空间中的所述输入输出操作日志,并基于所述输入输出操作日志,对所述从虚拟机的从系统盘进行文件系统级重放。3.如权利要求2所述的系统,其特征在于,所述分布式存储系统还包括数据盘;所述主终端设备用于:在加载所述数据盘后,基于接收的数据修改指令,针对所述数据盘执行修改操作;所述从终端设备用于:在加载所述数据盘后,确定所述主虚拟机状态异常时,卸载所述数据盘和文件系统,并重新加载所述数据盘和所述文件系统。4.如权利要求2或3所述的系统,其特征在于,所述主虚拟机的虚拟机数据还包括设备运行数据和虚拟机状态;所述主终端设备还用于:将所述主虚拟机的设备运行数据和所述主虚拟机的虚拟机状态写入所述主状态同步空间;所述从终端设备还用于:确定达到虚拟机更新条件时,基于所述主状态同步空间中的设备运行数据,更新所述从虚拟机的设备运行数据。5.如权利要求4所述的系统,其特征在于,所述设备运行数据包括以下参数中的至少一种:中央处理器信息、输入输出设备信息以及内存数据;所述分布式存储系统中的各存储设备之间通过存储网络进行数据传输,所述分布式存储系统中的至少一个存储设备为持久化内存设备。6.一种虚拟机容错方法,其特征在于,包括:通过主终端设备,将主虚拟机当前的虚拟机数据写入至分布式存储系统,所述主虚拟机当前处于运行状态,所述虚拟机数据为所述主虚拟机运行相关的数据;通过从终端设备,基于所述分布式存储系统中的虚拟机数据确定所述主虚拟机状态异常时,基于所述分布式存储系统中的虚拟机数据,对从虚拟机进行文件系统级重放,以及控制更新后的从虚拟机从静默状态切换为运行状态;其中,所述分布式存储系统为分布式的多个存储设备的集群,用于为所述主终端设备
和所述从终端设备提供存储空间;所述主终端设备设置有所述主虚拟机,所述从终端设备设置有所述从虚拟机。7.如权利要求6所述的方法,其特征在于,所述主虚拟机的虚拟机数据包括输入输出操作日志,所述分布式存储系统包括所述主虚拟机的主系统盘、所述从虚拟机的从系统盘以及主状态同步空间,所述主状态同步空间的存储空间是由所述分布式存储系统在所述从终端设备内的存储设备提供的;所述将主虚拟机当前的虚拟机数据写入至所述分布式存储系统包括:基于对所述主系统盘的修改操作,生成输入输出操作日志,以及将所述输入输出操作日志写入所述主状态同步空间;所述基于所述分布式存储系统中的虚拟机数据,对所述从虚拟机进行文件系统级重放,包括:读取所述主状态同...

【专利技术属性】
技术研发人员:张朝潞
申请(专利权)人:北京天融信科技有限公司北京天融信软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1