System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于主机性能的集群内任务自动分布调整方法及系统技术方案_技高网

一种基于主机性能的集群内任务自动分布调整方法及系统技术方案

技术编号:41704110 阅读:17 留言:0更新日期:2024-06-19 12:36
本发明专利技术公开了一种基于主机性能的集群内任务自动分布调整方法及系统,方法包括:采集集群内的业务指标,并判断是否存在异常;在业务指标存在异常时,确定异常业务指标所在的资源信息;采集资源信息对应的资源指标,并判断是否存在异常;在资源指标存在异常时,根据异常业务指标和异常资源指标,加载任务调度信息,并结合预设的业务分布调整规则,生成任务调整策略;根据任务调整策略,进行任务资源分布调整,使得业务指标和资源指标恢复正常。通过本发明专利技术的技术方案,能够根据主机的实际资源使用情况来进行任务的自动分布调整,可快速解决集群内某台主机性能下降影响整个集群业务的问题,减少了运维成本。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于主机性能的集群内任务自动分布调整方法以及一种基于主机性能的集群内任务自动分布调整系统。


技术介绍

1、目前大部分系统均基于集群部署,一个集群存在多台机器,每台机器的允许启动的进程数、进程个数均在zookeeper中通过控制树配置,还可以通过框架代码去实现根据进程总数、主机总数去计算每台机器上允许启动的最大进程数等,任务数上可以做到负载均衡,充分利用主机资源。

2、但是,现有技术仅从任务数上做到均衡分配,不能根据主机资源实际情况去分配任务,一旦某台主机性能下降,会影响整个集群的业务,且需要人工干预解决问题。

3、举例说明如下:

4、如一个集群存在1-6台主机,其中1-4台部署在离线业务,5-6号部署在线业务,在线计费进程均衡部署在这6台主机上。但1-2可能因为主机硬件或是网络问题,性能下降,端口堵塞,导致整个集群的在线率下降,需要人工将1-2号主机上端口堵塞的进程停掉,在3-6号机器上拉起,方可解决问题,其中包含的工作有:

5、1.判断在线计费流程中哪个程序的端口堵塞;

6、2.更改zookeeper配置,不允许1-2号上该进程自动拉起;

7、3.将1-2号主机上该进程停掉;

8、4.在3-6号选择主机拉齐进程。


技术实现思路

1、针对上述问题,本专利技术提供了一种基于主机性能的集群内任务自动分布调整方法及系统,通过监测业务指标和资源指标的异常情况,在异常发生时根据主机的实际资源使用情况来进行任务的自动分布调整,能够根据资源均衡使用集群内的主机,可快速解决集群内某台主机性能下降影响整个集群业务的问题,减少运维成本。

2、为实现上述目的,本专利技术提供了一种基于主机性能的集群内任务自动分布调整方法,包括:

3、采集集群内的业务指标,并判断是否存在异常;

4、在所述业务指标存在异常时,确定异常业务指标所在的资源信息;

5、采集所述资源信息对应的资源指标,并判断是否存在异常;

6、在所述资源指标存在异常时,根据所述异常业务指标和异常资源指标,加载任务调度信息,并结合预设的业务分布调整规则,生成任务调整策略;

7、根据所述任务调整策略,进行任务资源分布调整,使得所述业务指标和所述资源指标恢复正常。

8、在上述技术方案中,优选地,基于主机性能的集群内任务自动分布调整方法还包括:

9、将所述任务调整策略发送至预设的运维人员;

10、根据所述运维人员回复的预设指令,执行所述任务资源分布调整操作。

11、在上述技术方案中,优选地,基于主机性能的集群内任务自动分布调整方法还包括:

12、若所述资源指标无异常时,向运维人员发送业务指标异常而资源指标无异常的告警信息。

13、在上述技术方案中,优选地,基于主机性能的集群内任务自动分布调整方法还包括:

14、任务资源分布调整后,对所述异常业务指标和所述异常资源指标进行稽核,并将稽核结果发送至运维人员。

15、在上述技术方案中,优选地,所述任务调整策略通过告警系统向运维人员发送短信进行通知;

16、所述资源指标无异常时,通过所述告警系统向运维人员发送所述告警信息;

17、所述稽核结果通过所述告警系统向运维人员发送短信进行通知。

18、本专利技术还提出一种基于主机性能的集群内任务自动分布调整系统,应用如上述技术方案中任一项公开的基于主机性能的集群内任务自动分布调整方法,包括:

19、业务指标采集模块,用于采集集群内的业务指标,并判断是否存在异常;

20、资源信息确定模块,用于在所述业务指标存在异常时,确定异常业务指标所在的资源信息;

21、资源指标采集模块,用于采集所述资源信息对应的资源指标,并判断是否存在异常;

22、任务策略调整模块,用于在所述资源指标存在异常时,根据所述异常业务指标和异常资源指标,加载任务调度信息,并结合预设的业务分布调整规则,生成任务调整策略;

23、任务资源调整模块,用于根据所述任务调整策略,进行任务资源分布调整,使得所述业务指标和所述资源指标恢复正常。

24、在上述技术方案中,优选地,基于主机性能的集群内任务自动分布调整系统还包括任务策略审核模块,具体用于:

25、将所述任务调整策略发送至预设的运维人员;

26、根据所述运维人员回复的预设指令,执行所述任务资源分布调整操作。

27、在上述技术方案中,优选地,基于主机性能的集群内任务自动分布调整系统还包括业务异常告警模块,用于在所述资源指标无异常时,向运维人员发送业务指标异常而资源指标无异常的告警信息。

28、在上述技术方案中,优选地,基于主机性能的集群内任务自动分布调整系统还包括异常指标稽核模块,用于在任务资源分布调整后,对所述异常业务指标和所述异常资源指标进行稽核,并将稽核结果发送至运维人员。

29、在上述技术方案中,优选地,基于主机性能的集群内任务自动分布调整系统还包括告警系统通知模块,具体用于:

30、将所述任务调整策略通过告警系统向运维人员发送短信进行通知;

31、在所述资源指标无异常时,通过所述告警系统向运维人员发送所述告警信息;

32、将所述稽核结果通过所述告警系统向运维人员发送短信进行通知。

33、与现有技术相比,本专利技术的有益效果为:通过监测业务指标和资源指标的异常情况,在异常发生时根据主机的实际资源使用情况来进行任务的自动分布调整,能够根据资源均衡使用集群内的主机,可快速解决集群内某台主机性能下降影响整个集群业务的问题,减少运维成本。

本文档来自技高网...

【技术保护点】

1.一种基于主机性能的集群内任务自动分布调整方法,其特征在于,包括:

2.根据权利要求1所述的基于主机性能的集群内任务自动分布调整方法,其特征在于,还包括:

3.根据权利要求2所述的基于主机性能的集群内任务自动分布调整方法,其特征在于,还包括:

4.根据权利要求3所述的基于主机性能的集群内任务自动分布调整方法,其特征在于,还包括:

5.根据权利要求4所述的基于主机性能的集群内任务自动分布调整方法,其特征在于,所述任务调整策略通过告警系统向运维人员发送短信进行通知;

6.一种基于主机性能的集群内任务自动分布调整系统,其特征在于,应用如权利要求1至5中任一项所述的基于主机性能的集群内任务自动分布调整方法,包括:

7.根据权利要求6所述的基于主机性能的集群内任务自动分布调整系统,其特征在于,还包括任务策略审核模块,具体用于:

8.根据权利要求7所述的基于主机性能的集群内任务自动分布调整系统,其特征在于,还包括业务异常告警模块,用于在所述资源指标无异常时,向运维人员发送业务指标异常而资源指标无异常的告警信息。

9.根据权利要求8所述的基于主机性能的集群内任务自动分布调整系统,其特征在于,还包括异常指标稽核模块,用于在任务资源分布调整后,对所述异常业务指标和所述异常资源指标进行稽核,并将稽核结果发送至运维人员。

10.根据权利要求9所述的基于主机性能的集群内任务自动分布调整系统,其特征在于,还包括告警系统通知模块,具体用于:

...

【技术特征摘要】

1.一种基于主机性能的集群内任务自动分布调整方法,其特征在于,包括:

2.根据权利要求1所述的基于主机性能的集群内任务自动分布调整方法,其特征在于,还包括:

3.根据权利要求2所述的基于主机性能的集群内任务自动分布调整方法,其特征在于,还包括:

4.根据权利要求3所述的基于主机性能的集群内任务自动分布调整方法,其特征在于,还包括:

5.根据权利要求4所述的基于主机性能的集群内任务自动分布调整方法,其特征在于,所述任务调整策略通过告警系统向运维人员发送短信进行通知;

6.一种基于主机性能的集群内任务自动分布调整系统,其特征在于,应用如权利要求1至5中任一项所述的基于主机性能的集群内任务自动分布调整方法,包括...

【专利技术属性】
技术研发人员:吴清萍
申请(专利权)人:北京思特奇信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1