本发明专利技术公开了一种业务系统运维方法和装置,方法包括:获取目标业务系统的运维样本集,所述运维样本集中的运维样本基于所述目标业务系统的运行数据生成;基于预设机器学习算法,从所述运维样本集中筛选出运维样本子集,所述运维样本子集中的运维样本对运维所述目标业务系统的贡献度满足第一预设条件;基于所述运维样本子集中的运维样本,进行机器学习训练,得到系统运维模型,以供运维所述目标业务系统。由此可见,本发明专利技术通过根据运维样本对运维目标业务系统的贡献度从运维样本集中筛选出运维样本子集,并基于所述运维样本子集中的运维样本进行机器学习训练,来得到系统运维模型,以供运维目标业务系统,能够更加可靠地进行业务系统运维。
【技术实现步骤摘要】
业务系统运维方法和装置
本专利技术涉及终端领域,尤其涉及一种业务系统运维方法和装置。
技术介绍
业务系统运维旨在实现资源的合理配置和确保业务系统的安全可靠运行。目前的业务系统运维方案,通过运维人员人工进行业务系统的故障预测、故障定位、故障检测与分析,以及故障处理等运维工作,然而由于经验水平和工作时间等的限制,运维人员可能不能及时预测业务系统的故障,进而降低了业务系统运维的可靠性。因此,亟需一种更可靠的业务系统运维方法。
技术实现思路
本专利技术实施例提供一种业务系统运维方法,以解决业务系统运维可靠性低的问题。为了解决上述技术问题,本专利技术是这样实现的:第一方面,提供了一种业务系统运维方法,该方法包括:获取目标业务系统的运维样本集,所述运维样本集中的运维样本基于所述目标业务系统的运行数据生成;基于预设机器学习算法,从所述运维样本集中筛选出运维样本子集,所述运维样本子集中的运维样本对运维所述目标业务系统的贡献度满足第一预设条件;基于所述运维样本子集中的运维样本,进行机器学习训练,得到系统运维模型,以供运维所述目标业务系统。第二方面,提供了一种业务系统运维装置,该装置包括:获取模块,用于获取目标业务系统的运维样本集,所述运维样本集中的运维样本基于所述目标业务系统的运行数据生成;样本筛选模块,用于基于预设机器学习算法,从所述运维样本集中筛选出运维样本子集,所述运维样本子集中的运维样本对运维所述目标业务系统的贡献度满足第一预设条件;训练模块,用于基于所述运维样本子集中的运维样本,进行机器学习训练,得到系统运维模型,以供运维所述目标业务系统。第三方面,提供了一种终端设备,所述终端设备包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的方法的步骤。第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。在本专利技术实施例中,通过根据运维样本对运维目标业务系统的贡献度从运维样本集中筛选出运维样本子集,并基于所述运维样本子集中的运维样本进行机器学习训练,来得到系统运维模型,以供运维目标业务系统,能够更加可靠地进行业务系统运维。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术的一个实施例提供的一种业务系统运维方法的流程示意图;图2是本专利技术的一个实施例提供的一种运维样本筛选、运行指标处理和运行指标筛除的示意图;图3是本专利技术的一个实施例提供的一种系统运维模型训练的示意图;图4是本专利技术的一个实施例提供的一种业务系统运维装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1是本专利技术的一个实施例提供的一种业务系统运维方法的流程示意图,参见图1,该方法具体可以包括如下步骤:步骤102:获取目标业务系统的运维样本集,所述运维样本集中的运维样本基于所述目标业务系统的运行数据生成。其中,所述运维样本包括:运行指标集和故障标注信息,所述故障标注信息用于描述所述运维样本对应的故障信息。其中,业务系统可以是一个企业把自己的产品推向市场并取得最大化收益的一个企业分系统,业务系统可以包括操作系统、应用程序和所请求的业务;运行数据可以是业务系统运行时的相关数据;运行指标集中可以包括多个运行指标,不同运维样本的运行指标集中的运行指标的类型和数量相同,运行指标基于运行数据生成,运行指标可以包括应用监控指标、业务监控指标和系统监控指标等,其中,应用监控指标可以用来反映业务系统的应用程序的资源使用情况,可以包括应用程序的可用性、异常、吞吐量、响应时间、队列深度等,业务监控指标可以用来反映业务系统的业务请求和响应情况,可以包括业务的日志明细、请求笔数和响应笔数等,系统监控指标可以用来反映业务系统的操作系统的资源使用情况,可以包括:CPU(CentralProcessingUnit,中央处理器)负载、内存负载、磁盘负载和进程数等;故障标注信息可以是业务系统运行过程中出现故障时,运维人员所标注的故障的类型和引起故障的原因等,例如可以是CPU负载过高导致宕机、请求笔数过多造成数据不准确或丢失等。基于此,不仅可以获取到运维样本的运行指标集,还可以获取到运维样本的故障标注信息,使得获取到的运维样本包含的内容更加丰富和全面。步骤104:基于预设机器学习算法,从所述运维样本集中筛选出运维样本子集,所述运维样本子集中的运维样本对运维所述目标业务系统的贡献度满足第一预设条件。其中,预设机器学习算法可以是聚类检测算法和异常点检测算法中的至少一种;聚类检测算法包括K均值聚类(KMeans)算法、多阶段聚类(CHAMELEON)算法和基于密度的噪声应用空间聚类(DBSCAN,Density-BasedSpatialClusteringofApplicationswithNoise)算法等;异常点检测算法包括孤立森林(iForest,IsolationForest)算法和OneClassSVM算法等。参见图2,以KMeans算法为例,步骤104具体可以示例为:首先从N个运维样本组成的运维样本集(第一运维样本X1=【第一运行指标集(x11,x12,x13,x14,...x1M),第一故障标注信息】,第二运维样本X2=【第二运行指标集(x21,x22,x23,x24,...x2M),第二故障标注信息】,第三运维样本X3=【第三运行指标集(x31,x32,x33,x34,...x3M),第三故障标注信息】,第四运维样本X4=【第四运行指标集(x41,x42,x43,x44,...x4M),第四故障标注信息】,……,第N运维样本XN=【第N运行指标集(xN1,xN2,xN3,xN4,...xNM),第N故障标注信息】)中随机选取K个运维样本作为K个簇的K个初始聚类中心,其次基于每个运维样本的运行指标集中的运行指标,计算每个运维样本与每个初始聚类中心的距离,并把运维样本分配给最近的初始聚类中心(即最近的簇),每分配一个运维样本,要重新计算该运维样本所属簇的聚类中心,最后将不满足第一预设条件的运维样本(即运维样本数少于预设样本数阈值,并且聚类中心与其他簇的聚类中心的距离大于预设距离阈值的簇中的所有运维样本)从运维样本集中过滤掉(此簇中的所有运维样本有很大概率是异常运维样本),将满足第一预设条件的第一运维样本X1=【第一运行指标集(x11,x12,x13,x14,...x1M本文档来自技高网...
【技术保护点】
1.一种业务系统运维方法,其特征在于,包括:/n获取目标业务系统的运维样本集,所述运维样本集中的运维样本基于所述目标业务系统的运行数据生成;/n基于预设机器学习算法,从所述运维样本集中筛选出运维样本子集,所述运维样本子集中的运维样本对运维所述目标业务系统的贡献度满足第一预设条件;/n基于所述运维样本子集中的运维样本,进行机器学习训练,得到系统运维模型,以供运维所述目标业务系统。/n
【技术特征摘要】
1.一种业务系统运维方法,其特征在于,包括:
获取目标业务系统的运维样本集,所述运维样本集中的运维样本基于所述目标业务系统的运行数据生成;
基于预设机器学习算法,从所述运维样本集中筛选出运维样本子集,所述运维样本子集中的运维样本对运维所述目标业务系统的贡献度满足第一预设条件;
基于所述运维样本子集中的运维样本,进行机器学习训练,得到系统运维模型,以供运维所述目标业务系统。
2.根据权利要求1所述的方法,其特征在于,所述运维样本包括:运行指标集和故障标注信息,所述故障标注信息用于描述所述运维样本对应的故障信息。
3.根据权利要求2所述的方法,其特征在于,还包括:
对所述运维样本子集中的运维样本的运行指标集中的运行指标进行无量纲化处理和缺失值处理,所述无量纲化处理包括归一化处理、标准化处理和正则化处理中的至少一种。
4.根据权利要求3所述的方法,其特征在于,还包括:
确定所述运维样本子集中的每个运维样本对应的运行指标集;
对所述运维样本对应的运行指标集中的运行指标进行筛除处理,得到所述运维样本对应的运行指标子集;
其中,所述运行指标子集中的运行指标与所述运维样本对应的故障信息的相关性满足第二预设条件。
5.根据权利要求2所述的方法,其特征在于,基于所述运维样本子集中的运维样本,进行机器学习训练,得到系统运维模型,包括:
从所述运维样本子集中随机选取出目标运维样本子集,所述目标运维样本子集至少包括第一目标运维样本和第二目标运维样本;
从所述第一目标运维样本对应的运行指标子集中随机选取第一目标运行指标子集,并基于所述第一目标运行指标子集和所述第一目标运维样本对应的故障标注信息,进行第一机器学习训练,得到第一机器学习训练结果;
从所...
【专利技术属性】
技术研发人员:黄启雄,王攀,林晓群,林玉广,牛允诺,
申请(专利权)人:中国移动通信集团福建有限公司,中国移动通信集团有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。