集群预测模型训练方法和集群预测方法技术

技术编号:36424759 阅读:14 留言:0更新日期:2023-01-20 22:34
本申请涉及大数据处理技术领域,本申请涉及一种集群预测模型训练方法、集群预测方法、装置、计算机设备、存储介质和计算机程序产品。集群预测模型训练方法包括:获取多组参考数据;根据集群标签,对多组参考数据进行编码,得到多个参考变量;建立参考变量与所有集群标签的相关性系数;根据相关性系数,筛选出符合预设条件的参考数据,作为集群预测模型的训练样本;根据训练样本,训练集群预测模型,得到训练完成的集群预测模型。采用本方法能够将参考数据参数化,并根据相关性系数进行数据筛选,使得最终训练完成的集群预测模型的集群预测分类结果能够更准确,鲁棒性更强。鲁棒性更强。鲁棒性更强。

【技术实现步骤摘要】
集群预测模型训练方法和集群预测方法


[0001]本申请涉及大数据处理
,特别是涉及一种集群预测模型训练方法、集群预测方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]划分集群即信息标签化,将具有相同属性的参考数据划分为一个群体,并进行后续分析。集群划分的原理是根据历史数据将不同的参考数据进行划分,将具有一定规律特性的参考数据进行归类,进而再次观察该集群的具体特征,参考数据分群后能够使不同集群间的数据特征差异明显、同一群组内参考数据的数据特征相似。
[0003]通常,对大量参考数据进行分类大多是业务人员根据经验进行划分的,这融入了很多主观判断的元素,使得最后获取到的分类结果偏差较大;若使用传统的RFM等模型对参考数据进行简单的划分,也会出现对参考数据评估条件少、结果准确性不高的情况,现有技术中的参考数据分类方法无法挖掘出数据内部更深层次的信息,因而现有技术中的集群划分准确度也较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高集群划分准确度的集群预测模型训练方法、集群预测方法、装置、计算机设备、存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种集群预测模型训练方法,包括:
[0006]获取多组参考数据;其中,每组参考数据上携带有唯一的集群标签,所有参考数据上携带有至少一种集群标签,所述集群标签用以标识集群类型;
[0007]根据所述集群标签,对所述多组参考数据进行编码,得到多个参考变量;
[0008]建立所述参考变量与所有集群标签的相关性系数;
[0009]根据所述相关性系数,筛选出符合预设条件的参考数据,作为集群预测模型的训练样本;
[0010]根据所述训练样本,训练所述集群预测模型,得到训练完成的集群预测模型。
[0011]在其中一个实施例中,所述根据所述集群标签,对所述多组参考数据进行编码,得到多个参考变量,包括:
[0012]根据所述集群标签的种类,确定参数位数,所述参数位数和所述种类的数量相匹配;
[0013]针对每组参考数据,根据预设的集群标签编码规则,将所述参考数据携带的集群标签对应的编码位置编码为第一预设值,得到所述参考数据对应的参考变量,其中,所述集群标签编码规则包括集群标签与编码位置的关联关系。
[0014]在其中一个实施例中,所述建立所述参考变量与所有集群标签的相关性系数,包括:
[0015]按照预设的划分规则,将所有所述参考变量划分为多个集合;
[0016]计算每个所述集合中的参考变量与预设的多个设定值的关系值,作为当前集合中的参考变量与所有集群标签的相关性系数。
[0017]在其中一个实施例中,所述根据所述相关性系数,筛选出符合预设条件的参考数据,作为集群预测模型的训练样本,包括:
[0018]根据所述相关性系数确定相关性系数阈值;
[0019]将对应的相关性系数达到所述相关性系数阈值的参考数据作为所述训练样本。
[0020]在其中一个实施例中,所述根据所述训练样本,训练所述集群预测模型,得到训练完成的故障诊断模型,包括:
[0021]将所述训练样本输入所述集群预测模型,得到预测集群分类结果;
[0022]根据所述预测集群分类结果,确定所述集群预测模型的模型损失;
[0023]基于所述模型损失调整所述集群预测模型的模型参数,继续训练,直到所述集群预测模型收敛,得到训练完成的集群预测模型。
[0024]在其中一个实施例中,所述基于所述模型损失调整所述集群预测模型的模型参数,继续训练,直到所述集群预测模型收敛,得到训练完成的集群预测模型,包括:
[0025]根据所述预测集群分类结果与对应的训练样本携带的集群标签的偏差,调整所述集群预测模型的模型参数,直到训练完成得到训练好的集群预测模型。
[0026]第二方面,本申请还提供了一种集群预测方法,包括:
[0027]采集参考数据,并将所述参考数据输入采用上述任一实施例中所述的集群预测模型训练方法训练得到的集群预测模型,得到所述参考数据对应的集群类型。
[0028]第三方面,本申请还提供了一种集群预测模型训练装置,包括:
[0029]获取模块,用于获取多组参考数据;其中,每组参考数据上携带有唯一的集群标签,所有参考数据上携带有至少一种集群标签,所述集群标签用以标识集群类型;
[0030]第一处理模块,用于根据所述集群标签,对所述多组参考数据进行编码,得到多个参考变量;
[0031]第二处理模块,用于建立所述参考变量与所有集群标签的相关性系数;
[0032]筛选模块,用于根据所述相关性系数,筛选出符合预设条件的参考数据,作为集群预测模型的训练样本;
[0033]模型生成模块,用于根据所述训练样本,训练所述集群预测模型,得到训练完成的集群预测模型。
[0034]在其中一个实施例中,所述第一处理模块还被配置为:
[0035]根据所述集群标签的种类,确定参数位数,所述参数位数和所述种类的数量相匹配;
[0036]针对每组参考数据,根据预设的集群标签编码规则,将所述参考数据携带的集群标签对应的编码位置编码为第一预设值,得到所述参考数据对应的参考变量,其中,所述集群标签编码规则包括集群标签与编码位置的关联关系。
[0037]在其中一个实施例中,所述第二处理模块还被配置为:
[0038]按照预设的划分规则,将所有所述参考变量划分为多个集合;
[0039]计算每个所述集合中的参考变量与预设的多个设定值的关系值,作为当前集合中的参考变量与所有集群标签的相关性系数。
[0040]在其中一个实施例中,所述筛选模块还被配置为:
[0041]根据所述相关性系数确定相关性系数阈值;
[0042]将对应的相关性系数达到所述相关性系数阈值的参考数据作为所述训练样本。
[0043]在其中一个实施例中,所述模型生成模块还被配置为:
[0044]将所述训练样本输入所述集群预测模型,得到预测集群分类结果;
[0045]根据所述预测集群分类结果,确定所述集群预测模型的模型损失;
[0046]基于所述模型损失调整所述集群预测模型的模型参数,继续训练,直到所述集群预测模型收敛,得到训练完成的集群预测模型。
[0047]在其中一个实施例中,所述模型生成模块还被配置为:
[0048]根据所述预测集群分类结果与对应的训练样本携带的集群标签的偏差,调整所述集群预测模型的模型参数,直到训练完成得到训练好的集群预测模型。
[0049]第四方面,本申请还提供了一种集群预测装置,包括:
[0050]采集模块,用于采集参考数据;
[0051]预测模块,用于将所述参考数据输入采用上述任一实施例中所述的集群预测模型训练方法训练得到的集群预测模型,得到所述参考数据对应的集群类型。
...

【技术保护点】

【技术特征摘要】
1.一种集群预测模型训练方法,其特征在于,包括:获取多组参考数据;其中,每组参考数据上携带有唯一的集群标签,所有参考数据上携带有至少一种集群标签,所述集群标签用以标识集群类型;根据所述集群标签,对所述多组参考数据进行编码,得到多个参考变量;建立所述参考变量与所有集群标签的相关性系数;根据所述相关性系数,筛选出符合预设条件的参考数据,作为集群预测模型的训练样本;根据所述训练样本,训练所述集群预测模型,得到训练完成的集群预测模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述集群标签,对所述多组参考数据进行编码,得到多个参考变量,包括:根据所述集群标签的种类,确定参数位数,所述参数位数和所述种类的数量相匹配;针对每组参考数据,根据预设的集群标签编码规则,将所述参考数据携带的集群标签对应的编码位置编码为第一预设值,得到所述参考数据对应的参考变量,其中,所述集群标签编码规则包括集群标签与编码位置的关联关系。3.根据权利要求1所述的方法,其特征在于,所述建立所述参考变量与所有集群标签的相关性系数,包括:按照预设的划分规则,将所有所述参考变量划分为多个集合;计算每个所述集合中的参考变量与预设的多个设定值的关系值,作为当前集合中的参考变量与所有集群标签的相关性系数。4.根据权利要求1所述的方法,其特征在于,所述根据所述相关性系数,筛选出符合预设条件的参考数据,作为集群预测模型的训练样本,包括:根据所述相关性系数确定相关性系数阈值;将对应的相关性系数达到所述相关性系数阈值的参考数据作为所述训练样本。5.根据权利要求1所述的方法,其特征在于,所述根据所述训练样本,训练所述集群预测模型,得到训练完成的故障诊断模型,包括:将所述训练样本输入所述集群预测模型,得到预测集群分类结果;根据所述预测集群分类结果,确定所述集群预测模型的模型损失;基于所述模型损失调整所述集群预测模型的模型参数,继续训练,直到所述集群预测模型收敛,得到训练完成的集群预测模型。6.根据权利要求5所述的方法,其特征在于,所述基于所述模型损失调整所述集群预测模型的模型参数,继续训练,直到所述集群预测模型收敛,得到训练完成的集群预测模型,包括:根据所述预测集群分类结果与对应的训练样本携带的集群标签的偏差,调整所述集群预测模型的模型参数,直到训练完成得到训练好的集群预测模型。7.一种集群预测方法,其特征在于,包括:采集参考数据,并将所述参考数据输入采用如权利要求1至6中任一项所述的方法训练得到的集群预测模型,得到所述参考数据对应的集群类型。8.一种集群预测模型训练装置,其特征在于,包括:获取模块,用于获取多组参考数据;其中,每组参考数据上携带有唯一的集群标签,所
有参考数据上携带有至少一种集群标签,...

【专利技术属性】
技术研发人员:李佐群刘倬铭魏海洲
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1