模型训练方法、类型预测方法、装置和计算设备制造方法及图纸

技术编号:28422693 阅读:25 留言:0更新日期:2021-05-11 18:30
本说明书实施例公开了一种模型训练方法、类型预测方法、装置和计算设备。所述类型预测方法包括:获取业务对象在历史时段内的多个指标数据;将指标数据输入至基于决策树的集成学习分类模型,获得业务对象在未来时段的类型。本说明书实施例的模型训练方法、类型预测方法、装置和计算设备,可以提高预测结果的准确性。

【技术实现步骤摘要】
模型训练方法、类型预测方法、装置和计算设备
本说明书实施例涉及计算机
,特别涉及一种模型训练方法、类型预测方法、装置和计算设备。
技术介绍
随着科技的发展,人工智能技术的应用为人们的日常生活带来了各种便利。在一些场景下,需要对业务对象的类型进行预测。例如,需要对股票是否为新进重仓股进行预测。在相关技术中,可以选择逻辑回归模型对业务对象的类型进行预测。但是,逻辑回归模型比较简单,在处理大量特征时,容易欠拟合,造成预测结果的不准确。
技术实现思路
本说明书实施例提供一种模型训练方法、类型预测方法、装置和计算设备,以提高预测结果的准确性。本说明书实施例的技术方案如下。本说明书实施例的第一方面,提供了一种模型训练方法,包括:获取业务对象的多个指标数据和标签,所述标签用于表示业务对象的类型;从多个指标数据中筛选出目标指标数据;根据目标指标数据和标签,对基于决策树的集成学习分类模型进行训练。本说明书实施例的第二方面,提供了一种类型预测方法,包括:获取业务对象在历史时段内的多个指标数据;将指标数据输入至基于决策树的集成学习分类模型,获得业务对象在未来时段的类型。本说明书实施例的第三方面,提供了一种模型训练装置,包括:获取单元,用于获取业务对象的多个指标数据和标签,所述标签用于表示业务对象的类型;筛选单元,用于从多个指标数据中筛选出目标指标数据;训练单元,用于根据目标指标数据和标签,对基于决策树的集成学习分类模型进行训练。本说明书实施例的第四方面,提供了一种类型预测装置,包括:获取单元,用于获取业务对象在历史时段内的多个指标数据;输入单元,用于将指标数据输入至基于决策树的集成学习分类模型,获得业务对象在未来时段的类型。本说明书实施例的第五方面,提供了一种计算设备,包括:至少一个处理器;存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如第一方面或者第二方面所述方法的指令。本说明书实施例提供的技术方案,可以利用业务对象的指标数据和标签,对基于决策树的集成学习分类模型进行训练。另外,还可以利用基于决策树的集成学习分类模型对业务对象的类型进行预测,从而提高了预测结果的准确性。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本说明书实施例中模型训练方法的流程示意图;图2为本说明书实施例中模型训练过程的示意图;图3为本说明书实施例中类型预测方法的流程示意图;图4为本说明书实施例中模型训练装置的结构示意图;图5为本说明书实施例中类型预测装置的结构示意图;图6为本说明书实施例中计算设备的结构示意图。具体实施方式下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。考虑到基于决策树的集成学习分类模型的准确性较高、效率较高、可解释性较强,本说明书实施例利用基于决策树的集成学习分类模型对业务对象的类型进行预测。请参阅图1。本说明书实施例提供一种模型训练方法。所述模型训练方法可以应用于服务器。所述服务器可以为一个服务器、包括多个服务器的服务器集群、或者部署在云端的服务器。所述模型训练方法可以用于训练基于决策树的集成学习分类模型。所述基于决策树的集成学习分类模型可以为一种基于决策树实现的集成学习模型。所述基于决策树的集成学习分类模型可以为XGBoost模型。当然,所述基于决策树的集成学习分类模型还可以为其它的模型,例如GBDT(GradientBoostingDecisionTree,梯度提升决策树)。所述模型训练方法可以包括以下步骤。步骤S11:获取业务对象的多个指标数据和标签,所述标签用于表示业务对象的类型。在一些实施例中,所述指标数据可以包括业务对象的行情指标数据、以及业务对象所关联企业的财务指标数据。由于指标数据可以包括行情指标数据和财务指标数据,使得指标数据更加全面,从而可以提高训练效果。所述标签可以用于表示业务对象的类型。所述业务对象可以包括股票。所述标签可以用于表示股票是否为新进重仓股。所述重仓股可以为被机构大量持有的股票。具体地,例如,基金重仓股可以为被基金公司持有并占据流通市值20%以上的股票。所述新进重仓股可以为上一季度不是重仓股,本季度成为重仓股的股票。所述指标数据可以包括股票的行情指标数据、以及股票所关联企业的财务指标数据。其中,所述行情指标数据能够反映股票的估值、股价、成交量等等。所述财务指标数据能够从盈利能力、营运能力、现金流量等等方面反映公司的经营情况。例如,某一业务对象的多个指标数据可以如下表1所示。表1当然,在实际中所述业务对象还可以为期货或者债券等其它的金融对象。在一些实施例中,所述服务器可以采集一个或多个业务对象的指标数据和标签。在实际中,针对每个业务对象,所述服务器可以采集获得该业务对象的多个指标数据、以及与所述多个指标数据相对应的标签。例如,所述服务器可以从互联网上采集业务对象的多个指标数据、以及与所述多个指标数据相对应的标签。具体地,例如,所述服务器可以从互联网上采集2016年~2020年期间上市公司每季度的财务指标数据、上市公司所发行股票每季度的行情指标数据、以及上市公司所发行股票在每季度的标签。步骤S13:从多个指标数据中筛选出目标指标数据。在一些实施例中,为了提高基于决策树的集成学习分类模型的训练效果,所述服务器可以对所述多个指标数据进行筛选,获得多个目标指标数据。所述服务器可以对指标数据之间的相关性进行分析,实现从多个指标数据中筛选出目标指标数据。具体地,所述服务器可以确定所述多个指标数据两两之间的相关系数;可以从所述多个指标数据中筛选出多个目标指标数据,使得所述多个目标指标数据两两之间的相关系数满足第一条件。其中,指标数据之间的相关系数可以用于表示指标数据之间的相关性。相关系数越大,表示指标数据之间越相关;相关系数越小,表示指标数据之间越不相关。在实际中,指标数据两两之间的相关系数可以为经验值。或者,指标数据两两之间的相关系数还可以通过计算的方式获得。例如,所述服务器还可以计算指标数据两两之间的一致性系数(coefficientofconcordance),作为指标数据两两之间的相关系数。所述第一条件可以包括:相关系数小于或等于第一阈值。这样可以使得筛选本文档来自技高网...

【技术保护点】
1.一种模型训练方法,包括:/n获取业务对象的多个指标数据和标签,所述标签用于表示业务对象的类型;/n从多个指标数据中筛选出目标指标数据;/n根据目标指标数据和标签,对基于决策树的集成学习分类模型进行训练。/n

【技术特征摘要】
1.一种模型训练方法,包括:
获取业务对象的多个指标数据和标签,所述标签用于表示业务对象的类型;
从多个指标数据中筛选出目标指标数据;
根据目标指标数据和标签,对基于决策树的集成学习分类模型进行训练。


2.如权利要求1所述的方法,所述指标数据包括业务对象的行情指标数据、以及业务对象所关联企业的财务指标数据;所述业务对象包括股票;
所述基于决策树的集成学习分类模型包括XGBoost模型。


3.如权利要求1所述的方法,所述从多个指标数据中筛选出目标指标数据,包括:
确定所述多个指标数据两两之间的相关系数;从所述多个指标数据中筛选出多个目标指标数据,所述多个目标指标数据两两之间的相关系数满足第一条件。


4.如权利要求1所述的方法,所述从多个指标数据中筛选出目标指标数据,包括:
确定指标数据与标签之间的相关系数;
从所述多个指标数据中筛选出相关系数满足第二条件的指标数据作为目标指标数据。


5.一种类型预测方法,包括:
获取业务对象在历史时段内的多个指标数据;
将指标数据输入至基于决策树的集成学习分类模型,获得业务对象在未来时段的类型。

【专利技术属性】
技术研发人员:周茜浦婧蕾王毅
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1