数据的预测方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:34165144 阅读:5 留言:0更新日期:2022-07-17 09:23
本公开涉及一种数据的预测方法、装置、电子设备及计算机可读介质,属于数据处理技术领域。该方法包括:获取预测对象的特征变量;将所述预测对象的特征变量输入预先训练的分类模型中,得到所述预测对象关于预设特殊事件的事件发生概率;将所述预测对象的特征变量输入预先训练的数据预测模型中,得到所述预测对象在发生所述预设特殊事件之后所产生的相关数据的预测值;根据所述事件发生概率和所述相关数据的预测值,得到所述预测对象关于所述预设特殊事件的相关保障数据的预测值。本公开通过二阶段模型进行相关数据的预测,可以提高数据预测的准确性。测的准确性。测的准确性。

【技术实现步骤摘要】
数据的预测方法、装置、电子设备及计算机可读介质


[0001]本公开涉及数据处理
,具体而言,涉及一种数据的预测方法、数据的预测装置、电子设备及计算机可读介质。

技术介绍

[0002]在医疗、保险等相关的领域中,经常需要根据一些已有的信息来对医疗数据或保险数据等进行预测。
[0003]而现有的方法中,一般都是以经验数据为基础进行预测,由于考虑的因素不够全面,预测的结果往往也不够准确。
[0004]鉴于此,本领域亟需一种能够提高预测准确度的数据的预测方法。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种数据的预测方法、数据的预测装置、电子设备及计算机可读介质,进而至少在一定程度上提高数据预测结果的准确度。
[0007]根据本公开的第一个方面,提供一种数据的预测方法,包括:
[0008]获取预测对象的特征变量;
[0009]将所述预测对象的特征变量输入预先训练的分类模型中,得到所述预测对象关于预设特殊事件的事件发生概率;
[0010]将所述预测对象的特征变量输入预先训练的数据预测模型中,得到所述预测对象在发生所述预设特殊事件之后所产生的相关数据的预测值;
[0011]根据所述事件发生概率和所述相关数据的预测值,得到所述预测对象关于所述预设特殊事件的相关保障数据的预测值。
[0012]在本公开的一种示例性实施例中,所述分类模型的训练方法包括:
[0013]从样本数据库中获取训练样本,并根据所述训练样本的样本事件类型,以及所述训练样本对应的特征变量,构建所述分类模型的训练样本集;
[0014]根据所述训练样本集中所述训练样本对应的特征变量得到自变量,将所述样本事件类型作为因变量,根据所述训练样本集训练所述分类模型。
[0015]在本公开的一种示例性实施例中,所述从样本数据库中获取训练样本,包括:
[0016]获取训练所述分类模型所需的所述特征变量的变量名称;
[0017]从所述样本数据库中获取样本对象,并根据所述变量名称获取所述样本对象的特征变量;
[0018]根据所述样本对象的各个特征变量对应的预设筛选条件,对所述样本对象进行过滤,得到训练样本。
[0019]在本公开的一种示例性实施例中,在对所述样本对象进行过滤之后,所述方法还
包括:
[0020]从所述变量名称中确定一抽样分类变量,并根据所述抽样分类变量对所述样本对象进行分类,得到多个样本对象集合;
[0021]分别对各个所述样本对象集合中的所述样本对象进行抽样,得到所述训练样本。
[0022]在本公开的一种示例性实施例中,所述样本数据库包括真实世界数据。
[0023]在本公开的一种示例性实施例中,所述分类模型包括梯度提升树模型,所述根据所述训练样本集训练所述分类模型,包括:
[0024]获取所述梯度提升树模型的损失函数,并根据所述损失函数和所述因变量初始化所述梯度提升树模型的学习器;
[0025]根据所述损失函数以及所述自变量和因变量,得到所述梯度提升树模型的负梯度;
[0026]根据所述自变量和所述负梯度拟合所述梯度提升树模型的分类回归树,并根据所述分类回归树得到最佳拟合值;
[0027]根据所述最佳拟合值更新所述学习器,得到所述梯度提升树模型的强学习器,并将所述强学习器作为所述梯度提升树模型的输出。
[0028]在本公开的一种示例性实施例中,在所述构建所述分类模型的训练样本集之后,所述方法还包括:
[0029]将所述训练样本集划分为预设数量的训练样本子集;
[0030]分别将每一所述训练样本子集作为模型测试集,得到预设数量的模型评估结果;
[0031]根据所述模型评估结果对所述分类模型中的模型参数进行调整。
[0032]在本公开的一种示例性实施例中,所述数据预测模型的训练方法包括:
[0033]从样本数据库中获取训练样本,并根据所述训练样本关于所述预设特殊事件的相关数据,以及所述训练样本对应的特征变量,构建所述数据预测模型的训练样本集;
[0034]对所述数据预测模型的训练样本集进行有放回的重采样,得到多个数据预测训练集,并通过多个所述数据预测训练集训练所述数据预测模型。
[0035]在本公开的一种示例性实施例中,所述根据所述事件发生概率和所述相关数据的预测值,得到所述预测对象关于所述预设特殊事件的相关保障数据的预测值,包括:
[0036]获取所述预测对象关于所述预设特殊事件的相关数据保障比例;
[0037]根据所述事件发生概率和所述相关数据的预测值,以及所述相关数据保障比例,得到所述预测对象关于所述预设特殊事件的相关保障数据的预测值。
[0038]根据本公开的第二方面,提供一种数据的预测装置,包括:
[0039]特征变量获取模块,用于获取预测对象的特征变量;
[0040]事件概率预测模块,用于将所述预测对象的特征变量输入预先训练的分类模型中,得到所述预测对象关于预设特殊事件的事件发生概率;
[0041]相关数据预测模块,用于将所述预测对象的特征变量输入预先训练的数据预测模型中,得到所述预测对象在发生所述预设特殊事件之后所产生的相关数据的预测值;
[0042]保障数据预测模块,用于根据所述事件发生概率和所述相关数据的预测值,得到所述预测对象关于所述预设特殊事件的相关保障数据的预测值。
[0043]根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储
所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的数据的预测方法。
[0044]根据本公开的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的数据的预测方法。
[0045]本公开示例性实施例可以具有以下有益效果:
[0046]本公开示例实施方式的数据的预测方法中,通过预先训练的分类模型和数据预测模型,分别得到预测对象关于预设特殊事件的事件发生概率,以及预测对象在发生预设特殊事件之后所产生的相关数据的预测值,进而得到预测对象关于预设特殊事件的相关保障数据的预测值。本公开示例实施方式中的数据的预测方法,首先通过分类模型预测事件发生的概率,然后通过数据预测模型预测事件发生时所产生的相关数据,可以在两个预测模型相结合的基础上,更加全面地考虑到影响事件发生概率和相关数据预测的诸多因素,使数据最终的预测更加准确。
[0047]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0048]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据的预测方法,其特征在于,包括:获取预测对象的特征变量;将所述预测对象的特征变量输入预先训练的分类模型中,得到所述预测对象关于预设特殊事件的事件发生概率;将所述预测对象的特征变量输入预先训练的数据预测模型中,得到所述预测对象在发生所述预设特殊事件之后所产生的相关数据的预测值;根据所述事件发生概率和所述相关数据的预测值,得到所述预测对象关于所述预设特殊事件的相关保障数据的预测值。2.根据权利要求1所述的数据的预测方法,其特征在于,所述分类模型的训练方法包括:从样本数据库中获取训练样本,并根据所述训练样本的样本事件类型,以及所述训练样本对应的特征变量,构建所述分类模型的训练样本集;根据所述训练样本集中所述训练样本对应的特征变量得到自变量,将所述样本事件类型作为因变量,根据所述训练样本集训练所述分类模型。3.根据权利要求2所述的数据的预测方法,其特征在于,所述从样本数据库中获取训练样本,包括:获取训练所述分类模型所需的所述特征变量的变量名称;从所述样本数据库中获取样本对象,并根据所述变量名称获取所述样本对象的特征变量;根据所述样本对象的各个特征变量对应的预设筛选条件,对所述样本对象进行过滤,得到训练样本。4.根据权利要求3所述的数据的预测方法,其特征在于,在对所述样本对象进行过滤之后,所述方法还包括:从所述变量名称中确定一抽样分类变量,并根据所述抽样分类变量对所述样本对象进行分类,得到多个样本对象集合;分别对各个所述样本对象集合中的所述样本对象进行抽样,得到所述训练样本。5.根据权利要求2所述的数据的预测方法,其特征在于,所述样本数据库包括真实世界数据。6.根据权利要求2所述的数据的预测方法,其特征在于,所述分类模型包括梯度提升树模型,所述根据所述训练样本集训练所述分类模型,包括:获取所述梯度提升树模型的损失函数,并根据所述损失函数和所述因变量初始化所述梯度提升树模型的学习器;根据所述损失函数以及所述自变量和因变量,得到所述梯度提升树模型的负梯度;根据所述自变量和所述负梯度拟合所述梯度提升树模型的分类回归树,并根据所述分类回归树得到最佳拟合值;根据所述最佳拟合值更新所述学习器,得到所述梯度提升树模型的强学习器,并将所述强学习...

【专利技术属性】
技术研发人员:亓玉雪郭潇宇
申请(专利权)人:天津幸福生命科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1