基于变量优化的对象甄选方法、装置、设备及介质制造方法及图纸

技术编号:33461245 阅读:14 留言:0更新日期:2022-05-19 00:42
本发明专利技术涉及人工智能领域,提供一种基于变量优化的对象甄选方法、装置、设备及介质,能够根据每个候选变量的变异系数及每个候选变量的信息价值均值,从候选变量中筛选出目标变量,实现对变量的二次筛选,使选择的变量与最终的训练目标间的关联性更强,进一步提升预测的准确度,根据每个目标变量的映射参数及每个目标变量的截距参数对目标变量进行合成,得到替换变量,由于替换变量用于训练与用于预测的时间间隔较短,提升了模型的稳定性,并且,变量的层层筛选,也进一步提升了模型的准确性,结合排序算法及对变量的优化,进一步提升了模型预测的准确率及稳定性。本发明专利技术还涉及区块链技术,所述预测模型可以存储于区块链节点上。所述预测模型可以存储于区块链节点上。所述预测模型可以存储于区块链节点上。

【技术实现步骤摘要】
基于变量优化的对象甄选方法、装置、设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于变量优化的对象甄选方法、装置、设备及介质。

技术介绍

[0002]在对象甄选场景(如选择绩优保险代理人的场景)中,模型的训练和预测通常存在较长时间间隔,因此出现数据偏移现象。此现象提升了模型预测的风险,降低了模型的泛化能力,不利于应用场景的推广应用。
[0003]针对此类问题,通常采用的解决方案是利用短期目标替代长期目标。例如:采用三转目标(即:入司三个月后转正)代替十三留目标(即:入司一年后留存),训练集和预测集时间间隔由13个月缩短至4个月。
[0004]但是,上述方法中的三转目标与十三留目标间仍然存在一定偏差,模型的精度还有待进一步提升。

技术实现思路

[0005]本专利技术实施例提供了一种基于变量优化的对象甄选方法、装置、设备及介质,旨在解决对象甄选场景下预测准确度不高的问题。
[0006]第一方面,本专利技术实施例提供了一种基于变量优化的对象甄选方法,其包括:
[0007]每隔预设时间间隔获取当前变量,及获取与所述当前变量对应的至少一个候选变量,其中,利用所述当前变量进行训练与进行预测的时间间隔大于利用所述至少一个候选变量进行训练与进行预测的时间间隔;
[0008]在预设时间范围内的每个周期中,计算所述至少一个候选变量中每个候选变量相对于所述当前变量的信息价值;
[0009]根据每个周期中每个候选变量相对于所述当前变量的信息价值,计算每个候选变量的变异系数;
[0010]计算每个周期中每个候选变量相对于所述当前变量的信息价值的平均值,得到每个候选变量的信息价值均值;
[0011]根据每个候选变量的变异系数及每个候选变量的信息价值均值,从所述至少一个候选变量中筛选出至少一个目标变量;
[0012]确定所述至少一个目标变量中每个目标变量的映射参数及每个目标变量的截距参数;
[0013]根据每个目标变量的映射参数及每个目标变量的截距参数对所述至少一个目标变量进行合成,得到替换变量;
[0014]获取排序模型,并利用所述替换变量训练所述排序模型,得到预测模型;
[0015]响应于对待预测对象的甄选指令,利用所述预测模型从所述待预测对象中选择目标对象。
[0016]根据本专利技术优选实施例,所述计算所述至少一个候选变量中每个候选变量相对于所述当前变量的信息价值包括:
[0017]获取每个候选变量中的正样本及负样本;
[0018]计算每个候选变量中的正样本相对于所述当前变量的信息价值;
[0019]计算每个候选变量中的负样本相对于所述当前变量的信息价值;
[0020]计算每个候选变量中的正样本相对于所述当前变量的信息价值与每个候选变量中的负样本相对于所述当前变量的信息价值的和,得到每个候选变量相对于所述当前变量的信息价值。
[0021]根据本专利技术优选实施例,所述根据每个周期中每个候选变量相对于所述当前变量的信息价值,计算每个候选变量的变异系数包括:
[0022]计算每个周期中每个候选变量相对于所述当前变量的信息价值的标准差,作为每个候选变量对应的第一数值;
[0023]计算每个周期中每个候选变量相对于所述当前变量的信息价值的平均值,作为每个候选变量对应的第二数值;
[0024]计算每个候选变量对应的第一数值与每个候选变量对应的第二数值的商,作为每个候选变量的变异系数。
[0025]根据本专利技术优选实施例,所述根据每个候选变量的变异系数及每个候选变量的信息价值均值,从所述至少一个候选变量中筛选出至少一个目标变量包括:
[0026]获取预先配置的第一阈值及第二阈值;
[0027]比较每个候选变量的信息价值均值与所述第一阈值;
[0028]比较每个候选变量相对于所述当前变量的信息价值与所述第二阈值;
[0029]当检测到在所述至少一个候选变量中,有候选变量的所述信息价值均值大于或者等于所述第一阈值,且所述信息价值大于或者等于所述第二阈值时,将检测到的候选变量确定为所述至少一个目标变量。
[0030]根据本专利技术优选实施例,所述确定所述至少一个目标变量中每个目标变量的映射参数及每个目标变量的截距参数包括:
[0031]获取样本集;
[0032]从所述样本集中获取每个目标变量的正样本的数量,作为每个目标变量对应的第一数量;
[0033]从每个目标变量的正样本中获取所述当前变量的正样本的数量,作为每个目标变量对应的第二数量;
[0034]计算每个目标变量对应的第二数量与每个目标变量对应的第一数量的商,得到每个目标变量的映射参数;
[0035]从所述样本集中获取每个目标变量的负样本的数量,作为每个目标变量对应的第三数量;
[0036]从每个目标变量的负样本中获取所述当前变量的正样本的数量,作为每个目标变量对应的第四数量;
[0037]计算每个目标变量对应的第四数量与每个目标变量对应的第三数量的商,得到每个目标变量的截距参数。
[0038]根据本专利技术优选实施例,所述根据每个目标变量的映射参数及每个目标变量的截距参数对所述至少一个目标变量进行合成,得到替换变量包括:
[0039]计算所述至少一个目标变量中每个目标变量与对应的映射参数的乘积,作为每个目标变量对应的第一乘积;
[0040]计算1与每个目标变量的差值,得到每个目标变量对应的第一差值;
[0041]计算每个目标变量对应的第一差值与对应的截距参数的乘积,作为每个目标变量对应的第二乘积;
[0042]计算每个目标变量对应的第一乘积与每个目标变量对应的第二乘积的和,得到每个目标变量对应的第三数值;
[0043]计算每个目标变量对应的第三数值的累加和,得到所述替换变量。
[0044]根据本专利技术优选实施例,所述利用所述预测模型从所述待预测对象中选择目标对象包括:
[0045]根据所述替换变量获取所述待预测对象对应的待处理数据;
[0046]将所述待处理数据输入至所述预测模型;
[0047]获取所述预测模型的预测概率;
[0048]根据所述预测概率对所述待预测对象进行排序,并获取排在预设位的待预测对象作为所述目标对象。
[0049]第二方面,本专利技术实施例提供了一种基于变量优化的对象甄选装置,其包括:
[0050]获取单元,用于每隔预设时间间隔获取当前变量,及获取与所述当前变量对应的至少一个候选变量,其中,利用所述当前变量进行训练与进行预测的时间间隔大于利用所述至少一个候选变量进行训练与进行预测的时间间隔;
[0051]计算单元,用于在预设时间范围内的每个周期中,计算所述至少一个候选变量中每个候选变量相对于所述当前变量的信息价值;
[0052]所述计算单元,还用于根据每个周期中每个候选变量相对于所述当前变量的信息价值,计算每个候选变量的变本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于变量优化的对象甄选方法,其特征在于,包括:每隔预设时间间隔获取当前变量,及获取与所述当前变量对应的至少一个候选变量,其中,利用所述当前变量进行训练与进行预测的时间间隔大于利用所述至少一个候选变量进行训练与进行预测的时间间隔;在预设时间范围内的每个周期中,计算所述至少一个候选变量中每个候选变量相对于所述当前变量的信息价值;根据每个周期中每个候选变量相对于所述当前变量的信息价值,计算每个候选变量的变异系数;计算每个周期中每个候选变量相对于所述当前变量的信息价值的平均值,得到每个候选变量的信息价值均值;根据每个候选变量的变异系数及每个候选变量的信息价值均值,从所述至少一个候选变量中筛选出至少一个目标变量;确定所述至少一个目标变量中每个目标变量的映射参数及每个目标变量的截距参数;根据每个目标变量的映射参数及每个目标变量的截距参数对所述至少一个目标变量进行合成,得到替换变量;获取排序模型,并利用所述替换变量训练所述排序模型,得到预测模型;响应于对待预测对象的甄选指令,利用所述预测模型从所述待预测对象中选择目标对象。2.根据权利要求1所述的基于变量优化的对象甄选方法,其特征在于,所述计算所述至少一个候选变量中每个候选变量相对于所述当前变量的信息价值包括:获取每个候选变量中的正样本及负样本;计算每个候选变量中的正样本相对于所述当前变量的信息价值;计算每个候选变量中的负样本相对于所述当前变量的信息价值;计算每个候选变量中的正样本相对于所述当前变量的信息价值与每个候选变量中的负样本相对于所述当前变量的信息价值的和,得到每个候选变量相对于所述当前变量的信息价值。3.根据权利要求1所述的基于变量优化的对象甄选方法,其特征在于,所述根据每个周期中每个候选变量相对于所述当前变量的信息价值,计算每个候选变量的变异系数包括:计算每个周期中每个候选变量相对于所述当前变量的信息价值的标准差,作为每个候选变量对应的第一数值;计算每个周期中每个候选变量相对于所述当前变量的信息价值的平均值,作为每个候选变量对应的第二数值;计算每个候选变量对应的第一数值与每个候选变量对应的第二数值的商,作为每个候选变量的变异系数。4.根据权利要求1所述的基于变量优化的对象甄选方法,其特征在于,所述根据每个候选变量的变异系数及每个候选变量的信息价值均值,从所述至少一个候选变量中筛选出至少一个目标变量包括:获取预先配置的第一阈值及第二阈值;比较每个候选变量的信息价值均值与所述第一阈值;
比较每个候选变量相对于所述当前变量的信息价值与所述第二阈值;当检测到在所述至少一个候选变量中,有候选变量的所述信息价值均值大于或者等于所述第一阈值,且所述信息价值大于或者等于所述第二阈值时,将检测到的候选变量确定为所述至少一个目标变量。5.根据权利要求1所述的基于变量优化的对象甄选方法,其特征在于,所述确定所述至少一个目标变量中每个目标变量的映射参数及每个目标变量的截距参数包括:获取样本集;从所述样本集中获取每个目标变量的正样本的数量,作为每个目标变量对应的第一数量;从每个目标变量的正样本中获取所述当前变量的正样本的数量,作为每个目标变量对应的第二数量;计算每个目标变量对应的第二数量与每...

【专利技术属性】
技术研发人员:张巧丽
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1