建模方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26690881 阅读:20 留言:0更新日期:2020-12-12 02:42
本申请公开了一种建模方法、装置、电子设备及存储介质,获取多个第一信息,并且获取第一信息对应的第二信息,第二信息具有多个类别,基于第一预设算法对每个第一信息对应的所述第二信息进行计算,获取每个第一信息在所述每个类别下的后验概率;基于第二预设算法对多个第一信息对应的第二信息进行计算,获取多个第一信息在所述每个类别下的先验概率;基于第三预设算法对后验概率和先验概率进行计算,获取多个第一信息在每个类别下的平均概率;基于多个第一信息在每个类别下的平均概率建模,得到决策模型,通过后验概率对先验概率进行修正,得到平均概率,通过平均概率建立决策模型,确保决策模型分类的准确性,使得决策模型能够能准确的分析业务。

【技术实现步骤摘要】
建模方法、装置、电子设备及存储介质
本申请涉及电子设备
,更具体地,涉及一种建模方法、装置、电子设备及存储介质。
技术介绍
随着普惠金融、移动互联网等业务的普及,小额现金贷、理财、保险、电子产品等业务得到快速的发展。这些业务在发展过程中产生的大数据,对推进上述业务发展有着重要的作用。从大数据中提取的众多有效信息可用于全方位KYC(Knowyourcustomer)建模,通过模型来对上述业务进行分析以及决策。由于现有技术获取的众多有效信息不准确,导致通过获得的有效信息建立的模型不能准确的分析业务。
技术实现思路
鉴于上述问题,本申请提出了一种建模方法、装置、电子设备及存储介质,能够提高有效信息得准确率,从而提高模型分析业务的准确度。第一方面,本申请实施例提供了一种建模方法,包括:获取多个第一信息,并获取多个所述第一信息对应的第二信息,其中,所述第二信息具有多个类别;基于第一预设算法对每个所述第一信息对应的所述第二信息进行计算,获取每个所述第一信息在所述每个类别下的后验概率;基于第二预设算法对多个所述第一信息对应的所述第二信息进行计算,获取多个所述第一信息在所述每个类别下的先验概率;基于第三预设算法对所述后验概率和所述先验概率进行计算,获取多个所述第一信息在所述每个类别下的平均概率;基于多个所述第一信息在所述每个类别下的平均概率建模,得到决策模型。第二方面,本申请实施例提供了一种建模装置,包括:信息获取模块,用于获取多个第一信息,并获取多个所述第一信息对应的第二信息,其中,所述第二信息具有多个类别;后验概率获取模块,用于基于第一预设算法对每个所述第一信息对应的所述第二信息进行计算,获取每个所述第一信息在所述每个类别下的后验概率;先验概率获取模块,用于基于第二预设算法对多个所述第一信息对应的所述第二信息进行计算,获取多个所述第一信息在所述每个类别下的先验概率;平均概率获取模块,用于基于第三预设算法对所述后验概率和所述先验概率进行计算,获取多个所述第一信息在所述每个类别下的平均概率;建模模块,用于基于多个所述第一信息在所述每个类别下的平均概率建模,得到决策模型。第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中,所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述方法。第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法。本申请实施例提供的一种建模方法、装置、电子设备及存储介质,获取多个第一信息,并且获取多个第一信息对应的第二信息,其中,第二信息具有多个类别,基于第一预设算法对每个第一信息对应的所述第二信息进行计算,获取每个第一信息在所述每个类别下的后验概率;基于第二预设算法对多个第一信息对应的第二信息进行计算,获取多个第一信息在所述每个类别下的先验概率;基于第三预设算法对后验概率和先验概率进行计算,获取多个第一信息在每个类别下的平均概率;基于多个第一信息在每个类别下的平均概率建模,得到决策模型,由于通过后验概率对先验概率进行修正,得到平均概率,通过平均概率建立决策模型,保证了决策模型分类的准确性,使得决策模型能够能准确的分析业务。本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本申请一个实施例的建模方法流程示意图;图2示出了本申请又一个实施例的建模方法流程示意图;图3示出了本申请再一个实施例的建模方法流程示意图;图4示出了本申请另一个实施例的建模方法流程示意图;图5示出了本申请又再一个实施例的建模方法流程示意图;图6示出了本申请又另一个实施例的建模方法流程示意图;图7示出了根据本申请一个实施例的建模装置的框图;图8是本申请实施例的用于执行根据本申请实施例的建模方法的电子设备的框图;图9是本申请实施例的用于保存或者携带实现根据本申请实施例的建模方法的程序代码的存储单元。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。随着普惠金融、移动互联网等业务的普及,小额现金贷、理财、保险、电子产品等业务得到快速的发展。这些业务在发展过程中产生的大数据,对推进上述业务发展有着重要的作用。从大数据中提取的众多(高基数)有效信息可用于全方位KYC建模,通过模型来对上述业务进行分析以及决策。专利技术人在研究中发现,可以采用一种建模方法,该方法在提取大数据中高基数有效信息的时,采用基于标签编码的方式,即赋予高基数有效信息中每个有效信息一个数值,可以对高基数有效信息按照序号编码为连续的数值,如编码为连续的0,1,2,3...,例如,对N个不同城市按照序号编码为0,1,2,3...N-1,然后将编码后的数值后,将该数值直接放入模型进行训练,训练后的模型可用于分析决策。专利技术人还发现,可以采用另一种建模方法,该方法在提取大数据中高基数有效信息时,采用独热编码的方式,将高基数有效信息转编码为多维度变量,即将高基数有效信息中的每一条信息作为一个维度,每一个维度上使用0或1来量化,依据高基数有效信息可以得到多个维度的向量,继续以N个不同城市为例,按照独热编码的方式,将N个城市编码为N*1维度的向量。然而,专利技术人发现,在一种建模方法中,基于标签编码的方式,只适合处理具有大小或顺序关系的数据型变量。当高基数有效信息为数据型变量如年龄时,可以按照年龄的大小进行编码,例如对10岁的人编码为10,则编码10代表年龄的大小关系。而在类别型变量中,不同的变量之间不存在大小关系,且不同的变量之间平等,例如,N个城市之间无大小关系;用标签编码的方式编码类别型变量时,则赋予了类别型变量大小以及顺序关系,当将标签编码的类别型变量用于建模时,会影响损失函数的计算结果,导致建立的模型不能准确地用于分析决策。而在另一种建模方式中,采用独热编码的方式,在编码后的多维向量中,高基数有效信息中的每一条信息占用一个维度。由于高基数有效信息的数量众多,导致多维向量的维度过高,一方面,多维向量占用大量的内存,从而导致了维度爆炸的问题;另一方面,将多维向量训练模型时,导致训练的时间过长。针对上述问题,专利技术人经过长期的研究发现,并提出了本申请实施例提供的一种建模方法、装置、电子设备及存储介质,高基数有效信息中包括多个第一信息以及每个第一信息对应的第二信息,第二信息具有多个类别,计算第一信息在每个类别下的后验概率,以及计算第一信息在每个类别下的先验概率,根据先验本文档来自技高网
...

【技术保护点】
1.一种建模方法,其特征在于,包括:/n获取多个第一信息,并获取多个所述第一信息对应的第二信息,其中,所述第二信息具有多个类别;/n基于第一预设算法对每个所述第一信息对应的所述第二信息进行计算,获取每个所述第一信息在所述每个类别下的后验概率;/n基于第二预设算法对多个所述第一信息对应的所述第二信息进行计算,获取多个所述第一信息在所述每个类别下的先验概率;/n基于第三预设算法对所述后验概率和所述先验概率进行计算,获取多个所述第一信息在所述每个类别下的平均概率;/n基于多个所述第一信息在所述每个类别下的平均概率建模,得到决策模型。/n

【技术特征摘要】
1.一种建模方法,其特征在于,包括:
获取多个第一信息,并获取多个所述第一信息对应的第二信息,其中,所述第二信息具有多个类别;
基于第一预设算法对每个所述第一信息对应的所述第二信息进行计算,获取每个所述第一信息在所述每个类别下的后验概率;
基于第二预设算法对多个所述第一信息对应的所述第二信息进行计算,获取多个所述第一信息在所述每个类别下的先验概率;
基于第三预设算法对所述后验概率和所述先验概率进行计算,获取多个所述第一信息在所述每个类别下的平均概率;
基于多个所述第一信息在所述每个类别下的平均概率建模,得到决策模型。


2.根据权利要求1所述的方法,其特征在于,所述基于第一预设算法对每个所述第一信息对应的所述第二信息进行计算,获取每个所述第一信息在所述每个类别下的后验概率,包括:
从多个所述第一信息中确定任意一个第一信息作为目标第一信息,并从所述第二信息的多个类别中确定任意一个类别作为目标类别;
获取所述目标第一信息在所述目标类别下的第二信息的数量作为第一数量,并获取所述目标第一信息在所述多个类别下的所述第二信息的数量作为第二数量;
计算所述第一数量与所述第二数量之间的比值,获取所述目标第一信息在所述目标类别下的后验概率。


3.根据权利要求2所述的方法,其特征在于,所述基于第二预设算法对多个所述第一信息对应的所述第二信息进行计算,获取多个所述第一信息在所述每个类别下的先验概率,包括:
获取多个所述第一信息在所述目标类别下的第二信息的数量作为第三数量,并获取多个所述第一信息在所述多个类别下的第二信息的数量作为第四数量;
计算所述第三数量与所述第四数量之间的比值,获取多个所述第一信息在所述目标类别下的先验概率。


4.根据权利要求3所述的方法,其特征在于,所述基于第三预设算法对所述后验概率和所述先验概率进行计算,获取多个所述第一信息在所述每个类别下的平均概率,包括:
获取第一权重以及第二权重,其中,所述第一权重为所述目标第一信息在所述目标类别下的后验概率的权重,所述第二权重为多个所述第一信息在所述目标类别下的先验概率的权重;
计算所述后验概率与所述第一权重之间的乘积,获得第一加权概率;
计...

【专利技术属性】
技术研发人员:侯宪龙
申请(专利权)人:深圳市欢太科技有限公司OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1