本发明专利技术提供一种基于逻辑回归与投票式模型集成的评分卡开发方法,该方法包括:确定所有待评风险维度;将所述所有待评风险维度划分为多个待评风险维度子集;根据所述多个待评风险维度子集分别构建与其对应的子集模型;分别对各子集模型进行检验,基于检验结果筛选得到目标子集模型;基于所有目标子集模型,获得所有待评风险维度的集成评分结果。通过将所有待评风险维度划分为多个待评风险维度子集,能够快速准确的确定所有待评风险维度的得分;且保留了传统逻辑回归的因果关系明确、可解释性强、有明确检验标准的优点,同时覆盖多风险维度,结果更加稳健,集成中纳入了更多能够带来边际有用信息的风险因素,评估更加全面。
A scorecard development method based on the integration of logistic regression and voting model
【技术实现步骤摘要】
一种基于逻辑回归与投票式模型集成的评分卡开发方法
本专利技术涉及资源分配
,尤其涉及一种基于逻辑回归与投票式模型集成的评分卡开发方法。
技术介绍
现有的资源分配业务,在接收到资源申请方的资源分配请求后,为了确保资源分配的安全性以及提高资源分配的准确性,需要首先对资源申请方进行客观评价。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种基于逻辑回归与投票式模型集成的评分卡开发方法,以对资源申请方进行客户评价。基于上述目的,本专利技术第一方面提供了一种基于逻辑回归与投票式模型集成的评分卡开发方法,所述方法包括:确定所有待评风险维度;将所述所有待评风险维度划分为多个待评风险维度子集;根据所述多个待评风险维度子集分别构建与其对应的子集模型;分别对各子集模型进行检验,基于检验结果筛选得到目标子集模型;基于所有目标子集模型,获得所有待评风险维度的集成评分结果。可选地,所述基于所有目标子集模型,获得所有待评风险维度的集成评分结果,包括:分别将各待评风险维度分档,并确定各档对应的WOE编码值;基于各待评风险维度的最大WOE编码值、最小WOE编码值及各待评风险维度在各目标子集模型中的β值,确定各待评风险维度在各目标子集模型中的权重;基于各待评风险维度在各目标子集模型中的权重,确定各待评风险维度在预设评分卡模型中的加权平均系数或算术平均系数;基于单个待评风险维度各档对应的WOE编码值,确定各待评风险维度的评分;基于各待评风险维度的评分及各待评风险维度的加权平均系数或算术平均系数,获得所有待评风险维度的集成评分结果。可选地,所述分别对各子集模型进行检验,基于检验结果筛选得到目标子集模型,包括:对所有子集模型分别进行检验,获得检验结果;判断所述检验结果是否大于预设检验阈值;若是,则判定所述检验结果对应的子集模型是目标子集模型;若否,则判定所述检验结果对应的子集模型不是目标子集模型。可选地,所述对所有子集模型分别进行检验,获得检验结果,包括:分别对各子集模型进行模型预测精确度检验、柯尔莫可洛夫-斯米洛夫检验、拟合优度检验和风险维度拟合参数显著性检验,相应的,获得模型预测精确度检验结果、柯尔莫可洛夫-斯米洛夫检验结果、拟合优度检验结果和风险维度拟合参数显著性检验结果。可选地,所述确定所有待评风险维度,包括:接收资源申请方的资源分配请求;基于所述资源申请方的资源分配请求,获取所述资源申请方的相关数据;其中,所述资源申请方的相关数据包括司法数据、工商数据、征信数据、税务数据和银行数据中的一种或多种;基于所述资源申请方的相关数据,确定所述资源申请方的所有待评风险维度。可选地,所述方法还包括:基于所有待评风险维度的集成评分结果,进行资源分配。从上面所述可以看出,本专利技术提供的基于逻辑回归与投票式模型集成的评分卡开发方法,通过确定所有待评风险维度,将所有待评风险维度划分为多个待评风险维度子集,并基于待评风险维度子集构建与其对应的子集模型,然后筛选获得目标子集模型,最后基于目标子集模型获得所有待评风险维度的集成评分结果;通过将所有待评风险维度划分为多个待评风险维度子集,能够快速准确的确定所有待评风险维度的得分;且保留了传统逻辑回归的因果关系明确、可解释性强、有明确检验标准的优点,同时覆盖多风险维度,结果更加稳健,集成中纳入了更多能够带来边际有用信息的风险因素,评估更加全面。该方法还通过接收资源申请方的资源分配请求,基于资源分配请求获取资源申请方的相关数据,然后基于资源申请方的相关数据获得所有待评风险维度,然后基于所有待评风险维度的集成评分结果,进行资源分配;通过基于所有待评风险维度的集成评分结果,进行资源分配,能够对资源申请方进行客观评价,提高资源分配的安全性和准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的基于逻辑回归与投票式模型集成的评分卡开发方法的流程示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。需要说明的是,除非另外定义,本专利技术实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。现有的资源分配业务,在接收到资源申请方的资源分配请求后,为了确保资源分配的安全性以及提高资源分配的准确性,需要首先对资源申请方进行客观评价。为了解决上述问题,本专利技术提供了一种基于逻辑回归与投票式模型集成的评分卡开发方法,通过确定所有待评风险维度,将所有待评风险维度划分为多个待评风险维度子集,并基于待评风险维度子集构建与其对应的子集模型,然后筛选获得目标子集模型,最后基于目标子集模型获得所有待评风险维度的集成评分结果。该方法可以应用于手机、平板电脑等各种电子设备,具体不做限定。该方法中提及的资源可以是信贷资源,提及的业务可以是信贷业务,具体不做限定。后续将以信贷业务为例,对该基于逻辑回归与投票式模型集成的评分卡开发方法进行详细说明。为了便于理解,下面结合附图对该基于逻辑回归与投票式模型集成的评分卡开发方法进行详细说明。图1为本专利技术实施例提供的基于逻辑回归与投票式模型集成的评分卡开发方法的流程示意图,该方法包括:S01、确定所有待评风险维度;S02、将所有待评风险维度划分为多个待评风险维度子集;S03、根据多个待评风险维度子集分别构建与其对应的子集模型;S04、分别对各子集模型进行检验,基于检验结果筛选得到目标子集模型;S05、基于所有目标子集模型,获得所有待评风险维度的集成评分结果。在实际应用中,待评风险维度为进行风险评估时需要考量的风险因素。以信贷业务为例进行详细说明。在实际应用中,待评风险维度可以包括企业征信、企业法定代表人征信、企业法定代表人信贷记录、企业纳税评级、企业年销售收入等等,具体不做限定。基于信贷申请方的相关数据,可以确定信贷申请方的所有待评风险维度;比如,可以由信贷申请方的税务数据确定企业纳税评级、企业年销售收入、企业违法违章次数等等,或者可以由信贷申请方的征信数据确定企业征信、企业法定代表人征信等等、或者可以由信贷申请方的银行数据获取企业法定代表人信贷记录等等,具体不做限定。获得信贷申请方的所有待评风险维度后,首先采用斜交主成分分析方法,将所有待评风险维度划分为多个待评风险维度子集,且每个待评风险维度子集中的待评风险维度不存在显著的多重共线本文档来自技高网...
【技术保护点】
1.一种基于逻辑回归与投票式模型集成的评分卡开发方法,其特征在于,所述方法包括:/n确定所有待评风险维度;/n将所述所有待评风险维度划分为多个待评风险维度子集;/n根据所述多个待评风险维度子集分别构建与其对应的子集模型;/n分别对各子集模型进行检验,基于检验结果筛选得到目标子集模型;/n基于所有目标子集模型,获得所有待评风险维度的集成评分结果。/n
【技术特征摘要】
1.一种基于逻辑回归与投票式模型集成的评分卡开发方法,其特征在于,所述方法包括:
确定所有待评风险维度;
将所述所有待评风险维度划分为多个待评风险维度子集;
根据所述多个待评风险维度子集分别构建与其对应的子集模型;
分别对各子集模型进行检验,基于检验结果筛选得到目标子集模型;
基于所有目标子集模型,获得所有待评风险维度的集成评分结果。
2.根据权利要求1所述的基于逻辑回归与投票式模型集成的评分卡开发方法,其特征在于,所述基于所有目标子集模型,获得所有待评风险维度的集成评分结果,包括:
分别将各待评风险维度分档,并确定各档对应的WOE编码值;
基于各待评风险维度的最大WOE编码值、最小WOE编码值及各待评风险维度在各目标子集模型中的β值,确定各待评风险维度在各目标子集模型中的权重;
基于各待评风险维度在各目标子集模型中的权重,确定各待评风险维度在预设评分卡模型中的加权平均系数或算术平均系数;
基于单个待评风险维度各档对应的WOE编码值,确定各待评风险维度的评分;
基于各待评风险维度的评分及各待评风险维度的加权平均系数或算术平均系数,获得所有待评风险维度的集成评分结果。
3.根据权利要求1所述的基于逻辑回归与投票式模型集成的评分卡开发方法,其特征在于,所述分别对各子集模型进行检验,基于检验结果筛选得到目标子集模...
【专利技术属性】
技术研发人员:吉风明,韩传赞,
申请(专利权)人:东方微银科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。