System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种新型农业经营主体的信用评价方法技术_技高网

一种新型农业经营主体的信用评价方法技术

技术编号:40347151 阅读:4 留言:0更新日期:2024-02-09 14:32
本发明专利技术涉及农业经营主体信用评价技术领域,公开了一种新型农业经营主体的信用评价方法,包括数据接入层、数据存储层、数据管理层和数据应用层,数据通过数据接入层服务采集,并存储至数据存储层的数据库之中,通过数据管理层的服务对数据库中的数据进行清洗、转换、质量核查等操作,为数据应用层中的模型引擎、数据服务、主体库等应用服务提供数据支撑。该新型农业经营主体的信用评价方法基于大数据支撑平台构建全量业务数据,可以用全量业务数据训练模型,达到最好的模型效果;变量分箱更优,采用最有卡方分箱和单调性结合的方式,变量分箱效果更好;模型泛化能力强,基于全量数据对模型进行训练,使得到的模型具有很强的泛化能力。

【技术实现步骤摘要】

本专利技术涉及农业经营主体信用评价,特别涉及一种新型农业经营主体的信用评价方法


技术介绍

1、当前各省农担公司通常采用信用评分卡技术对新型农业经营主体信用进行评价,信用评分卡是用以前申请人的表现预测新申请人行为的一项工具。信用评分卡技术利用历史数据和统计技术,分析各种风险要素对违约率的影响程度,最终形成一个得分,根据该得分,可以区分贷款申请的风险程度。根据构建方法,信用评分卡可以分为三种:判断评分卡(专家型评分卡)、统计评分卡和混合评分卡。

2、现有技术缺点:

3、一、数据来源单一,无法全面了解新型农业经营主体的信用情况。

4、二、传统的新型农业经营主体信用评价方式依赖于专家经验,通过专家评分卡方式对新型农业经营主体进行打分,无法客观准确的体现出新型农业经营主体的信用和风险情况。


技术实现思路

1、本专利技术的第一个目的是提供一种建立大数据支撑的农业经营主体的信用评价平台系统,通过大数据支撑平台对接第三方数据源,并采集互联网数据,构建大数据资源库,解决数据来源单一问题;本专利技术的第二个目的是一种基于机器学习逻辑回归模型构建新型农业经营主体信用评价模型的方法,提高模型预测的准确性,解决依赖专家经验带来偏差,可以有效解决
技术介绍
中的问题。

2、为实现上述目的,本专利技术采取的技术方案为:

3、一种新型农业经营主体的信用评价平台系统,包括数据接入层、数据存储层、数据管理层和数据应用层,数据通过数据接入层服务采集,并存储至数据存储层的数据库之中,通过数据管理层的服务对数据库中的数据进行清洗、转换、质量核查等操作,为数据应用层中的模型引擎、数据服务、主体库等应用服务提供数据支撑。

4、本专利技术还采取的技术方案为:一种新型农业经营主体的信用评价方法,包含以下步骤:

5、步骤一、目标变量定义,根据vintage分析,观察各月份平均逾期的走势,确定表现窗口的时间跨度,将表现期内代偿客户用户定义为“坏用户”,将表现期内未代偿用户定义为“好用户”;

6、步骤二、数据获取,选取建模的新型农业经营主体客户数据和客户授权获取的第三方数据;

7、步骤三、探索性数据分析,对现有数据进行分类,了解数据的大体情况,包括每个字段的缺失值情况、异常值情况、平均值、中位数、最大值、最小值以及分布情况;

8、步骤四、数据预处理,包括脏数据清洗、缺失值处理和异常值处理;

9、步骤五、特征工程,包括变量分箱、woe转换、信息值iv和变量相关系数计算、根据信息值iv和变量相关系数进行特征筛选;

10、步骤六、数据集划分,随机或跨时间划分训练集、验证集;

11、步骤七、模型开发,以特征筛选后获得的特征变量为基础,构建模型,运用逻辑回归算法,进行模型拟合;对拟合后的变量系数进行检查,删掉符号相反的变量,后再次进行模型拟合;循环以上步骤,直到变量系数全部正确;最后删除相关系数矩阵较高的特征变量或者vif较高的特征变量,排除变量之间的多重共线性;

12、步骤八、模型评估,利用逻辑回归的参数调参训练,并根据模型评估指标评估模型的拟合能力;所述模型评估指标包括roc曲线、auc及ks;所述逻辑回归的参数包括正则化选择参数、优化算法选择参数、分类方式选择参数、类型权重参数、样本权重参数、正则化参数c、迭代次数;

13、步骤九、信用评分,根据逻辑回归的模型系数和woe得到评分刻度,制成标准评分卡。

14、进一步的,所述变量相关系数指两个变量之间的相互关系及其相关方向,可以避免多重共线性,变量根据iv排序逐一进入模型,后续变量的与已进入模型变量的相关系数需小于阈值之后才能进入模型。

15、进一步的,所述步骤二中数据包括客户的年龄、户籍、性别、收入、负债比以及在本机构的担保行为。

16、进一步的,所述步骤二中的第三方数据字段包括多头借贷、反欺诈数据。

17、进一步的,所述步骤五中的变量分箱包括通过卡方分箱选出对代偿状态影响最显著的字段、针对特征变量进性自动化分箱、根据分箱后的特征变量进行评分卡评估;

18、进一步的,所述自动化分箱实现方法为,将数据等频切分为p个区间,设定最大的分箱个数n,计算每一相邻区间的卡方值,将卡方值最小的一对区间合并;统计现存的数据区间数量q,如果q>n,重复执行计算,直至q≤n。

19、与现有技术相比,本专利技术具有如下有益效果:

20、1、基于大数据支撑平台构建全量业务数据,可以用全量业务数据训练模型,达到最好的模型效果;

21、2、变量分箱更优,采用最有卡方分箱和单调性结合的方式,变量分箱效果更好;

22、3、模型泛化能力强,基于全量数据对模型进行训练,使得到的模型具有很强的泛华能力。

本文档来自技高网...

【技术保护点】

1.一种新型农业经营主体的信用评价平台系统,包括数据接入层、数据存储层、数据管理层和数据应用层,其特征在于:数据通过数据接入层服务采集,并存储至数据存储层的数据库之中,通过数据管理层的服务对数据库中的数据进行清洗、转换、质量核查等操作,为数据应用层中的模型引擎、数据服务、主体库等应用服务提供数据支撑。

2.一种新型农业经营主体的信用评价方法,其特征在于,包含以下步骤:

3.根据权利要求2所述的一种新型农业经营主体的信用评价方法,其特征在于:所述变量相关系数指两个变量之间的相互关系及其相关方向,可以避免多重共线性,变量根据IV排序逐一进入模型,后续变量的与已进入模型变量的相关系数需小于阈值之后才能进入模型。

4.根据权利要求2所述的一种新型农业经营主体的信用评价方法,其特征在于:所述步骤二中数据包括客户的年龄、户籍、性别、收入、负债比以及在本机构的担保行为。

5.根据权利要求2所述的一种新型农业经营主体的信用评价方法,其特征在于:所述步骤二中的第三方数据字段包括多头借贷、反欺诈数据。

6.根据权利要求2所述的一种新型农业经营主体的信用评价方法,其特征在于:所述步骤五中的变量分箱包括通过卡方分箱选出对代偿状态影响最显著的字段、针对特征变量进性自动化分箱、根据分箱后的特征变量进行评分卡评估。

7.根据权利要求2所述的一种新型农业经营主体的信用评价方法,其特征在于:所述自动化分箱实现方法为,将数据等频切分为p个区间,设定最大的分箱个数n,计算每一相邻区间的卡方值,将卡方值最小的一对区间合并;统计现存的数据区间数量q,如果q>n,重复执行计算,直至q≤n。

...

【技术特征摘要】

1.一种新型农业经营主体的信用评价平台系统,包括数据接入层、数据存储层、数据管理层和数据应用层,其特征在于:数据通过数据接入层服务采集,并存储至数据存储层的数据库之中,通过数据管理层的服务对数据库中的数据进行清洗、转换、质量核查等操作,为数据应用层中的模型引擎、数据服务、主体库等应用服务提供数据支撑。

2.一种新型农业经营主体的信用评价方法,其特征在于,包含以下步骤:

3.根据权利要求2所述的一种新型农业经营主体的信用评价方法,其特征在于:所述变量相关系数指两个变量之间的相互关系及其相关方向,可以避免多重共线性,变量根据iv排序逐一进入模型,后续变量的与已进入模型变量的相关系数需小于阈值之后才能进入模型。

4.根据权利要求2所述的一种新型农业经营主体的信用评价方法,其特征在于:所...

【专利技术属性】
技术研发人员:吴先锋杨定华赵金虎曾能新
申请(专利权)人:湖北省农业信贷融资担保有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1