System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于企业融资额度估算的商业汇票大数据分析方法技术_技高网

一种用于企业融资额度估算的商业汇票大数据分析方法技术

技术编号:40869796 阅读:2 留言:0更新日期:2024-04-08 16:36
本发明专利技术涉及信息管理技术领域,尤其涉及一种用于企业融资额度估算的商业汇票大数据分析方法。本发明专利技术方法,根据企业历史汇票交易数据,通过离群值逐步收敛法寻找模型效果最优点,使模型效果影响比较大的离群值逐步收敛,降低离群值对模型训练的噪声干扰,使模型更加稳定;本发明专利技术方法,基于解释变量与响应变量数据进行多元线性回归算法建模,利用最小二乘参数估计法求解,使之与响应变量之间的相关关系的方差扰动降低,应用方差膨胀因子减少多重共线性影响,使模型泛化能力更加稳健;本发明专利技术方法,应用企业实际授信额度与预测额度之间的差值评估算法结果授信额度的可信性,能够精准预测企业贷款授信额度。

【技术实现步骤摘要】

本专利技术涉及信息管理,尤其涉及一种用于企业融资额度估算的商业汇票大数据分析方法


技术介绍

1、目前,金融机构对存在用款需求的企业的授信,主要是根据该企业自身的发票数据、税务数据等来进行,这部分数据一定程度能够反映经营情况,但在维度上存在不足,如,某中小企业经营规模中等,但为了减少成本,尽可能地选择了少开发票等策略,上述授信考虑的逻辑就存在失真。金融机构开展供应链金融业务一般基于核心企业供应链展开,如图2所示,针对信用特别好的核心企业集团深挖其信用传递能力,围绕核心企业上下游的产业关联企业进行准入与授信;但在全国5000万家中小企业中,仅有约800万家企业支持通过发票进行授权,仅从纳税、发票维度考虑授信,在核心企业一级上下游可以满足,但在更深层次的中小企业,就存在信用传递穿透性不足,信用数据佐证材料缺失等问题。因此,为实现信用穿透,亟需一类信用工具数据,能够对纳税、发票数据进行补足,以期更好地为中小企业进行精准授信。汇票数据作为国内特有工具兼具支付和流通属性,公众认可度较高,平均一张银行承兑汇票可以流通8手以上,非常适合反映核心企业的信用传递。因此,采用银行承兑汇票、商业承兑汇票等汇票数据作为基础开发大数据增信提额模型,能够较好地起到佐证作用。

2、基于商业汇票交易的业务关于企业的特征指标共计200余个,存在数值型、分类型、布尔型多种类型的特征指标,各指标存在一定程度的离群值,过大的离群值对线性回归的结果会有较大的影响,需要对数据的归一化处理,减小模型复杂度的同时尽可能地排除数据噪声的影响;部分特征指标之间存在很强的相关性,同时进入模型会产生多重共线性,降低模型指标回归系数的解释性。因而,如何对解释变量离群值处理、寻找模型效果最优点,如何降低响应变量之间相关关系的方差扰动,如何减少多重共线性影响,如何科学评估算法结果授信额度的可信性、精准预测企业贷款授信额度,是亟须解决的技术问题。


技术实现思路

1、本专利技术要解决的技术问题是:克服现有技术中存在的不足,提供一种用于企业融资额度估算的商业汇票大数据分析方法,根据企业历史汇票交易数据,对解释变量离群值处理、寻找模型效果最优点,降低响应变量之间相关关系的方差扰动、减少多重共线性影响,科学评估算法结果授信额度的可信性、精准预测企业贷款授信额度。本专利技术技术方案如下:

2、一种用于企业融资额度估算的商业汇票大数据分析方法,将企业授信金额定义为响应变量,将企业特征指标定义为模型解释变量,方法模型主要采用解释变量对响应变量进行学习,得到能够针对样本外的企业解释变量去预测响应变量值,包括:

3、s1解释变量离群值处理,应用离群值优化算法,通过离群值逐步收敛法寻找模型效果最优点从而达到降低离群值对模型训练的噪声干扰,所述为解释变量与响应变量之间的训练模型计算值;模型效果决定系数是对线性模型评估的一种评价指标,其值最大为1,最小为0;当值越接近于1,则说明模型越好,此时参数为最优值;值越接近于0,则模型越差;

4、公式:

5、;

6、其中,表示模型估计值,表示样本原始值,表示样本原始值的均值;

7、s2解释变量离散化处理,利用最小二乘离散化方法对解释变量进行预处理,使之与响应变量之间的相关关系的方差扰动降低,从而使模型泛化能力更加稳健;

8、最小二乘离散化方法公式:

9、;

10、;

11、;

12、上述公式表达为选取待切分离散化的第j个x变量,遍历其切分点s,使得数据集d划分为和,和分别为数据集和中y对应的均值,寻找使得上述表达式值最小的切分点s;

13、s3算法训练构建模型,基于上述两类分析方法处理的解释变量与响应变量数据进行多元线性回归算法建模,利用最小二乘参数估计法求解,并用方差膨胀因子vif进行多重共线性检验;

14、s3.1采用多元线性回归算法,公式:

15、;

16、s3.2参数估计方法损失函数:

17、;

18、其中,i表示第i个样本,n为样本总数,表示因变量模型估计值,表示因变量样本原始值,由链式法则对中的求偏导数,得到:

19、;

20、上述公式k表示第k个解释变量或参数,两边同时乘以,令d=,经过矩阵式转换,得到:

21、;

22、;

23、由于参数最优化求解的需要,且l为非凸函数,当时损失函数值可达到最小,该方法称为最小二乘参数求解法,在等式两边从左侧同时乘以,得到:

24、;

25、s3.3应用方差膨胀因子vif对回归变量间共线性检验,公式:

26、;

27、其原理是把第i个解释变量作为响应变量,将其余n-1个变量作为解释变量,作线性回归计算模型得出判决统计量方差膨胀因子vif,所述为第i个解释变量与其他解释变量之间的;方差膨胀因子越大,说明越接近1,则第i个解释变量与其他解释变量之间共线程度越强;如果方差膨胀因子vif大于,则认为该变更与剩余n-1个变量之间具备多重共线性,因而剔除该变量;所述的取值范围3~10;

28、s4对模型算法进行效果统计与评估,评分模型效果误差统计与分布:

29、;

30、为企业实际授信额度与预测额度之间的差值,当误差表现出为均值为0的渐近正态分布时,模型效果最佳。

31、优选地,s3.3所述。

32、本专利技术的有益效果是:

33、1、本专利技术提供的一种用于企业融资额度估算的商业汇票大数据分析方法,选取汇票数据作为标准化数据,通过其承载的支付频次、连续性、规模等信息,能够使用反映核心企业链属企业间的紧密程度,企业经营规模与近一年汇票收入规模成正比。

34、2、本专利技术提供的一种用于企业融资额度估算的商业汇票大数据分析方法,通过多张汇票提取企业交易关系、企业合作方式指标,能够从行业、客群角度反映同一类的企业信用;汇票数据不是纳税、发票数据的替代数据,而是一种有效的加强与补充,在现有同质化较高的基于纳税数据、发票数据的模型基础上叠加汇票数据,能够更好地反映供应链关系。

35、3、本专利技术提供的一种用于企业融资额度估算的商业汇票大数据分析方法,能够根据企业历史汇票交易数据,通过离群值逐步收敛法寻找模型效果最优点,使模型效果影响比较大的离群值逐步收敛,从而降低离群值对模型训练的噪声干扰,从而使模型更加稳定。

36、4、本专利技术提供的一种用于企业融资额度估算的商业汇票大数据分析方法,基于解释变量与响应变量数据进行多元线性回归算法建模,利用最小二乘参数估计法求解,使之与响应变量之间的相关关系的方差扰动降低,应用方差膨胀因子减少多重共线性影响,从而使模型泛化能力更加稳健。

37、5、本专利技术提供的一种用于企业融资额度估算的商业汇票大数据分析方法,应用企业实际授信额度与预测额度之间的差值评估算法结果授信额度的可信性,当误差本文档来自技高网...

【技术保护点】

1.一种用于企业融资额度估算的商业汇票大数据分析方法,将企业授信金额定义为响应变量,将企业特征指标定义为模型解释变量,方法模型主要采用解释变量对响应变量进行学习,得到能够针对样本外的企业解释变量去预测响应变量值,包括:

2.根据权利要求1所述的一种用于企业融资额度估算的商业汇票大数据分析方法,S3.3所述。

【技术特征摘要】

1.一种用于企业融资额度估算的商业汇票大数据分析方法,将企业授信金额定义为响应变量,将企业特征指标定义为模型解释变量,方法模型主要采用解释变量对响应变量进行学习...

【专利技术属性】
技术研发人员:全传晓周力夏敏王红平李大岩
申请(专利权)人:深度山东数字科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1