贷款数据分析预测方法及装置制造方法及图纸

技术编号:30825856 阅读:36 留言:0更新日期:2021-11-18 12:22
本发明专利技术公开了一种贷款数据分析预测方法及装置,涉及时间序列大数据建模技术领域,该方法包括:建立贷款时间序列数据集,分为训练数据集与测试数据集;采用时间序列模型对贷款时间序列训练数据集进行拟合得到模型参数,计算求得对应的动态均值序列与动态方差序列;根据贷款时间序列训练数据集、所述动态均值序列、所述动态方差序列进行残差计算得到残差序列,更换时间序列模型重新输入贷款时间序列训练数据集进行拟合,优化模型参数,直到残差序列通过独立性检验;根据贷款时间序列测试数据集对拟合、优化后的时间序列模型进行测试,利用通过测试的时间序列模型对待预测贷款数据进行分析预测,可以提高贷款数据分析预测准确性,改善用户体验。改善用户体验。改善用户体验。

【技术实现步骤摘要】
贷款数据分析预测方法及装置


[0001]本专利技术涉及时间序列大数据建模
,尤其涉及一种贷款数据分析预测的方法及装置。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]客户贷款数据往往具有周期性变化,这是因为生产过程具有周期性从而对资金有规律性需求,特别是大型企业的业务规模相对稳定,规律性非常明显。现阶段对企业资金需求往往只根据几个常用的统计量加以分析,比如均值、峰值、浮动百分比,或者画出每日数据散点图观察走势。
[0004]传统方法对贷款数据的分析预测较为粗糙,比如要预测某地一时间段范围内的客户贷款金额,一般根据个人经验以及对行业的了解,粗略的估计客户可能需要的贷款金额和贷款时间范围,偏差较大。

技术实现思路

[0005]本专利技术实施例提供一种贷款数据分析预测方法,用以提高贷款数据分析预测准确性,改善用户体验,该方法包括:
[0006]建立贷款时间序列数据集,所述贷款时间序列数据集为客户的历史日贷本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种贷款数据分析预测方法,其特征在于,包括:建立贷款时间序列数据集,所述贷款时间序列数据集为客户的历史日贷款额数据,所述贷款时间序列数据集分为贷款时间序列训练数据集与贷款时间序列测试数据集;采用时间序列模型对贷款时间序列训练数据集进行拟合,计算模型参数估计值,得到拟合好的时间序列模型,基于拟合好的时间序列模型分别得到贷款时间序列训练数据集对应的动态均值序列与动态方差序列;根据模型参数估计值、模型公式、贷款时间序列训练数据集、所述动态均值序列、所述动态方差序列进行残差计算得到残差序列,对残差序列进行独立性检验;将不符合白噪声序列的残差序列对应的动态均值序列与动态方差序列返回,更换时间序列模型重新输入贷款时间序列训练数据集进行拟合,优化模型参数,直到残差序列符合白噪声序列,所述白噪声序列满足独立同分布;根据贷款时间序列测试数据集对拟合、优化后的时间序列模型进行测试,利用通过测试的时间序列模型对待预测贷款数据进行分析预测。2.如权利要求1所述的方法,其特征在于,建立贷款时间序列数据集,包括:对客户的历史日贷款额数据进行预处理;所述预处理包括清洗、补足、标准化处理、box

cox变换其中之一或任意组合;利用预处理后的客户的历史日贷款额数据建立贷款时间序列数据集。3.如权利要求1所述的方法,其特征在于,采用时间序列模型对贷款时间序列训练数据集进行拟合,计算模型参数估计值,得到拟合好的时间序列模型,基于拟合好的时间序列模型,分别得到贷款时间序列训练数据集对应的动态均值序列与动态方差序列,包括:将贷款时间序列训练数据集输入时间序列模型,采用极大似然化方法计算模型参数的极大似然估计值;以所述极大似然估计值作为参数值得到拟合好的时间序列模型,将贷款时间序列训练数据集输入拟合好的时间序列模型,输出贷款时间序列训练数据集对应的动态均值序列与动态方差序列。4.如权利要求3所述的方法,其特征在于,按如下公式,将贷款时间序列训练数据集输入拟合好的时间序列模型,输出贷款时间序列训练数据集对应的动态均值序列与动态方差序列:序列:其中,μ、φ
i
、θ
j
、ω、α
i
、β
j
为待优化的模型参数;p1、q1、p2、q2为时间序列模型的构造参数,是在时间序列模型进行拟合之前确定的固定整数;μ
t
为动态均值序列;为动态方差序列;X
t

i
与X
t

j
为历史贷款时间序列训练数据集中t时刻之前对应的客户历史日贷款额数据序列;μ
t

i
与μ
t

j
为t时刻之前的历史动态均值序列;为t时刻之前的历史动态方差序列。5.如权利要求1所述的方法,其特征在于,根据模型参数估计值、模型公式、贷款时间序
列训练数据集、所述动态均值序列、所述动态方差序列进行残差计算得到残差序列,包括:根据贷款时间序列训练数据集、所述动态均值序列、所述动态方差序列,以及所述贷款时间序列训练数据集、所述动态均值序列、所述动态方差序列之间的模型公式关系,基于拟合得到的参数估计值,对拟合好的时间序列模型代入贷款时间序列训练数据集进行残差计算得到残差序列。6.如权利要求5所述的方法,其特征在于,按如下公式根据贷款时间序列训练数据集、所述动态均值序列、所述动态方差序列,以及所述贷款时间序列训练数据集、所述动态均值序列、所述动态方差序列之间的模型公式关系,基于拟合得到的参数估计值,对拟合好的时间序列模型输入贷款时间序列训练数据集进行残差计算得到残差序列:X
t

μ
t
=σ
t
Z
t
,t=1,2,3,

,n其中,n为贷款时间序列训练数据集包含的样本数量;X
t
为贷款时间序列训练数据集中t时刻的客户历史日贷款额数据;μ
t
为t时刻的动态均值;σ
t
为t时刻的动态方差;Z
t
为独立同分布的白噪声序列,均值为0方差为1,基于模型公式及参数估计值代入贷款时间序列训练集数据计算得到Z
t
的估计值,此估计值序列为样本残差序列。7.如权利要求1所述的方法,其特征在于,对残差序列进行独立性检验,包括:采用Ljung

Box检验方法对残差序列进行独立性检验,判断所述残差序列是否符合白噪声序列的独立性要求。8.如权利要求1所述的方法,其特征在于,根据贷款时间序列测试数据集对拟合、优化后的时间序列模型进行测试,包括:利用拟合并优化后的时间序列模型模拟产生客户日贷款额时间序列的预测值;将客户日贷款额预测值与贷款时间序列测试数据集数据进行比对;采用平均绝对值误差MAE和/或均方误差MSE,计算所述客户日贷款额的预测值与贷款时间序列测试数据集真实值之间的偏差;将所述偏差与预设阈值进行比较;利用通过测试的时间序列模型对待预测贷款数据进行分析预测,包括:利用所述偏差小于预设阈值的拟合优化好的时间序列模型,对待预测贷款数据进行分析预测。9.如权利要求1所述的方法,其特征在于,利用通过测试的时间序列模型对待预测贷款数据进行分析预测,包括:利用通过测试的时间序列模型对待预测贷款数据进行分析预测,根据时间序列模型残差的概率分布设定,求出待预测贷款数据对应的预测值置信区间;在利用通过测试的时间序列模型对待预测贷款数据进行分析预测之后,还包括:将实际贷款数据与贷款数据对应的预测值置信区间的上下界进行比对;根据比对结果,分析实际贷款...

【专利技术属性】
技术研发人员:陈鹏
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1