一种用于自营存款预测的方法技术

技术编号:37402409 阅读:5 留言:0更新日期:2023-04-30 09:29
本发明专利技术公开了一种用于自营存款预测的方法,包括:历史数据接入;数据预处理;特征工程计算;基于lightGBM,Auto

【技术实现步骤摘要】
一种用于自营存款预测的方法


[0001]本专利技术涉及存款预测方法领域,尤其涉及一种用于自营存款预测的方法。

技术介绍

[0002]银行自营存款主要由企事业单位存款和居民储蓄存款组成,是银行进行经济统计中非常重要的指标。对金融机构自营存款做出科学合理的预测,可为金融机构降低闲置资本,有效提高资本利用率。同时,也可为相关决策部门研究居民的收入水平、资金流向、居民的消费习惯等提供重要依据。
[0003]然而,传统的自营存款预测主要依靠专家经验、报表分析以及规则模型等手段。同时,由于不同的渠道收集数据的限制,预测偏差波动较大。另外,自营存款每类存款有很大的行业特征和地域特征,波动规律呈现差异性。对宏观经济指数、行业指数、市场行情等诸多外部因素敏感度高,因子与存款余额间的关联关系复杂。譬如,商品住宅成交均价、住宅用地(当周值)等因子,在一段时间内与月末余额变动呈现较强的负相关。但在下一个时间段内,受宏观环境影响,又会与月末余额变动呈现正相关趋势。这也加大了自营存款预测的难度。传统构建时间序列模型的方法,例如:自回归模型,线性动态模型、ARIMA模型,对于数据平稳的时间序列预测效果较好,但是,自营存款余额波动变化较大,并不适用于自营存款预测的场景。

技术实现思路

[0004]本专利技术的目的在于提供一种用于自营存款预测的方法,以解决上述技术问题。
[0005]本专利技术为解决上述技术问题,采用以下技术方案来实现:
[0006]一种用于自营存款预测的方法,包括:
[0007]历史数据接入;
[0008]数据预处理;
[0009]特征工程计算;
[0010]基于lightGBM,Auto

Encoder,Multi

Head

Attention多头注意力机制的混合神经网络的三种模型融合训练与预测;
[0011]模型效果回检。
[0012]优选的,所述数据包含:账户交易事件、账户余额信息、机构信息、对公客户信息、零售客户信息、新闻舆情数据、行业景气度数据、市场情绪指数数据、因子数据。
[0013]优选的,所述数据预处理的方法包括:
[0014]1)结合自营存款自身的产品属性,将自营存款分为粗放的科目类别进行预测;
[0015]2)针对每大类的存款数据,考虑数据之间的共性特性和差异性特征,结合k

means方法进行二次聚类;首先,基于存款数据的行业属性和分行属性,进行存款账户的分类,得到一级分类数据;其次,对存款账户聚合之后的存款余额量级巨大的序列进行拆分,对存款余额两级较小的序列进行合并,对存款余额分别设置分割阈值的下限和上限;最后,针对以
上聚类之后的数据,采用k

means方法进行二次聚类,以此得到基础类别的二级分类的时间序列数据。
[0016]优选的,所述特征工程包含两部分,一部分采用手工提取统计特征,一部分采用深度学习自动化提取特征。
[0017]优选的,所述特征包括:
[0018](1)日期属性特征:年、月、日、周几、一个月第几天、是否为工作日、月内第几个工作日;
[0019](2)特殊日期属性特征:节假日、年末、季度末;
[0020](3)往年同一时点的变化情况:近几年的和目标日期属性相同的余额差数据以及相关序列的统计值(最大值、最小值、均值、方差);
[0021](4)往年同一时点的变化率:当前时段余额相较于历史同期变化率;
[0022](5)当前类别在自营存款总额占比:当前类别在当前窗口统计下类比在自营存款总额中占比变化情况;
[0023](6)波动率变化特征:当前时刻在不同窗口下余额波动率变化计算;
[0024](7)余额序列特征:过去几十天的余额序列;
[0025](8)通货膨胀率、居民消费价格指数、GDP比重市场因子。
[0026]优选的,使用MAE进行模型效果回检,MAE计算公式如下:
[0027]。
[0028]本专利技术的有益效果是:
[0029]1、在数据预处理阶段,将自营存款按照业务维度分为四大科目进行预测。在此分类基础之上,针对不同科目存款,结合数据特点分别采用了不同的数据聚类方式,完成数据的类别处理。
[0030]2、在特征计算阶段,本专利技术充分挖掘历史近七年时序数据的统计特征、时间窗口特征的同时,引入了市场波动率计算因子、同期、环比变化等相关特征捕捉数据的年周期变化;引入行业景气度、市场情绪指数等宏观数据变化,来捕捉数据长周期变化;在模型构建阶段,引入Multi

Head

Attention多头注意力机制,来捕获序列内部的序列特征。以上多维度模型特征的构建,充分挖掘了数据的历史变化特征,更能充分的捕捉数据的变化趋势。
[0031]3、在模型预测阶段,本文采用lightGBM,Auto

Encoder,Multi

Head

Attention多头注意力机制的混合神经网络三种模型融合的手段,以此提高了模型的预测准确度,减小了预测误差。
附图说明
[0032]图1为Multi

Head

Attention多头注意力机制的混合神经网络模型结构图;
[0033]图2为AutoEncoder模型结构图;
具体实施方式
[0034]为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施例,进一步阐述本专利技术,但下述实施例仅仅为本专利技术的优选实施例,并非全部。
基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其它实施例,都属于本专利技术的保护范围。下述实施例中的实验方法,如无特殊说明,均为常规方法,下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0035]一种用于自营存款预测的方法,包括:
[0036]历史数据接入;
[0037]数据预处理;
[0038]特征工程计算;
[0039]基于lightGBM,Auto

Encoder,Multi

Head

Attention多头注意力机制的混合神经网络的三种模型融合训练与预测;
[0040]模型效果回检。
[0041]1、历史数据接入
[0042]自营存款序列的变化与时间序列呈现强相关性。因此,本专利技术使用近几年的自营存款余额数据作为训练数据,所述数据包含:账户交易事件、账户余额信息、机构信息、对公客户信息、零售客户信息、新闻舆情数据、行业景气度数据、市场情绪指数数据、因子数据。
[0043]2、数据预处理
[0044]数据预处理模块的主要功能是为模型训练和预测提供处理好的基础数据。...

【技术保护点】

【技术特征摘要】
1.一种用于自营存款预测的方法,其特征在于:包括:历史数据接入;数据预处理;特征工程计算;基于lightGBM,Auto

Encoder,Multi

Head

Attention多头注意力机制的混合神经网络的三种模型融合训练与预测;模型效果回检。2.根据权利要求1所述的一种用于自营存款预测的方法,其特征在于:所述数据包含:账户交易事件、账户余额信息、机构信息、对公客户信息、零售客户信息、新闻舆情数据、行业景气度数据、市场情绪指数数据、因子数据。3.根据权利要求1所述的一种用于自营存款预测的方法,其特征在于:所述数据预处理的方法包括:1)结合自营存款自身的产品属性,将自营存款分为粗放的科目类别进行预测;2)针对每大类的存款数据,考虑数据之间的共性特性和差异性特征,结合k

means方法进行二次聚类;首先,基于存款数据的行业属性和分行属性,进行存款账户的分类,得到一级分类数据;其次,对存款账户聚合之后的存款余额量级巨大的序列进行拆分,对存款余额两级较小的序列进行合并,对存款余额分别设置分割阈值的下限和上限;最后,针对以...

【专利技术属性】
技术研发人员:苑建蕊郭翰橙刘彦凯
申请(专利权)人:招银网络科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1