ATM现金流预测模型的训练方法、预测方法及装置制造方法及图纸

技术编号:30917360 阅读:54 留言:0更新日期:2021-11-23 00:06
本公开提供了一种ATM现金流预测模型的训练方法、预测方法及装置,涉及人工智能领域。该ATM现金流预测模型的训练方法包括:获取多个原始ATM设备的基础数据,基础数据包括业务属性数据、部署环境属性数据和时空关联属性数据,对基础数据进行数据清洗和聚合,生成以每个原始ATM设备为中心的基础数据宽表;根据预设分类规则,对基础数据宽表进行分类筛选和聚类处理,得到每个原始ATM设备归属的ATM大类和ATM大类下的ATM小类;获取归属同一ATM小类下的至少一个原始ATM设备的历史交易数据,形成ATM小类集合数据;使用ATM小类集合数据作为训练数据集来训练预设算法模型,得到训练好的ATM现金流预测模型。ATM现金流预测模型。ATM现金流预测模型。

【技术实现步骤摘要】
ATM现金流预测模型的训练方法、预测方法及装置


[0001]本公开涉及人工智能领域,具体涉及一种ATM现金流预测模型的训练方法、预测方法及装置。

技术介绍

[0002]ATM(Automated Teller Machine,自动柜员机)是银行用于为客户提供自助存取现金的设备。银行需要根据业务量以及相关管理要求,对所辖ATM设备制定加钞计划,由于ATM设备周围环境复杂多变,其每日现金流量变化受经济或人文环境、设备摆放地点、周边事件、节假日、天气等多种因素干扰,需依靠人工经验或采用一些新技术进行现金流量估算。
[0003]目前,主要采用经验估算法和数据建模法进行ATM现金流预测。其中,经验估算法在传统银行业务中普遍采用,主要依靠业务专家经验积累,对所辖ATM设备的业务特点、历史交易量等因素进行综合判断,设定合理的经验值指导ATM的现金加钞量估算。数据建模法目前在一些大型商业银行中采用,通过自研产品或者采购产品,利用传统统计学算法、机器学习算法对ATM历史现金流水进行分析建模,预测未来一定周期的现金流量,指导ATM现金加钞量估算。
[0004]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:银行的ATM设备经常会有增设、撤并、移址等情况发生,发生这些情况之后,涉及的ATM设备通常可以认为是新设备,由于缺乏足够的历史交易数据指导专家经验估算,采用历史数据建模方法会因为缺少数据导致无法建模或者模型预测不准确的问题,两种方法均会导致无法准确预估ATM现金流的问题。

技术实现思路
/>[0005]针对现有技术的上述不足,本公开提供了一种ATM现金流预测模型的训练方法、预测方法及装置。
[0006]根据本公开的第一个方面,提供了一种ATM现金流预测模型的训练方法,包括:
[0007]获取多个原始ATM设备的基础数据,基础数据包括业务属性数据、部署环境属性数据和时空关联属性数据,对基础数据进行数据清洗和聚合,生成以每个原始ATM设备为中心的基础数据宽表;
[0008]根据预设分类规则,对基础数据宽表进行分类筛选和聚类处理,得到每个原始ATM设备归属的ATM大类和ATM大类下的ATM小类;
[0009]获取归属同一ATM小类下的至少一个原始ATM设备的历史交易数据,形成ATM小类集合数据;
[0010]使用ATM小类集合数据作为训练数据集来训练预设算法模型,得到训练好的ATM现金流预测模型。
[0011]根据本公开的实施例,业务属性数据包括ATM所属网点类型、所属网点层级、ATM设
备类型、ATM钞箱容量、所属线路、所属区域和每日历史平均现金收付量中的至少一种;
[0012]部署环境属性数据包括ATM所在城市经济类型、ATM城市人口规模类型、ATM部署位置坐标、ATM部署地点类型、ATM周边区域类型和ATM周边环境人流密度分类中的至少一种;
[0013]时空关联属性数据包括相同地点ATM设备数量、相同地点ATM设备平均流量、附近ATM设备数量、附近ATM平均流量、ATM周边网点数量和ATM周边网点规模类型中的至少一种。
[0014]根据本公开的实施例,数据清洗包括:
[0015]剔除基础数据宽表中的重复数据;和/或
[0016]修复基础数据宽表中的缺失数据、异常数据和离群数据。
[0017]根据本公开的实施例,修复基础数据宽表中的缺失数据、异常数据和离群数据包括以下之中的至少一种:
[0018]采用近四周均值或中位数来填充缺失数据;
[0019]根据正态分布3σ原则,将三倍于基础数据宽表的标准差的数据视为噪声数据,采用Smooth Data函数对噪声数据进行平滑处理;
[0020]通过箱线图的上下边缘来确定离群数据,采用前后四周相同星期平均值填充方式来填充离群数据。
[0021]根据本公开的实施例,预设分类规则包括:
[0022]若多个原始ATM设备的部署位置相同,则标记原始ATM设备归属相同的ATM大类和ATM小类,聚类处理结束;
[0023]根据ATM设备类型、ATM历史平均收付量、工作日平均收付量、周六平均收付量和周日平均收付量,标记每个原始ATM设备归属的ATM大类。
[0024]根据本公开的实施例,预设分类规则还包括:
[0025]按顺序生成ATM大类和ATM大类下的ATM小类编号;
[0026]已标记了ATM小类的原始ATM设备,则聚类处理结束。
[0027]根据本公开的实施例,ATM历史平均收付量、工作日平均收付量、周六平均收付量和周日平均收付量均以预设平均收付量划分为不同区间,以标记多个原始ATM设备归属的不同ATM大类。
[0028]根据本公开的实施例,聚类处理包括:
[0029]对经过分类筛选的基础数据宽表进行特征工程处理,生成对ATM大类分类有影响的多维特征数据;
[0030]根据多维特征数据,采用K

means算法对归属不同ATM大类的基础数据宽表进行聚类处理,得到每个原始ATM设备在ATM大类下的ATM小类。
[0031]根据本公开的实施例,特征工程处理包括以下之中的至少一种:
[0032]特征构建、特征选择、特征提取和归一化处理。
[0033]根据本公开的实施例,多维特征数据包括:
[0034]ATM所属网点类型、所属网点层级、ATM设备类型、ATM钞箱容量、所属区域类型、每日历史平均现金收付量、ATM所在城市经济类型、ATM城市人口规模类型、ATM部署地点类型、ATM周边环境人流密度分类、ATM周边区域类型、预设周边公里ATM数量、预设周边公里ATM平均流量、预设周边公里网点数量和预设周边公里网点规模类型。
[0035]根据本公开的实施例,历史交易数据包括以下之中的至少一种:
[0036]ATM设备近三年历史流水记录、所属分行的发薪日和还款日数据、法定节假日以及天气数据。
[0037]根据本公开的实施例,使用ATM小类集合数据作为训练数据集来训练预设算法模型之前,还包括:
[0038]对ATM小类集合数据进行数据清洗。
[0039]根据本公开的实施例,使用ATM小类集合数据作为训练数据集来训练预设算法模型,包括:
[0040]按照ATM小类,从ATM小类集合数据提取与现金流预测有关的业务数据,作为ATM设备特征数据;
[0041]将ATM设备特征数据输入预设算法模型进行模型训练。
[0042]根据本公开的实施例,预设算法模型包括K近邻回归算法模型、随机森林回归算法模型、XGBoost回归算法模型、长短期记忆网络算法模型和Deep Forest深度森林算法模型中的至少一种。
[0043]根据本公开的实施例,预设算法模型包括单一算法模型或动态加权组合算法模型;
[0044]其中,动态加权组合算法模型是根据至少两个单一算法模型在训练数据集上的预测结果,动态生成每个单本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种ATM现金流预测模型的训练方法,包括:获取多个原始ATM设备的基础数据,所述基础数据包括业务属性数据、部署环境属性数据和时空关联属性数据,对所述基础数据进行数据清洗和聚合,生成以每个原始ATM设备为中心的基础数据宽表;根据预设分类规则,对所述基础数据宽表进行分类筛选和聚类处理,得到每个原始ATM设备归属的ATM大类和ATM大类下的ATM小类;获取归属同一所述ATM小类下的至少一个原始ATM设备的历史交易数据,形成ATM小类集合数据;使用所述ATM小类集合数据作为训练数据集来训练预设算法模型,得到训练好的ATM现金流预测模型。2.根据权利要求1所述的方法,其中,所述业务属性数据包括ATM所属网点类型、所属网点层级、ATM设备类型、ATM钞箱容量、所属线路、所属区域和每日历史平均现金收付量中的至少一种;所述部署环境属性数据包括ATM所在城市经济类型、ATM城市人口规模类型、ATM部署位置坐标、ATM部署地点类型、ATM周边区域类型和ATM周边环境人流密度分类中的至少一种;所述时空关联属性数据包括相同地点ATM设备数量、相同地点ATM设备平均流量、附近ATM设备数量、附近ATM平均流量、ATM周边网点数量和ATM周边网点规模类型中的至少一种。3.根据权利要求1所述的方法,其中,所述数据清洗包括:剔除所述基础数据宽表中的重复数据;和/或修复所述基础数据宽表中的缺失数据、异常数据和离群数据。4.根据权利要求3所述的方法,其中,所述修复所述基础数据宽表中的缺失数据、异常数据和离群数据包括以下之中的至少一种:采用近四周均值或中位数来填充所述缺失数据;根据正态分布3σ原则,将三倍于所述基础数据宽表的标准差的数据视为噪声数据,采用Smooth Data函数对所述噪声数据进行平滑处理;通过箱线图的上下边缘来确定离群数据,采用前后四周相同星期平均值填充方式来填充所述离群数据。5.根据权利要求1所述的方法,其中,所述预设分类规则包括:若多个原始ATM设备的部署位置相同,则标记所述原始ATM设备归属相同的ATM大类和ATM小类,所述聚类处理结束;根据ATM设备类型、ATM历史平均收付量、工作日平均收付量、周六平均收付量和周日平均收付量,标记每个原始ATM设备归属的ATM大类。6.根据权利要求5所述的方法,其中,所述预设分类规则还包括:按顺序生成ATM大类和ATM大类下的ATM小类编号;已标记了ATM小类的原始ATM设备,则所述聚类处理结束。7.根据权利要求5所述的方法,其中,所述ATM历史平均收付量、工作日平均收付量、周六平均收付量和周日平均收付量均以预设平均收付量划分为不同区间,以标记多个原始ATM设备归属的不同ATM大类。8.根据权利要求1所述的方法,其中,所述聚类处理包括:
对经过分类筛选的基础数据宽表进行特征工程处理,生成对ATM大类分类有影响的多维特征数据;根据所述多维特征数据,采用K

means算法对归属不同ATM大类的基础数据宽表进行聚类处理,得到每个原始ATM设备在ATM大类下的ATM小类。9.根据权利要求8所述的方法,其中,所述特征工程处理包括以下之中的至少一种:特征构建、特征选择、特征提取和归一化处理。10.根据权利要求8所述的方法,其中,所述多维特征数据包括:ATM所属网点类型、所属网点层级、ATM设备类型、ATM钞箱容量、...

【专利技术属性】
技术研发人员:蔡为彬左金柱卢业郑广斌
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1