System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及金融异常检测,特别涉及一种账户异常检测方法及系统。
技术介绍
1、银行交易可能面临各种欺诈形式。通过实时异常检测和分析交易数据,银行可以及时发现异常模式,从而降低欺诈风险。银行每天都会处理大量的交易数据,涉及到存款、提款、转账等多种操作,庞大的数据量使得手动检测异常几乎是不可能的事情,因此需要机器学习和人工智能算法来对大量交易数据中的正常行为模式进行建模,以实现自动化的异常检测。
2、但是,目前的时序异常检测模型均是基于时间间隔相同的时序数据的,并没有考虑到时序数据在时间上分布并不规则的这一特性。如果缺乏考虑这一问题会导致由于对时序依赖建模的偏差使得模型大量误抛和漏抛异常;此外,现有的时序异常检测模型都是基于单行为模式的假设,即所有账户的行为时间序列数据服从一个行为模式,而银行数据中大多数账户的行为模式是并不相同的,基于单行为模式对这些数据一起建模是并不科学的。再者,现有银行账户异常检测方法缺少考虑交易的对手账户、交易的经办人行为以及同期交易行为差别等要素,这些特征对于账户异常检测也是十分重要的,并不能忽视对它们的建模。
3、因此,有必要提供一种账户异常检测方法及系统,以实现对面向多行为模式的账户进行异常检测,并基于时序数据在时间上分布不规则建模,解决了现有技术中模型出现大量误抛和漏抛异常的问题。
技术实现思路
1、在本专利技术的目的在于提供一种账户异常检测方法及系统,以实现对面向多行为模式的账户进行异常检测,并基于时序数据在时间上分布不规则建
2、为了解决现有技术中存在的问题,本专利技术提供了一种账户异常检测方法,包括以下步骤:
3、s1:获取银行内部账户及所有内部账户所涉及的交易数据;
4、s2:根据所述交易数据,按照不同科目、不同分行以及不同账户类别并行提取d维特征,d为自然数;
5、s3:根据交易金额特征和交易频率特征,对内部账户进行聚类,以将内部账户划分到不同簇中,完成行为聚类,形成多种行为模式;
6、s41:对d维特征进行z-score标准化,以得到各内部账户针对各特征在任一时间点的行为数据;
7、s42:记录每个内部账户中行为数据的时间序列,对每个内部账户行为数据划分时间窗口,根据时间窗口形成内部账户行为数据的训练样本;
8、s43:根据不同行为模式建立不同训练模型,以得到不同行为模式下各内部账户任一时间点的行为数据的预测值,训练方式如下:其中,表示t-1时间点的记忆,其包含t-1时间点的信息和t-1时间点之前的长期与短期记忆,表示t-2时间点的记忆,表示时间衰减函数,表示任一内部账户在t-1时间点的行为数据,表示t-1时间点模型的隐藏状态,表示t-2时间点模型的隐藏状态, ,,,, 分别是遗忘门、输入门、输出门、候选门以及预测门的神经网络参数,是子空间分解参数,代表各内部账户任一时间点的行为数据的预测值;
9、s5:根据模型计算内部账户在对应时间点的行为数据的预测值;比对行为数据的预测值和s42中记录的时间序列的行为数据,根据比对结果得到异常的内部账户。
10、可选的,在所述账户异常检测方法中,
11、s1中,所有内部账户所涉及的交易数据包括银行服务器固定存储的最近一年的交易数据,所有内部账户所涉及的交易数据按固定频率更新。
12、可选的,在所述账户异常检测方法中,s2中,使用特征中位数填充缺失值。
13、可选的,在所述账户异常检测方法中,d维特征内包括对手账户类特征、经办人行为特征以及同期交易比较特征。
14、可选的,在所述账户异常检测方法中,s41中,对d维特征进行z-score标准化的方式如下:
15、;其中,t为时间点,i为特征,k为任一内部账户,为内部账户k在时间点t针对特征i的原始值,为特征i的均值,为特征i的标准差,表示特征i变换后的值,即内部账户k针对特征i在时间点t的行为数据。
16、可选的,在所述账户异常检测方法中,s42中,
17、时间序列如下:时间序列如下:
18、;其中,k为任一内部账户,为各内部账户中行为数据的时间序列,为内部账户k在时间点t的行为数据,,d为特征数量,为d维实数域;
19、训练样本如下:
20、其中,为根据时间窗口形成内部账户行为数据的训练样本,w为时间窗口。
21、可选的,在所述账户异常检测方法中,s5之前,还包括模型优化步骤,使用二范数衡量行为数据的预测值和s42中记录的时间序列的行为数据之间的差异,以优化模型,公式如下:其中,表示行为模式c的模型的训练损失函数,表示属于行为模式c的所有内部账户,表示内部账户的时间点,w为时间窗口长度,表示内部账户k在时间点t行为数据的预测值,表示s42中记录的时间序列中内部账户k在时间点t的行为数据,和均为d维向量。
22、可选的,在所述账户异常检测方法中,s5中,比对行为数据的预测值和s42中记录的时间序列的行为数据的方式如下:
23、其中,为内部账户k在时间点t的预测误差,d为特征集合,为内部账户k在时间点t的非空特征数量,表示s42中记录的时间序列中内部账户k针对特征i在时间点t的行为数据,表示内部账户k针对特征i在时间点t行为数据的预测值。
24、可选的,在所述账户异常检测方法中,s5中,根据比对结果得到异常的内部账户的方式如下:其中,为训练集中属于模式c的内部账户的预测误差中位数,为内部账户k在时间点t的异常分数;
25、计算所有内部账户每个时间点的异常分数,根据各内部账户每个时间点的异常分数的降序排序;
26、将排名前j位的内部账户时间点作为异常,j为自然数。
27、本专利技术还提供了一种账户异常检测系统,采用前述的账户异常检测方法,所述系统包括:
28、数据获取模块,配置为获取银行内部账户及所有内部账户所涉及的交易数据;
29、特征抽取模块,配置为根据所述交易数据,按照不同科目、不同分行以及不同账户类别并行提取d维特征,d为自然数;
30、行为聚类模块,配置为根据交易金额特征和交易频率特征,对内部账户进行聚类,以将内部账户划分到不同簇中,完成行为聚类,形成多种行为模式;
31、时序建模模块,配置为对d维特征进行z-score标准化,以得到各内部账户针对各特征在任一时间点的行为数据;并记录每个内部账户中行为数据的时间序列,对每个内部账户行为数据划分时间窗口,根据时间窗口形成内部账户行为数据的训练样本;
32、还配置为根据不同行为模式建立不同训练模型,以得到不同行为模式下各内部账户任一时间点的行为数据的预测值,训练方式如下:其中,表示t-1时间点的记忆,其包含t-1时间点的信息和t-1时间点之前的长期与短期记忆,表示t-2时间点的记忆,表示时间衰减函数,表示任本文档来自技高网...
【技术保护点】
1.一种账户异常检测方法,其特征在于,包括以下步骤:
2.如权利要求1所述的账户异常检测方法,其特征在于,
3.如权利要求1所述的账户异常检测方法,其特征在于,S2中,使用特征中位数填充缺失值。
4.如权利要求1所述的账户异常检测方法,其特征在于,d维特征内包括对手账户类特征、经办人行为特征以及同期交易比较特征。
5.如权利要求1所述的账户异常检测方法,其特征在于,S41中,对d维特征进行z-score标准化的方式如下:
6.如权利要求5所述的账户异常检测方法,其特征在于,S42中,
7.如权利要求6所述的账户异常检测方法,其特征在于,S5之前,还包括模型优化步骤,使用二范数衡量行为数据的预测值和S42中记录的时间序列的行为数据之间的差异,以优化模型,公式如下:
8.如权利要求6所述的账户异常检测方法,其特征在于,S5中,比对行为数据的预测值和S42中记录的时间序列的行为数据的方式如下:
9.如权利要求8所述的账户异常检测方法,其特征在于,S5中,根据比对结果得到异常的内部账户的方式如
10.一种账户异常检测系统,其特征在于,采用如权利要求1-9中任一项所述的账户异常检测方法,所述系统包括:
...【技术特征摘要】
1.一种账户异常检测方法,其特征在于,包括以下步骤:
2.如权利要求1所述的账户异常检测方法,其特征在于,
3.如权利要求1所述的账户异常检测方法,其特征在于,s2中,使用特征中位数填充缺失值。
4.如权利要求1所述的账户异常检测方法,其特征在于,d维特征内包括对手账户类特征、经办人行为特征以及同期交易比较特征。
5.如权利要求1所述的账户异常检测方法,其特征在于,s41中,对d维特征进行z-score标准化的方式如下:
6.如权利要求5所述的账户异常检测方法,其特征在于,s42中,
【专利技术属性】
技术研发人员:张博宇,李晓珺,周昉,程璐,何泽伟,周晨沂,刁磊,
申请(专利权)人:上海银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。