交易异常值检测方法及装置制造方法及图纸

技术编号:36090969 阅读:17 留言:0更新日期:2022-12-24 11:07
本发明专利技术公开了交易异常值检测方法及装置,可用于人工智能技术领域,方法包括:获取历史用户交易数据;根据过滤后的历史用户交易数据构建原始时间序列;将原始时间序列作为样本数据,构建训练集;利用训练集对长短期记忆网络自编码器模型进行训练,根据训练好的长短期记忆网络自编码器模型确定训练集对应的重建时间序列;将待测用户交易数据输入至训练好的长短期记忆网络自编码器模型,得到待测用户交易数据对应的重建时间序列;根据待测用户交易数据对应的重建时间序列及误差阈值确定待测用户交易数据是否异常。本发明专利技术通过采用长短期记忆网络自编码器模型实现了实时判断用户交易数据是否异常,提高了交易异常值检测准确率及效率。效率。效率。

【技术实现步骤摘要】
交易异常值检测方法及装置


[0001]本专利技术涉及人工智能
,尤其涉及交易异常值检测方法及装置。

技术介绍

[0002]异常检测是目前时序数据分析最成熟的应用之一,指从正常的时间序列中识别不正常的事件或行为的过程。有效的异常检测被广泛用于多个领域,例如量化交易。
[0003]目前异常值检测领域的常用方法是利用可视化图像比如箱线图;利用指标值比如百分比法、均方差。这些方法直接用于对时间序列类型的数据进行检测,存在检测结果不准确、直接使用效果不好、没有充分利用时序信息、无法及时发现异常等问题。
[0004]综上,亟需一种交易异常值检测方法,用于解决上述现有技术存在的问题。

技术实现思路

[0005]本专利技术实施例提供一种交易异常值检测方法,用以提高交易异常值检测准确率及效率,该方法包括:
[0006]获取历史用户交易数据;
[0007]滤除历史用户交易数据中的异常数据;
[0008]根据过滤后的历史用户交易数据构建原始时间序列;
[0009]将原始时间序列作为样本数据,构建训练集;
[0010]利用训练集对长短期记忆网络自编码器模型进行训练,得到训练好的长短期记忆网络自编码器模型;
[0011]根据训练好的长短期记忆网络自编码器模型确定训练集对应的重建时间序列;
[0012]根据重建时间序列及原始时间序列确定误差阈值;
[0013]将待测用户交易数据输入至训练好的长短期记忆网络自编码器模型,得到待测用户交易数据对应的重建时间序列;
[0014]根据待测用户交易数据对应的重建时间序列及误差阈值确定待测用户交易数据是否异常。
[0015]本专利技术实施例还提供一种交易异常值检测装置,用以提高交易异常值检测准确率及效率,该装置包括:
[0016]模型训练模块,用于获取历史用户交易数据;滤除历史用户交易数据中的异常数据;根据过滤后的历史用户交易数据构建原始时间序列;将原始时间序列作为样本数据,构建训练集;利用训练集对长短期记忆网络自编码器模型进行训练,得到训练好的长短期记忆网络自编码器模型;
[0017]异常值检测模块,用于根据训练好的长短期记忆网络自编码器模型确定训练集对应的重建时间序列;根据重建时间序列及原始时间序列确定误差阈值;将待测用户交易数据输入至训练好的长短期记忆网络自编码器模型,得到待测用户交易数据对应的重建时间序列;根据待测用户交易数据对应的重建时间序列及误差阈值确定待测用户交易数据是否
异常。
[0018]本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述交易异常值检测方法。
[0019]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述交易异常值检测方法。
[0020]本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述交易异常值检测方法。
[0021]本专利技术实施例中,获取历史用户交易数据;滤除历史用户交易数据中的异常数据;根据过滤后的历史用户交易数据构建原始时间序列;将原始时间序列作为样本数据,构建训练集;利用训练集对长短期记忆网络自编码器模型进行训练,得到训练好的长短期记忆网络自编码器模型;根据训练好的长短期记忆网络自编码器模型确定训练集对应的重建时间序列;根据重建时间序列及原始时间序列确定误差阈值;将待测用户交易数据输入至训练好的长短期记忆网络自编码器模型,得到待测用户交易数据对应的重建时间序列;根据待测用户交易数据对应的重建时间序列及误差阈值确定待测用户交易数据是否异常,与现有技术相比,将原始时间序列作为样本数据,构建训练集,利用训练集对长短期记忆网络自编码器模型进行训练,根据训练好的长短期记忆网络自编码器模型确定训练集对应的重建时间序列,根据重建时间序列及原始时间序列确定误差阈值,充分利用时序信息,通过采用长短期记忆网络自编码器模型实现了实时判断用户交易数据是否异常,提高了交易异常值检测准确率及效率。
附图说明
[0022]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0023]图1为本专利技术提供的交易异常值检测方法的流程示意图;
[0024]图2为本专利技术提供的交易异常值检测方法的流程示意图;
[0025]图3为本专利技术提供的交易异常值检测方法的流程示意图;
[0026]图4为本专利技术提供的交易异常值检测方法的流程示意图;
[0027]图5为本专利技术提供的交易异常值检测装置的结构示意图。
具体实施方式
[0028]为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。
[0029]图1为本专利技术实施例提供的一种交易异常值检测方法所对应的流程示意图,如图1所示,该方法包括:
[0030]步骤101,获取历史用户交易数据。
[0031]步骤102,滤除历史用户交易数据中的异常数据。
[0032]本专利技术实施例中,对历史用户交易数据进行标注,以区分历史用户交易数据中的异常数据及非异常数据。
[0033]在一种可能的实施方式中,手动剔除异常数据。
[0034]步骤103,根据过滤后的历史用户交易数据构建原始时间序列。
[0035]步骤104,将原始时间序列作为样本数据,构建训练集。
[0036]本专利技术实施例中,将非异常数据分为训练集、验证集和测试集,将样本转换为二维张量。
[0037]步骤105,利用训练集对长短期记忆网络自编码器模型进行训练,得到训练好的长短期记忆网络自编码器模型。
[0038]本专利技术实施例中,将训练集通过长短期记忆网络自编码器模型传递,以使长短期记忆网络自编码器模型学习到数据中的特征。
[0039]步骤106,根据训练好的长短期记忆网络自编码器模型确定训练集对应的重建时间序列。
[0040]本专利技术实施例中,根据训练好的长短期记忆网络自编码器模型确定训练集对应的重建时间序列,通过几个长短期记忆网络LSTM层来捕获数据的时间依赖性。
[0041]步骤107,根据重建时间序列及原始时间序列确定误差阈值。
[0042]步骤108,将待测用户交易数据输入至训练好的长短期记忆网络自编码器模型,得到待测用户交易数据对应的重建时间序列。
[0043]步骤109,根据待测用户交易数据对应的重建时间序列及误差阈值确定待测用户交易数据是否异常。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种交易异常值检测方法,其特征在于,包括:获取历史用户交易数据;滤除历史用户交易数据中的异常数据;根据过滤后的历史用户交易数据构建原始时间序列;将原始时间序列作为样本数据,构建训练集;利用训练集对长短期记忆网络自编码器模型进行训练,得到训练好的长短期记忆网络自编码器模型;根据训练好的长短期记忆网络自编码器模型确定训练集对应的重建时间序列;根据重建时间序列及原始时间序列确定误差阈值;将待测用户交易数据输入至训练好的长短期记忆网络自编码器模型,得到待测用户交易数据对应的重建时间序列;根据待测用户交易数据对应的重建时间序列及误差阈值确定待测用户交易数据是否异常。2.如权利要求1所述的交易异常值检测方法,其特征在于,根据重建时间序列及原始时间序列确定误差阈值,包括:计算重建时间序列与原始时间序列之间的第一重建误差;根据第一重建误差确定误差阈值。3.如权利要求2所述的交易异常值检测方法,其特征在于,根据第一重建误差确定误差阈值,包括:根据预设的重建异常比率及第一重建误差确定误差阈值。4.如权利要求2所述的交易异常值检测方法,其特征在于,根据第一重建误差确定误差阈值,包括:根据第一重建误差生成分箱图;根据长尾效应及分箱图确定误差阈值。5.如权利要求2所述的交易异常值检测方法,其特征在于,根据待测用户交易数据对应的重建时间序列及误差阈值确定待测用户交易数据是否异常,包括:根据待测用户交易数据对应的重建时间序列确定待测用户交易数据对应的第二重建误差;在第二重建误差大于误差阈值时,待测用户交易数据异常。6.一种交易异常值检测装...

【专利技术属性】
技术研发人员:童楚婕
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1