一种异常数据识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号:37422875 阅读:20 留言:0更新日期:2023-04-30 09:44
本发明专利技术提供了一种异常数据识别方法、装置、设备及可读存储介质,所述方法包括:获取第一数据和第二数据,所述第一数据包括第一统计指标在当前时间段下的真实数值,所述第二数据包括所述第一统计指标在历史时间段下的真实数值;基于所述第二数据和autogression算法计算在当前时间段下所述第一统计指标所对应的残差;将所述残差输入残差序列图模型得到所述第一统计指标在下一时间段对应的预测均值和标准差;基于所述第一数据、所述预测均值和所述标准差判断所述第一数据是否异常。通过本发明专利技术中的方法,可以对客户的相关操作进行风险识别,并且可以及时识别出异常操作,进而可以排查出异常客户,降低银行的交易风险。降低银行的交易风险。降低银行的交易风险。

【技术实现步骤摘要】
一种异常数据识别方法、装置、设备及可读存储介质


[0001]本专利技术涉及数据处理
,具体而言,涉及一种异常数据识别方法、装置、设备及可读存储介质。

技术介绍

[0002]目前,在银行领域,客户因商业贸易,资产管理等原因,经常需要使用银行的渠道,向其他客户做转账,然而洗钱等金融犯罪,也会透过银行的渠道完成交易。为此银行有责任对通过银行渠道进行的金融交易进行风控,排查可疑客户以维护银行的行业形象。

技术实现思路

[0003]本专利技术的目的在于提供一种异常数据识别方法、装置、设备及可读存储介质,以改善上述问题。
[0004]为了实现上述目的,本申请实施例提供了如下技术方案:
[0005]一方面,本申请实施例提供了一种异常数据识别方法,所述方法包括:
[0006]获取第一数据和第二数据,所述第一数据包括第一统计指标在当前时间段下的真实数值,所述第二数据包括所述第一统计指标在历史时间段下的真实数值;
[0007]基于所述第二数据和autogression算法计算在当前时间段下所述第一统计指标所对应的残差;
[0008]将所述残差输入残差序列图模型得到所述第一统计指标在下一时间段对应的预测均值和标准差;
[0009]基于所述第一数据、所述预测均值和所述标准差判断所述第一数据是否异常。
[0010]第二方面,本申请实施例提供了一种异常数据识别装置,所述装置包括获取模块、第一计算模块、第二计算模块和判断模块。
[0011]获取模块,用于获取第一数据和第二数据,所述第一数据包括第一统计指标在当前时间段下的真实数值,所述第二数据包括所述第一统计指标在历史时间段下的真实数值;
[0012]第一计算模块,用于基于所述第二数据和autogression算法计算在当前时间段下所述第一统计指标所对应的残差;
[0013]第二计算模块,用于将所述残差输入残差序列图模型得到所述第一统计指标在下一时间段对应的预测均值和标准差;
[0014]判断模块,用于基于所述第一数据、所述预测均值和所述标准差判断所述第一数据是否异常。
[0015]第三方面,本申请实施例提供了一种异常数据识别设备,所述设备包括存储器和处理器。存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述异常数据识别方法的步骤。
[0016]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有
计算机程序,所述计算机程序被处理器执行时实现上述异常数据识别方法的步骤。
[0017]本专利技术的有益效果为:
[0018]1、通过本专利技术中的方法,可以对客户的相关操作进行风险识别,并且可以及时识别出异常操作,进而可以排查出异常客户,降低银行的交易风险。
[0019]2、本专利技术为了提高识别出来的异常数据的准确性,还会分析统计指标之间的紧密关系,查找到与其关系最紧密的统计指标后,根据关系最紧密的统计指标的真实数值就可以进一步的分析数据异常是否是其他统计指标引起的,进而最终得到数据异常到底是其他正常的操作引起的还是确实存在异常。
[0020]本专利技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术实施例了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0021]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0022]图1是本专利技术实施例中所述的异常数据识别方法流程示意图;
[0023]图2是本专利技术实施例中所述的异常数据识别装置结构示意图;
[0024]图3是本专利技术实施例中所述的异常数据识别设备结构示意图。
具体实施方式
[0025]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0026]应注意到:相似的标号或字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0027]实施例1
[0028]如图1所示,本实施例提供了一种异常数据识别方法,该方法包括步骤S1、步骤S2、步骤S3和步骤S4。
[0029]步骤S1、获取第一数据和第二数据,所述第一数据包括第一统计指标在当前时间段下的真实数值,所述第二数据包括所述第一统计指标在历史时间段下的真实数值;
[0030]步骤S2、基于所述第二数据和autogression算法计算在当前时间段下所述第一统计指标所对应的残差;
[0031]步骤S3、将所述残差输入残差序列图模型得到所述第一统计指标在下一时间段对应的预测均值和标准差;
[0032]步骤S4、基于所述第一数据、所述预测均值和所述标准差判断所述第一数据是否异常。
[0033]在本实施例中,第一统计指标在当前时间段下的真实数值可以理解为:例如,今天凌晨1点到2点的客户的鼠标点击次数;第一统计指标在历史时间段下的真实数值,可以理解为:例如,昨天凌晨1点到2点的客户的鼠标点击次数;其中,当前时间段与历史时间段之间的时间间隔可以根据用户需要进行自定义;其中,当前时间段与历史时间段之间的时间间隔与当前时间段与下一时间段之间的时间间隔相同;
[0034]在客户交易过程中,会产生一系列的时间序列,如鼠标点击事件时间序列,键盘敲击事件时间序列,短信沟通事件时间序列等。这些时间序列可以用来辅助判断客户的行为是否有异常,并在异常发生时提供预警。在本实施例中,第一统计指标在当前时间段下的真实数值,第一统计指标在历史时间段下的真实数值即为一些时间序列,通过本实施例中的方法,可以对客户的相关操作进行风险识别,并且可以及时识别出异常操作,进而可以排查出异常客户,降低银行的交易风险。
[0035]在本公开的一种具体实施方式中,所述步骤S2,还可以包括步骤S21和步骤S22。
[0036]步骤S21、将所述第二数据输入所述autogression算法中,计算得到所述第一统计指标在当前时间段下的预测数值;
[0037]步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常数据识别方法,其特征在于,包括:获取第一数据和第二数据,所述第一数据包括第一统计指标在当前时间段下的真实数值,所述第二数据包括所述第一统计指标在历史时间段下的真实数值;基于所述第二数据和autogression算法计算在当前时间段下所述第一统计指标所对应的残差;将所述残差输入残差序列图模型得到所述第一统计指标在下一时间段对应的预测均值和标准差;基于所述第一数据、所述预测均值和所述标准差判断所述第一数据是否异常。2.根据权利要去1所述的异常数据识别方法,其特征在于,所述基于所述第二数据和autogression算法计算在当前时间段下所述第一统计指标所对应的残差,包括:将所述第二数据输入所述autogression算法中,计算得到所述第一统计指标在当前时间段下的预测数值;将所述第一统计指标在当前时间段下的真实数值减去所述第一统计指标在当前时间段下的预测数值得到当前时间段所述第一统计指标所对应的残差。3.根据权利要去1所述的异常数据识别方法,其特征在于,所述残差序列图模型的构建方法,包括:将第一时间段各个统计指标对应的真实数值进行集合,得到第一集合,将第二时间段各个统计指标对应的真实数值进行集合,得到第二集合,所述第二时间段在所述第一时间段之后;将所述第一集合和所述第二集合中的真实数值按照相同的预设顺序进行排序后形成第一列向量和第二列向量;将所述第一列向量和所述第二列向量输入神经网络模型中,得到各个统计指标所对应的损失函数,将所有的所述损失函数进行平均计算,得到平均后的损失函数;使所述平均后的损失函数最小化,得到所述残差序列图模型。4.根据权利要去3所述的异常数据识别方法,其特征在于,所述基于所述第一数据、所述预测均值和所述标准差判断所述第一数据是否异常,包括:基于所述预测均值和所述标准差计算所述预测均值加上三个所述标准差的值,得到第一数值,计算所述预测均值减去三个所述标准差的值,得到第二数值;判断所述第一数据是否处于所述第一数值和所述第二数值所形成的数值范围内,若处于则所述第一数据的判断结果为正常,若不处于则所述第一数据的判断结果为异常。5.根据权利要去4所述的异常数据识别方法,其特征在于,所述第一数据的判断结果为异常后,还包括:根据使所述平均后的损失函数最小化后得到的时间序列连通矩阵,得到与所述第一统计指标关系最紧密的统计指标;基于与所述第一统计指标关系最紧密的统计指标在当前时间段下的真实数值分析所述第一数据异常的原因,得到异常分析结果。6.根据权利要去5所述的异常数据识别方法,其特征在于,所述根据使所述平均后的损失函数最小化后得到的时间序列连通矩阵,得到与所述第一统计指标关系最紧密的统计指标,包括:
将除开所述第一统计指标之外的其他统计指标记为第二统计指标;将所述第一统计指标在所述列向量中的排列序号记为N,将每个所述第二统计指标在所述列向量中的排列序号记为M,所述N和M均为正整数;在所述时间序列连通矩阵中查找位于第N行第M列位置的元素,并计算每个所述元素的绝对值;筛选出绝对值中的最大值,将所述最大值所对应的所述第二统计指标识别为与所述第一统计指标关系最紧密的统计指标。7.一种异常数据识别装置,其特征在于,包括:获取模块,用于获取第一数据和第二数据,所述第一数据包括第一统计指标在当前时间段下的真实数值,所述第二数据包括所述第一统计指标在历史时间段下的...

【专利技术属性】
技术研发人员:范相儒闭思泽冯瑜曹志远刘春邹双辉马楚芊刘明广郑聪
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1