一种数据检测方法及装置制造方法及图纸

技术编号:24852868 阅读:25 留言:0更新日期:2020-07-10 19:06
本申请涉及金融科技(Fintech)领域,公开了一种数据检测方法及装置,该方法包括:获取第一采样时间对应的第一交易量和所述第一采样时间之前的N个采样时间分别对应的N个第二交易量;根据选取的M个异常值判定方法和所述N个第二交易量,确定所述第一交易量对应的M个检测结果;根据预设的投票方法对所述M个检测结果进行投票,确定所述第一交易量对应的投票数;若所述第一交易量对应的投票数大于预设的票数阈值,则确定所述第一交易量异常。该方法通过实时调整第二交易量的数据范围,有助于提高对第一交易量的检测结果判定的准确性;以及根据多种异常值判定方法得到的检测结果和预设的投票方法,可实现准确判断第一交易量是否发生异常。

【技术实现步骤摘要】
一种数据检测方法及装置
本申请实施例涉及金融科技(Fintech)领域,尤其涉及一种数据检测方法及装置。
技术介绍
随着计算机技术的发展,越来越多的技术(例如:大数据、云计算或区块链)应用在金融领域,传统金融业正在逐步向金融科技转变,大数据技术也不例外。但由于金融、支付行业的安全性、实时性要求,也对大数据技术提出了更高的要求。对金融科技企业而言,维持金融系统服务的高可用性以及稳定性是至关重要的,直接关系到企业运营的效率及稳定性,甚至会影响整个金融行业的稳定。所以对金融系统服务的可用性及稳定性的监控和预警是非常重要的。由于金融系统服务的可用性及稳定性通常直接体现在数据上,因此对数据进行异常检测则是一个非常重要的手段。例如对于银行的交易系统,如果某时段系统稳定性降低,可能会直接导致交易成功率显著降低;或者,当有外部黑客攻击频繁发起交易请求时可能会影响系统的可用性,数据上直接的体现就是交易量迅速激增或者某个IP(InternetProtocol,网络之间互联的协议)地址下的交易请求量突增。所以可以通过数据异常检测来实时监控当前金融系统服务的可用性和稳定性,一旦检测出异常数据就会预警,让企业采取相应的措施。如何准确地发现异常数据,是亟需解决的问题。
技术实现思路
本申请提供一种数据检测方法及装置,用以实现准确判断交易数据是否发生异常。第一方面,本申请实施例提供一种数据检测方法,该方法包括:获取第一采样时间对应的第一交易量和所述第一采样时间之前的N个采样时间分别对应的N个第二交易量,N为大于1的整数;根据选取的M个异常值判定方法和所述N个第二交易量,确定所述第一交易量对应的M个检测结果,其中,一个异常值判定方法对应一个检测结果,M为大于1的整数;根据预设的投票方法对所述M个检测结果进行投票,确定所述第一交易量对应的投票数;若所述第一交易量对应的投票数大于预设的票数阈值,则确定所述第一交易量异常。基于该方案,针对每个异常值判定方法,根据N个第二交易量以确定第一交易量对应的检测结果;根据第一交易量在每个异常值判定方法下的检测结果和预设的投票方法以确定第一交易量对应的投票数;在确定投票数大于预设的票数阈值时,则确定第一交易量异常。该方案通过实时调整第二交易量的数据范围,有助于提高对第一交易量的检测结果判定的准确性;以及根据多种异常值判定方法得到的检测结果和预设的投票方法,可以实现准确判断第一交易量是否发生异常。在一种可能的实现方法中,所述根据预设的投票方法对所述M个检测结果进行投票,确定所述第一交易量对应的投票数,包括:根据所述投票方法对应的总票数和所述M个异常值判定方法分别对应的历史投票正确率,确定所述M个异常值判定方法分别对应的票数;根据所述M个异常值判定方法分别对应的票数和所述第一交易量对应的M个检测结果,确定所述第一交易量对应的投票数。基于该方案,通过对每个异常值判定方法分别对应的历史投票正确的次数的统计,则可以确定每个异常值判定方法分别对应的权重值;再结合投票方法对应的总票数,则可以确定每个异常值判定方法分别对应的票数;具体到确定第一交易量是否发生异常时,确定用每个异常值判定方法对第一交易量进行判断的检测结果,通过统计每个检测结果对应的票数值,则可以确定第一交易量对应的投票数。该方案通过结合多个异常值判定方法的历史投票情况,从而有助于确定每个异常值判定方法对于第一交易量是否发生异常作出判断的准确性,进一步地为不同的异常值判定方法赋予不尽相同的票数,使得后期可以更加合理地确定第一交易量是否发生异常。在一种可能的实现方法中,所述M个异常值判定方法包括拉依达准则;根据所述拉依达准则和所述N个第二交易量,确定所述第一交易量对应的检测结果,包括:确定所述N个第二交易量中的L个第二交易量,所述L个第二交易量与所述第一交易量对应的采样时间处于不同天的同一时段;确定所述L个第二交易量的均值和标准差;若所述第一交易量属于第一区间,则确定所述第一交易量正常,所述第一区间的下限为所述均值与所述标准差乘以预设的第一参数值的差值,所述第一区间的上限为所述均值与所述标准差乘以预设的第一参数值的和值。在一种可能的实现方法中,所述M个异常值判定方法包括图基准则;根据所述图基准则和所述N个第二交易量,确定所述第一交易量对应的检测结果,包括:确定所述N个第二交易量中的L个第二交易量,所述L个第二交易量与所述第一交易量对应的采样时间处于不同天的同一时段;确定所述L个第二交易量的四分之一分位数和四分之三分位数;若所述第一交易量属于第二区间,则确定所述第一交易量正常,所述第二区间的下限为所述四分之一分位数与四分位间距乘以预设的第二参数值的差值,所述第二区间的上限为所述四分之一分位数与所述四分位间距乘以预设的第二参数值的和值,所述四分位间距为所述四分之三分位数与所述四分之一分位数的差值。在一种可能实现的方法中,所述M个异常值判定方法包括环比准则;根据所述环比准则和所述N个第二交易量,确定所述第一交易量对应的检测结果,包括:确定所述第一交易量与第三交易量的第一比值,所述第三交易量为所述N个第二交易量中距离所述第一采样时间最近的交易量;若所述第一比值属于第三区间,则确定所述第一交易量正常;其中,所述第三区间是正常值区间。在一种可能实现的方法中,所述第三区间的下限为第一均值与第一标准差乘以预设的第三参数值的差值,所述第三区间的上限为所述第一均值与所述第一标准差乘以预设的第三参数值的和值,所述第一标准差和所述第一均值是根据所述N个交易量对应的N-1个比值确定的,所述N-1个比值包括所述N个交易量中每两个相邻交易量的比值;或者,其中,所述第三区间的下限为四分之一分位数与四分位间距乘以预设的第四参数值的差值,所述第三区间的上限为所述四分之一分位数与所述四分位间距乘以预设的第四参数值的和值,所述四分位间距为四分之三分位数与所述四分之一分位数的差值,所述四分之三分位数和所述四分之一分位数是根据所述N个交易量对应的N-1个比值确定的,所述N-1个比值包括所述N个交易量中每两个相邻交易量的比值。在一种可能实现的方法中,所述M个异常值判定方法包括同比准则;根据所述同比准则和所述N个第二交易量,确定所述第一交易量对应的检测结果,包括:确定所述第一交易量与所述N个第二交易量中的第四交易量的第二比值,所述第四交易量与所述第一交易量对应的采样时间处于不同天的同一时段;若所述第二比值属于第四区间,则确定所述第一交易量正常;其中,所述第四区间是正常值区间。在一种可能实现的方法中,所述第四区间的下限为第二均值与第二标准差乘以预设的第五参数值的差值,所述第四区间的上限为所述第二均值与所述第二标准差乘以预设的第五参数值的和值,所述第二标准差和所述第二均值是根据所述N个交易量对应的X个比值确定的,所述X个比值包括Y个交易量中每两个相邻交易量的比值,所述Y个交易量为所述N个交易量中处于不同天的同一时段的交易量;或者,其中,所述第四区间的下限为四分之一分位数与四分位间距乘以预设的第六参数值的差值,所述第四区间的上限为所述四分之一本文档来自技高网...

【技术保护点】
1.一种数据检测方法,其特征在于,包括:/n获取第一采样时间对应的第一交易量和所述第一采样时间之前的N个采样时间分别对应的N个第二交易量,N为大于1的整数;/n根据选取的M个异常值判定方法和所述N个第二交易量,确定所述第一交易量对应的M个检测结果,其中,一个异常值判定方法对应一个检测结果,M为大于1的整数;/n根据预设的投票方法对所述M个检测结果进行投票,确定所述第一交易量对应的投票数;/n若所述第一交易量对应的投票数大于预设的票数阈值,则确定所述第一交易量异常。/n

【技术特征摘要】
1.一种数据检测方法,其特征在于,包括:
获取第一采样时间对应的第一交易量和所述第一采样时间之前的N个采样时间分别对应的N个第二交易量,N为大于1的整数;
根据选取的M个异常值判定方法和所述N个第二交易量,确定所述第一交易量对应的M个检测结果,其中,一个异常值判定方法对应一个检测结果,M为大于1的整数;
根据预设的投票方法对所述M个检测结果进行投票,确定所述第一交易量对应的投票数;
若所述第一交易量对应的投票数大于预设的票数阈值,则确定所述第一交易量异常。


2.如权利要求1所述的方法,其特征在于,所述根据预设的投票方法对所述M个检测结果进行投票,确定所述第一交易量对应的投票数,包括:
根据所述投票方法对应的总票数和所述M个异常值判定方法分别对应的历史投票正确率,确定所述M个异常值判定方法分别对应的票数;
根据所述M个异常值判定方法分别对应的票数和所述第一交易量对应的M个检测结果,确定所述第一交易量对应的投票数。


3.如权利要求1或2所述的方法,其特征在于,所述M个异常值判定方法包括拉依达准则;
根据所述拉依达准则和所述N个第二交易量,确定所述第一交易量对应的检测结果,包括:
确定所述N个第二交易量中的L个第二交易量,所述L个第二交易量与所述第一交易量对应的采样时间处于不同天的同一时段;
确定所述L个第二交易量的均值和标准差;
若所述第一交易量属于第一区间,则确定所述第一交易量正常,所述第一区间的下限为所述均值与所述标准差乘以预设的第一参数值的差值,所述第一区间的上限为所述均值与所述标准差乘以预设的第一参数值的和值。


4.如权利要求1或2所述的方法,其特征在于,所述M个异常值判定方法包括图基准则;
根据所述图基准则和所述N个第二交易量,确定所述第一交易量对应的检测结果,包括:
确定所述N个第二交易量中的L个第二交易量,所述L个第二交易量与所述第一交易量对应的采样时间处于不同天的同一时段;
确定所述L个第二交易量的四分之一分位数和四分之三分位数;
若所述第一交易量属于第二区间,则确定所述第一交易量正常,所述第二区间的下限为所述四分之一分位数与四分位间距乘以预设的第二参数值的差值,所述第二区间的上限为所述四分之一分位数与所述四分位间距乘以预设的第二参数值的和值,所述四分位间距为所述四分之三分位数与所述四分之一分位数的差值。


5.如权利要求1或2所述的方法,其特征在于,所述M个异常值判定方法包括环比准则;
根据所述环比准则和所述N个第二交易量,确定所述第一交易量对应的检测结果,包括:
确定所述第一交易量与第三交易量的第一比值,所述第三交易量为所述N个第二交易量中距离所述第一采样时间最近的交易量;
若所述第一比值属于第三区间,则确定所述第一交易量正常;
其中,所述第三区间是正常值区间。


6.如权利要求5所述的方法,其特征在于,所述第三区间的下限为第一均值与第一标准差乘以预设的第三参数值的差值,所述第三区间的上限为所述第一均值与所述第一标准差乘以预设的第三参数值的和值,...

【专利技术属性】
技术研发人员:袁敏
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1