一种下单异常检测方法技术

技术编号:33378341 阅读:21 留言:0更新日期:2022-05-11 22:46
本发明专利技术公开了下单异常检测方法,属于下单异常检测技术领域,要解决的技术问题为如何快速准确的识别下单状况异常。包括如下步骤:对于待检测的下单数据,按照时间对数据包进行排序,得到数值序列形式的长序列包;对于长序列包,通过设置的滑动窗口提取具有一定长度的子序列;基于小波分析对每个滑动窗口内子序列进行不同尺度的能量特征提取,并将能量特征融合为最终特征;通过训练后检测模型对最终特征进行分析,得到检测结果,所述训练后检测模型用于通过均值漂移聚类对最终特征进行学习。于通过均值漂移聚类对最终特征进行学习。于通过均值漂移聚类对最终特征进行学习。

【技术实现步骤摘要】
一种下单异常检测方法


[0001]本专利技术涉及下单异常检测
,具体地说是下单异常检测方法。

技术介绍

[0002]目前运单的管理通常采用线上管理,在线上运单管理系统中,有时候会存在被攻击,从而产生无效下单或下单阻塞的情况。
[0003]如何快速准确的识别下单状况异常,是需要解决的技术问题。

技术实现思路

[0004]本专利技术的技术任务是针对以上不足,提供下单异常检测方法,来解决如何快速准确的识别下单状况异常的技术问题。
[0005]第一方面,本专利技术的下单异常检测方法,基于小波分析对下单数据数据进行特征提取,通过均值漂移聚类对异常下单进行学习,并对在线的下单数据进行异常识别,所述方法包括如下步骤:
[0006]对于待检测的下单数据,按照时间对数据包进行排序,得到数值序列形式的长序列包;
[0007]对于长序列包,通过设置的滑动窗口提取具有一定长度的子序列;
[0008]基于小波分析对每个滑动窗口内子序列进行不同尺度的能量特征提取,并将能量特征融合为最终特征;
[0009]通过训练后检测模型对最终特征进行分析,得到检测结果,所述训练后检测模型用于通过均值漂移聚类对最终特征进行学习。
[0010]作为优选,通过如下步骤构建并训练检测模型,得到训练后检测模型:
[0011]获取历史下单数据作为训练集,对于训练集,按照时间对数据包进行排序,得到数值序列形式的长序列包;
[0012]对于长序列包,通过设置的滑动窗口提取具有一定长度的子序列;
[0013]基于小波分析对每个滑动窗口内子序列进行不同尺度的能量特征提取,并将能量特征融合为最终特征;
[0014]基于均值漂移聚类方法构建检测模型,将所述最终特征输入所述检测模型进行模型训练,得到训练后检测模型。
[0015]作为优选,构建并训练检测模型,得到训练后检测模型后,还包括对训练后测试模型进行模型测试,所述模型测试包括如下步骤:
[0016]获取历史下单数据作为测试集,对于测试集,按照时间对数据包进行排序,得到数值序列形式的长序列包;
[0017]对于长序列包,通过设置的滑动窗口提取具有一定长度的子序列;
[0018]基于小波分析对每个滑动窗口内子序列进行不同尺度的能量特征提取,并将能量特征融合为最终特征;
[0019]将所述最终特征输入所述训练后检测模型,得到的检测结果作为预测检测结果,并将所述预测检测结果与所述历史下单数据对应的现实检测结果进行比对,实现对训练后检测模型的测试。
[0020]作为优选,所述长序列包[序号,包长]形式的数值序列。
[0021]作为优选,对于长序列包,每个窗口内的数据包均作为一个单位数据流,基于小波分析对单位数据流进行特征提取,得到频域特征和时域特征,所述频域特征包括高频分量频域特征和低频分量频域特征,低频分量频域特征用于分析下单异常的整体特征,高频分量频域特征用于区分不同种类下单异常;
[0022]对于频域特征,分别对高频分量频域特征和低频分量频域特征进行层数分解,计算高频分量频域特征各层能量在总能量中的占比,得到高频分量频域特征的能量比,并计算低频分量频域特征各层能量在总能量中的占比,得到低频分量频域特征的能量比;
[0023]对于时域特征,提取均值和标准差;
[0024]所述频域特征相关的能量比以及所述时域特征相关的均值和标准差均为能量特征,将所述能量特征进行融合,得到最终特征。
[0025]作为优选,基于小波分析分解高频分量频域特征时,当高频分量频域特征仅包含单个样本时分解就可以停止,分解低频分量频域特征时,待低频分量的波形没有变化即可停止分解。
[0026]本专利技术的下单异常检测方法及检测系统具有以下优点:对于复杂的下单数据数据,采用小波分析进行特征抽取,既能够很好地表征时域和频域的局部特征,有效的分析出时域和频域上异常信号;又能做到快速计算,节省检测时间;利用均值漂移聚类对下单数据进行进一步的检测,对于数据较少而无法精确学习到异常数据特点,且异常类别无法确定时,均值漂移聚类能够在不明确有多少种异常情况种类的条件下对数据进行划分。
附图说明
[0027]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0028]下面结合附图对本专利技术进一步说明。
[0029]图1为实施例1下单异常检测方法的流程框图。
具体实施方式
[0030]下面结合附图和具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定,在不冲突的情况下,本专利技术实施例以及实施例中的技术特征可以相互结合。
[0031]本专利技术实施例提供下单异常检测方法,用于解决如何快速准确的识别下单状况异常的技术问题。
[0032]本专利技术下单异常检测方法,基于小波分析对下单数据数据进行特征提取,通过均值漂移聚类对异常下单进行学习,并对在线的下单数据进行异常识别,该方法包括如下步
骤:
[0033]S100、对于待检测的下单数据,按照时间对数据包进行排序,得到数值序列形式的长序列包;
[0034]S200、对于长序列包,通过设置的滑动窗口提取具有一定长度的子序列;
[0035]S300、基于小波分析对每个滑动窗口内子序列进行不同尺度的能量特征提取,并将能量特征融合为最终特征;
[0036]S400、通过训练后检测模型对最终特征进行分析,得到检测结果,所述训练后检测模型用于通过均值漂移聚类对最终特征进行学习。
[0037]本实施例步骤S100中将获得的下单数据按照发生的时间顺序对数据包从1开始编号,形成[序号,包长]形式的数值序列。
[0038]为了提取到足够多的特征,步骤S200根据数据包包长周期设置滑动时间窗口大小和一定的步长划定子序列。
[0039]每个窗口内的数据包都看成一个单位数据流。步骤S300利用小波分析对单位数据流进行特征抽取。
[0040]步骤S300中每个窗口内的数据包均作为一个单位数据流,基于小波分析对单位数据流进行特征提取,得到频域特征和时域特征,该频域特征包括高频分量频域特征和低频分量频域特征,分解的低频分量包含信号特征,提取低频特征可以分析下单异常的整体特征;高频成分反映细节或信号的差异,提取高频特征用来区分不同种类下单异常。
[0041]对于时域特征,提取时域中的均值和标准差,上述频域特征对应的能量比以及时域特征对应的均差和标准差作为能量特征,将能量特征融合为最终特征,送入训练后检测模型进行学习。
[0042]检测模型是基于均值漂移聚类方法构建的,均值漂移聚类的主要思想是基于滑动窗口的算法,来找到数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种下单异常检测方法,其特征在于,基于小波分析对下单数据数据进行特征提取,通过均值漂移聚类对异常下单进行学习,并对在线的下单数据进行异常识别,所述方法包括如下步骤:对于待检测的下单数据,按照时间对数据包进行排序,得到数值序列形式的长序列包;对于长序列包,通过设置的滑动窗口提取具有一定长度的子序列;基于小波分析对每个滑动窗口内子序列进行不同尺度的能量特征提取,并将能量特征融合为最终特征;通过训练后检测模型对最终特征进行分析,得到检测结果,所述训练后检测模型用于通过均值漂移聚类对最终特征进行学习。2.根据权利要求1所述的下单异常检测方法,其特征在于通过如下步骤构建并训练检测模型,得到训练后检测模型:获取历史下单数据作为训练集,对于训练集,按照时间对数据包进行排序,得到数值序列形式的长序列包;对于长序列包,通过设置的滑动窗口提取具有一定长度的子序列;基于小波分析对每个滑动窗口内子序列进行不同尺度的能量特征提取,并将能量特征融合为最终特征;基于均值漂移聚类方法构建检测模型,将所述最终特征输入所述检测模型进行模型训练,得到训练后检测模型。3.根据权利要求2所述的下单异常检测方法,其特征在于构建并训练检测模型,得到训练后检测模型后,还包括对训练后测试模型进行模型测试,所述模型测试包括如下步骤:获取历史下单数据作为测试集,对于测试集,按照时间对数据包进行排序,得到数值序列形式的长序列包;对于长序列包,通过设置的滑动窗口提取具有一定长度的子序列;基于小波分析对每个滑动窗口内子序列...

【专利技术属性】
技术研发人员:李慧
申请(专利权)人:安徽运通达物流科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1