基于聚类算法和回声状态网络的异常消费行为检测方法技术

技术编号：16472170 阅读：74 留言：0更新日期：2017-10-28 23:51

本发明专利技术涉及一种基于动态时间规整和回声状态网络时间序列预测的一卡通数据异常检测方法，通过加入基于动态时间规整的相关序列作为回声状态的输入序列，克服一卡通数据的随机噪声，提高回声状态网络预测的准确性，最终提高异常检测的准确度。

Detection method of abnormal consumer behavior based on clustering algorithm and echo state network

The invention relates to a method of anomaly detection card data dynamic time warping and echo state network time series prediction based on sequence by adding the relevant dynamic time warping based on echo state as input sequence, random noise card data to overcome, to improve the accuracy of echo state network prediction, and ultimately improve the accuracy of anomaly detection.

全部详细技术资料下载

【技术实现步骤摘要】
基于聚类算法和回声状态网络的异常消费行为检测方法
本专利技术涉及信息
，具体的说是一种基于聚类算法和回声状态网络的异常消费行为检测方法。
技术介绍
随着高校数字化和信息化的深入发展，校园一卡通得到了广泛的使用。一卡通中存储了大量的学生消费记录信息，从中挖掘有价值的信息对学生行为进行分析，极大地推动了学生管理工作的高效运行。目前基于一卡通数据的分析非常广泛，如通过校园一卡通数据研究学生校内的学习、消费及作息行为特点；通过对一卡通消费数据执行聚类算法，分析一卡通消费和学习成绩之间的关系；还有基于一卡通消费数据的异常检测。从经济的角度来讲，异常消费行为检测不仅可以为学生提供贴心的金融服务，也可以及早地发现学生的异常消费行为，对学生实施相应的支持和帮助。早期的异常检测方法主要是基于统计、遗传算法和神经网络的方法，但是这些方法没有利用时间序列的时间依赖性，异常检测性能受限。实际消费数据通常存在随机噪声，常规基于预测的异常检测方法存在训练误差很低、测试误差很高的过拟合问题。针对预测算法输入输出中存在的过拟合问题，目前常用的方法是正则化及后验贝叶斯概率方法，但是受限于训练数据本身的随机噪声影响，这些方法获得的估计精度有限。
技术实现思路
针对上述现有基于预测的异常检测中存在的过拟合等问题，本专利技术提供一种基于聚类算法和回声状态网络预测的异常消费行为检测方法。为解决上述技术问题，本专利技术采用的技术方案为：一种基于聚类算法和回声状态网络的异常消费行为检测方法，包括以下步骤：步骤一：确定相关时间序列采集范围、数据预处理和异常数据初步检测；步骤二：相关时间序列搜索，待训练...

【技术保护点】
一种基于聚类算法和回声状态网络的异常消费行为检测方法，其特征在于，包括以下步骤：步骤一：确定相关时间序列采集范围、数据预处理和异常数据初步检测；步骤二：相关时间序列搜索，待训练时间序列与每条可能与之相关的时间序列执行动态时间规整算法，其相关性判断采用如下公式：

【技术特征摘要】
1.一种基于聚类算法和回声状态网络的异常消费行为检测方法，其特征在于，包括以下步骤：步骤一：确定相关时间序列采集范围、数据预处理和异常数据初步检测；步骤二：相关时间序列搜索，待训练时间序列与每条可能与之相关的时间序列执行动态时间规整算法，其相关性判断采用如下公式：（1）其中T和R是两个长度分别为M和N的时间序列，有：wk为相邻矩阵元素的集合称为弯曲路径，其由距离相异矩阵A确定：式中A中的元素Aij为两个时间序列点ti和rj之间的欧几里得距离；设定相关性阈值Jthreshold，当JDTW(T,Rq)<Jthreshold,q=1,…,Q,称待训练数据与第q个时间序列为相关性序列，否则为不相关时间序列；其中Q是采集的时间序列个数；步骤三：将预处理后的输入序列和输出序列送入到回声状态网络，储蓄池回声状态向量x(t)和输出向量y(t)模型如下:（2）式中Win和Wx分别为输入权值矩阵和储备池连接权值矩阵，它们是已知的；Wout为储备池输出连接矩阵，是唯一由需要训练求解的参数；时刻储备池内部状态向量x(t)由当前输入uin(t)和上一时刻状态x(t-1)共同激发产生；输出权值使用最小二乘求解输出权值，表示为:（3）式中是X的伪拟；步骤四：下一时刻的时间序列预测通过下式获取所述预测数据：（4）其中，为第时刻输入值，为第时刻预测数据，为估计的输出权值矩阵；步骤五：使用回声状态网络估计的预测值，计算其和真实...

【专利技术属性】
技术研发人员：张各各，王辉，任宁宁，陈祥涛，周毅，
申请(专利权)人：河南科技大学，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人