基于事件序列频繁项集的异常交易行为分析方法和系统技术方案

技术编号:26793776 阅读:42 留言:0更新日期:2020-12-22 17:09
本发明专利技术公开了基于事件序列频繁项集的异常交易行为分析方法和系统,对客户可能存在的异常交易行为进行分析,达到动态异常交易行为监管的目的。其技术方案为:从行情数据和客户行为数据中抽取分析所需数据;对行情事件和客户行为事件进行定义,对行情数据切片处理,并将客户行为数据的时间线与切片后的行情数据对齐;对所有数据进行离散化处理,得到行情、客户行为事件序列;针对客户行为事件、离散化处理后的行情、客户行为事件序列,进行频繁序列模式挖掘,找到待检测客户的事件序列频繁项集;依据事件序列频繁项集,借助异常指数计算,获取疑似交易行为异常的客户;基于规则对异常客户行为识别分析,并经综合判断得出异常行为客户名单。

【技术实现步骤摘要】
基于事件序列频繁项集的异常交易行为分析方法和系统
本专利技术涉及异常交易分析技术,具体涉及一种基于事件序列频繁项集的异常交易行为分析方法和系统。
技术介绍
早在19世纪,异常识别就作为统计学领域当中重要的课题被提出和讨论。目前为止已有大量不同的技术方法被运用到不同领域的异常识别当中,以应对各领域相关问题。从所运用的技术种类来说,这些方法可以分为:基于统计学、监督型机器学习、非监督机器学习、信息论、图论、其他技术等,以及一些对以上技术方法综合运用的手段。从针对的问题范围和种类来说,既有普适异常发现问题,也有针对特定领域的比如网络攻击识别,信用安全检测,健康指标检测,社会学指标检测等等。随后这些技术被进一步改进和应用到各个研究领域和实践领域当中,包括金融经济领域,社会信用管理领域,军事领域等等,并在这些领域中取得了一定成效。由于异常本身的复杂性和检测技术所针对的场合和设计理念的差异,具体的正常行为模式和异常的判别依据又根据使用场合和面向方向不同可以有多种不同的具体定义方式。在经济金融领域,异常检测技术目前主要应用于:通过挖掘本文档来自技高网...

【技术保护点】
1.一种基于事件序列频繁项集的异常交易行为分析方法,其特征在于,方法包括:/n步骤1:从行情数据和客户行为数据中抽取分析所需数据;/n步骤2:对行情事件和客户行为事件进行定义,结合定义的数据字段进行特征选择,对行情数据进行切片处理,并将客户行为数据的时间线与切片后的行情数据对齐;/n步骤3:根据步骤2定义的行情事件和客户行为事件,对所有待检测数据进行离散化处理,得到行情、客户行为事件序列;/n步骤4:针对通过步骤2定义的客户行为事件、步骤3离散化处理后的行情、客户行为事件序列,进行频繁序列模式挖掘,找到待检测客户的事件序列频繁项集;/n步骤5:依据步骤4获得的事件序列频繁项集,借助异常指数计算...

【技术特征摘要】
1.一种基于事件序列频繁项集的异常交易行为分析方法,其特征在于,方法包括:
步骤1:从行情数据和客户行为数据中抽取分析所需数据;
步骤2:对行情事件和客户行为事件进行定义,结合定义的数据字段进行特征选择,对行情数据进行切片处理,并将客户行为数据的时间线与切片后的行情数据对齐;
步骤3:根据步骤2定义的行情事件和客户行为事件,对所有待检测数据进行离散化处理,得到行情、客户行为事件序列;
步骤4:针对通过步骤2定义的客户行为事件、步骤3离散化处理后的行情、客户行为事件序列,进行频繁序列模式挖掘,找到待检测客户的事件序列频繁项集;
步骤5:依据步骤4获得的事件序列频繁项集,借助异常指数计算,获取疑似交易行为异常的客户;
步骤6:基于规则对异常的客户行为识别分析,并结合步骤5获得的结果进行综合判断,得出异常行为客户名单。


2.根据权利要求1所述的基于事件序列频繁项集的异常交易行为分析方法,其特征在于,步骤1中对行情数据的处理进一步包括:通过对主力合约的计算和异常波动时段的选取,确定待检测的全量行情数据中后续步骤需要分析的交易时段;步骤1中对客户行为数据的处理进一步包括:先对客户的整体行为进行汇集,以建立对全量客户的分布特征的认识,再抽取依据行情数据筛选得到的异常波动时间段内有过交易行为的客户行为数据。


3.根据权利要求1所述的基于事件序列频繁项集的异常交易行为分析方法,其特征在于,步骤2中对行情数据的切片处理进一步包括:
依据日内交易时长,选取合适的切片大小;
定义行情事件,定义内容包括事件前缀、行情类别、振幅、主力委托方向、主力成交方向的属性,属性位数的长度和特征选择根据实际异常检测需求确定;
步骤2中对客户行为数据的切片对齐进一步包括:
根据行情数据的切片规则,对客户行为数据进行切片对齐;
分别对包括客户委单行为、客户撤单行为在内的客户行为事件进行定义,其中客户委单行为的定义内容包括事件前缀、属性、主力委单方向、委单量、价格偏差、价格偏差方向,客户撤单行为的定义内容包括事件前缀、属性、主力委单方向、价格偏差、价格偏差方向、时间偏差、撤单占比。


4.根据权利要求3所述的基于事件序列频繁项集的异常交易行为分析方法,其特征在于,步骤3进一步包括:
针对包括委单量、价格偏差、时间偏差及撤单占比在内的难以确定固定数量划分类别的数据,采用ChiMerge方法寻找分裂点并进行原始数据的离散化处理,以消除数值属性以及为数值属性定义准确的类别。


5.根据权利要求4所述的基于事件序列频繁项集的异常交易行为分析方法,其特征在于,步骤3的离散化处理中还通过采用分箱算法对连续数据进行离散化处理:区间内一致,区间之间差异显著的拆分。


6.根据权利要求5所述的基于事件序列频繁项集的异常交易行为分析方法,其特征在于,步骤4中的频繁序列模式挖掘是采用PrefixSpan算法实现。


7.根据权利要求6所述的基于事件序列频繁项集的异常交易行为分析方法,其特征在于,步骤5中的获取疑似交易行为异常的客户是通过自比和他比方法来实现,其中:
自比处理过程进一步包括:
考察在波动时间段内客户行为与其平时行为序列的异同;
计算波动时间段中客户行为与平时行为的最短距离作为其相似度,对相似度进行评估得到异常指数;
他比处理过程进一步包括:
考察在相同行情条件下各客户的行为模式,以及该客户与所有客户的行为模式相似情况;
计算被考察客户行为与波动中其他客户的事件序列频繁项集的最短距离,作为相似度进行评估得到异常指数。


8.根据权利要求7所述的基于事件序列频繁项集的异常交易行为分析方法,其特征在于,方法还包括:
步骤7:对根据步骤5、步骤6获得的异常行为客户名单进行可视化展示,以辅助业务人员判定是否确实异常。


9.一种基于事件序列频繁项集的异常交易行为分析系统,其特征在...

【专利技术属性】
技术研发人员:倪梦珺苗仲辰林越峰江航王晨宇高剑史光伟鲁继东童兰轩曹健
申请(专利权)人:上海金融期货信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1