【技术实现步骤摘要】
一种基于动态序列规整的异常交易行为识别方法及系统
[0001]本专利技术涉及计算机
,尤其涉及一种基于动态序列规整的异常交易行为识别方法及系统。
技术介绍
[0002]异常交易识别最主要的挑战在于复杂性和多样性,所谓复杂性在于异常交易通常包括一系列不同的交易目的和交易手段;所谓多样性表现在多卡片、多地区、多机构之间并发或继发的多样性,银行作为其中的一个环节,并不能以上帝视角来通观全局。
[0003]目前针对金融业客户交易行为模式分析识别的方式,主要包括时序识别技术、特征挖掘技术和经验规则技术,各项技术均有其无法克服的局限性:
[0004]1.时序识别技术:针对基于时序的异常行为识别所带来的局限性表现在异常交易往往穿插在正常交易之间,而往往专用于不正当行为的某些账户或卡片偶尔也可能会用于日常生活消费。在实际应用中,基于时序并不能很好的识别出应当识别出的可疑行为,甚至还会出现较多的错报和误报,带来一系列不必要的困扰。
[0005]2.特征挖掘技术:目前而言,较为优秀的模态识别方法就是基于无监督的聚类方式,但是目前市面上所采用的基于数据挖掘和特征工程的行为指标构建方式,一方面将带来巨大的工作量和数据量,导致工程的复杂和繁琐;另一方面漫无目的的挖掘并非一定能挖掘出最为核心关键的异常交易行为指标,造成大量无用功,效率低下。
[0006]3.经验规则技术:针对基于现有标签或专家经验规则来推断可疑交易行为模态,缺点是无法在复杂多样的未知模态中进行区分,从而带来更多的漏报。针对电话诈骗、恐怖融资
【技术保护点】
【技术特征摘要】
1.一种基于动态序列规整的异常交易行为识别方法,其特征在于,包括:步骤S1、获取用户基础交易数据;步骤S2、将交易数据进行分类,根据实际业务需求划分为二维序列数据集,其中,交易时间为横轴,交易金额为纵轴;步骤S3、对时域数据进行预处理,根据实际业务需求,所述预处理包括交易金额分桶、交易金额平滑、交易金额标准化、交易时间序列填充、时间指数衰减中的任意处理模块组合;步骤S4、通过傅里叶变化或数值计数变化将交易行为从时域映射到频域;步骤S5、根据实际业务需求将频域数据进行预处理,形成用户二维序列数据集;步骤S6、构建二维核序列,通过动态序列规整算法计算所有用户行为数据之间聚类,得出用户标签数据;步骤S7、对用户标签数据进行抽样判断,确定用户标签数据是否为异常交易行为。2.如权利要求1所述的方法,其特征在于,所述步骤S1中,所述用户基础交易数据包括交易时间、交易金额、收付标志、交易对手,其中,过滤掉金融理财保险交税类型的交易以及非主动交易类型的交易。3.如权利要求1所述的方法,其特征在于,所述步骤S2中,将交易数据划分为贷方和借方,贷方的交易金额设置为正值,借方的交易金额设置为负值,以交易时间为横轴,交易金额为纵轴,将贷方和借方的数据形成二维序列数据集。4.如权利要求1所述的方法,其特征在于,所述步骤S3中,所述预处理包括:交易金额分桶,包括对于交易金额[M0,M1,M2...,M
i
‑1,M
i
],设置分桶区间[N0,N1,N2,...,N
n
‑1,N
n
],对于任意交易金额M
k
,如果M
k
属于(N
n
‑1,N
n
]区间,则M
k
分桶取值为N
n
‑1,其中M、N、i、n为任意实数,且N0≤M0≤M
i
≤N
n
;交易金额平滑,包括对于交易金额[M0,M1,M2,...,M
i
‑1,M
i
],有交易时间[T0,T1,T2...,T
i
‑1,T
i
],对于任意交易(M
k
,T
k
),取[(M
k
‑1,T
k
‑1)、(M
k
,T
k
)、(M
k+1
,T
k+1
)],则M
k
平滑后的交易金额M
k
=(M
k
‑1+M
k
+M
k+1
)/3,其中,M、i为任意实数,T为任意时间维度;交易金额标准化,包括对于交易金额[M0,M1,M2,...,M
i
‑1,M
i
],有标准差Std和平均值Mean,对于任意M
k
,则有标准化后金额M
k
=(M
k
‑
Mean)/Std;交易时间序列填充,包括对交易金额按照时间粒度T进行分组求和,其中,对于缺失时间粒度的交易金额填充为0,T包括年、月、日、小时、分钟;时间指数衰减,包括以分析统计时间为起始时间T0,对于起始时间前T
n
个时间单位记作T0‑
T
n
,对于T0的衰减率记作N0,到达T0‑
T
n
时刻衰减率记作N
n
,其中,N0≥N
n
,Bias为起始时间后开始衰减的位置,通过以下公式解出参数:后开始衰减的位置,通过以下公式解出参数:计算T
t
时段指数衰减比例N
t...
【专利技术属性】
技术研发人员:钟俊菘,
申请(专利权)人:中信银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。