一种基于动态序列规整的异常交易行为识别方法及系统技术方案

技术编号:38399982 阅读:10 留言:0更新日期:2023-08-07 11:12
本发明专利技术涉及基于动态序列规整的异常交易行为识别方法,所述方法包括:获取用户基础交易数据;将交易数据进行分类,根据实际业务需求划分为二维序列数据集;对时域数据进行预处理,所述预处理包括交易金额分桶、交易金额平滑、交易金额标准化、交易时间序列填充、时间指数衰减中的任意处理模块组合;通过傅里叶变化或数值计数变化将交易行为从时域映射到频域;根据实际业务需求将频域数据进行预处理,形成用户二维序列数据集;构建二维核序列,通过动态序列规整算法计算所有用户行为数据之间聚类,得出用户标签数据;对用户标签数据进行抽样判断,确定用户标签数据是否为异常交易行为。该方法可提高对异常交易行为识别的效率和准确率。准确率。准确率。

【技术实现步骤摘要】
一种基于动态序列规整的异常交易行为识别方法及系统


[0001]本专利技术涉及计算机
,尤其涉及一种基于动态序列规整的异常交易行为识别方法及系统。

技术介绍

[0002]异常交易识别最主要的挑战在于复杂性和多样性,所谓复杂性在于异常交易通常包括一系列不同的交易目的和交易手段;所谓多样性表现在多卡片、多地区、多机构之间并发或继发的多样性,银行作为其中的一个环节,并不能以上帝视角来通观全局。
[0003]目前针对金融业客户交易行为模式分析识别的方式,主要包括时序识别技术、特征挖掘技术和经验规则技术,各项技术均有其无法克服的局限性:
[0004]1.时序识别技术:针对基于时序的异常行为识别所带来的局限性表现在异常交易往往穿插在正常交易之间,而往往专用于不正当行为的某些账户或卡片偶尔也可能会用于日常生活消费。在实际应用中,基于时序并不能很好的识别出应当识别出的可疑行为,甚至还会出现较多的错报和误报,带来一系列不必要的困扰。
[0005]2.特征挖掘技术:目前而言,较为优秀的模态识别方法就是基于无监督的聚类方式,但是目前市面上所采用的基于数据挖掘和特征工程的行为指标构建方式,一方面将带来巨大的工作量和数据量,导致工程的复杂和繁琐;另一方面漫无目的的挖掘并非一定能挖掘出最为核心关键的异常交易行为指标,造成大量无用功,效率低下。
[0006]3.经验规则技术:针对基于现有标签或专家经验规则来推断可疑交易行为模态,缺点是无法在复杂多样的未知模态中进行区分,从而带来更多的漏报。针对电话诈骗、恐怖融资、地下钱庄和行贿受贿等不同类型的犯罪,其交易模式、交易金额和交易频率通常呈现出不同的特征,这决定了很大一部分常规认知以外的异常交易行为模式无法以现有人工认知或者专家规则进行囊括,因此,基于现有行为标签形态的有监督的机器学习无法在此种条件下带来理想的效果。

技术实现思路

[0007]为解决现有技术的不足,本专利技术提出一种基于动态序列规整的异常交易行为识别方法及系统,提高对异常交易行为识别的效率和准确率。
[0008]为实现以上目的,本专利技术所采用的技术方案包括:
[0009]本专利技术第一方面公开了一种基于动态序列规整的异常交易行为识别方法,包括:
[0010]一种基于动态序列规整的异常交易行为识别方法,包括:
[0011]步骤S1、获取用户基础交易数据;
[0012]步骤S2、将交易数据进行分类,根据实际业务需求划分为二维序列数据集,其中,交易时间为横轴,交易金额为纵轴;
[0013]步骤S3、对时域数据进行预处理,根据实际业务需求,所述预处理包括交易金额分桶、交易金额平滑、交易金额标准化、交易时间序列填充、时间指数衰减中的任意处理模块
组合;
[0014]步骤S4、通过傅里叶变化或数值计数变化将交易行为从时域映射到频域;
[0015]步骤S5、根据实际业务需求将频域数据进行预处理,形成用户二维序列数据集;
[0016]步骤S6、构建二维核序列,通过动态序列规整算法计算所有用户行为数据之间聚类,得出用户标签数据;
[0017]步骤S7、对用户标签数据进行抽样判断,确定用户标签数据是否为异常交易行为。
[0018]进一步地,所述步骤S1中,所述用户基础交易数据包括交易时间、交易金额、收付标志、交易对手,其中,过滤掉金融理财保险交税类型的交易以及非主动交易类型的交易。
[0019]进一步地,所述步骤S2中,将交易数据划分为贷方和借方,贷方的交易金额设置为正值,借方的交易金额设置为负值,以交易时间为横轴,交易金额为纵轴,将贷方和借方的数据形成二维序列数据集。
[0020]进一步地,所述步骤S3中,所述预处理包括:
[0021]交易金额分桶,包括对于交易金额[M0,M1,M2...,M
i
‑1,M
i
],设置分桶区间[N0,N1,N2,...,N
n
‑1,N
n
],对于任意交易金额M
k
,如果M
k
属于(N
n
‑1,N
n
]区间,则M
k
分桶取值为N
n
‑1,其中M、N、i、n为任意实数,且N0≤M0≤M
i
≤N
n

[0022]交易金额平滑,包括对于交易金额[M0,M1,M2,...,M
i
‑1,M
i
],有交易时间[T0,T1,T2...,T
i
‑1,T
i
],对于任意交易(M
k
,T
k
),取[(M
k
‑1,T
k
‑1)、(M
k
,T
k
)、(M
k+1
,T
k+1
)],则M
k
平滑后的交易金额M
k
=(M
k
‑1+M
k
+M
k+1
)/3,其中,M、i为任意实数,T为任意时间维度;
[0023]交易金额标准化,包括对于交易金额[M0,M1,M2,...,M
i
‑1,M
i
],有标准差Std和平均值Mean,对于任意M
k
,则有标准化后金额M
k
=(M
k

Mean)/Std;
[0024]交易时间序列填充,包括对交易金额按照时间粒度T进行分组求和,其中,对于缺失时间粒度的交易金额填充为0,T包括年、月、日、小时、分钟;
[0025]时间指数衰减,包括以分析统计时间为起始时间T0,对于起始时间前T
n
个时间单位记作T0‑
T
n
,对于T0的衰减率记作N0,到达T0‑
T
n
时刻衰减率记作N
n
,其中,N0≥N
n
,Bias为起始时间后开始衰减的位置,通过以下公式解出参数:
[0026][0027][0028]计算T
t
时段指数衰减比例N
t
为:
[0029]N(t)=N0e

α(t+l)
[0030]其中,0≤N
t
≤1,对于Tt时段发生的交易(T0,T1,...,T
s
)按照衰减比例N
t
进行随机剔除。
[0031]进一步地,所述步骤S4包括:
[0032]对时域规整后区间为F
m
的数据进行快速傅里叶变换按照采样周期

t进行采样,

t为时间粒度T的整数倍,傅里叶变换公式如下:
[0033][0034]其中,k=0,

n
...

【技术保护点】

【技术特征摘要】
1.一种基于动态序列规整的异常交易行为识别方法,其特征在于,包括:步骤S1、获取用户基础交易数据;步骤S2、将交易数据进行分类,根据实际业务需求划分为二维序列数据集,其中,交易时间为横轴,交易金额为纵轴;步骤S3、对时域数据进行预处理,根据实际业务需求,所述预处理包括交易金额分桶、交易金额平滑、交易金额标准化、交易时间序列填充、时间指数衰减中的任意处理模块组合;步骤S4、通过傅里叶变化或数值计数变化将交易行为从时域映射到频域;步骤S5、根据实际业务需求将频域数据进行预处理,形成用户二维序列数据集;步骤S6、构建二维核序列,通过动态序列规整算法计算所有用户行为数据之间聚类,得出用户标签数据;步骤S7、对用户标签数据进行抽样判断,确定用户标签数据是否为异常交易行为。2.如权利要求1所述的方法,其特征在于,所述步骤S1中,所述用户基础交易数据包括交易时间、交易金额、收付标志、交易对手,其中,过滤掉金融理财保险交税类型的交易以及非主动交易类型的交易。3.如权利要求1所述的方法,其特征在于,所述步骤S2中,将交易数据划分为贷方和借方,贷方的交易金额设置为正值,借方的交易金额设置为负值,以交易时间为横轴,交易金额为纵轴,将贷方和借方的数据形成二维序列数据集。4.如权利要求1所述的方法,其特征在于,所述步骤S3中,所述预处理包括:交易金额分桶,包括对于交易金额[M0,M1,M2...,M
i
‑1,M
i
],设置分桶区间[N0,N1,N2,...,N
n
‑1,N
n
],对于任意交易金额M
k
,如果M
k
属于(N
n
‑1,N
n
]区间,则M
k
分桶取值为N
n
‑1,其中M、N、i、n为任意实数,且N0≤M0≤M
i
≤N
n
;交易金额平滑,包括对于交易金额[M0,M1,M2,...,M
i
‑1,M
i
],有交易时间[T0,T1,T2...,T
i
‑1,T
i
],对于任意交易(M
k
,T
k
),取[(M
k
‑1,T
k
‑1)、(M
k
,T
k
)、(M
k+1
,T
k+1
)],则M
k
平滑后的交易金额M
k
=(M
k
‑1+M
k
+M
k+1
)/3,其中,M、i为任意实数,T为任意时间维度;交易金额标准化,包括对于交易金额[M0,M1,M2,...,M
i
‑1,M
i
],有标准差Std和平均值Mean,对于任意M
k
,则有标准化后金额M
k
=(M
k

Mean)/Std;交易时间序列填充,包括对交易金额按照时间粒度T进行分组求和,其中,对于缺失时间粒度的交易金额填充为0,T包括年、月、日、小时、分钟;时间指数衰减,包括以分析统计时间为起始时间T0,对于起始时间前T
n
个时间单位记作T0‑
T
n
,对于T0的衰减率记作N0,到达T0‑
T
n
时刻衰减率记作N
n
,其中,N0≥N
n
,Bias为起始时间后开始衰减的位置,通过以下公式解出参数:后开始衰减的位置,通过以下公式解出参数:计算T
t
时段指数衰减比例N
t...

【专利技术属性】
技术研发人员:钟俊菘
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1