一种可疑风险交易筛查方法与相应系统技术方案

技术编号:22565875 阅读:35 留言:0更新日期:2019-11-16 12:22
一种可疑风险交易筛查方法(200),该方法包括如下步骤:获取已知客户信息数据(201),其中所述已知客户信息数据包括已知客户交易信息数据和已知客户个人信息数据;由所述已知客户信息数据计算已知客户交易特征(202);根据所述计算的已知客户交易特征利用邻近采样随机森林方法训练客户可疑行为筛选模型(203);根据所述训练好的客户可疑行为筛选模型对目标筛选客户的交易行为进行筛选(204)。

A screening method and corresponding system for suspicious risk transactions

A suspicious Risk Transaction screening method (200) includes the following steps: obtaining known customer information data (201), wherein the known customer information data includes known customer transaction information data and known customer personal information data; calculating the known customer transaction characteristics (202) from the known customer information data; utilizing proximity according to the calculated known customer transaction characteristics The sampling random forest method trains the customer suspicious behavior screening model (203); according to the trained customer suspicious behavior screening model, the transaction behavior of the target screening customer is screened (204).

【技术实现步骤摘要】
一种可疑风险交易筛查方法与相应系统
本专利技术涉及金融安全分析
,具体地涉及一种可疑风险交易筛查方法与相应系统。
技术介绍
文献CN201510947459.7公开一种可疑交易节点集合侦测方法及装置,其中通过充分考虑节点与节点之间的关联性,节点之间的网络拓扑结构中各个节点之间的关系,来确定出金融网络中的可疑交易节点的集合。此外,文献CN201510857280.2公开一种应用于反洗钱处理的数据处理系统及方法,其中通过对待进行反洗钱处理的报文进行报文处理、消息收发、状态确认,接入不同的反洗钱系统。再者,文献CN201610647003.3公开一种洗钱账户的确定方法及装置,其中根据在多个数据样本中的每个数据样本的权重将其进行分类,然后确定目标数据样本,根据目标数据样本对应的账户是否符合预设的洗钱账户标准,来确定是否为洗钱账户。此外,文献CN201610522577.8还公开一种可疑洗钱账户的确定方法及装置,其中针对用于表示一个账户在设定时间段的设定时长内的交易信息的多个数据样本进行分类,从而获得最佳分类,从特定类数据样本中确定出孤立点数据样本,并且将该孤立点数据样本确定为可疑洗钱账户。此外,文献CN201710576257.5还公开一种反洗钱系统的异常业务数据筛选方法,其中通过采取异常指标、异常模型筛选的方法,同时筛选方法与业务场景相结合,通过满足该异常模型触发条件的触发方式进行筛选,从而筛选出异常业务数据。
技术实现思路
本专利技术所要解决的技术问题在于提供一种将客户可疑交易行为量化之后并借助于人工智能分类识别模型进行判别的方法和相应系统,由此可以基于银行客户交易行为中的已知客户交易的特征,更准确地从目标客户中筛查出具有显著可疑交易行为的客户。因此,按照本专利技术的第一方面,提出一种可疑风险交易筛查方法,该方法包括如下步骤:获取已知客户信息数据,其中所述已知客户信息数据包括已知客户交易信息数据和已知客户个人信息数据;由所述已知客户信息数据计算已知客户交易特征;根据所述计算的已知客户交易特征利用邻近采样随机森林方法训练客户可疑行为筛选模型;根据所述训练好的客户可疑行为筛选模型对目标筛选客户的交易行为进行筛选。按照本专利技术提出的可疑风险交易筛查方法的基本构思在于,借助于邻近采样随机森林方法针对非平衡数据集进行分类,以筛除部分正常客户,保留绝大多数可疑交易,有效减少人工筛查的工作量。在此可以把分类理解为,将在银行交易的客户分为具有可疑交易的客户和正常交易的客户。在分类任务中,我们一般将要识别出来的样本称为正向样本,与之相对的称为负向样本。在此,所谓非平衡数据集是指数据集中的正向样本和负向样本的数据量相差很大,使得模型的预测或者分类结果严重倾向于占据多数的样本类,这样得到的准确率是不可信的,比如当数据集中正向样本和负向样本的比例为9:1时。即使它的准确率为90%,也有理由怀疑它将所有的类别都判断为数据多的那一类,从而完全忽略了数据量小的样本。通常在银行的客户交易中,显然具有可疑交易的客户只占据其中很小的一部分,而绝大部分的客户交易都是正常的,因此银行的客户交易数据属于典型的非平衡数据集,从而采用对此非常有针对性的邻近采样随机森林方法进行处理能充分避免上文提到的偏差,从而有效提高预测或筛选的准确度。有利地,已知客户交易信息数据可以包括:交易时间、交易金额、交易IP、交易账户信息以及交易留言等。有利地,已知客户个人信息数据可以包括:客户账户号、客户姓名、开户日期以及联系方式等。有利地,在获取已知客户信息数据之后,可以包括对所述获取的已知客户信息数据进行数据清洗手段,以便使得数据结构化。所谓数据清洗可以包括:数据连接、合并、处理缺失值和异常值等。所谓的缺失值处理例如可以理解为:如果交易信息中缺少金额,则将缺少的金额填补0。所谓的异常值处理人可以理解为:例如,在正常情况下,交易表中“交易金额”与“对手交易金额”应相同,如果一旦出现不一致的情况,则以“交易金额”为标准,将“对手交易金额”改为“交易金额”,以便使得这两项一致。有利地,所述客户交易特征可以包括如下12个特征:周期内快频率交易特征、金额进出一致特征、相同IP特征、累计交易金额特征、累计交易次数特征、对公客户公转私次数特征、对公客户公转私比率特征、交易人数特征、交易转出次数及占比特征、交易转入次数及占比特征、交易转出金额及占比特征以及交易转入金额及占比特征。其中,所述12个特征的描述与计算方式分别如下:1.周期内快频率交易特征通过如下公式计算:其中p为周期,trxMoney为每次交易金额,a为系数,用于增加快频率与慢频率间隔。2.金额进出一致特征通过如下公式计算:其中p为周期,p+1为平移一个区间的进出金额周期(如p为正负正负周期,则p+1为负正负正周期),trxMoneyp,in为周期内转入金额,moneyp,out为周期内转出金额。3.相同IP特征通过如下公式计算:MaxSameIPcountp=max(countip(trxallp,cust.groupby(ip,cust_id)))trxallp,cust∈trxp,cust∪trxp,opptrxp,opp∈trxptrxp,opp~trxp.cust_id=trxp,cust.opp_cust_id其中,IP地址字段为SLF_EQP_ADR/chnl_srl,统计与上下游交易中,与当前客户具有相同IP的最大公司/客户数量。4.累计交易金额特征通过如下公式计算:SumTrxMoneyp=∑abs(trx.trxMoneyp)其中,SumTrxMoneyp为客户在p周期内累计交易金额绝对值总和,p可以选择1天、7天、14天、30天、90天、180天。5.累计交易次数特征通过如下公式计算:SumTrxCountp=∑trx.countp其中,SumTrxCountp为客户在p周期内累计交易次数总和,p可以选择1天、7天、14天、30天、90天、180天。6.对公客户公转私次数特征为计算网络中对公客户与对私客户转账次数,其中对公客户定义为名字长度小于6的客户,通过如下公式计算:Com2CusTrxCountp=∑Countp,trx_opp_custrx_opp_cus.opp_cust_name.length<6其中,网络中公对私转账次数最高的n个对公客户的次数平均,n=1,2,3。7.对公客户公转私比率特征为计算网络中对公客户与对私客户转账占总交易的比例,其中对公客户定义为名字长度小于6的客户,通过如下公式计算:trx_opp_cus.opp_cust_name.length<6网络中公对私转账比例最高的n个对公客户的比例平均,n=1,2,38.交易人数特征为网络中不同人名的数量统计,通过如下公式计算,其中disti本文档来自技高网...

【技术保护点】
1.一种可疑风险交易筛查方法(200),该方法包括如下步骤:/n获取已知客户信息数据(201),其中所述已知客户信息数据包括已知客户交易信息数据和已知客户个人信息数据;/n由所述已知客户信息数据计算已知客户交易特征(202);/n根据所述计算的已知客户交易特征利用邻近采样随机森林方法训练客户可疑行为筛选模型(203);/n根据所述训练好的客户可疑行为筛选模型对目标筛选客户的交易行为进行筛选(204)。/n

【技术特征摘要】
1.一种可疑风险交易筛查方法(200),该方法包括如下步骤:
获取已知客户信息数据(201),其中所述已知客户信息数据包括已知客户交易信息数据和已知客户个人信息数据;
由所述已知客户信息数据计算已知客户交易特征(202);
根据所述计算的已知客户交易特征利用邻近采样随机森林方法训练客户可疑行为筛选模型(203);
根据所述训练好的客户可疑行为筛选模型对目标筛选客户的交易行为进行筛选(204)。


2.根据权利要求1所述的方法(200),其特征在于,在根据所述获取的已知客户交易特征利用邻近采样随机森林方法训练客户可疑行为筛选模型的步骤(203)中包括如下子步骤:
区分具有可疑交易行为的客户与交易行为正常的客户(2031);
对所述所有已知客户交易特征使用K-MEANS聚类算法进行无监督聚类(2032);
根据上述聚类结果对所述交易行为正常的客户进行下采样(2033);
使用随机森林方法对具有可疑交易行为的客户与经下采样后的交易行为正常的客户进行训练(2034),获得客户可疑行为筛选模型。


3.根据权利要求1或2所述的方法(200),其特征在于,所述已知客户交易信息数据包括:交易时间、交易金额、交易IP、交易账户信息和交易留言。


4.根据权利要求1或2所述的方法(200),其特征在于,所述已知客户个人信息数据包括:客户账户号、客户姓名、开户日期和联系方式。


5.根据权利要求1或2所述的方法(200),其特征在于,在获取已知客户信息数据之后,对所述获取的已知客户信息数据进行数据清洗以便使得数据结构化。

【专利技术属性】
技术研发人员:王子剑严武陈龙曹磊
申请(专利权)人:上海诺悦智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利