【技术实现步骤摘要】
基于迁移学习的风控方法、装置及系统
本说明书实施例涉及互联网
,尤其涉及一种基于迁移学习的风控方法、装置及系统。
技术介绍
随着互联网的快速发展,各种形式的业务不断涌现,如在线银行、在线支付、在线购物等基于互联网的服务业务。人们已经接受并越来越习惯在网上进行各种商务及生活活动。由于互联网是一个开放的网络,任何人在任何地方都可以很方便地连接到互联网上。互联网在给人们生活提供便利的同时,也带来了风险。尤其是随着电子商务平台和第三方交易平台的发展,网络金融犯罪以及网上欺诈、信用卡盗刷等不断出现。因此,对交易进行风险识别及控制越来越重要。
技术实现思路
本说明书实施例提供及一种基于迁移学习的风控方法、装置及系统。第一方面,本说明书实施例提供一种基于迁移学习的风控方法,包括:获取风险交易样本的源域数据及目标域数据;基于迁移学习算法,从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据,并从所述目标域数据选取出训练目标域数据;合并所述训练源域数据与所述训练目标域数据为训练数据集;利用所述训练数据集进行风险模型训练。第二方面,本说明书实施例提供一种基于迁 ...
【技术保护点】
一种基于迁移学习的风控方法,包括:获取风险交易样本的源域数据及目标域数据;基于迁移学习算法,从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据,并从所述目标域数据选取出训练目标域数据;合并所述训练源域数据与所述训练目标域数据为训练数据集;利用所述训练数据集进行风险模型训练。
【技术特征摘要】
1.一种基于迁移学习的风控方法,包括:获取风险交易样本的源域数据及目标域数据;基于迁移学习算法,从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据,并从所述目标域数据选取出训练目标域数据;合并所述训练源域数据与所述训练目标域数据为训练数据集;利用所述训练数据集进行风险模型训练。2.根据权利要求1所述的方法,在获取源域数据及目标域数据之后,还包括:合并所述源域数据及目标域数据为具有相同数据结构的初始合并数据集;其中,所述训练数据集是从所述初始合并数据集中选定的。3.根据权利要求1所述的方法,所述从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据包括:基于数据特征提取及特征聚类,从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据;或者,基于深度学习对数据建模的模型参数分布相似度,从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据;或者,基于数据迭代分类过程中权重动态更新,从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据。4.根据权利要求1所述的方法,所述从所述目标域数据选取出训练目标域数据包括:根据所述目标域数据中各数据的完整性,选取出训练目标域数据。5.根据权利要求3所述的方法,所述基于数据迭代分类过程中权重动态更新,从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据,包括:为所述源域数据中每一个样本数据赋予权重;在迭代分类过程中,判断样本数据是否被错误分类,若被错误分类,则降低所述样本数据的权重;根据权重高低优先选取权重高的样本数据进行下一次迭代分类,从而从所述源域数据中选取出与所述目标域数据具有类似或相同数据分布的训练源域数据。6.根据权利要求5所述的方法,所述从所述目标域数据选取出训练目标域数据包括:为所述目标域数据中每一个样本数据赋予权重;在迭代分类过程中,判断样本数据是否被错误分类,若被错误分类,则提高所述样本数据的权重;根据权重高低优先选取权重高的样本数据进行下一次迭代分类,从而从所述目标域数据选取出训练目标域数据。7.根据权利要求1-6任一项所述的方法,所述利用所述训练数据集进行风险分类模型训练包括:针对所述训练数据集,通过二分类算法进行训练,得到风险识别模型。8.根据权利要求7所述的方法,在得到风险识别模型之后,还包括:根据所述风险识别模型,对业务数据进行识别,确定出业务风险分值;对于风险分值高于风险阈值的业务进行控制。9.一种基于迁移学习的风控装置,包括:数据获取单元,用于获取风险交易样本的源域数据及目标域数据;训练数据集确定单元,用于基于迁移学习算法,从所述...
【专利技术属性】
技术研发人员:陈明星,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。