异常交易识别模型的训练方法、异常交易识别方法及装置制造方法及图纸

技术编号:38014869 阅读:10 留言:0更新日期:2023-06-30 10:39
本公开提供一种异常交易识别模型的训练方法、异常交易识别方法及装置,所述异常交易识别模型的训练方法包括:获取基础样本集,其中,基础样本集中的每条交易样本包括交易信息和样本标签,样本标签指示交易样本为异常交易的黑样本或为正常交易的白样本;对基础样本集中的交易样本的样本标签进行修正,得到训练样本集;对训练样本集进行特征提取,得到训练特征集;基于训练特征集,训练异常交易识别模型。根据本公开的异常交易识别模型的训练方法、异常交易识别方法及装置能够基于训练的异常交易识别模型识别异常交易,解决了传统的基于专家规则的识别方法中无法对复杂、庞大的交易数据进行处理的问题,能够提高异常交易识别效率和准确性。和准确性。和准确性。

【技术实现步骤摘要】
异常交易识别模型的训练方法、异常交易识别方法及装置


[0001]以下描述涉及人工智能
,具体地涉及一种异常交易识别模型的训练方法、异常交易识别方法及装置。

技术介绍

[0002]在金融交易过程中,为了确保交易行为的安全性,通常需要识别交易行为是否存在异常交易风险,以防范可能对交易账户造成的资金损失。
[0003]传统的识别模型一般是基于专家规则建立的,专家规则是根据业务专家的经验,结合实际发生的异常交易事件,制定的异常交易识别规则。然而,专家规则的制定仅能建立在小样本的表现上,其识别维度单一,对于日趋庞大的金融交易量、复杂的交易行为特征、种类各色的用户画像,基于专家规则的识别模型则无法再适用。

技术实现思路

[0004]本公开的示例性实施例可至少解决上述问题,也可不解决上述问题。
[0005]根据本公开的第一方面,提供了一种异常交易识别模型的训练方法,所述异常交易识别模型的训练方法包括:获取基础样本集,其中,所述基础样本集中的每条交易样本包括交易信息和样本标签,样本标签指示交易样本为异常交易的黑样本或为正常交易的白样本;对所述基础样本集中的交易样本的样本标签进行修正,得到训练样本集;对所述训练样本集进行特征提取,得到训练特征集;基于所述训练特征集,训练异常交易识别模型。
[0006]可选地,对所述基础样本集中的交易样本的样本标签进行修正,得到训练样本集的步骤包括:通过比对所述基础样本集中的黑样本和白样本,对所述基础样本集中的交易样本的样本标签进行修正,得到所述训练样本集。
[0007]可选地,通过比对所述基础样本集中的黑样本和白样本,对所述基础样本集中的交易样本的样本标签进行修正,得到所述训练样本集的步骤包括:对所述基础样本集中的满足第一预设条件的黑样本的样本标签进行修正;和/或,对所述基础样本集中的满足第二预设条件的白样本的样本标签进行修正;其中,第一预设条件为:在黑样本的交易发生后的预定时间后,在所述黑样本的交易主体和交易对手之间还存在白样本,其中,第二预设条件为:在黑样本的交易发生时间的同日内,所述黑样本的交易主体和交易对手之间还存在交易额与所述黑样本的交易额之间的差值小于预定阈值的白样本。
[0008]可选地,所述异常交易识别模型的训练方法还包括:将所述训练样本集划分为训练集和测试集,其中,所述训练集用于机器学习模型的学习,所述测试集用于评估机器学习模型的性能;从所述训练集中剔除单次交易主体的交易样本,其中,所述单次交易主体是在所述训练集中仅存在一次交易的交易主体。
[0009]可选地,所述异常交易识别模型的训练方法还包括:从所述基础样本集中剔除单次交易主体的交易样本,其中,所述单次交易主体是在所述基础样本集中仅存在一次交易的交易主体。
[0010]可选地,对所述训练样本集进行特征提取,得到训练特征集的步骤包括:按照与每个时间维度对应的时间窗口,对所述训练样本集中的交易场景维度上的字段进行聚合处理得到聚合特征,并基于所述聚合特征得到训练特征集。
[0011]可选地,所述训练特征集包括:多个训练特征子集,所述多个训练特征子集与不同的特征维度对应,所述异常交易识别模型包括:主模型和多个子模型,其中,基于所述训练特征集,训练异常交易识别模型的步骤包括:利用所述多个训练特征子集一一对应地对所述多个子模型进行训练,以得到多个训练好的子模型;将所述多个训练特征子集一一对应地输入到所述多个训练好的子模型,以从每个训练好的子模型输出第一特征得分集,所述第一特征得分集包括训练特征子集中的每个训练样本为黑样本的概率得分;利用从多个所述训练好的子模型所输出的第一特征得分集,对所述主模型进行训练,其中,所述主模型的输出作为所述异常交易识别模型的输出。
[0012]可选地,所述多个训练特征子集包括多个时间训练特征子集和/或多个交易场景训练特征子集,其中,所述多个时间训练特征子集与多个不同的时间维度一一对应,每个时间训练特征子集包括:与时间训练特征子集所对应的时间维度相关的聚合特征;所述多个交易场景训练特征子集与多个不同的交易场景维度一一对应,每个交易场景训练特征子集包括:与交易场景训练特征子集所对应的交易场景维度相关的聚合特征。
[0013]可选地,所述训练特征集包括强关联训练特征子集和至少一个弱关联训练特征子集,所述训练异常交易识别模型包括:最终模型和至少一个弱关联模型,其中,基于所述训练特征集,训练异常交易识别模型的步骤包括:利用所述至少一个弱关联训练特征子集一一对应地对所述至少一个弱关联模型进行训练,以得到至少一个训练好的弱关联模型;将所述至少一个弱关联训练特征子集一一对应地输入到所述至少一个训练好的弱关联模型,以从每个训练好的弱关联模型输出第二特征得分集,所述第二特征得分集包括弱关联训练特征子集中的每个训练样本为黑样本的概率得分;利用所述强关联特征子集和从所述至少一个弱关联模型输出的第二特征得分集,对所述最终模型进行训练,其中,所述最终模型的输出作为所述异常交易识别模型的输出,其中,每个弱关联训练特征子集包括:与异常交易无直接关联的聚合特征,不同弱关联训练特征子集包括的聚合特征的特征维度不完全相同;其中,每个强关联训练特征子集包括:与异常交易有直接关联的聚合特征;其中,与异常交易有无直接关联指的是是否可以通过聚合特征直接确定交易是否为异常交易。
[0014]可选地,所述时间维度划分为短期维度、中期维度和长期维度,其中,所述短期维度、所述中期维度和所述长期维度各自对应一个或多个时间窗口,所述短期维度所对应的时间窗口中的每个时间窗口的长度小于所述中期维度的所对应的时间窗口中的任意一个时间窗口的长度,所述中期维度所对应的时间窗口中的每个时间窗口的长度小于所述长期维度所对应的时间窗口中的任意一个时间窗口的长度。
[0015]可选地,所述交易场景维度包括以下项之中的至少一者:交易主体维度、交易对手维度、交易地点维度、交易媒介维度、交易渠道维度和开卡地点维度。
[0016]根据本公开的第二方面,提供了一种异常交易识别方法,所述异常交易识别方法包括:获取关于待识别交易的预测数据集,其中,所述预测数据集包括待识别交易的交易信息;对所述预测数据集进行特征提取,得到预测特征集;基于所述预测特征集,使用异常交易识别模型识别所述待识别交易是否为异常交易,其中,所述异常交易识别模型是根据本
公开所述的异常交易识别模型的训练方法训练得到的。
[0017]根据本公开的第三方面,提供了一种异常交易识别模型的训练装置,所述异常交易识别模型的训练装置包括:获取单元,被配置为获取基础样本集,其中,所述基础样本集中的每条交易样本包括交易信息和样本标签,样本标签指示交易样本为异常交易的黑样本或为正常交易的白样本;修正单元,被配置为对所述基础样本集中的交易样本的样本标签进行修正,得到训练样本集;提取单元,被配置为对所述训练样本集进行特征提取,得到训练特征集;训练单元,被配置为基于所述训练特征集,训练异常交易识别模型。
[0018]可选地,所述修正单元还被本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常交易识别模型的训练方法,其特征在于,包括:获取基础样本集,其中,所述基础样本集中的每条交易样本包括交易信息和样本标签,样本标签指示交易样本为异常交易的黑样本或为正常交易的白样本;对所述基础样本集中的交易样本的样本标签进行修正,得到训练样本集;对所述训练样本集进行特征提取,得到训练特征集;基于所述训练特征集,训练异常交易识别模型。2.根据权利要求1所述的训练方法,其特征在于,对所述基础样本集中的交易样本的样本标签进行修正,得到训练样本集的步骤包括:通过比对所述基础样本集中的黑样本和白样本,对所述基础样本集中的交易样本的样本标签进行修正,得到所述训练样本集。3.根据权利要求2所述的训练方法,其特征在于,通过比对所述基础样本集中的黑样本和白样本,对所述基础样本集中的交易样本的样本标签进行修正,得到所述训练样本集的步骤包括:对所述基础样本集中的满足第一预设条件的黑样本的样本标签进行修正;和/或,对所述基础样本集中的满足第二预设条件的白样本的样本标签进行修正;其中,第一预设条件为:在黑样本的交易发生后的预定时间后,在所述黑样本的交易主体和交易对手之间还存在白样本,其中,第二预设条件为:在黑样本的交易发生时间的同日内,所述黑样本的交易主体和交易对手之间还存在交易额与所述黑样本的交易额之间的差值小于预定阈值的白样本。4.根据权利要求1所述的训练方法,其特征在于,还包括:将所述训练样本集划分为训练集和测试集,其中,所述训练集用于机器学习模型的学习,所述测试集用于评估机器学习模型的性能;从所述训练集中剔除单次交易主体的交易样本,其中,所述单次交易主体是在所述训练集中仅存在一次交易的交易主体。5.一种异常交易识别方法,其特征在于,包括:获取关于待识别交易的预测数据集,其中,所述预测数据集包括待识别交易的交易信息;对所述预测数据集进行特征提取,得到预测特征集;基于所述预测特征集,使用异常交易识别模型识别所述待识别交易是否为异常交易,其中,所述异常交易识别...

【专利技术属性】
技术研发人员:李旭
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1