【技术实现步骤摘要】
一种合规审核规则中的模型训练方法、装置和设备
本文件涉及计算机
,尤其涉及一种合规审核规则中的模型训练方法、装置和设备。
技术介绍
为了监督企业的经营等活动是否符合国家法律、法规及行业规则等规定或规则(以下统称为规则),需要对这些企业通过网络业务平台开展的业务等对象进行合规审核。例如,如果用户想用第三方支付平台进行账单支付,则第三方支付平台需要对该用户是否为实名注册账户进行审核,如不是实名账户,则不允许支付。目前,对于网络业务平台开展的业务或其他审核对象,先采用机器审核(简称机审)再进行人工复核的方式进行合规审核,其中,机审依赖于一系列的合规审核规则,且部分合规审核规则使用预先训练好的审核模型对审核对象是否符合相应的规则做出评判,给出审核结果。但是,合规审核规则中使用的审核模型的训练方式存在一些缺陷,如模型迭代优化过程较慢,时效性差等,需要改进。
技术实现思路
本说明书实施例提供了一种合规审核规则中的模型训练方法、装置和设备,以改善相关技术中的合规审核规则中使用的审核模型的训练存在的问题。< ...
【技术保护点】
1.一种合规审核规则中的模型训练方法,包括:/n获取第一时段内产生的一批审核对象的人工复核数据,其中,所述一批审核对象中一个审核对象的人工复核数据包括该审核对象的目标标签,该目标标签是基于目标机审结果的人工复核结果添加的,所述目标机审结果是使用目标规则对该审核对象进行机审得到的,所述一批审核对象中不同审核对象对应的合规审核规则中包含所述目标规则;/n将所述一批审核对象作为一批样本,并将所述一批审核对象的人工复核数据中的目标标签作为所述一批样本的标签,对应加入所述目标规则中使用的合规审核模型的训练集,以对所述合规审核模型的训练集进行更新;/n基于更新后的所述合规审核模型的训练 ...
【技术特征摘要】 【专利技术属性】
1.一种合规审核规则中的模型训练方法,包括:
获取第一时段内产生的一批审核对象的人工复核数据,其中,所述一批审核对象中一个审核对象的人工复核数据包括该审核对象的目标标签,该目标标签是基于目标机审结果的人工复核结果添加的,所述目标机审结果是使用目标规则对该审核对象进行机审得到的,所述一批审核对象中不同审核对象对应的合规审核规则中包含所述目标规则;
将所述一批审核对象作为一批样本,并将所述一批审核对象的人工复核数据中的目标标签作为所述一批样本的标签,对应加入所述目标规则中使用的合规审核模型的训练集,以对所述合规审核模型的训练集进行更新;
基于更新后的所述合规审核模型的训练集,对所述合规审核模型进行训练,以对所述合规审核模型进行在线更新。
2.根据权利要求1所述的方法,在获取第一时段内产生的一批审核对象的人工复核数据之前,还包括:
响应于针对所述一批审核对象的机审结果进行的人工复核操作,给所述一批审核对象分别添加目标标签,得到所述一批审核对象的人工复核数据。
3.根据权利要求2所述的方法,其中,响应于针对所述一批审核对象的机审结果进行的人工复核操作,给所述一批审核对象分别添加目标标签,包括:
如果基于所述一批审核对象中一个审核对象的人工复核结果,确定基于所述目标规则对该审核对象进行机审得到的结果是正确的,则响应于针对该审核对象的人工复核操作,给该审核对象添加机审结果准确的标签;
如果基于所述一批审核对象中一个审核对象的人工复核结果,确定基于所述目标规则对该审核对象进行机审得到的结果是不正确的,则响应于针对该审核对象的人工复核操作,给该审核对象添加机审结果不准确的标签,并在该审核对象中标出正确的审核结果。
4.根据权利要求3所述的方法,其中,所述将所述一批审核对象作为一批样本,并将所述一批审核对象的人工复核数据中的目标标签作为所述一批样本的标签,对应加入所述目标规则中使用的合规审核模型的训练集,包括:
从所述一批审核对象中筛选出多个指定审核对象,其中,所述指定审核对象的目标标签包括基于所述目标规则的机审结果不准确,且所述指定审核对象中标识有基于所述目标规则的正确审核结果;
将所述多个指定审核对象作为一批样本,并将所述多个指定审核对象的人工复核数据中的目标标签作为所述一批样本的标签,对应加入所述目标规则中使用的合规审核模型的训练集。
5.根据权利要求1-4任一项所述的方法,其中,所述获取第一时段内产生的一批审核对象的人工复核数据,包括:
在第二时段获取第一时段内产生的一批审核对象的人工复核数据,其中,所述第二时段与所述第一时段相邻,且所述第二时段晚于所述第一时段,所述第一时段为产生的审核对象的总数高于或等于预设阈值的时段,所述第二时段为产生的审核对象的总数低于所述预设阈值的时段。
6.根据权利要求5所述的方法,还包括:
在基于所述目标规则对第三时段产生的目标审核对象进行机审时,使用更新后的所述合规审核模型进行审核,其中,所述第三时段与所述第二时段相邻,且所述第三时段晚于所述第二时段。
7.根据权利要求6所述的方法,
所述第一时段和所述第二时段是同一周期中的不同时段;
所述第一时段和所述第三时段是相邻两个周期的相同时段。
8.根据权利要求6或7所述的方法,
所述第一时段与所述第二时段的长度相同,或者,所述第一时段与所述第二时段的长度不同。
9.根据权利要求1-4、6-7中任一项所述的方法,
所述一批审核对象中不同审核对象对应的合规审核规则相同。
10.一种业务合规审核规则中的模型训练方法,包括:
获取第一时段内产生的目标业务场景下的一批业务的人工复核数据,其中,所述一批业务中一个业务的人工复核数据包括该业务的目标标签,该目标标签是基于目标机审结果的人工复核结果添加的,所述目标机审结果是使用目标规则对该业务进行机审得到的,所述目标规则是所述目标业务场景对应的合规审核规则中的一个或多个;
将所述一批业务作为一批样本,并将所述一批业务的人工复核数据中的目标标签作为所述一批样本的标签,对应加入所述目标规则中使用的业务合规审核模型的训练集,以对所述业务合规审核模型的训练集进行更新;
基于更新后的所述业务合规审核模型的训练集,对所述业务合规审核模型进行训练,以对所述业务合规审核模型进行在线更新。
11.一种合规审核规则中的模型训练装置,包括:
第一数据获取模块,获取第一时段内产生的一批审核对象的人工复核数据,其中,所述一批审核对象中一个审核对象的人工复核数据包括该审核对象的目标标签,该目标标签是基于目标机审结果的人工复核结果添加的,所述目标机审结果是使用目标规则对该审核对象进行机审得到的,所述一批审核对象中不同审核对象对应的合规审核规则中包含所述目标规则;
技术研发人员:苏豫陇,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。