【技术实现步骤摘要】
特征数据的生成方法、装置、计算机设备和存储介质
本申请涉及反洗钱
,特别是涉及一种特征数据的生成方法、装置、计算机设备和存储介质。
技术介绍
洗钱是严重的经济犯罪行为,其威胁金融体系的安全稳定,对一个国家的政治稳定、社会安定以及经济安全都构成严重威胁。目前,很多金融机构都设有反洗钱监测部门,目的是根据交易数据查找出存在洗钱嫌疑的交易主体(客户),并上报监管部门。反洗钱监测的具体实现过程包括:对交易主体对应的交易数据进行特征提取,并将提取出的特征数据输入到预先训练好的反洗钱模型中,得到反洗钱模型输出的该交易主体是否存在洗钱嫌疑的预测结果。但是,特征提取过程中采用的特征提取语句是相对固定的,如果修改了部分特征提取语句,就需要运行全量特征提取语句重新提取特征数据,以便重新训练反洗钱模型,这个过程非常耗时,并且耗费计算资源。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够节省计算资源的特征数据的生成方法、装置、计算机设备和存储介质。一种特征数据的生成方法,方法包括: >获取预设时间段内的本文档来自技高网...
【技术保护点】
1.一种特征数据的生成方法,其特征在于,所述方法包括:/n获取预设时间段内的交易信息、当前版本的语句配置文件和上一版本的语句配置文件;所述语句配置文件存储在预先设置的版本库,所述语句配置文件中包含特征提取语句的配置信息;/n根据所述当前版本的语句配置文件和所述上一版本的语句配置文件,确定所述特征提取语句的变更信息;/n根据所述特征提取语句的变更信息,得到变更后的特征提取语句和未变更的特征提取语句;/n采用所述变更后的特征提取语句对所述交易信息进行特征提取,得到目标特征数据,并由所述目标特征数据和所述未变更的特征提取语句对应的特征数据组成全量特征数据。/n
【技术特征摘要】
1.一种特征数据的生成方法,其特征在于,所述方法包括:
获取预设时间段内的交易信息、当前版本的语句配置文件和上一版本的语句配置文件;所述语句配置文件存储在预先设置的版本库,所述语句配置文件中包含特征提取语句的配置信息;
根据所述当前版本的语句配置文件和所述上一版本的语句配置文件,确定所述特征提取语句的变更信息;
根据所述特征提取语句的变更信息,得到变更后的特征提取语句和未变更的特征提取语句;
采用所述变更后的特征提取语句对所述交易信息进行特征提取,得到目标特征数据,并由所述目标特征数据和所述未变更的特征提取语句对应的特征数据组成全量特征数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述特征提取语句的变更信息,得到变更后的特征提取语句,包括:
根据所述特征提取语句的变更信息,生成训练特征提取语句;其中,所述训练特征提取语句用于提取训练特征数据,所述训练特征数据用于修正训练特征数据集,所述训练特征数据集用于训练反洗钱模型。
3.根据权利要求1所述的方法,其特征在于,所述根据所述特征提取语句的变更信息,得到变更后的特征提取语句,包括:
根据所述特征提取语句的变更信息,生成每日特征提取语句;其中,所述每日特征提取语句用于提取每日特征数据,所述每日特征数据用于修正每日特征数据集,所述每日特征数据集用于输入到反洗钱模型中得到交易主体是否存在洗钱嫌弃的预测结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述特征提取语句的变更信息,得到变更后的特征提取语句,包括:
根据所述特征提取语句的变更信息,生成全量特征提取语句;所述全量特征提取语句用于对每日的交易信息进行特征提取得到所述每日特征数据集。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述确定所述特征提取语句的变更信息之后,所述方法还包括:
根据所述特征提取语句的变更信息,生成第一数据表;
在所述采用所述变更后的特征提取语句对所述交易信息进行特征提取,得到目标特征数据之后,所述方法还包括:
将所述目标特征数据和所述未变更的特征提取语句对应的特征数据存储到所述第一数据表中。
6.根据权利要求5所述的方法,其特征在于,在所述确定所述特征提取语句的变更信息之后,所述方法还包括:
在预先设置的特征数据库中生成第二数据表;
在所述将所述目标...
【专利技术属性】
技术研发人员:侯皓龄,
申请(专利权)人:深圳追一科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。