一种基于横向联邦学习的反洗钱识别方法、装置及系统制造方法及图纸

技术编号:29208843 阅读:34 留言:0更新日期:2021-07-10 00:45
本发明专利技术公开了一种基于横向联邦学习的反洗钱识别方法、装置及系统,所述方法先对各参与节点所提供的数据特征进行特征对齐,提取出用于构建反洗钱模型的基础数据特征;根据各参与节点所上传的各数据样本的用户ID以及样本生成时间进行样本同步;向各参与节点下发时序特征构造指令,构造出所需的时序特征的最终特征值,并将其下发至各个参与节点,以使各个参与节点根据获取的时序特征值结合自身的数据特征的特征值,通过横向联邦学习构建出反洗钱识别模型,最终根据所构建的反洗钱模型进行反洗钱识别。通过实施本发明专利技术实施例能够提高反洗钱识别的准确性。钱识别的准确性。钱识别的准确性。

【技术实现步骤摘要】
一种基于横向联邦学习的反洗钱识别方法、装置及系统


[0001]本专利技术涉及计算机
,尤其涉及一种基于横向联邦学习的反洗钱识别方法、装置及系统。

技术介绍

[0002]现有基于机器学习的反洗钱判断,由各证券公司利用各自的交易数据单独训练模型,然后进行反洗钱判断;在反洗钱模型构造过程中,所需要的数据主要分为两类;一类是单一特征,这类特征值依赖于当前记录,例如客户的年纪或职业特征;另一类为时序特征,这一类特征依赖于多条记录。例如某个客户最近一个月的交易数量,这个特征就需要对客户近一个月内所有交易记录进行汇总后得到;而同一个客户在不同公司可能有不同的交易数据,不同公司的数据具有保密性无法互通,那么若仅依靠单个公司的数据来构造反洗钱模型,会因为数据不全面导致所构造的时序特征不准确,进而导致模型的准确性较低的问题,此外单个公司的历史洗钱案件数量很少,仅由一个公司的数据所构造的模型,存在过拟合现象,误差较大,

技术实现思路

[0003]本专利技术实施例提供一种基于横向联邦学习的反洗钱识别方法、装置及系统,能够提高反洗钱识别的准确性。<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于横向联邦学习的反洗钱识别方法,其特征在于,包括:对若干参与节点的样本数据表中各数据特征进行特征对齐,生成用于构建反洗钱模型的基础数据特征;其中,每一所述样本数据表包括若干数据样本,且每一数据样本均设置有用户ID以及样本生成时间;根据用户ID以及样本生成时间对各所述参与节点的样本数据表进行样本同步;其中,在进行样本同步时,将当前参与节点中一选定数据样本的用户ID和样本生成时间发送至未拥有所述选定数据样本但拥有与所述选定数据样本用户ID相同的数据样本的参与节点;向各所述参与节点下发时序特征构造指令,以使各所述参与节点在接收所述时序特征构造指令时,根据所述时序构造指令所包含的统计时间维度信息,所需的基础数据特征的特征名称以及计算方式,基于样本同步后的样本数据表计算所需构造的时序特征的基础特征值;根据各所述基础特征值计算所述时序特征的最终特征值;将所述时序特征的最终特征值下发至各所述参与节点,以使各所述参与节点根据所述时序特征的最终特征值以及自身的数据特征的特征值,通过横向联邦学习生成反洗钱识别模型并根据所述反洗钱识别模型进行反洗钱识别。2.如权利要求1所述的基于横向联邦学习的反洗钱识别方法,其特征在于,所述对若干参与节点的样本数据表中各数据特征进行特征对齐,生成用于构建反洗钱模型的基础数据特征,具体包括:取各参与节点的样本数据表中的各数据特征的特征交集,获得若干第一基础数据特征;逐一计算除所述第一基础数据特征外的各数据特征的全局有效率;将全局有效率超过第一预设阈值的数据特征,作为第二基础数据特征;将所有所述第一基础数据特征以及所有所述第二基础数据特征作为所述用于构建反洗钱模型的基础数据特征。3.如权利要求2所述的基于横向联邦学习的反洗钱识别方法,其特征在于,通过以下公式计算一数据特征的全局有效率:其中,g
r
为一数据特征的全局有效率、M为参与节点的数量,I
rM
为数据特征在第M个参与节点的局部有效率、n
M
为第M个参与节点的数据样本的数量。4.一种基于横向联邦学习的反洗钱识别装置,其特征在于,包括:特征对齐模块、样本同步模块、时序特征构造模块以及反洗钱识别模块;所述特征对齐模块,用于对若干参与节点的样本数据表中各数据特征进行特征对齐,生成用于构建...

【专利技术属性】
技术研发人员:武润鹏李衡张岩邹杰
申请(专利权)人:广发证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1