System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及通信,尤其涉及一种风险对象预测方法、装置、电子设备及存储介质。
技术介绍
1、走逃企业是指不履行税收义务并脱离税务机关监管的企业,少数违法分子会在开具增值税专用发票后走逃,使得国家税款严重流失,税收经济秩序遭到破坏,同时也侵害了守法经营纳税人的合法权益。相关技术中,通过训练普通的机器学习模型来预测有走逃风险的企业,然而,在训练模型时,为提高模型的预测准确性,需要综合来自不同机构的企业的税务相关数据作为训练样本进行训练,然而需要训练模型的机构可能无法获取到来自其他机构的数据,如果能够获取到其他机构的数据将会造成其他机构隐私数据的泄露。
2、因此,如何在提高有走逃风险的企业预测的准确性的同时,确保数据的安全,是亟待解决的技术问题之一。
技术实现思路
1、本申请实施例提供了一种风险对象预测方法、装置、电子设备及存储介质,在提高了具有走逃风险的企业预测的准确性的同时,保障了数据的安全。
2、第一方面,本申请实施例提供了一种风险对象预测方法,包括:
3、获取第一参与方基于待检测目标对象的第一特征数据和第一风险预测模型获得的第一预测结果,以及第二参与方基于所述待检测目标对象的第二特征数据和第二风险预测模型获得的第二预测结果;其中,所述第一风险预测模型和所述第二风险预测模型是基于所述第一参与方的第一训练样本和所述第二参与方的第二训练样本采用纵向联邦学习方式进行训练获得的;
4、汇总所述第一预测结果和所述第二预测结果,得到针对所述待检测目标
5、在一种实施方式中,所述第一风险预测模型和所述第二风险预测模型是通过以下方式训练获得的:
6、获取所述第一参与方根据第一训练样本训练第一风险预测模型生成并加密的第一中间结果,以及所述第二参与方根据第二训练样本训练第二风险预测模型生成并加密的第二中间结果;
7、将所述加密的第二中间结果发送至所述第一参与方,以使所述第一参与方根据所述加密的第二中间结果计算第一加密梯度值;
8、将所述加密的第一中间结果发送至所述第二参与方,以使所述第二参与方根据所述加密的第一中间结果计算第二加密梯度值;
9、获取所述第一加密梯度值和所述第二加密梯度值,根据解密后的第一梯度值和解密后的第二梯度值生成目标梯度值,并将所述目标梯度值发送至所述第一参与方和所述第二参与方,以使所述第一参与方基于所述目标梯度值更新所述第一风险预测模型的参数,得到训练后的第一风险预测模型,以及所述第二参与方基于所述目标梯度值更新所述第二风险预测模型的参数,得到训练后的第二风险预测模型。
10、在一种实施方式中,所述第一训练样本和所述第二训练样本为对二者进行对齐后的训练样本。
11、在一种实施方式中,所述第一训练样本包括所述第一参与方的第一样本对象的第一样本特征数据和样本标签;所述第二训练样本包括所述第二参与方的第二样本对象的第二样本特征数据。
12、在一种实施方式中,所述待检测目标对象为待检测目标纳税人标识对应的企业;所述第一样本特征数据至少包括:纳税人标识对应的企业的行业代码、登记注册类型代码和登记日期;所述第二样本特征数据至少包括:纳税人标识对应的发票中的交易特征,所述样本标签表征所述纳税人标识对应的企业是否为风险企业。
13、第二方面,本申请实施例提供了一种风险对象预测装置,包括:
14、获取单元,用于获取第一参与方基于待检测目标对象的第一特征数据和第一风险预测模型获得的第一预测结果,以及第二参与方基于所述待检测目标对象的第二特征数据和第二风险预测模型获得的第二预测结果;其中,所述第一风险预测模型和所述第二风险预测模型是基于所述第一参与方的第一训练样本和所述第二参与方的第二训练样本采用纵向联邦学习方式进行训练获得的;
15、预测单元,用于汇总所述第一预测结果和所述第二预测结果,得到针对所述待检测目标对象的目标预测结果。
16、在一种实施方式中,所述装置,还包括:
17、训练单元,用于通过以下方式训练所述第一风险预测模型和所述第二风险预测模型:获取所述第一参与方根据第一训练样本训练第一风险预测模型生成并加密的第一中间结果,以及所述第二参与方根据第二训练样本训练第二风险预测模型生成并加密的第二中间结果;将所述加密的第二中间结果发送至所述第一参与方,以使所述第一参与方根据所述加密的第二中间结果计算第一加密梯度值;将所述加密的第一中间结果发送至所述第二参与方,以使所述第二参与方根据所述加密的第一中间结果计算第二加密梯度值;获取所述第一加密梯度值和所述第二加密梯度值,根据解密后的第一梯度值和解密后的第二梯度值生成目标梯度值,并将所述目标梯度值发送至所述第一参与方和所述第二参与方,以使所述第一参与方基于所述目标梯度值更新所述第一风险预测模型的参数,得到训练后的第一风险预测模型,以及所述第二参与方基于所述目标梯度值更新所述第二风险预测模型的参数,得到训练后的第二风险预测模型。
18、在一种实施方式中,所述第一训练样本和所述第二训练样本为对二者进行对齐后的训练样本。
19、在一种实施方式中,所述第一训练样本包括所述第一参与方的第一样本对象的第一样本特征数据和样本标签;所述第二训练样本包括所述第二参与方的第二样本对象的第二样本特征数据。
20、在一种实施方式中,所述待检测目标对象为待检测目标纳税人标识对应的企业;所述第一样本特征数据至少包括:纳税人标识对应的企业的行业代码、登记注册类型代码和登记日期;所述第二样本特征数据至少包括:纳税人标识对应的发票中的交易特征,所述样本标签表征所述纳税人标识对应的企业是否为风险企业。
21、第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请所述的风险对象预测方法。
22、第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请所述的风险对象预测方法中的步骤。
23、本申请的有益效果如下:
24、本申请实施例提供的风险对象预测方法、装置、电子设备及存储介质,可信服务器获取第一参与方基于待检测目标对象的第一特征数据和第一风险预测模型获得的第一预测结果,以及获取第二参与方基于所述待检测目标对象的第二特征数据和第二风险预测模型获得的第二预测结果,其中,第一风险预测模型和第二风险预测模型是基于第一参与方的第一训练样本和第二参与方的第二训练样本采用纵向联邦学习方式进行训练获得的,汇总第一中间结果和第二中间结果,得到针对待检测目标对象的目标预测结果,本申请实施例中,各参与方采用纵向联邦学习方式训练各自的风险预测模型,分别采用各自训练的风险预测模型预测待检测目标对象是否为风险对象,可信服务器汇总各参与方的预测结果,得到针对待检测目标对象最终的目标预测结果,由于各参与方采用本文档来自技高网...
【技术保护点】
1.一种风险对象预测方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述第一风险预测模型和所述第二风险预测模型是通过以下方式训练获得的:
3.如权利要求2所述的方法,其特征在于,所述第一训练样本和所述第二训练样本为对二者进行对齐后的训练样本。
4.如权利要求2或3所述的方法,其特征在于,所述第一训练样本包括所述第一参与方的第一样本对象的第一样本特征数据和样本标签;所述第二训练样本包括所述第二参与方的第二样本对象的第二样本特征数据。
5.如权利要求4所述的方法,其特征在于,所述待检测目标对象为待检测目标纳税人标识对应的企业;所述第一样本特征数据至少包括:纳税人标识对应的企业的行业代码、登记注册类型代码和登记日期;所述第二样本特征数据至少包括:纳税人标识对应的发票中的交易特征,所述样本标签表征所述纳税人标识对应的企业是否为风险企业。
6.一种风险对象预测装置,其特征在于,包括:
7.如权利要求6所述的装置,其特征在于,还包括:
8.如权利要求7所述的装置,其特征在于,所述第一训练样本
9.如权利要求7或8所述的装置,其特征在于,所述第一训练样本包括所述第一参与方的第一样本对象的第一样本特征数据和样本标签;所述第二训练样本包括所述第二参与方的第二样本对象的第二样本特征数据。
10.如权利要求9所述的装置,其特征在于,所述待检测目标对象为待检测目标纳税人标识对应的企业;所述第一样本特征数据至少包括:纳税人标识对应的企业的行业代码、登记注册类型代码和登记日期;所述第二样本特征数据至少包括:纳税人标识对应的发票中的交易特征,所述样本标签表征所述纳税人标识对应的企业是否为风险企业。
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~5任一项所述的风险对象预测方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~5任一项所述的风险对象预测方法中的步骤。
...【技术特征摘要】
1.一种风险对象预测方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述第一风险预测模型和所述第二风险预测模型是通过以下方式训练获得的:
3.如权利要求2所述的方法,其特征在于,所述第一训练样本和所述第二训练样本为对二者进行对齐后的训练样本。
4.如权利要求2或3所述的方法,其特征在于,所述第一训练样本包括所述第一参与方的第一样本对象的第一样本特征数据和样本标签;所述第二训练样本包括所述第二参与方的第二样本对象的第二样本特征数据。
5.如权利要求4所述的方法,其特征在于,所述待检测目标对象为待检测目标纳税人标识对应的企业;所述第一样本特征数据至少包括:纳税人标识对应的企业的行业代码、登记注册类型代码和登记日期;所述第二样本特征数据至少包括:纳税人标识对应的发票中的交易特征,所述样本标签表征所述纳税人标识对应的企业是否为风险企业。
6.一种风险对象预测装置,其特征在于,包括:
7.如权利要求6所述的装置,其特征在于,还包括:
8.如权利要求7所述...
【专利技术属性】
技术研发人员:王芳,张平,王志刚,宋若宁,刘振宇,田心,马兰,
申请(专利权)人:航天信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。