数据识别方法、装置和存储介质及电子装置制造方法及图纸

技术编号:27935847 阅读:18 留言:0更新日期:2021-04-02 14:16
本发明专利技术公开了一种数据识别方法、装置和存储介质及电子装置。其中,该方法包括:获取目标用户的目标数据;将目标数据输入数据识别模型,其中,数据识别模型为利用多个样本数据进行训练后得到的用于识别数据的决策树模型,多个样本数据为整合至少两个目标来源的样本数据后获得的数据,至少两个目标来源中的至少一个目标来源的样本数据中包括至少一个类别的用户标签;获取数据识别模型输出的识别结果,其中,识别结果包括目标用户的目标用户标签。本发明专利技术解决了数据识别的效率较低的技术问题。

【技术实现步骤摘要】
数据识别方法、装置和存储介质及电子装置
本专利技术涉及计算机领域,具体而言,涉及一种数据识别方法、装置和存储介质及电子装置。
技术介绍
近年来,随着互联网技术和传统金融的快速融合,越来越多的金融交易和活动(如第三方支付和网络借贷)已经实现了数字化,利用丰富的业务数据进行快速准确的预测是在金融实践中需求强烈。在众多的建模应用实践中,规则化的模型输出由于其易于解释,易于落地而受到业务应用的欢迎。但金融场景下的业务数据往往不够海量、全面以及集中,而冲突的是建模往往需要海量、全面以及集中的业务数据,进而导致现有技术很难训练出一个完整可用的数据识别模型以识别业务数据,降低了数据的识别效率。概括而言,在现有技术中存在数据的识别效率较低的技术问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据识别方法、装置和存储介质及电子装置,以至少解决数据识别的效率较低的技术问题。根据本专利技术实施例的一个方面,提供了一种数据识别方法,包括:获取目标用户的目标数据;将上述目标数据输入数本文档来自技高网...

【技术保护点】
1.一种数据识别方法,其特征在于,包括:/n获取目标用户的目标数据;/n将所述目标数据输入数据识别模型,其中,所述数据识别模型为利用多个样本数据进行训练后得到的用于识别数据的决策树模型,所述多个样本数据为整合至少两个目标来源的样本数据后获得的数据,所述至少两个目标来源中的至少一个目标来源的样本数据中包括至少一个类别的用户标签;/n获取所述数据识别模型输出的识别结果,其中,所述识别结果包括所述目标用户的目标用户标签。/n

【技术特征摘要】
1.一种数据识别方法,其特征在于,包括:
获取目标用户的目标数据;
将所述目标数据输入数据识别模型,其中,所述数据识别模型为利用多个样本数据进行训练后得到的用于识别数据的决策树模型,所述多个样本数据为整合至少两个目标来源的样本数据后获得的数据,所述至少两个目标来源中的至少一个目标来源的样本数据中包括至少一个类别的用户标签;
获取所述数据识别模型输出的识别结果,其中,所述识别结果包括所述目标用户的目标用户标签。


2.根据权利要求1所述的方法,其特征在于,在所述获取目标用户的目标数据之前,包括:
获取所述多个样本数据;
对每个所述样本数据使用对应的用户标签进行标记,得到标记后的所述多个样本数据;
将标记后的所述多个样本数据输入初始数据识别模型,以训练得到所述数据识别模型。


3.根据权利要求2所述的方法,其特征在于,所述获取所述多个样本数据,包括:
获取公钥,以及第一目标来源的第一样本数据,其中,所述第一样本数据使用所述公钥进行同态加密,所述至少两个目标来源包括所述第一目标来源,所述第一样本数据中包括所述对应的用户标签;
基于第二目标来源的第二样本数据以及所述第一样本数据,提取目标特征值,其中,所述目标特征值用于表示对应一组样本数据以及所述样本数据对应的用户标签,所述目标特征值使用所述公钥进行所述同态加密;
计算所述多个样本数据各自对应的所述目标特征值的求和结果,及第一分布统计结果,其中,所述第一分布统计结果用于表示所述对应的用户标签在所述第一样本数据以及所述第二样本数据的分布情况,其中,所述至少两个目标来源包括所述第二目标来源;
将所述求和结果与所述第一分布统计结果发送至所述第一目标来源,以使所述第一目标来源使用所述公钥对应的私钥进行解码,得到解码后的所述求和结果和所述第一分布统计结果,并基于解码后的所述求和结果和所述第一分布统计结果获取所述多个样本数据。


4.根据权利要求2所述的方法,其特征在于,所述获取所述多个样本数据,包括:
获取第三目标来源的第三样本数据,并基于所述第三样本数据提取第一特征值,其中,所述第三样本数据包括所述对应的用户标签,每个所述第一特征值用于表示所述第三样本数据的每一组样本数据以及所述样本数据对应的用户标签,所述至少两个目标来源包括所述第三目标来源;
获取第四目标来源的第四样本数据,并基于所述第四样本数据提取第二特征值,其中,所述第四样本数据包括所述对应的用户标签,每个所述第二特征值用于表示所述第四样本数据的每一组样本数据以及所述样本数据对应的用户标签,所述至少两个目标来源包括所述第四目标来源;
合并所述第一特征值以及所述第二特征值,以获得合并后的特征值;
基于所述合并后的特征值获取所述多个样本数据。


5.根据权利要求4所述的方法,其特征在于,所述基于所述合并后的特征值获取所述多个样本数据,包括:
将所述合并后的特征值使用公钥进行动态加密,并发送至所述第三目标来源,以使所述第三目标来源基于所述第三样本数据以及所述合并后的特征值进行加总计算计算,获取第二分布统计结果,其中,所述第二分布统计结果用于表示所述对应的用户标签在所述第三...

【专利技术属性】
技术研发人员:李琨郑方兰何玥颖彭成霞田江向小佳丁永建李璠
申请(专利权)人:光大科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1