跨域数据融合方法、系统以及存储介质技术方案

技术编号:19745456 阅读:35 留言:0更新日期:2018-12-12 04:46
本公开提供了一种跨域数据融合方法、系统以及存储介质,涉及数据挖掘技术领域,其中方法包括:获得数据域中的与用户关键词信息相对应的用户特征信息,将与用户特征信息转换为隐含特征信息,对用户关键词信息进行多次加密处理,对用户关键词信息密文与隐含特征信息进行融合处理生成域用户融合特征,根据用户关键词信息密文对多个数据域的域用户融合特征进行融合处理,获得跨域用户融合特征。本公开的跨域数据融合方法、系统以及存储介质,可以避免由于用户关键词泄露导致的用户原始数据泄露,将用户特征信息转换为隐含特征信息并进行融合处理,提高了对于各个领域数据汇总特征的表示能力,能够提升数据挖掘准确度和安全性。

【技术实现步骤摘要】
跨域数据融合方法、系统以及存储介质
本公开涉及数据挖掘
,尤其涉及一种跨域数据融合方法、系统以及存储介质。
技术介绍
传统数据挖掘通常处理的是来自单一数据域的数据,把将同一领域的多个数据集合并成具有一致数据模式的数据库。而在大数据时代背景下,经常面临着来自不同领域、不同来源的各类数据,这些数据往往由多种形式组成,每种形式都有着不同的表示、分布、规模以及密度。来自不同领域的多个数据集通过潜在对象进行了隐式连接,例如,一个用户的电商平台交易数据,个人信用记录和人口统计特性描述了该用户的潜在消费能力。现有的跨域数据融合首先在不同的存储源当中分别进行用户的特征融合,之后通过用户的Key(主键)的对应关系,将来自多个存储地方的所有特征进一步融合,最后得到用户关于多个存储地方的汇总跨域特征。用户的不同领域数据都是隐私敏感的,一旦用户Key的加密方式泄露,攻击方可以利用用户Key的密文反推得到用户Key,造成用户各领域知识甚至原始特征信息的泄露,并且各个存储地方的输出是由用户Key密文和低阶的原始特征融合组成,安全性较低。
技术实现思路
有鉴于此,本专利技术要解决的一个技术问题是提供一种跨域数据本文档来自技高网...

【技术保护点】
1.一种跨域数据融合方法,包括:获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息;基于特征转换模型将与所述用户特征信息转换为隐含特征信息;根据预设的加密规则对所述用户关键词信息进行多次加密处理;对用户关键词信息密文与所述隐含特征信息进行融合处理,生成所述数据域的域用户融合特征;根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理,获得跨域用户融合特征。

【技术特征摘要】
1.一种跨域数据融合方法,包括:获得数据域中的数据源存储的与用户关键词信息相对应的用户特征信息;基于特征转换模型将与所述用户特征信息转换为隐含特征信息;根据预设的加密规则对所述用户关键词信息进行多次加密处理;对用户关键词信息密文与所述隐含特征信息进行融合处理,生成所述数据域的域用户融合特征;根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理,获得跨域用户融合特征。2.如权利要求1所述的方法,所述获得数据域中的数据源存储的与用户关键词相对应的用户特征信息包括:根据所述用户关键词信息并按照预设的关联映射规则生成查询SQL语句;将所述查询SQL语句发送到所述数据源中执行,用以获取所述用户特征信息。3.如权利要求1所述的方法,所述基于预设的加密规则对所述用户关键词信息进行多次加密处理包括:采用第一加密算法将所述用户关键词进行第一次加密;采用第二加密算法将第一次加密后的密文数据进行二次加密,获得所述用户关键词信息密文;其中,所述第一加密算法包括:MD5算法;所述第二加密算法包括:AES算法。4.如权利要求1所述的方法,所述基于特征转换模型将与所述用户特征信息转换为隐含特征信息包括:将预先提供的初始用户特征信息和初始隐含特征信息作为训练样本;使用深度学习方法并基于所述训练样本对预设的深度学习模型进行训练,获得所述特征转换模型;将所述预设的深度学习模型更新为所述特征转换模型,通过将所述用户特征信息输入所述特征转换模型,获得与所述用户特征信息相对应的所述隐含特征信息。5.如权利要求4所述的方法,所述使对预设的深度学习模型进行训练包括:将所述初始用户特征信息作为输入特征数据,将与所述初始用户特征信息相对应的所述初始隐含特征信息作为初始预测结果;基于所述输入特征数据和所述初始预测结果对所述预设的深度学习模型进行训练。6.如权利要求4所述的方法,所述用户特征信息包括多个特征参数,所述特征转换模型的数量为多个;所述获得与所述用户特征信息相对应的所述隐含特征信息包括:将所述多个特征参数中的至少一个特征参数输入各个所述特征转换模型,获得多个所述隐含特征信息。7.如权利要求6所述的方法,其中,所述特征转换模型包括:三层神经元模型;所述三层神经元模型包括:输入层神经元模型、中间层神经元模型和输出层神经元模型;每层神经元模型的输出作为下一层神经元模型的输入;其中,所述输入层神经元模型的神经元与所述多个特征参数中的至少一个特征参数相对应,所述输出层神经元模型的神经元与所述隐含特征信息相对应。8.如权利要求7所述的方法,其中,所述三层神经元模型为具有全连接结构的多个神经网络层的子网络结构;其中,所述中间层神经元模型为全连接层。9.如权利要求6所述的方法,所述隐含特征信息为多维数字向量;其中,所述对所述用户关键词密文与所述隐含特征信息进行融合处理、生成所述数据域的域用户融合特征包括:获取多个所述特征转换模型输出的多个多维数字向量;将所述用户关键词信息密文与所述多个多维向量进行合并处理,生成域用户融合特征向量。10.如权利要求9所述的方法,所述根据所述用户关键词信息密文对多个数据域的域用户融合特征进行融合处理、获得跨域用户融合特征包括:获取与所述用户关键词信息密文相对应的多个数据域的域用户融合特征向量;将所述多个数据域的域用户融合特征向量进行合并处理,生成跨域用户融合特征向量。11.一种跨域数据融合系统,包括:原始信息获取模块,用于获得数据域中的数据源存储的与用户关键词信...

【专利技术属性】
技术研发人员:张钧波郑宇梁宇轩
申请(专利权)人:北京京东金融科技控股有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1