【技术实现步骤摘要】
一种适用于多应用场景的安全数据融合系统
[0001]本专利技术涉及大数据
,具体涉及一种适用于多应用场景的安全数据融合系统。
技术介绍
[0002]热数据指存在于数据需求方系统中,业务尚未完结或者可能存在更新,需要被访问和更新的数据。而冷数据指已完成的业务存档数据,无更新需求。冷数据通常适合离线的分析,比如机器学习中的模型训练或者大数据分析。但机器学习训练完成后,则需要最新的业务数据代入,才能知道业务的开展。随着信息技术的发展,以智能制造、人工智能为代表的新技术正开启全新变革,引领全球经济发展。人工智能的核心是数据,离开数据的支撑人工智能将难以实现复杂的功能。然而,目前人工智能需要的数据分散在不同的企业和部门系统中。出于隐私保护需要、竞争关系等等原因,导致目前的数据难以进行分享和融合,形成了一个个的数据孤岛。这严重限制了人工智能技术的发展。因而有必要研制一种数据分享的机制,在确保数据隐私的前提下,实现数据的分享和流通。
[0003]如中国专利CN113268474A,公开日2021年8月17日,一种多维数据融合 ...
【技术保护点】
【技术特征摘要】
1.一种适用于多应用场景的安全数据融合系统,其特征在于,包括数据接收节点、若干个数据存储节点、若干个保留节点、模型节点和信息节点,所述数据接收节点接收数据源方提交的数据描述文本和外部主键字段标识信息,为数据源方的数据行分配行编号,所述保留节点设置在数据源方,所述保留节点与数据源方系统同步数据,所述保留节点为数据行制作若干个副本,副本关联行编号,所述保留节点保留一个副本作为保留副本,将数据行的数值型字段的真实值拆分为若干个加数,若干个加数分别分配给若干个副本,非数值型字段的真实值由保留副本存储,其余副本保存混淆值,若干个副本分别分配给若干个数据存储节点存储,所述模型节点接收数据需求方提交的数据处理模型,为数据处理模型分配模型编号,所述信息节点展示数据接收节点收到的数据行的行编号、对应的数据描述文本和外部主键字段标识信息,数据需求方查看所述信息节点展示的信息获得需要调用的数据行的行编号,将行编号和模型编号提交给模型节点,所述模型节点将行编号发送给数据存储节点和保留节点,所述数据存储节点和保留节点建立多方安全计算将数据行代入数据处理模型,将模型结果发送给所述模型节点,所述模型节点将模型结果反馈给数据需求方。2.根据权利要求1所述的一种适用于多应用场景的安全数据融合系统,其特征在于,所述数据存储节点开辟有若干个存储区,所述存储区包括若干个存储块,所述存储块的空间与副本及行编号所需空间匹配,所述数据存储节点为每个存储区设置有若干个交换对,所述数据存储节点将最新收到副本追加存储在当前存储区的空闲存储块中,检查副本与上一条副本是否存在按位对齐的交换对,若存在则将对齐的交换对内容交换存储位置;若存储区无空闲存储块,则将副本存储在新存储区的第一个存储块,且不做交换对的检查;调取行编号对应的数据行时,所述数据存储节点按照行编号找到副本存储的存储块;首先向下检查与下一个存储块的副本是否存在对齐的交换对,若存在,则继续在检查出的交换对所在位置上,向下检查是否存在对齐的交换对;若存在则继续在最新检查出的交换对位置上,向下检查是否存在对齐的交换对,直到未检查出交换对或者到达存储区的最后一个存储块;将向下检查出存在交换对的全部存储块复制出一个副本,从最后一个存储块开始,依次交换对齐交换对的存储位置进行副本的复原;复原后检测与上一个存储块的副本是否存在对齐的交换对,若存在,则将对齐的交换对交换存储位置;即复原出行编号对应的存储块内的副本。3.根据权利要求1或2所述的一种适用于多应用场景的安全数据融合系统,其特征在于,数据源方建立替代数表,将非数值型字段的取值替换为对应的替代数,所述接收节点为收到的数据行建立若干个副本,副本数量与存储节点数量匹配,将数据行的非数值型字段的替代数拆分为若干个加数,加数分配给副本存储,将若干个副本分配给若干个存储节点存储。4.根据权利要求3所述的一种适用于多应用场景的安全数据融合系统,其特征在于,所述数据源方建立一个关联副本,所述关联副本和保留副本的取值互为相反数,建立关联节点,所述关联副本存储在关联节点上,若数据行发生变化,则数据源方将数据变化量叠加到保留副本,数据存储节点、保留节点和关联节点建立多方安全计算...
【专利技术属性】
技术研发人员:张金琳,高航,俞学劢,
申请(专利权)人:浙江数秦科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。