【技术实现步骤摘要】
安全多方数据融合与联邦共享方法、装置、设备及介质
本专利技术涉及计算机
,尤其涉及一种安全多方数据融合与联邦共享方法、装置、电子设备及存储介质。
技术介绍
随着大数据技术的发展,常常需要根据数据应用目的,将来自不同数据源的数据进行建模分析,而不同数据源往往分别统计数据,数据采集标准不统一,导致数据在构建之初就存在差异,难以形成数据合力,并且不同数据应用目的,所需数据的来源也不尽相同。比如,新型冠状病毒感染的肺炎的爆发,为公共卫生管理和疫情防控带来了很大的挑战,尤其正逢中国传统春节期间,人员流动性大,导致疫情传播的风险非常高,运用大数据技术可以精准掌握疫区人员信息,定向指导各类人群的风险识别和居家隔离措施,甚至用于疫情研判和趋势分析,当构建疫情预测模型是疫情应用目的时,可能需要来自于不同地区的不同医院的疫情数据,当追踪传播路径是疫情应用目的时,可能需要多家医院的疫情数据、航空铁路的交通数据甚至社交平台的社交关系数据等。传统的数据集成方法主要是将多个数据源的数据统一存放在一个服务器上以实现物理上的数据汇集,效率低下 ...
【技术保护点】
1.一种安全多方数据融合与联邦共享方法,其特征在于:包括以下步骤:/n获取数据集成需求;/n根据所述数据集成需求得到对应的多个数据源,其中,每个数据源具有数据库,所述数据库包括描述原始数据的元数据以及对应表示所述元数据含义的数据表字段;/n基于预先存储的第一数据集成视图和第一数据映射表从所述多个数据源的数据库中加载第一目标数据,包括:从所述第一数据集成视图中的多个候选字段中确定目标字段,根据所述第一数据映射表得到所述目标字段与所述多个数据源的数据库中的各数据表字段之间的映射关系,根据所述多个数据源的数据库中各数据表字段与元数据间的对应关系以及所述映射关系,得到与所述目标字段 ...
【技术特征摘要】 【专利技术属性】
1.一种安全多方数据融合与联邦共享方法,其特征在于:包括以下步骤:
获取数据集成需求;
根据所述数据集成需求得到对应的多个数据源,其中,每个数据源具有数据库,所述数据库包括描述原始数据的元数据以及对应表示所述元数据含义的数据表字段;
基于预先存储的第一数据集成视图和第一数据映射表从所述多个数据源的数据库中加载第一目标数据,包括:从所述第一数据集成视图中的多个候选字段中确定目标字段,根据所述第一数据映射表得到所述目标字段与所述多个数据源的数据库中的各数据表字段之间的映射关系,根据所述多个数据源的数据库中各数据表字段与元数据间的对应关系以及所述映射关系,得到与所述目标字段对应的元数据并将与所述目标字段对应的元数据描述的原始数据作为第一目标数据;
将所述第一目标数据存储至所述多个数据源所在的内存上生成第一数据仓库。
2.如权利要求1所述的一种安全多方数据融合与联邦共享方法,其特征在于:所述第一数据集成视图和所述第一数据映射表通过下述方式生成,包括:
对表示相同含义的各数据表字段进行标准化处理得到与各数据表字段具有相同含义的候选字段;
由表示不同含义的多个候选字段构成所述第一数据集成视图;
将所述多个数据源的数据库中表示相同含义的各数据表字段与各所述数据表字段表示相同含义的候选字段建立映射关系,生成所述第一数据映射表。
3.如权利要求2所述的一种安全多方数据融合与联邦共享方法,其特征在于:从所述第一数据集成视图中的多个候选字段中确定目标字段,包括:在所述多个数据源的数据库中查询是否有与各所述候选字段具有映射关系的数据表字段表示的元数据,若是,将所述候选字段作为目标字段。
4.如权利要求3所述的一种安全多方数据融合与联邦共享方法,其特征在于:将从每个数据源的数据库中加载的原始数据记为子目标数据,所述第一目标数据包括从各数据源的数据库中对应加载的子目标数据;将所述第一目标数据存储至所述多个数据源所在的内存上生成第一数据仓库,包括:
将所述子目标数据存储至对应数据源所在的内存上;
由所述多个数据源的内存上对应存储的多个子目标数据构成所述第一数据仓库。
5.如权利要求2所述的一种安全多方数据融合与联邦共享方法,其特征在于:还包括:
获取新数据集成需求;
根据所述新数据集成需求得到对应的新数据源;
基于所述新数据源得到第二数据仓库;
将所述第二数据仓库与所述第一数据仓库进行关联得到新数据仓库。
6.如权利要求5所述的一种安全多方数据融合与联邦共享方法,其特征在于:基于所述新数据源得到第二数据仓库,包括:
技术研发人员:李宏宇,李晓林,
申请(专利权)人:同盾控股有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。