一种隐私增强的关系型表格数据仿真生成方法技术

技术编号:44655419 阅读:13 留言:0更新日期:2025-03-17 18:47
本发明专利技术提供了一种隐私增强的关系型表格数据仿真生成方法,挖掘链接表L与具有外键关联的单表U、V中高度相关的属性,并将属性与链接表L进行合并,得到k个属性对相应的U、V表中的属性;根据链接表L的外键对应关系,将得到的属性与链接表L进行拼接,得到合并表,根据链接表L的属性,将合并表按列切分,得到仿真生成的链接表;根据链接表的合成结果,使用马尔科夫随机场模型仿真生成表;根据链接表的合成结果,使用马尔科夫随机场模型仿真生成表。在仿真数据生成时提高仿真数据的效用,确保仿真数据在保护隐私的同时仍能保持其真实性和有效性。

【技术实现步骤摘要】

本专利技术属于表格数据处理领域,尤其涉及一种隐私增强的关系型表格数据仿真生成方法


技术介绍

1、在各类人工智能应用中,通常需要对多表进行数据处理整合,与传统的单表数据场景不同,多表数据往往具有外键关联。这要求仿真数据不仅能够反映原始单表数据的统计特性,还能在复杂的多表关系网络中维持数据的一致性和关联性。现有方法通过外键将父表和子表连接成单表,然后使用单表算法进行仿真数据合成。然而,不相关属性的连接不仅使得仿真算法的运行效率降低,而且只能保持“u表与l表”或“v表与l表”的关联关系,对仿真数据的效用具有不利影响,不仅无法适用于“多对多”外键关联的表格数据,而且没有应用隐私增强技术对模型和生成数据进行必要的隐私保护。


技术实现思路

1、为了解决上述问题,本专利技术提供一种隐私增强的关系型表格数据仿真生成方法。

2、本专利技术是这样实现的,一种隐私增强的关系型表格数据仿真生成方法,所述方法包括以下步骤:

3、步骤s1:挖掘链接表l与具有外键关联的单表u、v中高度相关的属性,并将属性与链接表本文档来自技高网...

【技术保护点】

1.一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述步骤S1包括以下步骤:

3.根据权利要求1所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述步骤S2包括以下步骤:

4.根据权利要求3所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,步骤S2中得到生成模型后,在生成模型上采样得到合并表的仿真数据,算法有两个终止条件,一是若要维持仿真数据行数与原始表相同,当算法生成与原链接表L相同行数的仿真数据时终止;二是若要维持外键...

【技术特征摘要】

1.一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述步骤s1包括以下步骤:

3.根据权利要求1所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述步骤s2包括以下步骤:

4.根据权利要求3所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,步骤s2中得到生成模型后,在生成模型上采样得到合并表的仿真数据,算法有两个终止条件,一是若要维持仿真数据行数与原始表相同,当算法生成与原链接表l相同行数的仿真数据时终止;二是若要维持外键一致,当算法生成与原链接表l相同行数的仿真数据时,检查原链接表l的外键是否存在于仿真数据表中,若均存在,则算法终止,若有缺失,则继续使用生成模型采样,直到原链接表l的外键全部存在为止。

5.根据权利要...

【专利技术属性】
技术研发人员:刘川意卓腾龙韩培义段少明
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1