【技术实现步骤摘要】
本专利技术属于表格数据处理领域,尤其涉及一种隐私增强的关系型表格数据仿真生成方法。
技术介绍
1、在各类人工智能应用中,通常需要对多表进行数据处理整合,与传统的单表数据场景不同,多表数据往往具有外键关联。这要求仿真数据不仅能够反映原始单表数据的统计特性,还能在复杂的多表关系网络中维持数据的一致性和关联性。现有方法通过外键将父表和子表连接成单表,然后使用单表算法进行仿真数据合成。然而,不相关属性的连接不仅使得仿真算法的运行效率降低,而且只能保持“u表与l表”或“v表与l表”的关联关系,对仿真数据的效用具有不利影响,不仅无法适用于“多对多”外键关联的表格数据,而且没有应用隐私增强技术对模型和生成数据进行必要的隐私保护。
技术实现思路
1、为了解决上述问题,本专利技术提供一种隐私增强的关系型表格数据仿真生成方法。
2、本专利技术是这样实现的,一种隐私增强的关系型表格数据仿真生成方法,所述方法包括以下步骤:
3、步骤s1:挖掘链接表l与具有外键关联的单表u、v中高度相关的属
...【技术保护点】
1.一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述步骤S1包括以下步骤:
3.根据权利要求1所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述步骤S2包括以下步骤:
4.根据权利要求3所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,步骤S2中得到生成模型后,在生成模型上采样得到合并表的仿真数据,算法有两个终止条件,一是若要维持仿真数据行数与原始表相同,当算法生成与原链接表L相同行数的仿真数据时终
...【技术特征摘要】
1.一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述步骤s1包括以下步骤:
3.根据权利要求1所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,所述步骤s2包括以下步骤:
4.根据权利要求3所述的一种隐私增强的关系型表格数据仿真生成方法,其特征在于,步骤s2中得到生成模型后,在生成模型上采样得到合并表的仿真数据,算法有两个终止条件,一是若要维持仿真数据行数与原始表相同,当算法生成与原链接表l相同行数的仿真数据时终止;二是若要维持外键一致,当算法生成与原链接表l相同行数的仿真数据时,检查原链接表l的外键是否存在于仿真数据表中,若均存在,则算法终止,若有缺失,则继续使用生成模型采样,直到原链接表l的外键全部存在为止。
5.根据权利要...
【专利技术属性】
技术研发人员:刘川意,卓腾龙,韩培义,段少明,
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。