联邦数据关联分析方法、数据推荐方法及装置制造方法及图纸

技术编号:35996867 阅读:43 留言:0更新日期:2022-12-17 23:13
本公开是关于一种联邦数据关联分析方法、数据推荐方法及装置,涉及计算机技术领域。该方法应用于与至少一个第二参与方通信连接的第一参与方,第一参与方根据获取的样本数据确定第一频繁项集及支持度;接收第二参与方发送的第二频繁项集,第二频繁项集由第二参与方根据第二参与方的样本数据获得;确定第一频繁项集出现的情况下,第二频繁项集出现的置信度,并根据置信度确定关联规则。此时,在多参与方间交换频繁项集保留对应的支持度,实现基于隐私保护的联邦关联分析,能够针对数据组成多样、关联关系复杂的分析环境;且无需获取所有源数据即可避免各参与方间数据割裂,既保证了数据隐私安全,也降低了硬件配置要求,降低成本,提高分析效率。提高分析效率。提高分析效率。

【技术实现步骤摘要】
联邦数据关联分析方法、数据推荐方法及装置


[0001]本公开涉及计算机
,具体而言,涉及一种联邦数据关联分析方法、数据推荐方法及装置。

技术介绍

[0002]关联分析又称关联挖掘,是通过数据处理获得项目集合之间关联性、相关性、因果结构或频繁模式的分析技术。在数据推荐的场景中,基于关联分析技术可以根据用户已产生交互行为的项目,确定存在关联性的其他项目,并向用户推荐该其他项目,以实现更准确的数据推荐。
[0003]目前,关联分析通常限于同一领域、平台内,难以在数据割裂的情况下进行准确高效的数据关联分析;而且同一领域、平台内的业务类似,导致数据组成单一、关系简单,难以充分表征网络环境中复杂的关联状态,从而限制了关联规则的实用性、准确性;同时,关联分析也通常为集中式处理、学习和分析,需要获取待分析的所有源数据,对硬件配置要求较高,使得分析成本高,且数据隐私的安全隐患大。
[0004]需要说明的是,在上述
技术介绍
部分公开的数据仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的数据。
专利技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联邦数据关联分析方法,其特征在于,所述方法应用于第一参与方,所述第一参与方与至少一个第二参与方通信连接,所述方法包括:获取样本数据;在所述样本数据中确定第一频繁项集,以及所述第一频繁项集对应的支持度;接收所述第二参与方发送的第二频繁项集,所述第二频繁项集由所述第二参与方根据所述第二参与方的样本数据获得;确定所述第一频繁项集出现的情况下,所述第二频繁项集出现的置信度,并根据所述第二频繁项集出现的置信度确定关联规则。2.根据权利要求1所述的方法,其特征在于,所述确定所述第一频繁项集出现的情况下,所述第二频繁项集出现的置信度,并根据所述第二频繁项集出现的置信度确定关联规则,包括:获取至少一个联邦频繁项集,每个所述联邦频繁项集由一个所述第一频繁项集与一个所述第二频繁项集组合形成,各所述联邦频繁项集间所述第一频繁项集、所述第二频繁项集至少一个不同;确定所述联邦频繁项集对应的联邦支持度;在所述联邦支持度大于联邦支持度阈值的情况下,根据所述支持度和所述联邦支持度,计算所述联邦频繁项集中所述第一频繁项集出现的情况下,所述第二频繁项集出现的置信度;在所述置信度、所述联邦频繁项集符合关联规则条件的情况下,确定所述关联规则包括在所述联邦频繁项集中所述第一频繁项集出现的情况下,所述第二频繁项集出现。3.根据权利要求2所述的方法,其特征在于,所述在所述置信度、所述联邦频繁项集符合关联规则条件的情况下,确定所述关联规则包括在所述联邦频繁项集中所述第一频繁项集出现的情况下,所述第二频繁项集出现之后,还包括:在所述联邦频繁项集包括每种所述第一频繁项集与所述第二频繁项集的组合时,输出所述关联规则。4.根据权利要求2所述的方法,其特征在于,所述关联规则条件为所述置信度大于置信度阈值,且所述联邦频繁项集的长度小于项集长度阈值。5.根据权利要求2所述的方法,其特征在于,所述第一参与方还与中间方通信连接,所述中间方与所述第二参与方通信连接,所述确定所述联邦频繁项集对应的联邦支持度,包括:基于所述联邦频繁项集,通过所述中...

【专利技术属性】
技术研发人员:周一竞
申请(专利权)人:杭州博盾习言科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1