用于本地私有非交互通信的系统和方法技术方案

技术编号:37349368 阅读:15 留言:0更新日期:2023-04-22 21:47
一种计算机实现的用于以改进的隐私对数据进行编码以供通信的方法包括由包括一个或多个计算设备的计算系统获得包括一个或多个输入数据点的输入数据。方法可以包括由计算系统构造包括一个或多个输入数据点的潜在代表的网树,潜在代表被布置在多个层中,网树包括分层数据结构,分层数据结构包括多个分层组织节点。方法可以包括由计算系统从网树的潜在代表中确定一个或多个输入数据点中的每一个的代表,代表包括多个分层组织节点中的一个。方法可以包括由计算系统对一个或多个输入数据点中的每一个的代表进行编码以供通信。点中的每一个的代表进行编码以供通信。点中的每一个的代表进行编码以供通信。

【技术实现步骤摘要】
【国外来华专利技术】用于本地私有非交互通信的系统和方法
[0001]相关申请
[0002]本申请要求于2021年3月31日提交的美国临时专利申请第63/168533号的优先权和权益。美国临时专利申请第63/168,533号以全文引用的方式并入本文。


[0003]本公开一般涉及用于本地私有非交互通信的系统和方法。更具体地,本公开涉及在一轮非交互式本地模型中的差分私有k均值聚类。

技术介绍

[0004]聚类,诸如k均值聚类,涉及基于从点到聚类中心的距离将维度输入点的集合分组或聚类成聚类。在k均值聚类中,点是基于从点到其相应的聚类中心的欧几里德距离进行聚类的,其中,目标是将点分配到候选中心以最小化所有点的总成本,并且可能受到其他约束。
[0005]差分隐私已经成为一种流行的隐私定义,提供了强有力的保证和数学上的严谨性。差分隐私规定,输入集合中的轻微变化在输出时不可追踪。出现了两种主要的差分隐私模型:中心模型,其中,可信的中央管理器将数据编码为差分私有的;和分布式模型,诸如本地模型,其中,没有中央管理器,而是期望每个客户端的输出是差分私有的。

技术实现思路

[0006]本公开的实施例的方面和优点将在以下的描述中部分被阐述,或可以从描述中获知,或可以通过实施例的实践来获知。
[0007]本公开的一个示例方面涉及一种计算机实现的用于以改进的隐私对数据进行编码以供通信的方法。方法可以包括由包括一个或多个计算设备的计算系统获得包括一个或多个输入数据点的输入数据。方法可以包括由计算系统构造包括一个或多个输入数据点的潜在代表的网树,潜在代表被布置在多个层中,网树包括分层数据结构,分层数据结构包括多个分层组织节点。方法可以包括由计算系统从网树的潜在代表中确定一个或多个输入数据点中的每一个的代表,代表包括多个分层组织节点中的一个。方法可以包括由计算系统对一个或多个输入数据点中的每一个的代表进行编码以供通信。
[0008]本公开的另一示例方面涉及一种计算机实现的用于对由基于网树的编码算法编码的数据进行解码的方法。方法可以包括由可以包括一个或多个计算设备的计算系统获得包括编码直方图数据的编码输入数据。方法可以包括由计算系统至少部分地基于编码直方图数据来确定解码的频率预测。方法可以包括由计算系统至少部分基于解码的频率预测构造网树,网树包括多个叶。方法可以包括由计算系统对网树执行k均值近似算法,以根据相应的最近中心将多个叶划分成多个分区。
[0009]本公开的另一示例方面涉及一种计算机实现的用于以差分隐私保证和降低的近似比率对输入数据点进行聚类的方法。方法包括由包括一个或多个计算设备的计算系统获
得包括一个或多个输入数据点的输入数据。方法包括由计算系统构造包括一个或多个输入数据点的潜在代表的网树,潜在代表被布置在多个层中,网树包括分层数据结构,分层数据结构包括多个分层组织节点和多个分层组织节点之间的多个映射。方法可以包括由计算系统从网树的潜在代表中确定一个或多个输入数据点中的每一个的代表,代表包括多个分层组织节点中的一个。
[0010]本公开的其他方面涉及各种系统、装置、非瞬时性计算机可读介质、用户接口和电子设备。
[0011]将结合以下描述和所附权利要求书,本公开的各实施例的这些和其他特征、方面和优点将变得更好理解。并入并且构成本说明书的一部分的附图说明了本公开的示例实施例,并且与描述一起用于解释相关原理。
附图说明
[0012]参考附图的本说明书阐述了涉及本领域普通技术人员的实施例的详细讨论,其中:
[0013]图1描述了根据本公开的示例实施例的执行本地差分私有通信的示例计算系统的框图。
[0014]图2描述了根据本公开的示例实施例的构造网树的示例算法。
[0015]图3描述了根据本公开的示例实施例的用于计算扩展阈值以平衡k均值目标的示例算法。
[0016]图4描述了根据本公开的示例实施例的用于对用于非交互式本地差分私有通信的私有输入数据点进行编码的示例算法。
[0017]图5描述了根据本公开的示例实施例的用于对用于非交互式本地差分私有通信的私有输入数据点进行解码的示例算法。
[0018]图6A描述了根据本公开的示例实施例的示例直方图编码器。
[0019]图6B描述了根据本公开的示例实施例的示例直方图解码器。
[0020]图7A描述了根据本公开的示例实施例的示例分桶矢量求和编码器。
[0021]图7B描述了根据本公开的示例实施例的示例分桶矢量求和解码器。
[0022]图8描述了根据本公开的示例实施例的用于对用于非交互式差分私有通信的私有用户数据进行编码的示例方法的框图。
[0023]图9描述了根据本公开的示例实施例的用于对由基于网树的编码算法编码的私有数据进行解码的示例方法的框图。
[0024]图10描述了根据本公开的示例实施例的被配置成执行本文中描述的任何操作的示例计算设备的框图。
[0025]在多个附图中被重复的附图标记旨在标识各种实施方式中的相同特征。
具体实施方式
[0026]通常,本公开涉及用于本地私有非交互通信的系统和方法。根据本公开的示例方面的系统和方法可以采用被称为网树的分层对象来构造多个私有输入点的私有核心集。然后,私有核心集可以被编码,以通过强大的差分隐私保证来保持用户隐私。然后,解码器模
型(例如,在聚合器计算设备处)可以在编码核心集上运行近似算法,该近似算法可能不一定是私有的。根据本公开的示例方面的系统和方法可以在用于差分隐私的非交互式本地模型中工作,因为每个源可以对其相应输入点的所有潜在代表进行编码,而不需要与聚合器的任何交互(例如,任何来回通信)。
[0027]差分隐私(DP)可以被正式定义,使得对于ε>0和δ∈[0,1],随机算法是(ε,δ)

DP,如果对于在一个点上存在差异的输入的每对X,X

并且对于算法的可能输出的每个子集S,它保持当δ=0时,算法被称为ε

DP。类似地,差分隐私的本地模型可以被正式定义如下。设n为用户数,X={x1,

x
n
}并且输入x
i
由第i个用户持有。本地DP模型中的算法由编码器和解码器组成,编码器的输入是由一个用户持有的数据并且其输出是消息序列,解码器的输入是来自所有编码器的消息的级联并且其输出是算法的输出。在本地模型中,一对(Enc,Dec)是(ε,δ)

DP,如果对于任何输入X=(x1,

,x
n
),算法是(ε,δ)

DP。
[0028]具体而言,根据本公开的示例方面的系统和方法可以在诸如与用户相关联的多个源计算设备(例如,移动设备、膝上型电脑等)之间或客户端设备(例如,与中央服务器通信)与聚合器计算设备(也被称为分析器)之间提供差分私有和/或非交互式(例如,一轮)通信。在差分隐私的分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的用于以改进的隐私对数据进行编码以供通信的方法,所述方法包括:由包括一个或多个计算设备的计算系统获得包括一个或多个输入数据点的输入数据;由所述计算系统构造包括所述一个或多个输入数据点的潜在代表的网树,所述潜在代表被布置在多个层中,所述网树包括分层数据结构,所述分层数据结构包括多个分层组织节点;由所述计算系统从所述网树的所述潜在代表中确定所述一个或多个输入数据点中的每一个的代表,所述代表包括所述多个分层组织节点中的一个;由所述计算系统对所述一个或多个输入数据点中的每一个的所述代表进行编码以供通信。2.根据任一前述权利要求所述的计算机实现的方法,进一步包括:在从所述网树的所述潜在代表中确定所述一个或多个输入数据点中的每一个的代表之前,将所述一个或多个输入数据点投射到随机子空间;以及在将所述一个或多个输入数据点投射到所述随机子空间之后,将所述投射的输入数据点缩放到降维的子空间。3.根据任一前述权利要求所述的计算机实现的方法,其中,由所述计算系统对所述一个或多个输入数据点中的每一个的所述代表进行编码以供通信包括:由所述计算系统通过广义分桶矢量求和编码器模型对所述代表进行编码。4.根据权利要求3所述的计算机实现的方法,其中,所述广义分桶矢量求和编码器模型包括共享均匀随机分量和潜在代表的点积的矢量编码。5.根据任一前述权利要求所述的计算机实现的方法,其中,由所述计算系统对所述一个或多个输入数据点中的每一个的所述代表进行编码以供通信包括:由所述计算系统通过广义直方图编码器模型对所述代表进行编码。6.根据权利要求5所述的计算机实现的方法,其中,所述广义直方图编码器模型基于共享均匀随机分量产生输出,其中,所述输出以概率为正,并且以概率为负,其中,ε是差分隐私的超参数。7.根据任一前述权利要求所述的计算机实现的方法,其中,所述一个或多个输入数据点的输入数据点的所述代表包括与所述输入数据点最近的潜在代表。8.根据权利要求7所述的计算机实现的方法,其中,所述与所述输入数据点最近的潜在代表包括相对于所述网树中的其他潜在代表中的每一个,与所述输入数据点具有最小欧几里德距离的潜在代表。9.根据任一前述权利要求所述的计算机实现的方法,其中,所述通信包括差分隐私的本地模型。10.根据任一前述权利要求所述的计算机实现的方法,其中,所述通信包括差分隐私的混洗模型。11.根据任一前述权利要求所述的计算机实现的方法,其中,由所述计算系统构造包括所述一个或多个输入数据点的潜在代表的所述网树包括:由所述计算系统确定扩展阈值;
由所述计算系统在所述网树中的第一层识别所述网树中的一个或多个最高排名节点的数量,所述数量等于所述扩展阈值;以及由所述计...

【专利技术属性】
技术研发人员:B加齐S拉维库马A张P马努朗西
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1