【技术实现步骤摘要】
【国外来华专利技术】用于本地私有非交互通信的系统和方法
[0001]相关申请
[0002]本申请要求于2021年3月31日提交的美国临时专利申请第63/168533号的优先权和权益。美国临时专利申请第63/168,533号以全文引用的方式并入本文。
[0003]本公开一般涉及用于本地私有非交互通信的系统和方法。更具体地,本公开涉及在一轮非交互式本地模型中的差分私有k均值聚类。
技术介绍
[0004]聚类,诸如k均值聚类,涉及基于从点到聚类中心的距离将维度输入点的集合分组或聚类成聚类。在k均值聚类中,点是基于从点到其相应的聚类中心的欧几里德距离进行聚类的,其中,目标是将点分配到候选中心以最小化所有点的总成本,并且可能受到其他约束。
[0005]差分隐私已经成为一种流行的隐私定义,提供了强有力的保证和数学上的严谨性。差分隐私规定,输入集合中的轻微变化在输出时不可追踪。出现了两种主要的差分隐私模型:中心模型,其中,可信的中央管理器将数据编码为差分私有的;和分布式模型,诸如本地模型,其中,没有中央管理器,而是期望每个客户端的输出是差分私有的。
技术实现思路
[0006]本公开的实施例的方面和优点将在以下的描述中部分被阐述,或可以从描述中获知,或可以通过实施例的实践来获知。
[0007]本公开的一个示例方面涉及一种计算机实现的用于以改进的隐私对数据进行编码以供通信的方法。方法可以包括由包括一个或多个计算设备的计算系统获得包括一个或多个输入数据点的输入数据。方法可以包括由计算系统构造包括一个或多个输入 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的用于以改进的隐私对数据进行编码以供通信的方法,所述方法包括:由包括一个或多个计算设备的计算系统获得包括一个或多个输入数据点的输入数据;由所述计算系统构造包括所述一个或多个输入数据点的潜在代表的网树,所述潜在代表被布置在多个层中,所述网树包括分层数据结构,所述分层数据结构包括多个分层组织节点;由所述计算系统从所述网树的所述潜在代表中确定所述一个或多个输入数据点中的每一个的代表,所述代表包括所述多个分层组织节点中的一个;由所述计算系统对所述一个或多个输入数据点中的每一个的所述代表进行编码以供通信。2.根据任一前述权利要求所述的计算机实现的方法,进一步包括:在从所述网树的所述潜在代表中确定所述一个或多个输入数据点中的每一个的代表之前,将所述一个或多个输入数据点投射到随机子空间;以及在将所述一个或多个输入数据点投射到所述随机子空间之后,将所述投射的输入数据点缩放到降维的子空间。3.根据任一前述权利要求所述的计算机实现的方法,其中,由所述计算系统对所述一个或多个输入数据点中的每一个的所述代表进行编码以供通信包括:由所述计算系统通过广义分桶矢量求和编码器模型对所述代表进行编码。4.根据权利要求3所述的计算机实现的方法,其中,所述广义分桶矢量求和编码器模型包括共享均匀随机分量和潜在代表的点积的矢量编码。5.根据任一前述权利要求所述的计算机实现的方法,其中,由所述计算系统对所述一个或多个输入数据点中的每一个的所述代表进行编码以供通信包括:由所述计算系统通过广义直方图编码器模型对所述代表进行编码。6.根据权利要求5所述的计算机实现的方法,其中,所述广义直方图编码器模型基于共享均匀随机分量产生输出,其中,所述输出以概率为正,并且以概率为负,其中,ε是差分隐私的超参数。7.根据任一前述权利要求所述的计算机实现的方法,其中,所述一个或多个输入数据点的输入数据点的所述代表包括与所述输入数据点最近的潜在代表。8.根据权利要求7所述的计算机实现的方法,其中,所述与所述输入数据点最近的潜在代表包括相对于所述网树中的其他潜在代表中的每一个,与所述输入数据点具有最小欧几里德距离的潜在代表。9.根据任一前述权利要求所述的计算机实现的方法,其中,所述通信包括差分隐私的本地模型。10.根据任一前述权利要求所述的计算机实现的方法,其中,所述通信包括差分隐私的混洗模型。11.根据任一前述权利要求所述的计算机实现的方法,其中,由所述计算系统构造包括所述一个或多个输入数据点的潜在代表的所述网树包括:由所述计算系统确定扩展阈值;
由所述计算系统在所述网树中的第一层识别所述网树中的一个或多个最高排名节点的数量,所述数量等于所述扩展阈值;以及由所述计...
【专利技术属性】
技术研发人员:B加齐,S拉维库马,A张,P马努朗西,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。