用于用户标识符集合的交集的私密性保护确定的系统和方法技术方案

技术编号:28434715 阅读:71 留言:0更新日期:2021-05-11 18:46
至少一个方面涉及确定第一用户标识符集合和第二用户标识符集合中的用户标识符的交集的估计。可以用已经与相同内容项或内容项活动进行交互的用户标识符来填充第一和第二用户标识符集合。可以基于二项式矢量法、计数矢量法或混合法来确定第一集合和第二集合的相交的估计。二项式矢量方法基于第一集合中每个用户标识符的k个散列生成矢量,并将这些矢量求和以生成第一矢量。可以基于从第二用户标识符集合类似地生成的第一矢量和第二矢量的点积来确定交集。

【技术实现步骤摘要】
【国外来华专利技术】用于用户标识符集合的交集的私密性保护确定的系统和方法本申请要求下述的权益和优先权:2019年10月3日提交的美国专利申请No.16/592,110,其本身是下述的继续,并要求其优先权:2019年9月9日提交的美国专利申请No.16/564,130,其本身要求下述的权益和优先权:2019年7月22日提交的美国临时专利申请No.62/877,251和2019年7月5日提交的美国临时专利申请No.62/870,970;2019年10月3日提交的美国专利申请No.16/592,110也要求下述的权益和优先权:2019年7月22日提交的美国临时专利申请No.62/877,251和2019年7月5日提交的美国临时专利申请No.62/870,970;并且本申请还要求下述的权利和优先权:2019年7月22日提交的美国临时专利申请No.62/877,251和2019年7月5日提交的美国临时专利申请No.62/870,970。上述每个已标识的申请的内容通过引用整体并入本文。
技术介绍
在诸如互联网的计算机联网环境中,第三方内容提供商提供第三方内容项以在终端用户计算设备上显示。这些第三方内容项,例如广告,可以被显示在与相应发布者相关联的网页上。这些第三方内容项可以包括标识提供该内容项的第三方内容提供者的内容。
技术实现思路
由本公开解决的一个技术问题是在维护用户的私密性的同时由第三方确定用户与来自两个不同的内容递送平台的内容项集合之间的交互的总数中的困难。例如,第三方可能想要估计与跨两个单独的内容递送平台的某个内容项集合的用户交互的总数。然而,从每个内容递送平台向第三方发送关于用户及其交互的所有信息将向第三方提供关于每个用户的私人信息。本公开中解决的挑战涉及向第三方提供足够的数据以估计与某个内容项集合的用户交互的总数,同时维护每个内容递送平台的用户的私密性。通过使每个用户交互散列化,一个人能够在维护关于用户交互的一些信息的同时保护用户的私密性。这种信息是能够在进一步运算中使用的确定性位集合,但是不包含关于个别用户或其交互的具体信息。这些散列的碎片能够用于构造被称作矢量的数据结构。因为在用户交互数据上使用的散列运算是确定性的,所以存在于两个不同的内容递送平台上的用户交互将对每个平台的矢量具有相同的定量贡献。能够将矢量发送到第三方,该第三方能够处理来自两个不同的内容递送平台的矢量,以使用统计分析来估计与跨两个平台的内容项集合的用户交互的总数。本申请要求于2019年7月5日提交的临时申请62/870970和于2019年7月22日提交的临时申请62/877251的优先权。每个申请的内容通过引用并入于此。至少一个方面涉及一种用于估计与由不同的内容递送平台提供的内容项集合的独特用户交互的数目的方法。该方法包括经由网络向第一内容递送平台传送散列函数集合。该方法还包括经由网络将散列函数集合传送到第二内容递送平台。该方法还包括经由网络从第一内容递送平台接收第一矢量,该第一矢量的每个坐标等于基于多个散列的和,其中每个散列是从经由第一内容递送平台发生的与内容项集合的多个用户交互中的一个计算出的。该方法还包括经由网络从第二内容递送平台接收第二矢量,该第二矢量的每个坐标等于基于多个散列的和,其中每个散列是从经由第二内容递送平台发生的与内容项集合的多个用户交互中的一个计算出的。该方法还包括基于第一矢量的元素之和来估计经由第一内容递送平台发生的与内容项集合的用户交互的数目。该方法还包括基于第二矢量的元素之和来估计经由第二内容递送平台发生的与内容项集合的用户交互的数目。该方法还包括基于经由第一内容递送平台发生的与内容项集合的用户交互的数目、经由第二内容递送平台发生的与内容项集合的用户交互的数目以及第一矢量和第二矢量的点积来估计与由第一内容递送平台和第二内容递送平台两者提供的内容项集合的独特用户交互的数目。在一些实施方式中,该方法包括经由网络向第一内容递送平台传送对第一矢量的第一请求。在一些实施方式中,该方法包括经由网络向第二内容递送平台传送对第二矢量的第二请求。在一些实施方式中,第一请求包括散列函数集合。在一些实施方式中,第二请求包括散列函数集合。在一些实施方式中,该方法包括基于第一矢量中的所有坐标的和除以第一矢量中的坐标的数目的两倍来估计经由第一内容递送网络发生的与内容项集合的用户交互的总数。在一些实施方式中,该方法包括基于第二矢量中的所有坐标的和除以第二矢量中的坐标的数目的两倍来估计经由第二内容递送网络发生的与内容项集合的用户交互的总数。在一些实施方式中,该方法包括基于经由第一内容递送平台发生的与内容项集合的用户交互的数目、经由第二内容递送平台发生的与内容项集合的用户交互的数目以及第一矢量和第二矢量的协方差来估计与由第一内容递送平台和第二内容递送平台两者提供的内容项集合的独特用户交互的数目。至少另一方面涉及一种用于提供关于与内容项集合的用户交互的匿名数据的方法。该方法包括经由网络接收用于标识散列函数集合的数据。该方法还包括检索多个用户标识符,这些用户标识符中的每个标识由多个用户中的相应用户与内容项集合的交互。该方法还包括:对于多个用户标识符中的每个,生成用户标识符的k个散列,每个散列与散列函数集合中的一个对应;以及生成用户矢量,该用户矢量的每个坐标与相应散列的位值对应。该方法还包括通过对多个生成的用户矢量求和来生成交互矢量。该方法还包括经由网络将所生成的交互矢量传送到请求方。至少另一方面涉及一种用于提供关于与内容项集合的用户交互的匿名数据的方法。该方法包括经由网络从请求方接收对交互矢量的请求,该请求包括用于标识散列函数的数据。该方法还包括检索多个用户标识符,这些用户标识符中的每个标识由多个用户中的相应用户与内容项集合的交互。该方法还包括:对于多个用户标识符中的每个,使用包括在请求中的散列函数来生成用户标识符的散列值;确定散列值的前m位的值;以及递增与该值对应的寄存器的计数,该寄存器是k个寄存器之一,其中k=2^m。该方法还包括生成交互矢量,该交互矢量的每个坐标等于对应的第k个寄存器的计数。该方法还包括经由网络将所生成的交互矢量传送到请求方。在另一方面中,本公开涉及一种系统,该系统包括一个或多个处理器,该处理器被配置成估计与由不同的内容递送平台提供的内容项集合的独特用户交互的数目。在一些实施方式中,一个或多个处理器被配置成经由网络向第一内容递送平台传送散列函数集合。在一些实施方式中,一个或多个处理器被配置成经由网络将散列函数集合传送到第二内容递送平台。在一些实施方式中,一个或多个处理器被配置成经由网络从第一内容递送平台接收第一矢量,该第一矢量的每个坐标等于基于多个散列的和,其中每个散列是从经由第一内容递送平台发生的与内容项集合的多个用户交互中的一个计算出的。在一些实施方式中,一个或多个处理器被配置成经由网络从第二内容递送平台接收第二矢量,该第二矢量的每个坐标等于基于多个散列的和,其中每个散列是从经由第二内容递送平台发生的与内容项集合的多个用户交互中的一个计算出的。在一些实施方式中,一本文档来自技高网...

【技术保护点】
1.一种用于估计与由不同的内容递送平台提供的内容项集合的独特用户交互的数目的方法,包括:/n经由网络将散列函数集合传送到第一内容递送平台;/n经由网络将所述散列函数集合传送到第二内容递送平台;/n经由网络从所述第一内容递送平台接收第一矢量,所述第一矢量的每个坐标等于基于多个散列的和,其中每个散列是从经由所述第一内容递送平台发生的与所述内容项集合的多个用户交互中的一个计算出的;/n经由网络从所述第二内容递送平台接收第二矢量,所述第二矢量的每个坐标等于基于多个散列的和,其中每个散列是从经由所述第二内容递送平台发生的与所述内容项集合的多个用户交互中的一个计算出的;/n基于所述第一矢量的元素之和来估计经由所述第一内容递送平台发生的与所述内容项集合的用户交互的数目;/n基于所述第二矢量的元素之和来估计经由所述第二内容递送平台发生的与所述内容项集合的用户交互的数目;以及/n基于经由所述第一内容递送平台发生的与所述内容项集合的所述用户交互的数目、经由所述第二内容递送平台发生的与所述内容项集合的所述用户交互的数目、所述第一矢量以及所述第二矢量来估计与由所述第一内容递送平台和所述第二内容递送平台两者提供的所述内容项集合的独特用户交互的数目。/n...

【技术特征摘要】
【国外来华专利技术】20190705 US 62/870,970;20190722 US 62/877,251;20191.一种用于估计与由不同的内容递送平台提供的内容项集合的独特用户交互的数目的方法,包括:
经由网络将散列函数集合传送到第一内容递送平台;
经由网络将所述散列函数集合传送到第二内容递送平台;
经由网络从所述第一内容递送平台接收第一矢量,所述第一矢量的每个坐标等于基于多个散列的和,其中每个散列是从经由所述第一内容递送平台发生的与所述内容项集合的多个用户交互中的一个计算出的;
经由网络从所述第二内容递送平台接收第二矢量,所述第二矢量的每个坐标等于基于多个散列的和,其中每个散列是从经由所述第二内容递送平台发生的与所述内容项集合的多个用户交互中的一个计算出的;
基于所述第一矢量的元素之和来估计经由所述第一内容递送平台发生的与所述内容项集合的用户交互的数目;
基于所述第二矢量的元素之和来估计经由所述第二内容递送平台发生的与所述内容项集合的用户交互的数目;以及
基于经由所述第一内容递送平台发生的与所述内容项集合的所述用户交互的数目、经由所述第二内容递送平台发生的与所述内容项集合的所述用户交互的数目、所述第一矢量以及所述第二矢量来估计与由所述第一内容递送平台和所述第二内容递送平台两者提供的所述内容项集合的独特用户交互的数目。


2.根据权利要求1所述的方法,其中,从所述第一内容递送平台接收所述第一矢量包括:接收经由所述第一内容递送平台发生的用户交互的数目。


3.根据权利要求1所述的方法,其中,从所述第二内容递送平台接收所述第二矢量包括:接收经由所述第二内容递送平台发生的用户交互的数目。


4.根据权利要求1所述的方法,其中,从所述第一内容递送平台接收所述第一矢量包括:从所述第一内容递送平台接收第一多个矢量,其中,所述第一多个矢量中的每个矢量与所述散列函数集合中的一个散列对应。


5.根据权利要求4所述的方法,其中,从所述第二内容递送平台接收所述第二矢量包括:从所述第二内容递送平台接收第二多个矢量,其中,所述第二多个矢量中的每个矢量与所述散列函数集合中的一个散列对应。


6.根据权利要求5所述的方法,其中,估计所述独特用户交互的数目是基于所述第一多个矢量和所述第二多个矢量中的每个矢量的点积的平均值。


7.根据权利要求1所述的方法,其中,估计经由所述第一内容递送平台发生的与所述内容项集合的用户交互的数目是基于所述第一矢量的每个坐标的和。


8.根据权利要求1所述的方法,其中,估计经由所述第二内容递送平台发生的与所述内容项集合的用户交互的数目是基于所述第二矢量的每个坐标的和。


9.根据权利要求1所述的方法,其中,估计经由所述第一和第二内容递送平台发生的与所述内容项集合的独特用户交互的数目是基于确定所述第一矢量和所述第二矢量之间的协方差。


10.根据权利要求1所述的方法,其中,估计所述独特用户交互的数目包括:从经由所述第一内容递送平台发生的所述用户交互的数目与经由所述第二内容递送平台发生的所述用户交互的数目的和减去所述第一矢量和所述第二矢量的点积。<...

【专利技术属性】
技术研发人员:迈克尔·威廉·多布斯科特·施奈德约瑟夫·西恩·卡希尔·古德奈特·奈斯布鲁克马胜劳拉·格雷斯·布克
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1