公开了用于小组成员活动的快速合并的系统和方法。该系统可以维护多个小组成员标识符,每个标识符与相应的多个离线内容事件一起存储,并且从多个小组成员标识符中识别与匹配目标离线内容事件的相应离线内容事件一起存储的小组成员标识符的子集。该系统可以将每个子集映射到对应于具有虚拟设备属性的虚拟设备的相应的多个独特标识符。对于子集中的每一个,系统可以将相应的多个独特标识符简化为表示相应的多个独特标识符的略图。该系统可以将小组成员标识符的子集中的每一个的略图组合成聚合的略图,并且将该聚合的略图发送到计算设备,以便与表示在线内容事件的聚合的略图一起进行分析。起进行分析。起进行分析。
【技术实现步骤摘要】
【国外来华专利技术】通过快速合并数据源进行跨媒体报告的系统和方法
[0001]相关申请
[0002]本申请要求2020年9月24日提交的题为“Cross Media Reporting by Fast Merging of TV Panelist Activity and YouTube Log”的第63/082,980号美国临时专利申请的权益和优先权,其全部内容通过引用结合于此。
技术介绍
[0003]在许多情况下,作为数据分析或处理的一部分,计算和数据分析系统可以确定大的数据集的交集或并集。计算跨多个源分布的大的数据集的并集、交集或频率通常涉及在多个源之间共享有关大的数据集的信息。来自每个源的信息可能包括隐私的或受保护的信息,共享此类信息可能会对隐私和安全产生负面影响。
技术实现思路
[0004]本公开的至少一个方面涉及一种通过小组成员(panelist)活动的快速合并进行跨媒体报告的方法。该方法可以包括由包括一个或多个处理器和存储器的数据处理系统维护多个小组成员标识符,每个小组成员标识符与相应的多个离线内容事件一起存储。该方法可以包括由数据处理系统从多个小组成员标识符中识别与相应的多个离线内容事件中与目标离线内容事件相匹配的相应的离线内容事件一起存储的小组成员标识符的子集。该方法可以包括由数据处理系统将小组成员标识符的子集中的每一个映射到对应于具有虚拟设备属性的虚拟设备的相应的多个独特标识符。该方法可以包括由数据处理系统针对小组成员标识符的子集中的每一个将相应的多个独特标识符简化为表示相应的多个独特标识符的略图(sketch)。该方法可以包括由数据处理系统将小组成员标识符的子集中的每一个的略图组合到聚合的略图中。该方法可以包括由数据处理系统将聚合的略图发送到计算设备,以与表示在线内容事件的聚合的略图一起进行分析。
[0005]在一些实施方式中,为多个小组成员标识符的子集中的每一个生成略图可以包括进一步基于采样技术,对于多个小组成员标识符的子集中的每一个,将相应的多个独特标识符简化成表示相应的多个独特标识符的略图。在一些实施方式中,采样技术是深度略图子采样。在一些实施方式中,该方法可以包括确定多个小组成员标识符中的每一个的权重。
[0006]在一些实施方式中,将多个小组成员标识符的子集中的每一个映射到相应的多个独特标识符进一步基于多个小组成员标识符的子集中的每一个的权重。在一些实施方式中,将多个小组成员标识符的子集中的每一个的略图组合到聚合的略图中可以包括确定跨多个小组成员标识符的子集中的每一个的略图的最大寄存器值。在一些实施方式中,将多个小组成员标识符的子集中的每一个的略图组合到聚合的略图中可以包括选择与跨多个小组成员标识符的子集中的每一个的略图的每一个位置的最大寄存器值相对应的位置的值作为聚合的略图中的对应位置的值。
[0007]在一些实施方式中,为多个小组成员标识符的子集中的每一个生成略图可以包括为多个小组成员标识符的子集中的每一个生成超双对数(Hyper
‑
Log
‑
Log,HLL)略图。在一
些实施方式中,将多个小组成员标识符的子集中的每个小组成员标识符映射到相应的多个独特标识符进一步基于将小组成员标识符的属性数据与相应的多个独特标识符中的每个的属性数据进行匹配。在一些实施方式中,
[0008]在一些实施方式中,维护每个都与相应的多个离线内容事件标识符相关联地存储的多个小组成员标识符可以包括从与多个小组成员标识符中的小组成员标识符相对应的小组成员计算设备接收消息,该消息标识相应的离线事件。在一些实施方式中,维护每个都与相应的多个离线内容事件标识符相关联地存储的多个小组成员标识符可以包括与小组成员标识符相关联地存储在消息中标识的相应离线事件的标识符。
[0009]本公开的至少一个其他方面涉及一种系统,该系统被配置用于通过快速合并小组成员活动来进行跨媒体报告。该系统可以包括数据处理系统,该数据处理系统包括耦合到存储器的一个或多个处理器。通过包括一个或多个处理器和存储器的数据处理系统,数据处理系统可以维护多个小组成员标识符,每个小组成员标识符与相应的多个离线内容事件一起存储。通过数据处理系统,数据处理系统可以从多个小组成员标识符中识别与相应的多个离线内容事件中与目标离线内容事件相匹配的相应的离线内容事件一起存储的小组成员标识符的子集。通过数据处理系统,数据处理系统可以将小组成员标识符的子集中的每一个映射到对应于具有虚拟设备属性的虚拟设备的相应的多个独特标识符。通过数据处理系统,数据处理系统可以针对小组成员标识符的子集中的每一个将相应的多个独特标识符简化为表示相应的多个独特标识符的略图。通过数据处理系统,数据处理系统可以将小组成员标识符的子集中的每一个的略图组合到聚合的略图中。通过数据处理系统,数据处理系统可以将聚合的略图传输到计算设备,以便与表示在线内容事件的聚合的略图一起进行分析。
[0010]在一些实施方式中,为了生成多个小组成员标识符的子集中的每一个的略图,数据处理系统进一步被配置为进一步基于采样技术,针对多个小组成员标识符的子集中的每一个,将相应的多个独特标识符简化成表示相应的多个独特标识符的略图。在一些实施方式中,采样技术是深度略图子采样。在一些实施方式中,数据处理系统还被配置为确定多个小组成员标识符中的每一个的权重。在一些实施方式中,数据处理系统还被配置成进一步基于多个小组成员标识符的子集中的每一个的权重,将多个小组成员标识符的子集中的每一个映射到相应的多个独特标识符。
[0011]在一些实施方式中,为了将多个小组成员标识符的子集中的每一个的略图组合到聚合的略图中,数据处理系统还被配置为确定跨多个小组成员标识符的子集中的每一个的略图的最大寄存器值。在一些实施方式中,为了将多个小组成员标识符的子集中的每一个的略图组合到聚合的略图中,数据处理系统还被配置为选择与跨多个小组成员标识符的子集中的每一个的略图的每个位置的最大寄存器值相对应的位置的值,作为聚合的略图中的对应位置的值。
[0012]在一些实施方式中,为了生成多个小组成员标识符的子集中的每一个的略图,数据处理系统还被配置为生成多个小组成员标识符的子集中的每一个的HLL略图。在一些实施方式中,为了将多个小组成员标识符的子集中的每个小组成员标识符映射到相应的多个独特标识符,数据处理系统还被配置为将小组成员标识符的属性数据与相应的多个独特标识符中的每一个的属性数据进行匹配。在一些实施方式中,为了维护每个都与相应的多个
离线内容事件标识符相关联地存储的多个小组成员标识符,数据处理系统还被配置为从与多个小组成员标识符中的小组成员标识符相对应的小组成员计算设备接收消息,该消息标识相应的离线事件。在一些实施方式中,为了维护每个都与相应的多个离线内容事件标识符相关联地存储的多个小组成员标识符,数据处理系统还被配置为与小组成员标识符相关联地存储在消息中标识的相应离线事件的标识符。
[0013]本公开的又一方面涉及其上体现指令的非瞬态计算机可读存储介质,所述指令可由一个或多个处理器执行,以本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:由包括一个或多个处理器和存储器的数据处理系统维护多个小组成员标识符,每个小组成员标识符与相应的多个离线内容事件标识符相关联地存储;由所述数据处理系统从所述多个小组成员标识符中识别与相应的多个离线内容事件中与目标离线内容事件相匹配的相应离线内容事件一起存储的所述多个小组成员标识符的子集;由所述数据处理系统将所述多个小组成员标识符的所述子集中的每一个映射到对应于具有虚拟设备属性的虚拟设备的相应的多个独特标识符;由所述数据处理系统基于所述相应的多个独特标识符为所述多个小组成员标识符的所述子集中的每一个生成略图;由所述数据处理系统将所述多个小组成员标识符的所述子集中的每一个的略图组合到聚合的略图中;和由所述数据处理系统将所述聚合的略图发送到计算设备,以与表示在线内容事件的聚合的略图一起进行分析。2.根据权利要求1所述的方法,其中,为所述多个小组成员标识符的所述子集中的每一个生成略图进一步包括,由所述数据处理系统进一步基于采样技术针对所述多个小组成员标识符的所述子集中的每一个,将所述相应的多个独特标识符简化成表示所述相应的多个独特标识符的所述略图。3.根据权利要求2所述的方法,其中,所述采样技术是深度略图子采样。4.根据权利要求1所述的方法,进一步包括,由所述数据处理系统确定所述多个小组成员标识符中的每一个的权重。5.根据权利要求4所述的方法,其中,将所述多个小组成员标识符的所述子集中的每一个映射到所述相应的多个独特标识符进一步基于所述多个小组成员标识符的所述子集中的每一个的所述权重。6.根据权利要求1所述的方法,其中,将所述多个小组成员标识符的所述子集中的每一个的所述略图组合到所述聚合的略图中进一步包括,由所述数据处理系统确定跨所述多个小组成员标识符的所述子集中的每一个的所述略图的最大寄存器值。7.根据权利要求6所述的方法,其中,将所述多个小组成员标识符的所述子集中的每一个的所述略图组合到所述聚合的略图中进一步包括,由所述数据处理系统选择与跨所述多个小组成员标识符的所述子集中的每一个的所述略图的每个位置的所述最大寄存器值相对应的位置的值,作为所述聚合的略图中的对应位置的值。8.根据权利要求1所述的方法,其中,为所述多个小组成员标识符的所述子集中的每一个生成所述略图进一步包括,由所述数据处理系统为所述多个小组成员标识符的所述子集中的每一个生成Hyper
‑
Log
‑
Log(HLL)略图。9.根据权利要求1所述的方法,其中,将所述多个小组成员标识符的所述子集中的每一个小组成员标识符映射到所述相应的多个独特标识符进一步基于由所述数据处理系统将所述小组成员标识符的属性数据与所述相应的多个独特标识符中的每一个的属性数据进行匹配。10.根据权利要求1所述的方法,其中,维护其中每一个小组成员标识符与所述相应的
多个离线内容事件标识符相关联地存储的所述多个小组成员标识符进一步包括:由所述数据处理系统从与所述多个小组成员标识符中的小组成员标识符相对应的小组成员计算设备接收消息,该消息标识相应的离线事件;和由所述数据处理系统将在所述消息中标识的所述相应离线事件的标识符与所述小组成员标识符相关联地存储。11.一种系统,包括:数据处...
【专利技术属性】
技术研发人员:S蔡,E斯科沃特索夫,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。