用于内容准个性化的低熵浏览历史制造技术

技术编号:29420901 阅读:13 留言:0更新日期:2021-07-23 23:18
本公开提供了用于经由诸如数百万或数十亿个设备之类的多个设备的聚合的浏览历史来进行内容准个性化或匿名化内容检索的系统和方法。稀疏矩阵可以从聚合的浏览历史中构建,并且在维度上减小,从而减小熵并且为各个设备提供匿名性。可以经由用于表示相似浏览历史的准个性化聚类来选择相关内容,而无需将各个设备细节暴露于内容提供者。

【技术实现步骤摘要】
【国外来华专利技术】用于内容准个性化的低熵浏览历史相关申请的交叉引用本申请要求于2019年11月27日提交的专利技术名称为“LowEntropyBrowsingHistoryforContentQuasi-Personalization”(用于内容准个性化的低熵浏览历史)的美国专利申请No.16/698,548的优先权,该美国专利申请要求于2019年8月8日提交的专利技术名称为“LowEntropyBrowsingHistoryforContentQuasi-Personalization”(用于内容准个性化的低熵浏览历史)的美国专利申请No.16/535,912以及于2019年8月16日提交的专利技术名称为“LowEntropyBrowsingHistoryforContentQuasi-Personalization”(用于内容准个性化的低熵浏览历史)的美国专利申请No.62/887,902的优先权,上述美国专利申请的每一个都通过引用将其全部内容并入本文。
技术介绍
在诸如互联网的计算机联网环境中,内容提供者可以提供要插入到由在客户端设备上执行的应用(例如,web浏览器)所处理和渲染的信息资源(例如,网页)中的内容项。个性化内容递送通常基于捕获用户和/或设备的标识信息,诸如所述设备的浏览或访问历史。但是,这可能导致收集可分别跟踪的数据,使用户面临潜在安全风险并且消耗过多的计算资源。
技术实现思路
本文所讨论的系统和方法经由诸如数百万或数十亿个设备的大量设备的聚合浏览历史来提供内容准个性化或匿名化内容检索。稀疏矩阵可以从聚合浏览历史构建,并且在维度上减小,以减小熵并且为各个设备提供匿名性。可以经由用于表示相似浏览历史的准个性化聚类来选择相关内容,而无需将各个设备详细信息暴露给内容提供者。在一个方面,本公开针对一种用于匿名化内容检索的方法。该方法包括由计算设备的浏览器应用来基于所述计算设备的浏览历史生成简档。该方法还包括通过浏览器应用将所述简档编码为n维向量。该方法还包括由浏览器应用根据n维向量来计算降维向量。该方法还包括由浏览器应用确定与降维向量相对应的第一聚类。该方法还包括由浏览器应用向内容服务器传送对内容项的请求,该请求包括第一聚类的标识。该方法还包括由浏览器应用从内容服务器中接收根据第一聚类的标识所选择的内容项。在一些实施方式中,该方法包括通过从计算设备的用户的浏览历史的日志标识在预定时间段内对多个地址中的每一个地址的访问次数,来生成基于该浏览历史的简档。在一些实施方式中,该方法包括生成具有用于表示如下的值的字符串:在预定时间段内对与该字符串中的对应位置相关联的地址的一个或多个访问中的每一个。在一些实施方式中,该方法包括执行n维向量的奇异值分解。在另一实施方式中,该方法包括从第二计算设备接收奇异值分解的奇异向量集合。在又一实施方式中,该方法包括将n维向量传送到第二计算设备,该第二计算设备基于所述计算设备的n维向量和至少一个其它计算设备的n维向量的聚合来计算所述奇异向量集合。在一些实施方式中,该方法包括从第二计算设备接收多个聚类中的每个聚类的边界。在另一实施方式中,该方法包括响应于降维向量在第一聚类的边界内而选择所述多个聚类中的第一聚类。在一些实施方式中,该方法包括由浏览器应用从第二计算设备接收基于该计算设备的n维向量和至少一个其它计算设备的n维向量的聚合而确定的神经网络模型的权重;通过浏览器应用的机器学习系统,将神经网络模型应用于降维向量,以生成对预定聚类集合的排名;并且通过浏览器应用来选择第一聚类作为预定聚类集合中的排名最高的聚类。在另一方面,本公开针对一种用于匿名化内容检索的方法。该方法包括由服务器计算设备从多个客户端计算设备中的每个客户端计算设备接收基于相应的客户端计算设备的浏览历史的简档,每个简档包括n维向量。该方法还包括由所述服务器计算设备将多个简档的多个n维向量聚合为矩阵。该方法还包括由所述服务器计算设备来计算所述矩阵的奇异值分解以生成奇异值集合。该方法还包括由服务器计算设备向多个客户端计算设备中的每一个客户端计算设备和至少一个内容提供者设备传送所述奇异值集合。在一些实施方式中,该方法包括由服务器计算设备确定所述矩阵的聚类集合中的每个聚类的边界。在另一实施方式中,该方法包括由服务器计算设备向多个客户端计算设备中的每一个客户端计算设备和至少一个内容提供者设备传送所述矩阵的聚类集合中的每个聚类的边界。在一些实施方式中,该方法包括由所述服务器计算设备从所述矩阵经由神经网络模型来标识聚类集合中的每个聚类。在另一实施方式中,该方法包括将神经网络模型的权重传送到多个客户端计算设备中的每一个客户端计算设备和至少一个内容提供者设备。在另一方面,本公开针对一种用于匿名化内容检索的系统。该系统包括:计算设备,该计算设备包括与内容服务器通信的网络接口;存储器,该存储器存储该计算设备的浏览历史;以及浏览器应用。所述浏览器应用被配置为:生成基于所述计算设备的浏览历史的简档;以及将所述简档编码为n维向量;根据所述n维向量计算降维向量;确定对应于所述降维向量的第一聚类;经由网络接口向内容服务器传送对内容项的请求,该请求包括第一聚类的标识;并且经由所述网络接口从内容服务器接收根据所述第一聚类的标识所选择的内容项。在一些实施方式中,浏览器应用还被配置为生成具有值的字符串,该值表示在预定时间段内对与该字符串中的对应位置相关联的地址的一个或多个访问中的每一个。在一些实施方式中,浏览器应用还被配置为执行n维向量的奇异值分解。在另一实施方式中,浏览器应用还被配置为经由网络接口从第二计算设备接收所述奇异值分解的奇异向量集合。在又一个实施方式中,浏览器应用还被配置为经由网络接口将n维向量传送到第二计算设备,该第二计算设备基于所述计算设备的n维向量和至少一个其它计算设备的n维向量的聚合来计算所述奇异向量集合。在一些实施方式中,浏览器应用还被配置为经由网络接口从第二计算设备接收基于所述计算设备的n维向量和至少一个其它计算设备的n维向量的聚合而确定的神经网络模型的权重;将所述神经网络模型应用于降维向量,以生成对预定聚类集合的排名;并且选择第一聚类作为所述预定聚类集合中的排名最高的聚类。至少一个方面涉及一种编码用于内容选择的标识符的方法。在客户端设备上执行的第一应用可以标识在客户端设备上维护的浏览历史。浏览历史可以记录由客户端设备经由第一应用所访问的信息资源。第一应用可以将分类模型应用于所述第一应用的浏览历史,以标识用于将第一应用分类到其中的类别。第一应用可以将所述第一应用分配给与所标识的类别相对应的类别标识符。用于第一应用的类别标识符可以与用于第二应用的类别标识符相同。第一应用可以从内容发布者设备接收信息资源,该信息资源包括主要内容和可用于从内容选择服务接收内容的内容槽。第一应用可以针对所述信息资源的所述内容槽生成对内容的请求,所述对内容的请求包括用于所述第一应用的所述类别标识符。第一应用可以向所述内容选择服务传送所述对内容的请求。所述内容选择服务可以使用用于所述第一应用和用于所述第二应用的类别标识符,本文档来自技高网...

【技术保护点】
1.一种编码用于选择内容的标识符的方法,包括:/n标识经由在客户端设备上执行的第一应用所访问的多个信息资源;/n从所述多个信息资源中的每个信息资源中提取与所述信息资源的至少一部分内容相对应的特征;/n将分类模型应用于从所述多个信息资源中所提取的特征,以标识用于将所述第一应用归类到其中的类别集合;/n确定来自所述类别集合中的一个类别满足分配给该类别的应用的阈值数量;/n响应于确定所述类别满足所述阈值数量,将所述第一应用分配给与所述类别相对应的类别标识符,用于所述第一应用的所述类别标识符与用于第二应用的所述类别标识符相同;/n从内容发布者设备接收信息资源以用于经由所述第一应用呈现,该信息资源包括主要内容和可用于从内容选择服务接收内容的内容槽;/n针对所述信息资源的所述内容槽,生成对内容的请求,所述对内容的请求包括用于所述第一应用的所述类别标识符;以及/n向所述内容选择服务传送所述对内容的请求,所述内容选择服务使用用于所述第一应用和所述第二应用的类别标识符来选择内容项以插入到所述信息资源的所述内容槽中。/n

【技术特征摘要】
【国外来华专利技术】20190808 US 16/535,912;20190816 US 62/887,902;20191.一种编码用于选择内容的标识符的方法,包括:
标识经由在客户端设备上执行的第一应用所访问的多个信息资源;
从所述多个信息资源中的每个信息资源中提取与所述信息资源的至少一部分内容相对应的特征;
将分类模型应用于从所述多个信息资源中所提取的特征,以标识用于将所述第一应用归类到其中的类别集合;
确定来自所述类别集合中的一个类别满足分配给该类别的应用的阈值数量;
响应于确定所述类别满足所述阈值数量,将所述第一应用分配给与所述类别相对应的类别标识符,用于所述第一应用的所述类别标识符与用于第二应用的所述类别标识符相同;
从内容发布者设备接收信息资源以用于经由所述第一应用呈现,该信息资源包括主要内容和可用于从内容选择服务接收内容的内容槽;
针对所述信息资源的所述内容槽,生成对内容的请求,所述对内容的请求包括用于所述第一应用的所述类别标识符;以及
向所述内容选择服务传送所述对内容的请求,所述内容选择服务使用用于所述第一应用和所述第二应用的类别标识符来选择内容项以插入到所述信息资源的所述内容槽中。


2.根据权利要求1所述的方法,还包括:响应于接收到所述信息资源,根据混淆策略从所述类别集合中选择所述类别,所述混淆策略指定一种条件,在所述条件下相对应的类别标识符被允许包括在与所述信息资源的所述内容槽相关联的对内容的请求中。


3.根据权利要求1所述的方法,还包括:
响应于接收到第二信息资源,根据混淆策略,选择从应用所述分类模型而标识的所述类别集合中的第二类别标识符,所述第二类别标识符与分配给所述第一应用的所述类别不同;以及
针对所述第二信息资源的内容槽,生成对内容的第二请求,所述对内容的第二请求包括与所述第二类别相对应的第二类别标识符,而不是与所述类别相对应的所述类别标识符。


4.根据权利要求1所述的方法,还包括:
响应于接收到第二信息资源,根据混淆策略,确定不包括任何类别标识符到对内容的第二请求中以插入到所述第二信息资源的内容槽中;以及
响应于确定不包括任何类别标识符,向所述内容选择服务传送所述对内容的第二请求,所述对内容的第二请求缺少任何类别标识符。


5.根据权利要求1所述的方法,其中,确定所述类别满足所述阈值数量还包括:通过使用利用与所述类别相对应的所述类别标识符所生成的加密类别标识符,与类别授权服务协同地执行阈值密码协议。


6.根据权利要求1所述的方法,其中,确定所述类别满足阈值数量还包括:对照用于由类别授权服务所维护的类别标识符的概率数据结构,来检查所述类别标识符。


7.根据权利要求1所述的方法,其中,传送所述对内容的请求还包括:传送所述对内容的请求,所述内容选择服务使用所述类别标识符来维护用于所述第一应用和所述第二应用的聚合浏览历史。


8.根据权利要求1所述的方法,其中,应用所述分类模型还包括:应用所述分类模型,以从多个类别中标识在由所述分类模型定义的特征空间中彼此在接近度阈值内的所述类别集合。


9.根据权利要求1所述的方法,还包括:通过使用降维过程根据从所述客户端设备标识出的所述浏览历史来生成简化的特征向量集合,所述特征向量在文件大小方面小于所述浏览历史;以及
其中,应用所述分类模型还包括:将所述分类模型应用于根据所述浏览历史所生成的简化的特征向量集合。


10.根据权利要求1所述的方法,其中,提取所述特征还包括:从所述信息资源的至少一部分内容中提取所述特征,所述一部分内容包括以下中的至少一项:文本数据、视觉数据或音频数据。


11.一...

【专利技术属性】
技术研发人员:迈克尔·S·克莱贝尔王刚丹尼尔·罗伯特·拉梅奇查尔斯·谢弗·哈里森乔希·福雷斯特·卡林马塞尔·M·M·容
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1