【技术实现步骤摘要】
【国外来华专利技术】隐私保护机器学习预测
技术介绍
[0001]本说明书涉及数据处理和机器学习模型。
[0002]客户端设备能够使用应用(例如,web浏览器、本机应用)来访问内容平台(例如,搜索平台、社交媒体平台或托管内容的另一平台)。内容平台能够在客户端设备上启动的应用内显示可以由一个或多个内容源/平台提供的数字组件(数字内容或数字信息的离散单元,诸如视频剪辑、音频剪辑、多媒体剪辑、图像、文本或另一内容单元)。
技术实现思路
[0003]通常,本说明书中描述的主题的一个创新方面能够体现在包括下述操作的方法中,包括:基于客户端设备上的当前用户活动周期,向客户端设备分配临时组标识符,该临时组标识符从多个不同组中标识包括客户端设备的特定组;为要训练的模型生成训练集,训练集包括(i)基于客户端设备处的当前用户活动周期分配给客户端设备的临时组标识符,(ii)已经被分配临时组标识符的用户的组特征集,以及(iii)由已经被分配临时组标识符的用户执行的用户活动的活动特征集,其中,临时组标识符从多个不同组中标识包括客户端设备的特定组;使用训练集训练模型;从给定客户端设备接收对数字组件的请求,请求至少包括:(i)当前分配给给定客户端设备的临时组标识符,(ii)活动特征集的子集,以及(iii)一个或多个附加特征,其中,一个或多个附加特征基于客户端设备;通过将经训练的模型应用于(i)临时组标识符和(ii)请求中包括的活动特征子集,生成没有在请求中包括的一个或多个用户特性;基于经训练的模型生成的一个或多个用户特性选择一个或多个数字组件;以及向客户端设备发送选择的 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:基于客户端设备上的当前用户活动周期,向客户端设备分配临时组标识符,该临时组标识符从多个不同组中标识包括客户端设备的特定组;为要训练的模型生成训练集,训练集包括(i)基于客户端设备处的当前用户活动周期分配给客户端设备的临时组标识符,(ii)已经被分配临时组标识符的用户的组特征集,以及(iii)由已经被分配临时组标识符的用户执行的用户活动的活动特征集,其中,临时组标识符从多个不同组中标识包括客户端设备的特定组;使用训练集训练模型;从给定客户端设备接收对数字组件的请求,请求至少包括:(i)当前分配给给定客户端设备的临时组标识符,(ii)活动特征集的子集,以及(iii)一个或多个附加特征,其中,一个或多个附加特征基于客户端设备;通过将经训练的模型应用于(i)临时组标识符和(ii)请求中包括的活动特征子集,生成没有在请求中包括的一个或多个用户特性;基于经训练的模型生成的一个或多个用户特性选择一个或多个数字组件;以及向客户端设备发送选择的一个或多个数字组件。2.根据权利要求1所述的方法,其中,组特征集包括:(i)多个统一资源定位器(URL),包括由已经被分配临时组标识符的用户访问的多个URL,(ii)由已经被分配临时组标识符的用户访问的多个URL的表示。3.根据权利要求2所述的方法,其中,组特征集还可以包括:(i)由已经被分配临时组标识符的用户访问的URL的计数和/或比例,(ii)由已经被分配临时组标识符的用户访问的URL处呈现的数字内容中的模式。4.根据权利要求1所述的方法,其中,训练集的每个样本至少包括:(i)已经被分配临时组标识符的用户的匿名标识符,(ii)在用户被分配临时组标识符时用户访问的URL。5.根据权利要求1所述的方法,其中,组特征集包括一个或多个聚合用户组人口统计,共同表征与临时组标识符相对应的特定组中的用户,而不表征特定组中的任何单独用户。6.根据权利要求1所述的方法,其中,组特征集包括聚合上下文预测,其中,聚合上下文预测是基于由已经被分配临时组标识符的用户访问的数字内容的预测输出。7.根据权利要求1所述的方法,其中,活动特征集包括:(i)指定对数字组件的请求来源的地理标识符,(ii)提交对数字组件的请求来源的时间。8.一种系统,包括:基于客户端设备上的当前用户活动周期,向客户端设备分配临时组标识符,该临时组标识符从多个不同组中标识包括客户端设备的特定组;为要训练的模型生成训练集,训练集包括(i)基于客户端设备处的当前用户活动周期分配给客户端设备的临时组标识符,(ii)已经被分配临时组标识符的用户的组特征集,以及(iii)由已经被分配临时组标识符的用户执行的用户活动的活动特征集,其中,临时组标识符从多个不同组中标识包括客户端设备的特定组;使用训练集训练模型;从给定客户端设备接收对数字组件的请求,请求至少包括:(i)当前分配给给定客户端设备的临时组标识符,(ii)活动特征集的子集,以及(iii)一个或多个附加特征,其中,一个
或多个附加特征基于客户端设备;通过将经训练的模型应用于(i)临时组标识符和(ii)请求中包括的活动特征子集,生成没有在请求中包括的一个或多个用户特性;基于经训练的模型生成的一个或多个用户特性选择一个或多个数字组件;以及向客户端设备发送选择的一个或多个数字组件。9.根据权利要求8所述的系统,其中,组特征集包括:(i)多个统一资源定位器(URL),包括由已经被分配临时...
【专利技术属性】
技术研发人员:W黄,JP加德纳,MW道布,AE马约罗夫,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。