System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 隐私保护机器学习扩展模型制造技术_技高网

隐私保护机器学习扩展模型制造技术

技术编号:41248997 阅读:3 留言:0更新日期:2024-05-09 23:58
描述了用于使用机器学习模型来在保护用户隐私和数据安全的同时扩展用户组的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。在一个方面,一种方法包括针对基于web的资源接收用户兴趣组集合的用户组标识符集合,每个用户兴趣组包括作为成员的、在给定的时间段从基于web的资源请求内容的一个或多个用户。创建种子用户列表,该种子用户列表包括在用户兴趣组集合中的至少一部分用户的用户标识符。基于与在种子用户列表中的对应于用户标识符的用户的一个或多个特征对应的一个或多个特征值的集合,生成相似的受众机器学习模型。使用该模型识别相似用户集合。

【技术实现步骤摘要】
【国外来华专利技术】

本说明书涉及数据处理和机器学习。


技术介绍

1、客户端设备可以使用应用(例如,web浏览器、本机应用)来访问内容平台(例如,搜索平台、社交媒体平台或托管内容的其他平台)。内容平台可以在客户端设备上启动的应用内显示可以由一个或多个内容源/平台提供的数字组件(数字内容或数字信息的离散单元,诸如例如视频剪辑、音频剪辑、多媒体剪辑、图像、文本或其他内容单元)。


技术实现思路

1、本说明书涉及数据处理和机器学习。机器学习模型可被训练来识别相似用户,然后用于以保护用户隐私和维护数据安全的方式为用户定制内容。

2、一般而言,本说明书中描述的主题的一个创新方面可以体现在以下方法中,该方法包括:针对基于web的资源,接收用户兴趣组集合的用户组标识符集合,每个用户兴趣组包括作为成员的、在给定时间段内从基于web的资源请求内容的一个或多个用户。每个用户兴趣组包括已经被分类为对用户兴趣组的类别感兴趣的多个用户。创建种子用户列表,其包括用户兴趣组集合中的用户的至少一部分的用户标识符。基于与对应于在种子用户列表中的用户标识符的用户的一个或多个特征对应的一个或多个特征值的集合来生成相似受众机器学习模型。使用相似受众机器学习模型识别被分类为与对应于在种子用户列表中的用户标识符的用户相似的相似用户集合。生成扩展用户列表以包括种子用户列表的用户标识符和相似用户集合的用户标识符。基于用户在扩展用户列表中,将与基于web的资源相关的数字内容分发给与扩展用户列表中的用户标识符对应的用户。该方面的其他实施方式包括被配置为执行在计算机存储设备上编码的方法的各方面的对应装置、系统和计算机程序。

3、这些和其他实施方式均可任选地包括以下特征的一个或多个。在一些方面,接收用户组标识符集合包括:从客户端设备接收对基于web的资源的内容的请求;向客户端设备提供内容,该内容包括使客户端设备返回包括作为成员的客户端设备的用户的用户组的用户组标识符的代码;以及,响应于用户请求基于web的资源的内容,将包括作为成员的客户端设备的用户的用户组的用户组标识符添加到用户组标识符集合。

4、在一些方面,相似受众模型包括神经网络、质心模型或k最近邻居模型中的至少一个。创建种子用户列表可以包括:对于用户兴趣组集合中的每个用户兴趣组,确定在给定时间段内从用户兴趣组的成员接收到的对基于web的资源的内容的请求的数量;基于用户兴趣组集合中每个用户兴趣组的数量,选择用户兴趣组集合的合适子集;以及,在种子用户列表中包括用户兴趣组子集中的每个用户兴趣组的每个用户标识符。

5、在一些方面,基于与对应于在种子用户列表中的用户标识符的用户的一个或多个特征对应的一个或多个特征值的集合来生成相似受众机器学习模型可以包括:基于用户兴趣组中的用户的特征值,为每个用户兴趣组识别用户兴趣组的相应特征的相应特征值;以及,使用在用户兴趣组集合中每个用户兴趣组的相应特征值来训练相似受众机器学习模型。

6、在一些方面,基于与对应于在种子用户列表中的用户标识符的用户的一个或多个特征对应的一个或多个特征值的集合来生成相似受众机器学习模型包括:识别在种子用户列表中所有用户的所有特征值;以及,使用在种子用户列表中所有用户的所有特征值训练相似受众机器学习模型。

7、在一些方面,基于与对应于在种子用户列表中的用户标识符的用户的一个或多个特征对应的一个或多个特征值的集合来生成相似受众机器学习模型包括:对于给定的用户兴趣组,基于作为给定用户兴趣组的成员的每个用户的特征值来生成多个用户集群;对于每个集群,生成集群的特征的相应特征值;以及,使用每个集群的特征值训练相似受众机器学习模型。

8、本说明书中描述的主题可以在特定实施例中实现,以便实现以下优点中的一个或多个。本文档中描述的技术可以在使用有限的数据量改进内容选择和分发的同时以保护用户隐私的方式创建和扩展用户组。无需将用户的在线活动发送到内容平台或以其他方式将用户的跨域在线活动泄露给其他计算系统或各方或使用用户的跨域私人信息来扩展用户组成员资格,即可创建和扩展用户组。这保护了相对于此类平台的用户隐私,并保证了数据的安全在向平台和从平台的传输过程中不被泄露。

9、历史上,第三方cookie(例如,来自与客户端设备正在呈现的资源不同的域的cookie)已经被用来通过互联网从客户端设备收集数据。然而,一些浏览器阻止使用第三方cookie,并且第三方cookie越来越多地被删除以防使用,从而防止使用第三方cookie收集数据。当尝试利用收集的数据来分段数据、进行推理或以其他方式利用数据来增强在线浏览体验时,这会产生问题。换句话说,如果不使用第三方cookie,以前收集的大部分数据将不再可用,这会防止计算系统能够使用该数据以基于共同兴趣、用户在特定网页执行的活动或其他资源对用户进行分组,以增强用户的在线体验,和/或将相关数字组件传输给更大的用户组。

10、本文描述的技术可以解决因根除第三方cookie而可能出现的障碍。例如,所公开的技术可以提供用于匿名化用户信息,以及向用户兴趣组分配用户的用户标识符,用户兴趣组可以用于将组内的用户关联为具有相似兴趣。所公开的技术还可以提供用于基于其成员在诸如网站的基于web的资源处访问和/或执行特定动作的用户兴趣组来扩展用户组。因此,所公开的技术可以提供用于在不使用第三方cookie的情况下向共享相似兴趣的大用户组递送相关数字组件。

11、所公开的技术可以保护用户的隐私。将用户分组为兴趣组可以在设备上执行,而不是通过互联网或其他网络广播。不得通过网络连接泄露用户的私人或个人信息,也不得使用私人或个人信息基于兴趣对用户进行分组。因此,这些技术可以保护用户隐私并保护数据(例如个人信息)的安全。

12、可以训练机器学习模型来识别与种子用户列表中的用户相似的用户,其结果可以用于扩展包括种子用户列表中的用户的用户组以还包括至少一些相似用户,而不使用第三方cookie或用户的跨域活动。通过这种方式,用户组可以被扩展为包括相似用户,而无需通过公共网络(例如互联网)传输第三方cookie。通过这样做,保护了用户隐私,减少了网络带宽,减少了通常发送cookie的客户端设备和接收并处理cookie的服务器的计算资源,并且节省了客户端设备的电池电量。然后,扩展的用户组可用于选择和分发内容,而不是第三方cookie,这在内容选择时提供了相似的优势。通过这种方式消除对第三方cookie的需要可以减少/防止向客户端设备发送内容中的延迟。响应于请求提供内容(例如数字组件)中的延迟可能导致客户端设备处的页面加载错误或者导致电子文档的部分即使在电子文档的其他部分呈现在客户端设备处之后仍然未被填充。而且,随着向客户端设备提供数字组件中的延迟增加,当数字组件被传送到客户端设备时电子文档将更有可能不再呈现在客户端设备处,从而对用户对于电子文档的体验产生负面影响。此外,例如,如果在提供数字组件时电子文档不再呈现在客户端设备处,提供数字组件中的延迟可能导致数字组件的递送失败。<本文档来自技高网...

【技术保护点】

1.一种计算机实现的方法,包括:

2.根据权利要求1所述的计算机实现的方法,其中,接收所述用户组标识符集合包括:

3.根据权利要求1或2所述的计算机实现的方法,其中,所述相似受众模型包括神经网络、质心模型或k最近邻居模型中的至少一个。

4.根据前述权利要求中的任一项所述的计算机实现的方法,其中,创建种子用户列表包括:

5.根据前述权利要求中的任一项所述的计算机实现的方法,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

6.根据前述权利要求中的任一项所述的计算机实现的方法,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

7.根据前述权利要求中的任一项所述的计算机实现的方法,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

8.一种系统,包括:

9.根据权利要求8所述的系统,其中,接收所述用户组标识符集合包括:

10.根据权利要求8或9所述的系统,其中,所述相似受众模型包括神经网络、质心模型或k最近邻居模型中的至少一个。

11.根据权利要求8-10中的任一项所述的系统,其中,创建种子用户列表包括:

12.根据权利要求8-11中的任一项所述的系统,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

13.根据权利要求8-12中的任一项所述的系统,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

14.根据权利要求8-13中的任一项所述的系统,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

15.一种包括指令的计算机可读介质,所述指令当被处理器执行时使所述处理器执行操作,所述操作包括:

16.根据权利要求15所述的计算机可读介质,其中,接收所述用户组标识符集合包括:

17.根据权利要求15或16所述的计算机可读介质,其中,所述相似受众模型包括神经网络、质心模型或k最近邻居模型中的至少一个。

18.根据权利要求15-17中的任一项所述的计算机可读介质,其中,创建种子用户列表包括:

19.根据权利要求15-18中的任一项所述的计算机可读介质,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

20.根据权利要求15-19中的任一项所述的计算机可读介质,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

21.根据权利要求15-20中的任一项所述的计算机可读介质,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种计算机实现的方法,包括:

2.根据权利要求1所述的计算机实现的方法,其中,接收所述用户组标识符集合包括:

3.根据权利要求1或2所述的计算机实现的方法,其中,所述相似受众模型包括神经网络、质心模型或k最近邻居模型中的至少一个。

4.根据前述权利要求中的任一项所述的计算机实现的方法,其中,创建种子用户列表包括:

5.根据前述权利要求中的任一项所述的计算机实现的方法,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

6.根据前述权利要求中的任一项所述的计算机实现的方法,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

7.根据前述权利要求中的任一项所述的计算机实现的方法,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模型包括:

8.一种系统,包括:

9.根据权利要求8所述的系统,其中,接收所述用户组标识符集合包括:

10.根据权利要求8或9所述的系统,其中,所述相似受众模型包括神经网络、质心模型或k最近邻居模型中的至少一个。

11.根据权利要求8-10中的任一项所述的系统,其中,创建种子用户列表包括:

12.根据权利要求8-11中的任一项所述的系统,其中,基于与对应于在所述种子用户列表中的用户标识符的用户的一个或多个特征对应的所述一个或多个特征值的集合来生成所述相似受众机器学习模...

【专利技术属性】
技术研发人员:黄威刘振宇杰弗里·查尔斯·莱维恩迪帕·帕兰杰佩王依霈罗伯特·伊什特万·布萨费克特
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1