用户设备、服务器及其方法技术

技术编号:29490026 阅读:23 留言:0更新日期:2021-07-30 19:01
提供了保护用户隐私的用于预测模型的用户设备、服务器及其方法。一种用户设备执行的方法包括:从收集的用户数据中提取原始特征,对原始特征进行处理,得到该用户设备的特征向量;基于该特征向量和预测模型计算关于预测模型的中间参数;将该中间参数发送给服务器;以及更新预测模型参数。

【技术实现步骤摘要】
用户设备、服务器及其方法
本专利技术涉及人工智能领域。更具体地,本专利技术涉及用于预测模型的用户设备、服务器及其方法。
技术介绍
当前,随着移动互联网的快速发展和移动智能终端的广泛普及,移动端已经成为了互联网的主流入口,用户每天都在各种智能终端上产生了大量的用户数据,由于这些用户数据往往内含着用户的喜好信息,因此被各种服务提供商广泛地应用于各种互联网服务中,例如用户画像、个性化推荐、个性化搜索以及广告推送等。这些服务不仅很好地提升了用户体验,而且给服务提供商带来很多的商业利益和价值,所以,对用户数据进行深度挖掘以提升服务的质量是服务提供商的一项核心业务。当前,随着用户安全意识的提高,个人用户越来越重视对个人隐私的保护,各国也出台了或者正在制定相关的法律法规来保护个人数据,遏制个人信息被滥用,这些法律对个人数据的收集和使用做出了严格的限制。因此,对用户数据的保护和合法利用是必须考虑的问题。在很多利用预测模型的系统中往往需要利用到各类用户数据,然而这些用户数据往往涉及到用户隐私,目前绝大多数预测系统需要在服务器端收集并存储这些用于预测的用户数据,这样的方式存在用户隐私泄露风险和法律合规风险。
技术实现思路
技术问题需要用于预测模型的改进技术。解决方案提供了一种用户设备执行的方法,该方法包括:从收集的用户数据中提取原始特征,对原始特征进行处理,得到该用户设备的特征向量;基于该特征向量和预测模型计算关于预测模型的中间参数;将该中间参数发送给服务器;以及更新预测模型参数。r>提供了一种用户设备,包括存储器和处理器,所述存储器中存储有计算机程序;所述处理器,用于在运行所述计算机程序时,执行如下方法:从收集的用户数据中提取原始特征,对原始特征进行处理,得到该用户设备的特征向量;基于该特征向量和预测模型计算关于预测模型的中间参数;将该中间参数发送给服务器;以及更新预测模型参数。提供了一种服务器执行的方法,该方法包括:从用户设备接收基于特征向量和预测模型计算的关于预测模型的中间参数,该特征向量是用户设备通过从收集的用户数据中提取原始特征、对原始特征进行处理而得到的;以及对接收的中间参数进行聚合。提供了一种服务器设备,包括存储器和处理器,所述存储器中存储有计算机程序;所述处理器,用于在运行所述计算机程序时,执行如下方法:从用户设备接收基于特征向量和预测模型计算的关于预测模型的中间参数,该特征向量是用户设备通过从收集的用户数据中提取原始特征、对原始特征进行处理而得到的;以及对接收的中间参数进行聚合。有益效果本专利技术提供了用于预测模型的改进技术。对于本领域技术人员而言,从后面结合附图公开本专利技术的示范性实施例的详细描述中,本专利技术的其它方面、优点和显著特征将变得清楚。附图说明图1示出了目前的用户属性预测系统的总体框图。图2示出了根据本专利技术的实施例的用户属性预测系统的框图。图3示出了根据本专利技术的实施例的用户设备执行的方法的流程图。图4示出了根据本专利技术的实施例的服务器执行的方法的流程图。图5示出了传统的特征映射方法的框图。图6示出了根据本专利技术的实施例的特征映射方法的框图。图7是根据本专利技术的一个实施例的特征值标准化方法的示意图。图8是根据本专利技术的另一个实施例的特征值标准化方法的示意图。图9示出了基于同态加密的梯度保护方案的示意图。图10示出了基于秘密分享的梯度保护方案的示意图。图11示出了根据本专利技术的实施例的梯度保护方案的示意图。图12示出了根据本专利技术的实施例的用户设备的框图。图13示出了根据本专利技术的实施例的服务器的框图。具体实施方式下面将结合附图详细描述本专利技术的实施例。在下面说明书中使用的术语和词汇不限于字面含义,而是仅仅被用来使得能够对本专利技术进行清楚和一致的理解。相应地,本领域技术人员应当理解:提供下面对本专利技术的示范性实施例的描述仅仅是为了说明性目的,而不是用于限制本专利技术的目的,本专利技术由权利要求及其等同内容限定。应当理解:单数形式“一”、“一个”包括复数指代,除非上下文清楚地指出除外。以用户画像服务为例。用户画像,又称用户角色,也可看作是真实用户的虚拟代表,最初是在电商领域得到应用的。在大数据时代背景下,可以将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,或根据用户的行为特点的差异区分为不同类型,基于这些标签或行为类型的不同为用户提供有针对性的服务,使服务更加聚焦和个性化。在个性化推荐领域,基于用户统计学信息(包括用户年龄,性别,职业,婚姻,文化程度,健康水平,收入等)的推荐几乎是最容易实现的推荐方法。例如,基于用户的年龄、性别的不同来区分用户,从而为不同类型的用户进行个性化推荐。但是用户统计学信息都是比较难以直接获取的,所以目前一般采用预测技术获得用户的年龄和性别等基本人口统计学信息。其中,上述用户统计学信息也可以称为用户人口统计学信息,或称为用户属性信息。在用户画像系统中,对用户属性的预测往往需要利用到各类用户数据,然而这些数据往往涉及到用户隐私,目前绝大多数用户属性预测信息系统通过需要在服务器端收集并存储这些用于预测的用户数据,这样的方式存在用户隐私泄露风险和法律合规风险。图1示出了目前的用户属性预测系统的总体框图。该预测系统的基本工作过程如下:每个终端101分别收集用户的各类行为数据,例如:APP使用行为数据、网页浏览数据等,将收集到的信息存储在本地,并将数据上传至服务器102。服务器对从各个终端上传而来的用户数据进行处理(103),生成训练数据104。在生成好的训练数据104上进行预测算法(105)的训练。利用训练好的预测算法基于用户数据对用户的属性进行预测,并将预测的结果(即用户画像)106进行存储。为了更好地保护个人隐私,避免用户数据泄露,本申请提供了能够保护用户数据的年龄与性别等用户属性信息的技术方案。在该技术方案中,在用户设备侧收集的用户数据只存储在各个用户设备上,不再需要上传到服务器侧进行分析和处理,这样可以有效地规避用户隐私泄露风险,通过协同多个用户设备进行预测模型的联合训练,各个用户设备在用户设备侧利用联合训练出来的模型进行用户属性的预测。更进一步希望能够基于这些方法把用户画像作为用户设备的一个基础的系统层面的中间层服务,使不同的上层应用在用户授权后通过调用该服务能够为用户提供各种个性化的应用级服务,从而更好地满足用户需求。图2示出了根据本专利技术的实施例的用户属性预测系统的框图。该框图包括中央“服务器”,其可以是单一服务器或者服务器群组,以及用户设备的集合,其中每个用户设备代表一个用户。不同于图1,在本方案中,用户设备1(201)依然需要收集用户的各类行为数据,然而这些数据只存储在用户设备侧,不再需要上传至服务器202,数据处理(203)、本地预测模型(204)的训练和推断都在用户设备上执行。然而,由于只依赖一个用户的数据本文档来自技高网...

【技术保护点】
1.一种用户设备执行的方法,该方法包括:/n从收集的用户数据中提取原始特征,对原始特征进行处理,得到该用户设备的特征向量;/n基于该特征向量和预测模型计算关于预测模型的中间参数;/n将该中间参数发送给服务器;以及/n更新预测模型参数。/n

【技术特征摘要】
1.一种用户设备执行的方法,该方法包括:
从收集的用户数据中提取原始特征,对原始特征进行处理,得到该用户设备的特征向量;
基于该特征向量和预测模型计算关于预测模型的中间参数;
将该中间参数发送给服务器;以及
更新预测模型参数。


2.如权利要求1所述的方法,其中将该中间参数发送给服务器,以及更新预测模型参数,包括:
将该中间参数编码成至少两个编码后的中间参数数据,分别发送给至少两个服务器,以使所述至少两个服务器分别对接收的中间参数数据进行聚合;
从所述至少两个服务器获取聚合结果;
基于获取的聚合结果,更新预测模型参数。


3.如权利要求1所述的方法,其中更新预测模型参数包括从服务器接收更新的预测模型参数。


4.如权利要求1至3中任一项所述的方法,其中,所述中间参数是预测模型参数的梯度。


5.如权利要求1至4中任一项所述的方法,其中所述对原始特征进行处理包括:
对原始特征进行映射运算,得到映射运算结果;
将映射运算结果发送给服务器;
从服务器获取映射运算结果-索引映射表,其中,所述映射表是所述服务器根据各用户设备分别发送的映射运算结果进行索引映射得到的;
基于获取的映射表将原始特征表示成所述用户设备的特征向量。


6.如权利要求5所述的方法,其中所述映射运算是哈希编码,映射运算结果是特征哈希值。


7.如权利要求1至4中任一项所述的方法,其中所述对原始特征进行处理包括:对所述原始特征的特征值进行标准化。


8.如权利要求7所述的方法,其中所述对原始特征的特征值进行标准化包括:
对原始特征的特征值及其平方值进行同态加密,并发送给服务器;
从服务器获取所述特征值及其平方值分别对应的聚合结果;
对所述特征值及其平方值分别对应的聚合结果分别进行解密,得到特征值及其平方值分别对应的均值,并计算所述特征值对应的标准差;
根据特征值的均值以及标准差,得到标准化后的特征值。


9.如权利要求7所述的方法,其中所述对原始特征的特征值进行标准化包括:
将原始特征的特征值编码成至少两个编码后的特征值,分别发送给至少两个服务器;
将原始特征的特征值的平方值编码成至少两个编码后的平方值,分别发送给所述至少两个服务器;
从所述至少两个服务器分别接收聚合结果;
基于所述聚合结果计算原始特征的特征值的均值和标准差;以及
根据特征值的均值以及标准差,得到标准化后的特征值。


10.如权利...

【专利技术属性】
技术研发人员:李舒辰王晋夫翟永恒
申请(专利权)人:北京三星通信技术研究有限公司三星电子株式会社
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1