内容推荐方法和系统技术方案

技术编号:19821802 阅读:32 留言:0更新日期:2018-12-19 14:42
公开了一种内容推荐方法和系统。该内容推荐方法包括:在第一时段内采集终端设备的第一用户数据,第一用户数据包括在第一时段内使用终端设备的用户的个人数据、行为信息、以及实时情境相关信息中的至少一种;基于第一用户数据,从终端设备保存的内容推荐模型中提取至少一项内容特征,至少一项内容特征为表征针对终端设备的用户的推荐内容的内容特征,其中,内容推荐模型是终端设备根据历史用户数据构建的;以及将至少一项内容特征发送给服务器,并从服务器接收针对终端设备的用户的推荐内容,其中,针对终端设备的用户的推荐内容是服务器根据至少一项内容特征查询得到的。

【技术实现步骤摘要】
内容推荐方法和系统
本申请涉及通信领域,尤其涉及一种内容推荐方法和系统。
技术介绍
随着诸如,手机、平板电脑之类的终端设备的普及以及移动互联网技术的发展,终端设备正逐渐成为人们获取信息的重要平台。例如,人们可以通过终端设备进行新闻浏览、书籍阅读、视频收看、音乐聆听、以及社会交流等活动。但是,由于终端设备的信息处理能力非常有限,网络服务和信息内容的不断膨胀将在终端设备中引发“信息过载”,这会严重影响终端设备的用户体验和移动互联网的资源利用率。内容推荐系统通过机器学习技术分析和理解用户的需求,并基于用户的需求对信息进行筛选和过滤,从而将符合用户的需求的内容推荐给用户。内容推荐系统成为解决信息过载问题的重要手段之一,在互联网和终端领域得到了广泛关注和应用。通常,在现有的内容推荐系统中,终端设备收集用户数据,然后将用户数据上传到服务器;服务器基于用户数据进行分析建模和推荐计算,以挖掘用户与项目之间的二元关系(user-item),进而从大量内容数据中发现用户需求相关的项目,例如,新闻、视频、在线商品等,再将推荐结果发送到终端设备,以满足终端设备的用户的个性化需求。由于终端设备通常需要收集包含有用户的位置、状态、行为等信息的用户数据并上传至服务器,而这些用户数据可能涉及用户的隐私信息,例如,用户的位置信息里包含的用户的行动轨迹、浏览记录等,因此很可能造成用户隐私泄漏。另一方面,从终端设备制造商的角度,需要尽可能把用户信息保存在用户自己的终端设备中,从而充分保护用户隐私。如果某款终端设备不能保护隐私,则用户会选择其他厂商的终端设备,这对终端设备制造商的影响会非常巨大。因此,现有的内容推荐系统难以满足用户和终端设备制造商对于用户隐私保护的需求。
技术实现思路
本申请的实施例提供了一种内容推荐方法和系统,能够在保护终端设备的用户的个人隐私安全的条件下向终端设备的用户推荐相应的内容。第一方面,本申请实施例提供了一种内容推荐方法,包括:在第一时段内采集终端设备的第一用户数据,第一用户数据包括在第一时段内使用终端设备的用户的个人数据、行为信息、以及实时情境相关信息中的至少一种;基于第一用户数据,从终端设备保存的内容推荐模型中提取至少一项内容特征,该至少一项内容特征为表征针对终端设备的用户的推荐内容的内容特征,其中,内容推荐模型是终端设备根据历史用户数据构建的;以及将至少一项内容特征发送给服务器,并从服务器接收针对终端设备的用户的推荐内容,其中,针对终端设备的用户的推荐内容是服务器根据至少一项内容特征查询得到的。在根据本申请实施例的第一方面的内容推荐方法中,无需将用户数据从终端设备上传到服务器,因此充分保证了终端设备的用户的个人隐私安全。另外,利用终端设备的计算能力来构建内容推荐模型并进行推荐计算,因此充分利用了终端设备的计算能力,同时解放了服务器的计算能力。在第一种可能的实现方式中,上述内容推荐方法还包括:在第二时段内采集终端设备的第二用户数据,第二时段早于第一时段,第二用户数据为历史用户数据;以及基于历史用户数据、以及历史用户数据所对应的多项内容特征,构建内容推荐模型。结合上述可能的实现方式,在第二种可能的实现方式中,上述内容推荐方法还包括:在第三时段内采集终端设备的第三用户数据,第三时段晚于第二时段;以及基于第三用户数据、以及第三用户数据所对应的多项内容特征,更新内容推荐模型。这里,对于内容推荐模型的更新可以使得针对终端设备的用户的推荐内容更加符合终端设备的用户的需求。结合上述可能的实现方式,在第三种可能的实现方式中,历史用户数据包括多个历史用户数据样本,每个历史用户数据样本包括多个样本特征值,内容推荐模型包括多个历史用户数据样本所归属的各个样本类别与内容特征之间的对应关系。基于多个历史用户数据样本、以及多个历史用户数据样本所对应的各项内容特征构建内容推荐模型包括:对于每个历史用户数据样本,利用该历史用户数据样本所对应的特征权值向量和该历史用户数据样本中包括的多个样本特征值,获取该历史用户数据样本的加权值,其中,该历史用户数据样本所对应的特征权值向量包括分别与该历史用户数据样本中包括的多个样本特征值相对应的多个权重值;基于多个历史用户数据样本的加权值,将多个历史用户数据样本划分为多个样本类别;对于每个样本类别,将归属于该样本类别的各个历史用户数据样本所对应的内容特征与该样本类别相关联。结合上述可能的实现方式,在第四种可能的实现方式中,将多个历史用户数据样本划分为多个样本类别包括:通过聚类算法将多个历史用户数据样本划分为多个样本类别。在这种情况下,内容推荐模型还包括每个样本类别的聚类中心点、归属于该样本类别的用户数据样本的数目、以及与该样本类别相关联的各项内容特征在该样本类别中出现的概率。这里,使用聚类算法来构建内容推荐模型,避免了传统的内容推荐系统中使用的大规模矩阵运算,因此减轻了内容推荐模型的构建的计算量过大所引起的终端设备的功耗问题。结合上述可能的实现方式,在第五种可能的实现方式中,第三用户数据包括多个第三用户数据样本,多个第三用户数据样本中的每个第三用户数据样本包括多个样本特征值,基于多个第三用户数据样本中的任意一个第三用户数据样本、以及该第三用户数据样本所对应的内容特征更新内容推荐模型包括:利用该第三用户数据样本所对应的特征权值向量和该第三用户数据样本中包括的多个样本特征值,获取该第三用户数据样本的加权值,其中,该第三用户数据样本所对应的特征权值向量包括分别与该第三用户数据样本中包括的多个样本特征值相对应的多个权重值;计算该第三用户数据样本的加权值与各个样本类别的聚类中心点之间的距离;将该第三用户数据样本添加到与其距离最近的一个样本类别中;利用该第三用户数据样本的加权值更新该样本类别的聚类中心点,并利用该第三用户数据样本所对应的内容特征更新与该样本类别相关联的各项内容特征在该样本类别中出现的概率。结合上述可能的实现方式,在第六种可能的实现方式中,第一用户数据包括一个第一用户数据样本,第一用户数据样本包括多个样本特征值,基于第一用户数据从内容推荐模型提取至少一项内容特征包括:利用第一用户数据样本所对应的特征权值向量和第一用户数据样本中包括的多个样本特征值,获取第一用户数据样本的加权值,其中,第一用户数据样本所对应的特征权值向量包括分别与第一用户数据样本中包括的多个样本特征值相对应的多个权重值;计算第一用户数据样本的加权值与各个样本类别的聚类中心点之间的距离,作为第一用户数据样本与各个样本类别之间的相似度;找出与第一用户数据样本之间的相似度最高的一个样本类别,并提取与该样本类别相关联的至少一项内容特征,作为表征针对用户的推荐内容的至少一项内容特征。第二方面,本申请的实施例提供了一种内容推荐方法,包括:接收表征针对终端设备的用户的推荐内容的至少一项内容特征;基于至少一项内容特征,在预先存储有内容特征、内容特征所表征的内容、以及它们之间的对应关系的存储器中查找针对终端设备的用户的推荐内容;以及将针对终端设备的用户的推荐内容返回给终端设备。在第一种可能的实现方式中,使用搜索引擎的查询功能和数据库的查询功能中的一种或两种,查找针对终端设备的用户的推荐内容。在根据本申请实施例的第二方面的内容推荐方法中,服务器仅用于本文档来自技高网
...

【技术保护点】
1.一种内容推荐方法,包括:在第一时段内采集终端设备的第一用户数据,所述第一用户数据包括在所述第一时段内使用所述终端设备的用户的个人数据、行为信息、以及实时情境相关信息中的至少一种;基于所述第一用户数据,从所述终端设备保存的内容推荐模型中提取至少一项内容特征,所述至少一项内容特征为表征针对所述用户的推荐内容的内容特征,其中,所述内容推荐模型是所述终端设备根据历史用户数据构建的;以及将所述至少一项内容特征发送给服务器,并从所述服务器接收针对所述用户的推荐内容,其中,针对所述用户的推荐内容是所述服务器根据所述至少一项内容特征查询得到的。

【技术特征摘要】
1.一种内容推荐方法,包括:在第一时段内采集终端设备的第一用户数据,所述第一用户数据包括在所述第一时段内使用所述终端设备的用户的个人数据、行为信息、以及实时情境相关信息中的至少一种;基于所述第一用户数据,从所述终端设备保存的内容推荐模型中提取至少一项内容特征,所述至少一项内容特征为表征针对所述用户的推荐内容的内容特征,其中,所述内容推荐模型是所述终端设备根据历史用户数据构建的;以及将所述至少一项内容特征发送给服务器,并从所述服务器接收针对所述用户的推荐内容,其中,针对所述用户的推荐内容是所述服务器根据所述至少一项内容特征查询得到的。2.根据权利要求1所述的内容推荐方法,其特征在于,还包括:在第二时段内采集所述终端设备的第二用户数据,所述第二时段早于所述第一时段,所述第二用户数据为所述历史用户数据;以及基于所述历史用户数据、以及所述历史用户数据所对应的多项内容特征,构建所述内容推荐模型。3.根据权利要求2所述的内容推荐方法,其特征在于,还包括:在第三时段内采集所述终端设备的第三用户数据,所述第三时段晚于所述第二时段;以及基于所述第三用户数据、以及所述第三用户数据所对应的多项内容特征,更新所述内容推荐模型。4.根据权利要求2或3所述的内容推荐方法,其特征在于,所述历史用户数据包括多个历史用户数据样本,所述多个历史用户数据样本中的每个历史用户数据样本包括多个样本特征值,所述内容推荐模型包括所述多个历史用户数据样本所归属的各个样本类别与内容特征之间的对应关系,基于所述历史用户数据、以及所述历史用户数据所对应的多项内容特征,构建所述内容推荐模型包括:对于所述多个历史用户数据样本中的每个历史用户数据样本,利用所述历史用户数据样本所对应的特征权值向量和所述历史用户数据样本中包括的多个样本特征值,获取所述历史用户数据样本的加权值,其中,所述历史用户数据样本所对应的特征权值向量包括分别与所述历史用户数据样本中包括的多个样本特征值相对应的多个权重值;基于所述多个历史用户数据样本的加权值,将所述多个历史用户数据样本划分为多个样本类别;以及对于所述多个样本类别中的每个样本类别,将归属于所述样本类别的各个历史用户数据样本所对应的内容特征与所述样本类别相关联。5.根据权利要求4所述的内容推荐方法,其特征在于,将所述多个历史用户数据样本划分为多个样本类别包括:通过聚类算法将所述多个历史用户数据样本划分为所述多个样本类别,所述内容推荐模型还包括所述多个样本类别中的每个样本类别的聚类中心点、归属于所述样本类别的用户数据样本的数目、以及与所述样本类别相关联的各项内容特征在所述样本类别中出现的概率。6.根据权利要求3至5任一项所述的内容推荐方法,其特征在于,所述第三用户数据包括多个第三用户数据样本,所述多个第三用户数据样本中的每个第三用户数据样本包括多个样本特征值,基于所述多个第三用户数据样本中的任意一个第三用户...

【专利技术属性】
技术研发人员:胡仲义王义寅王细勇
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1