基于联邦学习的推荐模型训练方法、终端及存储介质技术

技术编号:22238142 阅读:21 留言:0更新日期:2019-10-09 18:01
本发明专利技术公开了一种基于联邦学习的推荐模型训练方法、终端及存储介质,所述方法包括:获取客户端应用在预设多种类型应用项目中记录的用户历史行为数据集;基于各组用户历史行为数据集提取各客户端应用的单一特征用户向量;并从目标应用的用户历史行为数据集中提取项目特征向量集和项目评分集;将各单一特征用户向量、项目特征向量集和项目评分集组合得到本地训练样本集;基于本地训练样本集参与联邦学习,得到目标类型应用项目的推荐模型。本发明专利技术实现了在联邦框架下进行模型训练以保护用户隐私数据的同时,基于多场景的数据进行推荐模型的训练,使得训练得到的推荐模型能够更准确地定位用户的偏好特征,从而提高了推荐模型的推荐效果。

Recommendation Model Training Method, Terminal and Storage Medium Based on Federal Learning

【技术实现步骤摘要】
基于联邦学习的推荐模型训练方法、终端及存储介质
本专利技术涉及人工智能
,尤其涉及一种基于联邦学习的推荐模型训练方法、终端及存储介质。
技术介绍
随着人工智能、机器学习技术的发展,为用户智能推荐音乐、电影、购物商品等项目的推荐系统也在不断的发展。目前的推荐系统会将用户的历史数据信息上传到中心数据库,将数据集中在一起进行推荐模型的训练,但是将用户数据上传到中心数据库,会存在泄漏用户隐私的风险。随着联邦学习概念的提出,可以通过在联邦学习架构下进行模型训练的方式,使用户的隐私数据不需上传,即可联合多个客户端进行有效的模型训练。但是这仅能解决隐私数据不上传的问题,而由于本地训练数据是来自单个客户端应用的数据,场景单一,所以推荐模型的效果并没有在本质上得到提升。
技术实现思路
本专利技术的主要目的在于提供一种基于联邦学习的推荐模型训练方法、终端及存储介质,旨在解决在联邦学习架构下,采用单一场景的数据进行训练得到的推荐模型推荐效果不佳的技术问题。为实现上述目的,本专利技术提供一种基于联邦学习的推荐模型训练方法,所述方法应用于客户端,所述方法包括以下步骤:获取客户端应用在预设多种类型应用项目中记录的用户历史行为数据集;基于各组所述用户历史行为数据集,分别提取各所述客户端应用对应的单一特征用户向量;在各所述客户端应用中确定目标应用和所述目标应用的目标类型应用项目,并从所述目标应用的所述用户历史行为数据集中,提取所述目标类型应用项目的项目特征向量集和项目评分集;将各所述单一特征用户向量、所述项目特征向量集和所述项目评分集组合得到本地训练样本集;基于所述本地训练样本集参与联邦学习,得到所述目标类型应用项目的推荐模型。可选地,所述基于各组所述用户历史行为数据集,分别提取各所述客户端应用对应的单一特征用户向量的步骤包括:逐个遍历各组所述用户历史行为数据集,对一组所述用户历史行为数据集中的每条行为数据,分别提取每条所述行为数据所指向应用项目的项目特征数据;对各所述项目特征数据进行向量化,得到所述用户历史行为数据集所指向的各应用项目的项目特征向量集;求取所述项目特征向量集的平均,将平均后的项目特征向量作为所述客户端应用对应的单一特征用户向量。可选地,从所述目标应用的所述用户历史行为数据集中,提取所述目标类型应用项目的项目评分集的步骤包括:对所述目标应用的所述用户历史行为数据集中的每条行为数据,分别提取每条所述行为数据所指向应用项目的用户偏好数据;分别基于所述用户偏好数据计算对应应用项目的项目评分,得到所述目标类型应用项目的项目评分集。可选地,所述将各所述单一特征用户向量、所述项目特征向量集和所述项目评分集组合得到本地训练样本集的步骤包括:将各所述单一特征用户向量进行拼接得到多特征用户向量;依次获取所述项目特征向量集中的项目特征向量、所述项目评分集中与所述项目特征向量对应的项目评分;将获取到的各组项目特征向量和项目评分分别与所述多特征用户向量组合,将得到的各条本地训练样本作为本地训练样本集。可选地,所述基于所述本地训练样本集参与联邦学习,得到所述目标类型应用项目的推荐模型的步骤包括:从服务端获取待训练推荐模型的初始模型参数;根据所述本地训练样本集和所述初始模型参数对所述待训练推荐模型进行本地训练得到模型参数更新;将所述模型参数更新上传至所述服务端,以供所述服务端将各所述客户端上传的所述模型参数更新进行聚合处理得到聚合模型参数,并在检测到所述待训练推荐模型处于未收敛状态时将所述聚合模型参数返回各所述客户端继续迭代训练,直到检测到所述待训练推荐模型处于收敛状态时,将所述聚合模型参数作为所述待训练推荐模型的最终参数,得到所述目标类型应用项目的推荐模型,并将所述推荐模型下发至各所述客户端;接收所述服务端下发的所述推荐模型。可选地,所述将所述模型参数更新上传至所述服务端的步骤包括:将所述模型参数更新按照预设加密算法进行加密处理后上传至所述服务端。可选地,所述基于所述本地训练样本集参与联邦学习,得到所述目标类型应用项目的推荐模型的步骤之后,还包括:获取待推荐应用项目的项目特征数据;对所述项目特征数据进行向量化,得到所述待推荐应用项目的项目特征向量;将所述项目特征向量、各所述单一特征用户向量输入所述推荐模型进行评分,得到所述待推荐应用项目的预测评分。可选地,所述将各所述单一特征用户向量、所述项目特征向量集和所述项目评分集组合得到本地训练样本集的步骤之前,还包括:获取所述客户端记录的用户画像特征数据;对所述用户画像特征数据进行向量化,得到用户画像特征对应的单一特征用户向量。此外,为实现上述目的,本专利技术还提供一种终端,所述终端包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的基于联邦学习的推荐模型训练程序,所述基于联邦学习的推荐模型训练程序被所述处理器执行时实现如上所述的基于联邦学习的推荐模型训练方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于联邦学习的推荐模型训练程序,所述基于联邦学习的推荐模型训练程序被处理器执行时实现如上所述的基于联邦学习的推荐模型训练方法的步骤。本专利技术通过客户端获取多种类型的客户端应用的用户历史行为数据集,并利用获取到的多组用户历史行为数据集提取多种类型客户端应用分别对应的单一特征用户向量,使得用户向量不局限于表示一种类型的用户特征,而通过将各单一特征用户向量均作为本地训练样本的组成部分,使得本地训练样本集中的用户特征更加多样化,如短视频类应用对应的用户向量能够丰富用户的UGC(UserGeneratedContent,用户生成内容)偏好特征,音乐类应用对应的用户向量能够丰富用户对歌手、流派的偏好特征,基于多样化的用户向量进行推荐模型的训练,使得训练得到的推荐模型能够更准确地定位用户的偏好特征,并基于准确表示用户偏好特征的多个单一特征用户向量,作出更符合用户偏好的项目预测评分,从而提高了推荐模型的推荐效果。同时,推荐模型的训练是在联邦学习框架下进行的,实现了保护用户隐私数据的效果。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的结构示意图;图2为本专利技术基于联邦学习的推荐模型训练方法较佳实施例的流程示意图;图3为本专利技术基于联邦学习的推荐模型训练方法实施例涉及的一种单一特征用户向量求取过程示意图;图4为本专利技术基于联邦学习的推荐模型训练方法实施例涉及的一种多特征用户向量求取过程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供了一种终端,参照图1,图1是本专利技术实施例方案涉及的硬件运行环境的结构示意图。需要说明的是,图1即可为终端的硬件运行环境的结构示意图。本专利技术实施例终端可以是PC,也可以是智能手机、智能电视机、平板电脑、便携计算机等具有显示功能的终端设备。如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003本文档来自技高网...

【技术保护点】
1.一种基于联邦学习的推荐模型训练方法,其特征在于,所述方法应用于客户端,所述方法包括以下步骤:获取客户端应用在预设多种类型应用项目中记录的用户历史行为数据集;基于各组所述用户历史行为数据集,分别提取各所述客户端应用对应的单一特征用户向量;在各所述客户端应用中确定目标应用和所述目标应用的目标类型应用项目,并从所述目标应用的所述用户历史行为数据集中,提取所述目标类型应用项目的项目特征向量集和项目评分集;将各所述单一特征用户向量、所述项目特征向量集和所述项目评分集组合得到本地训练样本集;基于所述本地训练样本集参与联邦学习,得到所述目标类型应用项目的推荐模型。

【技术特征摘要】
1.一种基于联邦学习的推荐模型训练方法,其特征在于,所述方法应用于客户端,所述方法包括以下步骤:获取客户端应用在预设多种类型应用项目中记录的用户历史行为数据集;基于各组所述用户历史行为数据集,分别提取各所述客户端应用对应的单一特征用户向量;在各所述客户端应用中确定目标应用和所述目标应用的目标类型应用项目,并从所述目标应用的所述用户历史行为数据集中,提取所述目标类型应用项目的项目特征向量集和项目评分集;将各所述单一特征用户向量、所述项目特征向量集和所述项目评分集组合得到本地训练样本集;基于所述本地训练样本集参与联邦学习,得到所述目标类型应用项目的推荐模型。2.如权利要求1所述的基于联邦学习的推荐模型训练方法,其特征在于,所述基于各组所述用户历史行为数据集,分别提取各所述客户端应用对应的单一特征用户向量的步骤包括:逐个遍历各组所述用户历史行为数据集,对一组所述用户历史行为数据集中的每条行为数据,分别提取每条所述行为数据所指向应用项目的项目特征数据;对各所述项目特征数据进行向量化,得到所述用户历史行为数据集所指向的各应用项目的项目特征向量集;求取所述项目特征向量集的平均,将平均后的项目特征向量作为所述客户端应用对应的单一特征用户向量。3.如权利要求1所述的基于联邦学习的推荐模型训练方法,其特征在于,从所述目标应用的所述用户历史行为数据集中,提取所述目标类型应用项目的项目评分集的步骤包括:对所述目标应用的所述用户历史行为数据集中的每条行为数据,分别提取每条所述行为数据所指向应用项目的用户偏好数据;分别基于所述用户偏好数据计算对应应用项目的项目评分,得到所述目标类型应用项目的项目评分集。4.如权利要求1所述的基于联邦学习的推荐模型训练方法,其特征在于,所述将各所述单一特征用户向量、所述项目特征向量集和所述项目评分集组合得到本地训练样本集的步骤包括:将各所述单一特征用户向量进行拼接得到多特征用户向量;依次获取所述项目特征向量集中的项目特征向量、所述项目评分集中与所述项目特征向量对应的项目评分;将获取到的各组项目特征向量和项目评分分别与所述多特征用户向量组合,将得到的各条本地训练样本作为本地训练样本集。5.如权利要求1所述的基于联邦学习的推荐模型训练方法,其特征在于,所述基于所述本地训练样本集参...

【专利技术属性】
技术研发人员:黄安埠
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1