【技术实现步骤摘要】
标签推荐模型训练方法及装置、标签获取方法及装置
[0001]本公开涉及数据处理
,尤其涉及深度学习、云服务、内容搜索等
,具体而言涉及一种标签推荐模型训练方法及装置、标签获取方法及装置。
技术介绍
[0002]兴趣画像包括基于规则、传统模型两种技术方案。属性画像可以是年龄、性别等固定属性,获取简单方便。兴趣画像表示的是兴趣爱好,例如偏好,技能,习惯等方面。两种技术方案的特点是特征,多采用文本表示特征。
技术实现思路
[0003]本公开提供了一种标签推荐模型训练方法及装置、标签获取方法及装置。
[0004]根据本公开的一方面,提供了一种标签推荐模型训练方法,所述方法包括:
[0005]响应于接收到收集训练素材指示,收集训练素材,所述训练素材包含兴趣标签;采用语义增强表示框架,对所述训练素材的特征进行表示,得到包括所述兴趣标签的训练语义向量;将社交网络聚合至所述训练语义向量中,得到训练编码向量;基于所述训练编码向量作为输入,所述兴趣标签作为输出,训练双层神经网络结构,得到标签推荐模型。
[0006]根据本公开的第二方面,提供了一种标签获取方法,所述方法包括:
[0007]响应于接收到获取兴趣标签指示,获取相应的素材;采用语义增强表示框架,对所述素材的特征进行表示,得到包括兴趣标签的语义向量;将社交网络聚合至所述语义向量中,得到编码向量;将所述编码向量输入至预先训练的标签推荐模型中,得到兴趣标签。
[0008]根据本公开的第三方面,提供了一种标签推荐模型训 ...
【技术保护点】
【技术特征摘要】
1.一种标签推荐模型训练方法,所述方法包括:响应于接收到收集训练素材指示,收集训练素材,所述训练素材包含兴趣标签;采用语义增强表示框架,对所述训练素材的特征进行表示,得到包括所述兴趣标签的训练语义向量;将社交网络聚合至所述训练语义向量中,得到训练编码向量;基于所述训练编码向量作为输入,所述兴趣标签作为输出,训练双层神经网络结构,得到标签推荐模型。2.根据权利要求1所述的方法,其中,所述训练素材包括行为训练素材和业务训练素材;所述采用语义增强表示框架,对所述训练素材的特征进行表示,得到包括兴趣标签的训练语义向量,包括:基于所述语义增强表示框架,将所述行为训练素材表示为不同长度的训练行为向量,将所述业务训练素材表示为固定长度的训练业务向量;将所述训练行为向量求平均之后,与所述训练业务向量进行融合,得到训练语义向量。3.根据权利要求1所述的方法,其中,所述将社交网络聚合至所述训练语义向量中,得到训练编码向量,包括:获取之间的社交网络,并确定社交网络之间的亲密值;将所述亲密值作为矩阵中元素的取值,构建邻接矩阵;在所述邻接矩阵中每行所述元素的权重和为一的条件下,为所述元素分配权重,所述邻接矩阵中对角线元素分配的权重大于其他元素分配的权重;获取所述邻接矩阵中每个元素对应的训练语义向量,基于图卷积网络,计算所述训练语义向量与分配权重之后每个元素取值之间的乘积,得到训练编码向量。4.根据权利要求1所述的方法,其中,所述基于所述训练编码向量作为输入,所述兴趣标签作为输出,训练双层神经网络结构,得到标签推荐模型,包括:将所述训练编码向量作为向前网络的输入,训练所述向前网络,得到新的训练编码向量;将所述新的训练编码向量再次作为全连接网络的输入,训练所述全连接网络,得到训练标签向量;将所述训练标签向量作为自变量,输出为兴趣标签,得到标签推荐模型。5.根据权利要求4所述的方法,其中,所述将所述训练标签向量作为自变量,输出为兴趣标签,得到标签推荐模型,包括:采用激活函数解析所述训练标签向量,得到所述训练标签向量中包含的兴趣标签;在所述兴趣标签中,确定与所述兴趣标签对应的第一兴趣标签,并计算所述第一兴趣标签在所述兴趣标签中占用的比例,确定标签推荐模型的概率阈值,得到输出标签概率大于或等于所述概率阈值的标签推荐模型。6.一种标签获取方法,所述方法包括:响应于接收到获取兴趣标签指示,获取相应的素材;采用语义增强表示框架,对所述素材的特征进行表示,得到包括兴趣标签的语义向量;将社交网络聚合至所述语义向量中,得到编码向量;
将所述编码向量输入至预先训练的标签推荐模型中,得到兴趣标签。7.根据权利要求6所述的方法,其中,所述将所述编码向量输入至预先训练的标签推荐模型中,得到兴趣标签,包括:将所述编码向量输入至所述标签推荐模型中的向前网络中,得到新的编码向量;将所述新的编码向量输入至全连接网络中,得到标签向量;解析所述标签向量,基于所述标签推荐模型中的概率阈值,输出兴趣标签。8.根据权利要求7所述的方法,其中,所述解析所述标签向量,基于所述标签推荐模型中的概率阈值,输出兴趣标签,包括:基于所述标签推荐模型中的激活函数,解析所述标签向量,得到多个标签;将所述多个标签中出现概率大于或等于概率阈值的标签,确定为兴趣标签。9.一种标签推荐模型训练装置,所述装置包括:获取模块,用于响应于接收到收集训练素材指示,收集训练素材,所述训练素材包含兴趣标签;处理模块,用于采用语义增强表示框架,对所述训练素材的特征进行表示...
【专利技术属性】
技术研发人员:骆金昌,王海威,步君昭,陈坤斌,和为,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。