标签推荐模型训练方法及装置、标签获取方法及装置制造方法及图纸

技术编号：32640333 阅读：13 留言：0更新日期：2022-03-12 18:16

本公开提供了一种标签推荐模型训练方法及装置、标签获取方法及装置，涉及数据处理技术领域，尤其涉及深度学习、云服务、内容搜索等技术领域，具体实现方案为：响应于接收到收集训练素材指示，收集训练素材，所述训练素材包含兴趣标签；采用语义增强表示框架，对所述训练素材的特征进行表示，得到包括所述兴趣标签的训练语义向量；将社交网络聚合至所述训练语义向量中，得到训练编码向量；基于所述训练编码向量作为输入，所述兴趣标签作为输出，训练双层神经网络结构，得到标签推荐模型。通过本公开获取的兴趣标签更加精确。公开获取的兴趣标签更加精确。公开获取的兴趣标签更加精确。

全部详细技术资料下载

【技术实现步骤摘要】
标签推荐模型训练方法及装置、标签获取方法及装置

[0001]本公开涉及数据处理
，尤其涉及深度学习、云服务、内容搜索等
，具体而言涉及一种标签推荐模型训练方法及装置、标签获取方法及装置。

技术介绍

[0002]兴趣画像包括基于规则、传统模型两种技术方案。属性画像可以是年龄、性别等固定属性，获取简单方便。兴趣画像表示的是兴趣爱好，例如偏好，技能，习惯等方面。两种技术方案的特点是特征，多采用文本表示特征。

技术实现思路

[0003]本公开提供了一种标签推荐模型训练方法及装置、标签获取方法及装置。
[0004]根据本公开的一方面，提供了一种标签推荐模型训练方法，所述方法包括：
[0005]响应于接收到收集训练素材指示，收集训练素材，所述训练素材包含兴趣标签；采用语义增强表示框架，对所述训练素材的特征进行表示，得到包括所述兴趣标签的训练语义向量；将社交网络聚合至所述训练语义向量中，得到训练编码向量；基于所述训练编码向量作为输入，所述兴趣标签作为输出，训练双层神经网络结构，得到标签推荐模型。
[0006]根据本公开的第二方面，提供了一种标签获取方法，所述方法包括：
[0007]响应于接收到获取兴趣标签指示，获取相应的素材；采用语义增强表示框架，对所述素材的特征进行表示，得到包括兴趣标签的语义向量；将社交网络聚合至所述语义向量中，得到编码向量；将所述编码向量输入至预先训练的标签推荐模型中，得到兴趣标签。
[0008]根据本公开的第三方面，提供了一种标签推荐模型训...

【技术保护点】

【技术特征摘要】
1.一种标签推荐模型训练方法，所述方法包括：响应于接收到收集训练素材指示，收集训练素材，所述训练素材包含兴趣标签；采用语义增强表示框架，对所述训练素材的特征进行表示，得到包括所述兴趣标签的训练语义向量；将社交网络聚合至所述训练语义向量中，得到训练编码向量；基于所述训练编码向量作为输入，所述兴趣标签作为输出，训练双层神经网络结构，得到标签推荐模型。2.根据权利要求1所述的方法，其中，所述训练素材包括行为训练素材和业务训练素材；所述采用语义增强表示框架，对所述训练素材的特征进行表示，得到包括兴趣标签的训练语义向量，包括：基于所述语义增强表示框架，将所述行为训练素材表示为不同长度的训练行为向量，将所述业务训练素材表示为固定长度的训练业务向量；将所述训练行为向量求平均之后，与所述训练业务向量进行融合，得到训练语义向量。3.根据权利要求1所述的方法，其中，所述将社交网络聚合至所述训练语义向量中，得到训练编码向量，包括：获取之间的社交网络，并确定社交网络之间的亲密值；将所述亲密值作为矩阵中元素的取值，构建邻接矩阵；在所述邻接矩阵中每行所述元素的权重和为一的条件下，为所述元素分配权重，所述邻接矩阵中对角线元素分配的权重大于其他元素分配的权重；获取所述邻接矩阵中每个元素对应的训练语义向量，基于图卷积网络，计算所述训练语义向量与分配权重之后每个元素取值之间的乘积，得到训练编码向量。4.根据权利要求1所述的方法，其中，所述基于所述训练编码向量作为输入，所述兴趣标签作为输出，训练双层神经网络结构，得到标签推荐模型，包括：将所述训练编码向量作为向前网络的输入，训练所述向前网络，得到新的训练编码向量；将所述新的训练编码向量再次作为全连接网络的输入，训练所述全连接网络，得到训练标签向量；将所述训练标签向量作为自变量，输出为兴趣标签，得到标签推荐模型。5.根据权利要求4所述的方法，其中，所述将所述训练标签向量作为自变量，输出为兴趣标签，得到标签推荐模型，包括：采用激活函数解析所述训练标签向量，得到所述训练标签向量中包含的兴趣标签；在所述兴趣标签中，确定与所述兴趣标签对应的第一兴趣标签，并计算所述第一兴趣标签在所述兴趣标签中占用的比例，确定标签推荐模型的概率阈值，得到输出标签概率大于或等于所述概率阈值的标签推荐模型。6.一种标签获取方法，所述方法包括：响应于接收到获取兴趣标签指示，获取相应的素材；采用语义增强表示框架，对所述素材的特征进行表示，得到包括兴趣标签的语义向量；将社交网络聚合至所述语义向量中，得到编码向量；
将所述编码向量输入至预先训练的标签推荐模型中，得到兴趣标签。7.根据权利要求6所述的方法，其中，所述将所述编码向量输入至预先训练的标签推荐模型中，得到兴趣标签，包括：将所述编码向量输入至所述标签推荐模型中的向前网络中，得到新的编码向量；将所述新的编码向量输入至全连接网络中，得到标签向量；解析所述标签向量，基于所述标签推荐模型中的概率阈值，输出兴趣标签。8.根据权利要求7所述的方法，其中，所述解析所述标签向量，基于所述标签推荐模型中的概率阈值，输出兴趣标签，包括：基于所述标签推荐模型中的激活函数，解析所述标签向量，得到多个标签；将所述多个标签中出现概率大于或等于概率阈值的标签，确定为兴趣标签。9.一种标签推荐模型训练装置，所述装置包括：获取模块，用于响应于接收到收集训练素材指示，收集训练素材，所述训练素材包含兴趣标签；处理模块，用于采用语义增强表示框架，对所述训练素材的特征进行表示...

【专利技术属性】
技术研发人员：骆金昌，王海威，步君昭，陈坤斌，和为，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人