内容推送方法技术

技术编号:39824165 阅读:15 留言:0更新日期:2023-12-29 15:59
本申请实施例公开了一种内容推送方法

【技术实现步骤摘要】
内容推送方法、模型训练方法、装置及电子设备


[0001]本申请涉及人工智能
,特别是涉及一种内容推送方法

模型训练方法

装置及电子设备


技术介绍

[0002]随着互联网技术的快速发展,越来越多的用户通过互联网进行内容浏览,例如浏览新闻

资讯等

相关技术中,一般是通过提取待推送内容中的关键词,通过提取关键词的方式来对多个待推送内容进行去重或者匹配后再进行推送,在一定程度上提升推送的精度

然而,上述方式仅通过关键词来进行去重或者匹配,比较依赖于关键词的提取精度,并且,即便是关键词提取精度较高,由于关键词并不能完全代表待推送内容的语义,推送的准确性仍然有待提高


技术实现思路

[0003]以下是对本申请详细描述的主题的概述

本概述并非是为了限制权利要求的保护范围

[0004]本申请实施例提供了一种内容推送方法

模型训练方法
>、
装置及本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种内容推送方法,其特征在于,包括:获取多个样本文本,其中,所述样本文本标注有多个样本标签;基于编码模型提取各个所述样本文本的样本特征,根据多个所述样本特征构建正样本对和负样本对,根据所述正样本对和所述负样本对确定所述编码模型的对比损失;根据所述样本特征对所述样本文本进行分类,得到所述样本文本的样本类别,根据所述样本类别和各个所述样本标签,确定所述编码模型的多个分类子损失,根据多个所述分类子损失确定分类损失;根据所述对比损失和所述分类损失训练所述编码模型;获取多个候选推送内容,提取所述候选推送内容的候选文本,将所述候选文本输入至训练后的所述编码模型,得到候选特征,根据所述候选特征对多个所述候选推送内容进行推送
。2.
根据权利要求1所述的内容推送方法,其特征在于,所述候选文本的数量为多个,多个所述候选文本包括从多种模态类型的数据中提取得到的文本,所述根据所述候选特征对多个所述候选推送内容进行推送,包括:根据所述候选特征确定任意两个所述候选推送内容中,从相同模态类型的数据提取得到的所述候选文本之间的第一相似度;将多种类型的所述候选文本之间的第一相似度进行加权,得到任意两个所述候选推送内容之间的第二相似度;根据所述第二相似度从多个所述候选推送内容中确定目标推送内容,将所述目标推送内容进行推送
。3.
根据权利要求2所述的内容推送方法,其特征在于,所述将多种类型的所述候选文本之间的第一相似度进行加权,得到任意两个所述候选推送内容之间的第二相似度,包括:获取所述候选推送内容的封面图像,基于预先训练好的图像特征提取模型提取所述封面图像的图像特征;根据所述图像特征确定任意两个所述候选推送内容之间的第三相似度;将所述第三相似度与多种类型的所述候选文本之间的第一相似度进行加权,得到任意两个所述候选推送内容之间的第二相似度
。4.
根据权利要求1所述的内容推送方法,其特征在于,多个所述样本文本包括从多种模态类型的数据中提取得到的文本,所述根据所述对比损失和所述分类损失训练所述编码模型,包括:将从不同模态类型的数据中提取得到的所述样本文本对应的所述分类损失进行加权,得到加权损失;根据所述对比损失和所述加权损失确定目标损失,根据所述目标损失训练所述编码模型
。5.
根据权利要求1至4任意一项所述的内容推送方法,其特征在于,所述基于编码模型提取各个所述样本文本的样本特征,根据多个所述样本特征构建正样本对和负样本对,包括:复制多个所述样本文本中的其中一个第一文本,得到第二文本;基于编码模型提取第一文本的样本特征,并基于经过丢弃操作的所述编码模型提取所
述第二文本的样本特征;基于所述编码模型提取第三文本的样本特征,根据所述第一文本的样本特征和所述第二文本的样本特征构建正样本对,根据所述第一文本的样本特征和第三文本的样本特征构建负样本对,其中,所述第三文本为多个所述样本文本中除了所述第一文本以外的其他文本
。6.
根据权利要求5所述的内容推送方法,其特征在于,所述根据所述第一文本的样本特征和第三文本的样本特征构建负样本对,包括:对所述第一文本进行实体识别,得到所述第一文本中的第一实体;获取与所述第一实体类别相同的第二实体,利用所述第二实体替换所述第一文本中对应的所述第一实体,得到第四文本;基于编码模型提取所述第四文本的样本特征,将所述第一文本的样本特征和所述第三文本的样本特征作为负样本对,将所述第一文本的样本特征和所述第四文本的样本特征作为负样本对
。7.
根据权利要求6所述的内容推送方法,其特征在于,所述对所述第一文本进行实体识别,得到所述第一文本中的第一实体,包括:对所述第一文本中的词语进行词性过滤,得到多个候选词语;利用预设宽度的滑动窗口对多个所述候选词语进行滑动处理,将滑动过程中位于所述滑动窗口中的所述候选词语进行连接,得到词语网络;根据所述候选词语在所述词语网络中的权重确定所述候选词语的关键性得分,根据所述关键性得分从多个所述候选词语中确定目标词语;对所述第一文本进行实体识别,得到多个候选实体;根据所述目标词语与所述候选实体的交集或者并集得到所述第一文本中的第一实体
。8.
根据权利要求6所述的内容推送方法,其特征在于,所述获取与所述第一实体类别相同的第二实体,包括:获取预设的知识图谱,其中,所述知识图谱包括多个实体节点,所述第...

【专利技术属性】
技术研发人员:刘楚妮司建锋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1