视频搜索词推荐方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32673305 阅读:12 留言:0更新日期:2022-03-17 11:28
本公开关于一种视频搜索词推荐方法、装置、电子设备及存储介质,所述方法包括:针对目标视频,从预设的知识图谱中抽取与目标视频的视频内容相关联的概念实体,以及各概念实体之间的实体关系,生成目标视频对应的关联知识图谱;将目标视频的视频内容文本和关联知识图谱输入至预训练的搜索词生成模型,得到至少一个候选搜索词;将各候选搜索词和视频内容文本输入至预训练的搜索词评估模型,得到各候选搜索词对应的相关性标签;根据相关性标签满足预设条件的候选搜索词,确定针对目标视频的待推荐搜索词;待推荐搜索词用于引导用户账户在访问目标视频后执行搜索操作。采用本公开可以结合关联知识图谱生成搜索词,提升了搜索词和视频内容的相关性。内容的相关性。内容的相关性。

【技术实现步骤摘要】
视频搜索词推荐方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,尤其涉及一种视频搜索词推荐方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,在用户观看视频时,通过生成针对所观看视频的搜索词并推荐给用户,可以引导用户发起搜索,增加相应搜索产品的曝光机会,满足用户的深度消费诉求。但采用传统方法仅仅只能抽取出视频所涉及的品牌名称以生成相应的搜索词,导致了生成搜索词的视频应用范围受限、视频内容关联性较弱、搜索词缺乏多样性。
[0003]因此,相关技术中存在针对视频生成的搜索词,与该视频的视频内容的相关程度较低的问题。

技术实现思路

[0004]本公开提供一种视频搜索词推荐方法、装置、电子设备及存储介质,以至少解决相关技术中存在针对视频生成的搜索词,与该视频的视频内容的相关程度较低的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种视频搜索词推荐方法,包括:
[0006]针对目标视频,从预设的知识图谱中抽取与所述目标视频的视频内容相关联的概念实体,以及各所述概念实体之间的实体关系,生成所述目标视频对应的关联知识图谱;
[0007]将所述目标视频的视频内容文本和所述关联知识图谱输入至预训练的搜索词生成模型,得到至少一个候选搜索词;
[0008]将各所述候选搜索词和所述视频内容文本输入至预训练的搜索词评估模型,得到各所述候选搜索词对应的相关性标签;所述相关性标签用于表征所述候选搜索词与所述目标视频的视频内容的相关程度
[0009]根据相关性标签满足预设条件的所述候选搜索词,确定针对所述目标视频的待推荐搜索词;所述待推荐搜索词用于引导用户账户在访问所述目标视频后执行搜索操作。
[0010]在一种可能实现方式中,所述根据相关性标签满足预设条件的所述候选搜索词,确定针对所述目标视频的待推荐搜索词,包括:
[0011]将相关性标签满足预设条件的所述候选搜索词,作为目标搜索词;
[0012]对至少一个所述目标搜索词中的异常搜索词进行过滤,得到所述待推荐搜索词;所述异常搜索词为根据预设的业务需求和/或播放平台规则确定得到的。
[0013]在一种可能实现方式中,所述对至少一个所述目标搜索词中的异常搜索词进行过滤,得到所述待推荐搜索词,包括:
[0014]若所述目标搜索词中包含有指定词语,则判定所述目标搜索词为所述异常搜索词;所述指定词语为基于预设的业务需求和播放平台规则确定的;
[0015]删除所述异常搜索词中的所述指定词语,得到修改后搜索词;
[0016]将所述修改后搜索词和非异常搜索词,作为所述待推荐搜索词;所述非异常搜索词为未包含有所述指定词语的目标搜索词。
[0017]在一种可能实现方式中,所述对至少一个所述目标搜索词中的异常搜索词进行过滤,得到所述待推荐搜索词,包括:
[0018]若所述目标搜索词中包含有预设词语,和/或所述目标搜索词的词语表征概念与预设的异常表征概念相匹配时,则判定所述目标搜索词为所述异常搜索词;所述预设词语和所述预设的异常表征概念均为基于预设的业务需求和播放平台规则确定的;
[0019]在至少一个所述目标搜索词中删除所述异常搜索词,得到所述待推荐搜索词。
[0020]在一种可能实现方式中,所述预训练的搜索词生成模型具有预训练的编码器和预训练的解码器,所述将所述目标视频的视频内容文本和所述关联知识图谱输入至预训练的搜索词生成模型,得到至少一个候选搜索词,包括:
[0021]将所述视频内容文本和所述关联知识图谱输入至所述预训练的编码器,得到编码结果;所述编码结果包括对所述视频内容文本进行编码得到的第一编码结果和对所述关联知识图谱进行编码得到的第二编码结果;
[0022]将所述编码结果输入至所述预训练的解码器,得到至少一个所述候选搜索词;所述候选搜索词为通过所述预训练的解码器对第一编码结果和第二编码结果间的融合编码结果进行解码得到的。
[0023]在一种可能实现方式中,所述将所述视频内容文本和所述关联知识图谱输入至所述预训练的编码器,得到编码结果,包括:
[0024]将预设的搜索词控制码与所述视频内容文本进行拼接,得到拼接后文本;所述搜索词控制码包括词长度控制码和关键词控制码;所述词长度控制码用于控制所述候选搜索词的词长度;所述关键词控制码用于控制所述候选搜索词中是否包含有与所述关键词控制码对应的关键词;
[0025]将所述拼接后文本和所述关联知识图谱输入至所述预训练的编码器,得到编码结果。
[0026]在一种可能实现方式中,在所述将所述目标视频的视频内容文本和所述关联知识图谱输入至预训练的搜索词生成模型,得到至少一个候选搜索词的步骤之前,还包括:
[0027]获取第一训练样本数据;每个第一训练样本数据包括第一样本视频的视频内容文本、第一样本视频的第一样本搜索词,所述第一样本搜索词对应的用户账户点击次数大于预设的点击次数阈值;
[0028]针对所述第一样本视频,从预设的知识图谱中抽取与所述第一样本视频的视频内容相关联的概念实体,以及各所述概念实体之间的实体关系,生成所述第一样本视频对应的关联知识图谱;
[0029]基于所述第一样本视频的视频内容文本、所述第一样本视频对应的关联知识图谱、所述第一样本搜索词,对待训练的搜索词生成模型进行训练,得到所述预训练的搜索词生成模型。
[0030]在一种可能实现方式中,在所述将各所述候选搜索词和所述视频内容文本输入至预训练的搜索词评估模型,得到各所述候选搜索词对应的相关性标签的步骤之前,还包括:
[0031]获取第二训练样本数据;每个第二训练样本数据包括第二样本视频的视频内容文
本、所述第二样本视频的第二样本搜索词及其对应的相关性标签、随机搜索词及其对应的相关性标签,不同相关性标签对应不同的相关程度;
[0032]基于所述第二样本视频的视频内容文本、所述第二样本搜索词及其对应的相关性标签、所述随机搜索词及其对应的相关性标签,对待训练的搜索词评估模型进行训练,得到所述预训练的搜索词评估模型。
[0033]根据本公开实施例的第二方面,提供一种视频搜索词推荐装置,包括:
[0034]关联知识图谱生成单元,被配置为执行针对目标视频,从预设的知识图谱中抽取与所述目标视频的视频内容相关联的概念实体,以及各所述概念实体之间的实体关系,生成所述目标视频对应的关联知识图谱;
[0035]候选搜索词得到单元,被配置为执行将所述目标视频的视频内容文本和所述关联知识图谱输入至预训练的搜索词生成模型,得到至少一个候选搜索词;
[0036]相关性标签得到单元,被配置为执行将各所述候选搜索词和所述视频内容文本输入至预训练的搜索词评估模型,得到各所述候选搜索词对应的相关性标签;所述相关性标签用于表征所述候选搜索词与所述目标视频的视频内容的相关程度;
[0037]待推荐搜索词确定单元,被配置为执行根本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频搜索词推荐方法,其特征在于,所述方法包括:针对目标视频,从预设的知识图谱中抽取与所述目标视频的视频内容相关联的概念实体,以及各所述概念实体之间的实体关系,生成所述目标视频对应的关联知识图谱;将所述目标视频的视频内容文本和所述关联知识图谱输入至预训练的搜索词生成模型,得到至少一个候选搜索词;将各所述候选搜索词和所述视频内容文本输入至预训练的搜索词评估模型,得到各所述候选搜索词对应的相关性标签;所述相关性标签用于表征所述候选搜索词与所述目标视频的视频内容的相关程度;根据相关性标签满足预设条件的所述候选搜索词,确定针对所述目标视频的待推荐搜索词;所述待推荐搜索词用于引导用户账户在访问所述目标视频后执行搜索操作。2.根据权利要求1所述的方法,其特征在于,所述根据相关性标签满足预设条件的所述候选搜索词,确定针对所述目标视频的待推荐搜索词,包括:将相关性标签满足预设条件的所述候选搜索词,作为目标搜索词;对至少一个所述目标搜索词中的异常搜索词进行过滤,得到所述待推荐搜索词;所述异常搜索词为根据预设的业务需求和/或播放平台规则确定得到的。3.根据权利要求1所述的方法,其特征在于,所述预训练的搜索词生成模型具有预训练的编码器和预训练的解码器,所述将所述目标视频的视频内容文本和所述关联知识图谱输入至预训练的搜索词生成模型,得到至少一个候选搜索词,包括:将所述视频内容文本和所述关联知识图谱输入至所述预训练的编码器,得到编码结果;所述编码结果包括对所述视频内容文本进行编码得到的第一编码结果和对所述关联知识图谱进行编码得到的第二编码结果;将所述编码结果输入至所述预训练的解码器,得到至少一个所述候选搜索词;所述候选搜索词为通过所述预训练的解码器对第一编码结果和第二编码结果间的融合编码结果进行解码得到的。4.根据权利要求3所述的方法,其特征在于,所述将所述视频内容文本和所述关联知识图谱输入至所述预训练的编码器,得到编码结果,包括:将预设的搜索词控制码与所述视频内容文本进行拼接,得到拼接后文本;所述搜索词控制码包括词长度控制码和关键词控制码;所述词长度控制码用于控制所述候选搜索词的词长度;所述关键词控制码用于控制所述候选搜索词中是否包含有与所述关键词控制码对应的关键词;将所述拼接后文本和所述关联知识图谱输入至所述预训练的编码器,得到编码结果。5.根据权利要求1所述的方法,其特征在于,在所述将所述目标视频的视频内容文本和所述关联知识图谱输入至预训练的搜索词生成模型,得到至少一个候选搜索词的步骤之前,还包括:获取第一训练样本数据;每个第一训练样本数据包括第一样本视频的视频内容文本、第一样本视频的第一样本搜索词,所述...

【专利技术属性】
技术研发人员:黄诗磊
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1