一种视频查询方法及装置制造方法及图纸

技术编号:21184716 阅读:22 留言:0更新日期:2019-05-22 15:19
本申请实施例公开了一种视频查询方法及装置,获取用户输入的待处理查询词,根据待处理查询词获取待处理扩展词,其中待处理扩展词与待处理查询词的语义相似度大于或等于预设相似度,查询与待处理查询词匹配的视频,以及与待处理扩展词匹配的视频,作为与待处理查询词对应的目标视频。因为待处理扩展词与待处理查询词的语义相似度大于或等于预设相似度,因此与待处理扩展词匹配的视频也与待处理查询词相关,因此本申请实施例可以扩充用于查询的查询词,从而得到较多的视频作为查询结果,这样用户可以有更多的选择,提高了用户的查询体验。

A Video Query Method and Device

The embodiment of this application discloses a video query method and device, which obtains the query word input by the user, obtains the extended word to be processed according to the query word to be processed, in which the semantic similarity between the extended word to be processed and the query word to be processed is greater than or equal to the preset similarity, queries the video matched with the query word to be processed, and videos matched with the extended word to be processed as The target video corresponding to the query word to be processed. Because the semantic similarity between the query word to be processed and the query word to be processed is greater than or equal to the preset similarity, the video matched with the query word to be processed is also related to the query word to be processed. Therefore, the embodiment of this application can expand the query word to be used for query, so that more video can be obtained as the query result, so that the user can have more choices and improve the query body of the user. Proven.

【技术实现步骤摘要】
一种视频查询方法及装置
本专利技术涉及计算机领域,特别是涉及一种视频查询方法及装置。
技术介绍
随着信息科技的发展,网络数据的数量也越来越多,如何从众多的网络数据中获取需要的信息,是一个重要的问题。目前,用户可以通过输入查询词来查询感兴趣的内容,例如可以通过查询词查询相关视频,从而提高获取信息的效率。现有的视频查询方式中,可以计算用户输入的查询词和视频标题的相关程度,若相关程度较高,则认为该视频标题对应的视频是用户感兴趣的视频,将该视频作为与查询词对应的查询结果。具体的,可以对查询词和视频标题进行分词得到分词结果,再判断二者的分词结果是否匹配,若匹配则认为二者相关程度较高。例如视频标题“演唱会”可以分词得到“演唱”和“会”,而查询词“歌会”可以分词得到“歌”和“会”,其中“会”和“会”匹配,因此,“演唱会”和“歌会”的相关程度可以为50%。在实际操作中,通过分词匹配的方式得到的查询结果较少,不能满足用户的查询需求,进而影响用户的查询体验。
技术实现思路
为解决上述技术问题,本申请实施例提供一种视频查询方法及装置,增加了查询结果的数量,提高用户的查询体验。本申请实施例提供了一种视频查询方法,所述方法包括:获取用户输入的待处理查询词;根据所述待处理查询词获取待处理扩展词,所述待处理扩展词与所述待处理查询词的语义相似度大于或等于预设相似度;查询与所述待处理查询词匹配的视频,以及与所述待处理扩展词匹配的视频,作为与所述待处理查询词对应的目标视频。可选的,所述根据所述待处理查询词获取待处理扩展词,包括:将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词;所述机器学习模型基于历史查询词以及历史扩展词训练得到,所述历史扩展词为历史视频的标题文本,所述历史视频基于所述历史查询词被查询到且被用户选择。可选的,所述机器学习模型基于以下方式训练得到:对所述历史查询词进行分词,得到至少一个第一分词结果;对所述历史扩展词进行分词,得到至少一个第二分词结果;基于所述第一分词结果和所述第二分词结果的对齐关系,得到对齐词组;基于所述对齐词组对所述机器学习模型进行训练。可选的,所述将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词,包括:将所述待处理查询词输入机器学习模型中,以便所述机器学习模型对所述待处理查询词进行分词,得到第三分词结果以及与所述第三分词结果对齐的第四分词结果,根据所述第四分词结果得到待处理扩展词,并输出所述待处理扩展词。可选的,所述将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词,包括:将所述待处理查询词输入机器学习模型,得到所述机器学习模型的至少一个输出结果;利用分类模型得到所述输出结果的得分,将所述得分高于或等于阈值的输出结果作为待处理扩展词。可选的,所述根据所述待处理查询词获取待处理扩展词,包括:根据所述待处理查询词,在预先建立的近义词库中查找待处理扩展词,所述近义词库中包括预先对应存储的所述待处理查询词,以及与所述待处理查询词的语义相似度大于或等于预设相似度的词。可选的,所述方法还包括:根据与所述目标视频匹配的所述待处理查询词的数量,和与所述目标视频匹配的所述待处理扩展词的数量,确定所述目标视频与所述待处理查询词的相关度;显示所述相关度大于或等于预设值的目标视频以供用户选择。可选的,所述根据与所述目标视频匹配的所述待处理查询词的数量,和与所述目标视频匹配的所述待处理扩展词的数量,确定所述目标视频与所述待处理查询词的相关度,包括:为所述待处理查询词确定第一权重,为所述待处理扩展词确定第二权重;计算与所述目标视频匹配的所述待处理查询词的数量与第一权重的第一乘积,以及与所述目标视频匹配的所述待处理扩展词的数量与第二权重的第二乘积;将所述第一乘积和所述第二乘积的和,作为所述目标视频与所述待处理查询词的相关度。本申请实施例还提供了一种视频查询装置,所述装置包括:查询词获取单元,用于获取用户输入的待处理查询词;扩展词获取单元,用于根据所述待处理查询词获取待处理扩展词,所述待处理扩展词与所述待处理查询词的语义相似度大于或等于预设相似度;视频查询单元,用于查询与所述待处理查询词匹配的视频,以及与所述待处理扩展词匹配的视频,作为与所述待处理查询词对应的目标视频。可选的,所述扩展词获取单元包括:第一扩展词获取子单元,用于将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词;所述机器学习模型基于历史查询词以及历史扩展词训练得到,所述历史扩展词为历史视频的标题文本,所述历史视频基于所述历史查询词被查询到且被用户选择。可选的,所述机器学习模型基于以下方式训练得到:对所述历史查询词进行分词,得到至少一个第一分词结果;对所述历史扩展词进行分词,得到至少一个第二分词结果;基于所述第一分词结果和所述第二分词结果的对齐关系,得到对齐词组;基于所述对齐词组对所述机器学习模型进行训练。可选的,所述扩展词查询子单元具体用于:将所述待处理查询词输入机器学习模型中,以便所述机器学习模型对所述待处理查询词进行分词,得到第三分词结果以及与所述第三分词结果对齐的第四分词结果,根据所述第四分词结果得到待处理扩展词,并输出所述待处理扩展词。可选的,所述扩展词查询子单元,包括:输入单元,用于将所述待处理查询词输入机器学习模型,得到所述机器学习模型的至少一个输出结果;扩展词确定单元,用于利用分类模型得到所述输出结果的得分,将所述得分高于或等于阈值的输出结果作为待处理扩展词。可选的,所述扩展词获取单元,包括:第二扩展词获取子单元,用于根据所述待处理查询词,在预先建立的近义词库中查找待处理扩展词,所述近义词库中包括预先对应存储的所述待处理查询词,以及与所述待处理查询词的语义相似度大于或等于预设相似度的词。可选的,所述装置还包括:相关度确定单元,用于根据与所述目标视频匹配的所述待处理查询词的数量,和与所述目标视频匹配的所述待处理扩展词的数量,确定所述目标视频与所述待处理查询词的相关度;显示单元,用于显示所述相关度大于或等于预设值的目标视频以供用户选择。可选的,所述相关度确定单元,包括:权重确定单元,用于为所述待处理查询词确定第一权重,为所述待处理扩展词确定第二权重;计算单元,用于计算与所述目标视频匹配的所述待处理查询词的数量与第一权重的第一乘积,以及与所述目标视频匹配的所述待处理扩展词的数量与第二权重的第二乘积;相关度确定子单元,用于将所述第一乘积和第二乘积的和,作为所述目标视频与所述待处理查询词的相关度。本申请实施例提供了一种视频查询方法及装置,获取用户输入的待处理查询词,根据待处理查询词获取待处理扩展词,其中待处理扩展词与待处理查询词的语义相似度大于或等于预设相似度,查询与待处理查询词匹配的视频,以及与待处理扩展词匹配的视频,作为与待处理查询词对应的目标视频。因为待处理扩展词与待处理查询词的语义相似度大于或等于预设相似度,因此与待处理扩展词匹配的视频也与待处理查询词相关,因此本申请实施例可以扩充用于查询的查询词,从而得到较多的视频作为查询结果,这样用户可以有更多的选择,提高了用户的查询体验。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使本文档来自技高网...

【技术保护点】
1.一种视频查询方法,其特征在于,所述方法包括:获取用户输入的待处理查询词;根据所述待处理查询词获取待处理扩展词,所述待处理扩展词与所述待处理查询词的语义相似度大于或等于预设相似度;查询与所述待处理查询词匹配的视频,以及与所述待处理扩展词匹配的视频,作为与所述待处理查询词对应的目标视频。

【技术特征摘要】
1.一种视频查询方法,其特征在于,所述方法包括:获取用户输入的待处理查询词;根据所述待处理查询词获取待处理扩展词,所述待处理扩展词与所述待处理查询词的语义相似度大于或等于预设相似度;查询与所述待处理查询词匹配的视频,以及与所述待处理扩展词匹配的视频,作为与所述待处理查询词对应的目标视频。2.根据权利要求1所述的方法,其特征在于,所述根据所述待处理查询词获取待处理扩展词,包括:将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词;所述机器学习模型基于历史查询词以及历史扩展词训练得到,所述历史扩展词为历史视频的标题文本,所述历史视频基于所述历史查询词被查询到且被用户选择。3.根据权利要求2所述的方法,其特征在于,所述机器学习模型基于以下方式训练得到:对所述历史查询词进行分词,得到至少一个第一分词结果;对所述历史扩展词进行分词,得到至少一个第二分词结果;基于所述第一分词结果和所述第二分词结果的对齐关系,得到对齐词组;基于所述对齐词组对所述机器学习模型进行训练。4.根据权利要求3所述的方法,其特征在于,所述将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词,包括:将所述待处理查询词输入机器学习模型中,以便所述机器学习模型对所述待处理查询词进行分词,得到第三分词结果以及与所述第三分词结果对齐的第四分词结果,根据所述第四分词结果得到待处理扩展词,并输出所述待处理扩展词。5.根据权利要求2所述的方法,其特征在于,所述将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词,包括:将所述待处理查询词输入机器学习模型,得到所述机器学习模型的至少一个输出结果;利用分类模型得到所述输出结果的得分,将所述得分高于或等于阈值的输出结果作为待处理扩展词。6.根据权利要求1所述的方法,其特征在于,所述根据所述待处理查询词获取待处理扩展词,包括:根据所述待处理查询词,在预先建立的近义词库中查找待处理扩展词,所述近义词库中包括预先对应存储的所述待处理查询词,以及与所述待处理查询词的语义相似度大于或等于预设相似度的词。7.根据权利要求1-6任意一项所述的方法,其特征在于,所述方法还包括:根据与所述目标视频匹配的所述待处理查询词的数量,和与所述目标视频匹配的所述待处理扩展词的数量,确定所述目标视频与所述待处理查询词的相关度;显示所述相关度大于或等于预设值的目标视频以供用户选择。8.根据权利要求7所述的方法,其特征在于,所述根据与所述目标视频匹配的所述待处理查询词的数量,和与所述目标视频匹配的所述待处理扩展词的数量,确定所述目标视频与所述待处理查询词的相关度,包括:为所述待处理查询词确定第一权重,为所述待处理扩展词确定第二权重;计算与所述目标视频匹配的所述待处理查询词的数量与第一权重的第一乘积,以及与所述目标视频匹配的所述待处理扩展词的数量与第二权重的第二乘积;将所述第一乘积和所述第二乘积的和,作为所述目标视频与所述待处理...

【专利技术属性】
技术研发人员:王天畅陈英傑叶澄灿何咏倩
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1