视频排序方法、装置、服务器及存储介质制造方法及图纸

技术编号:26650693 阅读:16 留言:0更新日期:2020-12-09 00:50
本公开关于一种视频排序方法、装置、服务器及存储介质,属于视频处理技术领域,该方法包括:响应于终端基于目标搜索词的视频搜索请求,获取多个视频的参考文字信息,确定多个视频的文字匹配信息,基于文字匹配信息及对应的图文匹配信息,确定多个视频在终端上的展示顺序。本公开实施例中,由于参考文字信息为视频包含的文字信息,且由于图文匹配信息表示参考文字信息与对应视频的视频帧的匹配程度,因此根据图文匹配信息和文字匹配信息,确定展示顺序,能够确保图文匹配程度大的排序靠前,避免了图文不一致的情况,提高了确定展示顺序的准确性,进而用户能够快速确定出其想要观看的视频,提高了人机交互效率。

【技术实现步骤摘要】
视频排序方法、装置、服务器及存储介质
本公开涉及视频处理
,尤其涉及一种视频排序方法、装置、服务器及存储介质。
技术介绍
计算机技术和移动互联网的飞速发展,为用户随时随地观看视频提供了极大的便利。例如,用户想要观看视频时,可以按照该视频的搜索词进行搜索,进而搜索到该搜索词对应的多个视频,通过浏览该多个视频,找到想要观看的视频,再对想要观看的视频实施点击操作,就可以观看该视频。然而,由于网络视频数量及种类繁多,基于搜索词搜索出的视频也很多,可能会导致用户在浏览多个视频时,需要浏览很长时间才能找到其想要观看的视频。在这种情况下,通常需要对多个视频进行排序,以确定多个视频在终端上的展示顺序,再按照多个视频的展示顺序进行展示,使与搜索词相关的视频的顺序靠前,进而减小用户的浏览时间,使用户能够快速找到其想要观看的视频。目前,视频排序方法通常为:用户在终端上输入搜索词,点击搜索选项,则终端响应于用户的点击操作,向服务器发送视频搜索请求,服务器在接收到视频搜索请求后,获取多个视频的视频标题或者视频描述,根据该多个视频的视频标题或者视频描述,分别计算该多个视频与该搜索词的文字匹配程度,进而根据文字匹配程度的大小,确定该多个视频在终端上的展示顺序,再向终端返回该多个视频的展示顺序,由该终端根据该多个视频的展示顺序进行展示。上述技术中,仅仅利用了视频的视频标题和视频描述来确定视频的展示顺序,视频排序的准确性不高,可能会造成用户需要多次搜索才能找到其想要观看的视频,降低了人机交互效率。
技术实现思路
r>本公开提供一种视频排序方法、装置、服务器及存储介质,能够提高视频排序的准确性,避免了用户多次搜索才能找到其想要观看的视频,提高了人机交互效率。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种视频排序方法,该方法包括:响应于终端基于目标搜索词的视频搜索请求,获取多个视频的参考文字信息,该参考文字信息为该多个视频所包含的文字信息;确定该多个视频的文字匹配信息,该文字匹配信息用于表示该参考文字信息与该目标搜索词之间的文字匹配程度;基于该多个视频的文字匹配信息以及该多个视频对应的图文匹配信息,确定该多个视频在该终端上的展示顺序,该图文匹配信息用于表示该参考文字信息与对应视频的视频帧的匹配程度。在一种可能的实现方式中,该方法还包括:分别提取该多个视频的参考文字信息的语义特征;分别提取该多个视频的视频帧的内容特征;基于该参考文字信息的语义特征与该视频帧的内容特征,确定该多个视频的图文匹配信息。在一种可能的实现方式中,该基于该参考文字信息的语义特征与该视频帧的内容特征,确定该多个视频的图文匹配信息包括:对于该多个视频中的任一个视频,通过双塔网络中的语义分析网络提取该任一个视频的参考文字信息的语义特征,通过该双塔网络中的特征提取网络提取该任一个视频的视频帧的内容特征,对该语义特征与该内容特征进行匹配程度的预测,得到该任一个视频的图文匹配信息。在一种可能的实现方式中,该对所述语义特征与所述内容特征进行匹配程度的预测,得到所述任一个视频的图文匹配信息包括:通过该双塔网络,获取以该语义特征为搜索词得到的该内容特征的点击率;基于该语义特征与该内容特征,确定该语义特征与该内容特征之间的语义相似度;对该点击率与该语义相似度,进行加权求和,得到该图文匹配信息。在一种可能的实现方式中,该多个视频的参考文字信息基于对该多个视频的视频帧所识别出的文字的筛选得到。在一种可能的实现方式中,该多个视频的参考文字信息的确定过程包括:分别获取该多个视频的视频帧;分别对该多个视频的视频帧进行文字检测和文字识别,得到该多个视频的文字信息;分别基于该多个视频的文字信息的物理特征,对该多个视频的文字信息进行文字筛选,得到该多个视频的参考文字信息,该物理特征用于表示文字在视频帧中的显示形式。在一种可能的实现方式中,该分别获取该多个视频的视频帧包括下述任一项:分别获取该多个视频的视频封面帧,作为该多个视频的视频帧;分别在该多个视频对应的多个视频帧中,选取一个视频帧,作为该多个视频的视频帧。在一种可能的实现方式中,该物理特征为文字位置、文字大小、文字清晰度、文字高宽、文字倾斜角度、文字字体、文字是否人为编辑、文字是否前景文字、文字是否重复中任意一项或任意多项。在一种可能的实现方式中,该分别基于该多个视频的文字信息的物理特征,对该多个视频的文字信息进行文字筛选,得到该多个视频的参考文字信息包括:分别基于该多个视频的文字信息的文字大小和文字清晰度,在该多个视频的文字信息中,筛选出文字大小大于第一阈值且文字清晰度大于第二阈值的文字信息;将筛选出的文字信息作为该多个视频的参考文字信息。在一种可能的实现方式中,该基于该多个视频的文字信息的物理特征,分别对该多个视频的文字信息进行文字筛选,得到该多个视频的参考文字信息包括:分别基于该多个视频的文字信息的文字位置和文字是否人为编辑,在该多个视频的文字信息中,筛选出文字人为编辑或文字处于视频帧的目标位置的文字信息;将筛选出的文字信息作为该多个视频的参考文字信息。在一种可能的实现方式中,该分别基于该多个视频的文字信息的文字位置和文字是否人为编辑,在该多个视频的文字信息中,筛选出文字人为编辑或文字处于视频帧的目标位置的文字信息包括:分别将该多个视频的文字信息输入分类网络,通过该分类网络,确定该文字信息中属于前景文字类型的文字信息,该前景文字类型用于表示人为编辑或处于视频的目标位置的文字类型。在一种可能的实现方式中,该基于该多个视频的文字匹配信息以及该多个视频对应的图文匹配信息,确定该多个视频在该终端上的展示顺序包括:基于该多个视频的文字匹配信息、该多个视频的点击率以及该多个视频对应的图文匹配信息,确定该多个视频在该终端上的展示顺序。根据本公开实施例的第二方面,提供一种视频排序装置,该装置包括:获取单元,被配置为执行响应于终端基于目标搜索词的视频搜索请求,获取多个视频的参考文字信息,该参考文字信息为该多个视频所包含的文字信息;确定单元,被配置为执行确定该多个视频的文字匹配信息,该文字匹配信息用于表示该参考文字信息与该目标搜索词之间的文字匹配程度;排序单元,被配置为执行基于该多个视频的文字匹配信息以及该多个视频对应的图文匹配信息,确定该多个视频在该终端上的展示顺序,该图文匹配信息用于表示该参考文字信息与对应视频的视频帧的匹配程度。在一种可能的实现方式中,该装置还包括:语义特征提取单元,被配置为执行分别提取该多个视频的参考文字信息的语义特征;内容特征提取单元,被配置为执行分别提取该多个视频的视频帧的内容特征;图文匹配信息确定单元,被配置为执行基于该参考文字信息的语义特征与该视频帧的内容特征,确定该多个视频的图文匹配信息。在一种可本文档来自技高网...

【技术保护点】
1.一种视频排序方法,其特征在于,所述方法包括:/n响应于终端基于目标搜索词的视频搜索请求,获取多个视频的参考文字信息,所述参考文字信息为所述多个视频所包含的文字信息;/n确定所述多个视频的文字匹配信息,所述文字匹配信息用于表示所述参考文字信息与所述目标搜索词之间的文字匹配程度;/n基于所述多个视频的文字匹配信息以及所述多个视频对应的图文匹配信息,确定所述多个视频在所述终端上的展示顺序,所述图文匹配信息用于表示所述参考文字信息与对应视频的视频帧的匹配程度。/n

【技术特征摘要】
1.一种视频排序方法,其特征在于,所述方法包括:
响应于终端基于目标搜索词的视频搜索请求,获取多个视频的参考文字信息,所述参考文字信息为所述多个视频所包含的文字信息;
确定所述多个视频的文字匹配信息,所述文字匹配信息用于表示所述参考文字信息与所述目标搜索词之间的文字匹配程度;
基于所述多个视频的文字匹配信息以及所述多个视频对应的图文匹配信息,确定所述多个视频在所述终端上的展示顺序,所述图文匹配信息用于表示所述参考文字信息与对应视频的视频帧的匹配程度。


2.根据权利要求1所述的视频排序方法,其特征在于,所述方法还包括:
分别提取所述多个视频的参考文字信息的语义特征;
分别提取所述多个视频的视频帧的内容特征;
基于所述参考文字信息的语义特征与所述视频帧的内容特征,确定所述多个视频的图文匹配信息。


3.根据权利要求1所述的视频排序方法,其特征在于,所述多个视频的参考文字信息的确定过程包括:
分别获取所述多个视频的视频帧;
分别对所述多个视频的视频帧进行文字检测和文字识别,得到所述多个视频的文字信息;
分别基于所述多个视频的文字信息的物理特征,对所述多个视频的文字信息进行文字筛选,得到所述多个视频的参考文字信息,所述物理特征用于表示文字在视频帧中的显示形式。


4.根据权利要求3所述的视频排序方法,其特征在于,所述分别获取所述多个视频的视频帧包括下述任一项:
分别获取所述多个视频的视频封面帧,作为所述多个视频的视频帧;
分别在所述多个视频对应的多个视频帧中,选取一个视频帧,作为所述多个视频的视频帧。


5.根据权利要求3所述的视频排序方法,其特征在于,所述物理特征为文字位置、文字大小、文字清晰度、文字高宽、文字倾斜角度、文字字体、文字是否人为编辑、文字是否前景文字、文字是否重复中任意一项或任意多项。


6.根据权利要求5所述的视频排序方法...

【专利技术属性】
技术研发人员:张水发
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1