视频搜索方法及装置、计算机设备和介质制造方法及图纸

技术编号：29330729 阅读：21 留言：0更新日期：2021-07-20 17:48

本公开提供了一种视频搜索方法及装置、计算设备和介质，涉及人工智能技术领域，具体涉及智能搜索技术，可应用于视频理解场景下。实现方案为：获取待搜索视频，其中，待搜索视频包括多个在时域上连续的视频帧，多个视频帧中的每一个视频帧均包括字幕区域；基于待搜索视频的字幕区域中的内容在时域上的变化，根据预设规则，从待搜索视频中提取第一关键帧序列；获取多个候选视频中每一个候选视频所对应的第二关键帧序列，其中，每一个候选视频的第二关键帧序列根据预设规则从该候选视频中提取得到；以及基于第一关键帧序列，以及多个候选视频中每一个候选视频所对应的第二关键帧序列，确定多个候选视频中与待搜索视频相匹配的视频。

全部详细技术资料下载

【技术实现步骤摘要】
视频搜索方法及装置、计算机设备和介质
本公开涉及人工智能
，尤其涉及智能搜索技术，可应用于视频理解场景下。具体涉及一种视频搜索的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术：人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。视频相较于文本、图像等信息传播媒介可以提供更丰富的信息内容。在一些场景中，用户希望通过搜索来获取其需要的视频。现有的视频搜索方法通常是基于文本的搜索，即，通过匹配用户输入的搜索词与视频库中的各个视频的文本标签来得到搜索结果。这种搜索方式与视频本身的内容无关，仅依赖于用户输入的搜索词和视频文本标签标注的准确性，搜索结果通常难以令用户满意。在此部分中描述的方法不一定...

【技术保护点】
1.一种视频搜索方法，包括：/n获取待搜索视频，其中，所述待搜索视频包括多个在时域上连续的视频帧，所述多个视频帧中的每一个视频帧均包括字幕区域；/n基于所述待搜索视频的字幕区域中的内容在时域上的变化，根据预设规则，从所述待搜索视频中提取第一关键帧序列；/n获取多个候选视频中每一个候选视频所对应的第二关键帧序列，其中，每一个候选视频的第二关键帧序列根据所述预设规则从该候选视频中提取得到；以及/n基于所述第一关键帧序列，以及所述多个候选视频中每一个候选视频所对应的第二关键帧序列，确定所述多个候选视频中与所述待搜索视频相匹配的视频。/n

【技术特征摘要】
1.一种视频搜索方法，包括：
获取待搜索视频，其中，所述待搜索视频包括多个在时域上连续的视频帧，所述多个视频帧中的每一个视频帧均包括字幕区域；
基于所述待搜索视频的字幕区域中的内容在时域上的变化，根据预设规则，从所述待搜索视频中提取第一关键帧序列；
获取多个候选视频中每一个候选视频所对应的第二关键帧序列，其中，每一个候选视频的第二关键帧序列根据所述预设规则从该候选视频中提取得到；以及
基于所述第一关键帧序列，以及所述多个候选视频中每一个候选视频所对应的第二关键帧序列，确定所述多个候选视频中与所述待搜索视频相匹配的视频。

2.根据权利要求1所述的方法，其中，所述基于所述待搜索视频的字幕区域中的内容在时域上的变化，根据预设规则，从所述待搜索视频中提取第一关键帧序列包括：
针对所述待搜索视频中任意两个相邻的视频帧，响应于其中前一帧的字幕区域中的内容与其中后一帧的字幕区域中的内容不匹配，将该两个相邻的视频帧中至少一帧确定为第一关键帧，以构成所述第一关键帧序列。

3.根据权利要求2所述的方法，其中，所述其中前一帧的字幕区域中的内容与其中后一帧的字幕区域中的内容不匹配包括：
所述前一帧的字幕区域中的图像与所述后一帧的字幕区域中的图像的相似度小于预设阈值。

4.根据权利要求2所述的方法，还包括：
对所述多个视频帧中每一个视频帧的字幕区域执行文字识别；
其中，所述其中前一帧中的字幕区域中的内容与其中后一帧中的字幕区域中的内容不匹配包括：所述前一帧中的文字识别结果与所述后一帧中的文字识别结果不同。

5.根据权利要求1所述的方法，其中，所述基于所述第一关键帧序列，以及所述多个候选视频中每一个候选视频所对应的第二关键帧序列，确定所述多个候选视频中与所述待搜索视频相匹配的视频包括：
针对所述多个候选视频中每一个候选视频，响应于该候选视频所对应的第二关键帧序列与所述第一关键帧序列满足预设匹配条件，确定该候选视频为与所述待搜索视频相匹配的视频。

6.根据权利要求5所述的方法，其中，所述该候选视频所对应的第二关键帧序列与所述第一关键帧序列满足预设匹配条件包括：
针对所述第二关键帧序列中预设长度的第二子序列，所述第一关键帧序列中存在与所述第二子序列相应的所述预设长度的第一子序列，其中，所述第二子序列与所述第一子序列之间依次对应的每两帧之间的相似度大于预设阈值。

7.根据权利要求1所述的方法，还包括：
针对所述多个候选视频中每一个候选视频，基于所述预设规则，预先从该候选视频中提取该候选视频所对应的第二关键帧序列。

8.根据权利要求1所述的方法，还包括：
在确定所述多个候选视频中与所述待搜索视频相匹配的视频之后，反馈基于所确定的与所述待搜索视频相匹配的视频的页面信息。

9.一种视频搜索装置，包括：
第一获取单元，被配置用于获取待搜索视频，其中，所述待搜索视频包括多个在时域上连续的视频帧，所述多个视频帧中的每一个视频帧均包括字幕区域；
第一提取单元，被配置用于基于所述待搜索视频的字幕区域中...

【专利技术属性】
技术研发人员：刘俊启，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人