视频搜索方法及装置、电子设备和介质制造方法及图纸

技术编号：29489666 阅读：27 留言：0更新日期：2021-07-30 19:01

本公开提供了一种视频搜索方法及装置、电子设备和介质，涉及图像及视频处理技术领域，具体涉及人工智能和计算机视觉技术，可应用于视频理解场景下。实现方案为：根据待搜索视频的图像帧对应的对象，确定待搜索视频包括的至少一个对象片段，每个对象片段中的各图像帧对应于相同的对象；将上述至少一个对象片段中的一个或多个连续的对象片段的对象出场数据对进行拼接，得到待搜索视频的第一对象出场特征，其中，对象出场数据对包括相应对象片段对应的对象和该对象片段的首个图像帧与上一个对象片段的首个图像帧的时间差；以及根据第一对象出场特征，从多个候选视频中确定与待搜索视频相匹配的至少一个目标视频。

全部详细技术资料下载

【技术实现步骤摘要】
视频搜索方法及装置、电子设备和介质
本公开涉及图像及视频处理
，尤其涉及人工智能和计算机视觉技术，可应用于视频理解场景下。具体涉及一种视频搜索的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。视频相较于文本、图像等信息传播媒介可以提供更丰富的信息内容。在一些场景中，用户希望通过搜索来获取其需要的视频。现有的视频搜索方法通常是基于文本的搜索，即，通过匹配用户输入的搜索词与视频库中的各个视频的文本标签来得到搜索结果。这种搜索方式与视频本身的内容无关，仅依赖于用户输入的搜索词和视频文本标签标注的准确性，搜索结果通常难以令用户满意。在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。
技术实现思路
本公开提供了一种视频搜索的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。根据本公开的一方面，提供了一种视频搜索方法，该方法包括：根据...

【技术保护点】
1.一种视频搜索方法，包括：/n根据待搜索视频的图像帧对应的对象，确定所述待搜索视频包括的至少一个对象片段，每个对象片段中的各图像帧对应于相同的对象；/n将所述至少一个对象片段中的一个或多个连续的对象片段的对象出场数据对进行拼接，得到所述待搜索视频的第一对象出场特征，其中，所述对象出场数据对包括相应对象片段对应的对象和该对象片段的首个图像帧与上一个对象片段的首个图像帧的时间差；以及/n根据所述第一对象出场特征，从多个候选视频中确定与所述待搜索视频相匹配的至少一个目标视频。/n

【技术特征摘要】
1.一种视频搜索方法，包括：
根据待搜索视频的图像帧对应的对象，确定所述待搜索视频包括的至少一个对象片段，每个对象片段中的各图像帧对应于相同的对象；
将所述至少一个对象片段中的一个或多个连续的对象片段的对象出场数据对进行拼接，得到所述待搜索视频的第一对象出场特征，其中，所述对象出场数据对包括相应对象片段对应的对象和该对象片段的首个图像帧与上一个对象片段的首个图像帧的时间差；以及
根据所述第一对象出场特征，从多个候选视频中确定与所述待搜索视频相匹配的至少一个目标视频。

2.根据权利要求1所述的方法，还包括：
对待搜索视频的多个图像帧进行对象识别，以确定所述多个图像帧对应的对象。

3.根据权利要求2所述的方法，其中，所述对待搜索视频的多个图像帧进行对象识别，以确定所述多个图像帧对应的对象包括：
对于所述多个图像帧中的每一个图像帧：
对该图像帧进行对象识别，以确定该图像帧中包括的候选对象；以及
将下列任一项作为该图像帧对应的对象：距离该图像帧的中心最近的候选对象、面积最大的候选对象、具有正视图的候选对象。

4.根据权利要求1-3中任一项所述的方法，其中，所述根据待搜索视频的图像帧对应的对象，确定所述待搜索视频包括的至少一个对象片段包括：
将对应于相同的对象的一个或多个连续的图像帧作为一个对象片段。

5.根据权利要求1-4中任一项所述的方法，其中，所述根据所述第一对象出场特征，从多个候选视频中确定与所述待搜索视频相匹配的至少一个目标视频包括：
获取所述多个候选视频中的每一个候选视频的第二对象出场特征，所述第二对象出场特征包括至少一个对象出场数据对，每一个对象出场数据对包括对象和时间差；以及
响应于确定第二对象出场特征与所述第一对象出场特征存在连续相同的至少一个对象出场数据对，将相应的候选视频作为所述目标视频。

6.根据权利要求5所述的方法，还包括：
根据相应的第二对象出场特征与所述第一对象出场特征的连续相同的对象出场数据对的数量，确定所述至少一个目标视频中的每一个目标视频与所述待搜索视频的匹配度；以及
将所述至少一个目标视频按照匹配度由高到低的顺序排列。

7.根据权利要求1-4中任一项所述的方法，其中，所述根据所述第一对象出场特征，从多个候选视频中确定与所述待搜索视频相匹配的至少一个目标视频包括：
获取所述多个候选视频中的每一个候选视频的第二对象出场特征；以及
将第二对象出场特征中包括所述第一对象出场特征的候选视频作为所述至少一个目标视频。

8.一种视频搜索装置，包括：
对象片段划分模块，被配置为根据待搜索视频的图像帧对应的对象，确定所述待搜索视频包括的至少一个对象片段，每个对象片段中的各图像帧对应于相同的对象；
特征提取模块，被配置为将所述至少一个对象片段中的一个或多个连续的对象片段的对象出场数据对进行拼接，得到所述待搜索视频的...

【专利技术属性】
技术研发人员：刘俊启，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人