用于识别视频的方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：27656666 阅读：35 留言：0更新日期：2021-03-12 14:19

本申请实施例公开了用于识别视频的方法、装置、电子设备及计算机可读存储介质，涉及计算机视觉、云服务、深度学习技术领域，可用于视频搜索场景。该方法的一具体实施方式包括：获取待识别图像；根据图像相似度筛选出与待识别图像相似的视频关键帧集，视频关键帧集中的多张视频关键帧按与待识别图像的图像相似度大小顺序排列；确定待识别图像中图像内容所属的内容类别，并对视频关键帧集中多张视频关键帧的当前排列顺序按与内容类别的接近程度进行调整，得到调整后视频关键帧排序；分别确定与调整后视频关键帧排序中每个视频关键帧所属的匹配视频，得到匹配视频排序。该实施方式提升了确定出的视频与待识别图像的匹配程度。

全部详细技术资料下载

【技术实现步骤摘要】
用于识别视频的方法、装置、电子设备及可读存储介质
本申请涉及人工智能领域，具体涉及计算机视觉、云服务、深度学习
，尤其涉及用于识别视频的方法、装置、电子设备及计算机可读存储介质。
技术介绍
视觉搜索是以图像，视频等内容作为搜索的输入源，利用视觉识别相关技术，将输入的视觉内容识别检索，并返回相关图像、文字等多种形态结果的技术。随着视觉搜索的技术不断的发展，视觉搜索返回给用户的搜索结果由文字发展到图像，由图像发展到视频，不断更新迭代来满足不同用户的搜索需求。现有通常对用户给定的待识别图像进行猜词处理，然后根据猜出的搜索关键词来搜索相应的视频，并将搜索出的视频作为识别结果反馈给用户。
技术实现思路
本申请实施例提出了一种用于识别视频的方法、装置、电子设备及计算机可读存储介质。第一方面，本申请实施例提出了一种用于识别视频的方法，包括：获取待识别图像；根据图像相似度筛选出与待识别图像相似的视频关键帧集，视频关键帧集中的多张视频关键帧按与待识别图像的图像相似度大小顺序排列；根据待识别图像的图像内容确定图像内容类别，并对视频关键帧集中多张视频关键帧的当前排列顺序按与图像内容类别的接近程度进行调整，得到调整后视频关键帧排序；分别确定与调整后视频关键帧排序中每个视频关键帧所属的匹配视频，得到匹配视频排序。第二方面，本申请实施例提出了一种用于识别视频的装置，包括：待识别图像获取单元，被配置成获取待识别图像；视频关键帧集确定单元，被配置成根据图像相似度筛选出与待识别图像相似的视频关...

【技术保护点】
1.一种用于识别视频的方法，包括：/n获取待识别图像；/n根据图像相似度筛选出与所述待识别图像相似的视频关键帧集，所述视频关键帧集中的多张视频关键帧按与所述待识别图像的图像相似度大小顺序排列；/n确定所述待识别图像中图像内容所属的内容类别，并对所述视频关键帧集中多张视频关键帧的当前排列顺序按与所述内容类别的接近程度进行调整，得到调整后视频关键帧排序；/n分别确定与所述调整后视频关键帧排序中每个视频关键帧所属的匹配视频，得到匹配视频排序。/n

【技术特征摘要】
1.一种用于识别视频的方法，包括：
获取待识别图像；
根据图像相似度筛选出与所述待识别图像相似的视频关键帧集，所述视频关键帧集中的多张视频关键帧按与所述待识别图像的图像相似度大小顺序排列；
确定所述待识别图像中图像内容所属的内容类别，并对所述视频关键帧集中多张视频关键帧的当前排列顺序按与所述内容类别的接近程度进行调整，得到调整后视频关键帧排序；
分别确定与所述调整后视频关键帧排序中每个视频关键帧所属的匹配视频，得到匹配视频排序。

2.根据权利要求1所述的方法，其中，所述根据图像相似度筛选出与所述待识别图像相似的视频关键帧集，包括：
将所述待识别图像输入预设的图像相似度计算模型；
接收所述图像相似度计算模型输出的预设的视频关键帧集合中各视频关键帧分别与所述待识别图像之间的图像相似度；
取所述图像相似度的大小在前设定数量的视频关键帧生成所述视频关键帧集。

3.根据权利要求2所述的方法，其中，所述图像相似度计算模型在全连接层后增设有依次连接的2个卷积层和1个线性整流层。

4.根据权利要求1所述的方法，其中，所述确定所述待识别图像中图像内容所属的内容类别，包括：
利用预设的图像分类模型对所述待识别图像进行针对图像内容的语义识别操作，并根据得到的语义识别结果确定出所述内容类别。

5.根据权利要求4所述的方法，其中，所述图像分类模型在全连接层后增设有依次连接的2个卷积层和1个线性整流层。

6.根据权利要求1所述的方法，其中，所述获取待识别图像包括：
响应于接收到传入的待识别视频，从所述待识别视频中提取待识别关键帧，并将所述待识别关键帧作为所述待识别图像。

7.根据权利要求1所述的方法，其中，所述获取待识别图像包括：
响应于接收到传入的待识别视频和时间指示信息，将所述待识别视频中与所述时间指示信息对应的目标视频帧作为所述待识别图像。

8.根据权利要求1至7任一项所述的方法，其中，响应于所述图像相似度通过预设的第一维度数特征进行比较得到，还包括：
将所述内容类别表达为预设的第二维度数特征；以及
所述对所述视频关键帧集中多张视频关键帧的当前排列顺序按与所述内容类别的接近程度进行调整，得到调整后视频关键帧排序，包括：
将所述视频关键帧集中的每张视频关键帧的第一维度数特征与其第二维度数特征进行拼接，得到拼接后特征；
根据所述视频关键帧的拼接后特征与所述待识别图像的拼接后特征计算得到综合特征相似度，得到按所述综合相似度从大到小排列的调整后视频关键帧排序。

9.根据权利要求8所述的方法，其中，所述根据所述视频关键帧的拼接后特征与所述待识别图像的拼接后特征计算得到综合特征相似度，包括：
利用预设的检索模型计算得到所述视频关键帧和所述待识别图像各自的拼接后特征间的特征相似度，得到所述综合特征相似度。

10.一种用于识别视频的装置，包括：
待识别图像获取单元，被配置成获取待识别图像；
视频关键帧集确定单元，被配置成根据图像相似度筛选出与所述待识别图像相似的视频关键帧集，所述视频关键帧集中的多张视频关键帧按与所述待识别图像的图像相似度大小顺序排列；
排序调整单元，被配置成确定所述待识别图像中图像内容所属的内容类别，并对所述视频关键帧集中多张视频关键帧的当前排列顺序按与所述内容类别的接近程度进行调整，得到调整后视频关键...

【专利技术属性】
技术研发人员：代江，付程晗，范学峰，李国洪，高菲，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人