面向视频的目标片段定位方法、系统、存储介质及设备技术方案

技术编号：38142488 阅读：8 留言：0更新日期：2023-07-08 09:58

本发明专利技术涉及跨媒体检索技术领域，本发明专利技术公开了面向视频的目标片段定位方法、系统、存储介质及设备，包括：获取视频和查询，并分别进行特征提取；分别对视频特征和查询特征进行编码后，计算查询和视频之间的相似度，得到视频级别分数；对于编码后视频特征，使用时序卷积学习视频帧之间的时序关系后，生成若干候选片段，并得到每个候选片段的细粒度特征；同时，基于编码后查询特征，获取查询的细粒度特征；通过构造哈希空间，计算查询和候选片段之间的相似度，得到片段级别分数；对于每个查询，基于视频级别分数和片段级别分数，在所有视频的候选片段中筛选出目标片段。提高了检索速度、并实现了可扩展性。现了可扩展性。现了可扩展性。

全部详细技术资料下载

【技术实现步骤摘要】
面向视频的目标片段定位方法、系统、存储介质及设备

[0001]本专利技术涉及跨媒体检索
，具体的说，是涉及面向视频的目标片段定位方法、系统、存储介质及设备。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]随着城市化进程的加速和人口数量的增长，城市管理变得越来越复杂。为了实现城市智慧化，各种智能化技术被广泛采用，其中包括监控系统。监控系统已经成为城市管理的重要组成部分，它可以用于安全监控、交通管制、环境监测等多个方面。而监控视频由于冗长、信息密度低等特性，耗费了越来越多的人力成本和硬件资源，这为监控视频的智能化技术提出了新的挑战。
[0004]智慧城市中对监控视频的管理与分析是一个多学科交叉领域，涉及到计算机视觉、图像处理、深度学习、人工智能等多个
，现有的技术涵盖了视频数据采集、处理、分析、存储等多个方面。具体来说，包括以下几类：首先是视频数据采集技术，这是视频监控系统的基础；进而是视频数据预处理技术，对该技术的良好运用可以有效提高视频处理效率，预处理技术包括视频去噪、运动补偿、图像增强、图像分割等多个方面，其中，运动补偿技术可以降低视频帧率，从而减少数据量，提高处理效率；然后是视频数据分析技术，这是智慧城市中监控视频应用的关键技术之一，视频数据分析技术可以分为两类，一类是基于规则的分析技术，另一类是基于机器学习的分析技术，基于规则的分析技术通常需要人工定义规则，而基于机器学习的分析技术则可以自动学习规律，提高分析效率和准确...

【技术保护点】

【技术特征摘要】
1.面向视频的目标片段定位方法，其特征在于，包括：获取视频和查询，并分别进行特征提取，得到视频特征和查询特征；分别对视频特征和查询特征进行编码，得到编码后视频特征和编码后查询特征后，计算查询和视频之间的相似度，得到视频级别分数；对于编码后视频特征，使用时序卷积学习视频帧之间的时序关系后，生成若干候选片段，并得到每个候选片段的细粒度特征；同时，基于编码后查询特征，获取查询的细粒度特征；基于候选片段的细粒度特征和查询的细粒度特征，通过构造哈希空间，计算查询和候选片段之间的相似度，得到片段级别分数；对于每个查询，基于视频级别分数和片段级别分数，在所有视频的候选片段中筛选出目标片段。2.如权利要求1所述的面向视频的目标片段定位方法，其特征在于，对于某个视频，提取外观特征和动作特征后，对外观特征和动作特征均进行池化，得到片段级特征；通过连接外观特征的片段级特征和动作特征的片段级特征，并进行归一化，得到的每个视频片段的特征；所有视频片段的特征构成所述视频的视频特征。3.如权利要求1所述的面向视频的目标片段定位方法，其特征在于，对于某个查询，提取出上下文文本特征，并对查询语句进行微调后，将提取的上下文文本特征降维，并添加位置编码，得到查询特征。4.如权利要求1所述的面向视频的目标片段定位方法，其特征在于，所述视频级别分数的计算方法为：对于某个视频和某个查询，基于编码后查询特征，计算查询中的每个查询单词相对于视频的注意力分数；基于注意力分数，对查询中的每个查询单词的编码后查询特征进行加权求和，生成模块化查询向量；基于编码后视频特征和模块化查询向量，通过余弦相似度计算，得到该查询和该视频之间的视频级别分数。5.如权利要求1所述的面向视频的目标片段定位方法，其特征在于，对于编码后查询特征，利用多层感知机来获取查询的细粒度特征。6.如权利要求1所述的面向视频的目标片段定位方法，其特征在于，所述片段级别分数的...

【专利技术属性】
技术研发人员：罗昕，王妍，陈振铎，许信顺，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人