一种面向动态视频中目标关键帧的自动定位方法技术

技术编号：37722984 阅读：12 留言：0更新日期：2023-06-02 00:24

本发明专利技术公开一种面向动态视频中目标关键帧的自动定位方法，包括以下步骤：将待预测的视频数据统一转化为固定大小的视频，得到数据集，将数据集通过训练后的目标关键帧自动定位深度学习模型，得到包含目标的视频数据的关键帧位置。本发明专利技术采用一种基于“检测—定位”的两阶段框架，可以较好的分析包含目标的视频帧之间的依赖关系，给出关键帧定位结果。该深度学习模型输入为裁剪后的原始视频数据，并且以整段视频作为输入，避免了信息的损失。本方法对不同的种类的视频数据具有良好的兼容性，网络同时考虑了目标的图像特征和时空位置特征，具有自动化程度高，准确率高的特点。准确率高的特点。准确率高的特点。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向动态视频中目标关键帧的自动定位方法

[0001]本专利技术属于图像处理
，涉及一种面向动态视频中目标关键帧的自动定位方法。

技术介绍

[0002]随着互联网技术和多媒体技术的不断发展，视频数据成为日常生活中一种常见的数据类型。视频数据大体上可以看作是视频帧的集合，并且视频的帧与帧之间存在一定的前后时间依赖关系。并且视频数据通常具有数据量大，时间冗余大的特点，给视频存储，传输和检索带来了一定的困难。关键帧是视频中的某一最具代表性的帧，可以用于描述整段视频，视频关键帧被广泛应用于视频摘要，视频检索和视频分析等领域。例如在医学影像领域，关键帧在临床诊断中被应用于基于超声视频数据的甲状腺结节诊断，基于关键帧的超声视频自动分析和辅助诊断可以极大地降低甲状腺结节诊断对于医生的依赖，提高诊断效率和准确率。
[0003]传统的关键帧定位方法主要包括基于内容分析的定位方法，基于运动分析的定位方法和基于聚类的定位方法等。传统的关键帧定位方法通常基于一些手工特征进行定位，未能充分利用视频的全部信息，并且在面对不同时长，不同视频采集设备等差异较大的视频时表现不佳，难以给出令人满意的关键帧定位结果。例如在超声视频数据中，由于超声视频具有分辨率低、噪点多等特点，且临床超声采集设备型号较多，设备之间具有一定的差异，传统方法难以达到令人满意的效果。
[0004]近年来，随着计算机视觉技术和深度学习技术的不断发展，越来越多基于深度学习技术的自动化关键帧定位算法不断被提出，这些算法可以自动学习视频数据中的特征，经由模型可以...

【技术保护点】

【技术特征摘要】
1.一种面向动态视频中目标关键帧的自动定位方法，其特征在于，包括以下步骤：将待预测的视频数据统一转化为固定大小的视频，得到数据集，将数据集通过训练后的目标关键帧自动定位深度学习模型，得到包含目标的视频数据的关键帧位置。2.根据权利要求1所述的一种面向动态视频中目标关键帧的自动定位方法，其特征在于，将待预测的视频数据通过线性插值的方法，统一转化为固定大小的视频，得到数据集。3.根据权利要求1所述的一种面向动态视频中目标关键帧的自动定位方法，其特征在于，目标关键帧自动定位深度学习模型由目标检测模块和关键帧回归得分模块顺序相接组成；目标检测模块通过以下过程得到：从视频数据中抽取部分包含目标的视频帧数据，然后进行标注，将标注后的包含目标的视频帧数据进行划分为训练集、验证集和测试集；通过训练集训练目标检测模块，不断更新迭代，至目标检测模块收敛，得到训练好的检测模型；调整步骤检测模型的超参数，重复多次训练，得到多个模型，选取在验证集效果最好的模型，作为目标检测模块。4.根据权利要求3所述的一种面向动态视频中目标关键帧的自动定位方法，其特征在于，关键帧回归得分模块包括循环神经网络、全连接层，ReLU层和sigmoid层；训练好的关键帧回归得分模块通过以下过程得到：获取包含目标的视频数据，然后进行标注，将标注后的包含目标的视频数据转化为固定大小的视频，得到数据集，将数据集划分为训练集、验证集和测试集；通过训练集训练关键帧回归得分模块至收敛。5.根据权利要求3所述的一种面向动态视频中目标关键帧的自动定位方法，其特征在于，标注包括：包含目标的视频数据中关键帧的位置以及部分包含目标的视频帧中目标的位置。6.根据权利...

【专利技术属性】
技术研发人员：李钟毓，王煜辰，张靓靓，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人