【技术实现步骤摘要】
一种基于目标检测与跟踪的智能视频编码方法
本专利技术涉及视频编码
,特别涉及一种基于目标检测与跟踪的智能视频编码方法。
技术介绍
目前常用的视频图像分辨率已经达到1080P高清,正逐渐向4K和8K超清方向发展,这些高分辨率视频的码流数据在传输和存储方面受到巨大的挑战。对于主要采用高分辨率视频且对实时性和图像质量要求较高的视频监控、视频会议等应用领域,如何在有限的网络带宽和存储空间下合理分配码率资源至关重要。在视频信息处理领域,感兴趣区域的提出与应用主要利用了人类视觉系统(HumanVisualSystem,HVS)的特征。HVS在面对一个复杂场景时优先将注意力集中在少数几个具有显著视觉特征的视频对象上,对场景中的不同区域给于不同级别的关注程度。因此,在对整个视频图像区域进行处理时,那些不符合人眼特性的区域会造成码流资源和计算资源的浪费。感兴趣区域(RegionofInterest,ROI)在视频编码领域中的主要应用体现在优先保证人眼关注区域的图像清晰度,并降低非关注区域的码流比特数。此外,ROI中清晰目标对象也为后续高质量的智能视频分析打下良好基础。在视频监 ...
【技术保护点】
1.一种基于目标检测与跟踪的智能视频编码方法,其特征在于:所述方法包括以下步骤:步骤1:输入原始视频图像P1,设定目标对象类别的权重值Weight;步骤2:基于原始视频图像P1的水平像素分辨率,生成检测跟踪图像P2;步骤3:对检测跟踪图像P2进行目标对象检测,输出检测到目标对象的位置坐标、检测框宽高、置信度最大的对象类别及置信度值;步骤4:在生成的检测跟踪图像P2中,根据检测结果提取目标对象特征;步骤5:采用核相关滤波目标跟踪算法对目标对象进行跟踪;步骤6:利用目标对象与检测跟踪图像P2及原始视频图像P1的关系生成感兴趣区域;步骤7:计算感兴趣区域量化参数下调值QPdown ...
【技术特征摘要】
1.一种基于目标检测与跟踪的智能视频编码方法,其特征在于:所述方法包括以下步骤:步骤1:输入原始视频图像P1,设定目标对象类别的权重值Weight;步骤2:基于原始视频图像P1的水平像素分辨率,生成检测跟踪图像P2;步骤3:对检测跟踪图像P2进行目标对象检测,输出检测到目标对象的位置坐标、检测框宽高、置信度最大的对象类别及置信度值;步骤4:在生成的检测跟踪图像P2中,根据检测结果提取目标对象特征;步骤5:采用核相关滤波目标跟踪算法对目标对象进行跟踪;步骤6:利用目标对象与检测跟踪图像P2及原始视频图像P1的关系生成感兴趣区域;步骤7:计算感兴趣区域量化参数下调值QPdown;步骤8:视频图像编码。2.根据权利要求1所述的一种基于目标检测与跟踪的智能视频编码方法,其特征在于:所述步骤1中,支持目标对象类别包括人和车,Weight取值范围为[1,10]。3.根据权利要求1所述的一种基于目标检测与跟踪的智能视频编码方法,其特征在于:所述步骤2中,若原始视频图像P1的水平像素分辨率小于等于1920,则采用双线性插值算法将输入的原始视频图像P1缩放到分辨率为R的检测跟踪图像P2;否则采用基于像素区域关系的插值算法将原始视频图像P1缩放到分辨率为R的检测跟踪图像P2;分辨率R的大小在640×480至960×720之间,用户根据计算资源决定。4.根据权利要求1所述的一种基于目标检测与跟踪的智能视频编码方法,其特征在于:所述步骤3中,对步骤2生成的检测跟踪图像P2采用改进的SSD神经网络模型进行目标对象检测,从第1帧开始检测,每隔N帧检测一次,N的取值范围为[15,150];若当前帧为检测帧,并且检测到目标对象,则输出像素尺寸较大的前M个目标对象的位置坐标、检测框大小、置信度最大的对象类别及置信度值Conf,并进行步骤4;若当前帧中没有目标对象,进行步骤8,完成视频图像编码;M的取值范围为[1,50];若当前帧为非检测帧,并且在最近一次检测中已检测到目标对象,则进行步骤5,若当前帧中没有目标对象,进行步骤8,完成视频图像编...
【专利技术属性】
技术研发人员:朱威,王东洋,王义锋,吴远,陈朋,郑雅羽,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。