视频数据处理方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号：24210437 阅读：14 留言：0更新日期：2020-05-20 16:36

本公开的实施例提供了一种视频数据处理方法、装置、电子设备及计算机可读介质。该方法包括：获取待处理视频的当前帧图像，检测当前帧图像中目标对象的初始定位框；确定当前帧图像与前一帧图像的图像相似度；当图像相似度大于第一阈值时，将前一帧图像的初始定位框作为当前帧图像的显示定位框；当图像相似度小于或等于第一阈值且大于第二阈值时，根据前N帧图像的初始定位框的平均值确定当前帧图像的显示定位框，其中，第一阈值大于第二阈值，N为大于1的整数。本公开提供的技术方案根据图像相似度对定位框进行调整获得显示定位框，能够减轻待处理视频中定位框的抖动现象，提高连续帧图像中定位框的显示质量。

Video data processing methods, devices, electronic equipment and computer readable media

全部详细技术资料下载

【技术实现步骤摘要】
视频数据处理方法、装置、电子设备及计算机可读介质
本公开涉及视频处理
，具体而言，涉及一种视频数据处理方法、装置、电子设备及计算机可读介质。
技术介绍
在观测内窥镜输出的实时视频流时，通常通过目标检测算法对目标检测对象进行检测，获得目标对象的定位框。相关技术中，通过目标检测模型对视频流中按照时间进行排序的各帧图像进行目标检测。其中，每张独立的帧图像得到一个独立的定位框，该定位框用于标识目标对象。并将定位框叠加到视频上以进行显示。然而，视频流和普通图片不一样，同一目标在视频流上会连续出现一段时间。但由于内窥镜检测的环境较为复杂，无法精细操控镜头，且检测对象通常较小，上述方式将导致连续输出的视频中的定位框不稳定(视频的微小变化会导致定位框输出不稳定)，产品应用在病灶检测视频流上，表现为同一目标对象的定位框一直在“抖动”。因此，需要一种新的视频数据处理方法、装置、电子设备及计算机可读介质。需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开实施例提供一种视频数据处理方法、装置及电子设备，进而至少在一定程度上克服视频处理
中视频流中由于镜头变化导致的定位框的抖动现象。本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。本公开实施例提出一种视频数据处理方法，包括：获取待处理视频的当前帧图像，检测所述当前帧图像中目标对象的初...

【技术保护点】
1.一种视频数据处理方法，其特征在于，包括：/n获取待处理视频的当前帧图像，检测所述当前帧图像中目标对象的初始定位框；/n确定所述当前帧图像与前一帧图像的图像相似度；/n当所述图像相似度大于第一阈值时，将所述前一帧图像的初始定位框作为所述当前帧图像的显示定位框；/n当所述图像相似度小于或等于所述第一阈值且大于第二阈值时，根据前N帧图像的初始定位框的平均值确定所述当前帧图像的显示定位框，其中，所述第一阈值大于所述第二阈值，所述N为大于1的整数。/n

【技术特征摘要】
1.一种视频数据处理方法，其特征在于，包括：
获取待处理视频的当前帧图像，检测所述当前帧图像中目标对象的初始定位框；
确定所述当前帧图像与前一帧图像的图像相似度；
当所述图像相似度大于第一阈值时，将所述前一帧图像的初始定位框作为所述当前帧图像的显示定位框；
当所述图像相似度小于或等于所述第一阈值且大于第二阈值时，根据前N帧图像的初始定位框的平均值确定所述当前帧图像的显示定位框，其中，所述第一阈值大于所述第二阈值，所述N为大于1的整数。

2.如权利要求1所述的方法，其特征在于，还包括：
当所述图像相似度小于或等于所述第一阈值且大于所述第二阈值时，根据所述当前帧图像和所述前一帧图像的初始定位框的交并比确定所述当前帧图像的显示定位框，所述交并比为所述当前帧图像的初始定位框和所述前一帧图像的初始定位框的交集与并集的比值。

3.如权利要求2所述的方法，其特征在于，根据所述当前帧图像和所述前一帧图像的初始定位框的交并比确定所述当前帧图像的显示定位框包括：
当所述当前帧图像的初始定位框和所述前一帧图像的初始定位框的交并比大于第三阈值时，将所述前一帧图像的初始定位框作为所述当前帧图像的显示定位框；
当所述当前帧图像的初始定位框和所述前一帧图像的初始定位框的交并比小于或等于所述第三阈值且大于第四阈值时，根据所述前N帧图像的初始定位框的平均值确定所述当前帧图像的显示定位框，其中，所述第三阈值大于所述第四阈值。

4.如权利要求1或3所述的方法，其特征在于，根据前N帧图像的初始定位框的平均值确定所述当前帧图像的显示定位框包括：
对所述前N帧图像的初始定位框的中心坐标信息进行加权平均，生成所述前N帧图像的初始定位框的中心坐标平均值；
对所述前N帧图像的初始定位框的尺寸信息进行加权平均，生成所述前N帧图像的初始定位框的尺寸平均值；
根据所述中心坐标平均值和所述尺寸平均值确定所述前N帧图像的初始定位框的...

【专利技术属性】
技术研发人员：章子健，孙钟前，郑瀚，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人