目标区域识别方法、装置、终端和存储介质制造方法及图纸

技术编号：38942276 阅读：33 留言：0更新日期：2023-09-25 09:40

本申请实施例公开了目标区域识别方法、装置、终端和存储介质；本申请实施例可以获取视频流，视频流包括当前帧；对当前帧进行特征提取，得到当前帧的当前特征；获取前一区域，前一区域包括预设区域或前一帧区域；根据前一区域和当前特征，对当前帧进行目标识别，得到当前帧的目标区域，目标区域表征所述目标对象在所述当前帧中所处的区域。在本申请实施例中，当前帧可以是视频流中的任意一帧，如此，本申请在识别视频流中目标对象在视频帧所处的区域时，并不需要对首帧中目标对象所处的区域进行人工标注，并且并不需要耗费大量的计算来追踪目标对象在视频帧中所处的区域。由此，本方案可以提升识别视频帧中目标对象的效率。可以提升识别视频帧中目标对象的效率。可以提升识别视频帧中目标对象的效率。

全部详细技术资料下载

【技术实现步骤摘要】
目标区域识别方法、装置、终端和存储介质

[0001]本申请涉及计算机领域，具体涉及目标区域识别方法、装置、终端和存储介质。

技术介绍

[0002]近年来，随着计算机技术和网络技术的发展，计算机视觉得到广泛应用。比如，采用计算机视觉中的语义分割可以将视觉输入分为不同的语义可解释类别，语义的可解释性即分类类别在真实世界中是有意义的。目前，语义分割已经广泛应用到自动驾驶、机器人以及图像搜索引擎等许多领域中。
[0003]然而，目前通常采用视频物体分割算法(Video Object Segmentation，VOS)，识别视频帧中目标对象所处的区域时，而VOS算法需要对首帧中目标对象所处的区域进行人工标定，使在识别首帧之后的其他帧时，可以追踪到目标对象。此外，由于目标对象在不同帧中有不同的呈现，VOS算法在对其他帧中目标对象所处的区域进行识别时，需要耗费大量的计算来确定其他帧中是否有目标对象所处的区域，导致视频帧中目标对象的识别效率较低。

技术实现思路

[0004]本申请实施例提供目标区域识别方法、装置、终端和存储介质，可以提升识别视频帧中目标对象的效率。
[0005]本申请实施例提供一种目标区域识别方法，包括：
[0006]获取视频流，视频流包括当前帧；
[0007]对当前帧进行特征提取，得到当前帧的当前特征；
[0008]获取前一区域，前一区域包括预设区域或前一帧区域，前一帧区域为目标对象在当前帧的前一帧中所处的区域；
[0009]根据前一区域和当前特征，对...

【技术保护点】

【技术特征摘要】
1.一种目标区域识别方法，其特征在于，包括：获取视频流，所述视频流包括当前帧；对所述当前帧进行特征提取，得到所述当前帧的当前特征；获取前一区域，所述前一区域包括预设区域或前一帧区域，所述前一帧区域为目标对象在所述当前帧的前一帧中所处的区域；根据所述前一区域和所述当前特征，对所述当前帧进行目标识别，得到所述当前帧的目标区域，所述目标区域表征所述目标对象在所述当前帧中所处的区域。2.如权利要求1所述的方法，其特征在于，所述根据所述前一区域和所述当前特征，对所述当前帧进行目标识别，得到所述当前帧的目标区域，包括：对所述前一区域进行特征提取，得到所述前一区域的前一区域特征；对所述前一区域特征和所述当前特征进行特征融合，得到融合特征；根据所述融合特征，对所述当前帧进行目标识别，得到所述当前帧的目标区域。3.如权利要求1所述的方法，其特征在于，所述根据所述前一区域和所述当前特征，对所述当前帧进行目标识别，得到所述当前帧的目标区域，包括：若所述当前帧为所述视频流的首帧，根据所述预设区域和所述当前特征，对所述首帧进行目标识别，得到所述首帧的目标区域。4.如权利要求1所述的方法，其特征在于，所述根据所述前一区域和所述当前特征，对所述当前帧进行目标识别，得到所述当前帧的目标区域，包括：若所述当前帧为所述视频流的其他帧，根据所述前一帧区域和所述当前特征，对所述其他帧进行目标识别，得到所述其他帧的目标区域，所述其他帧为所述视频流中首帧之后的帧。5.如权利要求1所述的方法，其特征在于，所述目标区域包括第一子区域和第二子区域，所述第一子区域为所述当前帧中所述目标对象所处的区域，所述第二子区域为所述当前帧中其他对象所处的区域，所述其他对象为所述目标对象以外的对象。6.如权利要求1所述的方法，其特征在于，在所述获取视频流之前，还包括：获取多个训练视频流，以及获取目标区域识别网络，所述目标区域识别网络用于识别目标对象在帧中所处的区域，所述训练视频流中包括训练帧，所述训练帧的标注为所述训练帧的真实目标区域，所述真实目标区域包括第一真实子区域和第二真实子区域，所述第一真实子区域为所述训练帧中所述目标对象所处的区域，所述第二真实子区域为所述训练帧中其他对象所处的区域，所述其他对象为所述目标对象以外的对象；利用所述多个训练视频流对所述目标区域识别网络进行训练，直至所述目标区域识别网络收敛，得到训练完成的所述目标区域识别网络；采用训练完成的所述目标区域识别网络对以下方法进行处理：获取视频流，所述视频流包括当前帧；对所述当前帧进行特征提取，得到所述当前帧对应的当前特征；获取前一区...

【专利技术属性】
技术研发人员：林晓帆，姜文杰，
申请(专利权)人：影石创新科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人