目标区域检测方法、装置、终端及存储介质制造方法及图纸

技术编号:19389175 阅读:17 留言:0更新日期:2018-11-10 02:08
本发明专利技术实施例公开了一种目标区域检测方法、装置、终端及存储介质,属于计算机技术领域。该方法包括:确定多个样本区域以及分类结果;获取分类器,分类器包括依次排列的多个分类节点;根据多个样本区域以及多个样本区域的分类结果,对分类器中的第一个分类节点进行训练,第一个分类节点训练完成后继续对下一个分类节点进行训练,直至多个分类节点均训练完成;当确定当前跟踪的图像中不包括目标区域时,应用已训练完成的分类器,对当前跟踪的图像之后的第二图像中的至少一个区域进行分类,根据分类结果确定第二图像中的目标区域,无需对每帧图像均进行检测,减小了不必要的计算量。并且提高了分类器的准确性,进而提高了目标区域的准确性。

Target area detection method, device, terminal and storage medium

The embodiment of the invention discloses a target area detection method, device, terminal and storage medium, which belongs to the field of computer technology. The method includes: determining multiple sample areas and classification results; acquiring classifiers, which include sequentially arranged multiple classification nodes; training the first classification node in the classifier according to the classification results of multiple sample areas and multiple sample areas, and continuing the training of the first classification node after completion of training. The next classification node is trained until multiple classification nodes are trained. When the target area is not included in the current tracking image, the trained classifier is applied to classify at least one area in the second image after the current tracking image, and the second image is determined according to the classification results. The target area does not need to detect every frame image, which reduces unnecessary computation. The accuracy of the classifier is improved, and the accuracy of the target area is improved.

【技术实现步骤摘要】
目标区域检测方法、装置、终端及存储介质
本专利技术实施例涉及计算机
,特别涉及一种目标区域检测方法、装置、终端及存储介质。
技术介绍
随着互联网的快速发展和视频社交的广泛兴起,互联网信息的主要传播类型从文字、图片逐渐演变成了视频,多种视频处理功能也相继出现,如视频滤镜、视频打标(tagging)等,通过这些视频处理功能可以对视频中的某些目标区域进行个性化处理,提升了趣味性。相关技术中,在终端播放视频的过程中,用户可以在当前图像中手动确定目标区域,终端对当前图像中的目标区域进行编辑处理,如在目标区域添加贴纸或者对目标区域进行美化等。并且,终端还会以目标区域在当前图像中的位置为基准,从当前图像开始分别进行前向跟踪和后向跟踪,确定目标区域在当前图像之前和之后的每帧图像中的位置,从而对每帧图像中的目标区域进行相同的编辑处理,保证图像之间的一致性。但是,如果终端拍摄视频的过程中的位置或姿态变化较大,会导致视频的某些图像中不包括目标区域,那么当跟踪至不包括目标区域的图像时,目标区域跟踪失败,在之后跟踪的图像中即使存在目标区域,也很难被重新检测出来。
技术实现思路
本专利技术实施例提供了一种目标区域检测方法、装置、终端及存储介质,可以解决相关技术存在的问题。所述技术方案如下:一方面,提供了一种目标区域检测方法,所述方法包括:根据用户在视频的第一图像中确定的目标区域,确定多个样本区域以及所述多个样本区域的分类结果,所述分类结果用于表示所述样本区域是否属于所述目标区域;获取待训练的分类器,所述分类器包括按照先后顺序依次排列的多个分类节点;根据所述多个样本区域以及所述多个样本区域的分类结果,对所述分类器中的第一个分类节点进行训练,所述第一个分类节点训练完成后继续对下一个分类节点进行训练,直至所述多个分类节点均训练完成;在所述视频中除所述第一图像以外的其他图像中跟踪所述目标区域,当确定当前跟踪的图像中不包括所述目标区域时,应用已训练完成的所述分类器,对当前跟踪的图像之后的第二图像中的至少一个区域进行分类,根据分类结果确定所述第二图像中的所述目标区域。另一方面,提供了一种目标区域检测装置,所述装置包括:样本确定模块,用于根据用户在视频的第一图像中确定的目标区域,确定多个样本区域以及所述多个样本区域的分类结果,所述分类结果用于表示所述样本区域是否属于所述目标区域;获取模块,用于获取待训练的分类器,所述分类器包括按照先后顺序依次排列的多个分类节点;训练模块,用于根据所述多个样本区域以及所述多个样本区域的分类结果,对所述分类器中的第一个分类节点进行训练,所述第一个分类节点训练完成后继续对下一个分类节点进行训练,直至所述多个分类节点均训练完成;检测模块,用于在所述视频中除所述第一图像以外的其他图像中跟踪所述目标区域,当确定当前跟踪的图像中不包括所述目标区域时,应用已训练完成的所述分类器,对当前跟踪的图像之后的第二图像中的至少一个区域进行分类,根据分类结果确定所述第二图像中的所述目标区域。再一方面,提供了一种用于检测目标区域的终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并具有以实现所述的目标区域检测方法中所具有的操作。再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并具有以实现所述的目标区域检测方法中所具有的操作。本专利技术实施例提供的方法、装置、终端及存储介质,根据用户在视频的第一图像中确定的目标区域,确定多个样本区域以及多个样本区域的分类结果,分类结果用于表示样本区域是否属于目标区域,获取待训练的分类器,分类器包括按照先后顺序依次排列的多个分类节点,根据多个样本区域以及多个样本区域的分类结果,对分类器中的第一个分类节点进行训练,第一个分类节点训练完成后继续对下一个分类节点进行训练,直至多个分类节点均训练完成,在视频中除第一图像以外的其他图像中跟踪目标区域,当确定当前跟踪的图像中不包括目标区域时,应用已训练完成的分类器,对当前跟踪的图像之后的第二图像中的至少一个区域进行分类,根据分类结果确定第二图像中的目标区域,无需对每帧图像均进行检测,减小了不必要的计算量。并且先采用动态规划的训练方式,在分类器中上一个分类节点训练完成后才会训练下一个分类节点,提高了分类器的准确性,在训练好分类器后当目标区域跟踪失败时,应用已训练完成的分类器进行分类,重新检测出目标区域,能够提高目标区域的准确性。并且,在目标区域发生较大形变时,能够根据形变后的目标区域对分类器进行更新,及时学习到新的目标区域,提高了分类器的鲁棒性和可靠性,在终端快速抖动、旋转、目标被遮挡等情况下能够及时准确地检测出目标区域,检测效果理想。并且,采用线性结构的分类器,可以在保证分类节点数目固定的情况下,最大化地细分分类空间,提高分类准确率。并且,将图像视觉信息与传感器数据相结合,通过配置的传感器提供的位姿信息,估算目标区域的位置,在估算的目标区域内进行跟踪或检测,而对估算目标区域以外的其他区域无需进行跟踪或检测,能够避免由于传感器误差而导致的跟踪失败,而且还能减小不必要的计算量,提高运算速度。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是相关技术提供的一种TLD算法的示意图;图2是本专利技术实施例提供的一种目标区域检测方法的示意图;图3是本专利技术实施例提供的一种分类器的结构示意图;图4是本专利技术实施例提供的一种图像跟踪示意图;图5是本专利技术实施例提供的一种特征点示意图;图6是本专利技术实施例提供的另一种特征点示意图;图7是本专利技术实施例提供的一种坐标系示意图;图8是本专利技术实施例提供的一种级联分类器的示意图;图9是本专利技术实施例提供的一种操作流程示意图;图10是本专利技术实施例提供的一种跟踪速度示意图;图11是本专利技术实施例提供的一种目标区域检测装置的结构示意图;图12是本专利技术实施例提供的一种终端的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。在对本专利技术实施例进行详细说明之前,首先对TLD(Tracking-Learning-Detection,跟踪-学习-检测)算法进行如下介绍:TLD算法用于对视频中的单个物体进行长时间跟踪,参见图1,TLD算法包括三个模块:跟踪模块、检测模块和学习模块。一、跟踪模块:跟踪模块用于跟踪任两帧相邻图像之间的运动变化情况,根据目标区域在上一帧图像中的位置以及两帧图像之间的运动变化情况,在下一帧图像中确定目标区域的位置。跟踪模块只有在下一帧图像中存在目标区域时有效。并且,跟踪模块还会将下一帧图像中跟踪到的目标区域作为正样本区域,提供给学习模块,由学习模块将正样本区域用于训练分类器。二、检测模块:检测模块用于对图像进行全面地扫描,并应用分类器对扫描到的区域进行分类,找出与本文档来自技高网...

【技术保护点】
1.一种目标区域检测方法,其特征在于,所述方法包括:根据用户在视频的第一图像中确定的目标区域,确定多个样本区域以及所述多个样本区域的分类结果,所述分类结果用于表示所述样本区域是否属于所述目标区域;获取待训练的分类器,所述分类器包括按照先后顺序依次排列的多个分类节点;根据所述多个样本区域以及所述多个样本区域的分类结果,对所述分类器中的第一个分类节点进行训练,所述第一个分类节点训练完成后继续对下一个分类节点进行训练,直至所述多个分类节点均训练完成;在所述视频中除所述第一图像以外的其他图像中跟踪所述目标区域,当确定当前跟踪的图像中不包括所述目标区域时,应用已训练完成的所述分类器,对当前跟踪的图像之后的第二图像中的至少一个区域进行分类,根据分类结果确定所述第二图像中的所述目标区域。

【技术特征摘要】
1.一种目标区域检测方法,其特征在于,所述方法包括:根据用户在视频的第一图像中确定的目标区域,确定多个样本区域以及所述多个样本区域的分类结果,所述分类结果用于表示所述样本区域是否属于所述目标区域;获取待训练的分类器,所述分类器包括按照先后顺序依次排列的多个分类节点;根据所述多个样本区域以及所述多个样本区域的分类结果,对所述分类器中的第一个分类节点进行训练,所述第一个分类节点训练完成后继续对下一个分类节点进行训练,直至所述多个分类节点均训练完成;在所述视频中除所述第一图像以外的其他图像中跟踪所述目标区域,当确定当前跟踪的图像中不包括所述目标区域时,应用已训练完成的所述分类器,对当前跟踪的图像之后的第二图像中的至少一个区域进行分类,根据分类结果确定所述第二图像中的所述目标区域。2.根据权利要求1所述的方法,其特征在于,所述根据用户在视频的第一图像中确定的目标区域,确定多个样本区域以及所述多个样本区域的分类结果,包括:对所述第一图像进行区域检测,得到多个样本区域;根据所述多个样本区域与所述目标区域之间的重叠率,确定所述多个样本区域的分类结果。3.根据权利要求1所述的方法,其特征在于,所述根据所述多个样本区域以及所述多个样本区域的分类结果,对所述分类器中的第一个分类节点进行训练,所述第一个分类节点训练完成后继续对下一个分类节点进行训练,直至所述多个分类节点均训练完成,包括:初始化所述多个分类节点的节点参数;根据所述多个样本区域以及所述多个样本区域的分类结果,对所述分类器中的第一个分类节点的节点参数进行训练,得到所述第一个分类节点训练后的节点参数;继续根据所述多个样本区域、所述多个样本区域的分类结果以及上一个分类节点训练后的节点参数,对下一个分类节点的节点参数进行训练,得到所述下一个分类节点训练后的节点参数,直至所述多个分类节点均训练完成。4.根据权利要求3所述的方法,其特征在于,所述分类器中的任一分类节点输出第一分类数值时,表示本次待分类的区域属于所述目标区域,所述任一分类节点输出第二分类数值时,表示本次待分类的区域不属于所述目标区域;所述多个分类节点均训练完成之后,所述方法还包括:从所述多个样本区域中选取属于所述目标区域的多个正样本区域;对于每个正样本区域,应用所述多个分类节点,分别对所述正样本区域进行分类,得到所述多个分类节点分别输出的分类数值;按照所述多个分类节点的先后顺序,将所述多个分类节点分别输出的分类数值组合构成二进制数值,将所述二进制数值对应的十进制数值作为所述正样本区域的分类结果;将所述多个正样本区域中出现次数最多的分类结果确定为目标分类结果。5.根据权利要求4所述的方法,其特征在于,所述应用已训练完成的所述分类器,对当前跟踪的图像之后的第二图像中的至少一个区域进行分类,根据分类结果确定所述第二图像中的所述目标区域,包括:对于所述第二图像中的每个区域,应用所述多个分类节点,分别对所述区域进行分类,得到所述多个分类节点分别输出的分类数值;按照所述多个分类节点的先后顺序,将所述多个分类节点分别输出的分类数值组合构成二进制数值,将所述二进制数值对应的十进制数值作为所述区域的分类结果;当所述分类结果等于所述目标分类结果时,确定所述区域属于所述目标区域。6.根据权利要求1所述的方法,其特征在于,所述在所述视频中除所述第一图像以外的其他图像中跟踪所述目标区域,包括:对所述第一图像中的所述目标区域进行检测,得到多个特征点;通过在任两帧相邻图像中跟踪所述多个特征点,确定所述多个特征点在所述其他图像中的位置;根据所述多个特征点在所述其他图像中的位置,确定所述其他图像中的所述目标区域。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述视频中除所述第一图像以外的第三图像中跟踪所述目标区域时,获取跟踪误差;当所述跟踪误差大于第一预设阈值时,将所述第三图像中跟踪到的所述目标区域作为样本区域;根据所述样本区域对所述分类器进行更新,得到更新后的所述分类器。8.根据权...

【专利技术属性】
技术研发人员:姜媚
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1