【技术实现步骤摘要】
图像处理方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及图像处理方法和装置。
技术介绍
卷积神经网络是多层神经网络,擅长处理图像。需要对卷积神经网络设置几个锚点框(anchorbox),以作为卷积神经网络确定候选框(proposal)的依据。在应用卷积神经网络的过程中,经常会出现图像中的某个目标,与锚点框的偏差较大的情况。
技术实现思路
本申请实施例提出了图像处理方法和装置。第一方面,本申请实施例提供了一种图像处理方法,包括:获取包含目标的目标图像,其中,目标图像包括至少两个预设的栅格;在目标图像中,确定出至少两个子图像,其中,各个子图像包括相等数量的栅格,各个子图像的集合覆盖目标图像;对于每个栅格,确定该栅格的指定点,基于指定点和目标图像所包含的目标,生成预设数量不同尺寸的待选锚点框,其中,指定点位于各个待选锚点框的指定位置;对于每个子图像,对该子图像中,各个栅格的待选锚点框进行聚类,得到至少一个目标锚点框;将每个子图像的目标锚点框确定为该子图像在指定的卷积神经网络的输入图像中所对应的子图像的锚点框。在一些实施例中,在将每个子图像的目标锚 ...
【技术保护点】
1.一种图像处理方法,包括:获取包含目标的目标图像,其中,所述目标图像包括至少两个预设的栅格;在所述目标图像中,确定出至少两个子图像,其中,各个子图像包括相等数量的栅格,各个子图像的集合覆盖所述目标图像;对于每个栅格,确定该栅格的指定点,基于所述指定点和所述目标图像所包含的目标,生成预设数量不同尺寸的待选锚点框,其中,所述指定点位于各个待选锚点框的指定位置;对于每个子图像,对该子图像中,各个栅格的待选锚点框进行聚类,得到至少一个目标锚点框;将每个子图像的目标锚点框确定为该子图像在指定的卷积神经网络的输入图像中所对应的子图像的锚点框。
【技术特征摘要】
1.一种图像处理方法,包括:获取包含目标的目标图像,其中,所述目标图像包括至少两个预设的栅格;在所述目标图像中,确定出至少两个子图像,其中,各个子图像包括相等数量的栅格,各个子图像的集合覆盖所述目标图像;对于每个栅格,确定该栅格的指定点,基于所述指定点和所述目标图像所包含的目标,生成预设数量不同尺寸的待选锚点框,其中,所述指定点位于各个待选锚点框的指定位置;对于每个子图像,对该子图像中,各个栅格的待选锚点框进行聚类,得到至少一个目标锚点框;将每个子图像的目标锚点框确定为该子图像在指定的卷积神经网络的输入图像中所对应的子图像的锚点框。2.根据权利要求1所述的方法,其中,在所述将每个子图像的目标锚点框确定为该子图像在指定的卷积神经网络的输入图像中所对应的子图像的锚点框之后,所述方法还包括:将输入图像输入所述卷积神经网络进行检测,利用所述卷积神经网络的区域候选网络,在所述输入图像的每个子图像中,确定待确定的候选框与锚点框之间的偏移量,以确定所述候选框。3.根据权利要求2所述的方法,其中,所述在所述输入图像的每个子图像中,确定待确定的候选框与所述锚点框之间的偏移量,以确定所述候选框,包括:在所述输入图像的每个子图像中,确定待确定的候选框的指定点与该子图像的锚点框的指定点之间的距离偏移量,基于该子图像的锚点框的位置和所述距离偏移量,确定所述候选框的指定点的位置;确定待确定的候选框的尺寸与该子图像的锚点框的尺寸之间的差值,基于所述锚点框的尺寸和所述差值,确定所述候选框的尺寸。4.根据权利要求1所述的方法,其中,所述目标图像中包含至少两个目标,所述至少两个目标位于至少两个子图像内;所包含的至少一个目标大于第一尺寸阈值,所包含的至少一个目标小于第二尺寸阈值,所述第一尺寸阈值大于所述第二尺寸阈值。5.根据权利要求1所述的方法,其中,所述对于每个子图像,对该子图像中,各个栅格的待选锚点框进行聚类,得到至少一个目标锚点框,包括:对于每个子图像,对该子图像中,各个栅格的待选锚点框的位置和尺寸所对应的向量进行聚类;将聚类得到的各个聚类中心确定为所述至少一个目标锚点框。6.一种图像处理装置,包括:获取单元,被配置成获取包含目标的目标图像,其中,所述目标图像包...
【专利技术属性】
技术研发人员:胡耀全,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。