【技术实现步骤摘要】
图像数据集处理方法和目标检测模型训练方法
本专利技术涉及图像处理
,具体而言,涉及一种作为训练目标检测模型输入的图像数据集的处理方法。
技术介绍
目标检测是一种基于目标几何和统计特征的图像理解算法,目标检测是将目标对象的定位和识别合二为一,例如:基于计算机视觉算法,检测出图像中不同类别的目标对象,即以矩形框标注出目标的位置,并识别出目标对象的类别。目标检测模型的训练过程中,当在检测场景采集样本图像的数量受到限制时,为了增加图像数据集中样本图像的目标对象的多样性,相关技术中,通常对已采集到的样本图像进行放缩处理后混入到原图像数据集,再将扩充规模后的图像数据集用于对目标检测模型的训练。用上述方法得到的图像数据集中,虽然样本图像的目标对象的数量得以丰富,但是目标对象的像素尺寸的分布未进行合理规划,不同像素尺寸的目标对象的数量参差不齐,这样,目标检测模型对数量较多的一类像素尺寸的目标对象的记忆性会远远优于数量较少的一类像素尺寸的目标对象的记忆性,从而导致训练后的目标检测模型会在对不同数量的各类像素尺寸的目标对象 ...
【技术保护点】
1.一种图像数据集处理方法,其特征在于,包括:/n步骤S1,统计图像数据集内所有样本图像中属于类别R的目标对象的数量,以及各所述目标对象的像素尺寸,并根据两者绘制出像素尺寸-数量曲线Q
【技术特征摘要】
1.一种图像数据集处理方法,其特征在于,包括:
步骤S1,统计图像数据集内所有样本图像中属于类别R的目标对象的数量,以及各所述目标对象的像素尺寸,并根据两者绘制出像素尺寸-数量曲线Q2;
步骤S2,设定所述像素尺寸-数量曲线Q2上所述目标对象的像素尺寸坐标Xa和Xb之间的区域为检测区间,计算像素尺寸在所述检测区间内的所述目标对象的平均数量值并绘制与所述平均数量值对应的曲线Q1,以形成像素尺寸-数量的统计曲线图;
步骤S3,在所述统计曲线图上标定所述平均数量值对应的曲线Q1与所述像素尺寸-数量曲线Q2的全部交点,并统计各交点对应的像素尺寸坐标集合为{X1,X2,X3…Xn},根据所述像素尺寸坐标Xa和Xb,以及所述像素尺寸坐标集合{X1,X2,X3…Xn},沿所述像素尺寸-数量曲线Q2进行分区,分出的区间集合φ为{(0,Xa),(X1,X2),(X2,X3)…(Xn,Xb),(Xb,X+∞)},分别计算所述区间集合φ中各区间对应的缩放概率集P;
步骤S4,顺次对各所述区间内的所述像素尺寸-数量曲线Q2的所有坐标点所对应的所述目标对象的像素尺寸进行缩放处理,并根据所述缩放概率集P按预设的算法步骤判定处理方式,所述处理方式包括:
方式A:遍历所述区间内的所有所述坐标点,将各所述坐标点对应的所述目标对象的像素尺寸按预设缩放比例缩放到与其所在区间相邻的下游区间所对应的像素尺寸的范围内;或
方式B:遍历所述区间内的所有所述坐标点,将各所述坐标点对应的所述目标对象的像素尺寸按预设缩放比例缩放到与其所在区间相邻的上游区间所对应的像素尺寸的范围内;或
方式C:遍历所述区间内的所有所述坐标点,将各所述坐标点对应的所述目标对象的像素尺寸按预设缩放比例在其所在的本区间所对应的像素尺寸的范围内进行缩放;或
方式D:遍历所述区间内的所有所述坐标点,将各所述坐标点对应的所述目标对象的像素尺寸按预设缩放比例缩放到所述检测区间所对应的像素尺寸的范围内。
2.根据权利要求1所述的图像数据集处理方法,其特征在于,在所述步骤S3中,
所述区间集合φ中各所述区间的坐标点的个数构成的目标对象数量集合M为{m1,m2,m3…mi…mλ},所述缩放概率集P为{Pi1,Pi2},其中,
i为所述区间集合φ的区间的第数;
λ为所述区间集合φ的区间的总个数;
Pi1表示第i区间内的所述坐标点对应的所述目标对象的像素尺寸向与其所在区间相邻的上游区间所对应的像素尺寸的范围内缩小的概率;
Pi2表示第i区间内的所述坐标点对应的所述目标对象的像素尺寸向与其所在区间相邻的下游区间所对应的像素尺寸的范围内放大的概率;
所述缩放概率集P通过公式组(1)计算取得:...
【专利技术属性】
技术研发人员:陈映,曹松,任必为,
申请(专利权)人:北京文安智能技术股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。