【技术实现步骤摘要】
数据自适应重采样的目标检测模型训练方法、装置及设备
[0001]本专利技术涉及图像处理
,特别是数据自适应重采样的目标检测模型训练方法、装置及设备。
技术介绍
[0002]在深度学习分类任务中,经常遇到数据不均衡的问题。这会导致训练模型预测倾向于数据量多的类别。目前多采用以下两种方法:方法一:对量多的数据进行下采样,使其数量接近平均数。但是,下采样容易使部分数据丢失,如果丢失部分为重要数据,容易导致模型对局部数据过拟合。方法二,对量少的数据进行离线增广,使其数量接近平均数。常规的增广为:色域增广,空间增广和噪声增广。这些增广方法虽然能达到数据均衡,但具有以下缺点:1.离线增广增加整体训练数据量,使训练时间变长;2.如只采用离线增广,随机性不如在线增广。如采用离线与在线混合增广,多次增广可能导致增广过度;3.增广的数据并不能真正地丰富数据的多样性,可能导致模型对数据过拟合。
技术实现思路
[0003]鉴于上述问题,本专利技术提出一种克服上述问题或者至少部分地解决上述问题的数据自适应重采样的目标检测模型训练
【技术保护点】
【技术特征摘要】
1.一种数据自适应重采样的目标检测模型训练方法,其特征在于,所述方法包括:获取与预先根据业务场景建立的目标检测模型的基础样本数据集;从所述基础样本数据集中进行样本随机筛选得到第一训练数据集,利用所述第一训练数据集训练所述目标检测模型;基于所述基础样本数据集进行模型先验自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型。2.根据权利要求1所述的方法,其特征在于,所述利用所述第一训练数据集训练所述目标检测模型之后,所述方法还包括:统计利用所述第一训练数据集训练所述目标检测模型的训练次数,若所述训练次数大于预先设置的固定迭代次数,则停止利用所述第一训练数据集训练所述目标检测模型;或,获取所述目标检测模型的训练精度,若所述训练精度达到预先设置的目标精度,则停止利用所述第一训练数据集训练所述目标检测模型。3.根据权利要求1所述的方法,其特征在于,所述基于所述基础样本数据集进行模型先验自适应采样得到第二训练数据集,利用所述第二训练数据集训练所述目标检测模型包括:利用经由所述第一训练数据集训练后的目标检测模型对所述基础样本数据集中各样本数据进行目标检测,并根据检测结果进行数据筛选得到第二训练数据集;利用所述第二训练数据集训练所述目标检测模型;依据所述目标检测模型的模型训练数据判断所述目标检测模型是否符合预设重采样条件;若判断所述目标检测模型符合预设重采样条件,则基于所述基础样本数据集进行重采样以更新所述第二训练数据集;利用更新后的所述第二训练数据集训练所述目标检测模型。4.根据权利要求3所述的方法,其特征在于,所述依据所述目标检测模型的模型训练数据判断所述目标检测模型是否符合预设重采样条件包括:判断所述目标检测模型的训练轮数是否满足预设重采样周期,若是,则判断所述目标检测模型符合预设重采样条件;若否,则判断所述目标检测模型不符合预设重采样条件;或,依据所述目标检测模型的精度波动程度是否稳定,若稳定,则判断所述目标检测模型符合预设重采样条件;若不稳定,则判断所述目标检测模型不符合预设重采样条件。5.根据权利要求3所述的方法,其特征在于,所述基于所述基础样本数据集进行重采样以更新所述第二训练数据集包括:计算所述基础样本数据集中各样本数据对应的数据采样概率;基于各样本数据对应的数据采样概率在所述基于所述基础样本数据集进行重采样以更新第二训练数据集。6.根据权利要求5所述的方法,其特征在于,所述计算所述基础样本数据集中各样本数据对应的数据采样概率包括:获取所述目标检测模型对所述基础样本数据集中任一样本数据的预测结果;计算各...
【专利技术属性】
技术研发人员:陈瑞斌,肖兵,李正国,
申请(专利权)人:珠海视熙科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。