【技术实现步骤摘要】
图像元素检测模型的训练方法、图像元素检测方法及装置
[0001]本申请涉及人工智能领域,尤其涉及图像元素检测模型的训练方法、图像元素检测方法及装置。
技术介绍
[0002]随着图像处理技术的不断发展,如何有效检测出图像中属于特定类型的图像元素成为越来越受大众关注的技术问题。并且在成像角度、元素大小、颜色、轮廓等因素共同影响下,不同类型的图像元素往往看起来相似度较高,从而导致特定类型的图像元素的检测难度较大。
[0003]现有技术虽然可基于人工智能技术训练得到相关的检测模型来确定出特定类型的图像元素,但是其准确率有限。
技术实现思路
[0004]本申请实施例提供一种图像元素检测模型的训练方法、图像元素检测方法及装置,可提升预设类型的图像元素的检测准确率,适用性高。
[0005]一方面,本申请实施例提供一种图像元素检测模型的训练方法,该方法包括:
[0006]将每个样本图像的初始图像特征输入初始模型,得到该样本图像的至少一个目标检测区域的目标预测结果,每个上述预测结果用于指示模型预测对应的 ...
【技术保护点】
【技术特征摘要】
1.一种图像元素检测模型的训练方法,其特征在于,所述方法包括:将每个样本图像的初始图像特征输入初始模型,得到该样本图像的至少一个目标检测区域的目标预测结果,每个所述目标预测结果用于指示模型预测对应的目标检测区域是否包括预设类型的图像元素;基于各所述目标检测区域的目标预测结果和真实分类结果确定总训练损失,基于各所述样本图像对所述初始模型进行训练直至所述总训练损失符合预设条件时停止训练,并将停止训练时的模型确定为图像元素检测模型,每个所述真实分类结果用于指示对应的目标检测区域实际是否包括预设类型的图像元素;其中,所述初始模型基于以下方式确定各所述目标预测结果:基于每个样本图像的初始图像特征对该样本图像的至少一个初始检测区域进行预设次数的迭代调整得到对应的目标检测区域,其中,每次调整是基于以下方式进行的:基于该样本图像的初始图像特征对每个第一检测区域进行调整得到第二检测区域及其对应的初始预测结果,每个初始预测结果用于指示模型预测对应的第二检测区域是否包括预设类型的图像元素,每次调整对应的第一检测区域为上一次调整得到的第二检测区域,第一次调整对应的第一检测区域为各所述初始检测区域,最后一次调整得到的第二检测区域为该样本图像的目标检测区域;基于每次调整得到的第二检测区域的初始预测结果,确定该样本图像的各目标检测区域的目标预测结果。2.根据权利要求1所述的方法,其特征在于,对于每个所述样本图像,基于该样本图像的初始图像特征确定该样本图像的至少一个初始检测区域,包括:基于该样本图像的初始图像特征确定该样本图像的各候选检测区域;对于每个所述候选检测区域,确定该候选检测区域与该样本图像中每个图像元素所在的图像区域的第一交并比,若存在大于第一阈值的第一交并比,或者各所述第一交并比均小于第二阈值,则将该候选检测区域确定为该样本图像的一个初始检测区域,所述第一阈值大于所述第二阈值。3.根据权利要求1所述的方法,其特征在于,对于每个所述样本图像,所述基于该样本图像的初始图像特征对每个第一检测区域进行调整得到第二检测区域及其对应的初始预测结果,包括:将该样本图像的各第一检测区域的位置信息映射至该样本图像的初始图像特征,得到融合图像特征;基于所述融合图像特征确定该样本图像的各第一检测区域对应的第二检测区域及其对应的初始预测结果。4.根据权利要求1所述的方法,其特征在于,对于每个所述样本图像,所述基于每次调整得到的第二检测区域的初始预测结果,确定该样本图像的各目标检测区域的目标预测结果,包括:对于该样本图像的每个初始检测区域,基于除最后一次调整外其他每次调整得到的对应于该初始检测区域的第二检测区域的初始预测结果,确定该初始检测区域对应的融合预测结果,基于所述融合预测结果、以及最后一次调整得到的对应于该初始检测区域的第二检测区域的初始预测结果,确定该初始检测区域对应的目标检测区域的目标预测结果。
5.根据权利要求1所述的方法,其特征在于,所述基于各所述目标检测区域的目标预测结果和真实分类结果确定总训练损失,包括:基于各所述目标检测区域的目标预测结果和真实分类结果确定第一训练损失;确定每个所述样本图像中每个图像元素所在的图像区域,基于每个所述样本图像中每个图像元素所在的图像区域和各所述目标检测区域确定第二训练损失;基于所述第一训练损失和所述第二训练损失确定总训练损失。6.根据权利要求5所述的方法,其特征在于,所述基于各所述目标检测区域的目标预测结果和真实分类结果确定第一训练损失,包括:基于各所述目标检测区域的目标预测结果和真实分类结果确定第一子损失,基于第二子损失或者第三子损失中的至少一项、以及所述第一子损失,确定第一训练损失;确定所述第二子损失,包括:确定每次调整得到的各第二检测区域的真实分类结果;基于每次调整得到的各第二检测区域的初始预测结果和真实分类结果,确定所述第二子损失;确定所述第三子损失,包括:对于每个所述初始检测区域,基于该初始检测区域和对应样本图像中每个图像元素所在的图像区域,确定该初始检测区域的初始预测结果;确定每个所述初始检测区域的真实分类结果,基于各所述初始检测区域的初始预测结果和真实分类结果,确定所述第三子损失。7.根据权利要求6所述的方法,其特征在于,对于每个所述初始检测区域,所述基于该初始检测区域和对应样本图像中每个图像元素所在的图像区域,确定该初始检测区域的初始预测结果,包括:若该初始检测区域与对应样本图像中至少一个图像元素所在的图像区域的第一交并比大于第一阈值,则确定模型预测该初始检测区域包括预设类型的图像元素;若该初始检测区域与对应样本图像中各图像元素所在的图像区域的第一交并比均小于第二阈值,则确定模型预测该初始检测区域不包括预设类型的图像元素。8.根据权利要求5所述的方法,其特征在于,所述基于每个所述样本图像中每个图像元素所在的图像区域和各所述目标检测区域确定第二训练损失,包括:基于...
【专利技术属性】
技术研发人员:蒋哲兴,汪铖杰,龚星,侯嘉悦,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。