【技术实现步骤摘要】
半监督语义分割模型训练方法、识别方法和装置
本说明书一个或多个实施例涉及图像处理
,尤其涉及半监督语义分割模型训练方法、识别方法和装置。
技术介绍
图像识别是指利用计算机对图像进行分析和理解,以识别各种不同模式的目标和对象的技术。图像识别技术目前已被应用于遥感图像识别、通讯、图片档案修复等领域,为人们的生活提供便利。目前,用于图像识别的模型通常是经过训练数据训练后得到的,而训练数据是通过人工处理后得到的数据,这就导致模型的泛化能力不足,影响图像识别的准确度。因此,针对以上不足,需要提供准确度更高地图像识别模型。
技术实现思路
本说明书一个或多个实施例描述了半监督语义分割模型训练方法、识别方法和装置,能够提高图像识别的准确度。根据第一方面,提供了半监督语义分割模型训练方法,所述半监督语义分割模型用于对图像中的待标注对象进行标注;包括:获得每一张第一图像的第一监督数据;每一张第一图像的第一监督数据为针对该第一图像中的待标注对象进行人工标注后得到的数据;利用各第一监督数据训 ...
【技术保护点】
1.半监督语义分割模型训练方法,所述半监督语义分割模型用于对图像中的待标注对象进行标注;包括:/n获得每一张第一图像的第一监督数据;每一张第一图像的第一监督数据为针对该第一图像中的待标注对象进行人工标注后得到的数据;/n利用各第一监督数据训练全监督语义分割模型;/n将至少一张第二图像输入所述全监督语义分割模型;其中,每一张第二图像中包括待标注对象;/n由所述全监督语义分割模型对每一张第二图像中的待标注对象进行标注,获得每一张第二图像的第二监督数据;/n利用各第一监督数据和各第二监督数据训练所述半监督语义分割模型;/n生成随机扰动项;/n将至少一张所述第一图像、至少一张所述第 ...
【技术特征摘要】
1.半监督语义分割模型训练方法,所述半监督语义分割模型用于对图像中的待标注对象进行标注;包括:
获得每一张第一图像的第一监督数据;每一张第一图像的第一监督数据为针对该第一图像中的待标注对象进行人工标注后得到的数据;
利用各第一监督数据训练全监督语义分割模型;
将至少一张第二图像输入所述全监督语义分割模型;其中,每一张第二图像中包括待标注对象;
由所述全监督语义分割模型对每一张第二图像中的待标注对象进行标注,获得每一张第二图像的第二监督数据;
利用各第一监督数据和各第二监督数据训练所述半监督语义分割模型;
生成随机扰动项;
将至少一张所述第一图像、至少一张所述第二图像和所述随机扰动项输入所述半监督语义分割模型,获得每一张图像的第三监督数据;所述每一张图像的第三监督数据为由所述半监督语义分割模型对该图像中的待标注对象进行标注后得到的数据;
利用各第三监督数据、各第一监督数据和各第二监督数据,对所述半监督语义分割模型进行训练。
2.根据权利要求1所述的方法,其中,所述随机扰动项的个数为至少两个;
所述将至少一张所述第一图像、至少一张所述第二图像和所述随机扰动项输入所述半监督语义分割模型,获得每一张图像的第三监督数据,包括:
针对每一个随机扰动项,将至少一张所述第一图像、至少一张所述第二图像和该随机扰动项输入所述半监督语义分割模型,获得在输入该随机扰动项时至少一张所述第一图像和至少一张所述第二图像中的每一张图像的第三监督数据;
所述利用各第三监督数据、各第一监督数据和各第二监督数据,对所述半监督语义分割模型进行训练,包括:
针对所述每一张图像,计算在输入不同随机扰动项时所获得的不同的第三监督数据之间的差异,得到该图像的第一监督损失;
针对每一张第一图像,计算该第一图像的第三监督数据与该第一图像的第一监督数据之间的差异,得到该第一图像的第二监督损失;
针对每一张第二图像,计算该第二图像的第三监督数据与该第二图像的第二监督数据之间的差异,得到该第二图像的第二监督损失;
利用得到的各第一监督损失和各第二监督损失,对所述半监督语义分割模型进行训练。
3.根据权利要求1所述的方法,其中,所述获得每一张第一图像的第一监督数据,包括:
对人工标注后的每一张第一图像进行切分,得到该第一图像对应的至少两张切分图像,其中,相邻的两张所述切分图像存在重叠区域;
分别对每一张所述切分图像进行去差异化处理,从去差异化处理后得到的两张切分图像中得到该第一图像的第一监督数据。
4.根据权利要求3所述的方法,其中,所述分别对每一张所述切分图像进行去差异化处理,包括:
针对每一张所述切分图像,确定该切分图像的至少两个图像通道分别对应的至少两个第一图像通道属性值以及对该至少两个第一图像通道属性值进行求平均值计算,得到该切分图像对应的第一平均值;
对各切分图像对应的各第一平均值进行求平均值计算,得到第二平均值;
针对每一张所述切分图像,利用该切分图像的至少两个第一图像通道属性值和所述第二平均值,计算该切分图像对应的方差;
计算各切分图像对应的各方差的第三平均值;
将每一张所述切分图像的每一个图像通道对应的图像通道属性值从第一图像通道属性值更新为第二图像通道属性值;其中,所述第二图像通道属性值根据下述公式计算:
其中,用于表征切分图像的第i个图像通道对应的第二图像通道属性值,用于表征该切分图像的第i个图像通道对应的第一图像通道属性值,A用于表征所述第二平均值,V用于表征所述第三平均值。
5.根据权利要求1至4中任一所述的方法,其中,所述利用各第一监督数据训练全监督语义分割模型,包括:
利用多通道语义分割模型对所述第一监督数据进行训练,得到全监督语义分割模型;
或,
所述利用各第一监督数据和各第二监督数据训练半监督语义分割模型,包括:
利用所述多通道语义分割模型对所述各第一监督数据和所述各第二监督数据训练,获得半监督语义分割模型;
其中,所述多通道语义分割模型包括高分辨率网络HRNet模型、光学字符识别OCR模型和DeepLabV3+模型中的至少一个。
6.图像识别方法,包括:
利用权利要求1至5中任一项所述的半监督语义分割模型训练方法,训练出半监督语义分割模型;
利用所述半监督语义分割模型对待识别图像中的待标注对象进行标注。
7.半监督语义分割模型训练装置,包括:
第一监督数据获取模块,配置为获得每一张第一图像的第一监督数据;每一张第一图像的第一监督数据为针对该第一图像中的待标注对象进行人工标注...
【专利技术属性】
技术研发人员:劳江微,王剑,陈景东,褚崴,汪佳,顾欣欣,孙剑哲,甘利民,余泉,孙晓冬,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。