【技术实现步骤摘要】
分割模型的训练方法及装置、图像识别方法及装置
[0001]本说明书一个或多个实施例涉及人工智能技术,尤其涉及分割模型的训练方法及装置、图像识别方法和装置。
技术介绍
[0002]图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标对象的技术。图像识别技术一般分为人脸识别与商品识别等,人脸识别主要运用在安全检查、身份核验与移动支付中;商品识别主要运用在商品流通过程中,特别是无人货架、智能零售柜等无人零售领域。
[0003]在图像识别技术中,需要从图像包括的各种对象中识别出目标对象。比如,在人脸识别方案中,交互的屏幕采用的是实时展示相机原始采集的数据,但是这个过程在排队场景中,会导致不想刷脸的人员的脸也出现在屏幕上,这无形中会对排队用户产生一个隐私不友好的感受,部分用户甚至会感觉隐私被侵犯,因此需要通过图像识别分割出目标人脸。再如,在商品识别中,拍摄的图像中可能存在用户手握的之前已付款商品及当前待付款商品,因此,需要通过图像识别分割出当前待付款的目标商品。
[0004]然而现有技术的图像识 ...
【技术保护点】
【技术特征摘要】
1.分割模型的训练方法,该分割模型包括:第一网络模型、第二网络模型以及第三网络模型,其中包括:获取样本图像对;其中,所述样本图像对中包括对同一视觉范围拍摄后得到的RGB图像以及深度图像;将所述深度图像输入第一网络模型,得到该第一网络模型输出的第一深度特征提取结果;将所述深度图像与所述RGB图像的组合图像输入第二网络模型,得到该第二网络模型输出的目标对象的边缘特征;将所述目标对象的边缘特征以及所述第一深度特征提取结果输入第三网络模型,得到该第三网络模型输出的目标对象的分割结果;根据所述样本图像对的标签以及该目标对象的分割结果,对所述第一网络模型、第二网络模型以及第三网络模型进行参数调整。2.根据权利要求1所述的方法,其中,所述样本图像对的标签包括:第一标签以及第二标签;其中,第一标签为预先由人工形成的对所述RGB图像或所述深度图像的分割结果;第二标签为对所述第一标签进行高斯模糊处理后得到的;所述对所述第一网络模型、第二网络模型以及第三网络模型进行参数调整,包括:根据第一标签与目标对象的分割结果之间的差异,对第二网络模型以及第三网络模型进行参数调整;根据第二标签与第一深度特征提取结果之间的差异,对第一网络模型进行参数调整。3.根据权利要求1所述的方法,其中,在所述将所述深度图像输入第一网络模型中之后,进一步包括:得到第一网络模型包括的中间层神经网络所提取出的目标对象的轮廓信息,将该中间层神经网络所提取出的目标对象的轮廓信息作为第二深度特征提取结果输出给所述第二网络模型;在所述将所述深度图像与所述RGB图像的组合图像输入第二网络模型之后,并在得到该第二网络模型输出的目标对象的边缘特征之前,进一步包括:由所述第二网络模型包括的前端各层神经网络对所述组合图像进行特征提取,得到初级边缘特征;由第二网络模型包括的后端各层神经网络对该初级边缘特征以及第二深度特征提取结果进行处理,以便得到并输出所述目标对象的边缘特征。4.根据权利要求3所述的方法,其中,调整所述第一网络模型及所述第二网络模型的所述卷积核以及卷积步长,使得所述初级边缘特征与所述第二深度特征提取结果对应的图像尺寸相同。5.根据权利要求1所述的方法,其中,在将所述深度图像与所述RGB图像进行组合之前,进一步包括:对所述RGB图像的像素值和所述深度图像的像素值进行归一化,并且将深度图像中值为空的像素的像素值归一化为0。6.图像识别方法,其中包括:获取对同一视觉范围拍摄后得到的待处理的RGB...
【专利技术属性】
技术研发人员:胡永恒,马晨光,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。