【技术实现步骤摘要】
图像处理方法、深度学习模型的训练方法和装置
[0001]本公开涉及人工智能
,尤其涉及计算机视觉、图像处理、深度学习等
,可应用于活体检测等场景。更具体地,本公开提供了一种图像处理方法、深度学习模型的训练方法、装置、电子设备和存储介质。
技术介绍
[0002]近年来,随着深度学习理论的兴起,目标检测技术取得了飞速的发展,并逐渐投入到生产、生活等方面。例如广泛应用于活体检测、人脸识别、案情识别、违规行为识别等场景。
技术实现思路
[0003]本公开提供了一种图像处理方法、深度学习模型的训练方法、装置、设备以及存储介质。
[0004]根据第一方面,提供了一种图像处理方法,该方法包括:使用N个编码模块分别基于N个待处理图像各自的初始特征,确定N个待处理图像各自的编码特征,其中,N为大于1的整数,N个待处理图像是利用N个不同图像传感器针对相同场景采集得到的图像;针对每个初始特征,使用N个解码模块中的一个目标解码模块,基于对象查找参数和与初始特征对应的编码特征,从初始特征中确定有效信息,得到对象查找特征;将N个对象查找特征进行融合,得到融合特征;以及根据融合特征识别N个待处理图像中任一待处理图像中的目标对象。
[0005]根据第二方面,提供了一种深度学习模型的训练方法,深度学习模型包括N个编码模块以及N个解码模块,N为大于1的整数;该方法包括:将N个样本图像各自的初始特征分别输入N个编码模块,得到N个样本图像各自的编码特征,其中,N为大于1的整数,N个样本图像是利用N个不同图像传感器 ...
【技术保护点】
【技术特征摘要】
1.一种图像处理方法,包括:使用N个编码模块分别基于N个待处理图像各自的初始特征,确定所述N个待处理图像各自的编码特征,其中,N为大于1的整数,所述N个待处理图像是利用N个不同图像传感器针对相同场景采集得到的图像;针对每个初始特征,使用N个解码模块中的一个目标解码模块,基于对象查找参数以及与所述初始特征对应的编码特征,从所述初始特征中确定有效信息,得到对象查找特征;将N个所述对象查找特征进行融合,得到融合特征;以及根据所述融合特征识别所述N个待处理图像中任一待处理图像中的目标对象。2.根据权利要求1所述的方法,其中,所述使用N个编码模块分别基于N个待处理图像各自的初始特征,确定所述N个待处理图像各自的编码特征包括:针对每个初始特征,使用N个编码模块中的一个目标编码模块,对所述初始特征中的多个特征单元添加位置信息,得到所述编码特征。3.根据权利要求2所述的方法,其中,所述针对每个初始特征,使用N个解码模块中的一个目标解码模块,基于对象查找参数以及与所述初始特征对应的编码特征,从所述初始特征中确定有效信息,得到对象查找特征包括:针对每个初始特征,使用所述目标解码模块计算所述对象查找参数和与所述初始特征对应的编码特征之间的相关性,并根据所述相关性从所述初始特征中确定有效信息,得到所述对象查找特征。4.根据权利要求2或3所述的方法,其中,所述将N个所述对象查找特征进行融合,得到融合特征包括:针对每个对象查找特征,根据所述编码特征中多个特征单元各自的位置信息,确定所述对象查找特征中多个特征单元各自的位置信息;根据所述对象查找特征中多个特征单元各自的位置信息,将N个所述对象查找特征进行融合,得到所述融合特征。5.根据权利要求1至4中任一项所述的方法,还包括:使用N个特征提取模块分别提取所述N个待处理图像的初始特征。6.根据权利要求1至5中任一项所述的方法,其中,所述N个待处理图像包括彩色图像、红外图像和深度图像中的至少两种。7.一种深度学习模型的训练方法,所述深度学习模型包括N个编码模块以及N个解码模块,N为大于1的整数;所述方法包括:将N个样本图像各自的初始特征分别输入所述N个编码模块,得到所述N个样本图像各自的编码特征,其中,N为大于1的整数,所述N个样本图像是利用N个不同图像传感器针对相同场景采集得到的图像;针对每个初始特征,将所述初始特征、与所述初始特征对应的编码特征以及对象查找参数输入所述N个解码模块中的一个目标解码模块,得到对象查找特征;将N个所述对象查找特征进行融合,得到融合特征;根据所述融合特征确定所述N个样本图像中任一样本图像中的样本对象的识别结果;以及根据所述识别结果确定所述深度学习模型的损失,并根据所述损失调整所述深度学习模型的参数。
8.根据权利要求7所述的方法,其中,所述将N个样本图像各自的初始特征分别输入所述N个编码模块,得到所述N个样本图像各自的编码特征包括:针对每个初始特征,使用N个编码模块中的一个目标编码模块,对所述初始特征中的多个特征单元添加位置信息,得到所述编码特征。9.根据权利要求8所述的方法,其中,所述针对每个初始特征,将所述初始特征、与所述初始特征对应的编码特征以及对象查找参数输入所述N个解码模块中的一个目标解码模块,得到对象查找特征包括:针对每个初始特征,使用所述目标解码模块计算所述对象查找参数和与所述初始特征对应的编码特征之间的相关性,并根据所述相关性从所述初始特征中确定有效信息,得到所述对象查找特征。10.根据权利要求8或9所述的方法,其中,所述将N个所述对象查找特征进行融合,得到融合特征包括:针对每个对象查找特征,根据所述编码特征中多个特征单元各自的位置信息,确定所述对象查找特征中多个特征单元各自的位置信息;根据所述对象查找特征中多个特征单元各自的位置信息,将N个所述对象查找特征进行融合,得到所述融合特征。11.根据权利要求7至10中任一项所述的方法,其中,所述深度学习模型还包括N个特征提取模块;所述方法还包括:将所述N个样本图像分别输入所述N个特征提取模块,得到所述N个样本图像各自的初始特征。12.根据权利要求11所述的方法,其中,所述根据所述损失调整所述深度学习模型的参数包括:根据所述损失调整所述N个特征提取模块各自的参数、N个编码模块各自的参数、N个解码模块各自的参数以及对象查找参数中的至少之一。13.根据权利要求7至12中任一项所述的方法,其中,所述N个样本图像包括彩色图像、红外图像和深度图像中的至少两种。14.一种图像处理装置,包括:第一编码单元,用于使用N个编码模块分别基于N个待处理图像各自的初始特征,确定所述N个待处理图像各自的编码特征,其中,N为大于1的整数,所述N个待处理图像是利用N个不同图...
【专利技术属性】
技术研发人员:陈子亮,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。