【技术实现步骤摘要】
图像处理方法、装置、电子设备和计算机可读存储介质
[0001]本公开涉及图像处理领域,更具体地,本公开涉及使用卷积神经网络系统处理输入图像的图像处理方法和装置、以及计算机可读存储介质。
技术介绍
[0002]神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据,神经网络能够学习出数据中难以总结的隐藏特征,从而完成多项复杂的任务,如人脸检测、图像语义分割、物体检测、动作追踪、自然语言翻译等。神经网络已被人工智能界广泛应用。
[0003]在神经网络用于图像处理领域时,作为人脸识别技术的重要补充,行人重识别(Re-ID)是一种在不同相机捕获的图像或视频中确定是否存在特定人物的处理任务。由于不同相机设备之间的拍摄差异以及行人目标易受姿态、配饰、遮挡等多重因素的影响,行人重识别是具有挑战性的图像处理任务。用于行人重识别的方法包括基于ResNet、GoogleNet等基础模型、基于注意力机制模型、以及基于先验知识模型等的处理方法。基于基础模型的处理方法虽然比较简单,但是由于提取的图像特征过于粗糙,往往不能有效地完成行人重识 ...
【技术保护点】
【技术特征摘要】
1.一种使用神经网络系统处理输入图像的图像处理装置,包括:输入层单元,用于接收所述输入图像,并且提取所述输入图像的初始特征图;中间层单元,用于对于所述初始特征图进一步提取图像特征,以获取中间层特征图;以及输出层单元,基于所述中间层特征图,输出对于所述输入图像的处理结果,其中,所述中间层单元包括至少两个分支,所述至少两个分支生成具有不同尺度和/或对应于所述初始特征图的不同区域的中间层特征图。2.如权利要求1所述图像处理装置,其中,所述中间层单元用于:在所述中间层单元中的第一分支的第一子层,以第一步长对所述初始特征图执行卷积以获得第一子特征图,并且在所述第一分支的第二子层对所述第一子特征图执行第一分割,以获得第二子特征图;在所述中间层单元中的第二分支的第一子层,以第二步长对所述初始特征图执行卷积以获得第三子特征图,并且在所述第二分支的第二子层对所述第三子特征图执行第二分割,以获得第四子特征图;其中,所述第一步长不同于所述第二步长,并且所述第一分割和所述第二分割中的一个为水平分割,并且另一个为垂直分割。3.如权利要求1所述图像处理装置,其中,所述中间层单元用于:在所述中间层单元中的第一分支的第一子层,对所述初始特征图执行第一分割以获得第一子特征图,并且在所述第一分支的第二子层以第一步长对所述第一子特征图执行卷积以获得第二子特征图;在所述中间层单元中的第二分支的第一子层,对所述初始特征图执行第二分割以获得第三子特征图,并且在所述第二分支的第二子层以第二步长对所述第三子特征图执行卷积以获得第四子特征图;其中,所述第一步长不同于所述第二步长,并且所述第一分割和所述第二分割中的一个为水平分割,并且另一个为垂直分割。4.如权利要求1到3的任一项所述图像处理装置,还包括:训练单元,用于利用损失函数,训练所述神经网络系统,其中,所述损失函数涉及由所述至少两个分支的每一个获取的所有特征图。5.一种使用神经网络系统处理输入图像的图像处理方法,所述神经网络系统包含输入层、中间层和输出层,所述图像处理方法包括:经由所述输入层,接收所述输入图像,并且提取所述输入图像的初始特征图;经由所述中间层,对于所述初始特征图进一步提取图像特征,以...
【专利技术属性】
技术研发人员:竹梦圆,郭心语,李安新,陈岚,山谷佳祐,小岛诚也,杉村利明,酒井俊树,
申请(专利权)人:株式会社NTT都科摩,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。