图像处理方法、图像处理装置制造方法及图纸

技术编号:16388726 阅读:49 留言:0更新日期:2017-10-16 09:26
本发明专利技术的目的在于提高使用神经网络检测对象的过程的效率。本发明专利技术:将对象检测所需的任务转换为解决分类问题所需的任务;使用对输入数据进行分类的神经网络将对象检测处理为分类问题(参考图1)。

【技术实现步骤摘要】
【国外来华专利技术】图像处理方法、图像处理装置
本专利技术涉及一种使用神经网络处理图像的技术。
技术介绍
对象检测在许多图像处理任务中起着重要的作用。对象检测的动机是在图像中找到某个对象或其一部分。在对象被定位之后,可进行例如对象辨识的其它任务。对象检测的一个实施例是人脸识别。人脸识别通常需要将脸部在某个方向上对准,以实现高识别性能。为了对准该脸部区域,可使用脸部的特征,例如眼睛、鼻子、嘴巴等。通过对象检测,可识别这些脸部特征。能够使用识别的脸部特征来对准脸部的方向。在对象检测中,使用所谓的滑动窗口。该方法从图像中提取任意区域,并计算提取区域包括特定对象的概率。如果概率超过给定阈值,则在提取的区域中检测对象。通过这种滑动窗口方法,可实现高精度。然而,如果关于可能的对象位置的先验信息不可用,则该方法具有高计算成本的缺点。这是因为窗口必须放置在许多不同的位置并缩放,直到达到预定义的概率阈值。此外,这种滑动窗口方法通常使用模板匹配来计算特定对象在区域中的概率。这些模板通常是预定义的,并且如果对象外观随时间而变化,则不能很好地适用。因此,需要更新模板以实现高检测准确度。机器学习是适应对象变化的一种方法。机器学习本文档来自技高网...
图像处理方法、图像处理装置

【技术保护点】
一种图像处理方法,用于使用神经网络来处理包括对象的图像数据,所述神经网络进行学习以对输入数据进行分类,所述图像处理方法包括:量化步骤,对所述图像数据的像素坐标进行量化;映射步骤,对量化的像素坐标分配所述神经网络中内部包括的内部分类中的任何一个;学习步骤,使用所述图像数据的量化像素坐标并且使用在所述映射步骤中分配的内部分类来进行所述神经网络的学习;输出步骤,在进行所述学习之后,获取来自所述神经网络的输出值;再生步骤,在进行所述学习之后,对来自所述神经网络的输出值进行所述量化的反量化,从而将来自所述神经网络的输出值投影至所述图像数据中的坐标系上,以在所述坐标系上再生所述对象的位置。

【技术特征摘要】
【国外来华专利技术】2015.02.24 JP 2015-0337041.一种图像处理方法,用于使用神经网络来处理包括对象的图像数据,所述神经网络进行学习以对输入数据进行分类,所述图像处理方法包括:量化步骤,对所述图像数据的像素坐标进行量化;映射步骤,对量化的像素坐标分配所述神经网络中内部包括的内部分类中的任何一个;学习步骤,使用所述图像数据的量化像素坐标并且使用在所述映射步骤中分配的内部分类来进行所述神经网络的学习;输出步骤,在进行所述学习之后,获取来自所述神经网络的输出值;再生步骤,在进行所述学习之后,对来自所述神经网络的输出值进行所述量化的反量化,从而将来自所述神经网络的输出值投影至所述图像数据中的坐标系上,以在所述坐标系上再生所述对象的位置。2.根据权利要求1所述的图像处理方法,还包括在所述图像数据上定义多个区域的步骤,其中,所述图像处理方法对所述区域中的每一个都进行所述量化步骤和所述映射步骤。3.根据权利要求1所述的图像处理方法,还包括将所述像素坐标分离到每个坐标轴中的步骤,其中,所述映射步骤为分离的坐标轴中的每一个分配所述内部分类中的不同内部分类。4.根据权利要求1所述的图像处理方法,还包括将所述像素坐标分离到每个坐标轴中的步骤,其中,所述映射步骤为分离的坐标轴中的每一个分配所述内部分类中的不同内部分类,所述图像处理方法还包括:分类步骤,将来自所述神经网络的输出值分类为所述坐标轴上的对象的坐标值中的任何一个,其中,所述再生步骤对所述分类步骤的结果进行所述量化的反量化,从而在所述坐标系上再生所述对象的位置。5.根据权利要求1所述的图像处理方法,还包括:将在所述坐标系上通过所述再...

【专利技术属性】
技术研发人员:克林格特·马丁松原大辅
申请(专利权)人:株式会社日立制作所
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1