图像识别处理方法、装置、服务器及介质制造方法及图纸

技术编号:38193296 阅读:8 留言:0更新日期:2023-07-20 21:12
本申请提供了一种图像识别处理方法、装置、服务器及介质,通过获取待处理样本图像,对待处理样本图像进行灰度化处理和归一化处理,获取处理后的样本图像;利用最大熵分割法,获取处理后的样本图像中的目标物体像素点集合,并对每一目标物体像素点集合中的目标物体像素点的坐标进行坐标转换处理,获取每一目标物体像素点的三维坐标,继而获取目标物体像素点的梯度方向和梯度幅值,然后,建立待处理样本图像的方向梯度直方图,并对该方向梯度直方图进行归一化处理,获取HOG特征并进行图像识别处理。相比于现有技术,本申请利用优化处理后的HOG算法,可提高对图像特征提取的处理效率和准确率,进而可提高图像识别处理的效率和精准度。准度。准度。

【技术实现步骤摘要】
图像识别处理方法、装置、服务器及介质


[0001]本申请涉及机器视觉和图像处理领域,尤其涉及了一种图像识别处理方法、装置、服务器及介质。

技术介绍

[0002]近年来,行人检测和人脸识别在日常生活中越来越常见,计算机视觉已经成为当下学者们的研究热点。方向梯度直方图(Histogram of Oriented Gradient,HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。可以理解为,HOG特征是指通过计算和累计图像局部区域的梯度方向直方图而构成特征,而对一幅图像的识别处理简化为对图像的特征进行识别处理,这种便捷式图像识别处理方式,成为本领域的研究人员研究的热点。
[0003]现有技术中,HOG特征实现方法通常是将待处理图像分成若干个细小的连通区域,这些连通区域被看作一个个微小的细胞单元,然后采集这些细胞单元中各个像素的梯度或边缘的方向所对应的直方图,最后将这些直方图组合起来就可以构成特征描述,以便根据HOG特征进行图像识别处理。
[0004]但是,现有技术需要对待处理图像中的每一个像素点进行特征提取,这使得进行特征提取所需处理的数据量较大,导致处理的效率较低;而大量的处理数据导致细胞单元数量较多,进而使得由细胞单元采集到HOG特征的维度较大,这导致对像素度较高的图片或远距离的图片进行HOG特征提取的灵敏度降低;再者,由于现有技术中采用二元函数对图像进行处理,这仅可处理图像中相对比较明显的部分,进而使得提取到的HOG特征不够精准。

技术实现思路

[0005]本申请提供了一种图像识别处理方法、装置、服务器及介质,用以解决现有技术中HOG特征提取效率低、及提取精准度不高的问题。
[0006]第一方面,本申请提供了一种图像识别处理方法,包括:
[0007]获取待处理样本图像,对所述待处理样本图像进行灰度化处理和归一化处理,获取处理后的样本图像;
[0008]利用最大熵分割法,获取所述处理后的样本图像中的目标物体像素点集合,并对每一所述目标物体像素点集合中的目标物体像素点的坐标进行坐标转换处理,获取每一所述目标物体像素点的三维坐标;
[0009]对于每一所述目标物体像素点,根据所述目标物体像素点的三维坐标,计算获取所述目标物体像素点的梯度方向和梯度幅值;
[0010]根据每个所述目标物体像素点的梯度方向和梯度幅值,建立所述待处理样本图像的方向梯度直方图,并对所述待处理样本图像的方向梯度直方图进行归一化处理,获取HOG特征,以便根据所述HOG特征进行图像识别处理。
[0011]在这一种可选的实施方式中,所述利用最大熵分割法,获取所述处理后的样本图
像中的目标物体像素点集合,包括:
[0012]获取所述处理后的样本图像中的每一像素点的像素值;
[0013]针对所述像素点取值范围内的每一像素值,将所述每一像素值作为分割值,获取所述分割值对应的物体像素点集合和背景像素点集合,并计算所述物体像素点集合和所述背景像素点集合的信息熵总和;
[0014]将大于预设信息熵阈值的信息熵总和所对应的分割值,作为所述处理后的样本图像中的目标物体的目标分割值,并根据所述目标分割值,确定出所述目标物体像素点集合。
[0015]在这一种可选的实施方式中,所述针对所述像素点取值范围内的每一像素值,将所述每一像素值作为分割值,获取所述分割值对应的物体像素点集合和背景像素点集合,并计算所述物体像素点集合和所述背景像素点集合的信息熵总和,包括;
[0016]针对每一所述分割值,将小于或等于所述分割值的像素点所对应的集合作为所述背景像素点集合,及将大于所述分割值的像素点所对应的集合作为所述物体像素点集合;
[0017]计算所述背景像素点集合中每一背景像素点的第一分布概率,及计算所述物体像素点集合中每一物体像素点的第二分布概率;
[0018]利用信息熵方法,计算所述第一分布概率的第一信息熵的和及所述第二分布概率的第二信息熵的和,并计算所述第一信息熵的和与所述第二信息熵的和的信息熵总和,以获取所述物体像素点集合和所述背景像素点集合的信息熵总和。
[0019]在这一种可选的实施方式中,所述针对每一所述目标物体像素点,根据所述目标物体像素点的三维坐标,计算获取所述目标物体像素点的梯度方向和梯度幅值,包括:
[0020]针对每一所述目标物体像素点,根据所述目标物体像素点的图像坐标,获取所述目标物体像素点在相机坐标系下的相机坐标;
[0021]利用相机坐标的内外参数,并结合世界坐标系中的齐次坐标形式,构建所述图像坐标与所述相机坐标的矩阵关系式,其中,所述矩阵关系式包括所述目标物体像素点的投影矩阵;
[0022]获取所述目标物体像素点在相机坐标系下的左方向上的左投影矩阵和右方向上的右投影矩阵,将所述左投影矩阵和所述右投影矩阵分别代入到所述矩阵关系式,建立矩阵方程组,并求解所述矩阵方程组以获取所述图像坐标对应的三维坐标;
[0023]利用梯度方向计算公式和梯度幅值计算公式,计算所述三维坐标的梯度方向和梯度幅值,获取所述目标物体像素点的梯度方向和梯度幅值。
[0024]在这一种可选的实施方式中,所述根据每个所述目标物体像素点的梯度方向和梯度幅值,建立所述待处理样本图像的方向梯度直方图,包括:
[0025]按照预设像素标准,将所述目标物体像素集合分割成多个细胞单元;
[0026]针对每一所述细胞单元,按照预配置的梯度方向的方向区间范围,将所述细胞单元中的每一像素点的梯度方向所对应的梯度幅值累计到对应的方向区间范围上,获取所述细胞单元对应的特征向量;
[0027]将预设数量的所述特征向量进行串联处理,获取所述待处理样本图像的方向梯度直方图。
[0028]第二发面,本申请提供了一种图像识别处理装置,包括:
[0029]获取模块,用于获取待处理样本图像,对所述待处理样本图像进行灰度化处理和
归一化处理,获取处理后的样本图像;
[0030]所述获取模块,还用于利用最大熵分割法,获取所述处理后的样本图像中的目标物体像素点集合,并对每一所述目标物体像素点集合中的目标物体像素点的坐标进行坐标转换处理,获取每一所述目标物体像素点的三维坐标;
[0031]处理模块,用于对于每一所述目标物体像素点,根据所述目标物体像素点的三维坐标,计算获取所述目标物体像素点的梯度方向和梯度幅值;
[0032]所述处理模块,还用于根据每个所述目标物体像素点的梯度方向和梯度幅值,建立所述待处理样本图像的方向梯度直方图,并对所述待处理样本图像的方向梯度直方图进行归一化处理,获取HOG特征,以便根据所述HOG特征进行图像识别处理。
[0033]在这一种可选的实施方式中,所述获取模块,具体用于:
[0034]获取所述处理后的样本图像中的每一像素点的像素值;
[0035]针对所述像素点取值范围内的每一像素值,将所述每一像素值作为分割值,获取所述分割值对应的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别处理方法,其特征在于,包括:获取待处理样本图像,对所述待处理样本图像进行灰度化处理和归一化处理,获取处理后的样本图像;利用最大熵分割法,获取所述处理后的样本图像中的目标物体像素点集合,并对每一所述目标物体像素点集合中的目标物体像素点的坐标进行坐标转换处理,获取每一所述目标物体像素点的三维坐标;针对每一所述目标物体像素点,根据所述目标物体像素点的三维坐标,计算获取所述目标物体像素点的梯度方向和梯度幅值;根据每个所述目标物体像素点的梯度方向和梯度幅值,建立所述待处理样本图像的方向梯度直方图,并对所述待处理样本图像的方向梯度直方图进行归一化处理,获取HOG特征,以便根据所述HOG特征进行图像识别处理。2.根据权利要求1所述的方法,其特征在于,所述利用最大熵分割法,获取所述处理后的样本图像中的目标物体像素点集合,包括:获取所述处理后的样本图像中的每一像素点的像素值;针对所述像素点取值范围内的每一像素值,将所述每一像素值作为分割值,获取所述分割值对应的物体像素点集合和背景像素点集合,并计算所述物体像素点集合和所述背景像素点集合的信息熵总和;将大于预设信息熵阈值的信息熵总和所对应的分割值,作为所述处理后的样本图像中的目标物体的目标分割值,并根据所述目标分割值,确定出所述目标物体像素点集合。3.根据权利要求2所述的方法,其特征在于,所述针对所述像素点取值范围内的每一像素值,将所述每一像素值作为分割值,获取所述分割值对应的物体像素点集合和背景像素点集合,并计算所述物体像素点集合和所述背景像素点集合的信息熵总和,包括:针对每一所述分割值,将小于或等于所述分割值的像素点所对应的集合作为所述背景像素点集合,及将大于所述分割值的像素点所对应的集合作为所述物体像素点集合;计算所述背景像素点集合中每一背景像素点的第一分布概率,及计算所述物体像素点集合中每一物体像素点的第二分布概率;利用信息熵方法,计算所述第一分布概率的第一信息熵的和及所述第二分布概率的第二信息熵的和,并计算所述第一信息熵的和与所述第二信息熵的和的信息熵总和,以获取所述物体像素点集合和所述背景像素点集合的信息熵总和。4.根据权利要求1所述的方法,其特征在于,所述针对每一所述目标物体像素点,根据所述目标物体像素点的三维坐标,计算获取所述目标物体像素点的梯度方向和梯度幅值,包括:针对每一所述目标物体像素点,根据所述目标物体像素点的图像坐标,获取所述目标物体像素点在相机坐标系下的相机坐标;利用相机坐标的内外参数,并结合世界坐标系中的齐次坐标形式,构建所述图像坐标与所述相机坐标的矩阵关系式,其中,所述矩阵关系式包括所述像素点的投影矩阵;获取所述目标物体像素点在相机坐标系下的左方向上的左投影矩阵和右方向上的右投影矩阵,将所述左投影矩阵和所述右投影矩阵分别代入到所述矩阵关系式,建立矩阵方程组,并求解所述矩阵方程组以获取所述图像坐标对应的三维坐标;
利用梯度方向计算式和梯度幅值计算式,计算所述三维坐标的梯度方向和梯度幅值,获取所述目标物体像素点的梯度方向和梯度幅值。5.根据权利要求1所述的方法,其特征在于,所述根据每个所述目标物体像素点的梯度方向和梯度幅值,建立所述待处理样本图像的方向梯度直方图,包括:按照预设像素标准,将所述目标物体像素集合分割成多个细胞单元;针对每一所述细胞单元,按照预配置的梯度方向的方向区间范围,将所述细胞单元中的每一像素点的梯度方向所对应的梯度幅值累计到对应的方向区间范围上,获取所述细胞单元对应的特征向量;将预设数量的所述特征向量进行串联处理,获取所述待处理样本图像的方向梯度直方图。6.一种图像识别处理装置,其特征在于,包括:获取模块,用于获取待处理样本图像,对所述待处理样本图像进行灰度化处理...

【专利技术属性】
技术研发人员:鲁效平魏永强唐宇孙琦王超孟祥秀王迷珍
申请(专利权)人:卡奥斯物联科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1