当前位置: 首页 > 专利查询>蔡敏专利>正文

基于深度学习的图像处理系统及方法技术方案

技术编号:26599374 阅读:19 留言:0更新日期:2020-12-04 21:22
本发明专利技术属于图像处理技术领域,具体涉及基于深度学习的图像处理系统及方法,所述系统包括:图像灰度直方图处理单元,配置用于基于预设的3种不同的灰度值范围,对待处理图像进行图像灰度直方处理,分别获得在不同灰度值范围下的对应的灰度直方特性分布;神经网络处理单元,配置用于基于预先训练建立的图像处理模型,获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达,每个尺度对应3个深度和3种类型,针对每个尺度、每个深度和每个类型下的图像特征表达,进行多层采样和图像截断,然后进行全连接,输出全连接后的图像;图像截断单元,配置用于提供给神经网络处理单元,基于得到的灰度直方特性分布,对待处理的图像进行图像截断,筛除不相关信息的干扰。本发明专利技术具有图像识别的准确率更高和图像处理效率高的优点。

【技术实现步骤摘要】
基于深度学习的图像处理系统及方法
本专利技术属于图像处理
,具体涉及基于基于深度学习的图像处理系统及方法。
技术介绍
深度学习(DL,DeepLearning)是机器学习(ML,MachineLearning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,ArtificialIntelligence)。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。图像处理(imageprocessing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组,该数组的元素称为像素,其值称为灰度值。图像处理技术一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。图像处理的各个内容是互相有联系的。一个实用的图像处理系统往往结合应用几种图像处理技术才能得到所需要的结果。图像数字化是将一个图像变换为适合计算机处理的形式的第一步。图像编码技术可用以传输和存储图像。图像增强和复原可以是图像处理的最后目的,也可以是为进一步的处理作准备。通过图像分割得出的图像特征可以作为最后结果,也可以作为下一步图像分析的基础。
技术实现思路
本专利技术的主要目的在于提供基于深度学习的图像处理系统及方法,基于深度学习,通过对图像进行多个尺度、多个深度和多个类型的特征分析,采用图像截断和直方图化的方式,对图像进行处理,使得图像识别的准确率更高和图像处理效率更高。为达到上述目的,本专利技术的技术方案是这样实现的:基于深度学习的图像处理系统,所述系统包括:图像灰度直方图处理单元,配置用于基于预设的3种不同的灰度值范围,对待处理图像进行图像灰度直方处理,分别获得在不同灰度值范围下的对应的灰度直方特性分布;神经网络处理单元,配置用于基于预先训练建立的图像处理模型,获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达,每个尺度对应3个深度和3种类型,针对每个尺度、每个深度和每个类型下的图像特征表达,进行多层采样和图像截断,然后进行全连接,输出全连接后的图像;图像截断单元,配置用于提供给神经网络处理单元,基于得到的灰度直方特性分布,对待处理的图像进行图像截断,筛除不相关信息的干扰;图像识别单元,配置用于基于输出的全连接后的图像,使用预设的图像识别模型,对图像进行识别。进一步的,所述图像灰度直方图处理单元,基于预设的3种不同的灰度值范围,对待处理图像进行图像灰度直方处理,分别获得在不同灰度值范围下的对应的灰度直方特性分布得方法执行以下步骤:在提取特征之前,对每一张图像进行阈值分割,得到二值化图像BW,将图像BW进行一次开闭运算,得到分割后的图像X;具体方法如下:获取多维灰度特征:多维灰度变化特征:式中,g(x,y)为像素点(x,y)的灰度值,N表示分割图像X中等于1的像素总数,η表示图像分层数,i表示阈值分割的分割上限值,f(x)表示拟合直线的斜率函数;再得到分割后的图像X后,在0~85的灰度范围内,针对分割后的图像X进行灰度直方图统计分析,得到灰度直方特性分布;在86~171的灰度范围内,针对分割后的图像X进行灰度直方图统计分析,得到灰度直方特性分布;在172~255的灰度范围内,针对分割后的图像X进行灰度直方图统计分析,得到灰度直方特性分布。进一步的,所述神经网络处理单元,包括:卷积层、下采样层、多层采样层和全连接层;所述卷积层,由若干卷积单元组成,每个卷积单元的参数通过反向传播算法最佳化得到,配置用于获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达;所述下采样层,配置用于对图像特征表达,进行下采样,得到的下采样结果提供给多层采样层;所述多层采样层,配置用于对下采样结果进行多层采样,同时调用图像截断单元,进行图像截断;全连接层,配置用于对多层采样层处理后的结果进行全连接,输出全连接后的图像。进一步的,所述卷积层获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达的方法执行以下步骤:构建一个10层的高斯金字塔,将待处理图像的中心作为高斯金字塔的第0层,以该中心为原点,按照同心圆的方式,以设定的半径,分别向外扩散,高斯金字塔的第1层图像通过0层图像与窗口函数W(m,n)卷积获得,等价于靠近圆心的第一层同心圆图像,将获得第一层的结果隔3行和隔3列降采样,即:其中,Q表示高斯金字塔第一层图像的列数,P表示高斯金字塔第一层图像的行数,W(m,n)为5X5的窗口函数。进一步的,所述全连接层,对多层采样层处理后的结果进行全连接,输出全连接后的图像的方法执行以下步骤:多个依次堆栈的反向全连接分支全连接不同尺度、不同深度、不同类型的输入图像阴影区域分割特征;首先第一个反向全连接分支全连接主干网络的多尺度特征,最深层开始全连接操作,逐渐全连接相邻两个层次的特征,生成的全连接后特征作为新的较浅层特征;在全连接两个层次的特征时,先将较深层特征上采样2倍,再通过特征拼接的方式进行特征全连接,最后通过一个卷积层获得最终的全连接后特征。进一步的,所述第N个反向全连接分支由最深层开始,逐渐全连接主干网络多尺度特征,且特征尺度逐渐增大;在第N个反向全连接分支全连接过程中,将产生了多个中间层特征,而这些中间层特征也是不同尺度的,编码不同抽象层级的多类型特征;将第N个反向全连接分支产生的多个不同尺度、不同类型的特征看成待全连接的多尺度特征,并采用第N+1个反向全连接分支进行全连接,所采用的全连接单元进行的操作和第N个反向全连接分支是相同的,这样第N+1个反向全连接分支获得第N个反向全连接分支的多尺度特征的有效全连接。一种基于深度学习的图像处理方法,所述方法执行以下步骤:步骤1:基于预设的3种不同的灰度值范围,对待处理图像进行图像灰度直方处理,分别获得在不同灰度值范围下的对应的灰度直方特性分布;步骤2:基于预先训练建立的图像处理模型,获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达,每个尺度对应3个深度和3种类型,针对每个尺度、每个深度和每个类型下的图像特征表达,进行多层采样和图像截断,然后进行全连接,输出全连接后的图像;步骤3:基于得到的灰度直方特性分布,为步骤2对待处理的图像进行图像截断,筛除不相关信息的干扰;步骤4:基于输出的全连接后的图像,使用预设的图像识别模型,对图像进行识别。进一步的,基于预设的3种不同的灰度值范围,对待处理图像进行图像灰度直方处理,分别获得在本文档来自技高网
...

【技术保护点】
1.基于深度学习的图像处理系统,其特征在于,所述系统包括:图像灰度直方图处理单元,配置用于基于预设的3种不同的灰度值范围,对待处理图像进行图像灰度直方处理,分别获得在不同灰度值范围下的对应的灰度直方特性分布;神经网络处理单元,配置用于基于预先训练建立的图像处理模型,获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达,每个尺度对应3个深度和3种类型,针对每个尺度、每个深度和每个类型下的图像特征表达,进行多层采样和图像截断,然后进行全连接,输出全连接后的图像;图像截断单元,配置用于提供给神经网络处理单元,基于得到的灰度直方特性分布,对待处理的图像进行图像截断,筛除不相关信息的干扰;图像识别单元,配置用于基于输出的全连接后的图像,使用预设的图像识别模型,对图像进行识别。/n

【技术特征摘要】
1.基于深度学习的图像处理系统,其特征在于,所述系统包括:图像灰度直方图处理单元,配置用于基于预设的3种不同的灰度值范围,对待处理图像进行图像灰度直方处理,分别获得在不同灰度值范围下的对应的灰度直方特性分布;神经网络处理单元,配置用于基于预先训练建立的图像处理模型,获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达,每个尺度对应3个深度和3种类型,针对每个尺度、每个深度和每个类型下的图像特征表达,进行多层采样和图像截断,然后进行全连接,输出全连接后的图像;图像截断单元,配置用于提供给神经网络处理单元,基于得到的灰度直方特性分布,对待处理的图像进行图像截断,筛除不相关信息的干扰;图像识别单元,配置用于基于输出的全连接后的图像,使用预设的图像识别模型,对图像进行识别。


2.如权利要求1所述的系统,其特征在于,所述图像灰度直方图处理单元,基于预设的3种不同的灰度值范围,对待处理图像进行图像灰度直方处理,分别获得在不同灰度值范围下的对应的灰度直方特性分布得方法执行以下步骤:在提取特征之前,对每一张图像进行阈值分割,得到二值化图像BW,将图像BW进行一次开闭运算,得到分割后的图像X;具体方法如下:获取多维灰度特征:多维灰度变化特征:式中,g(x,y)为像素点(x,y)的灰度值,N表示分割图像X中等于1的像素总数,η表示图像分层数,i表示阈值分割的分割上限值,f(x)表示拟合直线的斜率函数;再得到分割后的图像X后,在0~85的灰度范围内,针对分割后的图像X进行灰度直方图统计分析,得到灰度直方特性分布;在86~171的灰度范围内,针对分割后的图像X进行灰度直方图统计分析,得到灰度直方特性分布;在172~255的灰度范围内,针对分割后的图像X进行灰度直方图统计分析,得到灰度直方特性分布。


3.如权利要求2所述的系统,其特征在于,所述神经网络处理单元,包括:卷积层、下采样层、多层采样层和全连接层;所述卷积层,由若干卷积单元组成,每个卷积单元的参数通过反向传播算法最佳化得到,配置用于获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达;所述下采样层,配置用于对图像特征表达,进行下采样,得到的下采样结果提供给多层采样层;所述多层采样层,配置用于对下采样结果进行多层采样,同时调用图像截断单元,进行图像截断;全连接层,配置用于对多层采样层处理后的结果进行全连接,输出全连接后的图像。


4.如权利要求3所述的系统,其特征在于,所述卷积层获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达的方法执行以下步骤:构建一个10层的高斯金字塔,将待处理图像的中心作为高斯金字塔的第0层,以该中心为原点,按照同心圆的方式,以设定的半径,分别向外扩散,高斯金字塔的第1层图像通过0层图像与窗口函数W(m,n)卷积获得,等价于靠近圆心的第一层同心圆图像,将获得第一层的结果隔3行和隔3列降采样,即:其中,Q表示高斯金字塔第一层图像的列数,P表示高斯金字塔第一层图像的行数,W(m,n)为5X5的窗口函数。


5.如权利要求5所述的系统,其特征在于,所述全连接层,对多层采样层处理后的结果进行全连接,输出全连接后的图像的方法执行以下步骤:多个依次堆栈的反向全连接分支全连接不同尺度、不同深度、不同类型的输入图像阴影区域分割特征;首先第一个反向全连接分支全连接主干网络的多尺度特征,最深层开始全连接操作,逐渐全连接相邻两个层次的特征,生成的全连接后特征作为新的较浅层特征;在全连...

【专利技术属性】
技术研发人员:蔡敏
申请(专利权)人:蔡敏
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1