当前位置: 首页 > 专利查询>蔡敏专利>正文

基于深度学习的图像处理系统及方法技术方案

技术编号：26599374 阅读：19 留言：0更新日期：2020-12-04 21:22

本发明专利技术属于图像处理技术领域，具体涉及基于深度学习的图像处理系统及方法，所述系统包括：图像灰度直方图处理单元，配置用于基于预设的3种不同的灰度值范围，对待处理图像进行图像灰度直方处理，分别获得在不同灰度值范围下的对应的灰度直方特性分布；神经网络处理单元，配置用于基于预先训练建立的图像处理模型，获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达，每个尺度对应3个深度和3种类型，针对每个尺度、每个深度和每个类型下的图像特征表达，进行多层采样和图像截断，然后进行全连接，输出全连接后的图像；图像截断单元，配置用于提供给神经网络处理单元，基于得到的灰度直方特性分布，对待处理的图像进行图像截断，筛除不相关信息的干扰。本发明专利技术具有图像识别的准确率更高和图像处理效率高的优点。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的图像处理系统及方法
本专利技术属于图像处理
，具体涉及基于基于深度学习的图像处理系统及方法。
技术介绍
深度学习(DL,DeepLearning)是机器学习(ML,MachineLearning)领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能(AI,ArtificialIntelligence)。深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。深度学习在搜索技术，数据挖掘，机器学习，机器翻译，自然语言处理，多媒体学习，语音，推荐和个性化技术，以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动，解决了很多复杂的模式识别难题，使得人工智能相关技术取得了很大进步。图像处理(imageprocessing)，用计算机对图像进行分析，以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组，该数组的元素称为像素，其值称为灰度值。图像处理技术一般包括图像压缩，增强和复原，匹配、描述和识别3个部分。图像处理的各个内容是互相有联系的。一个实用的图像处理系统往往结合应用几种图像处理技术才能得到所需要的结果。图像数字化是将一个图...

【技术保护点】
1.基于深度学习的图像处理系统，其特征在于，所述系统包括：图像灰度直方图处理单元，配置用于基于预设的3种不同的灰度值范围，对待处理图像进行图像灰度直方处理，分别获得在不同灰度值范围下的对应的灰度直方特性分布；神经网络处理单元，配置用于基于预先训练建立的图像处理模型，获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达，每个尺度对应3个深度和3种类型，针对每个尺度、每个深度和每个类型下的图像特征表达，进行多层采样和图像截断，然后进行全连接，输出全连接后的图像；图像截断单元，配置用于提供给神经网络处理单元，基于得到的灰度直方特性分布，对待处理的图像进行图像截断，筛除不相关信息的干扰；图像识别单元，配置用于基于输出的全连接后的图像，使用预设的图像识别模型，对图像进行识别。/n

【技术特征摘要】
1.基于深度学习的图像处理系统，其特征在于，所述系统包括：图像灰度直方图处理单元，配置用于基于预设的3种不同的灰度值范围，对待处理图像进行图像灰度直方处理，分别获得在不同灰度值范围下的对应的灰度直方特性分布；神经网络处理单元，配置用于基于预先训练建立的图像处理模型，获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达，每个尺度对应3个深度和3种类型，针对每个尺度、每个深度和每个类型下的图像特征表达，进行多层采样和图像截断，然后进行全连接，输出全连接后的图像；图像截断单元，配置用于提供给神经网络处理单元，基于得到的灰度直方特性分布，对待处理的图像进行图像截断，筛除不相关信息的干扰；图像识别单元，配置用于基于输出的全连接后的图像，使用预设的图像识别模型，对图像进行识别。

2.如权利要求1所述的系统，其特征在于，所述图像灰度直方图处理单元，基于预设的3种不同的灰度值范围，对待处理图像进行图像灰度直方处理，分别获得在不同灰度值范围下的对应的灰度直方特性分布得方法执行以下步骤：在提取特征之前，对每一张图像进行阈值分割，得到二值化图像BW，将图像BW进行一次开闭运算，得到分割后的图像X；具体方法如下：获取多维灰度特征：多维灰度变化特征：式中，g(x，y)为像素点(x，y)的灰度值，N表示分割图像X中等于1的像素总数，η表示图像分层数，i表示阈值分割的分割上限值，f(x)表示拟合直线的斜率函数；再得到分割后的图像X后，在0～85的灰度范围内，针对分割后的图像X进行灰度直方图统计分析，得到灰度直方特性分布；在86～171的灰度范围内，针对分割后的图像X进行灰度直方图统计分析，得到灰度直方特性分布；在172～255的灰度范围内，针对分割后的图像X进行灰度直方图统计分析，得到灰度直方特性分布。

3.如权利要求2所述的系统，其特征在于，所述神经网络处理单元，包括：卷积层、下采样层、多层采样层和全连接层；所述卷积层，由若干卷积单元组成，每个卷积单元的参数通过反向传播算法最佳化得到，配置用于获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达；所述下采样层，配置用于对图像特征表达，进行下采样，得到的下采样结果提供给多层采样层；所述多层采样层，配置用于对下采样结果进行多层采样，同时调用图像截断单元，进行图像截断；全连接层，配置用于对多层采样层处理后的结果进行全连接，输出全连接后的图像。

4.如权利要求3所述的系统，其特征在于，所述卷积层获得待处理图像在10个尺度、3个深度、3种类型的输入图像特征表达的方法执行以下步骤：构建一个10层的高斯金字塔，将待处理图像的中心作为高斯金字塔的第0层，以该中心为原点，按照同心圆的方式，以设定的半径，分别向外扩散，高斯金字塔的第1层图像通过0层图像与窗口函数W(m,n)卷积获得，等价于靠近圆心的第一层同心圆图像，将获得第一层的结果隔3行和隔3列降采样，即：其中，Q表示高斯金字塔第一层图像的列数，P表示高斯金字塔第一层图像的行数，W(m,n)为5X5的窗口函数。

5.如权利要求5所述的系统，其特征在于，所述全连接层，对多层采样层处理后的结果进行全连接，输出全连接后的图像的方法执行以下步骤：多个依次堆栈的反向全连接分支全连接不同尺度、不同深度、不同类型的输入图像阴影区域分割特征；首先第一个反向全连接分支全连接主干网络的多尺度特征，最深层开始全连接操作，逐渐全连接相邻两个层次的特征，生成的全连接后特征作为新的较浅层特征；在全连...

【专利技术属性】
技术研发人员：蔡敏，
申请(专利权)人：蔡敏，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人