使用卷积神经网络的数字图像处理制造技术

技术编号:13709454 阅读:35 留言:0更新日期:2016-09-15 19:18
根据示例,可以通过卷积神经网络(CNN)集合对数字图像进行处理,以对数字图像中的对象进行分类。对于每个CNN,可以选择候选架构和候选参数以构建多个CNN。一旦确定每个对于所选择的候选参数具有不同的值的预定数量的CNN满足验证阈值,就可以从预定数量的CNN生成CNN集合。然后,可以聚集来自CNN集合的预测以准确地对数字图像中的对象进行分类。

【技术实现步骤摘要】

技术介绍
数字图像处理通常涉及处理数字图像(例如,来自数字静止图像或数字视频)以确知、检测和/或分类图像中的具体特征或对象。可以在图像处理期间应用模式识别以检测图像中的具体对象。具有模式识别的数字图像处理已经在广泛多种应用(诸如面部识别、来自航空照片的土地特征的检测、车辆牌照确定等)中使用。不同类型的常规机器学习功能可以用于模式识别,然而,许多常规机器学习功能不适合于或可能难以适合于数字图像处理中的模式识别。附图说明通过示例的方式图示本公开的特征,并且不局限于以下附图,其中,类似的标号指示类似的元件,其中:图1示出了根据本公开的示例的图像处理系统的系统图;图2示出了根据本公开的示例的指示对资产(property)损坏的程度的分类类别;图3示出了根据本公开的示例的图像处理服务器的数据存储(data store);图4示出了根据本公开的示例的用于使用卷积神经网络(CNN)对数字图像中的对象进行分类的计算设备的框图;图5示出了根据本公开的示例的使用CNN对数字图像中的对象进行分类的方法的流程图;和图6示出了根据本公开的示例的优化CNN的流程图。具体实施方式出于简化和说明目的,主要通过参照其示例对本公开进行描述。
在以下描述中,阐述了许多具体细节,以便提供对本公开的透彻理解。然而,显而易见的是,在不局限于这些具体细节的情况下,也可以实践本公开。在其它实例中,没有对一些方法和结构进行详细描述,以免不必要地模糊本公开。如本文中所使用的,术语“一”和“一个”旨在表示至少一个具体元素,术语“包括(includes)”意味着包括(includes)但不限于,术语“包括(including)”意味着包括(including)但不限于,并且术语“基于”意味着至少部分基于。根据示例,图像处理系统构建并且训练深度学习模型(诸如卷积神经网络(CNN))集合(ensemble),以精确地且自动地执行图像处理来检测数字图像中的对象的具体属性,并且根据所检测的属性对对象进行分类。然而,CNN包括许多功能部件,其使得它很难确定准确执行以检测并分类对于手头问题是相关的图像的具体特征所必需的网络架构。更进一步地,CNN的每个部件通常具有与它相关联的大量参数。在没有应用任何鲁棒的图像处理系统的情况下,成功且准确的图像分类所必需的那些参数的特定值不是先验已知的。因此,图像处理系统提供了一种用于构建并且微调证明输出图像的准确分类的CNN的方法。通过迭代过程,可以选择用于CNN的候选架构和候选参数来构建、训练、并优化CNN。例如,迭代过程可以包括:从多个候选架构选择候选架构并且验证用于所选择的候选架构的候选参数集。候选架构可以包括分类器类型以及若干个卷积层和子采样(subsampling)层。候选参数可以包括学习率、批量大小、训练历元(training epoch)的最大数量、输入图像大小、CNN每一层处的特征映射图(feature map)数量、卷积滤波器大小、子采样池大小、隐含层数量、每个隐含层中的单元数量、所选择的分类器算法、以及输出种类的数量。另外,还可以选择预处理协议,以增强用于所选择的候选架构和所选择的候选参数的图像中的具体内容。迭代过程可以包括:使用训练集构建中间CNN并且评价
(evaluate)中间CNN在验证集上的性能。比如,该评价确定中间CNN是否满足验证阈诸(诸如小于20%错误率)。重复该迭代过程直到预定数量(例如,25个)的中间CNN满足验证阈值为止。根据示例,每个中间CNN对于所选择的候选参数具有不同的值。然后,从预定数量的中间CNN生成最准确的中间CNN集合。例如,该集合可能是前5个最准确的中间CNN。下一步骤可以包括:选择集合算法以聚集和/或组合该集合中的每个中间CNN的预测以形成集合预测。然后,该集合中的每个中间CNN的预测可以用来对图像或图像中的对象进行分类。所公开的示例的技术优势和优点包括:提供了表现出优良的分类准确度以评估(assess)资产损坏的先进深度学习架构和确定先进深度学习架构的迭代图像处理系统。通过迭代过程由图像处理系统生成的CNN比其它规则的前馈神经网络更容易训练,并且具有较少的估计参数,从而使其成为用来评估资产损坏的更有效的架构。根据示例,由图像处理系统生成的CNN可以用来对在数字图像中捕获的资产的损坏程度间分类。损坏可以是指损害资产外观的任何类型的损伤或伤害。图像或数字图像可以包括静止图像和运动图像(例如,视频)。资产可能是包括但不限于房子、家具、服装、车辆设备、土地、计算设备、玩具等的任何有形对象。在其中投保客户的有形资产意外受损的示例中,投保客户可以通过用智能手机和/或相机拍摄数码照片来记录对受损资产的损坏。然后,受损资产的数字图像可以被馈给到图像处理系统。图像处理系统可以自动基于从所接收的数字图像的图像处理确定的损坏量来对受损资产进行分类。在本示例中,图像处理系统提供了一种自动检测对如在数字图像中捕获的资产的损坏程度的机器视觉方法和装置。根据示例,图像处理系统生成集合模型(例如,包括多个优化CNN),以在准确度提高的情况下对图像或者该图像中的对象进行分类。在示例中,使用集合模型的图像处理系统对验证集中的图像的准确度接近90%。如上文所讨论的,根据示例,图像处理系统可以用于对在图像中捕获的资产损坏的程度进行分类。然而,图像处理系统可以基本上用于任何应用以将数字图像中的特征分类为预先定义的类别。参照图1,示出了根据本公开的示例的图像处理系统100的系统图。应当理解,在不脱离该系统100的范围的情况下,该系统100可以包括附加的部件,并且本文中所描述的部件的一个或多个部件可以被移除和/或修改。该系统100可以包括至少一个图像捕获设备110、通信网络120、图像处理服务器130、以及数据存储140。图像捕获设备110可以经由通信网络120与图像处理服务器130通信。图像捕获设备110可以是任何计算设备,其包括相机(诸如但不限于智能电话、计算平板电脑、膝上型计算机、台式计算机、或任何可穿戴计算设备)。根据示例,图像捕获设备110可以捕获有形资产150的图像并且将有形资产150的图像发送到图像处理服务器130以自动对有形资产150的损坏程度进行分类。通信网络120可以包括局域网(LAN)和广域网(WAN)(诸如因特网)。通信网络120可以包括可以由软件、应用程序和/或逻辑控制的信号承载介质。通信网络120可以包括支持数据通信服务的网络元件的组合。例如,通信网络120可以通过使用物理连接(诸如铜电缆、同轴电缆和光纤电缆)或通过无线技术(诸如无线电、微波、或卫星)将图像捕获设备110连接到图像处理服务器130。例如,图像处理服务器130可以在图像预处理器105处从训练集接收数字图像。图像预处理器可以裁剪并增强来自训练集的图像中的具体内容以输入到中间CNN构建器(builder)115。中间CNN构建器115可以选择各种架构和参数来训练中间CNN125。然后,可以在由验证电路135生成的验证集上对中间CNN125进行评估。验证电路135可以确定是否标记满足指定验证阈值的中间CNN125。如果中间CNN125不满足验证阈值,则中间CNN不被标记,并且继续通过中间C本文档来自技高网
...

【技术保护点】
一种图像处理方法,包括:从受损对象的图像创建训练集;选择用于卷积神经网络(CNN)的候选架构和候选参数以通过迭代过程对所述图像中的所述对象的损坏程度进行分类,其中,所述迭代过程包括:从多个候选架构中选择所述候选架构;选择用于所选择的候选架构的所述候选参数;针对所选择的候选架构和所选择的候选参数选择预处理协议以增强所述受损对象的所述图像中的所述信息内容;使用所述训练集构建中间CNN;评价所述中间CNN在验证集上的性能;确定所述中间CNN是否满足验证阈值;以及重复所述迭代过程直到预先确定数量的中间CNN满足所述验证阈值,其中,每个中间CNN对于所选择的候选参数具有不同的值;从所述预先确定数量的中间CNN创建中间CNN集合;以及对所述验证集中的每幅图像中的所述对象的损坏程度进行分类,其中,所述分类包括聚集来自所述中间CNN集合的预测。

【技术特征摘要】
2015.03.04 US 14/638,8731.一种图像处理方法,包括:从受损对象的图像创建训练集;选择用于卷积神经网络(CNN)的候选架构和候选参数以通过迭代过程对所述图像中的所述对象的损坏程度进行分类,其中,所述迭代过程包括:从多个候选架构中选择所述候选架构;选择用于所选择的候选架构的所述候选参数;针对所选择的候选架构和所选择的候选参数选择预处理协议以增强所述受损对象的所述图像中的所述信息内容;使用所述训练集构建中间CNN;评价所述中间CNN在验证集上的性能;确定所述中间CNN是否满足验证阈值;以及重复所述迭代过程直到预先确定数量的中间CNN满足所述验证阈值,其中,每个中间CNN对于所选择的候选参数具有不同的值;从所述预先确定数量的中间CNN创建中间CNN集合;以及对所述验证集中的每幅图像中的所述对象的损坏程度进行分类,其中,所述分类包括聚集来自所述中间CNN集合的预测。2.根据权利要求1所述的方法,其中,所述候选架构包括分类器类型以及若干个卷积层和子采样层。3.根据权利要求1所述的方法,其中,所述候选参数包括学习参数,其中,所述学习参数包括以下各项中的至少一项:学习率、批量大小、以及训练历元的最大数量。4.根据权利要求3所述的方法,其中,所述学习率介于0.05和0.1之间,所述批量大小介于2幅图像和128幅图像之间,并且所述训练历元的最大数量介于100和200之间。5.根据权利要求1所述的方法,其中,所述候选参数包括卷积和子采样参数,其中,所述卷积和子采样参数包括卷积滤波器大小、
\t特征映射图数量、以及子采样池大小。6.根据权利要求5所述的方法,其中,所述卷积滤波器大小介于2×2个像素和114×114个像素之间,第一卷积层中的所述特征映射图数量介于60和512之间,并且所述子采样池大小介于2×2个像素和4×4像素之间。7.根据权利要求1所述的方法,其中,所述候选参数包括分类器参数,其中,所述分类器参数包括图像输入大小、隐含层的数量、每个隐含层中的单元数量、分类器算法、以及输出种类数量。8.根据权利要求7所述的方法,其中,所述图像输入大小是等于特征映射图数量和最终卷积层的图像大小的乘积的数量,所述隐含层数量是2,所述每个隐含层中的单元数量介于6个单元和1024个单元之间,分类器算法是多层感知器(MLP)算法,并且所述输出种类数量是3。9.根据权利要求1所述的方法,其中,确定所述中间CNN是否满足所述验证阈值包括:确定所述中间CNN在所述验证集上的错误率是否小于20%。10.根据权利要求1所述的方法,其中,中间CNN的所述预先确定数量是25。11.一种图像处理服务器,包括:处理器;存储机器可读指令的存储器,所述机器可读指令使所述处理器:通过训练电路从受损对象的图像创建训练集;选择用于卷积神经网络(CNN)的候选架构和候选参数以通过迭代过程对所述图像中的所述对象的损坏程度进行分类,其中,所述迭代过程包括:通过模型构建器从多个候选架构中选择所述候选架构;通过所述模型构建器选择用于所选择的候选架构的所述候选参数;通过所述模型构建器使用所述训练集构建中间CNN;通过所述验证电路评价所述中间CNN在验证集上的性能,以及重复所述迭代过程,直到确定预先确定数量的中间CNN满足验证阈值,其中,每个中间CNN对于所选择的候选参数具有不同的值;通过所述验证电路从预先...

【专利技术属性】
技术研发人员:A·拉文德兰O·塞利克汀马兹M·巴达维
申请(专利权)人:埃森哲环球服务有限公司
类型:发明
国别省市:爱尔兰;IE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1