生成在神经网络中使用的人工图像制造技术

技术编号:21972665 阅读:41 留言:0更新日期:2019-08-28 01:43
方法包括为接收到的输入图像创建图像数据的输入矩阵,以及响应于选择第一图像滤波器以用于生成人工图像,该方法将第一图像滤波器的第一滤波器计算应用于图像数据的输入矩阵,其中应用第一滤波器计算生成了图像数据的第一结果矩阵。该方法将图像数据的第一结果矩阵级联到图像数据的输入矩阵,以生成图像数据的第一级联矩阵。该方法基于图像数据的级联矩阵生成适合在神经网络中使用的人工图像。

Generating Artificial Images Used in Neural Networks

【技术实现步骤摘要】
生成在神经网络中使用的人工图像
本专利技术涉及使用神经网络的图像处理,并且更具体地,涉及生成在神经网络中使用的人工图像(artificialimage)。
技术介绍
人工神经网络(artificialneuralnetwork,ANN)是受构成动物大脑的生物神经网络启发的计算系统。这种系统通过从示例中考虑和训练来学习并逐步提高任务表现。ANN是基于被称为人工神经元的连接单元或节点的集合。神经元之间的每个连接(突触)都可以彼此相互传递信号。接收(突触后)神经元可以处理(多个)信号,然后向与其连接的神经元发送信号。在常见的ANN实施方式中,突触信号是实数,并且每个神经元的输出由其输入之和的非线性函数计算。神经元和突触典型地具有随着学习的进行而调整的权重。权重增加或减少其跨突触传送的信号的强度。神经元可能有一个阈值,使得只有当总信号超过阈值时,信号才会被传送。典型地,神经元是按层组织的。不同的层可以对其输入执行不同种类的变换。可能在多次穿越层之后,信号从第一(输入)层传播到最后(输出)层。在机器学习中,卷积神经网络(convolutionalneuralnetwork,ConvNet)是一类深度前馈(feed-forward)人工神经网络,其已成功应用于分析视觉成像。ConvNet使用了多种多层感知器,该多层感知器被设计成要求最少的预处理。基于它们的共享权重体系结构和平移(translation)不变特性,它们也被称为移位不变或空间不变人工神经网络(spaceinvariantartificialneuralnetwork,SIANN)。与其它图像分类算法相比,ConvNet使用相对较少的预处理。这意味着网络学习了在传统算法中手工设计的滤波器。神经网络典型地使用层之间的矩阵向量线性积,其中将公共函数逐元素地应用于结果(resulting)向量函数,这可能产生非线性层,诸如径向基层或阈值整流层。然而,要求诸如傅立叶分解、多项式或绝对值或多个阈值的每元素函数的更复杂的非线性层难以实施,并且通过这些层的反向传播并不总是可解的。另外,层的结果会替换输入数据,而不是对输入数据的添加。如果需要诸如利用残差神经网络来传播先前的输入,则必须添加神经网络中的多条路径。
技术实现思路
根据本专利技术的实施例公开了一种用于生成在神经网络中使用的人工图像的方法、计算机程序产品和计算机系统。为接收到的图像创建图像数据的输入矩阵。响应于被选择用于生成人工图像的第一图像滤波器,将第一图像滤波器的第一滤波器计算应用于图像数据的输入矩阵,其中应用第一滤波器计算生成了图像数据的第一结果矩阵。将图像数据的第一结果矩阵级联(concatenate)到图像数据的输入矩阵以生成图像数据的第一级联矩阵。基于图像数据的级联矩阵生成适合在神经网络中使用的人工图像。附图说明被视为本专利技术的主题在说明书的结论部分中被具体指出并明确要求保护。当结合附图阅读时,通过参考下面的详细描述,可以最好地理解本专利技术的操作的组织和方法,以及其目的、特征和优点。现在将参考以下附图,仅通过示例的方式描述本专利技术的优选实施例,其中:图1是根据本专利技术实施例的方法的示例实施例的流程图。图2是根据本专利技术实施例的图1的方法的一方面的示例实施例的流程图。图3是根据本专利技术实施例的图1的方法的另一方面的示例实施例的流程图。图4是根据本专利技术实施例的输入图像和级联图像的示意图。图5A、图5B和图5C是根据本专利技术实施例的输入图像和级联图像的照片图。图6是根据本专利技术实施例的系统的示例实施例的框图。图7是其中可以实施本专利技术的计算机系统或云服务器的实施例的框图。图8是其中可以实施本专利技术的云计算环境的示意图。图9是其中可以实施本专利技术的云计算环境的抽象模型层的图。应当理解,为了说明的简单和清楚,附图中所示的元素不必按比例绘制。例如,为了清楚起见,元素中的一些元素的大小可以相对于其它元素被放大。此外,在认为合适的情况下,附图当中的参考编号可以重复,以指示相对应的或类似的特征。具体实施方式提供了一种用于生成在神经网络中使用的人工图像的方法和系统。人工图像对输入数据使用添加方案,使得添加的信息只被计算一次,从而使得神经网络中计算设备的内存利用率降低。这意味着计算设备不需要对每个网络层的计算,并且不需要针对每个神经网络迭代的计算。这消除了使用神经网络中的层来计算线性或非线性滤波器的需要。所述方法通过预先计算图像滤波器、通过增强图像来生成人工图像,从而改善对于神经网络的图像识别。通过预先计算图像滤波器并获得新的图像数据来增强初始图像,从而生成人工图像。人工图像可以被注入到神经网络中以用于更好的图像识别。在计算机图形学中,光栅图形或位图图像是点阵数据结构,其表示像素或颜色点的大致矩形网格。光栅图像由波段组成,并且被存储在具有不同格式的图像文件中。对于具有多个波段(红色、绿色、蓝色、红外线等)的图像,每个像素每波段包含一个元素。在所述方法中,元素被添加到表示输入图像的矩阵(诸如点阵数据结构)中,以创建相当于将经滤波的图像并排添加到原始图像的人工图像。级联图像的大小使得宽度*高度足以包含所有滤波器加上原始图像的(宽度*高度)之和。经滤波的图像可以以各种布置方式来放置并附加到最终图像,包括下方、右侧、左侧或混合位置,前提是选择的放置对于所有图像都是相同的。向神经网络馈送由输入图像和当作一个单个图像的经滤波的图像组成的人工图像。这克服了利用卷积神经网络无法实现不可微(non-differentiable)滤波器的问题。通过馈送包括滤波器和不可微滤波器的人工图像,改善了识别率。参考图1,流程图100示出了生成在神经网络中使用的人工图像的所述方法的示例实施例。该方法应用于在训练、交叉验证和测试集中的所有图像。训练后,同样的方法应用于被测试的任意图像。可以加载101输入图像,例如,作为神经网络训练集中的多个图像之一,或者作为待识别的图像。该方法可以对输入图像执行102任何经典的图像增强变换。经典的图像增强变换可以包括移位、翻转、旋转、噪声添加或消除、缩放等,或者这些变换的任意组合。这可以是自动化的过程,例如,使用Python预处理(Python是Python软件基金会的商标)。可以读取图像文件并且可以创建具有数据的像素的工作矩阵103。这可以将输入图像加载为像素矩阵,该像素矩阵是灰色图像(全色)的宽度*高度的矩阵,或者彩色图像的宽度*高度*颜色层数(通常为红色、绿色和蓝色3层)的矩阵。输入图像可以是全色的或彩色的。如果输入图像是彩色的,该方法可以确定104颜色平面或将彩色图像转换成灰度。参考图2进一步详细描述颜色平面处理。如果图像是全色的,下面描述的滤波器计算过程可以作为单个实体应用于整个图像。如果图像是彩色图像,则可以以替代方式处理除第一层外的颜色层的值矩阵。它们可以级联到第一层,创建相同宽度的、但是矩阵高度为颜色层数乘以原始高度的人工灰色图像。可替代地,另一方案是单独对每个颜色层应用滤波器计算过程。因此,该方法可以输入105第一颜色平面或整个图像的输入矩阵以用于处理。可以选择106待应用的滤波器。下面的滤波器列表是典型的列表,但是可以使用更多或更少的滤波器:阈值二进制反转或不反转;阈值截断;阈值为零;Canny边缘;高斯模糊和中值模糊本文档来自技高网
...

【技术保护点】
1.一种方法,包括:由一个或多个处理器为接收到的图像创建图像数据的输入矩阵;响应于选择第一图像滤波器以用于生成人工图像,由一个或多个处理器将第一图像滤波器的第一滤波器计算应用于所述图像数据的输入矩阵,其中应用所述第一滤波器计算生成图像数据的第一结果矩阵;由一个或多个处理器将所述图像数据的第一结果矩阵级联到所述图像数据的输入矩阵,以生成图像数据的第一级联矩阵;以及由一个或多个处理器基于所述图像数据的级联矩阵生成适合在神经网络中使用的人工图像。

【技术特征摘要】
2018.02.21 US 15/900,9211.一种方法,包括:由一个或多个处理器为接收到的图像创建图像数据的输入矩阵;响应于选择第一图像滤波器以用于生成人工图像,由一个或多个处理器将第一图像滤波器的第一滤波器计算应用于所述图像数据的输入矩阵,其中应用所述第一滤波器计算生成图像数据的第一结果矩阵;由一个或多个处理器将所述图像数据的第一结果矩阵级联到所述图像数据的输入矩阵,以生成图像数据的第一级联矩阵;以及由一个或多个处理器基于所述图像数据的级联矩阵生成适合在神经网络中使用的人工图像。2.根据权利要求1所述的方法,还包括:响应于选择第二图像滤波器以用于生成人工图像,由一个或多个处理器将第二图像滤波器的第二滤波器计算应用于所述图像数据的输入矩阵;以及由一个或多个处理器将所述图像数据的第一结果矩阵和图像数据的第二结果矩阵级联到所述图像数据的输入矩阵,以生成图像数据的第二级联矩阵。3.根据权利要求2所述的方法,还包括:由一个或多个处理器将所述图像数据的第一结果矩阵附加到所述图像数据的第二结果矩阵附近。4.根据权利要求1所述的方法,还包括:由一个或多个处理器修改所述图像数据的第一结果矩阵的第一尺寸,以匹配所述图像数据的输入矩阵的第二尺寸。5.根据权利要求4所述的方法,其中,所述图像数据的第一结果矩阵的第一尺寸小于所述图像数据的输入矩阵,并且修改所述图像数据的第一结果矩阵的第一尺寸包括像素复制、插值、外推或用常数值填充以匹配所述图像数据的输入矩阵的第二尺寸。6.根据权利要求4所述的方法,其中,所述图像数据的第一结果矩阵的第一尺寸大于所述图像数据的输入矩阵,并且修改所述图像数据的第一结果矩阵的第一尺寸包括提供附加矩阵以容纳附加矩阵数据。7.根据权利要求1所述的方法,其中,接收到的图像是全色的。8.根据权利要求1所述的方法,其中,将所述第一图像滤波器的第一滤波器计算应用于所述图像数据的输入矩阵还包括:由一个或多个处理器将所述第一滤波器计算分开地应用于所述图像数据的输入矩阵的每个颜色层,以返回每个颜色平面的单个级联矩阵。9.根据权利要求8所述的方法,其中,每个颜色层被堆叠以创建图像数据的人工灰色图像输入矩阵。10.一种计算机系统,包括:一个或多个计算机处理器;一个或多个计算机可读存储介质;和存储在计算机可读存储介质上的程序指令,用于由所述一个或多个计算机处理器中的至少一个计算机处理器运行,所述程序指令包括:程序指令,用于为接收到的图像创建图像数据的输入矩阵;程序指令,用于响应于选择第一图像滤波器以用于生成人工图像,将第一图像滤波器的第一滤波器计算应用于所述图像数据的输入矩阵,其中应用所述第一滤波器计算生成图像数据的第一结果矩阵;程序指令,用于将所述图像数据的第一结果矩阵级联到所述图像数据的输入矩阵,以生成图像数据的第一级联矩阵;以及程序指令,用于基于所述图像数据的级联矩阵生成适合在神经网络中使用的人工图像。11.根据权利要求10所述的计算机系统,还包括存储在一个...

【专利技术属性】
技术研发人员:M菲亚曼特
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1