当前位置: 首页 > 专利查询>罗伯特专利>正文

经由等渗卷积神经网络的图像处理制造技术

技术编号:37112162 阅读:28 留言:0更新日期:2023-04-01 05:09
一种卷积神经网络系统包括传感器和控制器,其中所述控制器被配置成:从所述传感器接收图像;将所述图像划分成补片,每个补片具有大小p;经由第一卷积层基于大小p的特征检测器来提取具有多个通道的特征图,其中所述特征检测器具有等于大小p的步幅;通过交替地应用逐深度卷积层和逐点卷积层来改善所述特征图以获得经改善的特征图,其中所述特征图中的通道的数目和所述特征图的大小遍及改善中的所有操作而保持恒定;以及输出经改善的特征图。以及输出经改善的特征图。以及输出经改善的特征图。

【技术实现步骤摘要】
经由等渗卷积神经网络的图像处理


[0001]本公开总体上涉及使用等渗卷积神经网络的图像处理。更具体地,本申请涉及允许等渗卷积神经网络中的减少的参数的改进。

技术介绍

[0002]对象辨别是涉及将图像分类成预定义数目的类的计算机视觉中的基本问题。归功于大的且加标签的数据集以及强大计算基础设施的可用性,卷积神经网络(CNN)已经实现关于该问题的最先进结果。CNN自动地从训练图像提取判别分类特征,并组合地使用它们以辨别复杂对象。这使CNN能够在大规模数据集(诸如,ImageNet)上显著地胜出传统计算机视觉途径,这是由于后者通常依赖于启发式特征。

技术实现思路

[0003]第一说明性实施例公开了一种用于利用卷积神经网络来处理图像的计算机实现方法。所述方法包括:接收图像;将所述图像划分成补片,每个补片具有大小p;经由第一卷积层基于大小p的特征检测器来提取具有多个通道的特征图,其中所述特征检测器具有等于大小p的步幅;通过交替地应用逐深度卷积层和逐点卷积层来改善所述特征图以获得经改善的特征图,其中所述特征图中的通道的数目和所述特征图的大小遍及改善中的所有操作而保持恒定;以及输出经改善的特征图。
[0004]第二说明性实施例公开了一种用于利用卷积神经网络来处理图像的计算机实现方法。所述计算机实现方法包括:接收大小L x W的图像;将所述图像划分成补片,其中每个补片的组合大小等于L x W;经由第一卷积层基于等于补片大小的大小的特征检测器来提取具有多个通道的特征图,其中所述特征检测器具有等于补片大小的步幅;通过交替地应用逐深度卷积层和逐点卷积层来改善所述特征图以获得经改善的特征图,其中所述特征图中的通道的数目和所述特征图的大小遍及改善中的所有操作而保持恒定;以及输出经改善的特征图。
[0005]第三说明性实施例公开了:一种卷积神经网络系统包括传感器和控制器,其中所述控制器被配置成:从所述传感器接收图像;将所述图像划分成补片,每个补片具有大小p;经由第一卷积层基于大小p的特征检测器来提取具有多个通道的特征图,其中所述特征检测器具有等于大小p的步幅;通过交替地应用逐深度卷积层和逐点卷积层来改善所述特征图以获得经改善的特征图,其中所述特征图中的通道的数目和所述特征图的大小遍及改善中的所有操作而保持恒定;以及输出经改善的特征图。
附图说明
[0006]图1是用于训练神经网络的系统的框图。
[0007]图2是各向同性卷积神经网络的流程图,其中特征图中的通道的数目和特征图的大小遍及所有操作而保持恒定。
[0008]图3是利用机器学习模型的数据注释系统的框图。
[0009]图4是针对具有补片大小14的ConvMixer

1024/20的补片嵌入权重的图形表示。
[0010]图5是电子计算系统的框图。
[0011]图6是图像、补片大小和通道深度的图形表示。
[0012]图7是针对图6的图像的补片嵌入的权重向量的图形表示。
[0013]图8是针对每个补片的通道深度的2维布局的图形表示。
[0014]图9是具有通道深度的每个特征图的3维布局的图形表示。
[0015]图10是来自ConvMixer

1536/20的逐渐更深层的64个逐深度卷积内核的具体子集的图形表示。
[0016]图11是被配置成控制交通工具的控制系统的示意图。
[0017]图12是被配置成控制制造机器的控制系统的示意图。
[0018]图13是被配置成控制电动工具的控制系统的示意图。
[0019]图14是被配置成控制自动化个人助理的控制系统的示意图。
[0020]图15是被配置成控制监视系统的控制系统的示意图。
[0021]图16是被配置成控制医学成像系统的控制系统的示意图。
具体实施方式
[0022]如所要求的那样,本文公开了本专利技术的详细实施例;然而,应当理解,所公开的实施例仅仅例证了可以以各种且可替换的形式体现的本专利技术。附图不必按比例绘制;一些附图可以被夸大或最小化以示出特定部件的细节。因此,本文公开的具体结构和功能细节不应被解释为限制,而是仅被解释为用于教导本领域技术人员以各种方式采用本专利技术的代表性基础。
[0023]本文可以使用术语“基本上”以描述所公开或要求保护的实施例。术语“基本上”可以修改在本公开中公开或要求保护的值或相对特性。在这种实例中,“基本上”可以表示其所修改的值或相对特性处于值或相对特性的
±
0%、0.1%、0.5%、1%、2%、3%、4%、5%或10%内。
[0024]术语传感器指代检测或测量物理性质且对它进行记录、指示或以其他方式响应的设备。术语传感器包括光学、光、成像或光子传感器(例如,电荷耦合器件(CCD)、CMOS有源像素传感器(APS)、红外传感器(IR)、CMOS传感器)、声学、声音或振动传感器(例如,麦克风、地震检波器、水听器)、汽车传感器(例如,轮速、停车、雷达、氧气、盲点、转矩)、化学传感器(例如,离子敏感场效应晶体管(ISFET)、氧气、二氧化碳、化学电阻器、全息传感器)、电流、电势、磁或射频传感器(例如,霍尔效应、磁力计、磁阻、法拉第杯、检流计)、环境、天气、水分或湿度传感器(例如,天气雷达、曝光表)、流量或流体速度传感器(例如,质量空气流量传感器、风速计)、电离辐射或亚原子粒子传感器(例如,电离室、盖革计数器、中子检测器)、导航传感器(例如,全球定位系统(GPS)传感器、磁流体动力学(MHD)传感器)、位置、角度、位移、距离、速度或加速度传感器(例如,LIDAR、加速度计、超宽带雷达、压电传感器)、力、密度或液位传感器(例如,应变计、核密度计)、热、热量或温度传感器(例如,红外温度计、高温计、热电偶、热敏电阻、微波辐射计)、或者其目的是检测或测量物理性质且对它进行记录、指示或以其他方式响应的其他设备、模块、机器或子系统。
[0025]图1示出了用于训练神经网络的系统100。系统100可以包括用于访问针对神经网
络的训练数据192的输入接口。例如,如图1中所图示,输入接口可以由可访问来自数据储存器190的训练数据192的数据储存器接口180构成。例如,数据储存器接口180可以是存储器接口或持久储存器接口,例如硬盘或SSD接口,但也可以是个域网、局域网或广域网接口,诸如蓝牙、Zigbee或Wi

Fi接口或者以太网或光纤接口。数据储存器190可以是系统100的内部数据储存器,诸如硬盘或SSD,但也可以是外部数据储存器,例如网络可访问数据储存器。
[0026]在一些实施例中,数据储存器190可以进一步包括可由系统100从数据储存器190访问的神经网络的未经训练版本的数据表示194。然而,应当领会,未经训练的神经网络的训练数据192和数据表示194也均可以是从不同数据储存器(例如,经由数据储存器接口180的不同子系统)访问的。每个子系统可以是如上面针对数据储存器接口180而描述的类型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于利用卷积神经网络来处理图像的计算机实现方法,所述计算机实现方法包括:接收图像;将所述图像划分成补片,每个补片具有大小p;经由第一卷积层基于大小p的特征检测器来提取具有多个通道的特征图,其中所述特征检测器具有等于大小p的步幅;通过交替地应用逐深度卷积层和逐点卷积层来改善所述特征图以获得经改善的特征图,其中所述特征图中的通道的数目和所述特征图的大小遍及改善中的所有操作而保持恒定;以及输出经改善的特征图。2.如权利要求1所述的方法,其中所述方法包括:从传感器接收所述图像。3.如权利要求2所述的方法,其中所述传感器是视频、RADAR、LIDAR或超声之一,且与控制器通信,所述控制器被配置成基于经改善的特征图来控制自主交通工具。4.如权利要求2所述的方法,其中所述传感器是视频、声音、IR或LIDAR之一,且与控制器通信,所述控制器被配置成基于经改善的特征图来控制访问门。5.如权利要求2所述的方法,其中所述传感器是视频、声音、超声、IR或LIDAR之一,且与控制器通信,所述控制器被配置成基于经改善的特征图来控制机械系统。6.如权利要求1所述的方法,其中所述第一卷积层包括作为高斯误差线性单元(GELU)的激活函数。7.如权利要求1所述的方法,进一步包括:在针对每个通道的空间位置上对所述特征图求平均以获得针对所有通道的均值;对针对所有通道的均值进行变换,以获得输入图像对应于具体类的概率;以及输出所述图像属于所述具体类的概率。8.一种用于利用卷积神经网络来处理图像的计算机实现方法,所述计算机实现方法包括:接收大小L x W的图像;将所述图像划分成补片,其中每个补片的组合大小等于L x W;经由第一卷积层基于等于补片大小的大小的特征检测器来提取具有多个通道的特征图,其中所述特征检测器具有等于补片大小的步幅;通过交替地应用逐深度卷积层和逐点卷积层来改善所述特征图以获得经改善的特征图,其中所述特征图中的通道的数目和所述特征图的大小遍及改善中的所有操作而保持恒定;以及输出经改善的特征图。9.如权利要求8所述的方法,其中每个补片大小是p x p。10.如权利要求8所述的方法,其中所述方法包括:从传感器接收所述图像。11.如权利要...

【专利技术属性】
技术研发人员:A
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1