基于光学神经网络结构的图像识别方法、装置及电子设备制造方法及图纸

技术编号:21344287 阅读:39 留言:0更新日期:2019-06-13 22:46
本申请公开了一种基于光学神经网络结构的图像识别方法、图像识别装置及电子设备,其中,光学神经网络结构由X层神经网络所构成;该图像识别方法包括:获取待识别图像;将待识别图像输入至光学神经网络结构;基于光学神经网络结构的输出结果确定待识别图像的识别结果;其中,光学神经网络结构用于:针对第i层神经网络,获取第i层神经网络的输入向量,i为大于0且小于X+1的正整数;分别基于Yi个内积计算单元对输入向量进行线性变换,得到Yi个线性变换的结果;将Yi个线性变换的结果通过非线性晶体进行激活,得到Yi个激活结果;将Yi个激活结果作为本层神经网络的输出向量。本申请方案应用了新型的光学神经网络结构,进一步提升了图像识别的速度。

Image Recognition Method, Device and Electronic Equipment Based on Optical Neural Network Structure

This application discloses an image recognition method, an image recognition device and an electronic device based on an optical neural network structure, in which the optical neural network structure consists of an X-layer neural network; the image recognition method includes: acquiring the image to be recognized; inputting the image to the optical neural network structure; and determining the image to be recognized based on the output result of the optical neural network structure. The structure of optical neural network is used to obtain the input vectors of layer I neural network, I is a positive integer greater than 0 and less than X+1 for layer I neural network. The input vectors are linearly transformed based on Y inner product calculation units, and the results of Y linear transformations are obtained. The results of Yi linear transformations are activated by non-linear crystals. The results of Yi activation are taken as the output vectors of the layered neural network. The application scheme uses a new optical neural network structure, which further improves the speed of image recognition.

【技术实现步骤摘要】
基于光学神经网络结构的图像识别方法、装置及电子设备
本专利技术属于数据处理
,尤其涉及一种基于光学神经网络结构的图像识别方法、装置及电子设备。
技术介绍
当前,机器学习已经成为一种十分重要的工具。其中,基于深度神经网络的深度学习受到了广泛的关注,并被应用于图像识别、语音识别、自然语言翻译等重要领域。其中,基于传统中央处理器(CentralProcessingUnit,CPU)的深度学习并非最优的方案;研发人员发展出了多样的硬件结构,以适应深度学习算法的要求,例如图形处理器(GraphicsProcessingUnit,GPU)和张量处理器(TensorProcessingUnit,TPU)。虽然它们都能加速深度学习算法,但这些硬件结构往往基于电子元件,其计算速度无法超越线性多项式增长的理论极限,这很可能影响到图像识别等操作时的速度及效率。
技术实现思路
有鉴于此,本专利技术实施例提供了一种基于光学神经网络结构的图像识别方法、图像识别装置、电子设备及计算机可读存储介质,用以提升图像识别的速度。本专利技术实施例的第一方面提供了一种基于光学神经网络结构的图像识别方法,上述光学神经网络结构由X层神经网络所构成,上述X为正整数;上述图像识别方法包括:获取待识别图像;将上述待识别图像输入至上述光学神经网络结构;基于上述光学神经网络结构的输出结果确定上述待识别图像的识别结果;其中,上述光学神经网络结构用于:针对第i层神经网络,获取第i层神经网络的输入向量,上述i为大于0且小于X+1的正整数,其中,当i等于1时,上述第i层神经网络的输入向量基于上述待识别图像的各个像素点而生成;当i大于1时,上述第i层神经网络的输入向量为第i-1层神经网络的输出向量;分别基于Yi个内积计算单元对上述输入向量进行线性变换,得到Yi个线性变换的结果,其中,上述Yi为正整数;将上述Yi个线性变换的结果通过非线性晶体进行激活,得到Yi个激活结果;将上述Yi个激活结果作为本层神经网络的输出向量,其中,当i等于X时,上述第i层神经网络的输出向量为上述光学神经网络结构的输出结果,上述第i层神经网络的输出向量中的各个元素用于指示上述待识别图像属于各个不同类别的可能性。本专利技术实施例的第二方面提供了一种基于光学神经网络结构的图像识别装置,上述光学神经网络结构由X层神经网络所构成,上述X为正整数;上述图像识别装置包括:图像获取模块,用于获取待识别图像;图像输入模块,用于将上述待识别图像输入至上述光学神经网络结构;结果识别模块,用于基于上述光学神经网络结构的输出结果确定上述待识别图像的识别结果;其中,上述光学神经网络结构的各层神经网络均包括:向量输入单元,用于针对第i层神经网络,获取第i层神经网络的输入向量,上述i为大于0且小于X+1的正整数,其中,当i等于1时,上述第i层神经网络的输入向量基于上述待识别图像的各个像素点而生成;当i大于1时,上述第i层神经网络的输入向量为第i-1层神经网络的输出向量;线性变换单元,用于分别基于Yi个内积计算单元对上述输入向量进行线性变换,得到Yi个线性变换的结果,其中,上述Yi为正整数;激活单元,用于将上述Yi个线性变换的结果通过非线性晶体进行激活,得到Yi个激活结果;结果输出单元,用于将上述Yi个激活结果作为本层神经网络的输出向量,其中,当i等于X时,上述第i层神经网络的输出向量为上述光学神经网络结构的输出结果,上述第i层神经网络的输出向量中的各个元素用于指示上述待识别图像属于各个不同类别的可能性。本申请的第三方面提供了一种电子设备,上述电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上第一方面的方法的步骤。本申请的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上第一方面的方法的步骤。由上可见,通过本申请方案,首先获取待识别图像,然后将上述待识别图像输入至上述光学神经网络结构,接着基于上述光学神经网络结构的输出结果确定上述待识别图像的识别结果;其中,上述光学神经网络结构由X层神经网络所构成,上述X为正整数,上述光学神经网络结构用于:针对第i层神经网络,获取第i层神经网络的输入向量,上述i为大于0且小于X+1的正整数,其中,当i等于1时,上述第i层神经网络的输入向量基于上述待识别图像的各个像素点而生成;当i大于1时,上述第i层神经网络的输入向量为第i-1层神经网络的输出向量;分别基于Yi个内积计算单元对上述输入向量进行线性变换,得到Yi个线性变换的结果,其中,上述Yi为正整数;将上述Yi个线性变换的结果通过非线性晶体进行激活,得到Yi个激活结果;将上述Yi个激活结果作为本层神经网络的输出向量,其中,当i等于X时,上述第i层神经网络的输出向量为上述光学神经网络结构的输出结果,上述第i层神经网络的输出向量中的各个元素用于指示上述待识别图像属于各个不同类别的可能性。通过本申请方案,提出了一种新型的光学神经网络结构,通过上述新型的光学神经网络结构对图像进行识别,由于其中的所有计算皆由光学元件完成,因而能耗极低,并且处理速度快,能够快速获得图像识别的结果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的基于光学神经网络结构的图像识别方法的实现流程示意图;图2是本专利技术实施例提供的光学神经网络结构的工作流程示意图;图3是本专利技术实施例提供的光学神经网络结构中,内积计算单元的示意图;图4是本专利技术实施例提供的光学神经网络结构的结构示意图;图5是本专利技术实施例提供的基于光学神经网络结构的图像识别装置的结构框图;图6是本专利技术实施例提供的光学神经网络结构中单层神经网络的结构框图;图7是本专利技术实施例提供的电子设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术上述的技术方案,下面通过具体实施例来进行说明。实施例一下面对本申请实施例提供的基于光学神经网络结构的图像识别方法进行描述,请参阅图1,本申请实施例中的基于光学神经网络结构的图像识别方法包括:在步骤101中,获取待识别图像;在本申请实施例中,可以先由电子设备获取待识别图像。可选地,若上述电子设备为智能手机、平板电脑等具备拍摄功能的电子设备,则可以对上述电子设备的相机应用程序进行监听,在监听到电子设备通过相机应用程序启动摄像头进行了拍摄操作后,获取拍摄的图片作为待识别图像,其中,上述摄像头可以为前置摄像头,也可以为后置摄像头,此处不作限定;或者,若上述电子设备为具备社交功能的电子设备,则可以对上述电子设备的社交类应用程序进行监听,在监听到上述社交类应用程序中接收到了本文档来自技高网...

【技术保护点】
1.一种基于光学神经网络结构的图像识别方法,其特征在于,所述光学神经网络结构由X层神经网络所构成,所述X为正整数;所述图像识别方法包括:获取待识别图像;将所述待识别图像输入至所述光学神经网络结构;基于所述光学神经网络结构的输出结果确定所述待识别图像的识别结果;其中,所述光学神经网络结构用于:针对第i层神经网络,获取第i层神经网络的输入向量,所述i为大于0且小于X+1的正整数,其中,当i等于1时,所述第i层神经网络的输入向量基于所述待识别图像的各个像素点而生成;当i大于1时,所述第i层神经网络的输入向量为第i‑1层神经网络的输出向量;分别基于Yi个内积计算单元对所述输入向量进行线性变换,得到Yi个线性变换的结果,其中,所述Yi为正整数;将所述Yi个线性变换的结果通过非线性晶体进行激活,得到Yi个激活结果;将所述Yi个激活结果作为本层神经网络的输出向量,其中,当i等于X时,所述第i层神经网络的输出向量为所述光学神经网络结构的输出结果,所述第i层神经网络的输出向量中的各个元素用于指示所述待识别图像属于各个不同类别的可能性。

【技术特征摘要】
1.一种基于光学神经网络结构的图像识别方法,其特征在于,所述光学神经网络结构由X层神经网络所构成,所述X为正整数;所述图像识别方法包括:获取待识别图像;将所述待识别图像输入至所述光学神经网络结构;基于所述光学神经网络结构的输出结果确定所述待识别图像的识别结果;其中,所述光学神经网络结构用于:针对第i层神经网络,获取第i层神经网络的输入向量,所述i为大于0且小于X+1的正整数,其中,当i等于1时,所述第i层神经网络的输入向量基于所述待识别图像的各个像素点而生成;当i大于1时,所述第i层神经网络的输入向量为第i-1层神经网络的输出向量;分别基于Yi个内积计算单元对所述输入向量进行线性变换,得到Yi个线性变换的结果,其中,所述Yi为正整数;将所述Yi个线性变换的结果通过非线性晶体进行激活,得到Yi个激活结果;将所述Yi个激活结果作为本层神经网络的输出向量,其中,当i等于X时,所述第i层神经网络的输出向量为所述光学神经网络结构的输出结果,所述第i层神经网络的输出向量中的各个元素用于指示所述待识别图像属于各个不同类别的可能性。2.如权利要求1所述的图像识别方法,其特征在于,当i等于1时,所述获取第i层神经网络的输入向量,包括:获取单一相干光源;将单一相干光源等分为N路光信号;将所述N路光信号分别通过光学衰减器进行编码,并基于编码后的N路光信号的振幅构建第1层神经网络的输入向量,其中,所述编码后的N路光信号分别与所述待识别图像的各个像素点相关联,所述N基于所述待识别图像的像素点的个数而设定。3.如权利要求1所述的图像识别方法,其特征在于,所述分别基于Yi个内积计算单元对所述输入向量进行线性变换,得到Yi个线性变换的结果,包括:分别对所述输入向量所包含的各个元素进行编码,得到M路输入光信号,其中,M为所述输入向量所包含的元素的个数;针对任一内积计算单元:所述内积计算单元中包含有M个光学组件,将所述M路输入光信号分别输入至相应的光学组件上,得到M路输出光信号;将所述M路输出光信号进行合束后得到内积计算结果,作为基于所述内积计算单元对所述输入向量进行线性变换所得到的线性变换的结果。4.如权利要求3所述的图像识别方法,其特征在于,所述图像识别方法还包括:获取预设的转换矩阵,其中,所述预设的转换矩阵与第i层神经网络相关,所述预设的转换矩阵的维度为M*Yi;将所述转换矩阵拆分为Yi个M*1的矩阵,记为Yi个计算矩阵;将所述Yi个计算矩阵分别编码至相应的内积计算单元中;相应地,所述将所述M路输入光信号分别输入至相应的光学组件上,得到M路输出光信号,包括:将所述M路输入光信号分别输入至相应的光学组件上,以使得所述输入向量分别与所述内积计算单元所编码的计算矩阵进行内积运算,得到M路输出光信号。5.如权利要求4所述的图像识别方法,其特征在于,所述光学组件包括光学衰减器及偏振片;所述将所述Yi个计算矩阵分别编码至相应的内积计算单元中,包括:针对任一计算矩...

【专利技术属性】
技术研发人员:翁文康张笑鸣
申请(专利权)人:南方科技大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1