当前位置: 首页 > 专利查询>清华大学专利>正文

模式识别方法及装置制造方法及图纸

技术编号:11756414 阅读:191 留言:0更新日期:2015-07-22 04:26
本发明专利技术提供了一种模式识别方法及装置,其中模式识别方法包括:接收待识别数据;利用基于具有递归卷积层的卷积神经网络训练得到的模式识别模型对所述待识别数据进行模式识别;其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络。本申请中使用的具有递归卷积层的卷积神经网络其能够充分融入上下文信息,并在保持参数数量不变的情况下增加网络的深度,因此本申请有效提高了模式识别的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机领域,尤其涉及一种模式识别方法及装置
技术介绍
模式识别是用于对输入的模式进行识别,输出该模式的类别。例如包括但不限于: 人脸识别,手势识别,交通标志识别,语音识别等。 现有技术的模式识别方法是基于神经网络进行训练,得到模式识别模型,利用训 练得到的模式识别模型来识别模式的类别。其中,利用卷积神经网络(CNN,C〇nV〇luti〇nal NeuralNetwork)训练模式识别模型是比较常见的一种训练方法。但是,专利技术人发现利用已 有的卷积神经网络进行模式识别模型的训练至少存在如下问题: 首先,由于卷积神经网络是纯前馈结构,在识别时无法充分融入上下文信息,而上 下文信息则对识别效果有重要的影响。 另外,网络深度大小对识别性能影响较大,识别准确率会随深度增加而增加,而卷 积神经网络的卷积层深度固定为1,要想增加网络深度,只能增加卷积层的个数,但这样做 会增加模型的参数数量,可能导致过拟合,因此,受网络深度影响基于目前的卷积神经网络 训练得到的模式识别模型的识别准确率难以保证。 因此,利用基于已有的卷积神经网络训练得到的模式识别模型进行模式识别的准 确率较低。
技术实现思路
本专利技术解决的技术问题之一是提供一种模式识别方法及装置,有效提高模式识别 准确率。 根据本专利技术一方面的一个实施例,提供了一种模式识别方法,包括: 接收待识别数据; 利用基于具有递归卷积层的卷积神经网络训练得到的模式识别模型对所述待识 别数据进行模式识别; 其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合层内递归输 入,得到总输入,并对所述总输入进行非线性激发的神经网络。 根据本专利技术另一方面的一个实施例,提供了一种模式识别装置,包括: 接收单元,用于接收待识别数据; 模式识别单元,用于利用基于具有递归卷积层的卷积神经网络训练得到的模式识 别模型对所述待识别数据进行模式识别; 其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合层内递归输 入,得到总输入,并对所述总输入进行非线性激发的神经网络。 本申请实施例的模式识别方法由于使用基于具有递归卷积层的卷积神经网络训 练得到的模式识别模型进行模式识别,所述具有递归卷积层的卷积神经网络为在前馈输入 基础上结合层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络,该具 有递归卷积层的卷积神经网络其能够充分融入上下文信息,并在保持参数数量不变的情况 下增加网络的深度,有效提高了模式识别的准确性。 本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行, 但本专利技术并不仅限于这些实施例。而是,本专利技术的范围是广泛的,且意在仅通过后附的权利 要求限定本专利技术的范围。【附图说明】 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它 特征、目的和优点将会变得更明显: 图1是根据本专利技术一个实施例的利用层内递归卷积神经网络训练模型示意图。 图2是根据本专利技术一个实施例的利用图1训练得到的模式识别模型进行模式识别 示意图。 图3是根据本专利技术一个实施例的模式识别方法的流程图。 图4是根据本专利技术一个实施例的模式识别装置结构示意图。 附图中相同或相似的附图标记代表相同或相似的部件。【具体实施方式】 在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成 作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许 多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其 操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理 可以对应于方法、函数、规程、子例程、子程序等等。 所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电 脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成 的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云,其 中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。 其中,所述计算机设备可单独运行来实现本专利技术,也可接入网络并通过与网络中的其他计 算机设备的交互操作来实现本专利技术。其中,所述计算机设备所处的网络包括但不限于互联 网、广域网、城域网、局域网、VPN网络等。 需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可 能出现的计算机设备或网络如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引 用方式包含于此。 后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间 件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施 时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存 储介质)中。(一个或多个)处理器可以实施必要的任务。 这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本专利技术的示 例性实施例的目的。但是本专利技术可以通过许多替换形式来具体实现,并且不应当被解释成 仅仅受限于这里所阐述的实施例。 应当理解的是,虽然在这里可能使用了术语"第一"、"第二"等等来描述各个单元, 但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元 进行区分。举例来当前第1页1 2 本文档来自技高网...

【技术保护点】
一种模式识别方法,其特征在于,包括:接收待识别数据;利用基于具有递归卷积层的卷积神经网络训练得到的模式识别模型对所述待识别数据进行模式识别;其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡晓林梁鸣
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1