识别方法、装置和电子设备制造方法及图纸

技术编号:34553555 阅读:15 留言:0更新日期:2022-08-17 12:39
本公开实施例公开了识别方法、装置和电子设备。该方法的一具体实施方式包括:将语音数据输入至第一语音识别网络,得到第一语音识别网络生成的第一特征信息,其中,所述第一语音识别网络通过对第二语音识别网络进行量化得到;根据第一特征信息和强化特征信息,生成第一语音识别网络的网络损失值,其中,所述强化特征信息基于第二语音识别网络处理所述语音数据得到;根据所述网络损失值调整所述第一语音识别网络的参数,其中,符合预设训练完成条件的第一语音识别网络用于识别语音。由此,提供了一种新的识别方式。供了一种新的识别方式。供了一种新的识别方式。

【技术实现步骤摘要】
识别方法、装置和电子设备


[0001]本公开涉及计算机
,尤其涉及一种识别方法、装置和电子设备。

技术介绍

[0002]随着计算机的发展,计算机可以辅助人类实现越来越多的功能。其中,语音识别技术也在日益发展和成熟。
[0003]语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术。

技术实现思路

[0004]提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面,本公开实施例提供了一种识别方法,该方法包括:将语音数据输入至第一语音识别网络,得到第一语音识别网络生成的第一特征信息,其中,所述第一语音识别网络通过对第二语音识别网络进行量化得到;根据第一特征信息和强化特征信息,生成第一语音识别网络的网络损失值,其中,所述强化特征信息基于第二语音识别网络处理所述语音数据得到;根据所述网络损失值调整所述第一语音识别网络的参数,其中,符合预设训练完成条件的第一语音识别网络用于识别语音。
[0006]第二方面,本公开实施例提供了一种识别装置,包括:第一生成单元,用于将语音数据输入至第一语音识别网络,得到第一语音识别网络生成的第一特征信息,其中,所述第一语音识别网络通过对第二语音识别网络进行量化得到;第二生成单元,用于根据第一特征信息和强化特征信息,生成第一语音识别网络的网络损失值,其中,所述强化特征信息基于第二语音识别网络处理所述语音数据得到;调整单元,用于根据所述网络损失值调整所述第一语音识别网络的参数,其中,符合预设训练完成条件的第一语音识别网络用于识别语音。
[0007]第三方面,本公开实施例提供了一种电子设备,包括:至少一个处理器;存储装置,用于存储至少一个计算机程序,当所述至少一个计算机程序被所述至少一个处理器执行,使得所述至少一个处理器实现如第一方面所述的识别方法。
[0008]第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的识别方法的步骤。
[0009]本公开实施例提供的识别方法、装置和电子设备,可以提高经量化得到的第一语音识别网络的准确度。具体来说,利用第二语音识别网络处理语音数据,得到强化特征信息;以第一语音识别网络处理同一段语音数据,得到第一特征信息;并且,强化特征信息可以指示第二语音识别网络处理语音数据得到的特征信息,以及将第一特征信息与强化特征
信息进行比对计算,由此得到网络损失值,利用网络损失值更新第一语音识别网络,可以使得第一语音识别网络的处理结果向靠近第二语音识别网络的处理结果的方向改进。由此,可以实现第一语音识别网络相对于第二语音识别,计算量和存储量降低的同时,准确率可以并不明显降低,即实现训练后的第一语音识别网络的准确度相对于训练前提高。
附图说明
[0010]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
[0011]图1是根据本公开的识别方法的一个实施例的流程图;
[0012]图2是根据本公开的一个示例性实现方式的流程图;
[0013]图3是根据本公开的语音识别网络之间的关系示意图;
[0014]图4A、图4B和图4C是根据本公开示例性实现方式的示意图;
[0015]图5是根据本公开的识别装置的一个实施例的结构示意图;
[0016]图6是本公开的一个实施例的识别方法可以应用于其中的示例性系统架构;
[0017]图7是根据本公开实施例提供的电子设备的基本结构的示意图。
具体实施方式
[0018]可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
[0019]例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
[0020]作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
[0021]可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其它满足相关法律法规的方式也可应用于本公开的实现方式中。
[0022]可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
[0023]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0024]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公
开的范围在此方面不受限制。
[0025]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0026]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0027]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0028]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0029]请参考图1,其示出了根据本公开的识别方法的一个实施例的流程。如图1所示该识别方法,包括以下步骤:
[0030]步骤101,将语音数据输入至第一语音识别网络,得到第一语音识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别方法,其特征在于,包括:将语音数据输入至第一语音识别网络,得到第一语音识别网络生成的第一特征信息,其中,所述第一语音识别网络通过对第二语音识别网络进行量化得到;根据第一特征信息和强化特征信息,生成第一语音识别网络的网络损失值,其中,所述强化特征信息基于第二语音识别网络处理所述语音数据得到;根据所述网络损失值调整所述第一语音识别网络的参数,其中,符合预设训练完成条件的第一语音识别网络用于识别语音。2.根据权利要求1所述的方法,其特征在于,所述强化特征信息通过第一步骤生成,其中,所述第一步骤包括:将所述语音数据输入至第二语音识别网络,得到第二语音识别网络生成的第二特征信息;基于第二特征信息的高频分量,生成第二特征信息的强化特征信息。3.根据权利要求2所述的方法,其特征在于,所述基于第二特征信息的高频分量,生成第二特征信息的强化特征信息,包括:对所述第二特征信息进行变换,得到所述第二特征信息对应的变换后信息,其中,所述变换用于分离第二特征信息中初始高频分量和初始低频分量;从所述变换后信息中确定预定义的初始高频分量;对初始高频分量进行与所述变换对应的反变换,得到所述高频分量。4.根据权利要求3所述的方法,其特征在于,所述对所述第二特征信息进行变换,得到所述第二特征信息对应的变换后信息,包括:对所述第二特征信息进行小波变换,得到所述变换后信息。5.根据权利要求2所述的方法,其特征在于,所述基于第二特征信息的高频分量,生成第二特征信息的强化特征信息,包括:根据所述高频分量和所述第二特征信息,生成所述强化特征信息。6.根据权利要求5所述的方法,其特征在于,所述第二语音识别网络包括预设数目个第二特征提取层;以及所述根据所述高频分量和所述第二特征信息,生成所述强化特征信息,包括:对各个第二特征提取层输出的第二特征信息进行归一化,得到与第二特征提取层对应的归一化第二特征信息;对各个第二特征信息的高频分量进行归一化,得到与第二特征提取层对应的归一化高频分量;根据对应于同一特征提取层的归一化高频分量与归一化第二特征信息,确定与第二特征提取层对应的强化特征信息。7.根据权利要求1所述的方法,其特征在于,所述第一语音识别网络包括预设数目个第一特征提取层,所述第二语音识别网络包括预设数目个第二特征提取层,第一特征提取层和第二特征提取层一一对应;第一特征提取层...

【专利技术属性】
技术研发人员:李晓阳秦浩桐刘祥龙张晰马泽君丁一芙马旭栋
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1