解码网络构建方法、语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号:22914803 阅读:50 留言:0更新日期:2019-12-24 22:00
本申请提供了一种解码网络构建方法、语音识别方法、装置、设备及存储介质,其中,解码网络构建方法包括:获取通用语言模型、领域语言模型、以及根据通用语言模型生成的通用解码网络,根据领域语言模型和通用语言模型生成领域解码网络,将领域解码网络融入通用解码网络,获得目标解码网络;语音识别方法包括:利用解码网络构建方法构建的目标解码网络对待识别语音数据进行解码,获得待识别语音数据的解码路径,根据待识别语音数据的解码路径确定待识别语音数据的语音识别结果。本申请能够提高特定领域专业词汇的语音识别准确率。

Decoding network construction method, speech recognition method, device, equipment and storage medium

【技术实现步骤摘要】
解码网络构建方法、语音识别方法、装置、设备及存储介质
本申请涉及语音识别
,尤其涉及一种解码网络构建方法、语音识别方法、装置、设备及存储介质。
技术介绍
语音识别基于语言模型实现,目前的语音识别方案大多为基于通用语言模型的识别方案。基于通用语言模型的识别方案为,首先将通用语言模型转换为通用解码网络,然后利用通用解码网络对待识别语音进行解码。基于通用语言模型的识别方案能够对通用词汇进行准确识别,但对于一些特定领域的专业词汇而言,其很容易将专业词汇识别为发音相近的通用词汇,即现有的基于通用语言模型的识别方案对特定领域专业词汇的识别准确率较低。
技术实现思路
有鉴于此,本申请提供了一种解码网络构建方法、语音识别方法、装置、设备及存储介质,用以提高特定领域专业词汇的识别准确率,其技术方案如下:一种解码网络构建方法,包括:获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络;根据所述领域语言模型和所述通用语言模型,生成领域解码网络;将所述领域解码网络融入所述通用解码网络,获得目标解码网络。可选的,所述根据所述通用语言模型和所述领域语言模型,生成领域解码网络,包括:对所述通用语言模型和所述领域语言模型进行插值,其中,插值部分为所述领域语言模型和所述通用语言模型中、只在所述领域语言模型中出现的部分进行插值;根据插值部分生成所述领域解码网络。可选的,所述将所述领域解码网络融入所述通用解码网络,获得目标解码网络,包括:将所述领域解码网络与所述通用解码网络进行串联,获得目标解码网络。可选的,所述将所述领域解码网络与所述通用解码网络进行串联,包括:分别针对所述通用解码网络和所述领域解码网络添加虚拟节点,所述虚拟节点包括起始节点和结束节点;利用所述起始节点和所述结束节点,将所述通用解码网络与所述领域解码网络进行串联。可选的,所述利用所述起始节点和所述结束节点,将所述通用解码网络与所述领域解码网络进行串联,包括:将针对所述通用解码网络创建的结束节点与针对所述领域解码网络创建的起始节点按结束节点指向起始节点进行有向连接;将针对所述领域解码网络创建的结束节点与针对所述通用解码网络创建的起始节点按结束节点指向起始节点进行有向连接。一种语音识别方法,包括:利用上述一项所述的解码网络构建方法构建的目标解码网络对待识别语音数据进行解码,获得所述待识别语音数据的解码路径;根据所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果。可选的,所述根据所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果,包括:通过预先获得的高阶语言模型和所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果;其中,所述高阶语言模型采用领域语言模型对通用语言模型进行插值得到。可选的,利用所述目标解码网络对所述待识别语音数据进行解码,获得所述待识别语音数据的解码路径,包括:将所述待识别语音数据的各个语音帧依次输入所述目标解码网络进行解码,获得所述待识别语音数据对应的解码路径;其中,所述待识别语音数据的各个语音帧经所述目标解码网络中的两个起始节点分别进入所述目标解码网络中的通用解码网络和领域解码网络进行解码,当所述通用解码网络或所述领域解码网络中的候选解码路径包括结束节点时,从该结束节点跳回与该结束节点连接的至少一个起始节点,以进入所述通用解码网络和/或所述领域解码网络中继续解码,直至语音帧结束。一种解码网络构建装置,包括:语言模型和通用解码网络获取模块、领域解码网络生成模块和解码网络融合模块;所述语言模型和通用解码网络获取模块,用于获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络;所述领域解码网络生成模块,用于根据所述通用语言模型和所述领域语言模型,生成领域解码网络;所述解码网络融合模块,用于将所述领域解码网络融入所述通用解码网络,获得目标解码网络。可选的,所述领域解码网络生成模块包括:插值子模块和领域解码网络生成子模块;所述插值子模块,用于对所述通用语言模型和所述领域语言模型进行插值,其中,插值部分为所述领域语言模型和所述通用语言模型中、在所述领域语言模型中出现的部分;所述领域解码网络生成子模块,用于根据插值部分生成所述领域解码网络。可选的,所述解码网络融合模块,具体用于将所述领域解码网络与所述通用解码网络进行串联,获得所述目标解码网络。一种语音识别装置,包括:解码模块和语音识别结果确定模块;所述解码模块,用于利用上述任意一项所述的解码网络构建装置构建的目标解码网络对待识别语音数据进行解码,获得所述目标解码网络的解码路径;所述语音识别结果确定模块,用于根据所述目标解码网络的解码路径,确定所述待识别语音数据的语音识别结果。一种解码网络构建设备,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现上述任一项所述的解码网络构建方法的各个步骤。一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一项所述的解码网络构建方法的各个步骤。一种语音识别设备,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现上述任一项所述的语音识别方法的各个步骤。一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一项所述的语音识别方法的各个步骤。经由上述方案可知,本申请提供的解码网络构建方法,可根据通用语言模型和领域语言模型生成领域解码网络,进而将领域解码网络融入通用解码网络,从而获得目标解码网络,本申请提供的解码网络构建方法通过在通用解码网络中融入领域解码网络,使得最终获得的目标解码网络除了能够对通用词汇进行准确识别外,还能够对特定领域的专业词汇进行准确识别,相比于现有技术中基于通用语言模型的语音识别方法,显著提高了特定领域专业词汇的语音识别准确率,另外,本申请提供的解码网络构建方法能够较快速地构建出目标解码网络。本申请提供的解码网络构建方法能够高效地构建出对特定领域的专业词汇进行准确识别的目标解码网络,这使得在基于目标解码网络对包含特定领域的专业词汇的语音进行语音识别时,能够获得较为准确的语音识别结果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的解码网络构建方法的流程示意图;图2为本申请实施例提供的解码网络构建方法中,根据通用语言模型和领域语言模型,生成领域解码网络的流程示意图;...

【技术保护点】
1.一种解码网络构建方法,其特征在于,包括:/n获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络;/n根据所述领域语言模型和所述通用语言模型,生成领域解码网络;/n将所述领域解码网络融入所述通用解码网络,获得目标解码网络。/n

【技术特征摘要】
1.一种解码网络构建方法,其特征在于,包括:
获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络;
根据所述领域语言模型和所述通用语言模型,生成领域解码网络;
将所述领域解码网络融入所述通用解码网络,获得目标解码网络。


2.根据权利要求1所述的解码网络构建方法,其特征在于,所述根据所述通用语言模型和所述领域语言模型,生成领域解码网络,包括:
对所述通用语言模型和所述领域语言模型进行插值,其中,插值部分为所述领域语言模型和所述通用语言模型中、在所述领域语言模型中出现的部分;
根据插值部分生成所述领域解码网络。


3.根据权利要求1所述的解码网络构建方法,其特征在于,所述将所述领域解码网络融入所述通用解码网络,获得目标解码网络,包括:
将所述领域解码网络与所述通用解码网络进行串联,获得所述目标解码网络。


4.根据权利要求3所述的解码网络的构建方法,其特征在于,所述将所述领域解码网络与所述通用解码网络进行串联,包括:
分别针对所述通用解码网络和所述领域解码网络添加虚拟节点,所述虚拟节点包括起始节点和结束节点;
利用所述起始节点和所述结束节点,将所述通用解码网络与所述领域解码网络进行串联。


5.根据权利要求4所述的解码网络的构建方法,其特征在于,所述利用所述起始节点和所述结束节点,将所述通用解码网络与所述领域解码网络进行串联,包括:
将针对所述通用解码网络创建的结束节点与针对所述领域解码网络创建的起始节点按结束节点指向起始节点进行有向连接;
将针对所述领域解码网络创建的结束节点与针对所述通用解码网络创建的起始节点按结束节点指向起始节点进行有向连接。


6.一种语音识别方法,其特征在于,包括:
利用如权利要求1~5中任意一项所述的解码网络构建方法构建的目标解码网络对待识别语音数据进行解码,获得所述待识别语音数据的解码路径;
根据所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果。


7.根据权利要求6所述的语音识别方法,其特征在于,所述根据所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果,包括:
通过预先获得的高阶语言模型和所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果;其中,所述高阶语言模型采用领域语言模型对通用语言模型进行插值得到。


8.根据权利要求6所述的语音识别方法,其特征在于,利用所述目标解码网络对所述待识别语音数据进行解码,获得所述待识别语音数据的解码路径包括:
将所述待识别语音数据的各个语音帧依次输入所述目标解码网络进行解码,获得所述待识别语音数据的解码路径;
其中,所述待识别语音数据的各个语...

【专利技术属性】
技术研发人员:高建清王智国胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1