解码网络构建方法、语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：22914803 阅读：50 留言：0更新日期：2019-12-24 22:00

本申请提供了一种解码网络构建方法、语音识别方法、装置、设备及存储介质，其中，解码网络构建方法包括：获取通用语言模型、领域语言模型、以及根据通用语言模型生成的通用解码网络，根据领域语言模型和通用语言模型生成领域解码网络，将领域解码网络融入通用解码网络，获得目标解码网络；语音识别方法包括：利用解码网络构建方法构建的目标解码网络对待识别语音数据进行解码，获得待识别语音数据的解码路径，根据待识别语音数据的解码路径确定待识别语音数据的语音识别结果。本申请能够提高特定领域专业词汇的语音识别准确率。

Decoding network construction method, speech recognition method, device, equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
解码网络构建方法、语音识别方法、装置、设备及存储介质
本申请涉及语音识别
，尤其涉及一种解码网络构建方法、语音识别方法、装置、设备及存储介质。
技术介绍
语音识别基于语言模型实现，目前的语音识别方案大多为基于通用语言模型的识别方案。基于通用语言模型的识别方案为，首先将通用语言模型转换为通用解码网络，然后利用通用解码网络对待识别语音进行解码。基于通用语言模型的识别方案能够对通用词汇进行准确识别，但对于一些特定领域的专业词汇而言，其很容易将专业词汇识别为发音相近的通用词汇，即现有的基于通用语言模型的识别方案对特定领域专业词汇的识别准确率较低。
技术实现思路
有鉴于此，本申请提供了一种解码网络构建方法、语音识别方法、装置、设备及存储介质，用以提高特定领域专业词汇的识别准确率，其技术方案如下：一种解码网络构建方法，包括：获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络；根据所述领域语言模型和所述通用语言模型，生成领域解码网络；将所述领域解码网络融入所述通用解码网络，获得目标解码网络。可选的，所述根据所述通用语言模型和所述领域语言模型，生成领域解码网络，包括：对所述通用语言模型和所述领域语言模型进行插值，其中，插值部分为所述领域语言模型和所述通用语言模型中、只在所述领域语言模型中出现的部分进行插值；根据插值部分生成所述领域解码网络。可选的，所述将所述领域解码网络融入所述通用解码网络，获得目标解码网络，包括

【技术保护点】
1.一种解码网络构建方法，其特征在于，包括：/n获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络；/n根据所述领域语言模型和所述通用语言模型，生成领域解码网络；/n将所述领域解码网络融入所述通用解码网络，获得目标解码网络。/n

【技术特征摘要】
1.一种解码网络构建方法，其特征在于，包括：
获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络；
根据所述领域语言模型和所述通用语言模型，生成领域解码网络；
将所述领域解码网络融入所述通用解码网络，获得目标解码网络。

2.根据权利要求1所述的解码网络构建方法，其特征在于，所述根据所述通用语言模型和所述领域语言模型，生成领域解码网络，包括：
对所述通用语言模型和所述领域语言模型进行插值，其中，插值部分为所述领域语言模型和所述通用语言模型中、在所述领域语言模型中出现的部分；
根据插值部分生成所述领域解码网络。

3.根据权利要求1所述的解码网络构建方法，其特征在于，所述将所述领域解码网络融入所述通用解码网络，获得目标解码网络，包括：
将所述领域解码网络与所述通用解码网络进行串联，获得所述目标解码网络。

4.根据权利要求3所述的解码网络的构建方法，其特征在于，所述将所述领域解码网络与所述通用解码网络进行串联，包括：
分别针对所述通用解码网络和所述领域解码网络添加虚拟节点，所述虚拟节点包括起始节点和结束节点；
利用所述起始节点和所述结束节点，将所述通用解码网络与所述领域解码网络进行串联。

5.根据权利要求4所述的解码网络的构建方法，其特征在于，所述利用所述起始节点和所述结束节点，将所述通用解码网络与所述领域解码网络进行串联，包括：
将针对所述通用解码网络创建的结束节点与针对所述领域解码网络创建的起始节点按结束节点指向起始节点进行有向连接；
将针对所述领域解码网络创建的结束节点与针对所述通用解码网络创建的起始节点按结束节点指向起始节点进行有向连接。

6.一种语音识别方法，其特征在于，包括：
利用如权利要求1～5中任意一项所述的解码网络构建方法构建的目标解码网络对待识别语音数据进行解码，获得所述待识别语音数据的解码路径；
根据所述待识别语音数据的解码路径，确定所述待识别语音数据的语音识别结果。

7.根据权利要求6所述的语音识别方法，其特征在于，所述根据所述待识别语音数据的解码路径，确定所述待识别语音数据的语音识别结果，包括：
通过预先获得的高阶语言模型和所述待识别语音数据的解码路径，确定所述待识别语音数据的语音识别结果；其中，所述高阶语言模型采用领域语言模型对通用语言模型进行插值得到。

8.根据权利要求6所述的语音识别方法，其特征在于，利用所述目标解码网络对所述待识别语音数据进行解码，获得所述待识别语音数据的解码路径包括：
将所述待识别语音数据的各个语音帧依次输入所述目标解码网络进行解码，获得所述待识别语音数据的解码路径；
其中，所述待识别语音数据的各个语...

【专利技术属性】
技术研发人员：高建清，王智国，胡国平，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人