【技术实现步骤摘要】
一种特定领域语音识别方法、装置、电子设备及存储介质
[0001]本专利技术涉及人工智能技术,尤其涉及一种特定领域语音识别方法、装置、电子设备及存储介质。
技术介绍
[0002]语音识别基于语言模型实现,目前的语音识别方案大多为基于通用语言模型的识别方案。
[0003]但是,基于通用语言模型的识别方案能够对通用词汇进行准确识别,但对于特定领域的待识别语音(如:专业的医学领域会议录音)进行识别时,待识别语音中一些特定领域的专业词汇很容易被误识别为发音相近的通用词汇,即现有的基于通用语言模型的识别方案对特定领域专业词汇的识别准确率较低,从而导致语音识别的准确率低。
技术实现思路
[0004]本专利技术提供一种特定领域语音识别方法、装置、电子设备及存储介质,其主要目的在于提高了语音识别的准确率。
[0005]为实现上述目的,本专利技术提供的一种特定领域语音识别方法,包括:获取通用语言模型及包括多个领域语言模型的语言模型集,其中,所述语言模型集还包括与所述领域语言模型一一对应的第一领域信息;获取待识别语 ...
【技术保护点】
【技术特征摘要】
1.一种特定领域语音识别方法,其特征在于,所述方法包括:获取通用语言模型及包括多个领域语言模型的语言模型集,其中,所述语言模型集还包括与所述领域语言模型一一对应的第一领域信息;获取待识别语音及对应的第二领域信息,从所述语言模型集中选取与所述第二领域信息相似的第一领域信息,并获取对应的领域语言模型作为目标领域语言模型;将所述通用语言模型与所述目标领域语言模型进行模型组合,得到目标识别模型;利用所述目标识别模型对所述待识别语音进行语音识别,得到识别结果。2.如权利要求1所述的特定领域语音识别方法,其特征在于,所述的从所述语言模型集中选取与所述第二领域信息相似的第一领域信息,并获取对应的领域语言模型作为目标领域语言模型,包括:分别将所述第一领域信息进行向量化,得到对应的第一领域向量,并将所述第二领域信息进行向量化,得到第二领域向量;分别计算所述第二领域向量与各个所述第一领域向量的相似度;选择最大的相似度所对应的第一领域信息,获取该第一领域信息对应的领域语言模型作为所述目标领域语言模型。3.如权利要求2所述的特定领域语音识别方法,其特征在于,所述将所述第二领域信息进行向量化,得到第二领域向量,包括:将所述第二领域信息中的每个字符转化为向量,得到对应的字符向量;将所述字符向量按照对应的字符在所述第二领域信息中的先后顺序进行向量拼接,得到所述第二领域向量。4.如权利要求1所述的特定领域语音识别方法,其特征在于,所述将所述通用语言模型与所述目标领域语言模型进行模型组合,得到目标识别模型,包括:获取所述目标领域语言模型出现但所述通用语言模型中未出现的n
‑
gram条目,并对获取的n
‑
gram条目进行概率插值;将概率插值后的n
‑
gram条目转换为加权有限状态机,得到领域解码网络;将所述通用语言模型转换为加权有限状态机,得到通用解码网络;将所述领域解码网络与所述通用解码网络进行拼接,得到所述目标识别模型。5.如权利要求4所述的特定领域语音识别方法,其特征在于,所述将所述领域解码网络与所述通用解码网络进行拼接,得到所述目标...
【专利技术属性】
技术研发人员:蒋志燕,黄石磊,陈诚,
申请(专利权)人:深圳市北科瑞声科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。