【技术实现步骤摘要】
语音识别方法、装置、电子设备及存储介质
本公开涉及语音识别
,尤其涉及一种语音识别方法、装置、电子设备及存储介质。
技术介绍
随着语音识别技术的发展,语音识别内容越来越丰富,语音识别所属的业务场景也越来越复杂,单一语言模型难以支持复杂应用场景下的语音识别。为了复杂应用场景下的语音识别效果,相关技术中出现了以下方案:将应用场景的相关领域的语料均加入基础语言模型的训练中,训练得到统一的语言模型;或是在同一个语言模型上,根据具体的应用场景,将相关领域的语料进行插值,得到一个新的语言模型;然后再基于得到的语言模型进行HCLG构图,并解码得到语音识别结果。但是,相关技术中的语音识别方法,根据各个领域的语料训练得到的语言模型,会弱化每个领域的识别效果,使得语音识别的结果不够准确。针对相关技术中单一语言模型难以支持复杂应用场景下的语音识别需求的问题,目前尚未提出有效的解决方案。
技术实现思路
本公开提供一种语音识别方法、装置、电子设备及存储介质,以至少解决相关技术中单一语言模型难以支持复杂 ...
【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n获取待识别语音数据的声学特征,并通过声学模型将所述声学特征处理为声学表示,其中,所述声学表示表征所述声学特征属于目标声学符号序列的概率;/n在由多个语言模型对应的子图链接而成的搜索图中,搜索得到所述声学表示对应的多条解码路径,其中,所述多个语言模型以及链接关系由所述待识别语音数据所属的业务场景确定,每个所述语言模型对应的子图由声学符号节点链接而成;/n从所述多条解码路径中确定目标解码路径,获取基于所述目标解码路径对所述声学表示解码得到的目标文本数据,并将所述目标文本数据确定为所述待识别语音数据的识别结果。/n
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
获取待识别语音数据的声学特征,并通过声学模型将所述声学特征处理为声学表示,其中,所述声学表示表征所述声学特征属于目标声学符号序列的概率;
在由多个语言模型对应的子图链接而成的搜索图中,搜索得到所述声学表示对应的多条解码路径,其中,所述多个语言模型以及链接关系由所述待识别语音数据所属的业务场景确定,每个所述语言模型对应的子图由声学符号节点链接而成;
从所述多条解码路径中确定目标解码路径,获取基于所述目标解码路径对所述声学表示解码得到的目标文本数据,并将所述目标文本数据确定为所述待识别语音数据的识别结果。
2.根据权利要求1所述的音识别方法,其特征在于,在由多个语言模型对应的子图链接而成的搜索图中,搜索得到所述声学表示对应的多条解码路径之前,所述方法还包括:
确定在所述业务场景下进行语音识别时,待使用的所述多个语言模型,以及所述多个语言模型的关联关系,其中,所述关联关系用于表征所述多个语言模型应用在语音识别过程中的前后关系或并列关系;
构建每个所述语言模型对应的子图;
根据所述关联关系确定所述多个语言模型对应的子图之间的链接关系;
根据所述链接关系链接所述多个语言模型对应的子图,得到所述搜索图。
3.根据权利要求2所述的音识别方法,其特征在于,待使用的所述语言模型至少包括以下之一:
由所述业务场景的场景类型关联的第一语料训练得到第一语言模型;
由所述业务场景所属的领域类型关联的第二语料训练得到的第二语言模型;
由所述业务场景下的话术语料训练得到的第三语言模型;
由所述业务场景关联的对象的个性化信息料训练得到的第四语言模型;
基础语言模型。
4.根据权利要求2所述的音识别方法,其特征在于,构建每个所述语言模型对应的子图包括:
获取所述语言模型的词表;
根据所述声学模型的发音词典确定所述词表中的每个词对应的声学符号,得到多个声学符号;
建立所述多个声学符号对应的声学符号节点,以及由声学符号序列构成的词对应的词节点,其中,相同的声学符号对应同一个声学符号节点;
根据所述多个声学符号之间的跳转关系链接多个所述声学符号节点,并根据多个所述词节点之间的跳转关系链接多个所述词节点,得到所述语言模型对应的子图。
5.根据权利要求2所述的语音识别方法,其特征在于,根据所述链接关系链接所述多个语言模型对应的子图,得到所述搜索图包括:
构建所述搜索图的起始节点;
根据所述业务场景下的语音识别路径,构建所述识别路...
【专利技术属性】
技术研发人员:李俊博,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。