语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号:33091959 阅读:10 留言:0更新日期:2022-04-16 23:21
本发明专利技术公开了一种语音识别方法、装置、设备及存储介质。其中,该方法包括:基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库;对待识别语音数据进行特征提取,得到声学特征数据;基于所述声学模型、所述语言模型及所述热词库对所述声学特征数据构建解码图;基于所述解码图求取目标解码路径,得到所述待识别语音数据的识别结果;其中,所述热词库包括与指定词语存在映射关系的热词;所述解码图包括基于所述热词库中的热词构建的热词路径。可以基于包括热词路径的解码图求取目标解码路径,得到待识别语音数据的识别结果,可以提高识别结果的输出效率,减少支持热词识别的语音识别的时间延迟,满足实时性要求。满足实时性要求。满足实时性要求。

【技术实现步骤摘要】
语音识别方法、装置、设备及存储介质


[0001]本专利技术涉及语音识别领域,尤其涉及一种语音识别方法、装置、设备及存储介质。

技术介绍

[0002]随着AI(Artificial Intelligence,人工智能)技术的发展,越来越多的智能设备在工业界得到广泛的开发与使用,自动语音识别(Automatic speech recognition,ASR)技术则成为智能语音设备中不可或缺的一部分。伴随经济全球化的发展,全球范围内语言和文化的融合现象也越来越明显,对人们日常生活中的交谈方式也产生了影响,混杂语言交谈成为了一个常见的现象,比如,“好想拿到这家公司的offer啊”。
[0003]在混杂语言语音识别中,外语词汇的热词识别成为一个重要课题。热词作为一种词汇现象,它被定义为一个国家、一个地区在一个时期被人们普遍使用的词汇。在不同场景下,外语词汇的热词(常被使用的外语词汇)就被赋予了领域性的特点。
[0004]相关技术中,热词识别往往依赖于预先建立的规则,需要在对待识别语音数据进行语音识别,得到初步识别结果后,利用热词识别的规则在初步识别结果中识别满足预设条件的目标词语,并将识别出的目标词语替换为热词,由于需要在初步识别结果的基础上进行二次处理,才能替换热词,导致语音识别的实时性难以达到要求。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供了一种语音识别方法、装置、设备及存储介质,旨在减少支持热词识别的语音识别的时间延迟,满足实时性要求。
[0006]本专利技术实施例的技术方案是这样实现的:
[0007]本专利技术实施例提供了一种语音识别方法,包括:
[0008]基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库;
[0009]对待识别语音数据进行特征提取,得到声学特征数据;
[0010]基于所述声学模型、所述语言模型及所述热词库对所述声学特征数据构建解码图;
[0011]基于所述解码图求取目标解码路径,得到所述待识别语音数据的识别结果;
[0012]其中,所述热词库包括与指定词语存在映射关系的热词;所述解码图包括基于所述热词库中的热词构建的热词路径。
[0013]本专利技术实施例还提供了一种语音识别装置,包括:
[0014]场景匹配模块,用于基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库;
[0015]声学特征提取模块,用于对待识别语音数据进行特征提取,得到声学特征数据;
[0016]模型处理模块,用于基于所述声学模型、所述语言模型及所述热词库对所述声学特征数据构建解码图;
[0017]解码模块,用于基于所述解码图求取目标解码路径,得到所述待识别语音数据的
识别结果;
[0018]其中,所述热词库包括与指定词语存在映射关系的热词;所述解码图包括基于所述热词库中的热词构建的热词路径。
[0019]本专利技术实施例又提供了一种语音识别设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器,用于运行计算机程序时,执行本专利技术实施例所述语音识别方法的步骤。
[0020]本专利技术实施例又提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现本专利技术实施例所述语音识别方法的步骤。
[0021]本专利技术实施例提供的技术方案,通过在解码图中构建热词库中热词对应的热词路径,可以基于包括热词路径的解码图求取目标解码路径,得到待识别语音数据的识别结果,相较于利用热词识别的规则在初步识别结果中识别满足预设条件的目标词语,并将识别出的目标词语替换为热词,可以提高识别结果的输出效率,减少支持热词识别的语音识别的时间延迟,满足实时性要求。
附图说明
[0022]图1为本专利技术实施例语音识别方法的流程示意图;
[0023]图2为本专利技术一应用示例中语音识别设备的结构示意图;
[0024]图3为本专利技术一应用示例中新增热词路径的原理示意图;
[0025]图4为本专利技术实施例语音识别装置的结构示意图;
[0026]图5为本专利技术实施例语音识别设备的结构示意图。
具体实施方式
[0027]下面结合附图及实施例对本专利技术再作进一步详细的描述。
[0028]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。
[0029]本专利技术实施例提供了一种语音识别方法,该语音识别方法可以应用于语音识别设备,如图1所示,包括:
[0030]步骤101,基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库;
[0031]这里,语音识别设备可以基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库。可以理解的是,声学模型、语言模型及热词库与各种场景一一对应设置,即不同场景的声学模型、语言模型及热词库可以不同,便于提高语音识别的准确率。
[0032]这里,声学模型(Acoustic Model,AM)用于将声学和发音学的知识进行整合,以提取的待识别语音数据的声学特征数据为输入,得到所述声学特征数据中匹配的各词语。示例性地,各词语具有对应的第一概率值。比如,第一概率值可以包括:由分帧组成状态的观察概率和由状态转移到自身或转移到下个状态的转移概率。
[0033]这里,语言模型(Language Model,LM)用于将基于语言统计规律,识别各词语之间的解码路径。示例性地,各解码路径具有对应的第二概率值,第二概率值可以理解为基于语言统计规律得到的各解码路径的概率值。
[0034]这里,所述热词库包括与指定词语存在映射关系的热词。其中,指定词语的数量可以为多个,各指定词语对应的热词可以为一个或者多个。比如,热词可以包括不限于:本国语言使用的热词和外国语言使用的热词。
[0035]在一些实施例中,所述基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库,包括:
[0036]基于当前地理位置和/或历史的语音识别记录确定当前语音识别所需的声学模型、语言模型及热词库。
[0037]这里,可以基于语音识别设备当前所处的地理位置和/或历史语音识别对应的场景来确定当前语音识别对应的场景,进而确定该场景对应的声学模型、语言模型及热词库。
[0038]实际应用中,往往同一地点对应的场景的数量并不唯一,基于此,在一些实施例中,语音识别方法还包括:
[0039]基于输入信息校正当前语音识别所需的声学模型、语言模型及热词库。
[0040]示例性地,语音识别设备可以基于地理位置和/或历史的语音识别记录在界面中显示初始确定的识别场景,并在界面中显示语音识别设备所支持的全部识别场景,供用户通过点击来进行选择或纠正。如此,使得识别场景的匹配方式更加灵活,避免了场景分类错误带来的识别效果变差的情况。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库;对待识别语音数据进行特征提取,得到声学特征数据;基于所述声学模型、所述语言模型及所述热词库对所述声学特征数据构建解码图;基于所述解码图求取目标解码路径,得到所述待识别语音数据的识别结果;其中,所述热词库包括与指定词语存在映射关系的热词;所述解码图包括基于所述热词库中的热词构建的热词路径。2.根据权利要求1所述的方法,其特征在于,所述基于所述声学模型、所述语言模型及所述热词库对所述声学特征数据构建解码图,包括:基于所述声学模型识别所述声学特征数据中匹配的各词语;基于所述语言模型识别各词语之间的解码路径;基于所述热词库与所述各词语,确定与所述各词语中的至少一个存在映射关系的热词,在所述解码路径的基础上添加热词路径,构成解码图。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:接收与任一指定词语存在映射关系的新增热词,基于所述新增热词,更新所述热词库。4.根据权利要求3所述的方法,其特征在于,若同一指定词语存在至少两个对应的热词,所述方法还包括:基于所述至少两个对应的热词的排序确定所述热词库中同一指定词语对应的各热词的权重系数。5.根据权利要求1所述的方法,其特征在于,所述基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库,...

【专利技术属性】
技术研发人员:侯雷静
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1