语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：33091959 阅读：10 留言：0更新日期：2022-04-16 23:21

本发明专利技术公开了一种语音识别方法、装置、设备及存储介质。其中，该方法包括：基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库；对待识别语音数据进行特征提取，得到声学特征数据；基于所述声学模型、所述语言模型及所述热词库对所述声学特征数据构建解码图；基于所述解码图求取目标解码路径，得到所述待识别语音数据的识别结果；其中，所述热词库包括与指定词语存在映射关系的热词；所述解码图包括基于所述热词库中的热词构建的热词路径。可以基于包括热词路径的解码图求取目标解码路径，得到待识别语音数据的识别结果，可以提高识别结果的输出效率，减少支持热词识别的语音识别的时间延迟，满足实时性要求。满足实时性要求。满足实时性要求。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备及存储介质

[0001]本专利技术涉及语音识别领域，尤其涉及一种语音识别方法、装置、设备及存储介质。

技术介绍

[0002]随着AI(Artificial Intelligence，人工智能)技术的发展，越来越多的智能设备在工业界得到广泛的开发与使用，自动语音识别(Automatic speech recognition,ASR)技术则成为智能语音设备中不可或缺的一部分。伴随经济全球化的发展，全球范围内语言和文化的融合现象也越来越明显，对人们日常生活中的交谈方式也产生了影响，混杂语言交谈成为了一个常见的现象，比如，“好想拿到这家公司的offer啊”。
[0003]在混杂语言语音识别中，外语词汇的热词识别成为一个重要课题。热词作为一种词汇现象，它被定义为一个国家、一个地区在一个时期被人们普遍使用的词汇。在不同场景下，外语词汇的热词(常被使用的外语词汇)就被赋予了领域性的特点。
[0004]相关技术中，热词识别往往依赖于预先建立的规则，需要在对待识别语音数据进行语音识别，得到初步识别结果后，利用热词识别的规则在初步识别结果中识别满足预设条件的目标词语，并将识别出的目标词语替换为热词，由于需要在初步识别结果的基础上进行二次处理，才能替换热词，导致语音识别的实时性难以达到要求。

技术实现思路

[0005]有鉴于此，本专利技术实施例提供了一种语音识别方法、装置、设备及存储介质，旨在减少支持热词识别的语音识别的时间延迟，满足实时性要求。
[0006]本专利技术实施例...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库；对待识别语音数据进行特征提取，得到声学特征数据；基于所述声学模型、所述语言模型及所述热词库对所述声学特征数据构建解码图；基于所述解码图求取目标解码路径，得到所述待识别语音数据的识别结果；其中，所述热词库包括与指定词语存在映射关系的热词；所述解码图包括基于所述热词库中的热词构建的热词路径。2.根据权利要求1所述的方法，其特征在于，所述基于所述声学模型、所述语言模型及所述热词库对所述声学特征数据构建解码图，包括：基于所述声学模型识别所述声学特征数据中匹配的各词语；基于所述语言模型识别各词语之间的解码路径；基于所述热词库与所述各词语，确定与所述各词语中的至少一个存在映射关系的热词，在所述解码路径的基础上添加热词路径，构成解码图。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：接收与任一指定词语存在映射关系的新增热词，基于所述新增热词，更新所述热词库。4.根据权利要求3所述的方法，其特征在于，若同一指定词语存在至少两个对应的热词，所述方法还包括：基于所述至少两个对应的热词的排序确定所述热词库中同一指定词语对应的各热词的权重系数。5.根据权利要求1所述的方法，其特征在于，所述基于场景匹配确定当前语音识别所需的声学模型、语言模型及热词库，...

【专利技术属性】
技术研发人员：侯雷静，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人