一种提高多语种ASR离线模型识别性能的方法、装置及系统制造方法及图纸

技术编号：32128052 阅读：28 留言：0更新日期：2022-01-29 19:21

本发明专利技术提供了一种提高多语言ASR离线模型识别性能的方法、装置及系统，所述方法应用于智能设备，包括以下步骤：S10，生成多语言模型文件；S20，根据唤醒时的唤醒词获取语言类型；S30，基于获取的语言类型，选取对应的语言模型文件来初始化引擎；S40，进入离线识别阶段。该发明专利技术提供的技术方案，由于在离线命令识别阶段，离线识别引擎不再需要处理多语言相关的逻辑，就避免了多语言给引擎带来了性能上的损失；且因为唤醒词决定唤醒后使用的识别语言，让产品具有支持多语种的功能需求。让产品具有支持多语种的功能需求。让产品具有支持多语种的功能需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种提高多语种ASR离线模型识别性能的方法、装置及系统

[0001]本专利技术书一个或多个实施例涉及计算机
，尤其涉及一种提高多语种ASR(Automatic Speech Recognition，自动语音识别技术)离线模型识别性能的方法、装置及系统。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述可包括可以探究的概念，但不一定是之前已经想到或者已经探究的概念。因此，除非在此指出，否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术，并且并不因为包括在本部分中就承认是现有技术。
[0003]ASR是一种将人的语音转换为文本的技术，随着现代社会信息的全球化，语种识别成为语音识别技术研究热点之一，而随着科技的发展和进步，离线语音识别已广泛应用到了人们的现实生活中，即在没有网络的情况下，识别文字或者语音操作等过程，例如，用户与家用电器进行交互，可通过离线语音识别模型对用户声音进行识别，从而该家用电器根据识别后的语音执行操作。
[0004]...

【技术保护点】

【技术特征摘要】
1.一种提高多语言ASR离线模型识别性能的方法，其特征在于，所述方法应用于智能设备，包括以下步骤：S10，生成多语言模型文件；S20，根据唤醒时的唤醒词获取语言类型；S30，基于获取的语言类型，选取对应的语言模型文件来初始化引擎；S40，进入离线识别阶段。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：离线识别完成后，智能设备进入待唤醒阶段。3.据权利要求1所述的方法，其特征在于，所述根据唤醒时的唤醒词获取语言类型，包括以下步骤：将每种语言的唤醒词的评分标准进行归一化处理；接收到至少一个唤醒词，并选择分数最高的作为唤醒词；根据选择的唤醒词选择支持的语言类型。4.根据权利要求3所述的方法，其特征在于，所述接收到至少一个唤醒词，选择分数最高的作为唤醒词，具体的：设置等待时间，当识别到第一个唤醒词后，判断引擎在等待时间段内是否还识别到其他唤醒词，若识别到多个唤醒词，则选择分数最高的一个唤醒词，否则选择唯一的唤醒词。5.根据权利要求1所述的方法，其特征在于，在步骤S30，当引擎初始化后，进入命令识别阶段，命令识别阶段支持离线命令识别和在线命令识别。6.一种提高多语言ASR离线模型识别性能的装置，其特征在于，包括：语言模型模块，用于生成多语言模型文件；获取模块，用于根据唤醒时的唤醒词获取语言类型；选择模块，用于基于...

【专利技术属性】
技术研发人员：李旭滨，陈晓松，潘云相，陈吉胜，
申请(专利权)人：云知声上海智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人