输出命令词的方法、装置、存储介质及电子装置制造方法及图纸

技术编号：32809825 阅读：26 留言：0更新日期：2022-03-26 20:03

本发明专利技术实施例提供了一种输出命令词的方法、装置、存储介质及电子装置，其中，该方法包括：在持续接收音频数据的情况下，对当前接收到的音频数据的类型进行检测；响应于检测到当前接收到的音频数据为对应于目标唤醒词的目标音频数据的情况下，基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词的音频数据的出现概率；响应于确定出出现概率大于第一概率阈值的对应于目标命令词的音频数据，输出所述目标命令词。通过本发明专利技术，有效解决相关技术中存在的需要对输入语音中包括的全部词全部进行识别后才可能确定出输入语音中是否包括命令词，从而导致命令词的识别效率低，识别功耗大的问题。识别功耗大的问题。识别功耗大的问题。

全部详细技术资料下载

【技术实现步骤摘要】
输出命令词的方法、装置、存储介质及电子装置

[0001]本专利技术实施例涉及通信领域，具体而言，涉及一种输出命令词的方法、装置、存储介质及电子装置。

技术介绍

[0002]命令词识别是语音识别的一种特殊场景，可以应用在家庭、会议等智能控制场景，唤醒词检测的关键词一般只有一个，例如，“小白”等等，但是命令词识别的关键词可能会有多，例如，在家庭场景下有类似“打开空调”和“打开电视”等，均是一个短促且具有明确的操作目标的祈使句，由于命令词识别是语音识别的一种，因此，语音识别的基本算法，同样可以应用于命令词检测算法。
[0003]在相关技术中，传统命令词识别算法可以单独使用、也可以作为唤醒词算法(常用的唤醒词算法包括，常规语音识别方式和端对端语音识别方式，另外，在深度优化的情况下，两者能达到相似的效果)的后置算法使用，当作为后置算法使用时，可以利用唤醒词的识别结果进一步提升命令词的识别效果，不需要进行vad(Voice Activity Detection，语音活动检测)算法就可以将命令词输出(即，等待vad算法给出输入语音...

【技术保护点】

【技术特征摘要】
1.一种输出命令词的方法，其特征在于，包括：在持续接收音频数据的情况下，对当前接收到的音频数据的类型进行检测；响应于检测到当前接收到的音频数据为对应于目标唤醒词的目标音频数据的情况下，基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词的音频数据的出现概率；响应于确定出出现概率大于第一概率阈值的对应于目标命令词的音频数据，输出所述目标命令词。2.根据权利要求1所述的方法，其特征在于，基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词的音频数据的出现概率包括：基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词类型的音频数据的第一概率以及出现对应于非命令词类型的音频数据的第二概率；响应于确定出所述第一概率大于第二概率阈值，基于后续接收到的音频数据确定对应于每个命令词的音频数据的所述出现概率。3.根据权利要求2所述的方法，其特征在于，基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词类型的音频数据的第一概率以及出现对应于非命令词类型的音频数据的第二概率包括：基于在所述目标音频数据之后所接收到的音频数据在目标解码图中调整后续出现对应于命令词类型的音频数据的第一权重以及出现对应于非命令词类型的音频数据的第二权重；基于所述第一权重和所述第二权重确定所述第一概率和所述第二概率。4.根据权利要求3所述的方法，其特征在于，基于在所述目标音频数据之后所接收到的音频数据调整后续出现对应于命令词类型的音频数据的第一权重以及出现对应于非命令词类型的音频数据的第二权重包括：对在所述目标音频数据之后所接收到的音频数据进行帧级解码，得到第一解码结果；基于所述第一解码结果持续对目标解码图中包括的命令词路径的第一初始权重以及非命令词路径的第二初始权重进行调整；将调整后的第一初始权重确定为所述第一权重，以及，将调整后的第二初始权重确定为所述第二权重。5.根据权利要求2所述的方法，其特征在于，基于后续接收到的...

【专利技术属性】
技术研发人员：张锦铖，史巍，林聚财，殷俊，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人