关键词检测方法、装置、电子设备以及存储介质制造方法及图纸

技术编号：26892971 阅读：10 留言：0更新日期：2020-12-29 16:14

本申请公开了一种关键词检测方法、装置、电子设备以及存储介质，包括：对待识别语音进行特征提取，得到语音特征；根据预设声学模型以及所述语音特征对所述待识别语音中的唤醒词进行检测，得到唤醒词检测结果；当所述唤醒词检测结果指示所述待识别语音中包含唤醒词时，则基于所述待识别语音的语音状态对所述语音特征进行分割；基于分割后语音特征、所述预设声学模型以及预设关键词，对所述待识别语音中的关键词进行检测，得到关键词检测结果；将所述唤醒词检测结果以及关键词检测结果进行融合，得到所述待识别语音的关键词识别结果，该方案在提高关键词检测效率的同时，还可以保证关键词检测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
关键词检测方法、装置、电子设备以及存储介质
本专利技术涉及计算机
，具体涉及一种关键词检测方法、装置、电子设备以及存储介质。
技术介绍
人工智能(AI，ArtificialIntelligence)是计算机科学的一个综合技术，通过研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，例如自然语言处理技术以及机器学习/深度学习等几大方向，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值，在实际应用中，将人工智能技术应用于关键词检测中，通过机器的推理与决策的功能可以获得与语音信息对应的文本信息，为用户带来了极大的便利。然而，目前关键词检测往往不能满足用户的需求，关键词检测的过程中经常出现延迟以及误识别等问题。
技术实现思路
本申请提供一种关键词检测方法、装置、电子设备以及存储介质，在提高关键词检测效率的同时，还可以保证关键词检测的准确性。本申请提供了一种关键词检测方法，包括：对待识别语音进行特征提取，得到语音特征；根据预设声学模型以及所述语音特征对所述待识别语音中的唤醒词进行检测，得到唤醒词检测结果；当所述唤醒词检测结果指示所述待识别语音中包含唤醒词时，则基于所述待识别语音的语音状态对所述语音特征进行分割；基于分割后语音特征、所述预设声学模型以及预设关键词，对所述待识别语音中的关键词进行检测，得到关键词检测结果；将所述唤醒词检测结果以及关键词检测结果进行融合，...

【技术保护点】
1.一种关键词识别方法，其特征在于，包括：/n对待识别语音进行特征提取，得到语音特征；/n根据预设声学模型以及所述语音特征对所述待识别语音中的唤醒词进行检测，得到唤醒词检测结果；/n当所述唤醒词检测结果指示所述待识别语音中包含唤醒词时，则基于所述待识别语音的语音状态对所述语音特征进行分割；/n基于分割后语音特征、所述预设声学模型以及预设关键词，对所述待识别语音中的关键词进行检测，得到关键词检测结果；/n将所述唤醒词检测结果以及关键词检测结果进行融合，得到所述待识别语音的关键词识别结果。/n

【技术特征摘要】
1.一种关键词识别方法，其特征在于，包括：
对待识别语音进行特征提取，得到语音特征；
根据预设声学模型以及所述语音特征对所述待识别语音中的唤醒词进行检测，得到唤醒词检测结果；
当所述唤醒词检测结果指示所述待识别语音中包含唤醒词时，则基于所述待识别语音的语音状态对所述语音特征进行分割；
基于分割后语音特征、所述预设声学模型以及预设关键词，对所述待识别语音中的关键词进行检测，得到关键词检测结果；
将所述唤醒词检测结果以及关键词检测结果进行融合，得到所述待识别语音的关键词识别结果。

2.根据权利要求1所述的方法，其特征在于，所述基于分割后语音特征、所述预设声学模型以及预设关键词，对所述待识别语音中的关键词进行检测，得到关键词检测结果，包括：
根据所述预设声学模型，获取所述待识别语音中待识别词的音素信息；
基于所述音素信息、分割后语音特征以及预设关键词对所述待识别语音中的关键词进行检测，得到关键词检测结果。

3.根据权利要求2所述的方法，其特征在于，所述基于所述音素信息、分割后语音特征以及预设关键词对所述待识别语音中的关键词进行检测，得到关键词检测结果，包括：
根据分割后语音特征对所述待识别语音进行文本转译，得到所述待识别语音的语音文本；
从所述语音文本中确定与所述音素信息对应的待识别词；
在确定的待识别词中选择与预设关键词匹配的待识别词，得到目标关键词集合。

4.根据权利要求3所述的方法，其特征在于，所述在确定的待识别词中选择与预设关键词匹配的待识别词，得到目标关键词集合，包括：
计算确定的待识别词与预设关键词之间的关键词相似度；
将关键词相似度大于预设值的待识别词确定为目标关键词，得到目标关键词集合。

5.根据权利要求3所述的方法，其特征在于，所述根据分割后语音特征对所述待识别语音进行文本转译，得到所述待识别语音的语音文本，包括：
根据所述音素信息生成各分割后语音特征对应的音素序列；
利用预设语言模型对所述音素序列进行识别，得到所述待识别语音的语音文本。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述根据所述语音特征对所述待识别语音中的唤醒词进行检测，得到第一检测结果，包括：
获取预设声学模型...

【专利技术属性】
技术研发人员：吕志强，黄申，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人