一种语音处理方法及系统技术方案

技术编号：20366615 阅读：17 留言：0更新日期：2019-02-16 18:14

本发明专利技术公开了一种语音处理方法及系统，其中所述方法包括获取待识别的语音；对所述待识别的语音进行语音识别；在语音识别的过程中，同时根据所待识别的语音的识别结果进行动态VAD判断；当通过动态VAD判断检测到所述待识别的语音结束时，根据所述待识别的语音的识别结果执行对应指令。应用本发明专利技术所述方案，能够根据用户命令词进行针对性响应，包括快速判断和慢速判断，提高了语音识别的准确性和及时性，避免语音识别过早结束造成中断误报，或过晚结束造成响应时间过长。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音处理方法及系统
本专利技术涉及语音处理
，特别涉及一种语音处理方法及系统。
技术介绍
在很多嵌入式应用中，例如车载语音识别系统，用户发出的语音指令分为不同情况：用户唤醒了直接说命令词进行识别或者查询什么的情况，这时候就要保证用户说话过程中出现停顿，包括用户停顿思考、犹豫、呼吸、口吃等情况，这种情况下不要断掉，要等待用户说完，但是用户说完后要快速结束以进行快速响应；或者，用户一口气说了一个命令，要很快结束而不是等待，以快速响应用户的命令。但是，现有技术方案中，都是基于端上vad(VoiceActivityDetection,语音动态检测)或者根据识别结果的提前返回的时间来做决策，一般是两者中触发哪一个用哪一个条件进行影响。基于端上的vad或者识别结果的提前返回来做决策存在以下问题：比较单一，并不能对于一些快速响应或者慢速响应的情况进行区分，都是统一用一个阈值进行判断，对于快速或者慢速的情况一般都是用户很敏感的情况，体验上不能一概而论用同一个时间进行控制。
技术实现思路
本申请的多个方面提供了一种语音处理方法及系统，能够根据用户命令词进行针对性响应，提高了语音识别的准确性和及时性。本申请的一方面，提供一种语音处理方法，包括：获取待识别的语音；对所述待识别的语音进行语音识别；在语音识别的过程中，同时根据所待识别的语音的识别结果进行动态VAD判断；当通过动态VAD判断检测到所述待识别的语音结束时，根据所述待识别的语音的识别结果执行对应指令。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，还包括：当通过动态VAD判断检测到所述待识别...

【技术保护点】
1.一种语音处理方法，其特征在于，包括：获取待识别的语音；对所述待识别的语音进行语音识别；在语音识别的过程中，同时根据所待识别的语音的识别结果进行动态VAD判断；当通过动态VAD判断检测到所述待识别的语音结束时，根据所述待识别的语音的识别结果执行对应指令。

【技术特征摘要】
1.一种语音处理方法，其特征在于，包括：获取待识别的语音；对所述待识别的语音进行语音识别；在语音识别的过程中，同时根据所待识别的语音的识别结果进行动态VAD判断；当通过动态VAD判断检测到所述待识别的语音结束时，根据所述待识别的语音的识别结果执行对应指令。2.根据权利要求1所述的方法，其特征在于，还包括：当通过动态VAD判断检测到所述待识别的语音结束时，向所述用户反馈所述待识别的语音的识别结果。3.根据权利要求1所述的方法，其特征在于，所述动态VAD判断包括：根据所述待识别的语音的识别结果确定当前判断模式，所述判断模式包括快速判断、慢速判断及正常判断。4.根据权利要求3所述的方法，其特征在于，所述快速判断模式中，VAD识别等待时间阈值小于正常判断模式；所述慢速判断模式中，VAD识别等待时间阈值大于正常判断模式。5.根据权利要求3所述的方法，其特征在于，根据所述待识别的语音的识别结果确定当前判断模式包括：根据所述待识别的语音的识别结果在预设的快速命令词库和慢速命令词库中分别进行查询，以确定所述待识别的语音对应的判断模式。6.根据权利要求5所述的方法，其特征在于，所述快速命令词库和慢速命令词库为树结构。7.根据权利要求5所述的方法，其特征在于，根据所待识别的语音的识别结果进行动态VAD判断包括：根据所述识别的语音的识别结果在快速命令词库中进行查询；若在快速命令词库查询到对应的命令词，则进入快速判断模式；若未查询到对应的命令词，根据所述识别的语音的识别结果文本在慢速命令词库中进行查询；若在慢速命令词库查询到对应的命令词，则进入慢速判断模式；若未查询到对应的命令词，进入正常判断模式。8.一种语音处理系统，其特征在于，包括：语音获取模块，用于获取待识别的语音；语音识别模块，用于对所述待识别的语音进行语音识别；动态VAD判断模块，用于在语音识别的过程中，同时根据所...

【专利技术属性】
技术研发人员：王知践，钱胜，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人