一种语音处理方法及系统技术方案

技术编号:20366615 阅读:17 留言:0更新日期:2019-02-16 18:14
本发明专利技术公开了一种语音处理方法及系统,其中所述方法包括获取待识别的语音;对所述待识别的语音进行语音识别;在语音识别的过程中,同时根据所待识别的语音的识别结果进行动态VAD判断;当通过动态VAD判断检测到所述待识别的语音结束时,根据所述待识别的语音的识别结果执行对应指令。应用本发明专利技术所述方案,能够根据用户命令词进行针对性响应,包括快速判断和慢速判断,提高了语音识别的准确性和及时性,避免语音识别过早结束造成中断误报,或过晚结束造成响应时间过长。

【技术实现步骤摘要】
一种语音处理方法及系统
本专利技术涉及语音处理
,特别涉及一种语音处理方法及系统。
技术介绍
在很多嵌入式应用中,例如车载语音识别系统,用户发出的语音指令分为不同情况:用户唤醒了直接说命令词进行识别或者查询什么的情况,这时候就要保证用户说话过程中出现停顿,包括用户停顿思考、犹豫、呼吸、口吃等情况,这种情况下不要断掉,要等待用户说完,但是用户说完后要快速结束以进行快速响应;或者,用户一口气说了一个命令,要很快结束而不是等待,以快速响应用户的命令。但是,现有技术方案中,都是基于端上vad(VoiceActivityDetection,语音动态检测)或者根据识别结果的提前返回的时间来做决策,一般是两者中触发哪一个用哪一个条件进行影响。基于端上的vad或者识别结果的提前返回来做决策存在以下问题:比较单一,并不能对于一些快速响应或者慢速响应的情况进行区分,都是统一用一个阈值进行判断,对于快速或者慢速的情况一般都是用户很敏感的情况,体验上不能一概而论用同一个时间进行控制。
技术实现思路
本申请的多个方面提供了一种语音处理方法及系统,能够根据用户命令词进行针对性响应,提高了语音识别的准确性和及时性。本申请的一方面,提供一种语音处理方法,包括:获取待识别的语音;对所述待识别的语音进行语音识别;在语音识别的过程中,同时根据所待识别的语音的识别结果进行动态VAD判断;当通过动态VAD判断检测到所述待识别的语音结束时,根据所述待识别的语音的识别结果执行对应指令。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,还包括:当通过动态VAD判断检测到所述待识别的语音结束时,向所述用户反馈所述待识别的语音的识别结果。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述动态VAD判断包括:根据所述待识别的语音的识别结果确定当前判断模式,所述判断模式包括快速判断、慢速判断及正常判断。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述快速判断模式中,VAD识别等待时间阈值小于正常判断模式;所述慢速判断模式中,VAD识别等待时间阈值大于正常判断模式。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述待识别的语音的识别结果确定当前判断模式包括:根据所述待识别的语音的识别结果在预设的快速命令词库和慢速命令词库中分别进行查询,以确定所述待识别的语音对应的判断模式。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述快速命令词库和慢速命令词库为树结构。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所待识别的语音的识别结果进行动态VAD判断包括:根据所述识别的语音的识别结果在快速命令词库中进行查询;若在快速命令词库查询到对应的命令词,则进入快速判断模式;若未查询到对应的命令词,根据所述识别的语音的识别结果文本在慢速命令词库中进行查询;若在慢速命令词库查询到对应的命令词,则进入慢速判断模式;若未查询到对应的命令词,进入正常判断模式。本专利技术的另一方面,提供一种语音处理系统,包括:语音获取模块,用于获取待识别的语音;语音识别模块,用于对所述待识别的语音进行语音识别;动态VAD判断模块,用于在语音识别的过程中,同时根据所待识别的语音的识别结果进行动态VAD判断;执行模块,用于当通过动态VAD判断检测到所述待识别的语音结束时,根据所述待识别的语音的识别结果执行对应指令。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述执行模块还用于当通过动态VAD判断检测到所述待识别的语音结束时,向所述用户反馈所述待识别的语音的识别结果。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述动态VAD判断包括:根据所述待识别的语音的识别结果确定当前判断模式,所述判断模式包括快速判断、慢速判断及正常判断。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述快速判断模式中,VAD识别等待时间阈值小于正常判断模式;所述慢速判断模式中,VAD识别等待时间阈值大于正常判断模式。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述动态VAD判断模块具体用于:根据所述待识别的语音的识别结果在预设的快速命令词库和慢速命令词库中分别进行查询,以确定所述待识别的语音对应的判断模式。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述快速命令词库和慢速命令词库为树结构。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述动态VAD判断模块具体用于:根据所述识别的语音的识别结果在快速命令词库中进行查询;若在快速命令词库查询到对应的命令词,则进入快速判断模式;若未查询到对应的命令词,根据所述识别的语音的识别结果文本在慢速命令词库中进行查询;若在慢速命令词库查询到对应的命令词,则进入慢速判断模式;若未查询到对应的命令词,进入正常判断模式。本专利技术的另一方面,提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。本专利技术的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。基于上述介绍可以看出,采用本专利技术所述方案,能够根据用户命令词进行针对性响应,提高了语音识别的准确性和及时性,避免语音识别过早结束造成中断误报,或过晚结束造成响应时间过长。【附图说明】图1为本专利技术所述语音处理方法的流程图;图2为本专利技术所述语音处理系统的结构图;图3示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器012的框图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。图1为本专利技术所述语音处理方法实施例的流程图,本专利技术实施例的执行主体为车载终端,如图1所示,包括以下步骤:步骤S11、获取待识别的语音;步骤S12、对所述待识别的语音进行语音识别;步骤S13、在语音识别的过程中,同时根据所待识别的语音的识别结果进行动态VAD判断;步骤S14、当通过动态VAD判断检测到所述待识别的语音结束时,根据所述待识别的语音的识别结果执行对应指令。在步骤S11的一种优选实现方式中,本实施例的执行主体为车载终端,所述车载终端可以是车辆行车电脑,也可以是通过蓝牙、WiFi与车载电脑相连接的移动设备,如智能手机等。具体地,终端上可以设置一个语音输入的触发条件,例如,触发条件可以为一个语音输入按钮,用户通过按动语音输入按钮触发输入待识别的语音,终端的语音采集模块可以采集所述待识别的语音,而后将采集的待识别的语音发送至语音处理模块,而语音处理模块可以获取待识别的语音。虽然语音识别可以由云端进行,但是,对于车载终端,很多情况下是没有网络或者网络比较弱;这时候使用云端进行语音识别存在一些问题,因此,在本实施例中,所述语音处理模块为终端上的嵌入式识别器。在步骤S12的一种优选实现方式本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:获取待识别的语音;对所述待识别的语音进行语音识别;在语音识别的过程中,同时根据所待识别的语音的识别结果进行动态VAD判断;当通过动态VAD判断检测到所述待识别的语音结束时,根据所述待识别的语音的识别结果执行对应指令。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:获取待识别的语音;对所述待识别的语音进行语音识别;在语音识别的过程中,同时根据所待识别的语音的识别结果进行动态VAD判断;当通过动态VAD判断检测到所述待识别的语音结束时,根据所述待识别的语音的识别结果执行对应指令。2.根据权利要求1所述的方法,其特征在于,还包括:当通过动态VAD判断检测到所述待识别的语音结束时,向所述用户反馈所述待识别的语音的识别结果。3.根据权利要求1所述的方法,其特征在于,所述动态VAD判断包括:根据所述待识别的语音的识别结果确定当前判断模式,所述判断模式包括快速判断、慢速判断及正常判断。4.根据权利要求3所述的方法,其特征在于,所述快速判断模式中,VAD识别等待时间阈值小于正常判断模式;所述慢速判断模式中,VAD识别等待时间阈值大于正常判断模式。5.根据权利要求3所述的方法,其特征在于,根据所述待识别的语音的识别结果确定当前判断模式包括:根据所述待识别的语音的识别结果在预设的快速命令词库和慢速命令词库中分别进行查询,以确定所述待识别的语音对应的判断模式。6.根据权利要求5所述的方法,其特征在于,所述快速命令词库和慢速命令词库为树结构。7.根据权利要求5所述的方法,其特征在于,根据所待识别的语音的识别结果进行动态VAD判断包括:根据所述识别的语音的识别结果在快速命令词库中进行查询;若在快速命令词库查询到对应的命令词,则进入快速判断模式;若未查询到对应的命令词,根据所述识别的语音的识别结果文本在慢速命令词库中进行查询;若在慢速命令词库查询到对应的命令词,则进入慢速判断模式;若未查询到对应的命令词,进入正常判断模式。8.一种语音处理系统,其特征在于,包括:语音获取模块,用于获取待识别的语音;语音识别模块,用于对所述待识别的语音进行语音识别;动态VAD判断模块,用于在语音识别的过程中,同时根据所...

【专利技术属性】
技术研发人员:王知践钱胜
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1