The embodiment of the present invention provides a processing method, device and electronic device for man-machine conversation, in which the method includes: after the device completes the last voice instruction, the content of the last voice instruction is identified to determine whether the user needs to input voice instruction again based on the last voice instruction; if the user needs to input voice instruction again, the method is activated. Moving voice activity detects VAD; otherwise, end the session. The scheme of the embodiment of the present invention can satisfy the user's need for continuous conversation with the device on the basis of not requiring the device to wake up repeatedly, improve the user's experience and improve the conversation efficiency.
【技术实现步骤摘要】
人机会话的处理方法、装置及电子设备
本申请涉及计算机
,尤其涉及一种人机会话的处理方法、装置及电子设备。
技术介绍
在人机会话的场景下,用户向设备输入一条语音指令后,设备会执行用户输入的语音指令,例如增大音量、播放视频等,指令执行完毕后,还可以通过TTS(TextToSpeech,文字转语音)向用户进行反馈,比如播放“音量已经增大”、“视频已打开”等。当设备完成一条语音指令后,认为整个会话终止了,便进入休眠状态。但是,在连续会话场景下,如果用户还有进一步的语音指令想输入,则需要重新唤醒设备。重新唤醒设备无论从时间上还是程序上都会导致较大的使用不便,例如,用户要重新输入语音唤醒词,并且,唤醒设备也会花一定的时间,从而严重影响使用体验。
技术实现思路
本专利技术提供了一种人机会话的处理方法、装置及电子设备,在不需要反复唤醒设备的基础上,满足用户想主动与设备进行连续会话的需求,改善用户使用体验,提高会话效率。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,提供了一种人机会话的处理方法,包括:在设备完成上一条语音指令后,对上一条语音指令的内容进行识别,确定用户是否有基于上一条语音指令而再次输入语音指令的需求;如果确定用户有再次输入语音指令的需求,则启动语音活动检测;否则,结束本次会话。第二方面,提供了另一种人机会话的处理方法,包括:对所接收的语音指令的内容进行识别;判断用户是否有再次输入语音指令的需求;根据判断结果,执行人机会话操作。第三方面,提供了一种人机会话的处理装置,包括:指令识别模块,用于在设备完成上一条语音指令后,对上一条语音指令的内容进 ...
【技术保护点】
1.一种人机会话的处理方法,其特征在于,包括:在设备完成上一条语音指令后,对上一条语音指令的内容进行识别,确定用户是否有基于上一条语音指令而再次输入语音指令的需求;如果确定用户有再次输入语音指令的需求,则启动语音活动检测;否则,结束本次会话。
【技术特征摘要】
1.一种人机会话的处理方法,其特征在于,包括:在设备完成上一条语音指令后,对上一条语音指令的内容进行识别,确定用户是否有基于上一条语音指令而再次输入语音指令的需求;如果确定用户有再次输入语音指令的需求,则启动语音活动检测;否则,结束本次会话。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在启动所述语音活动检测后,如果在指定的检测时间内没有检测到语音信号,则结束本次会话;否则,对检测到的语音信号进行自动语音识别。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:统计所述用户在各次会话过程中,用户从设备唤醒成功到发出语音指令的第一平均时间;统计所述用户在各次会话过程中,从启动所述语音活动检测到用户发出语音指令的第二平均时间;根据所述第一平均时间和所述第二平均时间计算得到所述指定的检测时间。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一平均时间和所述第二平均时间计算得到所述指定的检测时间,包括:根据T4=T3+(T2-T3)/2计算得到所述指定的检测时间T4;其中,所述T2为所述第一平均时间T1和预设冗余时间之和,所述T3为所述第二平均时间。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:在对检测到的所述语音信号进行所述自动语音识别后,如果未识别出文本内容,则结束本次会话;否则,对识别出的文本内容进行语义解析。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:在对识别出的所述文本内容进行语义解析后,如果解析得到的语义未进入任一预置的领域,或者解析得到的语义明确为结束本次会话,则结束本次会话;否则,根据解析得到的语义所进入的领域生成语音指令,并根据语音指令控制相应设备执行操作。7.一种人机会话的处理方法,其特征在于,包括:对所接收的语音指令的内容进行识别;...
【专利技术属性】
技术研发人员:刘广兴,许毅,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。