语音交互实现方法、装置及电子设备制造方法及图纸

技术编号:25892367 阅读:43 留言:0更新日期:2020-10-09 23:36
本申请提出了一种语音交互控制方法、装置及电子设备,第一电子设备进行语音帧连续采集过程中,获取当前语音帧的激活分数以及增强语音帧,检测到所获取的激活分数达到第一激活阈值但未达到第二激活阈值时,将激活标记、采集时间点以及相应的增强语音帧构建成第一增强语音包发送至第二电子设备,第二电子设备会禁止输出携带激活标记的第一增强语音包,避免了该时间段接收到的可能为激活词的增强语音帧输出后,对接听用户造成干扰,降低在线语音交互质量;若预设采集时间段内获取的激活分数达到第二激活阈值,第二电子设备将输出在第一增强语音包中激活词的结束时间点之后获取的增强语音帧,以保证第一电子设备与第二电子设备之间的正常通话交流。

【技术实现步骤摘要】
语音交互实现方法、装置及电子设备
本申请主要涉及多方通话应用领域,更具体地说是涉及一种语音交互实现方法、装置及电子设备。
技术介绍
目前,大部分电子设备配置有语音识别引擎(如语音助手),并针对该语音识别引擎配置相应的激活词,用以激活该语音识别引擎进入工作状态,这样,用户可以直接说针对电子设备的语音控制指令,即可控制电子设备执行预设操作,无需用户手动操作,非常方便。然而,在电子设备应用于如会议、游戏等场景下,实现多用户在线语音交流过程中,电子设备采集到本地用户的语音信息后,无论在语音信息是否包含语音识别引擎的激活词,目前都是直接发送至其他用户的电子设备输出,从而导致本地用户所说的针对本地电子设备的激活词,对其他用户造成干扰,降低了在线语音通话质量,影响用户体验。
技术实现思路
有鉴于此,为了解决现有技术本地用户所说的针对本地电子设备的激活词,对其他用户造成干扰,降低了在线语音通话质量的技术问题,一方面,本申请提供了一种语音交互控制方法,所述方法包括:在语音帧连续采集过程中,获取采集的当前语音帧的激活分数及增强语音帧,所述激活分数能够表示当前已采集到的语音帧包含第一电子设备的语音识别引擎的激活词的概率;检测所述激活分数达到第一激活阈值但未达到第二激活阈值,确定所述当前语音帧的类型标记为激活标记,由相应的增强语音帧、采集时间点及所述激活标记构建第一增强语音包;将所述第一增强语音包发送至第二电子设备,以使所述第二电子设备禁止输出所述第一增强语音包,直至在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定得到的第一增强语音包中激活词的结束时间点;由所述结束时间点之后获取的增强语音帧及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至所述第二电子设备输出。可选的,所述在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定携带有所述激活标记的增强语音包中激活词的结束时间点,包括:在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定在所述预设采集时间段内采集到的语音帧包含所述语音识别引擎的激活词,生成相应的激活检测结果;将所述激活检测结果发送至所述第二电子设备,以使所述第二电子设备从所述预设采集时间段内接收到的第一增强语音包中,确定激活词的结束时间点;接收所述第二电子设备反馈的所述结束时间点。可选的,所述方法还包括:获取所述当前语音帧的减弱语音帧;在所述确定所述当前语音帧的类型标记为激活标记的情况下,所述方法还包括:由所述当前语音帧的减弱语音帧、采集时间点及所述激活标记构建第一减弱语音包;将所述第一减弱语音包发送至所述第二电子设备,以使得所述第二电子设备输出所述第一减弱语音包。可选的,所述方法还包括:检测所述激活分数未达到第一激活阈值,由所述当前语音帧的增强语音帧,及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至所述第二电子设备输出。可选的,所述方法还包括:若在所述预设采集时间段内获取的激活分数未达到所述第二激活阈值,确定在所述预设采集时间段内采集到的语音帧未包含所述语音识别引擎的激活词,并生成相应的语音检测结果;将所述语音检测结果发送至第二电子设备,以使所述第二电子设备输出在所述预设采集时间段内接收到的所述第一增强语音包;由当前时间点之后获取的增强语音帧,及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至第二电子设备输出。又一方面,本申请还提出了一种语音交互控制方法,所述方法包括:接收第一电子设备发送的增强语音包;检测所述增强语音包是否携带有激活标记;若携带有所述激活标记,禁止输出所述增强语音包;若未携带有所述激活标记,输出所述增强语音包;其中,携带所述激活标记的增强语音包包括:所述第一电子设备检测到当前语音帧的激活分数达到第一激活阈值但未达到第二激活阈值的情况下,由所述当前语音帧的增强语音帧、采集时间点及确定的所述激活标记构建的增强语音包,所述激活分数能够表示当前已采集到的语音帧包含所述第一电子设备的语音识别引擎的激活词的概率;未携带所述激活标记的增强语音包包括:所述第一电子设备检测预设采集时间段内获取的激活分数达到第二激活阈值,确定携带激活标记的增强语音包中激活词的结束时间点后,由所述结束时间点之后获取的增强语音帧及相应的采集时间点构建的增强语音帧。可选的,所述方法还包括:接收所述第一电子设备发送的激活检测结果,所述激活检测结果是所述第一电子设备在预设采集时间段内获取的激活分数达到所述第二激活阈值的情况下生成的;对在所述预设采集时间段内接收到的携带有激活标记的增强语音包进行语义分析,确定所述第一电子设备的语音识别引擎的激活词的结束时间点;将所述结束时间点反馈至所述第一电子设备,并输出所述结束时间点之后接收到的增强语音包;其中,若在接收第一电子设备发送的增强语音包的同时,接收到所述第一电子设备发送的所述增强语音包相应语音帧的减弱语音包;输出所述结束时间点之前接收到的减弱语音包,并禁止输出所述结束时间点之后接收到的减弱语音包。又一方面,本申请还提出了一种语音交互控制装置,所述装置包括:数据获取模块,用于在语音帧连续采集过程中,获取采集的当前语音帧的激活分数及增强语音帧,所述激活分数能够表示当前已采集到的语音帧包含第一电子设备的语音识别引擎的激活词的概率;第一检测处理模块,用于检测所述激活分数达到第一激活阈值但未达到第二激活阈值,确定所述当前语音帧的类型标记为激活标记,由相应的增强语音帧、采集时间点及所述激活标记构建第一增强语音包;第一数据传输模块,用于将所述第一增强语音包发送至第二电子设备,以使所述第二电子设备禁止输出所述第一增强语音包,直至在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定得到的第一增强语音包中激活词的结束时间点;第二数据传输模块,用于由所述结束时间点之后获取的增强语音帧及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至所述第二电子设备输出。又一方面,本申请还提出了一种语音交互控制装置,所述装置包括:数据接收模块,用于接收第一电子设备发送的增强语音包;数据检测模块,用于检测所述增强语音包是否携带有激活标记;禁止输出模块,用于在所述数据检测模块的检测结果为是的情况下,禁止输出所述增强语音包;数据输出模块,用于在所述数据检测模块的检测结果为否的情况下,输出所述增强语音包;其中,携带所述激活标记的增强语音包包括:所述第一电子设备检测到当前语音帧的激活分数达到第一激活阈值但未达到第二激活阈值的情况下,由所述当前语音帧的增强语音帧、采集时间点及确定的所述激活标记构建的增强语音包,所述激活分数能够表示当前已采集到的语音帧包含所述第一电子设备的语音识别引擎的激活词的概率;未携带所述激活标记的增强语音包包括:本文档来自技高网...

【技术保护点】
1.一种语音交互控制方法,所述方法包括:/n在语音帧连续采集过程中,获取采集的当前语音帧的激活分数及增强语音帧,所述激活分数能够表示当前已采集到的语音帧包含第一电子设备的语音识别引擎的激活词的概率;/n检测所述激活分数达到第一激活阈值但未达到第二激活阈值,确定所述当前语音帧的类型标记为激活标记,由相应的增强语音帧、采集时间点及所述激活标记构建第一增强语音包;/n将所述第一增强语音包发送至第二电子设备,以使所述第二电子设备禁止输出所述第一增强语音包,直至在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定得到的第一增强语音包中激活词的结束时间点;/n由所述结束时间点之后获取的增强语音帧及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至所述第二电子设备输出。/n

【技术特征摘要】
1.一种语音交互控制方法,所述方法包括:
在语音帧连续采集过程中,获取采集的当前语音帧的激活分数及增强语音帧,所述激活分数能够表示当前已采集到的语音帧包含第一电子设备的语音识别引擎的激活词的概率;
检测所述激活分数达到第一激活阈值但未达到第二激活阈值,确定所述当前语音帧的类型标记为激活标记,由相应的增强语音帧、采集时间点及所述激活标记构建第一增强语音包;
将所述第一增强语音包发送至第二电子设备,以使所述第二电子设备禁止输出所述第一增强语音包,直至在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定得到的第一增强语音包中激活词的结束时间点;
由所述结束时间点之后获取的增强语音帧及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至所述第二电子设备输出。


2.根据权利要求1所述的方法,所述在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定携带有所述激活标记的增强语音包中激活词的结束时间点,包括:
在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定在所述预设采集时间段内采集到的语音帧包含所述语音识别引擎的激活词,生成相应的激活检测结果;
将所述激活检测结果发送至所述第二电子设备,以使所述第二电子设备从所述预设采集时间段内接收到的第一增强语音包中,确定激活词的结束时间点;
接收所述第二电子设备反馈的所述结束时间点。


3.根据权利要求1所述的方法,所述方法还包括:
获取所述当前语音帧的减弱语音帧;
在所述确定所述当前语音帧的类型标记为激活标记的情况下,所述方法还包括:
由所述当前语音帧的减弱语音帧、采集时间点及所述激活标记构建第一减弱语音包;
将所述第一减弱语音包发送至所述第二电子设备,以使得所述第二电子设备输出所述第一减弱语音包。


4.根据权利要求1所述的方法,所述方法还包括:
检测所述激活分数未达到第一激活阈值,由所述当前语音帧的增强语音帧,及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至所述第二电子设备输出。


5.根据权利要求1~4任一项所以的方法,所述方法还包括:
若在所述预设采集时间段内获取的激活分数未达到所述第二激活阈值,确定在所述预设采集时间段内采集到的语音帧未包含所述语音识别引擎的激活词,并生成相应的语音检测结果;
将所述语音检测结果发送至第二电子设备,以使所述第二电子设备输出在所述预设采集时间段内接收到的所述第一增强语音包;
由当前时间点之后获取的增强语音帧,及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至第二电子设备输出。


6.一种语音交互控制方法,所述方法包括:
接收第一电子设备发送的增强语音包;
检测所述增强语音包是否携带有激活标记;
若携带有所述激活标记,禁止输出所述增强语音包;
若未携带有所述激活标记,输出所述增强语音包;
其中,携带所述激活标记的增强语音包包括:所述第一电子设备检测到当前语音帧的激活分数达到第一激活阈值但未达到第二激活阈值的情况下,由所述当前语音帧的增强语音帧、采集时间点及确定的所述激活标记构建的增强语音包,所述激活分数能够表示当前已采集到的语音帧包含所述第一电子设备的语音识别引擎的激活词的概率;
未携带所述激...

【专利技术属性】
技术研发人员:张银平汪俊杰杨琳徐培来张传良
申请(专利权)人:北京联想软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1