语音交互实现方法、装置及电子设备制造方法及图纸

技术编号：25892367 阅读：43 留言：0更新日期：2020-10-09 23:36

本申请提出了一种语音交互控制方法、装置及电子设备，第一电子设备进行语音帧连续采集过程中，获取当前语音帧的激活分数以及增强语音帧，检测到所获取的激活分数达到第一激活阈值但未达到第二激活阈值时，将激活标记、采集时间点以及相应的增强语音帧构建成第一增强语音包发送至第二电子设备，第二电子设备会禁止输出携带激活标记的第一增强语音包，避免了该时间段接收到的可能为激活词的增强语音帧输出后，对接听用户造成干扰，降低在线语音交互质量；若预设采集时间段内获取的激活分数达到第二激活阈值，第二电子设备将输出在第一增强语音包中激活词的结束时间点之后获取的增强语音帧，以保证第一电子设备与第二电子设备之间的正常通话交流。

全部详细技术资料下载

【技术实现步骤摘要】
语音交互实现方法、装置及电子设备
本申请主要涉及多方通话应用领域，更具体地说是涉及一种语音交互实现方法、装置及电子设备。
技术介绍
目前，大部分电子设备配置有语音识别引擎(如语音助手)，并针对该语音识别引擎配置相应的激活词，用以激活该语音识别引擎进入工作状态，这样，用户可以直接说针对电子设备的语音控制指令，即可控制电子设备执行预设操作，无需用户手动操作，非常方便。然而，在电子设备应用于如会议、游戏等场景下，实现多用户在线语音交流过程中，电子设备采集到本地用户的语音信息后，无论在语音信息是否包含语音识别引擎的激活词，目前都是直接发送至其他用户的电子设备输出，从而导致本地用户所说的针对本地电子设备的激活词，对其他用户造成干扰，降低了在线语音通话质量，影响用户体验。
技术实现思路
有鉴于此，为了解决现有技术本地用户所说的针对本地电子设备的激活词，对其他用户造成干扰，降低了在线语音通话质量的技术问题，一方面，本申请提供了一种语音交互控制方法，所述方法包括：在语音帧连续采集过程中，获取采集的当前语音帧的激活分数及增强语音帧，所述激活分数能够表示当前已采集到的语音帧包含第一电子设备的语音识别引擎的激活词的概率；检测所述激活分数达到第一激活阈值但未达到第二激活阈值，确定所述当前语音帧的类型标记为激活标记，由相应的增强语音帧、采集时间点及所述激活标记构建第一增强语音包；将所述第一增强语音包发送至第二电子设备，以使所述第二电子设备禁止输出所述第一增强语音包，直至在预设采集时间段内获取...

【技术保护点】
1.一种语音交互控制方法，所述方法包括：/n在语音帧连续采集过程中，获取采集的当前语音帧的激活分数及增强语音帧，所述激活分数能够表示当前已采集到的语音帧包含第一电子设备的语音识别引擎的激活词的概率；/n检测所述激活分数达到第一激活阈值但未达到第二激活阈值，确定所述当前语音帧的类型标记为激活标记，由相应的增强语音帧、采集时间点及所述激活标记构建第一增强语音包；/n将所述第一增强语音包发送至第二电子设备，以使所述第二电子设备禁止输出所述第一增强语音包，直至在预设采集时间段内获取的激活分数达到所述第二激活阈值，确定得到的第一增强语音包中激活词的结束时间点；/n由所述结束时间点之后获取的增强语音帧及相应的采集时间点构建第二增强语音包，将所述第二增强语音包发送至所述第二电子设备输出。/n

【技术特征摘要】
1.一种语音交互控制方法，所述方法包括：
在语音帧连续采集过程中，获取采集的当前语音帧的激活分数及增强语音帧，所述激活分数能够表示当前已采集到的语音帧包含第一电子设备的语音识别引擎的激活词的概率；
检测所述激活分数达到第一激活阈值但未达到第二激活阈值，确定所述当前语音帧的类型标记为激活标记，由相应的增强语音帧、采集时间点及所述激活标记构建第一增强语音包；
将所述第一增强语音包发送至第二电子设备，以使所述第二电子设备禁止输出所述第一增强语音包，直至在预设采集时间段内获取的激活分数达到所述第二激活阈值，确定得到的第一增强语音包中激活词的结束时间点；
由所述结束时间点之后获取的增强语音帧及相应的采集时间点构建第二增强语音包，将所述第二增强语音包发送至所述第二电子设备输出。

2.根据权利要求1所述的方法，所述在预设采集时间段内获取的激活分数达到所述第二激活阈值，确定携带有所述激活标记的增强语音包中激活词的结束时间点，包括：
在预设采集时间段内获取的激活分数达到所述第二激活阈值，确定在所述预设采集时间段内采集到的语音帧包含所述语音识别引擎的激活词，生成相应的激活检测结果；
将所述激活检测结果发送至所述第二电子设备，以使所述第二电子设备从所述预设采集时间段内接收到的第一增强语音包中，确定激活词的结束时间点；
接收所述第二电子设备反馈的所述结束时间点。

3.根据权利要求1所述的方法，所述方法还包括：
获取所述当前语音帧的减弱语音帧；
在所述确定所述当前语音帧的类型标记为激活标记的情况下，所述方法还包括：
由所述当前语音帧的减弱语音帧、采集时间点及所述激活标记构建第一减弱语音包；
将所述第一减弱语音包发送至所述第二电子设备，以使得所述第二电子设备输出所述第一减弱语音包。

4.根据权利要求1所述的方法，所述方法还包括：
检测所述激活分数未达到第一激活阈值，由所述当前语音帧的增强语音帧，及相应的采集时间点构建第二增强语音包，将所述第二增强语音包发送至所述第二电子设备输出。

5.根据权利要求1～4任一项所以的方法，所述方法还包括：
若在所述预设采集时间段内获取的激活分数未达到所述第二激活阈值，确定在所述预设采集时间段内采集到的语音帧未包含所述语音识别引擎的激活词，并生成相应的语音检测结果；
将所述语音检测结果发送至第二电子设备，以使所述第二电子设备输出在所述预设采集时间段内接收到的所述第一增强语音包；
由当前时间点之后获取的增强语音帧，及相应的采集时间点构建第二增强语音包，将所述第二增强语音包发送至第二电子设备输出。

6.一种语音交互控制方法，所述方法包括：
接收第一电子设备发送的增强语音包；
检测所述增强语音包是否携带有激活标记；
若携带有所述激活标记，禁止输出所述增强语音包；
若未携带有所述激活标记，输出所述增强语音包；
其中，携带所述激活标记的增强语音包包括：所述第一电子设备检测到当前语音帧的激活分数达到第一激活阈值但未达到第二激活阈值的情况下，由所述当前语音帧的增强语音帧、采集时间点及确定的所述激活标记构建的增强语音包，所述激活分数能够表示当前已采集到的语音帧包含所述第一电子设备的语音识别引擎的激活词的概率；
未携带所述激...

【专利技术属性】
技术研发人员：张银平，汪俊杰，杨琳，徐培来，张传良，
申请(专利权)人：北京联想软件有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人