人机语音对话的控制方法、装置及电子设备制造方法及图纸

技术编号：34777587 阅读：12 留言：0更新日期：2022-09-03 19:29

本申请公开了一种人机语音对话的控制方法，包括：接收用户端进行人机语音对话的第一语音流及监控机器端进行所述人机语音对话的第二语音流；获取所述第一语音流在第一时间切片的第一状态特征和所述第二语音流在所述第一时间切片的第二状态特征；根据所述第一状态特征和所述第二状态特征，从设定的控制指令集中选择对应的控制指令；其中，所述控制指令集包括控制机器端播报的指令和控制机器端静音的指令；在所述第一时间切片之后，根据所述相匹配的控制指令控制所述机器端进行所述人机语音对话。该方法使得电子设备可以在任意时刻及时、准确的控制机器端响应用户发出的语音流，以降低响应延迟，提升用户体验。提升用户体验。提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
人机语音对话的控制方法、装置及电子设备

[0001]本公开涉及计算机
，更具体地，涉及一种人机语音对话的控制方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着计算机技术的不断发展，人机对话技术、尤其是人机语音对话技术被广泛应用于各种领域，极大的方便了人们生活。
[0003]目前在实现人机语音对话时，通常是基于人机文本对话模式进行对话，例如，在用户与智能音箱进行交互时，需要用户先唤醒设备，再发出语音，然后智能音箱基于用户语音进行应答；之后，需要用户再次唤醒设备并发出语音，设备才会再次进行应答。
[0004]在实现本申请的过程中，专利技术人发现，与文本对话不同，语音对话往往具有持续性和独占性的特点，在一方传达语音信息的过程中，另一方可以同时理解该信息以及打断以进行及时回复，而目前的人机语音对话方法是基于人机文本对话模式实现，在对话过程中存在不能及时、准确的进行对话反馈的问题。

技术实现思路

[0005]本公开实施例的一个目的是提供一种控制人机语音对话的新技术方案。
[0006]本公开的第一方面，提供了一种人机语音对话的控制方法，该方法包括：
[0007]接收用户端进行人机语音对话的第一语音流及监控机器端进行所述人机语音对话的第二语音流；
[0008]获取所述第一语音流在第一时间切片的第一状态特征和所述第二语音流在所述第一时间切片的第二状态特征；
[0009]根据所述第一状态特征和所述第二状态特征，从设定的控制指令集中选择对应的控制指...

【技术保护点】

【技术特征摘要】
1.一种人机语音对话的控制方法，包括：接收用户端进行人机语音对话的第一语音流及监控机器端进行所述人机语音对话的第二语音流；获取所述第一语音流在第一时间切片的第一状态特征和所述第二语音流在所述第一时间切片的第二状态特征；根据所述第一状态特征和所述第二状态特征，从设定的控制指令集中选择对应的控制指令；其中，所述控制指令集包括控制机器端播报的指令和控制机器端静音的指令；在所述第一时间切片之后，根据所述控制指令控制所述机器端进行所述人机语音对话。2.根据权利要求1所述的方法，其中，所述控制机器端播报的指令包括继续当前播报的第一控制指令、开始新的播报的第二控制指令、播报设定的句中承接内容的第三控制指令、播报设定的首轮问答内容的第四控制指令、播报设定的静音提示内容的第五控制指令中的至少一项；和/或，所述控制机器端静音的指令包括停止当前播报的第六控制指令、机器端保持静音的第七控制指令中的至少一项。3.根据权利要求1所述的方法，其中，所述获取所述第一语音流在第一时间切片的第一状态特征和所述第二语音流在所述第一时间切片的第二状态特征，包括：检测触发事件的发生；根据检测到的触发事件，获取所述第一语音流在检测到触发事件前的第一时间切片的第一状态特征和所述第二语音流在所述第一时间切片的第二状态特征。4.根据权利要求3所述的方法，其中，所述触发事件包括开启所述人机语音对话的事件、所述第一语音流出现非静音片段的事件、所述第一语音流出现静音片段的事件、所述第二语音流出现非静音片段的事件、所述第二语音流出现静音片段的事件、到达设定的触发时间中的至少一项。5.根据权利要求3所述的方法，其中，所述触发事件包括所述第一语音流出现非静音片段的事件，检测所述第一语音流出现非静音片段的事件的步骤，包括：拆分所述第一语音流，获得相邻的第一静音片段和第二静音片段，其中，所述第一静音片段早于所述第二静音片段；在所述第一静音片段和所述第二静音片段的时序不相连的情况下，提取所述第一静音片段与所述第二静音片段之间的语音片段作为非静音片段，并判定所述第一语音流出现非静音片段的事件。6.根据权利要求1所述的方法，其中，所述在设定的控制指令集中选择与所述第一状态特征和所述第二状态特征对应的控制指令，包括：根据所述第一状态特征和所述第二状态特征，判断所述机器端在所述第一时间切片之后是否具有话语权，得到判断结果；根据所述判断结果，在所述控制指令集中选择与所述第一状态特征和所述第二状态特征对应的控制指令。7.根据权利要求6所述的方法，其中，所述根据所述第一状态特征和所述第二状态特征，判断所述机器端在所述第一时间切片之后是否具有话语权，得到判断结果，包括：
在所述第二状态特征为所述机器端保持非静音或者所述机器端由静音转为非静音的情况下，确定所述机器端在所述第一时间切片之后具有话语权；所述控制机器端播报的指令包括继续当前播报的第一控制指令，所述根据所述判断结果，在所述控制指令集中选择与所述第一状态特征和所述第二状态特征对应的控制指令，包括：在所述机器端具有话语权的情况下，选择所述第一控制指令作为所述对应的控制指令。8.根据权利要求6所述的方法，其中，所述根据所述第一状态特征和所述第二状态特征，判断所述机器端在所述第一时间切片之后是否具有话语权，得到判断结果，包括：在所述第一状态特征表示所述第一语音流出现非静音片段，及所述第二状态特征为所述机器端保持非静音或者所述机器端由静音转为非静音的情况下，确定所述机器端在所述第一时间切片之后不具有话语权；所述控制机器端静音的指令包括停止当前播报的第六控制指令，所述根据所述判断结果，在所述控制指令集中选择与所述第一状态特征和所述第二状态特征对应的控制指令，包括：在所述机器端不具有话语权的情况下，选择所述第六控制指令作为所述对应的控制指令。9.根据权利要求8所述的方法，其中，所述第一状态特征表示所述第一语音流出现非静音片段包括：所述用户端由静音转为非静音和/或所述用户端由非静音转为静音。10.根据权利要求6所述的方法，其中，所述根据所述第一状态特征和所述第二状态特征，判断所述机器端在所述第一时间切片之后是否具有话语权，得到判断结果，包括：在所述第一状态特征和所述第二状态特征均为对话起始状态的情况下，确定所述机器端在所述第一时间切片之后具有话语权；所述控制机器端播报的指令包括播报设定的首轮问答内容的第四控制指令，所述根据所述判断结果，在所述控制指令集中选择与所述第一状态特征和所述第二状态特征对应的控制指令，包括：在所述机器...

【专利技术属性】
技术研发人员：陈克寒，李泽中，戴苏洋，刘小明，
申请(专利权)人：阿里巴巴新加坡控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人