【技术实现步骤摘要】
一种语音交互方法、装置、设备和计算机存储介质
本申请涉及计算机应用
,特别涉及人工智能领域的一种语音交互方法、装置、设备和计算机存储介质。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就被认为是现有技术。随着语音交互技术的不断发展,用户能够与智能音箱、智能手机等终端设备进行语音交互。除了终端设备操作系统自带的语音助手之外,越来越多的应用搭载了语音交互技术。用户能够通过输入语音指令获取对应的服务,从而在很大程度上解放双手。现有语音交互场景中,在对用户输入的语音指令进行语音识别和需求理解后,如果不能够很好地理解用户需求,则会向用户返回以下两种语音响应:1)返回不理解用户需求的结果,例如“对不起,暂时不理解你讲了啥”。2)向用户返回提示用户更换语音指令的结果,例如“对不起,请您更换个简单点的说法试试”。但无论上述哪种语音响应均给用户带来较差的体验,用户会觉得语音助手的智能化程度太差,另外需要反复变换输入的语音指令,对于用户 ...
【技术保护点】
1.一种语音交互方法,其特征在于,该方法包括:/n对用户输入的第一语音指令进行语音识别和需求解析;/n若需求解析失败,则对所述第一语音指令进行需求预测,得到至少一个需求表述;/n将所述需求表述中的至少一个通过问询的形式返回给所述用户;/n若接收到所述用户确定所述需求表述中的至少一个的第二语音指令,则利用所述用户确定的需求表述对应的需求解析结果进行服务响应。/n
【技术特征摘要】
1.一种语音交互方法,其特征在于,该方法包括:
对用户输入的第一语音指令进行语音识别和需求解析;
若需求解析失败,则对所述第一语音指令进行需求预测,得到至少一个需求表述;
将所述需求表述中的至少一个通过问询的形式返回给所述用户;
若接收到所述用户确定所述需求表述中的至少一个的第二语音指令,则利用所述用户确定的需求表述对应的需求解析结果进行服务响应。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
若需求解析成功,则利用所述第一语音指令对应的需求解析结果进行服务响应。
3.根据权利要求1所述的方法,其特征在于,对所述第一语音指令进行需求预测,得到至少一个需求表述包括:
将所述第一语音指令输入预先训练得到的需求预测模型,所述需求预测模型将所述第一语音指令映射至至少一个需求表述。
4.根据权利要求3所述的方法,其特征在于,所述需求预测模型采用以下方式预先训练得到:
获取训练数据,所述训练数据包括多个语句对,所述语句对包括第一语句和第二语句,其中第二语句能够被需求解析成功;
利用所述训练数据训练序列到序列Seq2Seq模型,得到所述需求预测模型,其中语句对中第一语句作为所述Seq2Seq模型的输入,第二语句作为所述Seq2Seq模型的目标输出。
5.根据权利要求4所述的方法,其特征在于,所述训练数据从文本搜索日志中获取;
其中将文本搜索请求query作为第一语句,利用query所对应的被点击搜索结果得到第二语句,将所述第一语句和所述第二语句构成语句对,第二语句的置信度由第一语句作为query时所述第二语句的被点击次数确定。
6.根据权利要求3所述的方法,其特征在于,将所述需求表述中的至少一个通过问询的形式返回给所述用户包括:
将所述需求预测模型映射得到的至少一个需求表述中置信度最高的需求表述作为所述第一需求表述;
将所述第一需求表述通过问询的形式返回给所述用户。
7.根据权利要求6所述的方法,其特征在于,将所述需求表述中的至少一个通过问询的形式返回给所述用户还包括:
若接收到所述用户否定所述第一需求表述的第三语音指令,则将所述需求预测模型映射得到的至少一个需求表述中置信度次高的需求表述作为第二需求表述;
将第二需求表述通过问询的形式返回给所述用户。
8.根据权利要求3所述的方法,其特征在于,将所述需求表述中的至少一个通过问询的形式返回给所述用户包括:
将所述需求预测模型映射得到的至少一个需求表述中置信度排在前N个的需求表述,通过问询的形式返回给所述用户,所述N为预设的正整数。
9.根据权利要求1、6或8所述的方法,其特征在于,该方法还包括:
分析所述需求解析失败的原因,在所述问询中进一步携带所述需求解析失败的原因。
10.根据权利要求9所述的方法,其特征在于,所述需求解析失败的原因包括:
环境嘈杂、所述第一语音指令的长度超限、所述第一语音指令的发音不准确或所述第一语音指令口语化。
11.一种语音交互装置,其特征在于,该装置包括:
语音交互单...
【专利技术属性】
技术研发人员:王海峰,黄际洲,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。