一种多轮人机对话方法、装置及设备制造方法及图纸

技术编号:22022241 阅读:20 留言:0更新日期:2019-09-04 01:17
本发明专利技术实施例公开了一种多轮人机对话方法、装置和设备,该方法包括:客户端获取用户在当前对话轮次下输入的用户交互语音,并解析以得到解析指令;所述客户端若确定为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;所述客户端接收到所述服务器的确认返回响应,将存储的所述上一级机器应答数据呈现给用户。本发明专利技术实施例的技术方案,客户端解析用户交互语音为返回指令时,通过发送信息标识以及获取服务器的确认返回响应,调取对应的机器应答数据呈现给用户,实现了人机之间的多轮对话,提高了用户体验,同时减少了客户端占用的数据带宽,节省了服务器资源。

A Multi-Round Man-Machine Dialogue Method, Device and Equipment

【技术实现步骤摘要】
一种多轮人机对话方法、装置及设备
本专利技术实施例涉及人机交互
,尤其涉及一种多轮人机对话方法、装置及设备。
技术介绍
随着软件技术的不断进步,各种各样的应用程序(Application,简称APP)出现在人们视野中,语音交互功能作为用户与应用程序之间的一个无形纽带,已经成为了应用程序开发中一个极为重要的组成部分。目前开发的应用程序,在语音交互的会话过程中都是采用单轮会话,例如,用户在说“附近有什么好吃的”,语音交互功能返回的是美食列表,用户可以说餐厅的名字或者列表的索引标号,比如“第一个”,进入待该餐厅的详情界面,当用户不喜欢该餐厅或者想查看其它餐厅时,那么用户需要重新输入“附近有什么好吃的”。这样的语音交互方式在逻辑上存在较大缺陷,尤其缺乏上下文之间的关联性,需要服务器多次提供相同的会话内容,尤其当用户会话的层级较多时,用户往往需要频繁输入同一个问题,经过多次筛选后,才能到达需要的对话层级,大大增加了交互次数,延长了会话时长。
技术实现思路
本专利技术实施例提供了一种多轮人机对话方法、装置及设备实现了人机之间的多轮对话,保证了呈现数据的准确性,避免了客户端重复获取相同的数据内容,节省了服务器资源。第一方面,本专利技术实施例提供了一种多轮人机对话方法,包括:客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;所述客户端若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;所述客户端根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。第二方面,本专利技术实施例提供了一种多轮人机对话方法,包括:服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音;所述服务器若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;所述服务器将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。第三方面,本专利技术实施例提供了一种多轮人机对话装置,应用于客户端中,包括:指令解析模块,用于获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;信息标识获取模块,用于若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;机器应答数据呈现模块,用于根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。第四方面,本专利技术实施例提供了一种多轮人机对话装置,应用于服务器中,包括:用户交互语音获取模块,用于接收客户端发送的用户在当前对话轮次下输入的用户交互语音;指令响应模块,用于若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;第一数据同步模块,用于将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。第五方面,本专利技术实施例提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任意实施例所述的多轮人机对话方法。第六方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例所述的多轮人机对话方法。本专利技术实施例的技术方案,通过客户端对用户交互语音进行解析,在用户交互语音为返回指令时,将存储的信息标识发送至服务器,并在收到服务器的确认返回响应后,本地调取对应的机器应答数据呈现给用户,实现了人机之间的多轮对话,提高了用户体验,并通过验证了信息标识的有效性,保证了呈现数据的准确性,同时,减少了客户端占用的数据带宽,避免了从服务器重复获取相同的数据内容,节省了服务器资源。附图说明图1A是本专利技术实施例一提供的多轮人机对话方法的流程图;图1B是本专利技术实施例一提供的多轮人机对话方法的数据流程图;图2A是本专利技术实施例二提供的多轮人机对话方法的流程图;图2B是本专利技术实施例二提供的多轮人机对话方法的数据流程图;图3是本专利技术实施例三提供的多轮人机对话装置的结构框图;图4是本专利技术实施例四提供的多轮人机对话装置的结构框图;图5是本专利技术实施例五提供的设备的结构框图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1A为本专利技术实施例一提供的一种多轮人机对话方法的流程图,本实施例可适用于用户与客户端进行多轮人机对话的情况,该方法可以由本专利技术实施例中的多轮人机对话装置来执行,该装置可以通过软件和/或硬件实现,并一般可以集成在提供人机交互功能的客户端中,与提供机器应答数据的服务器配合使用,典型的,可以集成在车载导航客户端中,该方法具体包括如下步骤:S110、客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令。客户端(Client)是为用户提供本地服务的应用程序,安装在用户的客户机中,例如,安装在手机和电脑等电子设备中;安装在汽车、火车和飞机等交通工具的通信装置中。客户端包括了多种形式,例如,浏览网页使用的浏览器以及各种类型的应用程序(Application,APP)等。可选的,在本专利技术实施例中,对客户端的类型以及安装有客户端的客户机类型不作具体限定。本专利技术实施例中的客户端是具有人机交互功能的客户端,可以获取用户的交互语音。在当前对话中,客户端在获取到用户交互语音时,对所述用户交互语音进行指令解析,得到解析指令。可选的,在本专利技术实施例中,利用自动语音识别(AutomaticSpeechRecognition,简称ASR)技术和/或自然语言理解(NaturalLanguageUnderstanding,简称NLU)技术对所述用户交互语音进行指令解析,得到解析指令。ASR是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。NLU则是关注于文本的语义,即将文本内容转换为文本语义,文本中单词的确切含义并不重要,重要的是文本传达的语义信息。S120、所述客户端若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器。客户端根据解析后的指令,如果确认为返回指令;所述返回指令是用户发出的查看上一级机器应答数据的指令;若当前对话轮次的机器应答数据是基于另一个机器应答数据中的相关信息获取的,那么所述当前对话轮次的机器应答数据即作为所述另一个机器应答数据的下一级机器应答数据,所述另一个机器应本文档来自技高网...

【技术保护点】
1.一种多轮人机对话方法,其特征在于,包括:客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;所述客户端若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;所述客户端根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。

【技术特征摘要】
1.一种多轮人机对话方法,其特征在于,包括:客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;所述客户端若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;所述客户端根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。2.根据权利要求1所述的方法,其特征在于,在所述客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令之后,包括:所述客户端若确定所述解析指令为非返回指令,则将所述解析指令发送至服务器,以使所述服务器查找与所述解析指令匹配的机器应答数据并生成与所述机器应答数据匹配的信息标识;所述客户端若获取到由所述服务器发送的所述机器应答数据以及与所述机器应答数据匹配的信息标识,则进行本地存储,并将所述机器应答数据呈现给用户。3.根据权利要求1或2所述的方法,其特征在于,所述对所述用户交互语音进行指令解析,得到解析指令,包括:利用自动语音识别技术和/或自然语言理解技术对所述用户交互语音进行指令解析,得到解析指令。4.一种多轮人机对话方法,其特征在于,包括:服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音;所述服务器若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;所述服务器将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。5.根据权利要求4所述的方法,其特征在于,在服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音之后,包括:所述服务器若确定所述用户交互语音为非返回指令,则获取与所述用户交互语音匹配的机器应答数据,生成与所述机器应答数据匹配的信息标识,将所述机器应答数据和所述信息标识反馈给所述客户端,以使所述客户端将所述机器应答数据呈现给用户;所述服务器将所述机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。6.根据权利要求4所述的方法,其特征在于,所述信息标识包括哈希值。7.一种多轮人机对话装置,应用于客户端中,其特征在于,包括:指令解析模块,用于获取用户在当前对话轮次下...

【专利技术属性】
技术研发人员:吕飞飞张子隆刘炎吴浩
申请(专利权)人:大众问问北京信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1