语音交互方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:26890820 阅读:22 留言:0更新日期:2020-12-29 16:07
本申请涉及一种语音交互方法、装置、计算机设备和存储介质。所述方法包括:在播放语音的过程中,若接收到第一语音,则对所述第一语音进行意图识别得到第一意图,进入所述第一意图对应的对话状态;若所述对话状态属于第一类对话状态,则确定所述对话状态的触发条件;所述第一类对话状态是对应的意图与预设的确定性意图之间的差异度大于第一差异度阈值的状态;若所述第一语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态;所述初始状态是未接收到任何语音所处的状态。采用本方法能够提高语音交互的准确性。

【技术实现步骤摘要】
语音交互方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种语音交互方法、装置、计算机设备和存储介质。
技术介绍
随着计算机技术的发展,出现了人机交互技术。人机交互是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。用户与智能机器人可以采用语音进行交互,也可以采用文本进行交互,还可以采用其他方式进行交互。在传统技术中,用户与智能机器人在语音交互时,通常是智能机器人播放完整的语音后,再接收用户输入的语音进行处理。然而,这种传统的语音交互方法,无法更准确地实现语音交互。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高准确性的语音交互方法、装置、计算机设备和存储介质。一种语音交互方法,所述方法包括:在播放语音的过程中,若接收到第一语音,则对所述第一语音进行意图识别得到第一意图,进入所述第一意图对应的对话状态;若所述对话状态属于第一类对话状态,则确定所述对话状态的触发条件;所述第一类对话状态是对应的意图与预设的确定性意图之间的差异度大于第一差异度阈值的状态;若所述第一语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态;所述初始状态是未接收到任何语音所处的状态。在其中一个实施例中,所述若所述第一语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态,包括:若所述第一语音不符合所述对话状态的触发条件,检测是否接收到新的语音;若接收到第二语音,则判断所述第二语音是否符合所述对话状态的触发条件;若所述第二语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态。在其中一个实施例中,所述若接收到第二语音,则判断所述第二语音是否符合所述对话状态的触发条件,包括:若接收到第二语音,则对所述第二语音进行意图识别得到第二意图;基于所述第二意图判断所述第二语音是否符合所述对话状态的触发条件。在其中一个实施例中,所述基于所述第二意图判断所述第二语音是否符合所述对话状态的触发条件,包括:若所述第二意图与所述第一意图之间的差异度小于第二差异度阈值,则所述第二语音符合所述对话状态的触发条件;若所述第二意图与所述第一意图之间的差异度大于或等于第二差异度阈值,则所述第二语音不符合所述对话状态的触发条件。在其中一个实施例中,所述接收到第二语音,则判断所述第二语音是否符合所述对话状态的触发条件之后,还包括:若所述第二语音符合所述对话状态的触发条件,则对所述第二语音进行意图识别得到第二意图;基于所述第一意图和所述第二意图得到目标意图;获取所述目标意图对应的第一业务处理策略,按照所述第一业务处理策略进行处理。在其中一个实施例中,所述若所述对话状态属于第一类对话状态,则确定所述对话状态的触发条件之后,还包括:若所述第一语音符合所述对话状态的触发条件,则获取所述对话状态对应的第二业务处理策略,按照所述第二业务处理策略进行处理。在其中一个实施例中,所述进入所述第一意图对应的对话状态之后,还包括:若所述对话状态属于第二类对话状态,则获取所述对话状态对应的第三业务处理策略,按照所述第三业务处理策略进行处理;所述第二类对话状态是对应的意图与预设的确定性意图之间的差异度小于或等于第一差异度阈值的状态。一种语音交互装置,所述装置包括:意图识别模块,用于在播放语音的过程中,若接收到第一语音,则对所述第一语音进行意图识别得到第一意图,进入所述第一意图对应的对话状态;触发条件确定模块,用于若所述对话状态属于第一类对话状态,则确定所述对话状态的触发条件;所述第一类对话状态是对应的意图与预设的确定性意图之间的差异度大于第一差异度阈值的状态;状态切换模块,用于若所述第一语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态;所述初始状态是未接收到任何语音所处的状态。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。上述语音交互方法、装置、计算机设备和存储介质,在播放语音的过程中,若接收到第一语音,则对第一语音进行意图识别得到第一意图,进入第一意图对应的对话状态;若对话状态属于第一类对话状态,第一类对话状态是对应的意图与预设的确定性意图之间的差异度大于第一差异度阈值的状态,即第一意图与预设的确定性意图之间的差异较大,则进一步地确定对话状态的触发条件;若第一语音不符合对话状态的触发条件,则可以认为在播放语音的过程中接收到的第一语音是无意义语音,准确识别出语音播放过程中的无意义打断的语音片段,则将对话状态切换至未接收到任何语音所处的初始状态,可以在后续用户输入真正的有业务需求的语音时,更加准确地从初始状态切换至用户所需的业务的状态,也将初始状态的节点切换至用户所需的业务的节点,更准确实现语音交互。附图说明图1为一个实施例中语音交互方法的应用环境图;图2为一个实施例中语音交互方法的流程示意图;图3为一个实施例中服务器在播放语音的过程中接收到第一语音的情况;图4为一个实施例中语音交互方法的示意图;图5为另一个实施例中语音交互方法的示意图;图6为一个实施例中若第一语音不符合对话状态的触发条件,则将对话状态切换至初始状态步骤的流程示意图;图7为另一个实施例中语音交互方法的流程示意图;图8为一个实施例中状态切换的示意图;图9为一个实施例中语音交互装置的结构框图;图10为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的语音交互方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104在播放语音的过程中,若接收到终端102发送的第一语音,则对第一语音进行意图识别得到第一意图,进入第一意图对应的对话状态;若对话状态属于第一类对话状态,则确定对话状态的触发条件;第一类对话状态是对应的意图与预设的确定性意图之间的差异度大于第一差异度阈值的状态;若第一语音不符合对话状态的触发条件,则将对话状态切换至初始状态;初始状态是未接收到任何语音所处的状态。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。需要说明的是,在本申请的实施例中,终端102可与服务器104协同执行该语音交互方法,终端102和服务器104也均可单独用于执行该语音交互方法。在一本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,所述方法包括:/n在播放语音的过程中,若接收到第一语音,则对所述第一语音进行意图识别得到第一意图,进入所述第一意图对应的对话状态;/n若所述对话状态属于第一类对话状态,则确定所述对话状态的触发条件;所述第一类对话状态是对应的意图与预设的确定性意图之间的差异度大于第一差异度阈值的状态;/n若所述第一语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态;所述初始状态是未接收到任何语音所处的状态。/n

【技术特征摘要】
1.一种语音交互方法,其特征在于,所述方法包括:
在播放语音的过程中,若接收到第一语音,则对所述第一语音进行意图识别得到第一意图,进入所述第一意图对应的对话状态;
若所述对话状态属于第一类对话状态,则确定所述对话状态的触发条件;所述第一类对话状态是对应的意图与预设的确定性意图之间的差异度大于第一差异度阈值的状态;
若所述第一语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态;所述初始状态是未接收到任何语音所处的状态。


2.根据权利要求1所述的方法,其特征在于,所述若所述第一语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态,包括:
若所述第一语音不符合所述对话状态的触发条件,检测是否接收到新的语音;
若接收到第二语音,则判断所述第二语音是否符合所述对话状态的触发条件;
若所述第二语音不符合所述对话状态的触发条件,则将所述对话状态切换至初始状态。


3.根据权利要求2所述的方法,其特征在于,所述若接收到第二语音,则判断所述第二语音是否符合所述对话状态的触发条件,包括:
若接收到第二语音,则对所述第二语音进行意图识别得到第二意图;
基于所述第二意图判断所述第二语音是否符合所述对话状态的触发条件。


4.根据权利要求3所述的方法,其特征在于,所述基于所述第二意图判断所述第二语音是否符合所述对话状态的触发条件,包括:
若所述第二意图与所述第一意图之间的差异度小于第二差异度阈值,则所述第二语音符合所述对话状态的触发条件;
若所述第二意图与所述第一意图之间的差异度大于或等于第二差异度阈值,则所述第二语音不符合所述对话状态的触发条件。


5.根据权利要求2所述的方法,其特征在于,所述若接收到第二语音,则判断所述第二语音是否符合所述对话状态的触发条件之后,还包括:
若所述第二语音符合...

【专利技术属性】
技术研发人员:刘思亮文博刘云峰
申请(专利权)人:深圳追一科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1