基于连续语音的多轮交互方法、装置、介质及设备制造方法及图纸

技术编号:36546395 阅读:12 留言:0更新日期:2023-02-04 16:58
本发明专利技术提供基于连续语音的多轮交互方法、装置、介质及设备。所述基于连续语音的多轮交互方法包括:获取第一语音,在所述获取第一语音的过程中持续检测用户停顿;在检测到所述用户停顿时,进行语句划分;在停止获取所述第一语音之后,解析划分后的各第一语句的语义信息;根据所述第一语音的各所述语义信息执行相应操作。本发明专利技术等用户连续语音都采集完后再一起解析,节省了多轮交互中用户的等待时间,从而可以更加快速地、更加灵敏地进行连续语音的多轮交互。多轮交互。多轮交互。

【技术实现步骤摘要】
基于连续语音的多轮交互方法、装置、介质及设备


[0001]本专利技术涉及语音交互
,特别是涉及基于连续语音的多轮交互方法、装置、介质及设备。

技术介绍

[0002]在当前的人机语音交互场景中,多轮语音交互方式较为繁琐,计算机在检测到一段语音到理解这段语音的时间内无法同时处理新的语音,而是必须在完成这段语音的语义解析后才能再次处理新的语音。在计算机理解语音的时间段内,用户只能无奈地等待,导致用户体验不佳,不能满足用户快速、准确的人机交互需求。

技术实现思路

[0003]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供基于连续语音的多轮交互方法、装置、介质及设备,用于解决现有技术中的以上不足。
[0004]为实现上述目的及其他相关目的,本专利技术提供一种基于连续语音的多轮交互方法,包括步骤:获取第一语音,在所述获取第一语音的过程中持续检测用户停顿;在检测到所述用户停顿时,进行语句划分;在停止获取所述第一语音之后,解析划分后的各第一语句的语义信息;根据所述第一语音的各所述语义信息执行相应操作。
[0005]于本专利技术一实施例中,所述方法还包括:在所述解析划分后的各第一语句的语义信息的步骤之后,按时间顺序存储各所述语义信息。
[0006]于本专利技术一实施例中,所述方法还包括:在所述解析划分后的各第一语句的语义信息的步骤之后,显示所述第一语音的各所述语义信息。
[0007]于本专利技术一实施例中,所述方法还包括:在解析所述第一语音的过程中,若获取第二语音,则抛弃对所述第一语音的解析;在所述获取第二语音的过程中持续检测用户停顿;在检测到所述用户停顿时,进行语句划分;在停止获取所述第二语音之后,解析划分后的各第二语句的语义信息;根据所述第二语音的各所述语义信息执行相应操作。
[0008]于本专利技术一实施例中,所述方法还包括:在所述解析划分后的各第二语句的语义信息的步骤之后,显示所述第二语音的各所述语义信息。
[0009]于本专利技术一实施例中,所述第一或第二语音为用户说出的在线预订需求信息。
[0010]于本专利技术一实施例中,所述在线预订需求信息包括:预订对象语句、预订地点语句、预订时间语句及预订入住日期语句中的至少两者。
[0011]为实现上述目的及其他相关目的,本专利技术提供一种基于连续语音的多轮交互装置,包括:语音获取模块,用于获取第一语音;语句划分模块,用于在所述语音获取模块获取第一语音的过程中持续检测用户停顿,并在检测到所述用户停顿时,进行语句划分;语义解析模块,用于在所述语音获取模块停止获取所述第一语音之后,解析划分后的各第一语句的语义信息;语音交互模块,用于根据所述第一语音的各所述语义信息执行相应操作。
[0012]为实现上述目的及其他相关目的,本专利技术提供一种计算机可读存储介质,其中存
储有计算机程序,所述计算机程序被处理器加载执行时,实现所述的基于连续语音的多轮交互方法。
[0013]为实现上述目的及其他相关目的,本专利技术提供一种电子设备,包括:处理器及存储器;其中,所述存储器用于存储计算机程序;所述处理器用于加载执行所述计算机程序,以使所述电子设备执行所述的基于连续语音的多轮交互方法。
[0014]如上所述,本专利技术的基于连续语音的多轮交互方法、装置、介质及设备,获取第一语音,在所述获取第一语音的过程中持续检测用户停顿;在检测到所述用户停顿时,进行语句划分;在停止获取所述第一语音之后,解析划分后的各第一语句的语义信息;根据所述第一语音的各所述语义信息执行相应操作;本专利技术等用户连续语音都采集完后再一起解析,从而节省了多轮交互中用户的等待时间,可以更加快速地、更加灵敏地进行连续语音的多轮交互。
附图说明
[0015]图1显示为现有技术中多轮场景下的人机交互流程图。
[0016]图2显示为本专利技术一实施例中基于连续语音的多轮交互方法的流程图。
[0017]图3显示为本专利技术另一实施例中基于连续语音的多轮交互方法的流程图。
[0018]图4显示为本专利技术一实施例中基于连续语音的多轮交互装置的模块图。
[0019]图5显示为本专利技术一实施例中电子设备的结构示意图。
具体实施方式
[0020]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0021]需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图示中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
[0022]如图1所示,显示为现有技术中多轮场景下(订酒店)的人机交互流程图。需说明的是,图1以订酒店为例展示了现有多轮场景的人机交互流程,但多轮场景并不仅限于此,还可以为订机票、导航、点餐等等,由于篇幅有限便不一一列举。
[0023]在图1所示的示例中,用户与计算机共进行了5次交互,通过这5次交互才最终完成了酒店的预订,具体的:
[0024]第一次,用户说出语音“帮我订个酒店”,车机/语音识别模块识别该语音并解析该语音的语义,完成后播放语音“住哪里的酒店?”;
[0025]第二次,用户说出语音“南京市玄武区”,车机/语音识别模块识别该语音并解析该语音的语义,完成后播放语音“住几天?”;
[0026]第三次,用户说出语音“1天”,车机/语音识别模块识别该语音并解析该语音的语
义,完成后播放语音“入住日期?”;
[0027]第四次,用户说出语音“今天”,车机/语音识别模块识别该语音并解析该语音的语义,完成后播放语音“已找到一家酒店,是否支付?”;
[0028]第五次,用户说出语音“确认支付”,车机/语音识别模块完成订酒店的服务。
[0029]在这5次人机交互中,每次交互过程中的语义解析期间,用户只能等待,不能连续说出指令,因为计算机在此期间内无法再次处理新语音。在这5次人机交互中,用户总共等待的时间为四次语义解析的时间,人机交互耗费的时间较长,用户体验较差。
[0030]鉴于现有技术中的以上不足,本申请提出一种基于连续语音的多轮交互方法,用户可以连续说出语音,等用户连续语音都采集完后再一起解析,从而可以快速、灵敏地给出最终交互结果,大大节省了用户多轮交互时间,有效提升了用户使用体验。以下将结合附图对该技术原理的实现做详细阐述。
[0031]如图2所示,本实施例提供一种基于连续语音的多轮交互方法,包括以下步骤:
[0032]S21:获取第一语音,在所述获取第一语音的过程中持续检测用户停顿;
[0033]具体的,第一语音优选来源于登录授权的用户,而非本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于连续语音的多轮交互方法,其特征在于,包括步骤:获取第一语音,在所述获取第一语音的过程中持续检测用户停顿;在检测到所述用户停顿时,进行语句划分;在停止获取所述第一语音之后,解析划分后的各第一语句的语义信息;根据所述第一语音的各所述语义信息执行相应操作。2.根据权利要求1所述的方法,其中,所述方法还包括:在所述解析划分后的各第一语句的语义信息的步骤之后,按时间顺序存储各所述语义信息。3.根据权利要求1所述的方法,其中,所述方法还包括:在所述解析划分后的各第一语句的语义信息的步骤之后,显示所述第一语音的各所述语义信息。4.根据权利要求1所述的方法,其中,所述方法还包括:在解析所述第一语音的过程中,若获取第二语音,则抛弃对所述第一语音的解析;在所述获取第二语音的过程中持续检测用户停顿;在检测到所述用户停顿时,进行语句划分;在停止获取所述第二语音之后,解析划分后的各第二语句的语义信息;根据所述第二语音的各所述语义信息执行相应操作。5.根据权利要求4所述的方法,其中,所述方法还包括:在所述解析划分后的各第二语句的语义信息的步骤之后,显示所述第二语音的各所...

【专利技术属性】
技术研发人员:褚枭阳
申请(专利权)人:博泰车联网南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1