一种语音交互方法和语音交互系统技术方案

技术编号:25528915 阅读:36 留言:0更新日期:2020-09-04 17:17
本发明专利技术公开了一种语音交互方法和语音交互系统。所述方法包括:互动式语音应答IVR模块获取用户的用户语音流,并将所述用户语音流发送至分析模块;所述分析模块获取所述用户语音流,并基于所述用户语音流确定是否生成打断消息;若生成所述打断消息,则所述分析模块将所述打断消息传输至所述IVR模块;所述IVR模块基于所述打断消息触发语音合成TTS模块停止语音合成。利用该方法,缩短了用户的通话时长,提升了用户的满意度。

【技术实现步骤摘要】
一种语音交互方法和语音交互系统
本专利技术实施例涉及通信
,尤其涉及一种语音交互方法和语音交互系统。
技术介绍
智能语音导航系统,基于业内领先的语音识别技术、自然语言处理技术、以及语音合成技术开发,与企业原有互动式语音应答(InteractiveVoiceResponse,IVR)系统对接后,实现用户电话呼入时通过语音方式表述业务诉求,系统将用户的语音转化为文本并准确理解用户的业务诉求,直接导航至用户所需IVR服务功能节点,化繁为简,缩短用户等待时间,提高用户体验。现有的智能语音导航系统虽然构建了一个体系完成的语音导航功能,但是在与用户交互时均是将待转换的文字合成一个个语音文件,并采用文件传输的方式将语音合成结果取回播放给用户听,并在语音合成结果播放结束后获取用户输入的指令,从而延长了用户的通话时长,降低了用户的满意度。
技术实现思路
本专利技术实施例提供了一种语音交互方法和语音交互系统,缩短了用户的通话时长,提升了用户的满意度。第一方面,本专利技术实施例提供了一种语音交互方法,包括:互动式语音应答IVR模块获取用户的用户语音流,并将所述用户语音流发送至分析模块;所述分析模块获取所述用户语音流,并基于所述用户语音流确定是否生成打断消息;若生成所述打断消息,则所述分析模块将所述打断消息传输至所述IVR模块;所述IVR模块基于所述打断消息触发语音合成TTS模块停止语音合成。进一步地,所述分析模块包括语音识别ASR模块;或所述分析模块包括ASR模块和自然语言处理NLP模块。进一步地,所述分析模块基于所述用户语音流确定是否生成打断消息,包括:ASR模块确定所述用户语音流对应的幅值是否大于预设阈值;若是,则生成打断消息。进一步地,所述分析模块基于所述用户语音流确定是否生成打断消息,包括:ASR模块将所述用户语音流转换为对应的用户文本信息,并将所述用户文本信息通过所述IVR模块传输至NLP模块;所述NLP模块确定所述用户文本信息对应的用户意图信息,并确定是否存在与所述用户意图信息匹配的预设意图;若存在,所述NLP模块将所述用户意图信息作为打断消息。进一步地,该方法,还包括:所述IVR模块基于所述用户意图信息触发对应的功能事件。进一步地,所述TTS模块生成对应所述功能事件的自助语音流,并将所述自助语音流传输至所述IVR模块,所述IVR模块播放所述自助语音流。进一步地,该方法,还包括:所述IVR模块确定所述用户语音流是否获取超时,若是,则所述IVR模块统计超时次数;若所述超时次数低于次数阈值,则所述IVR模块播放提示音。进一步地,该方法,还包括:所述IVR模块确定所述用户语音流是否转换失败,若是,则所述IVR模块统计超时次数;若所述超时次数低于次数阈值,则所述IVR模块播放提示音。进一步地,该方法,还包括:所述IVR模块确定所述用户语音流的意图分析是否失败,若是,则所述IVR模块统计超时次数;若所述超时次数低于次数阈值,则所述IVR模块播放提示音。第二方面,本专利技术实施例还提供了一种语音交互系统,所述语音交互系统执行本专利技术实施例所述的语音交互方法,所述语音交互系统包括:IVR模块、与所述IVR模块连接的分析模块和与所述IVR模块连接的TTS模块。本专利技术实施例提供了一种语音交互方法和语音交互系统,所述语音交互方法通过互动式语音应答IVR模块获取用户的用户语音流,并将所述用户语音流发送至分析模块;通过所述分析模块获取所述用户语音流,并基于所述用户语音流确定是否生成打断消息;若生成所述打断消息,则通过所述分析模块将所述打断消息传输至所述IVR模块;通过所述IVR模块基于所述打断消息触发语音合成TTS模块停止语音合成。利用上述技术方案,能够在有用户语音流输入时,有效的基于分析模块确定是否生成打断消息,以打断TTS模块输出自助语音流,进而缩短用户的通话时长,提升用户使用语音交互系统的满意度。附图说明图1为本专利技术实施例一提供的一种语音交互方法的流程示意图;图2为本专利技术实施例一提供的一种语音交互系统的架构示意图;图3为本专利技术实施例一提供的又一种语音交互方法的流程示意图;图4为本专利技术实施例一提供的一种普通打断机制的语音交互的流程示意图;图5为本专利技术实施例一提供的一种语义打断机制的语音交互的流程示意图;图6为本专利技术实施例一提供的一种打断消息传输示意图;图7为本专利技术实施例一提供的一种语音识别容错流程示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。此外,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。本专利技术使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”。实施例一图1为本专利技术实施例一提供的一种语音交互方法的流程示意图,该方法可适用于缩短用户通话时长的情况,该方法可以由语音交互系统来执行。该语音交互系统可以包括IVR模块、与所述IVR模块连接的分析模块和与所述IVR模块连接的TTS模块。其中,IVR模块能够实现IVR功能,IVR是一种功能强大的电话自动服务系统,在一体化呼叫中心平台中,IVR首先是一个子系统或模块,它与其他子系统协同来实现一个呼叫中心平台的标准功能。TTS模块具有语音合成(TextToSpeech,TTS)功能,TTS是让机器模仿人类说话。即输入一段文字,最终输出一段语音。目前主要应用在读书软件、导航软件和对话问答系统等中。分析模块可以包括语音识别(AutomaticSpeechRecognition,ASR)模块,ASR是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语音。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。分析模块还可以包括自然语言处理(NaturalLanguageProcessing,NLP)模块,NLP是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,包括:/n互动式语音应答IVR模块获取用户的用户语音流,并将所述用户语音流发送至分析模块;/n所述分析模块获取所述用户语音流,并基于所述用户语音流确定是否生成打断消息;/n若生成所述打断消息,则所述分析模块将所述打断消息传输至所述IVR模块;/n所述IVR模块基于所述打断消息触发语音合成TTS模块停止语音合成。/n

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:
互动式语音应答IVR模块获取用户的用户语音流,并将所述用户语音流发送至分析模块;
所述分析模块获取所述用户语音流,并基于所述用户语音流确定是否生成打断消息;
若生成所述打断消息,则所述分析模块将所述打断消息传输至所述IVR模块;
所述IVR模块基于所述打断消息触发语音合成TTS模块停止语音合成。


2.根据权利要求1所述的方法,其特征在于,所述分析模块包括语音识别ASR模块;或所述分析模块包括ASR模块和自然语言处理NLP模块。


3.根据权利要求1所述的方法,其特征在于,所述分析模块基于所述用户语音流确定是否生成打断消息,包括:
ASR模块确定所述用户语音流对应的幅值是否大于预设阈值;
若是,则生成打断消息。


4.根据权利要求1所述的方法,其特征在于,所述分析模块基于所述用户语音流确定是否生成打断消息,包括:
ASR模块将所述用户语音流转换为对应的用户文本信息,并将所述用户文本信息通过所述IVR模块传输至NLP模块;
所述NLP模块确定所述用户文本信息对应的用户意图信息,并确定是否存在与所述用户意图信息匹配的预设意图;
若存在,所述NLP模块将所述用户意图信息作为打断消息。

【专利技术属性】
技术研发人员:李蝉秀汪博艾巍张浩邹斯韬程榆谢隆飞邵小亮
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1