一种语音交互方法、装置、电子设备和介质制造方法及图纸

技术编号:28424891 阅读:33 留言:0更新日期:2021-05-11 18:33
本公开公开了一种语音交互方法、装置、电子设备和介质,涉及计算机技术领域,尤其涉及语音技术、云计算及云服务技术领域。具体实现方案为:在与用户进行语音交互的过程中,对语音交互信息进行处理得到处理结果;根据所述处理结果生成交互引导图像;向用户展示所述交互引导图像,用于引导用户继续进行语音交互。本公开实现了根据交互引导图像,高效、生动且直观的引导用户进行语音交互的效果,改善了用户体验。

【技术实现步骤摘要】
一种语音交互方法、装置、电子设备和介质
本公开涉及计算机
,尤其涉及语音技术、云计算及云服务
,特别涉及一种语音交互方法、装置、电子设备和介质。
技术介绍
随着计算机技术的普及,当今人们的生活已经逐渐走入智能时代。人们的衣食住行的方方面面都开始应用各种智能技术,智能技术将在人们生活的各个方面提供方便快捷的服务。智能语音交互技术就是一种典型的智能技术。当具备智能语音交互功能的设备被用户唤醒后,可与用户进行智能语音交互,以解决用户提出的问题。
技术实现思路
本公开提供了一种用于引导用户进行语音交互的方法、装置、电子设备和介质。根据本公开的一方面,提供了一种语音交互方法,包括:在与用户进行语音交互的过程中,对语音交互信息进行处理得到处理结果;根据所述处理结果生成交互引导图像;向用户展示所述交互引导图像,用于引导用户继续进行语音交互。根据本公开的另一方面,提供了一种语音交互装置,包括:处理结果获取模块,用于在与用户进行语音交互的过程中,对语音交互信息进行处理得到处理结果;交互引导图像生成模块,用于根据所述处理结果生成交互引导图像;交互引导图像展示模块,用于向用户展示所述交互引导图像,用于引导用户继续进行语音交互。根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开中任一项所述的方法。根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开中任一项所述的方法。根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开中任一项所述的方法。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本公开的限定。其中:图1是根据本公开实施例公开的一种语音交互方法的流程图;图2A是根据本申请实施例公开的一种语音交互方法的流程图;图2B是根据本公开实施例公开的一种拾音引导图像的示意图;图2C是根据本公开实施例公开的一种拾音符号的示意图;图2D是根据本公开实施例公开的一种识别结果引导图像的示意图;图2E是根据本公开实施例公开的一种图像展示方式的示意图;图2F是根据本公开实施例公开的一种拼接图像的示意图;图2G是根据本公开实施例公开的一种拼接图像的示意图;图3是根据本公开实施例公开的一种语音交互装置的结构示意图;图4是用来实现本公开实施例公开的语音交互方法的电子设备的框图。具体实施方式以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。申请人在研发过程中发现,现有的语音交互产品通常是以单调的文字结合语音的形式与用户进行交互,这种交互方式不够直观和生动,且也无法高效的引导用户继续进行语音交互,用户体验较差。图1是根据本公开实施例公开的一种语音交互方法的流程图,本实施例可以适用于引导用户进行语音交互的情况。本实施例方法可以由语音交互装置来执行,所述装置可采用软件和/或硬件实现,并可集成在任意的具有计算能力的电子设备上。如图1所示,本实施例公开的语音交互方法可以包括:S101、在与用户进行语音交互的过程中,对语音交互信息进行处理得到处理结果。其中,语音交互的过程表示语音交互产品根据用户的语音指令,与用户进行交互的过程。语音交互产品表示任意具有语音交互功能的设备,例如智能手机、智能音响和智能手表等。语音交互的过程包括但不限于语音识别功能唤醒过程、用户语音识别过程、用户意图识别过程和信息反馈过程。语音交互信息表示用户向语音交互产品发送的语音指令,包括但不限于语音唤醒指令和语音控制指令等,相应的,语音交互信息的处理结果包括但不限于语音识别功能已唤醒、语音识别功能未唤醒、用户语音识别结果以及用户意图识别结果等。在一种实施方式中,在语音交互产品的语音识别功能唤醒过程中,用户向语音交互产品发送语音唤醒指令,语音交互产品搭载的收音装置,例如麦克风等,会采集语音唤醒指令,并提取语音唤醒指令的声学特征,且将提取的声学特征与预存的声学特征进行匹配,根据匹配结果得到处理结果。可选的,若提取的声学特征与预存的声学特征匹配,则开启语音交互产品的语音识别功能,即处理结果为语音识别功能已唤醒;若提取的声学特征与预存的声学特征不匹配,则不开启语音交互产品的语音识别功能,即处理结果为语音识别功能未唤醒。可选的,除了以语音唤醒指令的方式来唤醒语音交互产品的语音识别功能以外,还可以通过人脸识别、指纹识别、虹膜识别或其他任意生物特征识别方式来唤醒语音交互产品的语音识别功能,本实施例并不对具体的唤醒方式进行限定。在另一种实施方式中,在用户语音识别过程中,用户向语音交互产品发送语音控制指令,语音交互产品采集语音控制指令并对语音控制指令进行语音识别,并将用户语音识别结果作为处理结果。在另一种实施方式中,在用户意图识别过程中,用户向语音交互产品发送语音控制指令,语音交互产品采集语音控制指令并对语音控制指令进行语音识别,并通过意图识别方法,例如基于词典以及模版的规则方法、基于查询点击日志方法或基于分类模型方法等,对用户语音识别结果进行意图识别,并将用户意图识别结果作为处理结果。通过在与用户进行语音交互的过程中,对语音交互信息进行处理得到处理结果,为后续生成交互引导图像奠定了基础。S102、根据所述处理结果生成交互引导图像。在一种实施方式中,根据处理结果的内容生成包含有文字信息的交互引导图像。其中,交互引导图像中的文字信息的字体、字号和字体粗细可根据需求进行设置;交互引导图像的形状可根据需求进行设置,可选的包括椭圆形形状;交互引导图像的背景效果可根据需求进行设置,例如背景效果包括纯色静态效果或渐变动态效果等。可选的,在所述处理结果为语音识别功能已唤醒的情况下,生成包含有唤醒提示文字的拾音引导图像;其中,所述拾音引导图像用于提示所述用户语音识别功能已处于唤醒状态。可选的,在所述处理结果为用户语音识别结果的情况下,生成包含有所述用户语音识别结果的识别结果引导图像。可选的,在所述处理结果为用户意图识别结果的情况下,根据所述用户意图识别结果确定待反馈信息,并生成包含有所述待反馈信息的反本文档来自技高网...

【技术保护点】
1.一种语音交互方法,包括:/n在与用户进行语音交互的过程中,对语音交互信息进行处理得到处理结果;/n根据所述处理结果生成交互引导图像;/n向用户展示所述交互引导图像,用于引导用户继续进行语音交互。/n

【技术特征摘要】
1.一种语音交互方法,包括:
在与用户进行语音交互的过程中,对语音交互信息进行处理得到处理结果;
根据所述处理结果生成交互引导图像;
向用户展示所述交互引导图像,用于引导用户继续进行语音交互。


2.根据权利要求1所述的方法,其中,所述根据所述处理结果生成交互引导图像,包括:
在所述处理结果为语音识别功能已唤醒的情况下,生成包含有唤醒提示文字的拾音引导图像;其中,所述拾音引导图像用于提示所述用户语音识别功能已处于唤醒状态。


3.根据权利要求2所述的方法,其中,所述拾音引导图像中包括拾音符号;
所述向用户展示所述交互引导图像,包括:
以预设动画效果向所述用户展示所述拾音引导图像中的拾音符号。


4.根据权利要求3所述的方法,其中,所述预设动画效果包括渐隐渐现动画效果。


5.根据权利要求1所述的方法,其中,所述根据所述处理结果生成交互引导图像,还包括:
在所述处理结果为用户语音识别结果的情况下,生成包含有所述用户语音识别结果的识别结果引导图像。


6.根据权利要求1所述的方法,其中,所述根据所述处理结果生成交互引导图像,还包括:
在所述处理结果为用户意图识别结果的情况下,根据所述用户意图识别结果确定待反馈信息,并生成包含有所述待反馈信息的反馈信息引导图像。


7.根据权利要求1所述的方法,其中,根据不同处理结果所生成的交互引导图像具有不同的背景效果。


8.根据权利要求1所述的方法,其中,所述向用户展示所述交互引导图像,包括:
生成语音交互产品的标志图像,并将所述语音交互产品的标志图像和所述交互引导图像共同展示给用户。


9.根据权利要求8所述的方法,其中,将所述语音交互产...

【专利技术属性】
技术研发人员:王峰磊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1