一种语音交互方法、装置、设备及存储介质制造方法及图纸

技术编号:20179336 阅读:45 留言:0更新日期:2019-01-23 01:12
本发明专利技术公开了一种语音交互方法、装置、设备及存储介质,该方法可以应用于裸眼3D显示装置中,具体包括:当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对目标交互语音进行分析处理,得到与目标交互语音相对应的目标交互文本;提取目标交互文本中的关键信息,并根据关键信息获取目标交互语音相对应的目标应答文本;将目标应答文本合成为目标应答语音进行播放。本发明专利技术实施例的技术方案,解决了现有技术中裸眼3D显示装置中无法实现人机交互的技术问题,实现了裸眼3D装置具备人机交互的功能,提高用户体验的技术效果。

A voice interaction method, device, device and storage medium

The invention discloses a voice interaction method, device, device and storage medium. The method can be applied to naked-eye 3D display device. Specifically, when the directional voice acquisition device in naked-eye 3D display device collects the target interactive voice in the target area, the target interactive voice is analyzed and processed, and the target interactive text corresponding to the target interactive voice is obtained. Extract the key information in the target interactive text, and get the target response text corresponding to the target interactive voice according to the key information; synthesize the target response text and play the target response voice. The technical scheme of the embodiment of the present invention solves the technical problem that the bare-eyed 3D display device can not realize human-computer interaction in the prior art, realizes that the bare-eyed 3D device has the function of human-computer interaction, and improves the technical effect of user experience.

【技术实现步骤摘要】
一种语音交互方法、装置、设备及存储介质
本专利技术实施例涉及语音交互
,尤其涉及一种语音交互方法、装置、设备及存储介质。
技术介绍
用户在观看物体时,既可以感知物体的形状,也可以感知物体远离自己以及与物体的相对位置关系,能够显示这种完整的物体空间信息的显示器称为3D显示器。随着科学技术的发展,3D显示技术已经发展起来了。但是,现有技术中的裸眼3D显示装置中还没有实现语音信息交互的功能。
技术实现思路
本专利技术提供一种语音交互方法、装置、设备及存储介质,以实现裸眼3D装置可以实现人机交互的技术效果。第一方面,本专利技术实施例提供了一种语音交互方法,该方法应用于裸眼3D显示装置中,具体包括:当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本;提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本;将所述目标应答文本合成为目标应答语音进行播放。第二方面,本专利技术实施例还提供了一种语音交互装置,该装置包括:应用于裸眼3D装置中的交互语音处理模块、语言处理模块以及语音播放模块;所述交互语音处理模块,用于当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本;所述语言处理模块,用于提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本;将所述语音播放模块,用于所述目标应答文本合成为目标应答语音进行播放。第三方面,本专利技术实施例提供一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例任一所述的语音交互方法。第四方面,本专利技术实施例提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本专利技术实施例任一所述的语音交互方法。本专利技术实施例的技术方案通过裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音,并对目标交互语音进行分析处理,得到与目标交互语音相对应的目标交互文本;进一步提取目标交互文本中的关键信息,并根据关键信息获取目标交互语音相对应的目标应答文本;最终将目标应答文本合成为目标应答语音进行播放,解决了现有技术中裸眼3D显示装置中无法实现人机交互的技术问题,实现了裸眼3D装置具备人机交互的功能,提高用户体验的技术效果。附图说明为了更加清楚地说明本专利技术示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本专利技术所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。图1为本专利技术实施例一所提供的一种语音交互方法的流程示意图;图2为本专利技术实施例二所提供的一种语音交互方法的另一流程示意图;图3为本专利技术实施例三所提供的一种语音交互装置结构示意图;图4为本专利技术实施例四所提供的一种设备结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一所提供的一种语音交互方法流程示意图,本实施例可应用于裸眼3D显示装置中,可以使裸眼3D显示装置实现语音交互的情况,该方法可以由语音交互装置来执行,该装置可以通过软件和/或硬件的形式实现。如图1所述,本实施例的方法包括:S110、当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对目标交互语音进行分析处理,得到与目标交互语音相对应的目标交互文本。其中,指向性语音采集设备,可以设置在裸眼3D显示装置中,可选的,设置在显示屏幕的外边缘,用于采集一定范围内发出的语音。需要说明的是,指向性语音设备具有一定的采集范围,可选的,指向性采集设备可以采集语音区域为,以指向性采集设备为中心,以一至两米的长度为母线,顶角为60度的圆锥体,也就是说指向性采集设备的采集区域可以是一个圆锥体区域,这样的好处在于可以适用不同身高的用户,以满足不同用户的需求。相应的,目标区域就可以理解为,指向性采集设备可以采集到语音的圆锥体区域,也就是说指向性设备可以采集该区域内发出的语音,若在其它区域发出语音时,该设备是无法采集到的。目标区域内发出的语音可以称为交互语音,其中,目标区域内发出的语音可以是用户发出的,也可以是其它设备发出的,只要在该区域内发出语音就可以称之为交互语音。当采集到交互语音时,就可以对交互语音进行处理,若需要确定相应的应答内容,则认为交互语音为目标交互语音,若是不需要对交互语音作为相应的应答,则称之为交互语音。也就是说,交互语音可以包括目标交互语音,将需要进一步处理的语音作为目标交互语音。需要说明的是,目标区域内用户的数量可以是一个、两个或者多个等,相应的采集到的语音可以是由多个用户发出的,当然也可以是其它设备发出的,只要在该区域内发出了语音,指向性采集设备就可以采集到语音。示例性的,在目标区域内有甲乙两个用户在交谈,甲用户说道:“今天天气真好”,乙说“是的”,此时指向性采集设备可以采集到“今天天气真好”和“是的”的语音,将采集到的语音成为交互语音。进一步的,可以对语音所处的情境进行判定,也就是判断是否需要对交互语音做出相应的回应。从情境可以判定交互语音只是两个用户的交谈,没有相应的问答,因此可以不用对交互语音做出相应的回应。若是甲用户说,今天天气怎样,那么裸眼3D显示装置中相应的模块,就需要去查找今天天气怎么样的资料,那么此时的交互语音就可以是目标交互语音。当采集到目标区域内的目标交互语音时,需要对交互语音进行分析处理。可选的,将采集到的目标交互语音由模拟信号转换为数字信号,将数字信号作为输入参数,输入至预先训练完成的目标声学模型中进行处理,得到与目标交互语音相对应的特征序列;将特征序列作为输入参数输入至预先训练完成的语言模型中进行处理,得到与目标交互语音相对应的目标交互文本。可以理解为,为了提高对目标交互语音的处理效果,可以先对目标交互语音进行去噪处理,再进行分帧处理,也就是将去噪处理后的目标交互语音由模拟信号转换为数字信号。可选的,采集到的语音为“今天天气怎么样”,将“今天天气怎么样”的模拟信号转换为与“今天天气怎么样”的数字信号。为了能够使计算机了解用户发出的语音是什么,还需要得到与目标交互语音相对应的特征序列,可以将目标交互语音的数字信号,输入至目标声学模型中来得到。示例性的,得到与“今天天气怎么样”的数字信号之后,将数字信号输入至预先训练完成的声学模型中,得到与目标交互语音相对应的特征序列。为了进一步确定用户或者设备发出的目标交互语音,将特征序列作为输入参数,输入至预先训练完成的语言模型中,得到与目标交互语音相对应的文本。在使用语言模型之前可以对语言模型进行训练,以使所述语言模型可以对不同种类语言进行处理。具体可以是,对词串进行统计建模生成本文档来自技高网...

【技术保护点】
1.一种语音交互方法,应用于裸眼3D显示装置中,其特征在于,包括:当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本;提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本;将所述目标应答文本合成为目标应答语音进行播放。

【技术特征摘要】
1.一种语音交互方法,应用于裸眼3D显示装置中,其特征在于,包括:当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本;提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本;将所述目标应答文本合成为目标应答语音进行播放。2.根据权利要求1所述的方法,其特征在于,所述对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本包括:将采集到的所述目标交互语音由模拟信号转换为数字信号,将所述数字信号作为输入参数,输入至预先训练完成的目标声学模型中进行处理,得到与所述目标交互语音相对应的特征序列;将所述特征序列作为输入参数输入至预先训练完成的语言模型中进行处理,得到与所述目标交互语音相对应的目标交互文本。3.根据权利要求2所述的方法,其特征在于,还包括:基于贝叶斯统计建模框架最大后验概率决策准则,对预先建立的初始声学模型进行训练得到目标声学模型。4.根据权利要求1所述的方法,其特征在于,所述提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本,包括:对所述目标交互文本进行分词以及词性标记,并提取所述目标交互文本中的关键词;根据所述关键词获取与所述目标交互语音相对应的至少一个应答文本,作为候选应答文本;根据预设规则将所述候选应答文本进行排序,将排在第一个位置的所述候选应答文本作为目标应答文本;其中,所述关键词包括所述语音文本中的时间、地点、人物、事件、原因或者结果中的至少一种。5.根据权利要求1所述的方法,其特征在于,所述提取所述目标交互文本中的关键信...

【专利技术属性】
技术研发人员:程俊
申请(专利权)人:上海玮舟微电子科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1