The invention discloses a voice interaction method, device, device and storage medium. The method can be applied to naked-eye 3D display device. Specifically, when the directional voice acquisition device in naked-eye 3D display device collects the target interactive voice in the target area, the target interactive voice is analyzed and processed, and the target interactive text corresponding to the target interactive voice is obtained. Extract the key information in the target interactive text, and get the target response text corresponding to the target interactive voice according to the key information; synthesize the target response text and play the target response voice. The technical scheme of the embodiment of the present invention solves the technical problem that the bare-eyed 3D display device can not realize human-computer interaction in the prior art, realizes that the bare-eyed 3D device has the function of human-computer interaction, and improves the technical effect of user experience.
【技术实现步骤摘要】
一种语音交互方法、装置、设备及存储介质
本专利技术实施例涉及语音交互
,尤其涉及一种语音交互方法、装置、设备及存储介质。
技术介绍
用户在观看物体时,既可以感知物体的形状,也可以感知物体远离自己以及与物体的相对位置关系,能够显示这种完整的物体空间信息的显示器称为3D显示器。随着科学技术的发展,3D显示技术已经发展起来了。但是,现有技术中的裸眼3D显示装置中还没有实现语音信息交互的功能。
技术实现思路
本专利技术提供一种语音交互方法、装置、设备及存储介质,以实现裸眼3D装置可以实现人机交互的技术效果。第一方面,本专利技术实施例提供了一种语音交互方法,该方法应用于裸眼3D显示装置中,具体包括:当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本;提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本;将所述目标应答文本合成为目标应答语音进行播放。第二方面,本专利技术实施例还提供了一种语音交互装置,该装置包括:应用于裸眼3D装置中的交互语音处理模块、语言处理模块以及语音播放模块;所述交互语音处理模块,用于当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本;所述语言处理模块,用于提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本;将所述语音播放模块,用于所述目标应答文本合成为目标应答语音进行播 ...
【技术保护点】
1.一种语音交互方法,应用于裸眼3D显示装置中,其特征在于,包括:当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本;提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本;将所述目标应答文本合成为目标应答语音进行播放。
【技术特征摘要】
1.一种语音交互方法,应用于裸眼3D显示装置中,其特征在于,包括:当裸眼3D显示装置中的指向性语音采集设备采集到目标区域内的目标交互语音时,对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本;提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本;将所述目标应答文本合成为目标应答语音进行播放。2.根据权利要求1所述的方法,其特征在于,所述对所述目标交互语音进行分析处理,得到与所述目标交互语音相对应的目标交互文本包括:将采集到的所述目标交互语音由模拟信号转换为数字信号,将所述数字信号作为输入参数,输入至预先训练完成的目标声学模型中进行处理,得到与所述目标交互语音相对应的特征序列;将所述特征序列作为输入参数输入至预先训练完成的语言模型中进行处理,得到与所述目标交互语音相对应的目标交互文本。3.根据权利要求2所述的方法,其特征在于,还包括:基于贝叶斯统计建模框架最大后验概率决策准则,对预先建立的初始声学模型进行训练得到目标声学模型。4.根据权利要求1所述的方法,其特征在于,所述提取所述目标交互文本中的关键信息,并根据所述关键信息获取所述目标交互语音相对应的目标应答文本,包括:对所述目标交互文本进行分词以及词性标记,并提取所述目标交互文本中的关键词;根据所述关键词获取与所述目标交互语音相对应的至少一个应答文本,作为候选应答文本;根据预设规则将所述候选应答文本进行排序,将排在第一个位置的所述候选应答文本作为目标应答文本;其中,所述关键词包括所述语音文本中的时间、地点、人物、事件、原因或者结果中的至少一种。5.根据权利要求1所述的方法,其特征在于,所述提取所述目标交互文本中的关键信...
【专利技术属性】
技术研发人员:程俊,
申请(专利权)人:上海玮舟微电子科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。