语音交互方法、装置、系统、交互设备和存储介质制造方法及图纸

技术编号:35043338 阅读:14 留言:0更新日期:2022-09-24 23:23
本申请涉及一种语音交互方法、装置、系统、交互设备和存储介质。所述方法应用于交互设备,交互设备与目标植物对应配置,目标植物还对应配置有对象检测器;所述方法包括:当确定对象检测器探测到有目标对象进入目标植物的预设范围时,从目标植物的待选交互文本集合中确定交互引导文本;按照与目标植物匹配的交互风格,将交互引导文本转换为语音并输出;获取目标对象对交互引导文本的语音输出进行响应时的响应信息;从待选交互文本集合中确定与响应信息对应的目标植物科普文本,将目标植物科普文本转换为语音并输出。上述方案,与靠近目标植物的目标对象实现智能化交互并进行植物科普信息的输出,能提高植物科普信息的输出效率。率。率。

【技术实现步骤摘要】
语音交互方法、装置、系统、交互设备和存储介质


[0001]本申请涉及网络
,特别是涉及一种语音交互方法、装置、系统、交互设备和存储介质。

技术介绍

[0002]植物园吸引着许多游客来悠闲娱乐、亲近自然以及学习自然界的知识。当前主要通过以下方式进行植物信息的科普:游客阅读标识牌记载的信息,游客阅读显示屏显示的信息,园区广播播报信息,导游讲解信息。以上方式,都是游客被动地接收植物园内的科普信息,往往难以引起参观植物园的游客(特别是小朋友)的兴趣,导致科普信息的输出效率低下。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高植物园科普信息的输出效率的语音交互方法、装置、系统、交互设备和存储介质。
[0005]一种语音交互方法,应用于交互设备,所述交互设备与目标植物对应配置,所述目标植物还对应配置有对象检测器,所述交互设备与所述对象检测器通讯连接;所述方法包括:当确定所述对象检测器探测到有目标对象进入所述目标植物的预设范围时,从所述目标植物的待选交互文本集合中确定交互引导文本;其中,所述待选交互文本集合中包含交互引导文本以及植物科普文本;按照与所述目标植物匹配的交互风格,将所述交互引导文本转换为语音并输出;其中,所述交互风格基于所述目标植物的特征信息确定;获取所述目标对象对所述交互引导文本的语音输出进行响应时的响应信息;从所述待选交互文本集合中确定与所述响应信息对应的目标植物科普文本,将所述目标植物科普文本转换为语音并输出。
[0006]在一可选实施例中,所述从所述待选交互文本集合中确定与所述响应信息对应的目标植物科普文本,将所述目标植物科普文本转换为语音并输出,包括:从所述待选交互文本集合中确定对所述响应信息进行响应的反馈文本;确定与所述响应信息以及所述反馈文本相匹配的目标植物科普文本;获取与所述目标植物的特征信息对应的拟人交互角色;其中,所述特征信息基于所述目标植物的属性特征、当前状态和历史经历得到;按照与所述拟人交互角色对应的交互风格,将所述反馈文本和所述目标植物科普文本转换为语音并输出。
[0007]在一可选实施例中,所述响应信息包括语音响应信息;所述获取所述目标对象对
所述交互引导文本的语音输出进行响应时的响应信息,包括:若在语音输出后的预设时间内获取到对所述交互引导文本的语音输出进行响应的语音输入,确定所述语音输入对应的语音内容;对所述语音内容进行关键词提取,并基于所提取的关键词确定对应的用户意图,作为所述语音响应信息。
[0008]在一可选实施例中,所述响应信息包括动作响应信息;所述获取所述目标对象对所述交互引导文本的语音输出进行响应时的响应信息,包括:触发视频采集器在语音输出后的预设时间内采集所述目标对象的视频帧;提取各个视频帧中的特征点,并基于不同视频帧内特征点的动态变化特征得到所述动作响应信息。
[0009]在一可选实施例中,所述从所述待选交互文本集合中确定与所述响应信息对应的目标植物科普文本,将所述目标植物科普文本转换为语音并输出,包括:从至少一个所述视频帧中提取所述目标对象的生物识别信息;基于所述动作响应信息和所述生物识别信息确定所述目标对象的对象状态信息;从所述待选交互文本集合中确定与所述对象状态信息对应的目标植物科普文本;确定与所述对象状态信息匹配的目标交互风格;将所述目标植物科普文本转换为语音并按照所述目标交互风格进行输出。
[0010]在一可选实施例中,所述待选交互文本集合中还包含推荐交互文本;所述获取所述目标对象对所述交互引导文本的语音输出进行响应时的响应信息之后,还包括:基于所述响应信息确定所述目标对象的用户画像;输出与所述用户画像对应的推荐信息。
[0011]在一可选实施例中,所述基于所述响应信息确定所述目标对象的用户画像,包括:触发视频采集器在语音输出后的预设时间内采集所述目标对象的视频帧;从至少一个所述视频帧中提取所述目标对象的动作响应信息和生物识别信息;若在语音输出后的预设时间内获取到对所述交互引导文本的语音输出进行响应的语音输入,基于所述语音输入得到语音响应信息;基于所述动作响应信息、所述语音响应信息和所述生物识别信息中的至少一项确定所述目标对象的用户画像。
[0012]在一可选实施例中,所述输出与所述用户画像对应的推荐信息,包括:当获取到景点推荐触发指令时,从云端数据库中获取所述目标植物所在植物园中多个景点的人员密集度,并基于所述人员密集度从所述多个景点中确定待选景点;所述人员密集度基于对应景点的当前人员数以及预约人员数确定;从所述待选景点中获取与所述用户画像匹配的目标景点;确定与所述目标景点对应的目标推荐交互文本并输出。
[0013]在一可选实施例中,所述待选交互文本集合中还包含推荐交互文本;所述确定与所述目标景点对应的目标推荐交互文本并输出,包括:从云端数据库中获取所述植物园的地图信息;所述地图信息中包含植物、园区、道路的位置信息;基于所述地图信息中的植物、园区、道路的位置信息生成到达所述目标景点的路
线信息;从所述待选交互文本集合中确定与所述目标景点匹配的目标推荐交互文本;将所述目标推荐交互文本和所述路线信息转换为语音并输出。
[0014]一种语音交互装置,应用于交互设备,所述交互设备与目标植物对应配置,所述目标植物还对应配置有对象检测器,所述交互设备与所述对象检测器通讯连接;所述装置包括:引导语音获取模块,用于当确定所述对象检测器探测到有目标对象进入所述目标植物的预设范围时,从所述目标植物的待选交互文本集合中确定交互引导文本;其中,所述待选交互文本集合中包含交互引导文本以及植物科普文本;引导语音输出模块,用于按照与所述目标植物匹配的交互风格,将所述交互引导文本转换为语音并输出;其中,所述交互风格基于所述目标植物的特征信息确定;响应信息获取模块,用于获取所述目标对象对所述交互引导文本的语音输出进行响应时的响应信息;科普语音输出模块,用于从所述待选交互文本集合中确定与所述响应信息对应的目标植物科普文本,并将所述目标植物科普文本转换为语音并输出。
[0015]一种语音交互系统,包括对象检测器、交互设备和云端服务器;所述交互设备分别与所述对象检测器和所述云端服务器通讯连接,所述对象检测器配置在目标植物上;所述云端服务器,用于确定所述目标植物的待选交互文本集合;所述对象检测器,用于探测对应目标植物的预设范围内的目标对象,当探测到有目标对象进入所述目标植物的预设范围时,向所述交互设备发送触发信号;所述交互设备,用于在接收所述触发信号时,从所述云端服务器的所述待选交互文本集合中确定交互引导文本;其中,所述待选交互文本集合中包含交互引导文本以及植物科普文本;按照与所述目标植物匹配的交互风格,将所述交互引导文本转换为语音并输出;其中,所述交互风格基于所述目标植物的特征信息确定;获取所述目标对象对所述交互引导文本的语音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,其特征在于,应用于交互设备,所述交互设备与目标植物对应配置,所述目标植物还对应配置有对象检测器,所述交互设备与所述对象检测器通讯连接;所述方法包括:当确定所述对象检测器探测到有目标对象进入所述目标植物的预设范围时,从所述目标植物的待选交互文本集合中确定交互引导文本;其中,所述待选交互文本集合中包含交互引导文本以及植物科普文本;按照与所述目标植物匹配的交互风格,将所述交互引导文本转换为语音并输出;其中,所述交互风格基于所述目标植物的特征信息确定;获取所述目标对象对所述交互引导文本的语音输出进行响应时的响应信息;从所述待选交互文本集合中确定与所述响应信息对应的目标植物科普文本,将所述目标植物科普文本转换为语音并输出。2.根据权利要求1所述的方法,其特征在于,所述从所述待选交互文本集合中确定与所述响应信息对应的目标植物科普文本,将所述目标植物科普文本转换为语音并输出,包括:从所述待选交互文本集合中确定对所述响应信息进行响应的反馈文本;确定与所述响应信息以及所述反馈文本相匹配的目标植物科普文本;获取与所述目标植物的特征信息对应的拟人交互角色;其中,所述特征信息基于所述目标植物的属性特征、当前状态和历史经历得到;按照与所述拟人交互角色对应的交互风格,将所述反馈文本和所述目标植物科普文本转换为语音并输出。3.根据权利要求1所述的方法,其特征在于,所述响应信息包括语音响应信息;所述获取所述目标对象对所述交互引导文本的语音输出进行响应时的响应信息,包括:若在语音输出后的预设时间内获取到对所述交互引导文本的语音输出进行响应的语音输入,确定所述语音输入对应的语音内容;对所述语音内容进行关键词提取,并基于所提取的关键词确定对应的用户意图,作为所述语音响应信息。4.根据权利要求1所述的方法,其特征在于,所述响应信息包括动作响应信息;所述获取所述目标对象对所述交互引导文本的语音输出进行响应时的响应信息,包括:触发视频采集器在语音输出后的预设时间内采集所述目标对象的视频帧;提取各个视频帧中的特征点,并基于不同视频帧内特征点的动态变化特征得到所述动作响应信息。5.根据权利要求4所述的方法,其特征在于,所述从所述待选交互文本集合中确定与所述响应信息对应的目标植物科普文本,将所述目标植物科普文本转换为语音并输出,包括:从至少一个所述视频帧中提取所述目标对象的生物识别信息;基于所述动作响应信息和所述生物识别信息确定所述目标对象的对象状态信息;从所述待选交互文本集合中确定与所述对象状态信息对应的目标植物科普文本;确定与所述对象状态信息匹配的目标交互风格;将所述目标植物科普文本转换为语音并按照所述目标交互风格进行输出。6.根据权利要求1所述的方法,其特征在于,所述获取所述目标对象对所述交互引导文本的语音输出进行响应时的响应信息之后,还包括:
基于所述响应信息确定所述目标对象的用户画像;输出与所述用户画像对应的推荐信息。7.根据权利要求6所述的方法,其特征在于,所述基于所述响应信息确定所述目标对象的用户画像,包括:触发视频采集器在语音输出后的预设时间内采集所述目标对象的视频帧;从至少一个所述视频帧中提取所述目标对象的动作响应信息和生物识别信息;若在语音输出后的预设时间内获取到对所述交互引导文本的语音输出进行响应的语音输入,基于所述语音输入...

【专利技术属性】
技术研发人员:林雨婷杨毅松麦凌倩
申请(专利权)人:深圳市人马互动科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1