一种元宇宙智能语音交互方法及系统技术方案

技术编号:36809543 阅读:16 留言:0更新日期:2023-03-09 00:36
本申请属于元宇宙交互技术领域,公开了一种元宇宙智能语音交互方法及系统。通过获取交互日志记录和多通道日志记录;构建神经网络模型,并进行训练,得到交互场景判断模型和交互结果推荐模型;接收用户在当前交互场景的语音信息,进行语音识别得到语音识别结果;获取多通道实时信息,基于语音识别结果和多通道实时信息,使用交互场景判断模型得到当前交互场景的交互场景判断结果;判断当前交互场景是否为人机交互场景,若为人机交互场景则将语音识别结果和多通道实时信息输入到交互结果推荐模型,得到若干交互推荐结果,将若干交互推荐结果进行排序供用户进行选择。实现为用户提供多种语音交互结果,提供元宇宙语音交互的用户体验。验。验。

【技术实现步骤摘要】
一种元宇宙智能语音交互方法及系统


[0001]本申请涉及元宇宙交互
,尤其涉及一种元宇宙智能语音交互方法及系统。

技术介绍

[0002]元宇宙可为用户提供身临其境的沉浸式体验,其交互方式显得尤为重要。随着元宇宙交互技术的快速发展,市面上出现越来越多的元宇宙交互设备,为进一步提升元宇宙用户的体验创造了条件。然而,目前的元宇宙语音交互方法未充分利用人工智能技术来提高元宇宙语音交互过程中的准确率;现有语音交互方式比较单一,未综合运用元宇宙的多种交互通道提升语音交互体验效果。

技术实现思路

[0003]为此,本申请提供了一种元宇宙智能语音交互方法,为用户提供多样的语音交互结果,提升元宇宙语音交互的用户体验。
[0004]第一方面,本申请提供一种元宇宙智能语音交互方法。
[0005]本申请是通过以下技术方案得以实现的:
[0006]一种元宇宙智能语音交互方法,所述方法包括:
[0007]获取用户在元宇宙交互场景中产生的交互日志记录和多通道日志记录;
[0008]构建神经网络模型,根据所述交互日志记录和所述多通道日志记录,对所述神经网络模型进行训练,得到训练好的交互场景判断模型和交互结果推荐模型;
[0009]接收用户在元宇宙当前交互场景中产生的语音信息,并对所述语音信息进行语音识别,得到语音识别结果;
[0010]从元宇宙交互设备中获取多通道实时信息,基于所述语音识别结果和多通道实时信息,使用所述交互场景判断模型得到当前交互场景的交互场景判断结果;<br/>[0011]基于所述交互场景判断结果判断所述当前交互场景是否为人机交互场景,若不属于人机交互场景,则结束当前语音交互场景;若属于人机交互场景,则将语音识别结果和所述多通道实时信息输入到所述交互结果推荐模型,得到若干交互推荐结果,将若干所述交互推荐结果进行排序供用户进行选择。
[0012]在本申请一较佳的示例中可以进一步设置为,所述将若干所述交互推荐结果进行排序供用户进行选择的步骤之后还包括:
[0013]用户对所述交互推荐结果进行选择,确定最终语音交互结果;
[0014]将所述当前交互场景中产生的交互日志以及最终语音交互结果发送至系统数据库中进行存储。
[0015]在本申请一较佳的示例中可以进一步设置为,所述构建神经网络模型,根据所述交互日志记录和所述多通道日志记录,对所述神经网络模型进行训练,得到训练好的交互场景判断模型和交互结果推荐模型的步骤包括:
[0016]选择所述交互日志记录作为模型训练的第一训练数据,选择多通道日志记录作为模型训练的第二训练数据;
[0017]提取所述第一训练数据的语义特征和所述第二训练数据的标注信息,得到所述第一训练数据的语义特征和所述第二训练数据的标注信息;
[0018]利用所述语义特征为主题层的第一训练数据和所述标注信息为人机交互的第二训练数据,来训练所述神经网络模型,达到预设条件,得到训练好的交互场景判断模型;
[0019]利用语义特征为语义层的第一训练数据和标注信息为交互结果的第二训练数据,来训练神经网络模型,达到预设条件,得到训练好的交互结果推荐模型。
[0020]在本申请一较佳的示例中可以进一步设置为,所述接收用户在元宇宙当前交互场景中产生的语音信息,并对所述语音信息进行语音识别,得到语音识别结果的步骤还包括:
[0021]对所述语音信息进行降噪处理,得到降噪后的语音信息,并对所述降噪后的语音信息进行语音识别。
[0022]在本申请一较佳的示例中可以进一步设置为,所述接收用户在元宇宙当前交互场景中产生的语音信息,并对所述语音信息进行语音识别,得到语音识别结果的步骤后还包括:
[0023]检测所述语音识别结果中是否包含预设的唤醒词,若包含预设的唤醒词则跳转至进行交互推荐结果预测的步骤;若不包含预设的唤醒词则进行交互场景判断的步骤。
[0024]在本申请一较佳的示例中可以进一步设置为,所述基于所述交互场景判断结果判断所述当前交互场景是否为人机交互场景的步骤还包括:
[0025]将所述交互场景判断结果中的人机交互概率值与预设阈值进行对比,若所述交互场景判断结果中的人机交互概率值大于或等于所述预设阈值,则判断所述当前交互场景为人机交互场景;
[0026]若所述交互场景判断结果中的人机交互概率值小于所述预设阈值,则判断所述当前交互场景不属于人机交互场景。
[0027]在本申请一较佳的示例中可以进一步设置为,所述多通道实时信息至少包括用户在元宇宙中产生的语音信息、动作信息、位置信息、心率信息以及体温信息。
[0028]第二方面,本申请提供一种元宇宙智能语音交互系统。
[0029]本申请是通过以下技术方案得以实现的:
[0030]一种元宇宙智能语音交互系统,所述系统包括:
[0031]交互信息获取模块,用于获取用户在元宇宙交互场景中产生的交互日志记录和多通道日志记录;
[0032]模型训练模块,用于根据所述交互日志记录和所述多通道日志记录,对所述神经网络模型进行训练,得到训练好的交互场景判断模型和交互结果推荐模型;
[0033]语音识别模块,用于接收用户在元宇宙当前交互场景中产生的语音信息,并对所述语音信息进行语音识别,得到语音识别结果;
[0034]交互场景判断模块,从元宇宙交互设备中获取多通道实时信息,基于所述语音识别结果和多通道实时信息,使用所述交互场景判断模型得到当前交互场景的交互场景判断结果;
[0035]交互结果推荐模块,基于所述交互场景判断结果判断所述当前交互场景是否为人
机交互场景,若不属于人机交互场景,则结束当前语音交互场景;若属于人机交互场景,则将语音识别结果和所述多通道实时信息输入到所述交互结果推荐模型,得到若干交互推荐结果,将若干所述交互推荐结果进行排序供用户进行选择。
[0036]第三方面,本申请提供一种计算机设备。
[0037]本申请是通过以下技术方案得以实现点的:
[0038]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一种元宇宙智能语音交互方法的步骤。
[0039]第四方面,本申请提供一种计算机可读存储介质。
[0040]本申请是通过以下技术方案得以实现的:
[0041]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种元宇宙智能语音交互方法的步骤。
[0042]综上所述,与现有技术相比,本申请实施例提供的技术方案带来的有益效果至少包括:构建神经网络模型,对神经网络模型进行训练,得到训练好的交互场景判断模型和交互结果推荐模型,使用交互场景判断模型和交互结果推荐模型结合语音识别结果和多通道实时信息来自动识别和交互推荐结果,提高元宇宙语音交互的准确率和易用性;提供多种交互推荐结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种元宇宙智能语音交互方法,其特征在于,所述方法包括:获取用户在元宇宙交互场景中产生的交互日志记录和多通道日志记录;构建神经网络模型,根据所述交互日志记录和所述多通道日志记录,对所述神经网络模型进行训练,得到训练好的交互场景判断模型和交互结果推荐模型;接收用户在元宇宙当前交互场景中产生的语音信息,并对所述语音信息进行语音识别,得到语音识别结果;从元宇宙交互设备中获取多通道实时信息,基于所述语音识别结果和多通道实时信息,使用所述交互场景判断模型得到当前交互场景的交互场景判断结果;基于所述交互场景判断结果判断所述当前交互场景是否为人机交互场景,若不属于人机交互场景,则结束当前语音交互场景;若属于人机交互场景,则将语音识别结果和所述多通道实时信息输入到所述交互结果推荐模型,得到若干交互推荐结果,将若干所述交互推荐结果进行排序供用户进行选择。2.根据权利要求1所述的元宇宙智能语音交互方法,其特征在于,所述将若干所述交互推荐结果进行排序供用户进行选择的步骤之后还包括:用户对所述交互推荐结果进行选择,确定最终语音交互结果;将所述当前交互场景中产生的交互日志以及最终语音交互结果发送至系统数据库中进行存储。3.根据权利要求1所述的元宇宙智能语音交互方法,其特征在于,所述构建神经网络模型,根据所述交互日志记录和所述多通道日志记录,对所述神经网络模型进行训练,得到训练好的交互场景判断模型和交互结果推荐模型的步骤包括:选择所述交互日志记录作为模型训练的第一训练数据,选择多通道日志记录作为模型训练的第二训练数据;提取所述第一训练数据的语义特征和所述第二训练数据的标注信息,得到所述第一训练数据的语义特征和所述第二训练数据的标注信息;利用所述语义特征为主题层的第一训练数据和所述标注信息为人机交互的第二训练数据,来训练所述神经网络模型,达到预设条件,得到训练好的交互场景判断模型;利用语义特征为语义层的第一训练数据和标注信息为交互结果的第二训练数据,来训练神经网络模型,达到预设条件,得到训练好的交互结果推荐模型。4.根据权利要求1所述的元宇宙智能语音交互方法,其特征在于,所述接收用户在元宇宙当前交互场景中产生的语音信息,并对所述语音信息进行语音识别,得到语音识别结果的步骤还包括:对所述语音信息进行降噪处理,得到降噪后的语音信息,并对所述降噪后的语音信息进行语音识别,得到语音识别结果。5.根据权利要求4所...

【专利技术属性】
技术研发人员:劳斌吕薇
申请(专利权)人:广东外语外贸大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1