基于语音识别的3D模型控制方法、装置、设备和存储介质制造方法及图纸

技术编号:36217623 阅读:19 留言:0更新日期:2023-01-04 12:15
本申请提供一种基于语音识别的3D模型控制方法、装置、计算机设备及存储介质,该方法通过语音识别模型,将目标音频文件转换成至少一个识别文本集,以每一个识别文本集作为一个指令组,从而便于区分用户的指令和指令操作顺序;通过指令关键词组,对每一组的识别文本集进行关键词匹配,从而提取出每一组识别文本集中的所有目标关键词,并生成各组识别文本集对应的指令链表;然后即可根据指令链表的生成顺序,依次执行各指令链表所对应的执行操作,从而实现对3D模型的语音操作。本申请涉及人工智能技术领域,可以实现对3D模型的语音操作,避免了复杂的手动操作,使得3D模型操作的交互难度降低,提高了用户体验。提高了用户体验。提高了用户体验。

【技术实现步骤摘要】
基于语音识别的3D模型控制方法、装置、设备和存储介质


[0001]本申请涉及人工智能
,尤其涉及一种基于语音识别的3D模型控制方法、装置、设备和存储介质。

技术介绍

[0002]现阶段人工智能技术发展迅速,其中语音相关的AI能力趋于成熟。通过使用这些语音能力,是可以快速、精准地识别出所说的文字,甚至对于方言、外语的兼容,也做的非常不错。这使得它可以应用的领域变得愈加宽泛。
[0003]其次随着浏览器的发展,它提供到的能力更加强大,其中推出的WebGL(一种3D绘图协议),是可以利用GPU资源在浏览器中构建3D模型,并且提供了丰富的操作方法。再加上目前3D模型成熟的市场,可以看出未来的浏览器中是会大量使用这些3D模型,来丰富网页,提高用户交互体验。不过目前操作3D模型的方式太过单一,只能通过鼠标点击,来进行互动,其对于3D模型操作的便利性较差,使得用户体验感较差。因此,如何提高3D模型的操作便利性成为了目前亟需解决的问题。

技术实现思路

[0004]本申请提供了一种基于语音识别的3D模型控制方法、装置、计算机设备和存储介质,旨在提高目前3D模型的操作便利性。
[0005]第一方面,本申请提供一种基于语音识别的3D模型控制方法,所述基于语音识别的3D模型控制方法包括以下步骤:
[0006]获取目标音频文件,基于语音识别模型,对所述目标音频文件进行识别,生成至少一组识别文本集;
[0007]基于指令关键词组,匹配所述识别文本集中的相似关键词,获得至少一个目标关键词,并基于所述目标关键词的获得顺序,生成指令链表;
[0008]基于所述目标关键词对应的指令含义和所述获得顺序,确定所述指令链表对应的执行指令,并基于所述执行指令,对3D模型执行对应的操作,以实现对所述3D模型的语音控制。
[0009]第二方面,本申请还提供一种基于语音识别的3D模型控制装置,所述基于语音识别的3D模型控制装置包括:
[0010]语音识别模块,用于获取目标音频文件,基于语音识别模型,对所述目标音频文件进行识别,生成至少一组识别文本集;
[0011]关键词匹配模块,用于基于指令关键词组,匹配所述识别文本集中的相似关键词,获得至少一个目标关键词,并基于所述目标关键词的获得顺序,生成指令链表;
[0012]模型操作模块,用于基于所述目标关键词对应的指令含义和所述获得顺序,确定所述指令链表对应的执行指令,并基于所述执行指令,对3D模型执行对应的操作,以实现对所述3D模型的语音控制。
[0013]第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的基于语音识别的3D模型控制方法的步骤。
[0014]第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的基于语音识别的3D模型控制方法的步骤。
[0015]本申请提供一种基于语音识别的3D模型控制方法、装置、设备及存储介质,本申请通过语音识别模型,将目标音频文件转换成至少一个识别文本集,以每一个识别文本集作为一个指令组,从而便于区分用户的指令和指令操作顺序;通过指令关键词组,对每一组的识别文本集进行关键词匹配,从而提取出每一组识别文本集中的所有目标关键词;并根据目标关键词在识别文本集中的顺序,对目标关键词进行对应排序,从而生成各组识别文本集对应的指令链表;指令链表中包含了对应的识别文本集中的目标关键词以及目标关键词的顺序,目标关键词的不同排列顺序,其表达的含义可能也是不同的,也即对应的指令不同,所以指令链表可以保证每一组识别文本对应唯一的执行指令,避免指令识别错误;然后即可根据指令链表的生成顺序,依次执行各指令链表所对应的执行操作,从而实现对3D模型的语音操作。通过上述方式,通过语音识别,提取用户语音指令中的目标关键词,并根据目标关键词对应的执行指令操作3D模型,实现对3D模型的语音操作,避免了复杂的手动操作,使得3D模型操作的交互难度降低,扩大了3D模型的受用群体的范围,并提高了用户体验,解决了目前3D模型的操作便利性低的技术问题。
附图说明
[0016]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本申请的实施例提供的一种基于语音识别的3D模型控制系统;
[0018]图2为本申请提供的一种基于语音识别的3D模型控制方法的第一实施例的流程示意图;
[0019]图3为本申请提供的一种基于语音识别的3D模型控制方法的第二实施例的流程示意图;
[0020]图4为本申请提供的一种基于语音识别的3D模型控制方法的第三实施例的流程示意图;
[0021]图5是本申请实施例提供的一种基于语音识别的3D模型控制装置的示意性框图;
[0022]图6是本申请实施例提供的一种计算机设备的结构示意性框图。
[0023]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0024]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施
例,都属于本申请保护的范围。
[0025]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0026]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0027]本申请的实施例提供了一种基于语音识别的3D模型控制方法、基于语音识别的3D模型控制装置、计算机设备及存储介质,用于通过语音识别方法,将语音指令转化为文字指令,实现对3D模型的语音控制,以提高3D模型控制的操作便利性。
[0028]如图1所示,图1为本申请的实施例提供的一种基于语音识别的3D模型控制系统,该系统包括终端和服务器,所述终端和服务器通信连接,所述服务器与数据库通信连接,所述数据库包括关键词数据库和3D模型数据库。
[0029]其中,所述终端包括手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
[0030]其中,所述服务器包括独立一台服务器,或者服务器集群。
[0031]以下,将基于该基于语音识别的3D模型控制系统对本申请的实施例提供的基于语音识别的3D模型控制方法进行详细介绍。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的3D模型控制方法,其特征在于,包括:获取目标音频文件,基于语音识别模型,对所述目标音频文件进行识别,生成至少一组识别文本集;基于指令关键词组,匹配所述识别文本集中的相似关键词,获得至少一个目标关键词,并基于所述目标关键词的获得顺序,生成指令链表;基于所述目标关键词对应的指令含义和所述获得顺序,确定所述指令链表对应的执行指令,并基于所述执行指令,对3D模型执行对应的操作,以实现对所述3D模型的语音控制。2.根据权利要求1所述的基于语音识别的3D模型控制方法,其特征在于,所述指令关键词组包括指代词、动作词和度量词,所述基于指令关键词组,匹配所述识别文本集中的相似关键词,获得至少一个目标关键词,并基于所述目标关键词的获得顺序,生成指令链表,包括:基于所述指令关键词组,判断所述目标关键词是否能够生成所述指令链表;在存在至少一个所述目标关键词匹配到所述动作词时,则基于当前识别文本集中匹配到的至少一个所述目标关键词,生成所述指令链表;在所述目标关键词未匹配到所述动作词时,则判定所述当前识别文本集中匹配到的所述目标关键词不能生成所述指令链表。3.根据权利要求2所述的基于语音识别的3D模型控制方法,其特征在于,所述基于所述目标关键词对应的指令含义和所述获得顺序,确定所述指令链表对应的执行指令,包括:基于所述目标关键词中的动作词,确定所述指令链表对应的执行动作;检测所述目标关键词中是否存在指代词和/或度量词;在所述目标关键词中存在所述指代词和/或所述度量词时,基于所述指代词和/或所述度量词对应的指令含义以及所述执行动作,确定所述执行指令。4.根据权利要求3所述的基于语音识别的3D模型控制方法,其特征在于,所述检测所述目标关键词中是否存在指代词和/或度量词之后,还包括:在检测到所述目标关键词中不存在所述指代词和/或所述度量词时,基于预设指代对象和/或预设度量标准以及所述执行动作,确定所述执行指令。5.根据权利要求1所述的基于语音识别的3D模型控制方法,其特征在于,所述基于语音识别模型,对所述...

【专利技术属性】
技术研发人员:刘扬安
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1