基于语音识别的3D模型控制方法、装置、设备和存储介质制造方法及图纸

技术编号：36217623 阅读：30 留言：0更新日期：2023-01-04 12:15

本申请提供一种基于语音识别的3D模型控制方法、装置、计算机设备及存储介质，该方法通过语音识别模型，将目标音频文件转换成至少一个识别文本集，以每一个识别文本集作为一个指令组，从而便于区分用户的指令和指令操作顺序；通过指令关键词组，对每一组的识别文本集进行关键词匹配，从而提取出每一组识别文本集中的所有目标关键词，并生成各组识别文本集对应的指令链表；然后即可根据指令链表的生成顺序，依次执行各指令链表所对应的执行操作，从而实现对3D模型的语音操作。本申请涉及人工智能技术领域，可以实现对3D模型的语音操作，避免了复杂的手动操作，使得3D模型操作的交互难度降低，提高了用户体验。提高了用户体验。提高了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于语音识别的3D模型控制方法、装置、设备和存储介质

[0001]本申请涉及人工智能
，尤其涉及一种基于语音识别的3D模型控制方法、装置、设备和存储介质。

技术介绍

[0002]现阶段人工智能技术发展迅速，其中语音相关的AI能力趋于成熟。通过使用这些语音能力，是可以快速、精准地识别出所说的文字，甚至对于方言、外语的兼容，也做的非常不错。这使得它可以应用的领域变得愈加宽泛。
[0003]其次随着浏览器的发展，它提供到的能力更加强大，其中推出的WebGL(一种3D绘图协议)，是可以利用GPU资源在浏览器中构建3D模型，并且提供了丰富的操作方法。再加上目前3D模型成熟的市场，可以看出未来的浏览器中是会大量使用这些3D模型，来丰富网页，提高用户交互体验。不过目前操作3D模型的方式太过单一，只能通过鼠标点击，来进行互动，其对于3D模型操作的便利性较差，使得用户体验感较差。因此，如何提高3D模型的操作便利性成为了目前亟需解决的问题。

技术实现思路

[0004]本申请提供了一种基于语音识别的3D模型控制方法、...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的3D模型控制方法，其特征在于，包括：获取目标音频文件，基于语音识别模型，对所述目标音频文件进行识别，生成至少一组识别文本集；基于指令关键词组，匹配所述识别文本集中的相似关键词，获得至少一个目标关键词，并基于所述目标关键词的获得顺序，生成指令链表；基于所述目标关键词对应的指令含义和所述获得顺序，确定所述指令链表对应的执行指令，并基于所述执行指令，对3D模型执行对应的操作，以实现对所述3D模型的语音控制。2.根据权利要求1所述的基于语音识别的3D模型控制方法，其特征在于，所述指令关键词组包括指代词、动作词和度量词，所述基于指令关键词组，匹配所述识别文本集中的相似关键词，获得至少一个目标关键词，并基于所述目标关键词的获得顺序，生成指令链表，包括：基于所述指令关键词组，判断所述目标关键词是否能够生成所述指令链表；在存在至少一个所述目标关键词匹配到所述动作词时，则基于当前识别文本集中匹配到的至少一个所述目标关键词，生成所述指令链表；在所述目标关键词未匹配到所述动作词时，则判定所述当前识别文本集中匹配到的所述目标关键词不能生成所述指令链表。3.根据权利要求2所述的基于语音识别的3D模型控制方法，其特征在于，所述基于所述目标关键词对应的指令含义和所述获得顺序，确定所述指令链表对应的执行指令，包括：基于所述目标关键词中的动作词，确定所述指令链表对应的执行动作；检测所述目标关键词中是否存在指代词和/或度量词；在所述目标关键词中存在所述指代词和/或所述度量词时，基于所述指代词和/或所述度量词对应的指令含义以及所述执行动作，确定所述执行指令。4.根据权利要求3所述的基于语音识别的3D模型控制方法，其特征在于，所述检测所述目标关键词中是否存在指代词和/或度量词之后，还包括：在检测到所述目标关键词中不存在所述指代词和/或所述度量词时，基于预设指代对象和/或预设度量标准以及所述执行动作，确定所述执行指令。5.根据权利要求1所述的基于语音识别的3D模型控制方法，其特征在于，所述基于语音识别模型，对所述...

【专利技术属性】
技术研发人员：刘扬安，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人