一种基于AI多模态交互的虚拟数字人应用方法技术

技术编号：41385024 阅读：26 留言：0更新日期：2024-05-20 19:06

本发明专利技术提供一种基于AI多模态交互的虚拟数字人应用方法，属于人工智能领域，本发明专利技术融合多模态建模，人工智能语音识别、图像识别，大数据等技术，包括唤醒、语音交互、人脸识别、手势识别、才艺展示等功能。本发明专利技术融合了多种AI人工智能技术：语音识别算法，人脸识别算法，手势识别算法，文本相似度匹配，AI换脸算法，口型驱动算法等。通过语音或手势识别等唤醒数字人，与数字人进行语音交互，数字人语音识别用户问题，进行语音互动解答，结束对话等；同时，数字人还包括手势智能交互，人脸智能交互，趣味互动等功能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，尤其涉及一种基于ai多模态交互的虚拟数字人应用方法。

技术介绍

1、“数字人”(digital human/meta human)系指以数字形式存在于数字空间中，具有拟人或真人的外貌、行为和特点的虚拟人物，也称之为虚拟形象、数字虚拟人、虚拟数字人等。

2、“人工智能”(artificial intelligence，ai)系指研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

3、“语音唤醒”(voice wakeuper)系指通过辨别输入的音频中特定的词语(如“小新小新”)，返回被命中(唤醒)结果，应用通过回调的结果，进行下一步的处理，如点亮屏幕，或与用户进行语音交互等。

4、“语音听写”系指基于自然语言处理，将自然语言音频转换为文本输出的技术

5、“手势识别”系指通过数学算法来识别人类手势。

6、“人脸识别”系指基于人的脸部特征信息进行身份识别的一种生物识别技术。

7、“自然语言处理”(natural language本文档来自技高网...

【技术保护点】

1.一种基于AI多模态交互的虚拟数字人应用方法，其特征在于，

2.根据权利1要求所述的方法，其特征在于，

3.根据权利1要求所述的方法，其特征在于，

4.根据权利1要求所述的方法，其特征在于，

5.根据权利4要求所述的方法，其特征在于，

6.根据权利5要求所述的方法，其特征在于，

7.根据权利1要求所述的方法，其特征在于，

8.根据权利1要求所述的方法，其特征在于，

9.根据权利5要求所述的方法，其特征在于，

10.根据权利1要求所述的方法，其特征在于，

【技术特征摘要】

1.一种基于ai多模态交互的虚拟数字人应用方法，其特征在于，

2.根据权利1要求所述的方法，其特征在于，

3.根据权利1要求所述的方法，其特征在于，

4.根据权利1要求所述的方法，其特征在于，

5.根据权利4要求所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：郑伟，王元强，王培元，修志远，王茂帅，房兰涛，
申请(专利权)人：浪潮智能终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人