一种基于AI多模态交互的虚拟数字人应用方法技术

技术编号:41385024 阅读:26 留言:0更新日期:2024-05-20 19:06
本发明专利技术提供一种基于AI多模态交互的虚拟数字人应用方法,属于人工智能领域,本发明专利技术融合多模态建模,人工智能语音识别、图像识别,大数据等技术,包括唤醒、语音交互、人脸识别、手势识别、才艺展示等功能。本发明专利技术融合了多种AI人工智能技术:语音识别算法,人脸识别算法,手势识别算法,文本相似度匹配,AI换脸算法,口型驱动算法等。通过语音或手势识别等唤醒数字人,与数字人进行语音交互,数字人语音识别用户问题,进行语音互动解答,结束对话等;同时,数字人还包括手势智能交互,人脸智能交互,趣味互动等功能。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,尤其涉及一种基于ai多模态交互的虚拟数字人应用方法。


技术介绍

1、“数字人”(digital human/meta human)系指以数字形式存在于数字空间中,具有拟人或真人的外貌、行为和特点的虚拟人物,也称之为虚拟形象、数字虚拟人、虚拟数字人等。

2、“人工智能”(artificial intelligence,ai)系指研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

3、“语音唤醒”(voice wakeuper)系指通过辨别输入的音频中特定的词语(如“小新小新”),返回被命中(唤醒)结果,应用通过回调的结果,进行下一步的处理,如点亮屏幕,或与用户进行语音交互等。

4、“语音听写”系指基于自然语言处理,将自然语言音频转换为文本输出的技术

5、“手势识别”系指通过数学算法来识别人类手势。

6、“人脸识别”系指基于人的脸部特征信息进行身份识别的一种生物识别技术。

7、“自然语言处理”(natural language本文档来自技高网...

【技术保护点】

1.一种基于AI多模态交互的虚拟数字人应用方法,其特征在于,

2.根据权利1要求所述的方法,其特征在于,

3.根据权利1要求所述的方法,其特征在于,

4.根据权利1要求所述的方法,其特征在于,

5.根据权利4要求所述的方法,其特征在于,

6.根据权利5要求所述的方法,其特征在于,

7.根据权利1要求所述的方法,其特征在于,

8.根据权利1要求所述的方法,其特征在于,

9.根据权利5要求所述的方法,其特征在于,

10.根据权利1要求所述的方法,其特征在于,

【技术特征摘要】

1.一种基于ai多模态交互的虚拟数字人应用方法,其特征在于,

2.根据权利1要求所述的方法,其特征在于,

3.根据权利1要求所述的方法,其特征在于,

4.根据权利1要求所述的方法,其特征在于,

5.根据权利4要求所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:郑伟王元强王培元修志远王茂帅房兰涛
申请(专利权)人:浪潮智能终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1