【技术实现步骤摘要】
本专利技术涉及多模态交互分析领域,尤其涉及一种数字人智能体的多模态交互方法及系统。
技术介绍
1、随着人工智能技术的快速发展,数字人智能体作为人机交互的重要载体,正逐步在教育、医疗、金融、政务、虚拟客服等众多领域得到广泛应用。尤其是在自然语言处理、计算机视觉以及语音识别等技术不断突破的推动下,数字人智能体已从最初的文本对话系统演进为具备视觉识别、语音感知、情绪理解等多模态感知能力的高级交互主体。在提升用户体验、增强服务智能化水平方面,数字人展现出前所未有的潜力。传统的人机交互方式通常依赖于单一模态的信息输入,如键盘输入、语音识别或手势识别等,但在实际应用中,这种单一模态的交互方式往往无法全面感知用户意图,导致交互效率低、理解误差大、响应不自然等问题。而数字人智能体作为新一代交互系统的核心,需要同时具备图像识别与语音识别的能力,能够通过视觉和听觉双通道获取用户信息,进而实现更为自然、智能和人性化的交互体验。
2、当前基于图像识别的技术已能够实现面部识别、表情识别、视线追踪等功能,而语音识别技术也在语音转写、语义理解、情感分析等
...【技术保护点】
1.一种数字人智能体的多模态交互方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的数字人智能体的多模态交互方法,其特征在于,步骤S1具体步骤为:
3.根据权利要求1所述的数字人智能体的多模态交互方法,其特征在于,步骤S2具体步骤为:
4.根据权利要求1所述的数字人智能体的多模态交互方法,其特征在于,步骤S3具体步骤为:
5.根据权利要求4所述的数字人智能体的多模态交互方法,其特征在于,所述对自适应优化语音信号进行语音-情绪关联分析,生成语音-情绪联动映射谱的具体步骤为:
6.根据权利要求1所述的数字人
...【技术特征摘要】
1.一种数字人智能体的多模态交互方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的数字人智能体的多模态交互方法,其特征在于,步骤s1具体步骤为:
3.根据权利要求1所述的数字人智能体的多模态交互方法,其特征在于,步骤s2具体步骤为:
4.根据权利要求1所述的数字人智能体的多模态交互方法,其特征在于,步骤s3具体步骤为:
5.根据权利要求4所述的数字人智能体的多模态交互方法,其特征在于,所述对自适应优化语音信号进...
【专利技术属性】
技术研发人员:梁春艳,
申请(专利权)人:广东汇通信息科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。