一种基于多尺度扩张卷积的虚拟数字人表情识别方法及系统技术方案

技术编号：45664904 阅读：23 留言：0更新日期：2025-06-27 19:04

本发明专利技术涉及表情识别技术领域，尤其是涉及一种基于多尺度扩张卷积的虚拟数字人表情识别方法及系统。方法，包括：对获取的图像数据进行预处理；基于预处理的数据构建基于多尺度扩张卷积的神经网络模型，利用预处理的图像数据训练神经网络模型；将训练后的模型应用于图像处理，输出表情识别结果；根据识别结果驱动虚拟数字人生成表情动画。本发明专利技术通过多尺度扩张卷积融合注意力模块（MDFA）和坐标注意力协同机制，实现多层级表情特征的高效提取与融合，通过全局平均池化与1×1卷积降维策略，低分辨率输入的"惊讶"表情识别准确率提升7.8%。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及表情识别，尤其是涉及一种基于多尺度扩张卷积的虚拟数字人表情识别方法及系统。

技术介绍

1、表情识别是计算机视觉领域的一个重要研究方向，旨在通过计算机对面部表情进行识别和分析，以实现对个体情感状态的理解。

2、随着人工智能和深度学习技术的发展，基于卷积神经网络（cnn）的表情识别方法取得了显著进展，逐渐成为研究热点。然而，现有技术在复杂场景下仍面临诸多挑战，主要体现在以下几个方面：

3、1.多尺度特征感知能力不足：传统cnn采用固定尺寸的卷积核，难以有效捕捉表情特征在不同空间尺度下的差异性表达。尤其在复杂场景中，细微表情变化（如微表情）与宏观面部肌肉运动的关联性易被忽略，导致关键特征丢失。

4、2.动态环境鲁棒性差：现有方法对光照突变、头部姿态偏移及部分遮挡的适应性不足。主因在于特征提取过程中缺乏对关键区域的定向增强机制，冗余背景信息干扰模型判断。

5、3.注意力机制融合不充分：尽管部分研究引入通道或空间注意力，但未能实现多维度特征的协同优化。例如，通道注意力易忽视空间位置相关...

【技术保护点】

1.一种基于多尺度扩张卷积的虚拟数字人表情识别方法，其特征在于，包括：

2.根据权利要求1所述的一种基于多尺度扩张卷积的虚拟数字人表情识别方法，其特征在于，所述对获取的图像数据进行预处理，包括利用几何-光照联合增强矩阵将图像数据进行数据多样性转化，其中，利用矩阵通过参数随机组合生成多样化训练样本，模拟侧脸、遮挡和明暗变化的复杂场景以提升模型的识别精度和泛化能力，增强矩阵表示为：

3.根据权利要求2所述的一种基于多尺度扩张卷积的虚拟数字人表情识别方法，其特征在于，所述基于预处理的数据构建基于多尺度扩张卷积的神经网络模型，包括以ResNet34为骨干结构，嵌入多尺度扩...

【技术特征摘要】

1.一种基于多尺度扩张卷积的虚拟数字人表情识别方法，其特征在于，包括：

3.根据权利要求2所述的一种基于多尺度扩张卷积的虚拟数字人表情识别方法，其特征在于，所述基于预处理的数据构建基于多尺度扩张卷积的神经网络模型，包括以resnet34为骨干结构，嵌入多尺度扩张卷积融合注意力机制、残差掩码机制和坐标注意力机制进行构建神经网络模型，其中，残差掩码机制嵌入于每个残差层后，其结构为：

4.根据权利要求3所述的一种基于多尺度扩张卷积的虚拟数字人表情识别方法，其特征在于，所述利用预处理的图像数据训练神经网络模型，包括利用神经网络模型的layer1层对224×224×3标准化图像数据进行特征提取，输出56×56×64特征图，再通过残差掩码机制执行特征增强，再经过layer2层处理后，输出28×28×128特征图，叠加rmb机制并引入通道丢弃策略，防止过拟合，layer1层的特征增强表示为：

5.根据权利要求4所述的一种基于多尺度扩张卷积的虚拟数字人表情识别方法，其特征在于，所述利用预处理的图像数据训练神经网络模型，还包括将经过layer2层处理的数据输入到layer3层，经过layer3层处理后输出14×14×256特征图，再接入坐标注意力机制，其中，首先执行双向池化生成h/w方向特征描述符，通过1×1卷积降维至c/8通道，经relu激活后分离生成空间注意力权重，再使用特征重加权，增强眉毛和嘴角的表情关键点的空间相关性，h/w方向特征描述符表示为：

6.根据权利...

【专利技术属性】
技术研发人员：刘兆伟，郑阳，刘延乐，陈本权，赵鑫鑫，宋鹏，刘志中，宋永超，
申请(专利权)人：烟台大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人