【技术实现步骤摘要】
脸部表情识别方法和装置
本公开涉及人工智能
,具体涉及计算机视觉和深度学习
,可应用于智慧城市和智慧金融场景下,尤其涉及脸部表情识别方法和装置。
技术介绍
表情可以通过面部表达感情。具体地,表情是情绪的主观体验的外化表现。比如,表情可以包括愤怒、厌恶、恐惧、高兴、中性和伤心。在现有技术中,进行表情识别一般采用分类器进行,比如可以采用支持向量机。即便如此,表情的识别依然有较大难度。例如,生气和恐惧这两种表情,在面部的表现是较为相似的,给表情识别带来了较大的难度。
技术实现思路
提供了一种脸部表情识别方法、装置、电子设备以及存储介质。根据第一方面,提供了一种脸部表情识别方法,包括:获取脸部图像中各个图像位置的特征;将各个图像位置的特征中的待处理特征,通过表情识别模型的多头自注意力网络执行如下步骤:生成待处理特征的查询向量、键向量和值向量;确定查询向量和待处理特征以外的其它特征的键向量的点乘结果,将该点乘结果作为待处理特征与其它特征之间的相关度,并对相关度进行预设处理;将预设处理结果与其它特征的值向量的乘积,确定为待处理特征相对于其它特征的目标特征;确定待处理特征相对于各个其它特征的目标特征之和;基于多头自注意力网络得到的和确定表情类别。根据第二方面,提供了一种脸部表情识别装置,包括:获取单元,被配置成获取脸部图像中各个图像位置的特征;执行单元,被配置成将各个图像位置的特征中的待处理特征,通过表情识别模型的多头自注意力网络执行如下步骤:生成单元,被配置成生成待处理特征 ...
【技术保护点】
1.一种脸部表情识别方法,所述方法包括:/n获取脸部图像中各个图像位置的特征;/n将所述各个图像位置的特征中的待处理特征,通过表情识别模型的多头自注意力网络执行如下步骤:/n生成所述待处理特征的查询向量、键向量和值向量;/n确定所述查询向量和所述待处理特征以外的其它特征的键向量的点乘结果,将该点乘结果作为所述待处理特征与所述其它特征之间的相关度,并对所述相关度进行预设处理;/n将预设处理结果与所述其它特征的值向量的乘积,确定为所述待处理特征相对于所述其它特征的目标特征;/n确定所述待处理特征相对于各个其它特征的目标特征之和;/n基于所述多头自注意力网络得到的所述和确定表情类别。/n
【技术特征摘要】
1.一种脸部表情识别方法,所述方法包括:
获取脸部图像中各个图像位置的特征;
将所述各个图像位置的特征中的待处理特征,通过表情识别模型的多头自注意力网络执行如下步骤:
生成所述待处理特征的查询向量、键向量和值向量;
确定所述查询向量和所述待处理特征以外的其它特征的键向量的点乘结果,将该点乘结果作为所述待处理特征与所述其它特征之间的相关度,并对所述相关度进行预设处理;
将预设处理结果与所述其它特征的值向量的乘积,确定为所述待处理特征相对于所述其它特征的目标特征;
确定所述待处理特征相对于各个其它特征的目标特征之和;
基于所述多头自注意力网络得到的所述和确定表情类别。
2.根据权利要求1所述的方法,其中,所述表情识别模型还包括掩膜生成网络;
所述获取脸部图像中各个图像位置的特征,包括:
获取所述脸部图像,对所述脸部图像进行卷积处理,得到初始特征图;
通过所述掩膜生成网络,对所述初始特征图生成掩膜特征图,其中,所述掩膜特征图中,亮度越大的位置的特征对所述脸部图像的表情类别的指示度越大;
根据所述掩膜特征图,生成所述脸部图像中各个图像位置的特征。
3.根据权利要求2所述的方法,其中,所述掩膜生成网络包括并行的多个掩膜生成网络;
所述通过所述掩膜生成网络,对所述初始特征图生成掩膜特征图,包括:通过所述多个掩膜生成网络,对所述初始特征图生成多个掩膜特征图;以及
所述根据所述掩膜特征图,生成所述脸部图像中各个图像位置的特征,包括:
将所述多个掩膜特征图中各个掩膜特征图的亮度最大的位置的特征,集中为一个新的掩膜特征图;
将该新的掩膜特征图与所述初始特征图进行融合,并提取出所述融合结果中各个位置的特征,作为所述脸部图像中各个图像位置的特征。
4.根据权利要求3所述的方法,其中,所述表情识别模型的训练结构包括第一丢弃层;
在所述表情识别模型的训练过程的前向传播中,所述通过所述多个掩膜生成网络,对所述初始特征图生成多个掩膜特征图,包括:
通过所述多个掩膜生成网络中的每个掩膜生成网络,对所述初始特征图确定该掩膜生成网络对应的掩膜特征图;
通过所述第一丢弃层,在所确定的掩膜特征图中随机选取出掩膜特征图,将该掩膜特征图的亮度修改为第一预设值,得到包括亮度修改后的掩膜特征图的多个掩膜特征图。
5.根据权利要求1-4之一所述的方法,其中,所述表情识别模型的训练结构中,所述多头自注意力网络包括第二丢弃层;
在所述表情识别模型的训练过程的前向传播中,所述各个特征的所述和的确定步骤,包括:
通过所述第二丢弃层,在所述多头自注意力网络中,随机选取出一个自注意力网络,将该自注意力网络中各个特征的所述和修改为第二预设值,得到从所述第二丢弃层输出的、所述各个特征的所述和。
6.根据权利要求5所述的方法,其中,所述基于所述多头自注意力网络得到的所述和确定表情类别,包括:
对所述多头自注意力网络得到的各个特征的所述和,与从所述第二丢弃层输出的、所述各个特征的所述和,进而加和处理,得到加和处理结果;
通过所述感知机层,对所述加和处理结果确定表情类别,其中,感知机层包括多层感知机。
7.一种脸部表情识别装置,所述装置包括:
获取单元,被配置成获取脸部图像中各个图像位置的特征;
执行单元,被配置成将所述各个图像位置的特征中的待处理特征,通过表情识别模型的多头自注意力网络执行如下步骤:
生成单元,被配置成生成所述待处理特征的查询向量、键向量和值向量;
相关度确定单元,被配置成确定所述查询向量和所述待处理特征以外的其它特征的键向量的点乘结果,将该点乘结果作为所述待处理特征与所述其它特征之间的相关度,并对所...
【专利技术属性】
技术研发人员:薛方磊,王强昌,郭国栋,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。