一种异构计算场景下的人脸识别方法及系统技术方案

技术编号:39679121 阅读:12 留言:0更新日期:2023-12-11 18:56
本发明专利技术公开了一种异构计算场景下的人脸识别方法及系统,所述人脸识别系统包括:中央处理器

【技术实现步骤摘要】
一种异构计算场景下的人脸识别方法及系统


[0001]本申请涉及人脸识别
,尤其涉及一种异构计算场景下的人脸识别方法及系统


技术介绍

[0002]人脸识别技术,是一种从场景图像中识别出人脸目标

无接触地完成用户身份登记与验证的技术,其广泛应用于金融

司法

军队

公安

边检

政府

航天

电力

工厂

教育

医疗及众多企事业单位等众多领域

[0003]为提高人脸识别精度,目前普遍采用基于深度神经网络的人脸识别技术

深度神经网络在提高人脸识别精度

降低系统时延有较好效果,但由于其涉及大量浮点值计算

矩阵乘法

向量值等操作,需要处理的数据规模极其庞大,且随着其学习层次的深入,计算呈现指数级增长趋势

[0004]目前,人脸识别技术发展出越来越大的模型规模和复杂的模型结构,需要巨大的计算和内存资源;但某些应用场景具有严格的功耗限制,例如智能汽车,移动终端等等

因此,人脸识别技术在精度要求和功耗限制之间存在着权衡的困难


技术实现思路

[0005]本专利技术提供了一种异构计算场景下的人脸识别方法及系统,以解决或者部分解决无法权衡人脸识别技术的精度要求和功耗限制需求的技术问题

[0006]为解决上述技术问题,本专利技术的第一方面,公开了一种异构计算场景下的人脸识别系统,所述人脸识别系统包括:中央处理器

辅助处理器以及
M
个计算节点,
M≥1
且为正整数;其中,所述中央处理器与
M
个计算节点间通过所述辅助处理器实现隔离解耦;
[0007]所述中央处理器,用于执行系统初始化操作,确定出人脸识别的程序执行顺序,以及采集场景图像帧序列;
[0008]其中,所述中央处理器在系统初始化操作时具体包括:
[0009]读取模块,用于读取
M
个计算节点对应的模型分发信息;
[0010]分段量化模块,用于根据所述模型分发信息对人脸识别网络模型拆分

分段量化以得到
N
个可部署子文件;其中,
1≤N≤M

N
为正整数;
[0011]模型分发模块,用于将所述
N
个可部署子文件分配至对应计算节点中;
[0012]融合模块,用于将
M
个计算节点的流动顺序和人脸识别顺序进行融合,得到所述程序执行顺序;
[0013]所述辅助处理器,用于从所述中央处理器接收所述场景图像帧序列;按照所述程序执行顺序控制所述
M
个计算节点并行处理所述场景图像帧序列,得到所述场景图像帧序列对应的人脸特征数据;
[0014]所述中央处理器,还用于将所述人脸特征数据与人脸数据库中的已注册人脸数据进行比对,得到人脸识别结果

[0015]可选的,所述模型分发信息参考计算节点的算力信息生成

[0016]可选的,所述分段量化模块,具体用于执行下述操作:
[0017]构建所述人脸识别网络模型;
[0018]根据所述模型分发信息将所述人脸识别网络模型拆分为
N
个子模型;所述
N
个子模型对应有处理顺序;
[0019]对每个子模型创建量化器和校准器;
[0020]基于所述
N
个子模型对应的量化器和校准器,对所述
N
个子模型进行分段量化,得到
N
个量化子模型;
[0021]按照对应计算节点所需格式对所述
N
个量化子模型进行后处理,得到
N
个可部署子文件

[0022]可选的,所述分段量化模块,具体还用于:
[0023]利用当前子模型的校准器加载当前校准数据;其中,所述当前校准数据由上一级子模型量化后输出;
[0024]将所述当前校准数据输入所述当前子模型,根据前向传播结果调整当前量化器的量化参数,得到当前量化子模型的同时,将当前量化器的量化输出作为下一级子模型的校准数据输入下一级子模型处理,直至所有子模型遍历完毕

[0025]可选的,所述系统还包括:拼接模块,用于在基于所述
N
个子模型对应的量化器和校准器,对所述
N
个子模型进行分段量化,得到
N
个量化子模型之前,执行下述操作:
[0026]将所述
N
个子模型对应的量化器和校准器拼接在对应子模型中,形成
N
个串联模型;
[0027]按照所述处理顺序对所述
N
个串联模型相互进行拼接,得到拼接模型

[0028]可选的,所述中央处理器,具体包括:采集模块,用于采集所述场景图像帧序列;编码模块,用于将所述场景图像帧序列以进制数方式进行编码,得到编码数据;
[0029]所述辅助处理器,具体包括:接收模块,用于从所述中央处理器接收所述编码数据;解码模块,用于对所述编码模块进行解码,得到所述场景图像帧序列

[0030]可选的,所述系统还包括:通信模块,用于所述中央处理器与所述辅助处理器间的数据交互,交互的数据包括指令数据和编码数据

[0031]可选的,所述辅助处理器,具体还包括:控制模块,用于结合程序执行顺序和各计算节点所需处理时间依序输入所述场景图像帧序列中的各图像帧,以使所述
M
个计算节点并行处理所述各图像帧,得到所述各图像帧对应的人脸特征数据

[0032]可选的,所述系统还包括:公共缓存,用于存储所述中央处理器传输的所述场景图像帧序列,以及所述辅助处理器传输的人脸特征数据

[0033]本专利技术的第二方面,公开了一种异构计算场景下的人脸识别方法,其特征在于,所述人脸识别方法应用于人脸识别系统,人脸识别系统包括:中央处理器

辅助处理器以及
M
个计算节点,
M≥1
且为正整数;其中,所述中央处理器与
M
个计算节点间通过所述辅助处理器实现隔离解耦;
[0034]所述人脸识别方法包括:
[0035]利用所述中央处理器执行系统初始化操作,确定出人脸识别的程序执行顺序,以及采集场景图像帧序列;
[0036]其中,所述系统初始化操作包括:
[0037]读取
M
个计算节点对应的模型分发信息;根据所述模型分发信息对人脸识别本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种异构计算场景下的人脸识别系统,其特征在于,所述人脸识别系统包括:中央处理器

辅助处理器以及
M
个计算节点,
M≥1
且为正整数;其中,所述中央处理器与
M
个计算节点间通过所述辅助处理器实现隔离解耦;所述中央处理器,用于执行系统初始化操作,确定出人脸识别的程序执行顺序,以及采集场景图像帧序列;其中,所述中央处理器在系统初始化操作时具体包括:读取模块,用于读取
M
个计算节点对应的模型分发信息;分段量化模块,用于根据所述模型分发信息对人脸识别网络模型拆分

分段量化以得到
N
个可部署子文件;其中,
1≤N≤M

N
为正整数;模型分发模块,用于将所述
N
个可部署子文件分配至对应计算节点中;融合模块,用于将
M
个计算节点的流动顺序和人脸识别顺序进行融合,得到所述程序执行顺序;所述辅助处理器,用于从所述中央处理器接收所述场景图像帧序列;按照所述程序执行顺序控制所述
M
个计算节点并行处理所述场景图像帧序列,得到所述场景图像帧序列对应的人脸特征数据;所述中央处理器,还用于将所述人脸特征数据与人脸数据库中的已注册人脸数据进行比对,得到人脸识别结果
。2.
如权利要求1所述的人脸识别系统,其特征在于,所述模型分发信息参考计算节点的算力信息生成
。3.
如权利要求1或2所述的人脸识别系统,其特征在于,所述分段量化模块,具体用于执行下述操作:构建所述人脸识别网络模型;根据所述模型分发信息将所述人脸识别网络模型拆分为
N
个子模型;所述
N
个子模型对应有处理顺序;对每个子模型创建量化器和校准器;基于所述
N
个子模型对应的量化器和校准器,对所述
N
个子模型进行分段量化,得到
N
个量化子模型;按照对应计算节点所需格式对所述
N
个量化子模型进行后处理,得到
N
个可部署子文件
。4.
如权利要求3所述的人脸识别系统,其特征在于,所述分段量化模块,具体还用于:利用当前子模型的校准器加载当前校准数据;其中,所述当前校准数据由上一级子模型量化后输出;将所述当前校准数据输入所述当前子模型,根据前向传播结果调整当前量化器的量化参数,得到当前量化子模型的同时,将当前量化器的量化输出作为下一级子模型的校准数据输入下一级子模型处理,直至所有子模型遍历完毕
。5.
如权利要求3所述的人脸识别系统,其特征在于,所述系统还包括:拼接模块,用于在基于所述
N
个子模型对应的量化器和校准器,对所述
N
个子模型进行分段量化,得...

【专利技术属性】
技术研发人员:李威君游恒尚德龙周玉梅
申请(专利权)人:中科南京智能技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1