信息处理装置及方法制造方法及图纸

技术编号:17033473 阅读:27 留言:0更新日期:2018-01-13 19:43
本公开提供了一种信息处理装置,包括:存储单元,用于接收并存储数据及指令;以及数据处理单元,与所述存储单元连接,用于接收所述存储单元发送的数据及指令,对所述数据中包含的关键特征进行提取和运算处理,并根据运算处理结果生成多维向量。本公开还提供了一种信息处理方法。本公开信息处理装置及方法,实现了对人脸的精确,快速识别;支持离线运行神经网络,在没有云端服务器协助计算的情况下用户终端/前端离线即可实现人脸识别和相应控制的工作;具有很好的移植性,能够用于各种应用场景和设备,大大节省了设计成本。

【技术实现步骤摘要】
信息处理装置及方法
本公开涉及信息处理
,尤其涉及一种处理图像的装置和方法。
技术介绍
现有使用通用的图像识别装置来识别人脸图像。图像识别装置包括表情采集单元,表情识别单元。表情采集单元采集用户的表情并形成模拟信号发送给表情识别单元,表情识别单元将模拟信号转换为数字信号,再经过数据处理模块产生输出,最终做出实现预期功能的响应。然而,现有的识别人脸图像的装置及方法,其存在以下缺陷:信号的精度差,对人脸识别不精准,可移植性不够好,功能不具备好的拓展性,设计上通常针对一种或一类特定设备,不能通过机器学习等方法提高识别精度。
技术实现思路
(一)要解决的技术问题为了解决或者至少部分缓解上述技术问题,本公开提供一种信息处理装置及方法,实现了对人脸的更精确,快速识别;支持离线运行神经网络,在没有云端服务器协助计算的情况下用户终端/前端离线即可实现人脸识别和相应控制的工作;具有很好的移植性,能够用于各种应用场景和设备,大大节省了设计成本。(二)技术方案根据本公开的一个方面,提供了一种信息处理装置,包括:存储单元,用于接收并存储数据及指令;以及数据处理单元,与所述存储单元连接,用于接收所述存储单元发送的数据及指令,对所述数据中包含的关键特征进行提取和运算处理,并根据运算处理结果生成多维向量。在本公开一些实施例中,所述关键特征包括人脸的动作、表情及其对应的位置。在本公开一些实施例中,所述输入数据包括一个或多个图像,所述数据处理单元根据运算处理结果为每一图像生成一多维向量。在本公开一些实施例中,所述图像包括静态图片、组成视频的图片或视频;所述静态图片、组成视频的图片或视频包括人脸的一个或者多个部位的图像。在本公开一些实施例中,所述人脸的一个或者多个部位为人脸面部肌肉,嘴唇,眼部,眉毛,鼻子,额头,耳朵及其组合。在本公开一些实施例中,所述多维向量为情绪向量,其包括的每个元素表示人脸的一种情绪,该情绪包括愤怒,高兴,痛苦,沮丧,困倦或疑惑。在本公开一些实施例中,所述情绪向量的每个元素的值为0和1之间的数,数值大小表示这一元素对应的情绪出现的概率;或所述情绪向量的每个元素的值为任意大于等于0的数,数值大小表示这一元素对应的情绪的强度;或所述情绪向量的一元素值为1,其余元素的值为0,这一情绪向量表示最显著的一情绪。在本公开一些实施例中,所述的信息处理装置,还包括:转换模块,用于将多维向量转换为输出;该输出包括控制指令,数据,标签,或图片。在本公开一些实施例中,所述控制指令包括鼠标单击/双击拖动、触摸屏的单点/多点/滑动、开关的开/关、快捷键。在本公开一些实施例中,所述存储单元用于输入n个图像,每个图像对应一个真实情绪向量;n为大于等于1的正整数;所述数据处理单元用于接收所述n个图像,计算出与输入相同格式的输出情绪向量,即预测情绪向量,并根据预测情绪向量与真实情绪向量的对比结果更新所述信息处理装置的参数。在本公开一些实施例中,所述数据处理单元采用欧式距离或内积的绝对值法对所述预测情绪向量与真实情绪向量进行对比。在本公开一些实施例中,所述信息处理装置为人工神经网络芯片。在本公开一些实施例中,所述数据处理单元包括:运算单元,用于根据所述存储单元中存储的指令对所述数据执行相应的运算;所述运算单元为标量计算单元,向量计算单元和/或混合计算单元,包括:乘法器,用于将输入其中的数据相乘得到相乘之后的输出;和/或一个或多个加法器,用于将输入其中的数据相加得到输出数据,所述多个加法器构成加法树,用于进行加法树运算,即将输入其中的数据逐级相加得到输出数据;激活函数单元,用于通过激活函数运算得到激活输出数据,该激活函数包括sigmoid、tanh、relu或softmax;以及池化单元,用于将输入数据(in)通过池化运算得到池化操作之后的输出数据(out),即out=pool(in),其中pool为池化操作,池化操作包括平均值池化,最大值池化,中值池化,输入数据in是和输出out相关的一个池化核中的数据。在本公开一些实施例中,所述存储单元用于存储数据及指令,该数据包括神经元,权值,图像,及向量;所述信息处理装置还包括:预处理单元,用于对原始输入数据,即一个或多个图像,进行预处理,得到符合人工神经网络预设参数和数据格式的图像数据,所述预处理包括:切分、高斯滤波、二值化、正则化及归一化;指令缓存单元,用于缓存指令;权值缓存单元,用于缓存权值数据;输入神经元缓存单元,用于缓存输入到运算单元的输入神经元;输出神经元缓存单元,用于缓存运算单元输出的输出神经元;控制单元,用于从所述指令缓存单元中读取指令,并将其译码成运算单元指令并输入至运算单元;DMA(DirectMemoryAccess,直接内存存取),用于在所述存储单元、指令缓存单元、权值缓存单元、输入神经元缓存单元和输出神经元缓存单元中进行数据或者指令读写。在本公开一些实施例中,所述运算单元包括:短位浮点数模块,用于进行正向计算;该短位浮点数模块包括:浮点数据统计模块,用于对所述人工神经网络正向运算所需的各个类型的数据进行统计分析,得到指数位的长度EL;短位浮点数据转换单元,用于根据所述浮点数据统计模块得到的指数位的长度EL来实现长位数浮点数据类型向短位数浮点数据类型的转换;以及短位浮点数据运算模块,用于在所述浮点数据转换单元将所有所述人工神经网络正向运算中所需的输入、权值和/或偏置数据均采用短位数浮点数据类型表示之后,对所述短位数浮点数据进行人工神经网络正向运算。在本公开一些实施例中,所述浮点数据统计模块还用于对所述人工神经网络正向运算所需的各个类型的数据进行统计分析,得到指数位偏移量offset;所述短位浮点数据转换单元还用于根据所述浮点数据统计模块得到的所述指数位偏移量offset及指数位的长度EL来实现长位数浮点数据类型向短位数浮点数据类型的转换。在本公开一些实施例中,所述短位浮点数据转换单元包括:运算缓存单元,用于存储所述正向运算的中间结果;数据转换单元,用于将所述运算缓存单元中的数据转换为短位数浮点数据;以及舍入单元,用于对超出短位浮点精度范围的数据进行舍入操作。在本公开一些实施例中,所述舍入单元包括随机舍入单元、四舍五入单元、向上舍入单元、向下舍入单元以及截断舍入单元。在本公开一些实施例中,所述随机舍入单元执行如下操作:式中,y表示随机舍入后的短位浮点数据,x表示随机舍入前的32位浮点数据,ε为当前短位数浮点数据表示格式所能表示的最小正整数,即2offset-(X-1-EL),表示对原数据x直接截得短位数浮点数据所得的数,w.p.表示概率,即随机舍入获得的数据y为的概率为为的概率为所述四舍五入单元执行如下操作:式中,y表示四舍五入后的短位浮点数据,x表示四舍五入前的长位浮点数据,ε为当前短位数浮点数据表示格式所能表示的最小正整数,即2offset-(X-1-EL),为ε的整数倍,其值为小于或等于x的最大数;所述向上舍入单元执行如下操作:式中,y表示向上舍入后的短位浮点数据,x表示向上舍入前的长位浮点数据,为ε的整数倍,其值为大于或等于x的最小数,ε为当前短位数浮点数据表示格式所能表示的最小正整数,即2offset-(X-1-EL);所述向下舍入单元执行如下操作:式中,y表示向本文档来自技高网...
信息处理装置及方法

【技术保护点】
一种信息处理装置,包括:存储单元,用于接收并存储数据及指令;以及数据处理单元,与所述存储单元连接,用于接收所述存储单元发送的数据及指令,对所述数据中包含的关键特征进行提取和运算处理,并根据运算处理结果生成多维向量。

【技术特征摘要】
1.一种信息处理装置,包括:存储单元,用于接收并存储数据及指令;以及数据处理单元,与所述存储单元连接,用于接收所述存储单元发送的数据及指令,对所述数据中包含的关键特征进行提取和运算处理,并根据运算处理结果生成多维向量。2.根据权利要求1所述的信息处理装置,其中,所述关键特征包括人脸的动作、表情及其对应的位置。3.根据权利要求1或2所述的信息处理装置,其中,所述输入数据包括一个或多个图像,所述数据处理单元根据运算处理结果为每一图像生成一多维向量。4.根据权利要求3所述的信息处理装置,其中,所述图像包括静态图片、组成视频的图片或视频;所述静态图片、组成视频的图片或视频包括人脸的一个或者多个部位的图像。5.根据权利要求4所述的信息处理装置,其中,所述人脸的一个或者多个部位为人脸面部肌肉,嘴唇,眼部,眉毛,鼻子,额头...

【专利技术属性】
技术研发人员:陈天石何皓源胡帅
申请(专利权)人:上海寒武纪信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1