The embodiment of the invention provides a calculation method based on neural network includes: receiving the original image; feature extraction tensor of the original image; point trained neural network to the characteristic tensor to produce the image processing based on thermodynamic diagram. The embodiment of the invention provides a method for realizing the calculation of a neural network by using a fixed point method, which has the advantages of low cost, small amount of resources, and low hardware requirement.
【技术实现步骤摘要】
本专利技术涉及图像处理领域,更具体地涉及一种基于神经网络的计算方法及装置。
技术介绍
神经网络(NeuralNetworks,NNs)也称为人工神经网络(ArtificialNeuralNetworks,ANNs)或连接模型(ConnectionModel),是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。神经网络依靠系统的复杂程度,通过调整内部大量计算节点之间相互连接的关系,从而达到处理信息的目的。神经网络在语音识别、文字识别、以及图像视频识别等许多领域中已经有了广泛而成功的应用。传统的神经网络采用双精度或单精度浮点数乘/加计算作为基本计算单元,然而,传统的神经网络的算法架构会导致大计算量需求、高内存(或显存)占用、以及高带宽要求等问题,对硬件的要求较高。
技术实现思路
考虑到上述问题而提出了本专利技术。本专利技术提供了一种基于神经网络的计算方法,对硬件的要求较低。根据本专利技术的第一方面,提供了一种基于神经网络的计算方法,包括:接收原始图像;提取所述原始图像的特征张量;基于训练好的定点神经网络对所述特征张量进行处理,以产生图像热力图。示例性地,所述训练好的定点神经网络通过如下方法训练得到:对初始神经网络进行至少一次浮点训练,并将所述浮点训练之后的神经网络的参数定点化;如果所述定点化后的神经网络的参数不满足训练指标,则将所述初始神经网络替换为所述定点化后的神经网络并重复执行上述步骤;如果所述定点化后的神经网络的参数满足所述训练指标,则将所述定点化后的神经网络作为所述训练好的定点神经网络。示例性地,所述训练好的定点神经网络为二值神经网络 ...
【技术保护点】
一种基于神经网络的计算方法,其特征在于,包括:接收原始图像;提取所述原始图像的特征张量;基于训练好的定点神经网络对所述特征张量进行处理,以产生图像热力图。
【技术特征摘要】
1.一种基于神经网络的计算方法,其特征在于,包括:接收原始图像;提取所述原始图像的特征张量;基于训练好的定点神经网络对所述特征张量进行处理,以产生图像热力图。2.如权利要求1所述的方法,其特征在于,所述训练好的定点神经网络通过如下方法训练得到:对初始神经网络进行至少一次浮点训练,并将所述浮点训练之后的神经网络的参数定点化;如果所述定点化后的神经网络的参数不满足训练指标,则将所述初始神经网络替换为所述定点化后的神经网络并重复执行上述步骤;如果所述定点化后的神经网络的参数满足所述训练指标,则将所述定点化后的神经网络作为所述训练好的定点神经网络。3.如权利要求1或2所述的方法,其特征在于,所述训练好的定点神经网络为二值神经网络,所述基于训练好的定点神经网络对所述特征张量进行处理包括:所述二值神经网络中的每一个计算节点执行以下操作:对输入数据进行卷积操作;将所述卷积操作的卷积输出二值化。4.如权利要求3所述的方法,其特征在于,所述将所述卷积操作的卷积输出二值化,包括:使用非线性函数将所述卷积输出映射为[-0.5,0.5]闭区间之内的数;对所述映射后的数进行舍入操作,以实现中间表示的二值化。5.如权利要求4所述的方法,其特征在于,所述对所述映射后的数进行舍入操作包括:使用公式Y=floor(y+1)-0.5对所述映射后的数进行舍入操作,其中,y表示所述映射后的数,Y表示二值化后的中间表示,floor表示向下取整。6.如权利要求3所述的方法,其特征在于,所述对输入数据进行卷积操作,包括:通过公式M=bitcount(WxorA)实现矩阵W与矩阵A之间的内积操作,其中,xor为按位异或操作,bitcount计算一个二值串中1的个数并返回,M为二值卷积的结果,W为权重矩阵,A为激活量输入。7.如权利要求2所述的方法,其特征在于,所述训练指标为测试集的测试函数最小化。8.如权利要求1至7任一项所述的方法,其特征在于,所述方法由位于摄像头内的包括现场可编程门阵列FPGA的片上系统SoC实现。9.一种基于神经网络的计算装置,其特征在于,包括:接收模...
【专利技术属性】
技术研发人员:周舒畅,梁喆,张宇翔,温和,周昕宇,
申请(专利权)人:北京旷视科技有限公司,北京小孔科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。