【技术实现步骤摘要】
一种基于零值检测的卷积神经网络硬件系统及运算方法
本专利技术涉及卷积神经网络,具体为一种基于零值检测的卷积神经网络硬件系统及运算方法。
技术介绍
人工智能是目前热门的计算机科学之一,作为实现人工智能的主要方式,深度学习也得到了深远的发展。卷积神经网络(ConvolutionNeuralNetwork,CNN)是人工神经网络结构研究最多、应用最广的网络结构之一,目前已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于CNN避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。近年来卷积神经网络在计算机视觉领域取得了很不错的成就,同时也让卷积神经网络得到了发展。神经网络的核心是运算,CNN在应用于计算机视觉领域时,利用卷积核对图像数据进行特征提取。同时,为了提高图像特征提取的效率,神经网络的神经元中需要有激活函数,激活函数是神经网络中不可缺少的一部分。ReLU作为激活函数的一种,在训练时可以有效避免梯度爆炸和梯度消失问题,同时简化了神经网络的计算过程,已经成为了一个常用的激活函数。用ReLU作为激活函数的卷积神经网络在运算过程中,会产 ...
【技术保护点】
1.一种基于零值检测的卷积神经网络硬件系统,其特征在于,包括数据输入存储器、零值检测模块、PE阵列和权值存储器;输入数据存储器,用于存储卷积神经网络全连接层的输入数据,并根据接收到的输入数据的读使能信号将输入数据传送至零值检测模块和PE阵列;PE阵列,用于传送输入数据的读使能信号至输入数据存储器,传送权值数据的读使能信号至零值检测模块;根据接收到的0值检测结果进行操作:如果输入数据为0,则PE阵列将输出数据置为0,否则PE阵列正常工作;还用于进行卷积神经网络全连接层中输入数据和权值数据的乘加操作;零值检测模块,用于检测接收到的输入数据是否为0值,并将得到的0值检测结果分为两 ...
【技术特征摘要】
1.一种基于零值检测的卷积神经网络硬件系统,其特征在于,包括数据输入存储器、零值检测模块、PE阵列和权值存储器;输入数据存储器,用于存储卷积神经网络全连接层的输入数据,并根据接收到的输入数据的读使能信号将输入数据传送至零值检测模块和PE阵列;PE阵列,用于传送输入数据的读使能信号至输入数据存储器,传送权值数据的读使能信号至零值检测模块;根据接收到的0值检测结果进行操作:如果输入数据为0,则PE阵列将输出数据置为0,否则PE阵列正常工作;还用于进行卷积神经网络全连接层中输入数据和权值数据的乘加操作;零值检测模块,用于检测接收到的输入数据是否为0值,并将得到的0值检测结果分为两路,一路发送到PE阵列,另一路与接收到的权值数据的读使能信号做逻辑运算,得到权值存储器的读使能信号,并将该权值存储器的读使能信号发送至权值存储器;权值存储器,用于存储卷积神经网络全连接层的权值数据,并根据接收到的权值存储器的读使能信号进行操作:当输入数据不为0且PE阵列发送的读使能信号为1时,权值存储器接收到的读使能信号为1,权值数据被读出传输到PE阵列中;当输入数据为0时,权值存储器接收到的读使能信号为0,跳过该输入数据所对应的权值的行地址。2.根据权利要求1所述的基于零值检测的卷积神经网络硬件系统,其特征在于,零值检测模块包括比较器,比较器将输入数据与0值进行比较,用于检测输入数据是否为0值。3.根据权利要求1所述的基于零值检测的卷积神经网络硬件系统,其特征在于,卷积神经网络为AlexNet或VGG-16...
【专利技术属性】
技术研发人员:杨晨,张海波,王小力,耿莉,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。