【技术实现步骤摘要】
一种基于三维垂直阻变存储器的视频动作识别方法和装置
[0001]本专利技术属于非易失性存储器
,涉及一种基于三维垂直阻变存储器的视频动作识别方法和装置。
技术介绍
[0002]近年来,人工智能技术越来越成熟,卷积神经网络是深度学习的代表算法之一。卷积核是卷积神经网络中重要的特征提取器。应用于2维图像的卷积神经网络缺乏捕捉图像之间相关性的能力。因此,对于视频动作识别,为了捕获时间的相关性,采用三维卷积神经网络3D
‑
CNN,在卷积核中引入了视频的时间信息。但是,3D
‑
CNN的硬件实现在面积和能量上都比较昂贵。VRRAM即垂直RRAM作为一种新兴技术,在面积,能源效率和并行性方面将比1T1R和1S1R等集成技术具有更大的优势。此外,得益于三维堆叠结构的优势,三维垂直交叉阻变存储器3D
‑
VRRAM中的每一层都可以作为单独的卷积核使用,具有高度的并行性。然而仍然存在一些问题,首先,实现3D
‑
VRRAM技术的挑战是高自整流器件,其次,由于非线性和非对称 ...
【技术保护点】
【技术特征摘要】
1.一种基于三维垂直阻变存储器的视频动作识别方法,其特征在于,包括以下步骤:步骤一,搭建基于自整流器件的三维垂直阻变存储器;步骤二,采集并预处理用于视频动作识别的训练集图像和测试集图像;步骤三,构造三维卷积神经网络模型;步骤四,使用训练集图像,在三维垂直阻变存储器上仿真训练三维卷积神经网络模型;步骤五,利用在三维垂直阻变存储器上训练好的三维卷积神经网络模型,输入测试集图像,进行视频动作识别。2.如权利要求1所述的一种基于三维垂直阻变存储器的视频动作识别方法,其特征在于,所述三维垂直阻变存储器由4层RRAM阻变存储器阵列堆叠组成,每个RRAM阻变存储器阵列由m行n列的RRAM单元器件组成,每个RRAM单元的器件结构包括铂Pt、碳C、氧化铌NbO
x
和锡TiN,其中阻变材料氧化铌NbO
x
与铂Pt电极形成肖特基势垒,使RRAM阵列出现整流特性。3.如权利要求1所述的一种基于三维垂直阻变存储器的视频动作识别方法,其特征在于,所述步骤二,具体为:采集视频,对视频流进行视频分帧处理,得到多帧RGB图像,每4帧图像作为一个样本,每个样本的大小为4
×
H
×
W
×
C,其中4表示帧数,H表示图像高度,W表示图像宽度,C表示图像通道数;将每个样本的RGB图像转换为灰度图像,得到新的样本,大小为4
×
H
×
W,然后将每个样本的尺寸缩小1/2,缩放后的样本大小为4
×
H
½×
W
ꢀ½
,将缩放后的所有样本选取80%作为训练集图像,剩余的20%作为测试集图像。4.如权利要求1所述的一种基于三维垂直阻变存储器的视频动作识别方法,其特征在于,所述三维卷积神经网络模型的结构为:依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、全连接层和分类器,其中,每层参数的设置如下:输入层的特征通道数设置为4;第一卷积层的特征通道数设置为32,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。