【技术实现步骤摘要】
一种数据处理方法、装置、电子设备及可读介质
本申请涉及数据处理
,特别是涉及数据处理方法、数据处理装置、电子设备、机器可读介质。
技术介绍
音频播放的声音是随着时间生成的,所以很自然的被表示为一维时间序列,这样的数据称为序列数据。语言中的单词也是逐个出现的,这样的数据也是序列数据,它们都包含时间的概念。而将这样一段序列数据转换为一个固定长度向量表示的方法,称为序列建模(SequenceModels)。目前,在音频数据的序列建模中,通常的计算过程是:将音频信号分帧加窗并提取特征,将若干帧(例如W=100帧)特征组成一个滑动窗口,作为一个整体,输入一个卷积神经网络进行计算,例如,TCN(TemporalConvolutionalNetwork,时域卷积网络),并得到网络的输出(一般为1帧特征)作为该段特征序列的向量表示结果,当前滑动窗口向后滑动若干帧(例如H=10帧),即将当前滑动窗口的前面若干帧(例如H=10帧)移出滑动窗口,并在当前滑动窗口后面添加新的若干帧(例如H=10帧),组成下一个滑动窗口,重复向后滑动窗口,直至所有帧都计算完。申请人经研究发现,卷积神经网络计算中存在一定程度的上下文依赖关系,在使用TCN模型进行序列建模这个场景中,传统的做法是对输入的所有特征帧进行计算,首先得到与输入帧数相等的输出帧,然后从输出帧中取最后一帧作为最终的向量表示结果。这样一来就出现了有些帧不是必要计算的问题,造成了计算资源的浪费。
技术实现思路
鉴于上述问题,本申请实施例提出了一种克服上 ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小;/n根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数;/n在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层;/n输出所述目标特征数据。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小;
根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数;
在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层;
输出所述目标特征数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数包括:
对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少所述预定值后和最后一个卷积层对应的卷积核大小之间的第二和值;所述预定值为正整数;
将所述第一和值和第二和值之中的较小值确定为所述目标帧数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标帧数,调整所述各个卷积层待输入的特征数据包括:
对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标帧数,对所述各个卷积层待输入的特征数据调整包括:
对于每一卷积层,若对应的所述目标帧数小于或者等于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述卷积神经网络采用浮点数进行存储和计算时,记录每一卷积层输出的特征数据的最大值和最小值;
根据所述每一卷积层输出的特征数据的最大值和最小值,确定对应的卷积层采用定点数时的整数位数和小数位数;
在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述各个卷积层采用定点数时的整数位数和小数位数,在所述各个卷积层中采用定点数进行存储和计算。
6.根据权利要求1所述的方法,其特征在于,在所述获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小之前,所述方法还包括:...
【专利技术属性】
技术研发人员:唐文琦,朱宝亮,赵成帅,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。