多媒体数据的识别方法、装置、设备及计算机存储介质制造方法及图纸

技术编号:26223559 阅读:34 留言:0更新日期:2020-11-04 10:56
本申请公开了一种多媒体数据的识别方法、装置、设备及计算机存储介质,属于数据处理技术领域。所述方法包括:获取第二神经网络模型;获取待识别的多媒体数据;通过第二神经网络模型对待识别的多媒体数据进行识别并获取识别结果。由于该第二神经网络模型中不包括目标批标准化层,而是由根据目标批标准化层的预处理参数确定的批标准化处理公式来实现目标批标准化层的相同的功能,如此可以简化第二神经网络模型的结构,并减少第二神经网络模型中批标准化处理的运算量,加快神经网络模型的处理速度。解决了相关技术中多媒体数据的识别方法的运算量较大,识别速度较慢的问题,达到了减少多媒体数据的识别方法的运算量,加快识别速度的效果。

【技术实现步骤摘要】
多媒体数据的识别方法、装置、设备及计算机存储介质
本申请涉及数据处理
,特别涉及一种多媒体数据的识别方法、装置、设备及计算机存储介质。
技术介绍
多媒体数据识别是一种对于图像数据和音频数据等各种多媒体数据的识别的技术,通过对图像数据和音频数据的识别,可以实现对图像数据和音频数据的分类、处理和分析等各种技术效果。相关技术中一种多媒体数据的识别方法中,通过神经网络模型来对待识别的多媒体数据进行识别,该神经网络模型包括至少一个隐层,批标准化(BatchNormalization,BN)层接在神经网络模型的隐层后,隐层的输出作为BN层的输入,BN层的输出作为下一层的输入,从而实现对神经网络模型的优化。但是,上述多媒体数据的识别方法中,神经网络模型的结构较为复杂,且运算量较大,进而使得多媒体数据的识别方法的运算量较大,识别速度较慢。
技术实现思路
本申请实施例提供了一种多媒体数据的识别方法、装置、设备及计算机存储介质。所述技术方案包括下列内容。根据本申请的一方面,提供了一种多媒体数据的识别方法,所本文档来自技高网...

【技术保护点】
1.一种多媒体数据的识别方法,其特征在于,所述方法包括:/n获取第二神经网络模型,所述第二神经网络模型由去除第一神经网络模型的目标批标准化层后,将批标准化处理公式添加至所述第一神经网络模型的目标隐层中后得到,所述第一神经网络模型包括至少一个隐层,所述至少一个隐层中的所述目标隐层与所述目标批标准化层连接,所述批标准化处理公式由所述目标批标准化层的预处理参数得到,所述批标准化处理公式用于将所述目标隐层的原始输出量处理为处理输出量,并将所述处理输出量输入所述目标隐层的下一层;/n获取待识别的多媒体数据;/n通过所述第二神经网络模型对所述待识别的多媒体数据进行识别;/n获取所述第二神经网络模型的识别结...

【技术特征摘要】
1.一种多媒体数据的识别方法,其特征在于,所述方法包括:
获取第二神经网络模型,所述第二神经网络模型由去除第一神经网络模型的目标批标准化层后,将批标准化处理公式添加至所述第一神经网络模型的目标隐层中后得到,所述第一神经网络模型包括至少一个隐层,所述至少一个隐层中的所述目标隐层与所述目标批标准化层连接,所述批标准化处理公式由所述目标批标准化层的预处理参数得到,所述批标准化处理公式用于将所述目标隐层的原始输出量处理为处理输出量,并将所述处理输出量输入所述目标隐层的下一层;
获取待识别的多媒体数据;
通过所述第二神经网络模型对所述待识别的多媒体数据进行识别;
获取所述第二神经网络模型的识别结果。


2.根据权利要求1所述的方法,其特征在于,所述获取第二神经网络模型,包括:
获取所述第一神经网络模型;
获取所述目标批标准化层的预处理参数,所述目标批标准化层用于根据所述预处理参数对所述目标隐层的原始输出量进行处理,得到处理输出量;
根据所述预处理参数得到所述目标批标准化层的批标准化处理公式;
去除所述目标批标准化层;
将所述批标准化处理公式添加至所述目标隐层中,得到所述第二神经网络模型。


3.根据权利要求1或2所述的方法,其特征在于,所述批标准化处理公式,包括:


其中,所述,所述,所述为所述处理输出量的第i个元素,所述为所述原始输出量的第i个元素,所述为所述目标批标准化层的权重的第i个元素,所述为所述目标批标准化层的数据方差的第i个元素,所述eps为一个预设的数,所述bbn(i)为所述目标批标准化层的补偿量的第i个元素,所述ebn(i)为所述目标批标准化层的数据均值的第i个元素;
所述目标批标准化层的预处理参数包括所述,所述,所述bbn(i)以及所述ebn(i)。


4.根据权利要求3所述的方法,其特征在于,所述目标隐层为全连接层时,所述原始输出量的第i个元素,所述批标准化处理公式包括:


其中,所述inputsize为所述全连接层的输入维度,所述为所述全连接层的权重矩阵的第i行第j列的元素,所述s(j)为所述全连接层的输入特征量的第j列的元素,所述bfc(i)为所述全连接层的补偿量的第i行的元素。


5.根据权利要求3所述的方法,其特征在于,所述目标隐层为卷积层时,所述卷积层的第J个输出通道对应的所述原始输出量,所述批标准化处理公式包括:


其中,所述为所述卷积层第J个输出通道对应的处理输出量的第i个元素,所述为所述卷积层第L个输入通道第J个输出通道对应的处理输出量的第i个元素的卷积核矩阵,所述为所述卷积层第L个输入通道的输入量,所述为所述卷积层第J个输出通道的补...

【专利技术属性】
技术研发人员:栾天祥陈孝良冯大航
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1