神经网络模型的运行方法、可读介质和电子设备技术

技术编号：35990481 阅读：6 留言：0更新日期：2022-12-17 23:05

本申请涉及人工智能领域，公开了一种神经网络模型的运行方法、可读介质和电子设备。该方法应用于电子设备，其中方法包括：电子设备根据输入数据的大小以及每层计算层的模型参数，预测计算结果的大小；根据预测计算结果的大小，确定多个子结果的大小；电子设备基于每个子结果的大小以及每层计算层的模型参数，确定每个子结果在输入数据中对应的数据块的范围，然后对每个数据块进行计算，得到每个数据块对应的子结果；电子设备根据每个数据块对应的子结果，确定输入数据对应的计算结果。这样，电子设备每次只用对输入数据中部分数据进行计算，不会一次性产生较多中间数据，减少了运行神经网络模型过程中对内存的占用。行神经网络模型过程中对内存的占用。行神经网络模型过程中对内存的占用。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的运行方法、可读介质和电子设备

[0001]本申请涉及人工智能领域，特别涉及一种神经网络模型的运行方法、可读介质和电子设备。

技术介绍

[0002]随着人工智能(artificial intelligence，AI)的迅速发展，卷积神经网络模型在人工智能领域的应用越来越广泛。在卷积神经网络的计算过程中，是将待计算的数据全部输入到卷积层，然后逐层进行计算。由于现有的卷积神经网络的通道数越来越多，如果同时输入全部数据通道，会导致数据量较大，整个卷积计算过程需要消耗大量的存储和计算资源。
[0003]由于硬件设备(例如计算机装置)的计算能力有限，在神经网络的计算过程中，如果输入的待计算的数据较多，而且每一层卷积层的权值通道较多，会产生很多的中间结果，导致对硬件设备的要求过高。对于一些性能不够高的硬件设备来说，过多的输入数据和生成的中间数据可能会造成数据溢出，导致计算出现错误。

技术实现思路

[0004]有鉴于此，本申请实施例提供了神经网络模型的运行方法、可读介质和电子设备。
[0005]第一方面，本申请实施例提供了一种神经网络模型的运行方法，应用于电子设备，神经网络模型包括多个计算层，该方法包括：根据输入数据张量的大小以及每层计算层的模型参数，预测输入数据张量对应的计算结果张量的大小；根据计算结果张量的大小，确定多个子结果张量的大小；基于每个子结果张量的大小以及每层计算层的模型参数，确定每个子结果张量在输入数据张量中对应的数据块的范围；根据每层计算层的模型参数对每个数据块进行计算...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的运行方法，应用于电子设备，其特征在于，所述神经网络模型包括多个计算层，所述方法包括：根据输入数据张量的大小以及每层计算层的模型参数，预测所述输入数据张量对应的计算结果张量的大小；根据所述计算结果张量的大小，确定多个子结果张量的大小；基于每个子结果张量的大小以及所述每层计算层的模型参数，确定所述每个子结果张量在所述输入数据张量中对应的数据块的范围；根据所述每层计算层的模型参数对所述每个数据块进行计算，得到所述每个数据块对应的子结果张量；根据所述每个数据块对应的子结果张量，确定所述输入数据张量对应的计算结果张量。2.根据权利要求1所述方法，其特征在于，所述计算层为卷积层或者反卷积层，所述卷积层用于对所述输入数据张量进行卷积操作，所述反卷积层用于对所述输入数据张量进行反卷积操作；所述模型参数包括卷积操作或反卷积操作的步长、卷积核大小以及填充块数量。3.根据权利要求2所述方法，其特征在于，基于每个子结果张量的大小以及所述每层计算层的模型参数，确定每个子结果张量在所述输入数据张量中对应的数据块的范围，包括：根据每个子结果张量的大小以及所述每层计算层的模型参数，确定所述每个数据块的大小；根据每个子结果张量的大小以及所述每层计算层的模型参数，确定相邻数据块之间重叠区域的大小；根据所述每个数据块的大小以及所述相邻数据块之间重叠区域的大小，确定每个子结果张量在输入数据张量中对应的数据块的范围。4.根据权利要求3所述方法，其特征在于，根据每个子结果张量的大小以及所述每层计算层的模型参数，确定相邻数据块之间重叠区域的大小，包括:根据所述每个子结果张量在不同维度方向上的前一个子结果张量的大小以及每层计算层的模型参数，确定当前子结果张量对应的数据块与在不同维度方向上的前一子结果张量对应的数据块之间...

【专利技术属性】
技术研发人员：许礼武，余宗桥，黄敦博，
申请(专利权)人：安谋科技中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人