数据处理方法及其电子设备和介质技术

技术编号：38151852 阅读：9 留言：0更新日期：2023-07-13 09:16

本申请涉及人工智能领域，涉及一种数据处理方法及其电子设备和介质，方法包括：获取对第一神经网络模型的模型参数进行量化的第一输入数据集；从第一输入数据集中筛选出满足第一条件的数据组成第二输入数据集；基于调节系数对第二输入数据集中的数据进行调整得到第三输入数据集；使用第三输入数据集对第一神经网络模型的模型参数进行量化，得到第二神经网络模型。确定出的第三输入数据集的数据量小于第一输入数据集的数据量，但第三输入数据集的种类能够尽可能多地覆盖第一输入数据集的种类，使得对神经网络模型进行量化所消耗的时间较少，且保持了通过量化后的神经网络模型的精度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法及其电子设备和介质

[0001]本申请涉及人工智能领域，特别涉及一种数据处理方法及其电子设备和介质。

技术介绍

[0002]在人工智能领域中，对于训练完成的神经网络模型来说，需要对神经网络模型进行量化后才能部署运行。如图1所示，这里的量化是指确定神经网络模型100的各数据处理层的模型参数，也就是，调整训练完成的神经网络模型的权值，激活值等等模型参数的数值范围，节省神经网络模型的存储空间，例如：将神经网络模型的模型参数从高精度(原始的数值范围)转化成低精度(量化后的数值范围)。
[0003]通常会使用较大的输入数据(验证数据集)对训练完成的神经网络模型进行量化以确保量化后的神经网络模型的精度，但是较大的验证数据集也会增加对神经网络模型进行量化的耗时。例如：较大的数据集中，许多样本数据的特征之间存在相关性，增加了量化的复杂性。因此，需要找到一种减少量化的耗时，又能够尽量保持量化的精度的方法。

技术实现思路

[0004]有鉴于此，本申请实施例提供一种数据处理方法、介质和电子设备。
[0005]本申请的第一方面提供了一种数据处理方法，包括：
[0006]获取对第一神经网络模型的模型参数进行量化的第一输入数据集；
[0007]从第一输入数据集中筛选出满足第一条件的数据组成第二输入数据集，其中，第一条件包括：第二输入数据集中的各数据，与第一输入数据集中的多个数据之间的数据相关性小于第一相关性阈值；
[0008]基于调节系数对第二输入数据集中的数据进行调整得到第三...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：获取对第一神经网络模型的模型参数进行量化的第一输入数据集；从所述第一输入数据集中筛选出满足第一条件的数据组成第二输入数据集，其中，所述第一条件包括：所述第二输入数据集中的各数据，与所述第一输入数据集中的多个数据之间的数据相关性小于第一相关性阈值；基于调节系数对第二输入数据集中的数据进行调整得到第三输入数据集，其中，所述调节系数是所述第一输入数据集中的数据，并且所述调节系数与所述第二输入数据集中的数据的相关性满足第二条件；使用所述第三输入数据集对所述第一神经网络模型的模型参数进行量化，得到第二神经网络模型。2.根据权利要求1所述的数据处理方法，其特征在于，所述第二输入数据集中的数据不相同。3.根据权利要求2所述的数据处理方法，其特征在于，所述第二条件包括：所述调节系数与所述第二输入数据集中的各数据之间的数据相关性的最大值大于第二相关性阈值，其中，所述调节系数与所述第二输入数据集中的各数据不相同。4.根据权利要求3所述的数据处理方法，其特征在于，所述第一输入数据集和所述第二输入数据集中的数据包括以下类型中的至少一种：图像特征向量；语音特征向量；文字特征向量。5.根据权利要求4所述的数据...

【专利技术属性】
技术研发人员：许礼武，余宗桥，黄敦博，
申请(专利权)人：安谋科技中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人