信息处理方法、神经网络的训练方法、装置及存储介质制造方法及图纸

技术编号：27744279 阅读：21 留言：0更新日期：2021-03-19 13:38

本申请实施例公开了一种信息处理方法、神经网络的训练方法、装置及计算机可读存储介质，信息处理方法包括：获取包括多个带有标签的样本的初始样本集；确定该多个带有标签的样本中每个样本的冗余权重，该多个带有标签的样本中第一样本的冗余权重与该第一样本的类间相似度相关；根据样本的冗余权重从该初始样本集中去除部分样本以得到精简样本集，该第一样本的冗余权重越小，其被选入该精简样本集的可能性越高，由于其他类别的样本的数目通常远大于所属类别内的样本的数目，因此，类间相似度能够体现初始样本集中更多样本的信息，基于本申请样本冗余权重的确定方法得到精简样本集，对神经网络进行训练，有利于提高神经网络的测试精度和训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
信息处理方法、神经网络的训练方法、装置及存储介质本申请要求于2019年9月18日提交中国专利局、申请号为201910883302.0、专利技术名称为“信息处理方法、神经网络的训练方法、装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。
本申请涉及信息处理领域，尤其涉及一种信息处理方法、神经网络的训练方法、装置及计算机可读存储介质。
技术介绍
随着神经网络性能的不断提升，神经网络的深度和计算复杂度也在不断提升，从而导致神经网络的训练时长也不断增加。目前大部分神经网络是利用全量的样本集进行训练，样本数目过多，训练时长过长。为了缩短训练时长，现有技术提出从样本集中去除部分样本，基于得到的精简后的样本集训练神经网络。对于同一样本集，从样本集中去除的样本不同，训练得到的神经网络模型的测试精度和/或训练时长不同，这表明样本集中不同样本对训练神经网络的重要性一般不同。为了保证神经网络模型的测试精度，现有技术提出根据样本对训练神经网络的重要性来对样本集进行精简，一般用样本的权重信息或冗余权重来衡量该样本对训练神经网络的重要性，从样本集中去除冗余权重较高的样本，能够保证训练得到的神经网络模型的测试精度，而从样本集中去除冗余权重较低的样本，容易降低训练得到的神经网络模型的测试精度。对样本集中样本的冗余权重的确定方法决定着训练神经网络所采用的样本，进而影响着训练得到的神经网络的测试精度。现有技术提出以样本与所属类别中其他样本的相似度作为样本的冗余权重，从样本集中去除冗余权重较高的部分样本，形成精简后...

【技术保护点】
1.一种信息处理方法，其特征在于，包括：/n获取初始样本集，所述初始样本集包括多个带有标签的样本，其中，一个样本携带的标签用于标识所述样本的类别；/n确定所述多个带有标签的样本中每个样本的冗余权重，所述多个带有标签的样本中第一样本的冗余权重与所述第一样本的类间相似度相关，所述第一样本的类间相似度用于表示所述第一样本与所述多个带有标签的样本中所述第一样本所属类别以外的其他类别的样本之间的相似程度，其中，所述第一样本为所述每个样本中的任意一个；/n根据所述多个带有标签的样本中每个样本的冗余权重，从所述初始样本集中去除部分样本，以得到精简样本集，所述第一样本的冗余权重越小，其被选入所述精简样本集的可能性越高。/n

【技术特征摘要】
20190918 CN 20191088330201.一种信息处理方法，其特征在于，包括：
获取初始样本集，所述初始样本集包括多个带有标签的样本，其中，一个样本携带的标签用于标识所述样本的类别；
确定所述多个带有标签的样本中每个样本的冗余权重，所述多个带有标签的样本中第一样本的冗余权重与所述第一样本的类间相似度相关，所述第一样本的类间相似度用于表示所述第一样本与所述多个带有标签的样本中所述第一样本所属类别以外的其他类别的样本之间的相似程度，其中，所述第一样本为所述每个样本中的任意一个；
根据所述多个带有标签的样本中每个样本的冗余权重，从所述初始样本集中去除部分样本，以得到精简样本集，所述第一样本的冗余权重越小，其被选入所述精简样本集的可能性越高。

2.根据权利要求1所述的方法，其特征在于，所述第一样本的冗余权重与所述第一样本的类间相似度负相关。

3.根据权利要求1或2所述的方法，其特征在于，所述第一样本的类间相似度为根据所述第一样本与所述其他类别的样本的聚类中心之间的距离确定的。

4.根据权利要求3所述的方法，其特征在于，所述其他类别包括第1类别、第2类别、……、和第n类别，其中，n为大于1的整数；
所述第一样本的类间相似度为根据所述第一样本的类间距离集中的最小距离确定的，所述第一样本的类间距离集包括所述第一样本与所述第1类别的样本的聚类中心之间的距离、所述第一样本与所述第2类别的样本的聚类中心之间的距离、……、和所述第一样本与所述第n类别的样本的聚类中心之间的距离。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述第一样本的冗余权重与所述第一样本的类内相似度正相关，所述第一样本的类内相似度用于表示所述第一样本与其所属类别中其他样本之间的相似程度。

6.根据权利要求5所述的方法，其特征在于，所述第一样本的类内相似度为根据所述第一样本与其所属类别的样本的聚类中心之间的距离确定的。

7.根据权利要求1至6中任一项所述的方法，其特征在于，在得到所述精简样本集之后，所述方法还包括：
基于所述精简样本集训练神经网络，所述神经网络的学习率与取样比例相关，所述取样比例为在得到所述精简样本集的过程中从所述初始样本集中去除的样本的数目与所述初始样本集中样本的数目之间的比例。

8.根据权利要求7所述的方法，其特征在于，所述基于所述精简样本集训练神经网络，包括：
基于所述精简样本集对所述神经网络进行第j次迭代训练，j为正整数。

9.根据权利要求8所述的方法，其特征在于，在所述基于所述精简样本集对所述神经网络进行第j次迭代训练之后，所述方法还包括：
根据所述多个带有标签的样本中每个样本的冗余权重，从所述初始样本集中去除部分样本，以得到第j+1精简样本集；
基于所述第j+1精简样本集对所述神经网络进行第j+1次迭代训练。

10.根据权利要求8所述的方法，其特征在于，第j次迭代训练处于学习率上升阶段，所述神经网络在第j次迭代训练的学习率与所述取样比例正相关。

11.根据权利要求8所述的方法，其特征在于,第j次迭代训练处于学习率下降阶段，所述神经网络在第j次迭代训练的学习率与所述取样比例负相关。

12.根据权利要求5或6所述的方法，其特征在于，所述第一样本的冗余权重和所述第一样本的类内相似度与类间相似度的比值相关。

13.根据权利要求12所述的方法，其特征在于，若第二样本的类内相似度与所述第二样本的类间相似度的比值与第三样本的类内相似度与所述第三样本的类间相似度的比值相同，则所述第二样本的冗余权重与所述第三样本的冗余权重相同，其中，所述第二样本和所述第三样本为所述多个带有标签的样本中的任意两个样本。

14.根据权利要求12所述的方法，其特征在于，若第四样本的类内相似度与所述第四样本的类间相似度的比值大于第五样本的类内相似度与所述第五样本的类间相似度的比值，则所述第四样本的冗余权重大于所述第五样本的冗余权重，其中，所述第四样本和所述第五样本为所述多个带有标签的样本中的两个样本。

15.根据权利要求13或14所述的方法，其特征在于，所述第一样本的冗余权重为所述第一样本被从所述初始样本集中去除的概率；
第六样本为所述多个带有标签的样本中的任意一个样本，若所述第六样本的类内相似度与所述第六样本的类间相似度相同，则第六样本的冗余权重为0.5。

16.一种神经网络的训练方法，其特征在于，包括：
获取初始样本集，所述初始样本集包括多个样本；
从所述初始样本集中去除部分样本，以得到精简样本集；
基于所述精简样本集训练神经网络，所述神经网络的学习率与取样比例相关，所述取样比例为从所述初始样本集中去除的样本的数目与所述初始样本集中样本的数目之间的比例。

17.根据权利要求16所述的方法，其特征在于，所述基于所述精简样本集训练神经网络，包括：
基于所述精简样本集对所述神经网络进行第j次迭代训练，j为正整数。

18.根据权利要求17所述的方法，其特征在于，在所述基于所述精简样本集对所述神经网络进行第j次迭代训练之后，所述方法还包括：
根据所述多个带有标签的样本中每个样本的冗余权重，从所述初始样本集中去除部分样本，以得到第j+1精简样本集；
基于所述第j+1精简样本集对所述神经网络进行第j+1次迭代训练。

19.根据权利要求17所述的方法，其特征在于，第j次迭代训练处于学习率上升阶段，所述神经网络在第j次迭代训练的学习率与所述取样比例正相关。

20.根据权利要求17所述的方法，其特征在于,第j次迭代训练处于学习率下降阶段，所述神经网络在第j次迭代训练的学习率与所述取样比例负相关。

21.一种信息处理装置，其特征在于，包括：
获取模块，用于获取初始样本集，所述初始样本集包括多个带有标签的样本，其中，一个样本携带的标签用于标识所述样本的类别；
权重确定模块，用于确定所述多个带有标签的样本中每个样本的冗余权重，所述多个带有标签的样本中第一样本的...

【专利技术属性】
技术研发人员：陈雷，阿米尔·卡吉斯塔·加拉希卡勒，王君，朱雄威，应江勇，姜奕祺，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人