神经网络选择制造技术

技术编号：32724718 阅读：50 留言：0更新日期：2022-03-20 08:29

本发明专利技术题为神经网络选择。本发明专利技术公开了一种识别用于处理数据的神经网络的计算机实现的方法，该方法包括：基于响应于将训练数据集输入到教师神经网络中而在该教师神经网络的神经元中生成的激活模式的相似性，将该训练数据集聚类成多个数据聚类；训练学生神经网络以用于处理该多个数据聚类中的每个数据聚类；以及提供数据分类器神经网络，以用于基于数据的数据聚类识别该经训练的学生神经网络中用于处理数据的一个或多个经训练的学生神经网络。处理数据的一个或多个经训练的学生神经网络。处理数据的一个或多个经训练的学生神经网络。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络选择

技术介绍

[0001]本公开涉及识别用于处理数据的神经网络的计算机实现的方法。本专利技术还公开了相关的非暂态计算机可读存储介质、系统和设备。
[0002]相关技术说明
[0003]神经网络用于多种多样的应用诸如图像分类、语音识别、字符识别、图像分析、自然语言处理、手势识别等。许多不同类型的神经网络诸如卷积神经网络“CNN”、当前神经网络“RNN”、生成对抗网络“GAN”和自动编码器已被开发和定制用于此类应用。
[0004]神经元是神经网络的基本单元。神经元具有一个或多个输入并基于这些输入生成输出。通常将施加到每个输入的数据的值乘以“权重”，并对结果求和。将求和后的结果输入到“激活函数”中，以便确定神经元的输出。该激活函数还具有通过向神经元的激活提供阈值来控制该神经元的输出的“偏差”。神经元通常被布置在层中，这些层可包括输入层、输出层以及布置在该输入层和该输出层之间的一个或多个隐藏层。权重确定网络中神经元之间的连接的强度。权重、偏差和神经元连接是神经网络的“可训练参数”的示例，其在神经网络“训练”过程期间“学习”，或换句话讲，能够被训练。神经网络(尤其是在包括归一化层的神经网络中的神经网络)的可训练参数的另一个示例是(批量)归一化参数。在训练期间，(批量)归一化参数是从流经归一化层的数据的统计值中学习的。
[0005]神经网络还包括用于控制神经网络训练过程的“超参数”。根据所涉及的神经网络的类型，超参数可例如包括以下中的一者或多者：学习速率、衰减速率、动量、学习时间表和批量大小。学习速率控制...

【技术保护点】

【技术特征摘要】
1.一种识别用于处理数据的神经网络的计算机实现的方法，所述方法包括：基于响应于将训练数据集输入到教师神经网络中而在教师神经网络的神经元中生成的激活模式的相似性，将训练数据集聚类成多个数据聚类；训练学生神经网络以用于处理所述多个数据聚类中的每个数据聚类；以及提供数据分类器神经网络，以用于基于所述数据的数据聚类识别所述经训练的学生神经网络中用于处理数据的一个或多个经训练的学生神经网络。2.根据权利要求1所述的计算机实现的方法，其中所述训练学生神经网络以用于处理所述多个数据聚类中的每个数据聚类包括：i)对于每个数据聚类，将来自所述数据聚类的数据输入到学生神经网络中并输入到所述教师神经网络中，以及基于所述教师神经网络的所述输出来优化所述学生神经网络的参数，或者ii)对于每个数据聚类，将来自所述数据聚类的数据输入到学生神经网络中并且基于所述数据的对应标记来优化所述学生神经网络的参数。3.根据权利要求1所述的计算机实现的方法，其中所述聚类训练数据集，以及其中所述训练学生神经网络，以及其中所述提供数据分类器神经网络使用第一处理系统的一个或多个处理器来执行，并且所述方法包括：使用所述第一处理系统的所述一个或多个处理器将所述数据分类器神经网络从所述第一处理系统部署到第二处理系统的一个或多个处理器；以及/或者使用所述第一处理系统的所述一个或多个处理器，以及响应于来自所述第二处理系统的所述一个或多个处理器的、基于由所部署的数据分类器神经网络识别的一个或多个数据聚类生成的请求，将所述经训练的学生神经网络中的一个或多个经训练的学生神经网络从所述第一处理系统部署到所述第二处理系统的所述一个或多个处理器，以用于处理由所述第二处理系统的所述一个或多个处理器接收的数据。4.根据权利要求3所述的计算机实现的方法，所述方法包括使用所述第一处理系统的一个或多个处理器压缩所述数据分类器神经网络和/或每个经训练的学生神经网络，使得所述第一处理系统的所述一个或多个处理器将所述已压缩的数据分类器神经网络部署到所述第二处理系统的所述一个或多个处理器，并且/或者使得响应于来自所述第二处理系统的所述一个或多个处理器的请求，所述第一处理系统的所述一个或多个处理器将所述一个或多个已压缩的经训练的学生神经网络分别部署到所述第二处理系统的所述一个或多个处理器。5.根据权利要求1所述的计算机实现的方法，其中所述聚类训练数据集，以及其中所述训练学生神经网络，以及其中所述提供数据分类器神经网络使用第一处理系统的一个或多个处理器来执行，并且所述方法包括：使用所述第一处理系统的所述一个或多个处理器将所述数据分类器神经网络从所述第一处理系统部署到第二处理系统的一个或多个处理器；以及使用所述第二处理系统的所述一个或多个处理器接收数据；使用所述第二处理系统的所述一个或多个处理器将所接收的数据输入到所述数据分类器神经网络中；使用所述第二处理系统的所述一个或多个处理器来使用所述数据分类器神经网络将所接收的数据分类为属于所述多个数据聚类中的一个或多个数据聚类；
使用所述第二处理系统的所述一个或多个处理器记录由所述数据分类器神经网络分类的所述数据聚类的历史；以及使用所述第二处理系统的所述一个或多个处理器、基于由所述数据分类器神经网络分类的所述数据聚类的所记录历史，识别所述经训练的学生神经网络中的一个或多个经训练的学生神经网络，以用于处理由所述第二处理系统的所述一个或多个处理器接收的另外的数据。6.根据权利要求5所述的计算机实现的方法，所述方法包括：使用所述第一处理系统的所述一个或多个处理器将初始神经网络从所述第一处理系统部署到所述第二处理系统的所述一个或多个处理器；使用所述第二处理系统的所述一个或多个处理器将所接收的数据输入到所述初始神经网络中；以及响应于所述将所接收的数据输入到所述初始神经网络中，使用所述第二处理系统的所述一个或多个处理器从所述初始神经网络生成输出；并且/或者其中所述识别包括将来自所述第二处理系统的所述一个或多个处理器的请求发送到所述第一处理系统的所述一个或多个处理器，使得所述第一处理系统将所识别的一个或多个经训练的学生神经网络部署到所述第二处理系统的所述一个...

【专利技术属性】
技术研发人员：M，
申请(专利权)人：ARM云技术公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人