通过实时代理评估反馈增强的深度神经网络模型设计制造技术

技术编号：37275968 阅读：8 留言：0更新日期：2023-04-20 23:43

本公开提供了通过实时代理评估反馈增强的深度神经网络模型设计。本公开涉及人工智能(AI)、机器学习(ML)和神经体系结构搜索(NAS)技术，具体而言涉及使用代理评估反馈的深度神经网络(DNN)模型工程技术。本文论述的DNN模型工程技术经由低成本的代理得分提供近乎实时的模型性能反馈，而不要求持续的训练和/或验证周期、迭代、历时，等等。与基于代理的评分相结合，半监督学习机制被用来将代理得分映射到各种模型性能度量。可描述和/或要求保护其他实施例。实施例。实施例。

全部详细技术资料下载

【技术实现步骤摘要】
通过实时代理评估反馈增强的深度神经网络模型设计

[0001]本文描述的实施例概括而言涉及人工智能(artificial intelligence，AI)、机器学习(machine learning，ML)和神经体系结构搜索(Neural Architecture Search，NAS)技术，具体而言涉及用于深度神经网络(Deep Neural Network，DNN)模型工程的技术。

技术介绍

[0002]机器学习(ML)是对计算机算法的研究，这些算法通过经验和并且通过使用数据而自动改进。执行机器学习涉及创建统计模型(或者简称为“模型”)，它被配置为处理数据以进行预测和/或推理。ML算法使用样本数据(称为“训练数据”)和/或基于过去的经验来构建模型，从而在没有被明确编程的情况下做出预测或决策。
[0003]ML模型设计是一个漫长的过程，它涉及到高度迭代的训练和验证循环，以调整给定模型的结构、参数和/或超参数。对于诸如深度神经网络(DNN)之类的较大ML体系结构，训练和验证可能是尤其耗费时间并且资源密集的。传统的ML设计技术也可能要求相对大量的计算资源，超出许多用户的能力范围。
[0004]代理任务可用于ML模型设计，以便减少时间长度和资源消耗。代理任务可包括例如在比完整训练会话更少的历时(epoch)中进行训练，用更少的块学习，或者用完整训练数据集的子集(即，“训练子集”)进行训练。使用代理任务，可以减少训练/验证迭代的数目，这应当减少用于训练的时间和资源消耗。然而，使用代理任务训练ML模型可得到准确...

【技术保护点】

【技术特征摘要】
1.一种用于为机器学习(ML)模型预测性能度量的方法，该方法包括：为各个用户生成一组ML模型；对于所述一组ML模型中的每个ML模型，操作代理反馈引擎以为所述一组ML模型中的相应ML模型生成代理得分，其中，该相应ML模型的代理得分是基于该相应ML模型的一个或多个预测性能度量的；训练来自所述一组ML模型的ML模型的子集以为所述ML模型的子集中的相应ML模型获得一个或多个实际性能度量；操作半监督学习(SSL)机制以学习所述一个或多个实际性能度量与所述ML模型的子集中的相应ML模型之间的关系；并且利用学习到的关系更新所述代理反馈引擎来为另一组ML模型生成代理得分。2.如权利要求1所述的方法，其中，所述代理反馈引擎的操作是在不训练所述一组ML模型中的ML模型的情况下发生的。3.如权利要求1所述的方法，其中，为操作所述代理反馈引擎，所述指令的执行将使得所述计算系统：为所述一组ML模型中的第一ML模型从多个代理函数中选择第一代理函数；操作所述第一代理函数以为所述第一ML模型产生第一代理得分；为所述一组ML模型中的第二ML模型从多个代理函数中选择第二代理函数；并且操作所述第二代理函数以为所述第一ML模型产生第二代理得分。4.如权利要求1所述的方法，其中，为操作所述代理反馈引擎，所述指令的执行将使得所述计算系统：为所述一组ML模型中的至少一个ML模型从多个代理函数中选择两个或更多个代理函数；单独操作所述两个或更多个代理函数中的每一者以为所述至少一个ML模型产生对应代理得分；并且基于所述对应代理得分的组合、所述对应代理得分的加权平均、使用所述对应代理得分的集总平均或者使用基于所述对应代理得分的集总学习方法，为所述至少一个ML模型确定最终代理得分。5.如权利要求1所述的方法，其中，个体ML模型是基于由对应用户提供的一个或多个输入为该对应用户生成的。6.如权利要求5所述的方法，其中，由对应用户提供的一个或多个输入包括ML领域中的ML任务，并且其中，为操作所述代理反馈引擎，所述指令的执行将使得所述计算系统：为所述一组ML模型中的每个ML模型，基于由对应用户提供的ML任务和ML领域从多个代理函数中选择代理函数。7.如权利要求6所述的方法，其中，由对应用户提供的一个或多个输入还包括硬件平台规格，并且为每个ML模型选择代理函数还基于所述硬件平台规格。8.如权利要求3所述的方法，其中，所述多个代理函数包括以下各项中的一个或多个：关联阵列、映射函数、字典、散列表、查找表(LUT)、链接列表、ML分类器、参数计数、计算吞吐量度量、雅可比协方差函数、显著性修剪函数、通道修剪函数、试探函数、和超试探函数。9.如权利要求1所述的方法，其中，所述SSL机制包括归纳SSL方法或者直推SSL方法。
10.如权利要求1所述的方法，其中，所述SSL机制包括从包括以下各项的群组中选择的SSL方法：自我训练包装方法、共同训练包装方法、提升包装方法、无监督预处理特征提取方法、无监督预处理预训练方法、无监督预处理聚类然后标记方法、以及内在半监督方法、图卷积网络(GCN)、以及直推式支持向量机(TSVM)。11.一种非暂态计算机可读存储介质，包括用于为机器学习模型预测性能度量的指令，其中所述指令被计算系统的一个或多个处理器执行将使得所述计算系统执行如权利要求1到10中任一项所述的方法。12.一种用于提供机器学习模型开发环境(MDE)的装置，该装置包括：接口电路，被配置为从客户端设备获得机器学习(ML)输入；以及与所述接口电路通信地耦合的处理器电路，其中，所述处理器电路响应于从所述客户端设备接收到所述ML输入中的个体输入，而被配置为：基于所述个体输入获得ML模型，从代理反馈引擎为所述ML模型获得代理得分，其中：所述ML模型的代理得分是基于所述ML模型的一组预测性能度量的，所述ML模型和所述代理得分中的至少一者被半监督学习(SSL)机制用来学习实际性能度量和经训练的ML模型之间的关系，并且学习到的关系被所述代理反馈引擎用来为其他ML模型生成代理得分，并且经由所述接口电路将所述ML模型和所述代理得分提供给所述客户端设备。13.如权利要求12所述的装置，其中，所述处理器电路还用于：操作服务器侧MDE应用来使得能够从...

【专利技术属性】
技术研发人员：丹尼尔，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人