自动提前退出机器学习模型制造技术

技术编号：38207485 阅读：13 留言：0更新日期：2023-07-21 16:56

本公开的某些方面提供了用于利用自动退出机器学习模型架构进行处理的技术，包括：在分类模型的第一部分中处理输入数据以生成第一中间激活数据；向第一门提供第一中间激活数据；由第一门作出关于是否要退出由该分类模型进行的处理的确定；以及从该分类模型的多个分类器之一生成分类结果。类器之一生成分类结果。类器之一生成分类结果。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】自动提前退出机器学习模型
[0001]相关申请的交叉引用
[0002]本申请要求于2021年11月15日提交的美国专利申请No.17/527,076的优先权，该美国专利申请要求于2020年11月16日提交的美国临时专利申请No.63/114,434的权益和优先权，这些申请中的每一者的全部内容通过援引整体纳入于此。
[0003]引言
[0004]本公开的各方面涉及包括中间分类器的机器学习模型架构，其允许模型的自动提前退出以节省计算资源。
[0005]机器学习可一般产生经训练模型(例如，人工神经网络、树或其他结构)，其表示对训练数据集合的广义拟合。将经训练模型应用于新数据产生“推断”，这可被用于获得关于新数据的洞察。
[0006]机器学习模型被越来越多地用于各种领域，包括用于分类、检测和识别任务。例如，机器学习模型正被用于基于由电子设备上的一个或多个机载传感器所提供的传感器数据在这些设备上执行复杂任务，诸如自动检测由电子设备的相机传感器提供的图像内的特征(例如，面部)。
[0007]然而，常规的机器学习方法必须在较大的计算密集型模型和较小的不太计算密集型模型之间进行选择，前者在宽泛范围的输入数据上表现良好，后者可能在简单的输入数据上表现良好，但在复杂的输入数据上表现不佳。这种趋势是由依赖于整个模型来馈送单个输出层(诸如分类层)的模型架构产生的。因为较低功率处理设备(诸如移动设备、物联网(IoT)设备、始终在线设备、边缘处理设备、智能可穿戴设备等)可具有限制板载计算、存储器和功率资源的固有设计限制，所以此类设...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种处理器实现的方法，包括：在分类模型的第一部分中处理输入数据以生成第一中间激活数据；向第一门提供所述第一中间激活数据；由所述第一门作出关于是否要退出由所述分类模型进行的处理的确定；以及从所述分类模型的多个分类器中的一个分类器生成分类结果。2.如权利要求1所述的方法，其中所述第一门包括：池化层，所述池化层被配置成降低所述第一中间激活数据的维度；一个或多个神经网络层，所述一个或多个神经网络层被配置成生成关于是否要退出由所述分类模型进行的处理的确定；以及Gumbel采样组件。3.如权利要求2所述的方法，其中所述一个或多个神经网络层包括多个多层感知器层。4.如权利要求1所述的方法，其中：由所述第一门进行的所述确定包括关于退出所述分类模型的处理的确定，并且所述方法进一步包括：利用所述多个分类器中的第一分类器处理所述第一中间激活数据以生成所述分类结果，其中所述多个分类器中的每个分类器与模型部分相关联，并且其中所述分类模型包括模型部分的定向序列。5.如权利要求1所述的方法，其中：由所述第一门进行的所述确定包括关于继续所述分类模型的处理的确定，并且所述方法进一步包括：向所述分类模型的第二部分提供所述第一中间激活数据，其中所述多个分类器中的每个分类器与模型部分相关联，并且其中所述分类模型包括模型部分的定向序列。6.如权利要求5所述的方法，进一步包括：由所述分类模型的所述第二部分处理所述第一中间激活数据以生成第二中间激活数据；向第二门提供所述第二中间激活数据；以及由所述第二门作出关于是否要退出由所述分类模型进行的处理的确定，其中所述多个分类器中的每个分类器与模型部分相关联，并且其中所述分类模型包括模型部分的定向序列。7.如权利要求1所述的方法，其中：所述输入数据包括图像数据，并且所述分类模型包括图像分类模型。8.如权利要求1所述的方法，其中所述第一门已经使用批量整形损失函数来训练，以最小化分类误差并最小化处理资源使用。9.如权利要求1所述的方法，其中所述第一门包括时间比较模型，所述时间比较模型被配置成将来自当前时间步的所述第一中间激活数据与来自先前时间步的先前中间激活数据进行比较。10.如权利要求9所述的方法，其中：由所述第一门进行的所述确定包括关于基于来自所述当前时间步的所述第一中间激
活数据与来自所述先前时间步的先前中间激活数据的相似性来退出所述分类模型的处理的确定，并且所述方法进一步包括：从所述分类模型输出来自所述先前时间步的分类数据。11.如权利要求9所述的方法，其中：由所述第一门进行的所述确定包括关于基于来自所述当前时间步的所述第一中间激活数据与来自所述先前时间步的先前中间激活数据的相异性来继续由所述分类模型进行的处理的确定，并且所述方法进一步包括：向第二门提供所述第一中间激活数据，所述第二门被配置成确定所述第一中间激活数据的复杂性；以及由所述第二门基于来自所述当前时间步的所述第一中间激活数据来作出关于是否要退出由所述分类模型进行的处理的确定。12.如权利要求11所述的方法，其中：由所述第二门进行的所述确定包括关于退出所述分类模型的处理的确定，并且所述方法进一步包括：利用所述多个分类器中的第一分类器处理所述第一中间激活数据以生成所述分类结果。13.如权利要求1所述的方法，进一步包括：在向所述第一门提供所述第一中间激活数据之前使用一个或多个卷积层来卷积所述第一中间激活数据。14.如权利要求9所述的方法，其中：所述输入数据包括视频数据，并且所述分类模型包括视频分类模型。15.一种处理系统，包括：包括计算机可执行指令的存储器；以及处理器，所述处理器被配置成执行所述计算机可执行指令并使所述处理系统：在分类模型的第一部分中处理输入数据以生成第一中间激活数据；向第一门提供所述第一中间激活数据；由所述第一门作出关于是否要退出由所述分类模型进行的处理的确定；以及从所述分类模型的多个分类器中的一个分类器生成分类结果。16.如权利要求15所述的处理系统，其中所述第一门包括：池化层，所述池化层被配置成降低所述第一中间激活数据的维度；一个或多个神经网络层，所述一个或多个神经网络层被配...

【专利技术属性】
技术研发人员：B，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人