用于个性化神经网络模型的分布外检测制造技术

技术编号：39303557 阅读：8 留言：0更新日期：2023-11-12 15:53

一种用于生成个性化人工神经网络(ANN)模型的方法在第一人工神经网络处接收输入。处理该输入以提取中间特征集合。该方法确定该输入相对于用于训练该第一人工神经网络的数据集是否在分布外。基于分布外确定而将对应于该输入的中间特征提供给第二人工神经网络。附加地，用于执行第一人工神经网络和第二个性化人工神经网络的训练和推断任务的系统资源是根据这些训练和推断任务的计算复杂性以及资源的功耗来分配的。的功耗来分配的。的功耗来分配的。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于个性化神经网络模型的分布外检测
[0001]背景
[0002]领域
[0003]本公开的各方面一般涉及神经网络，尤其涉及对用于个性化神经网络模型的分布外(out
‑
of
‑
distribution)数据的设备上检测。
[0004]背景
[0005]人工神经网络可包括诸群互连的人工神经元(例如，神经元模型)。人工神经网络可以是计算设备，或者被表示为要由计算设备执行的方法。
[0006]神经网络由消耗张量和产生张量的操作数组成。神经网络可以被用来解决复杂问题；然而，由于网络大小和可被执行以产生解决方案的运算量可能是巨大的，因此网络完成任务的时间可能很长。此外，由于这些任务可在移动设备(其可能具有有限的计算能力)上执行，因此深度神经网络的计算成本可能会有问题。
[0007]卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合，其中每个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)(诸如深度卷积神经网络(DCN))具有众多应用。具体而言，这些神经网络架构被用于各种技术，诸如图像识别、模式识别、语音识别、自动驾驶和其他分类任务。
[0008]机器学习性能可能比被报告为研究结果的性能要低。这可能是例如由于训练中的变化以及设备硬件及其操作环境特性。在统计学上检测与训练分布相距足够远的测试样本是部署许多现实世界机器学习应用的基本要求。
[0009]可惜的是，设备上学习也很困难。增量学习的一个目标是使学习模型适配新数据而不遗忘其现有知识...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于生成个性化人工神经网络(ANN)模型的方法，包括：在第一人工神经网络处接收输入；处理所述输入以提取中间特征集合；确定所述输入相对于用于训练所述第一人工神经网络的数据集是否在分布外；以及至少部分地基于分布外确定而将对应于所述输入的中间特征提供给第二人工神经网络。2.如权利要求1所述的方法，其中，所述第二人工神经网络是至少部分地基于所述中间特征在移动设备上进行训练的。3.如权利要求1所述的方法，其中，所述第二人工神经网络基于所述中间特征来确定分类。4.如权利要求1所述的方法，其中，所述中间特征至少部分地基于所述分布外确定而被提供给服务器。5.如权利要求1所述的方法，其中，用于执行所述第一人工神经网络和所述第二人工神经网络的训练和推断任务的资源是根据所述训练和推断任务的计算复杂性以及所述资源的功耗来分配的。6.如权利要求5所述的方法，其中，所述第一人工神经网络是用户无关分类器，而所述第二人工神经网络是用户相关分类器。7.如权利要求1所述的方法，进一步包括：确定所述第二人工神经网络是否已基于分布外输入进行了训练；如果所述第二人工神经网络还未基于所述分布外输入进行训练，则接收所述分布外输入的标签；以及如果所述第二人工神经网络已基于所述分布外输入进行了训练，则操作所述第二人工神经网络以生成推断。8.如权利要求1所述的方法，进一步包括：将所述输入的极值签名与类原型进行比较；以及如果所述极值签名在不同的维度集合中具有比所述类原型更大的激活，则检测到所述输入在分布外。9.一种用于生成个性化人工神经网络(ANN)模型的装置，包括：存储器；以及耦合到所述存储器的至少一个处理器，所述至少一个处理器被配置成：在第一人工神经网络处接收输入；处理所述输入以提取中间特征集合；确定所述输入相对于用于训练所述第一人工神经网络的数据集是否在分布外；以及至少部分地基于分布外确定而将对应于所述输入的中间特征提供给第二人工神经网络。10.如权利要求9所述的装置，其中，所述至少一个处理器被进一步配置成：至少部分地基于所述中间特征在移动设备上训练所述第二人工神经网络。11.如权利要求7所述的装置，其中，用于执行所述第一人工神经网络和所述第二人工神经网络的训练和推断任务的资源是根据所述训练和推断任务的计算复杂性以及所述资
源的功耗来分配的。12.如权利要求9所述的装置，其中，所述第一人工神经网络是用户无关分类器，而所述第二人工神经网络是用户相关分类器。13.如权利要求9所述的装置，其中，所述至少一个处理器被进一步配置成：确定所述第二人工神经网络是否已基于分布外输入进行了训练；如果所述第二人工神经网络还未基于所述分布外输入进行训练，则接收所述分布外输入的标签；以及如果所述第二人工神经网络已基于所述分布外输入进行了训练，则操作所述第二人工神经网络以生成推断。14.如权利要求9所述的装置，其中，所述至少一个处理器被进一步配置成：将所述输入的极值签名与类原型进行比较；以及如果所述极值签名在不同的维度集合中具有比所述类原型更大的激活，则检测到所述输入在分布外。15.一种用于生成个性化人工神经网络(ANN)模型的装备，包括...

【专利技术属性】
技术研发人员：赵海军，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人