用于重新训练分类器的样本选择制造技术

技术编号:16708129 阅读:37 留言:0更新日期:2017-12-02 23:26
一种管理所存储的用于分类的训练集的存储器使用的方法包括计算第一相似性度量和第二相似性度量中的一者或二者。该第一相似性度量与新的训练样本以及与该新的训练样本相同分类的现有训练样本相关联。该第二相似性度量与该新的训练样本以及与该新的训练样本不同分类的现有训练样本相关联。该方法还包括基于该第一相似性度量和/或该第二相似性度量选择性地将该新的训练样本存储在存储器中。

【技术实现步骤摘要】
【国外来华专利技术】用于重新训练分类器的样本选择相关申请的交叉引用本申请要求于2015年3月17日提交的美国临时专利申请No.62/134,493以及于2015年5月20日提交的题为“FEATURESELECTIONFORRETRAININGCLASSIFIERS(用于重新训练分类器的特征选择)”的美国临时专利申请No.62/164,484的权益,其公开内容通过援引全部明确纳入于此。背景领域本公开的某些方面一般涉及机器学习,尤其涉及用于重新训练分类器的特征选择的系统和方法。
技术介绍
可包括一群互连的人工神经元(例如,神经元模型)的人工神经网络是一种计算设备或者表示将由计算设备执行的方法。卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合,其中每一个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)具有众多应用。具体地,CNN已被广泛使用于模式识别和分类领域。深度学习架构(诸如,深度置信度网络和深度卷积网络)是分层神经网络架构,其中第一层神经元的输出变成第二层神经元的输入,第二层神经元的输出变成第三层神经元的输入,以此类推。深度神经网络可被训练以识别特征阶层并因此它们被越来越多地用本文档来自技高网...
用于重新训练分类器的样本选择

【技术保护点】
一种管理所存储的用于分类的训练集的存储器使用的方法,包括:计算第一相似性度量或第二相似性度量中的至少一者,其中所述第一相似性度量与新的训练样本以及与所述新的训练样本相同分类的现有训练样本相关联,并且其中所述第二相似性度量与所述新的训练样本以及与所述新的训练样本不同分类的现有训练样本相关联;以及至少部分基于所述第一相似性度量或所述第二相似性度量中的该至少一者选择性地将所述新的训练样本存储在存储器中。

【技术特征摘要】
【国外来华专利技术】2015.03.17 US 62/134,493;2015.05.20 US 62/164,484;1.一种管理所存储的用于分类的训练集的存储器使用的方法,包括:计算第一相似性度量或第二相似性度量中的至少一者,其中所述第一相似性度量与新的训练样本以及与所述新的训练样本相同分类的现有训练样本相关联,并且其中所述第二相似性度量与所述新的训练样本以及与所述新的训练样本不同分类的现有训练样本相关联;以及至少部分基于所述第一相似性度量或所述第二相似性度量中的该至少一者选择性地将所述新的训练样本存储在存储器中。2.如权利要求1所述的方法,其特征在于,进一步包括:计算第三相似性度量或第四相似性度量中的至少一者,其中所述第三相似性度量与候选训练样本以及与所述候选训练样本相同分类的现有训练样本相关联,并且其中所述第四相似性度量与所述候选训练样本以及与所述候选训练样本不同分类的现有训练样本相关联;以及至少部分基于所述第三相似性度量或所述第四相似性度量中的该至少一者选择性地从所述存储器中移除所述候选训练样本。3.如权利要求1所述的方法,其特征在于,所述第一相似性度量或所述第二相似性度量中的至少一者是至少部分基于所述现有训练样本的质心来计算的。4.如权利要求1所述的方法,其特征在于,所述第一相似性度量包括以下两者之间的差:相同分类中的现有训练样本的任何两点之间的最小距离,和所述新的训练样本的点与相同分类中所有现有训练样本的点之间的最小距离。5.如权利要求1所述的方法,其特征在于,所述第一相似性度量包括以下两者之间的差:相同分类中的现有训练样本的任何两点之间的最大总和距离,和所述新的训练样本的点与相同分类中所有现有训练样本的点之间的最大总和距离。6.如权利要求1所述的方法,其特征在于,所述第一相似性度量包括分类中的现有训练样本的每一点与其他分类中的所有现有训练样本之间的最大总和距离,并且所述第二相似性度量包括该分类中的新的训练样本的点与其他分类中的所有现有训练样本的点之间的最大总和距离,所述新的训练样本至少部分基于所述第一相似性度量和所述第二相似性度量之间的差而被选择性地添加到所述训练集。7.如权利要求1所述的方法,其特征在于,进一步包括接收新的训练样本。8.一种用于管理所存储的用于分类的训练集的存储器使用的装备,包括:用于计算第一相似性度量或第二相似性度量中的至少一者的装置,其中所述第一相似性度量与新的训练样本和与所述新的训练样本相同分类的现有训练样本相关联,并且其中所述第二相似性度量与所述新的训练样本和与所述新的训练样本不同分类的现有训练样本相关联;以及用于至少部分基于所述第一相似性度量或所述第二相似性度量中的该至少一者选择性地将所述新的训练样本存储在存储器中的装置。9.如权利要求8所述的装备,其特征在于,进一步包括:用于计算第三相似性度量或第四相似性度量中的至少一者的装置,其中所述第三相似性度量与候选训练样本和与所述候选训练样本相同分类的现有训练样本相关联,并且其中所述第四相似性度量与所述候选训练样本以及与所述候选训练样本不同分类的现有训练样本相关联;以及用于至少部分基于所述第三相似性度量或所述第四相似性度量中的该至少一者选择性地从所述存储器中移除所述候选样本的装置。10.如权利要求8所述的装备,其特征在于,所述第一相似性度量或所述第二相似性度量中的至少一者是至少部分基于所述现有训练样本的质心来计算的。11.如权利要求8所述的装备,其特征在于,所述第一相似性度量包括以下两者之间的差:相同分类中的现有训练样本的任何两点之间的最小距离,和所述新的训练样本的点与相同分类中所有现有训练样本的点之间的最小距离。12.如权利要求8所述的装备,其特征在于,所述第一相似性度量包括以下两者之间的差:相同分类中的现有训练样本的任何两点之间的最大总和距离,和所述新的训练样本的点与相同分类中所有现有训练样本的点之间的最大总和距离。13.如权利要求8所述的装备,其特征在于,所述第一相似性度量包括分类中的现有训练样本的每一点与其他分类中的所有现有训练样本之间的最大总和距离,并且所述第二相似性度量包括该分类中的该新的训练样本的点与其他分类中的所有现有训练样本的点之间的最大总和距离,所述新的训练样本至少部分基于所述第一相似性度量和所述第二相似性度量之间的差而被选择性地添加到所述训练集。14.如权利要求8所述的装备,其特征在于,进一步包括接收新的训练样本。15.一种用于管理所存储的用于分类的训练集的存储器使用的装置,包括:存储器;以及至少一...

【专利技术属性】
技术研发人员:R·B·托瓦
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1