【技术实现步骤摘要】
本专利技术总体上涉及数据的分类,更具体地涉及在存储器有限的系统 中进行数据的分类。
技术介绍
数据分类数据分类是基于从数据项中提取的某种定量信息以及先前标记过的 数据项的训练集而将预定标记指派给该数据项。例如,电子邮件分类系 统可以基于电子邮件的内容以及已知是垃圾邮件或者非垃圾邮件的 电子邮件的训练数据集而将特定的邮件标记为垃圾邮件或者非垃圾邮 件。分类器的性能很大程度上依赖于要被分类的数据的特性。不存在对 所有的分类问题都能很好地工作的单一分类器。该性能还依赖于训练数 据的质量。 一个良好训练的分类器要求大的训练数据集,该大的训练数 据集具有带有各种特性的带标记样本。分类器可以根据用于从数据项中提取信息的数学模型、训练数据的 量和模型复杂度而不同。分类器的选择通常依赖于数据特性及其对计算资源的要求,例如CPU的使用和存储器要求。例如,当实时地要求分类 结果时,某些分类器可能是不适合的。 嵌入式系统嵌入式系统通常集成在某种其它设备或机器中。嵌入式系统可以被 设计为通常实时地执行专用的功能。对于很多设备而言嵌入式系统是非 常常见的,这些设备例如便携式视频播放器、照 ...
【技术保护点】
一种用于在具有有限存储器的系统中对数据进行分类的方法,该方法包括以下步骤: 确定训练数据集; 获取用于存储数据的存储器大小; 对所述训练数据集应用实例学习(EL)过程以产生适于所述存储器大小的实例数据集,其中该EL过程是从 包括基于熵的实例学习(EBEL)过程和支持宽带的高级学习(ABEL)过程的组中选择的; 获取待分类数据;以及 使用所述实例数据集对所述数据进行分类。
【技术特征摘要】
US 2008-9-15 12/210,2891、一种用于在具有有限存储器的系统中对数据进行分类的方法,该方法包括以下步骤确定训练数据集;获取用于存储数据的存储器大小;对所述训练数据集应用实例学习(EL)过程以产生适于所述存储器大小的实例数据集,其中该EL过程是从包括基于熵的实例学习(EBEL)过程和支持宽带的高级学习(ABEL)过程的组中选择的;获取待分类数据;以及使用所述实例数据集对所述数据进行分类。2、 根据权利要求1的方法,其中该确定步骤进一步包括以下步骤获取当前实例数据集;获取样本数据集;以及将所述当前实例数据集和所述样本数据组合起来以产生训练数据集。3、 根据权利要求2的方法,其中,所述当前实例数据集最初为空。4、 根据权利要求l的方法,其中,所述EBEL过程进一步包括以下对于所述训练数据集&中的各样本;c,确定在给定样本x的条件下的类变量C的条件熵损失/Z(4c);以及从所述训练数据集&中移除使得条件熵损失Z/(Cl;c)最小的所选择的样本。5、根据权利要求4的方法,其中所选择的样本是根...
【专利技术属性】
技术研发人员:安库尔贾殷,丹尼尔N尼科夫斯基,
申请(专利权)人:三菱电机株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。