【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及数据分类方法及数据分类装置,特别涉及一种通过利用多个分离面能够将已知类别及偏离值同时进行分类的数据分类方法及数据分类装置。该申请基于2007年9月28日申请的日本专利申请2007-253703号。该日本专利申请公开的内容通过参照援引在本申请中。
技术介绍
数据分类是在被给出未分类数据的情况下对该数据隶属的类别进行推测的技术,是数据分析最基本的要素之一。特别是利用了类别之间的分离面等、将特征空间分为多个区域的分离面的数据分类技术的模型表现力高。因此,不仅能够应用于以画像数据、蛋白质或遗传因子数据为代表的数据分类,也能够应用于将类别标签作为故障信息的情况下的故障诊断、将因特网或社会网络等网络间的链接的有无作为类别标签的情况下的链接的预测等广泛的问题及数据结构。 利用分离面的数据分类方法较大地分为识别和偏离值分类的2个技术。前者是学习从附带有类别标签的数据将类别分离的分离面,将分类对象数据向已知类别进行分类的技术。后者是将学习数据视为1个类别,学习将学习数据所分布的区域和除此之外的区域分离的分离面,由此,对分类对象数据隶属于该类别还是偏离该类别 ...
【技术保护点】
一种数据分类装置,其特征在于,具备:分离面集合存储部,存储有对将特征空间分离为与至少1个已知类别分别对应的至少1个已知类别区域和未知类别区域的多个分离面进行规定的信息,其中,所述至少1个已知类别区域的每个通过所述多个分离面中不相交的2个以上分离面与外部区域相分离;以及分类部,通过对能够计算内积的分类对象数据隶属于在所述分离面存储部中存储的所述信息所规定所述至少1个已知类别区域和所述未知类别区域中的哪个区域进行计算,来决定所述分类对象数据的分类。
【技术特征摘要】
【国外来华专利技术】...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。