数据处理装置、数据处理方法、程序及集成电路制造方法及图纸

技术编号：5977730 阅读：163 留言：0更新日期：2012-04-11 18:40

一种数据处理装置（１００），具有：临时记录部（５），记录聚类／要素对应表以及分组／聚类对应表，该聚类／要素对应表将识别由该数据处理装置分类后的多个聚类中的每个的聚类ＩＤ、和识别属于利用该聚类ＩＤ识别的聚类的要素ＩＤ相对应地保存，该分组／聚类对应表将识别按照用户的主观基准分类后的分组的分组ＩＤ、和识别属于利用该分组ＩＤ识别的分组的聚类ＩＤ相对应地保存；特征抽取部（１），抽取新追加的要素数据的特征量；自动分类处理部（２），从多个聚类中确定归属聚类，并且按照规定的制约条件将规定归属聚类的边界的分类边界条件更新；数据管理部（６），将新追加的要素数据的要素ＩＤ和归属聚类的聚类ＩＤ相对应地记录在聚类／要素对应表中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及以能够自动将逐次输入的数据分类、而且能够通过手动输入来修正 (annotation 标注)其结果为前提的数据处理装置或者数据处理方法。
技术介绍
以往，关于自动将数据分类的方法，已经公知有使用事前学习数据来识别数据并分类的方法，和不使用事前学习数据而将数据分类的方法。无论哪种方法都通过从数据中抽取多维的特征量并进行特征量的比较来实现。作为事前学习的一例有对每个分类分组，根据学习数据的分布信息来计算概率分布，并判定输入数据归属于哪个分类分组的方法(例如贝叶斯估计=Bayesian Estimation)。作为其他示例有使学习数据的分布信息近似于多个高斯分布的重叠，并判定输入数据归属于哪个分类分组的方法(例如高斯混合模型(Gaussian Mixture Model) 等)。作为另一个其他示例有根据学习数据的分布信息来设定分类分组之间的边界，并判定输入数据归属于哪个分类分组的方法(例如支持向量机(Support Vector Machine)等)。这些方法需要在实现自动分类之前预先由人工准备学习用的数据，其登记作业比较烦杂。另一方面，关于不使用事前学习数据而将数据自动分类的方法，已经公知有各种聚类(clustering)方法。聚类用于根据数据自身的分布的浓淡将数据分类。关于具体的聚类方法有预先指定分类数并进行分类的k-means(k-均值)法，或者根据输入模式 (pattern)群的相似度自主地获得分类的能力的神经网络即自组织映射法(SOM)等。数据的自动分类往往要求逐次处理型的学习及分类。例如，已经公知有依据于 k-means...

【技术保护点】
一种数据处理装置，对要素数据进行分类，具有：　　临时记录部，记录所述要素数据、聚类／要素对应表、分类边界条件以及分组／聚类对应表，所述聚类／要素对应表将识别由该数据处理装置分类后的多个聚类中的各个聚类的聚类ＩＤ、和识别属于利用该聚类ＩＤ识别的所述聚类的所述要素数据的要素ＩＤ相对应地保存，所述分类边界条件用于规定所述多个聚类各自的边界，所述分组／聚类对应表将识别按照用户的主观基准分类后的分组的分组ＩＤ、和识别属于利用该分组ＩＤ识别的所述分组的所述聚类的所述聚类ＩＤ相对应地保存；特征抽取部，抽取新追加的所述要素数据的特征量；　　自动分类处理部，通过将由所述特征抽取部抽取的特征量与所述分类边界条件进行比较，确定所述多个聚类之中、所述新追加的要素数据应该归属的归属聚类，并且按照规定的制约条件将规定所述归属聚类的边界的所述分类边界条件更新，以使所述新追加的要素数据包含在所述归属聚类中；以及　　数据管理部，将识别所述新追加的要素数据的要素ＩＤ、和识别由所述自动分类处理部确定的所述归属聚类的所述聚类ＩＤ相对应地记录在所述聚类／要素对应表中。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：河村岳，矶贝邦昭，刘亚洲，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人