使用形式概念分析的数据分类的系统和方法技术方案

技术编号:15190612 阅读:48 留言:0更新日期:2017-04-19 23:12
使用形式概念分析的数据分类的系统和方法。描述了一种使用形式概念分析(FCA)的数据分类的系统。在训练阶段中,该系统使用训练数据集生成具有结构的FCA分类格。该训练数据集包括训练表现以及与训练表示相对应的分类,在分类阶段中,使用FCA分类格的结构对具有实际上分层的类别的测试数据集进行分类。

【技术实现步骤摘要】
【国外来华专利技术】政府许可权本专利技术在美国政府合同号FA8650-13-C-7356下得到政府支持而做出。政府对本专利技术具有特定权利。相关申请的交叉引用这是于2014年9月17号于美国提交的题为\MappingAcrossDomainstoExtractConceptualKnowledgeRepresentationfromNeuralSystems\的美国非临时专利申请No.14/489,313的部分继续申请案,其全部内容通过引用全部并入本文中。这也是于2014年7月23日于美国提交的题为“AGeneralFormalConceptAnalysis(FCA)FrameworkforClassification”的美国临时申请No.62/028,171的非临时申请,其全部内容通过引用全部并入本文中。专利技术背景(1)
本专利技术涉及一种用于数据分类的系统,并且更具体地,涉及一种使用形式概念分析(FCA:FormalConceptAnalysis)的数据分类的系统。(2)相关领域描述通过机器学习的分类是非常重要的研究领域,因为它允许系统发展解决难题的能力,诸如面部识别、异常检测和故障预测。分类可以被描述为基于数据的训练集识别一组类别中的哪一个应用于新的观察。形式概念分析(FCA)是导出一组对象(每个对象都由一组属性限定)的偏序(partialorder)的原则性方式。这是已经应用于数据可视化、数据挖掘、信息检索及知识管理的数据和知识处理中的技术(参见并入的文献参考列表,文献参考号3)。用于组织数据的原理是由对象的属性之间的包含关系引发的偏序。另外,FCA承认从结构化数据挖掘的规则。这广泛地应用于数据分析,尤其是在德国和法国。文献参考号7提供了FCA型分类工具的调查并且作出任一个工具均不奏效(普遍显示出较高的错误率)的结论。算法的细节是稀疏和发展,并且经常在法国或德国进行分析。另外,文献参考号5提出一种用于简单符号识别的分类的FCA分类器的具体实例化。该工作依赖于在赖以进行分类的格内找到单一节点,这使得这样的分类在更复杂喧嚣的环境中可能失败变得明显。这类数据必定出现在生物领域,诸如脑电图(EEG)、功能磁共振成像血氧依赖水平(fMRIBOLD)、功能近红外光谱(fNlRS)和脑磁图(MEG),其中信噪比很大。文献参考号6提出一种FCA分类的迭代版本,其在它们特定测试问题中产生良好的结果(仍然是简单的符号分类),但是要承受潜在大量的昂贵迭代,因此需要大量的计算时间。因此,一直存在对使用形式概念分析来对实际上分层的类别进行分类以使得显示和利用数据的分层结构的有效系统的持续的需求。
技术实现思路
本专利技术涉及一种用于数据分类的系统,并且更具体地,涉及一种使用形式概念分析(FCA)的数据分类的系统。该系统包括一个或更多个处理器以及具有指令的存储器,当所述指令被执行时,使得一个或更多个处理进行多个操作。在训练阶段,该系统使用训练数据集以及与该训练数据集相对应的多个分类,用一个或更多个处理器生成形式概念分析(FCA)分类格。使用FCA分类格的结构,在分类阶段生成输入数据集的分类。另一方面,在训练阶段中,根据训练数据集生成上下文表,所述上下文表具有对象标签行和属性标签列。针对每个训练表现,在训练阶段中,将针对与训练表现相对应的分类的至少一个类列附加到所述上下文表。根据所述上下文表生成所述FCA分类格。另一方面,在FCA分类格的生成期间,将至少一个类列视为正常属性,其中,包括FCA分类格内的多个节点的、被给定类属性跨越的子结构与相对应的分类相关联。另一方面,该系统在分类阶段中根据测试数据集生成表现上下文向量mp,其中,mp是与测试数据集中的表现p相关联的属性集。在分类阶段中,选择FCA分类格中的表决节点集并用于表决表现p的分类值。另一方面,根据针对至少mp和FCA分类格操作的选择函数来选择表决节点集。另一方面,根据针对至少所述选择函数的输出、FCA分类格和mp操作的表决函数来表决分类值c。另一方面,表决函数返回表决节点集中的每一个表决节点的关联类值的和。另一方面,各个关联类值根据该关联类值与表现p共享的多个属性进行加权。另一方面,各个表决节点都具有包括对象集的外延(extent),其中,表决函数返回各个表决节点的关联类值的和,根据表决节点的外延内的多个对象对所述和进行归一化,然后对跨所有表决节点的归一化的和求和。另一方面,各个表决节点都具有包括属性集的内涵(intent),并且各个表决节点的关联类值根据该表决节点的内涵中的多个属性进行加权。另一方面,训练数据集包括具有属性的对象,并且通过将多个分类视为训练数据中的对象的属性来生成FCA分类格。另一方面,使用fMRI传感器、图像传感器和声音传感器中的至少一种来获取输入数据集,并且其中,为了对象识别、图像识别和声音识别中的至少一个的目的,执行分类。另一方面,本专利技术还包括一种用于使处理器执行本文中描述的操作和进行列举的操作的方法。最后,在又一方面中,本专利技术还包括计算机程序产品,该计算机程序产品包括存储在非暂时性计算机可读介质上的计算机可读指令,所述计算机可读指令能够由具有处理器的计算机执行以使处理器执行本文中所述的操作。附图说明本专利或专利申请公开的文件包括用颜色处理的至少一个附图。一经请求并且支付必要费用,美国专利局将提供本专利或专利申请公开的具有彩图的副本。结合参照下面的附图,本专利技术的目的、特征和益处将在下面专利技术的各个方面的详细描述中显而易见,其中:图1是根据各种实施方式描绘的用于数据分类的系统的组件的框图;图2是根据各种实施方式的计算机程序产品的示图;图3是根据各种实施方式的第一上下文表的示图;图4A是根据各种实施方式的第二上下文表的示图;图4B是根据各种实施方式的由第二上下文表中的数据得到的格的示图;图5是根据各种实施方式的形式概念分析(FCA)格分类的示图;图6A是根据各种实施方式的附带有类列的上下文表的示图;以及图6B是根据各种实施方式的由附带有类列的上下文表中的数据得到的格的示图。详细描述本专利技术涉及一种用于数据分类的系统,并且更具体地,涉及一种使用形式概念分析(FCA)的数据分类的系统。提供下面描述使本领域的普通技术人员制造和使用该专利技术,并且将该专利技术结合至具体应用的背景下。在不同应用中的各种修改和各种使用对本领域的技术人员而言将是显而易见的,并且本文中定义的一般性原理可以被应用于广泛的方面。因此,本专利技术不旨在受限于所提出的方面,而是符合与本文中所公开的原理和新颖特征相一致的最宽范围。在以下详细描述中,阐述了许多具体细节以提供对本专利技术的更全面的理解。然而,可以不必受限于这些具体细节来实践本专利技术对于本领域技术人员而言将是显而易见的。在其它情况下,以框图的形式而不是详细地示出众所周知的结构和装置,以避免模糊本专利技术。将读者的注意力引导至与说明书同时提交的且被开放给公众审阅说明书的所有论文和文献,并且将所有这些论文和文献的内容通过引用并入本文中。本说明书(包括任何所附权利要求、摘要和附图)中公开的所有特征均可以被用于相同、等同或类似目的的替代特征置换,除非另有明确规定。因此,除非另有明确规定,否则公开的每个特征均仅是一般性的一系列等同或类似特征的一个示例。另外,权利要求中未被明确说明为本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201580039768.html" title="使用形式概念分析的数据分类的系统和方法原文来自X技术">使用形式概念分析的数据分类的系统和方法</a>

【技术保护点】
一种使用形式概念分析(FCA)的数据分类的系统,所述系统包括:具有关联的存储器的一个或更多个处理器,在所述存储器上编码有可执行指令,使得当执行所述可执行指令时,所述一个或更多个处理器执行以下操作:在训练阶段,使用训练数据集以及与所述训练数据集相对应的多个分类,用所述一个或更多个处理器生成形式概念分析(FCA)分类格;以及在分类阶段期间,使用所述FCA分类格的结构生成输入数据集的分类。

【技术特征摘要】
【国外来华专利技术】2014.07.23 US 62/028,171;2014.09.17 US 14/489,3131.一种使用形式概念分析(FCA)的数据分类的系统,所述系统包括:具有关联的存储器的一个或更多个处理器,在所述存储器上编码有可执行指令,使得当执行所述可执行指令时,所述一个或更多个处理器执行以下操作:在训练阶段,使用训练数据集以及与所述训练数据集相对应的多个分类,用所述一个或更多个处理器生成形式概念分析(FCA)分类格;以及在分类阶段期间,使用所述FCA分类格的结构生成输入数据集的分类。2.根据权利要求1所述的系统,其中,所述一个或更多个处理器还执行以下操作:在所述训练阶段中,根据所述训练数据集生成上下文表,所述上下文表具有对象标签行和属性标签列;在所述训练阶段中,针对每个训练表现,将针对与所述训练表现相对应的分类的至少一个类列附加至所述上下文表;以及根据所述上下文表生成所述FCA分类格。3.根据权利要求2所述的系统,其中,在所述FCA分类格的生成期间,将所述至少一个类列视为正常属性,并且其中,包括所述FCA分类格内的多个节点的、被给定的类属性跨越的子结构与相对应的分类相关联。4.根据权利要求1所述的系统,其中,所述一个或更多个处理器还执行以下操作:在所述分类阶段中,根据测试数据集生成表现上下文向量mp,其中,mp是与所述测试数据集中的表现p相关联的属性集;在所述分类阶段中,选择所述FCA分类格中的表决节点集;以及在所述分类阶段中,使用所述表决节点集以针对所述表现p的分类值进行表决。5.根据权利要求4所述的系统,其中,根据针对至少mp和所述FCA分类格操作的选择函数来选择所述表决节点集。6.根据权利要求5所述的系统,其中,根据针对至少所述选择函数的输出、所述FCA分类格和mp操作的表决函数来表决分类值c。7.根据权利要求6所述的系统,其中,所述表决函数返回所述表决节点集中的各个表决节点的关联类值的和。8.根据权利要求7所述的系统,其中,各个关联类值根据该关联类值与所述表现p共享的多个属性进行加权。9.根据权利要求6所述的系统,其中,各个表决节点都具有包括对象集的外延,并且其中,所述表决函数返回各个表决节点的关联类值的和,其中,所述和根据所述表决节点的外延内的多个对象进行归一化,其中,对跨所有表决节点的归一化的和进行求和。10.根据权利要求9所述的系统,其中,各个表决节点都具有包括属性集的内涵,并且其中,各个表决节点的所述关联类值根据该表决节点的内涵中的多个属性进行加权。11.根据权利要求1所述的系统,其中,所述训练数据集包括具有属性的对象,并且通过将所述多个分类视为所述训练数据中的对象的属性来生成所述FCA分类格。12.根据权利要求1所述的系统,其中,使用fMRI传感器、图像传感器和声音传感器中的至少一种获取所述输入数据集,并且其中,为了对象识别、图像识别和声音识别中的至...

【专利技术属性】
技术研发人员:M·J·奥布莱恩J·本韦努托R·巴特查里亚
申请(专利权)人:赫尔实验室有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1