用于深分级结构中模糊输入的高效重新排序和分类方法技术

技术编号:36733583 阅读:16 留言:0更新日期:2023-03-04 10:02
本公开涉及一种分类方法,用于通过与表示用于不同分类选项的分类方案的分级结构的节点的相关性来对记录进行分类。该分类方法包括接收具有多个记录内容特征的输入记录,以及指示该输入记录的该接收的上下文的上下文属性。该方法包括检索关系数据,该关系数据指示该分级结构的与所接收的输入记录的该上下文属性相关联的一个或多个节点。该方法还包括确定该分级结构的节点中的一个或多个节点的相关性得分以对该输入记录进行分类。根据该输入记录的该多个记录内容特征相对于由所述节点表示的该分类选项的比较来确定该一个或多个节点中的每个节点的该相关性得分,并且进一步地,其中根据所检索的关系数据来确定该一个或多个节点中的每个节点的该相关性得分。个节点中的每个节点的该相关性得分。个节点中的每个节点的该相关性得分。

【技术实现步骤摘要】
【国外来华专利技术】用于深分级结构中模糊输入的高效重新排序和分类方法


[0001]本公开一般涉及一种用于根据分级结构对输入记录进行分类的方法。特别地,本公开涉及在深分级结构中对模糊输入进行高效(重新)排序和分类。本公开的方面涉及分类方法、控制器和非暂态计算机可读存储介质。

技术介绍

[0002]通常期望根据稀疏和深分级结构(诸如树或有向无环图)来对所记录的数据进行分类。以这种方式,可以以期望的细节级别对数据进行分类,并且所分类的数据能够被有效地搜索和分类以用于有效的处理和存储。此类分级结构包括一系列节点或分类选项,这些节点或分类选项被布置成通过相应的边缘或连接部连接在一起的层级或分支。以这种方式,分级结构中的每个边缘将较高层级的节点连接到较低层级上的一组更多粒度节点。这在较高层级上形成所谓的“父节点”,并且在较低层级上形成一组“子节点”或更详细的分类选项。
[0003]用于将数据记录分类成此类分级结构的方法在计算机科学领域中是公知的。然而,当在期望分类层级的节点彼此非常相似和/或记录的数据以其他方式难以分类到一个选项或另一个选项中时,将数据记录分类到此类分级结构中的挑战出现。
[0004]对记录进行分类的这种困难可能意味着需要对增加数量的记录进行分类以在结构中构建准确的排序。这遭受计算效率低的问题,因为需要处理具有更多迭代次数的较大数量的输入和输出以获得排序。而且,当使用已知的计算方法不能准确地对记录进行分类时,可能需要耗时的人工干预来执行分类,这是不期望的。因此,需要一种对分级结构中的记录进行分类的更准确和有效的方法。
[0005]正是在这个背景下设计了本公开。

技术实现思路

[0006]根据本公开的一个方面,提供了一种分类方法,用于通过与表示用于不同分类选项的分类方案的分级结构的节点的相关性来对记录进行分类。该分类方法包括接收具有多个记录内容特征的输入记录,以及指示输入记录的接收的上下文的上下文属性。该方法包括检索关系数据,该关系数据指示分级结构的与所接收的输入记录的上下文属性相关联的一个或多个节点。该方法还包括确定分级结构的节点中的一个或多个节点的相关性得分以对输入记录进行分类。根据输入记录的该多个记录内容特征相对于由所述节点表示的分类选项的比较来确定该一个或多个节点中的每个节点的相关性得分。还根据所检索的关系数据来确定该一个或多个节点中的每个节点的相关性得分。
[0007]分类方法可以包括基于历史记录的数据库确定关系数据。
[0008]可以通过将本体工程算法应用于历史记录的数据库以确定知识图谱来确定关系数据,该知识图谱对历史记录的上下文属性与分级结构的节点的相关性进行建模。
[0009]可以通过将语义推理算法应用于知识图谱以确定与分级结构的相应节点逻辑相
关的一组上下文属性来确定关系数据。
[0010]可以根据将输入记录的上下文属性与从由语义推理算法确定的该组上下文属性中选择的对应上下文属性进行匹配来检索关系数据。
[0011]可以通过将历史记录的数据库分成一个或多个主体组(subject group)、客体组(object group)和/或谓词组(predicate group)来确定知识图谱。
[0012]在一些示例中,确定该一个或多个节点中的每个节点的相关性得分包括:根据输入记录的该多个记录内容特征相对于由所述节点表示的分类选项的比较来确定初始相关性得分;以及基于所检索的关系数据来更新该初始相关性得分。
[0013]在一些示例中,基于所检索的关系数据增大或减小初始相关性得分包括:根据指示第一节点与所接收的输入记录的上下文属性相关联的关系数据,增大在分级结构的期望分类层级处的第一节点的初始相关性得分;以及减小在期望分类层级处不同于第一节点的第二节点的初始相关性得分。
[0014]在一些示例中,确定该一个或多个节点中的每个节点的相关性得分包括:确定该输入记录的指示初始相关性得分中的不确定性的置信度得分;以及根据所确定的置信度得分来更新该初始相关性得分。
[0015]分级结构的节点中的一个或多个节点的相关性得分可以至少部分地基于该节点的局部相似性得分和从属于该节点的一个或多个子节点的局部相似性得分的组合来确定,每个局部相似性得分指示输入记录与相应节点的相关性。
[0016]根据本公开的另一方面,提供了一种具有存储在其上的指令的非暂态计算机可读存储介质,该指令在由计算机执行时致使计算机执行上述分类方法。
[0017]根据本公开的另一方面,提供了一种分类系统,用于通过与表示用于多个分类选项的分类方案的分级结构的节点的相关性来对记录进行分类。该分类系统包括输入模块,该输入模块被配置为接收具有多个记录内容特征的输入记录,以及指示输入记录的接收的上下文的上下文属性。该分类系统包括相关性评估模块,该相关性评估模块被配置为确定分级结构的节点中的一个或多个节点的相关性得分,以对输入记录进行分类。根据输入记录的该多个记录内容特征相对于由所述节点表示的分类选项的比较来确定该一个或多个节点中的每个节点的相关性得分。还根据所检索的关系数据来确定该一个或多个节点中的每个节点的相关性得分,该关系数据指示分级结构的与所接收的输入记录的上下文属性相关联的一个或多个节点。该分类系统包括输出模块,该输出模块被配置为基于分级结构的节点中的一个或多个节点的所确定的相关性得分来输出输入记录的分类。
[0018]分类系统还可以包括上下文化(contextualizing)模块,该上下文化模块被配置为基于历史记录的数据库确定关系数据。
[0019]上下文化模块可以被配置为通过将本体工程算法应用于历史记录的数据库以确定知识图谱来确定关系数据,该知识图谱对历史记录的上下文属性与分级结构的节点的相关性进行建模。
[0020]该上下文化模块可以被配置为通过将语义推理算法应用于知识图谱以确定与分级结构的相应节点逻辑相关的一组上下文属性来确定关系数据。
[0021]该上下文化模块可以被配置为根据将输入记录的上下文属性与从由语义推理算法确定的该组上下文属性中选择的对应上下文属性进行匹配来检索该关系数据。
[0022]应当理解,本公开的每个方面的优选和/或任选特征也可单独地或以适当的组合并入本公开的其他方面中。
附图说明
[0023]现在将参照附图仅以示例的方式描述本公开的示例,其中:
[0024]图1示出了根据本公开的实施方案的示例性分类系统的示意图;
[0025]图2示意性地展示了根据本公开的实施方案的操作图1所示的分类系统的示例性方法;
[0026]图3示意性地展示了图2所示的方法中的步骤的示例性子步骤;
[0027]图4示意性地展示了图2所示的方法中的另一个步骤的示例性子步骤;并且
[0028]图5示意性地展示了图2所示的方法中的另外的步骤的示例性子步骤。
具体实施方式
[0029]本公开的实施方案涉及一种用于基于输入记录与分级结构的节点的相关性来对输入记录进行分类(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的分类方法,用于通过与表示用于多个分类选项的分类方案的分级结构的节点的相关性来对记录进行分类,所述分类方法包括:接收具有多个记录内容特征的输入记录,以及指示所述输入记录的所述接收的上下文的上下文属性;检索关系数据,所述关系数据指示所述分级结构的与所接收的输入记录的所述上下文属性相关联的一个或多个节点;以及确定所述分级结构的所述节点中的一个或多个节点的相关性得分以对所述输入记录进行分类,其中根据所述输入记录的所述多个记录内容特征相对于由所述节点表示的所述分类选项的比较来确定所述一个或多个节点中的每个节点的所述相关性得分,并且进一步地,其中根据所检索的关系数据来确定所述一个或多个节点中的每个节点的所述相关性得分。2.根据权利要求1所述的分类方法,包括基于历史记录的数据库确定所述关系数据。3.根据权利要求2所述的分类方法,其中通过将本体工程算法应用于历史记录的所述数据库以确定知识图谱来确定所述关系数据,所述知识图谱对所述历史记录的上下文属性与所述分级结构的所述节点的相关性进行建模。4.根据权利要求3所述的分类方法,其中通过将语义推理算法应用于所述知识图谱以确定与所述分级结构的相应节点逻辑相关的一组上下文属性来确定所述关系数据。5.根据权利要求4所述的分类方法,其中根据将所述输入记录的所述上下文属性与从由所述语义推理算法确定的所述一组上下文属性中选择的对应上下文属性进行匹配来检索所述关系数据。6.根据权利要求3至5中任一项所述的分类方法,其中通过将历史记录的所述数据库分成一个或多个主体组、客体组和/或谓词组来确定所述知识图谱。7.根据任一前述权利要求所述的分类方法,其中确定所述一个或多个节点中的每个节点的所述相关性得分包括:根据所述输入记录的所述多个记录内容特征相对于由所述节点表示的所述分类选项的所述比较来确定初始相关性得分;以及基于所检索的关系数据来更新所述初始相关性得分。8.根据权利要求7所述的分类方法,其中基于所检索的关系数据来增大或减小所述初始相关性得分包括:根据指示所述第一节点与所接收的输入记录的所述上下文属性相关联的所述关系数据,增大在所述分级结构的期望分类层级处的第一节点的所述初始相关性得分;以及减小在所述期望分类层级处不同于所述第一节点的第二节点的所述初始相关性得分。9.根据权利要求7或权利要求8所述的分类方法,其中确定所述一个或多个节点中的每个节点的所述相关性得分包括:确定所述输入记录的指示所述初始相...

【专利技术属性】
技术研发人员:A
申请(专利权)人:伊顿智能动力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1