信息处理装置、信息处理方法和计算机可读存储介质制造方法及图纸

技术编号:31452149 阅读:16 留言:0更新日期:2021-12-18 11:15
本申请公开一种信息处理装置、信息处理方法和计算机可读存储介质。该信息处理装置包括:概率向量获取单元,获取待分类对象被划分成的N个区段的M维概率向量;候选类别选择单元,选择各个区段的M维概率向量中的除第H元素之外的元素中的前K个最大的元素所对应的类别作为相应的区段的候选类别;路径向量生成单元,基于各个区段的候选类别生成路径向量,并且基于每个路径向量所包括的元素所对应的概率和相邻元素之间的关联度计算相应的路径向量的分数;以及分类结果获取单元,获取分数最高的路径向量作为待分类对象的分类结果,其中,基于相邻元素之间的语义信息以及与相邻元素所对应的区段之间的距离有关的可变权重计算相邻元素之间的关联度。算相邻元素之间的关联度。算相邻元素之间的关联度。

【技术实现步骤摘要】
信息处理装置、信息处理方法和计算机可读存储介质


[0001]本公开涉及信息处理领域,具体涉及信息处理装置、信息处理方法和计算机可读存储介质。

技术介绍

[0002]分类技术具有广泛的应用,例如图像识别、字符识别、语音识别等。

技术实现思路

[0003]在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
[0004]本公开的目的是提供一种改进的信息处理装置、信息处理方法和计算机可读存储介质。
[0005]根据本公开的一方面,提供了一种信息处理装置,包括:概率向量获取单元,被配置成获取待分类对象被划分成的N个区段中的每一个的M维概率向量,M为类别的数目,每个M维概率向量中的第一元素至第M元素分别表示相应的区段属于第一类别至第M类别的概率,并且M和N为大于1的自然数;候选类别选择单元,被配置成针对所述N个区段中的每一个,选择该区段的M维概率向量中的除第H元素之外的元素中的前K个最大的元素所对应的类别作为该区段的候选类别,其中H和K为自然数,1≤H≤M,并且1≤K≤M-1,以及其中,与所述第H元素对应的第H类别是不包含语义信息的类别;路径向量生成单元,被配置成基于所述N个区段中的各个区段的候选类别生成路径向量,并且针对所生成的路径向量中的每一个,基于该路径向量所包括的各个元素所对应的概率和相邻元素之间的关联度计算该路径向量的分数;以及分类结果获取单元,被配置成获取所述路径向量中的、分数最高的路径向量作为所述待分类对象的分类结果,其中,基于路径向量中的相邻元素之间的语义信息以及与相邻元素所对应的区段之间的距离有关的可变权重计算相邻元素之间的关联度。
[0006]根据本公开的另一方面,提供了一种信息处理方法,包括:概率向量获取步骤,用于获取待分类对象被划分成的N个区段中的每一个的M维概率向量,M为类别的数目,每个M维概率向量中的第一元素至第M元素分别表示相应的区段属于第一类别至第M类别的概率,并且M和N为大于1的自然数;候选类别选择步骤,用于针对所述N个区段中的每一个,选择该区段的M维概率向量中的除第H元素之外的元素中的前K个最大的元素所对应的类别作为该区段的候选类别,其中H和K为自然数,1≤H≤M,并且1≤K≤M-1,以及其中,与所述第H元素对应的第H类别是不包含语义信息的类别;路径向量生成步骤,用于基于所述N个区段中的各个区段的候选类别生成路径向量,并且针对所生成的路径向量中的每一个,基于该路径向量所包括的各个元素所对应的概率和相邻元素之间的关联度计算该路径向量的分数;以及分类结果获取步骤,用于获取所述路径向量中的、分数最高的路径向量作为所述待分类
对象的分类结果,其中,基于路径向量中的相邻元素之间的语义信息以及与相邻元素所对应的区段之间的距离有关的可变权重计算相邻元素之间的关联度。
[0007]根据本公开的其它方面,还提供了用于实现上述根据本公开的方法的计算机程序代码和计算机程序产品,以及其上记录有该用于实现上述根据本公开的方法的计算机程序代码的计算机可读存储介质。
[0008]在下面的说明书部分中给出本公开实施例的其它方面,其中,详细说明用于充分地公开本公开实施例的优选实施例,而不对其施加限定。
附图说明
[0009]本公开可以通过参考下文中结合附图所给出的详细描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并形成说明书的一部分,用来进一步举例说明本公开的优选实施例和解释本公开的原理和优点。其中:
[0010]图1是示出根据本公开的实施例的信息处理装置的功能配置示例的框图;
[0011]图2A和图2B分别示出待分类对象的示例和分类结果的示例;
[0012]图3示出在字符识别的情况下更新路径向量所考虑的三种情况的示例;
[0013]图4示出根据本公开的实施例的信息处理装置的路径向量生成单元在第i≥2轮处理中执行的处理的流程实例的流程图;
[0014]图5是示出根据本公开的实施例的信息处理方法400的流程实例的流程图;以及
[0015]图6是示出作为本公开的实施例中可采用的个人计算机的示例结构的框图。
具体实施方式
[0016]在下文中将结合附图对本公开的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
[0017]在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与根据本公开的方案密切相关的设备结构和/或处理步骤,而省略了与本公开关系不大的其它细节。
[0018]下面结合附图详细说明根据本公开的实施例。
[0019]首先,将参照图1描述根据本公开的实施例的信息处理装置的功能配置示例。图1是示出根据本公开的实施例的信息处理装置的功能配置示例的框图。如图1所示,根据本公开的实施例的信息处理装置100可以包括概率向量获取单元102、候选类别选择单元104、路径向量生成单元106和分类结果获取单元108。
[0020]概率向量获取单元102可以被配置成获取待分类对象被划分成的N个区段中的每一个的M维概率向量,M为类别的数目,每个M维概率向量中的第一元素至第M元素分别表示相应的区段属于第一类别至第M类别的概率,并且M和N为大于1的自然数。例如,概率向量获
取单元102可以通过神经网络、比如预先训练的卷积循环神经网络CRNN来获取各个区段的M维概率向量(例如参见Shi B,Bai X,Yao C.An End-to-End Trainable Neural Network for Image-Based Sequence Recognition and Its Application to Scene Text Recognition[J].IEEE transactions on pattern analysis&machine intelligence,2017,39(11):2298-2304),但是获取各个区段的M维概率向量的方法不限于此,并且本领域技术人员可以根据实际需要采用其他的方式来获取各个区段的M维概率向量,这里将不再赘述。
[0021]作为示例,待分类对象可以是包含文本的图像。在这种情况下,第一类别至第M类别可以分别表示不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理装置,包括:概率向量获取单元,被配置成获取待分类对象被划分成的N个区段中的每一个的M维概率向量,M为类别的数目,每个M维概率向量中的第一元素至第M元素分别表示相应的区段属于第一类别至第M类别的概率,并且M和N为大于1的自然数;候选类别选择单元,被配置成针对所述N个区段中的每一个,选择该区段的M维概率向量中的除第H元素之外的元素中的前K个最大的元素所对应的类别作为该区段的候选类别,其中H和K为自然数,1≤H≤M,并且1≤K≤M-1,以及其中,与所述第H元素对应的第H类别是不包含语义信息的类别;路径向量生成单元,被配置成基于所述N个区段中的各个区段的候选类别生成路径向量,并且针对所生成的路径向量中的每一个,基于该路径向量所包括的各个元素所对应的概率和相邻元素之间的关联度计算该路径向量的分数;以及分类结果获取单元,被配置成获取所述路径向量中的、分数最高的路径向量作为所述待分类对象的分类结果,其中,基于所述路径向量中的相邻元素之间的语义信息以及与相邻元素所对应的区段之间的距离有关的可变权重计算相邻元素之间的关联度。2.根据权利要求1所述的信息处理装置,其中,相邻元素之间的语义信息通过经由预先训练的n-gram模型计算的值表征。3.根据权利要求1所述的信息处理装置,其中,在相邻元素所对应的区段之间的距离小于或等于预定阈值的情况下,所述可变权重被设置为1;并且在相邻元素所对应的区段之间的距离大于所述预定阈值的情况下,所述可变权重被设置为小于1的值,并且所述可变权重随着所述距离的增大而减小。4.根据权利要求1至3中任一项所述的信息处理装置,所述路径向量生成单元进一步被配置成通过如下N轮处理来生成所述路径向量并获得所述路径向量的分数,在第一轮处理中,所述路径向量生成单元基于所述N个区段中的第一区段的候选类别和所述第H类别生成K+1个路径向量,并且基于每个路径向量中的元素所对应的概率生成该路径向量的分数;在第i≥2轮处理中,所述路径向量生成单元:选择分数最大的前L个路径向量作为候选路径向量,其中L为大于1的自然数;舍弃相同的两个或更多个候选路径向量中的、除具有最高分数的候选路径向量之外的其余候选路径向量;至少基于第i区段的M概率向量对经舍弃后的剩余的候选路径向量的分数进行更新;以及对于剩余的候选路径向量中的每一个:将第i区段的候选类别中的每一个分别添加到该剩余的候选路径向量,以新生成路径向量,并且基于该剩余的候选路径向量的更新之前的分数、新添加的候选类别所对应的概率以及新添加的候选类别与该剩余的候选路径向量的关联度来计算新生成的路径向量的分数。5.根据权利要求4所述的信息处理装置,其中,在第i≥2轮处理中,所述路径向量生成单元通过如下方式对所述剩余的候选路径向量中的每一个的分数进行更新:在所述剩余的候选路径向量包括1个元素且该元素不是所述第H类别的情况下,
基于第i区段的M维概率向量中的与所述剩余的候选路径向量的第1元素对应的概率和所述第i区段的M维概率向量中的第H元素对所述剩余的候选路径向量的分数进行更新,或者如果第i轮中的剩余的候选路径向量中存在仅包含所述第H类别的剩余的候选路径向量,则...

【专利技术属性】
技术研发人员:张颖汪留安孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1