【技术实现步骤摘要】
信息处理装置、信息处理方法和计算机可读存储介质
[0001]本公开涉及信息处理领域,具体涉及信息处理装置、信息处理方法和计算机可读存储介质。
技术介绍
[0002]分类技术具有广泛的应用,例如图像识别、字符识别、语音识别等。
技术实现思路
[0003]在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
[0004]本公开的目的是提供一种改进的信息处理装置、信息处理方法和计算机可读存储介质。
[0005]根据本公开的一方面,提供了一种信息处理装置,包括:概率向量获取单元,被配置成获取待分类对象被划分成的N个区段中的每一个的M维概率向量,M为类别的数目,每个M维概率向量中的第一元素至第M元素分别表示相应的区段属于第一类别至第M类别的概率,并且M和N为大于 ...
【技术保护点】
【技术特征摘要】
1.一种信息处理装置,包括:概率向量获取单元,被配置成获取待分类对象被划分成的N个区段中的每一个的M维概率向量,M为类别的数目,每个M维概率向量中的第一元素至第M元素分别表示相应的区段属于第一类别至第M类别的概率,并且M和N为大于1的自然数;候选类别选择单元,被配置成针对所述N个区段中的每一个,选择该区段的M维概率向量中的除第H元素之外的元素中的前K个最大的元素所对应的类别作为该区段的候选类别,其中H和K为自然数,1≤H≤M,并且1≤K≤M-1,以及其中,与所述第H元素对应的第H类别是不包含语义信息的类别;路径向量生成单元,被配置成基于所述N个区段中的各个区段的候选类别生成路径向量,并且针对所生成的路径向量中的每一个,基于该路径向量所包括的各个元素所对应的概率和相邻元素之间的关联度计算该路径向量的分数;以及分类结果获取单元,被配置成获取所述路径向量中的、分数最高的路径向量作为所述待分类对象的分类结果,其中,基于所述路径向量中的相邻元素之间的语义信息以及与相邻元素所对应的区段之间的距离有关的可变权重计算相邻元素之间的关联度。2.根据权利要求1所述的信息处理装置,其中,相邻元素之间的语义信息通过经由预先训练的n-gram模型计算的值表征。3.根据权利要求1所述的信息处理装置,其中,在相邻元素所对应的区段之间的距离小于或等于预定阈值的情况下,所述可变权重被设置为1;并且在相邻元素所对应的区段之间的距离大于所述预定阈值的情况下,所述可变权重被设置为小于1的值,并且所述可变权重随着所述距离的增大而减小。4.根据权利要求1至3中任一项所述的信息处理装置,所述路径向量生成单元进一步被配置成通过如下N轮处理来生成所述路径向量并获得所述路径向量的分数,在第一轮处理中,所述路径向量生成单元基于所述N个区段中的第一区段的候选类别和所述第H类别生成K+1个路径向量,并且基于每个路径向量中的元素所对应的概率生成该路径向量的分数;在第i≥2轮处理中,所述路径向量生成单元:选择分数最大的前L个路径向量作为候选路径向量,其中L为大于1的自然数;舍弃相同的两个或更多个候选路径向量中的、除具有最高分数的候选路径向量之外的其余候选路径向量;至少基于第i区段的M概率向量对经舍弃后的剩余的候选路径向量的分数进行更新;以及对于剩余的候选路径向量中的每一个:将第i区段的候选类别中的每一个分别添加到该剩余的候选路径向量,以新生成路径向量,并且基于该剩余的候选路径向量的更新之前的分数、新添加的候选类别所对应的概率以及新添加的候选类别与该剩余的候选路径向量的关联度来计算新生成的路径向量的分数。5.根据权利要求4所述的信息处理装置,其中,在第i≥2轮处理中,所述路径向量生成单元通过如下方式对所述剩余的候选路径向量中的每一个的分数进行更新:在所述剩余的候选路径向量包括1个元素且该元素不是所述第H类别的情况下,
基于第i区段的M维概率向量中的与所述剩余的候选路径向量的第1元素对应的概率和所述第i区段的M维概率向量中的第H元素对所述剩余的候选路径向量的分数进行更新,或者如果第i轮中的剩余的候选路径向量中存在仅包含所述第H类别的剩余的候选路径向量,则...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。