当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理设备、信息处理方法和程序技术

技术编号:6885669 阅读:132 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了信息处理设备、信息处理方法和程序。根据本发明专利技术的信息处理设备包括数据取得单元,其用于获得至少两个元素数据;相异度计算单元,其用于计算数据取得单元获得的元素数据之间的相异度;转变成本计算单元,其用于计算从数据取得单元获得的元素数据中的一个元素数据转变到所述元素数据中的另一个元素数据的成本,所述另一个元素数据不同于所述一个元素数据;以及距离计算单元,其用于通过利用相异度计算单元计算的相异度和转变成本计算单元计算的转变成本,来计算表示元素数据之间的相异程度的元素距离。

【技术实现步骤摘要】

本专利技术涉及信息处理设备、信息处理方法和程序
技术介绍
近年来,各种信息已被数字化和存储,数字化信息的量持续增大。在这些情况下, 需要一种从所存储信息的源有效地取得必需信息的方法。最近专利技术了对原始信息的源进行编码的各种方法。因此,近似字符串匹配不仅被应用于文档的搜索和分析,而且应用于广范围领域中的信息,包括诸如语音、音乐、图像和视频之类的编码多媒体的搜索和分析。在编码信息的搜索和分析中,近似字符串匹配中使用的字符串距离度量极大地影响搜索处理的效率和获得的搜索结果的适当性。广泛使用的字符串距离度量的示例包括适应用于具有相同长度的两个字符串的汉明距离和适用于具有不同长度的字符串的来文史特距离(也可被称为“编辑距离”)。在这种情况下,在近似字符串匹配中引入了反映不匹配部分的分散和位置的另一度量,以改进距离的精度和有效地分离字符串。这种度量的其它示例包括熵度量和 N-gram(N 元语法)法(W0 2009/085555)。
技术实现思路
然而,在WO 2009/085555中描述的熵度量和N-gram法存在以下问题即使提供非常精确的距离度量,它们的计算负荷也是沉重的。鉴于上述情况,本文档来自技高网...

【技术保护点】
1.一种信息处理设备,包括:数据取得单元,其用于获得至少两个元素数据;相异度计算单元,其用于计算所述数据取得单元获得的所述元素数据之间的相异度;转变成本计算单元,其用于计算从所述数据取得单元获得的所述元素数据中的一个元素数据转变到所述元素数据中的另一个元素数据的成本,所述另一个元素数据不同于所述一个元素数据;以及距离计算单元,其用于通过利用所述相异度计算单元计算的所述相异度和所述转变成本计算单元计算的所述成本,来计算表示所述元素数据之间的相异程度的元素距离。

【技术特征摘要】
2010.05.21 JP 2010-1172591.一种信息处理设备,包括数据取得单元,其用于获得至少两个元素数据;相异度计算单元,其用于计算所述数据取得单元获得的所述元素数据之间的相异度; 转变成本计算单元,其用于计算从所述数据取得单元获得的所述元素数据中的一个元素数据转变到所述元素数据中的另一个元素数据的成本,所述另一个元素数据不同于所述一个元素数据;以及距离计算单元,其用于通过利用所述相异度计算单元计算的所述相异度和所述转变成本计算单元计算的所述成本,来计算表示所述元素数据之间的相异程度的元素距离。2.根据权利要求1所述的信息处理设备,其中所述转变成本计算单元基于构成所述元素数据的单元元素的相异度,来计算从具有相对小值的相异度转变到具有相对大值的相异度的第一转变成本,或者从具有相对大值的相异度转变到具有相对小值的相异度的第二转变成本。3.根据权利要求2所述的信息处理设备,其中所述距离计算单元计算由所述相异度计算单元计算的所述相异度与由所述转变成本计算单元计算的第一转变成本和第二转变成本的和,并采用所述和作为所述元素距离。4.根据权利要求1所述的信息处理设备,还包括数据预处理单元,其用于对所述数据取得单元获得的所述元素数据进行预定预处理。5.根据权利要求4所述的信息处理设备,其中当所述元素数据是结构化数据时,所述数据预处理单元将所述结构化数据分成多个结构化元素,并且所述相异度计算单元、所述转变成本计算单元和所述距离计算单元对每个所述结构化元素进行处理。6.根据权利要求1所述的信息处理设备,还包括元素距离计算单元,其用于通过使用从所述数据取得单元输出的所述元素数据来计算表示所述元素数据之间的相异程度的所述元素距离,其中所述元素距离计算单元包括 数据预处理单元,其用于对所述数据取得单元获得的所述元素数据进行预定预处理; 所述距离计算单元; 所述相异度计算单元;以及所述转变成本计算单元。7.根据权利要求1所述的信息处理设...

【专利技术属性】
技术研发人员:吉田芳
申请(专利权)人:索尼公司
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1