检索装置制造方法及图纸

技术编号:7184377 阅读:214 留言:0更新日期:2012-04-11 18:40
在现有的检索技术中,检索结果具有多个候补时的候补缩小方式的一个方法为了防止候补遗漏而产生庞大数量的候补导致管理成本增大,其他方法由于总是以全部候补为对象进行处理,因此处理时间长,响应性下降。将包括来自于输入单元的输入内容与候补列表的检索历史存储在检索历史存储单元中,按照存储的检索历史内容,由缩小方式选择单元从将检索对象限定为上位候补的方式、与基于过去输入重新检索的方式中选择缩小方法,按照选择的缩小方式从检索历史中设定检索候补及其得分,基于来自于输入单元的字符串以检索用索引为参照由候补得分更新单元更新候补得分,根据更新的候补数及其得分的分布由候补决定单元决定提示候补,参照名称信息数据由候补提示单元对用户提示决定的候补。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种针对文本输入或输入语音等基于模式识别的输入如对设施等名称的检索装置
技术介绍
基于字符串索引的名称检索技术是对检索对象的词素、N字符连锁的部分字符串检索出现的名称的技术。日本专利第3665112号公报公开了一种根据部分字符串的对照合计各候补的得分,将上位候补作为检索结果的方法。此时,能够实现即使不是与输入完全一致的字符串也会提取类似的候补的模糊检索。在模糊检索中,需要保持得分不同的多个候补,与完全一致检索相比,使用存储器、运算量更大。在上述中参照的字符串索引的大小与检索对象字符串的检索单位数成正比。因此,当检索对象为大规模时,需要在DVD (DigitalVersatile Disk)或硬盘等二次存储器上配置参照的字符串索引。这种情况下,从二次存储器的读出所需的处理时间变长。词典的读出次数为不同的部分字符串的种类数,在如名称这样简短的输入中,大致与输入字符串的长度成正比。另外,一般而言,在模糊检索中,需要保持得分不同的多个候补,与完全一致检索相比,存储器、运算量更大。通过将上述检索方式与语音识别技术相结合能够实现基于语音输入的检索。日本特开2008-262279号公报中,作为使用了语音的检索方法,公开了一种考虑了语音识别的单位和检索的单位的差异的检索手法。这种情况下,成为还考虑了语音识别时的误识别的检索,候补数进一步增加。检索的结果,在产生了多个候补时,希望通过用户的追加输入而缩小候补。日本专利第3134204号公报中,公开了一种通过指示操作能够选择分层检索模式与总体检索模式的方法,其中,所述分层检索模式将作为紧接之前的检索结果的文档集合作为母集团进行缩小,所述总体检索模式在每次检索中总是将一定的文档集合作为母集合进行检索。专利文献1 日本专利第3665112号公报、字符串检索方法及装置专利文献2 日本特开2008-262279号公报、语音检索装置专利文献3 日本专利第3134204号公报、信息检索用终端装置及信息检索用终端装置中的信息显示·输入输出方法
技术实现思路
所述专利文献3的日本专利第3134204号公报所公开的两种缩小方式需要用户指定缩小方法。另外,可以考虑将上述方式与模糊检索相结合。这种情况下,各个缩小方式存在以下课题。上述分层检索模式中,保持被缩小的候补列表作为检索历史,针对用于缩小的追加输入,仅对候补列表内的对象进行处理。因此,仅对追加输入产生索引的参照。另外,合计对象少且运算量小。CN 102365639 A说明书2/9页 但是,由于一旦成为候补外,则不会再次成为候补,因此需要防止候补遗漏。例如, 将位于东京都的设施名称作为检索对象时,针对“东京”这样的输入会产生庞大数量的候补。这种情况下,不仅用户难以确认所有的候补,而且存在检索历史中包含很多候补导致管理成本增加的问题。另外,在可保持的候补数具有上限时,会产生从候补遗漏的情况。当考虑多次缩小或缩小取消时,需要存储多次的检索历史,管理成本也会增加。上述总体检索模式中,每当重新检索时对文档母集团重新检索。因此,只要保持用户的输入作为检索历史即可,管理检索历史的成本小。但是,总是以全部候补为对象,需要处理所有的输入。因此,由于索引的读出次数多,合计对象的候补数也多,所以处理时间变长,响应性下降。另外,日本特开2008-262279号公报在以语音输入为对象的检索的情况下,制作覆盖检索对象整体的识别词典。该词典并未考虑缩小结果,缩小时也未能改善识别率。通常,由于用户以能限定检索对象的方式进行输入,因此成为庞大的候补数的情况是少见的。所以,有鉴于上述问题,本专利技术的目的在于不提高缩小检索时的管理成本,而改善平均检索时间。另外,目的在于改善基于语音的缩小中的识别精度。本专利技术所涉及的检索装置,包括输入单元,受理用户输入,输出检索请求;检索历史存储单元,存储包括来自于输入单元的输入内容以及候补列表的检索历史;缩小方式选择单元,根据检索请求,按照存储在检索历史存储单元中的检索历史的内容,从以下两种方式中选择缩小方法将检索对象限定为上位候补的方式;以及根据过去输入重新检索的方式;候补得分更新单元,根据选择的缩小方式,从检索历史中设定检索候补及其得分, 基于由输入单元受理的字符串,以检索用索引为参照更新候补得分;候补决定单元,根据通过候补得分更新单元更新的候补数与得分的分布,决定提示的候补;以及候补提示单元,参照名称信息数据,对用户提示由候补决定单元决定的候补。根据本专利技术所涉及的检索装置,按照存储在检索历史存储单元中的检索历史的内容,从将检索对象限定为上位候补的方式、与根据过去输入重新检索的方式这两种方式中选择缩小方法。因此,当妥当性高的候补少时,能够限定对象进行缩小以缩短运算时间。另外,当妥当性高的候补多时,能够参照检索历史的输入字符串,进行扩大了范围的检索,即使是较小的检索历史大小,也不会产生遗漏,能够实现平均运算时间短的检索。附图说明图1是本专利技术设想的检索装置的整体结构图。图2是表示本专利技术的实施方式1所涉及的检索装置的结构的功能框图。图3是名称信息词典例的说明图。图4是基于字符2-gram的检索用索引例的说明图。图5是检索历史例的说明图。图6是表示合计得分与合计标志的合计用表格的说明图。4图7是表示实施方式1所涉及的检索装置的检索处理动作的流程图。图8是针对两个输入的检索结果的候补次序与得分的特性图。图9是表示本专利技术的实施方式2所涉及的检索装置的结构的功能框图。图10是表示双字母组语言模型的连接概率P的说明图。图11是识别三个名称以及构成单词的缩小用识别词典例的说明图。图12是表示实施方式2所涉及的检索装置的检索处理动作的流程图。图13是表示本专利技术的实施方式3所涉及的检索装置的结构的功能框图。图14是表示实施方式3所涉及的检索装置的检索处理动作的流程图。具体实施例方式下面参照附图,对本专利技术的优选实施方式进行详细说明。实施方式1.图1是本专利技术设想的检索装置的整体结构。输入部10受理基于文本、语音等的输入,根据需要参照大词汇语音识别词典103转换为检索部20可受理的形式。检索部20参照检索用索引102进行模糊检索。提示部30参照名称信息词典101向用户提示基于检索部20的检索结果的名称、附带信息。名称信息词典101、检索用索引102以及大词汇语音识别词典103是根据检索对象的数据制作出的。当检索对象成为大规模时,这些数据大小也变大,因此配置在二次存储装置40上。图2是表示本专利技术的实施方式1所涉及的检索装置的结构的功能框图。检索装置包括名称信息词典101、检索用索引102、作为输入部10的结构单元的一例的输入单元201、检索历史存储单元202、缩小方式选择单元203、候补得分更新单元204、 候补决定单元205、作为提示部30的结构单元的一例的候补提示单元206。本专利技术的特征部分在于包括缩小方式选择单元203,按照从检索历史存储单元 202读出的检索历史决定缩小方式这点。下面对各功能块的动作进行说明。名称信息词典101为与用于向用户提示的名称ID (identification)对应的表述、 发音等名称信息。图3是由名称ID与名称的读法构成的名称信息词典101的例子。如果名称信息词典101为与名称ID相对应的信息,则也可以登记单本文档来自技高网
...

【技术保护点】
1.一种检索装置,包括:输入单元,受理用户输入,输出检索请求;检索历史存储单元,存储检索历史,该检索历史包括来自于输入单元的输入内容以及候补列表;缩小方式选择单元,根据检索请求,按照存储在检索历史存储单元中的检索历史的内容,从以下两种方式中选择缩小方法:将检索对象限定为上位候补的方式;以及根据过去输入而重新检索的方式;候补得分更新单元,根据选择的缩小方式,从检索历史中设定检索候补及其得分,基于从输入单元受理的字符串,以检索用索引为参照更新候补得分;候补决定单元,根据通过候补得分更新单元更新的候补数与得分的分布,决定要提示的候补;以及候补提示单元,参照名称信息数据,对用户提示由候补决定单元决定的候补。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:冈登洋平花沢利行
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1