【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及生成表示字符或基础单词的有无的索引信息,使用索引信息进行检索 的信息生成程序、信息检索程序、信息生成装置、信息检索装置、信息生成方法,以及信息检索方法。
技术介绍
已知ー种高速生成所谓字符成分表的全文检索索引的位图型的全文检索技术(例如,參照下述专利文献I 3。)。以往的位图型的全文检索技术中,由于不进行词素解析,所以能够高速生成,能够压缩位图。一般的国语词典中,有约24万项目的记录,以约6000 8000字符记述,单一字符的位图也有约6000 8000。专利文献I :日本特开平I 一 181329号公报专利文献2 日本特开平3 — 174652号公报专利文献3 日本特开平5 — 174064号公报
技术实现思路
然而,在上述的以往技术中,存在如下问题包含于各项目(记录)的假名、片假名和英文字符的出现频率高,在单一字符的位图中,锁定对象项目的效率低。另外,若追加2连接字符串的位图,则尺寸变大而使存储器不够用。若通过哈希(hash)处理进行尺寸縮小则产生检索噪声。因此,位图的锁定效率降低,检索速度变得缓慢。另ー方面,由英文字符、假名、片假名等的单词构成的 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。