一种字符数据的检索方法技术

技术编号：2920599 阅读：207 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种字符数据的检索方法。包括：１）提取源数据库中字符数据的前两位字母组合作为索引项建立索引；２）记录每个索引项所对应的字符数据的存储地址；３）加载所述索引到内存；以及，４）根据输入关键字的前两位字母加载该字母组合索引项对应的字符数据到内存；５）遍历内存中的字符数据，输出与关键字匹配的数据。本发明专利技术能够快速的反馈与关键字相似的字符数据，并且不仅降低了内存占有量，也具有较高的匹配速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数据检索技术，尤其是字符类数据的检索方法。
技术介绍
用户在进行词典类数据的查询操作中，用户往往出现不能十分确定查询关键字的具体拼写的情况；或者，用户需要查询具有部分相同字符的数据。针对以上两种情况，可以依据用户输入的不确定的字符串，从源数据中查找出一系列与之相似的数据，供用户参考，同时也支持包括通配符的关键字的查找。在关键字中加入通配符“？”或“*”以查找所有与之预期相同或者相近的字符数据。其中通配符“？”匹配文件名中的单个字符，而通配符“*”匹配零个或多个字符。例如data？.dat的模式所能查找到的文件包括data1.dat或者dataN.dat；当使用′*′字符代替′？′字符时(即data*.dat的模式)，则会扩大检索出的文件范围，则下列名称的文件将出现在查询结果中data12222.dat或者data12XF.dat等。如本领域技术人员所知，关键字的查找方法是对源数据中所有数据逐一进行比对。所述源数据通常是保存在磁盘上的单词索引文件。由于对磁盘操作的速度较慢，并且逐一进行对比的算法较为繁琐，因而，现有技术不能提供更高的检索速度。现有技术的一种改进方法是先将磁盘文件中的数据读入内存，进而在内存中进行字符匹配的操作，但是由于不同检索应用中的索引文件大小不同，尤其在索引文件较大的情况下，将其全部读入内存会占用相当部分的内存空间，进一步由于该改进方法仅改变了匹配操作的环境，而依然沿用了现有技术中较为繁琐的字符匹配算法，因而所述对现有技术的改进并没有明显的提高字符查找的速度。
技术实现思路
本专利技术的目的是提供一种字符数据的查找方法，...

【技术保护点】
一种字符数据检索方法，其特征在于：１）提取源数据库中字符数据的前两位字母组合作为索引项建立索引；２）记录每个索引项所对应的字符数据的存储地址；３）加载所述索引到内存；以及，４）根据输入关键字的前两位字母加载该字母组合索引项对应的字符数据到内存；５）遍历内存中的字符数据，输出与关键字匹配的数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈亮，林剑峰，
申请(专利权)人：北京金山软件有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人