【技术实现步骤摘要】
一种基于关键字排序的检索编码方法
本专利技术涉及的是计算机技术检索领域,尤其涉及搜索引擎、排序、优选结果集的相关技术和方法,具体涉及一种基于关键字排序的检索编码方法。
技术介绍
当今社会是信息爆炸的时代,如何从海量数据搜索、提取想要的信息,是一门重要的技术。基于关键字检索、排序、选优相关技术也比较多,一般方法多是按某一个或多个关键字简单而机械的查询或者联合查询。比较好一点方法,或是加入包含权重系统等特征的字典,或是引入算法以计算权重等特征,进行结果上的排序和选优,这在一定程度上提高了的查询的匹配度。另外,检索所涉及的集合数据多、过程复杂,系统如何编码?一套简明易懂、合理高效的编码方法显的非常重要。本文提供了一种更优的检索、排序、选优的技术编码方法,本方法基于“关键字顺序集合”和“关键字有序组合集合”的分级元组编码,强调有序顺序性、组合分级性,并支持关键字、词、句多样化处理,从整体上准确匹配结果,有效提高检索精度,并有一定的灵活性和易用性。
技术实现思路
为了解决现有技术的问题,本专利技术提供了一种 ...
【技术保护点】
1.一种基于关键字排序的检索编码方法,其特征在于,该方法包括:/n获得关键字有序集合,其中每个关键字具有索引;/n将所述关键字有序集合中的关键字进行组合,形成不同的子集;/n将所述子集分级、排序,得到关键字有序组合集合;/n分别针对所述子集和所述关键字有序组合集合进行分级元组编码。/n
【技术特征摘要】
1.一种基于关键字排序的检索编码方法,其特征在于,该方法包括:
获得关键字有序集合,其中每个关键字具有索引;
将所述关键字有序集合中的关键字进行组合,形成不同的子集;
将所述子集分级、排序,得到关键字有序组合集合;
分别针对所述子集和所述关键字有序组合集合进行分级元组编码。
2.根据权利要求1所述的基于关键字排序的检索编码方法,其特征在于,所述子集的分级包括:
第一级,对应包括1个关键字的子集;
第二级,对应由2个关键字组合而成的子集;
第N级,对应由N个关键字组合而成的子集。
3.根据权利要求2所述的基于关键字排序的检索编码方法,其特征在于,所述子集的索引由组合该子集的关键字的索引从小到大组合而成;
同一级别的所述子集按照索引排序,索引越小排序时越靠前,查优度越高。
4.根据权利要求3所述的基于关键字排序的检索编码方法,其特征在于,针对所述子集的分级元组编码为:
(Lev级别,构成子集Key的序列),进一步表示为:
(n,Ki序列)
其中n为当前子集级别,i为构成子集Key的顺序索引,Key的数量和n相等。
5.根据权利要求4所述的基于关键字排序的检索编码...
【专利技术属性】
技术研发人员:赵成军,雷艳玲,孟祥乾,郭奇,孟凡涛,王恒峰,
申请(专利权)人:航天信息股份有限公司企业服务分公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。