一种基于反馈的有序分级排序方法技术

技术编号:24251495 阅读:23 留言:0更新日期:2020-05-22 23:33
本发明专利技术提出了一种基于反馈的有序分级排序方法,该方法包括:获得关键字初步顺序集合,其中每个关键字具有索引;基于检索结果反馈调整专属业务字典的专业权重,并基于专业权重进行索引顺序调整,获得关键字有序集合;将所述关键字有序集合中的关键字进行组合,形成不同的子集;将所述子集分级、排序,得到关键字有序组合集合。本方法引入了个性化的反馈机制,对检索的整体结果或单个结果进行反馈,经过反馈分级转换、反馈增益量化和调优等过程,以便动态调整专业字典中的权重,使其调优过程更具备个性化、自学习能力。

An ordered hierarchical sorting method based on feedback

【技术实现步骤摘要】
一种基于反馈的有序分级排序方法
本专利技术涉及的是计算机技术检索领域,尤其涉及搜索引擎、排序、优选结果集的相关技术和方法,具体涉及一种基于反馈的有序分级排序方法。
技术介绍
当今社会是信息爆炸的时代,如何从海量数据搜索、提取想要的信息,是一门重要的技术。基于关键字检索、排序、选优相关技术也比较多,一般方法多是按某一个或多个关键字简单而机械的查询或者联合查询。比较好一点方法,或是加入包含权重系统等特征的字典,或是引入算法以计算权重等特征,进行结果上的排序和选优,这在一定程度上提高了的查询的匹配度。本文提供了一种更优的检索、排序、选优的技术方法,本方法基于动态业务字典,支持用户反馈,具备自学习能力,强调有序顺序性、组合分级性,并支持关键字、词、句多样化处理,从整体上准确匹配结果,有效提高检索精度,并具备个性化、灵活性和易用性的特点。
技术实现思路
为了解决现有技术的问题,本专利技术提供了一种基于反馈的有序分级排序方法,该方法包括:获得关键字初步顺序集合,其中每个关键字具有索引;基于检索结果反馈调整专属业务字典的专业权重,并基于专业权重进行索引顺序调整,获得关键字有序集合;将所述关键字有序集合中的关键字进行组合,形成不同的子集;将所述子集分级、排序,得到关键字有序组合集合。进一步地,基于专业权重进行索引顺序调整包括:获得初步权重Wi和专业权重Vi;调整后的权重Ui为:其中,K为专业权重Vi的权重系数。进一步地,通过专属业务字典获取关键字的专业权重Vi;以及通过曲线拟合的方式进行权重量化,获得初步权重Wi。进一步地,基于反馈调整专属业务字典的专业权重Vi,并基于调整后的权重Ui重新排序,获得新的关键字有序集合。进一步地,基于检索结果反馈调整专属业务字典的专业权重包括:利用关键字有序组合集合的每一个子集元素进行查询检索,进行检索结果展示;获得用户对检索结果的反馈,并将用户反馈进行分级转换;根据用户反馈分级评价等级计算增益度;根据增益度调整专业权重。进一步地,根据以下增益度计算公式,进行计算:其中,n为评价分级的级别数量,为大于1的整数;i为评价等级索引,取值范围:1~n。进一步地,Vi增益调优公式:其中,Vi′为Vi增益调整后的值,Vi为专业字典中第一关键字的专业权重,k为增益范围系数,大于等于1。进一步地,所述子集的分级包括:第一级,对应包括1个关键字的子集;第二级,对应由2个关键字组合而成的子集;……第N级,对应由N个关键字组合而成的子集,N为自然数。进一步地,将所述关键字有序集合中的关键字分成多组,将每个组内的关键字进行组合形成不同的子集,多组关键字形成多组不同的子集。进一步地,将多组不同的子集进行分级、排序,得到关键字有序组合集合。本专利技术提供了基于反馈的有序分级排序方法。该方法具有以下特点和优势:一、基于业务字典权重。业务字典中包含有带有权重属性的专属业务领域的关键字信息,并引入权重量化、曲线拟合和动态调优机制。在句法分析、提取关键字阶段,可以更加准确的进行业务领域的分词,同时将关键字按权重大小、重要程度依次按顺序排序,使得为后续的精准优选检索提供了必要支持。二、有序顺序性。本方法基于“关键字有序集合”和“关键字有序组合集合”,强调了关键字顺序和关键字组合顺序的重要性。权重系数的大小、用户输入的次序、词性等各种维度都可以看作顺序索引的体现。三、组合分级性。本方法中将关键字分组、分级构成各个子集。子集中关键字数量越多,则该子集等级越高,则查优度越高。四、基于结果反馈。本方法引入了个性化的反馈机制,对检索的整体结果或单个结果进行反馈,经过反馈分级转换、反馈增益量化和调优等过程,以便动态调整业务字典中的权重,使其调优过程更具备个性化、自学习能力。五、支持关键字、词、句多样化。针对包含关键字序列的短语或词句,使用数据清洗或分词技术进行处理、分析、提取。用户输入是字、或词、或句,都可有效处理,提高应用的灵活性、易用性。本方法基于动态业务字典,支持结果反馈,具备自学习能力,强调有序顺序性、组合分级性,并支持关键字、词、句多样化处理,从整体上准确匹配结果,有效提高检索精度,并具备个性化、灵活性和易用性的特点。附图说明通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。图1是本专利技术的基于业务字典权重的有序分级排序方法的流程图。图2是本专利技术的一个专属业务字典的示意图表。图3展示了三条拟合曲线,其中包含一条直线和两条弧线。图4给出了当n=3时关键字权重表。图5给出了当n=3时拟合曲线图。图6展示了初步权重Wi和专业权重Vi的对比图表。图7展示了初步权重Wi、专业权重Vi和调整后权重Ui的对比。图8是本专利技术实施例一的基于关键字有序集合的分级排序方法流程图。图9是本专利技术实施例二的基于关键字有序集合的分级排序方法流程图。图10是本专利技术实施例四的有两个关键字时关键字有序组合集合中子集特性示意图。图11是本专利技术实施例四的有两个关键字时关键字有序组合集合中子集特性对应关系表。图12是本专利技术实施例五的有三个关键字时关键字有序组合集合中子集特性示意图。图13是本专利技术实施例五的有三个关键字时关键字有序组合集合中子集特性对应关系表。图14是本专利技术实施例六的检索信息形成有序结果集合的流程图。图15是本专利技术实施例七的检索信息形成有序结果集合的优化和扩展过程的流程图。图16是本专利技术实施例八的个性化反馈机制的流程图。图17是本专利技术实施例八的第一顺序关键字在专业字典中的权重信息表。图18是本专利技术实施例八的第一顺序关键字的增益调整信息表。具体实施方式下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。如图1所示,本专利技术提供一种基于业务字典权重的有序分级排序方法,该方法包括:获得关键字初步顺序集合,其中每个关键字具有索引;基于检索结果反馈调整专属业务字典的专业权重,并基于专业权重进行索引顺序调整,获得关键字有序集合;将所述关键字有序集合中的关键字进行组合,形成不同的子集;将所述子集分级、排序,得到关键字有序组合集合。具体地,获得关键字有序集合之前首先输入文本。输入文本的格式可以是包含关键字/词(以下统称为“关键字”Key,简写为K)的序列本文档来自技高网...

【技术保护点】
1.一种基于反馈的有序分级排序方法,其特征在于,该方法包括:/n获得关键字初步顺序集合,其中每个关键字具有索引;/n基于检索结果反馈调整专属业务字典的专业权重,并基于专业权重进行索引顺序调整,获得关键字有序集合;/n将所述关键字有序集合中的关键字进行组合,形成不同的子集;/n将所述子集分级、排序,得到关键字有序组合集合。/n

【技术特征摘要】
1.一种基于反馈的有序分级排序方法,其特征在于,该方法包括:
获得关键字初步顺序集合,其中每个关键字具有索引;
基于检索结果反馈调整专属业务字典的专业权重,并基于专业权重进行索引顺序调整,获得关键字有序集合;
将所述关键字有序集合中的关键字进行组合,形成不同的子集;
将所述子集分级、排序,得到关键字有序组合集合。


2.根据权利要求1所述的基于反馈的有序分级排序方法,其特征在于,基于专业权重进行索引顺序调整包括:
获得初步权重Wi和专业权重Vi;
调整后的权重Ui为:



其中,K为专业权重Vi的权重系数。


3.根据权利要求2所述的基于反馈的有序分级排序方法,其特征在于,通过专属业务字典获取关键字的专业权重Vi;以及
通过曲线拟合的方式进行权重量化,获得初步权重Wi。


4.根据权利要求2所述的基于反馈的有序分级排序方法,其特征在于,基于反馈调整专属业务字典的专业权重Vi,并基于调整后的权重Ui重新排序,获得新的关键字有序集合。


5.根据权利要求1所述的基于反馈的有序分级排序方法,其特征在于,基于检索结果反馈调整专属业务字典的专业权重包括:
利用关键字有序组合集合的每一个子集元素进...

【专利技术属性】
技术研发人员:赵成军
申请(专利权)人:航天信息股份有限公司企业服务分公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1