【技术实现步骤摘要】
本专利技术属于电信业务中的信息搜索应用
,尤其涉及一种对 排序结果进行验证的方法和系统。
技术介绍
在信息大爆炸的时代,用户需要更准确定位所需分类信息,由此衍 生出垂直搜索技术以满足客户日益增长变化的需求。为实现此目的,搜 索引擎需要不断根据客户需求完善其自身的排序规则,使之做到准确、 合理、高效。大多数搜索产品在面临新增排序需求或调整排序结果时,并不能较 完美的满足用户需求,无法较好的按照客户业务需求进行排序,搜索结 果不尽如人意。急需在排序算法调整后对搜索结果的准确性做完备的验 证,但目前业内尚无较好的方法对搜索结果的排序进行衡量,主要存在如下问题1、 大多情况下,搜索结果的排序效果需要依靠人工的方式进行验 证,再对比业务需求修改排序参数来优化排序效果,效率低。2、 对排序效果的判断存在个人主观性,无法完全客观反映验证实 际情况。3、 对排序效果的衡量没有可量化的标准,无法对各类排序算法或 算法不同参数组合的排序结果进行自动对比。
技术实现思路
本专利技术提出 一种对排序结果进行验证的方法和系统,可以对多个搜 索算法的效果进行比较,并提高检验排序结果的效率。根据本专利技术的一个方面,提出一种对排序结果进行验证的方法,包括以下步骤搜索引擎根据要搜索的关键词获取搜索结果,并对搜索结 果标注位置序号,得到用位置序号组成的搜索结果序列;将各搜索结果 划分成具有权重系数的多个信息文本,根据关键词与信息文本的匹配次 数以及信息文本的权重系数计算信息相关度r ,其中,p表示关键词在字段中的匹配次数,w表示权重系数;根据对信息文本设定的业务M和权重系数计算信息丰富 ...
【技术保护点】
一种对排序结果进行验证的方法,包括以下步骤: 搜索引擎根据要搜索的关键词获取搜索结果,并对搜索结果标注位置序号,得到用位置序号组成的搜索结果序列; 将各搜索结果划分成具有权重系数的多个信息文本,根据关键词与信息文本的匹配次数以及 信息文本的权重系数计算信息相关度r,r=p1*w1+p2*w2+...+pn*wn,其中,p表示关键词在字段中的匹配次数,w表示权重系数; 根据对信息文本设定的业务条件和权重系数计算信息丰富度c,c=F1*w1+F2*w2+F3*w3 +...+Fn*wn,其中,w表示权重系数,F↓[n-1]*w↓[n-1]>F↓[n]*w↓[n]; 根据信息相关度和信息丰富度计算排序分数score=r*w+c*w′; 按分数大小顺序排列排序分数,并将搜索引擎搜索结果中的位置 序号对应标注到各排序后分数,得到用位置序号组成的排序结果序列;计算用位置序号组成的排序结果序列与用位置序号组成的搜索结果序列的相似度; 将相似度与配置的阈值进行比较,并记录比较结果,在比较结果中包括相似度大于阈值的次数以及相似度小于阈 值的 ...
【技术特征摘要】
1.一种对排序结果进行验证的方法,包括以下步骤搜索引擎根据要搜索的关键词获取搜索结果,并对搜索结果标注位置序号,得到用位置序号组成的搜索结果序列;将各搜索结果划分成具有权重系数的多个信息文本,根据关键词与信息文本的匹配次数以及信息文本的权重系数计算信息相关度r,r=p1*w1+p2*w2+...+pn*wn,其中,p表示关键词在字段中的匹配次数,w表示权重系数;根据对信息文本设定的业务条件和权重系数计算信息丰富度c,c=F1*w1+F2*w2+F3*w3+...+Fn*wn,其中,w表示权重系数,Fn-1*wn-1>Fn*wn;根据信息相关度和信息丰富度计算排序分数score=r*w+c*w′;按分数大小顺序排列排序分数,并将搜索引擎搜索结果中的位置序号对应标注到各排序后分数,得到用位置序号组成的排序结果序列;计算用位置序号组成的排序结果序列与用位置序号组成的搜索结果序列的相似度;将相似度与配置的阈值进行比较,并记录比较结果,在比较结果中包括相似度大于阈值的次数以及相似度小于阈值的次数;当比较结果中相似度大于阈值的次数大于设定次数,或者比较结果中相似度小于阈值的次数小于设定次数,搜索引擎的排序结果未通过验证,否则通过验证。2. 根据权利要求1所述对排序结果进行验证的方法,其中,计算 用位置序号组成的排序结果序列与用位置序号组成的搜索结果序列的相 似度的操作,包括以下步骤计算排序结果序列中位置序号与搜索结果序列中相应位置的位置序号的差值的绝对值;将各计算结果进行加和运算得到相似度。3. 根据权利要求2所述对排序结果进行验证的方法,其中,计算差值的绝对值的操作,还包括对各差值的绝对值配以权重系数的步骤。4. 根据权利要求l所述对排序结果进行验证的方法,其中,计算用位置序号组成的排序结果序列与用位置序号组成的搜索结果序列的相似度的操作,包括以下步骤计算排序结果序列中两个位置序号的差值的绝对值,并将各计算结果进行加和运算得到绝对排序结果序列;计算搜索结果序列中相应位置的两个位置序号的差值的绝对值,并 将各计算结果进行加和运算得到绝对搜索结果序列;将绝对排序结果序列与绝对搜索结果序列的差值的绝对值作为相似度。5. 根据权利要求1所述对排序结果进行验证的方法,其中,将相 似度与配置的阈值进行比较,并记录比较结果的操作,包括以下步骤判断相似度是否大于配置的阁值,如果是,将记录结果中相似度大 于阈值的次数加l,否则,将相似度小于阈值的次数加l;或者判断相似度与配置的阈值的差值的绝对值是否在设定范围内,如果 是,将记录结果中相似度小于阈值的次数加1,否则,将记录结果中相 似度大于阈值的次数加1。6. 根据权利要求1所述对排序结果进行验证的方法,其中,将搜 索引擎搜索结果中的位置序号对应标注到各排序后分数的操作,还包括...
【专利技术属性】
技术研发人员:余锦婷,徐雄,杨翊平,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:11[]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。