一种查询结果的排序方法和装置制造方法及图纸

技术编号:7095812 阅读:219 留言:0更新日期:2012-04-11 18:40
本申请实施例公开了一种查询结果的排序方法和装置,其中,所述方法包括:根据提取出的符合用户查询条件的查询结果,采集指示查询结果质量的质量因子、指示查询结果供应商的活跃度的活跃度因子、指示查询结果供应商所在行业的行业因子、查询结果供应商的信息点击转化率和信息反馈转化率中的任意一个或者任意多个组合;将采集到的内容作为查询结果的特征,基于支持向量机SVM回归模型进行特征拟合,得到查询结果的特征拟合值;基于查询结果的相关值进行排序,在相同的相关性级别中,以查询结果的特征拟合值从高到低的顺序进行排列。根据本申请实施例,可以节省资源消耗,提高用户体验。

【技术实现步骤摘要】

本申请涉及通信和计算机
,特别是涉及一种查询结果的排序方法和装置
技术介绍
用户在信息查询搜索引擎系统中进行信息查询时,当用户输入查询条件后,后台的信息查询系统从数据库中提取符合用户查询条件的查询结果,将查询结果以一定的方式进行排序后展现给用户,这样,用户就可以从展现出的,并以一定顺序排列的查询结果中选择自己满意的信息。其中,在将查询结果进行排序时,信息查询系统通常会在相关性基础上考虑每个查询结果的时效性。即,根据每个查询结果的相关值,先将查询结果分类到不同的相关性级别,再按照相关性级别由高到低进行排序。而在相同的相关性级别中,则根据每个查询结果的发布时间进行排序,发布时间越近的查询结果,排名越靠前。例如,以购物网站中的信息查询系统对商品进行排序为例,当信息查询系统从数据库中提取符合用户查询条件的商品信息后,会在相关性基础上考虑每个商品信息的时效性,在相同的相关性级别中,发布时间越近的商品信息,排名越靠前。但是,专利技术人在研究中发现,在现有的排序方式下,为了使商品信息的排序靠前, 一部分供应商通过每天多次重发商品信息来不断更新发布时间。每天大量的重发信息不仅对带宽、数据库和服务器等技术资源造成了大量的消耗,而且,以发布时间为导向的排序方法也导致了一部分供应商的恶性竞争行为,最终降低了用户的体验性。
技术实现思路
为了解决上述技术问题,本申请实施例提供了一种查询结果的排序方法和装置, 以节省资源消耗,提高用户体验。本申请实施例公开公开了如下技术方案一种搜索引擎中查询结果的排序方法,包括根据提取出的符合用户查询条件的查询结果,采集指示查询结果质量的质量因子、指示查询结果供应商的活跃度的活跃度因子、指示查询结果供应商所在行业的行业因子、查询结果供应商的信息点击转化率和信息反馈转化率中的任意一个或者任意多个组合;将采集到的内容作为查询结果的特征,基于支持向量机SVM回归模型进行特征拟合,得到查询结果的特征拟合值;基于查询结果的相关值进行排序,在相同的相关性级别中,以查询结果的特征拟合值从高到低的顺序进行排列。一种搜索引擎中查询结果的排序装置,包括第一采集模块,用于根据提取出的符合用户查询条件的查询结果,采集指示查询结果质量的质量因子、指示查询结果供应商的活跃度的活跃度因子、指示查询结果供应商所在行业的行业因子、查询结果供应商的信息点击转化率和信息反馈转化率中的任意一个或者任意多个组合;特征拟合模块,用于将采集到的内容作为查询结果的特征,基于支持向量机SVM回归模型进行特征拟合,得到查询结果的特征拟合值;排序模块,用于基于查询结果的相关值进行排序,在相同的相关性级别中,以查询结果的特征拟合值从高到低的顺序进行排列。由上述实施例可以看出,以质量因子、活跃度因子、行业因子、信息点击转化率和信息反馈转化率中的任意一个或者任意多个组合做为导向的排序方法,弱化了查询结果的时效性因素,不仅可以避免由供应商重发信息而导致的带宽、数据库和服务器等技术资源的消耗,节省了资源消耗,也避免了供应商的恶心竞争行为,提高了用户的体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请一种查询结果的排序方法的一个实施例的流程图;图2为本申请一种查询结果的排序方法的另一个实施例的流程图;图3为本申请一种信息查询系统的总体结构图;图4为本申请一种查询结果的排序方法的另一个实施例的流程图;图5为本申请一种商品信息的字段展现示意图;图6为本申请一种手机信息的属性展现示意图;图7为本申请一种查询结果的排序装置的一个实施例的结构图;图8为本申请一种查询结果的排序装置的另一个实施例的结构图。具体实施例方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例进行详细描述。实施例一请参阅图1,其为本申请一种查询结果的排序方法的一个实施例的流程图,该方法包括以下步骤步骤101 根据提取出的符合用户查询条件的查询结果,采集查询结果的特征,所述查询结果的特征包括指示查询结果质量的质量因子、指示查询结果供应商的活跃度的活跃度因子、指示查询结果供应商所在行业的行业因子、查询结果供应商的信息点击转化率和信息反馈转化率中的任意一个或者任意多个组合;其中,所述采集查询结果信息质量的质量因子包括根据数据库信息统计查询结果的质量指标,所述查询结果的质量指标包括信息完整率、属性完整率和详细说明完整率中的任意一个或者任意多个组合;对统计的查询结果的质量指标进行线性拟合,得到所述质量因子。需要说明的是,本申请并不限定查询结果的质量指标为信息完整率、属性完整率和详细说明完整率中的一个或者任意多个组合。例如,信息完整率、属性完整率和详细说明完整率都从不同的方面反映了一个查询结果的质量,从而可以将其中的一个或者任意多个组合作为计算质量因子的质量指标。因此,根据查询结果的不同,反映查询结果的质量指标还可以是除上述之外的其它指标。应该明确的是,当查询结果的内容确定后,反映查询结果的质量指标也就随之确定,因此,就可以根据数据库信息统计相应的查询结果的质量指标。例如,以查询结果的质量指标为信息完整率、属性完整率和详细说明完整率为例来进行说明。当数据库信息中保存了某个查询结果的可填写字段和已填写字段时,统计可填写字段数和已填写字段数,已填写字段数与可填写字段数的比值为信息完整率。当数据库信息中保存了某个查询结果的可填写属性和已填写属性时,统计可填写属性数和已填写属性数,已填写属性数与可填写属性数的比值为属性完整率。当数据库信息中保存了有关某个查询结果的详细说明部分的已填图片和文字描述时,符合详细说明部分图文并茂或者文字描述在50个字以上条件的,被归为详细说明完整率高,符合详细说明部分中的文字描述在20-50个字之间条件的,被归为详细说明完整率中,符合详细说明部分中的文字描述在20字以下条件的,被归为详细说明完整率低。详细说明完整率高、详细说明完整率中和详细说明完整率低分别对应预先设置的某个数值。需要说明的是,本申请并不限定详细说明完整率高、详细说明完整率中和详细说明完整率低所对应的条件,可以根据用户的使用需要而任意设定。例如,当用户对某个查询结果的详细说明完整率要求较高时,可以是符合文字描述在60个字以上条件的,被归为详细说明完整率高。反之,当用户对查询结果的详细说明完整率要求较低时,可以是符合文字描述在40个字以上条件的,被归为详细说明完整率高。当统计出信息完整率、属性完整率和详细说明完整率后,对统计得到的信息完整率、属性完整率和详细说明完整率进行线性拟合,得到各条查询结果的质量因子。例如,质量因子=信息完整率*0. 3+属性完整率*0. 4+详细说明完整率*0. 3。此处需要说明的是, 本申请并不限定进行线性拟合时各个查询结果的质量指标中的权重数,可以根据不同的应用需求而调整各个查询结果的质量指标的权重数。其中,所述采集指示查询结果供应商的活跃度的活跃度因子包括根据数据库信息统计信息供应商的活跃度指标,所述查询结果供应商的活跃度指标包括查询结果供应商的在线时间和/或查询本文档来自技高网...

【技术保护点】
1.一种搜索引擎中查询结果的排序方法,其特征在于,包括:根据提取出的符合用户查询条件的查询结果,采集指示查询结果质量的质量因子、指示查询结果供应商的活跃度的活跃度因子、指示查询结果供应商所在行业的行业因子、查询结果供应商的信息点击转化率和信息反馈转化率中的任意一个或者任意多个组合;将采集到的内容作为查询结果的特征,基于支持向量机SVM回归模型进行特征拟合,得到查询结果的特征拟合值;基于查询结果的相关值进行排序,在相同的相关性级别中,以查询结果的特征拟合值从高到低的顺序进行排列。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈超韩小梅
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1