基于搜索引擎和数据库查询系统的搜索结果排名方法技术方案

技术编号:9276473 阅读:163 留言:0更新日期:2013-10-24 23:30
本申请提供一种基于搜索引擎和数据库查询系统的搜索结果排名方法,应用于给服务搜索匹配的企业的场景和领域;离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的高质量企业会在搜索结果里排在前面,以尽可能符合用户的需求。同时动态的统计分析所匹配的企业的业务数据量,依据企业的服务能力动态的调整企业的匹配优先级,以避免企业服务能力不足问题的出现。

【技术实现步骤摘要】
基于搜索引擎和数据库查询系统的搜索结果排名方法
本申请涉及搜索结果排名方法,尤其涉及一种基于搜索引擎和数据库查询系统的搜索结果排名方法。
技术介绍
搜索引擎提供强大的工具来定位在大型文档数据库中的文档中的内容。响应与搜索查询使用文档的索引来定位文档,搜索查询由用户提交的一个或者多个词、词语、关键词和/或短语组成。可以将在文档的索引中的文档与搜索查询的一个或者多个词语匹配以确定分值。基于分值,将相关文档或者文档位置的排名的列表提供给用户。中文搜索引擎的核心是分词技术。分词技术是利用一定的规则和词库,切分出一个句子中的词,为自动索引做好准备。目前的索引多采用Non-clustered方法,该技术和语言文字的学问有很大的关系,具体有如下几点:(1)存储语法库,和词汇库配合分出句子中的词汇;(2)存储词汇库,要同时存储词汇的使用频率和常见搭配方式;(3)词汇库,应可划分为不同的专业库,以便于处理专业文献;(4)对无法分词的句子,把每个字当作词来处理。网络关键词搜索系统的搜索结果提供,一般都采用按匹配加权的方式加以排序显示,即在返回全部搜索结果的同时,按照与搜索需求的符合程度排序显示,以便将最符合用户需求的资源在前面显示,在保持检全率的同时提高检准率。这种排序方式在通常的搜索业务中有不错的表现效果,但在某些特定的搜索领域会体现出局限性。首先,它无法体现搜索结果跟用户位置的相关性;其次,针对特定的搜索领域文档的特定属性会体现出较高的权重,必须特殊处理;不同文档本身的重要性在特定的搜索领域也需要单独定义。此外,同样条件的搜索每次检索出来的结果都是一样的,这会导致用户对搜索结果前几条的集中访问,在特定的搜索领域,既造成了前几条展示搜索对象的业务堵塞,也造成了后面搜索结果对象没有业务量。
技术实现思路
本申请提供一种基于搜索引擎和数据库查询系统的搜索结果排名方法和系统,此搜索引擎及排名方法和系统应用于给服务搜索匹配的企业的场景和领域;可以同时根据用户提交的搜索条件,按照企业到服务地点的距离给予综合评分,这样,离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的高质量企业会在搜索结果里排在前面,以尽可能符合用户的需求。同时动态的统计分析所匹配的企业的业务数据量,依据企业的服务能力动态的调整企业的匹配优先级,以避免企业服务能力不足问题的出现。为实现上述目的,本申请实施例提供了一种搜索结果排名方法,是这样实现的:在数据索引模块,对企业数据的ID,名称,地址,服务分类,经纬度等各字段分别进行索引存储,其中名称,地址,服务分类等文本字段进行分词后索引,企业ID,经纬度等字段按照数字格式进行索引(不分词);同时,根据企业的硬件资质,服务质量,服务能力,信誉度等给予企业不同的索引权重。在搜索模块,定义一个搜索接口,以接收用户对服务地点附近的某一服务分类企业的搜索;在匹配算法里,首先满足用户搜索的必要条件。匹配结果的排序通过综合评分实现,分值高的排序展示在前面。即综合评分=搜索匹配度+企业评分+主营业务符合度+距离匹配度-业务量指数+其他排序指数。搜索匹配度为企业信息与用户提交的文本搜索关键字的匹配度,由通常的搜索引擎匹配算法实现。企业评分为企业在系统中的综合评分,包含对企业各方面包括硬件资质,服务质量,服务能力,信誉度等指标的综合评价。主营业务符合度是指企业的主营业务包含用户提交的服务分类查询条件则为1,否则为0。对于特定的服务分类,在服务半径内的企业,根据距离服务地点的远近计算的分值为距离匹配度,对于服务半径外的企业,此分值为0,在服务半径内的企业,其分值为1-距离服务地点的距离/服务半径。业务量指数为企业近期接受服务量与服务能力的比值,服务能力趋近于0则表示该企业已经业务量饱和,很难再提供服务。这样,离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的高质量,具有高服务能力的企业会在搜索结果里排在前面。为实现上述目的,本申请实施例提供了一种搜索结果排名系统。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作介绍,下面描述中的附图仅仅是本申请中记载的一些实施例。图1为本申请搜索结果排名方法的第一实施例框图。具体实施方式本申请实施例提供一种搜索结果排名方法。在数据索引模块,索引线程实时监测数据库中企业数据的变化,对更新的企业数据进行实时索引、更新。对企业数据的ID,名称,地址,服务分类,经纬度等各字段分别进行索引存储,其中名称,地址,服务分类等文本字段进行分词后索引,企业ID,经纬度等字段按照数字格式进行索引(不分词);同时,根据企业的硬件资质,服务质量,服务能力,信誉度等给予企业不同的索引权重。比如,默认所有企业的权重都是1,对于每个企业都有自己的硬件资质,服务质量,服务能力,信誉度等的单项分值,对于各项分值总和在前10%的企业,定义为推荐的高质量企业,在索引的时候,给予较高的索引权重,比如2。在搜索模块,定义一个搜索接口,可以接收用户对某一中心点附近的某一服务分类企业的搜索。在匹配算法里,首先满足用户搜索的必要条件,如搜索的城市,服务分类,。匹配结果的排序通过综合评分实现,分值高的排序展示在前面。即综合评分=搜索匹配度+企业评分+主营业务符合度+距离匹配度+业务量指数+其他排序指数。搜索匹配度为企业信息与用户提交的文本搜索关键字的匹配度,由通常的搜索引擎匹配算法实现,根据用户输入的搜索关键字在企业信息中出现的字段,位置,频率等确定。企业评分为企业在系统中的综合评分,包含对企业各方面包括硬件资质,服务质量,服务能力,信誉度等指标的综合评价。主营业务符合度是指企业的主营业务包含用户提交的服务分类查询条件则为1,否则为0。对于特定的服务分类,在服务半径内的企业,根据距离服务地点的远近计算的分值为距离匹配度,对于服务半径外的企业,此分值为0,在服务半径内的企业,其分值为1-距离服务地点的距离/服务半径。业务量指数为企业近期接受服务量与服务能力的比值,服务能力趋近于0则表示该企业已经业务量饱和,很难再提供服务,此指数会根据企业的接单情况及回访情况动态更新。其他排序指数是指根据具体业务相关的其他排序指数,比如满足条件的服务人员的数量也可作为排序的参考指数。这样,离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的高质量,具有高服务能力的企业会在搜索结果里排在前面。给用户匹配服务企业后,更新企业的匹配记录和服务记录,从而动态影响企业的业务量指数,进而影响后续的搜索排序。在对整个服务过程进行跟踪回访后,更新企业的服务记录和评价记录,从而动态影响企业的业务量指数,企业信誉度,服务能力等,索引进程将监控这些变化并即时更新索引,进而影响后续的搜索排序。整个过程形成一个完整的闭环。本文档来自技高网
...
基于搜索引擎和数据库查询系统的搜索结果排名方法

【技术保护点】
一种基于搜索引擎和数据库查询系统的搜索结果排名方法,其特征在于,包括以下步骤:a)索引模块对数据库表中变化的数据进行实时索引:b)在搜索模块,定义一个搜索接口,以接收用户对特定服务地点附近的某一服务分类企业的搜索;c)给予主营业务为该服务分类的企业以较高优先级,给予非主营业务为该服务分类的企业较低优先级,同时按照企业到服务地点的距离给予一个综合评分,这样,离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的优质企业会在搜索结果里排在前面;d)匹配完成后动态修改企业的业务量指数进而影响后续的匹配结果。

【技术特征摘要】
1.一种基于搜索引擎和数据库查询系统的搜索结果排名方法,其特征在于,包括以下步骤:a)索引模块对数据库表中变化的数据进行实时索引,根据企业的硬件资质,服务质量,服务能力,信誉度等给予企业不同的索引权重,对企业数据的ID,名称,地址,服务分类,经纬度等各字段分别进行索引存储,其中名称,地址,服务分类等文本字段进行分词后索引,企业ID,经纬度等字段按照数字格式进行索引;同时,默认所有企业的权重都是1,对于每个企业都有自己的硬件资质,服务质量,服务能力,信誉度等的单项分值,对于各项分值总和在前10%的企业,定义为推荐的高质量企业,在索引的时候,给予较高的索引权重;b)在搜索模块,定义一个搜索接口,以接收用户对特定服务地点附近的某一服务分类企业的搜索;c)给予主营业务为该服务分类的企业以较高优先级,给予非主营业务为该服务分类的企业较低优先级,同时按照企业到服务地点的距离给予一个综合评分,对于服务半径外的企业,此分值为0,在服务半径内的企业,其分值为1-距离服务...

【专利技术属性】
技术研发人员:文飞
申请(专利权)人:北京易盟天地信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1