一种信息搜索、及信息搜索排序装置和方法制造方法及图纸

技术编号:7605442 阅读:265 留言:0更新日期:2012-07-22 09:49
本发明专利技术公开了一种信息搜索排序装置和方法,用以提高用户获取目标搜索结果的效率,从而降低搜索引擎中相关设备的开销,提高系统性能。所述信息搜索排序装置包括:确定单元,用于根据用户提交的搜索内容,确定每一篇搜索文档针对搜索内容的相关性参数值;预测单元,用于根据组织架构内各用户的搜索日志信息、组织架构信息,预测每一篇搜索文档针对搜索内容的用户及组织架构推荐点击权重;排序单元,用于根据每一篇搜索文档的相关性参数值、以及用户及组织架构推荐点击权重,确定每一篇搜索文档的排序参数值;返回按照搜索文档的排序参数值进行排序的搜索结果。本发明专利技术还公开了一种信息搜索装置和方法,用以提高搜索结果的准确性。

【技术实现步骤摘要】

本专利技术涉及搜索
,尤其涉及。
技术介绍
随着商用搜索引擎使用的普及,如何把用户个性化特点良好地融入到搜索引擎中是当前搜索
的研究热点。现有技术中,基于Web的搜索引擎采用传统向量空间模型的相似性匹配方法,查找与用户输入的关键词相匹配的文档,然后根据用户搜索的历史记录,重新评价文档的权重,并向用户返回搜索结果。一方面,基于Web的搜索引擎采用向量空间模型,向量空间模型是基于相似性的排序方法,不能准确反映搜索内容与搜索文档的相关性,直接将相似等同于相关,显然这个前提并不一定成立,因此得到的搜索结果不准确,无法满足用户的需要。如果用户对搜索结果不满意便会将搜索内容变化组合后再次发起搜索,这样,占用了搜索引擎的系统资源,增加了搜索引擎中相关设备的开销,影响了系统的性能。如何提高信息搜索结果的准确性,以减少用户发起搜索的次数,从而达到降低搜索引擎中相关设备的开销,提升系统性能的目的,成为现有技术中亟待解决的技术问题。另一方面,基于Web的搜索引擎无法针对特定的领域提供搜索服务,对于一些特定的行业,如通信行业,信息系统沉淀积累的数据信息繁多,组织架构信息相对保密,数据信息集中在组织架构局域网内,普通基于Web的搜索引擎无法搜索到,不能满足组织架构内部搜索的需要,不利于组织架构组织间知识转移和学习。另外,组织架构内不同部门、不同权限组的用户获取数据信息的需求也不相同,而基于Web的搜索引擎无法针对组织架构内部用户搜索的个性化需求,对搜索结果进行准确排序,使得用户需点击每一篇搜索结果文档确定是否满足自身需要,同样占用了搜索引擎的系统资源,增加了搜索引擎中相关设备的开销,影响了系统的性能。如何提高用户获取目标搜索结果的效率,以降低搜索引擎中相关设备的开销,提升系统性能,成为现有技术中亟需解决的技术问题。
技术实现思路
本专利技术实施例提供了一种信息搜索排序装置和方法,用以提高用户获取目标搜索结果的效率,从而降低搜索引擎中相关设备的开销,提升系统性能。本专利技术实施例提供了一种信息搜索装置和方法,用以提高搜索结果的准确性,从而降低搜索引擎中相关设备的开销,提升系统性能。本专利技术实施例提供一种信息搜索排序装置,包括确定单元,用于根据用户提交的搜索内容,确定每一篇搜索文档与搜索内容的邻近度参数值、以及每一篇搜索文档的搜索内容权重;根据每一篇搜索文档的搜索内容权重、 以及每一篇搜索文档与搜索内容的邻近度参数值,确定每一篇搜索文档针对搜索内容的相关性参数值; 预测单元,用于根据组织架构内各用户的搜索日志信息、以及组织架构信息,预测每一篇搜索文档针对搜索内容的用户及组织架构推荐点击权重;排序单元,用于根据每一篇搜索文档的相关性参数值、以及用户及组织架构推荐点击权重,确定每一篇搜索文档的排序参数值;向用户返回按照搜索文档的排序参数值进行排序的搜索结果。本专利技术实施例提供一种信息搜索装置,包括分词单元,用于对用户提交的搜索内容进行分词处理得到若干搜索关键词;第一确定单元,用于根据各搜索关键词确定每一篇搜索文档的搜索内容权重,以及根据各搜索关键词在每一篇搜索文档的各结构区域中的位置,确定每一篇搜索文档与搜索内容的邻近度参数值;第二确定单元,用于根据每一篇搜索文档的搜索内容权重、以及每一篇搜索文档与搜索内容的邻近度参数值,确定每一篇搜索文档针对搜索内容的相关性参数值;返回单元,用于基于每一篇搜索文档针对搜索内容的相关性参数值,向用户返回搜索结果。本专利技术实施例提供一种信息搜索排序方法,包括根据用户提交的搜索内容,确定每一篇搜索文档与搜索内容的邻近度参数值、以及每一篇搜索文档的搜索内容权重;根据每一篇搜索文档的搜索内容权重、以及每一篇搜索文档与搜索内容的邻近度参数值,确定每一篇搜索文档针对搜索内容的相关性参数值;根据组织架构内各用户的搜索日志信息、以及组织架构信息,预测每一篇搜索文档针对搜索内容的用户及组织架构推荐点击权重;根据每一篇搜索文档的相关性参数值、以及用户及组织架构推荐点击权重,确定每一篇搜索文档的排序参数值;向用户返回按照搜索文档的排序参数值进行排序的搜索结果。本专利技术实施例提供一种信息搜索方法,包括对用户提交的搜索内容进行分词处理得到若干搜索关键词;根据各搜索关键词确定每一篇搜索文档的搜索内容权重,以及根据各搜索关键词在每一篇搜索文档的各结构区域中的位置,确定每一篇搜索文档与搜索内容的临近度参数值;根据每一篇搜索文档的搜索内容权重、以及每一篇搜索文档与搜索内容的邻近度参数值,确定每一篇搜索文档针对搜索内容的相关性参数值;并基于每一篇搜索文档针对搜索内容的相关性参数值,向用户返回搜索结果。本专利技术实施例提供的信息搜索排序装置和方法,基于用户提交的搜索内容,确定每一篇搜索文档与搜索内容的邻近度参数值和每一篇搜索文档的搜索内容权重,并据此确定每一篇搜索文档针对搜索内容的相关性参数值;在此基础上,结合用户所在的组织架构内各用户的搜索日志信息、组织架构信息,预测每一篇搜索文档针对搜索内容的用户及组织架构推荐点击权重,确定每一篇搜索文档的排序参数值,并基于该排序参数值对各搜索文档进行排序。由于确定了每一篇搜索文档针对搜索内容的相关性参数值,并预测用户及组织架构推荐点击权重,使得排序参数值更加准确,也更能体现用户的需求,从而提高了用户获取目标搜索结果的效率,降低了搜索引擎中各相关设备的开销,提升了系统性能。本专利技术实施例提供的信息搜索装置和方法,基于用户提交的搜索内容,确定每一篇搜索文档与搜索内容的邻近度参数值和每一篇搜索文档的搜索内容权重,并据此确定每一篇搜索文档针对搜索内容的相关性参数值,基于该相关性参数值向用户返回搜索结果, 这样,得到的搜索结果同时考虑了每一篇搜索文档与搜索内容的邻近度参数值和每一篇搜索文档的搜索内容权重,提高了搜索结果的准确性,从而减少了用户发起搜索的次数,达到了降低搜索引擎中相关设备的开销,提升系统性能的目的。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明图1为本专利技术实施例中,信息搜索排序装置的一种可能的结构示意图;图2为本专利技术实施例中,信息搜索装置的一种可能的结构示意图;图3为本专利技术实施例中,信息搜索排序方法实施流程示意图;图4为本专利技术实施例中,信息搜索方法实施流程示意图;图5为本专利技术实施例中,信息搜索排序装置应用于某一信息系统中的详细架构图;图6为本专利技术实施例中,信息搜索排序方法在某一信息系统中的实施流程示意图。具体实施例方式本专利技术实施例提供了一种信息搜索排序装置和方法,用以提高用户获取目标搜索结果的效率,从而降低搜索引擎中相关设备的开销,提升系统性能。本专利技术实施例提供了一种信息搜索装置和方法,用以提高搜索结果的准确性,从而降低搜索引擎中相关设备的开销,提升系统性能。以下结合说明书附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术,并且在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。如图1所示,为本专利技术实施例提供的信息搜索排序装置的一种可能的结构示意图,包括确定单元1本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:谭本军伍显峰蔡俊李少年阮鹏
申请(专利权)人:中国移动通信集团湖南有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术