基于知识网络的搜索结果聚焦系统及聚焦方法技术方案

技术编号:8533037 阅读:156 留言:0更新日期:2013-04-04 16:10
本发明专利技术公开了一种基于知识网络的搜索结果聚焦系统及聚焦方法。该聚焦系统包括知识网络库、搜索结果模块、模式引擎和聚焦呈现模块,其中模型引擎分别连接搜索结果模块、知识网络库和聚焦呈现模块。搜索结果模块将通用搜索引擎的搜索结果输入模式引擎中,模式引擎从知识网络库的根节点开始,依据知识网络节点中的模式判别函数对搜索结果进行模式判别归类,完成搜索结果的聚焦工作;聚焦呈现模块将聚焦后的搜索结果输出显示。本发明专利技术利用知识网络对搜索结果进行聚焦,能够实现准确分类,分类数量确切,并使每一类别的命名清晰可读。

【技术实现步骤摘要】

本专利技术涉及一种搜索结果聚焦系统及聚焦方法,尤其涉及一种利用预定领域的知识网络作为聚焦依据,从而改善搜索结果聚焦效果的聚焦系统及聚焦方法,属于网络搜索

技术介绍
当前,互联网中的数据总量以几百兆兆字节来计算,而且仍然呈指数增长。为了帮助用户从这个漫无边际的数据海洋中快速获取所需的信息,搜索引擎发挥着不可替代的作用。互联网信息是极其浩繁的,任何一个关键词都可能搜索到数百个甚至数万个相关的网页或者链接。而通过通用搜索引擎得到的搜索结果往往精度低,难以迅速让用户得到所需内容。因此,有必要对搜索结果进行聚焦分类,重新整理分类排序,使得用户能够迅速锁定目标集合。在这一
,目前通用的方法是利用搜索结果聚类,根据某些用户未知的条件将搜索结果聚类到若干子集中,并提供子集标签以利于用户迅速锁定。例如申请号为200410091772. 7的中国专利申请中,公开了一种搜索结果聚类的方法,包括如下步骤预先记录被索引文档相对于其所包含的某个或者某几个关键词的一个或多个类别;根据预先记录的文档相对于包含在搜索请求中的某个或者某几个关键词的类别,对所述搜索结果中的文档分组。所述类别可以为任意的文档分类标记或者关键词。每个类别可设置一个权重值。搜索结果中的文档被放入该文档相对于查询关键词的类别集合中,并且所得到的各个聚类类别的级别可由其所包含的文档的级别来计算。该聚类方法适用于大规模文档检索系统(例如互联网搜索引擎)对搜索结果的聚类,并且通过对聚类类别评级,可以将具有较高级别的聚类以及其中较高级别的文档优先呈现给用户。美国雅虎公司在申请号为200780049318. 7的中国专利申请中,也提出了一种用于搜索数据并且将搜索结果分组成根据搜索相关性来排序的聚类的方法和装置。每个聚类包括一个或多个数据类型,诸如图像、WEB页面、本地信息、新闻、广告等。在一个实施例中,针对指示搜索的数据源的分类的相关概念来评价搜索项。还可通过诸如客户端设备的位置、当前运行的应用等上下文信息来识别数据源。每个聚类中的搜索结果通过相关性来排序,并且每个聚类都基于该聚类之内的相关性的聚集而被给予分数。每个聚类分数可基于一个或多个相应概念和/或上下文信息来修改。基于经修改的分数来排序聚类。包括广告的内容还可被增加到经排序的列表以表现为另一聚类。另外,在专利号为ZL 200810226637. 7的中国专利技术专利中,进一步提出了一种优化聚类搜索结果的方法及其装置,用以解决现有聚类搜索技术返回的搜索结果不能满足用户的个性化搜索需求的问题。具体技术方案包括根据当前聚类搜索结果中的聚类类别,从预先保存的用户历史搜索信息中查找与所述聚类类别对应的历史权值;根据所述历史权值的查找结果以及所述聚类类别对应的当前权值,确定所述聚类类别对应的结果权值;根据所述结果权值,确定所述聚类类别返回给用户时的优先级。通过该技术方案返回的聚类搜索结果能够满足用户的个性化搜索需求,提高用户的体验度。由于聚类技术所存在的局限性,导致现有的通用搜索引擎所提供的搜索结果数据量大、精度低。用户不得不进行人工二次搜索,工作效率低下。
技术实现思路
本专利技术所要解决的技术问题在于提供一种。该技术方案利用预定领域的知识网络作为聚焦依据,可以有效改善搜索结果的聚焦效果。为实现上述的专利技术目的,本专利技术采用下述的技术方案一种基于知识网络的搜索结果聚焦系统,包括知识网络库、搜索结果模块、模式引擎和聚焦呈现模块,其中所述模型引擎分别连接所述搜索结果模块、所述知识网络库和所述聚焦呈现模块;所述搜索结果模块将通用搜索引擎的搜索结果输入所述模式引擎中,所述模式引擎从所述知识网络库的根节点开始,依据知识网络节点中的模式判别函数对所述搜索结果进行模式判别归类,完成所述搜索结果的聚焦工作;所述聚焦呈现模块将聚焦后的所述搜索结果输出显示。其中较优地,所述搜索结果聚焦系统中还包括辅助概念树,所述辅助概念树与所述知识网络库连接。其中较优地,所述知识网络库由多个知识网络节点构成,每个知识网络节点具有自身专属的模式判别函数和概念标签。其中较优地,所述知识网络库中的多个知识网络节点采用树状层次结构分布方式。一种基于知识网络的搜索结果聚焦方法,基于上述的搜索结果聚焦系统实现,包括如下步骤首先通过用户输入,引发通用搜索引擎的搜索结果;当所述搜索结果加载到模式引擎后,所述模式引擎从知识网络库的根节点开始,依据知识网络节点中的模式判别函数对所述搜索结果进行模式判别归类,将所述搜索结果分别归并入相应的知识网络节点中,从而完成所述搜索结果的聚焦工作;聚焦呈现模块将聚焦后的所述搜索结果输出显示。其中较优地,在所述模式引擎的判断过程中,进一步利用辅助概念树中存储的概念词集辅助进行语义逻辑判别。其中较优地,记录所述搜索结果的原始排列顺序,将每个知识网络节点处聚焦的搜索结果按照原始排序顺序进行排列。其中较优地,所述聚焦呈现模块的输出呈树状分层递增形式,并显示每个知识网络节点的概念标签。本专利技术利用知识网络对搜索结果进行聚焦,能够实现准确分类,分类数量确切,并使每一类别的命名清晰可读,避免了现有的聚类方法生成类别个数随机,类别语义不清,让用户难以快速定位所需内容的问题。附图说明图1是本专利技术所提供的搜索结果聚焦系统的整体结构示意图;图2是知识网络库的树状层次结构示意图;图3是图2所示的知识网络库的一个实施例示意图。具体实施例方式下面结合附图和具体实施例,对本专利技术所采用的技术方案做进一步的详细说明。图1显示了本专利技术所提供的搜索结果聚焦系统的整体结构。该搜索结果聚焦系统 由辅助概念树、知识网络库、搜索结果模块、模式引擎和聚焦呈现模块组成。其中,模型引擎分别连接搜索结果模块、知识网络库和聚焦呈现模块,辅助概念树连接知识网络库。该搜索结果模块、聚焦呈现模块等可以采用计算机领域的成熟算法,以软件或者固件方式实现。辅助概念树和知识网络库等可以以非易失性存储器方式实现。在本搜索结果聚焦系统中,首先通过用户输入,引发通用搜索引擎的搜索结果。搜索结果模块从通用搜索引擎处获得搜索结果,并将该搜索结果输入模式引擎中。知识网络库由多个概念与逻辑判别融合的知识网络节点构成,每个知识网络节点具有概念标签及其概念判别模式(体现为模式判别函数)。辅助概念树是概念词集的存储集合,对知识网络库起到概念支持作用。模式引擎是模式判别的执行核心,当搜索结果记录加载后,模式引擎从知识网络库的根节点开始,依据知识网络节点中的模式判别函数g(x)对搜索结果记录进行模式判别归类,从而完成搜索结果的聚焦工作。聚焦呈现模块将聚焦后的搜索结果输出显示,输出呈树状分层递增形式,并显示每个知识网络节点的概念标签(Tag)。图2显示了知识网络库中,多个知识网络节点的树状层次结构分布方式。在知识网络库的内部结构上,本专利技术以树状层次结构递增的形式表示知识概念间的层次关系,并且每个知识网络节点是概念标签及知识的机器表达的融合,即Tag与g(x)的融合体。每个知识网络节点通过模式判别函数g(x)实现下一级的概念细分,以便能够实现快速聚焦。例如在图2中,根节点root下有i个子节点sub(l, I)、sub (I, 2)、......sub(l, i),而子节点sub (I, I)下又有j个孙节点sub (2,I)、s本文档来自技高网
...

【技术保护点】
一种基于知识网络的搜索结果聚焦系统,其特征在于:所述搜索结果聚焦系统包括知识网络库、搜索结果模块、模式引擎和聚焦呈现模块,其中所述模型引擎分别连接所述搜索结果模块、所述知识网络库和所述聚焦呈现模块;所述搜索结果模块将通用搜索引擎的搜索结果输入所述模式引擎中,所述模式引擎从所述知识网络库的根节点开始,依据知识网络节点中的模式判别函数对所述搜索结果进行模式判别归类,完成所述搜索结果的聚焦工作;所述聚焦呈现模块将聚焦后的所述搜索结果输出显示。

【技术特征摘要】
1.一种基于知识网络的搜索结果聚焦系统,其特征在于所述搜索结果聚焦系统包括知识网络库、搜索结果模块、模式引擎和聚焦呈现模块,其中所述模型引擎分别连接所述搜索结果模块、所述知识网络库和所述聚焦呈现模块;所述搜索结果模块将通用搜索引擎的搜索结果输入所述模式引擎中,所述模式引擎从所述知识网络库的根节点开始,依据知识网络节点中的模式判别函数对所述搜索结果进行模式判别归类,完成所述搜索结果的聚焦工作;所述聚焦呈现模块将聚焦后的所述搜索结果输出显示。2.如权利要求1所述的搜索结果聚焦系统,其特征在于所述搜索结果聚焦系统中还包括辅助概念树,所述辅助概念树与所述知识网络库连接。3.如权利要求1所述的搜索结果聚焦系统,其特征在于所述知识网络库由多个知识网络节点构成,每个知识网络节点具有自身专属的模式判别函数和概念标签。4.如权利要求1所述的搜索结果聚焦系统,其特征在于所述知识网络库中的多个知识网络节点采用树状层次结...

【专利技术属性】
技术研发人员:王树强宋传宝庞晓曦
申请(专利权)人:北京海量融通软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1