一种用于生成搜索结果的摘要的方法与设备技术

技术编号:6137220 阅读:271 留言:0更新日期:2012-04-11 18:40
本发明专利技术的目的是提供一种用于生成搜索结果的摘要的方法与设备。其中,摘要生成设备获取与查询序列相对应的搜索结果以及所述搜索结果所对应的文档的摘要提取参数;根据所述查询序列,从所述文档中提取与所述查询序列相对应的摘要片段;根据所述摘要片段,结合所述摘要提取参数,生成与所述查询序列相对应的摘要。与现有技术相比,本发明专利技术通过获取查询序列的需求类型,使得生成的摘要能够满足用户的查询需求,同时提升用户的搜索体验;本发明专利技术还通过获取查询序列与搜索结果的匹配信息,使得生成的摘要能够包含更多的信息,提高用户的搜索效率,也使得生成的摘要具有更好的可读性。

【技术实现步骤摘要】

本专利技术涉及网络搜索
,尤其涉及一种用于生成搜索结果的摘要的技术。
技术介绍
在网络信息极大丰富的今天,为了快速而准确的找到所需的信息,搜索引擎应运而生。虽然搜索引擎提供了较准确的搜索结果排序,但是由于搜索引擎是基于全文索引技术提供服务的,只要文档中包含查询关键词就会作为搜索结果返回,经常会有一些靠前的搜索结果并不是用户所需要的。因此,用户会通过阅读摘要来判断搜索结果的价值,此时, 摘要中是否包括用户需要的信息就成了至关重要的问题。现有的摘要生成方法主要有两种,一种是静态摘要生成方法,以文档的主题为中心,即“全文摘要”,这种方法生成的摘要虽然很好的表达了文档的中心意思,但是文档中与用户查询相关的信息未必是文档主题,该信息却可能对用户很有价值,故静态摘要生成方法很难满足用户的查询需求;另一种是动态摘要生成方法,根据用户的查询关键词,从文档中提取与查询关键词最相关的部分,但是很多时候查询关键词并不直接体现用户的查询需求,故动态摘要生成方法同样很难满足用户的查询需求,并且当查询关键词分散在文档中的多个段落时,提取出来的摘要更是很难包括用户需要的信息。因此,如何提供一种生成搜索结果的摘要的方法,使得摘要能够较好的满足用户的查询需求,以及包含较多的相关信息,成为目前急需解决的问题之一。
技术实现思路
本专利技术的目的是提供一种用于生成搜索结果的摘要的方法与设备。根据本专利技术的一个方面,提供了一种计算机实现的用于生成搜索结果的摘要的方法,其中,该方法包括以下步骤a获取与用户经由用户设备输入的查询序列相对应的搜索结果;b获取所述搜索结果所对应的文档的摘要提取参数;其中,该方法还包括χ根据所述查询序列,从所述文档中提取与所述查询序列相对应的摘要片段;y根据所述摘要片段,结合所述摘要提取参数,生成所述摘要。根据本专利技术的另一个方面,还提供了一种用于生成搜索结果的摘要的设备,其中, 该设备包括结果获取装置,用于获取与用户经由用户设备输入的查询序列相对应的搜索结果;参数获取装置,用于获取所述搜索结果所对应的文档的摘要提取参数;其中,该设备还包括片段提取装置,用于根据所述查询序列,从所述文档中提取与所述查询序列相对应的摘要片段;摘要生成装置,用于根据所述摘要片段,结合所述摘要提取参数,生成所述摘要。与现有技术相比,本专利技术根据摘要提取参数,诸如查询序列的需求类型、查询序列与搜索结果的匹配信息等,生成搜索结果的摘要。本专利技术通过获取查询序列的需求类型,使得生成的摘要能够满足用户的查询需求,例如,当查询序列的需求类型为问答型时,本专利技术可以从文档的答案资源块中提取问题的全部答案作为摘要,使得用户不用点击搜索结果的链接即可获得问题的答案,同时提升用户的搜索体验。本专利技术还通过获取查询序列与搜索结果的匹配信息,使得生成的摘要能够包含更多的信息,提高用户的搜索效率,例如,当查询序列与搜索结果的匹配信息为完全匹配时,即查询序列中的查询关键词连续或者非连续出现在文档的同一段落内,本专利技术可以将该文档段落作为相应的摘要。更进一步地,本专利技术还可以根据摘要提取参数确定摘要的长度,也使得生成的摘要具有更好的可读性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显图1示出根据本专利技术一个方面的用于生成搜索结果的摘要的设备的示意图;图2示出根据本专利技术一个优选实施例的用于生成搜索结果的摘要的设备的示意图;图3示出根据本专利技术另一个方面的用于生成搜索结果的摘要的方法流程图;图4示出根据本专利技术一个优选实施例的用于生成搜索结果的摘要的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施例方式下面结合附图对本专利技术作进一步详细描述。图1为根据本专利技术一个方面的设备示意图,示出一种用于生成搜索结果的摘要的设备。其中,摘要生成设备1包括结果获取装置11、参数获取装置12、片段提取装置13和摘要生成装置14。具体地,结果获取装置11获取与用户经由用户设备输入的查询序列相对应的搜索结果;接着,参数获取装置12获取所述搜索结果所对应的文档的摘要提取参数 ’片段提取装置13根据所述查询序列,从所述文档中提取与所述查询序列相对应的摘要片段; 随后,摘要生成装置14根据所述摘要片段,结合所述摘要提取参数,生成所述摘要。在此, 摘要生成设备1包括但不限于搜索引擎、或者与搜索引擎相连的网络设备,其中,该网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合。本领域技术人员应能理解上述摘要生成设备仅为举例,其他现有的或今后可能出现的摘要生成设备如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。更具体地,结果获取装置11获取与用户经由用户设备输入的查询序列相对应的搜索结果。具体地,结果获取装置11通过诸如在摘要生成设备1或者第三方设备的搜索信息库中进行查询、或者接收第三方设备发送的与用户经由用户设备输入的查询序列相对应的搜索结果,从而获取与用户经由用户设备输入的查询序列相对应的搜索结果。例如,用户通过鼠标、键盘或者手写板等输入设备向用户设备输入查询序列,用户设备将该查询序列发送至搜索引擎,该搜索引擎将基于该查询序列的搜索结果发送至摘要生成设备1,摘要生成设备1的结果获取装置11获取该搜索结果。本领域技术人员应能理解上述获取搜索结果的方式仅为举例,其他现有的或今后可能出现的获取搜索结果的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。接着,参数获取装置12获取所述搜索结果所对应的文档的摘要提取参数。具体地,参数获取装置12获取结果获取装置11获取的搜索结果所对应的文档的摘要提取参数, 诸如用户输入查询序列的需求类型、搜索结果与查询序列的匹配信息等。例如,结果获取装置11获取与用户输入查询序列相对应的搜索结果,参数获取装置12根据该搜索结果,获取该搜索结果与该查询序列的匹配信息,如完全匹配或部分匹配,以作为该文档的摘要提取参数。在此,完全匹配指切分查询序列获得的查询关键词连续或者非连续出现在该文档的同一段落内;部分匹配指查询关键词分散出现在不同的文档段落,即该文档中不存在一个同时包含这(些)查询关键词的段落。又如,参数获取装置12对用户经由用户设备输入的查询序列进行切分,并对切分后的查询词进行语义分析,以获得该查询序列的需求类型,以作为该文档的摘要提取参数。本领域技术人员应能理解上述获取摘要提取参数的方式仅为举例,其他现有的或今后可能出现的获取摘要提取参数的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。片段提取装置13根据所述查询序列,从所述文档中提取与所述查询序列相对应的摘要片段。具体地,片段提取装置13根据用户输入的查询序列,从结果获取装置11获取的搜索结果所对应的文档中提取与该查询序列相对应的摘要片段。例如,结果获取装置11 获取与用户输入查询序列相对应的搜索结果,片段提取装置13根据该查询序列,从该搜索结果所对应的文档中提取与该查询序列、或者该查询序列所包括的查询关键词相匹配的摘要片段。本领域技术人员应能理解上述提取摘要片段的方式仅为举例,其他现有的或今后可能出现的提取摘要片段的方式如可适用于本专利技术,也应包含本文档来自技高网...

【技术保护点】
1.一种计算机实现的用于生成搜索结果的摘要的方法,其中,该方法包括以下步骤:a获取与用户经由用户设备输入的查询序列相对应的搜索结果;b获取所述搜索结果所对应的文档的摘要提取参数;其中,该方法还包括:x根据所述查询序列,从所述文档中提取与所述查询序列相对应的摘要片段;y根据所述摘要片段,结合所述摘要提取参数,生成与所述查询序列相对应的摘要。

【技术特征摘要】

【专利技术属性】
技术研发人员:郑枫耀兰芳乔勇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1