一种提供搜索摘要服务的方法和装置制造方法及图纸

技术编号:13423048 阅读:63 留言:0更新日期:2016-07-28 18:17
本发明专利技术公开了一种提供搜索摘要服务的方法和装置,该方法包括:获取搜索词以及所述搜索词对应的搜索结果的URL列表;从指定数据库中获取所述URL列表中的各URL对应的精简网页;其中所述指定数据库中保存有各URL对应的精简网页;根据所述搜索词从各精简网页中分别提取各URL对应的摘要。本发明专利技术提供的技术方案基于搜索词提取摘要,将摘要与搜索词进行关联,克服了现有技术中摘要独立于搜索词的问题,在用户进行搜索时,为用户提供更加直观、准确、关联性强的搜索摘要,使用户可以快速有效地找到需要的网页,满足搜索需求。

【技术实现步骤摘要】

本专利技术涉及网络搜索
,具体涉及一种提供搜索摘要服务的方法和装置
技术介绍
随着互联网技术的迅猛发展,网络已经成为人们获得信息的重要途径和手段,网络中的海量信息既给人们带来了方便,也带来了许多问题,为了找到有用信息,人们经常要花费大量的时间去搜索、浏览和查找,因此近年来搜索引擎所提供的各种搜索服务越来越引起人们的关注,其中,搜索摘要服务将各网页的摘要显示在搜索结果的窗口中,使得用户无需打开网页就能一目了然该网页是否符合搜索需求。现有技术中,搜索引擎所提供的搜索摘要服务大多是基于静态方式生成搜索摘要,即搜索摘要独立于查询,按照某种规则,事先在预处理阶段从网页内容中提取出一些文字。例如,截取网页正文的开头160个字节(对应80个汉字),或者,将每一个段落的第一个句子拼起来等。这样形成的摘要存放在查询子系统中,一旦相关网页的文档被选中与查询项匹配,就将预存的摘要展示给用户。显然,这种方式对搜索引擎来说是最轻松的,无需做其他的处理工作。但这种方式最大的缺本文档来自技高网...

【技术保护点】
一种提供搜索摘要服务的方法,其中,该方法包括:获取搜索词以及所述搜索词对应的搜索结果的URL列表;从指定数据库中获取所述URL列表中的各URL对应的精简网页;其中所述指定数据库中保存有各URL对应的精简网页;根据所述搜索词从各精简网页中分别提取各URL对应的摘要。

【技术特征摘要】
1.一种提供搜索摘要服务的方法,其中,该方法包括:
获取搜索词以及所述搜索词对应的搜索结果的URL列表;
从指定数据库中获取所述URL列表中的各URL对应的精简网页;其中
所述指定数据库中保存有各URL对应的精简网页;
根据所述搜索词从各精简网页中分别提取各URL对应的摘要。
2.如权利要求1所述的方法,其中,所述根据所述搜索词从各精简网页
中分别提取各URL对应的摘要包括:
定制用于执行网页摘要提取操作的SO文件;
将搜索词和精简网页发送给所述用于执行网页摘要提取操作的SO文件
来提取摘要。
3.如权利要求1-2任一项所述的方法,其中,该方法进一步包括:定制
所述用于执行网页摘要提取操作的SO文件的调用接口。
所述将搜索词和精简网页发送给所述用于执行网页摘要提取操作的SO
文件来提取摘要包括:通过调用所述调用接口来将搜索词和精简网页发送给
所述用于执行网页摘要提取操作的SO文件,并通过该接口接收提出的摘要。
4.如权利要求1-3任一项所述的方法,其中,
所述定制用于执行网页摘要提取操作的SO文件包括:针对不同的站点
定制不同的用于执行网站摘要提取操作的SO文件;
所述将搜索词和精简网页发送给所述用于执行网页摘要提取操作的SO
文件包括:将搜索词和精简网页发送给精简网页所属站点对应的用于执行网
页摘要提取操作的SO文件。
5.如权利要求1-4任一项所述的方法,其中,根据所述搜索词从各精简
网页中分别提取各URL对应的摘要包括:
采用多模匹配算法根据所述搜索词从各精简网页中分别提取各URL对
应的摘要内容。
6.如权利要求1-5任一项所述的方法,其中,在根据所述搜索词从各精
简网页中分别提取各URL对应的摘要之前,该方法进一步包括:对精简网页
进行预处理,具体包括编码处理和/或标签分析处理;其中,
编码处理包括:...

【专利技术属性】
技术研发人员:雷鹏文维东
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1