一种范文检索请求的处理方法和装置制造方法及图纸

技术编号:9829310 阅读:71 留言:0更新日期:2014-04-01 18:21
本发明专利技术提供了一种范文检索请求的处理方法,包括:获取用户的检索请求;根据请求内容的关键词,判断所述检索请求是否是范文检索请求;如果是,根据请求内容的关键词,在范文网页数据库进行检索;提取检索到的与所述关键词匹配的范文网页数据项的关键项信息;将所述关键项信息以应用框结构嵌入检索结果页中。根据本发明专利技术提供的方法,使得真正与用户所要求的范文字数相同、相近的范文网页出现在搜索结果页中,并且在搜索结果排序时排在搜索结果页的前面,提高了范文搜索的质量。本发明专利技术提供了一种相应的处理装置。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种范文检索请求的处理方法,包括:获取用户的检索请求;根据请求内容的关键词,判断所述检索请求是否是范文检索请求;如果是,根据请求内容的关键词,在范文网页数据库进行检索;提取检索到的与所述关键词匹配的范文网页数据项的关键项信息;将所述关键项信息以应用框结构嵌入检索结果页中。根据本专利技术提供的方法,使得真正与用户所要求的范文字数相同、相近的范文网页出现在搜索结果页中,并且在搜索结果排序时排在搜索结果页的前面,提高了范文搜索的质量。本专利技术提供了一种相应的处理装置。【专利说明】一种范文检索请求的处理方法和装置
本专利技术涉及互联网搜索领域,特别是涉及一种范文检索请求的处理方法和装置。
技术介绍
范文搜索是网页搜索中一种很重要的需求,被搜索的范文类型众多,包括但不限于各类公文、文秘书信、工作计划、总结报告、心得体会、演讲致辞、作文作业、各种论文等等。在例如学生非放假期间、年底工作总结期间的高峰期,每天可以占到总网页搜索量的1%左右。实际中,大多数范文需求对于字数都有固定要求,因而很多用户都会在进行范文搜索时输入字数,如“读后感400字”、“奖学金申请书800字”等。即使在搜索时没有明确将字数输入,也会存在有对于该范文字数的潜在要求;例如,论文类的范文一般不低于8000字;入党申请书类的范文一般要求有3000?5000字,等等。对于范文搜索,目前存在的问题主要有两个:一是当前检索机制只能通过标题、网页内容匹配来命中字数的需求,对于没有相关字数的网页排序不公平;由于找不到相应的字数的字段,也使得召回率不足;二是在目前检索结果的标题摘要下,用户只能通过相应字段飘红来判定是否是自己想要的信息,对于很多有欺骗性质的页面、字数是否满足要求等都是没有预期的。图1示出了当前范文搜索的搜索结果页示意图,用户输入的范文搜索请求是“以家为题的作文350字”;在搜索结果页中,除了第一条结果的标题摘要直接命中350字外,其它结果都不知道有多少字数,只能将“350字”这个关键词丢弃来进行排序,对于一些潜在与350字非常接近的结果来说就显得非常不公平;用户也不知道什么结果是好结果,只能逐个点击查看,效率比较低下。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的范文检索请求的处理方法和相应的装置。依据本专利技术的一个方面,提供了一种范文检索请求的处理方法,包括:获取用户的检索请求;根据请求内容的关键词,判断所述检索请求是否是范文检索请求;如果是,根据请求内容的关键词,在范文网页数据库进行检索;提取检索到的与所述关键词匹配的范文网页数据项的关键项信息; 将所述关键项信息以应用框结构嵌入检索结果页中。可选地,所述范文网页数据库包括多个范文网页数据项,一范文网页数据项包括一范文网页的范文类型、范文数据和URL,且所述范文数据包括范文标题,范文正文和范文字数;所述请求内容包括主题关键词和字数关键词;其中,检索步骤包括,在范文类型和/或范文标题和/或范文正文中匹配主题关键词,并将字数关键词与范文字数进行匹配;且所述提取的关键项信息至少包括范文标题和范文字数。可选地,一范文网页数据项包括多个范文数据;其中,检索步骤包括,在该范文网页数据项的多个范文数据中分别进行关键词匹配;且提取步骤包括,对于检索到的与所述关键词匹配的多个范文数据,提取匹配的多个范文数据中的范文标题和范文字数。可选地,所述范文网页数据库包括多个范文网页数据项,一范文网页数据项包括一范文网页的范文类型、范文数据和URL ;且所述范文数据包括范文标题,和范文文档或范文文档的下载链接;所述请求内容包括主题关键词和字数关键词;其中,检索步骤包括,在范文类型和/或范文标题中匹配主题关键词;且所述提取的关键项信息至少包括范文标题。可选地,检索步骤还包括,根据请求内容的关键词,在基础网页库进行检索;其中所述基础网页库包括由网络爬虫下载存储到服务器侧的网页;并且所述方法还包括,在检索结果页中合并在范文网页数据库检索到的范文网页和在基础网页库检索到的范文网页,且iu者在检索结果页的排序闻于后者。可选地,对于检索结果页中在范文网页数据库检索到的范文网页,根据其范文字数与字数关键词的匹配度由高到低进行排序。依据本专利技术的另一方面,还提供一种范文检索请求的处理装置,包括:请求获取单元,适于获取用户的检索请求;请求判断单元,适于根据请求内容的关键词,判断所述检索请求是否是范文检索请求;检索单元,适于根据请求内容的关键词,在范文网页数据库进行检索;关键项提取单元,适于提取检索到的与所述关键词匹配的范文网页数据项的关键项信息;信息嵌入单元,适于将所述关键项信息以应用框结构嵌入检索结果页中。可选地,所述范文网页数据库包括多个范文网页数据项,一范文网页数据项包括一范文网页的范文类型、范文数据和URL,且所述范文数据包括范文标题,范文正文和范文字数;所述请求内容包括主题关键词和字数关键词;其中,检索单元适于,在范文类型和/或范文标题和/或范文正文中匹配主题关键词,并将字数关键词与范文字数进行匹配;且所述提取的关键项信息至少包括范文标题和范文字数。可选地,一范文网页数据项包括多个范文数据;其中检索单元适于,在该范文网页数据项的多个范文数据中分别进行关键词匹配;且关键项提取单元适于,对于检索到的与所述关键词匹配的多个范文数据,提取匹配的多个范文数据中的范文标题和范文字数。可选地,所述范文网页数据库包括多个范文网页数据项,一范文网页数据项包括一范文网页的范文类型、范文数据和URL ;且所述范文数据包括范文标题,和范文文档或范文文档的下载链接;所述请求内容包括主题关键词和字数关键词;其中,检索单元适于,在范文类型和/或范文标题中匹配主题关键词;且所述提取的关键项信息至少包括范文标题。可选地,检索单元还适于,根据请求内容的关键词,在基础网页库进行检索;其中所述基础网页库包括由网络爬虫下载存储到服务器侧的网页;并且所述装置还包括合并排序单元,其适于在检索结果页中合并在范文网页数据库检索到的范文网页和在基础网页库检索到的范文网页,且前者在检索结果页的排序高于后者。可选地,所述合并排序单元还适于对于检索结果页中在范文网页数据库检索到的范文网页,根据其范文字数与字数关键词的匹配度由高到低进行排序。根据本专利技术的范文检索请求的处理方法和装置,用户发出范文搜索请求时,在网页爬虫抓取的基础网页库进行常规搜索的同时,还在范文网页数据库中进行搜索。由于范文网页数据库中包含了各种范文网页的范文标题、正文以及字数,使得真正与用户所要求的范文字数相同、相近的范文网页出现在搜索结果页中,并且能在搜索结果排序时能排在前面,提高了范文搜索的质量;进一步还能在搜索结果页中将范文标题和范文字数显示给用户,以使得用户在不点击查看检索结果内容的情况下就能知道检索到的范文网页的字数,能更快速地决定哪些结果需要查看,提高了整体效率和用户体验。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的【具体实施方式】。【专利附图】【附图说明】通过阅读下文优选实施方式的详细描述,各种其本文档来自技高网
...

【技术保护点】
一种范文检索请求的处理方法,包括:获取用户的检索请求;根据请求内容的关键词,判断所述检索请求是否是范文检索请求;如果是,根据请求内容的关键词,在范文网页数据库进行检索;提取检索到的与所述关键词匹配的范文网页数据项的关键项信息;将所述关键项信息以应用框结构嵌入检索结果页中。

【技术特征摘要】

【专利技术属性】
技术研发人员:侯小虎
申请(专利权)人:北京奇虎科技有限公司 奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1