【技术实现步骤摘要】
一种文档页面跳转方法及系统
本专利技术涉及文档检索
,特别涉及一种文档页面跳转方法及系统。
技术介绍
根据用户提供的关键词,检索关键词,可在海量文档中查找到与关键词相关的文档。目前,现有技术通过检索关键词获取与关键词相关的文档,通常相关度高的文档排序靠前,但跳转至文档详情,一般都是从文档首页开始按原始文档的页码顺序排列文档页面。但就现有技术而言,无法判断文档中哪些页面内容与关键词相关度高,然而用户往往更加关注与关键词相关的页面内容,如果文档页数较多,用户难以快速精准定位与关键词相关度高的页面。
技术实现思路
为解决现有技术中无法快速定位与关键词相关度高的页面的技术问题,本专利技术提供了一种文档页面跳转方法,基于搜索服务器建立全文索引和页面索引,可以对文档页面按与关键词相关度从高到低排序,有效解决了用户选择命中关键词的文档之后不能快速定位与关键词相关度高的页面的问题,实现了文档页面的快速跳转。本专利技术提供了一种文档页面跳转方法,应用于搜索服务器,包括如下步骤:索引创建 ...
【技术保护点】
1.一种文档页面跳转方法,其特征在于,应用于搜索服务器,包括如下步骤:/n索引创建步骤,基于所述搜索服务器对原始文档创建全文索引和页面索引;/n文档检索步骤,根据目标关键词和所述全文索引,获取目标文档集;/n页面检索步骤,基于所述目标文档集,获取目标文档,根据预设过滤条件和所述页面索引,获取所述目标文档的全部页面;/n页面跳转步骤,根据所述目标关键词、所述页面检索步骤中获取的全部页面及其内容,获取按照相关度排列的目标页面集及与各个目标页面相对应的页面记录,基于所述页面记录,跳转至相对应的所述目标页面。/n
【技术特征摘要】
1.一种文档页面跳转方法,其特征在于,应用于搜索服务器,包括如下步骤:
索引创建步骤,基于所述搜索服务器对原始文档创建全文索引和页面索引;
文档检索步骤,根据目标关键词和所述全文索引,获取目标文档集;
页面检索步骤,基于所述目标文档集,获取目标文档,根据预设过滤条件和所述页面索引,获取所述目标文档的全部页面;
页面跳转步骤,根据所述目标关键词、所述页面检索步骤中获取的全部页面及其内容,获取按照相关度排列的目标页面集及与各个目标页面相对应的页面记录,基于所述页面记录,跳转至相对应的所述目标页面。
2.根据权利要求1所述的文档页面跳转方法,其特征在于,还包括:
文档类型转化步骤,获取所述原始文档及其类型,将所述原始文档类型转化为pdf类型,并将pdf类型所述原始文档存储至存储系统中,且获取pdf类型所述原始文档的id。
3.根据权利要求2所述的文档页面跳转方法,其特征在于,所述页面跳转步骤中的页面记录具体包括:
页面在文档内页码及目标关键词。
4.根据权利要求3所述的文档页面跳转方法,其特征在于,所述页面跳转步骤中跳转至相对应的所述目标页面具体包括:
根据所述目标文档,获取与所述目标文档相对应的pdf类型所述目标文档的id;
基于pdf类型所述目标文档的id和所述存储系统,获取pdf类型所述目标文档;
根据所述目标页面在所述目标文档内页码和pdf类型所述目标文档,跳转至相对应的pdf类型所述目标文档的目标页面。
5.根据权利要求1所述文档页面跳转方法,其特征在于,所述页面检索步骤中所述预设过滤条件具体包括:
以docid等于所述目标文档id为预设过滤条件。
6.根据权利...
【专利技术属性】
技术研发人员:杜芳,
申请(专利权)人:北京明略软件系统有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。