通过离线查询提高在线实时搜索质量的方法与系统技术方案

技术编号:7320437 阅读:260 留言:0更新日期:2012-05-05 08:46
本发明专利技术公开了一种通过离线查询提高在线实时搜索质量的方法与系统,系统接受用户查询请求;通过数据缓存平台,搜索有效时间窗口W1内满足要求的结果集;如果未找到满足要求的结果,将请求送至在线数据实时查询平台,获取在线实时结果集;实时结果集按照时间和关键值排序后返回给用户;如果没有满意结果,从离线数据提供者集合中按分类选取一组或者全部,将用户查询请求以及部分在线结果送出查询;从数据提供者接收结果并存入数据缓存平台;在用户可接受的时间窗口W2内,将数据提供者返回的结果和在线实时结果集合并。本发明专利技术的优点是:本发明专利技术对于用户在线提交和时间相关的查询,在一定的时间窗口内能够快速高效地帮助用户找到满意的解答。

【技术实现步骤摘要】

本专利技术涉及网络通信领域,主要是一种通过离线查询提高在线实时搜索质量的方法与系统
技术介绍
随着信息技术的发展和互联网的不断普及,网络搜索引擎不仅成为人们在互联网上获取知识的重要平台,也成为解决人们生活中各类问题的有效渠道。人们可以通过搜索引擎查询所需的资料和信息,也可以通过搜索引擎寻求生活中遇到的各方面问题的答案。 在现有的搜索技术和方法中,搜索引擎能过检索的信息源依赖于互联网在线资源,如果用户查询的结果掌握在一部分离线提供者手中,用户需要通过各种方式获取这些离线数据提供者的联系方式,并通过线下的方式向这些提供者进行询问,按个询问结果。但是在现有的技术和方法中,用户提出查询后,如果在线搜索返回的在线结果不能满足用户的要求,而真正能够满足用户要求的解答掌握在部分线下人员或者机构手中, 这种情形下,用户首先需要手动通过各种方式取得这些线下人员或者机构的联系方式,进行筛选后分别联系这些线下数据提供者并发出询问,然后等待线下数据提供者回应。对于这种情况,用户往往需要耗费巨大的精力获得有效的数据提供者名单和联系方式,精准度很低;而且分别通过线下联系方法进行联系的效率非常低。这样容易导致用户未能定位到真正掌握满足自己需求的离线数据提供者,同时又浪费巨大的时间和精力,最终仍未能获得自己满意的结果。
技术实现思路
本专利技术的目的正是要克服上述技术的不足,而提供一种通过离线查询提高在线实时搜索质量的方法与系统,当用户通过网络平台触发一个查询请求时,如果在缓存数据平台(记录一定时间窗口内的在线和离线查询的结果)和在线实时搜索系统中都未能找到满意的结果,该系统可以快速高效地帮助用户定位到一组掌握问题相关领域知识或资源并且愿意接受查询的离线数据提供者,向这些用户推送查询请求并收集答案,然后展现给提问者,由提问的用户提名一个最满意的查询结果。本专利技术解决其技术问题采用的技术方案这种通过离线查询提高在线实时搜索质量的方法,包括以下步骤步骤Si,系统接受用户查询请求;步骤S2,通过数据缓存平台,搜索一定时间窗口 Wl内满足要求的结果集,如果有, 排序后返回给用户;步骤S3,如果未找到满足要求的结果,将请求送至在线数据实时查询平台,获取实时结果集;步骤S4,实时结果集按照时间和关键值排序后返回给用户,用户如果从中找到满4意结果,则完成;步骤S5,如果没有满意结果,从离线数据提供者集合中按分类选取一组或者全部, 将用户查询请求以及部分在线结果送出查询;步骤S6,从数据提供者接收结果;步骤S7,在用户可接受的时间窗口 W2内,将数据提供者返回的结果和在线实时结果集合并,排序作为结果集,离线送给用户。前述的通过离线查询提高在线实时搜索质量的方法中,步骤S2中所述的通过数据缓存平台,获取一定时间周期内满足要求的结果集包括提取初始查询的领域类别信息、 初始查询中的关键词列表、初始查询中的条件信息,初始查询的类型信息;统计数据缓存中相似查询的领域类别信息、相似查询的关键词列表,相似查询中的条件信息,相似查询的类型信息;其中所述的缓存数据平台指的是在一定时间周期内被用户挑选为满意结果的查询和结果组合,比如数分钟或数小时乃至数天内曾被用户选作满意结果,超出时间窗口的查询和结果组合会从数据缓存平台中清除。前述的通过离线查询提高在线实时搜索质量的方法中,步骤S2还包括若结果集存在,则根据统计结果成绩由高到低排列结果,根据排序结果成绩由高到低分页返回给用户。前述的通过离线查询提高在线实时搜索质量的方法中,步骤S3所述的将查询请求送至在线数据实时查询平台包括根据查询请求的领域类别、查询请求的关键词列表、查询请求的条件、查询请求的类型,从在线实时查询平台中选择合适的在线数据源,进行在线实时搜索,并获取实时搜索结果集。前述的通过离线查询提高在线实时搜索质量的方法中,步骤S4中所述的对在线实时搜索结果集按照时间和值排序包括根据在线实时搜索结果集中结果的返回时间和结果值进行排序。排序后的结果集返回给用户,若用户从中选择了满意结果,则搜索完成。前述的通过离线查询提高在线实时搜索质量的方法中,步骤S5中所述的从离线数据提供者集合中按分类选取一组或者全部的选择依据包括初始查询的领域类别、初始查询的关键词列表、离线数据提供者的领域类别、离线数据提供者的关键词标记列表、离线数据提供者的在线信息、离线数据提供者的历史数据提供成绩。其中所述的离线数据提供者的历史数据提供成绩包括离线数据提供者总共回答过的问题数量和质量(在搜索结果中的排名统计),离线数据提供者在一定周期内回答过的问题数量,如一周或一个月。前述的通过离线查询提高在线实时搜索质量的方法中,步骤S6中所述的在用户可接受的时间窗口内,从数据提供者接收结果包括由用户设定时间作为从离线数据提供者接收查询结果的时间窗口 ;若用户未设定时间,则取系统默认值。前述的通过离线查询提高在线实时搜索质量的方法中,步骤S7中所述的将数据提供者返回的结果和在线实时结果集合并,排序作为结果集,离线送给用户包括在允许的时间窗口内接收到的离线查询结果和在线实时查询结果集合并,并进行排序。排序依据包括各结果返回的时间、各结果值;对于离线查询结果,排序依据还包括离线结果提供者的历史活跃度、离线结果提供者的历史数据提供成绩。排序后的结果,通过离线的方式送回给用户。用户选中的来自离线的满意结果将会保存至缓存数据平台,包括查询请求内容,查询请求的领域类型信息,查询请求关键词列表,查询请求的类型信息,查询请求的提交时间,用户账号,满意结果的内容,满意结果的回答时间,满意结果的有效期限。本专利技术所述的这种通过离线查询提高在线实时搜索质量的系统,它包括触发模块,用于用户触发查询请求;搜索模块一,用于从数据缓存平台获取满足要求的结果集并排序;显示模块一,用于显示排好序的缓存结果集;搜索模块二,用于搜索在线数据实时查询平台,获取实时结果集并排序;显示模块二,用于显示排好序的实时结果集;选择模块,用于选择一组或全部离线数据提供者作为查询的离线数据源;传送模块,用于将查询请求传送至离线数据提供者,收集离线结果,将离线结果和在线实时结果合并后排序;显示模块三,用于离线显示合并后的结果集;存储模块,用于将离线结果集保存至数据缓存平台。前述的通过离线查询来提高实时搜索质量的系统中,所述的搜索模块一还包括统计模块一,用于提取初始查询的领域类别信息、初始查询中的关键词列表、初始查询中的条件信息,初始查询的类型信息;统计数据缓存中相似查询的领域类别信息、相似查询的关键词列表,相似查询中的条件信息,相似查询的类型信息。其中所述的缓存数据平台指的是在一定时间周期内被用户挑选为满意结果的查询和结果组合,比如数小时或者数天内曾被用户选作满意结果,超出时间周期的查询和结果组合会从数据缓存平台中清除。前述的通过离线查询来提高实时搜索质量的系统中,所述的搜索模块一还包括排序模块一,用于根据统计成绩由高到低排列从缓存数据平台找到的结果集,其中所述的结果集是根据查询请求和缓存数据平台上保存的查询请求相似度选出的候选结果集,从而保证候选结果集的命中率。前述的通过离线查询来提高实时搜索质量的系统中,所述的搜索模块二还包括统计模块二,用于提取和统计查询请求的领域类别、查询请求的关键词列表、查询请求本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:史何富曹学军刘庆生曹智清
申请(专利权)人:浙江乐得网络科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术