一种基于时间特征支持复杂条件的大数据检索方法技术

技术编号:12393643 阅读:91 留言:0更新日期:2015-11-26 01:11
本发明专利技术一种基于时间特征的支持复杂条件的大数据检索方法,按照数据保存时产生的时间戳或者根据用户自定义的时间特征,将数据信息按照时间特性进行切分,在全文检索引擎Solr上以不同的集群Collection建立索引,在用户已经知晓所查询信息产生的时间的情况下,可以快速的定位到当月的集群Collection的索引库中进行检索,可以大大缩小检索的范围,提升了效率;在用户无法确定信息产生的时间的情况下,将符合用户查询的结果提供给用户参考和选择;本发明专利技术不仅弥补了分布式数据库HBase没有二级索引的劣势,而且使得索引的创建更加灵活,满足不同需求情况下的检索,并且检索的效率能够得到保证。

【技术实现步骤摘要】
【专利说明】技术背景本专利技术涉及。
技术介绍
在大数据的环境下,根据用户提供的条件快速和准确的检索到用户关心和感兴趣的信息,是大数据应用的基础和重要的组成部分。目前,大数据的检索主要存在两个不足:首先,在大数据环境下,为了提供最佳的查询性能,一般都采用软硬一体的大数据一体机,这样项目的成本显著提升;其次,在数据量递增和集群扩展后,检索的性能降低的趋势明显。
技术实现思路
本专利技术的目的在于提供一种基于时间特征的支持复杂条件的大数据检索方法,可以满足用户各种不同情况下多条件组合以及复杂条件的检索需求,并且能够保证在数据和集群不断递增情况下,依然能够保持良好的性能。本专利技术一种基于时间特征的支持复杂条件的大数据检索方法,具体包括如下步骤:步骤1、数据的存储:(I)将业务数据完整地保存至分布式数据库HBase中;(2)根据该业务数据在全文检索引擎Solr中创建对应的索引:在全文检索引擎Solr中创建索引时,根据业务数据的时间特征判断所要保存的集群ColIect1n是否已经存在,如果不存在则先创建集群Collect1n,集群Collect1n的命名按照制定的时间规则,然后保存Solr索引本文档来自技高网...

【技术保护点】
一种基于时间特征的支持复杂条件的大数据检索方法,其特征在于包括如下步骤:步骤1、数据的存储:(1)将业务数据完整地保存至分布式数据库HBase中;(2)根据该业务数据在全文检索引擎Solr中创建对应的索引:在全文检索引擎Solr中创建索引时,根据业务数据的时间特征判断所要保存的集群Collection是否已经存在,如果不存在则先创建集群Collection,集群Collection的命名按照制定的时间规则,然后保存Solr索引,如果已经存在,则直接保存Solr索引;步骤2、数据的查询:(1)查询全文检索引擎Solr获取分布式数据库HBase的Rowkey值:根据用户提供的多字段或者复杂的查询条...

【技术特征摘要】

【专利技术属性】
技术研发人员:陈光淙周华游建友
申请(专利权)人:南威软件股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1