【技术实现步骤摘要】
一种关联数据检索方法和系统
[0001]本专利技术属于计算机
,具体涉及关联数据的检索优化方法。
技术介绍
[0002]互联网的发展和使用,产生了海量的数据。为了高效地存储海量数据,分布式数据库和NoSql应运而生。传统的数据库为了提高检索效率,会对数的部分属性构建索引。由于分布式数据库中存有海量数据,并且大多数是NoSql类型的数据,因此当数据增长到一定规模时,使用传统的索引查询数据也十分缓慢,难以达到预期效果。对于一些特定应用,在数据库中查询关联元组信息,这种情况将将更加耗时和低效。
[0003]因此,需要能够改进现有技术中的缺陷的方法和系统。
技术实现思路
[0004]提供本
技术实现思路
来以简化形式介绍将在以下具体实施方式部分中进一步描述的一些概念。本
技术实现思路
并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
[0005]针对现有技术中的针对海量非关系型数据的检索效率问题,本专利技术公开了一种高效的关联数据检索方法。该方法首先会从一 ...
【技术保护点】
【技术特征摘要】
1.一种构建用于关联数据检索的索引的方法,包括:遍历一个或多个数据库中的数据并确定所述数据的特征属性;基于所述特征属性来对所述数据进行分组以形成关联数据分组;为每一个关联数据分组中的关联数据的特征属性构建一组二级索引;以及为各组二级索引中的每一组二级索引构建相应的一级索引。2.如权利要求1所述的方法,其中所述数据库是分布式非关系型数据库,并且遍历所述数据库中的数据包括经由数据库接口来获取所述数据库中的数据。3.如权利要求1所述的方法,其中对所述数据进行分组包括采用关联规则算法来对所述数据进行分类以将相关联的数据归类到一个关联数据分组中。4.如权利要求1所述的方法,其中与每一个关联数据分组相对应的二级索引组存储该关联数据分组中的索引信息并包括针对来自所述一个或多个数据库的不同来源数据的二级索引,并且所述一级索引存储所述二级索引组的索引信息。5.一种用于关联数据检索的方法,包括:接收要检索的关键词;遍历一个或多个数据库中的数据并确定所述数据的特征属性;基于所述特征属性来对所述数据进行分组以形成关联数据分组;为每一个关联数据分组中的关联数据的特征属性构建一组二级索引;为各组二级索引中的每一组二级索引构建相应的一级索引;以及基于所述一级索引和各组二级索引来返回与所述关键词相关的关联数据。6.如权利要求5所述的方法,进一步包括对所述关键词进行分词以确定关键分词,并且基于所述一级索引和各组二级索引来返回与所述关键词相关的关联数据进一步...
【专利技术属性】
技术研发人员:鹿迅,杨立扬,成国强,宫敏,
申请(专利权)人:天翼数字生活科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。