【技术实现步骤摘要】
【技术保护点】
一种基于HBase的构建和检索增量索引的方法,其特征在于,包括下述步骤:(1)利用HBase来设计增量索引的存储结构利用HBase的数据列动态可扩展的特点,将词元作为关键字主键,将文本主键作索引存储表的列字段名称,利用HBase的分布式存储的特点,实现对大规模文本和索引信息的存储,索引系统同时为多个不同的数据源分别提供索引服务;为了有效的存储索引信息,共设计三个表:a、表Ttext存储索引数据的原始信息,字段包括文本主键,文本内容与来源等信息;b、表Tindex存储数据的索引信息,字段包括关键字主键,含有关键字的数据内容所对应的全部文本主键索引列,且表Tindex中的文本主 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:郑庆华,董博,贺欢,宋凯磊,徐海鹏,马天,陈亚兴,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。