【技术实现步骤摘要】
【技术保护点】
一种基于Hadoop的索引创建方法,其特征在于,包括以下步骤:将输入分片按行读取,分别形成第一键值对,并将读取的所述字符串按行生成第一输入表格;获取所述第一输入表格的格式信息,根据所述第一键值对,将所述第一输入表格的各行字符串进行重组,生成第二输入表格;提取所述第二输入表格的索引属性值;计算所述各第二键值对的分片号,根据所述各第二键值对的分片号,对所述各第二键值对进行分组;将每组内所述各第二键值对对应的表格记录按照其索引属性值进行排序,并根据生成的所述各中间键值对,提取所述每组表格记录的索引取值范围,创建基于文件的索引。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。