一种多指标排序数据处理方法及设备技术

技术编号:8626080 阅读:192 留言:0更新日期:2013-04-25 23:11
本申请实施例提出一种多指标排序数据处理方法及设备,将包含一个主体信息和多个指标的第一记录信息,按照指标进行拆分,得到多条包含一个主体信息和一个指标的第二记录信息,对第二记录信息进行排序。由于本申请的方案中,针对第二记录信息进行排序,因此,只需调用一次用于排序的函数就可以对各条第二记录信息按照其中包含的指标进行排序,克服多次调用用于排序的函数所带来的资源占用量大、排序时间长、效率低的问题。

【技术实现步骤摘要】

本申请涉及数据处理
,尤其涉及一种多指标排序数据处理方法及设备
技术介绍
随着信息技术的发展,会产生大量的包含指标以及相应指标值的记录信息,针对不同主体的相同指标,可按照对应的指标值对各主体进行排序。例如对于销售的商品,如果要按照商品销售相关的指标,如销售金额、商品的销售数量对商品进行排序,则进行排序的商品之间具有某种共有的信息,可称之为维度信息,如商品的类目、商品销售的时间等,记录信息中可记录该商品的维度信息、指标、指标值以及表示该商品本身的主体信息(如商品标识),表示具有相同维度信息的商品,可根据其中的指标进行排序。再例如对于学生的考试成绩,记录信息中记录的维度信息可以是需要进行排序的各学生共有的信息,指标可以是用于排序的各项科目,指标值是学生各科目的成绩,如表I所示,为杭州市育才中学I年级4位学生在2011年期末考试各科成绩的4条记录信息,其中“杭州市”、“育才中学”、“I年级”、“2011年期末考试”是这4条记录信息中的维度信息,用于表示进行排序的学生所共有的信息;“兵甲、101”、“兵乙、202”、“张三、303”、“李四、505”是这4条记录信息中的主体信息;“语文”、“数学”、“英语”是这4条记录信息中的指标,4条记录信息分别记录各自的主体信息在各指标下的指标值,即考试成绩。

【技术保护点】
一种多指标排序数据处理方法,其特征在于,所述方法包括:确定多条具有相同维度信息的第一记录信息,其中,每条第一记录信息中包含了主体信息、该主体信息对应的至少两个指标、各指标对应的指标值;分别将每条第一记录信息按照其中包含的指标拆分为多条第二记录信息,其中,一条第二记录信息中包含一个指标、与该指标对应的一个主体信息,以及该主体信息在该指标下的指标值;将具有相同指标的第二记录信息按照包含的指标值进行排序。

【技术特征摘要】
1.一种多指标排序数据处理方法,其特征在于,所述方法包括 确定多条具有相同维度信息的第一记录信息,其中,每条第一记录信息中包含了主体信息、该主体信息对应的至少两个指标、各指标对应的指标值; 分别将每条第一记录信息按照其中包含的指标拆分为多条第二记录信息,其中,一条第二记录信息中包含一个指标、与该指标对应的一个主体信息,以及该主体信息在该指标下的指标值; 将具有相同指标的第二记录信息按照包含的指标值进行排序。2.如权利要求1所述的方法,其特征在于,将具有相同指标的第二记录信息按照包含的指标值进行排序之后,所述方法还包括 分别将具有相同主体信息的第二记录信息合并为一条第一记录信息,并显示合并后的第一记录信息中的主体信息对应的各指标的排序结果。3.如权利要求1所述的方法,其特征在于,所述确定多条具有相同维度信息的第一记录信息具体包括 将所述多条第一记录信息划分为至少一个信息集合,所述信息集合中包含的第一记录信息具有相同的维度信息; 将任一所述的信息集合中的第一记录信息作为确定的多条具有相同维度信息的第一记录信息。4.如权利要求1 3任一所述的方法,其特征在于,将第一记录信息拆分为多条第二记录信息之后,且将具有相同指标的第二记录信息按照包含的指标值进行排序之前,所述方法还包括 将拆分得到的第二记录信息划分为多个子集合,所述子集合中包含的第二记录信息具有相同的指标; 将具有相同指标的第二记录信息按照包含的指标值进行排序,具体包括 针对每个子集合中的多条第二记录信息,按照包含的指标值进行排序。5.如权利要求4所述的方法,其特征在于,所述多指标排序数据处理方法通过Hadoop中的映射-归约Map-Reduce编程模型或Hive来实现。6.如权利要求5所述的方法,其特征在于,将拆分得到的第二记录信息划分为多个子集合,具体包括 利用Map-Reduce中的KeyComparat...

【专利技术属性】
技术研发人员:黄明
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1