筛选信息的方法、装置和计算机设备制造方法及图纸

技术编号:25835115 阅读:26 留言:0更新日期:2020-10-02 14:16
本申请揭示了筛选信息的方法,包括:从源数据中筛选满足大小要求的第一数据,按照预设排序依次存入预设链表中形成第一链表;从多个第一链表中选择数据属性相同的两个第一链表并进行头部数据大小比较,将较大的头部数据存入第二链表,并将较大的头部数据从原第一链表中删除,使排序在较大的头部数据后面的数据成为新的头部数据,再进行头部数据比较,直到将两个数据属性相同的第一链表中满足要求的数据全部提取到第二链表,并根据两个第一链表的数据比较和提取过程,将所有数据属性相同的数据全部提取至第二链表;从第二链表中获取指定任务对应的TOP值;锁定并展示指定任务对应的TOP值,以及指定任务对应的TOP值对应的关联信息,简化比较,提高效率。

【技术实现步骤摘要】
筛选信息的方法、装置和计算机设备
本申请涉及到计算机领域,特别是涉及到筛选信息的方法、装置和计算机设备。
技术介绍
Hadoop做数据仓库时,常用hive做离线数据处理,hive做离线数据处理时,需要用到分组排序获取第一条数据的情况。传统的方式是使用“row_number”加上“distributeby”指定对应的分组字段,然后“sortby”指定需要排序的字段并定义为字段“rn”,最后将计算的数据作为子查询,然后再增加筛选条件“rn=1”,就能挑选出分组排序的第一条记录,但是这样需要将一个分组中的所有数据先汇总再全部排序,消耗的资源也很大。而且数据架构中只保存筛选出的一个结果数据,不利于数据应用的拓展。
技术实现思路
本申请的主要目的为提供筛选信息的方法,旨在解决现有数据分组排序中耗费的资源大的技术问题。本申请提出一种筛选信息的方法,包括:从源数据中筛选满足大小要求的第一数据,按照预设排序依次存入预设链表中形成第一链表,其中,所述第一数据为所述源数据中的任一数据;从多个所述第一链表中选择数据属性相同本文档来自技高网...

【技术保护点】
1.一种筛选信息的方法,其特征在于,包括:/n从源数据中筛选满足大小要求的第一数据,按照预设排序依次存入预设链表中形成第一链表,其中,所述第一数据为所述源数据中的任一数据;/n从多个所述第一链表中选择数据属性相同的两个所述第一链表并进行头部数据大小比较,将较大的头部数据存入第二链表,并将所述较大的头部数据从原第一链表中删除,使排序在所述较大的头部数据后面的数据成为新的头部数据,再进行头部数据比较,直到将两个数据属性相同的所述第一链表中满足要求的数据全部提取到第二链表,并根据两个所述第一链表的数据比较和提取过程,将所有数据属性相同的数据全部提取至第二链表;/n从所述第二链表中获取指定任务对应的T...

【技术特征摘要】
1.一种筛选信息的方法,其特征在于,包括:
从源数据中筛选满足大小要求的第一数据,按照预设排序依次存入预设链表中形成第一链表,其中,所述第一数据为所述源数据中的任一数据;
从多个所述第一链表中选择数据属性相同的两个所述第一链表并进行头部数据大小比较,将较大的头部数据存入第二链表,并将所述较大的头部数据从原第一链表中删除,使排序在所述较大的头部数据后面的数据成为新的头部数据,再进行头部数据比较,直到将两个数据属性相同的所述第一链表中满足要求的数据全部提取到第二链表,并根据两个所述第一链表的数据比较和提取过程,将所有数据属性相同的数据全部提取至第二链表;
从所述第二链表中获取指定任务对应的TOP值,其中,所述指定任务属于任务列表中的任一任务,所述指定任务对应的TOP值关联对应的关联信息;
锁定并展示所述指定任务对应的TOP值,以及所述指定任务对应的TOP值对应的关联信息。


2.根据权利要求1所述的筛选信息的方法,其特征在于,所述第一链表包括链表结构和按照预设排序填充在链表中的元组数,所述预设排序为降序排列,所述从源数据中筛选满足大小要求的第一数据,按照预设排序依次存入预设链表中形成第一链表的步骤,包括:
获取位于所述第一链表开始表格的第一元组数;
判断所述第一数据是否大于或等于所述第一元组数;
若是,则在所述开始表格的降序排序之前添加第一新表格,使所述第一新表格成为开始表格;
将所述第一数据填充至所述第一新表格,使所述第一数据成为新的第一元组数,并按照所述第一新表格的添加过程以及所述第一新表格中的数据填充过程,完成所述第一链表中所有数据的录入。


3.根据权利要求2所述的筛选信息的方法,其特征在于,判断所述第一数据是否大于或等于所述第一元组数的步骤之后,包括:
若否,则获取与所述开始表格相邻且位于所述开始表格排序之后的第二元组数;
判断所述第一数据是否大于或等于所述第二元组数;
若是,则在所述第二元组数之前添加第二新表格;
将所述第一数据填充至所述第二新表格,并按照所述第一新表格、第二新表格的添加过程,以及所述第一新表格、第二新表格中的数据填充过程,完成所述第一链表中所有数据的录入。


4.根据权利要求3所述的筛选信息的方法,其特征在于,判断所述第一数据是否大于或等于所述第二元组数的步骤之后,包括:
若否,依次获取降序排列中排布于所述第二元组数之后的第三元素组,直至降序排序的末尾数;
判断所述第一数据是否大于或等于所述末尾数;
若否,则在降序排序中的所述末尾数之后,添加第三新表格;
将所述第三元组数填充至所述第三新表格,并根据所述第一新表格、第二新表格和第三新表格的添加过程,以及所述第一新表格、第二新表格和第三新表格中数据填充过程,完成所述第一链表中所有数据的录入。


5.根据权利要求2-4中任一项所述的筛选信息的方法,其特征在于,所述完成所述第一链表中所有数据的录入的步骤之后,包括:
判断添加完所有数据的第一链表的链表长度是否大于第一预设量;
若是,则将排布于所述第一链表的指定数量的末尾表格剔除,同时删除填充在所述指定数量的末尾表格的元组数,使所述第一链表的链表长度保持在小于或等于所述第一预设量。


6.根据权利要求1所述的筛选信息的方法,其特征在于,从源数据中筛选满足大小要求的第一数据,按照预设排序依次存入预设链表中形成第一链表的步骤之前...

【专利技术属性】
技术研发人员:叶波
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1