【技术实现步骤摘要】
数据处理方法及其装置、设备、介质、产品
[0001]本申请属于大数据
,尤其涉及一种数据处理方法及其装置、设备、介质、产品。
技术介绍
[0002]现有企业级数据字典包含十七多万项数据项,包含外部数据和内部的基础数据、派生数据、衍生数据,数量庞大,存在数据项冗余臃肿、大量不被使用数据项被纳管的问题。
[0003]相关技术中,针对应用场景,业务人员、技术人员、管理人员查询使用数据项时,面对海量的未经分析筛选的数据项,存在查询数量大、查找速度慢的问题。
技术实现思路
[0004]本申请实施例提供一种数据处理方法及其装置、设备、介质、产品,能够解决查询数量大、查找速度慢的问题。
[0005]第一方面,本申请实施例提供一种数据处理方法,该方法包括:获取多个数据项及其对应的数据项编号;获取每个数据项编号被不同模型引用的第一次数,以及被不同物理子系统引用的第二次数;基于每个数据项编号对应的第一次数和第二次数,筛选多个数据项中的热度数据项;将热度数据项作为主数据,并为热度数据项设置对应的主数据标识进行 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取多个数据项及其对应的数据项编号;获取每个数据项编号被不同模型引用的第一次数,以及被不同物理子系统引用的第二次数;基于所述每个数据项编号对应的第一次数和所述第二次数,筛选所述多个数据项中的热度数据项;将所述热度数据项作为主数据,并为所述热度数据项设置对应的主数据标识进行展示。2.根据权利要求1所述的方法,其特征在于,在所述获取多个数据项及其对应的数据项编号之前,所述方法还包括:对于每个数据项,获取用户输入的业务含义和数据格式;基于所述数据项的业务含义和数据格式生成数据项编号。3.根据权利要求1所述的方法,其特征在于,所述获取每个数据项编号被不同模型引用的第一次数,以及被不同物理子系统引用的第二次数,包括:统计所述每个数据项编号被整合逻辑模型、贴源层模型和组件物理模型中的不同子模型引用的次数加和,得到所述第一次数;对于所述每个数据项编号,基于引用所述数据项编号的子模型所属的物理子系统,统计所述每个数据项编号被不同物理子系统引用的次数加和,得到所述第二次数。4.根据权利要求1所述的方法,其特征在于,所述基于所述每个数据项编号对应的第一次数和所述第二次数,筛选所述多个数据项中的热度数据项,包括:对于所述每个数据项编号,基于所述第一次数和所述第二次数,判断所述数据项编号是否满足热度数据条件;在所述数据项编号满足所述热度数据条件的情况下,确定所述数据项编号对应的数据项为所述热度数据项。5.根据权利要求4所述的方法,其特征在于,所述热度数据条件为所述第一次数大于第一次数阈值,且所述第二次数大于第二次数阈值。6.根据权利要求4所述的方法,其特征在于,所述基于所述第一次数和所述第二次数,判断所述数据项编号是否满足热度数据条件,包括:将所述第一次数和所述第二次数分别与对应预设权重系数相乘,计算得到所述数据项编号对应的热度值;在所述热度值大于...
【专利技术属性】
技术研发人员:于凭跃,谢泽添,罗旌森,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。