The invention discloses a method and device for locating abnormal origin of abnormal data, which relates to the field of computer technology. \u8be5\u65b9\u6cd5\u7684\u4e00\u5177\u4f53\u5b9e\u65bd\u65b9\u5f0f\u5305\u62ec\uff1a\u628a\u53f6\u8282\u70b9\u7684\u6570\u636e\u4e0e\u76f8\u5e94\u9884\u5904\u7406\u5c42\u8282\u70b9\u7684\u6570\u636e\u4f5c\u6bd4\u8f83\uff0c\u5f53\u67d0\u4e2a\u9884\u5904\u7406\u5c42\u8282\u70b9\u4e0e\u5176\u5bf9\u5e94\u7684\u53f6\u8282\u70b9\u4e0d\u4e00\u81f4\uff0c\u5219\u786e\u5b9a\u8be5\u9884\u5904\u7406\u5c42\u8282\u70b9\u4e3a\u5f02\u5e38\u8d77\u6e90\u5e76\u8fd4\u56de\uff1b\u5f53\u5f02\u5e38\u6570\u636e\u4e0d\u5927\u4e8e\u57fa\u51c6\u503c\uff0c\u5219\u68c0\u67e5\u9664\u9884\u5904\u7406\u5c42\u8282\u70b9\u4e4b\u5916\u7684\u5404\u4e2d\u95f4\u8282\u70b9\u7684\u5b8c\u6574\u60c5\u51b5\uff0c\u5f53\u67d0\u4e2a\u4e2d\u95f4\u8282\u70b9\u4e0d\u5b8c\u6574\uff0c\u5219\u786e\u5b9a\u8be5\u4e2d\u95f4\u8282\u70b9\u4e3a\u5f02\u5e38\u8d77\u6e90\u5e76\u8fd4\u56de\uff1b\u68c0\u67e5\u9664\u9884\u5904\u7406\u5c42\u8282\u70b9\u4e4b\u5916\u7684\u5404\u4e2d\u95f4\u8282\u70b9\u7684\u53e3\u5f84\u4e0e\u5f02\u5e38\u6570\u636e\u7684\u6807\u51c6\u53e3\u5f84\u662f\u5426\u4e00\u81f4\uff0c\u82e5\u67d0\u4e2a\u4e2d\u95f4\u8282\u70b9\u7684\u53e3\u5f84\u4e0e\u5f02\u5e38\u6570\u636e\u7684\u53e3\u5f84\u4e0d\u4e00\u81f4\uff0c\u5219\u786e\u5b9a\u8be5\u4e2d\u95f4\u8282\u70b9\u4e3a\u5f02\u5e38\u8d77\u6e90\u5e76\u8fd4\u56de\u3002 The implementation method can effectively avoid human error, reduce the requirements for data exception handlers and be fast and efficient.
【技术实现步骤摘要】
定位异常数据的异常起源的方法和装置
本专利技术涉及计算机
,尤其涉及一种定位异常数据的异常起源的方法和装置。
技术介绍
数据仓库是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库,它用于支持企业或组织的决策分析处理。对于数据仓库出现的数据异常的原因的判断,目前唯一的处理方法是全人工的对数据仓库进行排查,当数据仓库下游反馈数据有问题后,工程师开始从数据仓库的前端应用到底层数据源一层一层往下排查,找到一个问题点处理一个,然后再重跑,或者将所有问题点找出来统一处理,然后再重跑。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:现有的对于数据仓库的数据异常的原因的判断方法,由纯人工进行,如果遇到不规范的脚本(例如脚本全文注释寥寥)就会对判断和处理工作增加难度和成本,人力成本高、人为误差可能性高且速度较慢。并且整个过程对于排查问题的人要求较高,要求其对问题数据的来源、底层加工逻辑以及业务知识相当熟知,否则会浪费很多时间,导致工作效率大大降低,甚至找错方向、徒劳无功。因此,亟需一种快速高效,能够有效规避人为误差,降低对数据异常处理者的要求的定位异常数据的异常起源的方法和装置。
技术实现思路
有鉴于此,本专利技术实施例提供一种定位异常数据的异常起源的方法和装置,能够有效规避人为误差,降低对数据异常处理者的要求并且快速高效。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种定位异常数据的异常起源的方法,所述异常数据对应逻辑关系树,所述逻辑关系树的根节点是该异常数据,叶节点是数据源的数据表,中间节点是该异常数据产生过 ...
【技术保护点】
一种定位异常数据的异常起源的方法,其特征在于,所述异常数据对应逻辑关系树,所述逻辑关系树的根节点是该异常数据,叶节点是数据源的数据表,中间节点是该异常数据产生过程中涉及的中间数据表,所述方法包括:步骤一,把所述叶节点的数据与相应预处理层节点的数据作比较,所述预处理层节点是对应叶节点的数据源经预处理后生成的中间节点,其中,当某个预处理层节点与其对应的叶节点不一致,则确定该预处理层节点为异常起源并返回,否则执行步骤二;步骤二,判断所述异常数据是否大于对应的基准值,当所述异常数据不大于所述基准值,则检查除所述预处理层节点之外的各中间节点的完整情况,否则执行步骤三,其中,当某个中间节点不完整,则确定该中间节点为异常起源并返回,否则执行步骤三;步骤三,检查除所述预处理层节点之外的各中间节点的口径与所述异常数据的标准口径是否一致,若某个中间节点的口径与所述异常数据的口径不一致,则确定该中间节点为异常起源并返回。
【技术特征摘要】
1.一种定位异常数据的异常起源的方法,其特征在于,所述异常数据对应逻辑关系树,所述逻辑关系树的根节点是该异常数据,叶节点是数据源的数据表,中间节点是该异常数据产生过程中涉及的中间数据表,所述方法包括:步骤一,把所述叶节点的数据与相应预处理层节点的数据作比较,所述预处理层节点是对应叶节点的数据源经预处理后生成的中间节点,其中,当某个预处理层节点与其对应的叶节点不一致,则确定该预处理层节点为异常起源并返回,否则执行步骤二;步骤二,判断所述异常数据是否大于对应的基准值,当所述异常数据不大于所述基准值,则检查除所述预处理层节点之外的各中间节点的完整情况,否则执行步骤三,其中,当某个中间节点不完整,则确定该中间节点为异常起源并返回,否则执行步骤三;步骤三,检查除所述预处理层节点之外的各中间节点的口径与所述异常数据的标准口径是否一致,若某个中间节点的口径与所述异常数据的口径不一致,则确定该中间节点为异常起源并返回。2.根据权利要求1所述的方法,其特征在于,所述逻辑关系树是把所述异常数据对应的原始的业务逻辑关系树中的与定位异常起源无关的部分剪去获得的。3.根据权利要求1所述的方法,其特征在于,还包括:输出所述确定的异常起源的清单。4.根据权利要求1所述的方法,其特征在于,把所述叶节点的数据与相应预处理层节点的数据作比较包括:基于所述逻辑关系树获得所述异常数据与其产生过程中涉及的所述预处理层节点的直接映射关系树;把所述直接映射关系树中的预处理层节点的数据与其对应的所述叶节点的数据作比较。5.根据权利要求1所述的方法,其特征在于,所述检查除所述预处理层节点之外的各中间节点的口径与所述异常数据的标准口径是否一致包括:根据所述逻辑关系树获取除所述预处理层节点之外的各中间节点的口径清单;检查所述口径清单中的中间节点的口径与所述异常数据的口径是否一致。6.一种定位异常数据的异常起源的装置,其特征在于,所述异常数据对应逻辑关系树,所述逻辑...
【专利技术属性】
技术研发人员:钟媛媛,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。