【技术实现步骤摘要】
【国外来华专利技术】使用域索引的约束储存库的异常和漂移检测
[0001]本申请一般涉及信息技术,并且更具体地涉及异常和漂移检测。
技术介绍
[0002]异常检测涉及识别数据中的不规则性,并且通常依赖于应用于数值或经编码数据的基于统计或机器学习的方法。通常,这些方法不能应用于原始数据。
[0003]异常检测用于多种应用,例如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络中的事件检测以及检测生态系统干扰。
技术实现思路
[0004]在本专利技术的一个实施例中,提供了使用约束储存库来进行针对多变量原始数据的域感知可解释异常和漂移检测的技术。一种示例性计算机实现的方法包括以下步骤:获得(i)数据集以及(ii)指示数据集的域的信息;至少部分地基于域索引(domain
‑
indexed)的约束储存库来检测数据集中的一个或多个异常,该域索引的约束储存库包括具有多个节点的知识图,其中,每一个节点包括(i)与多个域中的至少一个域相关联的属性以及(ii)对应于属性的一个或多个约束;生成与一个或多个异常中的每一个异常相对应的解释;以及输出(i)一个或多个异常的指示和(ii)相对应的自然语言解释。
[0005]另一种示例性计算机实现的方法包括以下步骤:获得包括训练数据的数据文件集,其中,该集中的每一个数据文件对应于多个域中的一个域;对于该集中的每一个给定数据文件:(i)根据该给定数据文件的训练数据的至少一部分推断至少一个约束,以及(ii)将所推断的至少一个约束存储在域索引的约束储存库中的节点处,其中,该 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,所述方法包括:获得数据集和指示所述数据集的域的信息;至少部分地基于所述数据集和所述信息从域索引的约束储存库获得一个或多个约束,其中,所述域索引的约束储存库包括具有多个节点的知识图,其中,每个节点包括与多个域中的至少一个域相关联的属性以及与所述属性相对应的一个或多个约束;至少部分地基于所述数据集的一个或多个部分是否违反所获得的一个或多个约束来检测所述数据集中的一个或多个异常;生成与所述一个或多个异常中的每一个异常相对应的解释,所述解释描述与所违反的一个或多个约束相对应的属性;以及输出所述一个或多个异常的指示和相对应的解释。2.根据权利要求1所述的计算机实现的方法,其中,所述知识图的一个或多个子树中的每一个子树对应于所述多个域中的给定一个域,并且其中,所述子树中的给定一个子树的每个级相对于所述给定子树中的先前级增加所述给定域的抽象级。3.根据权利要求1所述的计算机实现的方法,其中,所述检测包括:基于指示所述数据集的域的所述信息将所述数据集映射到所述多个节点中的一个或多个节点;以及将所映射的节点的约束应用于所述数据集以检测所述一个或多个异常。4.根据权利要求1所述的计算机实现的方法,其中,所述一个或多个约束包括以下各项中的至少一个:单属性约束;以及多属性约束。5.根据权利要求4所述的计算机实现的方法,其中,所述单属性约束对应于以下各项中的一个:文本属性、数值属性以及分类属性,并且其中,所述多属性约束对应于以下各项中的两个或更多个:文本属性、数值属性以及分类属性。6.根据权利要求5所述的计算机实现的方法,其中,每个约束包括基于所述单属性约束的类型和所述多属性约束的类型中的一个或多个的模型,并且其中,所述检测包括将所述模型应用于所述数据集的至少一部分。7.根据权利要求1所述的计算机实现的方法,其中,所述数据集包括至少一个机器学习模型的实时数据,并且其中,所述方法包括:使用机器学习聚类技术来检测所述实时数据的一个或多个段中的漂移;以及输出所述实时数据的与所述漂移相对应的段。8.根据权利要求7所述的计算机实现的方法,其中,所述生成包括生成和输出所述实时数据的与所述漂移相对应的所述段中的每个段的解释。9.根据权利要求1所述的计算机实现的方法,其中,对应于所述一个或多个异常中的每一个异常的所述解释包括描述所述部分如何违反所检索的一个或多个约束的自然语言解释。10.根据权利要求1所述的计算机实现的方法,其中,所述检测包括:基于所述数据集与基础数据集的比较来确定指示所述数据集的质量的值。11.根据权利要求10所述的计算机实现的方法,包括:
响应于指示所述数据集的质量的值满足阈值而验证所述数据集。12.根据权利要求1所述的计算机实现的方法,其中,所述数据集包括既未被编码也未被变换的原始数据。13.一种计算机程序产品,包括计算机可读存储介质,所述计算机可读存储介质包括程序指令,所述程序指令可由计算设备执行以使所述计算设备:获得数据集和指示所述数据集的域的信息;至少部分地基于所述数据集和所述信息从域索引的约束储存库获得一个或多个约束,其中,所述域索引的约束储存库包括具有多个节点的知识图,其中,每个节点包括与多...
【专利技术属性】
技术研发人员:S汉斯,SZH夏克,R阿南塔纳拉亚南,D萨哈,A阿加瓦尔,G辛格,PK洛希亚,MA比德,S梅塔,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。