【技术实现步骤摘要】
该领域总体上涉及数据分析,并更为具体地涉及管理数据分析结果。
技术介绍
数据分析通常是指合并各种学科的科学,上述学科包括但并不局限于数据工程、数学、统计学、计算学以及特定于领域的专门知识。因此,数据科学家或数据工程师是实践数据分析的一些或全部方面以尝试解决涉及一个或多个输入数据集的复杂数据问题的人员。数据科学家或数据工程师采用通常对输入数据集进行探究和/或对输入数据集进行汇总(当涉及到多个数据集时)的一种或多种分析算法,并且随后生成表示该一种或多种分析算法的分析输出或结果的一个或多个输出数据集。这样的分析结果通常被放置在分析沙箱或数据湖中以用于进一步的行为。分析沙箱是被用来利用数据进行调控和/或进一步实验的单独计算环境,而数据湖则是用于结构化和非结构化数据的集中式数据存储系统。然而,无论分析结果被放在分析沙箱、数据湖还是一些其它存储位置中,这样的数据放置通常都并未受到高度管控。
技术实现思路
本专利技术的实施例提供了用于管理数据分析结果的技术。例如,在一个实施例中,一种方法包括以下步骤。获得分别与由一个或多个分析应用所处理的一个或多个输入数据集相关联的元数据。每个数据集的元数据指示与该数据集相关联的信任度和真实性中的至少一者。该一个或多个分析应用基于该一个或多个输入数据集生成分析结果。基于所获得的元数据的至少一部分而至少针对该分析结果确定管控放置。可以使用管控选择器数据(例如,最大值、平均值、中间值、模式、覆盖模式)来做出放置决策。有利地,说明性实施例通过提供动态的、受信任的放置而消除了分析结果的非管控放置,因此使得数据科学家和数据工程师能够保持符合与从其得 ...
【技术保护点】
一种方法,包括:获得分别与由一个或多个分析应用所处理的一个或多个输入数据集相关联的元数据,其中针对每个数据集的元数据指示与所述数据集相关联的信任度和真实性中的至少一者,并且所述一个或多个分析应用基于所述一个或多个输入数据集生成分析结果;并且基于所获得的元数据的至少一部分而至少针对所述分析结果来确定管控放置;其中所述获得步骤和所述确定步骤由一个或多个处理设备所执行,所述一个或多个处理设备中的每一个包括操作地耦合至存储器的处理器。
【技术特征摘要】
2015.06.19 US 14/744,9211.一种方法,包括:获得分别与由一个或多个分析应用所处理的一个或多个输入数据集相关联的元数据,其中针对每个数据集的元数据指示与所述数据集相关联的信任度和真实性中的至少一者,并且所述一个或多个分析应用基于所述一个或多个输入数据集生成分析结果;并且基于所获得的元数据的至少一部分而至少针对所述分析结果来确定管控放置;其中所述获得步骤和所述确定步骤由一个或多个处理设备所执行,所述一个或多个处理设备中的每一个包括操作地耦合至存储器的处理器。2.根据权利要求1所述的方法,进一步包括获得管控选择器输入,其中针对所述分析结果确定管控放置的步骤经由所述管控选择器输入进行控制。3.根据权利要求2所述的方法,其中所述管控选择器输入指定对所获得的元数据进行处理以做出放置决定的一种或多种模式。4.根据权利要求3所述的方法,其中对所获得的元数据进行处理的所述一种或多种模式中的至少一种模式包括选择具有最高真实性或信任度水平的元数据以做出所述放置决定。5.根据权利要求3所述的方法,其中对所获得的元数据进行处理的所述一种或多种模式包括对所述一个或多个输入数据集的元数据求平均以做出所述放置决定。6.根据权利要求3所述的方法,其中对所获得的元数据进行处理的所述一种或多种模式中的至少一种模式包括计算所述一个或多个输入数据集合的元数据的中值以做出所述放置决定。7.根据权利要求3所述的方法,其中对所获得的元数据进行处理的所述一种或多种模式中的至少一种模式包括计算所述一个或多个输入数据集合的元数据的模式以做出所述放置决定。8.根据权利要求3所述的方法,其中对所获得的元数据进行处理的所述一种或多种模式中的至少一种模式包括覆盖所述一个或多个输入数据集合的元数据以做出缺省放置决定。9.根据权利要求8所述的方法,其中所述缺省放置决定由定义用于放置所述分析结果的受信任设施的形式的数字签名的指令所指定。10.根据权利要求1所述的方法,其中所述管控放置确定步骤进一步包括生成合规目标简档,所述合规目标简档指定针对要在其上存储符合所获得的元数据的至少一部分的分析结果的设施的真实性和信任度标准中的至少一者。11.根据权利要求10所述的方法,其中所述合规目标简档被安全存储以便在后续审计中使用。12.一种系统,包括:操作地耦合至一个或...
【专利技术属性】
技术研发人员:S·托德,S·塔贝特,
申请(专利权)人:伊姆西公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。