【技术实现步骤摘要】
技术介绍
1、为了从数据中提取有价值的见解,人们可以使用数据处理流水线来分析数据。数据处理流水线可以包括变换数据的一系列处理步骤(如本文中所使用的,数据通常可以指的是各种类型的数据相关产品,诸如原始数据、数据集、数据库、从数据中导出的分析模型、显示一个或多个前述数据相关产品的仪表板等等)。换言之,通过一系列处理步骤,数据处理流水线可以将上游/先辈数据相关产品(例如,原始数据、数据集、数据库等)迭代地变换成下游/后代数据相关产品(例如,从上游数据相关产品导出的新数据集,从上游数据相关产品导出的分析模型,显示一个或多个前述数据相关产品的仪表板等)。例如,利用第一处理步骤,数据处理流水线可以将第一数据相关产品(例如,原始数据源)变换成第二数据相关产品(例如,从原始数据源导出的数据集)。利用第二处理步骤,数据处理流水线可以将第二数据相关产品变换成第三数据相关产品(例如,从数据集导出的分析模型)等等(在这里,第三数据相关产品可以被称为第一数据相关产品和第二数据相关产品的“后代”;相反,第一数据相关产品和第二数据相关产品可以被称为第三数据相关产品
...【技术保护点】
1.一种方法,包括:
2.根据权利要求2所述的方法,其中通过所述谱系表示传播所述价值指示符包括:
3.根据权利要求2所述的方法,其中通过所述谱系表示传播所述价值指示符还包括:根据实现针对给定先辈数据集的给定聚合价值指示符的成本,减少针对所述给定先辈数据集的所述给定聚合价值指示符。
4.根据权利要求1所述的方法,其中所生成的所述隐式元数据包括所述一个或多个下游数据相关产品及与所述一个或多个下游数据相关产品相关联的先辈处理步骤和先辈数据集的元数据特性之间的统计上显著的对应关系。
5.根据权利要求1所述的方法,其中所接收的与所
...【技术特征摘要】
1.一种方法,包括:
2.根据权利要求2所述的方法,其中通过所述谱系表示传播所述价值指示符包括:
3.根据权利要求2所述的方法,其中通过所述谱系表示传播所述价值指示符还包括:根据实现针对给定先辈数据集的给定聚合价值指示符的成本,减少针对所述给定先辈数据集的所述给定聚合价值指示符。
4.根据权利要求1所述的方法,其中所生成的所述隐式元数据包括所述一个或多个下游数据相关产品及与所述一个或多个下游数据相关产品相关联的先辈处理步骤和先辈数据集的元数据特性之间的统计上显著的对应关系。
5.根据权利要求1所述的方法,其中所接收的与所述目标数据分析项目相关的所述参数包括针对将要在所述目标数据分析项目中利用的数据相关产品的期望元数据特性。
6.根据权利要求5所述的方法,其中参考所传播的所述价值指示符和所生成的所述隐式元数据以针对所述目标数据分析项目推荐所述先辈数据集中的至少一个所述先辈数据集包括:推荐一个先辈数据集和一个先辈处理步骤,所述一个先辈处理步骤用于将所述一个先辈数据集变换成针对所述目标数据分析项目的新的数据相关产品。
7.根据权利要求6所述的方法,其中针对所述目标数据分析项目的所述新的数据相关产品具有在所接收的与所述目标数据分析项目相关的所述参数中指定的期望元数据特性。
8.根据权利要求6所述的方法,其中:
9.一种存储指令的非暂时性计算机可读介质,所述指令在由一个或多个处理资源执行时,使得所述一个或多个处理资源:
10.根据权利要求9所述的存储指令的非暂时性计算机可读介质,还包括用于基于所述元数据指示符表示针对预期数据集推荐一个或多个元数据特性的指令。
11.根据权利要求10所述的存储指令的非暂时性计算机可读介质,还包括指令,用于在生成针对所述一个或多个初级数据集的所述扩充元数据谱系表示之前,基于从与所述一个或多个初级数据集的使用相关的人类行为动作导出的价值指示符,将所述一个或多个初级数据集...
【专利技术属性】
技术研发人员:T·唐尼,S·巴塔查里亚,G·鲍登,L·A·尼亚瑟,J·M·兹丹库斯,S·苏达卡兰,
申请(专利权)人:慧与发展有限责任合伙企业,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。