用于演进分析的系统技术方案

技术编号：10600144 阅读：161 留言：0更新日期：2014-11-05 13:14

一种用于演进分析的系统通过下述操作来支持三个维度（分析工作流、用户和数据）：通过使用物化为系统中的先前工作流执行运行的一部分的答案，重写工作流以便更高效。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】一种用于演进分析的系统通过下述操作来支持三个维度（分析工作流、用户和数据）：通过使用物化为系统中的先前工作流执行运行的一部分的答案，重写工作流以便更高效。【专利说明】用于演进分析的系统本申请是于2012年6月27日提交的序列号为61664971的临时申请的非临时申请并要求该临时申请的优先权，该临时申请的内容通过弓I用而并入。
技术介绍
本专利技术涉及演进分析。知识驱动的企业采用了运用其业务的每个方面的进取型策略，并鼓励雇员在所收集的大量原始数据中找到价值。数据驱动的决策(DDD)没有给不受改变影响的知识驱动的企业留余地，只要在数据中存在足够的证据对其进行支持即可。组织收集数据作为可能具有未知价值的日志，因而，执行提取-变换-加载(ETL)由于ETL的高支出而不可行。ETL需要昂贵的正式过程，并需要数据看起来像什么以及价值驻留于何处的先验知识。典型地，日志是大的、平的且具有低结构，增加了典型数据库的ETL的复杂度，这是由于这需要一种数据库设计，其中其结构完全是预定义的。出于这些原因，许多数据从未被彻底地评估，并且需要数据分析者来分析现代组织所收集的不断增长的数据量并产生可付诸行动的见解。如所期望的那样，这种类型的分析本质上是高度探索性的并涉及下述迭代过程:数据分析者以对数据的初始查询开始，检查结果，然后重新制定查询，且甚至可以将附加数据源带进来，等等。典型地，这些查询涉及与数据的类型和分析的目的相联系的完善的、域专用的操作，例如，通过推特消息(tweets)来执行情感分析或者计算每个节点在大社交网络内的影响。大规模系统(诸如MapR...

【技术保护点】
一种用于支持演进查询的方法，包括：保留来自先前查询或工作流执行运行的人工产物（物化视图）；提供用户定义函数（UDF）的灰盒模型以支持针对UDF的重写的搜索；自动地产生使用人工产物减少工作流执行时间的重写；以及递增地搜索要创建（激增）的重写的空间并搜索最小量的解空间以找到最优重写。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：VH哈奇古穆斯，J桑卡拉纳拉亚南，J勒菲弗尔，J塔特穆拉，N波利佐蒂斯，
申请(专利权)人：美国日本电气实验室公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人