利用分布式计算图快速预测分析超大型数据集制造技术

技术编号:19077389 阅读:46 留言:0更新日期:2018-09-29 18:35
已经开发了利用分布式计算图预测分析超大型数据集的系统。数据接收软件从一个或多个源接收流数据。在批处理数据路径中,数据形式化软件对输入数据格式化以进行存储。批处理事件分析服务器检查存储的数据的趋势、情况或知识。汇总的数据被传递给消息处理软件。系统健全软件从消息处理程序接收状态信息并优化系统性能。在流路径中,转换流水线软件操纵数据流、将结果提供回系统、接收来自系统健全和再调试软件的指令。

【技术实现步骤摘要】
【国外来华专利技术】利用分布式计算图快速预测分析超大型数据集相关申请的交叉引用本申请是于2015年10月28日提交的序列号为14/925,974、标题为“利用分布式计算图快速预测分析超大型数据集”的美国专利申请的PCT申请并且要求其优先权,其整个说明书通过引用全部并入本文。
本专利技术属于利用分布式计算图工具分析超大型数据集的领域,该分布式计算图工具通过线性转换流水线(pipeline)和非线性转换流水线允许数据转换。
技术介绍
即使在远距离的情况下,在个体之间传递信息的能力归因于使人类能够从灵长类采集者-拾荒者种类上升到形成简单群落。稳定记录信息的能力以便可以分析重复性事件和趋势,并作为扩展和构建的基础。可以肯定地说,可获得允许与其积累过程属于同一时期的个体以及下一代分析和添加的格式的信息是人类可以利用的最有力工具,并且能够推动我们进入我们已经实现的社会和技术成就的水平。没有任何东西能够增强我们收集和存储类似于电子和计算机技术的兴起信息的能力。存在可以测量任何可以想象的条件的各种类型的传感器。已经允许计算机存储和访问大部分人口的健康信息。同样,可以对关于车辆事故、环境因素以及车辆部件因素、航空事故和坠本文档来自技高网...

【技术保护点】
1.一种利用分布式计算图预测分析超大型数据集的系统,其包括:数据接收软件模块,其存储在计算装置的存储器中并在所述计算装置的处理器上运行;数据过滤软件模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;数据形式化软件模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;输入事件数据存储模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;批处理事件分析服务器,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;系统健全和再调试软件模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;消息传送模块软件,其存储在所述计算装置的存储器...

【技术特征摘要】
【国外来华专利技术】2015.10.28 US 14/925,9741.一种利用分布式计算图预测分析超大型数据集的系统,其包括:数据接收软件模块,其存储在计算装置的存储器中并在所述计算装置的处理器上运行;数据过滤软件模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;数据形式化软件模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;输入事件数据存储模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;批处理事件分析服务器,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;系统健全和再调试软件模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;消息传送模块软件,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;转换流水线软件模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;和输出软件模块,其存储在所述计算装置的存储器中并在所述计算装置的处理器上运行;其中所述数据接收软件模块:(a)从多个数据源中的一个或多个接收输入流;(b)向所述数据过滤模块发送所述数据流;以及其中所述过滤软件模块:(c)从所述数据接收软件模块接收数据流;(d)由于包括但不限于下列集合的多种原因从所述数据流中去除数据记录:缺少所有信息、所述记录中的数据损坏,以及存在使所述数据记录无效的不一致信息或缺失信息;(e)将过滤的数据流分割成两个或多个相同的部分;(f)向所述数据形式化软件模块发送一个相同的数据流;以及(g)向所述分布式图计算模块的转换流水线模块发送另一个相同的数据流;以及其中所述数据形式化模块:(h)从所述数据过滤软件模块接收数据流;(i)基于一组预定参数对所述数据流内的数据格式化,以准备有意义地存储在数据存储装置中;以及(j)将格式化的数据流放入所述输入事件数据存储模块中;和其中所述输入事件数据模块:(k)从所述数据形式化模块接收格式正确的数据;以及(l)通过适合长期可获得、及时检索和分析累积的数据的方法存储所述数据;和其中所述批处理事件分析服务器:(m)基于一组预定参数访问所述数据存储装置以获得感兴趣的信息;(n)将从所述数据存储装置检索的数据预先确定地汇总,所述数据表示诸如重要性趋势、系统内待分析的事件或一组事件的过去事例或者在许多迭代中两个或更多个变量之间的可能因果关系等兴趣点;和(o)向所述消息传送软件模块提供基于分析的数据的广度的汇总...

【专利技术属性】
技术研发人员:杰森·克拉布特里安德鲁·塞勒斯
申请(专利权)人:分形工业有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1