用于完全集成捕获和分析商业信息以产生预测决策和模拟的系统技术方案

技术编号:20596413 阅读:33 留言:0更新日期:2019-03-16 12:02
本发明专利技术公开了一种用于完全集成收集商业影响数据、对数据进行分析并生成分析驱动的商业决策和候选商业决策的分析驱动的模拟的系统,包括存储在计算设备的处理器的存储器中并在处理器上运行的商业信息检索引擎、商业信息分析引擎和商业决策及商业动作路径模拟引擎。一种用于从具有异构报告简档的源捕获、存储和分析多维时间序列数据的系统和方法。来自以不规则间隔发送可变量的多维数据的传感器组的数据由数据处理设备接收,该数据处理设备处理原始数据以提取感兴趣的参数并保持直到接收到预定数量的传感器事件或流数据量。然后将数据提交到数据存储,直到分析时为止。较旧的数据将写入存档存储。该系统允许通过健壮的查询语言对数据存储数据进行复杂的选择和转换。

A system for fully integrated capture and analysis of business information to generate predictive decisions and simulations

The invention discloses an analysis-driven simulation system for fully integrating the collection of business impact data, the analysis of data and the generation of analysis-driven business decisions and candidate business decisions, including a business information retrieval engine, a business information analysis engine, a business decision and a business action path stored in the memory of a processor of a computing device and running on the processor. Diameter simulation engine. A system and method for capturing, storing and analyzing multidimensional time series data from sources with heterogeneous reporting profiles are described. Data from a group of sensors sending variable multidimensional data at irregular intervals is received by a data processing device that processes raw data to extract parameters of interest and remains until a predetermined number of sensor events or stream data volumes are received. The data is then submitted to the data store until analysis. Older data will be written to archive storage. The system allows complex selection and transformation of data storage data through robust query language.

【技术实现步骤摘要】
【国外来华专利技术】用于完全集成捕获和分析商业信息以产生预测决策和模拟的系统相关申请的交叉引用本申请是PCT申请,要求2016年4月28日提交的申请号为15/141,752、题为“用于完全集成捕获和分析商业信息以产生预测决策和模拟的系统”的美国专利申请的优先权,同时为2016年4月5日提交的申请号为15/091,563、题为“用于对来自传感器的具有异构报告间隔简档的时间序列数据进行捕获、分析及存储的系统”的部分延续案。上述专利文件的全部内容通过引用分别并入于此。
本专利技术涉及在商业信息管理、操作和预测规划中使用计算机系统的领域。特别地,涉及系统的开发,该系统集成了商业信息和操作数据、复杂数据分析和该数据的使用、预编程序命令和参数以及机器学习的功能,以创建能够实现预测决策和行动(action)路径结果模拟的商业操作系统。本专利技术涉及大量远程传感器数据的接收、存储以及分析,特别地,来自远程传感器的传感器数据的传输速率随时间变化呈高度异构(heterogeneous)。
技术介绍
在过去数十年中,商业决策者可以从诸如商业设备上或可从第三方获得的无处不在的传感器、详细因果数据以及商业过程监控软件所获得的金融、操作、基础设施、风险管理的和哲学方面的信息的数量,已经扩展到数据超过几乎所有人能够完全遵循所有这些功能的能力,更不用说在给定的商业环境中更有效地解释和有意义地使用这些可用数据。换句话说,现在可供决策者群体的决策者使用的商业相关信息的迅速发展已经远远超出了那些最需要使用它的人的能力,无论是完全遵循它还是可靠地使用它。在过去几年中,未能及时识别重要趋势或及时了解信息导致NETFLIXTM,FACEBOOKTM和UPSTM出现了高度可见的、面向客户的中断,仅举几例。现已出现了一些商业软件,其目的是将商业数据分析或商业决策过程精简或自动化。PALANTIRTM提供用于隔离大量数据模式的软件,DATABRICKSTM提供定制分析服务,ANAPLANTM提供财务影响计算服务,还有其他软件源可缓解商业数据相关性识别、该数据的分析和商业决策自动化的某些方面,但这些解决方案都不能处理整个任务的多个方面。目前需要的是一个完全集成的系统,它可以从许多不同的来源检索商业相关信息,并对这些大量数据进行识别和分析,将其转换为商业有用的格式,然后使用该数据创建智能预测商业决策和商业路径模拟。形成一种“商业操作系统”。使用远程传感器连续实时甚至远距离收集环境信息如温度、压力、光照水平、个别化合物的存在和声音,此处仅列出总可能性中的小部分,这种能力数倍地提高了人类管理和控制日益复杂的生活的各个方面的潜力。除了物理传感器,例如重力仪、甲烷传感器和热电偶,这些只是传统上讨论传感器时所考虑的几个例子,还有大量的电子硬件和软件混合传感器可以测量计算机或集群计算速度、计算机网络流量速度、路径、目的地、瓶颈,此处仅举几个例子。不幸的是,阻碍人类利用传感器的潜力及其返回的信息的原因并非我们可以制造和部署的传感器的数量或类型受限,而是我们缺乏对每个传感器提供的数据连续流进行可靠检索和存储的能力,以及操纵这些数据产生有意义的、可操作的结果,例如导致了特定兴趣高峰的重复事件,或从原始数据流识别重要趋势。最近,在这个问题领域取得了进展。Boundary报告称对从他们的时间序列网络监测传感器生成的数据流进行了成功捕获和短期存储,其实现是通过减少记录的传感器参数的数量、聚合进入系统的流使得例如10秒的传感器数据将作为单个块提交至他们的数据存储器、并且还限制每个提交的块以包括来自任意和有限数量的网络传感器的读数。这些数据,即通过总传感器的任意子群测量定义的时间段的块被作为块写入直接(straight)键:值对数据存储器达预定的时间量,但必须清除维持足够低的数据存储级别以保证系统运作。没有长期存储捕获的数据的规定。开发人员还能够根据时间记录的传感器ID和存储传感器数据的数据存储器中的关键字获取一些原始数据。这个系统被开发商称为Kobayashi(来自Boundary的HungryHungryKobayashi-DietrichFeatherston;https://vimeo.com/42902962:2012),是传感器数据流捕获和在短时间内从数据存储器中简单获取传感器数据的重要基础。虽然Kobayashi通过从一组传感器捕获和存储简化数据流的能力推动了技术发展,但Boundary的开发无法执行功能传感器数据流捕获和分析所需的多项任务。这些要求来自一份清单,该清单包括:1)Kobayashi使用的严格基于时间间隔的递交(commitment)计划在可靠的时间序列传感器中运行良好,这意味着数据随时间均匀到达,但是当传感器数据不规则地到达并且同时接收大量数据时,运行情况并不能令人满意;2)Kobayashi没有规定传感器数据的长期存储—开发人员提供的只有8.64x104(一天中的秒数)存储在数据存储器中,然后数据被清除;3)除最基本的脚本之外,Kobayashi没有强大的查询语言来从数据存储器中获取特定数据;4)没有转换能力,这种能力在尝试分析大量潜在的有噪声和复杂数据时尤为重要。因此,亟需一种从多个传感器捕获时间序列数据到数据存储器的系统和方法,这些传感器可以以不规则的间隔发送数据,其中大量数据可以同时来自传感器阵列。还需要一种用于旧数据的长期存档存储的系统和方法,可能不再需要用于当前分析,并且这将导致实时数据库中不可接受的高维护开销,但这对于长期趋势或者先前事件分析是至关重要的。最后,需要一种系统和方法,其允许基于复杂的搜索标准对特定传感器数据进行直接、标准化的搜索和分析,然后使用转换工具来最大化数据信息潜力以及一组强大的表示格式,以使转换数据的信息价值最大化。
技术实现思路
因此,专利技术人开发了一种分布式系统,用于对来自多个源的商业操作信息进行完全集成的检索以及深度分析。该系统进一步使用商业信息分析的结果来优化商业决策的制定,并允许使用最新数据和机器介导的预测算法来模拟替代行动路径。根据本专利技术的一个实施例,一种系统,包括:商业信息检索引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行;商业信息分析引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行;以及商业决策及商业动作路径模拟引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行。其中,所述商业信息检索引擎用于:从多个来源检索多个商业相关数据;直接从人机接口设备或从一个或多个命令和控制存储设备接收多个分析参数和控制命令;存储所累积检索的信息,以供商业信息分析引擎或预定数据超时进行处理。所述商业信息分析引擎用于:从商业信息检索引擎中检索多种数据类型;基于商业流程分析作者在当前活动中提出的具体目标和需求,对检索到的数据执行多种分析函数及变换。商业决策及商业动作路径模拟引擎用于:使用商业信息分析引擎执行的数据分析和变换结果,并结合来自多个来源的可用补充数据以及来自商业流程分析作者的任何当前活动特定机器学习、命令和参数,以制定当前商业操作和风险状况报告;以及使用商业信息分析引擎执行的数据分析和变换结果,并结合来自多个来源的可用补充数据、来自商业流程分析作者的任何当前活动特定命令和参数、以及从机器学习到的算法中收本文档来自技高网
...

【技术保护点】
1.一种用于完全集成收集商业影响数据、对所述数据进行分析并生成分析驱动的商业决策和候选商业决策的分析驱动的模拟的系统,其特征在于,包括:商业信息检索引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行;商业信息分析引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行;以及商业决策及商业动作路径模拟引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行;其中,所述商业信息检索引擎用于:(a)从多个来源检索多个商业相关数据;(b)直接从人机接口设备或从一个或多个命令和控制存储设备接收多个分析参数和控制命令;(c)存储所累积检索的信息,以供商业信息分析引擎或预定数据超时进行处理;其中,所述商业信息分析引擎用于:(d)从商业信息检索引擎中检索多种数据类型;(e)基于商业流程分析作者在当前活动中提出的具体目标和需求,对检索到的数据执行多种分析函数及变换;其中商业决策及商业动作路径模拟引擎用于:(f)使用商业信息分析引擎执行的数据分析和变换结果,并结合来自多个来源的可用补充数据以及来自商业流程分析作者的任何当前活动特定机器学习、命令和参数,以制定当前商业操作和风险状况报告;以及(g)使用商业信息分析引擎执行的数据分析和变换结果,并结合来自多个来源的可用补充数据、来自商业流程分析作者的任何当前活动特定命令和参数、以及从机器学习到的算法中收集的输入,为第一个终端用户提供商业行动路径模拟和商业决策支持。...

【技术特征摘要】
【国外来华专利技术】2016.04.05 US 15/091,563;2016.04.28 US 15/141,7521.一种用于完全集成收集商业影响数据、对所述数据进行分析并生成分析驱动的商业决策和候选商业决策的分析驱动的模拟的系统,其特征在于,包括:商业信息检索引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行;商业信息分析引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行;以及商业决策及商业动作路径模拟引擎,其存储在计算设备的处理器的存储器中并在所述处理器上运行;其中,所述商业信息检索引擎用于:(a)从多个来源检索多个商业相关数据;(b)直接从人机接口设备或从一个或多个命令和控制存储设备接收多个分析参数和控制命令;(c)存储所累积检索的信息,以供商业信息分析引擎或预定数据超时进行处理;其中,所述商业信息分析引擎用于:(d)从商业信息检索引擎中检索多种数据类型;(e)基于商业流程分析作者在当前活动中提出的具体目标和需求,对检索到的数据执行多种分析函数及变换;其中商业决策及商业动作路径模拟引擎用于:(f)使用商业信息分析引擎执行的数据分析和变换结果,并结合来自多个来源的可用补充数据以及来自商业流程分析作者的任何当前活动特定机器学习、命令和参数,以制定当前商业操作和风险状况报告;以及(g)使用商业信息分析引擎执行的数据分析和变换结果,并结合来自多个来源的可用补充数据、来自商业流程分析作者的任何当前活动特定命令和参数、以及从机器学习到的算法中收集的输入,为第一个终端用户提供商业行动路径模拟和商业决策支持。2.根据权利要求1所述的系统,其特征在于,所述商业信息检索引擎采用用于人机接口设备输入的门户,所述输入的至少一部分是商业相关数据,至少另一部分是与当前商业分析活动的进行相关的命令和参数。3.根据权利要求2所述的系统,其特征在于,所述商业信息检索引擎采用存储在计算设备的处理器的存储器中并在其上运行的存储器中的高容量深度网页爬虫,所述高容量深度网页爬虫从高度可定制的基于云的接口接收至少一些爬取控制和蜘蛛配置参数,使用通用搜索控制参数和单独的Web搜索代理特定配置数据来协调一个或多个万维网搜索,接收可能导致发布更多Web搜索控制参数的爬取进度反馈信息、控制以及监视分布式爬取服务器上的蜘蛛,从爬取服务器接收原始爬取活动数据,依据爬取活动的参数聚合来自每个网站或网页的爬取活动数据的至少一部分。4.根据权利要求3所述的系统,其特征在于,原型蜘蛛由程序库提供,单个蜘蛛通过使用配置文件创建。5.根据权利要求3所述的系统,其特征在于,爬取活动请求被持久存储,并且可以重复使用或用做类似爬取活动的基础。6.根据权利要求2所述的系统,其特征在于,所述商业信息检索引擎采用存储在计算设备的处理器的存储器中并在其上运行的多维时间序列数据存储器,以从多个异构类型的传感器接收多个数据,其中部分传感器具有异构报告和数据有效载荷传输配置简档;所述商业信息检索引擎在预定时间量、预定数量的数据或预定数量的事件上聚合传感器数据;所述商业信息检索引擎依照每个预定访问连接检索特定数量的聚合后的传感器数据,以允许可靠地接收和包含数据;所述商业信息检索引擎使用另外的多个访问连接透明地检索大量因太大而无法通过一个访问连接可靠传输的聚合后的传感器数据,以允许在传感器数据流量大的情况下捕获所有聚合后的传感器数据;并将聚合后的传感器数据存储在简单的键值对中,使得在接收这些聚合后的传感器数据时不需要进行数据变换。7.根据权利要求1所述的系统,其特征在于,所述商业信息分析引擎采用存储在计算设备的处理器的存储器中并在其上运行的存储器中的有向计算图;所述有向计算图检索来自多个数据源中的一个或多个的输入流;过滤数据以从流中移除数据记录,移除数据记录的原因包括但不限于:缺少所有信息、记录中数据损坏、以及存在不一致信息或缺失信息导致数据记录无效;所述有向计算图将过滤后的数据流分成两个或多个相同的部分;基于一组预定参数格式化一个数据流内的数据,以便为数据存储器中的有意义存储做准备;使用系统的资源发送相同的数据流以便进一步分析和线性变换或分支变换。8.一种用于完全集成收集商业影响数据、对所述数据进行分析并生成分析驱动的商业决策和分析驱动的商业决策模拟的方法,其特征在于,包括以下步骤:(a)使用存储在计算设备的处理器的存储器中并在所述处理器上运行的商业信息检索引擎来检索商业相关数据、分析活动命令和控制信息;(b)使用存储在计算设备的处理器的存储器中并在所述处理器上运行的商业信息分析引擎并结合前述设计的分析活动命令和控制信息来分析和变换所检索的商业相关数据;以及(c)基于对前述检索的商业相关数据的分析结果和前述输入的分析活动命令和控制信息,使用商业决策及商业路径模拟引擎提供商业决策关键信息以及商业路径模拟信息。9.根据权利要求8所述的方法,其特征在于,所述商业信息检索引擎采用用于人机接口设备输入的门户,所述输入的至少一部分是商业相关数据,至少另一部分是与当前商业分析活动的进行相关的命令和参数。10.根据权利要求9所述的方法,其特征在于,所述商业信息检索引擎采用存储在计算设...

【专利技术属性】
技术研发人员:杰森·拉布特里安德鲁·塞勒斯
申请(专利权)人:分形工业公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1