【技术实现步骤摘要】
【国外来华专利技术】用于计算近实时数据聚集的搜索和检索数据处理系统
本说明书涉及特别适于提供从分布在网络中的数据源的数据检索的方法和数据结构。
技术介绍
在一个示例中,执行应用的系统通过检索数据仓库(例如,与物流中心、分布式机械、移动通信或零售商店相关的数据仓库)中所储存的数据并分批聚集该数据,来聚集数据。这些应用通常称为批应用,这是因为它们将所接收到的数据(分批)储存在数据仓库中、然后将该数据从数据仓库检索出来以计算聚集,从而在聚集数据时导致延迟。另外,由于涉及大量数据,因此这些应用难以聚集实时数据(和/或仓储数据)。参考图1A,环境2包括不同的应用(例如,引擎),以实现针对批数据的不同类型的应用。在该示例中,将来自数据源3的数据储存在企业数据仓库(EDW)4中。物流应用5a、5b、5c、5d(各自实现不同的操作、规则或应用)各自分别从EDW4中检索适合该应用的数据。这些不同应用5a、5b、5c、5d各自作用于不同的数据类型和数据流,因此从EDW4中检索合适数据。这些不同应用5a、5b、5c、5d各自可以执行许多操作、规则和应用。各应用使用相同的通用工作流。在另一示例中,例如如美国专利9,002,770中所描述的规则的用户界面使得用户(例如,使用者)能够定义应用中所使用的规则(例如,SMS使用>40),而无需写入用以访问数据库中的合适数据记录的计算机代码以检索规则的相关数据。一般地,当用户定义应用时,他/她(例如,在电子表格中)写出规则,然后将电子表格发送至计算机程序员以写入用以实现该规则的代码。利用规则的用户界面,用户可以在该用户界面中仅选择规则(例如,或者 ...
【技术保护点】
1.一种用于处理数据的数据处理系统所进行的方法,所述方法包括:间歇地接收来自一个或多个数据流的数据,其中所接收到的数据包括数据记录;随着继续接收来自所述一个或多个数据流的数据,检测所接收到的数据记录中的两个或多个特定数据记录,其中所检测到的两个或多个特定数据记录各自包括特定标识符,针对该特定标识符,创建包括所检测到的两个或多个特定数据记录的数据记录的集合;针对数据记录的所述集合中所包括的至少一个特定数据记录,搜索数据记录以获得与所述特定标识符相关联的数据的历史聚集,其中所述历史聚集是从先前时间段预计算出的数据聚集,以及基于所述至少一个特定数据记录和所述历史聚集来计算组合数据,通过将所述组合数据插入数据记录的字段中、并且通过将来自所述集合中的数据记录至少之一的数据插入到该数据记录的另一字段中,来修改该数据记录;通过对修改后的数据记录应用一个或多个规则,来处理所述修改后的数据记录;基于应用所述规则,向存储器写入用于发起一个或多个动作的一个或多个指令;以及将所述一个或多个指令发布至队列以发起所述一个或多个动作。
【技术特征摘要】
【国外来华专利技术】2015.12.21 US 62/270,257;2016.11.23 US 15/360,4491.一种用于处理数据的数据处理系统所进行的方法,所述方法包括:间歇地接收来自一个或多个数据流的数据,其中所接收到的数据包括数据记录;随着继续接收来自所述一个或多个数据流的数据,检测所接收到的数据记录中的两个或多个特定数据记录,其中所检测到的两个或多个特定数据记录各自包括特定标识符,针对该特定标识符,创建包括所检测到的两个或多个特定数据记录的数据记录的集合;针对数据记录的所述集合中所包括的至少一个特定数据记录,搜索数据记录以获得与所述特定标识符相关联的数据的历史聚集,其中所述历史聚集是从先前时间段预计算出的数据聚集,以及基于所述至少一个特定数据记录和所述历史聚集来计算组合数据,通过将所述组合数据插入数据记录的字段中、并且通过将来自所述集合中的数据记录至少之一的数据插入到该数据记录的另一字段中,来修改该数据记录;通过对修改后的数据记录应用一个或多个规则,来处理所述修改后的数据记录;基于应用所述规则,向存储器写入用于发起一个或多个动作的一个或多个指令;以及将所述一个或多个指令发布至队列以发起所述一个或多个动作。2.根据权利要求1所述的方法,其中,将来自所述集合中的数据记录至少之一的数据插入到该数据记录的另一字段中包括:将来自所述集合中所包括的所述至少一个特定数据记录的数据插入到通过插入而修改的数据记录的另一字段中。3.根据权利要求1所述的方法,其中,数据记录的所述集合是包括来自数据记录的数据的第一数据记录,以及所述方法还包括:收集多个数据记录;将所述数据记录发布至单个队列;从所述队列中检测所述两个或多个特定数据记录;将所述两个或多个特定数据记录一起联接到所述第一数据记录中,其中所述两个或多个特定数据记录包括表示为不同类型的事件的数据;以及利用针对所述至少一个特定数据记录的组合数据来增强所述第一数据记录。4.根据权利要求1所述的方法,其中,所述先前时间段是进行检测之前的时间。5.根据权利要求1所述的方法,其中,还包括:向所述第一数据记录附加与所述第一数据记录中所包括的特定事件相关联的客户的客户简档数据;以及向所述第一数据记录附加具有针对所述特定事件的历史聚集的可附加查找文件即ALF。6.根据权利要求1所述的方法,其中,计算组合数据包括:向所述历史聚集添加增量数据,其中所述增量数据包括从计算出所述历史聚集的时间到近当前时间的数据,所述近当前时间距当前时间在一分钟内;以及基于所述增量数据的添加,产生数据的近实时聚集。7.根据权利要求1所述的方法,其中,还包括:从用户的客户端装置接收表示用于定义应用的一个或多个规则的数据;基于所接收到的数据生成用于定义应用的一个或多个规则;以及基于执行所述一个或多个规则,针对间歇地接收到的一个或多个数据流实现该应用。8.根据权利要求1所述的方法,其中,接收所述一个或多个数据流包括:接收具有表示第一类型的事件的数据的第一数据流;以及接收具有表示第二类型的事件的数据的第二数据流。9.根据权利要求1所述的方法,其中,还包括:针对所述一个或多个指令中所包括的发布动作触发器执行一个或多个应用。10.根据权利要求1所述的方法,其中,数据记录包括事件。11.根据权利要求1所述的方法,其中,搜索包括在数据存储库中进行搜索或者在存储器中进行搜索。12.一种用于处理数据的数据处理系统,包括:一个或多个处理器;以及一个或多个机器可读硬件存储装置,其储存能够执行以使所述一个或多个处理器进行操作的指令,所述操作包括:间歇地接收来自一个或多个数据流的数据,其中所接收到的数据包括数据记录;随着继续接收来自所述一个或多个数据流的数据,检测所接收到的数据记录中的两个或多个特定数据记录,其中所检测到的两个或多个特定数据记录各自包括特定标识符;针对该特定标识符,创建包括所检测到的两个或多个特定数据记录的数据记录的集...
【专利技术属性】
技术研发人员:J麦克莱恩,P·维塞尔,
申请(专利权)人:起元技术有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。