时间序列搜索引擎制造技术

技术编号：5487055 阅读：211 留言：0更新日期：2012-04-11 18:40

根据本发明专利技术的方法和装置基于搜索而提供组织、编制索引、搜索和呈现时间序列数据的能力。时间序列数据通常是一个或多个连续流中出现的具有时间戳的记录的序列，其表示某些类型的活动。在一个实施方式中，利用规格化时间戳将时间序列数据组织为离散事件，并且通过时间和关键字对这些事件编制索引。接收搜索请求，并且整体或部分地基于时间索引机制、关键字索引机制或搜索时计算的统计索引来检索相关事件信息。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及信息组织、搜索以及检索，并且更特别地涉及时间序列(time series )数据组织、溲索以及才全索。
技术介绍
时间序列数据通常是一个或多个连续流中出现的具有时间戳的记录的序列，其表示由离散事件组成的某些类型的活动。示例包括信息处理日志、市场交易以及来自于实时监视器的传感器数据(供应链、军事操作网络或安全系统)。为了理解以及利用发出大量时间序列数据的系统，编制索引、搜索以及呈现相关搜索结果是重要的。现有的大规模搜索引擎(例如，Google和Yahoo的web搜索) 设计为满足对时间性不太敏感类数据的需要，并且该搜索引擎建立在如下假设上，即仅需要在索引库中存储数据的一个状态，例如， Web搜索索引中的URL、客户数据库中的记录或作为文件系统一部分的文档。针对信息的搜索通常基于关键字搜索项而仅检索单个信息的副本来自于几天前编制索引的Web站点的URL集合、来自于昨天营业结束时的客户记录或指定版本的文档。相反，考虑来自于如图1所示的典型信息处理环境中的时间序列数据的示例。防火墙、路由器、web服务器、应用服务器和数据库总是生成事件形式的数据流，其中，每秒可能出现数百次或数千次事件。这里，随时间变化的数据行为模式以及历史数据值通常与当前数据值一样重要。目前的搜索方案通常几乎不具有基于时间编制索引、搜索或结果呈现中相关性的概念，并且不符合时间序列数据的需要。与全文本搜索引擎(全文本搜索引擎对其索引进行组织，从而检索具有最高相关性分数的文档是最有效的)相比，搜索时间序列数据的引擎优选地对索引进行组织，从而对各种时间...

【技术保护点】
一种用于时间搜索数据的计算机实现的方法，包括：　接收时间序列数据流；　对所述时间序列数据流标记时间戳，以创建具有时间戳的事件；　对所述具有时间戳的事件编制时间索引，以创建时间分段的索引；　接收时间序列搜索请求；以及　　至少部分地通过搜索所述时间分段的索引，来执行所述时间序列搜索请求。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：M鲍姆，D卡拉索，R达斯，R格林，B哈尔，N米利，B墨菲，S索尔金，A斯特克特，EM斯旺，
申请(专利权)人：斯普兰克公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人