本发明专利技术的实施方式公开了一种构建引擎的流程的方法和设备。该方法可以包括:基于引擎历史流程来得到每两个引擎的顺序关系;根据每两个引擎的顺序关系来构建引擎的流程。根据本发明专利技术实施方式的方法和设备能够完成自动的引擎集成,便于用户使用。
【技术实现步骤摘要】
本专利技术一般涉及数据处理领域,特别涉及用于构建引擎的流程的方法与设备。
技术介绍
引擎集成可以将若干个相关的引擎连接在一起来构建一个流程,其中该流程可以 被运行以解决一个特定的任务。例如为了解决一个产品提取任务,可以将网络信息收集引 擎,分词引擎和产品标注引擎连在一起来形成一个引擎流程,从而可以对通过网络收集的 内容进行分词并且对其中与产品有关的信息进行标注。 引擎集成的关键问题主要是引擎顺序的确定。美国专利公开号US 2004/0243556 Al描述了一个非结构化信息管理和文本分析系统,其中用户需要将过程中的每个引擎按预 先确定的顺序放置,即非自动的引擎顺序确定。美国专利公开号US 2005/0097224 Al描述 了一种自动服务组合的方法,它可以根据服务知识库中存储的服务规范来确定服务间的顺 序,但无法处理没有规定服务规范的服务。日本专利公开号JP10-222371描述了一个生成 和执行知识库系统的设备,它可以根据引擎的输入和输出来确定引擎间的顺序,但无法处 理没有规定输入输出的引擎。 可见,现有技术不能自动确定引擎间的顺序,或者处理范围有限。另外,现有技术 均是手动验证引擎流程是否合法,不能自动完成引擎流程验证。
技术实现思路
针对以上问题,本专利技术一个目的是提供一种构建引擎的流程的技术方案,以便能 够自动完成引擎集成而形成弓I擎流程。 为此,根据本专利技术的第一方面,提供了一种构建引擎的流程的方法,该方法可以包 括基于引擎历史流程来得到每两个引擎的顺序关系;根据每两个引擎的顺序关系来构建 引擎的流程。 根据本专利技术的第二方面,提供了一种构建引擎的流程的设备,该设备可以包括流 程构建单元,该流程构建单元包括用于基于引擎历史流程来得到每两个引擎的顺序关系的装置,以及用于根据每两个引擎的顺序关系来构建引擎的流程的装置。 通过以下对说明本专利技术的优选实施方式的描述,并结合附图,本专利技术的其他特征以及优点将会是显而易见的。附图说明 通过以下结合附图的说明,并且随着对本专利技术的更全面了解,本专利技术的其他目的 和效果将变得更加清楚和易于理解,其中 图1是按照本专利技术的一种实施方式的用于构建引擎的流程的方法的流程图; 图2是按照本专利技术的另一种实施方式的用于构建引擎的流程的方法的流程图; 图3是按照本专利技术的另一种实施方式的用于构建引擎的流程的方法的流程图;以及5 图4是按照本专利技术的一种实施方式的用于构建引擎的流程的设备的方框图。 在所有的上述附图中,相同的标号表示具有相同、相似或相应的特征或功能。具体实施例方式以下结合附图对本专利技术实施方式进行更详细的解释和说明。应当理解,本专利技术的 附图及实施方式仅用于示例性作用,并非用于限制本专利技术的保护范围。 为了清楚起见,首先对本专利技术中所使用的术语作以解释。 1.引擎 引擎是用于完成特定管理和处理功能的例程。例如,网络信息收集引擎是用于从 网络收集相关信息的例程;分词引擎是用于对通过网络收集的内容进行分词的例程;以及 产品标注弓I擎是指对得到的分词中与产品有关的信息进行标注的例程。 2.引擎的流程 引擎的流程是为了解决特定任务将若干个相关的引擎连接在一起而构建的一个 引擎序列。例如,为了解决一个产品提取任务,可以将网络信息收集引擎、分词引擎和产品 标注引擎连在一起构建一个引擎的流程。这个流程例如表示为"网络信息收集引擎一分词 引擎一产品标注引擎",其中符号"一"指示两个引擎的顺序。该流程表示先执行"网络信息 收集引擎"、然后执行"分词引擎"、最后执行"产品标注引擎"。 3.顺序关系 在本专利技术中,顺序关系包括两个对象之间的顺序。可选地,顺序关系还包括该顺序 的出现频率。 在本专利技术中,每两个引擎的顺序关系包括在两个或更多个引擎中任意两个引擎之 间的顺序,也可以可选地包括该顺序的出现频率。例如,在上述例子中,网络信息收集引擎 和分词引擎的顺序关系包括这两个引擎的顺序为"网络信息收集引擎一分词引擎"。可选 地,网络信息收集引擎和分词引擎的顺序关系还包括顺序"网络信息收集引擎一分词引擎" 在历史流程中的出现频率。 在本专利技术中,每两种引擎类型的顺序关系包括在两种或更多种引擎类型中任意两 种引擎类型之间的顺序,也可以可选地包括该顺序的出现频率。例如,假设网络信息收集引 擎的类型是数据读取,分词引擎的类型是数据标注,包括这两个引擎的历史流程为"网络信 息收集引擎一分词引擎",则数据读取和数据标注这两种引擎类型的顺序关系包括"数据读 取一数据标注"这一顺序。可选地,数据读取和数据标注的顺序关系还包括顺序"数据读取 —数据标注"在历史流程中的出现频率。 4.引擎历史流程 引擎历史流程是指先前已经存在的历史流程。引擎历史流程可以预先存储在引擎 历史流程库中。引擎历史流程库可以存储先前已经建立的所有流程。可以以多种方式实现 引擎历史流程库,表1和表2分别示出了引擎历史流程库的例子。 表l引擎历史流程库 <table>table see original document page 7</column></row><table> 在表1所示的引擎历史流程库的例子中,引擎历史流程库包括2个条目,其中每个条目分别包括引擎历史流程、使用过该引擎历史流程的用户的用户名、和该引擎历史流程的创建时间。表1所示的引擎历史流程库的每个条目的含义是某用户在某时间建立了某个流程。例如,第一个条目表示User001在2008-11-05 18:40:36时建立了一个流程"网络信息收集引擎一分词引擎"。同时,在表l中,引擎历史流程包括引擎名称,并且示出了各个引擎之间的顺序。 表2引擎历史流程库<table>table see original document page 7</column></row><table> 表2的结构与表1的结构不同之处仅在于引擎历史流程还包括每个引擎的类型。 例如,第一个条目表示User001在2008-11-0518:40:36时建立了一个流程"网络信息收集 引擎一分词引擎",并且在该流程中,网络信息收集引擎的类型是数据读取,分词引擎的类 型是数据标注。 存在多种方式生成引擎历史流程。例如,既可以由外部的公知装置(例如用于保 存用户手动创建的流程的保存装置)生成引擎历史流程并将其保存到引擎历史流程库,也 可以由本专利技术的用于构建引擎的流程的设备将合法的引擎历史流程自动保存到引擎历史 流程库。引擎历史流程库中的引擎类型可以是在生成历史流程过程中自动标注的,也可以 是在生成历史流程后由用户手工标注的。 5.引擎描述信息 引擎描述信息是描述引擎的细节,其可以存储在引擎描述信息库中。引擎描述信 息库可以存储多个条目,每个条目可以包括引擎名称、引擎类型、引擎输入类型、引擎输出 类型和引擎上下文等与引擎相关联的信息。引擎名称是指引擎的名字;引擎类型是指引擎 属于何种功能类别,引擎类型例如包括数据读取、数据标注、知识分析等;引擎输入类型 是指引擎要求输入的数据的数据类型;引擎输出类型是指引擎可以输出的数据的数据类型;引擎上下文是指引擎对它的前一个引擎及后一个引擎有什么限制。表3示出了引擎描本文档来自技高网...
【技术保护点】
一种构建引擎的流程的方法,包括:基于引擎历史流程来得到每两个引擎的顺序关系;以及根据所述每两个引擎的顺序关系来构建引擎的流程。
【技术特征摘要】
【专利技术属性】
技术研发人员:丰强泽,齐红威,
申请(专利权)人:日电中国有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。