云计算环境下面向不确定数据源的工作流视图构造方法技术

技术编号：8271464 阅读：176 留言：0更新日期：2013-01-31 03:41

本发明专利技术公开了云计算环境下面向不确定数据源的工作流视图构造方法。本发明专利技术首先读取科学工作流的数据源图信息，并将整个数据源图视为一个完整的工作流视图，检测它的合理性。然后对数据源图进行拆分与重构时，按照四种情形处理。最后对数据源图中的任务节点进行再次合并与重构，直到数据源图中无法再进行任务节点之间的合并为止，则数据源图中最终存在的任务节点和复合任务节点将构成该数据源图的合理性视图。本发明专利技术所提供的检测方法不仅考虑到了确定数据源图中视图的合理性，更是结合了视图存在的期望支持度来检测是否可以将多个任务合并为期望支持度更大的复合任务。

全部详细技术资料下载

【技术实现步骤摘要】
本专利技术属于科学工作流
，涉及一种面向科学工作流不确定数据源的视图构造方法。
技术介绍
近年来，随着计算机网络技术飞速发展，作为新型互联网的后端支撑基础云计算技术已开始逐步走向人类社会生活。科学工作流是一类典型的面向海量密集型数据流、以减少计算成本为目标的应用系统，它的出现为跨多类学科和跨不同地域的科研合作提供了方便。在科学工作流系统中，海量数据密集型计算与分布式资源共享彼此间协作、无隙地进行，使得具有不同领域专业知识、地理位置分布的科研工作者可跨组织合作完成相关的科学实验。科学工作流系统现已在各国的科研院所展开应用，并在生物信息学、社会关系分析、气象学、物理学等多个领域都发挥了应有的作用。在云计算环境下进行科学工作流运行时，将产生大量的中间数据和结果，对这些数据进行管理与分析有助于科研工作者对复杂、多步骤的科学实验进行描述和分析。为了保证实验结果的可重复性与可验证性，许多科学工作流系统都提供了对数据源的支持。由于复杂、大规模的科学工作流系统在运行过程中将产生大量的数据源。如何对这些海量的数据源进行有效地查询与管理现已成为科研工作者研究的重要问题之一，目前许多研究工作针对此方面展开，它们通过构造数据源视图的方式来分析数据源，从而达到缩减数据源图的规模和计算复杂度的目的。在数据源视图中，科学工作流中的任务依据数据流关系，被抽象成高阶的复合任务，从而达到隐藏不相关的源数据细节、降低数据源图规模的目的，同时在视图级进行数据查询将有效地提高查询效率。然而由于受数据采集的准确度和服务器的可靠性影响，当对数据源进行数据集成时，工作流数据的不确定性现象将会产生。一般...

【技术保护点】
云计算环境下面向不确定数据源的工作流视图构造方法，其特征在于该方法的具体步骤：步骤（1）读取科学工作流的数据源图信息，包括数据源图中任务节点集、任务节点间的数据流边的集合和数据流边的存在概率；？步骤（2）将整个数据源图视为一个完整的工作流视图，检测它的合理性，包括：①根据数据源图中的每条输入数据流必须能够到达该数据源图的所有输出任务节点这一原则，来检测数据源图的合理性；②数据源图中的相邻任务节点在满足条件①的情况下能否合并为一个新的复合任务、且新的复合任务存在概率是否小于未合并之前各任务节点的存在概率，如果合并后的新复合任务存在概率大于合并之前各任务节点的存在概率，则认为原来的数据源图具有不合理性；若数据源图具有合理性，则整个数据源图被视为一个完整的工作流视图；步骤（3）若步骤(2)中整个数据源图将作为一个工作流视图被检测为不合理的，则按照以下两种情况重新构造该数据源图的合理性视图：i)若数据源图因为不符合步骤（2）中的条件①，则对该数据源图按照步骤(4)进行拆分重构，从数据源图里面重新构造出合理性的视图；ii)若数据源图不符合步骤（2）中的条件②，则找出数据源图中存在那些相邻任务节点...

【技术特征摘要】
1.云计算环境下面向不确定数据源的工作流视图构造方法，其特征在于该方法的具体步骤步骤(I)读取科学工作流的数据源图信息，包括数据源图中任务节点集、任务节点间的数据流边的集合和数据流边的存在概率；步骤(2)将整个数据源图视为一个完整的工作流视图，检测它的合理性，包括 ①根据数据源图中的每条输入数据流必须能够到达该数据源图的所有输出任务节点这一原则，来检测数据源图的合理性； ②数据源图中的相邻任务节点在满足条件①的情况下能否合并为一个新的复合任务、且新的复合任务存在概率是否小于未合并之前各任务节点的存在概率，如果合并后的新复合任务存在概率大于合并之前各任务节点的存在概率，则认为原来的数据源图具有不合理性；若数据源图具有合理性，则整个数据源图被视为一个完整的工作流视图；步骤(3)若步骤(2)中整个数据源图将作为一个工作流视图被检测为不合理的，则按照以下两种情况重新构造该数据源图的合理性视图 i)若数据源图因为不符合步骤(2)中的条件①，则对该数据源图按照步骤(4)进行拆分重构，从数据源图里面重新构造出合理性的视图； )若数据源图不符合步骤(2)中的条件②，则找出数据源图中存在那些相邻任务节点这些相邻任务节点在满足条件①的情况下能合并为一个新的复合任务、且新复合任务存在概率大于未合并之前各任务节点的存在概率，并将这些相邻的任务节点进行合并；步骤(4)对数据源图进行拆分与重构时，按照如下情形处理情形I、对某一任务节点，若它有且仅有一个相邻的前序节点，且该任务节点与该前序节点合并后...

【专利技术属性】
技术研发人员：胡海洋，刘占晨，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人