【技术实现步骤摘要】
本专利技术属于科学工作流
,涉及一种面向科学工作流不确定数据源的视图构造方法。
技术介绍
近年来,随着计算机网络技术飞速发展,作为新型互联网的后端支撑基础云计算技术已开始逐步走向人类社会生活。科学工作流是一类典型的面向海量密集型数据流、以减少计算成本为目标的应用系统,它的出现为跨多类学科和跨不同地域的科研合作提供了方便。在科学工作流系统中,海量数据密集型计算与分布式资源共享彼此间协作、无隙地进行,使得具有不同领域专业知识、地理位置分布的科研工作者可跨组织合作完成相关的科学实验。科学工作流系统现已在各国的科研院所展开应用,并在生物信息学、社会关系分析、气象学、物理学等多个领域都发挥了应有的作用。在云计算环境下进行科学工作流运行 时,将产生大量的中间数据和结果,对这些数据进行管理与分析有助于科研工作者对复杂、多步骤的科学实验进行描述和分析。为了保证实验结果的可重复性与可验证性,许多科学工作流系统都提供了对数据源的支持。由于复杂、大规模的科学工作流系统在运行过程中将产生大量的数据源。如何对这些海量的数据源进行有效地查询与管理现已成为科研工作者研究的重要问题之一,目前许多 ...
【技术保护点】
云计算环境下面向不确定数据源的工作流视图构造方法,其特征在于该方法的具体步骤:步骤(1)读取科学工作流的数据源图信息,包括数据源图中任务节点集、任务节点间的数据流边的集合和数据流边的存在概率;?步骤(2)将整个数据源图视为一个完整的工作流视图,检测它的合理性,包括:①根据数据源图中的每条输入数据流必须能够到达该数据源图的所有输出任务节点这一原则,来检测数据源图的合理性;②数据源图中的相邻任务节点在满足条件①的情况下能否合并为一个新的复合任务、且新的复合任务存在概率是否小于未合并之前各任务节点的存在概率,如果合并后的新复合任务存在概率大于合并之前各任务节点的存在概率,则认为原 ...
【技术特征摘要】
1.云计算环境下面向不确定数据源的工作流视图构造方法,其特征在于该方法的具体步骤 步骤(I)读取科学工作流的数据源图信息,包括数据源图中任务节点集、任务节点间的数据流边的集合和数据流边的存在概率; 步骤(2)将整个数据源图视为一个完整的工作流视图,检测它的合理性,包括 ①根据数据源图中的每条输入数据流必须能够到达该数据源图的所有输出任务节点这一原则,来检测数据源图的合理性; ②数据源图中的相邻任务节点在满足条件①的情况下能否合并为一个新的复合任务、且新的复合任务存在概率是否小于未合并之前各任务节点的存在概率,如果合并后的新复合任务存在概率大于合并之前各任务节点的存在概率,则认为原来的数据源图具有不合理性; 若数据源图具有合理性,则整个数据源图被视为一个完整的工作流视图; 步骤(3)若步骤(2)中整个数据源图将作为一个工作流视图被检测为不合理的,则按照以下两种情况重新构造该数据源图的合理性视图 i)若数据源图因为不符合步骤(2)中的条件①,则对该数据源图按照步骤(4)进行拆分重构,从数据源图里面重新构造出合理性的视图; )若数据源图不符合步骤(2)中的条件②,则找出数据源图中存在那些相邻任务节点这些相邻任务节点在满足条件①的情况下能合并为一个新的复合任务、且新复合任务存在概率大于未合并之前各任务节点的存在概率,并将这些相邻的任务节点进行合并;步骤(4)对数据源图进行拆分与重构时,按照如下情形处理 情形I、对某一任务节点,若它有且仅有一个相邻的前序节点,且该任务节点与该前序节点合并后...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。