一种基于数据细胞模型的Web服务演化方法技术

技术编号:19425596 阅读:21 留言:0更新日期:2018-11-14 10:40
一种基于数据细胞模型的服务演化方法,包括以下步骤:第一步、结合Bigraph理论,建立一个服务演化框架,分为信息抽取和细胞建模及服务行为演化分析两阶段;第二步、基于所述的框架提出的基于数据细胞模型的服务演化方法,过程如下:步骤2.1:Web服务的信息抽取;步骤2.2:细胞建模;步骤2.3:服务行为演化:结合服务与生物细胞特性构建DCEM,随着用户需求与资源变更的变化,数据细胞发现现有的内部服务结构已经不能提供高质量的服务能力,需要进行相应的行为演化,使之在需求频繁变更和资源动态更新的情况下也能够高效的提供服务。本发明专利技术提高系统的灵活性,使系统能够适应复杂的分析应用。

【技术实现步骤摘要】
一种基于数据细胞模型的Web服务演化方法
本专利技术涉及Web服务组合领域,尤其是数据服务的组合演化方法。
技术介绍
数据即服务(DataasaService,DaaS)是一种新兴的云计算服务模式,通过互联网上的不同协议以及时、低成本的方式向消费者按需提供数据。DaaS的主要目标是克服数据技术中先进方法的局限性,根据这些方法存储数据,并从位置已知且与共享、处理相关的存储库中访问数据。利用DaaS不仅可以随时随地支持数据访问,而且可以降低数据管理成本。不同类型的DaaS,允许消费者在大量丰富的数据源上执行数据请求和分析,提高了对数据的访问灵活性。例如Azure的DataMarket、大数据平台供应商Infochimps与开发位置数据平台Factual。以及随之产生的一系列研究系统。然而,由于单个数据服务功能单一,难以满足在复杂网络环境中各个消费者的需求,因此,服务组合已成为面向服务架构(ServiceOrientedArchitecture,SOA)中构建新服务和满足业务需求的主要手段,在业务流程的构造和重组中处于核心地位。但高动态的Web服务运行环境和多样化的用户需求增加了服务组合的动态适应难度。事实上,现有的这类服务组合系统并没有过多考虑全局设计与固定需求目标,其内的每个组成服务个体为了自身的利益最大化而提供服务,系统松散结合并根据需求变化或者自身利益而演化。因此,如何有效的对服务组合演化进行演化建模和对服务行为进行分析,成为了现有研究必须应对的问题。服务组合的演化不同于传统的软件演化,由于服务有着多源、异构以及自治的特点,并且具备动态特性,使得服务组合的演化面临着更严峻的挑战。目前国内外学者在服务演化建模及其行为特征方面进行了大量研究,取得了一定的成果。在服务组合演化建模方面,牛津大学的Aitor将环境的服务及其功能抽象为语义Web服务,提出一个支持用户请求和服务行为动态推理的自适应服务组合框架,但是该组合框架的理论方法主要适用基于物联网的智能城市应用,在其他的应用场景有一定的局限性。科尔多瓦大学的Aurora基于多目标的优化分析Web服务质量(QoS),实现在复杂服务网络中选取QoS侧重点不同的服务组合方案,从而解决Web服务绑定问题的适用性。但是由于多目标算法计算复杂度较高,只能较好适用于设计阶段的服务组合,不能很好的在运行时实现优化过程。对于服务组合的行为分析主要从单个服务或者组合服务的角度,采用例如Petri网、进程代数、π演算等形式化的方法进行分析,并在服务组合的行为兼容性和组合有效性方面进行考察,例如,同济大学的Chen提出一种处理模糊语义服务的输入/输出兼容性和行为约束兼容性的自动Web服务组合方法,首先将用户输入/输出需求建模为Horn子句集,然后应用模糊谓词Petri网对字句集进行建模,最终构造一个FPPN模型显示所选服务的调用顺序。爱丁堡大学的Petros在经典线性逻辑中利用过程范式证明来进行复杂Web服务组合,提出一个基于线性逻辑和π演算严格定理证明的Web服务组合论述,但以上的研究主要集中在具体服务的抽象行为和语义分析,不能很好的支持在动态上下文环境中服务行为的有效分析,在环境发生改变时,容易产生服务的性能下降以及组合失效等问题。南京大学的Song在服务组合演化中提出一套演化操作准则,只要开发人员在系统演化过程中正确修改服务组合,就可以保证Web服务组合的数据流的正确性,而不必重新对整个Web服务组合的数据流正确性进行验证。缺点是提出的演化准则较为复杂,在实际应用中可行性不高。生物细胞作为一种结构精密的形态整体,在生长、分化和生理活动过程中其结构能根据环境不断发生变化。在分析细胞的多种复杂的生物特性后,发现将服务组合的动态行为与生物细胞的行为方式进行比较,在某些方面两者呈现出一定的相似特效。因此可以将数据服务同生物细胞结合,通过模拟生物细胞的智能行为,来分析服务组合的演化行为。例如,北京大学的Zhang提出的活化细胞理论,将数据组织为一组活化细胞,每个细胞是与计算能力相结合的数据集合,随着用户需求的变化,活化细胞可以自发演变满足新的查询负载,但是其只是提出了一种理论方法,并没有对数据与细胞结合的可行性进行分析。Zhang等人之后提出一种基于活化细胞理论的面向数据服务体系结构,将活化细胞作为系统的基本单元,细胞之间具有嵌套与层次结构,并具有一系列交互能力,在系统层次提高了数据的分析能力与系统的灵活性。但是其理论主要应用于数据服务体系的非线性任务中提高异构数据的可伸缩性和灵活性。并没有对细胞交互行为进行很好的形式化描述与演化推理。云南大学Wei通过对Spark集群和生物的DNA/RNA测序结合,全面研究了各生物信息学阶段对不同工作负载的性能影响,但是其主要目的在于解决Spark系统上如何有效管理生物信息的数据分析服务。
技术实现思路
为了克服传统的形式化方法很难对数据细胞的生命活动进行准确推理的不足,本专利技术以数据细胞为载体,基于Bigraph理论,针对数据即服务的思想提出一种基于数据细胞模型的服务演化方法,将数据服务封装为具有智能行为的数据细胞,从而在数据细胞的层次进行服务组合的演化建模和动态行为分析;该方法通过对数据细胞的静态结构和动态行为模型进行设计与分析,以提高系统的灵活性,使系统能够适应复杂的分析应用。为了解决上述技术问题本专利技术所采用的技术方案是:一种基于数据细胞模型的服务演化方法,所述服务演化方法包括以下步骤:第一步、结合Bigraph理论,建立一个服务演化框架,分为信息抽取和细胞建模及服务行为演化分析两阶段;1.1、信息抽取和细胞建模:提取服务的相关描述信息,得到服务描述元数据,基于抽取的服务信息,根据服务的语法信息匹配服务操作参数与资源状态,基于Bigraph理论构建数据细胞和数据细胞簇的结构及生物特性,代表服务的状态信息与服务间潜在的调用关系;1.2、服务行为演化:将数据细胞和数据细胞簇作为服务的演化行为方式的载体,选取数据细胞和细胞簇,按照吸收消化、进化生物细胞行为定义服务的组合生长规则,模拟服务生成组合服务的行为模式;构建基于数据细胞的服务演化模型;第二步、基于所述的框架提出的基于数据细胞模型的服务演化方法,过程如下:步骤2.1:Web服务的信息抽取在Web服务的信息抽取阶段,将服务的名称映射为s,每个服务对应一个控制C,唯一,组成规则为:C=s:cotrol;将服务的可用性度量映射为U,将服务的端口的ID、名称和类型分别映射为pI、pN和pT,另外将端口的控制类型映射为pC,代表此端口是输入、输出还是输入/输出;将此服务和其他服务的依赖状态映射为CL,组成规则为:CL=<DL,CN>,其中,DL是当前服务的依赖层次,CN则是与之依赖的另一个服务的控制名称;步骤2.2:细胞建模对于服务的形式化建模需要根据映射规则,将服务的结构和消息交互行为加以映射到对应形式化结构和动作,从而通过形式化的方法对服务及其组合进行进程演算;步骤2.3:服务行为演化服务组合以服务间的按需聚合为主要运行模式,以动态适应、随需演化作为其运行特征,在不可预测的用户需求驱动下,各协同服务形成错综复杂的交互关系,各服务进程需要与其他服务以一系列操作序列形式进本文档来自技高网
...

【技术保护点】
1.一种基于数据细胞模型的服务演化方法,其特征在于,所述服务演化方法包括以下步骤:第一步、结合Bigraph理论,建立一个服务演化框架,分为信息抽取和细胞建模及服务行为演化分析两阶段;1.1、信息抽取和细胞建模:提取服务的相关描述信息,得到服务描述元数据,基于抽取的服务信息,根据服务的语法信息匹配服务操作参数与资源状态,基于Bigraph理论构建数据细胞和数据细胞簇的结构及生物特性,代表服务的状态信息与服务间潜在的调用关系;1.2、服务行为演化:将数据细胞和数据细胞簇作为服务的演化行为方式的载体,选取数据细胞和细胞簇,按照吸收消化、进化生物细胞行为定义服务的组合生长规则,模拟服务生成组合服务的行为模式;构建基于数据细胞的服务演化模型;第二步、基于所述的框架提出的基于数据细胞模型的服务演化方法,过程如下:步骤2.1:Web服务的信息抽取在Web服务的信息抽取阶段,将服务的名称映射为s,每个服务对应一个控制C,唯一,组成规则为:C=s:cotrol;将服务的可用性度量映射为U,将服务的端口的ID、名称和类型分别映射为pI、pN和pT,另外将端口的控制类型映射为pC,代表此端口是输入、输出还是输入/输出;将此服务和其他服务的依赖状态映射为CL,组成规则为:CL=...

【技术特征摘要】
1.一种基于数据细胞模型的服务演化方法,其特征在于,所述服务演化方法包括以下步骤:第一步、结合Bigraph理论,建立一个服务演化框架,分为信息抽取和细胞建模及服务行为演化分析两阶段;1.1、信息抽取和细胞建模:提取服务的相关描述信息,得到服务描述元数据,基于抽取的服务信息,根据服务的语法信息匹配服务操作参数与资源状态,基于Bigraph理论构建数据细胞和数据细胞簇的结构及生物特性,代表服务的状态信息与服务间潜在的调用关系;1.2、服务行为演化:将数据细胞和数据细胞簇作为服务的演化行为方式的载体,选取数据细胞和细胞簇,按照吸收消化、进化生物细胞行为定义服务的组合生长规则,模拟服务生成组合服务的行为模式;构建基于数据细胞的服务演化模型;第二步、基于所述的框架提出的基于数据细胞模型的服务演化方法,过程如下:步骤2.1:Web服务的信息抽取在Web服务的信息抽取阶段,将服务的名称映射为s,每个服务对应一个控制C,唯一,组成规则为:C=s:cotrol;将服务的可用性度量映射为U,将服务的端口的ID、名称和类型分别映射为pI、pN和pT,另外将端口的控制类型映射为pC,代表此端口是输入、输出还是输入/输出;将此服务和其他服务的依赖状态映射为CL,组成规则为:CL=<DL,CN>,其中,DL是当前服务的依赖层次,CN则是与之依赖的另一个服务的控制名称;步骤2.2:细胞建模对于服务的形式化建模需要根据映射规则,将服务的结构和消息交互行为加以映射到对应形式化结构和动作,从而通过形式化的方法对服务及其组合进行进程演算;步骤2.3:服务行为演化服务组合以服务间的按需聚合为主要运行模式,以动态适应、随需演化作为其运行特征,在不可预测的用户需求驱动下,各协同服务形成错综复杂的交互关系,各服务进程需要与其他服务以一系列操作序列形式进行会话,结合服务与生物细胞特性构建数据细胞模型DCEM,随着用户需求与资源变更的变化,数据细胞发现现有的内部服务结构已经不能提供高质量的服务能力,需要进行相应的行为演化,使之在需求频繁变更和资源动态更新的情况下也能够高效的提供服务。2.如权利要求1所述的一种基于数据细胞模型的服务演化方法,其特征在于,所述步骤2.2中,给出的形式定义如下:定义1.数据细胞的Bigraph定义是一个五元组DC=<S,E,Ctrl,CP,CL>:<m,X>→<n,Y>,其中,(1)S是数据细胞内包含有限的服务集,称为一个数据服务;对于数据细胞DCi,其内最多可有Ni个数据服务;(2)E是包含服务集的有限边集合,称为一条连接边;(3)Ctrl:S→C,代表服务到控制C的映射图;(4)CP、CL为位置图和连接图,分别表示各计算服务的所在位置和服务之间的依赖关系;(5)内部接口<m,X>代表数据细胞的Bigraph形式中有m个根和一组内连接边集合X,外部接口<n,Y>代表有n个site和一组外连接边集合Y;定义2.服务的控制C是五元组C=<CN,CT,P,CL,U>,代表该服务的上下文关系,其中,(1)CN和CT分别是该服务控制的名称和类型;(2)P是当前服务控制上端口的有限集,称为一个端口;(3)CL=<DL,CN>,代表该服务当前的依赖状态,DL是当前服务的依赖层次,CN是与之依赖的控制名称;(4)U是当前服务的可用性度量,是一个概率值;定义3.服务的依赖层次DL代表该服务的组合结构,取值来自状态集{⊙,《,》},其中⊙,《,》分别代表此服务和其他服务为无依赖、前置依赖、后置依赖等关系;定义4.端口的定义是一个四元组p=<pI,pN,pT,pC,>,其中,(1)pI和pN分别是该端口的ID和名称;(2)pT是该端口的类型,代表接口参数的类型;(3)pC是该端口的控制属性,取值来自状态集其中分别代表该端口是输入端口、输出端口还是输入/输出端口;数据细胞的Bigraph定义目的在于构造数据细胞的结构和生物特性,每一个数据细胞对应一个原子服务或者复合服务,从而体现服务的结构资源特点和相互依赖关系,数据细胞的具体结构和元素定义详见表1,一个数据细胞对应Bigraph中的root,数据细胞中的每个服务对应Bigraph中的节点,服务之间的依赖关系为Bigraph中节点的连接边,每个服务的基本信息和上下文关系对应Bigraph中节点的控制,服务的每个输入、输出端口对应Bigraph中节点端口的形状;表1由于单个数据细胞提供的服务功能相对较为单一,但在实际应用中,为满足用户日益复杂的需求,需要从网络上选择合适的服务并按照一定的业务规则进行组合,构建可伸缩的松耦合的组合,数据细胞簇基于服务组合的四种工作流模式,由多个数据细胞按照功能属性和需求调用动态聚集组合而成;数据细胞基于Bigraph的合成、并置规则从而形成数据细胞簇,数据细胞簇同样能够消化从环境中感知吸收和其他数据细胞交流的信息,智能地与其他数据细胞进行互动,从而可以提供更加精确复杂的服务功能;DCEM中数据细胞簇的相关形式定义如下:定义5.数据细胞簇的定义是一个三元组DCC=<DCS,CS,LinkS>,其中,(1)DCS是一个数据细胞的有限集,称为一个数据细胞;(2)CS是数据细胞组合结构的有限集;(3)LinkS是数据细胞簇中各端口的连接集合,称为两个端口的连接关系;定义6.数据细胞的组合结构cs是一个三元组cs=<DCi,DCj,St>,其中,(1)DCi、DCj分别代表数据细胞i和数据细胞j,且满足DCi∩DCj=Φ;(2)St是该组合数据细胞的依赖结构,取值来着状态集{·、+、||、*},分别代表这数据细胞DCi与DCi组合是顺序、选择、并行或者循环结构;定义7.端口的连接关系是一个二元组Link=<pi,pj>,其中,pi、pj分别代表两个不同数据服务的端口,且满足pi∩pj=Φ;项语言是Bigraph动态演化的形式化规约和性质验证的基础,不同工作流模式的数据细胞簇项语言定义具有通用特征,为了更好的描述不同服务结构数据细胞簇的项语言定义,归纳总结一系列符号和定义,如表2所示:符号定义DCm第m个数据细胞Sn第n个数据服务ei第i条数据服务连接边ij,第j个内部名Ij,用外部名替换的第j个内部名ok第k个外部名表2通过Bigraph中项语言的表达理论和表2中基于数据细胞结构的相关定义,对上文所述的基于服务组合工作流模式构造的数据细胞簇分析,在数据细胞簇项语言形式化上下文中,定义基本代数概念,所述基本代数概念包括基调和项集;定义8:数据细胞簇形式化定义上的基调∑由类子:数据细胞集DC、数据服务集S、边集E、内部连接集I、外部连接集O、地点集N和一系列操作符·、+、||、*组成,每个操作符f的操作数记为ar(f);定义9:令Σ是数据细胞簇形式化定义上的基调,则基调Σ上的项集∏(Σ)是满足以下条件的最小集合:(1)每个类子变量都是项集中的元素;(2)(3)如果f∈Σ,且DC1,DC2,...,DCiar(f)∈∏(Σ),那么f(DC1,DC2,…,DCiar(f))∈∏(Σ);定义10:令Σ是数据细胞簇形式化定义上的基调,∏(Σ)是基调Σ上的项集,若u(f)∈∏(Σ),则称u(f)为基于操作f的项;项的定义也可采用结构归纳定义,表示成以下形式:其中::=表示归纳定义,ELrule代表数据细胞簇Bigraph形式中边和连接的形式化定义,DCi代表单个数据细胞的项语言定义,m为数据细胞的个数。3.如权利要求2所述的一种基于数据细胞模型的服务演化方法,其特征在于,所述步骤2.3中,吸收消化和进化的流程如下:2.3.1吸收消化行为在需求动态变化的环境中,当现有的数据服务不能很好的满足需求,或者发现细胞内服务的缺失时,数据细胞可以通过吸收消化行为获取其他数据细胞内的服务,从而完善自身的服务...

【专利技术属性】
技术研发人员:陆佳炜周焕高燕煦吴涵张元鸣高飞肖刚
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1