一种基于语义相似度的API Framework服务发现方法技术

技术编号:22329799 阅读:35 留言:0更新日期:2019-10-19 12:13
一种基于语义相似度的API Framework服务发现方法,基于API Framework中服务收集模块不断收集服务信息,将服务信息描述为WSDL标准化文档形式;抽取对应的信息内容构造服务属性信息;将同义词集进行组织,得到两个概念或者两个句子直接的语义相似度;针对属性相似度,分别求解服务之间的相似度,最后获得服务相似度,并判别该服务是否属于新的服务类别,从而判断是否将其加入到API Framework服务集中。本发明专利技术通过引入计算机领域的语义词典,通过多种语义相似度计算方法的集成,可以有效的辅助服务信息的发现,增强系统的服务范围。

An API framework service discovery method based on semantic similarity

【技术实现步骤摘要】
一种基于语义相似度的APIFramework服务发现方法
本专利技术涉及5G网络能力开放应用程序框架(APIFramework)的服务发现问题,特别涉及一种基于语义相似度的APIFramework服务发现方法。
技术介绍
工业互联网已成为产业升级发展的必然趋势,5G网络依靠多接入、广覆盖、高性能以及丰富的网络控制和组网方案等优势功能,正在逐渐成为工业企业优先考虑的部署选择。与此同时,5G移动通信系统标准化成为一个亟待解决的问题。在标准化组织第三代合作伙伴计划(3GPP)中,存在多个北向应用程序接口(API)相关规范(例如,用于3GPP技术规范(TS)23.682中定义的服务能力暴露功能(SCEF)功能的API,用于MBTS服务提供商和3GPPTR26.981中定义的BM-SC之间的接口的API)。为避免不同API规范之间的方法重复和不一致,3GPP考虑开发通用API框架(CAPIF),其中包括适用于任何北向服务API的常见方面。参照R15能力开放标准规范,研发出API网关(GW)系统,提供基于Restful的网络能力开放API,为第三方提供调用获得相关网络能力(如用户位置、基于业务要求的数据传输QoS保障等)的服务;设计能力开放APIFramework,实现API的注册,发现及授权机制,进行标准化操作从而弥补现有技术中不能为APIFramework的管理提供一套完整解决方案的问题。基于5G通信技术和网络的不断发展和演进,在APIFramework中构造Restful形式的服务集,为用户提供更加高效、便捷的服务。然而在服务大规模增长的场景下,APIFramework如何在保证服务集完备性和健壮性的前提下,通过服务之间相似度的衡量,从而发现新的服务类别来扩展该APIFramework的服务范围。其中,服务发现依赖于服务之间的相似度,而服务之间的相似度最终转化为对于API中的概念语义相似度的计算,传统的语义相似度计算方法分为四类,分别为基于距离的方法、基于信息量的方法、基于属性的方法以及混合式方法。这四种语义相似度计算方法特点如下:(1)基于距离的方法基于距离计算语义相似度的思想:在本体概念结构树中通过向量化概念词来计算两个概念之间的路径长度,通过两个概念在路径维度上的结果得出相似度关系,规定两个概念词在本体层次树中的路径长度越大,相似度越小。传统基于距离的计算方法主要利用了语义字典(WordNet)中的上下位结构信息来计算相似度,方法简单易实施,但是由于只利用距离、深度、宽度等语义信息进行计算,在计算的准确性方面表现较差,从而影响了服务发现的效率。(2)基于信息量的方法基于信息量计算语义相似度的方法是将概念的信息量与本体知识相结合,即认为概念对之间共享信息量越高,其概念的差异信息量越少,相似度则越高。其中,共享信息量根据共享的父节点信息量计算,而差异信息量根据各个概念与共享父节点的差量来计算。在本体的概念结构树中,每个概念子节点可以认为是根节点的实例化以及概念的扩展,因此根据其父节点之间的信息量的关系可以计算其概念之间的相似度。基于信息量的语义计算方法能够客观的反应概念节点在语义、语法等方面的相似度和差异性,但其最大的问题是,信息量的计算依赖于语料库,不同的语料库存在较大的差异,使用不同的语料库计算也会产生很大的差异,从而导致其语义相似度的计算很难形成统一的结果,从而影响其服务发现的可信度。(3)基于属性的方法基于属性的语义相似度计算方法主是通过两个概念之间属性集的相似程度来衡量语义的相似度关系。基于属性的语义相似度基于本体属性的重叠程度来计算语义相似度,从而更好地解决跨本体的语义相似度问题,从而很好的弥补了基于距离计算语义相似度时无法跨本体的问题。基于属性的方法依赖概念节点具有完备的属性集,对于WordNet等大型本体字典才会拥有丰富的语义知识,而其他的特定领域词典不会含有足够的语义内容,从而造成属性的相似度无法有效的计算,影响最终语义相似度的准确率,导致其服务发现的效率比较低。(4)混合式方法不同于基于距离、基于信息量以及基于属性的计算方法,混合式的计算方法充分利用多种语义信息,对于各种计算因素加以不同的权重,得到最终的相似度计算结构。由于使用语义信息更加充分,该方法能够极大的挖掘语义信息来提高准确度。然而,由于其需要根据领域本体设置权值,从而权重设置的不确定性影响了这种方法的普适性,通用的语义词典很难满足特定的业务需求,导致在设定的应用场景下服务发现效率比较低。考虑到传统方法严重影响服务发现效率的情况,因而,计算方法并不能直接应用于APIFramework服务发现中,必须根据其所属领域对其相似度计算方法进行改进。
技术实现思路
本专利技术的目的在于解决APIFramework系统中服务发现问题,提供一种基于语义相似度的APIFramework服务发现方法,该方法在构建基于计算机领域知识网络的基础上,通过计算服务之间各个属性的相似度,从而对服务之间的总体相似度进行准确的分析,根据分析的结果做出决策,可以有效的解决由于语义相似度计算准确性不够而引起无法准确发现服务的情况。为了达到上述目的,本专利技术采用了以下技术方案:一种基于语义相似度APIFramework服务发现方法,包括以下步骤:1)基于APIFramework中服务收集模块不断收集服务信息,如果没有获得服务信息则继续服务收集工作,否则将服务信息描述为WSDL标准化文档形式;同时抽取对应的信息内容构造服务属性信息;2)将语义词典内所有的术语和概念都以同义词集合的形式表示,将同义词集进行组织,得到知识网络;3)对步骤2)的知识网络,使用word2vec模型训练分好词的语料,得到训练好的词向量文件,基于训练好的的词向量文件和步骤1)得到的服务属性信息,得到两个概念或者两个句子直接的语义相似度;4)针对属性相似度,分别求解服务之间的相似度,最后使用线性加权的方式获得服务相似度;5)针对步骤4)得到的服务相似度,判别该服务是否属于新的服务类别,从而做出是否将其加入到APIFramework服务集中的决策。本专利技术进一步的改进在于:步骤2)中,语义词典通过以下过程构造:选择计算机领域本体的概念及概念关系来源,获取概念及其属性间的关系,生成本体概念层次,并将其映射到OWL语言,采用相关性分析方法对构建的本体网络结构信息进行分析,通过挖掘上下位结构发现不同类目间的关联关系以及进行本体映射研究,并且建立概念的层级,挖掘本体的语义信息,发现本体中的隐含知识,从而构造语义词典。本专利技术进一步的改进在于:步骤3)中,两个概念或者两个句子直接的语义相似度sims(t1,t2)采用以下公式计算得到;其中S1·S2表示两个句子的向量点乘;||Si||表示句子Si向量的长度。本专利技术进一步的改进在于:步骤4)中,属性相似度通过以下过程得到:针对服务属性信息中的概念,计算概念之间的平均语义相似度;根据概念之间的平均语义相似度得到属性wsName与wsDesp的相似度;属性OprSet中的oprName属性使用字符串匹配算法计算相似度,相等为1,不相等为0;根据两个概念或者两个句子直接的语义相似度、基于距离的语义相似度以及基于信息量的语义相似度,构造带权二分图模型,在该带权二分图模型上计本文档来自技高网
...

【技术保护点】
1.一种基于语义相似度API Framework服务发现方法,其特征在于,包括以下步骤:1)基于API Framework中服务收集模块不断收集服务信息,如果没有获得服务信息则继续服务收集工作,否则将服务信息描述为WSDL标准化文档形式;同时抽取对应的信息内容构造服务属性信息;2)将语义词典内所有的术语和概念都以同义词集合的形式表示,将同义词集进行组织,得到知识网络;3)对步骤2)的知识网络,使用word2vec模型训练分好词的语料,得到训练好的词向量文件,基于训练好的的词向量文件和步骤1)得到的服务属性信息,得到两个概念或者两个句子直接的语义相似度;4)针对属性相似度,分别求解服务之间的相似度,最后使用线性加权的方式获得服务相似度;5)针对步骤4)得到的服务相似度,判别该服务是否属于新的服务类别,从而做出是否将其加入到API Framework服务集中的决策。

【技术特征摘要】
1.一种基于语义相似度APIFramework服务发现方法,其特征在于,包括以下步骤:1)基于APIFramework中服务收集模块不断收集服务信息,如果没有获得服务信息则继续服务收集工作,否则将服务信息描述为WSDL标准化文档形式;同时抽取对应的信息内容构造服务属性信息;2)将语义词典内所有的术语和概念都以同义词集合的形式表示,将同义词集进行组织,得到知识网络;3)对步骤2)的知识网络,使用word2vec模型训练分好词的语料,得到训练好的词向量文件,基于训练好的的词向量文件和步骤1)得到的服务属性信息,得到两个概念或者两个句子直接的语义相似度;4)针对属性相似度,分别求解服务之间的相似度,最后使用线性加权的方式获得服务相似度;5)针对步骤4)得到的服务相似度,判别该服务是否属于新的服务类别,从而做出是否将其加入到APIFramework服务集中的决策。2.根据权利要求1所述的一种基于语义相似度APIFramework服务发现方法,其特征在于:步骤2)中,语义词典通过以下过程构造:选择计算机领域本体的概念及概念关系来源,获取概念及其属性间的关系,生成本体概念层次,并将其映射到OWL语言,采用相关性分析方法对构建的本体网络结构信息进行分析,通过挖掘上下位结构发现不同类目间的关联关系以及进行本体映射研究,并且建立概念的层级,挖掘本体的语义信息,发现本体中的隐含知识,从而构造语义词典。3.根据权利要求1所述的一种基于语义相似度APIFramework服务发现方法,其特征在于:步骤3)中,两个概念或者两个句子直接的语义相似度sims(t1,t2)采用以下公式计算得到;其中S1·S2表示两个句子的向量点乘;||Si||表示句子Si向量的长度。4.根据权利要求1所述的一种基于语义相似度APIFramework服务发现方法,其特征在于:步骤4)中,属性相似度通过以下过程得到:针对服务属性信息中的概念,计算概念之间的平均语义相似度;根据概念之间的平均语义相似度得到属性wsName与wsDesp的相似度;属性OprSet中的oprName属性使用字符串匹配算...

【专利技术属性】
技术研发人员:曲桦赵季红边江张艳鹏李佳琪李明霞
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1