当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于LDA跨域的构建服务知识图谱实现服务组合优化的方法及系统技术方案

技术编号:29926187 阅读:61 留言:0更新日期:2021-09-04 18:46
本发明专利技术涉及一种基于LDA跨域的构建服务知识图谱实现服务组合的方法及系统,包括:(1)抓取服务数据;(2)处理语义信息:对服务描述等信息进行处理,对响应的服务描述信息进行修正,使得不同领域的服务在能保持原有特性的基础上,和相近领域的服务保持关联,使抽取出来不同服务实体之间的关联关系更加合理紧密地连接不同领域的服务;(3)构建语义本体库;(4)构建知识图谱:抽取上述服务领域知识的实体以及实体之间的关系,导入Neo4j数据库中;(5)服务组合优化:基于已构建的知识图谱,利用部分可观察马尔科夫决策过程给服务组合问题建模,并结合基于循环神经网络的深度强化学习优化服务组合过程。本发明专利技术能实现服务组合的优化。本发明专利技术能实现服务组合的优化。本发明专利技术能实现服务组合的优化。

【技术实现步骤摘要】
一种基于LDA跨域的构建服务知识图谱实现服务组合优化的方法及系统


[0001]本专利技术涉及一种基于LDA跨域的构建服务知识图谱实现服务组合的方法及系统,属于服务组合优化领域。

技术介绍

[0002]服务组合(service composition)是指以特定方式(取决于服务组合语言)按给定应用逻辑将若干服务组合成为一个逻辑整体的方法、过程和技术。它主要是通过组合不同服务来获得更大粒度的服务,最终由多个单一服务或者简单服务实现支持解决复杂问题或实现复杂功能业务需求的组合服务。依据构建服务组合过程中的人工参与程度,由高到低依次可分为基于工作流的人工服务组合、交互式的服务组合以及自动服务组合。
[0003]但是在实际应用中,由于网络环境的不可预知性以及服务自身的演变甚至外部环境的变化都会导致服务组合的动态变化,这依然会给现有的服务组合技术的计算效率带来极大挑战。因此,服务组合方面在计算机领域需要研究的就是如何在组合过程中尽量减少人工的干涉的同时,自动地快速提供满足用户功能需求的服务组合,那么语义驱动的服务组合是有效实现这一需求的方式,即在语本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,其特征在于,包括步骤如下:(1)抓取服务数据:抓取服务描述信息,对服务描述信息进行分词处理,并对服务描述信息根据不同服务固有的类别进行领域划分;(2)处理语义信息:使用自然语言处理技术,对服务描述信息和领域标签信息进行处理,是指:依据不同领域的标签信息,对响应的服务描述信息进行修正,使得不同领域的服务在保持原有特性的基础上,和相近领域的服务保持关联;(3)构建语义本体库;通过对WSDL文件以及服务描述信息的语义提取,将语义信息转化为语义本体描述存入语义本体库;(4)构建知识图谱:抽取服务即实体以及实体之间的关系,以csv格式导入Neo4j数据库中;(5)服务组合优化:基于已构建的知识图谱,构建自适应性深度强化学习组合网络,基于自适应性深度强化学习组合网络深度强化学习优化服务组合。2.根据权利要求1所述的一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,其特征在于,步骤(2)中,处理语义信息,包括步骤如下:a、使用隐含狄利克雷分布分析服务描述信息和地理位置信息;使用隐含狄利克雷分布用来计算每个服务相近的主题模型,并将服务描述信息投影映射到由多个主题组成的向量空间,其中,领域标签信息经过独热编码被视为特殊的词汇,该特殊的词汇以出现的频率被添加到服务描述信息中去;被添加的Top

N词汇l在形式上满足如下式(I):式(I)中,γ系数由公式确定,ω、η、δ都是在程序中手动设定的参数,用以限制γ的范围,l
i
是指文档中出现的不同词语在该文档中的频率;f
wd
是指文档中出现的不同词语在全部语料库中的频率;f
l
是不同服务的Top

N地理位置计数频率;b、使用吉布斯采样进行近似处理,具体是指:输入服务描述d、参数α和β、主题数目K、地理位置信息l,参数α和β是在隐含狄利克雷分布中所需要的参数,进行服务语义建模,在服务语义建模之后,获得文档

主题概率分布矩阵φ和主题

词语概率分布矩阵Θ。3.根据权利要求2所述的一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,其特征在于,步骤b的具体实现过程包括:c、对Top

N词汇l使用聚类算法聚类并进行过滤,将Top

N词汇l以步骤a所述的以出现的频率添加相应的服务描述信息中去;d、初始化列统计变量,对语料库每个词进行吉布斯采样,采样主题词,并赋予每一个服务描述文档可能的主题词,不断进行收敛与更新,直至获取到最终的主题词共现频率矩阵;e、统计语料库的主题词汇共现频率矩阵,获取到服从多项式分布的主题

词语概率分布矩阵Θ和文档

主题概率分布矩阵φ。4.根据权利要求1所述的一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,
其特征在于,步骤(3)中,构建语义本体库,包括步骤如下:f、如果语义本体库中的服务无服务描述信息,则自动生成服务描述信息,进入步骤g;否则,结束;g、导入服务描述信息,存储服务的服务描述信息,既得语义本体库。5.根据权利要求3所述的一种基于LDA跨域的构建服务知识图谱实现服务组合的方法,其特征在于,步骤(4)中,构建知识图谱,包括步骤如下:h、基于上述步骤实现的服务描述信息的抽取以及关系的抽取;通过服务注册中心获取服务注册表,根据服务注册表中服务事实,获取其输入状态及输出状态;步骤(1)中对服务描述信息进行分词处理后得到若干主题词;文档

主题概率分布矩阵φ是指服务描述信息与主题词的相关度;这是服务描述信息的抽取;服务的输入参数和输出参数信息存在于OWL

S文件中,即实现了对关系的抽取;i、基于已有特征构建知识图谱,分为两部分:第一部分:基于输入状态及输出状态构建知识图谱,抽取出的关系三元组为...

【专利技术属性】
技术研发人员:戴鸿君李秀萍
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1