面向自然语言处理的语义Web服务智能代理制造技术

技术编号:3927291 阅读:243 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种面向自然语言处理的语义Web服务智能代理,包括面向自然语言处理的语义Web服务搜索方法和服务智能代理系统,Web服务采集子系统与Web服务搜索引擎通过共享服务仓库实现数据链接;自然语言用户接口与Web服务搜索引擎、自然语言用户接口与服务执行引擎通过TCP网络连接实现数据交换。采用信息抽取法获取描述服务的关键词集,以概率隐含语义索引方法构建服务语义索引,基于WSDL的语义Web服务搜索方法,利用词汇相似度,基于签名文本匹配。提高搜索的精确度并简化算法优化设计,提高了查准率和查全率,具有兼容性,易于推广应用。为面向自然语言处理的智能代理的实际应用解决路径的技术问题,具有突破性的意义。

【技术实现步骤摘要】

本专利技术属于网络通信
,主要涉及语义Web服务(Semantic Web Service, SWS)领域,尤其涉及一种面向自然语言处理的Web服务代理方法和系统,具体是一种面向 自然语言处理的语义Web服务智能代理。
技术介绍
语义Web服务是互联网技术的新领域,又是语义Web和Web服务两个重要分支相 互结合的产物。语义Web服务的主要研究内容是使用更加丰富的、分布式的语义描述元素 进行动态分布式计算。通过使用相关语义描述信息,能够得到更加灵活的自动化服务提供 和使用方式,开发出更加强大的软件开发工具,构建语义服务,并创建基于服务的软件解决 方案的方法。整个语义Web服务的生命周期包括语义Web服务的标注、发布、发现、数据调 制、组合、配置、编排和执行等步骤。Web服务代理是实现语义Web服务的重要基础构件,其 主要作用是提高语义Web服务易用性和简化服务部署过程。Web服务代理是Web服务请求者与Web服务之间的中间件,遵循代理协议,实现 服务请求解析、服务发现、服务数据调制和服务执行等功能。如“A Broker forOWL-S Web services,,,Technical Report, Stanford University Palo Alto, CA, 2004.M. Paolucci, J. Soudry, N. Srinivasan and K. Sycara.所述,代理协议涉及3个参与者请求者、提供者 和代理。请求者通过发送请求到代理启动协议;提供者是服务库中最适合解决请求问题的 提供者。代理协议分为两个部分广告协议和调停协议。广告协议代理采集服务提供者发 布的服务广告(例如服务wsdl文件),这些服务广告将用于选择满足服务请求的最佳服 务提供者。调停协议服务请求者向代理发送询问请求;代理使用其服务发现机制定位能 回答询问的服务提供者;代理依据服务提供者要求格式化服务请求并调用服务;服务提供 者计算服务请求并将计算结果返回代理;代理将服务计算结果按服务请求者要求格式化并 返回请求者。Web服务代理的核心问题是基于服务广告的服务选择(搜索)问题。现有的Web服务搜索方法分为两类基于WSDL的方法和基于领域本体的方法。 基于领域本体的方法又细分为基于0WL_S、基于WSDL_S和WSM0等方法,其中基于WSDL_ S的方法是通过领域本体标注标准WSDL实现。基于领域本体方法的基本思路是构建语 义丰富的 WSDL 文件。文献"Semantic Web Service, Processes and Applications,,,in Semantic Web and Beyond Computing for HumanExperience, R. Jain and A. Sheth, (Eds.) :Springer,2006.深入总结了基于领域本体的Web服务检索方法。由于领域本体的 缺乏和服务代理的通用性,所以基于领域本体的方法很难应用于服务代理。基于WSDL的方法又细分为基于文本和基于语义等方法。基于文本的Web服务 发现方法是最直接的方法,而其最常用方法是UDDI内嵌的关键词匹配方法。UDDIAPI允 许其用户指定感兴趣关键词集,然后其返回服务描述包含指定关键词集的服务列表。文献 H. H. Do and E.Rahm, "C0MA-A system for flexible combination ofschema matching approaches,,,in 28th VLDB Conference, Hong Kong,China,2002 应用各种字符串比较算法(例如前缀、后缀、编辑距离)匹配存在少许拼写错误的可交换关键词集。基于语义的服务搜索方法:C. Platzer and S. Dustdar, "A vector space searchengine for Web Services,,,in Third IEEE European Conference on Web Services,Sweden,2005 采用向量空间模型(Vector Space Model, VSM)构建 Web 服务搜索 弓|擎° 而 A. Saj janhar, J. Hou, and Y. Zhang,"Algorithm for Web Services Matching, ”at APWeb,2004则采用改进的VSM模型(LSA)发现Web服务。上述方法存在下列问题1、上述 方法都需要依赖现存的UDDI注册中心。而由于公共UDDI的永久关闭和服务自然语言描述 的缺乏和无效,因此这些方法都不能满足Web服务代理的需要;2、上述方法基于服务的自 然语言描述工作,由于自然语言词汇的同义和多义现象,查准率(recall)低;3、上述方法 构建的Web服务索引无法解释,从而用户难以理解和使用;4、现有的方法都仅关注了 Web服 务搜索与文本搜索的共性问题,很少基于Web服务代理优化Web服务搜索,提高服务查询的 查准率和查全率。本专利技术项目组对国内外专利文献和公开发表的期刊论文检索,再尚未发现与本发 明密切相关和一样的报道或文献。
技术实现思路
本专利技术的目的是克服上述方法、技术或系统存在的缺点,提供一种接收自然语言 描述的服务请求、搜索相关服务、执行服务和返回自然语言描述的服务结果。基于WSDL的 语义方法,优化Web服务搜索,服务查询查准率和查全率高,遵循Web服务代理协议的一种 面向自然语言处理的语义Web服务智能代理。下面对本专利技术进行详细说明本专利技术要解决的主要问题是提高现有服务查询的查准率和查全率不高的技术问 题;并提供一种查准率和查全率不高的面向自然语言处理的语义Web的服务智能代理。本专利技术的内容包括面向自然语言处理的语义Web服务搜索方法和面向自然语言 处理的语义Web服务智能代理系统,后者更侧重于结构与设备,前者是一种语义Web服务搜 索方法。作为一种面向自然语言处理的语义Web服务搜索方法,其特征在于,包括如下步 骤A、将Web服务采集子系统采集的所有服务描述文件(WSDL)汇集为服务描述文集 C;B、采用信息抽取(Information Extraction, IE)算法,处理服务描述文集C,获取 描述服务语义的关键词;C、从服务描述文集C抽取的所有关键词汇集为服务原始词汇集T ;D、采用词聚类算法,处理服务原始词汇集T,构造服务词汇表D ;E、基于服务词汇表D,采用概率隐含语义索引(pLSI)算法,处理服务描述文集C, 自动构建服务描述文集C的语义索引;F、基于服务描述文集C的语义索引,采用服务搜索算法,处理用户服务请求,从而 实现服务搜索。本专利技术首先采用信息抽取方法获取描述服务的关键词集;然后,采用概率隐含语 义索引(PLSI)方法构建服务语义索引;最后,基于服务描述文件(WSDL)与服务请求的语6义相似度搜索与服务请求相关服务。与基于领域本体的方法不同,本专利技术不依赖于本体方 法而是采用实证方法,从而解决了领域本体的缺乏和通用性问题。与基于语义的服务搜索 方法不同,本专利技术不基于Web服务的自然语言描述工作,而是直接基于WSDL文档工作,通过 WSDL本文档来自技高网
...

【技术保护点】
一种面向自然语言处理的语义Web服务搜索方法,其特征在于,包括如下步骤:A、将Web服务采集子系统采集的所有服务描述文件汇集为服务描述文集C;B、采用信息抽取算法,处理服务描述文集C,获取描述服务语义的关键词;C、从服务描述文集C抽取的所有关键词汇集为服务原始词汇集T;D、采用词聚类算法,处理服务原始词汇集T,构造服务词汇表D;E、基于服务词汇表D,采用概率隐含语义索引算法,处理服务描述文集C,自动构建服务描述文集C的语义索引;F、基于服务描述文集C的语义索引,采用服务搜索算法,处理用户服务请求,从而实现服务搜索。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘志境朱旭东姚勇王静杨伟
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1