当前位置: 首页 > 专利查询>北京大学专利>正文

网络服务的描述信息获取方法和装置制造方法及图纸

技术编号:4271963 阅读:209 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种网络服务的描述信息获取方法和装置,网络服务的描述信息获取方法包括:从网络服务描述语言文件中获取网络服务的自身信息;通过搜索引擎获取与所述网络服务相关的网页信息;解析所述网页信息,并获取网页的主体信息;根据所述网络服务的自身信息和所述网页的主体信息获取所述网络服务的描述信息。网络服务的描述信息获取装置包括第一获取模块、第二获取模块、解析模块和第三获取模块。本发明专利技术实现了自动地获取网络服务的描述信息,便于用户理解该网络服务的功能和使用方法,为用户提供了极大的便利。

【技术实现步骤摘要】

本专利技术涉及软件技术,尤其涉及一种网络服务的描述信息获取方法和装置
技术介绍
随着软件技术的发展,构件技术的出现成为软件技术发展史上的一次变革,基于 构件的软件开发,不仅使软件产品在客户需求吻合度、上线时间、软件质量上领先于同类产 品,提高了项目的成功率,而且对软件的开发和维护变得十分简单,客户可以随时随地应对 商业环境变化和IT技术变化,实现敏捷定制。在目前的基于构件的软件开发过程中,通 常利用软件构件库来保存大量构件,软件构件库是对可复用的软件构件进行管理,并对软 件构件的复用过程提供支持的基础设施。随着网络服务(Web Services)技术的发展,目前 因特网(Internet)环境中的构件资源主要以Web Services的形式出现,Web Services作 为一种布署在网络(Web)上的构件,其应用越来越广泛。 目前,在Internet上存在大量的Web Services资源,用户通常通过普通的搜索引 擎(如谷歌、百度等)来检索想要的Web Services。然而现有的搜索引擎是基于网页信息 的搜索引擎,并未考虑本身的特性,也不能提供专门针对Web Services的搜索服务。而且 用户从现有搜索引擎获取的WebServices大部分不包含用于说明Web Services的主要功 能和接口使用方法的描述信息,或包含很少的描述信息。由于缺乏Web Services的描述信 息,使得用户理解难于理解该Web Services的功能以及使用方法,同时用户也不能方便地 查询禾口检索该Web Services。
技术实现思路
本专利技术的目的在于提供一种网络服务的描述信息获取方法和装置,实现自动地获取网络服务的描述信息,便于用户理解该网络服务的功能和使用方法。为了实现上述目的,本专利技术提供了 一种网络服务的描述信息获取方法,包括 从网络服务描述语言文件中获取网络服务的自身信息; 通过搜索引擎获取与所述网络服务相关的网页信息; 解析所述网页信息,并获取网页的主体信息; 根据所述网络服务的自身信息和所述网页的主体信息获取所述网络服务的描述信息。本专利技术还提供了一种网络服务的描述信息获取装置,包括 第一获取模块,用于从网络服务描述语言文件中获取网络服务的自身信息; 第二获取模块,用于通过搜索引擎获取与所述网络服务相关的网页信息; 解析模块,用于解析所述第二获取模块获取的所述网页信息,并获取网页的主体信息; 第三获取模块,用于根据所述第一获取模块获取的所述网络服务的自身信息和所 述解析模块获取的所述网页的主体信息获取所述网络服务的描述信息。 本专利技术提供的一种网络服务的描述信息获取方法和装置,通过搜索引擎获取与网 络服务相关的网页信息,并根据网络服务的自身信息从相关网页信息中获取网络服务的描 述信息,实现了自动地获取网络服务的描述信息,便于用户理解该网络服务的功能和使用 方法,为用户提供了极大的便利。附图说明 图1为本专利技术网络服务的描述信息获取方法实施例的流程图; 图2为本专利技术网络服务的描述信息获取装置实施例的结构图。具体实施例方式下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。 图l为本专利技术网络服务的描述信息获取方法实施例的流程图,如图l所示,本实施 例提供了一种网络服务的描述信息获取方法,具体包括如下步骤 步骤101,从网络服务描述语言文件中获取网络服务的自身信息。 从网络服务描述语言(Web Services Description Language ;以下简称WSDL) 文件中获取网络服务(Web Services)的自身信息。其中,Web Services是由统一资源标 识符(Uniform Resource Identifier ;以下简称URL)标识的软件应用,该应用的接口和 绑定可通过可扩展标识语言(eXtensiveMarkup Language ;以下简称XML)制品进行定义、 描述和发现,同时,该应用可通过基于Internet的XML消息协议与其它软件应用直接交互。 WebServices是一种布署在Web上的构件,而构件是软件系统中具有相对独立功能、可以明 确辨识、接口由契约制定,和语境有明显依赖关系、可独立部署、且多由第三方提供的可组 装软件实体。WSDL是一种AML应用,它将WebServices描述定义为一组服务访问点,客户端 可以通过这些服务访问点对包含面向文档信息或面向过程调用的服务进行访问。从WSDL 文档中解析并获取Web Services的自身信息,自身信息包括服务名称、服务的接口名称以 及该服务自身的描述信息等。WSDL本身也是一种XML文档,因此,在获取WebServices的 自身信息时,可以利用XML文档解析的方法将所需要的标签内容一一解析出来,例如Web Services的自身信息中的服务名称所对应的标签为〈service name =LDAPService>,即 获取到的该服务的服务名称为LDAPService, Web Services的自身信息中的服务接口名称 所对应的标签为〈operation name = getUnitSubTree >,即获取到的该服务的某个服务 接口名称为getUnitSubTree。 步骤102,通过搜索引擎获取与网络服务相关的网页信息。 通过普通的搜索引擎,如谷歌,从Internet上获取与Web Services相关的网页 信息,即通过在搜索引擎上进行关键字搜索,来获取与该WebServices相关的网页。具体 地,与Web Services相关的网页信息可以为WebServices的WSDL文件的URL的反向链接 (backlink)指向的网页信息,以及包含WSDL文件的URL的相对路径的网页信息,即此处相 关的含义为与WebServices的WSDL文件的URL有链接关系的网页,或者在搜索到的网页中 包含Web Services的链接,或者一个网页中包含有该Web Services的名称信息。本步骤 为从Internet上获取与该Web Services相关的全部网页信息,以备后续步骤的使用。 需要指出的是,上述步骤101和步骤102的执行顺序可以根据实际需要进行调整,如先执行步骤102,再执行步骤IOI,或者并列地同时执行步骤101和步骤102,本领域技术 人员可以理解,上述步骤的执行先后顺序并不会影响本专利技术实施例的技术方案,以及最终 达到的技术效果。 步骤103,解析网页信息,并获取网页的主体信息。 在从Internet上获取到与Web Services相关的网页信息后,对获取到的网页信 息进行解析处理,获取该网页的主体信息。在通过搜索引擎搜索到的相关网页信息中,显 示给用户的为具有一定格式的网页界面,其中可以包含表格、图片以及对文字的特殊编辑 格式,如黑体等。本步骤中对网页信息的解析处理为对网页信息所对应的超文本标记语 言(Hypertext MarkupLanguage ;以下简称HTML)文件进行解析处理,其中,在HTML文件 中包含各种标签,如〈P>、 〈title〉、 〈table〉、 〈hl>等等,利用这些标签来体现网页界面显 示的各种编辑格式,本文档来自技高网...

【技术保护点】
一种网络服务的描述信息获取方法,其特征在于,包括:从网络服务描述语言文件中获取网络服务的自身信息;通过搜索引擎获取与所述网络服务相关的网页信息;解析所述网页信息,并获取网页的主体信息;根据所述网络服务的自身信息和所述网页的主体信息获取所述网络服务的描述信息。

【技术特征摘要】
一种网络服务的描述信息获取方法,其特征在于,包括从网络服务描述语言文件中获取网络服务的自身信息;通过搜索引擎获取与所述网络服务相关的网页信息;解析所述网页信息,并获取网页的主体信息;根据所述网络服务的自身信息和所述网页的主体信息获取所述网络服务的描述信息。2. 根据权利要求1所述的方法,其特征在于,所述根据所述网络服务的自身信息和所 述网页的主体信息获取所述网络服务的描述信息包括对所述网络服务的自身信息进行切词处理,并获取自身信息的词语向量; 将所述网页的主体信息组织成语句向量,并对所述语句向量中的各个语句进行切词处理,并获取所述各个语句的词语向量;根据所述自身信息的词语向量和所述各个语句的词语向量获取所述网络服务的描述信息。3. 根据权利要求2所述的方法,其特征在于,所述根据所述自身信息的词语向量和所 述各个语句的词语向量获取所述网络服务的描述信息包括根据所述自身信息的词语向量和所述各个语句的词语向量计算所述网络服务的自身 信息和所述各个语句的相似度;分别比较各个语句的相似度与预设的相似度阈值,如果所述语句的相似度大于所述相 似度阈值,则获取所述语句为所述网络服务的描述信息。4. 根据权利要求3所述的方法,其特征在于,所述根据所述自身信息的词语向量和所 述各个语句的词语向量计算所述网络服务的自身信息和所述各个语句的相似度包括分别计算所述各个语句的词语向量和所述自身信息的词语向量的并集; 统计所述并集中的词语在所述语句的词语向量中出现的词频,并记录在第一词频向量中,以及统计所述并集中的词语在所述自身信息的词语向量中出现的词频,并记录在第二词频向量中;利用所述第一词频向量和所述第二词频向量计算所述网络服务的自身信息和所述各 个语句的相似度。5. 根据权利要求1所述的方法,其特征在于,所述与所述网络服务相关的网页信息包 括所述网络服务的网络服务描述语言文件的统一资源标识符的反向链接指向的网页信息、 包含所述网络服务描述语言文件的统一资源标识符的相对路径的网页信息。6. —...

【专利技术属性】
技术研发人员:李戈谢冰张良杰黄艺燕王立杰刘飞
申请(专利权)人:北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1