一种基于迁移学习的Web服务分类方法技术

技术编号:30825186 阅读:39 留言:0更新日期:2021-11-18 12:19
本发明专利技术提出的一种基于迁移学习的Web服务分类方法,首先构建一个与Web服务数据集类似且具有大量高质量标记数据的App数据集作为源数据集,利用相关领域上丰富的标记数据预训练一个用于App分类任务的深度学习模型,然后将预训练模型的词嵌入和特征提取部分迁移到Web服务分类模型上,经迁移学习在Web服务分类中复用App分类任务学到的知识,最后采用适当的模型微调策略使Web服务精确分类。本发明专利技术具有分类准确率高、泛化性能强等特点,能较好地解决现有标记Web服务数量少、分布不均匀的问题,使模型具有更好的泛化性能和更高的分类精度。使模型具有更好的泛化性能和更高的分类精度。使模型具有更好的泛化性能和更高的分类精度。

【技术实现步骤摘要】
一种基于迁移学习的Web服务分类方法


[0001]本专利技术涉及软件
,具体涉及一种基于迁移学习的Web服务分类方法。

技术介绍

[0002]软件重用是软件开发中非常重要的手段和方法,它能够降低软件开发的成本,使开发者专注于核心功能的开发。Web服务(Web Services)是一种基于网络的、分布式、自描述的模块化组件,它遵循W3C的技术规范并执行特定的任务,能够使用标准的互联网协议如TCP/IP和HTTP,提供通过互联网动态请求的能力,使人们在重用软件代码的同时还能够方便地重用代码背后的数据。随着互联网开发和云计算的高速增长,Web服务分类成为软件重用的常用方法之一。基于关键字的方法是大多数情况下发现Web服务的首选方法,如何为Web服务分配适当的关键字成为了基于关键字搜索的一个重要任务。目前Web服务共享平台ProgrammableWeb有400多种类型的服务,由于人工水平的差异和服务标签种类繁多,人工为每个Web服务正确标记是困难的。因此如何根据Web服务的名称和描述自动为Web服务分配准确的标签成为迫切需求。现有的Web服务自动本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于迁移学习的Web服务分类方法,其特征在于方法如下:首先构建一个与Web服务数据集类似且具有大量高质量标记数据的App数据集作为源数据集,利用相关领域上丰富的标记数据预训练一个用于App分类任务的深度学习模型,然后将预训练模型的词嵌入和特征提取部分迁移到Web服务分类模型上,通过迁移学习在Web服务分类中复用App分类任务学到的知识,最后采用适当的模型微调策略使Web服务精确分类。2.根据权利要求1所述的一种基于迁移学习的Web服务分类方法,其特征在于具体步骤为:步骤1、源域数据的获取、分析与处理,搜集移动端应用程序Mobile App领域数据,令搜集到的App数据只保留名称、描述和类别三种属性参数,然后下采样App数据所含数据量较多的类别使数据集分布尽量均衡,构建一个与Web服务非常相似且具有大量高质量标记数据的App数据集作为源域;步骤2、将App数据每个类别中按比例随机划分训练集和测试集,使二者遵循同分布,之后将App数据按描述由短到长划分小批次,用于分批装入内存进行训练,在小批次内对App描述进行分词和动态填充,填充至小批次内的最长描述长度nLen,预处理Web服务数据亦是如此;步骤3、根据App分类数N,设计N分类的源模型结构,用预处理所得到的App描述和名称,输入到源模型的网络结构中,通过多层模型结构计算得到最终的M维向量输出,其中M=N;步骤4、结合App分类中源模型的N维向量输出和输入样本对应的标签,构建损失函数和合适的优化器,通过最小化损失函数训练源模型;步骤5、训练好App分类的源模型后,将其作为预训练模型,把词嵌入和特征提取部分用基于模型参数的迁移学习方式迁移至Web服务分类任务的模型上;步骤6、根据Web服务分类数N

,设计N

分类的目标模型结构,用预处理所得到的Web服务描述和名称,输入到目标模型的网络结构中,通过多层模型结构计算得到最终的M

维向量输出,其中M

=N

;步骤7、结合Web服务分类中目标模型的N

维...

【专利技术属性】
技术研发人员:杨溢龙李兆天张莉
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1