【技术实现步骤摘要】
一种基于迁移学习的Web服务分类方法
[0001]本专利技术涉及软件
,具体涉及一种基于迁移学习的Web服务分类方法。
技术介绍
[0002]软件重用是软件开发中非常重要的手段和方法,它能够降低软件开发的成本,使开发者专注于核心功能的开发。Web服务(Web Services)是一种基于网络的、分布式、自描述的模块化组件,它遵循W3C的技术规范并执行特定的任务,能够使用标准的互联网协议如TCP/IP和HTTP,提供通过互联网动态请求的能力,使人们在重用软件代码的同时还能够方便地重用代码背后的数据。随着互联网开发和云计算的高速增长,Web服务分类成为软件重用的常用方法之一。基于关键字的方法是大多数情况下发现Web服务的首选方法,如何为Web服务分配适当的关键字成为了基于关键字搜索的一个重要任务。目前Web服务共享平台ProgrammableWeb有400多种类型的服务,由于人工水平的差异和服务标签种类繁多,人工为每个Web服务正确标记是困难的。因此如何根据Web服务的名称和描述自动为Web服务分配准确的标签成为迫切需求。 ...
【技术保护点】
【技术特征摘要】
1.一种基于迁移学习的Web服务分类方法,其特征在于方法如下:首先构建一个与Web服务数据集类似且具有大量高质量标记数据的App数据集作为源数据集,利用相关领域上丰富的标记数据预训练一个用于App分类任务的深度学习模型,然后将预训练模型的词嵌入和特征提取部分迁移到Web服务分类模型上,通过迁移学习在Web服务分类中复用App分类任务学到的知识,最后采用适当的模型微调策略使Web服务精确分类。2.根据权利要求1所述的一种基于迁移学习的Web服务分类方法,其特征在于具体步骤为:步骤1、源域数据的获取、分析与处理,搜集移动端应用程序Mobile App领域数据,令搜集到的App数据只保留名称、描述和类别三种属性参数,然后下采样App数据所含数据量较多的类别使数据集分布尽量均衡,构建一个与Web服务非常相似且具有大量高质量标记数据的App数据集作为源域;步骤2、将App数据每个类别中按比例随机划分训练集和测试集,使二者遵循同分布,之后将App数据按描述由短到长划分小批次,用于分批装入内存进行训练,在小批次内对App描述进行分词和动态填充,填充至小批次内的最长描述长度nLen,预处理Web服务数据亦是如此;步骤3、根据App分类数N,设计N分类的源模型结构,用预处理所得到的App描述和名称,输入到源模型的网络结构中,通过多层模型结构计算得到最终的M维向量输出,其中M=N;步骤4、结合App分类中源模型的N维向量输出和输入样本对应的标签,构建损失函数和合适的优化器,通过最小化损失函数训练源模型;步骤5、训练好App分类的源模型后,将其作为预训练模型,把词嵌入和特征提取部分用基于模型参数的迁移学习方式迁移至Web服务分类任务的模型上;步骤6、根据Web服务分类数N
′
,设计N
′
分类的目标模型结构,用预处理所得到的Web服务描述和名称,输入到目标模型的网络结构中,通过多层模型结构计算得到最终的M
′
维向量输出,其中M
′
=N
′
;步骤7、结合Web服务分类中目标模型的N
′
维...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。