一种基于迁移学习的Web服务分类方法技术

技术编号：30825186 阅读：39 留言：0更新日期：2021-11-18 12:19

本发明专利技术提出的一种基于迁移学习的Web服务分类方法，首先构建一个与Web服务数据集类似且具有大量高质量标记数据的App数据集作为源数据集,利用相关领域上丰富的标记数据预训练一个用于App分类任务的深度学习模型，然后将预训练模型的词嵌入和特征提取部分迁移到Web服务分类模型上，经迁移学习在Web服务分类中复用App分类任务学到的知识，最后采用适当的模型微调策略使Web服务精确分类。本发明专利技术具有分类准确率高、泛化性能强等特点，能较好地解决现有标记Web服务数量少、分布不均匀的问题，使模型具有更好的泛化性能和更高的分类精度。使模型具有更好的泛化性能和更高的分类精度。使模型具有更好的泛化性能和更高的分类精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于迁移学习的Web服务分类方法

[0001]本专利技术涉及软件
，具体涉及一种基于迁移学习的Web服务分类方法。

技术介绍

[0002]软件重用是软件开发中非常重要的手段和方法，它能够降低软件开发的成本，使开发者专注于核心功能的开发。Web服务(Web Services)是一种基于网络的、分布式、自描述的模块化组件，它遵循W3C的技术规范并执行特定的任务，能够使用标准的互联网协议如TCP/IP和HTTP，提供通过互联网动态请求的能力，使人们在重用软件代码的同时还能够方便地重用代码背后的数据。随着互联网开发和云计算的高速增长，Web服务分类成为软件重用的常用方法之一。基于关键字的方法是大多数情况下发现Web服务的首选方法，如何为Web服务分配适当的关键字成为了基于关键字搜索的一个重要任务。目前Web服务共享平台ProgrammableWeb有400多种类型的服务，由于人工水平的差异和服务标签种类繁多，人工为每个Web服务正确标记是困难的。因此如何根据Web服务的名称和描述自动为Web服务分配准确的标签成为迫切需求。...

【技术保护点】

【技术特征摘要】
1.一种基于迁移学习的Web服务分类方法，其特征在于方法如下：首先构建一个与Web服务数据集类似且具有大量高质量标记数据的App数据集作为源数据集,利用相关领域上丰富的标记数据预训练一个用于App分类任务的深度学习模型，然后将预训练模型的词嵌入和特征提取部分迁移到Web服务分类模型上，通过迁移学习在Web服务分类中复用App分类任务学到的知识，最后采用适当的模型微调策略使Web服务精确分类。2.根据权利要求1所述的一种基于迁移学习的Web服务分类方法，其特征在于具体步骤为：步骤1、源域数据的获取、分析与处理，搜集移动端应用程序Mobile App领域数据，令搜集到的App数据只保留名称、描述和类别三种属性参数，然后下采样App数据所含数据量较多的类别使数据集分布尽量均衡，构建一个与Web服务非常相似且具有大量高质量标记数据的App数据集作为源域；步骤2、将App数据每个类别中按比例随机划分训练集和测试集，使二者遵循同分布，之后将App数据按描述由短到长划分小批次，用于分批装入内存进行训练，在小批次内对App描述进行分词和动态填充，填充至小批次内的最长描述长度nLen，预处理Web服务数据亦是如此；步骤3、根据App分类数N，设计N分类的源模型结构，用预处理所得到的App描述和名称，输入到源模型的网络结构中，通过多层模型结构计算得到最终的M维向量输出，其中M＝N；步骤4、结合App分类中源模型的N维向量输出和输入样本对应的标签，构建损失函数和合适的优化器，通过最小化损失函数训练源模型；步骤5、训练好App分类的源模型后，将其作为预训练模型，把词嵌入和特征提取部分用基于模型参数的迁移学习方式迁移至Web服务分类任务的模型上；步骤6、根据Web服务分类数N
′
，设计N
′
分类的目标模型结构，用预处理所得到的Web服务描述和名称，输入到目标模型的网络结构中，通过多层模型结构计算得到最终的M
′
维向量输出，其中M
′
＝N
′
；步骤7、结合Web服务分类中目标模型的N
′
维...

【专利技术属性】
技术研发人员：杨溢龙，李兆天，张莉，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人