一种基于深度学习的软件众包任务推荐方法技术

技术编号：32916032 阅读：12 留言：0更新日期：2022-04-07 12:06

本发明专利技术公开了一种基于深度学习的软件众包任务推荐方法。目前已有很多相关研究提出使用深度学习的方法对众包任务文本信息来进行众包任务推荐，但在现有的方法中，众包任务文本信息的提取方法缺乏通用性，且由于众包数据分布不平衡的特点，在推荐结果的指标上，命中率与多样性无法兼顾。本发明专利技术方法包含三部分的内容：基于预训练模型Bert提取众包文本特征、基于CNN+LSTM对众包文本特征进行进一步的特征学习和基于上述两个模型作用下的输出，能够自适应克服众包数据分布不平衡的损失函数。通过本发明专利技术可以在简单高效地针对特定软件众包平台实现开发者的推荐，同时也提高了推荐结果的命中率与多样性。的命中率与多样性。的命中率与多样性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的软件众包任务推荐方法

[0001]本专利技术属于众包领域，涉及一种针对多类型软件众包任务的自适应推荐方法。

技术介绍

[0002]近年来，随着软件复杂性的增加，将一个大的软件开发任务分成几个小的任务是一种常规方法。分离步骤可能包括：(1)将一个大型项目划分为一系列小模块，这些模块具有简单的需求、清晰的接口、明确的目标和全面的测试；(2)将所有这些模块组合成最终的工件。这一趋势为众包软件开发的出现奠定了坚实的基础。
[0003]与传统的外包相比，众包强调的是以自由自愿的形式外包给非特定的大众志愿者的做法，他们被分配到特定项目的小部分。近年来，市场繁荣，出现了许多众包平台，如国内的码市、程序员客栈，国外的TopCoder等。
[0004]在典型的软件众包过程中，首先，请求者将软件开发任务发布到平台上。任何开发人员都可以根据其个人兴趣和熟练程度注册为该特定开发任务的“注册人”。这一过程可能会持续一段时间。接着，如果所需的需求、规格等都清楚，“注册人”再被请求者或平台确认后就可开始工作。最后，在截止日期之前，开发人员应在完成其开发工作后将其最终作品上载到平台，然后等待审阅者或请求者根据几个评价指标确定采纳一个或几个注册者的作品。
[0005]然而，请求者不得不浪费大量时间等待足够的开发人员注册并从他们中间挑选合适的开发人员。即使如此，被选定的开发人员也可能不是特定任务的最合适开发人员，因为“合适的开发人员”可能会因为大量可用任务而错过此任务。当大量开发人员对发布的任务进行注册时，注册...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的软件众包任务推荐方法，其特征在于该方法包括以下步骤：步骤1. 针对特定的众包平台，收集众包任务的文本信息及其对应完成的开发者id，并进行过滤；步骤2. 对收集和过滤过的数据进行训练集与测试集的划分；步骤3. 对众包任务的文本信息进行分词，从训练集中得出一个最大长度sequence_length；训练集中分词长度小于sequence_length的样本将其填充，测试集若出现分词长度大于sequence_length的样本将其截断；步骤4. 将经过分词且填充的训练集样本先输入Bert预训练模型，生成下游任务需要的词向量；生成的词向量再交给由CNN+LSTM的深度学习模型进行进一步的特征学习，最后...

【专利技术属性】
技术研发人员：李尤慧子，袁宇宸，殷昱煜，周丽，李玉，梁婷婷，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人