本发明专利技术公开了基于深度学习的工作平台任务量预测方法及系统,涉及任务量预测技术领域。本发明专利技术包括如下过程:A0:建立源数据集以及目标数据集;其中,源数据集为工作内容;目标数据集为与源数据集中工作内容对应的加权工作量;A1:利用源数据集与目标数据集训练自编码器;A2:从自编码器提取数据特征,把数据特征输入卷积神经网络训练预测器,使用预测器生成任务量。本发明专利技术自编码器通过工作内容的后验分布和先验分布匹配实现正则化;通过卷积神经网络的训练和学习,实现对动态工作内容的准确匹配,提高任务量评估精度,进而提高工作内容处理效率。
【技术实现步骤摘要】
基于深度学习的工作平台任务量预测方法及系统
本专利技术属于任务量预测
,特别是涉及一种基于深度学习的工作平台任务量预测方法及系统。
技术介绍
现有互联网工作平台承载较多的信息的传递以及处理。工作平台以一个众包模式提供各项工作管理相关服务。发包方将工作任务需求发布到工作平台,平台将任务分解并根据各项子任务的技能要求,从平台人才库中寻找匹配的接包方,将子任务分配给合适的接包方;接包方接到分派的子任务后开始工作,子任务完成后将工作结果提交至平台;发包方接发包方接收任务交付结果并审查。发包方在发布任务时,将任务费用托管在平台,待任务交付并验收后,再通过平台与接包方进行结算。上述过程中,工作平台为了更好的任务分配以及实现负载均衡,在进行任务分配和发包前,进行工作内容的任务量评估,实现分配合理、提高效率。现有的对工作内容的任务量评估多为定义好不同工作量的权值后,通过不同类型就行加权评估对应的工作量;该种做法虽然针对不同类型的区分,实现不同类型工作内容的工作量评估,但同一种类型的工作内容其内部工作复杂程度也不相同,多为动态变化的。基于此,本专利技术提供一种基于深度学习的工作平台任务量预测方法及系统,用于适应动态变化的工作内容,通过卷积神经网络的训练和学习,实现对动态工作内容的准确匹配,提高任务量评估精度,进而提高工作内容处理效率。
技术实现思路
本专利技术的目的在于提供基于深度学习的工作平台任务量预测方法及系统,通过卷积神经网络的训练和学习,实现对动态工作内容的准确匹配,提高任务量评估精度,进而提高工作内容处理效率。为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术为基于深度学习的工作平台任务量预测方法,包括如下过程:A0:建立源数据集以及目标数据集;其中,所述源数据集为工作内容;所述目标数据集为与源数据集中工作内容对应的加权工作量;A1:利用所述源数据集与所述目标数据集训练自编码器;A2:从所述自编码器提取数据特征,把所述数据特征输入卷积神经网络训练预测器,使用所述预测器生成任务量;其中,所述自编码器通过工作内容的后验分布和先验分布匹配实现正则化;所述工作内容的后验分布为:所述工作内容的后验分布为:其中,n为工作内容作为输入向量;m为所述自编码器的工作加权任务量作为编码向量;q(m|n)将工作内容n编码为工作加权任务量m的编码分布,对应的,q(m|n)即为将工作加权任务量m解码为工作内容n的解码分布;pd(m)为数据分布。优选地,所述输入向量为所述目标数据集l时,其对应的后验分布为:所述自编码器通过q(m)与p(m)进行匹配完成正则化训练。优选地,所述自编码器包括编码器以及解码器;所述编码器对目标数据集中的工作加权任务量进行编码生成编码向量;所述解码器对编码向量解码并重构编码前的数据。优选地,所述自编码器包括生成器和判别器,所述生成器与判别器对抗;所述生成器为编码器,用于对所述目标数据集进行编码生成训练样本;所述训练样本即为对工作加权任务量编码生成的编码向量。优选地,所述判别器对所述训练样本进行辨别并判断所述训练样本是否符合真实数据编码分布;所述目标数据集编码分布为模拟数据分布;所述源数据集编码分布为真实数据分布。优选地,所述预测器为实时动态更新,具体更新过程包括如下:A21:采集数据并建立新数据集;A22:选取未输入到所述预测器的新数据集作为最新源数据集,所述预测器原有的源数据集与目标数据集重组构成最新目标数据集;A23:将所述最新源数据集与所述最新目标数据集输入到所述预测器,进行更新训练。优选地,所述新数据集中的数据来自工作平台上传的工作内容以及对应的加权工作量。优选地,所述卷积神经网络包括一个输入层、一个全连接层、一个输出层以及若干个全连接层;所述卷积神经网络的连接顺序依次为:输入层、若干数次排列的卷积层、全连接层以及输出层。基于深度学习的工作平台任务量预测系统,包括输入模块、输出模块、神经网络处理模块、工作平台、数据库以及动态更新模块;所述输入模块用于向工作平台输入工作内容;所述工作平台传递工作内容神经网络处理模块;所述神经网络模块对工作内容处理后生成任务量并存储到数据库中的目标数据集中;所述神经网络模块还将生成的任务量传递到输出模块;所述输出模块输出经过神经网络模块处理后的任务量;所述动态更新模块,用于将数据库中的源数据集中的工作内容更新至神经网络模块。优选地,所述神经网络模块包括输入单元、输出单元、卷积处理单元以及全连接单元;所述输入单元接收输入模块传递的工作内容并输入到卷积处理单元;所述工作内容经卷积处理单元内若干所述卷积处理层处理后传递全连接单元;所述全连接层对处理后的工作内容过滤检测后形成工作量;所述输出单元将工作量传递至输出模块。本专利技术的一个方面具有以下有益效果:1、本专利技术利用源数据集与所述目标数据集训练自编码器;从自编码器提取数据特征,把数据特征输入卷积神经网络训练预测器,使用预测器生成任务量,提高任务量的评估精度。2、本专利技术自编码器通过工作内容的后验分布和先验分布匹配实现正则化;通过卷积神经网络的训练和学习,实现对动态工作内容的准确匹配,提高任务量评估精度,进而提高工作内容处理效率。3、本专利技术通过预测器动态更新并且预测结果不受数据集的组合顺序影响,使得预测器的预测方法可以不断完善,让预测值愈加准确。当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于深度学习的工作平台任务量预测方法的流程图;图2为本专利技术中预测器实时动态更新流程图;图3为本专利技术中基于深度学习的工作平台任务量预测系统的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要理解的是,术语“开孔”、“上”、“中”、“长度”、“内”等指示方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的组件或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本专利技术的限制。请参阅图1所示,本专利技术为基于深度学习的工作平台任务量预测方法,包括如下过程:A0:建立源数据集以及目标数据集;其中,源数据集为工作内容;目标数据集为与源数据集中工作内容对应的加权工作量;A1:利用源本文档来自技高网...
【技术保护点】
1.基于深度学习的工作平台任务量预测方法,其特征在于,包括如下过程:/nA0:建立源数据集以及目标数据集;/n其中,所述源数据集为工作内容;所述目标数据集为与源数据集中工作内容对应的加权工作量;/nA1:利用所述源数据集与所述目标数据集训练自编码器;/nA2:从所述自编码器提取数据特征,把所述数据特征输入卷积神经网络训练预测器,使用所述预测器生成任务量;/n其中,所述自编码器通过工作内容的后验分布和先验分布匹配实现正则化;所述工作内容的后验分布为:/n
【技术特征摘要】
1.基于深度学习的工作平台任务量预测方法,其特征在于,包括如下过程:
A0:建立源数据集以及目标数据集;
其中,所述源数据集为工作内容;所述目标数据集为与源数据集中工作内容对应的加权工作量;
A1:利用所述源数据集与所述目标数据集训练自编码器;
A2:从所述自编码器提取数据特征,把所述数据特征输入卷积神经网络训练预测器,使用所述预测器生成任务量;
其中,所述自编码器通过工作内容的后验分布和先验分布匹配实现正则化;所述工作内容的后验分布为:
所述工作内容的后验分布为:p(m)
其中,n为工作内容作为输入向量;m为所述自编码器的工作加权任务量作为编码向量;q(m|n)将工作内容n编码为工作加权任务量m的编码分布,对应的,q(n|m)即为将工作加权任务量m解码为工作内容n的解码分布;pd(m)为数据分布。
2.根据权利要求1所述的基于深度学习的工作平台任务量预测方法,其特征在于,所述输入向量为所述目标数据集l时,其对应的后验分布为:
所述自编码器通过q(m)与p(m)进行匹配完成正则化训练。
3.根据权利要求1所述的基于深度学习的工作平台任务量预测方法,其特征在于,所述自编码器包括编码器以及解码器;所述编码器对目标数据集中的工作加权任务量进行编码生成编码向量;所述解码器对编码向量解码并重构编码前的数据。
4.根据权利要求3所述的基于深度学习的工作平台任务量预测方法,其特征在于,所述自编码器包括生成器和判别器,所述生成器与判别器对抗;所述生成器为编码器,用于对所述目标数据集进行编码生成训练样本;所述训练样本即为对工作加权任务量编码生成的编码向量。
5.根据权利要求4所述的基于深度学习的工作平台任务量预测方法,其特征在于,所述判别器对所述训练样本进行辨别并判断所述训练样本是否符合真实数据编码分布;所述目标数据集编码分布为模拟数据分布;所述源数据集...
【专利技术属性】
技术研发人员:王琦,
申请(专利权)人:武汉空心科技有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。