一种采用LSTM建模预测劳动力需求增量的方法技术

技术编号:20364665 阅读:38 留言:0更新日期:2019-02-16 17:20
本发明专利技术提供一种采用LSTM建模预测劳动力需求增量的方法,包括如下步骤:搜集过去指定时间段单位用工信息,获得用工景气指数增量数据;利用LSTM对获得的用工景气指数增量数据进行建模,获得未来用工景气指数增量预测模型;根据所得未来用工景气指数增量预测模型预测未来指定时间段的预测增量值,进行累加恢复,获得未来用工景气指数。本发明专利技术提供的采用LSTM建模预测劳动力需求增量的方法,根据历史用工的增量变化,利用LSTM模型对过去用工景气指数进行数学建模,获得未来用工景气指数预测模型,预测其未来用景气指数的增量变化,能够有效提高预测的准确度,为劳动力市场的监管和针对性政策制定提供必要的数据参考依据。

【技术实现步骤摘要】
一种采用LSTM建模预测劳动力需求增量的方法
本专利技术涉及人力资源与社会保障预测领域,特别涉及一种采用LSTM建模预测劳动力需求增量的方法。
技术介绍
区域劳动力增量需求是指一个省或者一个市或者某个区县的一段时期内总体或者某一工种的劳动力增量的需求。其中的一段时期通常指一个自然年,其中的增量可以是正的(有劳动力需求)也可以是负值(劳动力富余)。区域劳动力增量需求的预测意思在于通过预测未来时期内劳动力资源的增减量,为人力资源和社会保障部门各项人力、社会保障的政策制定提供参考依据。区域劳动力增量需求的影响因素众多,如技术进步、经济增长、经济结构的变化、行业变迁、教育程度等。众多因素的不同影响导致区域劳动力增量需求成为一个多因素影响下的复杂预测问题。本申请人在先申请的申请号:2018102894172的中国专利,公开了一种区域劳动力需求增量预测方法;其根据各工种历史用工的增量变化,利用ARIMA模型对过去用工景气指数进行数学建模,获得未来用工景气指数预测模型,预测其未来用工数量增量变化;然而申请人在实际应用中发现其预测结果虽然相较于其他现有技术的预测结果具有更高的精确度,然而随着信息技术的发展,人们对信息的精确度要求越来越高,上述专利中提供的区域劳动力需求增量预测方法所获得的预测结果难以满足人们对信息的精确度日益提高的需求。
技术实现思路
为解决上述现有技术中提到的不足,本专利技术提供一种采用LSTM建模预测劳动力需求增量的方法,以获得高精度的区域劳动力需求增量预测结果。为实现上述目的,本专利技术提供的采用LSTM建模预测劳动力需求增量的方法,包括如下步骤:S10:搜集过去指定时间段单位用工信息,获得用工景气指数增量数据;S20:利用LSTM对步骤S10中获得的用工景气指数增量数据进行建模,获得未来用工景气指数增量预测模型;S30:根据步骤S20所得未来用工景气指数增量预测模型预测未来指定时间段的预测增量值,进行累加恢复,获得未来用工景气指数;其中,所述步骤S20具体包括:S201:对用工景气指数增量数据进行标准化处理后划分为训练集和测试集;S202:初始化LSTM模型参数,确定LSTM模型的初始结构;S203:利用训练集数据对LSTM模型进行训练学习;S204:判断预测误差是否满足要求,如果不满足则调整LSTM模型参数,重新进行网络训练,直至误差满足需求为止;S205:获得最终确定的未来用工景气指数增量预测模型。进一步地,步骤S20中,LSTM模型参数包括训练集的窗口长度、隐藏层神经元个数、迭代次数、采样比例、激活函数、优化器、损失函数以及误差检验值。进一步地,所述步骤S20中,训练集的窗口长度初始值设定为3,隐藏层神经元个数初始设定为3,迭代次数初始值设定为100,采样比例初始设定为1,激活函数初始采用ReLU函数,优化器初始采用adam函数,损失函数初始采用mean_squared_error,误差检验值初始值为accuracy。进一步地,所述用工景气指数包括总体用工景气指数和分行业用工景气。进一步地,步骤S10中根据收集到的单位用工信息获取用工景气指数增量数据的具体步骤包括为:S101:搜集过去指定时间段单位用工信息;S102:根据用工指数景气计算公式,进行用工景气指数计算;S103:对获得的用工景气指数进行异常值检测、异常值处理和空值处理;S104:对处理后的用工景气指数进行一阶差分,获得用工景气指数增量数据。进一步地,步骤S102中所述用工景气指数的计算公式:用工景气指数=(用工数上升企业百分比-用工数下降企业百分比)*100+100。进一步地,步骤S103中,采用3σ法则对异常值进行检测,并通过拉格朗日插值法对异常数据处理。本专利技术提供的采用LSTM建模预测劳动力需求增量的方法,根据各工种历史用工的增量变化,利用LSTM模型对过去用工景气指数进行数学建模,获得未来用工景气指数预测模型,预测其未来用景气指数的增量变化,能够有效提高预测的准确度,为劳动力市场的监管和针对性政策制定提供必要的数据参考依据。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供的采用LSTM建模预测劳动力需求增量的方法,包括如下步骤:S10:搜集过去指定时间段单位用工信息,获得用工景气指数增量数据;具体步骤包括S101:搜集过去指定时间段单位用工信息;S102:根据用工指数景气计算公式,进行用工景气指数计算;S103:对获得的用工景气指数进行异常值检测、异常值处理和空值处理;S104:对处理后的用工景气指数进行一阶差分,获得用工景气指数增量数据。具体地,对某个区域劳动力就业数据中的单位用工数据进行收集整理,获取至少3年的区域劳动力就业数据,至少含以下字段:月份、单位id、用工数、单位性质、行业性质;然后根据用工景气指数计算公式,进行用工景气指数计算;用工景气指数的公式为:用工景气指数=(用工数上升企业百分比-用工数下降企业百分比)*100+100;利用以上公式可以计算总体用工景气指数、分行业用工景气指数;指数值>100,表明总体劳动力需求或者行业劳动力需求处于上升状态;指数值<100,表明总体劳动力需求或者行业劳动力需求处于下降状态;为避免异常数据对预测结果造成较大干扰,导致最终预测结果偏差过大,对数据的异常值和空值进行检测并进行相应处理;本专利技术实施中采用基于经典统计的方法进行异常值检测,将三倍于标准差之上的数据判定为异常值,即基于统计学上的3σ法则,如果数据服从或者近似服从正态分布,在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过3倍标准差的值,因为在正态分布的假设下,距离平均值3σ之外的值出现的概率小于0.003。具体检测过程如下:S1031:初始化计数器n=1,设定终止步数N;S1032:检测0.1置信水平上是否服从正态分布,如果是,进入步骤S1033;S1033:生成待检测数据,并计算数据列的均值和标准差;S1034:判断是否存在3σ之外的值,如果不存在,输出结果并结束;S1035:如果存在3σ之外的值,进行异常值处理;S1036:判断n+1后是否达到停止条件N,如果达到则停止,输出结果并结束,否则进入下一轮判断是否有异常值。其中步骤S1035中检测到异常数据后,可以采用拉格朗日插值法对异常数据处理,生成新的数据并替换原数据。对经过处理后的总体用工指数景气数据或者分行业的用工指数景气数据进行一阶差分,即将所有的总量数据转化成增量数据;能够消除总量的数量对预测结果的影响,从而提高通过历史数据预测未来数据的准确性。获得区域过去指定时间段内的用工景气指数增量数据后,执行步骤S20。S20:利用LSTM对步骤S10中获得的用工景气指数增量数据进行建模,获得未来用工景气指数增量预测模型;具体地,利用LSTM建模时间递归神经网络,获得未来用工景气指数增量的预测模型,用以根据历史用工指数景气和用工增量值等预测未来短期内用工指数景气值和用工增量值的变化趋势。其中,所述利用LST本文档来自技高网...

【技术保护点】
1.一种采用LSTM建模预测劳动力需求增量的方法,其特征在于,包括如下步骤:S10:搜集过去指定时间段单位用工信息,获得用工景气指数增量数据;S20:利用LSTM对步骤S10中获得的用工景气指数增量数据进行建模,获得未来用工景气指数增量预测模型;S30:根据步骤S20所得未来用工景气指数增量预测模型预测未来指定时间段的预测增量值,进行累加恢复,获得未来用工景气指数;其中,所述步骤S20具体包括:S201:对用工景气指数增量数据进行标准化处理后划分为训练集和测试集;S202:初始化LSTM模型参数,确定LSTM模型的初始结构;S203:利用训练集数据对LSTM模型进行训练学习;S204:判断预测误差是否满足要求,如果不满足则调整LSTM模型参数,重新进行网络训练,直至误差满足需求为止;S205:获得最终确定的未来用工景气指数增量预测模型。

【技术特征摘要】
1.一种采用LSTM建模预测劳动力需求增量的方法,其特征在于,包括如下步骤:S10:搜集过去指定时间段单位用工信息,获得用工景气指数增量数据;S20:利用LSTM对步骤S10中获得的用工景气指数增量数据进行建模,获得未来用工景气指数增量预测模型;S30:根据步骤S20所得未来用工景气指数增量预测模型预测未来指定时间段的预测增量值,进行累加恢复,获得未来用工景气指数;其中,所述步骤S20具体包括:S201:对用工景气指数增量数据进行标准化处理后划分为训练集和测试集;S202:初始化LSTM模型参数,确定LSTM模型的初始结构;S203:利用训练集数据对LSTM模型进行训练学习;S204:判断预测误差是否满足要求,如果不满足则调整LSTM模型参数,重新进行网络训练,直至误差满足需求为止;S205:获得最终确定的未来用工景气指数增量预测模型。2.根据权利要求1所述的采用LSTM建模预测劳动力需求增量的方法,其特征在于:步骤S20中,LSTM模型参数包括训练集的窗口长度、隐藏层神经元个数、迭代次数、采样比例、激活函数、优化器、损失函数以及误差检验值。3.根据权利要求2所述的采用LSTM建模预测劳动力需求增量的方法,其特征在于:所述步骤S20中,训练集的窗口长度初始值设定为3,隐藏层神经元个...

【专利技术属性】
技术研发人员:吴梁斌庄国强詹进林
申请(专利权)人:易联众信息技术股份有限公司易联众厦门大数据科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1