基于多因素和模型融合的区域运力预测方法技术

技术编号:38658000 阅读:10 留言:0更新日期:2023-09-02 22:43
本发明专利技术公开了基于多因素和模型融合的区域运力预测方法,包括如下步骤:S1,GPS轨迹数据降采样;S2,运力值预处理,并利用熵权法计算区域运力值。本发明专利技术利用熵权法获取区域历史运力得分,采用基于BERT的政策因素提取模型提取政策文本输出对应的政策文本因素特征并生成对应的向量化特征表示。使用基于权值修正的天气因素生成方法,根据历史天气数据构建修正权值对天气预报数据进行修正,获取天气因素特征并生成对应的向量化特征表示。最后使用XGBoost和LSTM模型分别进行序列预测,并融合两个模型的预测结果作为区域运力的预测结果,其准确率高,取得了良好的效果。取得了良好的效果。取得了良好的效果。

【技术实现步骤摘要】
services》.IEEE Transactions on Intelligent Transportation Systems,2019,20(11):4160

4173,对城市道路网络按照六边形网格进行划分,提出了基于六边形的卷积神经网络集成框架,实现网约车服务的供需缺口预测。在上述研究中,时间序列模型虽然能够从历史数据中提取出一些时间序列的特征,由于模型复杂度较为有限,所能表征的特征种类也比较单一,导致方法的预测结果准确性较低。此外,在大宗物流场景中货车司机对运输流向依赖性较强,基于交通流量的预测方法并不适用于物流运力预测。

技术实现思路

[0004]本专利技术为克服现有研究成果应用在区域车辆运力预测上的不足,提出了一种融合多因素的区域车辆运力预测方法。本专利技术在对车辆GPS轨迹数据降采样的基础上,根据熵权法计算得到车辆运力得分来计算整个区域运力得分来生成数据集。采用基于BERT的政策因素提取模型构建政策文本因素特征,使用基于权值修正的天气因素生成方法构建天气预报特征,并融合XGBoost和长短期记忆网络(LSTM,LongShort

Term Memory)模型的预测结果作为区域运力的预测结果。
[0005]本专利技术采用的技术方案是:基于多因素和模型融合的区域运力预测方法,包括如下步骤:S1,GPS轨迹数据降采样,通过计算车辆在30天内所有降采样后的GPS连续点之间的距离作为该车辆30天内的运营里程;根据车辆在30天内所有降采样后的GPS连续点之间的时间差累计值作为运营时长;S2,运力值预处理,通过对车辆的运营里程、运营天数、运营时长、运价和货运周转量5个因子来衡量区域运力,并利用熵权法计算区域运力值。
[0006]作为本专利技术的进一步改进,所述S2中,熵权法计算区域运力值包括对5个因子指标进行标准化处理,假设某区域拥有n0辆车,选取m个指标(m=5,分别代表30天内的运营里程、运营天数、运营时长、运价和货运周转量),剔除空值和异常值后随机选取n辆车作为熵权法的输入,假定第i个车辆的第j个指标数值表示为x
ij
(i=1,2,...,n;j=1,2,...,m)将绝对值转化为相对值,如公式(1)所示:
[0007][0008]x

ij
(i=1,2,...,n;j=1,2,...,m)为第i个车辆的第j个指标数值,对第j个指标下第i个样本值占该指标的比重进行计算,如公式(2)所示:
[0009][0010]第j项指标的熵值计算方法如公式(3)所示:
[0011][0012]其中ln为自然对数,且满足e
j
>=0;
[0013]信息熵冗余度(即各指标的差异化系数)计算方式如公式(4)所示:
[0014]d
j
=1

e
j
,j=1,2,...,m
ꢀꢀ
(4)
[0015]根据信息熵冗余度计算运力评估指标体系中各项指标的权重,如公式(5)所示:
[0016][0017]在获得各指标的权重后,各车辆的运力综合得分计算方法如公式(6)所示:
[0018][0019]该区域所拥有的n0辆车的运力综合得分sall的计算方法如公式(7)和公式(8)所示:
[0020][0021]s
all
=n0*s
mean
ꢀꢀ
(8)
[0022]作为本专利技术的进一步改进,还包括S3,以S2中计算出的区域运力值作为标签来构建该区域运力值数据集,并作为区域运力预测模型的训练数据。
[0023]作为本专利技术的进一步改进,其特征是还包括S4和S5;S4,构建政策因素分析模型,利用BERT模型处理相关政策来获取影响车辆运力的相关特征;S5,构建天气变化因素分析模型,基于时间衰减的天气因素提取算法来提取天气相关因素,天气因素提取包含训练阶段的天气数据嵌入和预测阶段的基于时间衰减的天气预报数据嵌入。
[0024]作为本专利技术的进一步改进,所述S4,构建政策因素分析模型包括数据集构建和模型构建;数据集构建阶段,选取某段时间与物流货运相关的政策文本进行人工标注,每篇政策文本对应于一个影响因素类别,类别种类为积极因素、消极因素和中立因素;模型构建阶段,政策因素分析模型使用BERT预训练语言构建特征提取层,并使用全连接网络结合softmax函数进行多分类。
[0025]作为本专利技术的进一步改进,所述S5,构建天气变化因素分析模型,在模型训练阶段,根据历史30天的降雨、气温、气压、风速的气象数据构建4个天气因素的特征向量,生成30m维向量,m为天气因素个数(m取值为4),30m维向量作为区域车辆运力预测模型训练时的天气因素输入特征。
[0026]作为本专利技术的更进一步改进,还包括S6,利用XGBoost和LSTM模型评估车辆在未来时间的运力得分;将政策和天气变化因素作为特征变量嵌入到预测模型中,得出针对区域所有车辆的运力得分集合D={{x
i
,y
i
}}(|D|=n,x
i
∈R
m
,y
i
∈R),其中x
i
为车辆运力得分对应的计算指标,y
i
为对应的车辆运力得分(i∈N表示运力得分集合所覆盖的时间长度,以月为单位);通过熵权法计算得到区域所有车辆每30天的运力值后,使用大小为Sw步长为Ls的滑动窗口选取数据作为输入数据,滑动窗口的下一个位置为模型label;选取前1

6个30天的多因素特征t
i
作为模型的输入数据,以第7个30天运力得分y
i
为模型label,其中多因素特征t
i
为第i个30天的运力值数据和i个30天多因素向量融合得到的向量;使用窗口大小为6步长为l的滑动窗口沿时序方向进行滑动,得到一系列数据来构建数据集;将构建的数据集划分为训练集、验证集、测试集对模型进行训练和预测,并采用相应的评价指标进行模型评
估;在完成训练集构建后,分别训练XGBoost模型和LSTM模型,并进行调参,选取最优的模型结果使用投票法进行加权融合,从而得到对区域所有车辆在未来一段时间内的运力趋势预测。
[0027]本专利技术具有的有益效果:为提升物流公司应对区域运力变化的预判能力,本专利技术利用熵权法获取区域历史运力得分,采用基于BERT的政策因素提取模型提取政策文本输出对应的政策文本因素特征并生成对应的向量化特征表示。使用基于权值修正的天气因素生成方法,根据历史天气数据构建修正权值对天气预报数据进行修正,获取天气因素特征并生成对应的向量化特征表示。最后使用XGBoost和LSTM模型分别进行序列预测,并融合两个模型的预测结果作为区域运力的预测结果,其准确率高,取得了良好的效果。
附图说明
[0028]图1为本专利技术的构建政策因素分析模型的模型构建阶段文本长度小于等于L的输出向量示意图。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多因素和模型融合的区域运力预测方法,包括如下步骤:S1,GPS轨迹数据降采样,通过计算车辆在30天内所有降采样后的GPS连续点之间的距离作为该车辆30天内的运营里程;根据车辆在30天内所有降采样后的GPS连续点之间的时间差累计值作为运营时长;S2,运力值预处理,通过对车辆的运营里程、运营天数、运营时长、运价和货运周转量5个因子来衡量区域运力,并利用熵权法计算区域运力值。2.根据权利要求1所述的基于多因素和模型融合的区域运力预测方法,其特征是所述S2中,熵权法计算区域运力值包括对5个因子指标进行标准化处理,假设某区域拥有n0辆车,选取m个指标(m=5,分别代表30天内的运营里程、运营天数、运营时长、运价和货运周转量),剔除空值和异常值后随机选取n辆车作为熵权法的输入,假定第i个车辆的第j个指标数值表示为x
ij
(i=1,2,...,n;j=1,2,...,m)将绝对值转化为相对值,如公式(1)所示:x

ij
(i=1,2,,n;j=1,2,,m)为第i个车辆的第j个指标数值,对第j个指标下第i个样本值占该指标的比重进行计算,如公式(2)所示:第j项指标的熵值计算方法如公式(3)所示:其中ln为自然对数,且满足e
j
>=0;信息熵冗余度(即各指标的差异化系数)计算方式如公式(4)所示:d
j
=1

e
j
,j=1,2,...,m
ꢀꢀꢀꢀꢀꢀ
(4)根据信息熵冗余度计算运力评估指标体系中各项指标的权重,如公式(5)所示:在获得各指标的权重后,各车辆的运力综合得分计算方法如公式(6)所示:该区域所拥有的n0辆车的运力综合得分sall的计算方法如公式(7)和公式(8)所示:s
all
=n0*s
mean
ꢀꢀ
(8)。
3.根据权利要求1所述的基于多因素和模型融合的区域运力预测方法,其特征是还包括S3,以S2中计算出的区域运力值作为标签来构建该区域运力值数据集,并作为区域运力预测模型的训练数据。4.根据权利要求3所述的基于多因素和模型融合的区域运力预测方法,其特征是还包括S4和S5;S4,构建政策因素分析模型,利用BERT模型处理相关政策来获取影响车辆运力的相关特征;S5,构建天气变化因素分析模型,基于时间衰减的天气因素提取算法来提取天气相关因素,天气因素提取包含训练阶段的天气数据嵌入和预测阶段的基于时间衰减的天气预报数据嵌入。5.根据权利要求4所述的基于多因素和模型融合的区域运力预测方法,其特征是所述S4,构建政策因素分析模型包括数据集构建和模型构建;数据集构建阶段,选取某段时间与物流货运相关的政策文本进行人工标注,每篇政策文本对应于一个影响因素类别,类别种类为积极因素、消极因素和中立因素;模型构建阶段,政策因素分析模型使用BERT预训练语言构建特征提取层,并使用全连接网络结合softmax函数进行多分类,具体算法流程如下:Step1:对数据集中的政策文本进行预处理,如果文本长度大于L,则对输入文本进行分句处理,得到句子集合S,按顺序将S中的句子分割为多个子集合{s
i
},使得s
i
的长度小于L,且子集合中的每个s
i
对应的标签均为政策文本对应的标签;如果文本长度小于等于L,则不处理;Step2:对于文本长度小于等于L的政策文本,直接使用BERT处理,获取政策文本的表示向量,并使用全连接网络结合softmax函数进行分类,获取当前政策文本的分类类别概率;Step3:对于长度大于L的政策文本构建的子集合{s
i
},使用BERT模型提取每个s
i
...

【专利技术属性】
技术研发人员:王建兵杨超项勇黄暕
申请(专利权)人:安徽港口物流有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1