基于多因素和模型融合的区域运力预测方法技术

技术编号：38658000 阅读：10 留言：0更新日期：2023-09-02 22:43

本发明专利技术公开了基于多因素和模型融合的区域运力预测方法，包括如下步骤：S1，GPS轨迹数据降采样；S2，运力值预处理，并利用熵权法计算区域运力值。本发明专利技术利用熵权法获取区域历史运力得分，采用基于BERT的政策因素提取模型提取政策文本输出对应的政策文本因素特征并生成对应的向量化特征表示。使用基于权值修正的天气因素生成方法，根据历史天气数据构建修正权值对天气预报数据进行修正，获取天气因素特征并生成对应的向量化特征表示。最后使用XGBoost和LSTM模型分别进行序列预测，并融合两个模型的预测结果作为区域运力的预测结果，其准确率高，取得了良好的效果。取得了良好的效果。取得了良好的效果。

全部详细技术资料下载

【技术实现步骤摘要】
services》.IEEE Transactions on Intelligent Transportation Systems,2019,20(11):4160
‑
4173，对城市道路网络按照六边形网格进行划分，提出了基于六边形的卷积神经网络集成框架，实现网约车服务的供需缺口预测。在上述研究中，时间序列模型虽然能够从历史数据中提取出一些时间序列的特征，由于模型复杂度较为有限，所能表征的特征种类也比较单一，导致方法的预测结果准确性较低。此外，在大宗物流场景中货车司机对运输流向依赖性较强，基于交通流量的预测方法并不适用于物流运力预测。

技术实现思路

[0004]本专利技术为克服现有研究成果应用在区域车辆运力预测上的不足，提出了一种融合多因素的区域车辆运力预测方法。本专利技术在对车辆GPS轨迹数据降采样的基础上，根据熵权法计算得到车辆运力得分来计算整个区域运力得分来生成数据集。采用基于BERT的政策因素提取模型构建政策文本因素特征，使用基于权值修正的天气因素生成方法构建天气预报特征，并融合XGBoost和长短期记忆网络(LSTM，LongShort
‑
Term Memory)模型的预测结果作为区域运力的预测结果。
[0005]本专利技术采用的技术方案是：基于多因素和模型融合的区域运力预测方法，包括如下步骤：S1，GPS轨迹数据降采样，通过计算车辆在30天内所有降采样后的GPS连续点之间的距离作为该车辆30天内的运营里程；根据车辆在30天内所有降采样后的GPS连续点之间的时间差累计值作为运营时长；S2，...

【技术保护点】

【技术特征摘要】
1.基于多因素和模型融合的区域运力预测方法，包括如下步骤：S1，GPS轨迹数据降采样，通过计算车辆在30天内所有降采样后的GPS连续点之间的距离作为该车辆30天内的运营里程；根据车辆在30天内所有降采样后的GPS连续点之间的时间差累计值作为运营时长；S2，运力值预处理，通过对车辆的运营里程、运营天数、运营时长、运价和货运周转量5个因子来衡量区域运力，并利用熵权法计算区域运力值。2.根据权利要求1所述的基于多因素和模型融合的区域运力预测方法，其特征是所述S2中，熵权法计算区域运力值包括对5个因子指标进行标准化处理，假设某区域拥有n0辆车，选取m个指标(m＝5，分别代表30天内的运营里程、运营天数、运营时长、运价和货运周转量)，剔除空值和异常值后随机选取n辆车作为熵权法的输入，假定第i个车辆的第j个指标数值表示为x
ij
(i＝1,2,...,n；j＝1,2,...,m)将绝对值转化为相对值，如公式(1)所示：x
′
ij
(i＝1，2，，n；j＝1，2，，m)为第i个车辆的第j个指标数值，对第j个指标下第i个样本值占该指标的比重进行计算，如公式(2)所示：第j项指标的熵值计算方法如公式(3)所示：其中ln为自然对数，且满足e
j
＞＝0；信息熵冗余度(即各指标的差异化系数)计算方式如公式(4)所示：d
j
＝1
‑
e
j
，j＝1，2，...，m
ꢀꢀꢀꢀꢀꢀ
(4)根据信息熵冗余度计算运力评估指标体系中各项指标的权重，如公式(5)所示：在获得各指标的权重后，各车辆的运力综合得分计算方法如公式(6)所示：该区域所拥有的n0辆车的运力综合得分sall的计算方法如公式(7)和公式(8)所示：s
all
＝n0*s
mean
ꢀꢀ
(8)。
3.根据权利要求1所述的基于多因素和模型融合的区域运力预测方法，其特征是还包括S3，以S2中计算出的区域运力值作为标签来构建该区域运力值数据集，并作为区域运力预测模型的训练数据。4.根据权利要求3所述的基于多因素和模型融合的区域运力预测方法，其特征是还包括S4和S5；S4,构建政策因素分析模型，利用BERT模型处理相关政策来获取影响车辆运力的相关特征；S5，构建天气变化因素分析模型，基于时间衰减的天气因素提取算法来提取天气相关因素，天气因素提取包含训练阶段的天气数据嵌入和预测阶段的基于时间衰减的天气预报数据嵌入。5.根据权利要求4所述的基于多因素和模型融合的区域运力预测方法，其特征是所述S4，构建政策因素分析模型包括数据集构建和模型构建；数据集构建阶段，选取某段时间与物流货运相关的政策文本进行人工标注，每篇政策文本对应于一个影响因素类别，类别种类为积极因素、消极因素和中立因素；模型构建阶段，政策因素分析模型使用BERT预训练语言构建特征提取层，并使用全连接网络结合softmax函数进行多分类，具体算法流程如下：Step1：对数据集中的政策文本进行预处理，如果文本长度大于L，则对输入文本进行分句处理，得到句子集合S，按顺序将S中的句子分割为多个子集合{s
i
}，使得s
i
的长度小于L，且子集合中的每个s
i
对应的标签均为政策文本对应的标签；如果文本长度小于等于L，则不处理；Step2：对于文本长度小于等于L的政策文本，直接使用BERT处理，获取政策文本的表示向量，并使用全连接网络结合softmax函数进行分类，获取当前政策文本的分类类别概率；Step3：对于长度大于L的政策文本构建的子集合{s
i
}，使用BERT模型提取每个s
i
...

【专利技术属性】
技术研发人员：王建兵，杨超，项勇，黄暕，
申请(专利权)人：安徽港口物流有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人