预测模型的训练方法、装置、介质和计算设备制造方法及图纸

技术编号：27061573 阅读：12 留言：0更新日期：2021-01-15 14:42

本发明专利技术的实施方式提供了一种预测模型的训练方法、装置、介质和计算设备。该方法包括：基于获取到的训练数据，以使所述预测模型的网络权重进行收敛为目标训练所述预测模型；通过所述预测模型输出与所述训练数据对应的预测分布；通过最大均值差异损失函数对所述预测分布进行计算，以使所述预测模型的网络权重再次进行收敛，并得到校准后的预测分布为目标训练所述预测模型。本发明专利技术的上述技术能够基于训练数据对预测模型进行训练，并通过预测模型输出与训练数据对应的预测分布，基于最大均值差异损失函数以及预测分布对预测模型进行训练，以使预测模型的网络权重再次收敛，得到校准后的预测分布，提升预测模型基于时序数据输出的预测结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
预测模型的训练方法、装置、介质和计算设备
本专利技术的实施方式涉及深度学习
，更具体地，本专利技术的实施方式涉及一种预测模型的训练方法、装置、介质和计算设备。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。预测是机器学习中普遍存在的一类任务，广泛应用于各种场景中，如销售预测、股票分析、交通流量预测、天气预报等基于时序数据的预测。近年来随着深度学习技术突飞猛进的发展，深度模型在预测任务上取得了显著的进步。目前，通常会基于异方差神经网络对神经网络进行训练。然而，在实践中发现，基于异方差神经网络可能会基于已有的时序数据产生不可靠的预测分布和不确定性估计，且产生的概率分布往往是未校准的。可见，现有的神经网络基于时序数据得到的预测结果准确性较低。
技术实现思路
在本上下文中，本专利技术的实施方式期望提供一种预测模型的训练方法、装置、介质和计算设备。在本专利技术实施方式的第一方面中，提供了一种预测模型的训练方法，包括：基于获取到的训练数据，以使所述预测模型的网络权重进行收敛为目标训练所述预测模型；通过所述预测模型输出与所述训练数据对应的预测分布；通过最大均值差异损失函数对所述预测分布进行计算，以使所述预测模型的网络权重再次进行收敛，并得到校准后的预测分布为目标训练所述预测模型。在本实施方式的一个实施例中，基于获取到的训练数据之前，所述方法还包括：获取原始数据；通过预设方...

【技术保护点】
1.一种预测模型的训练方法，包括：/n基于获取到的训练数据，以使所述预测模型的网络权重进行收敛为目标训练所述预测模型；其中，上述训练数据为时序数据，包括环境监测数据、交通监测数据、气象监测数据、用户历史行为数据中的一种；/n通过所述预测模型输出与所述训练数据对应的预测分布；/n通过最大均值差异损失函数对所述预测分布进行计算，以使所述预测模型的网络权重再次进行收敛，并得到校准后的预测分布为目标训练所述预测模型。/n

【技术特征摘要】
1.一种预测模型的训练方法，包括：
基于获取到的训练数据，以使所述预测模型的网络权重进行收敛为目标训练所述预测模型；其中，上述训练数据为时序数据，包括环境监测数据、交通监测数据、气象监测数据、用户历史行为数据中的一种；
通过所述预测模型输出与所述训练数据对应的预测分布；
通过最大均值差异损失函数对所述预测分布进行计算，以使所述预测模型的网络权重再次进行收敛，并得到校准后的预测分布为目标训练所述预测模型。

2.根据权利要求1所述的预测模型的训练方法，基于获取到的训练数据之前，所述方法还包括：
获取原始数据；
通过预设方式对所述原始数据进行预处理，得到所述原始数据对应的训练数据，其中，所述预设方式至少包括数据归一化处理。

3.根据权利要求2所述的预测模型的训练方法，其中，当所述原始数据中包含时间序列数据时，所述预设方式还包括按照时间窗口格式对所述时间序列数据进行分割。

4.根据权利要求1~3任一项所述的预测模型的训练方法，基于获取到的训练数据，以使所述预测模型的网络权重进行收敛为目标训练所述预测模型，包括：
将获取到的训练数据输入至所述预测模型的分布估计器；
通过所述分布估计器中的负对数似然损失函数对所述训练数据进行计算，以使所述预测模型的网络权重进行收敛为目标训练所述预测模型。

5.根据权利要求4所述的预测模型的训练方法，通过所述预测模型输出与所述训练数据对应的预测分布，包括：
通过所述预测模型输出与所述训练数据对应的均值和方差；
基于所述均值和所述方差计算得到预测分布。

6.根据权利要求5所述的预测模型的训练方法，所述最大均值差异损失函数包含核函数和再生核希尔伯特空间，通过最大均值差异损失函数对所述预测分布进行计算，以使所述预测模型的网络权重再次进行收敛，并得到校准后的预测分布为目标训练所述预测模型，包括：
从所述预测分布中获取数据样本；
控制所述预测模型中的分布匹配器通过所述最大均值差异损失函数对所述数据样本进行计算，以使所述预测模型的网络权重再次进行收敛，并得到校准后的预测分布为目标训练所述预测模型。

7.根据权利要求6所述的预测模型的训练方法，控制所述预测模型中的分布匹配器通过所述最大均值差异损失函数对所述数据样本进行计算，以使所述预测模型的网络权重再次进行收敛，并得到校准后的预测分布为目标训练所述预测模型之后，所述方法还包括：
基于所述预测模型输出的所述校准后的预测分布，计算得到真实置信度；
基于期望置信度和所述真实置信度，计算得到覆盖概率的期望损失以及覆盖概率的最大损失；
当所述覆盖概率的期望损失小于第一预设值以及所述覆盖概率的最大损失小于第二预设值时，确定所述校准后的预测分布具有可靠性。

8.根据权利要求5~7任一项所述的预测模型的训练方法，所述预测模型通过异方差概率神经网络模型构建。

9.一种预测模型的训练装置，包括：
第一训练单元，用于基于获取到的训练数据，以使所述预测模型的网络权重进行收敛为目标训练所述预测模型；其中，上述训练数...

【专利技术属性】
技术研发人员：胡文波，崔鹏，
申请(专利权)人：北京瑞莱智慧科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人