模型训练方法技术

技术编号:39713999 阅读:14 留言:0更新日期:2023-12-17 23:22
本申请提供一种模型训练方法

【技术实现步骤摘要】
模型训练方法、对象属性值确定方法、装置、设备及介质


[0001]本申请涉及人工智能
,尤其涉及一种模型训练方法

对象属性值确定方法

装置

设备及介质


技术介绍

[0002]在人工智能
中,通过分析规律性的历史数据并从中提取数据规律,可以根据数据规律预测历史数据对应的对象在未来某一时刻或者某一时段的数据

数据预测可应用在多个场景,例如预测商品价格以及预测网络流量等场景,根据预测结果指导用户在该场景下的决策或者规划

[0003]由于用户的决策或者规划依赖预测数据,因此预测数据的准确性对于用户来说很重要,只有准确性高的预测数据可以正确知道用户的决策或者规划

[0004]历史数据为时序数据,时序数据中包括多个历史时段以及每个历史时段对应的历史数据,为了从历史数据中准确提取数据规律,通常会获取大量历史时段对应的历史数据,从而消除偶然因素,准确提取数据规律

然而,大量历史时段对应的历史数据中会存本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种模型训练方法,其特征在于,包括:确定初始模型,所述初始模型为长短期记忆网络
LSTM
模型,所述初始模型包括输出层
、LSTM


隐藏层

激活层和输出层,所述
LSTM
层包括多个
LSTM
单元,所述
LSTM
单元具有记忆机制和遗忘机制;确定训练样本,所述训练样本包括预设对象在多个历史时段内的对象属性值;根据所述训练样本,确定所述初始模型中各模型参数的梯度值,并根据各模型参数的梯度值更新所述初始模型中的各个模型参数,直至所述初始模型收敛时,得到目标模型,所述目标模型用于确定所述预设对象在未来时段的对象属性值
。2.
根据权利要求1所述的方法,其特征在于,根据所述训练样本,确定所述初始模型中各模型参数的梯度值,包括:根据所述训练样本,确定样本输入数据和样本输出数据,所述样本输入数据包括样本时刻之前的多个历史时段对应的对象属性值,所述样本输出数据包括所述样本时刻对应的样本属性值;将所述样本输入数据输入至所述初始模型,得到预测输出数据,所述预测输出数据包括所述初始模型预测得到的所述预设对象在所述样本时刻的对象属性值;根据所述样本输出数据和所述预测输出数据,确定损失值;根据所述损失值进行反向传播,得到各模型参数的梯度值
。3.
根据权利要求2所述的方法,其特征在于,根据所述损失值进行反向传播,得到各模型参数的梯度值,包括:将所述损失值输入至所述输出层;通过链式法则,依次通过所述激活层

所述隐藏层和所述
LSTM
层对所述损失值进行运算,得到各模型参数的梯度值
。4.
根据权利要求1‑3任一项所述的方法,其特征在于,针对任意一个模型参数;根据所述模型参数的梯度值更新所述模型参数,包括:根据所述模型参数的梯度值,确定所述模型参数的待调整参数值;根据所述待调整参数值和所述模型参数的当前参数值,确定所述模型参数的目标学习率,所述目标学习率用于指示所述当前参数值相对于所述待调整参数值的变化幅度;确定预设学习率范围;根据所述目标学习率和所述预设学习率范围,确定所述模型参数的目标参数值,并将所述模型参数更新为所述目标参数值
。5.
根据权利要求4所述的方法,其特征在于,根据所述目标学习率和所述预设学习率范围,确定所述模型参数的目标参数值,包括:若所述目标学习率位于所述预设学习率范围,则将所述待调整参数值确定为所述目标参数值;若所述目标学习率小于所述预设学习率范围的最小值,则根据所述最小值和所述当前参数值,确定所述目标参数值;若所述目标学习率大于所述预设学习率范围的最大值,则根据所述最大值和所述当前参数值,确定所述目标参数值
。6.
根据权利要求1‑5任一项所述的方法,其特征在于,确定训练样本,包括:
确定多个初始数据,所述初始数据包括所述预设对象在多个历史时刻的历史属性值;对所述初始数据进行预处理,得到所述训练样本,所述预处理包括如下至少一种:缺失值填充处理

异常值剔除处理

非线性化处理和平稳型检测处理
。7.
根据权利要求1‑6任一项所述的方法,其特征在于,根据各模型参数的梯度值更新所述初始模型中的各个模型参数,直至所述初始模型收敛时,得到目标模型之后,还包括:获取验证数据集,所述验证数据集中包括验证输入数据和验证输出数据,所述验证输入数据包括所述预设对象在多个历史时段内的对象属性值,所述验证输出数据包括所述预设对象在验证时刻的标注对象属性值,所述多个历史时段位于所述验证时刻之前;通过所述目标模型对所述验证输入数据进行处理,得到实际输出数据,所述实际输出数据包括所述预设对象在所述验证时刻的预测对象属性值;根据所述标注对象属性值和所述预测对象属性值,确定所述目标模型的精确度;在所述精确度小于或等于预设阈值时,根据所述标注对象属性值和所述预测对象属性值更新所述目标模型的模型参数
。8.
一种对象属性值确定方法,其特征在于,包括:获取预设对象在多个历史时段内的对象属性值;通过目标模型对所述预设对象在多个历史时段内的对象属性值进行处理,得到所述预设对象在未来时段的对象属性值,其中,所述目标模型为通过权利要求1‑7任一项所述的方法训练得到的
。9.
一种模型训练装置,其特征在于,包括:获取模块,用于确定初始模型,所述初始模型为长短期记忆网络
LSTM
模型,所述初始模型包括输出层
、LSTM


隐藏层

激活层和输出层,所述
LSTM
层包括多个
LSTM
单元,所述
LSTM
单元具有记忆机制和遗忘机制;...

【专利技术属性】
技术研发人员:张茂发尹泽阳高玉杰金士隆贾国琛庞爱茹焦鹏
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1