建立区域热度预测模型、区域热度预测的方法及装置制造方法及图纸

技术编号:27143344 阅读:21 留言:0更新日期:2021-01-27 21:32
本申请公开了一种建立区域热度预测模型、区域热度预测的方法及装置,涉及大数据技术领域。具体实现方案为:利用第一历史区域热度数据,预训练时序预测模型;将第二历史区域热度数据作为第二支持样本,利用所述第二支持样本对所述时序预测模型进行进一步训练,以对模型参数进行调整得到所述区域热度预测模型;所述区域热度预测模型用于对第二查询样本进行预测,所述第二查询样本包括待预测时间的区域热度。该方式使得在第二历史区域热度数据所代表的分布数据较少的情况下,也能够对该分布数据进行有效学习,从而提高区域热度预测的准确度。度。度。

【技术实现步骤摘要】
建立区域热度预测模型、区域热度预测的方法及装置


[0001]本申请涉及计算机应用
,特别涉及大数据
下一种建立区域热度预测模型、区域热度预测的方法及装置。

技术介绍

[0002]区域热度预测具有巨大的价值,可以让政府、机构和个人更加有效地优化资源配置,预判发展趋势,甚至在交通出行方面提供参考或建议。所谓区域热度预测指的是预测区域在指定时间的人流量,例如预测某个商圈在指定时间的客流量,预测某个车站在指定时间的客流量,等等。
[0003]区域热度预测本质上是一个时间序列预测问题,现有的时间序列预测算法包括特征工程、神经网络拟合等算法。然而,现有的时间序列预测算法对大量标注数据存在高度依赖,只能在具有较长的平稳性序列历史记录的数据上进行训练后,才能够具有较高的预测准确率。然而一些小概率事件发生时会对区域热度产生影响,从而导致在一段时间内区域热度相较于平时发生剧烈波动。然而,由于这类小概率事件的历史数据较少,采用传统方法则无法对此进行有效学习,从而导致发生小概率事件情况下的区域热度预测准确度很差。
专利技术内容
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建立区域热度预测模型的方法,包括:利用第一历史区域热度数据,预训练时序预测模型;将第二历史区域热度数据作为第二支持样本,利用所述第二支持样本对所述时序预测模型进行进一步训练,以对模型参数进行调整得到所述区域热度预测模型;所述区域热度预测模型用于对第二查询样本进行预测,所述第二查询样本包括待预测时间的区域热度。2.根据权利要求1所述的方法,其中,所述第一历史区域热度数据包括第一历史时段中区域在各时间点的特征数据和区域热度;所述第二历史区域热度数据包括第二历史时段中所述区域在各时间点的特征数据和区域热度。3.根据权利要求2所述的方法,其中,所述特征数据包括以下至少一种:所述区域包含兴趣点POI的数量、用户到访时间分布数据、到访用户的出行方式分布数据以及到访用户的出行距离分布数据。4.根据权利要求2所述的方法,其中,所述时序预测模型的训练目标包括:最小化预测结果与期望值之间的差值,所述预测结果为所述时序模型利用时间窗T
w
内各时间点的特征数据和区域热度对时间窗T
w
之后τ个时间点的区域热度进行预测的结果,所述期望值为时间窗T
w
之后τ个时间点在对应样本中的区域热度;所述时间窗T
w
小于所述第一历史时段的长度,且小于所述第二历史时段的长度,所述τ为正整数。5.根据权利要求1所述的方法,其中,所述利用第一历史区域热度数据,预训练时序预测模型包括:利用所述第一历史区域热度数据,构建至少一个元训练任务;基于元训练任务中的第一支持样本和第一查询样本,采用元学习机制训练所述时序预测模型;其中所述第一支持样本、第一查询样本分别与所述第二支持样本、第二查询样本的时长一致。6.根据权利要求5所述的方法,其中,所述采用元学习机制训练所述时序预测模型包括:对于各元学习任务,在所述第一支持样本上计算损失函数的梯度并更新元参数;确定所有元学习任务在第一查询样本上的损失函数梯度并用以更新模型参数;利用所述第二支持样本对所述时序预测模型进行进一步训练,以对模型参数进行调整包括:在所述第二支持样本上的计算损失函数梯度并用以更新模型参数。7.根据权利要求6所述的方法,其中,所述损失函数是由所述时序模型利用时间窗T
w
内各时间点的特征数据和区域热度对时间窗T
w
之后τ个时间点的区域热度进行预测后,利用预测结果与时间窗T
w
之后τ个时间点在对应样本中的区域热度之间的差值构建得到;其中,所述时间窗T
w
的长度小于所述第一支持样本的时长、且小于所述第一查询样本的时长,所述τ为正整数。8.一种区域热度预测的方法,包括:利用区域热度预测模型对第二查询样本进行预测,所述第二查询样本包括待预测时间的区域热度;
其中所述区域热度预测模型是利用第一历史区域热度数据预训练时序预测模型后,将第二历史区域热度数据作为第二支持样本,并利用所述第二支持样本对所述时序预测模型进行进一步训练得到的。9.根据权利要求8所述的方法,其中,所述第一历史区域热度数据包括第一历史时段中区域在各时间点的特征数据和区域热度;所述第二历史区域热度数据包括第二历史时段中所述区域在各时间点的特征数据和区域热度。10.根据权利要求9所述的方法,其中,所述利用区域热度预测模型对第二查询样本进行预测包括:利用所述待预测时间之前时间窗T内各时间点的特征数据和区域热度,对所述待预测时间的区域热度进行预测;所述时间窗T小于所述第一历史时段的长度,且小于所述第二历史时段的长度。11.一种建立区域热度预测模型的装置,包括:预训练模块,用于利用第一历史区域热度数据,预训练时序预测模型;微调模块,用于将第二历史区域热度数据作为第二支持样本,利用所述第二支持样本对...

【专利技术属性】
技术研发人员:黄际洲王海峰范淼孙一博
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1