一种基于多视图深度残差神经网络的热点商圈预测方法技术

技术编号:23892721 阅读:100 留言:0更新日期:2020-04-22 07:08
本发明专利技术公开了一种基于多视图深度残差神经网络的热点商圈预测方法。该方法基于在线点评软件的评论与签到数据,通过局部CNN提取商圈临近空间关系,结合残差神经网络避免模型过拟合,最终将信息输入LSTM模型,实现了对热点商圈的预测。本发明专利技术方法良好关联了商圈的空间分布,并综合了近期与周期时间关系,有精度高、实用性强等特点,可以为公共设施部署、交通导流、用地规划等提供决策支撑。

【技术实现步骤摘要】
一种基于多视图深度残差神经网络的热点商圈预测方法
本专利技术涉及热点商圈预测领域,尤其涉及一种基于多视图深度残差神经网络的热点商圈预测方法。
技术介绍
商圈是众多商业个体的聚集,商圈的活跃度反映一个地区的商业发展情况。热点商圈预测属于时空关系预测,准确地预测热点商圈,有利于从业者把握商业发展趋势取得商业成功,帮助政府精准施策合理分配社会资源,规划城市布局。在热点商圈预测时,传统的研究往往依赖专家的实地调查,主观性较强推广较难。对于商圈的预测大多利用时间序列分析方法,不能捕捉商圈之间的相互影响与商业区块活跃度在时间与空间高维的联系。受到近年来基于深度学习的图像与视频方面取得的成果启发,科研人员将深度学习技术的应用范围扩展至时空关系预测领域。然而目前将深度学习应用至时空关系预测时,主要存在两个问题:使用CNN对空间关系进行提取时,将整个地区上的信息作为输入而不能良好的反映邻近地区之间相互作用强,分隔地区之间相互作用弱的实际情况;使用LSTM对时间信息展开预测,忽视了这些信息在空间上的相互联系。传统的商圈预测往往需要获取到店铺的营业额等经营情况,然而这涉及到商业机密以及商铺数量过多难以统计的问题。随着在线点评类软件的兴起,利用商铺的大数据进行商圈研究,在商圈的划定与分析方面有了一定的成果,但研究仅停留在了商业区块活跃度的分析,并未涉及到热点商圈的预测。
技术实现思路
为了克服上述现有技术的不足,本专利技术提供一种基于多视图深度残差神经网络的热点商圈预测方法,可有效解决上述问题。本专利技术具体采用的技术方案如下:一种基于多视图深度残差神经网络的热点商圈预测方法,包括以下步骤:S1.定义商业区块:将需要进行预测的商业区块定义为边长分别为a与b的矩形区域;S2.计算商铺活跃度:对商业区块内每家商铺τ的活跃度ετ通过在线点评软件的评论数量与签到数据相加进行计算,表示为:S3.对商业区块进行栅格化处理:将商业区块自坐标系原点置于二维坐标系中,按照N米*N米的栅格对商业区块进行分割,在x轴与y轴方向分别分为与个栅格,栅格在x轴与y轴方向上的序号分别为i与j,将栅格记为Pij;S4.对每个栅格进行赋值:将每个栅格内包含的所有商铺的活跃度进行求和,表示该栅格的活跃度初始值;S5.高斯平滑处理:按照二维高斯分布,将每个栅格的活跃度初始值分散至其周围k*k个栅格中,其中k取奇数,处理后栅格Pij的活跃度表示为S6.对商业区块进行切片得到切片矩阵,同时得到该商业区块的一维数组表示Y,具体包含以下子步骤:S61.将经过平滑处理的商业区块栅格图放置于二维坐标系的第一象限中;S62.从原点开始,切取k*k个栅格的切片,然后沿x轴正方向移动1个栅格后切取一个新的k*k切片,重复操作直到切片的右侧边缘到达商业区块边缘;S63.沿坐标轴y方向移动1个栅格的距离并在移动后重复S62,不断重复移动(每次移动均重复S62),直到切片的上侧边缘到达商业区块边缘,完成整个商业区块的切片,记切片的数量为Γ;S64.利用Γ个切片的中心栅格值为该商业区块的一维数组表示Y赋值,Y中包含Γ个元素;S7.训练商业区块活跃度预测模型,具体包含以下子步骤:S71.对预测月份前m个月的商业区块按月份依次执行m次S2到S6步骤,得到m*Γ个k*k的切片,将其记作四维的近期矩阵大小为(m,,,),对预测月份前n年同月份的商业区块按月份依次执行n次S2到S6步骤,得到n*Γ个k*k的切片,将其记作四维的周期性矩阵大小为(n,,,);S72.将矩阵输入到卷积层Conv_layer,对四维矩阵的后两个维度进行如下计算后得到输出矩阵VConv:其中为后两个维度中栅格点的栅格值,f为激活函数,w为可学习参数矩阵,b为偏置项参数;S73.将矩阵VConv输入批正则函数BatchNormalization中,对四维矩阵的后两个维度将进行如下计算后得到输出矩阵VBN:其中μConv为VConv中后两个维度的每维矩阵的平均值,σConv为VConv中后两个维度的每维矩阵的标准差组成的矩阵,∈是为了防止方差为0的常数,γ与β为可学习参数;S74.将矩阵VBN作为输入,再依次执行与S72、S73相同的运算,最终输出矩阵S75.将矩阵输入到卷积层Conv_layer2,执行与S72相同的运算,输出矩阵VConv2;S76.首先定义残差ResUnit,其接受矩阵作为输入,记作Vres_input,Vres_input经过其内部个连续的卷积层与批正则函数后,输出矩阵通过将Vres_input与相加,得到ResUnit的输出矩阵公式为:然后将VConv2依次输入至相连的个残差单元ResUnit中,最终得到输出矩阵S77.对与的后三个维度进行Flatten操作转换为两个二维矩阵,并将其分别对应输入到全连接层中,得到和计算公式如下:其中W为可学习参数矩阵,为偏置项参数,g为激活函数;S78.对与进行拼接操作生成向量然后将输入至LSTM神经网络中得到向量其中拼接操作计算公式如下:S79.将经过全连接层后得到长度为Γ的一维数组通过损失函数不断迭代Y与之间的损失值,当达到迭代终止条件时,输出商业活跃度预测模型S8.预测结果:与S71步骤做法一致,分别获得预测月份前m个月的矩阵和预测月份前n年同月份的矩阵输入至预测模型后得到商业活跃度预测结果矩阵S9.还原商业区块活跃度:将预测结果一维数组按照商业区块的栅格分布进行反向还原,还原后的二维矩阵中的每个元素与商业区块的每个栅格一一对应;S10.热点商圈提取:通过设置阈值的方式,提取预测商业活跃度大于阈值的所有栅格并将其进行拼接,得到商业区块内所有的热点商圈。作为优选,S71中所述的m取11,n取3。作为优选,S76中所述的残差单元中取13,取2。作为优选,S77所述的全连接层使用Relu激活函数。作为优选,S79中所述的全连接层使用的sigmoid激活函数,所述的损失函数为Loss,公式为:其中为矩阵中各个元素的值,为矩阵Y中各个元素的值。所述的迭代终止条件为迭代轮次达到10次或者损失函数值小于0.1%。本专利技术提出的预测模型从空间和时间两个视图对商业区块活跃度信息进行了提取。相比于传统的商业区块活跃度预测方法,本法明具有如下收益:1、使用点评类软件的大数据对商业区块活跃度进行刻画,减少了人为主观因素的影响,可推广性强;2、使用局部CNN对商业区块活跃度的空间信息进行提取,防止了神经网络对地图中距离较远栅格之间的过度拟合;3、使用LSTM对商业区块活跃度展开预测,良好地捕获了商业区块活跃度的高维时间信息;4、使用残差网络解决了梯度消失问题。附图说明图1为本专利技术的基于多视图深度残差神经网络的热点商圈预测模型;图2为本专利技术使用的商业区块本文档来自技高网...

【技术保护点】
1.一种基于多视图深度残差神经网络的热点商圈预测方法,其特征在于包括以下步骤:/nS1.定义商业区块:将需要进行预测的商业区块定义为边长分别为a与b的矩形区域;/nS2.计算商铺活跃度:对商业区块内每家商铺τ的活跃度ε

【技术特征摘要】
1.一种基于多视图深度残差神经网络的热点商圈预测方法,其特征在于包括以下步骤:
S1.定义商业区块:将需要进行预测的商业区块定义为边长分别为a与b的矩形区域;
S2.计算商铺活跃度:对商业区块内每家商铺τ的活跃度ετ通过在线点评软件的评论数量与签到数据相加进行计算,表示为:
S3.对商业区块进行栅格化处理:将商业区块自坐标系原点置于二维坐标系中,按照N米*N米的栅格对商业区块进行分割,在x轴与y轴方向分别分为与个栅格,栅格在x轴与y轴方向上的序号分别为i与j,将栅格记为Pij;
S4.对每个栅格进行赋值:将每个栅格内包含的所有商铺的活跃度进行求和,表示该栅格的活跃度初始值;
S5.高斯平滑处理:按照二维高斯分布,将每个栅格的活跃度初始值分散至其周围k*k个栅格中,其中k取奇数,处理后栅格Pij的活跃度表示为
S6.对商业区块进行切片得到切片矩阵,同时得到该商业区块的一维数组表示Y,具体包含以下子步骤:
S61.将经过平滑处理的商业区块栅格图放置于二维坐标系的第一象限中;
S62.从原点开始,切取k*k个栅格的切片,然后沿x轴正方向移动1个栅格后切取一个新的k*k切片,重复操作直到切片的右侧边缘到达商业区块边缘;
S63.沿坐标轴y方向移动1个栅格的距离并在移动后重复S62,不断重复直到切片的上侧边缘到达商业区块边缘,完成整个商业区块的切片,记切片的数量为Γ;
S64.利用Γ个切片的中心栅格值为该商业区块的一维数组表示Y赋值,Y中包含Γ个元素;
S7.训练商业区块活跃度预测模型,具体包含以下子步骤:
S71.对预测月份前m个月的商业区块按月份依次执行m次S2到S6步骤,得到m*Γ个k*k的切片,将其记作四维的近期矩阵大小为(m,Γ,k,k),对预测月份前n年同月份的商业区块按月份依次执行n次S2到S6步骤,得到n*Γ个k*k的切片,将其记作四维的周期性矩阵大小为(n,Γ,k,k);
S72.将矩阵输入到卷积层Conv_layer,对四维矩阵的后两个维度进行如下计算后得到输出矩阵VConv:



其中为后两个维度中栅格点的栅格值,f为激活函数,w为可学习参数矩阵,b为偏置项参数;
S73.将矩阵VConv输入批正则函数BatchNormalization中,对维矩阵的后两个维度将进行如下计算后得到输出矩阵VBN:



其中μConv为VConv中后两个维度的每维矩阵的平均值,σConv为VConv中后两个维度的每维矩阵的标准差组成的矩阵,∈是为了防止方差为0的常数,γ与β为可学习参数;
S74.将矩阵VBN作为输入,再依次执行与S72、S73相同的运算,最终输出矩阵
S75....

【专利技术属性】
技术研发人员:俞东进梁平孙笑笑
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1