一种基于极限学习机的最优化连锁店选址方法技术

技术编号：16188631 阅读：362 留言：0更新日期：2017-09-12 11:37

本发明专利技术公开了一种基于极限学习机的最优化连锁店选址方法，包括：首先根据城市路网划分区域，然后利用每个区域内的社交媒体和传感器数据构造特征，并利用极限自动编码机进行特征融合。最后根据城市之间数据分布的差异因素，灵活采用栈极限学习机和自适应领域极限学习机，训练最优化连锁店选址方法。本发明专利技术利用极限自动编码机对不同视图数据进行融合，可有效扩展其他来源的数据，同时本发明专利技术基于自适应领域极限学习机技术，对拥有较小样本的小城市也能取得较好的效果。

An optimal chain store location method based on extreme learning machine

The invention discloses a locating method, extreme learning machine based on chain optimization includes: firstly, according to the division of the regional city road network, and the use of social media within each region and sensor data structure, encoding and automatic machine feature fusion based on limit. Finally, according to the difference of data distribution between cities, flexible stack limit learning machine and adaptive domain extreme learning machine are adopted to train the location method of chain store. The invention uses limit automatic machine encoding the fusion of different view data can be effectively extended to other sources of data, at the same time, the invention of adaptive field extreme learning machine based on the technology of a small city with a small sample can also achieve better results.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于极限学习机的最优化连锁店选址方法
本专利技术属于数据挖掘与城市计算领域，具体涉及一种基于极限学习机的最优化连锁店选址方法。
技术介绍
商铺最优化选址能带来很强的经济效益。最优化的选址比随机选址通常能吸引更多的顾客。例如一个新的咖啡店可以开在道路的交叉口附近，通常交叉口拥有便利的交通和较好的客流，然而交通拥堵等因素也可能会给这个选址带来负面影响。随着城市计算的不断发展，利用城市中的海量数据进行商铺商铺的最优化选址成为了可能。传统的最优化选址通常利用一个区域本身特点例如人流量、购买力、交通等来构建模型。然而人不一定会一直停留在某些特定的区域。例如在大城市，早上有部分人会从很远的市郊到市中心上班，人处在一定的流动中。一个区域本身拥有的功能(例如是不是商圈)也会对选址的优劣产生影响。此外，区域内的同种类型的商铺所带来的竞争因素也需要值得考虑。一个最优的选址应当是一个能够吸引最多用户的区域。考虑到综上所述的因素，通常在大城市采集相应的数据是能够建立出最优的选址模型的。然而，城市中的某些区域或对于某些小城市，部分数据例如社交媒体等是相当稀疏的，单独利用这些区域或城市本身的数据建立的模型不能够取得很好的效果。此外，传统的学习模型的方式需要优化海量的参数，训练效率低下。近年来，极限学习机作为一种在海量数据学习中取得较高学习效果的学习框架，在很多领域取得了突出成果。栈极限学习机能够很好的应对高维特征和海量的数据样本的学习任务，自适应领域极限学习机能够利用不同分布的数据而取得较好的学习效果。因此，极限学习机对于利用海量城市数据进行连锁店最优化选址问题是很可行的。专利技...
一种基于极限学习机的最优化连锁店选址方法

【技术保护点】
一种基于极限学习机的最优化连锁店选址方法，包括下列步骤：(1)以每个城市的道路路网为边界，将城市划分成若干个相邻的区域；(2)采集每个区域内的社交媒体数据和物理传感器数据组成数据样本，并利用数据样本构造每个区域内与选址相关的社交媒体特征和物理传感器特征组成特征数据；(3)将社交媒体数据和物理传感器数据视作不同视图的数据，并利用自编码算法对每个区域内同一时间段内的社交媒体特征和物理传感器特征进行融合，得到融合特征；(4)选择需要最优化商铺选址的城市作为目标城市，选取相对于目标城市样本数据和特征数据更多的城市构造来源城市，若目标城市与来源城市的特征相对熵小于阈值，则将来源城市中的每个区域的融合特征作为栈极限学习机的输入，训练栈极限学习机，得到选址模型；否则，将目标城市和来源城市中的每个区域的融合特征作为自适应领域极限学习机的输入，训练自适应领域极限学习机，得到选址模型。(5)利用选址模型对目标城市中的每个区域进行测试，得到最优的寻址区域。

【技术特征摘要】
1.一种基于极限学习机的最优化连锁店选址方法，包括下列步骤：(1)以每个城市的道路路网为边界，将城市划分成若干个相邻的区域；(2)采集每个区域内的社交媒体数据和物理传感器数据组成数据样本，并利用数据样本构造每个区域内与选址相关的社交媒体特征和物理传感器特征组成特征数据；(3)将社交媒体数据和物理传感器数据视作不同视图的数据，并利用自编码算法对每个区域内同一时间段内的社交媒体特征和物理传感器特征进行融合，得到融合特征；(4)选择需要最优化商铺选址的城市作为目标城市，选取相对于目标城市样本数据和特征数据更多的城市构造来源城市，若目标城市与来源城市的特征相对熵小于阈值，则将来源城市中的每个区域的融合特征作为栈极限学习机的输入，训练栈极限学习机，得到选址模型；否则，将目标城市和来源城市中的每个区域的融合特征作为自适应领域极限学习机的输入，训练自适应领域极限学习机，得到选址模型。(5)利用选址模型对目标城市中的每个区域进行测试，得到最优的寻址区域。2.如权利要求1所述的基于极限学习机的最优化连锁店选址方法，其特征在于，所述的社交媒体数据指的是从微博、大众点评获得的社交媒体文本。3.如权利要求1所述的基于极限学习机的最优化连锁店选址方法，其特征在于，所述的物理传感器数据指的是从交通、公交车、房地产价格、兴趣点以及商圈获得的数据。4.如权利要求2所述的基于极限学习机的最优化连锁店选址方法，其特征在于，以分析社交媒体文本获得的词向量、词频率以及用户对区域内商铺的环境、服务的评分作为社交媒体特征。5.如权利要求3所述的基于极限学习机的最优化连锁店选址方法，其特征在于...

【专利技术属性】
技术研发人员：陈华钧，张宁豫，陈曦，吴朝晖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人