一种基于迁移学习的城市住宅地价评估方法技术

技术编号:20004120 阅读:33 留言:0更新日期:2019-01-05 17:16
本发明专利技术公开了一种基于迁移学习的城市住宅地价评估方法,该方法涉及迁移学习的平复方法,属于资产评估领域,特别是在土地价格分类定级领域。本发明专利技术主要针对城市住宅地价数据集的特点,提出了一种基于迁移学习的城市住宅地价特征提取算法,针对现有地价回归评估模型的缺点,引入分类定级评估模型,对城市住宅地价数据集的缺陷进行克服。首先,对地价特征提取器进行训练,基于房价数据集,使用深度置信网络(Deep Belief Network,DBN)对蕴含在房价数据集中的房价与其特征因子之间的关系进行拟合。其次,保留训练好的DBN模型参数设置,基于DBN模型进行住宅地价特征提取。最后,基于已提取到地价特征集,利用不同的地价分类评估模型,对住宅地价实施分类定级评估。

A Method of Urban Residential Land Price Assessment Based on Migration Learning

The invention discloses a method of urban residential land price evaluation based on transfer learning, which relates to the recovery method of transfer learning and belongs to the field of asset evaluation, especially in the field of land price classification and grading. According to the characteristics of urban residential land price data set, the present invention proposes a feature extraction algorithm based on migration learning for urban residential land price. Aiming at the shortcomings of the existing land price regression evaluation model, the classification and grading evaluation model is introduced to overcome the shortcomings of urban residential land price data set. Firstly, the land price feature extractor is trained. Based on the house price data set, the relationship between house price and its characteristic factors in the house price data set is fitted using Deep Belief Network (DBN). Secondly, retain the parameters of the trained DBN model and extract the features of residential land price based on the DBN model. Finally, based on the extracted land price feature set, different land price classification and evaluation models are used to carry out classification and gradation evaluation of residential land price.

【技术实现步骤摘要】
一种基于迁移学习的城市住宅地价评估方法
本专利技术涉及迁移学习的平复方法,属于资产评估领域,特别是在土地价格分类定级领域。
技术介绍
城市住宅地价评估是土地市场管理的重要内容之一,常规的住宅地价评估方法主要包含特征选取、特征量化、特征提取、主体建模、地价评估等步骤。其中,住宅地价特征量化过程中存在主观性量化误差,住宅地价数据存在样本总量小、类别不平衡等缺陷。现有的城市住宅地价评估方法主要基于BP神经网络和曲面拟合模型对住宅地价与其影响因子之间的非线性关系进行拟合,忽略了特征量化过程中引入的主观误差以及住宅地价数据的缺陷,由此得到得的住宅地价回归模型将很难模拟出住宅地价与其影响因子的准确关系,现有的城市住宅地价评估方法就具有周期长、低效率、误差大等缺点。因此,提出一种适合住宅地价数据特征的快速评估方法很有必要,其研究成果具有很高的应用价值。
技术实现思路
针对上述城市住宅地价数据缺陷给模型训练带来的挑战,本专利技术提出了一种新的城市住宅地价评估框架,并针对城市住宅地价的数据特点,提出了新的城市住宅地价特征提取算法。本专利技术主要针对城市住宅地价数据集的特点,提出了一种基于迁移学习的城市住宅地价特征提取算法,针对现有地价回归评估模型的缺点,引入分类定级评估模型,对城市住宅地价数据集的缺陷进行克服。首先,对地价特征提取器进行训练,基于房价数据集,使用深度置信网络(DeepBeliefNetwork,DBN)对蕴含在房价数据集中的房价与其特征因子之间的关系进行拟合。其次,保留训练好的DBN模型参数设置,基于DBN模型进行住宅地价特征提取。最后,基于已提取到地价特征集,利用不同的地价分类评估模型,对住宅地价实施分类定级评估。因此本专利技术的技术方案为一种基于迁移学习的城市住宅地价评估方法,该方法包括:步骤1:收集待评估区域中各地块的地价和不同类型房屋的房价,收集影响各地块地价与住宅房屋价格的影响因子,确定各影响因子对地价和房价的影响权重;步骤2:确定两个待训练的DBN模型,并采用步骤1得到的各地块不同类型房屋的房价数据对两个待训练的DBN模型进行训练;其中一个为降维型DBN模型包括:输入层,中间三层隐含层,输出层;该降维型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数小于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;另一个为扩展型DBN模型包括:输入层,中间三层隐含层,输出层;该扩展型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数大于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;步骤3:将步骤1中影响各地块价格的影响因子作为步骤2训练好的两个DBN模型的输入,获得每层隐含层的输出,将两个DBN模型中每层隐含层的输出组成集合作为各地块地价的特征集;步骤4:确定3个地价评估模型:BP神经网络模型、支持向量机(SupportVectorMachine,SVM)模型、随机森林模型,采用各地块的地价和其对应的特征集对3个地价评估模型进行训练;步骤5:对无标签地块的价格进行评估;步骤5.1:获取对无标签地块有影响的影响因子,各影响因子的影响权重与步骤1中影响权重相同;步骤5.2:采用步骤3的方法获得该无标签地块的特征集;步骤5.3:分别采用BP神经网络模型、SVM模型、随机森林模型来确定城市住宅地价无标签地块的价格,再对个模型评估的价格求平均得到最终的评估价格。步骤5.4:根据步骤5.2的特征集,采用步骤5.3确定的地价评估模型评估出该无标签地块的地价。进一步的,所述影响因子为下列影响因子中的一项或多项:城市快速路、高速公路、公交、地铁、中学、小学、幼稚园、商服发达度、医院、餐饮网点密度、金融服务网点密度、汽车服务网点密度、公园绿地、旅游景区、区域规划前景、人口密度。进一步的,所述步骤4中首先对各地块地价进行归一化处理,将归一化处理后的数据和其对应的特征集对3个地价评估模型进行训练。通过基于迁移学习的城市住宅地价分类评估方法,可以对于一座城市的地价进行快速而准确地评估,减少地价的小样本性对地价评估带来的致命缺陷,提高模型的准确拟合程度,从而提高地价评估精度。附图说明图1为基于迁移学习的城市住宅地价评估框架图;图2为基于迁移学习的城市住宅地价特征提取算法流程图;图3为地价数据箱式图示意图;图4为地价数据归一化分维可视化图;图5为SVM不同训练数据交叉验证结果图;图6为BP神经网络交叉验证结果图;图7为不同特征集关于三种模型平均分类精度图;图8为三种模型分类精度对比图。具体实施方式步骤1.根据选择的研究区域,本专利以深圳市为例,搜集了深圳市十个区县的房价与地价数据,主要包括兴趣点的坐标信息及其相关属性信息;运用德尔菲法和主成分分析方法对种类繁多的深圳市住宅地价特征因子进行分析,去除相关性强、重要程度低的特征因子,确定了包含城市快速路、高速公路、公交、地铁、中学、小学、幼稚园、商服发达度、医院、餐饮网点密度、金融服务网点密度、汽车服务网点密度、公园绿地、旅游景区、区域规划前景、人口密度等影响房价与地价的16个影响因子。对于各个影响因子的量化方式,结合各个影响因子对房地价的作用方式,分别采用绝对量化、相对量化、加权量化、等级量化的方式。步骤2.由于DBN模型具有对数据集特征提取能力,基于降维型DBN模型各层维度为16-12-12-10-7和扩展型DBN模型各层维度为16-20-20-20-7,使用带房价类别标签的、因子信息量丰富的、类别分布均衡的房价数据对两种DBN特征提取器进行训练,并进行精度分析。其中,房价类别采用正交向量编码唯一识别,则输出层为7维向量;中间三层隐含层采用Sigmoid函数,输出层采用Softmax分类函数;同时为防止模型过拟合,对中间层采用Dropout策略,第一层设置保留系数设置为0.2,第二次至第五层保留系数设置为0.5;步骤3.基于第二步训练好的DBN模型,保留两种模型的参数、激活函数、结构等信息,使用处理归一化处理后的地价数据集作为DBN模型的输入数据,每个模型的三个隐含层将分别获得三个不同的地价特征集,该特征集是对原始地价数据集的抽象与提取,数据集特征更接近于地价分类特征,然后将新提取特征集用于地价分类定级评估;步骤4.对第三步优化提取的地价特征集进行分类定级评估。为防止模型选择给地价特征集评估带来的影响,使用三种不同的分类评估模型(BP神经网络、SVM模型、随机森林模型)分别对提取的地价特征集进行分类定级评估,使用分类混淆矩阵、总体分类精度及Kappa系数作为分类评估指标,取三种模型的平均分类精度作为所提取地价特征集的分类定级精度;步骤5.基于预训练好的地价特征提取器、选取三种分类模型中分类效果最好的分类器作为地价评估模型,对无标签地块的地价进行分类定价评估;通过以上步骤,实验结果表明迁移学习所得地价特征集分类精度高于归一化和主成分分析方法地价特征集的分类精度;距离地价特征提取器的分类层越近,所得特征集分类精度越高本文档来自技高网...

【技术保护点】
1.一种基于迁移学习的城市住宅地价评估方法,该方法包括:步骤1:收集待评估区域中各地块的地价和不同类型房屋的房价,收集影响各地块地价与住宅房屋价格的影响因子,确定各影响因子对地价和房价的影响权重;步骤2:确定两个待训练的DBN模型,并采用步骤1得到的各地块不同类型房屋的房价数据对两个待训练的DBN模型进行训练;其中一个为降维型DBN模型包括:输入层,中间三层隐含层,输出层;该降维型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数小于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;另一个为扩展型DBN模型包括:输入层,中间三层隐含层,输出层;该扩展型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数大于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;步骤3:将步骤1中影响各地块价格的影响因子作为步骤2训练好的两个DBN模型的输入,获得每层隐含层的输出,将两个DBN模型中每层隐含层的输出组成集合作为各地块地价的特征集;步骤4:确定3个地价评估模型:BP神经网络模型、支持向量机(Support Vector Machine,SVM)模型、随机森林模型,采用各地块的地价和其对应的特征集对3个地价评估模型进行训练;步骤5:对无标签地块的价格进行评估;步骤5.1:获取对无标签地块有影响的影响因子,各影响因子的影响权重与步骤1中影响权重相同;步骤5.2:采用步骤3的方法获得该无标签地块的特征集;步骤5.3:分别采用BP神经网络模型、SVM模型、随机森林模型来确定城市住宅地价无标签地块的价格,再对个模型评估的价格求平均得到最终的评估价格。步骤5.4:根据步骤5.2的特征集,采用步骤5.3确定的地价评估模型评估出该无标签地块的地价。...

【技术特征摘要】
1.一种基于迁移学习的城市住宅地价评估方法,该方法包括:步骤1:收集待评估区域中各地块的地价和不同类型房屋的房价,收集影响各地块地价与住宅房屋价格的影响因子,确定各影响因子对地价和房价的影响权重;步骤2:确定两个待训练的DBN模型,并采用步骤1得到的各地块不同类型房屋的房价数据对两个待训练的DBN模型进行训练;其中一个为降维型DBN模型包括:输入层,中间三层隐含层,输出层;该降维型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数小于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;另一个为扩展型DBN模型包括:输入层,中间三层隐含层,输出层;该扩展型DBN模型的输入层维度个数与步骤1中确定的影响因子个数相同;中间三层隐含层的维度个数大于输入层的维度个数,各隐含层都采用Dropout策略放置过拟合,各隐含层采用Sigmoid函数将输入映射到下一层;输出层的维度与步骤1中房屋类型的个数相同;步骤3:将步骤1中影响各地块价格的影响因子作为步骤2训练好的两个DBN模型的输入,获得每层隐含层的输出,将两个DBN模型中每层隐含层的输出组成集合作为...

【专利技术属性】
技术研发人员:郑泽忠王娜刘佳玺谢晨牟范张彪李江
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1