The invention discloses a housing price forecasting method based on in-depth learning and feature combination, which comprises the following steps: recognizing data, analyzing data, feature engineering, in-depth learning, and forecasting results. The method of the invention provides a new idea of feature combination, and carries out layer-by-layer training network structure based on deep learning model structure. Compared with traditional manual feature extraction and common machine learning methods, the method can effectively extract the inherent non-linear features of data and better solve the problem of housing price prediction. The method achieves the fourth place in the King County House Price Prediction Competition of the United States on the DataCastle platform with an error accuracy of 0.14, which fully proves the effectiveness of the method.
【技术实现步骤摘要】
一种基于深度学习与特征组合的房价预测方法
本专利技术涉及美国KingCounty房价数据的特征提取与数据回归预测
,尤其涉及一种基于深度学习与特征组合的房价预测方法。
技术介绍
在我国房价持续高速增长的大环境下,其伴随的相关产业也迅速发展起来。例如一些公司或科研单位利用数学模型预测房价走势,从而产生巨大的经济效益。目前,在房价预测与分析相关的问题的研究方法主要有以下方法:(1)、基于传统逻辑回归方法预测,选择相关系数较高的特征,简单进行缺失值和热独码处理,利用最小二乘法,对数据进行拟合;(2)、基于集成学习的方法,使用多个模型得到多个预测结果,在其中选取可能性最大的一种。
技术实现思路
为了克服现有技术存在的缺点与不足,本专利技术提供一种基于深度学习与特征组合的房价预测方法,对相关性较低的特征进行特征组合,利用多层神经网络提取房价数据的特征,然后使用深度学习对特征进行回归计算,得到房价的预测值,使得更好的对房价问题进行预测和分析。为了解决上述技术问题,本专利技术提供如下技术方案:基于深度学习与特征组合的房价预测方法,包括如下步骤:S1、针对所需解决的问题,根据日 ...
【技术保护点】
1.一种基于深度学习与特征组合的房价预测方法,其特征在于,包括如下步骤:S1、针对所需解决的问题,根据日常生活经验推测出影响房价的因素,并考虑各因素之间的关联关系;读取美国KingCounty房价预测数据,获取数据集特征;S2、利用散点图、直方图和箱形图分析数据特征;S3、对缺失数据补全;利用已有特征组合成新特征;S4、建立深度学习模型;输入训练数据训练模型;S5、将测试数据输入模型,调节参数使得模型最优化。
【技术特征摘要】
1.一种基于深度学习与特征组合的房价预测方法,其特征在于,包括如下步骤:S1、针对所需解决的问题,根据日常生活经验推测出影响房价的因素,并考虑各因素之间的关联关系;读取美国KingCounty房价预测数据,获取数据集特征;S2、利用散点图、直方图和箱形图分析数据特征;S3、对缺失数据补全;利用已有特征组合成新特征;S4、建立深度学习模型;输入训练数据训练模型;S5、将测试数据输入模型,调节参数使得模型最优化。2.根据权利要求1所述的一种基于深度学习与特征组合的房价预测方法,其特征在于:所述步骤S1中根据日常生活经验推测出影响房价的主要因素包括房子面积、房子所在的区域、房龄、房型、特殊场景、交易时间。3.根据权利要求1所述的一种基于深度学习与特征组合的房价预测方法,其特征在于:所述数据集特征包括销售日期、销售价格、卧室数、浴室数、房屋面积、公园面积、楼层数、评分、建筑面积、地下室面积、建筑年份、修理年份、经度、维度。4.根据权利要求1所述的一种基于深度学习与特征组合的房价预测方法,其特征在于:所述步骤S2具体为:S21、输出部分数据,观察数据特征,区分类别型特征与数值型特征;S22、分析因变量房价,得出斜度和峭度,根据直方图了解因变量分布情况;S23、多因素分析,通过散点图和直方图,了解各特征之间的关系;S24、对类别型特征绘制箱形图,进一步确定其特征类型;S25、通过热力图,得到各特征间的相关系数。5.根据权利要求1所述的一种基于深度学习与特征组合的房价预测方法,其特征在于:所述步骤S3具体为:S31、使用各数值型特征的平均值填充其缺失值;S32、合并训练数据和测试数据,方便特征工程;S33、计算销售日期和建筑日期之间间隔的天数,创建新特征;S34、求得修理日期与建筑...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。