一种房产价格评估方法、装置、电子设备及存储介质制造方法及图纸

技术编号:25758160 阅读:21 留言:0更新日期:2020-09-25 21:06
本申请公开了一种房产价格评估方法、装置、电子设备及存储介质。房产价格评估方法包括:获取待测房产的至少包括地域属性值的属性数据,从网络中获取所在地域与所述地域属性值一致的指定房产的数据,根据指定房产的数据得到样本数据;基于所述样本数据,训练房价评估模型并保存;将待测房产的属性数据输入到保存的所述房价评估模型中,得到所述房价评估模型输出的待测房产价格。本申请实施例以实时的房产数据作为样本数据的来源,抽取与待预测数据地域(如省份、城市)相同的数据作为样本数据,保证样本数据和待测数据具有相同的属性值,利用样本数据训练房价评估模型,通过房价评估模型进行房产价格预测,使得预测得到的价格更加准确。

【技术实现步骤摘要】
一种房产价格评估方法、装置、电子设备及存储介质
本申请涉及互联网
,具体涉及一种房产价格评估方法、装置、电子设备及存储介质。
技术介绍
随着房地产业和互联网行业高速发展、日趋成熟,房地产业已经成为国民经济的新增长点,房价问题已成为人们日益关注的话题。而且房地产业的发展也关系到整个国民经济的发展,因此房产价格评估显得尤为重要。国家层面对房价评估的是房产交易中心,房产交易中心往往只依据房产的年份、大小笼统的对房产价格进行评估,评估价格与实际价格出入较大。互联网上或者相关的房产APP(Application应用程序)也可以搜索房产价格信息,用户可以通过一些维度信息进行房产价格检索,但网上的价格多为吸引用户的与实际房产价值不符的价格。房地产价格的制定原则中提到房产价格必须符合价值,对于不同质的房产,必须实行不同的价格标准,优质优价、低质低价,同类房产的价格标准必须反映房产内在质的差别。由于影响房产价格的因素较多,传统的房产价格房价评估模型,对数据量要求大,预测准确性差,因此亟需一种准确评估房产价格的技术方案。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的房产价格评估方法、装置、电子设备及存储介质。依据本申请的一个方面,提供了一种房产价格评估方法,包括:获取待测房产的至少包括地域属性值的属性数据,从网络中获取所在地域与所述地域属性值一致的指定房产的数据,根据指定房产的数据得到样本数据;基于所述样本数据,训练房价评估模型并保存;将待测房产的属性数据输入到保存的所述房价评估模型中,得到所述房价评估模型输出的待测房产价格。依据本申请的另一方面,提供了一种房产价格评估装置,包括:样本获取单元,用于获取待测房产的至少包括地域属性值的属性数据,从网络中获取所在地域与所述地域属性值一致的指定房产的数据,根据指定房产的数据得到样本数据;模型训练单元,用于基于所述样本数据,训练房价评估模型并保存;价格评估单元,用于将待测房产的属性数据输入到保存的所述房价评估模型中,得到所述房价评估模型输出的待测房产价格。依据本申请的又一方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述所述的方法。依据本申请的再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的方法。由上述可知,本申请的技术方案,以从网络中爬取的房产数据作为样本数据的来源,从样本数据中抽取与待测房产地域(如省份、城市)相同的数据作为样本数据,保证样本数据和待测数据具有相同的属性值(如地域),接着利用样本数据建立房价评估模型并保存,通过房价评估模型进行房产价格的预测,使得预测得到的房产价格更加准确。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本申请一个实施例的房产价格评估方法的流程示意图;图2示出了根据本申请一个实施例的房价评估模型构建流程示意图;图3示出了根据本申请一个实施例的房价评估模型训练流程示意图;图4示出了根据本申请一个实施例的10折交叉验证示意图;图5示出了根据本申请一个实施例的待测房产价格评估流程示意图;图6示出了根据本申请一个实施例的房产价格评估装置的框图;图7示出了根据本申请一个实施例的电子设备的结构示意图;图8示出了根据本申请一个实施例的计算机可读存储介质的结构示意图。具体实施方式下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。本申请的技术构思是:针对现有模型预测房产价格存在的准确性差的技术问题,本申请实施例在获取待测房产数据之后,根据待测房产数据中的地域数据获取同一地域的房产数据作为样本数据,通过使用少量样本数据训练房价评估模型即可快速有效的预测出房产价格。已知影响房产价格的因素很多,其中比较重要的因素是地域和房龄,以地域为例,同样面积、户型的房子,北京的价格与黑龙江的价格差别很大,即使同在北京,不同的行政区域房子的价格也不同。为了消除时间跨度、房产所在区域对房产价格的影响,本申请实施例采用爬虫技术爬取网络数据,经过数据提取,提取出与待预测数据时间相近且省市区县相同的数据作为样本数据。为了让预测的房产价格更准确,本申请实施例对样本数据进行空值、无效值等过滤,减少无效样本数据对预测结果的影响。有些样本数据的属性值是字符串变量,在进行算法实现时,不能直接对其进行处理,因此本申请实施例通过数值化处理将离散型属性值转换成数值。通过梯度提升树算法建立房价评估模型,多次调整参数取值查看验证结果,选取最优参数值。将样本数据按照k折交叉验证法的分割方式分成训练集和验证集,进行房价评估模型验证,验证效果好,则将房价评估模型持久化。最后,为了保证预测价格的准确,对待测数据也进行数据清洗、数值化处理过程。图1示出了根据本申请一个实施例的房产价格评估方法的流程示意图,参见图1,本申请实施例的房产价格评估方法包括下列步骤:步骤S110,获取待测房产的至少包括地域属性值的属性数据,从网络中获取所在地域与所述地域属性值一致的指定房产的数据,根据指定房产的数据得到样本数据;步骤S120,基于所述样本数据,训练房价评估模型并保存;步骤S130,将待测房产的属性数据输入到保存的所述房价评估模型中,得到所述房价评估模型输出的待测房产价格。由图1所示可知,本申请实施例的房产价格评估方法,获取待测房产的属性数据,根据待测房产的地域属性值,从网络中爬取所在地域与地域属性值一致的指定房产数据,由指定房产数据得到样本数据,基于样本数据训练房价评估模型,将待测房产的属性数据输入到房价评估模型中,得到预测的房产价格。从而以实时获取的房产数据作为样本数据的基础来源,抽取与待测房产地域(如省份、城市)相同的数据作为样本数据,保证样本数据和待测数据具有相同的属性值,提高了房价评估模型预测的精度,使得预测的房产价格更加准确。大体上,本申请实施例的房产价格评估方法包括两个部分,第一部分,建立房价评估模型,第二部分,评估房产价格。下面结合附图2至图5进行说明。第一部分,建立房价评估模型。图2示出了根据本申请一个实施例的房价评估模型构建流程示意图,参见图2,模型构建流程包括下列步骤:爬虫收集数据、数据抽取、数据清洗,数值化处理,利用梯度提升树建立房价评本文档来自技高网...

【技术保护点】
1.一种房产价格评估方法,其特征在于,包括:/n获取待测房产的至少包括地域属性值的属性数据,从网络中获取所在地域与所述地域属性值一致的指定房产的数据,根据指定房产的数据得到样本数据;/n基于所述样本数据,训练房价评估模型并保存;/n将待测房产的属性数据输入到保存的所述房价评估模型中,得到所述房价评估模型输出的待测房产价格。/n

【技术特征摘要】
1.一种房产价格评估方法,其特征在于,包括:
获取待测房产的至少包括地域属性值的属性数据,从网络中获取所在地域与所述地域属性值一致的指定房产的数据,根据指定房产的数据得到样本数据;
基于所述样本数据,训练房价评估模型并保存;
将待测房产的属性数据输入到保存的所述房价评估模型中,得到所述房价评估模型输出的待测房产价格。


2.如权利要求1所述的方法,其特征在于,所述属性数据中还包括待测房产的建成年份属性值;
所述根据指定房产的数据得到样本数据包括:
从所述指定房产的数据中提取建成年份与所述待测房产的建成年份属性值相同的房产数据或建成年份与所述待测房产的建成年份属性值的差值不大于预设阈值的房产数据,作为样本数据。


3.如权利要求1所述的方法,其特征在于,所述基于所述样本数据,训练房价评估模型包括:
对所述样本数据进行数据清洗;
对清洗后样本数据中的非数值型属性值进行数值化处理,将非数值型属性值转换为相应的数值;
利用梯度提升树算法以及数值化处理后的样本数据训练房价评估模型。


4.如权利要求3所述的方法,其特征在于,所述利用梯度提升树算法以及数值化处理后的样本数据训练房价评估模型包括:
将数值化处理后的样本数据划分为k份进行k折交叉验证:
步骤A,选取k份中的一份作为测试集,其余作为训练集训练房价评估模型;
步骤B,计算房价评估模型在测试集上的准确率,得到本轮验证误差;
重复步骤A和步骤B,得到k个验证误差;
判断k个验证误差是否符合预设条件;
如果k个验证误差符合预设条件,则结束房价评估模型训练并保存房价评估模型;所述预设条件包括:各个验证误差小于预设第一阈值且各个验证误差之间的差值小于预设第二阈值。


5.如权利要求3所述的方法,其特征在于,所述对清洗后样本数据中的非数值型属性值进行数值化处理包括:
对于清洗后样本数据中属性值之间具有顺序的第一离散属性,将第一离散属性的第一属性值转换为预设数列中的相应数值;
对于清洗后样本数据中属性值之间无序的第二离散属性,根据第二属性值指示的地理位置...

【专利技术属性】
技术研发人员:王志慧李晓宇李明张月鹏姜秋宇裴广超
申请(专利权)人:北京神州泰岳智能数据技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1