基于主成分和聚类法的地产区域价值预测方法技术

技术编号:39585961 阅读:9 留言:0更新日期:2023-12-03 19:38
本发明专利技术属于数据处理和分析技术领域,提供基于主成分和聚类法的地产区域价值预测方法,创造性的利用

【技术实现步骤摘要】
基于主成分和聚类法的地产区域价值预测方法


[0001]本专利技术属于数据处理和分析
,具体涉及基于主成分和聚类法的地产区域价值预测方法


技术介绍

[0002]房价潜力预测是房地产未来发展趋势的一个重要参考指标,精准掌握某个地区的房价潜力对于利益相关者而言,它可以了解到不确定因素带来的市场风险,可以根据实际情况开发营销决策,提高经济效益

[0003]对于传统的预测方法,它把预测对象按照时间顺序排起,构成一个时间序列,然后以这个时间序列的内部规律推测未来的变化趋势,属于定量预测,不能反映事物的内在联系和分析两因素的相关关系

若其中出现异常值,则需要把异常值剔除,否则预测结果会有偏差,因此,只适用于数据均匀的序列

[0004]目前,应用主成分析法和聚类法进行房价潜力预测已成为当前的重要技术手段

如何将主成分分析法和聚类法结合进行地产区域价值预测,克服预测结果的偏差,成为十分重要的研究课题


技术实现思路

[0005]为解决
技术介绍
中存在的问题,本专利技术提供基于主成分和聚类法的地产区域价值预测方法,其包括根据各个地区主成分载荷值计算总载荷值即为综合得分的步骤

计算类间距进行地区分类的步骤

具体步骤如下:
[0006]步骤1:指标数据标准化处理;
[0007]步骤2:建立指标间的相关系数矩阵;
[0008]步骤3:确定特征值;
[0009]步骤4:确定主成分信息贡献率和主成分累计贡献率;
[0010]步骤5:确定主成分矩阵;
[0011]步骤6:确定主成分得分和综合得分;
[0012]步骤7:基于主成分得分形成3维空间计算两个样本点距离;
[0013]步骤8:基于样本点计算类间距

[0014]优选的方案中,步骤
S1
的具体过程为:
[0015]指标数据包括
GDP、
人均
GDP、
人均可支配收入

固定资产投资

房地产开发投资
,
计算公式如下
:
[0016][0017]式中
,x
ij
指的是第
i
行第
j
列的元素,指的是第
j
列平均值
,s
j
是第
j
列值总和与平均值总和的误差

[0018]优选的方案中,步骤
S2
的具体过程为:
[0019]基于标准化数据建立5个指标之间的相关系数矩阵,计算公式如下所示:
[0020][0021]式中,
n

10。
[0022]优选的方案中,步骤
S3
的具体步骤为:
[0023]利用相关系数矩阵
R
的特征方程,得出
R
的特征值个数
λ
j
,计算公式下所示
:
[0024]|R

λ
γ
I|
=0ꢀꢀ
(3)
[0025]式中
,I
为4×5的单位矩阵,
R
是相关系数矩阵

[0026]优选的方案中,步骤
S4
的具体步骤为:
[0027]根据特征值
λ
γ
,求出主成分信息贡献率和主成分累计贡献率,计算公式如式
(4)
和式
(5)
所示
:
[0028][0029][0030]优选的方案中,步骤
S5
的具体步骤为:
[0031]利用特征值
λ
γ
,根据式
(6)
选择主成分个数,执行累计方差解释率至少达到
85
%的标准
,
重新选取主成分个数,根据主成分个数求出成分矩阵,计算公式如式
(6)
所示
:
[0032][0033]式中,由于式
(3)
求出特征值和式
(4)
求出主成分累计贡献率,遵守累计方差解释率至少达到
85
%标准,最终选取特征值个数
γ

3。
[0034]优选的方案中,步骤
S6
的具体步骤为:
[0035]基于成分矩阵

特征值以及标准化数据求出主成分得分矩阵,根据主成分得分求出各个地区的综合得分,计算公式如式
(7)
所示
:
[0036][0037]式中,
b
j
为第
j
个主成分的信息贡献率
,Y
ij
是主成分得分矩阵

[0038]优选的方案中,步骤
S7
的具体步骤为:
[0039]根据每个地区的主成分得分形成一个多维空间,计算每两个地区的空间距离,选择两个地区距离的最小值合为一类,计算公式如式
(8)
所示
:
按如下的步骤进行:
[0056]步骤1:将
10
个地区的数据标准化处理,具体过程为:
[0057]指标数据包括
GDP、
人均
GDP、
人均可支配收入

固定资产投资

房地产开发投资
,
计算公式如下
:
[0058][0059]式中
,x
ij
指的是第
i
行第
j
列的元素,指的是第
j
列平均值
,s
j
是第
j
列值总和与平均值总和的误差

[0060]步骤2:基于标准化数据建立5个指标之间的相关系数矩阵,计算公式如下所示:
[0061][0062]式中,
n

10。
[0063]步骤
S3
:利用相关系数矩阵
R
的特征方程,得出
R
的特征值个数
λ
j
,计算公式下所示
:
[0064]|R

λ
γ
I|
=0ꢀꢀ
(3)
[0065]式中
,I
为4×5的单位矩阵,
R
是相关系数矩阵

[0066]步骤
S4
:根据特征值
λ
γ
,求出主成分信息贡献率和主成分累计贡献率,计算公式如式
(4)
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于主成分和聚类法的地产区域价值预测方法,其特征在于,其包括:根据各个地区主成分载荷值计算总载荷值即为综合得分的步骤

计算类间距进行地区分类的步骤
。2.
根据权利要求1所述的基于主成分和聚类法的地产区域价值预测方法,其特征在于,具体步骤如下:步骤1:指标数据标准化处理;步骤2:建立指标间的相关系数矩阵;步骤3:确定特征值;步骤4:确定主成分信息贡献率和主成分累计贡献率;步骤5:确定主成分矩阵;步骤6:确定主成分得分和综合得分;步骤7:基于主成分得分形成3维空间计算两个样本点距离;步骤8:基于样本点计算类间距
。3.
根据权利要求1所述的基于主成分和聚类法的地产区域价值预测方法,其特征在于,步骤
S1
的具体过程为:指标数据包括
GDP、
人均
GDP、
人均可支配收入

固定资产投资

房地产开发投资
,
计算公式如下
:
式中
,x
ij
指的是第
i
行第
j
列的元素,指的是第
j
列平均值
,s
j
是第
j
列值总和与平均值总和的误差
。4.
根据权利要求1所述的基于主成分和聚类法的地产区域价值预测方法,其特征在于,步骤
S2
的具体过程为:基于标准化数据建立5个指标之间的相关系数矩阵,计算公式如下所示:式中,
n

10。5.
根据权利要求1所述的基于主成分和聚类法的地产区域价值预测方法,其特征在于:步骤
S3
的具体步骤为:利用相关系数矩阵
R
的特征方程,得出
R
的特征值个数
λ
j
,计算公式下所示
:|R

λ
γ
I|
=0ꢀꢀꢀꢀꢀꢀ
(3)
式中
,I
为4×5的单位矩阵,
R
是相关系数矩阵
。6.
根据权利要求1所述的基于主成分和聚类法的地产区域价值预测方法,其特征在于:步骤
S4
的具体步骤为:根据特征值
λ
γ
,求出主成分信息贡献率和主成分累计贡献率,计算公式如式
(4)
和式
(5)
所示

【专利技术属性】
技术研发人员:籍艳
申请(专利权)人:青岛卓易策略数据信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1