成都市05年度住宅市场定价模型

时间:2020-08-30 15:11:04 经济毕业论文 我要投稿

成都市05年度住宅市场定价模型

 
成都市05年度住宅市场定价模型
 
 
摘  要:本文通过计量统计的方法,将住宅价格的形成视作是其自身各方面属性综合作用的结果,并通过对成都市住宅市场2005年4月的楼盘公开信息数据建立基于成都住宅市场的房价模型,分析影响其价格的主要因素。

成都市05年度住宅市场定价模型

关键词:逐步回归,显著性水平,SAS

引言
 “安居乐业”有史以来就是衡量社会福利的指标之一,不同国度、不同历史时期皆然如此。尤其在中国这样一个儒学底蕴深厚的国家,“寄身之所”的重要性关乎社会、经济、文化的方方面面。早在千余年前,就有“安得广厦千万间”的疾呼,而今,如火如荼的房产市场更是引来社会各界的关注。介于此,我们意图通过计量统计所学,为房价(成都房产市场)这一敏感话题建立模型,揭开隐于其后的影响因素。

二、计量经济模型
 通过考察,我们在诸多可能影响房价的因素中选取以下九个作为住宅均价的解释变量,并对区位、厨卫装修、周边环境、环境进行评分,详见下表:
代码 因素 评分标准 分值 备注
x1 区位 一环以内(河内) 5 
  一环以内 4 
  一二环间 3 
  二三环间 2 
  三环以外 1 
  郊区 0.5 
x2 绿化率   
x3 容积率   等于总建筑面积与用地面积的比率
x4 占地面积   
x5 室   
x6 厅   
x7 卫   
 厨卫装修标准 精装修 3 
  初装修 2 
  清水房 1 
x8 周边环境 有大型商场,超市 2 累加
  有大学、小学、中学、幼儿园 2 
  交通便利与否 2 
  运动设施 2 
x9 户型 多层 2 7层及其以下,无电梯
  小高层 1.5 
 y  高层 1 7层以上的电梯公寓

(一)模型的建立:
首先我们假定模型为线性形式:即
使用eviews对该模型进行回归分析(原始数据参见附件一)
Dependent Variable: Y
Method: Least Squares
Date: 07/06/05   Time: 15:49
Sample: 1 46
Included observations: 46
Variable Coefficient Std. Error t-Statistic Prob. 
X1 330.3166 158.9451 2.078181 0.0449
X2 35.71240 18.36193 1.944915 0.0596
X3 270.5117 200.5099 1.349119 0.1857
X4 -0.145941 0.618733 -0.235871 0.8149
X5 -75.59086 209.5936 -0.360654 0.7205
X6 -201.6988 314.9935 -0.640327 0.5260
X7 406.5982 350.6853 1.159439 0.2539
X8 555.8820 129.3793 4.296531 0.0001
X9 636.7978 429.4878 1.482691 0.1469
C -2332.010 1320.955 -1.765396 0.0860
R-squared 0.783368     Mean dependent var 3184.696
Adjusted R-squared 0.729209     S.D. dependent var 1440.707
S.E. of regression 749.7082     Akaike info criterion 16.26691
Sum squared resid 20234248     Schwarz criterion 16.66444
Log likelihood -364.1388     F-statistic 14.46446
Durbin-Watson stat 1.097759     Prob(F-statistic) 0.000000
 
 回归结果见上表,发现t统计量的p值明显大于0.05,无法通过检验,修正R^2=0.729209较高,F值显著大于临界值0.05,我们认定模型中存在多重共线;与此同时,DW的值1.097759在0.01显著性水平下落入无法判定区域(0.927  1.834)。
 鉴于回归结果不太理想,我们决定将模型进行对数变化。对数变换后模型中参数可以看作Y相对于X的百分比变化,可以降低数据中因为评分的人为因素造成的不利影响,而且还可以减少异方差的影响。即原表达式变化为:
 
 根据新的对数模型,我们采取逐步回归的方式不断的.减少解释变量个数寻求最佳的log(y)表达式,即当模型中有i(i=9、8、7….)个解释变量时,我们从个模型中选取F统计量的p值最优的一个,直至达到理想效果时(即F统计量的p值小于给定的临界值)停止减少变量。我们将这个F的p值取为0.05,应用统计软件SAS,我们可以直接得到逐步回归的最优结果,如下:
Step 1  当引入九个解释变量时的回归结果:                                    
Variable Coefficient Error Sum of Squares F Prob>F
c 4.87008388 0.86121754 1.51976912 31.98 0.0001
LOGX1 0.57178564 0.08930026 1.94846019 41.00 0.0001
LOGX2 0.74759478 0.23261117 0.49090996 10.33 0.0028
LOGX3 0.00613760 0.15574548 0.00007381 0.00 0.9688
LOGX4 0.03867910 0.04376193 0.03712703 0.78 0.3826
LOGX5 0.04434081 0.14456985 0.00447077 0.09 0.7608
LOGX6 -0.10341707 0.19090993 0.01394626 0.29 0.5914
LOGX7 -0.04581903 0.15905078 0.00394412 0.08 0.7749
LOGX8 0.06266131 0.12937475 0.01114886 0.23 0.6311
LOGX9 0.11958031 0.17348930 0.02257898 0.48 0.4951

 显然,LOGX3、LOGX4……LOGX9的回归结果皆不尽如人意,其F的p值大于0.05。该模型达不到要求。因此,我们改用8个变量回归,并在个回归结果中选出最优的一个(即下表)。有必要说明,这一选择过程由SAS软件完成,依据的标准已事先在程序内部设定。同理,以下7步皆照此处理,不再赘述。

Step 2  引入8个解释变量的回归结果
Variable Coefficient Error SumofSquares F Prob>F
C 4.87932500 0.81741962 1.64770459 35.63 0.0001
LOGX1 0.57346645 0.07739036 2.53917319 54.91 0.0001
LOGX2 0.74703670 0.22902556 0.49200095 10.64 0.0024
LOGX4 0.03785721 0.03794983 0.04601798 1.00 0.3250
LOGX5 0.04457036 0.14249009 0.00452452 0.10 0.7562
LOGX6 -0.10072091 0.17580833 0.01517785 0.33 0.5702
LOGX7 -0.04603275 0.15679887 0.00398564 0.09 0.7707
LOGX8 0.06277069 0.12758784 0.01119297 0.24 0.6256
LOGX9 0.11609480 0.14722273 0.02875582 0.62 0.4354
     
Step 3      引入7个解释变量的回归结果
Variable Coefficient Error SumofSquares F Prob>F
C 4.97361789 0.74258191 2.02457875 44.86 0.0001
LOGX1 0.56744555 0.07372074 2.67391467 59.25 0.0001
LOGX2 0.72297807 0.21127494 0.52848520 11.71 0.0015
LOGX4 0.03630448 0.03712486 0.04315879 0.96 0.3343
LOGX5 0.01771462 0.10792739 0.00121585 0.03 0.8705
LOGX6 -0.10122597 0.17367326 0.01533192 0.34 0.5634
LOGX8 0.06688740 0.12528085 0.01286464 0.29 0.5965
LOGX9 0.11477451 0.14537390 0.02813174 0.62 0.4347
                          
Step 4   引入6个解释变量的回归结果
Variable Coefficient Error SumofSquares F Prob>F
C 4.97967032 0.73235497 2.03452609 46.23 0.0001
LOGX1 0.56959777 0.07163449 2.78225916 63.23 0.0001
LOGX2 0.72116361 0.20833684 0.52727942 11.98 0.0013
LOGX4 0.03820305 0.03483400 0.05292913 1.20 0.2795
LOGX6 -0.08614209 0.14551650 0.01542097 0.35 0.5573
LOGX8 0.06169746 0.11970301 0.01169041 0.27 0.6092
LOGX9 0.12205809 0.13669753 0.03508465 0.80 0.3774

Step 5  引入5个解释变量的回归结果
Variable coefficient Error SumofSquares F Prob>F
C 4.95127082 0.72354481 2.02283634 46.83 0.0001
Logx1 0.59867583 0.04373725 8.09354515 187.36 0.0001
Logx2 0.74688004 0.20040881 0.59996560 13.89 0.0006
Logx4 0.03881208 0.03449290 0.05469311 1.27 0.2672
Logx6 -0.09058593 0.14392129 0.01711314 0.40 0.5327
Logx9 0.10985899 0.13339139 0.02930042 0.68 0.4151

Step 6   引入4个解释变量的回归结果                         
Variable Coefficient Error SumofSquares F Prob>F
C 4.90847122 0.71501822 2.00573139 47.13 0.0001
LOGX1 0.59574329 0.04316695 8.10643953 190.47 0.0001
LOGX2 0.74419046 0.19888232 0.59592325 14.00 0.0006
LOGX4 0.03511208 0.03373707 0.04610126 1.08 0.3041
LOGX9 0.11399607 0.13224462 0.03162556 0.74 0.3937

Step 7   引入3个解释变量的回归结果
Variable Coefficient Error SumofSquares F Prob>F
C 5.16383859 0.64876666 2.67989478 63.35 0.0001
LOGX1 0.57801397 0.03783589 9.87229985 233.38 0.0001
LOGX2 0.68930027 0.18783567 0.56965279 13.47 0.0007
LOGX4 0.03503906 0.03363361 0.04591001 1.09 0.3035

Step 8   引入2个解释变量的回归结果                                                    
Variable Coefficient Error SumofSquares F Prob>F
C 5.03204671 0.63694420 2.64543383 62.41 0.0001
LOGX1 0.57413814 0.03768987 9.83544281 232.05 0.0001
LOGX2 0.76463294 0.17353094 0.82292924 19.42 0.0001
 
 通过对8个模型中所有变量F的p值考察,当引入两个解释变量logx1、logx2时,p值明显小于0.05,此时逐步回归结束,是log(y)的最佳表达式。

1、多重线性的检验
考察X1、X2的相关系数矩阵:

 LOGX1 LOGX2
LOGX1 1 -0.335175
LOGX2 -0.335175 0.0344709416129

显然二者协方差在显著小于0.8(经验值),LOGX1、LOGX2不存在多重共线性。

   Dependent Variable: LOGY
Method: Least Squares
Date: 06/06/05   Time: 17:23
Sample:1 46
Included observations: 46
Variable Coefficient Std. Error t-Statistic Prob. 
LOGX1 0.574138 0.037690 15.23322 0.0000
LOGX2 0.764633 0.173531 4.406320 0.0001
C 5.032047 0.636944 7.900294 0.0000
R-squared 0.843978     Mean dependent var 7.949505
Adjusted R-squared 0.836721     S.D. dependent var 0.509495
S.E. of regression 0.205876     Akaike info criterion -0.260094
Sum squared resid 1.822547     Schwarz criterion -0.140835
Log likelihood 8.982172     F-statistic 116.3011
Durbin-Watson stat 1.522128     Prob(F-statistic) 0.000000

由上表可见,logX1与logX2的p值显著,又由Adjusted R-squared=0.836721同样可判断,两者间不存在多重共线。

2、自相关检验:
 在0.01的显著水平下,4-Du=2.577>DW=1.522128>Du=1.423,落入无自相关的区域,因此判定模型不存在自相关。

3、异方差检验:
用white交叉检验,得到以下结果:
White Heteroskedasticity Test:
F-statistic 0.450226     Probability 0.810566
Obs*R-squared 2.450870     Probability 0.783875
    
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/06/05  Time: 21:56
Sample: 1 46
Included observations: 46
Variable Coefficient Std. Error t-Statistic Prob. 
C -1.139687 3.203654 -0.355746 0.7239
LOGX1 -0.207311 0.248592 -0.833939 0.4093
LOGX1^2 0.005436 0.020089 0.270577 0.7881
LOGX1*LOGX2 0.054562 0.067228 0.811584 0.4218
LOGX2 0.682647 1.704657 0.400460 0.6909
LOGX2^2 -0.098218 0.226295 -0.434024 0.6666
R-squared 0.053280     Mean dependent var 0.039621
Adjusted R-squared -0.065060     S.D. dependent var 0.060492
S.E. of regression 0.062429     Akaike info criterion -2.588463
Sum squared resid 0.155896     Schwarz criterion -2.349945
Log likelihood 65.53465     F-statistic 0.450226
Durbin-Watson stat 2.208109     Prob(F-statistic) 0.810566

Obs*R-squared的p值=0.783875>0.05,由此判定模型不存在异方差。
 综上所述,最终回归结果为:LOGY = 0.5741381393*LOGX1 + 0.7646329432*LOGX2 + 5.03204671即:
 
 
(二)模型解释:
当区位得分每上升1%时,住宅均价y上升0.574138139%;
当绿化率每上升1%时,住宅均价y上升0.7646329432%
从最终回归模型来看,绿化率对均价y的解释作用较大,说明现在都市人较为看重住宅小区的环境;住宅的区域位置则反应了成都房产市场中消费者依然倾向于城市中心区域给交通、娱乐、教育等带来的条件便利。
在剔除的变量中,包括室、厅、卫等因素,说明他们与住宅均价的相关性较小,推断可能是他们对消费者决策的影响程度有限。

(三)模型检验
    我们收集到04年住宅市场上的42个样本,(来源:04年成都市房地产交易会4月数据 成都市房地产协会会刊),并根据模型进行推断,得到今年的可能的房价,并与去年的实际房价进行对比,由此进行模型检验。
 05年的数据得模型为LOGY = 0.5741381393*LOGX1 + 0.7646329432*LOGX2 + 5.03204671,04年的42个样本为:
 X1 X2 Y X1 X2 Y
5 35 4800 2 30 4000
2 43 3000 3 33 3600
3 53.5 3700 3 30 3200
5 40 4200 2 35 2500
5 30 4000 3 42 3530
3 42 3000 2 30.5 4000
2 30 2800 2 40.5 3700
3 30 3150 2 68 3000
1 30.6 1868 3 30 4200
1 50 1328 1 40 2000
3 38 3600 2 33 3300
1 55 2700 2 30 3250
1 30.56 2500 1 38.2 3500
2 38 2900 3 31 3500
2 45 2950 2 39 3950
2 30 2300 1 70 3600
2 40 3900 1 35 3600
2 30 3000 2 35.5 2800
3 30 2800 5 30 4000
3 40 3300 5 55 3900
2 45 4300 5 40 4100
 
分别取对数得LOGX1   LOGX2   LOGY并做其描述统计如下

将04年的LOGX1、LOGX2的均值代入得到的模型得:
LOGY = 0.5741381393*LOGX1 + 0.7646329432*LOGX2 + 5.03204671
      =0.5741381393*0.798211+0.7646329432*3.625849+ 5.03204671
 =0.458283378+2.772443592+5.03204671
 =8.26773681
两边取指数E8.26773681得Y=3896.121343735即若代入LOGX1的均值0.798211、LOGX2的均值3.625849到由05年的数据得到的模型中,得到的每平方米的均价近似为3896元,而04年已知的每平方米的均价为Y=E8.079750  =3228.426029241即近似为3228元。
 由成都房地产咨询查得05年的房价由于通货膨胀、成都环境整治、购房需求旺盛等原因比04年每平米大约涨了350—750元左右。而我们由模型得到的差价为Y=3896-3228=668元,很符合实际。说明模型与成都房地产实际定价比较切合。
 再以“学林雅苑”楼盘为例进行个体分析,其区位得分1分,绿化率70%.最终以模型计算,得到价格约3946元,高出04年价格346元;同理,可以发现包括“汇夏花园”、“学府嘉苑”、“汇景樱桃季社区”、“天府长城”、“盛锦华庭”、“自由星城二期”、“东方桂苑”与“金港·金海岸”等楼盘的价格差异均在350-750的范围内波动(详见下表)。可以肯定,模型的真实性在大部分个体数据中是经得起考验的。它所反映的变化状况也是与事实相吻合的。这个模型应该可以作为房地产价格评判标准进行实际运用。

楼盘 区位 绿化 模型推测价 04年均价 差价
学林雅苑 1 0.7 3946.5080 3600 346.5080
汇夏花园 3 0.31 3978.0292 3500 478.0292
学府嘉苑 1 0.4 2572.6345 2000 572.6345
汇景樱桃季社区 3 0.33 4172.8182 3600 572.8182
天府长城 1 0.55 3281.9268 2700 581.9268
盛锦华庭 3 0.3 3879.5313 3200 679.5313
自由星城二期 2 0.3 3050.8210 2300 750.8210
东方桂苑 3 0.3 3879.5312 3150 729.5312
金港·金海岸 2 0.355 3496.0583 2800 696.0583
 综上所述,我们通过对模型及其效果的检验,最终得到较为满意的结果,证明了模型不但操作简单且具一定的可行性,可用以做相关分析预测。
 
  附表一:
原始数据(来源:05年成都市房地产交易会4月数据 成都市房地产协会会刊)
Y X1 X2 X3 X4 X5 X6 X7 X8 X9
1088 0.5 35 1.53 16.9 2 2 1 2.5 2
1400 0.5 36 1.73 330 3 2 2 2 2
1450 0.5 40 1.2 25 3 2 1 2 2
2100 0.5 45 1.2 85 3 2 2 1 2
1300 0.5 34.6 1.72 46.2 2 2 1 1.5 2
1800 0.5 45 1.26 26 3 2 2 2 2
1010 0.5 40.2 1.65 57.5 3 2 2 1.5 1.5
1400 0.5 40 2 18 2 3 2 2.5 1.75
2480 0.5 62 1.5 400 3 2 2 3 1.5
1600 0.5 35 2 15.8 2 2 1 1.5 2
2200 0.5 42 1.56 104.4 2 2 1 2.5 2
1900 0.5 42.3 2 72 4 2 3 1.5 1.5
2100 0.5 50 2 33 1 2 1 2 1
2600 0.5 65 0.89 1600 2 2 2 3 1
1980 0.5 31 1.8 22.48 3 2 1 1.5 2
1590 0.5 41 1.75 100 3 2 2 2 1.5
1800 0.5 50.1 1.35 120 4 2 2 1.5 2
1468 0.5 37 1.79 84 3 2 2 3 1.5
1860 0.5 37.8 2.1 80 4 2 2 1.5 1.5
1500 0.5 31.8 1.3 120 4 2 2 1.5 2
4800 5 35 5.3 30 4 3 2 4.5 1
4700 4 30.5 2.27 10 1 1 1 5 2
3650 2 30.6 3.9 38 2 2 1 5 1
3200 2 36 2.25 96.6 3 2 2 2 1.5
4200 2 40 1.7 100 3 3 2 4.5 2
3500 2 35 2.79 45 4 2 2 5 2
4500 3 38 3.9 7 1 1 1 5 1
4200 2 40.5 3.6 44 3 3 2 3.5 1.5
3900 2 30.5 4 27 1 2 1 4 1
6000 3 60.6 4.06 61 2 2 2 5 1
4000 2 35 2.43 170 3 2 2 3 2
3900 1 35 1.33 50 3 2 2 1.5 2
5000 3 36 3.5 75 3 3 2 5 1.5
5960 2 51 5.5 30 3 3 2 4 1.5
3800 3 41 3.2 72 1 2 1 5 1.5
3700 2 35 1.7 70 3 2 2 2.5 2
3300 2 30.8 2.8 24 3 2 2 4 1.5
4000 5 31.2 5.54 22.8 3 3 2 5 1
4500 2 37 2.69 181 3 2 2 4 2
4500 4 31.75 3 30 3 2 2 4 1.5
4500 5 35 4 30 2 2 1 4.5 1.5
5680 2 48 1.8 50 3 2 2 6 1.5
2900 2 32.56 1.77 80 2 2 2 3 2
4500 5 34 4 100 4 3 2 4.5 1
4300 2 35 1.7 50 3 2 2 4.5 2
4680 2 37 2 400 2 2 1 5 1


参考书目:
 《计量经济学》西南财经大学出版社  庞皓等
 《SAS 8.X经济统计》北京希望电子出版社 作者:樊欣 邵谦谦
  《统计软件教程》北京大学数学科学学院  作者:李东风

【成都市05年度住宅市场定价模型】相关文章:

1.基于因子分析的套利定价模型及实证研究

2.聚类分析模型在股票市场的应用

3.市场经济模型的研究与分析论文

4.试述现代市场营销学对企业定价的目标

5.创新扩散模型市场营销组合策略探讨论文

6.浅谈现代市场营销学对企业定价目标的研究论文

7.餐饮大牌如何进行定价-餐饮大牌四大的定价策略

8.房地产住宅市场营销重要性分析论文

9.卖房应该掌握哪些定价技巧