跪求一篇关于大学生就业数学建模的论文。
本文讨论了影响房地产价格的主要因素,找出了价格与其主要因素之间的近似线性关系,建立了表示房地产价格的数学模型——多元线性回归模型,并对模型进行了全方位的讨论,得出了求解各参数的方法,最终得出了房地产价格。在建模过程中,首先通过科学分析确定主要因素并进行数学抽象,然后综合运用各种数学方法对各因素进行分析求解。先用概率论和数理统计的方法,找出价格与各种因素的近似线性关系,确定模型;其次,用最小二乘法求解模型中的参数;再次,利用回归分析确定模型精度并进行检验,从而获得完整的数学模型;第四,通过该模型深入分析了影响房地产价格的主要因素,并提出了降低高开发成本、调整供应结构的政策建议。第五,根据模型和建议进行合理预测,最后分析模型的优缺点并提出改进方向。
问题的重述
所谓房地产泡沫,就是商品房价格远远超过实际价值。近年来,中国主要城市的房价普遍持续上涨,并居高不下。不断上涨的房价大大增加了生活成本,这使得许多低收入人群很难买房。目前,中国城市居民人均居住面积只有发达国家的一半左右,甚至低于许多发展中国家。不是居民没有住房需求,而是现有的货币支付能力无法让他们实现买房的愿望。虽然现在可以贷款分期买房,但也要求居民有相当不错的收入水平,要等到中年甚至更晚才能还清房子,人生中最美好的时光都要给房子。因此,如何有效抑制房价上涨,甚至降低房价,是一个备受关注的社会问题。我们就这个问题进行分析,建立数学模型,研究如何有效抑制房价上涨。
2.基本假设
影响房价的因素有很多,比如房屋建设成本、市场供求、城市经济发展、城市规模等等。假设房价与各种因素之间的关系是线性的,并且:
(1)房屋建造成本替换为完工房屋成本。
(2)城市经济发展用人均GDP表示。
(3)城市的规模是用建成区来表示的。
(4)市场的供求关系是通过消费者的支付能力来体现的,消费者的支付能力是通过在岗职工的平均工资来衡量的。
(5)房地产价格用住房均衡价格表示。
(6)忽略消费者偏好对房价的影响,如是否有学校、绿化率、停车位、热水供应状况、通讯、房屋建筑形式等。
(7)忽略消费成本对房价的影响,如交通成本、物业费、停车费等。
(8)忽略一些炒作对房价的影响。
基本符号、变量和术语
a:代表人均国内生产总值系列(元)
b:代表在岗职工平均工资系列(元)
c:表示竣工房屋的成本顺序(元/㎡)
d:城乡人均储蓄余额系列/元
y:住房均衡价格指数序列,均衡价格是指消费者对一种商品的需求与生产者提供的该商品的供给相等时的市场价格。均衡价格由需求和供给共同决定。与吸金率和交易价格有关。[1]
:是随机变量;
Uy,UA,UB,UCUD分别是Y,A,B,C,D序列的平均序列。
δY、δA、δB、δC、δD分别代表Y-uy、A-UA、B-UB、C-UC、D-UD序列,即集中式序列。
:序列的方差
、、:模型参数
S(a):是残差平方和。
n:统计城市数(样本数)
r:集中序列的协方差
第四,建立模型,分析。
一、模型推导过程
表1是全国12主要城市住房均衡价格及其相关因素统计表。根据这个表,我们可以得到各因素与住房均衡价格的相关系数,进而判断各因素对住房价格的影响程度,如表2所示。
表1 12主要城市住房均衡价格及其相关因素统计表[1]
城市住房平衡价格指数
人均国内生产总值/元/平方米
/元建成区
Km2非农业人口变动率在岗职工平均工资
人均居住面积每元
/米城乡人均储蓄余额/元竣工住房成本
/元/㎡
1北京3494.97 19846 488 0.072 654438+04054 13.97+04536
2天津1636.2 15976 378 0.041 1123 8.6 12417.38 1。
3石家庄1424.85 10425 108 0.147 7983 3.16 8105.87 767。
4太原859.21 10678 177 0.076 7378 12.23 13147.438+07760。
5呼和浩特872.57 7489 79 0.16 7346 6.22+0.47866
6沈阳1655.62 14989 202 0.028 85110.03 13317.48 978。
7大连1935.43 18429 234 0.079 10259 8.45 13857.8 978
8长春1222.49 10261540.073 8618 6.5 6949.56 1087。
9哈尔滨1502.94 9142 165 0.345 7577 6.96 6957.27 897
10上海3119.62 30805 5550 0.052 166465 438+06 5438+04.96 19 778 . 5566766
11南京1934.31 16 194 0.108 11931 8.59 65438。
杭州2312+01.061961.1.71.147121876.5438+0202056
同时可以得到各因子序列的平均值,如表1所示。
附表1中各因素序列的平均值
住房均衡价格指数
人均国内生产总值/元/平方米
/元建成区
Km2非农业人口变动率在岗职工平均工资
人均居住面积每元
/米城乡人均储蓄余额/元竣工住房成本
/元/㎡
平均值为1830.8 15401.67 0.11 10300 8.85 12110。
表2各因素与住房均衡价格的相关系数表
人均国内生产总值、建成区面积、非农人口变动率、在岗职工平均工资、人均居住面积、城乡人均储蓄余额
竣工房屋成本
相关系数r 0.848 0.824-0.236 0.910 0.766 0.836 0.894
从表2可以看出,住房均衡价格与非农人口、人均住宅面积、建成区面积变化率的相关系数较小,所以这里我们忽略它们的影响,只考虑其他主要因素的影响,主要包括:人均GDP、在岗职工平均工资、竣工住房成本、城镇人均储蓄余额等等。
通过表1,我们依次做出主要因素与住房均衡价格的关系图:
图1
图2
图3
图4
从均衡房价与人均GDP、均衡房价与人均工资、均衡房价与竣工成本、均衡房价与居民平均储蓄的图表中可以看出,均衡房价与人均GDP、人均工资、竣工成本、居民平均储蓄之间存在依赖关系,因此很容易想到使用多元线性回归模型。
Y= A+ B+ C+ D+……。+
代表因变量Y对自变量A,B,C,D的依赖性...,在哪里,,,...是参数。
模型特征如下:
1,a,b,c,d...是一般变量和随机变量;
2.Y是一般变量和随机变量的线性组合,Y序列的值不仅取决于A、B、C序列,还取决于。
如表3所示,每个序列
一般假设是白噪声序列,假设服从均值为0,方差为0的正态分布。
表3
序列号城市Y A B D C
1北京3494.97 19846 14054 21447.03 2037
2天津1636.2 15976 1123 12417.38 1061。
3石家庄1424.85 10425 7983 8105.87 767
4太原859.21 10678 7378 13147.17 760
5呼和浩特872.57 7489 7346 6721.47 866
6沈阳1655.62 14989 8511 13317.48 978
7大连1935.43 18429 10259 13857.8 978
8长春1222.49 10261 8618 6949.56 1087。
9哈尔滨1502.94 9142 7577 957.27 897
10上海3119.62 30805 16641 19778.24 2232
11南京1934.31 11931 10569.5 910。
12杭州2311.061.9961.12187 12054.1617。
集中之后,你会得到
y-Uy = *(A-Ua)+*(B-Ub)+*(C-Uc)+*(D-Ud)+
上面的公式是
δY = *δA+*δb+ *δC+*δD+
现在模型的参数是用最小二乘法估计的。
δ y、δ a、δ b、δ c和δ d的值如表4所示。
表4
序列号城市δ y δ a δ b δ d δ c
1北京1664.538+097 444366
2天津-194.573 574.58 55665665666
3石家庄-405.923-4976.42-2317.67-4004.37-382.67
4太原-971.563-4723.42-2922.67 1036.93-389.67
5呼和浩特-958.203-7912.42-2954.67-5388.77-283.67
6沈阳-175.153-412.42-1789.67 1207.24-171.67
7大连104.657 3027.58-41.67 1747.56-171.67
8长春-608.283-5140.42-1682.67-5160.68-62.67
9哈尔滨-327.833-6259.42-2723.67-55438+052.97-252.67
10上海1288.847 15403.58 6340.3668 1082.33
11南京103.537 1414.58 1630.33-1540.74-239.67
12杭州480.287 4559.58 1886.33-56.08 67.33
设a=(,,,),则A的最小二乘估计应使残差平方和最小,其中
S (a) = = (δ y t-* δ at-* δ b t-* δ c-* δ dt),取S(a) =0得到:
s(a)= 2 *(δy t-*δat-*δb t-*δCT-*δd)*(-δat)= 0-公式6544。
Rya表示序列δY和δA的协方差,Raa表示序列δA的方差,Rba表示序列δB和δA的协方差,Rca表示序列δC和δA的协方差:等式1可以写成:
-Rya+* Raa+* RBA+* RCA+* RDA = 0 -公式2。
类似地,s (a) = o推导出:
-ryb+* rab+* rbb+* rcb+* RDB = 0 -公式3。
S (a) = 0推导出:
-ryc+* RAC+* RBC+* RCC+* RDC = 0 -公式4。
S (a) = 0推导出:
-ryd+* rad+* rbd+* rcd+* rdd = 0 -公式5。
将公式2、公式3、公式4和公式5写成矩阵乘法:
* =
计算参数的公式为:
= *-公式6
具体到这个问题,我们用往年的统计数据来求解模型中的各个参数。
每个协方差的计算值为:(使用matlab软件)
Raa=38730662
Rba=Rab=18250255
Rca=Rac=2543343
Rda =拉德=25327000
Rbb=8106483
Rcb=Rbc=1257098
Rdb=Rbd=11269000
RCC = 211174.1
Rdc=Rcd=1882000
Rdd=22936000
Rya=4475718
Ryb=2197259
Ryc=343656.3
Ryd=3251000
通过矩阵运算,的值为:(使用matlab软件)
,=0.0583
=-0.0487
=1.1621
=0.0059
将系数、、代入原始模型:
y-1830.77 = 0.0583 *(A-15401.4)-0.0487 *(B-10300)+1.1621 *(C-1149)+0.0059 *(D-666
利用表3中的均衡房价、人均GDP、在岗职工平均工资、竣工房屋成本和城乡人均储蓄余额,取值反过来,即:
= Y-1830.77-〔0.0583 *(A-15401.4)-0.0487 *(B-10300)+1.1621 *(C-1149)+0.0059
获得的12值为:
表5剩余数据
城市序列号剩余
1 501.5639
2 -86.8221
3 239.8316
4 -391.561
5 -279.054
6 -45.8512
7 115.1803
8 -287.093
9 228.7031
10 -604.037
11 387.9655
12 228.1861
平均值为0.584425
图5
因为的平均值为0.584,相对于y值非常小,可以近似视为0,所以忽略不计。
因此,该模型进一步简化为:
y-1830.77 = 0.0583 *(A-15401.4)-0.0487 *(B-10300)+1.1621 *(C-1149)+0.0059 *(D-666
也就是
y = 0.0583 *(A-15401.4)-0.0487 *(B-10300)+1.1621 *(C-1149)+0.0059 *(D-121438
也就是六个模型的优化
虽然我们利用统计规律建立了一个多元线性回归模型来表示房地产价格,但计算结果总体上与实际相符。但是这种模式还是存在很多问题。
首先,影响房地产价格的因素很多,我们在构建模型时忽略了很多被认为不重的因素。
除了上述模型中考虑的影响房价的因素外,还有一系列其他因素:
(1)一套房子的结构、质量、功能、新旧程度是影响房价的重要因素。由于使用的建筑材料不同,施工机构不同,施工方法不同,施工技术力量不同,形成价格差异。
(2)建筑物的数量、层次和朝向。房屋分为高层、多层和低层。由于设备、施工工艺、施工机械化的不同,各种楼层、朝向的房子都有一定的价格差异。
(3)环境因素。房子的位置是在市区还是郊区,交通便利的繁华地段还是背街小巷,交通、文化教育、社区服务设施对房价的影响很大。
(4)国家政策。房价受政策因素影响很大,在某些情况下,政策因素往往成为房价的决定因素。比如计划经济时期,我国实行的是房屋不作为商品使用的福利分房政策,价格远远低于价值,严重影响了房屋的再生产。
(5)也有一部分人是投机性的,想利用房价上涨获利,多买房子,通过房屋增殖获利。
以上因素对房价有一定影响,但由于时间仓促,容量有限,很多因素我们无法一一考虑,只考虑影响较大的因素。所以我们采用“抓住主要矛盾,忽略次要矛盾”的方法,所以模型还是具有普适性和代表性的,代表了一个基本的思想和算法。在此基础上,考虑其他因素时,该方法仍然适用。
其次,我们用来确定模型参数的样本序列只有12组数据,这可以说是应用统计规律的一大戒,因为统计规律本来只适用于一些大样本甚至无限序列,如果应用在小样本的情况下,结果误差会很大,甚至有时会出错。但是我们在这里还是用这么小的样本来计算,其实只是为了说明一种计算方法,而且我们在提出模型的时候,确实参考了很多数据来确定它们之间的因素是线性的。为了节省时间和说明计算中的问题,我们只选取了几组数据。
此外,模型中部分因素存在* * *线性问题,需要进一步完善。
针对模型中存在的问题,我们提出以下改进建议。
(1),我觉得如果用更多城市的统计数据(样本)进行模型运算,准确率肯定会更高。
(2)综合考虑城市的方方面面,如建成区面积、流动人口、交通环境等因素。
(3)考虑到线性问题,我们尽量利用独立因子或其他一些更经典的模型。