时间:2024-06-03
黄凯鑫+梁晨辉+黄新程
我们城市分为以下两种类型:
a.发展中城市,拥有较大的人口增长率的内陆城市(Canberra);这种城市的特点是:社会公正体系不够完善,经济状况不是特别理想。
b.发达城市,拥有较缓慢的人口增长率的沿海城市(Odense);通常情况下這种城市具有完善的社会体制、医疗保障体系、较为发达的经济。
我们将建立多元线性回归模型,以智能增长总分H(Task1)为因变量,政府的各项政策(Task2)为自变量建立回归模型来研究最近几年政府的各项政策对城市智能增长的影响。
一、模型建立
因变量:智能增长总分H;
自变量:城市人口(P)、人口增长率(PGR)、GDP、第三产业比重(T)、教育投入(EI)、文化产业投入(CI)、卫生机构个数(HI)、交通运输投入(TI)、环境投入(ENI);
虚拟变量:地理位置(G) 1-沿海 、0-内陆。
根据所要研究的问题我们建立以下线性回归方程:
H=?茁0+?茁1*P+?茁2*PGR+?茁3*GDP+?茁4*T+?茁5*EI+?茁6*CI+?茁7*HI+?茁8*TI
+?茁9*ENI+?茁10*G+∈
其中,∈满足Gauss-Markov theory。
基于最小二乘原理建立线性回归方程为:
从上表来看Adjusted R-squared达到0.87,说明方程拟合程度较好。对回归方程进行显著性检验,只有P(人口数量)、HI(卫生机构个数)显著性不强,大部分回归变量都是显著的,说明我们建立的回归方程是有意义的。计算各个变量的回归扩大因子,以检验各个回归系数之间是否存在复共线性:
由表1可以观察到方差扩大因子都小于10,以此可以认为在这个模型中各个相关系数之间不存在复共线性。接下来采用逐步回归的方法对回归变量进行筛选,目的在于清除不显著的变量,找出主要的影响因素。逐步回归最终结果为:
对逐步回归筛选后的线性回归进行回归诊断:
分析:
a.由图Residuals vs Fitted可以看出,残差值和拟合值是在0左右的随机分布,因此,模型的因变量和自变量线性相关;
b.在图Normal Q-Q中,点基本都分布在45度的直线上,满足正态性假设;
c.Scale-Location图中的点随机分布在线的周围,符合同方差假设;
d.在Residuals vs Leverage图中对影响点进行分析,由结果可以看出,所用数据基本合理。
最后我们得到的回归模型数学表达式为:
H=72.3652-1.6521*PGR+2.0365*GDP+1.2624*T+0.7581*EI+
0.8742*CI+1.9542*TI+1.7242*ENI+2.0352*G
二、制定计划
从回归模型的系数上我们可以看出城市智能发展指标受G(地理位置)、GDP(当地生产总值)、PGR(人口增长速率)、TI(交通运输投入)、ENI(环境投入)的影响较大。因此根据这两种不同类型的城市我们提出了不同的政策计划使得该城市达到最大的智能发展指标:
(1)内陆发展中城市(Canberra)
政府应该尽可能增加当地的GDP,因为在回归模型中,当G(地理位置)取0时(代表内陆城市),H受到GDP的影响最大,其次是TI(交通运输投入)。也就是说政府在制定智能增长计划时要将发展当地GDP和交通运输放在重要的位置上。也可以这样理解:对于那些内陆正处于发展中的城市,政府首要任务就是加大交通运输投入这样才能使该城市有更多的机会和外界进行商业贸易。
(2)沿海发达城市(Odense)
对于发达城市,其原本就拥有发达的交通运输网,因此政府在制定智能增长计划时应该更多地考虑教育投资(EI)、增加卫生机构个数(HI);文化产业投入(CI)在回归模型中的系数比EI较大,说明对于沿海发达城市,政府在制定智能增长计划时应该更多地考虑如何提高当地居民的生活质量,比如加大文化产业的投入(CI)就有利于丰富当地居民的精神文明,加大环境投入(ENI)可以使居民拥有更加舒适的生活环境,从而使城市发展更加智能。
三、增长计划潜力排名
为了对之前提出的增长计划中的各政策(initiatives)进行评估排序,找出最具有潜力的、潜力最小的措施(initiatives),我们的方法是基于Task3建立的线性回归模型,利用主成分分析计算得出各个主成分的累计贡献率,解释各个主成分的含义。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!