时间:2024-04-24
范嘉慧 闫清云
摘要:SPSS软件是常用的社科类统计软件,主要用在统计与数学金融上面,但是它在土木程中的应用还不是很广泛,特别是在公路隧道的风险预判上没有涉及到该领域。这个软件在实际中的应用可以减轻工作量,并且预测的比较准确。文章应用的是SPSSl9.0版本。通过相关性分析,判断影响因素之间关系。
关键词:SPSS;相关性;回归分析
1.相关分析
在数据分析中,经常会碰到相关性问题,其主要是指各种影响因素的相互关系,可以通过建立特定条件下的相关变量或者是模型来进行因素的相关性分析,也就是在现有的多种数据基础上,建立一个或几个要素之间的相关关系,来对未来的实际工程实施进行科学的估计,可以进行相关分析以及偏相关分析,用相关系数矩阵的结果形式非常清楚地加以描述,便于阅读其分析结果。线性相关:相关系数有三种:Pearson、Spearman和Kendall。Pearson相关系数用于正态分布变量。Spearman和Kendall相关系数用于非正态或分布不明时。
2.回归分析
回归分析包括多元和逐步两类,当有较多的影响因素时候,一般用多元回归,如果用普通的方法来计算就会很麻烦,用该软件简单直接的能看出来,通过函数来对数据进行优化处理,是一种比较好的方法。
逻辑回归函数是根据Malthus模型,假设环境对种群密度是线性制约的,当种群大小接近环境容纳量时,增长率将趋近于O,从而推导出有限环境下种群增长的数学模型。1920年美国社会学家Pead研究美国人口时,得到了与Verhulst同样的公式,他将Ver-hulst的论文介绍出来,此后,这个公式就被称为Verhulst-Pearl的Logistic模型。
3.应用
文章数据来源于文献[5],对于300个隧道数据分类。
皮尔逊相关性
r>0代表两变量正相关,r<0代表两变量负相关。
|r|大于等于0.8时,可以认为两变量间高度相关;
|r|大于等于0.5小于0.8时,可以认为两变量中度相关;
|r|大于等于0.3小于0.5时,可以认为两变量低度相关;
|r|小于0.3说明相关程度弱,基本不相关。
3.1工程地质-勘察设计
将工程地质原因与勘察设计原因选人变量,在选项中勾选均值和标准差,选择Pearson检验,点击确定,得到相关性图表。从表中看出工程地质与勘察设计是负相关,相关系数为0.935,根据皮尔逊检验则认为二者是高度相关,然后点击“图形”-“旧对话框”,选择散点图。
添加总拟合线,从散点图中可看出二者是高度负相关,结合散点图与相关性分析,R2线性系数为0.875,认为二者是相关的。
3.2工程地质-施工方法
同上一步操作方法,得到皮尔逊相关系数为0.716,认为工程地质与施工方法是中度相关,在进行散点图检验。添加总拟合线,从散点图中可以认为二者近似在一条直线上,R2线性系数为0.513,证明二者近似可以认为是正相关。
3.3工程地质原因-其他
从表格中可以看出来,相关系数为0.268是不相关。R2=0.072,不相关。
3.4勘察设计原因-施工方法
相关系数-0.684,中度相关。添加总拟合线,从散点图中得到二者是负相关,R2线性系数为0.468,点与直线距离较远,为中等相关。
3.5勘察设计原因-其他
相关系数-0.043,不相关。添加总拟合线,散点图所示的点距离直线远,R2线性系数为0.002,认为该两种影响因素是不相关的。
p-p正态概率图,p-p图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。通过p-p图可以检验数据是否符合指定的分布,当数据符合指定分布时,p-p图中各点近似呈一条直线。Q-Q图是一种散点图,对应于正态分布的Q-Q图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图。要利用Q-Q图鉴别样本数据是否近似于正态分布,只需看Q-Q图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值。用Q-Q图还可获得样本偏度和峰度的粗略信息。Q-Q图同样可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。p-p图和Q-Q图的用途完全相同,只是检验方法存在差异。
文章采用SPSS软件19.0版本,打开软件将数据以Excel格式录入数据,选择“分析”-“描述统计”-“Q-Q图”,将工程地质原因、勘察设计原因、施工方法、其他选人变量,检验分布一栏默认正态,然后点击确定。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!