时间:2024-07-28
李旭,龚茂华
1.广州市公安局水上分局,广东广州510235;2.汕头市公安局,广东汕头515011
珠江主航道广州段溺亡浮尸ARIMA 模型初探
李旭1,龚茂华2
1.广州市公安局水上分局,广东广州510235;2.汕头市公安局,广东汕头515011
目的根据2003—2012年10年间珠江主航道广州段各季度法医收集的溺亡浮尸数量生成时间序列,建立ARIMA模型,为水上法医统计工作提供参考。方法利用Excel统计各年份每一季度浮尸数量,建立统计表,利用SAS软件建立时间序列ARIMA模型并检验。结果通过重新选择拟合模型,模型拟合定阶为疏数模型ARIMA(2)0(2)结论成功建立ARIMA((2)0(2))疏数模型,利用第2013年前两季度浮尸数量检验,发现获得较好的实用效果。
ARIMA模型;浮尸;法医
溺亡是一个常见致人死亡的原因,是伤害的重要组成部分,是人体呼吸道被水阻塞后,造成呼吸道气体交互障碍,引起机体缺氧,导致死亡的现象。溺亡占全球总死亡率的10%,占所有与伤害有关死亡的7%。虽然国外文献已经有对特定区域溺亡的报道,但是国内很少有相关文献对特定区域的溺亡进行全面的研究,主要都是集中在儿童溺亡的研究。在法医学中主要是研究溺亡浮尸死后的变化与浮尸死亡性质的关系,还未有时间序列相关研究。为此,利用现有法医学浮尸资料,该文对珠江主航道广州段溺亡浮尸进行统计和分析,利用Excel统计各年份每一季度浮尸数量,建立统计表,利用SAS软件建立时间序列ARIMA模型。利用时间序列模型和相关预测信息,为该地区法医工作提供参考和帮助,现报道如下。
收集2003—2012年共计10年珠江主航道广州段溺亡浮尸资料共2 291例,按照每个季度溺亡浮尸数据,建立预测模型,并且计算该区域2013年第1和第2季度的溺亡浮尸发生数量,与实际值比较,显示模型拟合有效。整理2003—2012年各季度溺亡浮尸数量,见表1。
表12003 —2012年各季度溺亡浮尸数量
2.1 平稳性检验
第一步:根据表1数据绘制各月溺亡浮尸数量时间序列图1,从该图很难分辨该序列是否平稳,所以进行单根检验。
图12003 —2012各季度溺亡浮尸数量分布时间序列图
第二步:对2003—2012各季度溺亡浮尸数量进行单根检验,结果如表2所示(P<0.05)。该序列为平稳序列,不需要进行季节差分和趋势差分。
表22003 —2012年各季度溺亡浮尸数量单根检验结果
2.2 纯随机性检验
时间序列的纯随机性检验是时间序列能否建立模型的一项重要检验步骤。根据时间序列ARIMA模型建模步骤,序列通过平稳性检验以后,需要对序列进行纯随机性检验,检验结果如表3所示。在显著性水平取0.05的条件下,由于延迟6阶的卡方统计量的P值小于0.0001,远小于0.05,所以该序列为非白噪声序列,序列内含有不容忽视的信息可以提取。序列平稳性和纯随机性都通过检验,可以进行模型拟合。
表32003 —2012年各季度溺亡浮尸数量纯随机性检验结果
2.3 根据自相关图和偏自相关图进行模型拟合
观察序列自相关图2和偏自相关图3拟合模型,见图2、图3。
根据该序列自相关图和偏自相关图显示,可以对序列进行多阶拟合。利用SAS程序对序列进行相对最优定阶,结果如表4所示。
图22003 —2012各季度溺亡浮尸数量序列自相关图
图32003 —2012各季度溺亡浮尸数量偏自相关图
表4 SAS程序对序列进行相对最优定阶
根据最小BIC准则显示,模型选择ARIMA(4,0,0)模型,但是经过检验模型残差不能通过白噪声检验,证明模型拟合失败,需要重新拟合。通过重新选择拟合模型,模型拟合定阶为疏数模型ARIMA((2)0(2))。
3.1 模型的有效性检验
根据拟合模型残差白噪声检验,P>0.05,判断为白噪声,说明该序列中的有效信息已经被提取完全,拟合模型有效,见表5。
表5 拟合模型残差白噪声检验
3.2 参数的显著性检验
根据SAS程序给出的条件最小二乘法估计,模型参数检验P<0.05,通过检验,参数显著,见表6。
表6 拟合模型参数显著性检验
3.3 模型计算检验
根据SAS模型预测计算2013年前两季度溺亡浮尸人数,如表7所示。第一季度的预测值和观测值一样,都为41人,准确率达到100%。第二季度相对误差为14.04%,准确率也到达80%以上,见表7。模型预测效果较好,拟合模型ARIMA((2)0(2))有效。
表7 模型对2013年第1和第2季度溺亡浮尸数量的预测
第一,溺亡浮尸数据的特征以及ARIMA模型特点。ARIMA模型是建立在马尔科夫随机过程的基础上,既吸取了回归分析的优点又发挥了移动平均的长处。在预测精度上,ARIMA模型对噪声进行了分析处理,只留下当时和历史无关的白噪声,使其成为线性模型的最优预测。传统的趋势模型外推预测方法,考虑了时间因素和各自变量之间的因果关系,事先必须明确所有的影响因素,收集所有影响因素的资料,但是很多事物的发展均受到外界各种因素的影响,难以明确所有的因素。因此,传统线性模型只适合具有某一种典型趋势性变化的预测[1]。ARIMA在国内外都被广泛应用于交通运输、经济以及公共事业领域的时间序列模型计算[2-4]。建立模型的溺亡浮尸发生是具有独立空间、时间分布特点。未来溺浮尸的发生与现在和过去溺亡浮尸的发生有着某种内在的联系,从以上讲,溺亡浮尸的发生适合ARIMA模型。该模型在建立过程中尝试过建立含有季节因子的ARIMA模型,但是并不成功。该文的模型在模型检验的时就已经是平稳模型,不需要通过差分运算进行数据变换,所以模型表达中的季节因子“I”为零,模型变换为ARMA模型。通过多次拟合以后,拟合疏数模型成功。推测不能建立以四季时间序列模型的原因是广州地区处于热带,每年的四季并不分明,每个季度的温度差距并不大,导致没有明显的周期性,所以可以不用考虑时间因子“I”。
第二,预测模型的意义及实用价值。通过对2003-2012年十年时间的溺亡浮尸序列的分析,拟合了该序列的季度序列模型。通过对2013年前两个季度的溺亡浮尸人数计算比较显示,该模型较好地预测了第1季度的溺亡浮尸数量,预测效果达到100%。第2季度溺亡浮尸数量的有效预测达到85.96%,超过80%,可以认为效果较好。该次研究为珠江主航道广州段的溺亡浮尸研究提供以下几点参考:①此次研究收集了该区域内溺亡浮尸数量,建立了预测模型,为进一步扩大该地区溺亡浮尸模型的研究分析奠定良好的基础。在现有的条件下,有一定的实用价值。②此次模型的建立,为该辖区内溺亡浮尸管理者针对不同季节的工作人员安排提供了有意义的参考,提高工作效率。③此次模型是通过参考其他领域的建模与预测,选择时间序列的方法进行建模,取得较好的预测效果。在以后的分析中可以尝试选择其他的方法进行建模预测。
该模型预测了2013年前2个季度的溺亡浮尸人数,预测精度在第2个月开始降低,此情况和时间序列模型本身就是短期预测的特征相符,时间跨度越长模型的预测效果越差的特点相同。如果希望进行更长期的预测,则应在此基础上引入更为敏感的参数或者辅助变量,用于进一步控制序列相关性的干扰,以保持模型的稳定性同时提高模型的精确度[1]。针对模型的建立后预测精度下降,分析原因可能是①模型本身的特点。该次研究以季度为单位进行预测,降低了数据的时间单位跨度,因此呈现出一定的时间序列内部计数数据的序列相关性干扰[5],影响溺亡浮尸本身非负、随机、整数的特点,在模型的准确度上即呈现长期预测准确度下降。②数据收集的准确程度。溺亡浮尸数量的记录和归档是人工操作,有人为因素导致误差的可能。该研究数据来源地域选取珠江主航道广州段,在上下游交界处,有可能是非该区域内溺亡浮尸人群被发现或者是该区域内溺亡浮尸的人群在随着潮汐的改变,顺水漂流出该区域,导致统计溺亡浮尸数量的误差。
[1]张路.重庆市某区交通事故流行病学分析及预测模型研究[D].重庆:第三军医大学,2006.
[2]Sharma P,Khare M.Application of intervention analysis for assessing the effectiveness of CO pollution control legislation in India[J].Transp Res,1999(4):427-432.
[3]Goh B.The dynamic effects of the Asian financial crisis on construction demand and tender price levels in Singapore[J]. Build Environ,2005,40(2):267-276.
[4]李琳,左其亭.城市用水量预测方法及应用比较研究[J].水资源与水工程学报,2005,16(3):6-10.
[5]Kedem B,Fokianos K.Regression Models for Time Series Analysis[B].Wiley Interscience,Hoboken,NJ,2002.
PrimaryExplorationofDrownedBodiesARIMAModelFloatingin Guangzhou Section of the Main Channel of the Pearl River
LI Xu1,GONG Mao-hua2
1.Water branch of Bureau of Public Security of Guangzhou Municipality,Guangzhou,Guangdong Province,510235 China;2.Bureau of Public Security of Shantou,Shantou,Guangdong Province,515011 China
ObjectiveTo establish the ARIMA model according to the time sequence produced by the drowned bodies floating in Guangzhou section of the main channel of the Pearl River from 2003 to 2012 collected by the legal examiners in various seasons thus providing reference for the statistical work of water legal examiners.MethodsThe drown bodies in each season in each year were counted by excel,and the statistical list was established,and the ARIMA model of time sequence was established by SAS software and tested.ResultsThrough to select fitting model,model fitting fixed order of hydrophobic model ARIMA((2)0(2)).ConclusionThe ARIMA(2)0(2)model was successfully constructed,and the better effect is obtained by testing the drown bodies number in the first two seasons in 2013.
ARIMA model;Floater;Legal examiner
R7
A
1672-5654(2016)12(c)-0022-03
10.16659/j.cnki.1672-5654.2016.36.022
2016-09-29)
李旭(1982.9-),男,四川成都人,本科,主检法医师,研究方向:法医学。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!