时间:2024-08-31
薛允莲张晋昕
移动假日效应调整对春节影响月份的出院病例数预测效果研究*
薛允莲1张晋昕2△
目的对比用原始出院人数序列预测的直接预测值与调整移动春节效应后序列的调整预测值对春节影响月份的预测效果。方法采用时间序列ARIMA模型进行预测研究。用移动假日效应调整方法进行出院人数移动春节效应的调整,并根据均值预测值和预测年份的调整差值计算得出调整预测值。结果两次预测的预测模型相同,均为ARIMA(1,(1,12),1)模型。2013年2月调整预测的相对预测误差为0.4%,其绝对值显著小于实际预测的相对预测误差(-13.58%)的绝对值。结论移动春节效应严重影响了春节效应月份的预测效果。调整移动春节效应后的调整预测值与实际值更为接近。
出院人数 移动假日效应 春节 ARIMA模型 预测
出院人数是衡量医院医疗业务量发展的重要指标之一,医院统计的业务量指标均与出院人数有一定的关系。因此,在病床数不变的前提下,预测出院人数情况,能提示医疗科室未来某个时间段可能面临的问题,以便院方及时采取措施,更好地为医疗和患者服务。由于每年的春节在1月和2月不同月份出现,移动春节效应会影响序列的预测效果。本文比较用出院人数原始序列预测的直接预测值与调整移动春节效应后序列的调整预测值对春节所处月份出院人数的预测效果。
一、研究对象
本次研究利用2007年1月至2012年12月广州市某三甲医院出院病人资料进行建模,利用2013年的出院病人数资料进行模型预测效果的评价。
二、研究方法
1.ARIMA模型
本文用ARIMA(auto regressive integrated moving average)模型进行模型拟合和预测。ARIMA模型,又称求和自回归移动平均模型,是进行时间序列分析的重要模型[1],能同时处理长期趋势、季节性、周期性等固定效应和无法分解的随机效应对预测的影响。用ARIMA模型进行预测的步骤如下。
(1)模型识别[2]
ARIMA模型的思想是将不平稳序列转为平稳序列,然后采用ARMA模型进行建模。因此,平稳性是序列建模的前提。若序列不满足平稳性,应将其转为平稳序列。差分是序列平稳化的一个有效方法。通常一阶差分用于去除趋势性,针对月度序列的12阶差分用于去除年度周期。通常可根据逆自相关函数图判断是否过差分。
(2)模型选择[2]
①根据自相关函数(ACF)图和偏自相关函数(PACF)图初步选择模型的阶数;②根据所选模型阶数进行ARIMA建模;③选取参数均有统计学意义、残差序列为白噪声、AIC和SBC最小的模型进行建模预测。
2.两次预测
(1)原始出院人数预测
用原始出院病人数的月度序列进行提前12期的预测,称该预测值为直接预测值;
(2)调整移动假日效应后预测
①先利用以春节为0点的逐日观测值时序图、配对t检验(将移动假日影响期间(1~3月)n年序列的某一天观测值(共n个数据)与该年观测值(除该影响期外)均值进行比较)等方法确定移动春节效应期[3];②用均值替代序列(年度均值替代效应期内出院人数)进行提前12期的预测,称该预测值为均值预测值;③定义:调整差值=出院人数-调整均值。考虑到观测值的变化趋势,令预测年份的调整差值=2×预测年份前第一年的调整差值-预测年份前第二年的调整差值。调整预测值=均值预测值+预测年份的调整差值。调整预测值即为调整移动春节效应后的序列预测值。
3.预测效果比较
比较两次预测的绝对预测误差和相对预测误差的大小。预测误差越小,表明预测效果越好。绝对预测误差=实际值-预测值,相对预测误差=(绝对预测误差/实际值)×100%。
三、统计软件
采用SAS 9.1.3软件进行ARIMA模型分析。
一、出院人数的直接预测
2007年1月至2012年12月的出院人数序列图见图1。可见序列有缓慢上升趋势以及年度周期特征。进行1阶差分和年度差分(即季节差分),差分后序列满足零均值、平稳的特点,见图2。单位根检验结果认为无单位根,即序列平稳。
图1 2007年1月-2012年12月出院人数的时序图
图2 1阶和12阶差分后的时序图
根据模型判定标准,经过多次尝试,最终选择AIC(856.7)和SBC(863.0)最小的ARIMA(1,(1,12),1)模型。模型预测效果见表1。2013年2月10日为春节,移动春节效应仅影响2月份的出院人数。2月份预测误差较大,相对预测误差为-13.58%。
二、调整移动假日效应后的预测
由于移动春节效应影响预测效果,故调整移动假日效应后进行预测。图3和图4分别为2007-2012年1-3月出院人数的逐日观测值时序图和以春节为0点的逐日观测值时序图(春节前日期横轴为负数,春节后日期横轴为正数)。可见,春节对出院人数有颇为一致的影响。
根据图3和配对t检验的结果,最终确定移动春节效应的范围为春节前第5天至春节后第14天。将该范围的出院人数用年度均值替代,并进行预测。图5和图6分别为2007年1月至2012年12月的调整后的出院人数(移动假日效应期内观测值用均值替换)时序图和平稳化(1阶差分和年度差分)后的序列图。
图3 2007-2012年1-3月出院人数的逐日观测值时序图
图4 2007-2012年以春节为0点的逐日观测值时序图
经过多次尝试,最终选择AIC(797.8)和SBC(804.0)最小的ARIMA(1,(1,12),1)模型。2月份的均值预测值为4661,调整差值为-1112。故2013年2月的调整预测值=4661-1112=3549。调整预测值的预测效果见表1。可见,2013年2月份的调整预测误差的绝对值明显小于直接预测误差的绝对值。
图5 2007年1月-2012年12月均值替换出院人数的时序图
图6 1阶和12阶差分后的时序图
表1 ARIMA模型预测效果
移动假日效应是指假日在各年出现的公历日期不同,具体表现为以下两个特征[3]:①假日前后序列测量的活动规律有上升或下降趋势,②假日对某相邻两个月(公历)的影响程度依赖于每年出现的不同日期。节假日在公历日期上的“移动”最直接表现为各年某些月份(如春节影响到的1、2月份)观测指标的不可比,甚至影响最终季节调整的效果[4]。Edward等[5]指出调整移动假日效应能提高序列的预测效果。
在我国,常见的移动假日有农历春节(中国农历正月初一)、元宵节(中国农历正月十五)、中秋节(中国农历八月十五)和龙舟节(中国农历五月二十)等。在实际工作中,我们发现出院人数受春节和元宵节的影响很大。由于春节和元宵节时间上接近,且传统意义上认为元宵节后才是真正春节的结束,故本研究将这一时间段内的影响均称为移动春节效应。我们发现,出院人数通常节前一周下降,春节期间最少,春节后缓慢增加。本课题组既往研究中也发现这一特点[6],本文中确定的移动春节效应期为节前第5天至节后第14天。用2007-2012年实际出院人数序列进行2013年1-12月出院人数预测,从相对预测误差看2013年2月的预测误差最大。文献[7]用ARIMA模型对出院人数进行预测,研究结果也显示春节月份的预测误差最大(其中,2005年1月为45.45%,2006年 1月为40.64%)。
本文通过比较调整预测误差与直接预测误差发现,移动假日效应调整后序列的调整预测误差明显低于直接预测误差。可见,移动春节效应确实降低了序列的预测效果,调整移动假日效应后对春节移动假日效应影响月份进行预测,调整预测值具有很好的预测效果。
本文用观测值比例因子模型的方法,确定移动假日效应期的长度。用年度均值替代移动假日效应期内的出院人数,并对均值替代后的序列进行移动假日效应的调整。国外移动假日效应调整方法主要采用天数比例因子模型,作者在既往研究中已经通过模拟和实例验证了观测值比例因子模型的优势[8]。故这里仍采用了观测值比例因子模型的思想进行移动假日效应的调整。此外,国内对出院人数影响明显的移动假日为春节,无法直接使用基于国外移动假日的X-12-ARIMA方法。本研究直观地说明了春节移动假日效应调整的必要性,同时给出具体的、可操作的调整方法,以期为同类研究提供参考。
[1]周青,陈秋,叶小云,等.基于A RIMA模型的医院门诊量预测.中国病案,2011,12(1):51-52.
[2]肖枝洪,郭明月.时间序列分析与SAS应用,2009:13-109,145-163.
[3]X-12-ARIMA Reference Manual.Version 0.3.Time Series Staff Statistical Research Division Room.U.S.Census Bureau,Washington,2007.http://www.census.gov/srd/www/x12a/
[4]Alper CE,Aruoba SB.Moving Holidays and Seasonal Adjustment:The Case of Turkey.Review of M iddle East Economics and Finance,2004,2(3):203-209.
[5]Edward E.Leamer.Workday,holiday and calendar adjustment with 21st century data:monthly aggregates from daily diesel fuel purchases.2011,C81:http://www.nber.org/papers/w16897.
[6]薛允莲,张晋昕,刘贵浩,等.医院住院人数序列的春节效应调整.中国卫生统计,2010,27(5):473-476.
[7]阿里木江·艾山.某专科医院门诊人次、出院人数预测方法的探讨.新疆医科大学,2007.
[8]薛允莲,张晋昕.时间序列分析中的移动假日效应.中国卫生统计,2009,26(5):502-504.
(责任编辑:郭海强)
*:广东省医学科研基金(No.B2014126)
1.中山大学孙逸仙纪念医院(510120)
2.中山大学公共卫生学院
△通信作者:张晋昕,E-mail:zhjinx@mail.sysu.edu.cn
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!