时间:2024-08-31
于智凯 郭 强 罗天娥△ 赵晋芳 段 燕
【提 要】 目的 探讨联合脆弱模型在含有终止事件的临床复发事件数据分析中的应用及R软件的实现。方法 收集肺癌患者复发数据(多次住院),构建联合脆弱模型,拟采用最大惩罚似然估计(MPnLE)进行模型的参数估计,并评估肺癌患者个体内多次复发间的相关性以及复发事件与终止事件(死亡)间的相关性。结果 联合脆弱模型分别评估了协变量对疾病复发进程与死亡进程的效应,同时也考虑了多次复发与死亡的相关性,结果解释合理,软件实现方便。结论 联合脆弱模型可以充分挖掘含终止事件的肺癌患者复发数据所蕴含的信息,也可用于其他肿瘤患者预后因素的分析,为临床诊断和治疗提供统计学支持。
含终止事件的复发事件数据在临床随访研究中非常多见,如肺癌患者一段时期内会经历多次复发,最后因肺癌而死亡。数据特点是:(1)复发事件的发生是有时间顺序的(同一个体在一段时间内可能会经历多次复发,有先后顺序,有纵向数据特点);(2)不同患者复发次数是不同的,即个体间存在异质性;(3)事件间存在相关性:同一患者多次复发事件间及复发事件与终止事件间存在相关;(4)存在删失数据:在随访结束后感兴趣的事件尚未发生或失访等原因引起的是无信息删失,因肺癌而死亡导致的删失是有信息删失[1-2]。针对此数据传统的分析方法是对首次复发和死亡分别构建Cox比例风险模型,或者是对多次复发事件数据构建共享脆弱模型,对死亡构建Cox比例风险模型;这些方法都忽略了事件间的相关性,分析结果是有偏估计[3-4]
本文提出用联合脆弱模型(joint frailty model)来分析含有终止事件的复发数据,在该模型里多次复发和死亡都是感兴趣的结局事件,将反映疾病进展的多次复发称为复发事件(recurrent event),将因肺癌而死亡称为终止事件(terminal event)[3]。对多次复发事件和终止事件联合构建脆弱模型,即建立复发风险和死亡风险函数,并用一个脆弱项来反映复发风险与死亡风险的相关性,该模型既考虑了同一个体多次复发的相关性,又考虑了患者多次复发和死亡的相关性,来探讨多次复发和死亡的影响因素;并与共享脆弱模型和Cox比例风险回归模型结果进行对比。
联合脆弱模型(joint failty mdel)[5]是Rondeau(2007年)提出的用来分析含终止事件的复发事件数据,通过复发事件和终止事件的联合进程来研究其影响因素。复发和死亡风险的联合脆弱模型可以表示为[6]:
(1)
(2)
式中,θ为脆弱项的方差,若θ有统计学意义,说明复发事件间或者复发事件与死亡间存在相关性。将公式(2)与模型(1)结合起来:在脆弱项方差θ有统计学意义的基础上,若α=0,即经假设检验α无统计学意义,表示死亡风险λi(t)与复发风险ri(t)相互独立,λi(t)与ri(t)无相关性,联合脆弱模型退化为共享脆弱模型和Cox比例风险回归模型,此时v的方差解释了复发事件间存在相关性。若α≠0,即经假设检验α有统计学意义,表示死亡风险λi(t)与复发风险ri(t)存在相关性,当α=1时,表示脆弱项对复发事件和死亡的效应相等,当α>1,表示死亡风险λi(t)与复发风险ri(t)存在正相关[11]。
在给定vi,生存时间的条件分布为各时段生存时间分布的乘积,即:
将脆弱项的概率密度函数f(v)带入,可推出边际分布似然函数为
由此可推出联合脆弱模型的对数似然函数表达式为[13]:
(3)
(4)
本研究探讨肺癌患者术后多次复发和死亡的相关因素,收集某医院自2011年4月1日至2014年6月12日确诊的肺癌住院患者156例,记录每一位患者的性别、年龄、既往史、家族史、是否吸烟等一般资料,病理分型、分化程度、临床分期、淋巴结是否转移、肿瘤大小等临床指标,同时记录每一位患者的确诊时间为随访进入时间,并记录患者复发的时间及死亡时间,以2017年3月1日结束随访。数据见表1,变量赋值见表2。
表1 156例肺癌患者复发影响因素的部分数据
表2 变量赋值表
*以低水平为参照组
156例肺癌患者中有115例患者经历了复发,占73.72%,复发次数最小值为0,最大值为10;140例患者经历了终止事件死亡,占89.74%;115例复发患者中有99例患者死亡,占86.09%。按协变量分组来描述肺癌患者多次复发及死亡的频数分布,结果见表3。
针对肺癌患者术后多次复发并有死亡发生的数据,考虑复发与死亡的相关性,构建联合脆弱模型;不考虑复发与死亡的相关性,对多次复发事件构建共享脆弱模型,对死亡构建Cox比例风险模型;探讨肺癌患者复发和死亡的影响因素,并将联合脆弱模型与简化模型(共享脆弱模型和 Cox 比例风险模型)结果进行比较,见表4。数据分析使用R3.4.1软件实现,需要加载的程序包:survival,frailtypack。
表3 按协变量分组描述肺癌患者多次复发和死亡的频数分布
表4 联合脆弱模型与简化模型部分结果比较
*:表示在检验水准是0.05时有统计学意义。对于复发事件,简化模型为共享脆弱模型;对于死亡事件,简化模型为Cox比例风险模型。
由表4模型结果比较可见:共享脆弱模型与联合脆弱模型多次复发事件影响因素分析部分相比,大多数协变量的效应被低估;同时联合脆弱模型θ=1.09,共享脆弱模型θ=0.53,可见脆弱项的方差也被低估。同样Cox比例风险模型与联合脆弱模型死亡影响因素分析部分相比,大多数协变量的效应被低估。本研究结果与Rondeau(2007)[5]的模拟数据结果及滤泡型淋巴瘤的预后分析结果一致,即协变量的效应被低估。
可见如果忽略多次复发和死亡的相关性,分别采用共享脆弱模型和Cox比例风险模型研究多次复发及死亡的影响因素,会使参数估计结果不准确,也会低估脆弱项的方差θ,因此从理论研究和实例分析均可见联合脆弱模型分析结果较为合理。
目前针对不同联合脆弱模型拟合优度的评价,多采用似然交叉验证的近似值(LCVa)作为标准,绝对值越小,模型拟合效果越好[14-15];从计算公式Cox比例风险模型仅用于结局事件发生一次的情况,无法分析多次复发事件的相关性及影响因素。
综上所述,针对含有终止事件的复发事件数据的分析方法,本文介绍的联合脆弱模型优于两类简化模型。
表5 联合脆弱模型的参数估计结果
*:表示在检验水准是0.05时有统计学意义。
以肺癌患者多次复发和死亡作为感兴趣事件建立联合脆弱模型,结果见表5。在考虑复发和死亡的相关性的前提下,肺癌患者多次复发影响因素为:在控制其他因素不变的情况下,性别对多次复发的影响有统计学意义(Z=2.064,P=0.039),女性患者复发风险是男性患者的2.01倍,RR95%CI为(1.04,3.91);分化程度对多次复发的影响有统计学意义(Z=1.979,P=0.048),分化程度低的患者复发风险是分化程度中的患者的1.81倍,RR95%CI为(1.01,3.25);临床分期III期对多次复发的影响有统计学意义(Z=3.192,P=0.001),III期患者复发风险是I~II期患者的2.24倍,RR95%CI为(1.37,3.68);临床分期IV期对多次复发的影响有统计学意义(Z=3.698,P<0.001),IV期患者复发风险是I~II期患者的2.28倍,RR95%CI为(1.47,3.52);淋巴结转移对多次复发的影响有统计学意义(Z=4.212,P<0.001),有淋巴结转移的患者复发风险是无淋巴结转移的患者的2.60倍,RR95%CI为(1.67,4.06);既往史对多次复发的影响有统计学意义(Z=2.715,P=0.007),有既往史的患者复发风险是无既往史的患者的1.63倍,RR95%CI为(1.15,2.33);家族史对多次复发的影响有统计学意义(Z=4.396,P<0.001),有家族史的患者复发风险是无家族史的患者的2.33倍,RR95%CI为(1.60,3.40)。
肺癌患者死亡的影响因素为:在控制其他因素不变的情况下,分化程度对死亡的影响有统计学意义(Z=2.325,P=0.020),分化程度低的患者死亡风险是分化程度中的患者的2.82倍,RR95%CI为(1.18,6.76);临床分期III期对死亡的影响有统计学意义(Z=3.403,P<0.001),III期患者死亡风险是I~II期患者的4.28倍,RR95%CI为(1.85,9.88);临床分期IV期对死亡的影响有统计学意义(Z=4.143,P<0.001),IV期患者死亡风险是I~II期患者的4.32倍,RR95%CI为(2.16,8.62);淋巴结转移对死亡的影响有统计学意义(Z=3.517,P<0.001),有淋巴结转移的患者死亡风险是无淋巴结转移的患者的3.81倍,RR95%CI为(1.81,8.04);家族史对死亡的影响有统计学意义(Z=2.961,P=0.002),有家族史的患者死亡风险是无家族史的患者的2.42倍,RR95%CI为(1.35,4.34);既往史对死亡的影响有统计学意义(Z=2.420,P=0.016),有既往史的患者死亡风险是无既往史患者的2.16倍,RR95%CI为(1.16,4.03)。
综上所述,在控制其他因素不变的情况下,女性、分化程度低、临床分期III~IV期、有淋巴结转移、有既往史及有家族史是肺癌患者多次复发的危险因素;分化程度低、临床分期III~IV期、有淋巴结转移、有家族史及有既往史是肺癌患者死亡的危险因素。脆弱项的方差(θ=1.09,P<0.001)和系数α(α=1.53,P<0.001)均有统计学意义,说明肺癌患者多次复发事件间有相关性,复发事件与死亡间存在正相关,进一步说明对该数据拟合联合脆弱模型是合适的。
在临床随访研究中,常遇到含有终止事件(死亡)的复发事件数据,这样的数据结构比较复杂,复发事件间存在相关性,复发与死亡存在相关性,复发时间也有删失,需采用复杂的脆弱模型来分析。如果将终止事件死亡看作无信息删失,对多次复发事件构建共享脆弱模型,会因忽视死亡与复发间的相关性,导致协变量效应的估计不准确;本文采用联合脆弱模型,在考虑复发和死亡相关性的基础上,分别探讨复发事件和死亡的影响因素,即通过脆弱项将复发事件和死亡的风险函数进行联合建模。此模型充分挖掘了数据蕴含的信息,结果解释更合理。
本文研究采用的联合脆弱模型,采用最大惩罚对数似然法(MPnLE)进行参数估计,利用脆弱项的方差和系数α来解释患者多次复发事件间的相关性及复发和死亡的相关性是否存在。本文结合肺癌患者随访实例进行分析,用156例含终止事件(死亡)的肺癌患者复发数据构建联合脆弱模型,结果显示影响肺癌患者多次复发和死亡的风险因素不全相同;复发风险和死亡风险存在正相关,即多次复发会增加肺癌患者的死亡风险。
研究不足:(1)本文探讨的联合脆弱模型来研究多次复发和死亡的相关性,尚不能估计相关强度,有待拓展此模型。(2)本次收集肺癌患者的临床指标都是在确诊后的首次记录,有待将多次入院的临床指标以纵向数据的形式记录下来,即在模型中加入分析重复测量数据的混合效应模型来扩展联合脆弱模型。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!