时间:2024-09-03
周逸飞, 杨雅蓉, 杨妙芳, 汪芳裕
1.南京大学医学院附属金陵医院(东部战区总医院)消化内科,江苏 南京 210002; 2.南方医科大学南京临床医学院(东部战区总医院)消化内科
国际癌症研究机构(International Agency for Research on Cancer,Globocan)在2018年进行的全球癌症调查结果显示,结直肠癌(colorectal cancer,CRC)是第三大最常见癌症,也是第二大癌症的死亡病因。CRC的5年生存率从早期的90%减少至晚期的14%[1]。随着发展中国家工业化进程,西式的饮食方式所致的肥胖、久坐等不良生活习惯,CRC的发病率逐年升高[2]。结直肠息肉是指结直肠的黏膜慢性炎性增生形成的黏膜隆起性病变,被认为是散发性和遗传性CRC的癌前病变[3-4],通过增生性息肉-腺瘤性息肉-腺癌的模型发展为CRC。因此,结直肠息肉的检出和处理是CRC预防的重要环节。肠镜检查是结直肠息肉检出的金标准,但肠镜为侵入性检查,存在一定的风险;同时,患者需要进行肠道准备,过程复杂,接受度较低,不适合人群筛查。
目前,CT检查已广泛应用于健康体检。通过胸腹部CT检查,我们可以分别获得肝脏和脾脏的CT值,以及二者之间的比值[CT(L/S)],可以定量评估肝脏的脂肪含量[5-6]。近年来研究证实,非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)是结直肠息肉和CRC的独立危险因素[7-9]。然而,目前尚无基于肝脏脂肪含量构建结直肠息肉发生概率的临床预测模型的研究。本研究通过套索回归(LASSO)交叉验证法筛选变量,构建结直肠息肉发生概率的临床预测模型,指导筛选结直肠息肉发病的高危人群进行肠镜检查,并做好CRC的二级预防。
1.1 研究队列选取2017年10月至2019年12月在我院体检行肠镜和胸/腹部CT检查的患者,根据肠镜检查结果分为结直肠息肉组和对照组。纳入标准:(1)纳入临床资料完整,同时具有肠镜和胸/腹部CT检查结果的患者;(2)排除既往有结直肠息肉切除病史、Peutz-Jeghers综合征、家族性腺瘤性息肉病、炎症性肠病、肠结核、血吸虫病、消化道肿瘤、胃肠道手术、全肠外营养,同时需要排除酒精性肝病、自身免疫性肝病、病毒性肝病、药物性肝病、胆汁淤积性肝病、淤血性肝病,及肝脏多发囊肿、肝硬化、肝癌及脾切除病史。按7∶3随机分为训练队列和验证队列。
1.2 人体指标的测量及实验室检查体质量指数(BMI)由体质量(kg)除以身高的平方(m2)计算。使用经校准的电子血压计(Omron,日本京都)测量血压。患者禁食12 h后,从肘静脉抽取静脉血,于24 h内离心分离血浆,采用自动分析仪B2400(日立,日本东京)完成实验室指标检测。
1.3 结肠镜检查结肠镜检查前,所有患者均给予磷酸钠盐或聚乙二醇电解质散完成肠道准备。使用CF-H260/H290(奥林巴斯,日本东京)进行结肠镜检查,当回盲瓣、盲肠和阑尾窝显示后退镜,退镜时间不少于5 min。息肉组记录息肉的位置、大小、数目和病理。
1.4 肝脏脂肪含量检测采用64层X射线计算机体层摄影(SOMATOM,西门子医疗,德国埃兰根)进行胸/腹部扫描检查。避开肝内脉管系统,选取同一层面,测量肝脏与脾脏的CT值[CT(L/S)]表示肝脏脂肪含量。
糖尿病:空腹血糖(FPG)≥7.0 mmol/L、随机血糖≥11.1 mmol/L或目前正在使用治疗糖尿病的药物[10]。冠心病:通过冠状动脉CT血管成像或既往病史进行诊断。高血压:静息状态,3次/d测量收缩压(SBP)≥140 mmHg和舒张压(DBP)≥90 mmHg或正在使用治疗高血压药物。
1.5 统计学方法
1.5.1 模型的建立:分类变量以例数/%的形式表示,连续变量以均数±标准差表示。在训练队列中,使用LASSO交叉验证法[11]筛选变量,进行临床资料降维。筛选后的变量经检验无多重共线性后纳入多因素逻辑回归。依据多因素逻辑回归的结果绘制列线图(Nomogram)建立临床预测模型。
1.5.2 模型的验证:模型的诊断效能通过预测个体结果的准确性来评价。C统计量[12](C statistics)用于估计预测结果和真实结果之间一致性概率,相当于受试者工作特征曲线(ROC)曲线下的面积(AUC)。C statistics=0.5表示不存在鉴别能力,C statistics=1.0表示模型可将不同结果的患者完全区分开。校准图(Calibration plot)是真实的概率和预测的概率之间关系的图形,用于预测模型的校准。在一个校准良好的模型中,预测概率应该落在一条45°的对角线上。内部验证:通过重复抽样的方法[bootstrap(n=1 000)]在训练队列中来验证模型的有效性并绘制校准曲线。外部验证:将训练队列中得到的逻辑回归公式应用于验证队列中的所有患者,计算每个患者的总得分。然后,将总得分作为一个因素,对该队列进行逻辑回归。最后,在回归分析的基础上,得到C statistics和校准曲线。使用Hosmer-Lemeshow检验判断预测模型的校准度。
研究人群基本特征的分析由SPSS v25(IBM Corporation,Armonk,New York)完成。临床变量的筛选、模型的建立和验证由R,v4.0.1(http://www.r-project.org/)完成。双边α=0.05,P<0.05为差异有统计学意义。
2.1 训练队列与验证队列基本特征1 998例体检行肠镜检查的患者,根据排除标准,排除既往有其他明确原因的胃肠道和肝脏疾病史,以及病例资料不完整患者1 408例,共纳入590例,其中息肉组353例,对照组237例。研究队列按7∶3随机分为训练队列(n=417)和验证队列(n=173),两个队列的23项临床特征一致(见表1)。
表1 训练队列和验证队列基本特征
续表1
2.2 变量的筛选和降维在训练队列中,使用LASSO回归交叉验证法,模型中系数为非零的变量作为潜在的预测因子。最终,23个变量减少为年龄、性别和CT(L/S)共3个变量(临床特征)成为预测结直肠息肉的预测因子(见图1),即我们可以通过年龄、性别和肝脏的脂肪含量[CT(L/S)]预测患者结直肠息肉发生的概率。
注:A:LASSO回归模型中调整参数(λ)通过最小准则10倍交叉验证进行选择。绘制受试者工作特征(ROC)曲线下的面积(AUC)与Log(λ)的对比图。在最优值和1+标准误(1+SE)处绘制垂直虚线。依据10倍交叉验证,在(1+SE)处选择λ=0.058,Log(λ)=-2.8388;B:23个临床特征的LASSO回归系数图。使用10倍交叉验证进行变量筛选,在最佳λ处选择非0回归系数的变量作为潜在的预测因子。
2.3 绘制结直肠息肉发生概率的列线图经LASSO回归交叉验证筛选的变量进行多因素逻辑回归分析(见表2)。年龄(OR=1.04,95%CI:1.02~1.06)、性别(OR=1.85,95%CI:1.18~2.91)和CT(L/S)(OR=0.18,95%CI:0.06~0.53)均为发生结直肠息肉的独立危险因素。使用二元逻辑回归的结果绘制列线图建立预测模型(见图2)。结直肠息肉预测概率的C statistics为0.662(95%CI:0.609~0.715)。
图2 结直肠息内发生概率列线图
表2 训练队列中结直肠息肉患者的多因素逻辑回归分析
2.4 临床预测模型的验证内部验证:在训练队列中,通过重复抽样的方法[bootstrap(n=1 000)]绘制校准曲线(见图3A)。校准曲线显示模型的预测概率靠近校准图对角线,表明模型的预测概率良好。
外部验证:在验证队列中,列线图对预测结直肠息肉概率的C statistics为0.708(95%CI:0.630~0.785),绘制的校准曲线同样显示出良好的鉴别能力(见图3B)。Hosmer-Lemeshow检验P=0.6477,χ2=5.9961,表明预测模型的校准度良好。
注:A:内部验证:在训练队列中,通过重复抽样的方法[bootstrap(n=1 000)]绘制校准曲线。校准曲线显示模型的预测概率靠近校准图对角线,表明模型的预测概率良好;B:外部验证:在验证队列中,列线图对预测结直肠息肉概率的C statistics为0.708(95% CI:0.630~0.785),绘制的校准曲线同样显示出良好的鉴别能力。
本研究纳入了结直肠息肉相关的23个临床变量,其中首次引入了肝脏脂肪含量[CT(L/S)]这个变量,采用LASSO回归交叉验证法,筛选出性别、年龄和CT(L/S)共3个变量成为潜在的预测因子,构建了预测结直肠息肉发生概率的列线图,通过内部验证和外部验证,结果显示预测模型具有良好的预测能力[13]。
本研究构建的预测模型中,性别和年龄是结直肠息肉的潜在的预测因子,其中,男性是结直肠息肉的危险因素;同时,随着年龄的增加,模型赋予的分值增大,息肉发生的概率增加。近年来,大量的研究表明,性别和年龄是结直肠息肉的独立危险因子,老年男性结直肠息肉的发生率明显增加[14-16],与我们模型预测结果一致,提示预测模型具有良好的科学性和可行性。近年来,由于肠镜筛查的普及,65岁以上的CRC发病率有所降低,而65岁以下的CRC发病率却每年增长约2%[17],提示了高危人群提前进行肠镜筛查的必要性。本研究结合年龄进行风险评分,客观地给予患者建议,适时进行肠镜检查。
本研究构建的预测模型中,首次提出了肝脏脂肪含量[CT(L/S)]的预测价值。在相同年龄和性别的人群中,CT(L/S)越低,预测模型得分越高,其结直肠息肉发生的风险越高。例如,年龄25岁,男,其结直肠息肉的发生概率<20%,不推荐进行肠镜筛查;当合并中度脂肪肝[0.5 本研究构建的预测模型中,相较于性别和年龄,肝脏脂肪含量[CT(L/S)]被赋予了更高的分值,提示肝脏脂肪含量在预测结直肠息肉发生中的重要性。因此,我们应该重视肝脏脂肪含量增加的NAFLD患者的结直肠息肉的筛查工作,一方面,针对肝脏脂肪含量增高的NAFLD患者,模型预测其结直肠息肉发生的概率较高,及时进行肠镜检查,做到早发现、早诊断、早治疗结直肠息肉,进而做好CRC的二级预防工作效率。此外,预测模型还适用于人群的结直肠息肉的初步筛查,应用模型进行人群的结直肠息肉发生概率预测,筛选概率较高的人群进一步进行肠镜检查,以提高结直肠息肉筛查的效率。 综上所述,我们构建了一个基于肝脏脂肪含量的结直肠息肉发生概率的临床预测模型,提高了对肝脏脂肪含量增高的NAFLD患者的结直肠息肉的预警作用和筛查效率。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!