当前位置:首页 期刊杂志

基于15省城镇医疗保险数据测算我国成人进行性肌萎缩患病率

时间:2024-08-31

许 璐,陈 璐,樊东升,冯菁楠,刘立立,詹思延,3,王胜锋△

(1. 北京大学公共卫生学院流行病与卫生统计学系,北京 100191; 2. 北京大学第三医院神经内科,北京 100191; 3. 北京大学第三医院临床流行病学中心,北京 100191)

进行性肌萎缩(progressive muscular atrophy,PMA)是一种散发的、罕见的、成年期起病的神经退行性疾病[1],属于运动神经元疾病(motor neuron disease,MND),与同时累及上、下运动神经元的MND常见亚型——肌萎缩侧索硬化(amyotrophic lateral sclerosis,ALS)不同的是,PMA仅累及下运动神经元[1]。PMA主要表现为手部或肩部等处横纹肌的衰弱和消瘦,早期症状主要为劳累性呼吸困难,因此易被误诊为慢性心肺功能不全等疾病[2]。目前国际上多数研究关注的是ALS的流行病学特征[3-4],但PMA和ALS一样,均会给患者及家人乃至整个社会带来巨大的负担[5-6],部分PMA患者甚至可在疾病后期发展为ALS[1],但遗憾的是,目前全球范围内关于PMA的流行病学特征与疾病负担的研究都比较缺乏。

既往的队列研究发现,PMA患者的平均发病年龄为62.7岁,平均生存期为27个月,男性多于女性[7]。目前尚无基于大样本人群研究估算PMA的患病率,但有研究提示PMA患者约占MND患者的2.5%~11%[1,8]。由于PMA是一种极为罕见的疾病,所以很难通过单中心或多中心的研究来发现足够的患者以进行患病率或发病率的估算,造成目前国际上还鲜有此方面的数据。

随着大数据时代的到来,医疗保险等电子医疗大数据覆盖人群广泛的优势给开展这一研究提供了可能。以我国为例,2016年城镇职工与城镇居民医疗保险数据库已覆盖了超过95%的全部城镇人口。因此,本研究利用我国城镇医疗保险数据进行PMA患病率的测算,分析我国PMA流行病学特征,为PMA的疾病机制研究和相关医疗政策的制定提供线索。

1 资料与方法

1.1 研究人群

利用来自我国大陆地区31个省、自治区、直辖市中的15个省2016年1月1日至12月31日的城镇职工和城镇居民医疗保险数据(包含门急诊和住院患者数据),排除18岁以下的儿童。剔除省份的原因包括:报告政策限制、仅上报一种医疗保险类型数据、重要信息的缺失或异常、因未观察到PMA患者无法直接纳入泊松(Poisson)回归填补。所有患者记录均进行了去识别处理以保护患者隐私。本研究得到北京大学生物医学伦理委员会的批准(IRB00001052-18012),并豁免知情同意。

1.2 患者识别

采用自然语言处理结合神经内科医师判读对医疗保险数据库中的疾病诊断信息进行标准化并对PMA患者进行识别标注,此项工作共为三个阶段[9]:第一阶段,神经内科医师制定PMA诊断名称和诊断编码字典;第二阶段,利用计算机将所有研究对象的诊断信息进行自然语言处理,并对PMA患者进行标注;第三阶段,将计算机标注完的诊断信息交到神经内科临床医师手中进行人工核查判断,两名医师独立审阅判断,出现差异时,二人讨论协商处理或咨询第三位高年资医生。最后根据人工核查结果再重新进行自然语言处理,以上过程循环往复,直至自然语言分词标注的准确率达到95%。

临床医生对PMA患者的判断标准为:(1)医疗保险数据库中患者的主要和次要疾病诊断名称包含“进行性肌萎缩”或“PMA”,疾病诊断编码ICD-10(International Classification of Diseases version 10)为“G12.2”;(2)若诊断信息中含有“?”、“待查”、“疑似”、“可疑”等字段则将患者判断为疑似PMA患者,这部分患者未纳入最后的分析中;(3)如果诊断信息中含有“排除”等字段,则为非PMA患者。

1.3 统计学分析

PMA全国患病率的测算分为两阶段进行。第一阶段,先进行各省不同性别年龄亚组患病率的测算,测算的分母(Nij)为2016年各省各性别年龄亚组城镇职工和城镇居民中参保者对应的总人年,测算的分子(Mij)为在考虑诊断信息缺失的情况下,从对应的分母人群中估算出的PMA患者数,其中i表示性别年龄亚组,j表示省份。因为医疗保险数据以月为单位将每位参保者的参保信息进行记录,所以研究期间总人年相当于研究期间所有的参保记录数除以12。分母(Nij)可分为三部分:(1)未患有疾病而无就诊记录参保者对应的人年数(N1ij);(2)有就诊记录且诊断信息完整的参保者对应的人年数(N2ij);(3)有就诊记录但诊断信息缺失的参保者对应的人年数(N3ij),因此,N2ij对应的参保者包含一部分PMA患者(aij),即可以观察到的患者,N3ij对应的参保者也应包含一部分PMA患者(cij),两者合计才为2016年各省不同性别年龄亚组总的PMA患者数。因为不考虑cij这部分PMA患者数会造成最终患病率的低估,所以将利用基于泊松回归的方法进行分子中PMA患者数的十次多重填补。前期数据摸索发现,数据库中患者诊断信息的缺失主要与行政管理因素有关。考虑到患者诊断信息是否缺失不受PMA患病情况的影响,因此推断诊断信息完整的参保者和诊断信息缺失的参保者中目标患者数所占比例是一致的,即aij/N2ij=cij/N3ij,继而cij=(aij/N2ij)×N3ij=rij×N3ij,其中rij表示N2ij这部分参保者中PMA的患病率。对每个省,拟合以下泊松回归模型:rj=eβ0+β1年龄+β1性别+β2医疗保险类型,然后可得到不同性别年龄亚组中患者数(包含诊断信息完整和诊断信息缺失参保者中的PMA患者)基于泊松模型的预测值。同时,为了减少模型预测的不确定性,通过在预测值的95%CI范围内进行十次抽样而实现十次填补。在计算各省整体患病率时,分子为各省不同亚组分子患者数的合计,即aj+cj=∑i(aij+cij),最终得到该省份某一亚组患病率或该省整体患病率[10]。在第二阶段,为了降低各省份间异质性对结果的影响[10],通过基于随机效应模型的meta分析方法合并各省的患病率得到全国患病率。在进行meta分析前,将各省的率值进行了Freeman-Tukey双反正弦变换[11]。

此外,按照性别、地区(包括东部地区、北部地区、东北地区、西北地区、中南地区和西南地区)和年龄进行亚组分析,并且依据我国2010年全国人口普查数据得到PMA按年龄调整后的患病标化率,同时通过不进行PMA患者数填补和剔除诊断信息缺失率前10%的省份(湖北、山东)进行敏感性分析。

统计学分析通过Stata 15.0完成,连续性变量采用t检验,分类变量采用卡方检验。双侧P<0.05为差异有统计学意义。

2 结果

本研究纳入的总参保人年数为99 609万,其中男性为51 841万,女性为47 767万(表1)。纳入研究对象的人口结构特征与我国2010年人口普查类似(图1)。

表1 2016年我国15省城镇人口人年数

a, the individuals with missingness in gender information covered 0.01 million person-years; b, the East area contains Jiangsu, Zhejiang, Anhui, and Shandong; the North area contains Inner Mongolia; the Northeast area contains Liaoning and Heilongjiang; the Northwest area contains Gansu; the Southcentral area contains Henan, Hubei, Hunan, Guangdong, and Guangxi; the Southwest area contains Chongqing and Yunnan.

本研究纳入的2016年参保人群中可通过诊断信息观察到的PMA患者共计131人,男性70人,女性61人,平均年龄为46.21岁,男性49.20岁,女性42.77岁,患者具体的人口学特征见表2。

表2 2016年我国15省城市地区进行性肌萎缩患者人口学基本特征

* for age, the statistic istvalue; for age group and area, the statistic is Chi-squared.

2016年我国PMA患病率为0.28/10万人年(95%CI:0.24~0.33),男性患病率大于女性患病率,男性患病率为0.35/10万人年(95%CI:0.28~0.42),女性患病率为0.21/10万人年(95%CI:0.16~0.26),按年龄调整后的全国患病标化率为0.29/10万人年(95%CI:0.27~0.31)。不进行PMA患者数填补和剔除诊断信息缺失率前10%的省份后所得的敏感性分析结果分别为0.17/10万人年(95%CI:0.14~0.20)和0.24/10万人年(95%CI:0.20~0.28)。

我国不同地区的PMA患病率差异较大(表3),表现为西南地区患病率最低(0.11/10万人年,95%CI:0.07~0.15), 西北地区患病率最高(3.47/10万人年,95%CI:0.80~7.99), 各年龄段患病率差异较小,其中70岁以上人群患病率相对较高(图2)。

3 讨论

PMA是MND的一种疾病亚型。MND是一组与上、下运动神经元变性有关的神经退行性疾病,包括上、下运动神经元均受累的ALS、脊髓性肌萎缩、遗传性痉挛性截瘫、仅上运动神经元受累的原发性侧索硬化、仅累及下运动神经元的PMA和进行性延髓麻痹[3,12],其中最为常见的是ALS和PMA两种亚型。但是,无论从临床还是组织病理角度,PMA和ALS都没有明确的界限,很大一部分PMA患者可于疾病后期出现上运动神经元受损症状[13],从而提示ALS的诊断。有学者认为,PMA应被视为ALS疾病谱中的一部分,而不是一个独立的疾病[1,14]。但既往也有研究提示ALS与PMA的流行病学特征存在差异,有研究显示PMA患者的发病和诊断年龄均较早[13],也有研究发现PMA的发病年龄和诊断年龄均较晚,从发病到诊断的间隔时间较长[1,8],所以目前对于这一问题还存在争议。

全球范围内对MND流行病学特征的研究主要关注的是MND整体及其主要亚型ALS[15],而对于PMA的各方面研究均较少,我国尚没有关于PMA流行病学特征的研究。本研究发现,我国2016年PMA患病率为0.28/10万人年,女性和男性分别为0.21/10万人年和0.35/10万人年,我国2016年总人口数13.8亿人[16],根据研究结果可以推测,我国2016年PMA患病人数约为3 864人。目前,一项在我国开展的注册登记研究中发现的461例MND患者中,ALS占 84.4%,进行性延髓麻痹占 4.1%,PMA占10.4%,原发性侧索硬化占0.9%[17],结合2019年发表的一项meta分析中东亚地区的ALS患病率(3.67/10万),估算东亚地区PMA的患病率约为0.45/10万人年,与本研究结果较为接近[4]。

表3 2016年我国城市地区不同性别、地区和年龄组成人进行性肌萎缩患病率(/10万人年)

* the statistical tests adopted are Poisson tests for comparison of multiple Poisson rates.

本研究和以往国外多数研究一样,发现男性患者多于女性患者[13,18],男性患病率高于女性。2016年PMA患者平均年龄为46.21岁,而文献报道的我国ALS患者的平均发病年龄为49.8岁[19],推算可知我国PMA患者的发病年龄要早于ALS患者,这与部分研究结果一致[7,13],与Kim等[8]的研究结果不一致。此外,本研究发现70岁以上人群的PMA患病率明显增高,呈现与ALS类似的趋势[4],但在70岁以前,PMA患病率一直相对稳定,而ALS患病率则呈现明显的上升趋势[4],这一点也进一步提示PMA与ALS可能是两种不同的疾病,该现象的潜在原因仍需临床研究和基础研究的探索和解答。在分地区测算患病率时,西北地区的患病率明显高于其他地区,值得注意的是,该率值对应的95%可信区间也很宽,此结果还有待进一步验证。

本研究的意义一方面在于首次测算了我国城镇人口中成人PMA的患病率,丰富了PMA匮乏的流行病学资料,另一方面在于为利用我国数据量不断攀升的基本医疗保险数据库开展罕见病的疾病负担测算工作提供了可借鉴的思路。因为是基于医疗保险数据,本研究也存在以下不足之处:第一,医疗保险数据缺乏实验室检查和影像学检查等信息来辅助识别目标患者,尽管如此,国际上也有不少研究尝试使用医疗保险数据来探索罕见病的患病率或发病率,既往同类研究也多采用医疗保险数据中含有的诊断名称和诊断编码来识别目标患者[20-23];第二,诊断变量存在一定比例的缺失,但本研究采用了基于泊松回归的填补思路,以尽可能获得较为真实的结果;第三,只纳入了城镇医疗保险数据,也许不能反映农村人口PMA的患病情况,但研究纳入的研究对象人口结构与2010年全国人口普查类似;第四,本研究无法排除经济水平(或疾病诊断率)对各地区患病率数值大小的影响,但将各省2010年地区生产总值纳入meta回归,发现地区生产总值每增加3 132 832亿元,患病率上升0.001/10万人年,影响幅度很小,且关联无统计学意义(P=0.160),至少可推测这种影响所造成的差异显著性不太明显。

综上,通过利用城镇基本医疗保险数据测算出我国15省城镇人口中成人2016年PMA的患病率,可以为相关部门制定针对PMA相关医疗政策提供基础性数据,同时PMA患者的基本人口学特征也可为PMA疾病机制研究提供提示性线索。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!