人口健康水平综合测算和健康测量

时间：2024-07-28

乔晓春

(北京大学人口研究所，北京 100871)

一、问题的提出

实施健康中国战略最重要的就是要测量和监测实施效果，通过监测可以检验健康水平是否随着时间的推移而得到改善，了解为什么不同地区、不同人群的健康水平会存在差异，还可以随时发现存在的问题，制定相应的政策并调整行动方案。可以说，监测不仅能反映健康中国建设的结果，也是推动健康中国建设的动力。

做好监测的第一步是找到一个测算人口群体健康水平的指标。2019年7月发布的《健康中国行动(2019—2030年)》把人口平均预期寿命作为评价人口健康水平的核心指标，(1)《“健康中国2030”规划纲要》中给出的“健康水平”测量指标包括：人均预期寿命、婴儿死亡率、5岁以下儿童死亡率、孕产妇死亡率和城乡居民达到《国民体质测定标准》合格以上的人数比例。这5个指标中的前4个指标均为死亡率指标，最后一个指标也并不是一个反映人群一般健康水平的指标，该指标在《健康中国行动(2019—2030年)》中已经从“健康水平”指标中拿掉，放到了“全面健身行动”指标中。并给出了基期水平为76.7岁， 2022年的目标值为77.7岁，2030年的目标值为79.0岁。

在《健康中国行动(2019—2030年)》中除了给出人均预期寿命外，“健康水平”指标中还给出了一个人均健康预期寿命指标。在指标的基期水平一栏标出2016年人均健康预期寿命为68.7岁，在栏目说明里提到这一数据来自《世界卫生统计2018》；该指标目标值一栏2022年和2030年分别标注为“提高”和“显著提高”，但并没有给出具体数值。没有给出具体数值的原因是，到目前为止中国政府并未计算和公布过中国人口的人均健康预期寿命，而目前给出的数据来自全球疾病负担(GBD)项目，它是基于数百种疾病患病率，通过人为给定的、复杂的失能权数调整以后计算出的结果[1-2]，被称为失能调整预期寿命(Disability-Adjusted Life Expectancy,简称为DALE)。由于使用主观设置的加权方法和使用大量疾病分类数据，该指标很难被世界各国所采用，其公布的结果也很难被世界很多国家所接受[3-4]。尽管《健康中国行动(2019—2030年)》中列出了这一指标，但这一指标并不是中国自己计算的，所以不可能用该指标作为健康中国行动的监测指标。

长期以来中国各级政府(包括卫生部门)都是用人均预期寿命(2)人口平均预期寿命是人口学在测量人口死亡水平时所使用的一个人口群体指标，它反映的是“假定一批人按照某一年的分年龄死亡率活过一生(或全部死亡)，这批人一生的平均死亡年龄或平均寿命”。它是由当前的分年龄死亡率计算出的假定一批人的平均寿命，而不是现有人口的真实寿命，因此叫平均“预期”寿命。来反映人口群体健康水平。由于这一指标是利用某一特定时期分年龄死亡率计算的，所以它综合地反映该时期内人口群体的死亡水平。在这里，“死亡水平”和“寿命”在词义上等价，方向则相反。死亡水平越高，寿命越短；死亡水平越低，寿命越长。不同年龄死亡率的变化对平均预期寿命作用程度是不一样的，一般来说年龄越低，该年龄死亡率变化对预期寿命变化的影响也越大，0岁死亡率对预期寿命的影响最大,老年人死亡率对预期寿命的影响最小[5]。当人口进入老龄化阶段，婴幼儿死亡率和中青年人死亡率几乎不存在太大的下降空间，此时老年人死亡率下降对平均预期寿命的提升起主导性作用。遗憾的是，由于老年人死亡率下降对预期寿命影响程度非常小，从而很难继续用平均预期寿命来展示死亡水平变化或人口健康水平的提升。

除此之外，尽管死亡水平或平均预期寿命与人口健康水平存在关联，而且在早期(3)至少中国在40年前，发达国家在60年前。人的寿命与健康之间的关系确实也非常密切，但是随着人类疾病谱从急性病向慢性病的转变，特别是人类社会进入老龄化阶段以后，死亡水平和健康水平开始分离，即死亡水平的降低或寿命的延长并不意味着健康水平在提升，甚至出现健康水平下降的情况，从而导致平均预期寿命并不能真正反映现有人群的健康水平。很多国家(也包括中国)都发现了人的寿命越长反而身体越不健康的情况[6-7]，即出现了寿命与健康的明显分离。此时，再继续用死亡水平或平均预期寿命来测量人口群体健康水平则是不合适的，甚至会出现对人口健康状况的误判。

为了测量人口健康水平，需要找到一个能够将死亡水平和健康水平相结合来反映人口群体健康水平的综合指标。针对人口群体健康水平测量，本文将回答以下三个问题：一是如何测算的问题；二是测量什么的问题；三是如何理解测算结果的问题。这里的“测算”指的是计算方法，“测量”指的是计算所用的指标。

二、人口健康水平测量方法

从年龄角度看健康的话，一个人一生大体可以分为两个时期，年轻时处在健康期，年纪大了以后会经历不健康期。尽管从个体上看，健康和不健康可以发生在任何年龄上，而且随着年龄的变化，健康可以转为不健康，不健康也可以转为健康；但从人口群体上看，随着年龄的增长，整体健康状况基本上是不可逆的，所以我们可以认为健康期处在低年龄段，不健康期处于高年龄段，从而把人口群体按照健康状况分为两部分：健康期和不健康期。当然，我们也可以把健康期和不健康期只看作处于不同健康状态时间长度的累计结果，既不考虑先后顺序也不考虑是否连续发生或是否可逆的情况。

为了与死亡分析相结合，也为了排除死亡率对健康的影响，我们将分年龄人口健康状况引入死亡率分析。图1描述了10万人出生后从健康期到不健康期再到死亡的全过程。假定有10万个新出生的婴儿，(4)这里无论假定有10万人、1万人、100人，还是1个人都不影响计算结果。每个婴儿按照这个分年龄存活率活过一生，此时的lx反映的是x岁人口存活人数，如果把它看成连续函数，则可以写成l(x)，此时l(0)=100000。图1的横轴为年龄，纵轴为人数。两条曲线中的上方曲线反映的是存活向死亡转移曲线，可以用l(x)表示，曲线的下方长度反映存活人口数量，上方长度反映死亡人口数量；两条曲线中的下方曲线反映的是从健康向不健康转移曲线，用h(x)来表示，曲线下方为健康人口数量，下方曲线到上方曲线的长度为不健康人口数量。下方曲线围成的面积为健康区域，下方曲线与上方曲线之间的面积为不健康区域。两个带箭头的横线反映的是两个人的生命历程，其中一个人从出生开始一直处于健康状态，从55岁开始进入不健康状态，在68岁的时候死亡，换句话说这个人一生中有55年处于健康状态，有13年处于不健康状态，处于不健康状态的时间占到生命长度的19.1%；另一个人从出生开始一直处于健康状态，在78岁开始从健康状态转入不健康状态，在84岁死亡，这个人的健康期是78年，不健康期是6年，不健康期占生命长度的比例为7.1%。很明显，第二个人不仅比第一个人活得长，也比第一个人活得更健康。

图1 一批人一生的健康曲线和生存曲线

根据这个图形，将所有人的死亡年龄相加，再除以10万人，就是每个人平均存活的年龄，即平均寿命(e0)，写成数学公式：

我们可以计算出健康曲线围成的面积，即平均健康预期寿命：

在这里h(x)为x岁人口中处于健康状态人口数，H(x)为x岁处于健康状态人口比例。由于h(x)是由x岁人口数l(x)乘以x岁健康人口比例H(x)所得到的，因此e0h由分年龄存活人口和分年龄健康人口比例所决定。由于这一计算是基于假定存在l(0)一批人按照现实各年龄死亡率“度过”一生，所以由此得到的l(x)和h(x)均与现实人口年龄结构无关，从而导致这一指标是一个不受年龄结构影响，且能够既反映死亡人口死亡水平又反映存活人口健康水平的一项综合健康指标。

同样，我们也可以计算出不健康区域的面积，即平均不健康预期寿命：

这样就得到了三个结果：出生时平均健康预期寿命e0h，出生时平均不健康预期寿命e0u和出生时平均预期寿命e0，而且e0h+e0u=e0。

此时，这里针对一个人口群体健康得出了两个指标，一个是反映死亡人口死亡水平的指标——平均预期寿命，另一个是将反映死亡人口死亡水平和反映存活人口健康状况整合在一起的指标——平均健康预期寿命，我们称其为综合健康指标，它反映人口群体综合健康水平。

三、健康的概念化分类

前面讨论的只是人口群体健康水平的综合测量方法，它们是在给定了某一特定年代人口分年龄健康比例和分年龄死亡率的情况下将人口平均预期寿命分解为平均健康预期寿命和平均不健康预期寿命两部分。但是，有一个最关键的问题并没有回答，那就是这里的“健康”是如何界定的。

世界卫生组织1947年给出的健康定义是,“健康是身体、心理和社会完好状态，而不仅仅是指没有疾病或不虚弱”。这是一个概念性定义，而与此相对应的操作化界定要比概念性定义更复杂。

不健康可以涵盖很多内容，包括患传染性疾病、患非传染性疾病、身体损伤、功能受限、失能等身体或生理方面问题，也可以是心理问题和社会交往障碍问题等，而且从健康到不健康本身就是一个逐步发展的过程，在这一过程中健康问题不仅涉及不同的程度或层级，甚至在同一层级上会涉及多项内容。早在20世纪60年代学者纳吉就针对健康给出了包括四项相关内容的概念性框架[8]，这一框架比一般的健康定义更为具体。尽管它仍然属于概念性界定，但可以说它是介于健康的一般化界定和操作化界定之间的一个更为清晰和直观的逻辑递进框架，它涵盖病理(Pathology)、残疾(Impairment)、功能受限(Funtional Limitation)和失能(Disability)。按照这样一种分类，我们可以将人口群体的健康生命历程依次分为下面六个阶段：

这里我们把病理改成了疾病，主要是侧重于慢性疾病，而不涵盖传染性疾病等急性病，因为这类疾病发病病程短且容易恢复，而不是不健康的一种持续状态。这六种状态可以简化为图1所展示的三种状态：健康、不健康和死亡。人们在健康和不健康状态上都会持续一段时间，而死亡则是一种吸收状态。(6)用多状态马尔科夫链模型来表示的话，死亡被定义为“吸收状态(absorbing state)”，健康或不健康被定义为“驻留状态(transient state)”。这样保持健康状态的时期被称为健康期，后面的四种状态都可以称为不健康状态。图2的健康曲线可以是四种不健康状态中的任何一种，也可以是在图1两条曲线之间再插入三条健康曲线，这样图2中的五条曲线反映的是六种状态依次递进转移概率曲线。如果承认人口群体健康状态的演进过程合理的话，一个人口群体从出生到死亡的全生命过程中就会经历五种连续状态：健康、疾病、残疾、功能受限和失能，最后到死亡。

图2 一批人一生多个递进健康状态曲线和死亡曲线

根据纳吉的解释，残疾主要指的是身体器官(解剖学和生理学)、精神或情感方面的不正常或缺失[9]。这个内容相当于中国残疾人调查所进行的分类：视力残疾、听力残疾、言语残疾、智力残疾、精神残疾和肢体残疾。残疾也跟功能有关，但功能受限比残疾在程度上要更高一些。尽管有些人身体器官存在缺损，但并不影响身体各项功能的发挥，而功能受限指器官缺损已经影响了功能的发挥，而且这种影响已经被表现出来了。失能指的是社会功能的发挥，而不是身体功能的发挥，具体讲就是在社会环境和自然环境下个人承担社会角色和社会工作时存在能力不足或能力缺失。社会角色涵盖家庭和人际关系，包括工作、就业、教育、娱乐、生活自理等。不是所有的残疾或功能受限都属于失能，但失能很大程度上源于残疾或功能受限。失能与残疾和功能受限的最大区别在于外在的自然和社会环境会影响人的能力发挥，比如楼房安装了电梯可以让原本行动不便的人上下楼，戴近视眼镜可以让视力受限的人看清想看的东西，佩戴助听器可让听力受限的人能够听到别人的讲话，计算机语音阅读可以让视力残疾人通过计算机或手机来阅读文章，等等。因此，改变生活环境成为解决失能问题的重要条件。有时失能也可以被看成是活动受限(Limitation of Activities)，活动可以包括家庭内部的活动也可以包括家庭以外的社会活动。

四、健康的操作化处理

前面提出了四个层面的健康定义：疾病、残疾、功能受限和失能，它们仍然属于概念性界定。为了进行实际测量，人们还需要给出操作化界定。

疾病(Disease)可以分很多种类，世界卫生组织(WHO)给出的国际疾病分类(ICD)对其有明确的划分，而识别一个人是否患某种疾病，则是医生的任务。遗憾的是，尽管医生可以基于检查结果给出客观判断，但人口群体健康水平测量覆盖的是全人群，几乎不可能通过医学检查了解全人群或大规模样本人群的患病状况，所以有时不得不通过主观自评的方式来获取结果。比如，中国老龄科研中心于1992年举行的“老年人供养体系调查”直接询问60岁及以上老年人的患病状况，其中包括脑血管病、心血管病、呼吸系统疾病、消化系统疾病等多种疾病，由此可以计算出老年人各类疾病患病的比例。因为是老年人自己申报的结果，往往并不会很准确，原因是很多已经患病的人由于没有去医院检查并不知道自己已经患病，所以会存在明显的低估。

残疾(Impairment)在国际疾病分类中也有明确的划分。中国在1987年和2006年针对全人群分别开展过两次大规模的全国残疾人抽样调查。调查中不仅把残疾分为视力残疾、听力残疾、言语残疾、智力残疾、精神残疾和肢体残疾，而且还根据缺损或不正常的程度对每类残疾划分了等级，这是一种典型的从身体器官的不正常或缺损角度进行识别的一种调查。(7)尽管这次残疾人调查中将“残疾”翻译成了“disability”，但它的准确含义应该是“impairment”，而不是“失能”。因为针对残疾和残疾等级的认定是通过专业医生基于医学检验标准甚至使用了专业设备进行的检测，所以中国的残疾人调查基本上属于一种客观调查，比一些社会调查通过主观自评得到的判断更严格。这样与其他国家比，中国的残疾发生率相对是比较低的。除此之外，中国一些针对老年人的抽样调查也会涉及残疾的内容，但绝大多数调查都属于主观自评，与全国残疾人调查的结果不具可比性。

功能受限(Funtional Limitation)从操作性测量角度看主要是检验人们日常生活活动(Activities of Daily Living，简称ADL)的自理能力，更多是针对身体方面的能力，而不针对智力或精神方面存在的问题。最早使用的测量工具是Katz于1957年构造的量表，主要用于检验老年人慢性病治疗效果。尽管日常生活活动可以列出100多项，但Katz量表只测量是否能独立洗澡、穿衣、如厕、床椅间移动、大小便控制和吃饭这六项，每一项按照不需要帮助、部分需要帮助和完全需要帮助分为三个等级。另一个国际通用的ADL测量工具为巴氏量表(Barthel Index),它共分为十项内容，而且将每项内容用打分的方式分成了不同等级，整合后的分数取值范围为0到100，分数越低意味着越需要帮助，越高意味着越能够自理。因为Katz量表更为简单，所以经常被用于社会调查，而Barthel量表更为复杂，通常被用于长期护理服务的评估。Lawton和Brody对Katz量表做了一些修订，用梳洗代替了大小便控制，将室内床椅间移动改为室外移动，而且把等级分为了五组；与此同时Lawton和Brody还将ADL概念从家庭日常生活拓展到社区范围内的活动，被称为IADL(Instrumental Activities of Daily Living),内容包括使用电话、购物、备餐、打扫卫生、洗衣、乘车、就医、理财共八项内容。Lawton和Brody将他们提出的ADL和IADL的合并测量称为身体自我维护量表(Physical Self-Maintenance Scale，简称为PSMS)[10]。目前国内学者使用的绝大多数都是PSMS量表，而不是Katz量表。几乎国内所有涉及老年人的抽样调查，都对ADL进行了调查，有些还调查了IADL。这个量表的局限在于一是它通常只针对老年人，二是只针对居家生活的老年人，而不能用于居住在养老机构的老年人。

失能(Disability)强调的是在残疾和功能受限情况下个人的社会活动和社会参与能力的不足。从活动参与层面看，IADL已经比ADL更进一步了，因为它从关注家庭环境内部走向了社区环境。但是，严格意义上说，尽管大家普遍使用失能这个词，但更多关注的是失能的个人自理能力属性，很少考虑个人的社会参与属性，从而也很少调查或测量这方面的内容。国际上在这方面还有很多测量量表，比如社会支持问卷(Social Support Questionnaire)、Katz调整量表(Katz Adjustment Scale)、社会功能量表(Social Funtioning Schedule)和社会调整量表(Social Adjustment Scale)等[10]。这些量表一方面测量起来都比较复杂，另一方面绝大多数都不是针对老年人或者针对残疾或功能受限人群，而是针对一般人群的，所以与功能受限人群的健康问题关系比较远,这样使用的也比较少。如何从社会活动和社会参与角度来测量失能仍然是摆在我们面前的一项难题。

五、自评健康测量工具

从人口群体健康水平测量的角度看，人们一直面临一种两难的境地。一方面，客观测量比较准确，信度和效度都比较好，但测量起来会非常困难，对全人群(包括针对部分有代表性的人群)进行测量几乎是不可能做到的；另一方面，主观测量(自评健康)比较简单，也很容易做到，但信度和效度往往会存在问题。因此，人们期望找到一种主观测量且能够更为贴近客观的健康测量方法。实际上，ADL量表具有类似的属性。早期一般是医院的医生或康复方面的专业人员使用ADL量表，目的是测量病人治疗和康复后的效果[10]；后期才把它引入社会调查问卷，由调查员或非专业人员依据被调查人自己的判断来进行测量。尽管通过社会调查问卷测量日常生活活动能力在调查信度上不如专业人员面对面进行测量，因为被调查者或调查员对问题的理解都会存在偏差，但该方法更简单、实用和高效。

最简单、最容易、最直观的健康测量方法是直接针对被调查对象询问是否健康，这被称为自评健康(self-rated health,简称为SRH)。比如，第四次中国城乡老年人生活抽样调查针对年龄60岁及以上老人是这样询问的：您觉得自己的健康状况如何？备选答案是：非常好、比较好、一般、比较差和非常差。这是自评健康国际通用的询问和回答方式。中国第六次和第七次全国人口普查也询问了类似的问题，即要求60岁及以上的人填报“身体健康状况”，可选答案是：健康、基本健康、不健康但生活能自理和不健康且生活不能自理。与国际通用应答选项不同的是，我国人口普查给出的答案中同时出现了“健康”和“生活自理”两个概念，好处是不仅可以得出健康状况，同时还可以得出生活自理状况，不好的是人们需要在一个问题中去理解两个不同的概念，而且还要区分二者的差异。这类测量自评健康的方式也算是一种创新。

以往的很多研究都曾证明，主观自评健康与死亡率之间存在密切关系[11-13],所以可以认为自评健康是对个人健康的一个好的估计。因为对这一指标的测量既没有给出先决条件也未给出具体的健康界定，完全取决于被调查者个人的理解，所以它可以涵盖上面提到的所有健康概念，包括疾病、残疾、功能受限和失能。因此，我们可以把自评健康指标看成是涵盖所有健康状况的一项综合测量指标。然而，该指标也存在缺点，因为有人可能把它理解为是否患病,也有人理解为是否残疾或是否存在功能受限，甚至有人会理解为精神健康、心理健康或亚健康等。理解的不同自然会导致选项的不同。这种测量的另一个问题是个人对自己健康状况好坏程度的判断往往取决于自己对健康的期望，期望值比较高的人会给出较低的评价，而期望值较低的人会给出较高的评价。而且期望值本身又受个人社会经济条件、生活环境和受教育水平的影响。除此之外，同一个人、同样的健康状况，在不同时间(由于受当时情绪和心情的影响)回答的结果也会有所不同。因此，自评健康的主观性往往会比较强。

尽管说自评健康(SRH)可以从整体上反映一般人群的健康状况，但是因为绝大多数人都把健康和未患疾病画等号，即简单理解为没病就是健康，有病就是不健康，甚至一些身体有残疾但没有慢性病的人也会认为自己很健康。所以，自评健康会跟疾病的关系比较密切，而且也有研究确实证明了这一点，即自评健康主要测量的是身体疾病，而不是心理疾病[14]。

尽管自评健康指标简单和易于操作，但这一指标含义太广，很难明确它反映的是哪一方面的健康状况。根据世界卫生组织发布的《功能、失能和健康国际分类》(International Classification of Funtioning, Disability and Health,简称为ICF)所提出的理念，健康应该跟更广泛的社会经济和环境政策联系起来，包括保险、社会保障、劳动力、教育、经济、社会政策和法规制定，以及环境改造等[15-16]。从社会整体发展的角度看，健康更应该定位在活动受限或失能层面。(8)将健康定义在活动受限或失能层面比定义在疾病层面更有意义，因为随着人们寿命的延长，患慢性病人群的数量和比例都在增加，然而患慢性病并不影响人们的日常生活和参与社会活动，所以对社会的影响并不大，而活动受限或失能无论对个人、家庭和社会都会产生影响。这类健康问题已经不仅仅是医学问题，而是社会问题。这样，人们渴望能够找到一个能够反映活动受限或失能的自评健康指标，并用该指标来测量人口群体的健康水平。该指标应该能够满足以下条件：(1)单一指标，且问题简单、易于理解和回答，能够在非医学专业调查，特别是在一般社会调查和人口普查中使用；(2)问题能够相对客观且受主观干扰比较小；(3)能够从活动受限或失能的角度反映健康水平；(4)有较好的信度和效度；(5)可以用于长期观测；(6)在国际上具有可比性。

六、失能的自评测量

为了找到这样一个指标，健康寿命和残疾国际网络组织(REVES)在1996年组织了一个“综合失能指标”的论坛，专门讨论设置测量失能的综合指标。当时主要讨论了设置这一指标的标准，并给出了一些初步的设想[17]。2002年联合国成立了针对失能监测的工作组，被称为失能统计的华盛顿城市小组，这一小组的目标就是指导失能综合测量指标的构建，并将其用于各国人口普查、抽样调查或其他统计调查，由此来获取全球的失能数据。(9)详见http:∥unstats.un.org/unsd/methods/citygroup/washington.htm

同样，这一指标构建基础来自世界卫生组织的ICF概念框架[15]。ICF将活动(Activities)定义为个人执行任务或行动；将活动受限(Activity Limitations)定义为个人参与活动存在困难。ICF还进一步明确，对受限的评价要相对于一般人所能接受的标准，要与没有此类健康问题的人进行比较，从而要求这种综合测量必须能够反映个体的活动功能，还要能够反映个体的社会参与功能。根据这样一种思路，REVES给出了下面一些标准：(1)单一项目或最多提出3个问题；(2)涉及长期活动受限，比如至少要6个月的时间；(3)涉及一般性健康问题，涵盖身体和心理两个方面；(4)涉及人们的经常性活动；(5)至少要有3个水平的答案；(6)为了避免选择性，问题之前不设置筛选项。随后学者们提出了30多种备选方案，评估发现这些方案都无法满足上面的全部或绝大多数标准的要求[18]。经过一段时间的讨论，REVES最终给出了一个更为合适的指标，即综合活动受限指标(Global Activity Limitation Indicator, 简称GALI)。它的问题是这样的：在过去至少6个月的时间里，你在多大程度上感觉由于健康问题日常活动受限？答案是：你是否认为你已经是(1)严重受限，(2)受限但不严重，(3)完全没有受限。(10)英文原文是：[Question]：For at least the past 6 months, to what extent have you been limited because of a health problem in activities people usually do? [Answer]：Would you say you have been 1) Severely limited; 2) limited, but not severely; 3) not limited at all.

综合活动受限指标和基于这一测量所计算的健康生命年(Healthy Life Year，简称为HLY)首先在欧盟得到了应用。该指标从2005年开始被欧盟作为人口群体健康指标纳入各项战略目标的监测，比如纳入2000年欧洲的里斯本战略，以及积极和健康老龄化欧洲战略。除此之外，欧洲的各项社会调查也引入了这一指标，比如欧盟收入和生活条件统计调查(EU-SILC)。2006年欧盟委员会还对用综合活动受限指标计算的健康预期寿命指标在各成员国的使用情况进行了评估，目的是想了解自从列入里斯本战略进程监测指标后，该指标在多大程度上为欧盟各成员国以及区域管理提供了支持。2018年欧盟再次对这一指标的使用做了评估，本次评估共向28个欧盟成员国发放了调查问卷，还向欧盟委员会发放了两份问卷，其中22个成员国提交了问卷，主要询问了综合活动受限指标和健康生命年是怎样被用于设置国家政策目标的，哪些调查使用了综合活动受限指标，结果是如何展示的，以及使用综合活动受限指标和健康生命年人员的能力状况如何。评估发现：有15个国家将健康生命年用于国家健康政策，并将其设置为健康战略或规划目标；针对健康生命年的分析还导致了一些国家政策的调整；健康生命年成为一些国家健康测量的主要指标，而且摆在比平均预期寿命更重要的位置；综合活动受限指标和健康生命年甚至开始在健康领域之外使用，比如养老金、退休年龄和可持续发展相关领域。欧盟总部在很多场合下使用综合活动受限指标和健康生命年，包括积极和健康老龄化欧盟创新伙伴计划，2017年欧盟委员会推出的欧盟社会权利支撑项目，65岁健康预期寿命被纳入欧盟社会记分系统的核心指标。欧盟统计局在各类调查中收集综合活动受限指标信息并将健康生命年作为公共卫生可持续发展指标和健康生活质量指标。欧盟就业局的2010—2020欧洲失能战略框架文件中也收集了综合活动受限指标信息，主要是为了监测失能人口的状况，用于支撑欧盟实施联合国失能人群权利公约(UNCRPD)。很多社会调查也使用了综合活动受限指标，比如欧盟收入和生活条件统计调查(EU-SILC)，欧洲健康访问调查(EHIS)，欧洲健康、老龄化和退休调查(SHARE)。欧盟收入和生活条件统计调查数据还被欧洲失能专家学术网络(ANED)用来对欧洲2020年失能人群的就业和教育进行估计。欧洲很多国家统计部门公布的国家健康报告采用的也是健康生命年。欧盟国家还发起了健康寿命年联合行动项目(EHLEIS)，目的是分析欧盟和欧洲国家健康生命年的趋势、类型和差异，以及其他一些人口群体健康综合测量指标；这一项目其中的一个任务就是通过对健康生命年的分析和解释，培训和指导欧洲国家官员和学者提高分析健康生命年的能力。评估发现每个国家都有至少3～4人在从事健康预期寿命分析方面的工作，这些人员基本分布在公共卫生部门、统计部门和大学[19]。除了欧洲，近年来亚洲的日本、菲律宾、新加坡等国家，以及我国台湾地区也在收集和使用综合活动受限指标，并依此来估计健康预期寿命。

因为欧盟和欧盟国家从2005年开始就将综合活动受限指标作为测量人口群体健康水平的指标，从而积累了大量这方面的数据，所以很多学者都对这一指标的效度和信度做了研究。Oyen对这类研究做了专门的回顾[20]，并发现：对未来健康结果的估计中，无论从死亡角度还是从健康照护支出角度看，与综合活动受限指标的估计结果都具有一致性；作为死亡的估计，自评健康和综合活动受限两个指标具有独立性和互补性。最终结论是：作为单一问题测量工具，综合活动受限指标满足活动参与受限综合测量的所有概念性特征，所有研究都未发现它存在效度问题；无论在效度还是信度方面，该指标都是一个好的和充分的测量指标。也有学者用实际数据检验发现，综合活动受限指标比较好地测量了功能的缺失，而自评健康则比较好地测量了身体疾病[14]。除了使用欧洲数据外，也有学者利用我国台湾地区数据、新加坡数据对综合活动受限指标的效度进行了检验，同样得出了综合活动受限指标有效的结论[21-22]。

七、健康预期寿命计算方法

平均预期寿命是通过计算生命表得到的。与此思路一样，计算平均健康预期寿命同样要通过计算健康生命表来得到，而健康生命表又是以生命表为基础的。因此，计算健康预期寿命需要具备两类数据：一是某年的分年龄死亡率，测量的是一年内的死亡发生率(Incidence Rate)；二是该年分年龄健康人口比例，测量的是某一时点上处于健康状态的频率(Prevalence Rate)。前者主要是用来计算生命表，后者用来在生命表基础上计算健康生命表。第一次采用这种方法计算健康预期寿命的是美国学者萨利文[23]，所以这种方法也被称为萨利文方法。

假定我们已经根据分年龄人口死亡率计算出了简略生命表。(11)简略生命表的确切年龄排序是0、1、5、10……，并不是等距的，0到1间距是1岁，1到5间距是4岁，从5岁以后间距均为5岁。确切年龄指的是瞬时年龄，而不是整数年龄。确切年龄1岁指的是1.000岁，整数年龄就是日常记年龄的办法，即确切年龄从1.000到1.999岁之间，或过了1岁生日还未过2岁生日的孩子都被称为1周岁。生命表中的x为确切年龄，lx为生命表上确切年龄为x的存活人口(这里lx=100000为给定值)，Lx为x确切年龄人口活到下一个确切年龄时的存活人年数，Tx为x确切年龄人口未来存活人年总数，ex为x确切年龄人口平均预期寿命(=Tx/Lx)。以上这些指标都是已知的。除此之外各年龄人口中健康人口所占比例Hx也是已知的。需要注意的是，这里的“健康”，可以是无病、无残疾、无活动障碍，也可以是自评健康中回答身体“非常好”和“比较好”，或者“健康”和“基本健康”的，还可以是综合活动受限指标中回答“完全没有受限”的任何一个有关人口健康的指标。使用哪个健康指标取决于手头有什么数据，以及想测量的是哪一类“健康”。

如果这里的“健康”指的是非残疾，健康生命表起始年龄可以从确切年龄0岁开始计算；如果指的是“生活自理能力”，即ADL，这个指标一般只涉及60岁及以上的老年人，那么计算健康生命表时起始年龄只能从60岁开始；如果指的是“整体活动受限指标”，通常只能从15岁开始测量，健康生命表的起始年龄可以从15岁开始。

八、健康预期寿命分析

从健康生命表的计算中可以发现，除了已知的分年龄死亡率和分年龄健康人口比例外，生命表上的很多变量都是中间或过程变量，比如存活人数、生存人年数、生存人年总数、健康生存人年数和健康生存人年总数，有三个变量属于结果变量：预期寿命、健康预期寿命和健康预期寿命占预期寿命的比例。这意味着，我们对人口群体健康水平的分析将针对这三个结果变量，而且这些结果变量的含义是不同的。

预期寿命完全来自分年龄死亡率，跟现有存活人口健康状况无关，而且x岁人口预期寿命或剩余寿命也只与大于x年龄人口的死亡率有关。预期寿命完全独立于健康预期寿命和健康预期寿命占预期寿命的比例。健康预期寿命是在生命表基础上引入分年龄健康人口比例后计算出的结果，这一结果涵盖了死亡和健康两类信息，或者说它是死亡和健康两个因素共同作用的结果。如果人口的死亡率较低或存活率较高，生命表上分年龄存活人口数量就会多；与此同时如果健康人口比例高，健康生存人数就会比较多，健康预期寿命的值也会更高。所以健康预期寿命值反映了与死亡有关和与存活人口有关的两个健康的“合计”或综合测量，这样不同地区的健康预期寿命是可以直接进行比较的。当然，这个用预期健康寿命反映的健康水平只控制了年龄结构而没有控制其他的影响因素。如果要想控制或排除死亡因素作用来比较存活人口的健康水平，则可以用健康预期寿命占预期寿命的比例。

需要引起注意的是，存活人口的健康水平实际上在很大程度上受死亡水平的影响，特别是由于人口快速老龄化和人均预期寿命快速延长，导致预期寿命变化与健康预期寿命变化在方向和程度上出现不一致时，会出现很多不同的结果。因此，在分析健康预期寿命变化时，最好与预期寿命变化结合起来进行分析。如果利用以上给出的健康测量指标和计算健康预期寿命的方法对人口群体健康水平进行分析，可以依据以下几种计算结果：

(1)用平均预期寿命e0来反映人口的死亡水平。尽管预期寿命本质上反映的是排除年龄结构干扰的死亡水平，但是因为该指标的名称为平均预期寿命，从而会使人联想或比照平均寿命进行分析，所以该指标还可以被看成是反映生命长度的指标。

(2)用健康预期寿命e0h来反映人口群体综合健康水平。因为该指标不仅不受年龄结构影响，而且承载了一个人口群体中死亡人口的死亡水平和存活人口的健康比例两类信息，所以属于对现有人口健康状况的综合测量。

(3)用健康预期寿命占预期寿命比例e0h/e0来反映存活人口的健康水平。健康预期寿命是死亡水平和存活人口健康水平两个因素的叠加，如果要想用这一指标测量现存人口的健康水平，则需要消除死亡水平或预期寿命的作用。换句话说，不同预期寿命情况下两组人群健康水平是不能直接比较的。比如男性和女性预期寿命差异很大，从而不能直接用健康人口所占比例来比较男性人口和女性人口健康水平，因为男性健康状况好于女性，很大程度上是死亡选择性(12)这里指的是死亡在性别上的选择性。由于同样风险下男性死亡率高于女性，就意味着在男性和女性健康状况同样很差的情况下，男性很多会由于死亡而被淘汰掉；而存活下来的女性仍然处于健康状况很差状态，存活下来的男性健康状况相对女性会更好一些。这是死亡水平的差异直接带来的健康状况的差异，而不是健康状况的原本差异。导致的。因此，一个比较好的办法就是控制死亡水平或平均预期寿命，即用健康预期寿命除以预期寿命，这相当于对预期寿命做了标准化处理，这样得出的结果可以看成是控制了死亡水平后的存活人口群体的健康水平。

(4)用“生命质量指数”[24]反映一个人口群体的生命质量。生命质量指数是用平均预期寿命除以不健康预期寿命所占比例，即e0/(1-e0h/e0)×100。该指标的分子反映的是“是否活得长”，分母反映的是“是否活得健康”。分子越大说明“活得越长”，分母越小说明“活得越健康”，生命质量越高。在该指标的分子和分母同时出现积极作用时其值会迅速提升；若同时出现消极作用时，其值会迅速下降；如果二者一个出现积极作用、另一个出现消极作用，即分子过大(寿命很长)，而分母并不是很小(健康状况并不是很好)，或者分子不是很大(寿命不够长)而分母特别小(健康状况非常好)的情况，此时生命质量指数值并不会出现太大变化。出现这类不一致的情况可以用下面的办法进行分析。

(5)用预期寿命e0和健康预期寿命e0h进行组合分析，来反映是否“既活得长又活得健康”。反映死亡水平的指标平均预期寿命测量的是生命的长度或生命的“数量”，而健康预期寿命反映的是生命的“质量”，(13)严格来说，这里的“质量”是承载了人的健康和死亡两类因素，而不单单是健康。那么用两个指标的结合来判断一个人口群体是否“既活得长又活得健康”，“活得长但活得不健康”，“活得不长但活得比较健康”，或者“既活得不长也活得不健康”。

利用健康预期寿命来分析人口群体健康水平主要有两个角度：一是针对同一地区分析不同时间上人口健康预期寿命的变化；二是在同一时间上针对不同地区或不同特征人群分析健康预期寿命的差异。

如果将同一地区两个或多个时间点上人口群体的健康预期寿命进行比较，会出现很多可能的情况：健康预期寿命提高的速度快于预期寿命提高的速度，从而导致不健康寿命被压缩，这被称为疾病(14)这里面的几个假设原本针对的是疾病，这里我们将其拓展到健康，这里的健康可以是任何内容，包括疾病、残疾、活动受限、失能等。可以把这里的“疾病”一词理解为“不健康”。压缩假设[25-28]；健康预期寿命提高的速度慢于预期寿命提高的速度，导致不健康寿命被拓展，这被称为疾病拓展假设[29-31]；健康预期寿命和预期寿命同时都在提高，但二者的差值不变，这被称为动态平衡假设[32]。除此之外，多次观测后疾病压缩和疾病拓展可能会交替出现，或者疾病与失能之间、失能和死亡之间出现不同方向和不同程度的变化，等等。

有人可能会认为，若结果显示为疾病拓展就意味着人口健康状况存在问题，若显示疾病压缩就说明人口健康状况有明显改善，这样简单地理解并不合适。因为无论是疾病拓展还是疾病压缩，很可能预期寿命和健康预期寿命同时都在延长，或者死亡率下降和健康状况改善同时发生，这是一种好现象，是预期寿命增长幅度与健康预期寿命增长幅度二者之间存在差异导致的结果。相反，疾病压缩现象可能是因为健康预期寿命提高了但预期寿命并没有提高，甚至还有可能是健康预期寿命没有变化而预期寿命下降导致的，这才真正是出现了问题。

因此，在分析人口群体健康水平时，首先要单独看健康预期寿命和预期寿命的变化，即现在与过去比健康预期寿命和预期寿命的绝对数是增加了还是减少了，如果二者同时增加，意味着寿命和健康同时都有所改善，是一种好现象；若二者有一个是下降的，则意味着人口健康存在问题。其次要看健康预期寿命和预期寿命绝对数增加或减少的程度，增加的幅度越大，意味着人口群体健康水平提高的幅度也越大。最后还要看健康预期寿命和预期寿命的相对变化，就是在预期寿命相同情况下，健康预期寿命是增加了还是减少了。这相当于在控制死亡因素影响下来看存活人口的健康状况，这就是健康预期寿命占预期寿命的比例，即将人的期望生命长度标准化为1时，看健康生存时间的长度，此时的疾病压缩意味着不健康期的相对比例在缩小，即人活得更健康。如果这一比例长期或快速下降，即使是健康预期寿命和预期寿命都在增加，无论是对个人、对家庭，还是对社会都不是一个好预兆。

分析的第二个视角是针对同一时间上不同地区或不同特征人群健康预期寿命差异的比较。这里首先要识别区域间和区域内的差异，其次是找到导致差异的原因，最后要识别和区分这些原因中哪些是客观原因、哪些是主观原因。这里的客观原因指的是通过健康中国战略不能直接改变的原因，比如人口结构、受教育状况、经济发展水平等；主观原因是指那些可以通过健康中国战略进行调整和改变的原因，比如健康教育、健康促进、卫生服务条件、服务可及性等。另外，还要识别不同特征人口群体健康状况的差异，比如不同性别人群的健康差异、不同受教育状况人群的健康差异、本地人和外地人的健康差异、不同职业人群的健康差异等，同样需要找到引起差异的原因，以及区别客观原因和主观原因。

总之，针对人口群体健康水平变化和差异的测量、计算和分析，并不是仅仅为了描述状况，更重要的是要找到引起变化和产生差异的影响因素，找到存在问题的原因，为有针对性地出台应对政策或构建制度提供证据支持，使中国人口健康水平得到更快的提升。