时间:2024-06-19
邱 东
(北京师范大学 国民核算研究院,北京100875)
2019 年年初,美国罗格斯大学经济学杰出教授(Distinguished Professor)H. 罗考夫(Hugh Rockoff,NBER 研究员)[1]在《经济展望杂志》(Journal of Economic Perspectives)发表了关于美国经济统计历史的论文。
笔者认为,从国民福利的视角出发,经济统计通常包括价格、生产与国民收入、失业三大基本内容。H.罗考夫的论文紧扣这三个方面,特别是将美国经济统计放在社会经济分化过程的大背景中,阐述社会矛盾和对政府政策的激烈争辩如何引发经济统计的产生和发展。H.罗考夫不只是将经济统计看成数字和计量,而是注重确立社会经济指标背后的缘由和依据。
本文意在解读H.罗考夫论文的重点,给出笔者所概括的视角,并就当代经济统计学的发展给出评论和意见。全文分为两大部分六个小节,先用前三节分别概述美国的价格统计、收入与生产统计和失业统计的历史沿革,指出其中值得特别关注的问题;第四节由H. 罗考夫的学说史论文引发话题——欧美国家经济统计学研究的存在性;第五节揭示经济现实隐含的对经济统计学的传统挑战;第六节概括提出H. 罗考夫论文对中国经济统计实践和经济统计学学科的启示。
1860 年代,美国内战期间,财长(Secretary of the Treasury)S.蔡斯(Salmon Chase)公布了价格平均数。数据表明,战争期间价格在北方近乎加倍,但并没有民间传言的那么高,以回应对政府财政政策的批评。这可以看作美国的第一个价格指数。①
美国价格统计至今已有近160 年。从三大经济统计开创的时间看,价格统计比生产与国民收入统计晚了13 年,但比失业统计早了18 年。需要强调的是,三个不同经济统计领域的开发与美国经济发展进程相匹配。经济统计属于社会基础结构,这种公共产品的需求拓展和供给提升是一个国家走向发达的标志之一。
1884 年,美国劳工局(The US Bureau of Labor)作为从事与劳工有关统计的机构成立,总统选择C.怀特(Carroll D. Wright)担任首任局长。此前他在马萨诸塞州担任劳工统计局局长,他的统计业绩和专业声誉被争端各方所认可,是美国经济统计开创和发展中的一位关键人物。专门机构的建立是美国建立现代价格统计的关键一步,从开发时间上看,发达州的州政府先于联邦政府进行劳工统计。
20 世纪90 年代,劳工局在联邦政府价格统计的专门委员会——“奥德里奇委员会”(The Aldrich Committee)②指令下制定了工资和价格指数。“奥德里奇委员会”成立的动机是:当时劳工组织断言,劳工的实际工资下降,原因是由于政府关税造成了价格上涨。要准确地回应这种社会诉求,就需要综合性的价格统计作为“无污染的数据来源”,于是专门开发了价格统计。
美国宾州大学统计学教授R. 福克纳(Roland Falkner)组织了一个研究小组,作为“奥德里奇委员会”的工作基础。这个小组收集了52 393 个价格观察值,③进而编制了1860 年至1891 年的批发和零售价格指数。他们以“常规居民户”④的支出为价格数据确权,并以分行业工人数为工资序列确权。
“奥德里奇委员会”报告回应了劳工的断言,价格确实因关税而上涨,但从更长时期看,劳工也分享到了经济繁荣的成果。R.福克纳小组的实证研究为该报告提供了数据解读和方法论支撑。“奥德里奇委员会”的工作引致了劳工局进一步的价格研究。从1902 年起,劳工局开始连续编制批发和零售价格指数,构成了价格数据的时间序列,这意味着经济统计从专项调查发展为常规统计,一种专业化进展,是社会基础结构建设中质的提升。
“奥德里奇委员会”报告得到了经济学家的充分利用,用以研究当时社会的关键事项,也就是各种与价格相关联的经济关系,比如货币水平(通货膨胀还是通货紧缩)、货币发行制度(金本位制还是金银本位制)、国民债务、利率等。
19 世纪50 年代,黄金大发现和内战时的美元印发导致通货膨胀,而当更多的国家加入金本位制,同时却无法找到大量的新黄金供应,又转换为通货紧缩,引发了激烈的政治辩论。民粹派认定,通货紧缩给农村债务人造成了伤害——不公平的负担,他们呼吁采用金银复本位制,那样会导致通货膨胀,以减轻农夫债务的实际价值。这种主张有根据吗?一些经济学家的争辩是:通货紧缩持续了几十年,一旦它被预期,就倾向于降低名义利率,对在通货紧缩被预期后签署抵押贷款的农夫而言,声称他们受到金本位制的伤害并不成立。而且,在转向金银复本位制后,新的抵押贷款利率将反映出较高的通货膨胀预期。
著名经济学家欧文·费雪(Irving Fisher)⑤参加了论战,1896 年他发表了《增值与利息》(Appreciation and Interest)——经济学说史上最有影响力的论文之一。I.费雪探讨了通货紧缩与利率之间的关系,并不是他首次提出名义利率调节反映预期的价格变化,但费雪提供了第一个透彻的理论和实证研究。I.费雪检验了大量数据,包括W.杰文斯(William Stanley Jevons)的英国数据和“奥德里奇委员会”的美国数据。I.费雪发现,通货紧缩时期当利率下降时,调节是缓慢的,这样实际上借贷者受到了通货紧缩的伤害。他也得出结论:当价格下降趋势被充分理解时,多数“未偿还贷款”(outstanding loans)同时也被收缩,从而并不存在需要被通货膨胀校正的不公正。
I. 费雪还专门开发了计算价格指数的最佳方法。他系统地检阅了W.杰文斯等学者提出的种种指数,将之置于系列检验之下加以比较。当时比较关注“权基问题”——“拉氏指数”(Etienne Laspeyres),采用基年加权。其结果通常不同于“派氏指数”(Hermann Paasche)的报告期加权,经济学大师马歇尔(Alfred Marshall)在1887 年提出了“链式加权法”(the Chain-Weighted approach),但是当权数连续数据缺失时就需要补充处理。I.费雪的著名结论是,拉氏指数与派氏指数的几何平均是理想指数。从学科视角看,I. 费雪的指数系统研究属于经济统计学的内生研究[2]。
1902 年,“无烟煤矿罢工事件”造成了美国东部城市的寒冬困难,T.罗斯福总统反复协调,最后成立了专门委员会,以平衡矿工和矿主的不同利益述求,而食品价格数据成为重要工具,用来反映生活成本究竟是否增加。委员会成员C.怀特主持了矿区食品价格调查并加工整理,用以确定工资的合理涨幅。这开创了一个先例,政府用价格信息确定工资控制政策,以协调罢工的结束。以无烟煤矿罢工这一特殊事件作为契机,引发了一个广为社会接受的观念:工资应该随着生活成本的上涨而增加,而官方发布的食品零售价格指数则应作为调整工资合理涨幅的工具。
一战期间,大学教授I·费雪与劳工事务助理国务卿L.波斯特(Louis F. Post)就工资调整幅度发生了争论,这一矛盾导致劳工统计局⑥建立更具综合性的指数(食品价格指数显然不足以作为调整基础)。应“船舶建造劳工协调委员会”(The Ship Building Labor Adjustment Board)的要求,先是在船舶工业领域建立“生活成本指数”(The Cost of Living Index),1918 年再扩展到全部劳工,人员范围的扩展是顺应“全国战时劳工委员会”(The National War Labor Board)的要求。然而,20 世纪20 年代经济繁荣,生活成本指数相应地淡出经济统计中心工作,国民收入和就业统计更为重要。由此可见,社会对经济统计重心的把握与经济波动相关。
二次世界大战期间,通胀回潮和工资价格控制再度导致对生活成本指数的重视。美国劳联(The AFI)领袖G.米尼(George Meany)质疑劳工统计局(BLS)指数,认定它低估了生活成本的增加,故而该调整因子损害了劳工利益。对价格数据的批判导致“总统生活成本委员会”(The President's Committee on the Cost of Living)的成立,这是一个“三方委员会”(a tripartite committee),包括了劳方、资方和政府三方代表。通过多方协调机制,以提升价格统计的公正性。政府不仅需要提供公共产品,还需要建立其质量提升的保障机制。
1944 年初劳方提出,从1941 年到1943 年生活成本指数的真实增长并不是23.5%,而应该比官方公布的指数多出20 个百分点。导致这一错误的原因在于官方指数遗漏了若干生活成本,主要有以下9项:(1)家务工人的短缺;(2)去战时生产中心工作的交通成本;(3)更高的税收;(4)质量恶化;(5)黑市;(6)新耐用消费品生产的中断;(7)配给制;(8)销售的取消;(9)强制性的贸易提升(forced up-trading)。⑦
劳方对劳工统计局指数的批判导致“无党派统计专家委员会”(A Nonpartisan Committee of Experts) 的建立。领衔的是W. 米契尔(Wesley Mitchell),参与的有S.库兹涅茨(Simon Kuznets)和M.雷德(Margaret Reid)。该委员会对经济测度争议问题做出“专业裁决”,并将“生活成本指数”(Cost of Living Index)改名为“消费者价格指数”(Consumer Price Index)。经济统计专家出面协调,既是解决现实社会矛盾的出路,也是经济统计方法论专业化提升的表现。
第二次世界大战之后,“工资合约中的增加条款”(escalation clauses in contracts)成为该指数应用的重心。劳方和资方就工资进行艰苦的谈判,双方都强调价格数据的不足,劳方认为指数因缺项(如税收)而低估价格水平,资方认定指数没有充分计量质量提升因素。数据矛盾导致“价格统计委员会”(The Price Statistics Commission)组建,该委员会由“局外专家”(a group of outside experts)组成,⑧经济学家G.斯蒂格勒(George Stigler)担任主席,通常被称为“斯蒂格勒委员会”(The Stigler Commission)。美国政府实施宏观管理,对委员会方式情有独钟,先是三方协调,再是借用无党派专家或局外专家,新型委员会的建立是公共产品质量保障机制的深化和拓展。
H.罗考夫的论文主要论述了该委员会的两项主要工作,一个是如何考量税收对价格的影响,另一个是质量改进对生活成本的影响。斯蒂格勒委员会就工作改进提出了三点建议:(1)建立常规的权数修正程序;(2)在样本系列中及时列出新产品;(3)建立研究小组,开发与质量改进过程相适应的调整方法。该委员会的“成员论文”(staff paper)——“格瑞里茨报告”(Griliches Report)1961 年发表,Z·格瑞里茨(Zvi Griliches)开创了“价格特征”法(Hedonic Method),该办法沿用和发展至今。H·罗考夫的学说史论文让我们明确了该方法的缘起。
美国最早的国民收入估计在1843 年,至今近180 年,但比英国晚了180 多年。在经济统计三大内容中,比价格统计早17 年,比失业统计早35 年。
我们先以核心人物为线索来看收入和生产统计发展。19 世纪中期,G.图克(George Tucker)(1843)和E.西门(Ezra Seaman)(1846)进行了美国国民收入的早期估计。20 世纪早期,S.聂云(Scott Nearing)(1915)和W.金(Wilford Isbel King)(1915)公布了对国民收入和财富分配的数量研究。20 世纪20 年代开创了NBER,由W.米契尔(Wesley Clair Mitchel)领衔,团队参与者有W. 金(King)、F·麦考雷(Frederick R.Macaulay)和O.克瑙斯(Oswald W·Knauth),由NGO而非个人进行国民收入估计。20 世纪30 年代则主要是S.库兹涅茨(Simon Kuznets)主持官方的国民收入测度工作。
再以机构为线索来看美国生产与国民收入统计。1843 年至1899 年由学者个人非连续地进行国民收入估计。1899 年组建经济研究局(Bureau of Economic Research),这是专门估计国民收入的最早NGO 组织。1917 年“国民收入分配委员会”(The committee of the distribution of Income)组建,奠定了后来NBER 的基础。1920 年正式组建“国民经济研究局”(The National Bureau of Economic Research,NBER)。1933 年美国参议院通过决议,由商务部接管国民收入估计工作。概括而言,1843 年至1933 年的90 年间,美国国民收入由私人或NGO 估计,尔后近90 年由政府接管成为常规政府统计的核心内容。
最早的国民收入估计基于普查数据,主要针对当时重要的政治事务。1937—1939 年经济不景气,一些州发生债务拖欠,G.图克做了州级水平的国民收入估计,认定这些州有足够的手段偿还债务。1850 年普查数据公布后,G.图克和E.西门重估了国民收入,重心在于南北两方的相对经济力量,就应对蓄奴制危机而言,这些财力信息相当重要。
19 世纪与20 世纪之交,国民收入估计数据定期公布,这主要源于收入分配的论争。S.聂云和W.金有关收入和财富分配的量化研究揭示了美国的高度不平等。W.金利用普查数据和马萨诸塞州、威斯康星州遗产税数据构建了财富洛伦茨曲线,表明美国的不平等水平尚低于欧洲工业化国家。国民收入统计采用国际比较的视野,服务于国家发展和国际竞争策略的制定和修订。
S.聂云和W.金按照生产要素估计其国民收入份额。W.金发现地租份额相对稳定,否定了地主掠取国民收入越来越大份额的断言,而且地租份额在1910 年很难覆盖政府支出,故而H.乔治提出的单一对土地征税并不可行。W.金还发现工资和薪水份额大幅下降,从1890 年的53.5%到1910 年的46.9%。这些数据印证了劳工的断言:劳动被资本剥夺,情形在恶化。但是,W.金认为劳动份额下降的主要原因在于自有土地的消失和低效率移民的涌入。
W.金还计算了“雇员平均实际工资”(the real wage per employee)。他发现,从1870 年到1900 年该指标增长令人满意,但从1900 年到1910 年却下降了2.5%,原因并不是民众所敌视的“大亨强盗”(robber barons),而是新移民。
从历史沿革可知,在二次世界大战以前,美国国民收入统计重心在“民”而不在“国”,“个人收入”(personal income)是国民收入统计的核心指标。对工业化国家而言,雇员工资是测度个人收入的主要内容,所以其实际水平和平均水平受到重视。
1918 年,I.费雪在美国经济学会(The American Economic Association)的主席致辞中引用W.金等人的统计数据描述了工人阶级的悲惨状况,他呼吁实施更严格的继承法,呼吁国家更多地资助和经营产业以减少不平等。“一战”中联邦政府的扩张,证明了政府在经济运作中比私人产业更具效率和平等性。当时美国社会主义潮流盛行,作为经济学家的费雪也提出了相应的社会主张。I. 费雪还呼吁资助超越个人的经济研究,当时美国社会对建立基于客观事实(objective facts)的经济研究团队也颇为热心,W.米契尔出任主席的国民经济研究局(NBER)应运而生。
W.米契尔团队(NBER)的第一个系统性成果是两卷本(近600 页)的《美国收入、数量和分配,1909—1919》,1921 年发表。该研究巧妙地应用了循环流量来估计国民收入,W.金基于最终产品支出的角度(the payments-for-final-products side),而O.克瑙斯则基于生产性服务支出的角度(the paymentsfor-productive-services side),对数据进行了双重审验(double-checking),二者结果相当接近。⑨该研究确认并试图处理国民收入估计中遗留下来的一些争议问题,比如家庭无酬劳动,据估计1918 年其估值可能达到几百万美元。可见,GDP 是否纳入“家庭主妇产值”,这是一个百年争议难题。
不平等问题在概要卷中倒数第二章专门论述,该章审视了收入按生产要素分配的估计,估计了年收入低于2 000 美元的人口比重。基于收入税返还数据,F. 麦考雷估计了1918 年美国收入的个人分配,最富有的1%人口占据14%,最富有10%的人口占据35%,不平等状况明显。可见,“人口比重与财富比重的对比”似乎近年来比较流行,其实是一个传统经济统计方法(“比率之比率”),只要社会分配问题凸显,这一方法就会被采用,该指标数据就受到重视。
尽管NBER 的原则是“反映事实”(just-thefacts),W.米契尔却认为经济统计还可以“做更多的事情”(do even more)。有了更好的数据,比如“领先指标”(leading indicators),采取相应的政策措施,商业周期波动就可能被减缓。对快速变动的经济形势而言,如果指标发布滞后,其价值就有限。
作为W.米契尔的学生,S.库兹涅茨(Simon Kuznets)并不是国民收入概念及其测度的首创者,但在这个领域他至少有以下四个方面的创造性贡献:(1)各种不同来源的数据如何结合,以得出有说服力的估计;(2)探讨对测度造成困难的各种经济和哲学事项;(3)展示基于估计的有关经济发展的重要问题;(4)对一代经济学家作为“学者型导师”(scholarteacher)典范的作用。前两项凸显了库兹涅茨作为经济统计学大师的专业贡献,值得引起我们足够的重视。⑩
20 世纪30 年代初的美国经济大萧条需要政府采取对策,国会要求商务部提供国民收入估计,作为政府把握“经济主动权”(economic initiatives)的数据基础。S.库兹涅茨受雇于商务部从事第一次国民收入的官方估计,1934 年提交了报告,F.罗斯福总统在向国会提交补充预算时引用了S.库兹涅茨的数据。
二战中,S.库兹涅茨参加了战时生产委员会,他和学生R.南森(Robert Nathan)对“战争与海军部”(The War and Navy Department)的支出计划进行了“可行性争辩”(the feasibility debate),促使军品与民品间生产与供应的平衡。对美国军需品项目的最终成功做出了重要贡献,提升了经济学家的声誉,这是经济统计方法在现实中应用的一个典范。
S.库兹涅茨深度关切“国民生产净值”(net national product)及其相关指标作为福利测度(measures of welfare)概念的局限性。他认识到,采用成本法(measured by costs)测度教育和健康并不合适,并就其偏误对国民生产净值的影响做了推测性估计(speculative estimates)。S.库兹涅茨还专门深入探讨了“军事支出”(Military Spending)观念,这是国民收入估计中的一个重要争议问题,不同时期(战时与平时)、不同社会组织形态下的测度处理可能不同,持不同观点的经济学家各有其依据。拓展而言,这项测度也就是“遗憾性支出”(regrettable expenditure)问题,⑪时至今日,经济学界(包括经济统计界)仍然没有达成共识。
美国第一个系统的失业调查1878 年由马萨诸塞州劳工统计局进行,C.怀特(Carroll D. Wright)领导,至今已有141 年历史。失业统计在三大经济统计中开发相对较晚,比收入和生产统计晚了35 年,比价格统计晚了18 年。这是由于美国当时处于工业革命的上升期,总体上对劳动力需求旺盛,只是由于经济波动和移民冲击,才造成间或的失业现象,引发社会对失业问题的重视。
从调查机构看,失业统计从一开始就是政府统计出面进行,从事失业统计的政府部门主要包括劳工统计局(Bureau of the Statistics of Labor)、政府普查机构(The Census Bureau)、移民归化局信息处(The Division of Information in the Bureau of Immigration and Naturalization)、美国就业服务机构(The US Employment Service)、失业统计委员会(The Committee on Unemployment Statistics,又名The Hoover Commission 胡佛委员会)、工作项目管理机构(The Department of Labor's American Job Centers)等。后来,作为非政府组织(NGO)的“国民经济研究局”(NBER)也编制失业指数。
经济学家在失业统计上的主要工作是问卷设计(designing questionnaires) 和 取 样 程 序(sampling procedures),缺欠的是经济理论思考不够。虽然与价格统计、收入统计同样起源于政治论争,但如同D.卡德(David Card)2011 年所说(由H.罗考夫在其论文中转述),失业统计多少属于一种“没有理论的测度”(measurement without theory)。
失业统计源于“1873 年恐慌”(The Panic of 1873)造成的萧条及失业现象,联邦政府需要知道失去工作的人数,当时主要是向地方政府机构调查,但这种调查只能基于“谁真正需要工作”(who really want work),即强调“主动寻求工作的人”(people actively seeking work),现在失业人口定义的三要素之一。显然这种失业人口少于实际需要工作的人,因为没有包括“求职受挫者”(discouraged workers),这个问题从头至今一直是高度受瞩目的政治辩题。
从1880 年到1910 年,失业问题一直包含在人口普查问卷中。第一次世界大战引发了金融恐慌和经济紧缩,十年一次的普查对失业调查而言频率显然不足。劳工统计局先与纽约市政府机构合作,得到纽约失业状况,又与“都市生命保险公司”(Metropolitan Life Insurance Company)合作,向行业决策者调查,结果显示失业率增加,数据高低与雇主用工策略⑫和移民涌入有关。对本土劳工而言,移民不仅压低了工资,还是罢工的破坏者。
1920 年的普查竟然没有包括失业问题,其后恰好遭遇美国V 型经济紧缩,W. 哈丁总统(Warren Gamaliel Harding)专门安排了失业问题讨论会(a conference on unemployment)。除了劳工统计局外,“美国就业服务机构”(The US Employment Service)也提供了失业数据。尽管是政府从事失业统计,也存在“一数多门”问题,于是就出现了以哪个部门的数据为准的选择问题。这是数据可信度在社会维度而非数量维度上的表现。
协调劳工和雇主的就业服务机构源自欧洲的政府治理传统,俄亥俄州率先引入这一机制,于是在美国被称为“俄亥俄主意”(The Ohio idea),欧洲产品被贴上了美国标签,尔后联邦政府建立了全国性机构。见贤思齐,或不为偷窃?该机构的一个主导思想是将东海岸都市的就业压力引向农业地区。“美国就业服务机构”的调查基于地方政府部门、雇主组织和劳工组织等多种来源,而劳工统计局的数据来源则较少。
美国失业统计的主要论争集中在三个方面。
1.就业形势的判断。除了“美国就业服务机构”数据与劳工统计局的差异,比较著名的还有“胡佛与珀金斯之争”。时任总统H. 胡佛(Herbert Clark Hoover)对就业形势比较乐观,而F.珀金斯(Frances Perkins)女士是纽约州政府产业委员会委员,她以纽约州数据和BLS 的月度数据为依据质疑了总统的判断。就业水平的估计与政府职责及其应对干预力度密切相关。
2.调查频率的确立。F.珀金斯认为,H.胡佛总统误判的原因在于数据的样本代表性偏差,这是由调查频率过高造成的。那么,调查究竟以多长时间为佳?当时争论主要是周数据(weekly figures)还是月频率(a monthly frequency),时间频率高往往导致能够提供基础数据的样本少,从而失去代表性。⑬1940年开始,美国“工作岗位项目管理机构”(the Works Projects Administration)开始常规失业调查。1942 年该机构终结后,调查任务移交给普查局(the Census Bureau),1959 年又移交给劳工统计局(BLS)。二战结 束 后,“ 月 度 失 业 率”(The monthly rate of unemployment)成为备受关注的统计量。
3.调查对象范围的确立。关键问题即是否包括“求职受挫者”(discouraged workers),这个难题在怀特进行第一次失业调查(1878 年)时就存在,至今仍然困扰着我们。本文第5 节将对此展开讨论。
H.罗考夫的这篇论文发表于2019 年初《经济展望杂志》,作为经济学的顶级期刊,它可以作为一个典型的例证,表明欧美国家存在经济统计学的研究。
国内有人臆造了一种说法,欧美大学里没有经济统计学,所谓经济统计学是苏联时代的东西,这样就把中国搞经济统计学的学者当成了计划经济的余孽,也就失去了参与学术研究的资格,少数把持学术资源者以此说法作为依据,扼杀中国经济统计学研究的存在。⑭其实,这种说法很容易证伪,笔者在几篇论文中曾列举了不少反例,H.罗考夫的这篇论文再次证伪了这种说法。
对于严肃的科学研究而言,参考文献构成了论文议题的前期研究成果的信息系统,是非常珍贵的。注重对论文参考文献的追踪,是深入开展该议题研究的优化路径。⑮H.罗考夫的论文列举了61 篇参考文献,其中与经济统计学直接相关的就有近20 篇[3-19],内容包括股票价格指数、失业率、生产者价格指数、GDP 史、美国政府统计、货币价值变动测度、工资统计、指数编制与应用、劳动统计、特征价格指数法、生产率趋势、国民账户发展、联邦政府价格统计、生活成本总统委员会技术报告、价格指数与一般交换价值回溯等。这些论文发表的刊物有《经济展望杂志》、《美国经济评论》、《政治经济学史》等,著作的出版社有剑桥大学出版社、普林斯顿大学出版社、麦克米兰公司、芝加哥大学出版社等。
顺着H.罗考夫论文的这条线索,可以发现,经济统计学论文是《经济展望杂志》的重要选刊内容之一,比如2019 年除了H.罗考夫的论文,接着就刊登了R.扎明的《为进化经济而进化测度——21 世纪美国经济统计构想》[20]。在2017 年,该刊还发表过三篇论文[21-23],即《理解GDP、个人收入和生产率的实际增长》、《用误测解释美国生产率下降的挑战》和《基于现场视角——政府统计如何调整数字技术时代来自质量变化和新产品的潜在偏差》。2016 年《经济展望杂志》发表了《十亿价格数据项目:用线上价格进行测度和研究》[24]一文。
进入21 世纪,法国时任总统萨科齐(N.Sarkozy)聘请斯蒂格里茨(J E Stiglitz)、森(A Sen)和菲图西(J P Fitoussi)领衔组建了“经济表现和社会进步测度委员会”。2009 年,该委员会的专题报告《误测我们的生活——为什么GDP 无法达成》(笔者简称之为“SSF 测度报告”)发表。⑯
2014 年由斯蒂格里茨、菲图西和杜兰德领衔建立了“经济绩效和社会进步测度高级专家组”(High Level Group on the Measurement of Economic Performance and Social Progress)。2018 年由OECD出版了新的经济测度报告(笔者间称之为“SFD 测度报告”)[25,26],分为两部:《超越GDP——测度经济社会绩效所值》(主席卷)和《为更好测度——拓展研究超越GDP 的福利指标》(专家卷)。
从经济学文献的称呼上也可以看到这个特殊学科的存在:“国民统计学家”(The national statistician)、“测度经济学家”(measurement economist)、“国民账户统计”(national accounts statistics)。⑰伦敦城市大学2011 年的一篇经济学博士论文——本杰明·密特拉-卡恩《经济的再定义:经济一词是如何在1620 年创造并重新定义的》[27],对整个经济及其测度的历史演变过程有深入和独特的论述。
在外行眼里,经济统计按照国际组织制定的标准做就可以了,不需要什么专业学问加以研究,似乎经济统计不再需要学术思考了。也有的学者从新经济和经济全球化等角度提出了经济统计面临的新挑战,似乎过去的问题都已经得到解决。其实,如果真正从历史的和动态的视角来审视,就会发现,经济统计学面临的传统挑战并不少,有的被搁置了,有的甚至尚未被我们意识到。此外,统计要为解决不确定性提供帮助,但经济统计更多地面临着哪一种不确定性?这也需要全方位的思考。
H.罗考夫的论文同时也揭示了美国经济统计研究的不足。为什么失业统计很大程度上没有理论支撑(Measurement without Theory)?经济学家的理论思考在失业统计上比较少,难道是没有值得思考的学术问题?H.罗考夫认为,经济统计并没有达成对其的最高期望,即对经济危机提供预警信息系统。尽管收集整理了大量数据,但经济统计并不能终结对社会问题的政治论争,就像地震学家一样,无法保证准确地指出地震发生的时间与空间的确切范围。
在经济统计研究的存量“账户”上,既可以看到巨额软资产(优秀成果),也应该意识到大量隐性负债(未决问题)。从某种意义看,经济统计学说史也是一部专业学术研究的负债史。
H.罗考夫在其文中指出了若干百年争议问题:无酬家庭劳动是否应该计入产值?军事支出项目究竟如何处理?失业统计中的“求职受挫者”(discouraged workers)到底算不算失业者?如此等等。
如果说经济统计是一种“社会基础结构”(social infrastructure),那么中国还处于发展的初级阶段,人们对于实物基础结构更为重视,强调的是所谓“要致富先修路”,大量建设高速公路和高铁。即便重视信息高速公路,也是满眼的数字,而非数据,对数字的社会经济内涵缺乏认知。甚至一些著名经济学者都欠缺经济统计素质,著述和演讲中露怯的事例不少。相当多的经济数据使用者,对经济指标的理解有所偏颇,从高层领导到普通群众,能免者寡。
在经济学庞大的学科体系中,经济统计学虽然不可或缺,但在经历了30 年黄金年代(大致在1950-1970)之后,只是一种边缘化存在。当然,发达国家和国际组织公布了很多经济统计方法手册,但我们对经济统计方法论的高层次思考还不够。对遗留下来的指标争议问题,好多人往往采取一种若无其事或不了了之的态度,对经济统计方法论问题缺少“第一性原理”(First Principle)思考。按说,首先应该确定并定义清楚当前的假设,将问题分解为基本原则,但这种经济统计学研究还相当稀缺。概括而言,学科的自觉意识不强,经济统计学在经济学学科群中只是一种弱存在。
相比经济统计数据,经济统计方法论是更为稀缺的公共产品。只靠少数独立学者的研究兴趣和专业自律是远远不够的。还存在(显在和隐含)不少学术问题需要深入和拓展研究,学科研究的层次也需要提升。在《经济统计学:从德国传统到当代困境》[28]中,笔者提出经济统计学研究的三个层次,中高级层次的研究尤其缺乏。很多人都在做实证分析,用了不少指标和数据,却并不知道其由来,不知其所以然。
许多人在思考当今经济统计面临的挑战时,往往只注重新技术和新经济给已有核算和测度系统带来的新困扰,实际上,这只是问题的一个方面。真正进行深入的实证研究,现行核算和测度系统还遗留了不少被掩埋的难题,英国宾爵士的经济统计独立报告⑱将这些未决问题归结为“传统挑战”(established challenges)。
不确定性有不同的种类,有的是事件发生与否不确定,还有的事件发生是确定的,但其边界模糊。就社会经济现象而言,后一种不确定性更为普遍。H.罗考夫的论述涉及到了一个典型例子,就是失业人口的统计,可以引发对“模糊不确定问题”的深入思考。
就失业人口的常规统计而言,国际标准已经划定了界线三条件:周工作时间少于一定小时;有谋求职业的意愿;具备工作能力。看似简单明晰,实际上,失业人口并不是一个独立指标,⑲与其他社会经济指标存在着千丝万缕的联系,在测度时,特别是在分析该指标时,需要更为周全的指标方法论思考。
(1)考察失业状况同时应该关注“不充分就业”(underemployment),特别在就业作为政府四大调控目标时,尤其需要注意这个问题,而不单单是“谋职受挫者”(discouraged workers)问题。该项研究中需要注意的是:兼职引起的竞争造成岗位减少,“全职工作者”(full time worker)也易于“兼职工作者”(part time worker)相混同,还容易与自谋职业者交叉。如果“不充分就业”程度提升,即便失业率下降,就业形势也可能恶化。
(2)“劳动适龄人口”用同一年龄作为统一界线是否合适?⑳若不是统一界线,不同国家的数据可比性如何?用年龄作为界线标识的利弊同在,然而它是失业人口的“母指标”,需要做指标基础研究。
(3)就业人口中“求职者”与“自谋职业者”比例的演变,需要研究市场经济发达程度和政府调控程度与该比例的关系。
(4)自谋职业者,包括开店、房屋出租、炒股、炒汇、炒黄金、炒房、服务出售者等,新经济现象会引发新的职业。自谋职业者与地下经济从业者的交叉问题,容易涉及两类地下经济:合法但不公开;非法活动。相关联的经济问题在于,非法活动的收入可以合法使用,合法工作收入也可以非法地使用,有时二者交叉难以区分,将会影响生产、分配和使用三方等价。
(5)“不谋职业者”包括“谋职受挫者”和“不愿谋职者”(如富贵二代、网虫、乞丐等),二者都会影响家人的福利水平,也会影响社会就业岗位创造的规划。
(6)无酬家务劳动问题。GDP 的“保姆笑话”广为流传,实际上隐含着深刻的经济测度悖论。笔者在《经济测度逻辑挖掘——困难与原则》中提出“测度范围协调适度原则”:一种测度的外延变化不应该影响其他测度的核心内容[29]。
(7)工作能力与病人(身体疾病与精神疾病),能力多元与岗位多元,存在多种匹配与错配的可能。如何鉴别能力与疾病的有无,涉及到指标口径和统计范围。
(8)大学生和研究生人数。高校规模与就业需求的消涨关系,高校作为就业需求调节池的社会功能,但高校在发挥社会功能的同时如何保障和提升本科教育水平,值得重视。
上述8 个方面的考虑表明,即便是看上去相当简单的指标口径,算术上只是加减问题,因为社会现象本身的“亦此亦彼性”,也难以断然切割。我们不应该大而化之,忽视隐含的测度困难。严肃的经济实证研究,恐怕需要借鉴模糊学中的“隶属度”思维,或许可以改进我们的经济测度。
美国联邦经济统计产生、发展于19 世纪中晚期、世界大战和大衰退,社会背景是经济社会分化及其对政府政策的激烈论战。
论战各方的共同信念在于:自己的经济见解是基于现实的,应该发展由专家构建的、非政治的和精确的公共统计,而这将有助于支持其所偏好的对策。这种信念体现了一种实事求是的精神,也是美国杜威所概括的实用主义哲学传统的一种表现。
表1 论战内容
笔者认为,这种共同信念是构建经济统计作为社会公共产品的文化基础。
美国经济统计由私人、私有机构、地方政府间或地开发,而常规化发展却是社会的共同需求,故而最后由联邦政府接手。由此,常规经济统计表现为政府统计,由政府实施,用户包括政府自身,却不限于政府,用户是多元的,还包括其他经济主体,如居民户、企业和非政府组织,还有“国外”。美国联邦经济统计的发展历史告诉我们,经济统计属于“社会基础结构”(social infrastructure)的组成部分,是一种特殊的公共产品。
经济统计并不是万能的,客观经济趋势可能超出预期,但是基于较精确数据的预期总好过直觉或无信息基础的权威断言。经济统计数据有助于经济功能的正常发挥,可以提供更为理性的辩论,有了系统的数据基础,对经济状况的极端看法容易露出破绽。
H.罗考夫相信,2008 年金融恐慌后,联邦经济统计为宏观经济政策的制定和成功实施做出了贡献。H.罗考夫还认为,联邦经济统计是关于一般经济气候(the general economic weather)的信息,对私人部门决策具有重要价值,多数私人企业在规划发展时都需要对经济前景的测度。
H.罗考夫在其论文的结论部分指出,联邦统计序列是经济学的主要成就之一,从指标方法到指标方法论离不开经济学的理论指导和总结。美国的国民核算采用的是“国民收入和生产账户体系”(national income and production accounts,NIPAs),这个体系根植于美国国民收入和生产统计,尽管NIPAs 与国际通行的SNA 原则上一致,但显然充分体现了美国国情和经济统计的历史积淀。I.费雪和M.米契尔都对经济指数性质和应用原则做了一般性的研究,这种研究基于各种经济指数的应用实践,从而完成从方法到方法论的提升,所谓“内生”性研究,意即在此。
归纳起来,联邦经济统计发展过程隐含的学理逻辑是“社会问题导向的经济统计方法论”,一种特殊方法论,即:问题(社会矛盾)—数据—经济统计方法—经济统计方法论。
如果切断这个逻辑链,数就没有“据”,数就仅仅是数字,而不是数据。应用就未必相应,应用之“应”是一种学术要求,所谓应,必须与研究对象相应。如果不顾及相应性,那就仅仅是一种“套用”,一种计算题运算,是课堂作业,而不是研究。如果只是套用方法做课堂作业,那顶多就是在数据和方法两个环节打转转,既无法真正进行实证分析,得出相应的决策建议;也无法在学科学理上提升,做出方法论的改进。
还需要注意的是,这个逻辑链条并不是单向的,也不是单轮次可以完成的。社会矛盾提出数据要求,也指导和制约着数据方法的选择。实践中方法应用可以遭遇到各种情形,从而可以总结归纳出一般性的方法原理和原则。有了学理升华的方法可以更好地收集和整理、概括基础数据,也就可以更深入地解释社会矛盾,帮助人们认识问题之所在,找到解决问题的优化办法。经过多轮次从实践到理论和从理论到实践的正向负向反馈,经济统计得以成为不断优化的决策工具。
需要深入思考的是问题是:为什么价格统计由政府劳工局(部)来主持?为什么价格统计、收入与生产统计、失业统计成为美国联邦经济统计的三大内容?显然,从收入或支出角度,这三者与民众利益关联最为紧密,因而才会引发激烈的政治论争,才会导致公共产品的提供,才会有政府统计的产生和发展。
2002 年,笔者提出《谁是政府统计的最后东家》[30],虽然政府统计部门的经费由长官拨付,但这并不意味着统计工作人员端的是长官给的饭碗,真正的东家应该是民众。这涉及到经济统计的重心何在。
美国联邦经济统计的历史表明,三大基本统计都以人的福利为核心,国民收入统计的初衷是经济结构问题——收入和财富如何分配?经济总量只是(本来是)经济结构分析的起点和基础,收入分配统计才是经济统计的初心和重心。
经济总量统计在经济统计中是基础,而不是重心或核心,并不唯一重要。由于人的认知和决策需要去掉不确定性,所以需要一个总量指标、综合指标,甚至“单一数值指标”。总量统计地位提升的另一原因是,相对结构分析而言计算比较容易,人们往往在测度时存在先易后难的取向,这两个因素导致总量指标成为所谓核心指标。媒体为吸引公众的注意力,往往过度渲染总量指标,推波助澜,加深了对经济核心问题所在的误解,即对核心指标的误读。
在二战欧洲重建中,为实施“马歇尔计划”(Marshall Plan),GNP 成为核心指标,总得有指标来衡量计划的执行情况。那些本年度GNP 高的国家能在下一年度得到更多的财力支持,GNP 成为计划考核指标,国民收入指标的重心才由“民”转向了“国”。
到了20 世纪90 年代,由于股票市场的兴起,收入权益更迭太快,确认要素收入难度加大,由于统计指标准确性和时效性的要求,GDP 替代了GNP(GNI),成为宏观经济的所谓核心指标。需要注意的是,这种替代决不意味着GDP 优于GNP,实际上是一种无奈之举。
实际上,经济统计判断止步于或仅仅强调总量指标是很危险的,其负面典型比如突尼斯。在所谓“突尼斯革命”前,欧美对其发展的评价相当乐观,因为突尼斯的人均GDP 在非洲相当高,但突尼斯高层人士和欧美相关人士都忽视了收入分配指标和失业率指标,没有预见到爆发革命的可能性。
在经济统计的指标应用中,我们应该区分“基础指标”和“核心指标”。尤其当经济发展到一定水准之后,GDP 之类的总量指标就越发显示其基础性,核心指标就越应该是结构指标。
读史使人明智。发达国家历史过程的许多因素往往会出现在发展中国家的前行道路上,所以发达国家的经验和教训对发展中国家而言是一笔宝贵的历史财富。同样作为大国,美国联邦经济统计的历史对中国当今的经济统计实践无疑具有重要参考价值。
任何学科(包括自然科学)的升华都需要重视历史沿革,其中思想史或学说史尤为重要。H.罗考夫的论文给出了美国经济统计从社会矛盾(问题)到数据到指标方法再到经济指标方法论研究的逻辑线索,对我们系统理解经济统计及其学说的过去、现实成就及困境和未来走向,具有相当深刻的指导意义。美国经济统计的史实表明,将经济统计仅仅视为数理统计的应用,是一种科学主义偏见。切断经济统计与社会经济问题的内在联系,仅仅搞“课堂作业”式的计量,无法真正达成其历史使命。
当年美国统计学教授(社会科学意义上的统计学,至今欧美国家仍有将统计学归结为社会科学门类的做法)的行为方式,持续收集价格和权重数据,并以英国学者的价格统计研究成果作为专业基础。反观当代经济学者,过于任性,利用假设把不易量化的因素忽略掉,在一个抽象空间进行理论思辨和量化处理。分工也造成分责,学者避重就轻,选择所谓技术含量高的研究项目,轻视基础性的问题,缺乏职业自觉意识。历史的镜子让我们知其高下,学者的职业道德,在急剧变化的社会中尤其值得我们自省。
解读H. 罗考夫论文需要注意的两个问题。其一,该论文只讲述了美国经济统计历史的一部分,从国民收入统计到国民核算的探索,NIPAs 的建立过程,还没有涉及。其二,H.罗考夫的论文不仅仅是美国经济统计史,还是美国政府宏观管理的历史,是美国近现代经济史的一个侧面和不可分割的组成部分。这段历史告诉我们,一般而言,只有政府可以提供常规化的经济统计,所以由个人、非政府组织(NGO)甚至地方政府开创的经济统计,一旦需要常规化进行,就需要由中央政府接手。美国在经济快速发展期,由于存在大量的社会矛盾,引发了经济统计的深入开展,美国政府对其发展采取了积极而又认真的态度,值得我们借鉴。
当前,中国正值发展提升的关键时期,在社会基础结构的建设上应该如何做?经济统计如何发展以作为高质量发展的支撑,值得做系统的战略思考。
注释:
①西方经济统计对指数和平均数并不做严格的区分,比如著名的道·琼斯股票指数就是一个平均数。笔者认为,这样做也有其学理原因,因为从严格意义上看,所谓“绝对数指标”其实是不存在的,任何经济指标都是相对的,都至少隐含着一个经济测度基准,也即都可以看成指数。
②该委员会以共和党参议员Nelson Aldrich 的名字命名,尔后他又在创建美联储中发挥重要作用。笔者认为,“委员会制”是美国联邦政府一种特定的宏观社会经济管理的运作方式,不同部门官员参与,特别是有学者参与,形成一种多方协调机制,是所谓“看不见的手”的重要组成部分。
③H.罗考夫特意强调,从其工作量来看,这就是那个时代的大数据!
④提出任何一个指标基础概念,就需要界定其统计口径和范围,以供操作。这里的“常规居民户”通常不超过5 个孩子,不拥有自己的住房,还包含其他特征。
⑤这位Fisher 是经济统计学大师,还有一位数理统计学大师罗纳德·埃尔默·费歇尔(Ronald Aylmer Fisher),二位同名学者流行的中文译名不同,不知是译者的无意,还是刻意的区分?对经济统计学者而言,只知费歇尔不知费雪便是数典忘祖。
⑥The Bureau of Labor Statistics,BLS,1913 年劳工部成立后,原劳工局改名为劳工统计局。
⑦对“强制性的贸易提升”可做相应的经济学解释。生产商可分为不同的生产系列:有的产品种类低价、低质、利薄、量大;有的产品种类高价、高质、利厚、量小。如果价格受到政府控制,当需求量变大时,容易造成强制性提升的贸易,此种情况下生产商无法提高价格,就倾向于少生产低价品,多生产高价品,结果造成市场中低价品的比重降低,高价品的比重上升,企业与政府的博弈改变贸易条件,居民生活成本被强制性地提升。这是一个现实难题,H.罗考夫告诉我们,美国政府的“价格管理办公室”(The Office of Price Administration)尝试各种办法试图加以解决,但收效甚微。这类事例也说明,经济统计指标分析的复杂性,需要透视数值背后隐藏着的复杂社会关系。
⑧这个“局”指劳工统计局之局。
⑨这是国民经济统计从经济测度(economic measurement)走向国民核算(national accounts)的一种探索。
⑩不过,罗考夫教授文中没有提及一场激烈争论:作为学院派统计学家,库兹涅茨曾与官方经济统计学家就GNP 指标产生了很大的分歧。中国有的人把库兹涅茨称为GDP 之父,其实并不准确。
⑪见邱东《剖析GDP 统计隐含的几个测度困局》,载《经济测度逻辑挖掘——困难与原则》第19-37 页。
⑫“保持门外有40 人等待一个潜在岗位”(keeping 40 men in line outside the gates for every job that might open)。
⑬对经济统计数据,我们往往愿意采取韩信将兵的态度,似乎多多益善,其实数据调查频率并非越高越好,这涉及到笔者所提出的“经济测度得失悖律”,参见邱东:《经济统计学:从德国传统到当代悖境》,载《经济测度逻辑挖掘:困难与测度》,科学出版社2018 年版,第114-128 页。
⑭典型案例就是强行将《统计研究》排斥出所谓A 刊之列。
⑮相反,如果是形式化的研究,其实不过是课堂作业,其参考文献就经不起推敲。所列参考文献往往是拉大旗作虎皮,与文章议题切实相关的内容未必那么多,参考时需要当心,审阅时需要严查。
⑯Joseph E. Stiglitz, A Sen, Jean-Paul Fitoussi(2014), Mismeasuring Our Lives: Why GDP Doesn't Add Up. New York: The New Press. 该报告包括主报告、技术报告和参考资料三个部分。主报告的中文译本参见:斯蒂格里茨J E, 森A, 菲图西J P 等.2011. 对我们生活的误测——为什么GDP 增长不等于社会进步. 阮江平,王海昉译. 北京. 新华出版社(中文版)。较为完整的中文译本参见:斯蒂格里茨J E, 森A, 菲图西J P 等. 2014. 经济表现和社会进步的测度报告. 李冻菊译. 郑州. 郑州大学出版社(中文版). 李冻菊教授的拓展研究参见:李冻菊. 2014. 经济表现和社会进步的测度研究与实证. 北京. 中国人民大学出版社.
⑰同注⑯。
⑱Charles Bean, 2016, Independent Review of UK Economic Statistics.
⑲应用数理统计方法对变量的一个基本要求恰恰是其独立性。
⑳就界线合适与否的要求而言,不同职业不同,不同气温条件不同,不同领域与其寿命水平的国家不同。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!