政治学实验的简化与推广：一种理论检验型准实验的概念设计

时间：2024-04-24

文/张杨宋雄伟

政治学实验的局限

1.主动干预和随机分配两大要素难以同时满足

实验研究与其他非实验研究最大的区别在于基础数据的生成方式。非实验的研究方法不需要控制基础数据的生成，这类自然生成的数据被称为观测数据。而实验研究要求研究者系统地干预数据生成过程，这类在人为干预下生成的数据，被称为实验数据。

目前政治学范畴中的实验研究，通常被分为三种类型：实验室实验、田野实验、调研实验。实验室实验最能充分体现实验研究的主动干预要素。研究者能够相对自由地设计并人工合成变量，或者人为隔离干扰变量。田野实验则在真实世界中进行，通常不额外设置边界条件和限制。但是实验者对受试对象的干预的手段、方向，都受到了限制。调研实验充分强化了随机分配要素，通过低成本的问卷，建立足够规模的受试者群体，并间接干预和控制受试者的行为，但干预的力度更弱。

本研究认为，有效的主动干预和科学的随机分配，是政治学实验能够产生出高质量基础数据的两大核心要素。上述三种基本的实验类型，可以根据对这两种要素的偏重进行分类，如下表所示：

性能上，上述三种实验类型各有利弊。究其根本原因，是研究者难以同时保证科学随机分配和有效的主动干预两大要素，并由此在一定程度上产生了实验研究方法本身的性能局限。

2.政治学实验存在学术伦理局限

政治学的实验研究法，有时难以避免面临伦理道德的问题：人类是否可以用来做实验。米格拉姆电击实验，以及斯坦福监狱实验，都被认为是学术伦理的反面教材。政治学的实验虽然通常不会存在生理上的伤害，但是欺骗是常见的。盖勒界定了研究中采用的三种欺骗类型：隐式欺骗，技术欺骗以及角色欺骗。在实验政治学发展较好的美国，很多高校和医疗机构都设置有机构审查管理委员会，审查实验研究是否符合伦理标准。在中国，类似的机构并不是标配。什么样的实验能做，什么样的实验不能做，并没有一个统一的标准。因为没有标准，所以在实际操作的过程中，实验很难得到许可并顺利开展。

3.实验法与其他政治学实验研究方法的兼容与互补

多年来，政治学实验的支持者和反对者存在非此即彼的尖锐矛盾。比如，一些偏激的政治学实验的支持者认为所有非实验的政治学研究都脱离实际，认为政治学缺乏经验检验的理论过剩，后续的研究者又在这些缺乏验证的理论的基础上，继续开发更多的新理论，所以这一类理论都没有说服力。这一类偏激的看法，阻碍了实验研究法和其他研究方法的兼容和互补。

本研究认为，研究方法是为研究目的服务的，研究方法只是工具，研究者能否恰当地使用这种工具才是关键。不同方法之间的差异不应该成为相互攻击的对象，相反应该成为互补的空间。

综上，本文从实验研究法的数据采集方式、实验研究的伦理以及实验研究法与其他方法的兼容互补三个层面，探讨国内政治学实验的困境。在此基础上，本文认为，应该从提高可行性、强化有益性、降低干扰性三个方面，优化政治学实验的设计。因此，本文探讨性地提出一种创新的实验研究设计思路，即：理论检验型的准实验研究。

一种理论检验型准实验的概念设计

通常来说，经典的实验设计有两种基本逻辑：理论驱动型实验和经验驱动型实验。前者以人为开展实践的方式验证理论；后者主要以差异法为基础，探索新的现象和关系。准实验研究则是对实验研究作了进一步的简化，在设计逻辑上与实验研究完全相同，但是降低了控制的标准。因此，准实验的设计难度和实施成本通常都低于实验研究。另外，由于直接采用了原始群体作为实验对象，准实验的外部有效性比实验研究略强。以检验理论的性能来看，准实验研究可以被视为一种冒烟手枪式检验。通过这种类型的检验，理论能够得到很强的确证，但是没有通过检验，也并不能使理论受到多少怀疑。

基于上述的理论基础，本文尝试提出一种理论检验型的准实验设计，其主要思路是：以真实世界为环境开展实验，不对受试对象采取严格的随机分组。直接采用原始样本，以不相等控制组前后测设计或单独样本前测后测设计的方式，设置相对合理的实验组与对照组。这种准实验强调研究者的亲身参与和实践操作，重点关注和强化实验者对系统主动施加的干预对因变量的影响，在尽可能保证实验严谨性和科学性的同时，充分强化实验的可行性与有益性。

1.设计理念：“你要知道梨子的滋味，你就得变革梨子，亲口吃一吃。”

在这种理论检验型的准实验设计中，研究者需要以真实世界中的事件或人群作为研究对象。理想状况下，最好是能够充分利用研究者熟悉的材料和场景开展实验。比如要研究实验政治学，最直接的方法就是自己尝试开展一项政治学实验。

举例1：研究实验政治学为何在国内难以实施

（1）从其他研究中，获得在国内开展政治学实验的主要困难ABC三项自变量。

（2）亲自尝试开展一项政治学实验，或者参与其他研究者开展的一项政治学实验，亲身验证是否确实遇到了困难ABC，并深入研究ABC三个变量之间，哪一个变量是最为显著的。研究团队为了克服ABC三个困难，分别采取了什么样的方式，花费了多少成本，最终获得了怎样的结果。

（3）研究发现，变量C是最难以克服的困难。C变量的影响如此之大，以至于最终这项政治学实验没有顺利开展，无疾而终。此外研究团队在尝试克服变量C的过程中，花费的成本甚至超过了A和B的总合。故可以得出初步结论，如果计划开展政治学实验，应该优先解决C的问题；否则即使解决了A和B，实验也无法顺利进行。

2.实验的选题：让研究创造价值

这种理论检验型的准实验设计，重点强调了实验的有益性和可行性。通过合理的设计，很多研究本身就有创造价值的潜力。比如研究扶贫，我们可以寻找一户真实存在的贫困户，协助他开设网店销售农产品。在创造价值的同时，收集到第一手的研究材料。

举例2：研究农户电商扶贫的影响与效果

（1）从其他研究中，获得初步假设：变量ABC对农户电商扶贫参与意愿等因素对农户参与电商扶贫有正向影响。

（2）寻找一户或几户贫困户作为研究对象，以上述框架对研究对象进行分析，哪些条件已经具备，哪些条件尚未具备。制定计划后，亲身参与，协助该农户参与电商扶贫、搭建网店、销售产品。采用不相等控制组前后测设计（两户差异较大的农户）或单独样本前测后测设计（同一户农户，受试前后状况作对比），并以此为基础开展准实验研究。

（3）研究发现（假设举例），变量A比其他变量更加显著。比如，农户创新意愿较低，但是照搬亲戚朋友成功经验的意愿很高。只要周边存在电商致富的案例，受试农户就有很高意愿模仿。相反，变量B和C不会形成显著的阻碍。

3.实验的目的设置：原则上仅用于检验理论或重复实验

准实验研究设计并不能取代实验研究。在条件允许的情况下，如果能够严谨地开展标准的政治学实验固然是最好的。但是由于政治学实验的种种局限，很多课题通常不能完全满足严谨的实验研究条件。仅仅用观察研究，又不足以得出令人满意的结论。这时就可以考虑采用这种理论检验型的准实验研究，在观察研究结论的基础上，进一步为理论提供强有力的确证。

进而言之，这种准实验设计需要尽可能地减少实验性质很强的干预。尽量把既有的干预进行有序化和系统化的处理，作为实验研究的素材使用。比如举例2中的实验，应该将扶贫（即实验）视为一项既定计划。扶贫本身的优先级高于实验。此时的实验者首先是一名真实扶贫工作者，其次才是一名以政治学实验方法研究扶贫的实验者。

4.关键变量的控制及测量：量化和实时反馈

如举例1和举例2所示，相比观察研究所取得的样板数据，研究者输入的干预可以容易地实现精确的量化。比如在举例2中，开展实验的明细资金账目，就可以以成本核算的方式实现量化。量化变量的形式不局限于成本和价格，还可以考虑用时间、面积、人数等多个维度的量化指标进行衡量。此外，相比非实验的研究方法，这种准实验的研究数据在一定程度上可以实现实时的反馈。以此能够及时调整研究的方向和路径。

5.实验对象的选择：控制范围内的受试对象

如上文所述，这种准实验设计中最重要的变量，是研究者团队对系统施加的干预。个人或者小团队对系统施加的干预精确可控，但是干预作为自变量对因变量的影响，有时可能确实太小，以至于无法观测到因变量的明显变化。以上特性决定了这种准实验研究方法更适合于研究某个非常具体的领域。换而言之就是一个足够小的系统，让自变量对因变量的影响足够显著，从而能够观测和论证。

理论上，对于宏观的大型课题，这种准实验设计也有应用的前景。但是这要求研究者或研究团队有能力调动足够的资源，并且能够承担足够的责任。在这个层面上，中国的试点政策，与这里所探讨的理论验证型准实验有一定的可比性。

举例3：以政策试点的推广为研究对象，验证政策变迁的原因

（1）从其他研究中，分析某个政策试点，以及其所属的政策子系统，研究触发政策变迁的自变量ABCD。

（2）观测一个准备推广上述试点政策的地区。在该地区中，自变量ABD都已经能够明显观测到，但是自变量C尚未出现。

（3）参与该政策子系统中，尝试推动事件的发展，促成自变量C的出现。

（4）如果观测到政策变迁，可以为自变量组ABCD与因变量X的因果关系提供强有力的验证。如果未能观测到政策变迁，则考虑进一步探讨变量C的量变是否足够，或其他潜在的因果关系。

该理论检验型准实验的应用前景

这种理论检验型准实验的设计，始终围绕着实践和实际参与来进行。实践是人类认知世界、改变世界的重要手段。这种准实验设计的根本依据，来源于毛泽东同志的《实践论》。在《实践论》中，明显包含了将实践作为一种研究方法用以探索真理、求证真理的深层含义。本研究探讨的这种理论检验型的准实验，是一种实验设计的思路，同时也可以说是一种改造主观世界和客观世界的实践方法。其应用的前景可以总结为以下几个方面：

1.尝试突破国内实验政治学的局限

在大量关于实验政治学的文献中，都反复论证了实验政治学和实验研究方法对中国政治学发展的积极意义。但是由于种种原因，政治学实验确实难以开展。所以，本研究探讨性地提出这种创新的准实验研究设计理念，以期降低开展实验的难度。另外，这种准实验设计能够在数据采集的层面上保证底层数据的质量。预期可以与其他研究方法形成互补。

2.规范的准实验设计能够为试点项目的具体实施提供方法论层面的支持

政策试点机制是一种在中国得到广泛使用的治理机制。长久以来，该机制对中国的经济发展、政策创新以及制度建设作出了很大的贡献。总体而言，试点机制有强烈的实验性质，但是并不等同于实验，通常被认为是一种尚处于不断开发改良中的政策工具。

关于试点机制的争议，主要包括（但不限于）三点。一是试点中“试”的成分不足。有研究表明，超过75%的试点是由中央政府和省级政府发起的。而基层的执行者将试点视为一种重要的成绩。在这种情况下，试点成了一种试对。因为地方有可能为了凸显政绩，不计代价地强迫试点成功，使得试点失去代表性和可复制性。二是试点中的“试”，缺乏理论的指导和系统的记录。在一些试点的运作过程中，容易观测到大量的人为干预和创新尝试，但是这些干预和尝试不见得具备足够的计划性，缺乏预案的临时调整也很常见。三是以经验主义和教条主义盲目照搬试点，而不顾当地的实际情况。这种情况不一定是人们通常认为的懒政造成的，有时候也有可能是因为当地想要尝试创新，但缺乏理论和方法论的支持。没有理论依据的尝试不容易从程序上获得决策者的认可，只能转而变为人与人的博弈。

本研究提出的这种理论检验型准实验，为进一步优化试点机制提供了一种创新的思路：以实验设计的模式，为试点项目进行前期规划。这样做的优势在于，在试点项目的前期规划中，充分将各类变数和可能的试错考虑在实验的计划中，像实验一样，形成动态的实时反馈。试点项目本身的成功固然重要，但是对于宏观层面而言，其最大价值在于收集经验，无论成功还是失败的经验都非常重要。这部分经验是判断试点是否值得推广的重要依据。因此，以这种准实验设计逻辑进行的试点项目规划，能够在方法论的层面上，提供充分的试错空间和调整计划的余地。从而避免了依靠人工决策进行无计划的临时调整，也避免了由主要负责人个人全权为成功或失败负责。因此，在一定程度上，避免了不计代价试对或生搬硬套，压抑创新的情况；同时也有利于试点经验和信息的真实反馈，充分规范和强化试点试的属性。

3.实践精神在政治学研究领域的体现

概而言之，近年来国内的政治学研究风格是非常谨慎的，这与改革开放以来，中国在实践中异常勇猛的改革和创新并不匹配。此外，也有不少学者认为，中国目前的政治学界普遍缺乏实证研究，尤其缺乏有效的实证研究。虽说“实践是检验真理的唯一标准”已经基本形成了一项全社会的共识，但是事实上，实践精神在中国政治学界，乃至社科领域的体现并不足够明显。不少以实践为主题的研究，主要采用的还是案例研究法，仅有个别案例采用了参与式观察。几乎没有研究主动对研究对象施加干预。如果仅仅只是观察而不操作，只看不动手的研究方式或许可以算是实证，但算作实践显然是比较牵强的。这种准实验设计，可能可以在方法论的层面作一些创新性的尝试。