倾向值匹配法的概述与应用——从统计关联到因果推论_苏毓淞_9787562496328

　　倾向值匹配法就是将各个受测单元多维度的信息，使用统计方法简化成一维的数值，成为倾向值，然后据之进行匹配，匹配的目的就是要找寻实验组和对照组样本中拥有相同（或者相似）倾向值的样本，它们之间的差异，就是因果关系。这个原理非常简单，但聪明的读者肯定会问，什么是多维度的信息？如何简化它？这都是倾向值匹配法*为关键也是*容易发生问题的地方。《倾向值匹配法的概述与应用：从统计关联到因果推论》的第1章将简要介绍为什么要对多维信息进行降维处理，而第2章将进一步讲解这背后的理论背景。第3章选择了4篇学刊论文，对其中倾向值匹配方法的使用进行解析。第4章则就“应用R软件和STATA软件实现倾向值匹配法”进行说明。

　　2005年春天，我在纽约大学Adam Przeworski教授的课上，第一次接触到倾向值匹配法，从此便与它结下了不解之缘。十年之后，“社会科学研究方法·前沿与应用”丛书召开第一次编写会，与会青年学者须各选择一个方法作为自己的主题，我当下就决定介绍这个方法。十年之前，倾向值匹配法在美国社会科学学界正处于上升期，许多学者认为因果推断有了新的解决方法，他们如获至宝，纷纷投入此一方法的使用，并为这个方法编写各类软件，以致坊间各式各样的“倾向值匹配方法”相关软件，一度如雨后春笋般层出不穷。不过，就如同Przeworski教授在那堂课后发表的工作论文中所指出的，这一方法在解决因果推断问题上存在局限性。学者们对这个方法的憧憬，其实是个美丽的误会；之后的数年间，也即我攻读博士期间（至2009年），我几乎见证了“倾向值匹配法”在学术界发展变迁的全过程。一方面，其所依据的理论不断产生新的突破和改进，学者提高了应用这个方法的标准和范式；然而，另一方面，他们的努力却为“倾向值匹配法”敲响了丧钟，它的绚烂，仿若一颗陨落的新星，暗淡了下来。正如学术研究中的许多方法一样，它们从最初喧嚣夺目、令人趋之若鹜的热闹，逐渐趋于平静和理智，这一过程让身处其中的我不禁扼腕叹息，同时又赞叹.于学界专家学者们永无休止的探索精神，这或许正是“方法”和一切学术研究的魅力所在吧！在这本书的前两章，我尽可能以由浅入深的方式，向你们介绍这个定量方法中一闪即逝的流星。

　　我想我可以下个定论，即倾向值匹配法在社会科学学界的盛行，与其隶属的因果推断理论有高度关系。20世纪以来，社会科学学者越来越希望能像自然科学学者一样，说因道果，确立研究的“科学性”与典范性，尽管他们的研究往往发现的是关联性，而非因果关系，不过他们依然为此付出了巨大的努力，不断挑战与审视自己的做法和观点。例如，早在1959年，美国社会学大师Seymour Martin Lipset博士即挑战了现代化理论，他认为关联不等于因果，现代化理论所主张的经济发展与民主化的关系，并不能构成因果关系。正是这样坦诚直面问题核心的精神，催促着社会科学学者们不断探究解决因果关系新的研究方法，同时也注定了“倾向值匹配法”这个宣称可以解决因果推断基本难题的研究方法，可以于21世纪初在社会科学学界横空出世！

　　如果读到这里，你打算合上这本书，从此远离倾向值匹配法，那你正好错过了这个在当代定量方法中最值得学习的方法。如果说倾向值匹配法是以最保守的方式进行变量间的因果推断，那么它的不足之处，同样也是其他方法推断因果受限的地方。所以，如果说学者对于这个方法的审慎规范，摧毁了这个方法的普适性，那么它的陨落同样也给其他研究方法带来本质上的）中击。简言之，我们再不能天真地认为回归分析结果就能给我们因果关系，甚至据此获得的关联性都有可能是错的，是谬误的（请详见本书关于共变量重合的讨论）！

你还可能感兴趣

我要评论