用户名
密码
(30天内有效)
注册
注册
首页 > 案例资料 >

【科学的实证方法】胡诗云:使用工具变量进行因果推断的方法

我要收藏
2022-03-25

今天向大家科普经济学中常用的实证方法,本文将借助今年诺贝尔经济学奖获得者之一Joshua Angrist与他人合著的一篇经典论文来介绍使用工具变量进行因果推断的方法。


读书能不能提高工资,这是劳动经济学非常经典的研究问题。多读书收入高,这一看似常识性的观察其实不一定是因果关系。例如,聪明的孩子读书多,日后因为聪明收入也更高;家里有钱的孩子读书多,日后因为继承了家业而收入更高。这些机制都可能导致受教育水平和个人收入产生联系,不能反映读书对收入的实际影响。特别是对于政策制定者来说,读书能够增加多少收入直接反映了教育投资的回报率。因此我们想要关心的是:其它条件不变,让学生多读一年书带来收入的变化是多少?


2042874f5b22a69343807dfd1f2ab346.png


理想的方法当然是随机对照试验:把孩子随机分成几组,一组只允许读完初中,一组只可以读完高中等等。但这样显然是不可行的。此时经济学家只好借助于自然实验:有没有一些政策或者历史事件,它们导致了相似的人拥有不同的受教育水平呢?美国的两位劳动经济学家——Joshua Angrist和Alan Krueger就找到了一个这样的例子:


根据美国的《义务教育法》,一个孩子需要在当年满6周岁才能够入学。具体来说,美国通常是8月份开学,如果一个孩子当年12月才满6周岁,也可以正常入读。因此,如果一个孩子是四季度出生的(譬如说12月),那么TA在不到6岁的时候就可以入学了。而如果一个孩子是一季度出生的(譬如说1月),那么TA必须等到6岁生日过后的秋季学期才能入学。


而美国法律对于辍学的规定也有些“奇特”,他们规定学生必须年满16周岁才可以正式辍学,相比之下中国则是要求完成九年义务教育——中国规定了最短的受教育年限,而美国规定了最早辍学的年龄。因此在美国,对于同样是16岁辍学的少年,如果他们出生月份不同,所获得的受教育年限也是不同的。如果孩子是在四季度出生,那么从5岁多一些入学到16岁辍学,受教育年限是10年多一些;而一季度出生的孩子,从6岁多入学到16岁毕业,受教育年限不到10年。


ace2b1581be380ba4bdd727effad27b0.jpg


Angrist和Krueger认为,父母在决定生孩子的时候,很难考虑到出生月份如此微妙的差别。因此,孩子出生的月份独立于其它可能影响受教育水平的因素——智商、家庭背景、成长环境等,可以认为是一个随机分配。也就是说,父母不经意的举动,造成了孩子出生月份的差异以及接下来受教育年限的差异!这就好像一次随机对照试验,四季度出生的孩子就是受教育年限更长的“实验组”,而一季度出生的孩子就是受教育年限更短的“对照组”。这样,“是否出生于四季度”就是我们所说的“工具变量”。


1fc2091a6d84d5ebd6905c066fde7ef1.jpg

b763de146eee316336f9ddac3969e8ff.png


上面的图表显示了出生时间和平均受教育年限的关系,从中我们可以看出两点:首先,随着时间的推移,平均受教育年限越来越长,这和经济社会的发展密不可分。其次,从各季度出生人口的相对受教育年限来看,四季度的受教育年限总是更长一些(用黑色实心方块表示),而一季度的受教育年限总是更短一些。


看到这里,细心的你可能会问:刚才计算的受教育年限不是在10年上下波动吗?为什么这里的平均受教育年限时12年多,而且随着时间的推移不断上升?这是因为并非所有的学生都受到义务教育法的限制:无论有没有义务教育法,都会有学生完成高中甚至是大学教育。也就是说,他们结束教育的时间不是16岁而是更晚。这些学生将平均受教育水平从10年左右提高到了12年以上。(相信中国的义务教育法对于屏幕前的你也不会是约束,因为你本来就是奔着读大学甚至研究生去的。)但是,也有不少学生早就想退学了,只是受到义务教育法的约束,要在学校待到16岁。


6a30ef3247526a4c99c78bdfca24cfba.jpg


在计量经济学当中,我们将这些人称作“依从者”。出生于一季度或者是四季度,只对这些“依从者”的受教育年限有影响:一季度受教育年限更短,而四季度更长。所以说图中受教育年限随出生季度的波动,完全是由这些依从者导致的。


18387dfca7d83af2ed491a66c8807e09.png


既然一季度出生的人和四季度出生的人平均受教育年限不同,那么他们的工资是否也有所不同呢?上图就展现了出生时间和工资的关系(纵轴的工资取了自然对数——这是因为工资的分布十分不平等,取对数有助于缓解极端值的问题)。在这里我们惊讶地发现:平均而言,在第四季度出生的人成年后的工资相对于前后出生的人更高一些,而出生于一季度的人平均工资相对于前后则更低!


如果出生季度不同带来的唯一的系统性差别就是受教育年限的不同,那么上面两幅图的证据就证明了多上学确实能够提高收入。Angrist 和 Krueger统计出如下的结果:


42b8f1d9cd97a31092dd166cfb1dee23.png


表格中的结果说明,由于四季度比一季度出生的人平均来说多上了0.151年学,他们成年后收入的对数值上升了0.0135。换算下来,如果多上一年学的话,那么收入的对数将会提升0.0135/0.151=0.0894,或者说(经过一定的数学换算)收入上升大约8.94%。


对于政策制定者而言,这一数值估计无疑是非常有价值的:因为8.94%的上升和家庭背景、个人能力等等因素没有任何关系,仅仅是由于义务教育法看似古板的规定,让一部分四季度出生的孩子比一季度出生的孩子在学校里多呆了几个月造成的。也就是说,这8.94%干干净净地衡量了法律政策带来的经济效果。正因为如此,这篇研究成为了如今经济学学生必读的经典文献之一。


Joshua Angrist由于在方法论上(主要是对工具变量理论和应用)的重要贡献而获得了2021年的诺贝尔经济学奖。而本文的另一位作者,Alan Krueger,却在2019年由于抑郁症离开了人世。在一个平行时空里倘若Krueger还活着,今年的诺贝尔奖应该有他的一份。


不过,Angrist和Krueger使用出生季度作为工具变量的方法虽然巧妙,却也面临着不少质疑。我们在这里介绍三种主要的质疑。


我们已经看到,一个有效的工具变量需要满足两个条件:一是它要接近于随机分配,与个人的其它特征不相关,学名叫“外生性”;二是它要通过某种渠道去影响我们关心的自变量,学名叫“相关性”。前两种质疑分别围绕外生性和相关性展开:


关于外生性,有人可能会怀疑出生季度并非完全随机。相反,越是聪明的父母越可能合理地安排孩子的出生时间。比如说,为了让孩子在学校里抢占先机,父母可能会选择在一季度生孩子,这样孩子入学时就会比其它同学高一头、更聪明、更有自信,未来的收入就会更高。这样一来,我们就一季度的出生孩子收入就会偏高,导致我们低估了教育年限变化带来的真实影响。


而相关性,有人可能会质疑说出生季度带来的影响真的有如此显著吗?事实上,有相当多的人并不会受到义务教育法的约束。如果义务教育法只对很少的人产生影响,那么平均下来一季度和四季度的平均受教育年限的之差就会接近于0。而在计算教育对收入的影响时,四季度和一季度的受教育年限之差在分母上。如果分母接近于0,那么得到的比例就会随着分母的变化而大幅度波动。因此,分母上一点点随机的扰动就会使得我们对教育回报率的估计出现大幅变化。这就是所谓“弱工具变量问题”,对此经济学界有非常多的争论。


最后是一个更加微妙、但也更加值得深思的问题:工具变量的结果只适用于一小部分人。我们看到四季度和一季度出生人群的受教育年限之差、收入之差,都是由一小部分“依从者”驱动的。因此,即便我们观察到的是接受教育对收入的因果效应,这一效应也仅仅反映了“一部分决定在16岁辍学的高中生,由于义务教育法的限制,而不得不在学校多读几个月书”对收入带来的影响。工具变量只反映政策对一部分依从者的因果效应,这叫做“局部平均因果效应”。对于本来志存高远、目标是拿下硕士、博士的学生,受教育带来的影响能否用现在的结果衡量?如果我们的政策评估只能衡量对一小部分边缘群体的影响,这一研究的结论又有多大的普适性?这是作为经济学研究者和政策制定者需要认真思考的问题。


也欢迎有兴趣的同学找来这篇原文读一读~(顺便锻炼英语阅读能力)

原文信息如下:

Angrist J D, Krueger A B. Does compulsory school attendance affect schooling and earnings?[J]. The Quarterly Journal of Economics, 1991, 106(4): 979-1014.


作者 胡诗云

图片 苏荣蔚

审核 王 宇

排版 冯睿容


本站声明

本文仅代表作者观点,不代表城市数据派立场;
本文系作者授权城市数据派发表,未经许可,不得转载;
本网站上的所有内容均为虚拟服务,一经购买成功概不退款,请您理解。

点赞0