大晚上又给我看兴奋了[苦涩]又激起了要投身入这个行业的热情
(乔姆斯基在课上真的被喷得好惨[吃瓜])
以及有关于myth telling,不只是看内容,还要看who is telling to whom, forms of uptake(those who dispute), and forms of social organization(who ratify the “true” version)
还有结构主义为什么crash and burn了,因为它建立在对索绪尔的误解和自己的幻想(ad-hoc explanation)上。索绪尔的理论是base在material reality上,有form-sense correlation. 但thought不是,没有segementable word form that expresses attitude/mental state,所以没有办法把attitude建立在某些种结构上
(乔姆斯基在课上真的被喷得好惨[吃瓜])
以及有关于myth telling,不只是看内容,还要看who is telling to whom, forms of uptake(those who dispute), and forms of social organization(who ratify the “true” version)
还有结构主义为什么crash and burn了,因为它建立在对索绪尔的误解和自己的幻想(ad-hoc explanation)上。索绪尔的理论是base在material reality上,有form-sense correlation. 但thought不是,没有segementable word form that expresses attitude/mental state,所以没有办法把attitude建立在某些种结构上
#学术笔记# 关于城市与区域经济学的因果识别中,因为很多treatment都是可以基于空间位置来定义,所以学者们经常会用到空间双重差分方法(spatial DD),这个方法将靠近treatment位置的sample视为处理组,稍微远一些的sample视为对照组,然后基于BD思想认为,两组因为位置接近,所以在除了treatment之外的特征都是类似的,以此在逻辑上满足common trend 假设。据此,学者们衍生出一系列变种的方法,典型的就是用Ring DD来识别treatment的溢出效应(当然我也用过)。
但其实,当我看了Kyle Butts最近在 JUE insight https://t.cn/A6oJ18bR的文章,发现市面上这些一系列基于空间位置的DD的方法多多少少都存在一些问题,这个问题其实很关键,就是选择距离treatment位置多远的sample才能算作对照组(下面简称“处理距离”),一般而言,这个处理距离应该是处理效应随距离衰减至零的位置。可是,处理距离范围的选择在既有文献中往往都是一种基于经验的做法(ad-hoc decision),这往往会导致common trend都是假的,处理效应估计不准确就更不用说了。
从第一个图可以看出,(a)是正确的设定,(b)是处理距离整的太远的案例,这样子相当于一部分对照组sample弄到处理组sample里面去了,直接导致处理效应被低估,这个问题其实还不大;但是(c)和(d)就更过分了,直接把处理距离整的太近,好家伙,本是处理组的sample弄到处理组里去了,这肯定高估了处理效应,这个问题就比较严重。其实,说白了,两者都很严重。
更让我吃惊的是,有良心的文章为了说明自己选的处理距离是合理的,于是采用调整划定处理组和对照组的方法,或者从最开始简单的从outcome和distance to treatment的相关性来间接证明他们选择对应距离标准的合理性,但其实不然。直接上图:
从第二个图,(a)是一般已经发表的文章为他选择0.1处的距离给出的证据。但事实上,选择的bandwidth不一样,结果就不一样,从(b)-(c)看,好像又不清楚选择哪个处理距离范围了。
作者这篇文章就解决了这么一个问题,他提出了基于数据驱动(data-driven)下的处理距离范围选择,换句话说,就是数据告诉你,你应该选择一个多远的距离范围。作者怎么做的呢?它基于partitioning- based least squares estimation and inference methods,其实就是把距离treatment的sample按照distance的分位数进行无尽的划分,划的越细就越好,但也取决于数据量的问题。这么做的好处除了选择处理距离之外,其实更容易捕捉处理效应随距离变化的异质性效应(衰减特征,衰减后有增加等等,如第三个图)。但这么做可能也需要付出一定代价,就是需要更强的假设, 就是不同距离分位之间的common trend应该是constant才行,不然白搞了。stata代码也简单binsreg.
具体的模型假设其实也不少,可以作为实证分析部分写内生性问题来源的参考吧~
但其实,当我看了Kyle Butts最近在 JUE insight https://t.cn/A6oJ18bR的文章,发现市面上这些一系列基于空间位置的DD的方法多多少少都存在一些问题,这个问题其实很关键,就是选择距离treatment位置多远的sample才能算作对照组(下面简称“处理距离”),一般而言,这个处理距离应该是处理效应随距离衰减至零的位置。可是,处理距离范围的选择在既有文献中往往都是一种基于经验的做法(ad-hoc decision),这往往会导致common trend都是假的,处理效应估计不准确就更不用说了。
从第一个图可以看出,(a)是正确的设定,(b)是处理距离整的太远的案例,这样子相当于一部分对照组sample弄到处理组sample里面去了,直接导致处理效应被低估,这个问题其实还不大;但是(c)和(d)就更过分了,直接把处理距离整的太近,好家伙,本是处理组的sample弄到处理组里去了,这肯定高估了处理效应,这个问题就比较严重。其实,说白了,两者都很严重。
更让我吃惊的是,有良心的文章为了说明自己选的处理距离是合理的,于是采用调整划定处理组和对照组的方法,或者从最开始简单的从outcome和distance to treatment的相关性来间接证明他们选择对应距离标准的合理性,但其实不然。直接上图:
从第二个图,(a)是一般已经发表的文章为他选择0.1处的距离给出的证据。但事实上,选择的bandwidth不一样,结果就不一样,从(b)-(c)看,好像又不清楚选择哪个处理距离范围了。
作者这篇文章就解决了这么一个问题,他提出了基于数据驱动(data-driven)下的处理距离范围选择,换句话说,就是数据告诉你,你应该选择一个多远的距离范围。作者怎么做的呢?它基于partitioning- based least squares estimation and inference methods,其实就是把距离treatment的sample按照distance的分位数进行无尽的划分,划的越细就越好,但也取决于数据量的问题。这么做的好处除了选择处理距离之外,其实更容易捕捉处理效应随距离变化的异质性效应(衰减特征,衰减后有增加等等,如第三个图)。但这么做可能也需要付出一定代价,就是需要更强的假设, 就是不同距离分位之间的common trend应该是constant才行,不然白搞了。stata代码也简单binsreg.
具体的模型假设其实也不少,可以作为实证分析部分写内生性问题来源的参考吧~
虚假的active faculty:行政升迁快,去会议的原因是因为可以见到申请中的proposal的committee或者director,但任何领域内当下比较有影响力的活动和topic都轮不上他们,盲目追逐ad hoc热点。
真正的active faculty:有能力在顶尖的机构组织相关领域的活动,即使这个领域已经是non-active了,也能盘出来一个program…
可惜选phd老板的时候没有人告诉你这一点…还好选postdoc老板follow师兄的意见选择还蛮正确的…
真正的active faculty:有能力在顶尖的机构组织相关领域的活动,即使这个领域已经是non-active了,也能盘出来一个program…
可惜选phd老板的时候没有人告诉你这一点…还好选postdoc老板follow师兄的意见选择还蛮正确的…
✋热门推荐