Gary King | 关于论文重复验证的小建议
编前记:政观在之前曾经推送了哈佛大学政府系Gary King教授关于《学好政治科学,你需要重复,再重复》一文的编译,引起了一些反响,一些读者在后台反映对重复验证尚有不太明确之处。为此,今天我们将再推送Gary King教授关于用数据重复验证的一些小建议作为补充。
作者简介:Gary King,政治学家、统计学家,哈佛大学政府系魏德海三世(Albert J. Weatherhead III)讲席教授(政观注:哈佛大学所设立的26个校级讲席之一,政治学巨擘亨廷顿生前也是该讲席教授),量化社会科学研究中心(Institute for Quantitative Social Science)主任,美国科学院与美国艺术与科学学院院士,其著作等身,在社会科学方法论、选举行为以及网络监管等研究领域做出大量贡献。
1.你需要思考你想重复验证什么主题的论文,同时不要忘记找到一到两个“玩”得来的合作者。
2.阅读Gary King已经出版的著作和发表的论文,在你开始写作之前再阅读一遍。
3.选择一篇对你研究领域有重要参考价值并且已经引起其他学者关注的文章。
4.找到一篇有影响力的文章最方便的方法就是看它的被引用率,对此谷歌学术(Google Scholar)能发挥十分有效的作用。
5.阅读作者已经写出的文章,特别是相同主题的文献。如果你重复的文章是这一系列文献的最后一篇,那么这一篇提及的文献会比前面的文献更加充足,即使这篇文章在文本中没有被明确提及。
6.阅读全部的脚注、表格与图片下的注释以及附录。
获取数据
1.寻找作者和网站。如果幸运的话,你可以发现你需要的数据(以及编码)已经被发布出来。你也需要浏览一些期刊的主页去了解他们是否有关于重复政策的讨论或者发布的数据。(比如,《美国经济学评论》(American Economics Review)经常提供相关文献的数据))
2.寻找公开数据存档。IQSS(量化社会科学研究中心)数据库和政治与社会研究校际联盟(ICPSR)是一个可供你开始重复验证的好机构。
3.如果你实在无法找到公开可获得的数据资源,那就请试着联系作者吧,但请务必保持礼貌的态度和专业的水准,并且尽可能地把你的问题打包通过电子邮件反馈。当然,在你没有他们的帮助就无法推进重复验证时,作者有责任去回复你的问题。
把数据载入R语言
1. R语言中的foreign()包可以方便地将SPSS、STATA以及其他形式的数据载入到R语言中,你可以通过阅读read.spss()和read.dta()包的帮助文件来了解更多的细节。
2. 一个名为DBMS/Copy的程序可以使得CGIS的实验机器能转换不同形式的文件,Stat/Transfer则是另一个能在实验室机器上进行转档的程序。
重复的样版
1.在最近的几年中,《美国政治学评论》(American Political Science Review)发表了两篇关于重复的文章,值得作为样板去阅读:
Jana von Stein. 2005. Do Treaties Constrain or Screen? Selection Bias and Treaty Compliance. American Political Science Review 99 (4): 611622.
Kusoke Imai(今井耕介). 2005. Do Get-Out-the-Vote Calls Reduce Turnout? The Importance of Statistical Methods for Field Experiments. American Political Science Review 99 (2): 283300.
2. 如果你想知道关于避免陷入重复验证陷阱的一些好建议,可以阅读Gerber和Green对Imai重复他们原始论文的回复。在公开你的重复验证结果之前,请仔细阅读本文:
Alan S. Gerber and Donald P. Green. 2005.Correction to Gerber and Green (2000), Replication of Disputed Findings, and Reply to Imai (2005).American Political Science Review 99 (2): 301313.
(本文译者 杨端程)
"广告点一点,也是支持学术公益"