技术方法 | 研究中国问题常用的免费公开数据库大全
编者按
一、综合调查数据
1、中国综合社会调查(Chinese General Social Survey,CGSS)
内容介绍:CGSS是我国最早的全国性、综合性、连续性学术调查项目,由中国人民大学中国调查与数据中心负责执行。遵照国际标准,自2003年起,每年一次,对中国大陆各省市自治区10000多户家庭进行连续性横截面调查。最新已经开始进行2021年的调查,公开版本最新数据更新至2017年,CGSS2019官方尚未公开。适合做当代中国相关政治态度和价值等问题的研究。
该数据方便下载,容易获取,学界认可度较高。此外在地理信息变量上,各年份均包含省级和地级市层面的信息。
链接:http://cnsda.ruc.edu.cn/
流程:首先按照要求注册,然后就可以随心所欲地下载啦!
2、中国社会状况调查(Chinese Social Survey,简称CSS)
内容介绍:CSS是中国社会科学院社会学研究所于2005年发起的一项全国范围内的大型连续性抽样调查项目,目的是通过对全国公众的劳动就业、家庭及社会生活、社会态度等方面的长期纵贯调查,来获取转型时期中国社会变迁的数据资料,从而为社会科学研究和政府决策提供翔实而科学的基础信息。此调查有助于获取转型时期中国社会变迁的数据资料,其研究结果可推论全国年满18-69周岁的住户人口。 目前已经更新到2019年。
在国内学界也较为常用,不过流程相对繁琐。在地理信息变量上,CSS2008/CSS2011/CSS2015公开的数据库尽管存在省份变量但是几乎完全缺失,其他年份的公开数据库可以根据身份信息和某些代码辅助判断,想要包含省份完整信息的数据库可能需要另辟蹊径了。
链接:http://csqr.cass.cn/DataExplore/?ProjectID=2018061909463245927261066314
流程:注册账号,上传身份证信息等待官网核验,通过后可下载数据。
3、中国家庭追踪调查(CFPS)
内容介绍:中国家庭追踪调查(China Family Panel Studies,CFPS)旨在通过跟踪收集个体、家庭、社区三个层次的数据,反映中国社会、经济、人口、教育和健康的变迁,为学术研究和公共政策分析提供数据基础。CFPS重点关注中国居民的经济与非经济福利,以及包括经济活动、教育成果、家庭关系与家庭动态、人口迁移、健康等在内的诸多研究主题,是一项全国性、大规模、多学科的社会跟踪调查项目。
链接:http://www.isss.pku.edu.cn/cfps/
二、专业数据库
1、China’s Corruption Investigations Dataset(中国腐败调查数据库)
内容介绍:包含十八大以来被调查的近20000名官员信息。具体变量包括:所在地区,姓,职务,被调查原由,年月等。
链接:http://cnsda.ruc.edu.cn/
2、Comprehensive Catalogue of Chinese Genealogies(中国家谱综合目录)
内容介绍:包含从1005到2007年,超过50000个家谱信息。
链接:http://csqr.cass.cn/DataExplore/?ProjectID=2018061909463245927261066314
3、Chinese Provincial Legal Funding Dataset
内容介绍:包含中国1995-2006年省级政府层面在公检法以及司法局上的支出。
链接:https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/KL88LQ
4、Chinese Political-Legal Leaders Database
链接:https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/KL88LQ
5、Chinese Listed Firms Personnel Database(中国上市公司个体层面数据库)
内容介绍:包括1991-2012年中国上市公司董事会成员的个人信息。
链接:https://dataverse.harvard.edu/dataset.xhtml/?persistentId=doi:10.7910/DVN/9QZRAD
(以上数据均来自哈佛大学王裕华教授个人研究的奉献,在此衷心感谢)
6、中国历代人物传记数据库(China Biographical Database Project,CBDB)
内容介绍:大约包含了491000个人物信息,做历史政治学的量化研究可以尝试。不过数据量大,网站上有中英文界面的详细介绍和使用指南,有兴趣的同学可以上官网看看,如果英文阅读不娴熟,可以切换到中文界面。
链接:https://projects.iq.harvard.edu/cbdb/home
7、China Historical GIS(中国历史地图集)
友情提醒:使用地图务必遵照国家有关规定
链接:https://chgis.fas.harvard.edu/
8、China Multi-Generational Panel Dataset, Liaoning (CMGPD-LN), 1749-1909 (ICPSR 27063) 1749-1909年清代内务府奉天省代际人口数据
链接:https://www.icpsr.umich.edu/web/DSDR/studies/27063
9、China County Map with 2000-201o Population Census Data(2000-2010年中国县级人口普查数据)
链接:https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/VKGEBX
10、COVID19 China Stats Analysis(中国的新冠疫情数据库)
链接:https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/FWOPW2
11、Mobility Index based on High-speed Railway Data in China(中国高铁数据)
链接:https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/JUBLGB
12、China Data Lab Dataverse
链接:https://dataverse.harvard.edu/dataverse/cdl_dataverse
或者:https://chinadatalab.ucsd.edu/resources/
三、常用的数据搜索网站
1、Harvard Dataverse
网址:https://dataverse.harvard.edu/
2、经管之家
网址:https://bbs.pinggu.org/
3、中国经济社会大数据研究平台
网址:https://data.cnki.net/Yearbook
4、国家统计局官网
中文网址:https://data.stats.gov.cn/
英文网址:http://www.stats.gov.cn/english/Statisticaldata/nsdp/201508/t20150819_1232260.html
5、北京大学开放研究数据平台
网址:https://opendata.pku.edu.cn/