向量自回归(VAR)以及面板向量自回归(PVAR)完全攻略
目录
第一部分 背景及理论说明
第二部分 经典论文讲解
1、中文PVAR模型经典论文
2、英文PVAR模型经典论文
第三部分 模型实操以及命令介绍
第四部分 案例讲解以及stata实操
1、案例背景及数据介绍
2、stata操作以及结果解读
2.1 pvar命令解读
2.2 pvar2命令解读
3、操作流程
3.1 滞后阶数阶确定
3.2 脉冲响应与方差分解
3.3 Granger因果检验
第一部分 背景及理论说明
面板向量自回归模型( Panel Vector Autoregression,简称PVAR) 最早是由Holtz Eakin et al.(1988)[12]提出的,模型沿袭了Sims(1980)[13]提出的向量自回归(Vector Autoregression,简称VAR) 模型的优点,亦即事先无需设定变量之间的因果关系,而是将各个变量都视为内生变量,分析各个变量及其滞后变量对模型中其他变量的影响。相对于传统VAR模型的长时序要求,PVAR模型具有截面大、时序短的特点。PVAR模型利用面板数据能够有效解决个体异质性问题,充分考虑了个体效应和时间效应。鉴于PVAR模型个体差异捕捉特征,通过刻画个体的时间表现从而形成各地区经济差异政策启示。
VAR模型是时间序列中比较常用的模型,虽然该模型不需要假设经济变量之间的关系,但是在学习和操作的过程中有很多细节需要注意,今天就Panel VAR模型的基本操作与大家做一个简单的分享。
第二部分 经典论文讲解
面板单位根检验 滞后阶数选择
脉冲响应 方差分解
1、中文PVAR模型经典论文
题目:
中国分地区消费信贷行为差异化影响的供给侧启示———基于29个省级单位面板数据的PVAR模型实证分析
摘要:
基于面板向量自回归模型,实证检验2007 年第1 季度至2015 年第4 季度东部、中部和西部三个区域消费信贷行为差异化影响的结果表明,各区域消费信贷对宏观经济发展具有差异化影响。
因此,不同地区供给侧改革的立足点和导向应因地制宜。东部地区供给侧改革应着重消费信贷所支持的商品消费,进行针对性的商品创新和供给; 中部地区消费信贷的推广要以供给侧创新和实际产品提供为前提; 西部地区供给侧改革需要针对地区特点进行创新设计,带动与供给相对应的消费。
供给侧改革的实施和推进要根据消费行径和特点,因为脱离需求的供给侧改革无法落实到实处,供给和需求的双结合才能形成经济的持续性增长动力。
2、英文PVAR模型经典论文
TITLE:
Is environmental pressure distributed equally in China? Empiricalevidence from provincial and industrial panel data analysis
ABSTRACT:
China's rapid economic development has resulted in increasinglyserious environmental pollution that is negatively affecting the health ofChinese citizens. Notably, the unfair distribution of resources may cause theuneven distribution of the environmental burden. In this study, panel data of 30Chinese provinces and 32 industries for the period 2004 to 2017 is used toinvestigate how the environmental burden is distributed across differentregions and industries. To managepotential endogeneity and allow for dynamics, the generalized method of momentsand panel vector autoregression models are employed. The estimation resultsindicate that, on the whole, urban residents endure themostserious environmental pollution. Notably, a big gap is observed between urbanand rural residents' share of environmental pressure, and a similar gap is alsoobserved between developed and underdeveloped areas in China. Moreover, the governmentis responsible for less environmental pressure than companies for urbanresidents and rural residents. The subindustry regression results indicate thatthe “polluting department” bears themost environmental pressure, and the “greendepartment” also bore some negative environmental pressure.
第三部分 模型实操以及命令介绍
使用新的Stata命令pvar、pvarsoc、pvargranger、pvarstable、pvarirf和pvarfevd可以实现面板向量自回归模型的选择、估计和推理。为了便于在面板和时间序列变量之间进行切换,本命令与Stata内置的var命令的语法和输出都是相似的。
pvar估计面板向量自回归模型,通过拟合各因变量对其自身、所有其他因变量和外生变量(如果有的话)的滞后的多元面板回归。采用广义矩法(GMM)进行估计。
pvarsoc提供各种简要措施,以帮助面板VAR模型的选择。它报告了模型总体决定系数,Hansen (1982) J统计量和相应的p值,以及Andrews和Lu(2001)基于J统计量制定的弯矩模型选择准则。Andrew和Lu的准则都是基于Hansen’s J统计量,它要求模型中的moment conditions数量大于内生变量的数量。
pvargranger对面板VAR模型的每个方程进行Granger causality Wald tests.
后估计命令pvarstable通过计算估计模型各特征值的向量来检查面板VAR估计的稳定性条件。Lutkepohl(2005)和Hamilton(1994)都表明,如果所有的伴随矩阵的向量都严格小于1,则VAR模型是稳定的。稳定性为估计脉冲响应函数和预测误差方差分解提供了已知的解释。
后估计命令pvarirf计算并绘制脉冲响应函数(IRF)。根据蒙特卡罗估计的面板VAR模型,采用高斯逼近的方法估计置信度。正交化的IRF基于Cholesky分解,累积的IRF也可以使用pvarirf计算。
第四部分 案例讲解以及stata实操
1、案例背景及数据介绍
我们通过分析年工作时间和小时收入之间的关系来说明pvar命令集的使用,Holtz-Eakin, Newey和Rosen(1988)在他们关于面板向量自回归的开创性论文中分析了这一关系。为了将我们的新程序与Stata内置的var命令集进行比较,我们还将新的pvar命令集应用于Lutkephol(1993)的 West Germany 时间序列数据。
我们使用了Stata提供的1968年至1978年全国纵向调查中14-26岁女性的子样本。我们的子样本包括2039名女性,她们在至少三轮调查中报告了工资(工资)和年度工作时间(小时),其中两轮调查是连续进行的。Holtz-Eakin等人使用了相同的调查,但不同的时间段和不同的工作人员子样本,因此结果可能不是直接可比的。使用前四个滞后时间和工资作为工具,使用pvarsoc计算一到三阶面板VAR模型选择。
2、stata操作以及结果解读
2.1 pvar命令解读
xtset idcode year
generate wage = exp(ln_wage)
*Helmert变换拟合面板VAR模型,滞后期选择默认的
helm wage hours
pvar wage hours
*与上面相同,但是标准误按行业分类
egen indocc = group(ind_code occ_code)
pvar wage hours, vce(cluster indocc)
*与第一个相同,但使用前三个滞后作为工具
pvar wage hours, instlags(1/3)
*使用GMM估计
pvar wage hours, instlags(1/3) gmmstyle
虽然可以从上面的pvar输出中推断出一阶面板变量的格兰杰因果关系,但是我们仍然使用pvargranger作为例子来执行测试。下面的格兰杰因果检验结果表明,在通常的信心水平下,工资格兰杰导致工作时间,而工作时间格兰杰导致工资,与Holtz-Eakin等人的发现类似。
*报告过度鉴定试验
pvar wage hours, instlags(1/3) gmmstyle overid
pvar wage hours, gmmopts(winitial(identity) wmatrix(robust) twostep vce(unadjusted))
面板向量自回归模型估计本身很少被解释。在实践中,研究人员往往对各内生变量的外生变化对面板VAR系统中其他变量的影响感兴趣。然而,在估计脉冲响应函数(IRF)和预测误差方差分解(FEVD)之前,我们首先检查估计的面板变量的稳定性条件。得到的特征值表和图证实了估计是稳定的。
*格兰杰检验
pvargranger
*稳定性检验
pvarstable, grap
根据Holtz-Eakin等人的理论阐述,我们认为,工资水平的冲击直接影响同期的工作时间,而当前的工作努力只影响未来的工资。利用这个因果顺序,我们计算了使用pvarirf的隐含IRF和使用pvarfevd的隐含FEVD。在估计模型的基础上,使用200个蒙特卡罗图计算IRF置信区间。FEVD估计值的标准误差和置信区间同样可用,但这里没有显示,以节省空间。
pvarfevd,mc(200)
pvarirf,mc(200) oirf byoption(yrescale)
根据FEVD的估计,在我们的例子中,女性工作时间的变化中有40%可以用她们的工资来解释。另一方面,工作时间只能解释女性未来工资变化的5%。就水平而言,IRF图显示,对实际工资的正面冲击会导致工作努力减少,这意味着样本中的女性劳动力供应会向后弯曲。值得注意的是,当前工作努力的冲击对工作时间和工资都有积极但短暂的影响。另一方面,当前冲击对工资的影响对未来工资有持续的积极影响。
2、pvar2命令解读(连玉君老师)
*导入数据,然后修改变量名称,设定声明
webuse grunfeld, clear
rename company id
xtset id year
*赫尔默特变换数据以消除固定效果
helm invest mvalue kstock
PVAR模型通常的主要用途是进行预测分析。因而在进行脉冲响应和方差分解前,需要对变量进行滞后阶数的判断,然后才能进行下一步的操作。
3、操作流程
3.1 滞后阶数阶确定
pvar2 kstock invest mvalue, lag(4) soc
判断规则:
(1)选择AIC,BIC或是HQIC值最小的模型;
(2)但三者不一致时,BIC/HQIC倾向于选择比较精简的模型,AIC倾向于比较“丰满”的模型,但通常,BIC/HQIC优于AIC.
(3)有时候也需要自己做一些人为判断从上可知,我们判断出需要使用滞后四阶的命令。
3.2 脉冲响应与方差分解
脉冲响应与方差分解是两个相互补充相互说明的部分,初学者比较容易犯的错误是对脉冲响应解释不清。这个时候可以将方差分解结合起来看。方差分解是“数值化”了脉冲响应。
脉冲响应反映的是在其他变量的当期和以前各期值保持不变的情况下,PVAR系统中某个方程中的扰动项当期发生一个标准差变化对未来各期内生变量的冲击响应情况,这种方法能有效的把握未来的趋势。
在输入命令时,需要注意变量的先后顺序。一般来说,外生变量的冲击会影响另一个变量,而受冲击的变量影响第三个变量,切记不可颠倒顺序。
pvar2 kstock invest mvalue,lag(2) irf(10) reg(500)
方差分解对内生变量预测的误差变异数中,每个一个正交单位冲击的贡献比例。这个命令表示方差分解为5期,分析每一个正交单位冲击对其他值的影响。
pvar2 kstock invest mvalue,lag(2) irf(5) nograph decomp(5)
3.3 Granger因果检验
格兰杰因果检验表示,如果一个变量X有助于增进另一个变量Y的预测,我们就说X是Y的原因。
pvar2 kstock invest mvalue, granger
执行Granger 因果检验时,可以不必拘泥于选出的滞后阶数,因为Granger因果检验的目的在于检验X滞后项对y的联合影响。如果阶数过长,由于数据期限较短,会导致模型无法估计。一般我们得到概率然后在10%,5%,1%的显著性水平下进行比较,来看是否拒绝原假设:”x不是y的原因”。