门槛回归模型系列讲解(二):门槛回归模型完全攻略
第一部分 模型背景以及简介
进行回归分析,一般需要研究系数的估计值是否稳定。很多经济变量都存在结构突变问题,使用普通回归的做法就是确定结构突变点,进行分段回归。这就像我们高中学习的分段函数。但是对于大样本、面板数据如何寻找结构突变点。所以本文在此讲解面板门限回归的问题,门限回归也适用于时间序列。、
门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象(结构突变)。作为原因现象的临界值称为门限值。例如,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。
history&Hansen
常见模型如下:门槛回归模型(thresholdregression,也称门限回归):
汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。Hansen于1996年在《Econometrica》上发表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了时间序列门限自回归模型(TAR)的估计和检验。之后,他在门限模型上连续追踪,发表了几篇经典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》(Hansen (1999) 首次介绍了具有个体效应的面板门限模型的计量分析方法, 该方法以残差平方和最小化为条件确定门限值, 并检验门限值的显著性, 克服了主观设定结构突变点的偏误。具体思路是:选定某一变量作为门限变量, 根据搜寻到的门限值将回归模型区分为多个区间, 每个区间的回归方程表达不同, 根据门限划分的区间将其他样本值进行归类, 回归后比较不同区间系数的变化。),2000年的《Sample splitting and threshold estimation》和2004年与他人合作的《Instrumental Variable Estimation of a Threshold Model》。
在这些文章中,Hansen介绍了包含个体固定效应的静态平衡面板数据门限回归模型,阐述了计量分析方法。方法方面,首先要通过减去时间均值方程,消除个体固定效应,然后再利用OLS(最小二乘法)进行系数估计。如果样本数量有限,那么可以使用自举法(Bootstrap)重复抽取样本,提高门限效应的显著性检验效率。在Hansen(1999)的模型中,解释变量中不能包含内生解释变量,无法扩展应用领域。Caner和Hansen在2004年解决了这个问题。他们研究了带有内生变量和一个外生门限变量的面板门限模型。与静态面板数据门限回归模型有所不同,在含有内生解释变量的面板数据门限回归模型中,需要利用简化型对内生变量进行一定的处理,然后用2SLS(两阶段最小二乘法)或者GMM(广义矩估计)对参数进行估计。
第二部分 优秀论文解读
1、优秀中文论文解读
论文题目:我国金融发展与经济增长的非线性关系研究——来自动态面板数据门限模型的经验证据
论文作者:黄智淋\董志勇
作者单位:北京大学经济学院深圳市政府投资项目评审中心
摘要:本文采用我国31个省市1979~2008年的年度面板数据,以通货膨胀率为门限变量,运用动态面板数据门限模型,探讨金融发展与经济增长之间的非线性关系。研究结果表明:金融发展与经济增长之间的关系存在通货膨胀率门限效应,通货膨胀率门限值约为5.05%左右;当通货膨胀率低于门限值时,金融发展与经济增长是正相关的;而当通货膨胀率超过门限值时,金融发展与经济增长是负相关的。这意味着金融发展仅在低通货膨胀水平下有利于促进经济增长。
关键词:金融发展;经济增长;动态面板数据门限模型
结论与政策建议:
本文基于我国31个省市1979~2008年的年度面板数据,以通货膨胀率为门限变量,
运用动态面板数据门限模型,考察我国金融发展与经济增长之间的非线性通货膨胀率门
限效应。得到的主要结论是:
1.我国金融发展与经济增长之间的关系存在非线性的通货膨胀率门限效应,通货膨
胀率门限值约为5.05%。这意味着通货膨胀是影响我国金融发展与经济增长关系的一
个重要因素。由此得出的政策建议是政府为促进经济增长而采取措施发展金融之前,应
充分考虑通货膨胀水平的高低。
2.当通货膨胀率处在低于门限值的低通货膨胀率区制时,金融发展对经济增长的影
响为正的;而当通货膨胀率处在高于门限值的高通货膨胀率区制时,金融发展对经济增长
的影响为负的。这说明通货膨胀率过高时,即使持续进行金融发展也将不利于促进经济增长。由此建议各省市要维持物价稳定,防止物价过快过大上涨或下降,把通货膨胀率控制在低水平。
2、优秀英文论文解读
TITLE:Financialdevelopment and innovation-led growth: Is too much finance better?
AUTHOR:Xiaoyang Zhu a,Stylianos Asimakopoulos b, Jaebeom Kim a,⇑
ABSTRACT:
We show that the expansion of financial sectormay hurt innovative activities and hence the innovation-led growth, using dataon 50 countries over the 1990–2016 period. Countries with higher level offinancial development are found to have a smaller positive or insignificanteffect on innovation. The marginal effect of innovation on growth is a decreasingfunction of financial development. Using a dynamic panel threshold methodwere-examine the possible non-linearity between finance, innovation and growth. We find thatinnovation exhibits an insignificant effect on output growth when credit to theprivate sector exceeds a threshold level of about 60% as a share of GDP. Theseresults are not driven by banking crises, the long run effect of 2007–2008financial crisis, or the ongoing European sovereign debt crisis.
Conclusion:
This paper has empirically tested the hypothesis that an expansion in financial sector would hurt innovation and innovation-led growth, using a panel of 50 countries over 1990–2016. The results from a linear system-GMM shows that countries with higher level of financial development are associated with a relatively low rate of innovation.
Furthermore, this vanishing effect between finance and innovation would finally transmit to innovation-led growth. We find that the positive effect of innovation on growth is smaller or even insignificant for countries with developed financial sector. These conclusions are robust to the banking crisis, the long run effect of 2007–2008 financial crisis, the ongoing European sovereign debt crisis and alternative indicators of financial development and innovation. To precisely estimate the threshold value at which the vanishing effect starts, a dynamic panel threshold model is employed. We find that, for our sample of countries, innovation starts to have an insignificant effect on output growth when private credit reaches the level of around 60% of GDP.
Finally, we have shown that our threshold value is not driven by our sample size and selection but the difference in the tools employed in our work, compared to the related literature, as well as the ongoing regional and international financial integration process.
第三部分 时间序列门槛模型stata操作
阈值将一个状态从另一个状态描述出来。有一个效应(一组系数)达到阈值和另一个效应(另一组系数)。Stata的新门限命令适用于时间序列。门槛模型常用于时间序列数据。门槛可以是一个时间。例如,如果你认为投资策略在某个未知的日期发生了变化,你可以用一个模型来获得日期的估计,并在它前后得到不同系数的估计。或者门槛值可以用另一个变量来表示。例如,在一定程度的通货膨胀之外,央行会提高利率。你可以用一个模型来得到门槛值的估计值和两边的系数。
计算最优的门槛个数,一般有Bayesian information criterion (BIC)、Akaikeinformation criterion (AIC) 、Hannan-Quinn informationcriterion (HQIC)三个信息准则。其中默认使用BIC信息准则进行选择。
操作步骤为:Statistics > Time series (panel data)> Thresholdregression model
webuse usmacro
twoway (line fedfunds date, sort lcolor(teal) lwidth(vthick) lpattern(solid))
threshold fedfunds, regionvars(l.fedfunds inflation oap) threshvar(l2.ogp)
threshold fedfunds, regionvars(l.fedfunds inflation oap) threshvar(l2.ogp) optthresh(5)
第四部分 面板数据门槛模型stata操作
进行回归分析,一般需要研究系数的估计值是否稳定。很多经济变量都存在结构突变问题,使用普通回归的做法就是确定结构突变点,进行分段回归。这就像我们高中学习的分段函数。但是对于大样本、面板数据如何寻找结构突变点。
门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象(结构突变)。作为原因现象的临界值称为门限值。例如,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。
4.1 王群勇老师xthreg与xtptm命令
语法格式为:
xthreg depvar [indepvars] [if] [in], rx(varlist) qx(varname) [thnum(#) grid(#) trim(numlist) bs(numlist) thlevel(#) gen(newvarname) noreg nobslog thgiven options]
depvar被解释变量,indepvars 解释变量,qx(varname) is the threshold variable,门限变量,thnum(#) is the number of thresholds,在stata门槛值是必要项目,需要等于大于1,小于等于3,默认值为1,也就是至少存在三个门槛值。
use hansen1999.dta
xtset id year
*Estimate a single-threshold model
xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnm(1) trim(0.01) grd(400) bs(300)
xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnm(3) trim(0.01 0.01 0.05) grd(400) bs(300 300 300)
输出结果包括四个部分。第一部分输出门限估计值和自举法的结果。第二部分列表输出门限值及置信区间,Th-1代表单一门限估计值,Th-21 和Th-22代表双门限回归的两个估计值,有时Th-21和Th-1相同。第三部分列出了门限检验,包括RSS、MSE、F统计量及概率值,以及10%、5%、1%的置信水平。第四部分是固定效应回归结果。
4.2 连玉君老师xtthres命令
语法格式为:
xtthres varlist [if] [in] , thres(varname) dthres(varname) [ qn(#) bs1(#) bs2(#) bs3(#) levle(#) minobs(#) ]
thres(varname)指定阈值变量,如Hansen(1999)中的q_it所示。请注意,不应忽略此选项。
dthres(varname)指定将显示阈值效果的变量,如Hansen(1999)中的x_it所示。此变量将乘以指示器函数I(.)。注意这个选项也不应该被忽略。
qn(#) 指定在查找阈值效果的最佳估计时要搜索的不同值的数目,即r\u hat,它将最小化模型的平方残差之和。默认值为400。
bs1(#), bs2(#), bs3(#) 分别在单阈值、双阈值和三阈值模型中指定引导时间。默认值都是300。
level(#)指定置信区间的置信度(百分比)。默认值为级别(95)或按设置级别设置;请参阅帮助级别。
minobs 指定在搜索r\u hats时每个区域中的最小观测数。默认值为10。
tabstat i q1 c1 d1, s(min p25 p50 p75 max) format(%10.6f) c(se)
xtthres i q1 q2 q3 d1 qd1, tm(d1) d(c1) min(120) bs1(300) bs2(300) bs3(200)