面板数据分析

面板数据分析 徐索菲

主要内容 • 基本原理介绍 • 面板数据的定义 • 面板数据模型分类 • 面板数据模型设定检验 • 面板数据的单位根检验 • 面板数据的协整检验 • 面板数据建模案例分析 • Eviews操作演示

会用Eviews做一般的面板数据分析!

面板数据的定义 • “面板数据”一词指的是一部分家庭、国家或企业等在一段时期内的观测值所构成的集合。这样的数据可以通过在一段时期内对一些家庭或个体进行跟踪调查来获得。 • 面板数据也称作时间序列与截面混合数据。 • 面板数据用双下标变量表示。例如：Yit 、Xit • 面板数据可以分为微观面板和宏观面板两大类： • 微观面板：个体数N较大，时期数T较小 • 宏观面板：有适度规模的N，时期数T较大

表1 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据（不变价格）

面板数据的优势 1、便于控制个体的异质性。 • 例如，研究2000~2012年我国各省居民对青岛啤酒的需求问题时，设定需求模型： • 则模型中解释变量包括四类： • 第一类：随个体（省）和时间的变化而变化的变量，如啤酒消费量的滞后项、价格和收入等可观测的变量； • 第二类：随个体（省）变化而不随时间变化的可观测变量，如民族习惯（nation）和风俗文化（custom）等变量； • 第三类：不随个体（省）变化而随时间变化的可观测变量，如电视和广播中的广告等变量； • 第四类：是一些不可观测变量 2、包含的信息量更大，降低了变量间共线性的可能性，增加了自由度和估计的有效性。 3、面板数据更适合于研究动态调整过程

面板数据模型 • 我们将基于面板数据的回归模型称为面板数据模型（panel data model）。面板数据模型可以分为单方程面板数据模型和联立方程面板数据模型；也可以分为线性面板数据模型和非线性面板数据模型；还可以分为静态面板数据模型和动态面板数据模型。

单方程静态面板数据模型的一般形式为： 其中用于衡量个体i在t时点，对的边际影响。对模型做进一步限制可以将面板数据模型划分为：混合估计模型、固定效应模型、随机效应模型

1 、混合回归模型 • 如果我们假设从时间上看，不同个体之间不存在显著性差异；从截面上看，不同截面之间也不存在显著性差异，也就是截距项和斜率都不随个体和时点的变化而变化，我们把这类模型称为混合回归模型，可以直接把面板数据混合在一起，用普通最小二乘法（OLS）估计参数。即估计模型： .

2、固定效应模型 如果对于不同的截面或不同的时间序列，只是模型的截距项是不同的，而模型的斜率系数是相同的，并且允许截距项的变化与解释变量相关，则称此种模型为固定效应模型。固定效应模型分为3 种类型，即个体固定效应模型、时点固定效应模型和时点个体固定效应模型。个体固定效应：时点固定效应：个体时点固定效应：对于固定效应模型可以采用在模型中加虚拟变量的方法估计回归参数，并称这种回归为最小二乘虚拟变量（The Least Square Dummy Variable）回归，简记为LSDV 回归。也可以采用广义最小二乘法的协方差分析（Analysis ofCovariance）法估计固定效应模型参数，简记为ANCOVA 回归。

3、随机效应模型 如果对于不同的截面或不同的时间序列，只是模型的截距项是不同的，而模型的斜率系数是相同的，但是截距项的变化与解释变量不相关，则称此种模型为随机效应模型。随机效应模型分为3 种类型，即个体随机效应模型、时点随机效应模型和时点个体水机效应模型。个体随机效应：时点随机效应：个体时点随机效应： • 对于随机效应模型我们通常可以采用可行广义最小二乘法（ FGLS）进行估计。

面板数据模型的检验与设定 • 1、F检验：用于判断是否应该建立固定效应模型 • 检验原理：H0：约束条件成立 • H1：约束条件不成立 • 构造F统计量：其中，SSEr表示约束模型的残差平方和，SSEu表示非约束模型的残差平方和，m表示约束条件个数，T表示样本容量，k表示非约束模型中被估参数的个数。计算得到的F统计量的值小于等于临界值，则接受原假设约束条件成立，大于临界值则拒绝原假设约束条件不成立。以是否应建立混合模型和个体固定效应模型为例

固定效应显著性检验 • 相对于混合估计模型来说，是否有必要建立个体固定效应模型可以通过F检验来完成。 • H0：不同个体的截距项相同(真实模型为混合估计模型) • H1：不同个体的截距项不同(真实模型为个体固定效应模型) • F统计量定义为： • 其中SSEr，SSEu分别表示约束模型(混合估计模型)和非约束模型(个体固定效应模型)的残差平方和。N表示个体个数，(N-1)表示约束条件个数， k为解释变量对应参数的个数。

面板数据模型的检验与设定 • 2、Hausman检验：用于判断是否应该建立随机效应模型 • 检验原理：H0：建立随机效应模型 • H1：建立固定效应模型 • 检验思想：因此只需检验是否渐进为0 其中： K表示解释变量个数

面板数据的单位根检验 • 面板数据的单位根检验分为两大类： • 一类假设所有的个体都具有相同的单位根 • 如LLC检验、Bretung检验 • 一类假设不同的个体具有不同的单位根 • 如IPS检验，Fisher-ADF检验，Fisher—PP检验注：这五个检验方法的原假设都是存在单位根 • 介绍LLC和Fisher-ADF检验思想： • LLC(Levin-Lin-Chu）检验原理仍采用ADF检验式。区别是使用的是剔除自相关和确定性影响的、标准化的代理变量。 • Fisher-ADF检验又称崔仁检验，他是基于fisher原理，首先对每个个体做ADF检验，用得到的N个ADF统计量所对应的的概率值P的和来构造两个统计量。

面板协整检验 • 面板数据的协整检验按方法分为两大类： • 由EG两步法推广而成的面板数据协整检验方法，如Pedroni协整检验法、Kao协整检验法。（只能检验一个协整关系） Pedroni检验包括4个统计量，11个检验方法 Kao检验给出1个ADF统计量，该统计量渐进服从标准正态分布由Johanson迹统计量推广而成的面板数据协整检验方法，如Fisher协整检验方法。（可检验多个协整关系） Fishen协整检验方法是用个体的协整检验值构造一个服从X2分布的累加统计量检验变量间的协整关系。

面板数据分析步骤 • 一、散点图时序图分析 • 二、面板数据平稳性检验 • 三、面板数据协整检验 • 四、面板数据模型设定 • 五、最终回归模型建立 • 六、模型应用

面板数据建模案例分析 • 案例1：中国城镇居民家庭人均消费和收入之间的关系。 • 数据选取：1999-2011年中国31个省级地区的城镇居民人均全年消费（CS)和人均全年可支配收入(YD)的不变价格数据。数据是13年的，每一年都有31个数据，共403组观测值。 • 数据来源：中经网统计数据库

一、散点图分析 人均消费对人均收入的面板数据散点图对数的人均消费对收入的面板数据散点图 • 缓解异方差； • 线性关系更明显。本例用对数研究更适合

二、面板数据平稳性检验 • 必要性：避免伪回归现象。 • 检验方法：Levin-Lin-Chu检验法、Im-Pesaran-Shin检验法、Fisher-ADF检验法和Fisher-PP检验法。 • 检验结果：对变量LNCS、DLNCS、LNYD和DLNYD进行平稳性检验，结果显示LNCS和LNYD都是非平稳的，DLNCS和DLNYD都是平稳的，所以LNCS和LNYD都是一阶单整序列。

LNCS的单位根检验结果 DLNCS的单位根检验结果

三、面板数据协整检验 • 采用Pedroni检验和Kao检验、Fisher个体联合检验对LNCS和LNYD进行协整检验，结果显示二者存在协整关系。 Pedroni检验结果（原假设不存在协整关系）

四、面板数据模型设定 • 结合散点图，选择初始模型个体固定效应模型 • 利用F检验，检验固定效应的显著性 • 利用Hausman检验，检验随机效应的显著性

个体固定效应模型估计结果

混合模型与个体固定效应模型比较，应该建立个体固定效应模型。混合模型与个体固定效应模型比较，应该建立个体固定效应模型。

随机效应显著性检验 • Hausman检验 • 原假设与备择假设是: • H0: 个体效应与回归变量无关（个体随机效应回归模型） • H1: 个体效应与回归变量相关（个体固定效应回归模型）结论：个体随机效应与个体固定效应比较应该建立个体固定效应

建立个体效应误差修正模型

案例2：美国公路交通事故死亡人数与啤酒税关系研究案例2：美国公路交通事故死亡人数与啤酒税关系研究美国每年有4万起高速公路交通事故，约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。凌晨1~3点25%的司机饮酒。饮酒司机出交通事故是不饮酒司机的13倍。现有1982~1988年48个州共336组美国公路交通事故死亡人数（number）与啤酒税（beertax）的数据，散点图如下：

按个体固定效应模型估计：

模型设定检验 1、用F检验判断应该建立混合模型还是固定效应模型用F检验判断是否建立个体时点固定效应模型应该建立个体固定效应模型

2、用H检验判断应该建立个体随机效应还是个体固定效应模型2、用H检验判断应该建立个体随机效应还是个体固定效应模型应该建立个体固定效应模型

案例3：柯布-道格拉斯生产函数研究

建立个体时点双固定效应模型

模型设定检验 1、用F检验判断应该建立混合模型还是固定效应模型应该建立个体时点固定效应模型

2、用H检验判断是否应该建立个体时点随机效应模型2、用H检验判断是否应该建立个体时点随机效应模型应该建立个体随机时点固定效应模型

个体随机、时点固定效应模型回归结果：

规模报酬不变检验 做WALD检验：原假设：接受原假设，规模报酬保持不变

Eviews7.2操作演示

面板数据分析

面板数据分析

Presentation Transcript