660 likes | 750 Views
人口普查数据 的评估与使用. 国务院人口普查办公室 国家统计局人口就业司 崔红艳 2011 年 11 月. 做好数据评估的目的. 更好地使用普查数据 更好地提供决策服务 更好地改进普查和调查方法. 评估主要方法. 数据内部核查 与其他来源(历史数据、行政资料)资料比较 人口间接分析技术. 对人口普查主要数据的评估. 分年龄人口的准确性 性别比的准确性 生育水平的准确性 死亡水平的准确性 对总人口的估计 教育数据的准确性 少数民族数据的准确性 对长表抽样数据的把握. 一、分年龄人口的准确性.
E N D
人口普查数据的评估与使用 国务院人口普查办公室 国家统计局人口就业司 崔红艳 2011年11月
做好数据评估的目的 • 更好地使用普查数据 • 更好地提供决策服务 • 更好地改进普查和调查方法
评估主要方法 • 数据内部核查 • 与其他来源(历史数据、行政资料)资料比较 • 人口间接分析技术
对人口普查主要数据的评估 • 分年龄人口的准确性 • 性别比的准确性 • 生育水平的准确性 • 死亡水平的准确性 • 对总人口的估计 • 教育数据的准确性 • 少数民族数据的准确性 • 对长表抽样数据的把握
一、分年龄人口的准确性 (一)10岁及以上人口准确性的检验 (二)低年龄人口准确性的检验 (三)三个年龄段人口分布的检验
(一)10岁及以上人口准确性的检验 方法1:采用留存率的一致性检验方法 与2000年人口普查的年龄结构比较,2010年普查的a+10岁人口应为2000年普查a岁的存活人口, 称为留存率。
留存率 • 某一时点某年龄(x岁)人口在n年后仍然活着的比例 • 留存率:实际留存率 nPx=Px+n,t+n / Px,t 生命表留存率 nSx=Lx+n/Lx • 逆留存率:Lx/Ln+x • 利用逆留存,推算出生 :lo/Lx*Px
全国2000年的分年龄人口与1990年人口普查相比,留存率曲线10-19岁人口留存率大于1,其余年龄基本与生命表留存率吻合。全国2000年的分年龄人口与1990年人口普查相比,留存率曲线10-19岁人口留存率大于1,其余年龄基本与生命表留存率吻合。 • 主要是1990年0-9岁漏报造成的。
全国2005年的分年龄人口与2000年人口普查相比,留存率曲线呈现出青壮年和低年龄人口少、老年人口多的状态,尤其是中间年龄明显偏小。全国2005年的分年龄人口与2000年人口普查相比,留存率曲线呈现出青壮年和低年龄人口少、老年人口多的状态,尤其是中间年龄明显偏小。 • 青壮年人口存在漏报。 • 5-9岁人口存在漏报。 • 由于样本中青壮年和低年龄的漏报,使得年龄结构存在偏差。
方法2:与其他数据比较 • 与普查登记户籍人口年龄结构比较 • 与公安身份证分年龄信息比较 • 与计生分年龄数据比较
(二)低年龄人口准确性的检验 方法1:采用儿童存活倒推法 根据普查(调查)的0-9岁人口,采用逆留存的办法,推算出相应年份的出生人口,与历史数据或行政资料比较。 公式:推算相应年份出生人数=lo/Lx* Px,x=0-9
方法2:与行政资料比较 • 教育部门的小学在校生数 • 计生部门的出生人数 • 卫生部门的分娩数 • …..
(三)三个年龄段人口分布的检验 方法: 通过0-14岁、15-64岁、65岁及以上三个年龄段人口数量和比重的变化,与人口自身发展规律、人口流动情况进行横向和纵向比较,来检验三个年龄段人口数据的准确性。
二、性别比的准确性 (一)10岁及以上人口性别比的准确性 (二)出生婴儿性别比的准确性 (三)总人口性别比的准确性
(一)10岁及以上人口性别比的准确性 方法:采用同队列性别比,对两次普查同一个出生队列人口的性别比进行比较。 以2000年普查为例: 把2000年a岁人口的性别比与1990年a-10(a>=10)岁人口性别比进行比较。
(二)出生婴儿性别比的准确性 方法1:采用普查低年龄人口性别比与历年出生婴儿性别比比较的方法,对历年出生婴儿性别比进行评价,检验出生婴儿性别比偏高是否存在女婴漏报的影响。
以2005年1%为例 0-5岁性别比与历年调查数据的比较
方法2,采用与教育入学数据性别比比较的方法,对1990-1999年出生婴儿性别比偏高的形势进行评价。方法2,采用与教育入学数据性别比比较的方法,对1990-1999年出生婴儿性别比偏高的形势进行评价。 从小学招生数推算出生婴儿性别比
方法3:比较历年调查的出生婴儿性别比,把握出生婴儿性别比变化趋势。方法3:比较历年调查的出生婴儿性别比,把握出生婴儿性别比变化趋势。
(三)总人口性别比的准确性 方法1:利用2000年以来历年总人口性别比变化趋势和幅度的比较,以及分年龄性别比偏差的结论。 方法2:采用人口年龄移算,即人口预测的方法,推算总人口的性别比,与实际调查数据进行比较。
对年龄性别数据的使用 • 低年龄人口存在漏报 • 其余年龄、性别数据准确性较高 • 可发布和使用直接登记数据
三、生育水平的准确性 方法1、从小学入学人数推算出生情况。 以评估2005年为例:将1996年-2005年历年小学入学人数,利用逆留存的办法,推算到出生时的人口数,1996-2005年入学的人就是1990-2000年出生的人,对90年代的人口出生状况进行评估。
方法2、实际调查的总和生育率、历年公布的出生数推算的总和生育率以及政策生育率的比较。方法2、实际调查的总和生育率、历年公布的出生数推算的总和生育率以及政策生育率的比较。
方法3、出生率与标准化出生率比较。 • 粗出生率是生育率度量中最基本的综合指标之一,能够较准确地反映生育对人口总量增长的影响,是计算自然增长率的重要组成部分。 • 但出生率也受到人口性别年龄结构的强烈影响 。 • 选择一个标准化的年龄结构,对出生率进行标准化。 • 通过横向和纵向比较,看生育水平的变化。
生育数据的使用 • 出生数据存在漏报 • 直接登记的总和生育率偏低 • 评估后对外发布
首先对出生人口、出生率进行修订 • 根据出生人口数拟合TFR • 考虑育龄妇女的年龄构成、生育政策的变化对出生的影响
如何根据出生人数推算TFR • 人口预测方法。采用年龄移算方法,预测出年龄别育龄妇女人数,用生育率模式拟合出生数,从而确定TFR。 • 采用历史数据拟合。收集各地、历年出生人口与TFR数据,利用出生人口与TFR的关系。 • TFR=B/B1*TFR1(假设漏报在每个年龄均匀分布)。
四、死亡水平的准确性 方法1、利用人口增长平衡方程,估计死亡登记的完整性(可参考有关人口分析技术教课书)。
方法2、标准化死亡率比较 比较不同地区或同一人口在不同时期的粗死亡率,一般采用一个统一的年龄结构(即标准年龄结构)作为权数来计算粗死亡率,以便消除年龄结构的影响。
方法3、分年龄死亡率与2000年比较 通过与前次普查死亡模式的比较,可以进一步分析死亡漏报的年龄分布。
以2005年为例:以2000年的死亡率为1,2005年分龄死亡率与对应年龄死亡率之比绘制出的曲线,可以明确直观地反映出死亡漏报的年龄分布。以2005年为例:以2000年的死亡率为1,2005年分龄死亡率与对应年龄死亡率之比绘制出的曲线,可以明确直观地反映出死亡漏报的年龄分布。
死亡数据的使用 • 登记的粗死亡率较低,死亡人口存在漏报。 • 婴儿死亡率漏报较为严重。 • 用直接登记的年龄别死亡率计算的预期寿命偏高。
对死亡人口、死亡率进行修订 • 修订年龄别死亡率 • 根据修订的年龄别死亡率编制生命表 • 考虑人口年龄构成死亡的影响
如何修订死亡数据 • 采用人口预测方法,推算死亡人口和死亡率。 • 估计死亡漏报人口 • 将漏报人口修正到分年龄死亡数据中 • 参考部门资料,参考死亡模式的变化 • 也可以采用logit变换,直接从2000年生命表生成lx,推出年龄别死亡率,计算预期寿命。
Logit变换:两个不同生命表上存活概率l(x)之间存在一种近似的线性关系。Logit变换:两个不同生命表上存活概率l(x)之间存在一种近似的线性关系。
五、对总人口的估计 • 方法1、利用人口增长平衡方程估计调查的完整性。 • 这是一种估计两次调查人口总量和调查之间死亡登记完整性的方法。 • 其原理是,对于一个封闭人口,有人口增长平衡方程: • 其中,N(a)为达到确切年龄a岁的生存人口数,N(a+)为a岁及a岁以上人口数,r(a+)为a岁及a岁以上人口的增长率,D(a+)为a岁及a岁以上死亡人口数。当a=0岁时,N(0)为出生人口,方程便是总人口的自然增长平衡方程,即出生率=自增率+死亡率。 • 该方法需要编制人口增长平衡方程表。 • 具体请参阅有关人口分析技术教课书。
方法2、利用事后质量抽查总人口评价总人口登记的完整率。方法2、利用事后质量抽查总人口评价总人口登记的完整率。 2000年总人口漏报率为1.81%,漏报人口2300万人。 2005年总人口的漏报率为1.72%,漏报人口2202万人。 2010年总人口漏报率为0.12%,漏报人口160万人。
六、教育数据的准确性 (一)对各种受教育程度人口准确性的估计 (二)对文盲率数据准确性的估计
方法1、从历年各种受教育程度人口比重的变化趋势,看教育数据的一致性。方法1、从历年各种受教育程度人口比重的变化趋势,看教育数据的一致性。
方法2、从2001-2010年各级各类学校招生数、毕业生数把握教育数据的准确性方法2、从2001-2010年各级各类学校招生数、毕业生数把握教育数据的准确性