760 likes | 963 Views
第三章 统计描述. Descriptive statistics. 第一节 统计表与统计图. 一、统计表. 统计表的概念:对统计调查所获得的原始资料 进行整理,得到的数据,把这些数据按一定的顺利 排列在表格上,就形成了统计表。广义的统计表包 括统计工作各个阶段中所用的一切表格,如调查表、 汇总表或整理表等。本节所讲的统计表是狭义的 统计表,即将汇总结果按一定顺序排列在由横行、 纵列交叉结合而成的表格中,这种表现统计资料 的表格称为统计表. (一)统计表的定义和结构. 统计表的结构:.
E N D
第三章 统计描述 Descriptive statistics
第一节 统计表与统计图 一、统计表 统计表的概念:对统计调查所获得的原始资料 进行整理,得到的数据,把这些数据按一定的顺利 排列在表格上,就形成了统计表。广义的统计表包 括统计工作各个阶段中所用的一切表格,如调查表、 汇总表或整理表等。本节所讲的统计表是狭义的 统计表,即将汇总结果按一定顺序排列在由横行、 纵列交叉结合而成的表格中,这种表现统计资料 的表格称为统计表 (一)统计表的定义和结构
统计表的结构: 1、从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总表题、横行标题、纵栏标题和指标数值四个部分。总表题是统计表的名称,它扼要地说明该表的基本内容。它置于统计表格的正上方。横行标题是横行的名称,一般放在表格的左方。纵栏标题是纵栏的名称,一般放在表格的上方。指标数值列在横行和纵栏的交叉处,用来说明总体及其组成部分的数量特征,它是统计表格的核心部分。
我国2002年国内生产总值 2、从内容上看,统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标。 纵标题 数 字 资 料 横 标 题 主 词 宾 词
(二)统计表的分类 1/2 (3)复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。 1、按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。 (1)简单表:主词未经任何分组的统计表称为简单表,也称一览表。主词罗列各单位的名称。 (2)分组表:主词只按一个标志进行分组形成的统计表,也称简单分组表。
(二)统计表的分类 2/2 2、按宾词设计分类,可分为宾词简单排列、分组平行排列和分组层叠排列等。 (1)宾词简单排列。宾词不进行任何分组,按一定顺序排列在统计表上。 (2)宾词分组平行排列。宾词栏中各分组标志彼此分开,平行排列。 (3)宾词分组层叠排列。统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起,宾词的栏数等于各种分组的组数连乘积。
(三)统计表的设计 1/3 统计表设计总的要求是:简练、明确、实用、美观、便于比较。 (1)线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。两端一般不划线,采用“开口式”。 (2)合计栏的设置。统计表各纵列若需合计时,一般应将合计列在最后一行,各横行若需要合计时,可将合计列在最前一栏或最后一栏。
(三)统计表的设计 2/3 (3)标题设计。统计表的总标题,横栏、纵栏标题应简明扼要,以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。 (4)指标数值。表中数字应该填写整齐,对准位数。当数字小且可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“” ;不应有数字时用符号“-”表示。
(三)统计表的设计 3/3 (5)计量单位。统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。 (6)注解或资料来源。必要时,在统计表下应加注解或说明,以便查考。
105 110 115 120 125 130 135 140 二、统计图 统计图:统计图是借助几何图形或具体形象来 显示统计数据的一种形式。 首先建立直角坐标系,横轴代表分组变量,纵轴表示频数或频率。以各组距为宽,各组的频数或频率为高,绘制代表各组的直方块,便形成直方图。 (一)直方图 15 12 9 6 3
(二)折线图 折线图:也称多边形图,是在直方图的基础上绘制的。 将每个直方块的顶端中点,即组中值画一个小圆点,然后将这些小圆点用直线相连,即形成折线图。起点通常放在距左边最低组半个组距的横轴上,终点通常放在距右边最高组半个组距的横轴上。 15 频 数 (人) 12 9 6 3 105 110 115 120 125 130 135 140
(三)曲线图 当变量数列的组数无限时,折线便表现为一条平滑曲线。 曲线图的绘制方法与折线图基本相同,只是在连接各组次数坐标点时应当用平滑曲线。 15 频 数 (人) 12 9 6 3
(四)累计曲线图 累计曲线图的绘制。累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。不论是向上累计还是向下累计均以分组变量为横轴,以累计频数(频率)为纵轴。在直角坐标系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向上累计曲线。对于向下累计频数分布图,在直角坐标系上将各组组距下限与其相应累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向下累计分布曲线图。
左偏分布 对称分布 右偏分布 三、频(次)数分布图的类型 主要有以下三种类型: 钟形分布的特征是“两头小,中间大”,即中间的变量值分布的次数多,靠近两边的变量分布的次数少,其曲线图宛如一口古钟。 (一)钟形分布
U型分布 (二)U型分布 U型分布的形状与钟 形分布相反,靠近中间的 变量值分布次数少,靠近 两端的变量值分布次数多, 形成“两头大,中间小”的U 型分布。
正J型分布 反J型分布 (三)J型分布 J型分布有两种类型,一种是次数随着变量的增大而增多,另一种是成反J型分布,其次数随着变量的增大而减少。
第二节 分布的集中趋势 (一)平均指标含义 指概括地描述统计分布的一般水平或集中趋势的数值。 一、描述分布集中趋势的主要指标及其分类 (二)平均指标的特点具有代表性和抽象性。
(三)平均指标的作用 4、分析现象之间的依存关系。 统计平均数具有重要作用,主要体现在以下几点: 1、反映总体各变量分布的集中趋势和一般水平。 2、便于比较同类现象在不同单位间的发展水平。 3、能够比较同类现象在不同时间的发展变化趋势或规律。
(四)平均数的分类 1/2 平均数根据其具体的代表意义和计算方式不同,可分为: 2、位置平均数:根据标志值某一特点位置来确定的平均数。它不是对统计数列中所有各项数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的。 1、数值平均数:是以统计数列的所有各项数据来 计算的平均数。其特点是统计数列中任何一项数据的 变动,都会在一定程度上影响数值平均数的计算结果。
(四)平均数的分类 2/2 算术平均数 调和平均数 几何平均数 幂平均数 众数 中位数 数值平均数 平均数 位置平均数
二、数值平均数 • 数值平均数是对总体各单位某一标志值的平均,表明总体单位标志值的一般水平。 总体单位数: 表示的是一个总体内所包含的总体单位数。 在上面计算公式中,总体标志总量必须是总体各单位标志值的总和,标志值和单位之间存在一一对应关系。 • 基本计算公式是: • 总体标志总量/总体单位数。 • 总体标志总量: • 总体各单位某种数量标志值的总和。
表示总体单位数。 代表算术平均数。 公式中 表示各单位标志值。 (一)算术平均数 1、算术平均数的计算 计算算术平均数有两种式: (1)简单算术平均数 适用于未分组资料,用总体各单位标志值加总得到标志总量除以总体单位总量而得。 计算公式为:
例1:应用条件:资料未分组,各组出现的次数都是1。5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:例1:应用条件:资料未分组,各组出现的次数都是1。5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:
(2)加权算术平均数 计算公式: ①根据单项数列计算加权算术平均数 应用条件:单项式分组,各组次数不同。
例: 某车间20名工人加工某种零件资料:
②根据组距数列计算加权算术平均数 例:某车间200名工人日产量资料: 应用条件:组距式分组,各组次数不同。
2、权数 (1)概念 权数在平均数中的权衡轻重的作用,是直接通过各组单位数占总体单位数的比重,也就是各组的频率-相对数的大小体现出来的。频率的大 对平均数的大小起着权衡轻重的作用。平均数总是趋向于出现次数最多的哪个标志值。 绝对数形式 相对数形式 (2)权数的表现形式 (3)权数的作用
小体现出来的。频率的大小就直接表明了该组标志值在平均数中占据的地位,频率越大,该标志值计入平均数的份额也越大,对平均数的影响就越大;反之,频率越小,该标志值计入平均数的份额就越小,对平均数的影响就越小,这就是权数权衡轻重作用的实质。小体现出来的。频率的大小就直接表明了该组标志值在平均数中占据的地位,频率越大,该标志值计入平均数的份额也越大,对平均数的影响就越大;反之,频率越小,该标志值计入平均数的份额就越小,对平均数的影响就越小,这就是权数权衡轻重作用的实质。 当各组的次数都相同时,各标志值对平均数的影响都相同时,那就无所谓权数的“权衡轻重”了。 在这种情况下,加权算术平均数就等 (4)权数不起作用的场合
于简单算术平均数。 可以说,简单算术平均数实际上是加权算术 平均数的特例。 即当 时,
(5)权数的选择 一般说来,次数就是权数,但在计算相对指标的平均数时,经常遇到次数不是权数的情况。故在求相对指标的平均数时,应根据相对指标的含义选择适当的权数。
(6)由比重权数计算加权算术平均数 应用条件:已知的是比重权数(次数是比重) 例1: 公式:
4、根据相对数(平均数)计算的加权 (1)根据相对数计算的 某局所属的三个企业的资料:
(2)根据平均数计算的 某企业各班组工人劳动生产率资料:
3、是非标志的平均数 是非标志:也称交替标志,当总体单位某种品质标志的具体表现为“是”与“非”或“有”与“无”两种情况时,这种品质标志就称为是非标志。 平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。
例:某工厂生产某种产品合格率为95%,不 合格率为5%,求是非标志平均数。
4、算术平均数的数学性质 (1)各个变量值与其平均数离差之和等于零 (2)各个变量值与其平均数离差平方之和为最小值
(3)给每个变量值增加或减少一个任意数A,则算术平均数也相应增增加或减少这个任意数A。(3)给每个变量值增加或减少一个任意数A,则算术平均数也相应增增加或减少这个任意数A。 (4)给每个变量值乘以或除以一个任意数A,则算术平均数也相应扩大或缩小A倍。
(二)调和平均数(H) 是社会经济统计中常用的另一种平均指标,它是根据标志值的倒数计算的,所以又称倒数平均数。与算术平均数一样,调和平均数有简单调和平均数和加权调和平均数两种。 1、简单调和平均数 计算公式: 应用条件:资料未分组,各个变量值次数都是1。 例:一个人步行两里,走第一里时速度为每小时候 10里,走第二里时为每小时20里,则平均速度为:
2、加权调和平均数 计算公式: 应用条件:资料经过分组,各组次数不同。 例1:
(三)几何平均数(G) 是另一种形式的平均数,是N 个变量值乘积的 N 次方根。主要用于计算平均比率和平均速度。几何平均数也有简单几何平均数和加权几何平均数两种。
1、简单几何平均数 计算公式: 应用条件:资料未分组(各变量值次数都是1)。 例:某企业生产某种产品需经过三个连续作业车间才能完成。
2、加权几何平均数 应用条件:资料经过分组,各组次数不同。 计算公式: 例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率 设本金为
三、位置平均数 1、众数的含义:总体中出现次数最多、频率最高的标志值。 (一)众数 2、确定众数的方法。 (1)单项数列确定众数
(2)由组距数列确定众数 1、计算公式:
农户年人均收入众数计算表 例:
(二)中位数 1、中位数的含义:将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数就是中位数。 2、确定中位数的方法 (1)由未分组资料确定中位数 ①标志值的个数是奇数 例:7名工人生产某种产品,日产量(件)分别为4、6、6、8、9、12、14。位于中间位置的第四名工人的日产量8件为中位数。
②标志值的个数是偶数 上例增加为8名工人,日产量为4、6、6、8、 9、12、13、14。中位数为 , )。 其位置在第四和第五名中间 (
(2)由单项数列确定中位数 例: 中位数为第40 名和41名日产量的平均值 [ ]