670 likes | 881 Views
Chapter Three central tendency 算术平均数 中数 百分位数 众数 加权平均数 几何平均数 调和平均数. 算术平均数( average ) : 未归表的原始数据计算算术平均数: 8 、 2 、 5 、 3 、 7 已归表的原始数据计算算术平均数. 中数 (Median) :位于一组按大小顺序排列的数据中间位置上的数据。 未归表的原始数据计算算术平均数:中数 = ( N+1 ) /2 数据个数为奇数与偶数的情形 数据个数为奇数与偶数时有重复数据的情形 1 , 9 , 5 , 5 , 5 , 7 , 4— 4.5-5.5
E N D
Chapter Three central tendency • 算术平均数 • 中数 • 百分位数 • 众数 • 加权平均数 • 几何平均数 • 调和平均数 大师教育 www.dashikaoyan.com
算术平均数(average): • 未归表的原始数据计算算术平均数:8、2、5、3、7 • 已归表的原始数据计算算术平均数 大师教育 www.dashikaoyan.com
中数(Median) :位于一组按大小顺序排列的数据中间位置上的数据。 • 未归表的原始数据计算算术平均数:中数=(N+1)/2 • 数据个数为奇数与偶数的情形 • 数据个数为奇数与偶数时有重复数据的情形 • 1,9,5,5,5,7,4— 4.5-5.5 • 1,9,5, 5,5, 7,4— 4.5-5.5 • 已归表的原始数据计算算术平均数 大师教育 www.dashikaoyan.com
百分位数(Percentiles):位于依一定顺序排列的一组数据中某一百分位置的数据。百分位数(Percentiles):位于依一定顺序排列的一组数据中某一百分位置的数据。 大师教育 www.dashikaoyan.com
众数(Mode):一组数据中出现次数最多的那个数。众数(Mode):一组数据中出现次数最多的那个数。 • 用观察法计算 • 用公式计算: • W.I.King插补法 大师教育 www.dashikaoyan.com
加权平均数(weighted mean),有时也可称为总体平均数,是几个样本的平均数组成的总体的平均数。 大师教育 www.dashikaoyan.com
几何平均数(GEOMEAN):当一个数列的后一个数据是以前一个数据为基础成比率增长时,可用集合平均数求平均增长速度。几何平均数(GEOMEAN):当一个数列的后一个数据是以前一个数据为基础成比率增长时,可用集合平均数求平均增长速度。 大师教育 www.dashikaoyan.com
调和平均数(HARMEAN):主要用于求学习速度 大师教育 www.dashikaoyan.com
Chapter Four Measures of Variation • 全距(Range) • 四分位差(Quartile) • 百分位距(Percent Rank) • 平均差(AD) • 方差和标准差(Variance & SD) • 汇合标准差或总体标准差(ST) • 偏态量(Skew) • 峰态量(Kurt) • 相对标准差(CV) • 标准差(Z) 大师教育 www.dashikaoyan.com
全距(Range) • 四分位差(Quartile) • 百分位距(Percent Rank) 大师教育 www.dashikaoyan.com
1、5、8、12、13、16、19、28、30; 50、51、59、65、66、79、82、90; 大师教育 www.dashikaoyan.com
平均差(AD—average deviation, or MD—median deviation): • 未归表数据求平均差; • 已归表数据求平均差。 大师教育 www.dashikaoyan.com
MD 大师教育 www.dashikaoyan.com
方差和标准差(variance and standard deviation): • 未归表数据求方差和标准差 • 已归表数据求方差和标准差 大师教育 www.dashikaoyan.com
汇合标准差或总体标准差 大师教育 www.dashikaoyan.com
标准分数(Z):以标准为单位,标志某一分数离开团体均数的距离:标准分数(Z):以标准为单位,标志某一分数离开团体均数的距离: 大师教育 www.dashikaoyan.com
相对差异量(relative deviation):该值一般在5%-35%之间。 大师教育 www.dashikaoyan.com
偏态量(Skew):当N>200以上时,计算的偏态系数才是可靠的。SK>0为正偏态,SK<0为负偏态, SK=0 为正态。 大师教育 www.dashikaoyan.com
Y X O 大师教育 www.dashikaoyan.com
Y X O 大师教育 www.dashikaoyan.com
峰态量(kurt):Ku以0.263为判断值,小于为高狭峰,大于为低阔峰; u以0为判断标准,大于0为高狭峰,小于0为低阔峰。 大师教育 www.dashikaoyan.com
Y O X 大师教育 www.dashikaoyan.com
Y O X 大师教育 www.dashikaoyan.com
练习与思考题P71-72: • 作业:2、5、6、7、8、11 • 其它:练习 大师教育 www.dashikaoyan.com
单元总结: • 1. 心理与教育统计学研究的主要内容有哪些? • 2. 为什么要学习心理与教育统计学? • 3.次数分布表的制作分为哪几步? • 4. 解释下列概念:随机变量 样本 统计量 参数 随机现象 • 5. 什么是集中量?包含哪些计算指标? • 6. 当一组数据呈正态分布时,中枢、均数与众数之间具有怎样的关系? • 7. 请分别写出下列统计量的基本计算公式:均数 加权平均数 • 8.请分别写出下列统计量的基本计算公式:平均差 标准差 标准分数 偏态量 峰态量 大师教育 www.dashikaoyan.com
9. 什么是四分位距?如何计算? 10. 什么是百分位距?百分等级?两者之间是什么关系? 11. 当一组数据呈正态分布时,全距、平均差、四分位距与标准差之间具有怎样的关系? 12. 差异量的作用是什么? 大师教育 www.dashikaoyan.com
Chapter Five Probability and Distribution • 概率的含义 • 二项分布 • 正态分布 大师教育 www.dashikaoyan.com
描述统计与推论统计的关系: • 前面介绍的统计方法是对研究所获资料进行一般性描述,但科学研究的任务更重要的是根据所获资料去推论由其所代表的总体的一般性情况。由于研究中所获数据多为随机数据或随机变量,因此,根据随机变量去推论由它们所构成的总体,就要依赖描述随机变量规律性变化的理论即概率论为基础。 • 概率的含义: • 后验概率:在对随机现象进行N次观察时,组成该随机现象的随机事件之一随机事件A出现的次数为M次,随着观测次数的不断增加,随机事件A发生的可能性逐渐稳定在M/N附近,该值就被用来描述随机事件A在该随机现象中有规律地出现的可能性大小,即随机事件A发生的概率,表示为: 大师教育 www.dashikaoyan.com
先验概率或古典概率:指对满足下列条件的随机事件发生可能性的描述,如掷色子或抛硬币:先验概率或古典概率:指对满足下列条件的随机事件发生可能性的描述,如掷色子或抛硬币: • 试验的每一种可能结果(称为基本事件)是有限的; • 每一个基本事件出现的可能性相等; • 概率的性质: • 公理性质: • 任何一个随机事件都是非负的; • 必然事件的概率为1; • 不可能事件的概率为0; • 加法定理: • 两个互不相容的事件之和的概率为两个事件概率之和。 • 互不相容的事件指在一次观测中不能同时发生的事件。 大师教育 www.dashikaoyan.com
公式表示为: • 可推广为: 大师教育 www.dashikaoyan.com
举例:凭猜测回答2道是非题,答对1题的可能性有多大?至少答对1题的可能性有多大?全猜对的可能性多大?举例:凭猜测回答2道是非题,答对1题的可能性有多大?至少答对1题的可能性有多大?全猜对的可能性多大? • × × 1/4 • × √ 1/4 • √ √ 1/4 • √ × 1/4 大师教育 www.dashikaoyan.com
乘法定理: • 两个独立事件同时发生的概率等于这两个事件各自出现概率的乘积。 • 独立事件指一个事件的出现对另一个事件的出现不发生影响。 • 公式表示为: 大师教育 www.dashikaoyan.com
举例:甲射手击中目标的概率为0.9,乙射手击中目标的概率为0.8,问甲乙两人同时击中目标的概率为多少?击中目标的概率为多少?举例:甲射手击中目标的概率为0.9,乙射手击中目标的概率为0.8,问甲乙两人同时击中目标的概率为多少?击中目标的概率为多少? 大师教育 www.dashikaoyan.com
概率分布:指用数学方法(函数)对随机变量取值的分布情况加以描述。概率分布:指用数学方法(函数)对随机变量取值的分布情况加以描述。 • 概率分布的类型: • 离散分布与连续分布 • 离散分布:随机变量取孤立的值时的概率分布,如二项分布; • 连续分布:连续随机变量的概率分布;如正态分布 • 经验分布与理论分布: • 经验分布:根据观察或实验所获得的饿数据而编制的次数分布或相对频率分布; • 理论分布:一指随机变量概率分布的函数—数学模型;二指按某种数学模型计算出的总体次数分布; 大师教育 www.dashikaoyan.com
基本随机变量分布与抽样分布: • 基本随机变量分布:理论分布中描述构成总体的基本变量的分布; • 抽样分布:样本统计量的理论分布;样本统计量如平均数、两平均数之差、方差、标准差、相关系数、回归系数、百分比率等等是基本随机变量的函数,即统计量是由基本随机变量计算而来的,故抽样分布又称为基本随机变量函数的分布。 大师教育 www.dashikaoyan.com
二项分布: • 二项分布试验:指满足下列条件的试验: • 一次试验只有两种可能结果,即成功或失败; • 各次试验相互独立,即各次试验之间互不影响; • 各次试验中成功的概率或失败的概率相等 • 二项分布函数: • 含义:描述在N次试验中成功事件出现不同次数的概率分布。 • 表达式: 大师教育 www.dashikaoyan.com
二项分布表达式的由来: • 以抛硬币为例:抛3次硬币,出现的可能结果分布如下(p代表正面,q代表反面): • ppp, ppq, pqq, qqq, qqp, qpp, pqp, qpq • 出现的结果可分成四类,即:p3、3 p2 p1、 3p1 p2、 p3,它们恰好是根据二项式定理对(p+q)3进行推导的展开式,若进行N次观察,则出现的各种可能结果就可用二项式定理(p+q)n的展开式加以对应描述,二项展开式的各项系数也可用杨辉三角直接求出。 • 二项分布图的性质: • 当P=Q时,不管N多大,呈对称分布;当N 很大时,接近正态分布; • 当P不等于Q且N较小时,图形呈偏态:偏的方向取决于P与Q相比睡大睡小 大师教育 www.dashikaoyan.com
二项分布图的平均数与标准差:当其接近正态分布时:二项分布图的平均数与标准差:当其接近正态分布时: • 平均数: • 标准差: • 二项分布的应用: • 用来判断成功事件出现的概率; • 判断试验结果的机遇性与真实性的界限。如回答10道四择一的选择题,如何判断学生的回答是真实的而非猜测? • 练习与作业P96-97:1--5 大师教育 www.dashikaoyan.com
正态分布:连续性随机变量的概率分布 • 正态分布的函数 • 或写成标准正态分布的形式: 大师教育 www.dashikaoyan.com
当样本均数等于总体均数时,可写成: • 当标准差为1时, • 即Y的最大值为0.3989 大师教育 www.dashikaoyan.com
曲线为频数(频率)曲线,略呈钟型,两头低,中间高,左右对称,近似数学上的正态曲线(normal curve),故称这种分布为正态分布(normal distribution)。 大师教育 www.dashikaoyan.com
正态分布曲线的性质: • 以过平均数的点为轴,两侧对称,均数、中数、众数三者相等,此点Y至最大,左右相当的饿间距面积相等; • 中央点最高向两侧下降,先里后外,拐点位于正负一个标准差处,曲线两端无限延伸,但最终不与基线相交; • 正态曲线下的面积为,以平均数为界,左右各占0.5,每一横坐标的值是其所对应面积与总面积的比值,是其所代表的随机变量的出现概率; • 正态分布的形态取决于平均数和标准差; • 正态部分中各差异量的值 都有固定的比率(见P155); • 正态分布中的标准差与概率之间具有一定的数量关系:即正负一个标准差包含68.26%的面积;正负一个标准差包含95%的面积;正负一个标准差包含99%的面积。 • 依标准分数性质,标准正态分布均数为0, 标准差为1 大师教育 www.dashikaoyan.com
正态分布曲线表的编制与使用: • 正态曲线下各对应的横坐标处与平均数之间的面积即个体概率及密度函数值(Y值)可根据Z值 的变化用积分公式加以计算(如下式),公式中的为X轴上无限小的区间。由于不同的编制者,有的从Z为无限小开始计算,有的Z=0开始计算,所制作的正态分布曲线表也就不同。 大师教育 www.dashikaoyan.com