第一讲教育测评的统计基础

第一讲教育测评的统计基础

一、什么是统计学？ • （一）含义 • 1.研究随机现象的规律 • 2.研究样本与总体的关系

（二）内容 • 1.描述统计 • 研究对数据的初步整理和分析。 • 2.推断统计 • 研究如何通过样本的信息，估计总体的信息和对总体的信息进行推断，这些估计和推断是在一定的概率基础上进行的。 • 3.实验设计

（三）基本概念 • 1.总体与样本 • 2.随机现象 • 3.概率 • 4.抽样 • 5.统计量与参数

（四）方法与功用 • 1.方法：不完全归纳法 • 2.功用： • （1）研究和处理随机事件； • （2）量化研究

二、数据的描述统计分析 • （一）集中量数 • 表示数据集中趋势或典型水平的量数。常用的有算术平均数、中数、众数等。 • 算术平均数（Mean)=所有数据之和/数据的总频数=∑X/N，用 X 表示。 • 平均数的优、缺点：简明易懂、适合代数运算；但易受极端值影响。

（二）差异量数 • 表示数据差异程度或分散程度、离散程度的量数。常用有方差、标准差、平均差等。 • 最常用的是：方差与标准差(std.deviation) • 方差等于离差平方的算术平均数。可用S2、σ2表示。标准差等于方差的平方根，可用S、σ表示。

∑（X - X ）2 • S2=———————— • N • （X1- X）2+ （X2- X）2 +…（Xn- X）2 • = —————————————— • N

（三）标准分数 • 1.定义：标准分数等于离差除以标准差之商。用Z表示。 • Z=（ X - X ）/S • 标准分数是不带单位的相对位置量数，它表示其原始分数在团体中的相对位置。 • 2.T分数=Z×10+50 • 3.CEEB分数=Z×100+500

（四）相关量数 • 1、相关的含义 • 两个随机变量之间不精确、不稳定的变化关系称为相关关系。它与函数关系的区别就在于两个变量值不是一一对应得那样精确、稳定。 • 从变化方向来看，有： • （1）正相关 • （2）负相关 • （3）零相关

从密切程度来看，有： • 1、强相关或高度相关 • 2、中度相关 • 3、弱相关或低度相关

2、相关系数 • 用来描述两个变量之间变化方向及密切程度的数字特征量称为相关系数。用r表示。 • 相关系数的取值范围，[-1，1]。 • 相关系数的值，仅仅是一个比值。不能加减乘除。 • 相关系数只能描述两个变量之间的变化方向及密切程度，并不能揭示二者之间的内在本质联系。 • 相关关系也并不一定是因果关系。

3、积差相关 • （1）积差相关的概念 • 当两个变量都是正态连续变量，而且两者之间呈线性关系，表示这两个变量之间的相关称为积差相关。

（2）积差相关的使用条件 • ① 两个变量都是由测量获得的连续性数据。 • ② 两个变量的总体都呈正态分布。 • ③ 必须是成对的数据，而且每对数据之间是相互独立的。 • ④ 两个变量之间呈线性关系。可由相关散布图的形状来决定。 • ⑤ 要排除共变因素的影响。 • ⑥ 样本容量n ≥ 30，计算出的积差相关系数才具有有效意义。

（3）积差相关系数的定义公式及计算 • ∑（X—X）（Y—Y） • r = —————————— • N σx σy • XY — X Y • = ———————————— • σx σy

三、推断统计的理论基础 • （一）概率的含义及运算 • 1、后验概率 • 　　　　　　　　　　ｍ　 • 　　频率　Ｗ（Ａ）＝— • 　　　　　　　　　　ｎ　 • 　　随机事件Ａ在Ｎ次试验中出现Ｍ次，随着试验次数Ｎ的无限增大，随机事件Ａ的频率稳定于一个常数Ｐ，这个常数Ｐ就是随机事件Ａ出现概率的近似值。可表示为：Ｍ • 　　Ｐ（Ａ）≈─── • N

2、先验概率 • 先验概率是通过古典概率模型加以定义的，故又称为古典概率。 • 　　古典概率模型要求满足两个条件： • 　　（１）试验的所有结果是有限的； • 　　（２）每一种可能结果出现的可能性（概率）相等。 • 　若所有可能结果的总数为Ｎ，随机事件Ａ包括Ｍ个可能结果，则事件Ａ的概率为： • 　　　　　　　　Ｍ • 　　Ｐ（Ａ）＝——— • 　　　　　　　　Ｎ

3、概率的加法和乘法 • （１）概率的加法 • 在一次试验中不可能同时发生的事件称为互不相容事件。　 • 　两个互不相容事件和的概率，等于这两个事件概率之和。 • 　　Ｐ（Ａ＋Ｂ）＝Ｐ（Ａ）＋Ｐ（Ｂ）

（２）概率的乘法 • 　独立事件：Ａ事件出现的概率不影响Ｂ事件出现的概率。 • 　两个独立事件积的概率，等于这两个事件概率的乘积。 • 　　Ｐ（ＡＢ）＝Ｐ（Ａ）Ｐ（Ｂ）

（二）正态分布 • 正态分布的特点 • １、曲线在Ｚ＝０处为最高点。 • ２、曲线以Ｚ＝０处为中心，双侧对称。 • ３、曲线从最高点向左右缓慢下降，并无限伸延，但永不与基线相交。 • ４、标准正态分布上的平均数为０，标准差为１。 • ５、曲线从最高点向左右伸延时，在正负１个标准差之内，既向下又向内弯。从正负１个标准差开始，既向下又向外弯，即拐点位于正负１个标准差处。

四、推断统计的基本原理 • （一）什么是小概率事件？ • 发生的概率非常小的随机事件。通常我们选择概率小于5%或1%的随机事件为小概率事件。 • （二）推断统计的基本假设 • 小概率事件在一次抽样中不可能发生。 • （三）推断统计的基本方法 • 概率意义上的反证法。

（四）举例说明 • 某小学历届毕业生汉语拼音测验平均分数为66分，标准差为12分。现以同样的试题测验应届毕业生（假定应届与历届毕业生条件基本相同），并从中随机抽取36份试卷，算得平均分为70分，问该校应届与历届毕业生汉语拼音测验成绩是否一样？

五、研究问题与推断统计方法 • （一）小学生学习经验调查问卷 • 1.个人变量 • 学生性别；家庭状况等。 • 属于类别和等级变量 • 2. 数学焦虑 • 27题，a1~a27；包括压力惧怕、情绪担忧、考试焦虑、课堂焦虑四个因素层面， • 属于连续变量

3. 数学态度 • 共有30个题目，b1~b30；包括学习信心、有用性、成功态度、探究动机四个层面。 • 属于连续变量。 • 4. 数学投入动机 • 共14个题目，c1~c14；包括工作投入、自我投入动机两个因素层面。 • 属于连续变量

5. 数学成绩 • 自编数学成绩测验，共45题（满分为45分） • 属于连续变量

（二）研究问题与统计方法 • 研究问题1：小学生的数学焦虑、数学态度、数学投入动机与数学成绩的现状如何？ • 以平均数和标准差最为适宜。

研究问题2 • 学生的数学焦虑、数学态度、数学动机、数学成绩间是否有显著的相关存在？ • 计算积差相关 • 计算积差相关的基本假定： • 1.受试样本人数最好在30人以上 • 2.变量间均为连续变量 • 3.变量总体均呈正态分布 • 4.二者相关形态为直线相关，而非曲线相关。

研究问题3 • 不同性别的学生，其数学焦虑、数学态度、数学投入动机与数学成绩是否有显著差异？ • 自变量为学生性别，属于类别变量 • 因变量有4个，均属于连续变量 • 采用独立样本t-test，分开检验 • 为何是独立样本？

研究问题4 • 不同家庭状况的学生，其数学成绩、数学焦虑是否有显著差异？ • 自变量为类别变量，但有4个水平 • 因变量为连续变量 • 采用独立样本单因子变异数分析（one-way ANOVA）

研究问题5 • 学生性别、数学焦虑、数学态度、数学投入动机是否可有效预测学生的数学成绩？其预测力如何？ • 自变量为学生性别、数学焦虑等四个。 • 因变量为数学成绩 • 采用多元回归分析法 • 注意性别是类别变量，须转化为虚拟变量，即0、1变量。

回归方程式 • 多元回归分析之原始化回归方程式为： • Y=B0+B1X1+B2X2+B3X3+……+ BKXK • 其中B0为截距，BK为原始回归系数。 • 标准化回归方程式为： • ZY=Β1ZX1+Β2ZX2+B3ZX3+……+BKZXK • 其中BK为标准化回归系数。

研究问题6 • 学生性别与家庭状况变量在数学成绩上是否有显著的交互作用？ • 自变量有2个：学生性别、家庭状况，均属于类别变量 • 因变量有一个，即数学成绩，为连续变量 • 采用独立样本二因子变异数分析（two-way ANOVA）

研究问题7 • 不同年级的学生在数学态度四个层面上是否有显著差异？ • 自变量为年级，属于间断变量（有3个水平）。 • 因变量数学态度包括四个层面，实际上有四个因变量。 • 采用独立样本单因子多变量变异数分析（multiple analysis of variance,MANOVA)

研究问题8 • 学生性别、家庭状况在数学成绩、数学焦虑、数学态度方面是否有显著的交互作用？ • 自变量有2个，一为二分变量、一为四分变量，均属于间断变量。 • 因变量有3个，均属连续变量。 • 采用独立样本二因子多变量变异数分析法。

研究问题9 • 模式图是否得到支持？ • 采用路径分析 • 径路系数即回归方程式中的标准化回归系数 • 采用多元回归分析法的“强迫输入法”（enter）

路径分析图 数学焦虑数学态度数学成绩投入动机

进行3个复回归分析 • 第一个复回归：效标变量为数学成绩，预测变量为数学焦虑、数学态度、数学投入动机。 • 第二个复回归：效标变量为数学态度，预测变量为数学焦虑、数学投入动机。 • 第三个复回归：效标变量为数学投入动机，预测变量为数学焦虑。

第一讲 教育测评的统计基础