外语教学与研究统计方法

外语教学与研究统计方法

为什么要学习统计方法？ • 1. 统计方法给我们一种看问题的视角、分析问题的手段，使我们可以从数量的角度，分析和认识现象的特点、规律、模式、趋势或关系。 • 2. 统计方法给我们一种精确测量的手段。例如对于“水平高”的概念，我们可以用数学计量的手段给予更精确的描述。 • 3. 可以使我们对现象的数量表现，做出更科学的判断。 • 4. 增强研究的自主性。数据收集的过程是自主的，对数据的处理和分析是原创的，得出的结论大大避免了抄袭的危险。

第一讲基本概念1. 数据类型：定类数据与定距数据2. 总体与样本3. 误差：抽样误差与非抽样误差4. 显著性与显著水平 1. 不同的数据需要采用不同的统计方法； 2. 人们一般研究的都是样本； 3. 统计中误差无所不在； 4. 显著性反映的是研究结论的确定性。

数据类型之：定类数据定类数据是一种分类数据。它是对观测对象按不同特性分类，并统计各类出现的次数（频数）后得到的结果。数据类型之：定类数据定类数据是一种分类数据。它是对观测对象按不同特性分类，并统计各类出现的次数（频数）后得到的结果。例如可以按性别、班级、课程等进行分类统计。定类测量中的类没有大小之分，只有频数高低。不能在类之间进行数学运算。

数据类型之：定距数据定距数据是对测量对象按一定尺度测量后得出的数值。所用测量尺度有恒定的单位，单位之间的距离是相等的。数据类型之：定距数据定距数据是对测量对象按一定尺度测量后得出的数值。所用测量尺度有恒定的单位，单位之间的距离是相等的。例如对成绩、年龄等的测量通常得到的是定距数据。人们可以对定距数据进行数学运算，比较不同数值之间的大小。

总体总体指具有相同特征或者性质的所有个体之和。总体可大可小。例如二语学习者是大总体，某校一年级新生则是小总体。总体总体指具有相同特征或者性质的所有个体之和。总体可大可小。例如二语学习者是大总体，某校一年级新生则是小总体。样本样本指从总体中选取的一部分个体。由于常常不能直接研究总体，所以人们常常通过样本来推断总体。样本有随机样本和非随机样本之分。

抽样误差抽样误差是客观存在。只要从总体中抽取样本，就会存在抽样误差。抽样误差抽样误差是客观存在。只要从总体中抽取样本，就会存在抽样误差。从一个总体中抽取的样本均值与总体均值之间多数存在差异。从一个总体中抽取的不同样本均值之间也多数存在差异。为了减少抽样误差，最好用随机抽取的大样本。

Mean=28 Mean1=25 Mean2=30

非抽样误差非抽样误差是由于技术上原因，如测量工具不准，或是人为操作造成的误差。非抽样误差非抽样误差是由于技术上原因，如测量工具不准，或是人为操作造成的误差。比较典型的非抽样误差是考试分数合计错误，或者是数据录入失误。避免非抽样误差的方法是仔细测量和认真录入与核对。

显著性显著性的概念涉及统计分析结果的可靠性。显著性检验用于验证统计结果是自然存在的还是由偶然因素如误差造成的。显著性显著性的概念涉及统计分析结果的可靠性。显著性检验用于验证统计结果是自然存在的还是由偶然因素如误差造成的。显著性水平显著性水平是衡量显著性的标准。在社会科学和应用语言学研究中，通常设定的显著水平为p=0.05。大于0.05的统计结果，通常说无显著差异，或无显著相关。等于/小于0.05的统计结果，通常说有显著差异，或显著相关。

描述统计 平均值、标准差、交互表、频数表

平均值：所有个值之和除以个值的数目。总体均值用μ表示，样本均值用表示。平均值：所有个值之和除以个值的数目。总体均值用μ表示，样本均值用表示。

70个学生的四级平均成绩

标准差：是数据内部差异的一种量度。标准差越大，内部差异也越大。例：两个班期末考试平均分相等，甲班的标准差为5分，乙班的标准差为10分，说明乙班的内部差异大于甲班。标准差：是数据内部差异的一种量度。标准差越大，内部差异也越大。例：两个班期末考试平均分相等，甲班的标准差为5分，乙班的标准差为10分，说明乙班的内部差异大于甲班。

70个学生四级成绩的标准差

Empirical Rule1 经验法则1 正态分布的数据 -1σμ +1σ • 大约68％的数值在均值的一个标准差范围内

Empirical Rule2 • 正态分布的数据 • -2σμ +2σ • 大约95％的数值在均值的2个标准差范围内。

Empirical Rule3 • 正态分布的数据 -3σμ +3σ • 几乎全部（99.7％）数值在3个标准差范围内。

大学英语四级考试成绩分布 均值：500 标准差：70 430 500 570 • 大约68％的四级考试分数在430到570之间。

大学英语四级考试成绩分布2 • 360 500 640 • 大约95％的考试分数在360到640之间。

英语四级考试成绩分布 290 500 710 • 几乎全部（99.7％）数值在290到710之间。

交互表交互表是对定类数据的一种归纳和表现形式。交互表根据行数和列数，分别有2x2表, 2x3表，或者j x k表。

频数表一种频数表是简单罗列数据中每个数值出现的次数；另一种频数表是按一定的区间，分组统计和罗列数值出现的次数。频数表一种频数表是简单罗列数据中每个数值出现的次数；另一种频数表是按一定的区间，分组统计和罗列数值出现的次数。

推断统计推断统计主要根据概率理论，利用各种分布模型，进行组之间、变量之间的差异或相关的显著性检验。推断统计推断统计主要根据概率理论，利用各种分布模型，进行组之间、变量之间的差异或相关的显著性检验。推断统计主要回答的问题是： 1）不同组或不同变量的均值之间存在的差异是否显著？ 2）两个变量之间的相关关系是否显著？

常用的差异检验方法1）独立样本的t检验2）成对样本的t检验3）一元方差分析4）卡方检验常用的差异检验方法1）独立样本的t检验2）成对样本的t检验3）一元方差分析4）卡方检验一般情况下： 1）如果数据是定距数据，根据数据情况，分别采用前三种方法； 2）如果数据是定类数据，采用卡方检验的方法。

独立样本t检验(independent sample t-test)独立样本t检验用于检验同一个变量下的两组数值之间是否存在显著差异。应用的研究问题： 1）一次考试中的两个班的成绩是否存在显著性差异？ 2）一次考试中的男女生的成绩是否存在显著性差异？

独立样本t检验要看计算出的t值和对应的sig.值，或者说显著性水平。如果sig.值大于0.05，两组之间没有显著差异，如果sig.值小于0.05，两组之间存在显著差异。在报告时，要报告t值和sig.值。独立样本t检验要看计算出的t值和对应的sig.值，或者说显著性水平。如果sig.值大于0.05，两组之间没有显著差异，如果sig.值小于0.05，两组之间存在显著差异。在报告时，要报告t值和sig.值。例：独立样本t检验的结果显示，多媒体教学实验班和常规教学班（对照班）的英语水平不存在显著性差异（t=1.11, p>0.05）。也就是说，多媒体教学并没有带来比常规教学更好的教学效果。

成对样本的t检验(paired sample t-test)成对样本的t检验用于检验就同一个变量对同一组对象两次收集的数据之间是否存在显著差异。应用的研究问题： 1）某年级学生进校时英语水平和现在英语水平之间是否存在显著差异？ 2）某级学生经过一年的学习后，学习动机是否发生了改变？

成对样本t检验也看计算出的t值和对应的sig.值，或者说显著性水平。如果sig.值大于0.05，成对样本没有显著差异，如果sig.值小于0.05，样本之间存在显著差异。在报告时，要报告t值和sig.值。成对样本t检验也看计算出的t值和对应的sig.值，或者说显著性水平。如果sig.值大于0.05，成对样本没有显著差异，如果sig.值小于0.05，样本之间存在显著差异。在报告时，要报告t值和sig.值。例：成对样本t检验的结果显示，某年级新生进校后经过一段时间的学习，成绩有了显著提高，第二次考试成绩显著高于进校时的成绩（t=3.12, p<0.05）。

方差检验（F检验）(F-test)方差检验用于检验一个变量下的三组之间是否存在显著性差异。方差检验（F检验）(F-test)方差检验用于检验一个变量下的三组之间是否存在显著性差异。例1：研究问题：三种词汇学习方法的效果是否有显著差异？方法1：有意学习方法2：附带学习方法3：附带学习+有意注意例2：研究问题：三种词汇教学方法的效果是否有显著差异？方法1：词表法方法2：阅读法方法3：写作法

方差分析要看计算出的F值和对应的sig.值，或者说显著性水平。如果sig.值大于0.05，说明各组间没有显著差异，如果sig.值小于0.05，至少两组之间存在显著差异。在报告时，要报告F值和sig.值。方差分析要看计算出的F值和对应的sig.值，或者说显著性水平。如果sig.值大于0.05，说明各组间没有显著差异，如果sig.值小于0.05，至少两组之间存在显著差异。在报告时，要报告F值和sig.值。例：研究问题：三种不同的词汇学习方法对词汇学习是否有不同的效果？对词汇考试数据的方差分析显示，三种方法对词汇学习有不同的效果（F=12, p<0.05）。

方差分析的后检验(post hoc test) • 如果要检验那两组之间存在显著性差异，可以 • 1）每两组之间做独立样本的t检验； • 2）做方差分析的后检验，看那两组之间存在差异。

相关分析(correlation test)相关分析考察两个变量之间是否存在一定的关系；如果是，这种关系有多强；而且要检验这种关系是否具有显著性。例如： 1）学习者二语词汇水平与阅读理解水平的关系？ 2）学习者二语词块知识与二语水平的关系？ 3）学习者二语学习动机与二语水平之间的关系？

相关分析要看计算出的r值和对应的sig.值。如果sig.值大于0.05，说明变量之间没有显著相关；如果sig.值小于0.05，说明变量之间存在显著相关。在报告时，要报告r值和sig.值。相关分析要看计算出的r值和对应的sig.值。如果sig.值大于0.05，说明变量之间没有显著相关；如果sig.值小于0.05，说明变量之间存在显著相关。在报告时，要报告r值和sig.值。例：经过统计，我们发现搭配能力与语言能力中度相关。其中, 搭配能力与阅读能力相关系数为.47，显著性达到p < .001；搭配能力与写作能力的相关系数为.514，显著性达到p< .001；搭配能力与听力的相关系数为.443，显著性也达到p < .001；搭配能力成绩与三项成绩总和的相关系数为.545，显著性达到p < .001。（黄强，2002）

卡方检验卡方检验应用于定类数据。1）对单向（单行、单列）分类数据的分析；2）对多向（多行、多列）分类数据的分析。卡方检验卡方检验应用于定类数据。1）对单向（单行、单列）分类数据的分析；2）对多向（多行、多列）分类数据的分析。单向分类数据多向分类数据

卡方检验用于单向分类数据的检验 • 单向分类数据的卡方检验要回答的问题是：“观察数据的分布是否符合某个期望分布？” • 例如： • 1）学生考试成绩的分布是否符合均等分布？ • 或者：各类成绩的学生人数是否相等？ • 2）学生考试成绩的分布是否符合正态分布？ • 检验假设是： • 1）学生考试成绩的分布符合均等分布。 • 或者：各类成绩的学生人数相等。 • 2）学生考试成绩的分布符合正态分布。

卡方检验用于多向分类数据的检验 • 多向分类数据的卡方检验要回答的问题是：“两个因素之间是否相互独立，或者说不存在任何关系？” • 例如： • 1）教龄与对影响学习效果因素的看法是否有关？ • 检验假设是： • 1）教龄与看法无关。

卡方检验要看计算出的卡方值和对应的sig.值。如果sig.值大于0.05，说明因素之间没有显著关系；如果sig.值小于0.05，说明因素之间存在显著关系。在报告时，要报告卡方值和sig.值。卡方检验要看计算出的卡方值和对应的sig.值。如果sig.值大于0.05，说明因素之间没有显著关系；如果sig.值小于0.05，说明因素之间存在显著关系。在报告时，要报告卡方值和sig.值。 1) 学生考试成绩符合均等分布，即各类成绩的学生人数是相同的（卡方值=8.783, p=0.067>0.05）。 2) 教龄与对影响学习效果的因素的看法之间有关系（卡方值=23.25, p=.000 <0.05）。

外语教学与研究统计方法

外语教学与研究统计方法

Presentation Transcript