教育科学研究方法
Download
1 / 184

教育科学研究方法 - PowerPoint PPT Presentation


  • 88 Views
  • Uploaded on

教育科学研究方法. 扬州大学教育科学学院 郭兆明 [email protected] 教育科学研究方法. 教育研究的过程(第三编) 教育研究方法的类型(第二编). 教育研究的过程(第三编). 课题的选择(第八章) 研究方案的设计(第九章) 资料的整理与成果的表述(第十章). 第八章 研究课题的选择. 发现研究问题 检索相关文献 确立研究课题. 发现研究问题. 实际需要 前人的研究. 实际需要(讨论). 数学(阅读)学习不良学生的认知特点及其干预研究 卢仲衡的自学辅导实验法 顾冷沅青浦数学教学改革 布卢姆的教学评价的新突破

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' 教育科学研究方法' - carr


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
教育科学研究方法

扬州大学教育科学学院

郭兆明

[email protected]


教育科学研究方法

  • 教育研究的过程(第三编)

  • 教育研究方法的类型(第二编)


教育研究的过程(第三编)

  • 课题的选择(第八章)

  • 研究方案的设计(第九章)

  • 资料的整理与成果的表述(第十章)


第八章 研究课题的选择

  • 发现研究问题

  • 检索相关文献

  • 确立研究课题


发现研究问题

  • 实际需要

  • 前人的研究


实际需要(讨论)

  • 数学(阅读)学习不良学生的认知特点及其干预研究

  • 卢仲衡的自学辅导实验法

  • 顾冷沅青浦数学教学改革

  • 布卢姆的教学评价的新突破

  • 80年代以来师范生素质的发展趋势研究

  • 高职院校学生职业性向测试分析研究


前人的研究

  • “一步评价”技术研究

  • 样例学习的研究

    (1)单个样例的研究(子目标,无具体目标)

    (2)多个样例的研究(样例个数、样例呈现方式)

    (3)样例学习与问题解决的比较


检索相关文献

  • 文献检索在教育科研中的作用

  • 教育文献的种类及主要分布

  • 文献检索的过程和主要方法


文献检索在教育科研中的作用

  • 避免重复劳动,提高科学研究的效益

  • 做好文献综述


教育文献的种类及主要分布

  • 书籍

  • 报刊

  • 网络媒体(中国知网,CNKI)


文献检索的过程和方法

  • 过程(主题、关键词、作者、来源)

  • 方法(按时间查、按照引文查)


确立研究课题

  • 确立研究课题的思维策略

  • 论证研究课题的主要问题


确立研究课题的思维策略

  • 分析课题的研究价值(结合项目申报)

    (1)理论价值

    (2)实践价值

  • 考察研究人员的主观条件

  • 考虑研究的客观条件


在选择课题时,要尽量避免

(1)范围太大,无从下手;

(2)在现有条件下,难度较大,资料缺乏;

(3)属于经验感想之谈,而不是科研题目。


论证研究课题的主要问题

  • 研究问题的性质(理论研究、应用研究)

  • 研究的目的和意义(研究价值)

  • 国内外相关研究现状、可能有所突破之处。

  • 研究的可能性、基本条件

  • 研究的步骤及成果形式


第九章 教育研究方案的设计

  • 制定研究方案的主要注意事项:

    (1)陈述研究课题

    (2)论述研究的目的和意义

    (3)阐述研究假设和依据

    (4)阐述研究内容

    (5)确定研究对象

    (6)选择抽样方法

    (7)选择研究方法和工具

    (8)制定行动计划


第十章 教育研究的资料整理与成果表述

  • 研究成果的的基本格式

    (1)题目(20字以内)

    (2)摘要和关键词

    (3)主体【引言、方法、结果、讨论(定量研究)】

    (4)参考文献


第二编 教育研究方法的类型

  • 教育研究的实证方法(第四章)

    1、问卷调查法

    2、教育测量法

    3、教育实验法

    4、内容分析法

  • 教育研究的质性方法(第五章)

    1、访谈调查法

    2、叙事研究法


第四章 教育研究的实证方法

  • 问卷调查法

  • 教育测量法

  • 教育实验法

  • 内容分析法


问卷调查法

  • 界定

  • 特点

  • 步骤

  • 案例研究【问卷举例(SCL90,职业兴趣、16PF,开发者问卷)】


界定

  • 是研究者用严格设计的问卷,通过书面语言与被调查者进行交流,来收集研究对象关于教育问题或教育现象的信息和资料的方法。


特点

  • 调查工具标准化

  • 调查过程标准化

  • 调查结果标准化

  • 研究效率高


步骤

  • 设计前的探索

  • 设计问卷的结构

  • 设计问卷初稿

  • 试用和修改问卷

  • 发放和回收问卷(回收率应不低于70%)

  • 分析调查结果


设计问卷初稿

  • 选择调查类型

  • 选择问题形式

  • 斟酌问题表述

  • 设计规范答案

  • 关注问题数量(时间控制)

  • 合理排列问题


选择调查类型

  • 就调查内容而言,选择综合调查或专题调查。

  • 就调查目的而言,选择常模调查或比较调查

  • 就调查范围而言,选择普遍调查或抽样调查


选择问题形式

  • 填空式

  • 是否式

  • 多项单选式

  • 多项限选式

  • 表格式(答题纸)或量表式(P83)

  • 排序式(P83)


案例研究

  • 中小学生家庭作业心理现状的调查分析

  • 上海市中小学生家庭教育现状的调查分析

  • 五年制师范生心理健康状况SCL-90的调查分析

  • 小学数学作业批改的现状的调查分析

  • 中小学生闲暇生活状况的调查分析

  • 物理教师课堂教学行为的调查分析


教育测量法

  • 界定

  • 特点

  • 步骤

  • 个案研究


界定

  • 教育测量法:根据某种规则,以数量化的形式描述教育现象的某种属性。


特点

  • 以测验为工具对研究对象进行测试,从而获得数量化的结果,并通过进一步分析获得相关结论。例如,了解学生的知识和能力发展情况。


编制测验的步骤

  • 确定测验目的

  • 确定测验内容

  • 确定测验形式

  • 筛选题目(难度、区分度)

  • 标准化过程

  • 鉴定测验(信度、效度)

  • 编写测验指导书


项目分析

  • 第一单元 项目难度

  • 第二单元 项目区分度


第一单元 项目难度

  • 项目难度的定义

  • 项目难度的计算方法

  • 难度水平的确定


项目难度的定义

  • 项目难度(difficulty)是指题目的难度。

    【注】

    (1)在非能力测验(如人格测验)中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答该题的人数,其计算方法与难度相同。

    (2)难度的指标通常以通过率表示,以答对(通过)该题的人数百分比来表示:

    P=(R/N)×100%,P表示项目难度,N表示全体被试数,R为答对(通过)该项目的人数。从公式可以发现:难度越大,P值越小。


计算方法

  • 二分法计分项目

  • 非二分记分的项目


二分法计分项目

  • 心理测验的项目大多为选择题,通过计1分,错误计0分。

    1、当被试较少时,对这类题目可以直接使用公式P=(R/N)×100%计算难度。

    2、当被试较多时,则可根据测验总成绩将被试分成三组:分数最高的27%被试分为高分组,分数最低27%被试为低分组,中间46%的被试为中间组。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。其公式为:

    P=(PH+PL)/2 式中P表示难度,PH和PL分别代表高分组和低分组通过率。


非二分记分的项目

  • 当测验项目为问答题或不能用二分法记分的形式时,一般用下面的公式计算难度。


难度水平的确定

  • 项目难度

  • 测验的难度


项目难度

  • 进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。


测验目的

  • 准确测量个体的差异。 在选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.50±0.20之间。

    注:(1)若P=0或1时;

    (2)P=0.5时,举一个极端的例子,假如某测验各试题间的相关系数均为1,难度均为0.50,那么就有可能使50%的被试答对所有的题目得满分;另外50%的被试无法通过任何试题得0分)


测验的性质

  • 当测验用于选拔或诊断时,应该比较多地选择难度值接近录取率的项目。

    (1)若测验是要选拔少数最优秀的被试,测验就应该有相当高的难度,P值就应该小。例如,如果录取率为20%,那么题目难度最好确定为20%,使得恰好20%的优秀被试通过;

    (2)假如测验是要诊断出少数较差的被试,则测验难度应该小,P值应该高,使得只有少数被试不能通过。


测验的形式

  • 对于选择题来说,P值一般应该大于概率水平。例如,对于是非题,其难度值应该为0.75最为合适;而对于四选一的题目,其难度值约为0.63时最为适宜。


测验的难度

  • 通过考察测验分数的频数分布,可以对测验的难度作出直观检验(常态分布,偏态分布:正偏态分布、负偏态分布)。

    (1)如果被试的取样具有代表性,对于中等难度的测验,其测验总分应该接近常态分布。如果得分多数偏高或偏低,则分别为“负偏态分布”和“正偏态分布”。

    (2)正偏态分布,即大多数得分集中在低端,说明编制的测验对于所要研究的样本团体来说偏难,因此,必须增加足够数量的较容易的项目;

    (3)负偏态分布,即大多数得分集中在高分端,说明测验过容易,必须增加足够数量的有高难度的项目。


第二单元 项目区分度

  • 项目区分度的定义

  • 项目区分度的计算方法

  • 区分度与难度的关系


项目区分度的定义

  • 项目区分度(item discrimination),也叫鉴别力,是指测验项目对被试的心理特性的区分能力。


项目区分度的计算方法

  • 鉴别指数

  • 相关法


鉴别指数

1.按测验总分高低排列答卷;

2.确定高分组与低分组,每一组取答卷总数的27%;

3.分别计算高分组与低分组在该项目上的通过率或得分率。

4.按下列公式估计出项目的鉴别指数:D=PH-PL,式中D为鉴别指数,PH为高分组在该项目上的通过率或得分率,PL为低分组在该项目上的通过率或得分率。

【注】高分组若在该测验上的得分率高于低分组,则D>0,D越大,说明该项目区分两种不同水平的程度越高。若D<0,则反映高水平组在该项目上的得分率反而低于低水平组,说明有问题。


1965年,美国测验专家(L.Ebel)根据长期的经验提出用鉴别指数评价项目性能的标准,


相关法

  • 计算区分度最常用的方法是相关法,即以某一项目分数与效标成绩或测验总分的相关作为该项目区分度的指标。相关越高,表明项目越具有区分的功能。


区分度与难度的关系

  • 难度和区分度是相对的,是针对一定团体而言的,绝对的难度和区分度是不存在的。一般来说,较难的项目对高水平的被试区分度高,较易的项目对水平低的被试区分度高,中等难度的项目对中等水平的被试区分度高。由于人的大多数心理特性呈常态分布,所以项目难度的分布也以常态分布好,即特别难与特别易的项目少一些,接近中等的项目多一些,而所有项目的平均难度为0.50,这样不仅能够保证多数项目具有较高的区分度,而且可以保证整个测验对被试具有较高的区分能力。


测验的信度

  • 信度的概念

  • 信度评估的方法


信度的概念

  • 信度的定义

    信度(reliability)指的是测量结果的稳定性程度。

    注: (1)若能用统一测量工具反复测量某人的同一心理特质,则其多次测量的结果间的一致性程度就叫信度。有时也叫测量的可靠性。

    (2)例如:比较钢尺与具有弹性的皮尺测量长度的信度。


第二单元 信度评估的方法

(1)重测信度

(2)复本信度

(3)内部一致性系数

(4)评分者信度


重测信度

  • 含义和计算

  • 使用的前提条件

  • 优点、缺点

  • 注意点

  • 使用重测信度的量表举例


定义和计算

  • 重测信度

    (1)含义:是指同一量表对同一组被试两次所得结果的一致性程度。

    (2)计算:大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。

    注:(1)此测验主要测量测验跨时间的稳定性,所以,又称稳定性系数。

    (2)当信度较大时,说明前后两次测量的结果比较一致,测量工具比较稳定,被试的心理特质受被试状态和环境变化的影响较小。


使用的前提条件

(1)所测量的心理特性必须是稳定的。例如,成人的人格测验就可以;但儿童的成就测验就不行(例如,刚入学儿童的识字量)。

(2)遗忘和练习的效果基本上互相抵消。智力测验的间隔时间一般在6个月左右。

(3)在两次施测的间隔时期内,被试的心理特质方面没有获得更多的学习和训练。


优、缺点

  • 优点:能够提供测验是否随时间而变异的资料,可作为被试将来行为表现的依据。

  • 缺点:易受练习和记忆的影响。

    (1)如果两次施测间隔的时间太短,则记忆犹新,练习的影响较大;

    (2)如果间隔的时间太长,则身心发展与学习经验的积累等足以改变分数的意义,而使得相关减低。最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周为宜,时间间隔最好不超过六个月。


注意点:

  • 同一量表,随着第二次测量的时间不同,它可以有不同的重测信度。因此,在报告重测信度时,应说明两次施测的间隔,以及在此期间被试的有关经历。

  • 例如,《韦氏儿童智力量表手册》中国修订版(C-WISC)中,就报告了两次测验的时间间隔(2-7周)以及两次的相关系数(城市:0.59-0.86,农村:0.59-0.81)。


使用重测信度的量表举例

  • MMPI:临床量表在相隔两周重测,其值在0.58-0.92之间。

  • CPI:加州心理调查表的重测信度各量表分别为0.38-0.77,平均0.66.

  • SB4(斯坦福-比奈量表第四版)

  • 瑞文:三个版本的一些重测信度研究结果不一,正常成人为0.80-0.93。


复本信度

  • 含义与计算

  • 使用的前提条件

  • 优、缺点

  • 注意点

  • 使用复本信度的量表举例


含义与计算

  • 复本信度

    (1)含义:指两个平行的测验测量同一组被试所得结果的一致性程度。

    (2)计算:大小等于同一组被试在两个复本测验上所得分数的皮尔逊积差相关系数。

    它是研究测验跨形式的一致性(等值性)。

  • 复本信度的分类:

    (1)等值性系数(同时);

    (2)稳定性与等值性系数(不同时)。


等值性系数

  • 定义:如果两个复本测验是同时连续施测的,则这种复本信度称为等值性系数。

  • 大小:反映两个复本测验的题目差别所带来的变异情况。


稳定性与等值性系数

  • 定义:如果两个复本测验是相距一段时间分两次施测的,则这种复本信度称为稳定性与等值性系数。它既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性。

  • 大小:与其它信度系数相比,此种复本信度最小,也就是说,稳定性与等值性系数是对信度的最严格的检验,其值最低。


使用的前提条件

  • 条件1:构造出两份或两份以上真正平行的测验。

    注:复本测验必须在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式和测验等其它方面都相同或相似。

  • 条件2:被试有条件接受两个测验。例如,时间、经费等。


优、缺点

  • 优点:能够避免重测信度的一些问题,如记忆、学习等。

  • 缺点:

    (1)如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题。

    (2)对许多测验来说,建立复本是非常困难的。


注意点 :

  • 第二次测验仍会受到练习和记忆等因素的影响、一些解题的策略等技能也会产生也会产生迁移。

  • 对于稳定性与等值性系数,在报告结果时,也需要报告两次施测的间隔,以及在此间隔内被试的有关经历。


使用复本信度的量表举例

  • 成就测验的A、B卷。


内部一致性系数

  • 内部一致性系数主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。

    (1)分半信度

    (2)同质性信度


分半信度

  • 含义

  • 计算

  • 使用的前提条件及范围

  • 使用分半信度的量表举例


含义

  • 分半信度是指将两个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

  • 这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两个半测验内容取样的一致性程度,因而属于内部一致性系数。


计算

  • 先求半测验的信度(皮尔逊积差相关系数)

    (1)如果两半测验的变异数相等,则使用斯皮尔曼-布朗公式:式中rhh表示一半分数的相关系数,rxx为测验原长度的信度估计值。

  • (2)如果两半测验的变异数不相等,则使用弗朗拉根(Flanagan)公式或卢仑公式


使用的前提条件及范围:

(1)分半信度通常在只能施测一次或没有复本的情况下使用。

(2)将一个测验分成两半的方法很多,所以,同一测验通常会有多个分半信度。分半的方法有:按题号的奇偶性分半、按题目的难度分半、按题目的内容分半等。


使用分半信度的量表举例

(1)CPI的分半相关系数为0.63-0.86,平均为0.78.

(2)瑞文彩色本的分半信度在0.65-0.94,年轻受试者较低。标准本的分半相关信度为0.86,也是年轻者较低。

(3)韦克斯勒三套智力量表(WAPPSI-R,WISC-3,WAIS-R)

言语量表:分半信度在0.86-0.97

操作量表:分半信度在0.85-0.94

全量表:分半信度在0.90-0.98

(4)SB4:内在一致性系数均在0.9-0.99之间。


同质性信度

  • 含义

  • 计算

  • 使用同质性信度的量表举例


含义

  • 同质性信度是指测验内部所有题目间的一致性程度。

  • 题目间的一致性:(1)所有题目都测的是同一种心理特质;(2)所有题目得分之间具有较高的正相关。



计算同质性信度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • K-R20

  • K-R21

  • 克伦巴赫α系数


1 k r20
当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。1)K-R20公式

库德和理查德逊于1937年提出,仅适用于0、1记分测验。


2 k r21
当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。2)K-R21

库德和理查德逊于1937年提出,仅适用于0、1记分测验。此公式只有当所有题目的难度接近时才可使用。不需逐题计算通过率。


当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。3)克龙巴赫α系数

此公式是由克龙巴赫(Cronbach)提出的,它不要求测验题目仅是0、1记分,可以处理任何测验的内部一致性系数的计算问题。


例 题当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 某态度量表共7题,100个被试在各题上得分的方差分别是0.81,0.82,0.79,0.83,0.85,0.76,0.77,测验总分的方差是14.00,此时测量的α值为?


使用同质性信度的量表举例当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

(1)诺森伯格(Rosenberg,1985)自尊量表:克龙巴赫α系数为0.77-0.88。

(2)SB4的KR-20,各测验各年龄中数平均值为0.73-0.98


评分者信度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 含义

  • 计算


含义当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 评分者信度是指多个评分者给同一组人的答卷进行评分的一致性程度。用于测量不同评分者产生的误差。

  • 一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。


计算当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 当评分者为两人时,评分者信度等于两个评分者的积差相关或等级相关系数。

  • 当多个评分者评定多个对象,评分者信度等于两个评分者的肯德尔和谐系数进行估计。


效 度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

第一单元:效度的概念

第二单元:效度评估的方法


第一单元 效度的概念当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 效度的定义

  • 效度的性质


效度的定义当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 效度是指所测量的与所要测量的心理特点之间符合的程度。

  • 效度是科学测量工具最重要的必备条件,一个测验若无效度,则无论具有其它任何优点,一律无法发挥其真正的功能。因此,选用测量工具时首先要看效度。


效度的性质当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 效度具有相对性

  • 效度具有连续性


效度的相对性当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。因此,不能笼统地说某测验有效,而应该说它对测量什么有没有效。


效度的连续性当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。因此,评价一个测验时,不应该说“有效”或“无效,而应该说效度较高或效度较低。当然,效度是指“测量结果”的有效程度。


第二单元 效度评估的方法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

(1)内容效度

(2)构想效度(结构效度)

(3)效标效度


内容效度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 内容效度的定义

  • 内容效度的评估方法

  • 内容效度与表面效度


内容效度的定义当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 内容效度是指项目对欲测的内容取样的适当程度。由于这种测验的效度主要与测验内容有关,所以称内容效度。

    注:人们要测定“忧虑性”,就要对这个概念有个明确的内容范围,然后从临床观察、病人自述、医生笔记以及文献报道中了解具有忧虑性的人具有哪些行为特点,从而编制“忧虑性”测验。


内容效度的评估方法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 专家判断法 (P65,双向细目表)


构想效度(结构效度)当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 构想效度的概念

  • 构想效度的估计方法


构想效度的当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。概念

  • 指测验对理论上结构的测量程度。


构想效度的估计方法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 测验内法

  • 测验间的相互比较


测验内法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 这类方法主要是通过研究测验的内部结构(如测验的内容以及题目间的关系等)来分析测验的结构效度。

    (1)确定测验的内容效度

    (2)考察测验的同质性(同质性信度)


确定测验的内容效度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 通过确定测验取样的内容范围,我们就可以利用这些资料来定义测验所测的结构的性质。通过确定测量的内容效度便为结构效度提供了有关证据。

  • 例如:在编制语文能力测验时,我们将内容总体描述为对词汇下定义、对语言进行类比推理以及在文章篇句中正确运用文字的能力,这在实际上给“语文能力”的结构下了定义。


考察测验的同质性当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 通过对被试在项目上的反应与总分的相关计算,以及分半系数、α系数、K-R20、K-R21等指标的计算,可以推算出测验所测的是单一特质还是多种特质,从而确定测验是否具有结构效度。


测验间的相互比较当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 相容效度

  • 区分效度

  • 因素效度


相容效度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 计算被试在新旧(已有效度证据的成熟测验)两个同类测验上的分数之间的相关。


区分效度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 看它是否与测量不同结构的测验是否具有较低的相关,用此方法确定的效度叫区分效度。例如,数学推理能力测验与阅读能力测验。


因素效度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 建立结构效度最常用的方法是:通过对一组测验进行因素分析,找到影响测验分数的共同因素,这种因素可能就是我们要测量的心理特质(构思)。


效标效度当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 效标效度的定义

  • 效标效度的评估方法


效标效度的定义当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 衡量测验有效性的一个重要方法是根据测验所作出的预测是否能证实,如果一个测验的预测与将来实际发生的事情非常接近,那么这就是一个好测验。

  • 例如,用大学入学考试来预测被试入学后的学习,如果预测准确性高,便说明这是一个好测验。


效标效度的定义当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 效标:被预测的行为是衡量测验是否有效的标准。

  • 效标效度:就是考查测验分数与效标的关系,看测验对我们感兴趣的行为预测得如何。因为效标效度需要在实践中检验,所以,又称实证效度。


效标效度的分类当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

1、同时效度:与用来诊断现状的测验有关。例如,智力测验以学生当时的学业成绩为效标,由于学业成绩是现成的,所以这种效度称为同时效度。

2、预测效度:与预测将来结果的测验有关。例如,大学入学考试可用学生入学后的学习成绩作效标,因为效标资料是在考试以后间隔一段时间后才能获得,所以高考的效度则是一种预测效度。

注:此种效度对人员的选拔和安置工作非常重要。常用的效标是专业训练的成绩、实际工作的表现等。


效标效度的评估方法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 相关法

  • 区分法(分组法)

  • 命中率法


相关法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 确定效标效度最常用的方法是计算测验分数与效标测量的相关。根据变量的性质不同,可分别采用积差相关法、等级相关法、二列相关法等。当测验分数为连续性变量,效标资料为等级评定时,可用贾斯朋(Juspen)多系列相关公式计算。


区分法(分组法)当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 区分法:是检验测验分数能否有效地区分由效标所定义的团体的一种方法。例如,在大学里,我们根据教师评定,把学生分为合格与不合格两组,然后回过头去查他们的高考分数,若两组在高考分数上有显著差异,那就可以认为高考是有效的,否则就认为是无效的。


命中率法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 使用命中率法,可将测验分数和效标资料分成两类。在测验分数方面是确定一个临界分数(即分数线),高于临界分数者预测其成功,低于临界分数者预测其失败;在效标资料方面是根据实际工作或学习成绩,确定一个合格标准,在标准之上者为成功,在标准之下者为失败。


这样便会有四种情况:(当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。1)预测成功而实际也成功(B);(2)预测成功而实际上失败(A);(3)预测失败而实际上成功(D);(4)预测失败事实上也失败(C)。

我们称正确预测的为命中;不正确预测的为失误。

表5-5 测验命中与失误的四种情况


两个指标当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 总命中率

  • 正命中率


教育实验法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 界定

  • 特点

  • 步骤

  • 案例研究


界定当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 根据一定的理论假设,有计划地控制教育活动的某些因素,以引起其它因素朝着有利于提高教育效果的方向转变,然后检验假设,并由此揭示教育活动规律的综合性研究活动。


教育实验法的步骤当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 形成实验假说

  • 界定实验变量

  • 选择实验模式

  • 确定实验对象

  • 制定实验方案

  • 实施实验

  • 评价实验结果


界定实验变量当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 确定和分解应变量

  • 选择和设计自变量

  • 确定需要控制的干扰变量


选择实验模式当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 单因素设计

    (1)单组单因素前后测实验

    (2)单因素随机实验

    (3)单因素随机匹配实验

    (4)协方差设计

  • 两因素设计


案例研究当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 卢仲衡的自学辅导法实验

  • 样例学习(个数,变异性、呈现方式)

  • 数学学习不良的个案研究


个案研究当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 问题提出

  • 方法

    (1)被试选择

    (2)实验材料

    (3)实验程序:基线、处理、概括、维持

  • 结果

  • 分析与讨论

  • 举例:认知策略训练对学习不良学生应用题解决成绩的影响


被试当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 6个学生15-19岁被选择于LD群体中。总IQ在85-115(WISC-R,1975,Wais,1955)。所有6个学生还满足另外几个条件。WISC-R或WAIS的算术子测试低于平均数的1个标准差。阅读水平至少4年级水平。此外,每个被试完成10个随机的2步数学应用题40分,或低于40分。


材料当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 材料包括策略的挂图(图2)和19个测试(2步应用题)、1个测试(三步应用题)、练习题(每个类型),记录测试分数和时间的图形。测试问题从220题的2步应用题和50题的3步应用题随机选出。10个2步问题组成被试选择测试和每个因变量测试(在基线、处理、维持和重新训练阶段)。概括测验包括10个3步问题。项目不返回试题库。每个测量中,问题的次序是随机的。在策略获得和策略运用练习阶段,应用题的次序也是随机的。


程序当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 在课堂教学中接受策略训练。策略训练者是研究者之一。教学和测试都在课堂上。多基线设计的实验条件包括基线、处理、概括和保持、重新训练。


基线当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 在基线期间,记录测试的时间和分数。基线数据继续收集,直到稳定的基线是明显的(对每一组的第一个学生)。当继续收集剩下来的两个学生的基线数据时,给第一个学生干预。

  • 当上升趋势明显,至少10个项目中至少7个正确反应的成绩稳定时,策略训练给第二个被试。在这个阶段,继续收集每组第三个被试的基线数据。对第三个被试来说,相似的程序。


处理当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 处理包括策略获得阶段、策略运用练习阶段和测试阶段,在测试阶段期间收集因变量测量数据。


策略获得阶段当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 策略获得训练进行了3课时(每课时50分钟)。训练中使用的步骤包括训练策略模型(Deschler,1981)中的6步获得步骤。获得步骤包括:(1)分析现在的学习习惯;(2)描述新策略;(3)模仿新策略;(4)复述新策略(5)学生练习;(6)在获得阶段的正确反馈。图2呈现了训练程序总结。


8当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。步数学应用题的问题解决策略:

  • 大声阅读问题:教师大声读题,解释学生不懂的词语。

  • 大声复述

  • 陈述重要信息(特别是数字);(2)大声重复问题部分;

  • 利用自我提问技术:题目问什么?我正在寻找什么?

  • 转化:画一个图形

  • 陈述问题:大声说“我知道了…,我想求…”。强调题目中的重要信息。


  • 假设:大声说“如果我当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。…,那么…”,“需要多少步骤”写下运算符号

  • 估计:写下估计的答案

  • 计算

  • 自我检查:(1)参照问题,检查每一步,决定运算符号的正确性;(2)检查计算的正确性;(3)运用自我提问技术问自己是否理解答案的意思。


策略获得训练概要(图当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。2)

  • 第一阶段

    (1)讨论基线分数、被试解决问题的方法、界定提高多少作为教学的目标

    (2)描述训练的形式

    (3)向被试阅读策略,回答被试提出的问题

    (4)使用样例模仿策略的使用

    (5)使用随机选择的问题模仿策略的使用

    (6)当被试解决问题时,提供正确的反馈

    (7)当被试复述策略时,提供正确的反馈


  • 第二阶段当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

    (1)复习策略步骤

    (2)被试一边说步骤,一边解决问题

    (3)监控被试策略的复述

    (4)重复(2)

    (5)重复(3)


  • 第三阶段当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

    (1)监控被试的策略复述

    (2)当被试一边说步骤,一边解决问题时,提供正确的反馈。

    (3)重复(1)

    (4)重复(2)

    (5)策略步骤言语表达的测试。


当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。3 数学应用题解决的步骤

1、大声阅读问题

2、复述

(1)重要信息;

(2)大声重复问题部分;

(3)题目问什么?我正在寻找什么?

3、转化:画一个图形

4、陈述问题:我知道了…,我想求…。


5当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。、假设:

(1)如果我…,那么…,

(2)需要多少步骤?

6、估计:写下估计答案

7、计算

8、自我检查:

(1)检查每一步运算符号;

(2)检查计算;

(3)理解答案的意思。


策略练习阶段当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 要求被试在策略步骤的言语表达达到100%的正确标准(图3列举了要求记忆的信息)。达到这个目标后,策略运用阶段开始,在测试前一天,练习阶段开始。包括策略步骤的言语表达和使用策略练习解决数学应用题。在练习期间,列出步骤的图形可以得到。及时的正确反馈被提供。如果学生在2个或者3个测试中,保持7分或者更好成绩,练习阶段结束。如果学生分数低于7,练习阶段恢复。


测试阶段当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 测试阶段收集因变量。每个测试包含10个2步数学应用题,使用与基线条件下相同的程序。此外,提示学生使用策略。不能得到图3。测试时间被记录。没有完成的测试第二天完成。测试分数测试完成后告诉被试。

  • 数据包括每个测试正确的数目,完成每个测试的时间,收集这些数据作图。成绩提高的标准是在连续4次测试中至少都正确7题。通常,70%只是一个平均水平。在连续四个测试中都高于7个的维持成绩表明成绩的可接受性。


概括当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 在最后一个处理测试的第二天,一个包含10个题目的3步数学应用题决定策略是否概括到更复杂的数学应用题中去了。5条正确作为作为可接受的标准。


维持当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 概括测试2周后,一个包含10个2步数学应用题的测试,决定维持的水平。如果学生不能完成至少7个正确回答,被试被重新训练到策略记忆达到100%的水平,提供练习阶段,重新测试。当在一个测试中达到至少7个的正确率,实验结束。

  • 为了考察更大的维持水平,3个月以后重新测试2步数学应用题。


结果当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。


内容分析法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 界定

  • 主要途径

  • 案例研究


界定当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 是对教育文献的内容作客观而系统的量化分析,并加以描述,从而对相关的教育现象作出事实判断的研究方法


主要途径(当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。P96)

  • 现状分析

  • 趋势分析

  • 比较分析

  • 意向分析


案例研究当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 口语报告分析法


质的研究--口语报告分析法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。


问题设计当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。


大声思维与口语报告记录当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。


转译当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。


数据分析当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。


一、口语报告练习题当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

1、如图,已知在四边形ABCD中,AB=CD,AD=BC,点E在BC上,点F在AD上,AF=CE,EF与对角线BD相交于点O,试说明EF、BD互相平分。


2当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。、已知ab≠0,求的值。


二、录音题当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 在△ABC中,∠B=∠C,AD⊥BC,垂足为D,E,F分别是AB,AC边的中点,连结DE, FD,求证:四边形AEDF是菱形


录音题当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

在△ABC中,∠B=∠C,AD⊥BC,垂足为D,E,F分别是AB,AC边的中点,连结DE, FD,求证:四边形AEDF是菱形

解:∵AD⊥BC

∴ABD和ADC是直角三角形

∵E、F分别是AB、AC的中点

∴DE=AE,DF=AF

∵∠B=∠C

∴AB=AC

∴AE=AF

∴DE=DF=AF=AE

∴四边形AEDF是菱形


优差生解决几何问题的策略比较研究当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。


第五章 教育研究的质性方法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 访谈调查法

  • 叙事研究法


访谈调查法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 界定

  • 特点

  • 步骤

  • 案例研究


界定当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 研究者通过与被调查者面对面进行交谈,以口头问答的形式来了解某人、某事、某种行为态度和教育现象的一种调查方法。


特点当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 调查过程灵活深入

  • 获取信息完整真实

  • 适用范围更为广泛


步骤当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 确定调查方式(结构式?)

  • 做好访谈准备

  • 调控访谈过程

  • 整理访谈资料


案例学习当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 陈向明:《王小刚为什么不上学了--一位辍学生的个案调查》,《教育研究与实验》,1996,1.


叙事研究方法当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 界定

  • 特点

  • 步骤

  • 案例研究


界定当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 就是以叙述故事的方式来描述人们的经验、行为和生活方式,通过所叙述的故事来探究经验、行为的意义,及其蕴涵的思想和哲理。


特点当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 以质性研究方法为工具

  • 以教育中的故事为对象

  • 教育实践者成为研究主体

  • 形成认识时采用归纳的方式


步骤当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 确定研究问题

  • 选择研究对象

  • 进入研究现场

  • 进行观察访谈

  • 整理分析资料

  • 撰写研究报告


案例研究一当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 叶少燕,《我的教育故事:情感还是方法》,中国教育报,2003,1,21


案例研究二当一个测验具有较高的同质性信度时,说明测验主要测的是某一单一心理特质,实测结果是该特质水平的反映。

  • 肖正德、李长吉:《山村小学青年教师需要的叙述研究》,教育理论与实践,2003,10


ad