810 likes | 972 Views
语文学业质量评价研究. 首都师范大学 王云峰. 提纲. 近十年来语文学业评价改革的主要进展和问题 如何构建科学的语文学业评价、反馈和指导系统. 十年来语文学业评价改革的主要进展. 评价改革是新课程改革的重要内容 语文课程标准(实验稿)提出:改进语文评价的目的、内容和方式,突出评价的教学诊断功能,引导改进教学,促进学生发展. 十年来语文学业评价改革的主要进展. 从 2004 年开始,随着新课程改革实验区中考改革的推进,教育部组织了专门的项目组,对各课改实验区中考语文改革进行研究和指导,连续 3 年开展了中考命题分析和命题者培训工作. 十年来语文学业评价改革的主要进展.
E N D
语文学业质量评价研究 首都师范大学 王云峰
提纲 • 近十年来语文学业评价改革的主要进展和问题 • 如何构建科学的语文学业评价、反馈和指导系统
十年来语文学业评价改革的主要进展 • 评价改革是新课程改革的重要内容 • 语文课程标准(实验稿)提出:改进语文评价的目的、内容和方式,突出评价的教学诊断功能,引导改进教学,促进学生发展
十年来语文学业评价改革的主要进展 • 从2004年开始,随着新课程改革实验区中考改革的推进,教育部组织了专门的项目组,对各课改实验区中考语文改革进行研究和指导,连续3年开展了中考命题分析和命题者培训工作
十年来语文学业评价改革的主要进展 • 2003年起教育部开始尝试建立国家“中小学学生学业质量分析、反馈与指导系统”(SAAE),对部分省、地市的3、8年级学生语文、数学、科学和英语学习质量进行系统分析,并指导进行教学改进 • 一些教育相当比较发达的地区(如北京)开发建立了地方的学业质量分析与反馈指导系统
严格测试工具开发 根据蓝图命制平行试卷多份 试卷Aa 预测试实施 / 无纸化阅卷 保留原题 形成正式试题 预测试分析 试题甄选 符合要求 共同试题 基本符合要求 适当修改 试卷Bb 弃用 不符合要求 1、经典测量理论(CTT)分析:难度、区分度、试题内部一致性(工具:SPSS) 2、项目反应理论(IRT)分析:两试卷等值处理、难度、拟合指数(工具:WINSTEP)
进行严格的试题、试卷质量分析 • 测验信息量、测验难度与学生能力分布情况、测验各题目难度、区分度、题目与RASCH模型的拟合度等
某题目学生总体作答情况 • 某题目学生不同水平学生作答情况 • 进行具体题目的学生表现分析
测验等值设计: • 共同被试组设计:主要用于确定基线水平,实现年度间分数的纵向比较
形成多层面、多方式、立体化的结果反馈系统 反馈方式 反馈对象 反馈市级 书面报告 反馈区县 现场报告 反馈学校 网上成绩报告单 反馈学生
近十年来语文学业评价的主要进展 • 学业评价的内容和方式都发生了明显的变化,更加注重对学生实际的语文应用能力的考察。 • 更加注重对学生学习过程的评价,且评价主体多元化。 • 开始重视发挥学业评价的诊断、反馈功能,指导教学的改进。
案例:江苏南京2006年中考第9-18题 • 测试情境:学校开展“爱我南京”语文综合性学习活动,小雨、小晴和你组成合作小组,选择了以下几个专题: • 第一个专题是“魅力南京”,小雨负责作南京简介(题目中呈现了一段介绍南京的文字),其中有两个字的读音容易读错,请你注音(第一题),还有两处错别字,也请你改正(第二题)。
第二个专题是“人文南京”。大家发现,南京人杰地灵,有许多文化名人在此居住。于是,小晴拟了一副对联。其中有一处不符合对联的要求,请你修改(第三题)。第二个专题是“人文南京”。大家发现,南京人杰地灵,有许多文化名人在此居住。于是,小晴拟了一副对联。其中有一处不符合对联的要求,请你修改(第三题)。 • 上联:吴敬梓冷眼观世,《儒林外史》讽丑恶 • 下联:深情怀旧周树人,《朝花夕拾》忆往昔 • 第三个专题是“青春南京”,题干中给出了三幅“南京青年联合会”的备选标识,要求写一段话,说明推荐选用某一标识的理由。题目中还给出了小雨推荐的理由,其中用了“因为……既……又……”(第四题)
第四个专题是“书香南京”,题干中呈现了同学们在研究性学习中收集到的两则材料:一则来自报纸的报道。反映了我国古代文学名著被冷落,而部分学生却喜欢读“水煮三国”之类“快餐读物”的现状。另一则是余光中在南京大学的演讲节选,提倡读经典,并认为经典并不难读。让学生根据上述两则材料,提炼“书香南京”活动的目的(第五题)。第四个专题是“书香南京”,题干中呈现了同学们在研究性学习中收集到的两则材料:一则来自报纸的报道。反映了我国古代文学名著被冷落,而部分学生却喜欢读“水煮三国”之类“快餐读物”的现状。另一则是余光中在南京大学的演讲节选,提倡读经典,并认为经典并不难读。让学生根据上述两则材料,提炼“书香南京”活动的目的(第五题)。
在“书香南京”活动中,小晴撰写了《骆驼祥子》的“阅读心语”(题干中给出了一段文章),请你从《西游记》《水浒传》或《繁星·春水》选出一部作品,也写一段“阅读心语”(第六题)在“书香南京”活动中,小晴撰写了《骆驼祥子》的“阅读心语”(题干中给出了一段文章),请你从《西游记》《水浒传》或《繁星·春水》选出一部作品,也写一段“阅读心语”(第六题)
存在的问题 • 对语文学业评价目的意义的理解还存在局限 • 对语文学业评价内容的把握还不一致 • 对各种评价方式的功能、特点和命题技术的研究不够 • 如何利用学业水平分析的结果指导教学改进,还需要进行深入的研究
语文课标对“评价建议”的修订 • 进一步明确了语文课程评价的基本原则 • 进一步明确了各学段学习内容的评价重点 • 对语文课程评价的一些重要操作环节给出了建议
语文课程评价的根本目的 • 为了促进学生学习,改善教师教学。 • 语文学业发展状况的评价是手段,而不是目的。评价的目的是促进学,改进教。 • 一定要改变 “考什么就教什么,不考不教,为考而教” 的旧观念,关注学生语文素养的整体提升,关注语文课程目标的全面实现。
充分发挥语文课程评价的多种功能 • 语文课程评价具有检查、诊断、反馈、激励、甄别和选拔等多种功能, • 其目的是为了考察学生实现课程目标的程度,检验和改进学生的学习和教师的教学,改善课程设计,完善教学过程。 • 应发挥语文课程评价的多种功能,尤其应注意发挥其诊断、反馈和激励的功能,有效地促进学生的发展。
恰当运用多种评价方式 • 形成性评价关注学习过程,有利于及时揭示问题、及时反馈、及时改进教与学活动。 • 终结性评价关注学习结果,有利于对教学活动作出总结性的结论。 • 形成性评价和终结性评价都是必要的。 • 应加强形成性评价,注意收集、积累能够反映学生语文学习与发展的资料,可采用成长记录袋等各种方式,记录学生的成长过程。 • 对学生语文学习的日常表现,应以表扬、鼓励等积极的评价为主,采用激励性的评语,从正面加以引导。
恰当运用多种评价方式 • 要坚持定性评价和定量评价相结合,全面反映学生语文学习的状态及水平。 • 评价方法除了纸笔测试以外,还有平时的行为观察与记录、问卷调查、面谈讨论等各种方法。 • 语文学习具有重情感体验和感悟的特点,更应重视定性评价。
突出语文课程评价的整体性和综合性 • 语文课程评价要体现语文课程目标的整体性和综合性,全面考察学生的语文素养。 • 应注意识字与写字、阅读、写作、口语交际和综合性学习五个方面的有机联系,注意知识与能力、过程与方法、情感态度与价值观的交融、整合,避免只从知识、技能方面进行评价。
如何建立一个科学的语文学业质量测量、分析和指导系统如何建立一个科学的语文学业质量测量、分析和指导系统
我国课程标准的特征 • 课程建设纲要 • 既说明“课程性质与地位、课程的基本理念、课程标准的设计思路”,有规定课程的核心目标(总目标和阶段目标),还提出了最重要的实施建议(教科书编写建议、课程资源的开发与利用、教学建议和评价建议) • 具有整体性和上位文件的特征 • 需要以此为基础,建立一个详细的基于学生不同发展阶段言语行为特征描述的“学习标准”
研究思路 问题:如何解决从“课程标准”到“学业质量评价标准”的转换
课程标准修订稿关于汉语拼音和识字评价的建议课程标准修订稿关于汉语拼音和识字评价的建议 • 汉语拼音的评价重在考察学生认读和拼读的能力,以及借助汉语拼音认读汉字、讲普通话、纠正地方音的情况。 • 识字能力的评价要考察学生认清字形、读准字音、掌握汉字基本意义的情况,以及在具体语言环境中运用汉字的能力,借助字典、词典等工具书查检字词的能力。 • 第一、第二学段应多关注学生主动识字的兴趣, 第三、第四学段要重视考察学生独立识字的能力。
课程标准修订稿关于写字评价的建议 • 要考察学生对于要求“会写”的字的掌握情况, • 第三学段要求学生会写2500个字。对学生写字学习情况的评价,当以本标准附录5“义务教育语文课程常用字表·字表一”为依据。 • 重视书写的正确、端正、整洁,在此基础上,逐步要求书写流利。 • 第四学段还要关注学生基本行楷字的书写和对名家书法作品的临摹。 • 义务教育的各个学段的写字评价都要关注学生写字的姿势与习惯,引导学生提高书写质量。
识字与写字能力的评价目标 • 识字: • 读准字音 • 认清字形 • 理解汉字(词)的基本意义和语境意义 • 写字: • 正确 • 工整 美观 • 识字与写字的兴趣和态度倾向(主动识字、喜欢写字、注重汉字的书写……) • 独立识字的习惯(有使用工具书的意识和习惯) 纸笔测试 现场观察和问卷调查
“读准字音”的测试结构能按普通话的读音标准认读(拼读)常用汉字的字音“读准字音”的测试结构能按普通话的读音标准认读(拼读)常用汉字的字音
“认清字形”的测试结构 • 影响字形识别的主要因素: • 字形相近,记忆有误: 例1:将“竞争”误写(误认)为“竟争” • 字音相同,不能理解字词意思而混用: 例2:将“班门弄斧”误为“班门弄斧” • 字形相近、字音相同,不能理解字词意思而混用: 例3:将“气球”误为“汽球”
“理解字词意思”的测试结构 • 词语的意思是语言理解测试在重要内容 • 词语的意思又可以分为基本义的理解和语境义的理解 • 语境又可以有简单语境和复杂语境之分 • 对不同年级的学生而言,语境的简单和复杂程度是有差别的 • 通过辨别近义词、选词填空等方式,可以考查学生对词语意义的理解和运用水平,建立多水平的测试框架
课程标准修订稿关于阅读评价的建议 • 综合考察学生阅读过程中的感受、体验和理解 • 关注阅读兴趣与价值取向、阅读方法与习惯 • 关注阅读面和阅读量,以及选择阅读材料的能力 • 重视对学生多角度、有创意阅读的评价 • 语文知识的概念不作为考试内容
朗读与诵读的评价 • 能用普通话正确、流利、有感情地朗读课文,是朗读评价的总要求。 • 根据阶段目标,各学段的要求可以有所侧重。 • 评价学生的朗读,可从语音、语调和语气等方面进行综合考察,评价“有感情地朗读”,要以对内容的理解与把握为基础,要防止矫情做作。 • 重在提高学生的诵读兴趣,增加积累,发展语感,加深体验和领悟。 • 在不同学段,可在诵读材料的内容、范围、数量、篇幅、类型等方面逐渐增加难度。
默读的评价 • 应从学生默读的方法、速度、效果和习惯等方面进行综合考察。 • 默读评价,包括对精读、略读和浏览的评价 • 略读的评价,重在考察学生能否把握阅读材料的大意。 • 浏览的评价,重在考察学生能否从阅读材料中捕捉有用信息。
精读的评价 • 重点评价学生对阅读材料的综合理解能力,要重视评价学生的情感体验和创造性的理解。 • 第一学段可侧重考察对文章内容的初步感知和文中重要词句的理解、积累; • 第二学段侧重考察通过重要词句帮助理解文章,体会其表情达意的作用,以及对文章大意的把握; • 第三学段侧重考察对文章表达顺序和基本表达方法的了解领悟。 • 第四学段侧重考察理清思路、概括要点、探究内容等方面的情况,以及读懂不同文体文章的能力。
文学作品阅读的评价 • 着重考察学生感受形象、体验情感、品味语言的水平,对学生独特的感受和体验应加以鼓励。 • 第一学段侧重考察学生能通过朗读和想象等手段,大体感受作品的情境、节奏和韵味; • 第二学段侧重考察在阅读全文基础上对重要段落和语句的细致阅读,具体感受作品的形象和语言; • 第三、第四学段,可通过考察学生对形象、情感、语言的领悟程度,以及自己的体验,来评价学生初步鉴赏文学作品的水平。
古代诗词和浅易文言文的阅读评价 要重视学生课外阅读的评价 • 应根据各学段的要求,通过小组和班级交流、学习成果展示等方式,了解学生的阅读量和阅读面,进而考察其阅读的兴趣、习惯、品位、方法和能力。 重点考察学生的记诵积累,考察他们能否凭借注释和工具书理解诗文大意。 词法、句法等方面的概念不作为考试内容。
如何建立符合我们测试需要的阅读(纸笔)测试框架如何建立符合我们测试需要的阅读(纸笔)测试框架 • 依据课程标准的相关规定 • 从不同的阅读目的出发,设置阅读情境 • 关注阅读活动过程,建立相对清晰的测试关注点 • 描述阅读活动中不同心智动作的特征和水平,完整体现阅读能力的基本结构
阅读测试框架 在3种不同的测试情境中,重点考查学生的4种基本阅读能力的表现 • 从文本中获取信息 • 形成对文本内容的整体感知或初步概括 • 利用文本信息和个人经验对相关问题做出合理的解释和推论 • 对文本的内容或表达做出合理评价或利用文本的相关信息解决问题
阅读测试框架 提取信息 • 提取信息是基础 • 包括提取单一信息、多个信息 • 提取位置、显隐程度不同的信息 • 在获取信息的基础上,形成整体感知和初步的概括实际上是信息的整合
整体感知和初步概括 • 整体感知和初步概括包括表层的感知和深层的感知 • 理解表层意义:能够整体感知文章的大概内容;初步感受文章所表达的思想感情 • 领会深层意义:能够分清主要观点和次要细节、能够理解文章各部分相互间的关系,理清文章的思路、能够体会作者的态度和观点
形成解释 • 能将文章的内容与自己的生活建立联系,能根据文本的具体内容对作品中的形象、情感、观点、态度等做出解释,能够运用文本中的信息,支持自己的观点; • 能结合具体语境,解释重要词语的意思和作用 • 能对文章中的事件、形象、情感等有自己的看法
做出评价 • 以自己的价值观念为基础 • 能对文章中的事件、形象、情感等有自己的看法 • 能对作者的观点、文章的意义和价值等做出评价和判断 • 能对文章的形式(结构、语言表达方式、写法等)做出评价
解决问题 • 从给定的文本材料中筛选出重要的信息,对相关信息进行重新组织,利于其中重要的信息(如条件性的、方法策略性的),解决具体的问题