1 / 74

Introduction & Rationale

Introduction & Rationale. 林陳涌 師大生物系. 測驗的兩個向度. 心理計量 (Psychometric) 教育計量 (Edumetric) Carver, R.P. (1974). Two dimensions of tests: Psychometric and Edumetric. American Psychologists, July, pp. 512-518. 1. 目的 評測個別差異。 2. 試題的選擇 取 P 值為 50% 者,以求 D 值最大,分數的變異量 (Variance) 大;信效度才能理想。 ‧.

Download Presentation

Introduction & Rationale

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Introduction & Rationale 林陳涌 師大生物系

  2. 測驗的兩個向度 • 心理計量(Psychometric) • 教育計量(Edumetric) • Carver, R.P. (1974). Two dimensions of tests: Psychometric and Edumetric. American Psychologists, July, pp. 512-518.

  3. 1. 目的 評測個別差異。 2. 試題的選擇 取P值為50%者,以求D值最大,分數的變異量(Variance)大;信效度才能理想。 ‧ 評測個體的成長 (Gain/Growth)。 取前後測的差異值最 大的試題,前測為0,後測為100%者最好。 (Sensitive to Gain) 測驗的兩個向度(Dimensions)心理計量 教育計量 (Psychometric) (Edumetric)

  4. 3. 信度 區辨個體差異的一致性(Consistency)。 以信度係數、誤差變異、SEm評估;Dependent on Variances 4. 效度 趨同和趨異效度 (Convergent & Discriminant Validity) 區辨個體成長的一致性。 以另一測驗來評估 (Alternate Forms);NOT Dependent on Variances 對學習成長的敏感度是否如預期。 (Sensitive to Gain) 測驗的兩個向度(Dimensions)心理計量 教育計量 (Psychometric) (Edumetric)

  5. ◆基本教學過程◆ 教學目標 學前評量 教學活動 學習評量

  6. E. L. Thorndike • If A Thing Exists, It Exists in Some Amount. • If It Exists in Some Amount It Can be Measured.

  7. A Grade is… Paul Dresse, (1957). Basic College Quarterly. • An Inadequate Report of an Inadequate Judgement by a Biased and Variable Judge of the extent to which a student has attended an Undefined Level of Mastery of an Unknown Proportion of an Indefinite Amount of Material.

  8. D. L. Stufflebeam • The Purpose of Evaluation is TO Improve, NOT to Prove.

  9. 名詞定義…………….

  10. 測量 (measurement) • 根據量史,用數字描述個人特質的歷程。 • 本質上是使用數量來描述特質,而不是使用文字或品質描述。

  11. 評鑑 (Evaluation) • 根據一項標準, 對所測量到的數量作價值的判斷. • Judgment of merit, usually qualitatively; Measurement is quantitative.

  12. 評測或測驗(Assessment or testing) • 狹義:指測量的工具 • 廣義:對行為樣本所做的一種客觀的和標準化的測量。 • 另一廣義:採用數字量尺或分類系統,來觀察和描述個人特質的一種有系統程序。

  13. 評測或測驗(Assessment or testing) • 總結: 採用一套標準的刺激,對個人的特質作客觀測量的有系統程序。 • 標準的刺激 • 個人的特質 • 有系統程序 

  14. 能力測驗(Ability Tests) • Assess the performance or level of skills of individuals in well-defined subject areas. (Satterly, 1990)

  15. 性向測驗(Aptitude Tests) • Indicate the probability with which new material will be learned. (Satterly, 1990)

  16. 認知(Cognition ) • Includes the processes of perception, thinking, reasoning, understanding, problem solving, and remembering. (Satterly, 1990)

  17. 認知風格測驗(Cognitive Style Tests) • Assess their typical approach or ways of learning and thinking in a variety of tasks. (Satterly, 1990)

  18. 學習能力測驗(Learning Ability Tests) • Seek to measure the ability to respond to instruction and so are measures of potential rather than achievement. • (Hegarty, 1990)

  19. 教學評鑑的目的、功能、類別、理念……

  20. 科學教學評鑑的意義 • 包括兩種過程的評鑑: • 1.科學教學中的評鑑 • (Evaluation in the Teaching of Science) • 評鑑的內容是「學習過程」。 • 科學教學的評鑑 • (Evaluation of Science Teaching) • 評鑑的內容是「教學過程」。

  21. 生物科教學評鑑的目的 • 了解學生的學習進展、意願和興趣。 • 發掘、鑑識學習的學習困難。 • 提供有關學生學習潛能、狀況與方向的具體資料或指標,供個別輔導之參考。 • 適應學生的個別差異,引導學習的方向。 • 學生學習成就之評鑑及成績報告。

  22. 生物科教學評鑑的目的 • 鑑別教學缺失、改進教學。 • 開發可行之教學法或教學媒體。 • 評估教學成效及各項教學有關變項對教學成效的影響,以調整教學進程。 • 其他行政上的特殊需要。

  23. 教學評鑑的功能 • 加強學習 • 輔導 • 診斷 • 測驗(學生學習成就) • 評估(學生各項發展) • 配置

  24. ◎ 教育測驗的種類 ◎ ◇ 認知測驗 1. 成就測驗(Achievement Test) 過去的行為或學得的能力 2. 性向測驗(Aptitude Test) 未來的行為或學習的能力 3. 智力測驗(Intelligence Test) 普通學習能力

  25. ◎ 教育測驗的種類 ◎ ◇ 情意測驗 1. 偏好測驗(Preference Test) 2. 態度、信念(Belief)測驗

  26. ◎ 教育測驗的種類 ◎ ◇ 感官動作測驗 1. 性向測驗(Aptitude Test) 2. 技能測驗(Intelligence Test) ◇ 人格/性格測驗

  27. 科學教學評鑑的類別 • 依目的來區分,可分為下列四大類: • 配置性評鑑(Placement Evaluation) • 診斷性評鑑(Diagnostic Evaluation) • 形成性評鑑(Formative Evaluation) • 總結性評鑑(Summative Evaluation)

  28. 配置性評鑑 • 瞭解學生的背景、性向和興趣,以因應學生之個別差異,安排適當的學習歷程,施予適當的教學和輔導,如:性向測驗。

  29. 診斷性評鑑 • 發掘、鑑識學生的學習困難,供調整教學方案之參考。在教學過程中之發問、平時測驗即應具此類評鑑的意義。

  30. 形成性評鑑 • 瞭解學生的學習進展及教學缺失,供改進教學、調整課程之方,它是一種迴饋式的評鑑過程。各級學校目前舉行之段考、期中考等,即應具此項功能。

  31. 總結性評鑑 • 評定學習成就,供成績報告或教育決策之參考。期考即屬此類。

  32. 科學教學評鑑可依特性分為 • 常模參考評鑑(Norm-Referenced Evaluation) • 測驗的結果,根據分數在團體中的相對位置而加以解釋的一種測驗 • 將對象族群以常態分佈分散開來或與參考常模(Norm group)比較,來判定優劣等級。 • 2.標準參考評鑑(Criterion-Referenced Evaluation) • 測驗的結果,根據教學前所訂定的標準而加以解釋的一種測驗

  33. NRE & CRE

  34. NRE & CRE

  35. NRT 預期的學習結果,可用概括或明確的方式敘述 CRT 預期的學習結果,採用明確具體的方式敘述 預期的學習結果的敘述

  36. NRT 包括較廣的學習結果,而每一結果的的試題很少 CRT 包括較小的學習結果,而每一結果的的試題很多 學習內容的涵蓋

  37. NRT 多用選擇是題目 CRT 少用選擇是題目 題目

  38. NRT 強調試題的鑑別度 CRT 強調試題能說明學生學習的工作表現 編擬試題的原則

  39. NRT 適合傳統統計方法估計信度(因為變異數大) CRT 不適合傳統統計方法估計信度(因為變異數小) 編結果的信度

  40. NRT 安置性或總結式評量 CRT 預備性、形成性或診斷性評量 用途

  41. ◎ 教育測驗的種類 ◎ 文字 & 非文字 個別 & 團體 標準化 & 非標準化 客觀 & 主觀 最大表現 & 典型表現 預備 & 診斷

  42. 理念、特性、原則…………….

  43. ◇ 生物教育測驗的理念◇ 1. 測驗(Measurement)?考試(Test)? 評量(Assessment)?評鑑(Evaluation) ? 2. 目的: 評定學習成果: 總結性評鑑(Summative Evaluation) 。 鑑識教學缺失;診斷學習困難: 形成性評鑑(Formative Evaluation)。

  44. ◇ 教育測驗的特性 ◇ 1.個體具有可測量的特質。 2. 評測的過程是間接的--- 評測的結果用來詮釋構念(Construct)。 3. 評測的過程和結果都有誤差。 4. 評測結果的解釋是相對的。

  45. 教學評量的原則 • 評量應依據教學目標 • 評量應顧及學生全面發展 • 評量的方法應有彈性 • 評量應兼顧反應歷程與結果 • 評量的結果應妥於應用

  46. 一般趨勢

  47. 1. Primarily group-administered tests A variety of administrative formats including large groups, small groups, and individuals. Predicted Trends in Measurement and Evaluation of Science Instruction From . . . . . . ◆ To . . . . . .

  48. 2. Primarily paper-and-pencil tests A variety of test formats including pictorial and laboratory performance tests. Predicted Trends in Measurement and Evaluation of Science Instruction From . . . . . . ◆ To . . . . . .

  49. 3. Primarily end-of-course summative assessment A variety of pretest, diagnostic and formative types of measurements. Predicted Trends in Measurement and Evaluation of Science Instruction From . . . . . . ◆ To . . . . . .

  50. 4. Primarily measurement of low-level cognitive outcomes The inclusion of higher level cognitive outcomes (analysis, evaluation, critical thinking), as well as the measurement of affective (attitudes, interests, and values) and psychomotor outcomes. Predicted Trends in Measurement and Evaluation of Science Instruction From . . . . . . ◆ To . . . . . .

More Related