20 2551
Download
1 / 42

ภาวิณี ศรีสุขวัฒนานันท์ คณะศึกษาศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ 20 มิถุนายน 2551 - PowerPoint PPT Presentation


  • 106 Views
  • Uploaded on

เทคนิคการสร้างข้อสอบ. ภาวิณี ศรีสุขวัฒนานันท์ คณะศึกษาศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ 20 มิถุนายน 2551. การวางแผนการสร้างแบบสอบ. 1. เนื้อหา และหัวข้อที่จะใช้สอบ. 2. ชนิดของคำถามหรือข้อสอบ สอดคล้องกับวัตถุประสงค์ทางการศึกษาด้านพุทธิพิสัย. 3. รูปแบบคำถามที่จะใช้.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' ภาวิณี ศรีสุขวัฒนานันท์ คณะศึกษาศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ 20 มิถุนายน 2551' - rufin


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
20 2551

เทคนิคการสร้างข้อสอบ

ภาวิณี ศรีสุขวัฒนานันท์

คณะศึกษาศาสตร์ มหาวิทยาลัยเกษตรศาสตร์

20 มิถุนายน 2551


การวางแผนการสร้างแบบสอบ

1. เนื้อหา และหัวข้อที่จะใช้สอบ

2. ชนิดของคำถามหรือข้อสอบ

สอดคล้องกับวัตถุประสงค์ทางการศึกษาด้านพุทธิพิสัย

3. รูปแบบคำถามที่จะใช้

4. กำหนดเวลาที่จะใช้

5. วิธีการตรวจให้คะแนนและแปลผลการสอบ


การวางแผนสร้างแบบสอบ การวางแผนการสร้างแบบสอบ

ตารางกำหนดการสร้างแบบสอบวิชา.....................



วัตถุประสงค์ในการวัดด้านพุทธิพิสัย

1. ความรู้ความจำ (Knowledge)

2. ความเข้าใจ (Comprehension)

3. การนำไปใช้ (Application)

4. การวิเคราะห์ (Analysis)

5. การสังเคราะห์ (Synthesis)

6. การประเมินค่า (Evaluation)

(Bloom and Krathwohl 1956)


Taxonomy of Learning Specified, with Six Steps of Appropriation

Benjamin Bloom

(1913–99)


1 knowledge of based on recall
1 Appropriation. Knowledge - of (based on recall)

  • • Specifics

  • • Terminology

  • • Specific facts

  • • Ways and means of dealing with specifics

  • • Conventions

  • • Trends and sequences

  • • Classifications and categories

  • • Criteria

  • • Methodology

  • • The universals and abstractions in a field

  • • Principles and generalizations

  • • Theories and structures


2 comprehension grasp
2 Appropriation. Comprehension (grasp)

  • • Translation

  • • Interpretation

  • • Extrapolation


3 application having a go too
3 Appropriation. Application ("having a go" too)

  • Application, or using learned material in new situations, involves using information, ideas, and skills to solve problems, then selecting and applying them appropriately.


Analysis
Analysis Appropriation

Analysis suggests separating items, or separate material into component parts and show relationships between parts. It also means breaking apart information and ideas into their component parts.

  • • Of elements

  • • Of relationships

  • • Of organizational principles


5 synthesis
5. Appropriation Synthesis

  • • Production of a unique communication

    • • Production of a plan, or proposed set of operations

    • • Derivation of a set of abstract relations

  • Synthesis suggests the ability to put together separate ideas to form new wholes of a fabric, or establish new relationships. Synthesis involves putting together ideas and knowledge in a new and unique form. This is where innovations truly take place.


6 evaluation judging worth etc

Evaluation Appropriation is the highest level in this arrangement. Here the ability to judge the worth of material against stated criteria will show itself. Evaluation involves reviewing and asserting evidence, facts, and ideas, then making appropriate statements and judegments

• Judgement in terms of internal evidence

• Judgements in tems of external criteria

6. Evaluation (judging worth etc.)


ETS (1965) Appropriation

1. Remebering

2. Understanding

3. Thinking

Ebel (1979 )

1. Understanding of terminology

2. Understanding of fact & principle

3. Ability to explain or illustrate

4. Ability to calculate

5. Ability to predict

6. Ability to recommend appropriate action

7. Ability to make an evaluative judgement

วัตถุประสงค์ในการวัดด้านพุทธิพิสัย (ต่อ)


การวางแผนเขียนข้อสอบ Appropriation

1. สร้างตารางกำหนดชนิดคำถาม และ ขอบเขตเนื้อหาในข้อสอบแต่ละข้อ จำนวนข้อสอบในแบบสอบ 1 ชุด

2. เลือกรูปแบบข้อสอบ


แบบสอบรูปแบบต่าง ๆ Appropriation

Selected-Response Items

Constructed-Response Items

  • ตอบสั้น

  • เติมให้สมบูรณ์

  • แบบความเรียง

    • ไม่จำกัดแนวตอบ

    • จำกัดแนวตอบ

  • ข้อสอบเลือกตอบ

    ถูก-ผิด

    จับคู่

    หลายตัวเลือก

    ผสมหลายแบบ


ข้อแนะนำ Appropriation: สร้างข้อสอบแบบหลายตัวเลือก

  • ข้อความหลักเป็นประโยคคำถามหรือประโยคที่ไม่สมบูรณ์ก็ได้

  • ระบุคำถาม หรือ คำสั่งในข้อความให้ชัดเจน

  • คำหรือข้อความที่ซ้ำกันในตัวเลือก ให้เขียนไว้ในข้อความหลัก

  • สร้างตัวเลือก 4 หรือ 5 ตัวเลือก

  • สาระในตัวเลือกมีลำดับหรือหรือขนาด ให้จัดเรียงตามธรรมชาติ

  • ทำให้ตัวเลือกทุกตัวมีความยาวพอ ๆ กัน

  • เขียนตัวลวงให้ดูมีเหตุมีผลน่าเลือก ส่วนตัวถูก ถูกต้องสมบูรณ์

  • หลีกเลี่ยงการใช้คำนิเสธ หรือ นิเสธซ้อนนิเสธ


ข้อแนะนำ Appropriation: สร้างข้อสอบแบบหลายตัวเลือก (ต่อ)

  • เขียนตัวลวงให้ดูมีเหตุมีผลน่าเลือก ส่วนตัวถูกมีความถูกต้องสมบูรณ์ที่สุด

  • หลีกเลี่ยงการใช้คำนิเสธ หรือ นิเสธซ้อนนิเสธ

  • หลีกเลี่ยงการใช้ตัวเลือก “ถูกทุกข้อ” “ไม่ถูกทุกข้อ”

  • เรียงตัวเลือกให้มีรูปแบบที่อ่านง่าย

  • ตรวจสอบคำเฉลยทุกข้ออย่างอิสระ


ตัวลวง Appropriationความหมาย การสร้าง

  • พิจารณาตามความสมเหตุสมผล เช่น

    • เป็นประเด็นที่เคยโต้แย้งในอดีต,

    • ข้อสรุปที่อ้างหลักการที่คลาดเคลื่อน

    • เป็นเหตุการณ์ที่คล้ายคลึงกับเหตุการณ์ที่ถูกต้อง

    • เป็นเทคนิคที่มีจุดอ่อนมากไม่ควรเป็นคำตอบที่ถูกต้อง เป็นต้น

  • พิจารณาด้วยข้อมูล เป็นคำตอบที่มีผู้ตอบผิดเสมอ ๆ โดยเฉพาะกลุ่มอ่อน

  • องค์ประกอบที่สำคัญยิ่งของประสิทธิภาพของข้อสอบเลือกตอบ คือ ประสิทธิภาพของตัวลวง

  • ประสิทธิภาพของตัวลวง หมายถึง ตัวลวงนั้นได้รับการเลือกเป็นคำตอบที่ถูกต้องจากกลุ่มผู้สอบที่มีความสามารถต่ำหรือกลุ่มอ่อน


การสร้างข้อสอบที่วัดความซับซ้อน

  • ข้อสอบที่สร้างยาก คือข้อสอบวัดความเข้าใจ ความสามารถในการคิด

  • ความยากของการสร้างอยู่ที่การกำหนดตัวลวงที่มีประสิทธิภาพ

  • รูปแบบที่มักใช้ “ถูกทุกข้อ” “ถูกสองข้อ” “ถูกทุกข้อนอกจาก ข้อ…”

  • ตัวอย่างเทคนิคการสร้างตัวเลือก

    • กำหนดตัวเลือกถูกต้อง(ผิด)หมดทุกตัว ให้เลือกคำตอบที่ถูกต้องที่สุด

    • ข้อสอบเสนอค่าตัวแปรหลาย ๆ ค่า ให้บอกว่าค่าใดถูกต้อง

    • ให้เลือกวิธีปรับปรุง หรือแก้ไขสิ่งที่ไม่ถูกต้องตามที่ข้อสอบเสนอไว้

    • ให้เพิ่มเงื่อนไขในปัญหาที่ไม่มีทางออก

    • ให้ตัวแปรที่อยู่ในกลุ่มลักษณะหนึ่ง เลือกเฉพาะที่เกี่ยวข้องในการทำงานเป้าหมายใดเป้าหมายหนึ่ง


ข้อสอบแบบความเรียง วัดความสามารถดังต่อไปนี้:

  • ความสามารถในการให้ข้อเท็จจริงทั้งส่วนกว้างและส่วนลึก (depth and score of knowledge)

  • ความสามารถในการประมวล จัดลำดับความคิด และ ขมวดเรื่องราวที่มีสาระตรงคำถาม (Organization)

  • ความสามารถในการบูรณาการความคิดจากความรู้หลายแนวทาง หรือ หลายทฤษฎี (Integration)

  • ความคิดสร้างสรรค์ (creativeness)

  • ความคิดที่เป็นอิสระ (freedom of expression)


ข้อสอบแบบความเรียง

  • ตอบโดยไม่จำกัดแนวทาง (Extended response type)

    • ให้โอกาสผู้ตอบแสดงความคิดเห็นโดยการใช้ความสามารถการวิเคราะห์เลือกแนวทางแก้ปัญหาด้วยตนเองแล้วประมวล เรียบเรียงเป็นคำตอบ

จุดอ่อน/ข้อจำกัด

ไม่เพียงพอ หรือไม่ครอบคลุม

การตรวจให้คะแนนค่อนข้างยาก มีแนวโน้มให้ค่า ......ความเที่ยงต่ำ


ข้อจำกัดของข้อสอบความเรียง

  • ยากแก่การตรวจ เกิดความลำเอียงได้ง่าย

  • ออกได้น้อยข้อ วัดความรู้ไม่ครอบคลุม

  • คนที่เก่งภาษาจะได้เปรียบ

  • มีความเที่ยงในตัวผู้ตรวจต่ำ (reliability)


สร้างเฉลยที่ครอบคลุมทุกแง่ทุกมุมของคำถาม และแบ่งเป็นเกณฑ์การพิจารณาโดยให้คะแนนเป็นส่วน ๆ ตามความสำคัญ

อ่านคำตอบ ตรวจทีละข้อให้ครบทุกคนทำใจเป็นกลาง

กำหนดคะแนนแต่ละข้อให้แน่นอน

ป้องกันการเกิดอารมณ์ของผู้ตรวจที่ขาดความคงเส้นคง และ ใช้เหตุผลที่ไม่ใช่เกณฑ์

การตรวจให้คะแนน


แบบสอบคู่ขนาน และแบ่งเป็นเกณฑ์การพิจารณาโดยให้คะแนนเป็นส่วน ๆ ตามความสำคัญ

  • แบบสอบสองชุดที่มีข้อสอบวัดความสามารถเดียวกัน ความยากเท่ากัน มีจำนวนข้อเท่ากัน และมีความสัมพันธ์ระหว่างกันสูง ผลการวัดลักษณะหรือความสามารถของบุคคลเดียวกันจากแบบสอบสองชุดเป็นปริมาณที่เท่ากัน เมื่อพิจารณาเป็นกลุ่ม ค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานที่ได้ต้องเท่ากัน

  • แบบสอบที่มีคุณสมบัติเช่นนี้ จะนำไปใช้วัดความสามารถของบุคคลเพียงชุดเดียว ผลหรือคะแนนจะนำมาเทียบและปรับเป็นหน่วยในมาตราเดียวกัน


ลักษณะข้อสอบอัตนัยที่ดีลักษณะข้อสอบอัตนัยที่ดี

  • มีความตรง (Validity)

    • ความสอดคล้องระหว่างข้อสอบกับวัตถุประสงค์

    • ความยุติธรรมของการสอบ (fairness or unbiased)

  • มีความเที่ยง (Reliability)

    • ค่าอำนาจจำแนกของข้อสอบ (itemdiscrimination)

    • ความยาวที่เหมาะสม (appropriate length)

    • ความเฉพาะของข้อสอบ (item specification)

    • ความเหมาะสมของเกณฑ์ตัดสิน (appropriate criteria)

    • ความยากของข้อสอบ (item difficulty)

  • ความสะดวกในการใช้ (Practicality)


การวิเคราะห์ความตรงของข้อสอบการวิเคราะห์ความตรงของข้อสอบ

  • ศึกษาความสอดคล้องระหว่างข้อสอบกับวัตถุประสงค์

    • ใช้คำถามบ่งบอกพฤติกรรมที่ต้องการทดสอบชัด เช่น

      • เขียนนิยาม บอกชื่อ

      • อธิบาย ยกตัวอย่าง

      • แก้ปัญหา ปรับเปลี่ยน

      • บอกความสัมพันธ์ ความแตกต่าง

      • ย่อความ เรียบเรียง เสนอแผน ออกแบบ

      • ประเมิน วิจารณ์

    • ความเห็นของผู้เชี่ยวชาญ

  • ศึกษาความสัมพันธ์ระหว่างผลการสอบรายข้อกับคะแนนรวม


การวิเคราะห์ความเที่ยงการวิเคราะห์ความเที่ยง

  • ความเที่ยงรายข้อ

    • ระดับความยาก

      IDiff อยู่ระหว่าง 0.20-0.80

    • หาระดับอำนาจจำแนก

      ข้อสอบที่ดี มีค่า Disc> .2

  • ความเที่ยงทั้งฉบับ

    ใช้ Cronbach alpha


คุณภาพแบบสอบการวิเคราะห์ความเที่ยง

  • ความตรง (validity)

    • ความตรงเชิงเนื้อหา (content validity)

    • ความตรงเชิงเชิงทฤษฎี (construct validity)

    • ความตรงเชิงทำนาย (Predictive validity)

    • ความตรงเชิงเกณฑ์สัมพันธ์ อื่น ๆ


ปัจจัยที่ส่งผลต่อความเที่ยงปัจจัยที่ส่งผลต่อความเที่ยง

  • ความยาวของแบบสอบ (Test length)

  • ช่วงเวลาของการสอบซ้ำ ( Test retest Interval)

  • ช่วงความสามารถที่มุ่งวัด (Constriction of range)

  • การเดา (Guessing)

  • สถานการณ์การสอบหลากหลาย

    ( Variation within the testing situation)


การวิเคราะห์ข้อสอบปัจจัยที่ส่งผลต่อความเที่ยง

  • คำตอบที่แสวงหาจากการวิเคราะห์

    • เวลาทำแบบสอบเพียงพอหรือไม่

    • ผู้สอบเข้าใจคำสั่งหรือไม่

    • สถานการณ์ณ์ เงื่อนไขเหมาะสมหรือไม่

    • การรับมือกับเหตุการณ์เฉพาะหน้าเหมาะสมหรือไม่

  • ผลการวิเคราะห์ภายหลังการสอบแต่ละครั้ง ย่อมเป็นประโยชน์ต่อการเพิ่มประสิทธิภาพครั้งต่อไป


ดัชนีคุณภาพข้อสอบปัจจัยที่ส่งผลต่อความเที่ยง

  • ทฤษฎีดั้งเดิม

    • ประสิทธิภาพข้อสอบ

      • ความยาก-ง่าย

      • อำนาจจำแนก

      • ประสิทธิภาพตัวลวง

  • ทฤษฎีตอบสนองข้อสอบ

    • ประสิทธิภาพข้อสอบ

      • เส้นโค้งข้อสอบ(ICC)

      • ความยาก (b)

      • อำนาจจำแนก (a)

      • ค่าการเดา (c)


ความยากของข้อสอบแบบดั้งเดิม (difficulty)

  • ดรรชนีความยาก :สัดส่วนผู้สอบที่ตอบถูกต่อจำนวนผู้สอบทั้งหมด และนิยมทำเป็นค่าร้อยละ ดังสูตร

    • P = x 100

    • R = จำนวนคนที่ทำข้อสอบข้อนั้น ๆ ถูก

    • N = จำนวนผู้สอบทั้งหมด


Discrimination
อำนาจจำแนก แบบดั้งเดิม(discrimination)

  • ใช้แนวความคิดอิงกลุ่ม

  • r = RH/NH -RL/NL

  • r คือ ดัชนีค่าอำนาจจำแนก

    • RH คือ จำนวนผู้ทำข้อสอบถูกในกลุ่มสูง

    • RL คือ จำนวนผู้ทำข้อสอบถูกในกลุ่มต่ำ

    • NH คือ จำนวนผู้สอบในกลุ่มสูง

    • NL คือ จำนวนผู้สอบในกลุ่มต่ำ

    • โดยกำหนดให้ NH = NL


ตัวอย่างข้อสอบคัดเลือกเข้ามหาวิทยาลัยตัวอย่างข้อสอบคัดเลือกเข้ามหาวิทยาลัย

ยากพอเหมาะ

จำแนกได้ดี

ยากพอเหมาะ จำแนกได้พอใช้

คัวลวง3 และ4 ไม่ดี กลุ่มเก่งเลือกตอบมากกว่ากลุ่มอ่อน


ตัวอย่างผลวิเคราะห์ข้อสอบวัดผลสัมฤทธิเรื่องโภชนาการตัวอย่างผลวิเคราะห์ข้อสอบวัดผลสัมฤทธิเรื่องโภชนาการ

ง่ายมาก จำแนกได้ดีพอสมควร

ตัวลวง 2 และ 3 มีประสิทธิภาพ กลุ่มอ่อนเลือกมากกว่ากลุ่มเก่ง

ตัวลวง 1ไม่ได้รับการเลือกเลย

ค่อนข้างง่าย จำแนกได้ดี

ตัวลวงมีประสิทธิภาพดีทุกตัว กลุ่มอ่อนเลือกมากกว่ากลุ่มเก่ง


ผังแสดงตำแหน่งข้อสอบตัวอย่างผลวิเคราะห์ข้อสอบวัดผลสัมฤทธิเรื่องโภชนาการ

ความยาก

-.1

อำนาจจำแนก


ดัชนีคุณภาพข้อสอบตัวอย่างผลวิเคราะห์ข้อสอบวัดผลสัมฤทธิเรื่องโภชนาการ

  • ทฤษฎีตอบสนองข้อสอบ

    • ประสิทธิภาพข้อสอบ

      • เส้นโค้งข้อสอบ(ICC)

      • ความยาก (b)

      • อำนาจจำแนก (a)

      • ค่าการเดา (c)

  • ทฤษฎีดั้งเดิม

    • ประสิทธิภาพข้อสอบ

      • ความยาก-ง่าย

      • อำนาจจำแนก

      • ประสิทธิภาพตัวลวง


3- parameterตัวอย่างผลวิเคราะห์ข้อสอบวัดผลสัมฤทธิเรื่องโภชนาการ

b

ค่าความยาก

a

ค่าอำนาจจำแนก

c

ค่าการเดา

Item Response Theory

ICC


ตัวอย่างลักษณะโค้งข้อสอบ (ICC)


แบบสอบคู่ขนาน ตัวอย่างลักษณะโค้งข้อสอบ (

  • แบบสอบสองชุดที่มีข้อสอบวัดความสามารถเดียวกัน ความยากเท่ากัน มีจำนวนข้อเท่ากัน และมีความสัมพันธ์ระหว่างกันสูง ผลการวัดลักษณะหรือความสามารถของบุคคลเดียวกันจากแบบสอบสองชุดเป็นปริมาณที่เท่ากัน เมื่อพิจารณาเป็นกลุ่ม ค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานที่ได้ต้องเท่ากัน

  • แบบสอบที่มีคุณสมบัติเช่นนี้ จะนำไปใช้วัดความสามารถของบุคคลเพียงชุดเดียว ผลหรือคะแนนจะนำมาเทียบและปรับเป็นหน่วยในมาตราเดียวกัน


การเทียบมาตราคะแนนสอบ Test Equating

การสร้างแบบสอบคู่ขนาน

ตรวจสอบความจริงจากผลการสอบ

กำหนดผังการออกข้อสอบ

ค่าเฉลี่ย

ส่วนเบี่ยงเบนมาตรฐาน

ค่าความเที่ยง

ค่าพารามิเตอร์รายข้อ

จัดชุดแบบสอบ 2-3 ชุดให้มีข้อสอบลักษณะเหมือนกันและยากง่ายพอ ๆ กัน

เขียนข้อสอบวัดแต่ละลักษณะ2-3 เท่า


ad