ความเที่ยงตรงตามแนวคิดอิงกลุ่ม
ความเที่ยงตรง (validity) หมายถึง ประสิทธิภาพของแบบทดสอบที่สามารถวัดลักษณะ (trait) ที่ต้องการจะวัดได้ หรือ หมายถึง แบบทดสอบนั้นสามารถวัดในสิ่งที่เราต้องการจะวัดได้ถูกต้อง (อนันต์ ศรีโสภา. 2525 : 43 ) การวัดใดๆจะไม่มีประโยชน์เลยถ้าเครื่องมือนั้นไม่มีความเที่ยงตรง ความเที่ยงตรงของเครื่องมือมีหลายชนิด ซึ่งแบ่งออกตามธรรมชาติและจุดมุ่งหมายของเครื่องมือแต่ละชนิด ดังนี้
1. ความเที่ยงตรงตามเนื้อหา (content validity)
2. ความเที่ยงตรงตามโครงสร้าง (construct validity)
3. ความเที่ยงตรงเชิงพยากรณ์ (predictive validity)
4. ความเที่ยงตรงตามสภาพ (concurrent validity)
1. ความเที่ยงตรงตามเนื้อหา
การหาความเที่ยงตรงแบบนี้จะหาความสอดคล้องของข้อสอบที่ออกว่าสอดคล้องกับหลักสูตรที่กำหนดให้
หรือครอบคลุมกับเนื้อหาที่จะสอนไว้หรือไม่
ดังนั้นการหาความเที่ยงตรงตามเนื้อหาไม่สามารถหาได้โดยการแสดงค่าสัมประสิทธิ์ของความเที่ยงตรงได้
แต่จะใช้วิธีการวิเคราะห์เนื้อหาและจุดมุ่งหมายของหลักสูตรก่อนที่จะสร้างแบบทดสอบ
แล้วพิจารณาตรวจสอบว่าแบบทดสอบที่สร้างขึ้นนี้มีข้อคำถามที่ได้สัดส่วนพอที่จะเป็นตัวแทนของมวลความรู้หรือไม่
วิธีการนี้เรียกว่า การสร้าง
ตารางวิเคราะห์หลักสูตร
นั้นเอง
ซึ่งแบบทดสอบวัดผลสัมฤทธิ์ทางการเรียนจะหาความเที่ยงตรงแบบนี้
2. ความเที่ยงตรงตามโครงสร้าง
หมายถึงคุณภาพของแบบทดสอบที่วัดโครงสร้างหรือคุณลักษณะตามทฤษฎี เช่น เชาว์ปัญญา ความคล่องทางภาษา ความมีเหตุผล เป็นต้น ถ้าจะสร้างเครื่องมือเพื่อวัดสิ่งที่กล่าวมา จำเป็นที่จะต้องทำความเข้าใจกับโครงสร้าง หรือคุณลักษณะนั้นให้ดีเสียก่อน ความเที่ยงตรงตามโครงสร้างเป็นการวัดสภาพปัจจุบันมากกว่าการวัดสภาพอดีต หรืออนาคต (ล้วน สายยศ และอังคณา สายยศ. 2527 :112)
วิธีการหาความเที่ยงตรงตามโครงสร้างอาจทำได้หลายวิธี ดังนี้
2.1 วิธี
Known Group Technique
(การเทียบกับกลุ่มที่รู้แล้ว)
คือการใช้
กลุ่มตัวอย่างที่เราทราบแล้วว่ามีความสามารถด้านนั้นมากน้อยเพียงใดเป็นหลักสำหรับเปรียบเทียบ
เช่นสมมติว่าเราทราบว่านักเรียนที่เรียนแผนกวิทยาศาสตร์มีความสามารถเชิงเหตุผลดีกว่านักเรียนแผนกอักษรศาสตร์
ดังนั้น
เมื่อทดสอบด้วยแบบทดสอบความมีเหตุผลแล้วคะแนนของนักเรียนแผนกวิทยาศาสตร์จะมากกว่านักเรียนแผนกอักษรศาสตร์อย่างมีนัยสำคัญทางสถิติ
ซึ่งก็แสดงว่าแบบทดสอบความมีเหตุผลมีความเที่ยงตรงตามโครงสร้าง
การทดสอบความแตกต่างของข้อมูลประเภทนี้จะใช้สถิติ t-test แบบกลุ่มตัวอย่างเป็นอิสระแก่กัน (independent samples) ซึ่งมีสูตรดังนี้ (Remington and Schork. 1970 : 213)
สูตร
เมื่อ t แทน อัตราส่วนค่าวิกฤติ
, แทน ค่าเฉลี่ยของกลุ่มที่ 1 และกลุ่มที่ 2 ตามลำดับ
แทน ความแปรปรวนของกลุ่มที่ 1 และกลุ่มที่ 2 ตามลำดับ
แทน จำนวนคนของกลุ่มที่ 1 และกลุ่มที่ 2 ตามลำดับ
ตัวอย่าง
8.8
นำแบบทดสอบความมีเหตุผลที่ได้สร้างขึ้น
ไปทดสอบกับนักศึกษาวิชาเอกวิทยาศาสตร์
จำนวน 5 คน
และนักศึกษาวิชาเอกภาษาอังกฤษ
จำนวน 8 คน ซึ่งกำลังศึกษาในปี
สุดท้าย ปรากฏผลคะแนนดังตาราง
จงหาความเที่ยงตรงตามโครงสร้างของแบบทดสอบฉบับนี้
(ตัวเลขในวงเล็บคือเลขตัวหน้ายกกำลังสอง)
นศ. เอกวิทย์ (คนที่) |
คะแนน(X1) |
นศ. เอกอังกฤษ (คนที่) |
คะแนน (X2) |
1 |
9 (81) |
1 |
7 (49) |
2 |
8 (64) |
2 |
5 (25) |
3 |
8 (64) |
3 |
6 (36) |
4 |
9 (81) |
4 |
7 (49) |
5 |
10 (100) |
5 |
5 (25) |
รวม |
44 (390) |
6 |
5 (25) |
7 |
4 (16) |
||
8 |
7 (49) |
||
รวม |
46 (274) |
จากสูตร
แทนค่าในสูตร
นำค่า t ที่คำนวณได้ไปเปรียบเทียบกับค่าวิกฤติของ t ในตาราง t โดยใช้ df = 11 (ได้มาจาก ) ที่ระดับนัยสำคัญ .01 กรณีหางเดียว ได้ค่า t (จากตาราง) = 2.718 แต่ค่า t ที่คำนวณได้มีค่าเท่ากับ 5.485 ซึ่งมีค่าสูงกว่าค่า t (จากตาราง) แปลว่า ผลการสอบของทั้งสองกลุ่ม แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 นั่นคือ ผลการสอบของนักศึกษาวิชาเอกวิทยาศาสตร์สูงกว่านักศึกษาวิชาเอกภาษาอังกฤษ เชื่อถือได้ 99 %
2.2 วิธี Pretest and Posttest Technique คือวิธีการทดสอบก่อนและหลังเรียน โดยถือหลักการว่าระหว่างทดสอบครั้งแรกกับครั้งหลังกลุ่มตัวอย่างได้พัฒนาสมองเพิ่มขึ้น และมี
ประสบการณ์เพิ่มขึ้น ดังนั้น คะแนนสอบครั้งหลังจึงควรมากกว่าคะแนนการสอบครั้งแรก
การทดสอบความแตกต่างของข้อมูลประเภทนี้ใช้สถิติ t-test แบบกลุ่มตัวอย่างไม่เป็นอิสระแก่กัน (dependent samples) ซึ่งมีสูตร ดังนี้ (Ferguson. 1976 : 167)
สูตร
เมื่อ t แทน ค่าอัตราส่วนวิกฤติ
D แทน ความแตกต่างของคะแนนแต่ละคู่
N แทน จำนวนคู่
ตัวอย่าง 8.9 นำแบบทดสอบภาษาไทยฉบับหนึ่งไปทดสอบกับนักเรียน 5 คน ซึ่งทดสอบสองครั้ง โดยครั้งแรกทดสอบก่อนเรียน และครั้งหลังทดสอบหลังเรียน ผลปรากฏดังตาราง จงหาความเที่ยงตรงตามโครงสร้างของแบบทดสอบฉบับนี้
คนที่ |
คะแนนครั้งแรก |
คะแนนครั้งหลัง |
ผลต่าง(D) |
ผลต่างยกกำลังสอง() |
1 |
3 |
8 |
5 |
25 |
2 |
4 |
8 |
4 |
16 |
3 |
5 |
7 |
2 |
4 |
4 |
3 |
9 |
6 |
36 |
5 |
4 |
8 |
4 |
16 |
? D = 21 |
? D2 = 97 |
ในที่นี้ N = 5
แทนค่าในสูตร
จากตาราง t โดยใช้ df = 4 (ได้จาก N-1) ที่ระดับนัยสำคัญ .01 กรณีหางเดียว ได้ค่าวิกฤติเท่ากับ 3.749 แต่ค่า t ที่คำนวณได้มีค่าเท่ากับ 6.24 ซึ่งมีค่ามากกว่าค่า t (จากตาราง) แปลว่า ผลการสอบครั้งหลังสูงกว่าผลการสอบครั้งแรก อย่างมีนัยสำคัญทางสถิติที่ระดับ .01
2.3 วิธี
Multivariable - Multimethod Matrix
วิธีการคือการนำเอาคะแนนผลการสอบของกลุ่มตัวอย่างที่ได้จากการสอบด้วยแบบทดสอบนั้น
ไปหาความสัมพันธ์กับคะแนนที่กลุ่มตัวอย่างได้จากแบบทดสอบฉบับอื่นที่มีโครงสร้างแบบเดียวกัน
และเป็นแบบทดสอบที่มี
คุณภาพ เช่น แบบทดสอบมาตรฐาน
ถ้าปรากฏว่าคะแนนที่ได้จากแบบทดสอบทั้งสองสอดคล้องกันแสดงว่าแบบทดสอบที่สร้างขึ้นใหม่มีความเที่ยงตรงตามโครงสร้างเหมือนแบบทดสอบฉบับ
มาตรฐาน
วิธีการหาความเที่ยงตรงแบบนี้ ใช้สูตรสหสัมพันธ์ของเพียร์สัน (pearson product moment correlation) ส่วนวิธีการคำนวณคล้ายกับตัวอย่างในบทที่ 6 สถิติที่ใช้ในการวัดผล การศึกษา เรื่องสหสัมพันธ์ เพียงแต่เปลี่ยน X เป็นคะแนนที่ได้จากแบบทดสอบที่สร้างขึ้น และ Y เป็นคะแนนที่ได้จากแบบทดสอบมาตรฐาน
2.4 วิธี Internal Consistency (การหาความสอดคล้องภายในของแบบทดสอบ) เป็นการหาความสัมพันธ์ระหว่างคะแนนสอบแต่ละข้อกับคะแนนรวม (item total correlation) หรือหาความสัมพันธ์ระหว่างข้อคำถามด้วยกัน หรือระหว่างตอนของแบบทดสอบนั้น ๆ ถ้าพบว่ามีความสัมพันธ์ภายในสูงแสดงว่าแบบทดสอบนั้นได้วัดคุณลักษณะที่ต้องการวัด หรือมีความเที่ยงตรงเชิงโครงสร้างสูง ส่วนวิธีการคำนวณใช้สูตรสหสัมพันธ์ของเพียร์สัน(pearson product moment correlation) โดยให้ X เป็นคะแนนรายข้อของทุกคน ส่วน Y เป็นคะแนนรวมทุกคนทุกข้อ ซึ่งวิธีการคำนวณเหมือนกับตัวอย่างในบทที่ 6 สถิติที่ใช้ในการวัดผลการศึกษา เรื่องสหสัมพันธ์
3. ความเที่ยงตรงเชิงพยากรณ์
เป็นความสอดคล้องของผลการวัดจากเครื่องมือที่สร้างขึ้นกับผลที่คาดคะเนหรือคาดการณ์ไว้ ที่จะเกิดขึ้นในอนาคตโดยกำหนดระยะเวลาเอาไว้ อาจจะเป็นระยะสั้นหรือระยะยาวก็ได้ เช่น คนที่สอบวิชาความถนัดทางการเรียนได้คะแนนสูง เมื่อเข้าเรียนก็สามารถเรียนได้โดยมีผลการเรียนปลายภาค หรือปลายปี หรือตลอดหลักสูตรได้คะแนนอยู่ในเกณฑ์ดี ก็แสดงว่าแบบทดสอบวิชาความถนัดทางการเรียนที่ใช้ในการสอบนี้มีความเที่ยงตรงเชิงพยากรณ์สูง การหาความเที่ยงตรงเชิงพยากรณ์จึงต้องรอให้บุคคลได้ปฏิบัติกิจกรรมที่ต้องการศึกษานั้นสักช่วงระยะหนึ่ง แล้วจึงนำผลการปฏิบัตินั้นไปสหสัมพันธ์กับคะแนนที่ได้จากเครื่องมือที่สร้างขึ้น คะแนนจากแบบทดสอบวัดความถนัดทางการเรียนถือว่าเป็นตัวพยากรณ์ (predictor) ซึ่งเป็นตัวแปรอิสระ ส่วนคะแนนผลสัมฤทธิ์ หรือคะแนนเฉลี่ยสะสมถือว่าเป็นตัวเกณฑ์ (criterion) ซึ่งเป็นตัวแปรตาม
สถิติที่ใช้ในการคำนวณคือสหสัมพันธ์ของเพียร์สัน (pearson product moment correlation) ใช้ในกรณีที่ผลการวัดทั้งสองชุดเป็นคะแนน แต่ถ้าผลของการวัดอยู่ในรูปอื่นจะใช้สหสัมพันธ์แบบอื่นที่สอดคล้องกันกับข้อตกลงของสถิตินั้น ๆ
4. ความเที่ยงตรงตามสภาพ
ความเที่ยงตรงตามสภาพ หมายถึง คุณภาพของแบบทดสอบที่วัดได้ตรงกับความเป็นจริงในสภาพปัจจุบัน เช่น ยอดชายทำคะแนนสอบในวิชาศีลธรรมได้คะแนนสูง ดังนั้น ในสภาพความเป็นจริงเขาก็ควรเป็นคนที่มีศีลธรรมด้วย ไม่ใช่ว่าได้คะแนนสอบวิชานี้สูงแต่เป็นคนชอบพูดจาโกหก ลักเล็กขโมยน้อย เป็นต้น หรือลูกปลาสอบวิชาคณิตศาสตร์ได้คะแนนสูง ถ้าแบบทดสอบนี้มีความเที่ยงตรงตามสภาพ ลูกปลาก็ควรเป็นคนที่แก้ปัญหาคณิตศาสตร์ได้เก่งด้วย เช่น การคิดเงินทอนในการขายของไม่ผิดพลาด เป็นต้น ถ้าเราพบว่าคนที่สอบวิชาพลานามัยได้คะแนนสูงมาก แต่สภาพความเป็นจริงเป็นคนที่มีสุขภาพอนามัยอ่อนแอ ขี้โรค แต่งกายสกปรก อย่างนี้แสดงว่าแบบทดสอบนั้นขาดความเที่ยงตรงตามสภาพ
การหาความเที่ยงตรงตามสภาพต้องนำเอาคะแนนจากแบบทดสอบไปสหสัมพันธ์กับเกณฑ์ปัจจุบัน ซึ่งเกณฑ์ปัจจุบันได้แก่ ผลการสังเกตของครูขณะทำการสอน อาจจะเป็นการจัดอันดับที่จากเก่งที่สุดถึงอ่อนที่สุด ซึ่งในกรณีนี้จะใช้สูตรสหสัมพันธ์แบบอันดับของสเปียร์แมน (spearman rank correlation) แต่ถ้าหากเกณฑ์ปัจจุบันเป็นคะแนนภาคปฏิบัติ หรือระดับคะแนนเฉลี่ยของรายวิชานั้น ๆ การคำนวณหาความเที่ยงตรงตามสภาพจะใช้สหสัมพันธ์ของเพียร์สัน (pearson product moment correlation)
ความเที่ยงตรงเชิงพยากรณ์และความเที่ยงตรงตามสภาพนี้ เรียกรวมกันอีกอย่างหนึ่งว่า ความเที่ยงตรงเชิงเกณฑ์สัมพันธ์ เนื่องจากความเที่ยงตรงประเภทนี้เป็นการพิจารณาความสัมพันธ์ระหว่างเครื่องมือรวบรวมข้อมูลกับเกณฑ์ภายนอกบางอย่าง ซึ่งเป็นสภาพความจริงที่ได้จากการปฏิบัติ