ความเที่ยงตรงตามแนวคิดอิงกลุ่ม

ความเที่ยงตรงตามแนวคิดอิงกลุ่ม

ความเที่ยงตรง (validity) หมายถึง ประสิทธิภาพของแบบทดสอบที่สามารถวัดลักษณะ (trait) ที่ต้องการจะวัดได้ หรือ หมายถึง แบบทดสอบนั้นสามารถวัดในสิ่งที่เราต้องการจะวัดได้ถูกต้อง (อนันต์ ศรีโสภา. 2525 : 43 ) การวัดใดๆจะไม่มีประโยชน์เลยถ้าเครื่องมือนั้นไม่มีความเที่ยงตรง ความเที่ยงตรงของเครื่องมือมีหลายชนิด ซึ่งแบ่งออกตามธรรมชาติและจุดมุ่งหมายของเครื่องมือแต่ละชนิด ดังนี้

1. ความเที่ยงตรงตามเนื้อหา (content validity)

2. ความเที่ยงตรงตามโครงสร้าง (construct validity)

3. ความเที่ยงตรงเชิงพยากรณ์ (predictive validity)

4. ความเที่ยงตรงตามสภาพ (concurrent validity)

การหาความเที่ยงตรงแบบนี้จะหาความสอดคล้องของข้อสอบที่ออกว่าสอดคล้องกับหลักสูตรที่กำหนดให้ หรือครอบคลุมกับเนื้อหาที่จะสอนไว้หรือไม่ ดังนั้นการหาความเที่ยงตรงตามเนื้อหาไม่สามารถหาได้โดยการแสดงค่าสัมประสิทธิ์ของความเที่ยงตรงได้ แต่จะใช้วิธีการวิเคราะห์เนื้อหาและจุดมุ่งหมายของหลักสูตรก่อนที่จะสร้างแบบทดสอบ แล้วพิจารณาตรวจสอบว่าแบบทดสอบที่สร้างขึ้นนี้มีข้อคำถามที่ได้สัดส่วนพอที่จะเป็นตัวแทนของมวลความรู้หรือไม่ วิธีการนี้เรียกว่า การสร้าง
ตารางวิเคราะห์หลักสูตร นั้นเอง ซึ่งแบบทดสอบวัดผลสัมฤทธิ์ทางการเรียนจะหาความเที่ยงตรงแบบนี้

2. ความเที่ยงตรงตามโครงสร้าง

หมายถึงคุณภาพของแบบทดสอบที่วัดโครงสร้างหรือคุณลักษณะตามทฤษฎี เช่น เชาว์ปัญญา ความคล่องทางภาษา ความมีเหตุผล เป็นต้น ถ้าจะสร้างเครื่องมือเพื่อวัดสิ่งที่กล่าวมา จำเป็นที่จะต้องทำความเข้าใจกับโครงสร้าง หรือคุณลักษณะนั้นให้ดีเสียก่อน ความเที่ยงตรงตามโครงสร้างเป็นการวัดสภาพปัจจุบันมากกว่าการวัดสภาพอดีต หรืออนาคต (ล้วน สายยศ และอังคณา สายยศ. 2527 :112)

วิธีการหาความเที่ยงตรงตามโครงสร้างอาจทำได้หลายวิธี ดังนี้

2.1 วิธี Known Group Technique (การเทียบกับกลุ่มที่รู้แล้ว) คือการใช้
กลุ่มตัวอย่างที่เราทราบแล้วว่ามีความสามารถด้านนั้นมากน้อยเพียงใดเป็นหลักสำหรับเปรียบเทียบ เช่นสมมติว่าเราทราบว่านักเรียนที่เรียนแผนกวิทยาศาสตร์มีความสามารถเชิงเหตุผลดีกว่านักเรียนแผนกอักษรศาสตร์ ดังนั้น เมื่อทดสอบด้วยแบบทดสอบความมีเหตุผลแล้วคะแนนของนักเรียนแผนกวิทยาศาสตร์จะมากกว่านักเรียนแผนกอักษรศาสตร์อย่างมีนัยสำคัญทางสถิติ ซึ่งก็แสดงว่าแบบทดสอบความมีเหตุผลมีความเที่ยงตรงตามโครงสร้าง

การทดสอบความแตกต่างของข้อมูลประเภทนี้จะใช้สถิติ t-test แบบกลุ่มตัวอย่างเป็นอิสระแก่กัน (independent samples) ซึ่งมีสูตรดังนี้ (Remington and Schork. 1970 : 213)

แทน ค่าเฉลี่ยของกลุ่มที่ 1 และกลุ่มที่ 2 ตามลำดับ

แทน ความแปรปรวนของกลุ่มที่ 1 และกลุ่มที่ 2 ตามลำดับ

แทน จำนวนคนของกลุ่มที่ 1 และกลุ่มที่ 2 ตามลำดับ

ตัวอย่าง 8.8 นำแบบทดสอบความมีเหตุผลที่ได้สร้างขึ้น ไปทดสอบกับนักศึกษาวิชาเอกวิทยาศาสตร์ จำนวน 5 คน และนักศึกษาวิชาเอกภาษาอังกฤษ จำนวน 8 คน ซึ่งกำลังศึกษาในปี
สุดท้าย ปรากฏผลคะแนนดังตาราง จงหาความเที่ยงตรงตามโครงสร้างของแบบทดสอบฉบับนี้ (ตัวเลขในวงเล็บคือเลขตัวหน้ายกกำลังสอง)

นศ. เอกวิทย์ (คนที่)	คะแนน(X1)	นศ. เอกอังกฤษ (คนที่)	คะแนน (X2)
1	9 (81)	1	7 (49)
2	8 (64)	2	5 (25)
3	8 (64)	3	6 (36)
4	9 (81)	4	7 (49)
5	10 (100)	5	5 (25)
รวม	44 (390)	6	5 (25)
		7	4 (16)
		8	7 (49)
		รวม	46 (274)

นำค่า t ที่คำนวณได้ไปเปรียบเทียบกับค่าวิกฤติของ t ในตาราง t โดยใช้ df = 11 (ได้มาจาก

) ที่ระดับนัยสำคัญ .01 กรณีหางเดียว ได้ค่า t (จากตาราง) = 2.718 แต่ค่า t ที่คำนวณได้มีค่าเท่ากับ 5.485 ซึ่งมีค่าสูงกว่าค่า t (จากตาราง) แปลว่า ผลการสอบของทั้งสองกลุ่ม แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 นั่นคือ ผลการสอบของนักศึกษาวิชาเอกวิทยาศาสตร์สูงกว่านักศึกษาวิชาเอกภาษาอังกฤษ เชื่อถือได้ 99 %

2.2 วิธี Pretest and Posttest Technique คือวิธีการทดสอบก่อนและหลังเรียน โดยถือหลักการว่าระหว่างทดสอบครั้งแรกกับครั้งหลังกลุ่มตัวอย่างได้พัฒนาสมองเพิ่มขึ้น และมี

ประสบการณ์เพิ่มขึ้น ดังนั้น คะแนนสอบครั้งหลังจึงควรมากกว่าคะแนนการสอบครั้งแรก

การทดสอบความแตกต่างของข้อมูลประเภทนี้ใช้สถิติ t-test แบบกลุ่มตัวอย่างไม่เป็นอิสระแก่กัน (dependent samples) ซึ่งมีสูตร ดังนี้ (Ferguson. 1976 : 167)

เมื่อ t แทน ค่าอัตราส่วนวิกฤติ

D แทน ความแตกต่างของคะแนนแต่ละคู่

ตัวอย่าง 8.9 นำแบบทดสอบภาษาไทยฉบับหนึ่งไปทดสอบกับนักเรียน 5 คน ซึ่งทดสอบสองครั้ง โดยครั้งแรกทดสอบก่อนเรียน และครั้งหลังทดสอบหลังเรียน ผลปรากฏดังตาราง จงหาความเที่ยงตรงตามโครงสร้างของแบบทดสอบฉบับนี้

คนที่	คะแนนครั้งแรก	คะแนนครั้งหลัง	ผลต่าง(D)	ผลต่างยกกำลังสอง()
1	3	8	5	25
2	4	8	4	16
3	5	7	2	4
4	3	9	6	36
5	4	8	4	16
			? D = 21	? D² = 97

จากตาราง t โดยใช้ df = 4 (ได้จาก N-1) ที่ระดับนัยสำคัญ .01 กรณีหางเดียว ได้ค่าวิกฤติเท่ากับ 3.749 แต่ค่า t ที่คำนวณได้มีค่าเท่ากับ 6.24 ซึ่งมีค่ามากกว่าค่า t (จากตาราง) แปลว่า ผลการสอบครั้งหลังสูงกว่าผลการสอบครั้งแรก อย่างมีนัยสำคัญทางสถิติที่ระดับ .01

2.3 วิธี Multivariable - Multimethod Matrix วิธีการคือการนำเอาคะแนนผลการสอบของกลุ่มตัวอย่างที่ได้จากการสอบด้วยแบบทดสอบนั้น ไปหาความสัมพันธ์กับคะแนนที่กลุ่มตัวอย่างได้จากแบบทดสอบฉบับอื่นที่มีโครงสร้างแบบเดียวกัน และเป็นแบบทดสอบที่มี
คุณภาพ เช่น แบบทดสอบมาตรฐาน ถ้าปรากฏว่าคะแนนที่ได้จากแบบทดสอบทั้งสองสอดคล้องกันแสดงว่าแบบทดสอบที่สร้างขึ้นใหม่มีความเที่ยงตรงตามโครงสร้างเหมือนแบบทดสอบฉบับ
มาตรฐาน

วิธีการหาความเที่ยงตรงแบบนี้ ใช้สูตรสหสัมพันธ์ของเพียร์สัน (pearson product moment correlation) ส่วนวิธีการคำนวณคล้ายกับตัวอย่างในบทที่ 6 สถิติที่ใช้ในการวัดผล การศึกษา เรื่องสหสัมพันธ์ เพียงแต่เปลี่ยน X เป็นคะแนนที่ได้จากแบบทดสอบที่สร้างขึ้น และ Y เป็นคะแนนที่ได้จากแบบทดสอบมาตรฐาน

2.4 วิธี Internal Consistency (การหาความสอดคล้องภายในของแบบทดสอบ) เป็นการหาความสัมพันธ์ระหว่างคะแนนสอบแต่ละข้อกับคะแนนรวม (item total correlation) หรือหาความสัมพันธ์ระหว่างข้อคำถามด้วยกัน หรือระหว่างตอนของแบบทดสอบนั้น ๆ ถ้าพบว่ามีความสัมพันธ์ภายในสูงแสดงว่าแบบทดสอบนั้นได้วัดคุณลักษณะที่ต้องการวัด หรือมีความเที่ยงตรงเชิงโครงสร้างสูง ส่วนวิธีการคำนวณใช้สูตรสหสัมพันธ์ของเพียร์สัน(pearson product moment correlation) โดยให้ X เป็นคะแนนรายข้อของทุกคน ส่วน Y เป็นคะแนนรวมทุกคนทุกข้อ ซึ่งวิธีการคำนวณเหมือนกับตัวอย่างในบทที่ 6 สถิติที่ใช้ในการวัดผลการศึกษา เรื่องสหสัมพันธ์

เป็นความสอดคล้องของผลการวัดจากเครื่องมือที่สร้างขึ้นกับผลที่คาดคะเนหรือคาดการณ์ไว้ ที่จะเกิดขึ้นในอนาคตโดยกำหนดระยะเวลาเอาไว้ อาจจะเป็นระยะสั้นหรือระยะยาวก็ได้ เช่น คนที่สอบวิชาความถนัดทางการเรียนได้คะแนนสูง เมื่อเข้าเรียนก็สามารถเรียนได้โดยมีผลการเรียนปลายภาค หรือปลายปี หรือตลอดหลักสูตรได้คะแนนอยู่ในเกณฑ์ดี ก็แสดงว่าแบบทดสอบวิชาความถนัดทางการเรียนที่ใช้ในการสอบนี้มีความเที่ยงตรงเชิงพยากรณ์สูง การหาความเที่ยงตรงเชิงพยากรณ์จึงต้องรอให้บุคคลได้ปฏิบัติกิจกรรมที่ต้องการศึกษานั้นสักช่วงระยะหนึ่ง แล้วจึงนำผลการปฏิบัตินั้นไปสหสัมพันธ์กับคะแนนที่ได้จากเครื่องมือที่สร้างขึ้น คะแนนจากแบบทดสอบวัดความถนัดทางการเรียนถือว่าเป็นตัวพยากรณ์ (predictor) ซึ่งเป็นตัวแปรอิสระ ส่วนคะแนนผลสัมฤทธิ์ หรือคะแนนเฉลี่ยสะสมถือว่าเป็นตัวเกณฑ์ (criterion) ซึ่งเป็นตัวแปรตาม

สถิติที่ใช้ในการคำนวณคือสหสัมพันธ์ของเพียร์สัน (pearson product moment correlation) ใช้ในกรณีที่ผลการวัดทั้งสองชุดเป็นคะแนน แต่ถ้าผลของการวัดอยู่ในรูปอื่นจะใช้สหสัมพันธ์แบบอื่นที่สอดคล้องกันกับข้อตกลงของสถิตินั้น ๆ

ความเที่ยงตรงตามสภาพ หมายถึง คุณภาพของแบบทดสอบที่วัดได้ตรงกับความเป็นจริงในสภาพปัจจุบัน เช่น ยอดชายทำคะแนนสอบในวิชาศีลธรรมได้คะแนนสูง ดังนั้น ในสภาพความเป็นจริงเขาก็ควรเป็นคนที่มีศีลธรรมด้วย ไม่ใช่ว่าได้คะแนนสอบวิชานี้สูงแต่เป็นคนชอบพูดจาโกหก ลักเล็กขโมยน้อย เป็นต้น หรือลูกปลาสอบวิชาคณิตศาสตร์ได้คะแนนสูง ถ้าแบบทดสอบนี้มีความเที่ยงตรงตามสภาพ ลูกปลาก็ควรเป็นคนที่แก้ปัญหาคณิตศาสตร์ได้เก่งด้วย เช่น การคิดเงินทอนในการขายของไม่ผิดพลาด เป็นต้น ถ้าเราพบว่าคนที่สอบวิชาพลานามัยได้คะแนนสูงมาก แต่สภาพความเป็นจริงเป็นคนที่มีสุขภาพอนามัยอ่อนแอ ขี้โรค แต่งกายสกปรก อย่างนี้แสดงว่าแบบทดสอบนั้นขาดความเที่ยงตรงตามสภาพ

การหาความเที่ยงตรงตามสภาพต้องนำเอาคะแนนจากแบบทดสอบไปสหสัมพันธ์กับเกณฑ์ปัจจุบัน ซึ่งเกณฑ์ปัจจุบันได้แก่ ผลการสังเกตของครูขณะทำการสอน อาจจะเป็นการจัดอันดับที่จากเก่งที่สุดถึงอ่อนที่สุด ซึ่งในกรณีนี้จะใช้สูตรสหสัมพันธ์แบบอันดับของสเปียร์แมน (spearman rank correlation) แต่ถ้าหากเกณฑ์ปัจจุบันเป็นคะแนนภาคปฏิบัติ หรือระดับคะแนนเฉลี่ยของรายวิชานั้น ๆ การคำนวณหาความเที่ยงตรงตามสภาพจะใช้สหสัมพันธ์ของเพียร์สัน (pearson product moment correlation)

ความเที่ยงตรงเชิงพยากรณ์และความเที่ยงตรงตามสภาพนี้ เรียกรวมกันอีกอย่างหนึ่งว่า ความเที่ยงตรงเชิงเกณฑ์สัมพันธ์ เนื่องจากความเที่ยงตรงประเภทนี้เป็นการพิจารณาความสัมพันธ์ระหว่างเครื่องมือรวบรวมข้อมูลกับเกณฑ์ภายนอกบางอย่าง ซึ่งเป็นสภาพความจริงที่ได้จากการปฏิบัติ