การทดสอบความเป็นอิสระต่อกันของสองตัวแปร (Test for independence, Contingency table test) บางครั้งเรามีข้อมูลลักษณะเป็นกลุ่ม (Category data) อยู่สองกลุ่ม เช่น เครื่องจักรกับชิ้นงานที่ผลิตได้ เพศของนักเรียนกับคณะที่เลือกอันดับหนึ่งในการสอบเข้าเรียนต่อในมหาวิทยาลัย เป็นต้น เราต้องการจะพิสูจน์ว่าตัวแปรที่หนึ่งเป็นเหตุหรือมีผลต่อตัวแปรที่สองหรือไม่ เครื่องมือที่ใช้เพื่อทำการทดสอบข้อมูลลักษณะนี้ เราเรียกว่า Contingency Table หรือบางครั้งก็เรียก Chi-square test การเก็บข้อมูล จะมีรูปแบบการบันทึกข้อมูลที่เป็นกฎเกณฑ์ ตามตารางดังต่อไปนี้ การตั้งสมมติฐาน จุดประสงค์ของการทดสอบคือ เราต้องการทราบความสัมพันธ์ ระหว่างตัวแปรสองตัวแปร รูปแบบการตั้งสมมติฐานจะต้องเป็นตามรูปแบบต่อไปนี้ Ho: Factor 1 ไม่ขึ้นอยู่กับ Factor 2 Ha: Factor 1 ขึ้นอยู่กับ Factor 2 กำหนดค่า Alpha หรือกำหนดระดับนัยสำคัญ โดยปกติเราให้ a = 0.05 ในกรณีนี้ เราใช้ c2 เป็น Test statistic ขั้นตอนการพิสูจน์ขอให้ดูดังตัวอย่างต่อไปนี้ ตัวอย่างที่1. ในโรงานผลิตสินค้าแห่งหนึ่ง วิศวกรต้องการทราบว่าจำนวนชิ้นงานที่พบข้อบกพร่องจากการผลิตขึ้นอยู่กับเครื่องจักรในสายการผลิตจำนวน 3 เครื่องนั้นหรือไม่ จึงได้สุ่มตรวจงานที่พบข้อบกพร่องโดยแยกรายละเอียดลักษณะของข้อบกพร่อง และแยกแต่ละเครื่องจักร บันทึกข้อมูลดังในตาราง
คำถามก็คือว่า ลักษณะของข้องบกพร่องขึ้นอยู่กับแต่ละเครื่องจักรหรือเปล่า เช่นว่า ที่เครื่องจักร #1 พบว่าลักษณะข้อบกพร่อง Scratch มากกว่าลักษณะอื่นๆ ขณะที่เครื่อง #2 กลับแทบไม่มีอาการแบบนี้เลย กรณีที่เราได้ข้อมูลเป็นตามตาราง เราจะสรุปว่าอย่างไร ขั้นตอนการพิสูจน์
Ho: ลักษณะของข้อบกพร่องของชิ้นงาน ไม่ได้ขึ้นอยู่กับ เครื่องจักร Ha: ลักษณะของข้อบกพร่องของชิ้นงาน ขึ้นอยู่กับ เครื่องจักร
เมื่อ Xtotal คือผลรวมในแนว Column ที่ Cell นั้นอยู่ Ytotal คือผลรวมในแนว Row ที่ Cell นั้นอยู่ Total คือผลรวมทั้งหมด
เมื่อคำนวณแล้วจะได้ค่า Expected ของแต่ละช่องดังต่อไปนี้
ค่า Expected value นี้เป็นค่าตามทฤษฎี โดยเปรียบเทียบว่า ถ้าผลรวมของข้อมูลในแนว Column และ Row ได้มาอย่างนี้ ในแต่ละ Cell นั้นควรจะได้จำนวนตัวอย่างมากเท่าใด (ตามกฏความน่าจะเป็น)
ค่า c2 นี้ คือค่าความคลาดเคลื่อน ระหว่างค่า จริงกับ Expected value ในรูปกำลังสอง ซึ่งได้ค่าดังนี้
6. คำนวณหาค่า Calculated Chi-square จากสมการ = 46.348+14.507+13.486+27.419+32.263+0.856+12.357+0.713+32.823 = 180.770
df = (C-1)(R-1) เมื่อ C คือจำ นวน Column R คือจำนวน Row
ดังงนั้น
df = (3-1)(3-1) = 2*2 = 4
จากตารางได้
=
9.488
ถ้า > เราถือว่า ปฏิเสธ Ho จากสมมติฐาน Ho: Factor 1 ไม่ขึ้นอยู่กับ Factor 2 Ha: Factor 1 ขึ้นอยู่กับ Factor 2 เมื่อเราปฏิเสธ Ho ในกรณีตัวอย่างนี้จึงสรุปได้ว่า เครื่องจักรแต่ละเครื่อง ทำให้เกิดลักษณะอาการข้องบกพร่องของชิ้นงาน แตกต่างกัน หมายความว่า หากจะลดอาการ Scratch ก็ต้องแก้ที่เครื่อง 1 อาจจะไม่จำเป็นต้องแก้ เครื่อง 2 หรือ 3 ก็ได้ กรณีตัวอย่างนี้ สมมติว่า เรายอมรับ Ho แปลว่า ลักษณะของข้อบกพร่อง ไม่ได้เกี่ยวกับ เครื่องจักรเลย นั่นคือ Scratch, Base crack และ Arm bent จะมีจำนวนเรียงลำดับอย่างนี้ทุกเครื่อง นั่นอาจเป็นเพราะ เหตุอื่นที่ไม่ใช่เครื่องจักรก็ได้ ที่ทำให้เกิดข้อบกพร่องในชิ้นงาน หากพิสูจน์โดยใช้ โปรแกรม Minitab จะได้ดังนี้ Chi-Square
Test: MC#1, MC#2 and MC#3 Expected
counts are printed below observed counts
MC#1
MC#2
MC#3 Total Scratch
128
9 19
156
70.74
43.56
41.70 Base
crack 44
87
40
171
77.54
47.75
45.71 Arm
bent 18
21 53
92
41.72
25.69
24.59 Total
190
117 112
419 Chi-Sq
= 46.349 + 27.420 + 12.357 +14.509 + 32.264 + 0.713 +
13.485 + 0.856 + 32.817 =
180.770 DF
= 4, P-Value = 0.000 ค่า P-Value น้อยกว่า a แปลว่าเรา ปฏิเสธ Ho ตัวอย่างที่ 2 ผลสำรวจตัวอย่างของนักเรียนชั้นมัธยมศึกษาปีที่ 6 ที่กำลังจะสมัครสอบเข้าเรียนต่อในมหาวิทยาลัย เกี่ยวกับสาขาที่เลือกเป็นอันดับ 1 ได้ผลดังตารางต่อไปนี้
คำถามคือ " เพศเป็นปัจจัยที่มีผลต่อการเลือกคณะอันดับ 1 ของนักเรียนหรือไม่ " ให้ทำการทดสอบสมมติฐาน โดยให้ระดับความมั่นใจที่ 95% ขั้นตอนการพิสูจน์
สมมติฐานของผู้ที่ทำการวิจัยในข้อนี้คือ เพศไม่ได้เป็นปัจจัยที่มีผลต่อการเลือกคณะอันดับ 1 เพราะตามหลักวิชาสถิติ สมมติฐานจะต้องถือว่า ปัจจัยหนึ่งไม่ได้ได้มีผลต่ออีกปัจจัยหนึ่ง จนกว่าจะมีหลักฐานมายืนยันว่ามีผล เมื่อเขียนสมมติฐานตามหลักวิชาสถิติจะได้ดังนี้ Ho: เพศไม่ได้เป็นปัจจัยที่มีผลต่อการเลือกคณะอันดับ 1 Ha: เพศเป็นปัจจัยที่มีผลต่อการเลือกคณะอันดับ 1
3. คำนวณหาค่า Expected value ของแต่ละช่อง (Cell) ได้ดังนี้
4. คำนวณหาค่า c2 ของแต่ละ Cell ได้ค่าดังต่อไปนี้
= 71.89+9.43+12.32+1.20+23.14+4.55+69.03+9.06+11.83+1.15+22.22+4.37 = 240.179
df = (C-1)(R-1) = (2-1)(6-1) = 5
จากตารางจะได้ = 11.07
เนื่องจาก > เราถือว่า ปฏิเสธ Ho ที่ว่า เพศไม่ได้เป็นปัจจัยที่มีผลต่อการเลือกคณะอันดับ 1
เมื่อใช้ โปรแกรม Minitab ในการวิเคราะห์ข้อมูล จะได้ดังนี้ Chi-Square
Test: Male, Female Expected
counts are printed below observed counts
Male
Female
Total Eng
321
89 410
200.84
209.16 IT
156
251 407
199.37
207.63 Sci
89
174 263
128.83
134.17 Law
74 59 133
65.15
67.85 MassCom
15
84 99
48.50
50.50 So_Sci
21
47 68
33.31
34.69 Total
676 704
1380 Chi-Sq
= 71.889 + 69.030 + 9.435 + 9.060 + 12.315 + 11.825 +
1.202 + 1.154 + 23.135 + 22.215 +
4.549 + 4.368 = 240.179
DF = 5, P-Value = 0.000 เมื่อ P-Value น้อยกว่า a เราจึงปฏิเสธ Ho จากสมมติฐาน Ho: เพศไม่ได้เป็นปัจจัยที่มีผลต่อการเลือกคณะอันดับ 1 Ha: เพศเป็นปัจจัยที่มีผลต่อการเลือกคณะอันดับ 1 1. ไม่มีข้อกำหนดเรื่องขนาดของสิ่งตัวอย่างตายตัว เพียงแต่ในระหว่างเก็บข้อมูลหากข้อมูลที่เก็บมาได้ใน Cell ใด Cell หนึ่ง มีค่าน้อยกว่า 5 นั่นเป็นข้อบ่งบอกว่า เรายังเก็บข้อมูลไม่เพียงพอ จำเป็นต้องใช้ขนาดสิ่งตัวอย่างเพิ่มขึ้น ถ้าหากเรายังฝืนใช้ข้อมูลดังกล่าววิเคราะห์ ผลสรุปก็จะนำไปสู่การสรุปที่ผิดพลาดอยู่ดี เป็นเรื่องที่ไม่ควรทำอย่างมาก 2. ในการทดสอบสมมติฐานนั้น สิ่งสำคัญอยู่ที่การเก็บและบันทึกข้อมูล จะต้องเก็บข้อมูลอย่างสุ่ม ขอบเขตของสิ่งตัวอย่างนั้นขึ้นอยู่กับขอบเขตการทำการวิจัย เช่น ถ้าผู้ทำการวิจัยตามตัวอย่างที่ 2 ต้องการศึกษาเฉพาะโรงเรียนในเขตกรุงเทพฯ ก็ให้ทำการเก็บข้อมูลโรงเรียนในกรุงเทพฯ เท่านั้น ในขณะเก็บข้อมูล จะต้องสุ่มสอบถามตัวอย่าง โดยที่ผู้สอบถามไม่ได้รู้ว่าตัวอย่างเลือกคณะอะไรมาก่อนเสมอ 3. Contingency Table ให้ข้อสรุปเพียงแค่ว่า Factor หนึ่งขึ้นอยู่กับอีก Factor หรือไม่ หรือ Factor หนึ่งมีผลหรือมีอิทธิพลต่ออีก Factor หรือไม่ เท่านั้น
|