การอนุมานค่ากลางของประชากร กรณีไม่รู้ค่าความแปรปรวน (Inference on the mean of a population, Variance unknown) จากหัวข้อที่ผ่านมาเราได้เรียนรู้เกี่ยวกับการทดสอบสมมตฐานบนพื้นฐานที่เรารู้ค่าความแปรปรวนของประชากร (s2) แต่ในความเป็นจริง สิ่งที่เราไม่อาจจะรู้ได้เลยก็คือค่าความแปรปรวนของประชากรนั่นเอง แต่บางครั้งเราก็สามารถยอมรับให้ใช้การทดสอบสมมติฐานโดยวิธี 1-Sample Z test ได้ ถ้าจำนวนสิ่งตัวอย่างมีมากพอ ( n>30 ) ตามทฤษฎี Central limit theorem แต่นั่นต้องอยู่บนพื้นฐานที่ว่า การกระจายตัวของค่าสิ่งตัวอย่างจะต้องเป็นแบบปกติ (Normal distribution) เสมอ แต่ในทางปฏิบัติก็จะมีข้อมูลบางประเภทที่เกือบจะไม่เป็น Normal distribution เลย และนั่นก็จะส่งผลให้เกิดความคลาดเคลื่อนเมื่อนำไปอนุมานประชากร เพื่อหลีกเลี่ยงความผิดพลาด เราจึงจึงต้องใช้วิธีอนุมานประชากรใหม่ ที่ไม่ได้ต้องการรู้ค่าความแปรปรวนของประชากร การทดสอบค่ากลาง สมมติประชากรที่เราสนใจมีการกระจายแบบปกติ (Normal distribution) และเราก็ไม่รู้ค่า (m) และ (s2) เมื่อเราต้องการทดสอบสมมติฐาน โดยเทียบกับค่าคงที่ค่าหนึ่งโดยวิธี Two-sided alternative โดยเขียนสมมติฐานได้ดังนี้
เมื่อ m0 คือค่าคงที่ที่เราระบุในสมมติฐาน โดยที่เราไม่รู้ค่า (s2) เราจึงต้องทำการสุ่มตัวอย่างออกมาจากประชากรแล้วคำนวณหาค่า (s) ของกลุ่มข้อมูลตัวอย่าง เราจึงต้องเลือกใช้ T ในการทดสอบ T0 นี้เราจะเรียกว่าตัวทดสอบสถิติ (Test Statistic) นั่นคือเราจะใช้ t-Distribution แทน Z-Distribution ในการอ้างอิง นั่นคือเราจะต้องใช้ degree of freedom เท่ากับ n-1 ด้วย และตัวสถิติทดสอบ เราก็ใช้ T0 แทน Z0 ด้วย จากสมมติฐาน เราจะปฏิเสธ H0 : m = m0 ถ้าค่า T0จะมีค่าอยู่ระหว่าง - ta/2,n-1 และ ta/2,n-1 ดังรูปที่แสดง
และเราจะยอมรับ H0: m = m0 ถ้า
แต่ถ้าสมมติฐานเขียนเป็น เราจะปฏิเสธ H0: m = m0 เมื่อ To > ta,n-1 แต่ถ้าสมมติฐานเขียนเป็น เราจะปฏิเสธ H0: m = m0 เมื่อ To < - ta,n-1 การทดสอบโดยใช้ T0 (Student-t distribution) ดังที่กล่าวมา บางครั้งก็รู้จักกันในชื่อ 1- Sample t Test ตัวอย่างการประยุกต์ใช้ 1-Sample t Test วิศวกรต้องการทดสอบว่าเส้นลวดที่กำลังทำการผลิตอยู่นั้นสามารถทนแรงดึงได้เท่ากับค่าที่กำหนดคือ 10 MPa หรือไม่ จึงได้ทำการสุ่มตัวอย่างจากสายการผลิตมาทดสอบ ด้วยเครื่องทดสอบ เป็นจำนวน 22 ตัวอย่าง ดังค่าต่อไปนี้
ให้ทำการทดสอบสมมติฐาน จากข้อมูล 25 ตัวอย่าง จะมีค่า Statistics ต่างๆ ดังนี้ Variable N Mean StDev Reading 25 12.380 3.159 ทำการทดสอบความเป็นปกติของการกระจายของข้อมูล Normality Test จากกราฟ จะเห็นได้ชัดเจนว่าข้อมูลมีการกระจายแบบปกติ ( Normal distribution ) ขั้นตอนในการทดสอบสมมติฐาน 1. ระบุค่าพารามิเตอร์ที่จะทดสอบ ในกรณีนี้คือค่าเฉลี่ยของความสามารถในการทนแรงดึงของเส้นลวด (m) 2. ตั้งสมมติฐาน4. เลือกใช้ตัวสถิติในการทดสอบ โดยโปรแกรม Minitab ได้ดังนี้ Inverse Cumulative Distribution Function Student's t distribution with 24 DF P( X <= x ) x 0.0250 -2.0639
หรือจากฟังก์ชันคณิตศาสตร์ของโปรแกรม Microsoft Excel ได้ดังนี้ เนื่องจากกลไก การคำนวณที่แตกต่างกัน โดยที่ Minitab จะคำนวณพื้นที่ด้านซ้ายมือของค่า Probability ที่ระบุ จึงได้ค่าออกมาเป็นค่าลบ ส่วนใน Excel นั้น เครื่องจะถือว่าเป็น Two-tailed เมื่อเราใส่ค่า Probability เครื่องจะนำไปหาร 2 อีกทีเพื่อใช้ในการคำนวณ ดังนั้นค่าที่ใส่เข้าไปเพื่อให้เครื่องคำนวณ คือค่า ระดับนัยสำคัญ โดยตรง และเครื่องจะคำนวณหรือคิดพื้นที่ทางด้านขวามือ จึงได้ค่าเป็นบวก จะได้ค่า -ta/2 = -2.063 และค่า ta/2, 24= 2.063 ดังนั้นช่วงที่ยอมรับ H0 : m = 10 MPa. คือ เนื่องจาก T0 = 3.767 ซึ่งมากกว่า 2.063 จึงสรุปว่าเราปฏิเสธ H0 : m = 10 MPa. หรือ ค่าความสามารถในการทนแรงดึงของเส้นลวดไม่เท่ากับ 10 MPa อย่างมีนัยสำคัญ ถ้าใช้ โปรแกรม Minitab เพื่อพิสูจน์สมมติฐานตามตัวอย่างข้างบนนี้จะได้ดังนี้ One-Sample T: MPa Test of mu = 10 vs mu not = 10 Variable N Mean StDev SE Mean MPa 25 12.380 3.159 0.632
Variable 95.0% CI T P MPa (11.076, 13.684) 3.77 0.001
หากจะใช้ Confidence Interval ในการทดสอบสมมติฐาน ก็นำค่า m = 10 MPa มาเที่ยบกับ Confidence Interval จะเห็นว่า 10 MPa ไม่ได้อยู่ภายใต้ Confidence Interval ก็หมายถึง m ไม่เท่ากับ 10 MPa หากจะใช้ P-Value โปรแกรม Minitab จะให้ค่า P-Value มา หากน้อยกว่า a ก็แปลว่าให้ ปฏิเสธ สมมติฐานหลัก (Ho) ซึ่งเราก็ต้องย้อนกลับมาดูว่า ตั้งไว้ว่าอย่างไร ก็ปฏิเสธ สมมติฐาน นั้น
หากต้องการตัดสินใจโดยการใช้ค่า P-Value ต้องหาจากสมการ (ดูรูปประกอบ) P-value = 2 * ( area from 3.767 to right hand side ) การหาค่า พื้นที่คือการหาค่า Cumulative Probability นั่นเอง หากใช้ตาราง ก็ระบุค่า df และค่า t แล้วหาค่า a หากใช้โปรแกรม Minitab จะได้ดังนี้ Cumulative Distribution Function Student's t distribution with 24 DF x P( X <= x ) -3.7670 0.0005
ดังนั้น P-Value จะเท่ากับ 2* 0.0005 = 0.001 ซึ่งน้อยกว่าค่า a = 0.05 ซึ่งหมายถึงว่า เราปฏิเสธสมมติฐาน Ho: m = 10 MPa หากใช้โปรแกรม Microsoft Excel จะได้ดังนี้
ถ้าหากตั้งสมมติฐาน เราจะปฏิเสธ H0 : m = 10 MPa. ถ้า To > ta,n-1 คำนวณหาค่า ta,n-1 โดยใช้โปรแกรม Minitab Inverse Cumulative Distribution Function Student's t distribution with 24 DF P( X <= x ) x 0.0500 -1.7109
โดยใช้ Microsoft Excel
เนื่องจาก T0 = 3.767 ซึ่งมากกว่า 1.71 จึงสรุปว่าเราปฏิเสธ H0 : m = 10 MPa. หรือหมายความว่า ค่าความสามารถในการทนแรงดึงของเส้นลวดมากกว่า 10 MPa อย่างมีนัยสำคัญ คำนวณหาค่า P-value จาก P-Value = area from 3.767 to the right hand side. (โปรดดูรูปประกอบ)
เมื่อคำนวณโดยใช้ Microsoft Excel จะได้ค่า P-Value ดังนี้ ได้ P-Value = 0.0004736 แต่หากใช้โปรแกรม Minitab เพื่อพิสูจน์สมมติฐานจะได้ดังนี้ One-Sample T: MPa Test of mu = 10 vs mu > 10 Variable N Mean StDev SE Mean MPa 25 12.380 3.159 0.632
Variable 95.0% Lower Bound T P MPa 11.299 3.77 0.0005
หากนำค่า 10 MPa มาเทียบกับค่าต่ำสุดของ Confidence Interval จะเห็นว่ายังอยู่ต่ำกว่าอีก นั่นแปลว่า ค่าโดยเฉลี่ยมากกว่า 10 MPa หากใช้ค่า P-Value เราจะปฏิเสธสมมติฐานหลัก (Ho) เพราะค่า P-Value น้อยกว่า a จะเห็นว่าเราจะสรุปสมมติฐานตามสมมติฐานหลัก เมื่อปฏิเสธสมมติฐานหลักแล้ว ความเป็นจริงก็จะเป็นตามสมมติฐานทางเลือก ที่ถูกระบุไว้ในขั้นตอนการตั้งสมมติฐาน
|