การอนุมานค่ากลางของประชากร กรณีไม่รู้ค่าความแปรปรวน (Inference on the mean of a population, Variance unknown)  

จากหัวข้อที่ผ่านมาเราได้เรียนรู้เกี่ยวกับการทดสอบสมมตฐานบนพื้นฐานที่เรารู้ค่าความแปรปรวนของประชากร (s2) แต่ในความเป็นจริง  สิ่งที่เราไม่อาจจะรู้ได้เลยก็คือค่าความแปรปรวนของประชากรนั่นเอง แต่บางครั้งเราก็สามารถยอมรับให้ใช้การทดสอบสมมติฐานโดยวิธี 1-Sample Z test ได้  ถ้าจำนวนสิ่งตัวอย่างมีมากพอ ( n>30 ) ตามทฤษฎี Central limit theorem แต่นั่นต้องอยู่บนพื้นฐานที่ว่า การกระจายตัวของค่าสิ่งตัวอย่างจะต้องเป็นแบบปกติ (Normal distribution) เสมอ  แต่ในทางปฏิบัติก็จะมีข้อมูลบางประเภทที่เกือบจะไม่เป็น Normal distribution เลย และนั่นก็จะส่งผลให้เกิดความคลาดเคลื่อนเมื่อนำไปอนุมานประชากร  เพื่อหลีกเลี่ยงความผิดพลาด เราจึงจึงต้องใช้วิธีอนุมานประชากรใหม่ ที่ไม่ได้ต้องการรู้ค่าความแปรปรวนของประชากร

การทดสอบค่ากลาง

สมมติประชากรที่เราสนใจมีการกระจายแบบปกติ (Normal distribution) และเราก็ไม่รู้ค่า (m) และ (s2)  เมื่อเราต้องการทดสอบสมมติฐาน โดยเทียบกับค่าคงที่ค่าหนึ่งโดยวิธี Two-sided alternative โดยเขียนสมมติฐานได้ดังนี้

 

เมื่อ m0 คือค่าคงที่ที่เราระบุในสมมติฐาน โดยที่เราไม่รู้ค่า (s2)  เราจึงต้องทำการสุ่มตัวอย่างออกมาจากประชากรแล้วคำนวณหาค่า (s) ของกลุ่มข้อมูลตัวอย่าง เราจึงต้องเลือกใช้  T   ในการทดสอบ

   T  นี้เราจะเรียกว่าตัวทดสอบสถิติ (Test Statistic)  นั่นคือเราจะใช้   t-Distribution  แทน    Z-Distribution  ในการอ้างอิง นั่นคือเราจะต้องใช้ degree of freedom เท่ากับ n-1 ด้วย และตัวสถิติทดสอบ เราก็ใช้ T0 แทน Z0 ด้วย

จากสมมติฐาน เราจะปฏิเสธ  H0 : m = m0   ถ้าค่า T0จะมีค่าอยู่ระหว่าง - ta/2,n-1 และ  ta/2,n-1  ดังรูปที่แสดง

 

และเราจะยอมรับ   H0: m = m0    ถ้า     

                        

แต่ถ้าสมมติฐานเขียนเป็น 

เราจะปฏิเสธ H0: m = m0 เมื่อ   To > ta,n-1 

แต่ถ้าสมมติฐานเขียนเป็น 

ราจะปฏิเสธ H0: m = m0 เมื่อ   To < - ta,n-1 

 การทดสอบโดยใช้  T0 (Student-t distribution) ดังที่กล่าวมา บางครั้งก็รู้จักกันในชื่อ  1- Sample t Test

ตัวอย่างการประยุกต์ใช้ 1-Sample t Test

วิศวกรต้องการทดสอบว่าเส้นลวดที่กำลังทำการผลิตอยู่นั้นสามารถทนแรงดึงได้เท่ากับค่าที่กำหนดคือ 10 MPa หรือไม่ จึงได้ทำการสุ่มตัวอย่างจากสายการผลิตมาทดสอบ ด้วยเครื่องทดสอบ เป็นจำนวน 22 ตัวอย่าง ดังค่าต่อไปนี้

9.8

8.5

15.6

16.7

15.8

15.4

14.1

13.6

11.9

11.4

11.4

8.8

7.5

15.4

15.4

19.5

14.9

12.7

11.9

11.4

10.1

7.9

11.7

9.4

8.7

 ให้ทำการทดสอบสมมติฐาน

จากข้อมูล 25 ตัวอย่าง  จะมีค่า Statistics ต่างๆ ดังนี้

        Variable     N      Mean      StDev

        Reading      25    12.380     3.159

 

ทำการทดสอบความเป็นปกติของการกระจายของข้อมูล  Normality Test  

จากกราฟ จะเห็นได้ชัดเจนว่าข้อมูลมีการกระจายแบบปกติ ( Normal distribution )

ขั้นตอนในการทดสอบสมมติฐาน

   1.      ระบุค่าพารามิเตอร์ที่จะทดสอบ ในกรณีนี้คือค่าเฉลี่ยของความสามารถในการทนแรงดึงของเส้นลวด (m)

   2.      ตั้งสมมติฐาน

    3.     ระบุค่าระดับนัยสำคัญ ในการทดสอบ ข้อนี้กำหนดให้   a = 0.05

    4.    เลือกใช้ตัวสถิติในการทดสอบ

      5.    คำนวณค่า   ta/2   และ    -ta/2,n-1   โดย ที่  n = 25 

    โดยโปรแกรม Minitab ได้ดังนี้

    Inverse Cumulative Distribution Function

    Student's t distribution with 24 DF

           P( X <= x )             x

           0.0250               -2.0639

     

    หรือจากฟังก์ชันคณิตศาสตร์ของโปรแกรม Microsoft Excel ได้ดังนี้

    เนื่องจากกลไก การคำนวณที่แตกต่างกัน โดยที่ Minitab จะคำนวณพื้นที่ด้านซ้ายมือของค่า Probability ที่ระบุ จึงได้ค่าออกมาเป็นค่าลบ  ส่วนใน Excel นั้น เครื่องจะถือว่าเป็น Two-tailed เมื่อเราใส่ค่า Probability เครื่องจะนำไปหาร 2 อีกทีเพื่อใช้ในการคำนวณ ดังนั้นค่าที่ใส่เข้าไปเพื่อให้เครื่องคำนวณ คือค่า ระดับนัยสำคัญ โดยตรง และเครื่องจะคำนวณหรือคิดพื้นที่ทางด้านขวามือ จึงได้ค่าเป็นบวก

    จะได้ค่า  -ta/2 =  -2.063   และค่า  ta/2, 24= 2.063

    ดังนั้นช่วงที่ยอมรับ     H0 : m = 10 MPa.          คือ

        6.     คำนวณหาค่า  T0  จากสมการ

      7.      สรุปผลการทดสอบสมมติฐาน

เนื่องจาก  T0  = 3.767  ซึ่งมากกว่า 2.063   จึงสรุปว่าเราปฏิเสธ  H0 : m = 10 MPa.  หรือ ค่าความสามารถในการทนแรงดึงของเส้นลวดไม่เท่ากับ 10 MPa  อย่างมีนัยสำคัญ

      ถ้าใช้ โปรแกรม Minitab เพื่อพิสูจน์สมมติฐานตามตัวอย่างข้างบนนี้จะได้ดังนี้

             One-Sample T: MPa

       Test of mu = 10 vs mu not = 10

       Variable     N      Mean     StDev      SE Mean

          MPa       25    12.380    3.159      0.632

 

        Variable        95.0% CI         T        P

         MPa       (11.076, 13.684)    3.77     0.001

 

 หากจะใช้ Confidence Interval ในการทดสอบสมมติฐาน ก็นำค่า m = 10 MPa มาเที่ยบกับ Confidence Interval จะเห็นว่า 10 MPa ไม่ได้อยู่ภายใต้ Confidence Interval ก็หมายถึง m ไม่เท่ากับ 10 MPa หากจะใช้ P-Value โปรแกรม Minitab จะให้ค่า P-Value มา  หากน้อยกว่า a ก็แปลว่าให้ ปฏิเสธ สมมติฐานหลัก (Ho) ซึ่งเราก็ต้องย้อนกลับมาดูว่า ตั้งไว้ว่าอย่างไร ก็ปฏิเสธ สมมติฐาน นั้น

 

หากต้องการตัดสินใจโดยการใช้ค่า P-Value ต้องหาจากสมการ (ดูรูปประกอบ)

             P-value = 2 * ( area from 3.767 to right hand side )  

การหาค่า พื้นที่คือการหาค่า Cumulative Probability นั่นเอง หากใช้ตาราง ก็ระบุค่า df และค่า t  แล้วหาค่า a หากใช้โปรแกรม Minitab จะได้ดังนี้

     Cumulative Distribution Function

    Student's t distribution with 24 DF

      x            P( X <= x )

    -3.7670        0.0005

                 

    ดังนั้น P-Value จะเท่ากับ   2* 0.0005  = 0.001  ซึ่งน้อยกว่าค่า a = 0.05 ซึ่งหมายถึงว่า เราปฏิเสธสมมติฐาน Ho: m = 10 MPa

หากใช้โปรแกรม Microsoft Excel จะได้ดังนี้

ได้ P-Value = 0.000947

จะเห็นว่าทั้ง Minitab และ Microsoft Excel จะให้ค่า P-Value ที่ใกล้เคียงกัน  

ถ้าหากตั้งสมมติฐาน

เราจะปฏิเสธ H0 : m = 10 MPa. ถ้า To > ta,n-1 

คำนวณหาค่า ta,n-1    โดยใช้โปรแกรม Minitab

        Inverse Cumulative Distribution Function

        Student's t distribution with 24 DF

          P( X <= x )             x

          0.0500                -1.7109

 

โดยใช้ Microsoft Excel

 

เนื่องจาก  T0  = 3.767  ซึ่งมากกว่า 1.71   จึงสรุปว่าเราปฏิเสธ  H0 : m = 10 MPa.  หรือหมายความว่า ค่าความสามารถในการทนแรงดึงของเส้นลวดมากกว่า 10 MPa  อย่างมีนัยสำคัญ

คำนวณหาค่า P-value จาก

                  P-Value = area from 3.767 to the right hand side.  (โปรดดูรูปประกอบ)

 

เมื่อคำนวณโดยใช้ Microsoft Excel จะได้ค่า P-Value ดังนี้

ได้ P-Value = 0.0004736 

แต่หากใช้โปรแกรม Minitab เพื่อพิสูจน์สมมติฐานจะได้ดังนี้

      One-Sample T: MPa

    Test of mu = 10 vs mu > 10

    Variable         N        Mean       StDev      SE Mean

      MPa            25      12.380      3.159      0.632

 

    Variable         95.0% Lower Bound         T       P

      MPa               11.299                3.77   0.0005

 

 

หากนำค่า  10 MPa มาเทียบกับค่าต่ำสุดของ Confidence Interval จะเห็นว่ายังอยู่ต่ำกว่าอีก นั่นแปลว่า ค่าโดยเฉลี่ยมากกว่า 10 MPa หากใช้ค่า P-Value เราจะปฏิเสธสมมติฐานหลัก (Ho) เพราะค่า P-Value น้อยกว่า a

จะเห็นว่าเราจะสรุปสมมติฐานตามสมมติฐานหลัก เมื่อปฏิเสธสมมติฐานหลักแล้ว ความเป็นจริงก็จะเป็นตามสมมติฐานทางเลือก ที่ถูกระบุไว้ในขั้นตอนการตั้งสมมติฐาน

 


[ HOME ]             [ CONTENTS ]       

                                            

Hosted by www.Geocities.ws

1