ทฤษฎีช่วงความเชื่อมั่น ( Confidence Interval Theorem)

การที่เราทำการเก็บตัวอย่างมาจำนวนหนึ่งแล้วหาค่าเฉลี่ย เพื่อนำมาประมาณค่ากลางของประชากร ( m ) เช่น. เมื่อเก็บตัวอย่างปริมาณบรรจุนม UHT จำนวน 25 กระป๋องได้ค่าเฉลี่ยเท่ากับ 248 cc ทั้งที่ข้อกำหนดระบุว่านมแต่ละกระป๋องต้องบรรจุ 250 cc หากเราใช้วิธีประมาณประชากรแบบ Point Estimation เราก็จะสรุปว่า ปริมาณบรรจุนมที่กำลังทำการเก็บข้อมูลอยู่นี้ ไม่ได้ตรงตามข้อกำหนด แล้วจะทำยังไงถึงจะบอกได้ว่าจริงๆแล้วปริมาณบรรจุของนม ในแต่ละกระป๋องที่กำลังผลิตอยู่นะ ยังเท่ากับ 250 cc หรือไม่หากเราเปลี่ยนมาใช้วิธีประมาณประชากรแบบช่วง (Interval estimation) ผลสรุปอาจจะบอกว่าปริมาณบรรจุนม จากการสุ่มตัวอย่างครั้งนี้ยังเท่ากับ 250 cc อยู่

ช่วงความเชื่อมั่นกรณีรู้ค่าความแปรปรวน ( Confidence Interval on the Mean : Variance known)

แนวคิดพื้นฐานของ Confidence interval

เมื่อ  l  คือ lower limit และ  u  คือ upper limit  ซึ่งราเรียกว่า " Two-sided confidence interval " เราสามารถบอกได้ว่าโอกาสที่ค่ากลางของประชากรจะอยู่ภายใน limit จะหาได้จากสมการ

ในกรณีนี้  a คือ Error risk หรือ ค่าที่บ่งบอก ความเสี่ยงที่เราจะ พยากรณ์ค่า m ผิดพลาด  ดังนั้น ถ้าเราพูดถึงค่าความเชื่อมั่น เราก็ต้องไม่ลืม ค่าความเสี่ยง ด้วยเหมือนกัน ดั้งนั้น   100(1-a) % คือ เปอร์เซนต์ความเชื่อมั่น ที่เรากำลังสนใจ

นอกจากนั้นก็ยังมี " One-sided confidence interval " ซึ่งมีสมการดังต่อไปนี้

จากสมการข้างบนนี้ เราเรียกว่า lower-confidence interval  โดยที่  l  คือค่า lower limit 

จากสมการข้างบนนี้ เราเรียกว่า upper-confidence interval  โดยที่  u  คือค่า upper limit 

ดังนั้น ค่า 100(1- a )%   จึงเรียกว่า ค่าความเชื่อมั่น ของ พารามิเตอร์  m   เมื่อเราอ้างอิงทฤษฎี Sampling distribution for mean ที่มีค่ากลางคือ m และค่าการกระจายเท่ากับ  s2/n  ดังนั้น

 ซึ่งเป็น Standard normal distribution ดังรูป

 

เมื่อการกระจายเป็นแบบ Normal  ได้ว่าค่า a จึงต้องหารสอง ในกรณีที่หา Two-sided confidence interval  จากรูปจะได้ว่า

เมื่อแทนค่า Z จะได้ว่า

จัดรูปแบบสมการใหม่จะได้ว่า

โดยที่

             X   : ค่าเฉลี่ยของตัวอย่างที่ทำการเก็บตัวอย่างแบบสุ่มมาจากประชากร

             n :  จำนวนตัวอย่าง

ในกรณีนี้เรารู้ค่า Variance ของประชากร  เพราะเราระบุค่า s ได้  ดังนั้น ค่าเปอร์เซนต์ความเชื่อมั่นของค่า m หาได้จากสมการ

ตัวอย่าง  เมื่อวิศวกรได้ทำการสุ่มเก็บตัวอย่างกระป๋องนม UHT มา 30 กระป๋อง เพื่อตรวจสอบปริมาณบรรจุนมแต่ละกระป๋อง พบว่าค่าเฉลี่ยอยู่ที่ 248 มิลลิลิตร โดยที่ข้อกำหนดบอกว่า ขนาดบรรจุนมทุกกระป๋องจะต้องเท่ากับ 250 มิลลิลิตร และที่ผ่านมา พบว่าค่า เบี่ยงเบนมาตรฐาน (s) อยู่ที่ 6 มิลลิลิตร  จงหาช่วงความเชื่อมั่น ที่ 95% ของขนาดบรรจุนม UHT นี้

จากโจทย์  เราจะได้ว่า   1- a  = 0.95   นั่นคือ    a = 0.05  เพราะฉะนั้น ค่า Z a/2=Z0.025   ซึ่งเมื่อคำนวนหาค่า Z โดยใช้ โปรแกรม Minitab จะได้ดังนี้

Inverse Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 1.00000

P( X <= x )           x

0.0250             -1.9600

 

โดยจะให้ค่าด้านลบ แต่เนื่องจากกฏของ Normal distribution เราจึงได้ค่าด้านบวก โดยเพียงแต่กลับเครื่องหมายเท่านั้นเอง 

หรือหากใช้ ฟังก์ชันคณิตศาสตร์ของ MS Excel เราจะได้ค่าดังนี้

 

เพียงแต่ วิธีการประมวลผลทางคณิตศาสตร์จะแตกต่างกัน คือ MS Excel จะให้เราใส่ค่า 1- (a/2)  แต่จะให้ผลเหมือนกัน คือค่า Z ณ a/2

ดังนั้นเราสามารถหาค่า Lower-confidence limit ได้จาก

เพราะฉะนั้น  Upper-confidence limit  = 248+2.147 = 250.147

ดังนั้น 95% ความเชื่อมั่น ของค่าปริมาณบรรจุนม UHT ทุกกระป๋องจะอยู่ระหว่าง 245.853 ถึง 250.147 มิลลิลิตร  หรือแปลว่า 95% ของนม UHT ที่ผลิตออกมานั้น จะมีค่าบรรจุน้ำนมในกระป๋อง อยู่ระหว่าง   245.853 ถึง 250.147 มิลลิลิตร ซึ่งอีก 5% จะเป็นค่าที่ต่ำและสูงกว่า ช่วงความเชื่อมั่นดังกล่าว ในจำนวนใกล้เคียงกัน คือมากกว่าก็ ประมาณ 2.5% และน้อยกว่าก็ประมาณ 2.5%

ช่วงความเชื่อมั่นกรณีไม่รู้ค่าความแปรปรวน ( Confidence Interval on the Mean : Variance unknown)

เพราะว่าสิ่งที่เราจะไม่รู้เลย ก็คือค่าพารามิเตอร์ ของประชากร  เราจึงจำเป็นต้องศึกษาผ่านการเก็บตัวอย่าง เพราะฉะนั้นเราจึงต้องอ้างอิง หัวข้อ t-distribution โดยคิดที่ degree of freedom  n-1 ดังนั้น เราสามารถหา Confidence interval ได้จาก

จากสมการ two-sided confidence interval

แทนค่า T ในสมการ เช่นเดียวกับกรณี Z จะได้

จัดรูปแบบสมการใหม่จะได้ว่า

ดังนั้น ค่าเปอร์เซ็นต์ความเชื่อมั่นของค่า m หาได้จากสมการ

ตัวอย่าง เก็บค่าบรรจุน้ำนมกระป๋อง UHT มา 22 กระป๋อง ได้ค่าเฉลี่ย X = 248 มิลลิลิตร และค่า s = 3.15 มิลลิลิตร  ค่าความเชื่อมั่น 95% ของค่าเฉลี่ยของประชากร จะอยู่ในช่วงใด

จากโจทย์  เราจะได้ว่า   1- a  = 0.95   นั่นคือ    a = 0.05  เพราะฉะนั้น ค่า t a/2= t0.025  และ ค่า n-1 = 21  ซึ่งเมื่อคำนวณหาค่า t โดยใช้ โปรแกรม Minitab จะได้ดังนี้

 

Inverse Cumulative Distribution Function

Student's t distribution with 21 DF

P( X <= x )         x

0.0250            -2.0796

 

 เพราะฉะนั้น  ค่า t0.025 ที่ degree of freedom =21 คือ   2.080 

เราสามารถหา Confidence interval ได้ดังนี้

 

นั่นแปลว่า ปริมาณบรรจุนม UHT ที่ผลิตขณะนี้ 95% จะมีค่าอยู่ระหว่าง 246.603 ถึง 249.397 มิลลิลิตร ส่วนที่เหลืออีก 5% นั้น จะมากและน้อยกว่า ช่วงดังกล่าวในจำนวนเท่าๆกัน คือ 2.5% จากข้อกำหนดที่บอกว่าปริมาณบรรจุนมในแต่ละกระป๋องจะต้อง 250 มิลลิลิตร เราสามารถสรุปได้ว่า นม UHT  ล้อตนี้ ปริมาณบรรจุต่ำกว่าเกณฑ์ กำหนดด้วยความเชื่อมั่นว่า คำสรุปนี้ถูกต้อง 95%

ในบางครั้งเราอาจจะต้องการทราบเพียงแค่ Limit ด้านเดียว หรือเราต้องการรู้  Confidence interval เพียวด้านเดียว   จากโจทย์เดียวกันนี้เราสามารถ หา Lower confidence limit ได้  โดยที่เราจะต้องหา t a ที่  degree of freedom 21  เมื่อใช้ โปรแกรม Minitab ในการหาค่า t จะได้ดังนี้

 

Inverse Cumulative Distribution Function

Student's t distribution with 21 DF

P( X <= x )        x

0.0500           -1.7207

 

จะได้ว่า t  จะ มีค่า 1.7207   ดังนั้น Lower confidence interval หาได้จาก

าก Confidence interval ที่ได้ เราตีความว่า 95% ของนมที่ผลิตได้ ล้อตนี้ มีปริมาณบรรจุ แต่ละกระป๋อง ตั้งแต่ 246.8444 มิลลิลิตร ขึ้นไป ส่วนอีก 5% นั้น น้อยกว่า 248.8444 มิลลิลิตร

หัวข้อเรื่อง Confidence interval นี้ จะใช้เยอะมากในหัว การทดสอบสมมติฐาน ดังนั้น จึงจำเป็นที่ผู้อ่านจะต้องทำความเข้าใจ  และที่สำคัญ เนื้อหาในเรื่อง Confidence interval เองก็มีมากมายหลายเรื่อง แต่ผู้เขียนเห็นว่า เรื่องที่ได้เขียนมานี้ เป็นเรื่องพื้นฐาน และมีการใช้เยอะที่สุด 

 


[ HOME ]             [ CONTENTS ]  

Hosted by www.Geocities.ws

1