ทฤษฎีแนวโน้มเข้าสู่ศูนย์กลาง (Central Limit Theorem )

ืถือเป็นทฤษฎีที่เชื่อมโยงระหว่าง Normal distribution หรืออีกนัยหนึ่งคือ การกระจายของประชากร กับ Sampling distribution ซึ่งอีกนัยหนึ่งก็คือการกระจายที่ได้จาก ข้อมูลตัวอย่าง  และถือเป็นทฤษฎี ที่แก้ปัญหาความยุ่งยากซับซ้อน ของทฤษฎีต่างๆ ในสาขาสถิติเชิงอนุมาน ( Inferential Statistics)

ทฤษฎีแนวโน้มเข้าสู่ศูนย์กลาง (Central Limit Theorem ) อธิบายไว้ว่า " สำหรับประชากรใดๆแล้ว ถ้าเก็บตัวอย่างในจำนวนที่มากพอ การกระจายของค่าตัวอย่างดังกล่าวจะมีแนวโน้มใกล้เคียง กับการกระจายแบบธรรมชาติ ( Normal distribution ) เสมอ" 

จากข้อความข้างบนหมายความว่า เมือเราเก็บตัวอย่างมา แล้วหาค่าเฉลี่ย (  X ) และหากเรากะทำเช่นนี้หลายๆ ครั้ง แล้วนำเอา (  X ) ที่ได้หลายๆ ค่ามาพล้อตเป็นกราฟการกระจาย เราจะเห็นว่ากราฟที่ได้มีแนวโน้มเป็น Normal distribution เสมอ ไม่ว่าประชากรแม่ของข้อมูลตัวอย่างดังกล่าว จะมีการกระจายแบบใดก็ตาม 

จุดสำคัญของทฤษฎีนี้ มีอยู่ 2 ข้อคือ

  1. สามารถใช้ได้กับข้อมูลจากประชากรทุกประเภทการกระจาย  ไม่จำกัดว่าจะมีการกระจายแบบธรรมชาติ (Normal distribution ) เท่านั้น 
  2. จำนวนตัวอย่างที่เก็บมาจะต้องมากพอ นั่นแปลว่า จำนวนตัวอย่างมีผลต่อลักษณะการกระจายตัวของข้อมูล 

ตัวอย่าง  มีข้อมูลอยู่ 3000 ข้อมูลซึงมีลักษณะการกระจายเป็นแบบ Exponential ที่มีค่าเฉลี่ย อยู่ที่ 100.0  เมื่อแสดงในรูป Distribution plot จะได้เป็นดังรูปกราฟต่อไปนี้

 

 

จากข้อมูลทั้งหมดดังกล่าว ทำการสุ่มตัวอย่างมา 10 ตัวอย่าง แล้วคำนวณหาค่า เฉลี่ยของ 10 ตัวอย่างดังกล่าว  ในทำนองเดียวกัน ได้ทำการสุ่มตัวอย่างซ้ำ แบบเดิม ทั้งหมด 20 รอบ เราก็จะได้ค่าเฉลี่ยของตัวอย่าง มาทั้งหมด 20 ค่า  เมื่อนำทั้ง 20 ค่าเฉลี่ย ดังกล่าวมาทำ Distribution plot จะได้รูปกราฟดังต่อไปนี้

จะเห็นว่า ลักษณะการกระจายของค่าเฉลี่ยจะไม่เหมือนลักษณะการกระจายของประชากรแม่เลย  คือมีแนวโน้มจะเป็น Normal distribution  แต่ค่าเฉลี่ย ของข้อมูลใหม่นี้จะยังเท่าเดิมกับค่าของประชากรแม่อยู่  แต่ถ้าเพิ่มจำนวนการเก็บตัวอย่างไปเป็น 40 ครั้ง หรือมีค่า เฉลี่ยของตัวอย่างอยู่ทั้งหมด 40 ค่ากราฟที่ได้จะเป็นดังต่อไปนี้

 

 

จะเห็นว่า กราฟที่เกิดจากค่าเฉลี่ยของตัวอย่างจำนวน 40 ค่าเฉลี่ย มีลักษณะการกระจายเป็นแบบ Normal distribution อย่างชัดเจนมากขึ้น  ซึ่งลักษณะการกระจายของข้อมูลใหม่ จะแตกต่างจากการกระจายของประชากรแม่ ซึ่งเป็นแบบ Exponential distribution อย่างสิ้นเชิง  แต่ค่าเฉลี่ยของข้อมูลทั้งสองชุด กลับมีค่าคงเดิม คือ 100.0 นั่นเอง

การนำทฤษฏีแนวโน้มเข้าสู่ศูนย์กลางไปประยุกต์ใช้งาน

ไม่มีข้อบ่งบอกการนำทฤษฎีนี้ไปใช้ เมื่อเกิดเหตุปัญหาใด หรือเมื่อไหร่เราถึงจะใช้ทฤษฎีนี้ อย่างชัดเจน  แต่จากประสบการณ์ของผู้เขียนเอง พบว่าบางครั้งมีการนำทฤษฎีนี้ไปใช้ โดยไม่รู้ตัว เช่น การเพิ่มจำนวนตัวอย่างที่เก็บ ก็จะมีผลให้ได้ขอ้มูล ที่มีการกระจายที่ใกล้เคียง Normal distribution มากขึ้น  หรือ เมื่อเราจะต้องใช้ เครื่องมือในการวิเคราะห์ ข้อมูลประเภท ที่ต้องใช้กับ Normal distribution เท่านั้น แต่เมื่อเก็บตัวอย่างมาแล้ว ทดสอบ Normal probability plot แล้วไม่ผ่าน หรือประชากรแม่ ไม่ใช่ Normal distribution เราก็จะไม่สามารถ ใช้เครื่องมือวิเคราะห์ประเภทดังกล่าวได้  เราสามารถนำทฤษฎีแนวโน้มเข้าสู่ศูนย์กลางดังกลางมาใช้ โดยต้องเก็บตัวอย่าง หลายๆรอบ แล้วนำมาหาค่าเฉลี่ย แต่ละรอบๆ หลายๆครั้ง เราก็จะได้ข้อมูลใหม่เป็น Normal distribution ในที่สุด

ตัวอย่าง วิศวกรกำลังศึกษาเรื่องปริมาณการบรรจุนมพร้อมดื่ม UHT โดยในแต่ละกระป๋องบรรจุต้องมีปริมาณน้ำนมเท่ากับ 250 ลูกบาตร์เซ็นติเมตร (CC) เขาได้ทำการสุ่มเก็บตัวอย่างมา 25 กระป๋อง เมื่อมาหาค่าปริมาณบรรจุพบว่ามีค่า เฉลี่ยอยู่ที่ 248 CC ซึ่งเขากำลังจะตัดสินใจสรุปว่า น่าจะอนุโลมว่าปริมาณบรรจุน้ำนมในแต่ละกระป๋องยังเท่ากับ 250 CC อยู่ ทั้งนี้เพราะเขาทราบว่านี่คือค่าที่ได้จากการสุ่มตัวอย่างที่สามารถนำเอาค่า เฉลี่ยของตัวอย่าง มาประมาณค่าประชากรทั้งหมดได้ ซึ่งแน่นอนว่าค่า 248 CC นี่มีโอกาสเกิดขึ้นได้  หากว่าเขา สุ่มอีกครั้ง ก็มีโอกาสได้มากกว่า 250 CC เหมือนกัน 

 


[ HOME ]             [ CONTENTS ] 

                                            

Hosted by www.Geocities.ws

1