การวัดการกระจายของข้อมูล (Measure of Dispersion)

ถึงแม้เราจะสามารถหาค่าศูนย์กลาง โดยมีวิธีหาได้สามวิธีดังที่กล่าวมาแล้วนั้น เราก็ยังไม่อาจจะอธิบายข้อมูลได้อย่างดีพอ ลองเปรียบเทียบ ข้อมูล จากตารางต่อไปนี้ แล้วจะทำให้เข้าใจได้ว่า เพราะอะไรถึงเป็นเช่นนั้น

X Y Z
30 10 10
30 30 20
30 30 30
30 30 40
30 50 50
Mean = 30 Mean = 30 Mean = 30

Median = 30

Median = 30

Median = 30

จากตารางหากเราอธิบายข้อมูลสามกลุ่ม โดยใช้วิธีวัดแนวโน้มเข้าสู่ศูนย์กลาง (Measure of location) เราจะพบว่าข้อมูลของสามกลุ่ม นี้ไม่แตกต่างกันแต่ ÍÂèÒ§ใด แม้จะใช้ ค่าเฉลี่ยและค่ามัธยฐานอธิบายก็ตาม  ทั้งที่ความเป็นจริง¢éÍมูลสามกลุ่มนี้แตกต่างกันอย่างสิ้นเชิง ดังนั้นวิธีวัดá¹Çโน้มเข้าสู่ศูนย์กลางเพียงอย่าง เดียวจึงไม่สามารถแยกแยะความแตกต่างของข้อมูลดังกล่าวออกมาได้จึงต้องมีค่าทางสถิติตัวอื่นเข้ามาช่วยในการแยกแยะเราเรียกค่าสถิตินี้ว่าตัววัดการกระจายของ  ข้อมูล ซึ่งมีดังต่อไปนี้ 

 

ค่าพิสัย (Range of data)  สัญญลักษณ์ คือ   R

เป็นวิธีวัดค่าความกระจายของข้อมูลที่ง่ายที่สุด  หาได้จากการเอาค่าสูงสุดของข้อมูลในกลุ่มลบด้วยข้อมูลตัวที่ต่ำที่สุดของกลุ่ม   จากตารางข้างบน หากเราใช้ค่าพิสัย เป็นตัววัดการกระจายของข้อมูลแต่ละกลุ่ม จะได้ดังนี้.

กลุ่ม  X      ค่าพิสัยคือ   30 - 30 = 0

 กลุ่ม  Y      ค่าพิสัยคือ  50 - 10 = 40

  กลุ่ม   Z      ค่าพิสัยคือ   50 - 10 = 40

ค่าพิสัยเป็นค่า äÁèใช่ช่วงความเชื่อมั่น (Interval) ให้ความรู้สึกถึงการกระจายของข้อมูล แต่เนื่องจากค่าพิสัยจะขึ้นอยู่กับค่าสูงสุด และต่ำสุดของข้อมูล ในกลุ่มเท่านั้น อย่างข้อมูลของกลุ่ม Y และ  Z ทั้งๆ ที่คุณสมบัติการกระจายของข้อมูลสองกลุ่มนี้จริงๆแล้วแตกต่างกันแต่เมื่อใช้ค่าพิสัยในการวัดกลับ ไม่สามารถวัดความแตกต่างดังกล่าวได้  หรือถ้าหากข้อมูลในกลุ่มมีบางค่าที่กระจายอยู่นอกกลุ่มมากผิดปกติ (Outliers) การใช้ค่าพิสัยในการบอกค่า การกระจายของข้อมูลจะผิดพลาดจากที่ควรจะเป็นมากขึ้น

 

ค่าความแปรปรวน (Sample Variance )   สัญญลักษณ์คือ  s2

เนื่องจากจุดอ่อนของค่าพิสัยดังที่กล่าวมาแล้ว ค่าความแปรปรวน (Variance) เป็นค่าที่ใช้วัดการกระจายของข้อมูลได้ดีกว่า เพราะไม่ได้ขึ้นอยู่กับ ค่าสูงสุดและต่ำสุดของข้อมูลในกลุ่ม เท่านั้น แต่ขึ้นอยู่กับค่าของข้อมูลทุกตัวว่าเบี่ยงเบน (Deviate) ไปจาก ค่าเฉลี่ยของกลุ่มเท่าไหร่ ทำให้ค่าความ แปรปรวน ต้องมีสมการคณิตศาสตร์ที่ซับซ้อนมากกว่าการหาค่าพิสัยดังตัวอย่างต่อไปนÕé

                                                                                                                            Deviation = ( X - X )

จากตารางที่ผ่านมา ข้อมูลกลุ่ม Y และ Z สามารถหาค่าความแปรปรวน ได้ดังนี้

Y (  X - X )
10 (10-30) = -20
30 (30-30) = 0
30 (30-30) = 0
30 (30-30) = 0
50 (50-30) = 20
X = 30 average = 0

 

Z (  X - X )
10 (10-30) = -20
20 (20-30) = -10
30 (30-30) = 0
40 (40-30) = 10
50 (50-30) = 20
X = 30 average = 0

 

ค่าความแปรปรวนก็คือค่าเฉลี่ยของค่าเบี่ยงเบนจากค่ากลางของข้อมูลทุกตัว แต่เราจะพบว่าเมื่อนำค่าเบี่ยงเบนจากค่ากลาง ทุกตัว มารวมกันจะได้ผล ÅѾ¸ìเป็นศูนย์(เสมอ) ซึ่งทำให้เราไม่อาจนำค่าดังกล่าวไปใช้ใน การหาค่าความแปรปรวนได้ ดังนั้นเพื่อหลีกเลี่ยง ปัญหาดังกล่าว จึงจำเป็นต้องขจัดเครื่อง หมายลบ ออกให้หมด โดยการนำเอาค่าเบี่ยงเบนมายกกำลังสอง แล้วค่อยนำมารวมกันตอน หลัง แล้วหาค่าเฉลี่ยโดยนำผลรวมที่ได้หารด้วยจำนวน ข้อมูล   แต่ตามสมการข้างบน ตัวหารจะเป็น n-1 ซึ่งเราเรียกว่า ค่าระดับ ความอิสระของข้อมูล (Degree of freedom)  ขอให้ท่านกลับไปอ่าน เรื่อง ประชากรและกลุ่มตัวอย่าง  เพื่อทำความเข้าใจ เนื่องจาก ตัวอย่างนี้เป็นข้อมูลของกลุ่มตัวอย่าง (Sample) จึงใช้ ค่าระดับความอิสระ เป็นตัวหาร

แต่ถ้าสังเกตดีๆเราจะพบว่า ค่าที่ได้ไม่ใช่ค่าเบี่ยงเบนโดยเฉลี่ยที่แท้จริง ยังติดกำลังสองอยู่ เราจึงเรียกค่าที่ได้นี้ว่า ค่าความแปรปรวน (Variance)  ถ้านำค่าดังกล่าวไปถอดกรณฑ์ หรือรากกำลังสองออก ค่าที่ได้ก็จะเรียกว่า ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation ) นั่นเอง เพราะฉะนั้น ทั้งค่า ความแปรปรวนและค่าเบี่ยงเบนมาตรฐานจึงสามารถใช้อธิบาย การกระจายของข้อมูล ได้ เช่นเดียวกัน แต่จะมีรายละเอียดที่แตกต่างกันในประเด็น ย่อยๆ บ้าง

ดังนั้นค่าความแปรปรวนของกลุ่มข้อมูล Y คือ 

 

ค่าเบี่ยงเบนมาตรฐานของกลุ่มข้อมูล Y  คือ  

ดังนั้นค่าความแปรปรวนของกลุ่มข้อมูล Z  คือ  

ค่าเบี่ยงเบนมาตรฐานของกลุ่มข้อมูล Z  คือ 

จากตัวอย่างที่ผ่านมาจะเห็นว่า เมื่อเราใช้ค่าความแปรปรวน หรือ ค่าเบี่ยงเบนมาตรฐานเป็นตัววัดค่าการกระจายของข้อมูลกลุ่ม Y และกลุ่ม Z เราจะสามารถเห็นความแตกต่างของค่าการกระจายของข้อมูลสองกลุ่มนี้ได้ ในขณะที่ เมื่อเราใช้พิสัยในการการวัดเราจะ ไม่สามารถเห็นความแตกต่าง ดังกล่าวได้เลย

 

àมื่อã´จะใช้ พิสัย เมื่อã´จะใช้ค่าความแปรปรวนในการวัดการการกระจาย

สิ่งที่จะต้องพิจารณา เสมอก่อนจะเลือกใช้ ค่าพิสัยหรือค่าความแปรปรวนในการวัด หรืออธิบายข้อมูล

1. จำนวน¢éÍมูล ถ้าเรามีข้อมูลน้อยตัวมาก เช่น สองหรือสามตัวเท่านั้น ใช้ค่าพิสัย ก็ให้ความถูกต้องมากพอ

2. ความแตกต่างของค่า แม้มีจำนวนข้อมูลหลายตัว  แต่หากค่าแต่ค่าละมีความใกล้เคียงกันมาก ก็สามารถจะวัดโดยค่าพิสัยได้

 3. ถ้ามีข้อมูลหลายตัว ควรใช้ ค่าความแปรปรวน หรือ ค่าเบี่ยงเบนมาตรฐานจะให้ความถูกต้องมากที่สุด

 


[ HOME ]             [ CONTENTS ]   

Hosted by www.Geocities.ws

1