Single –Factor ANOVA (One-Way ANOVA)

 จากตัวอย่างเรื่อง ความเร็วในการขับขี่รถ และระยะทางที่ขับได้เมื่อเติมน้ำมันเต็มหนึ่งถัง ที่ผ่านมานั้นเป็นตัวอย่างของ Single factor ANOVA ดังนั้นความหมายของ Single-Factor ANOVA คือการวิเคราะห์ ข้อมูลเมื่อการทดลองนั้นมีเพียงปัจจัย (Factor) เดียวเท่านั้นที่ถูกควบคุม (Treat) คือ อัตราเร็วต่อชั่วโมง (Speed) บางครั้งก็จะเรียกว่า Treatmented factor ในขณะที่แต่ละค่าของ Speed ในการทดลองนั้น เราจะเรียกว่า Level หรือ Treatment levels ด้วยเช่นเดียวกัน ส่วนปัจจัยอื่นจะปล่อยให้คงเดิม ไม่ได้มีการควบคุมหรือสนใจ  

คำ¨Ó¡Ñ´¤ÇÒÁµèÒ§æã¹ ANOVA

 

คำว่า Grand average คือค่าเฉลี่ยของค่าเฉลี่ย อีกที ซึ่งก็คือการให้ค่าน้ำหนักหรืออัตราส่วนของ Sample size เทียบกับ Total sample size และค่าเฉลี่ยแต่ละค่า ตามสมการนี้

เราสามารถหาค่า Between-samples variation จากสมการ

 เนื่องจากสมการเป็นการบวกกันของพจน์กำลังสอง จึงเรียกอีกอย่างว่า “ Treatment sum of squares” 

และเราสามารถหาค่า Within-samples variation จากสมการ

ซึ่งสมการนี้สุดท้าย ก็จะมีค่าเท่ากับÊมการต่อไปนี้

 

เนื่องจากในการใช้ ANOVA นั้น ค่า Variation จะเป็นค่าที่แสดงถึงขนาดของความคลาดเคลื่อนออกจากค่าเฉลี่ย ของบรรดาข้อมูลใดๆ เราจึงเรียกว่า Error แทนคำว่า Variation และจากสมการข้างบนนั้นเป็นการหาค่าผลบวกของพจน์กำลังสองของ Variation (Error) เราจึงเรียกค่านี้ว่า " Sum square of error "

และเมื่อนำ SSTr มารวมกันกับ SSE เราจึงเรียกว่า Sum square total  

 

จากคำว่า Between-samples หรือ  Within-sample นั้น Sample จะหมายถึง Level หรือ Treatment นั่นเอง ถ้า Between ก็จะหมาย ระหว่าง Level(Treatment ) ส่วน Within ก็จะหมายถึง ระหว่างข้อมูล ในแต่ละ Level (Treatment ) กรุณาดูในตัวอย่างที่จะกล่าวถึง

เราสามารถหาค่า Degree of freedom ได้ดังนี้

เมื่อ SST คือ ผลรวมทั้งหมด ดังนั้น  df = n-1  โดยที่ n คือผลรวม ของจำนวนตัวอย่าง(ข้อมูล) ทั้งหมดจาก ทุกๆ Level นั่นเอง

 และ SSTr คือผลรวม ระหว่าง Level ดังนั้น df = k-1 โดยที่  k คือจำนวน Level นั่นเอง

และ SSE คือผลรวมที่เกิดจาก ทุกๆข้อมูลของทุก Level ดังนั้น df = n-k

จุดประสงค์ที่เราต้องหาค่า  Degree of freedom ก็เพราะเราต้องการหาค่า เฉลี่ยของแต่ละพจน์ในสมการ

 

MSTr : Mean square for treatments (Between-sample)

MSE : Mean square error (Within-sample)

อัตราส่วนระหว่าง MSTr กับ MSE คือค่า สถิติที่ใช้ทดสอบ ANOVA ( Test statistic) ซึ่งเราเรียกย่อๆ ว่า  F

 

มีมากมายหลายสมการและหลายค่าจริง  เพื่อให้มองเห็นภาพรวมของ ANOVA จึงได้มีการสรุปในรูปตาราง ซึ่งเรียกว่า ANOVA Table ดังนี้

 

Source of Variation df SS MS F
Between samples (Treatments) k-1 SSTr MSTr MSTr/MSE
Within samples (Error) n-k SSE MSE
Total variation n-1 SST

 

ตัวอย่างที่ 1 วิศวกรที่ทำหน้าที่ควบคุมคุณภาพของบริษัทผลิต Harddisk แห่งหนึ่งต้องการทดสอบ Bearing จาก Supplier 5 บริษัท เพื่อคัดเลือกว่า Bearing จากบริษัท (Brand) ใด ที่เมื่อประกอบเข้ากับชุด มอเตอร์ขับแล้วเกิดการสั่นสะเทือน (Vibration) น้อยที่สุด เนื่องจากปัจจัยที่สำคัญของคุณภาพ Harddisk คือการสั่นสะเทือน หรือ Noise ขณะทำงานของ Harddisk  เขาจึงได้ออกแบบการทดลองโดยมีการสุ่มตัวอย่างมอเตอร์มา 30 ตัว และแบ่งออกเป็น 5 กลุ่มๆละ 6 ตัว โดยแต่ละกลุ่มก็ใช้กับ Bearing ตัวอย่างจากบริษัทเดียวกัน เมื่อประกอบเข้ากับมอเตอร์และเริ่มทำงานแล้ว เขาได้ทำการการวัดความสั่นสะเทือนของมอเตอร์ และได้ค่าออกมาดังตาราง ให้ทำการทดสอบว่า Bearing จากทั้ง 5 บริษัท (Brand) นั้นให้ผลการสั่นสะเทือนต่างกันหรือไม่

 

Brand 1 Brand 2 Brand 3 Brand 4 Brand 5 .
13.1 16.3 13.7 15.7 13.5
15.0 15.7 13.9 13.7 13.4
14.0 17.2 12.4 14.4 13.2
14.4 14.9 13.8 16.0 12.7
14.0 14.4 14.9 13.9 13.4
11.6 17.2 13.3 14.7 12.3
.
Mean : 13.68 15.95 13.67 14.73 13.08
Stdev : 1.194 1.167 0.816 0.943 0.479

                                                                                               

 

 

                Unit : Micro inch

ตาราง ค่าความสั่นสะเทือนของมอเตอร์ เมื่อใช้ Bearing จากแต่ละบริษัท (Brand)

เมื่อข้อมูลเป็นลักษณะนี้ ก็แน่นอนว่าผู้ทดลองจะต้องวิเคราะห์โดยใช้ ANOVA แน่นอน จึงจำเป็นต้องตรวจสอบข้อมูลก่อนทำการวิเคราะห์ เพื่อให้มั่นใจว่า ทุกอย่างตรงตามเงื่อนไขที่สำคัญของ ANOVA เมื่อดูจากขั้นตอนการทดลองจะเห็นว่าเงื่อนไขการสุ่มตัวอย่างก็ถูกต้อง โดยที่มอเตอร์ที่ใช้ทดสอบนั้นก็เป็นมอเตอร์ Brand เดียวกัน และเป็นชนิดที่ใช้ในการผลิตทั่วไป สมมติว่าเมื่อทดสอบความเป็นการแจกแจงแบบปกติแล้วก็ผ่านทั้ง 5 กลุ่มข้อมูล และค่า Standard deviation ก็ถือว่าไม่มีความแตกต่างกันอย่างมีนัยสำคัญ  ถ้ากำหนดให้ค่าระดับนัยสำคัญ (Significant level ) a = 0.05  ให้ทำการวิเคราะห์ว่า Bearing ทั้ง 5 Brand ดังกล่าวให้ค่าระดับความสั่นสะเทือนแตกต่างกันหรือไม่

ขั้นตอนการวิเคราะห์ข้อมูล

1. ตั้งสมมติฐาน  

                 Ho : ค่าเฉลี่ยความสั่นสะเทือนของมอเตอร์อันเนื่องมาจากการใช้ Bearing ต่าง Brand ทั้ง 5 Brand ไม่แตกต่างกัน

                 Ha : ค่าเฉลี่ยความสั่นสะเทือนของมอเตอร์อันเนื่องมาจากการใช้ Bearing ต่าง Brand ทั้ง 5 Brand แตกต่างกัน อย่าง¹éอยคู่หนึ่ง

         ถ้าเขียนเป็นภาษา Statistic จะได้ดังนี้

                       Ho : m1=m2=m3=m4=m5

                         Ha : At least two m's are different

 2. หาค่า  Grand average จาก

3. หาค่า SSTr  และ SSE

 

4. หาค่า MSTr และค่า MSE

         เมื่อ            n  คือ จำนวนข้อมูลรวมทั้งหมด

                           k  คือ จำนวนกลุ่มข้อมูล (จากโจย์ข้อนี้ คือจำนวน Brand นั่นเอง )

 

5. หาค่า F Statistic จาก

 

6. สรุปในรูป Anova Table ได้ดังนี้

Source df SS MS F
Factor 4 30.88 7.72 8.45
Error 25 20.83 0.913
Total 29 53.71

 

7. หาค่า F Critical จากตาราง ( F-Table) ที่   Fn1=4,n2=25,a =0.05

              F-Critical จากตารางได้  = 2.76

 

8. สรุปสมมติฐาน

             เมื่อ F ที่คำนวนได้ (Calculated ) มากกว่า F-Critical เราจึงปฏิเสธสมมติฐานหลัก ที่ว่า  " ค่าเฉลี่ยความสั่นสะเทือนของมอเตอร์อันเนื่องมาจากการใช้ Bearing ต่าง Brand ทั้ง 5 Brand ไม่แตกต่างกัน  " นั่นก็แปลว่า Bearing จาก 5 Brand ที่ทำการทดลองนั้น ให้ค่าความสั่นสะเทือนของมอเตอร์แตกต่างกันอย่างมีนัยสำคัญ

 

หากโจทย์ข้อนี้ ใช้ ฟังก์ชันของ MS-Excel ในการวิเคราะห์จะให้ผลดังนี้

Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
ฺฺBrand 1 6 82.1 13.683333 1.42566667
Brand 2 6 95.7 15.95 1.363
Brand 3 6 82 13.666667 0.66666667
Brand 4 6 88.4 14.733333 0.88266667
Brand 5 6 78.5 13.083333 0.22966667
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 30.85533 4 7.7138333 8.44395388 0.00018715 2.758710593
Within Groups 22.83833 25 0.9135333
Total 53.69367 29        

MS-Excel จะให้ตารางสรุป (Summary )พร้อมด้วย Anova Table ซึ่งวิธีการแปลความหมายจากตารางเราสามารถตัดสินใจได้ 2 วิธีคือ

1. เปรียบเทียบค่า F- calculated (ในตารางจะเป็น F ) กับค่า F-critical (ในตารางจะเป็น F crit ) ถ้าค่า F-calculated มากกว่า ก็ให้ปฏเสธสมมติฐานหลัก (Ho) ในทางตรงกันข้าม เราจะยอมรับสมมติฐานหลัก (Ho) ถ้าหาก F-critical มากกว่า 

2. เปรียบเทียบค่า P-Value กับค่าระดับนัยสำคัญ (a) ถ้า P-Value น้อยกว่าก็ให้ปฏเสธสมมติฐานหลัก (Ho) ในทางตรงกันข้าม เราจะยอมรับสมมติฐานหลัก (Ho) ถ้าหาก  P-Value มากกว่า

ซึ่งทั้งสองวิธี จะให้ผลตรงกันเสมอ ดังนั้น หากเราทำการวิเคราะห์ด้วยมือ เราก็เลือกใช้วิธีที่ 1 โดยหาค่า F-critical ได้จากตาราง  แต่ถ้าใช้โปรแกรมคอมพิวเตอร์ช่วยในการวิเคราะห์ ก็สามารถเลือกใช้วิธีที่ 2 ก็ได้เช่นกัน

 

หากโจทย์ข้อนี้เราวิเคราะห์โดยใช้โปรแกรม Minitab จะให้ผลดังนี้

One-way ANOVA: Brand 1, Brand 2, Brand 3, Brand 4, Brand 5

Analysis of Variance

   Source      DF        SS        MS         F           P

   Factor      4       30.855     7.714      8.44       0.000

   Error       25      22.838     0.914

   Total       29      53.694

 

                                     Individual 95% CIs For Mean

                                      Based on Pooled StDev

    Level    N     Mean    StDev  ---------+---------+---------+-------

ฺฺ    Brand 1  6    13.683   1.194       (----*-----)

    Brand 2  6    15.950   1.167                     (----*-----)

    Brand 3  6    13.667   0.816       (----*----)

    Brand 4  6    14.733   0.940              (----*-----)

    Brand 5  6    13.083   0.479   (----*-----)

                                  ---------+---------+---------+-------

  Pooled StDev = 0.956                   13.5       15.0      16.5

 

จากผลการวิเคราะห์ จะห็นว่า Minitab จะให้ผลเป็น Anova Table และ ให้ตัดสินใจโดยค่า P-Value เท่านั้น นอกจากนั้นแล้ว Minitab ยังให้ผลการวิเคราะห์ในเชิงคุณภาพ ด้วยโดยจะแสดง Confidence interval ของแต่ละกลุ่มข้อมูลให้ด้วย ซึ่งเราก็สามารถตัดสินใจโดยใช้ กราฟ Confidence Interval นี้ได้ด้วย โดยถ้าหาก Interval อันใดอันหนึ่ง ไม่คาบเกี่ยว หรือซ้อนทับกันเลยกับอีกอันหนึ่งหรือกลุ่มอื่นๆ เราก็สามารถสรุปได้เช่นกันว่า เราปฏิเสธสมมติฐานหลัก

จากตัวอย่าง Confidence Interval ข้างบน

   - Brand 1,3,5  ไม่ทับซ้อนกันเลยกับ Brand 2

   - Brand 5 ไม่ทับซ้อนกันเลยกับ Brand 2,4

 

เนื่องจาก Anova ให้ข้อสรุปแค่ว่า ให้ปฏิเสธหรือยอมรับสมมติฐานหลัก (Ho) เท่านั้น ไม่ได้สรุปว่าอะไรดีกว่าอะไร

ดังผู้ทำการทดลองจำเป็นต้องวิเคราะห์ต่อ ซึ่งก็มีหลายวิธี ตัวอย่างเช่น

 - ดูจากกราฟ Confidence Interval เราก็พอจะเห็นว่า Brand 1,3,5 นั้นให้ค่าความสั่นสะเทือนใกล้เคียงกัน ส่วน Brand 2,4 นั้นก็ใกล้เคียงกัน แต่สูงกว่า Brand 1,3,5 หากต้องเลือกใช้ ก็ควรเลือก Brand 1,3,5 ดังกล่าว หรืออาจจะนำ ทั้ง 3 Brand ดังกล่าว ไปทำการทดลองในเรื่องอื่นๆ เช่น อายุการใช้งาน ราคา หรือ ปริมาณของเสีย เมื่อใช้ในสายการผลิต เพื่อให้ได้ Brand ที่ดีที่สุดจริงๆ

 


[ HOME ]             [ CONTENTS ]      

Hosted by www.Geocities.ws

1