Two-Factors ANOVA ( Two-way ANOVA)

จากที่ผู้เขียนได้เริ่มต้นในเรื่อง ANOVA ไว้แล้วว่าสามารถ วิเคราะห์ได้พร้อมกันมากกว่า 1 Factor ตามตัวอย่างง่ายๆ เรื่องการทดลองเรื่องการขับรถด้วยความเร็วที่แตกต่างกัน นอกจากนั้น ANOVA ที่ยังสามารถวิเคราะห์ให้เห็นผลกระทบซึ่งกันและกัน ของปัจจัย (Facters ' Interaction) ได้ด้วยนั้น เพื่อให้เห็นภาพดังกล่าว ในหัวข้อนี้จะชี้ให้เห็นความเหมือนและความแตกต่างของ ANOVA เมื่อใช้วิเคราะห์ข้อมูลการทดลองจาก 1 Factor กับ หลาย Factor โดยยกตัวอย่าง 2 Factor เป็นตัวอย่าง โดยที่แท้จริงแล้ว ANOVA สามารถใช้วิเคราะห์กรณี 3 , 4 ,5 Factors หรือมากกว่า ก็ได้ แต่ด้วยเหตุความยุ่งยากในการวิเคราะห์ จึงอาจจะหาได้ยากที่จะวิเคราะห์ ANOVA ที่มากกว่า 2 Factors ในการทำงานทั่วๆไป  ซึ่งอาจมีสาเหตุมาจากความยุ่งยากในการออกแบบการทดลอง การเก็บข้อมูลและการคำนวณหรือการวิเคราะห์ ถ้าหากมีมากกว่า 2 Factors แล้วก็หลีกเลี่ยงไม่ได้ที่ผู้วิเคราะห์จะต้องอาศัย โปรแกรมคอมพิวเตอร์ช่วยในการวิเคราะห์  ดังนั้นทุกๆคนจะคุ้นเคยกับ ANOVA ที่มีไม่เกิน 2 Factors 

ใน ANOVA นั้นเราจะกล่าวถึง ค่า Sum sqaure (SS) หรือ  Variation นั่นเอง  ถ้ามี 2 Factor ลักษณะการอธิบาย Variation คือ

               

เมื่อ              T :  Total

                A : Factor A

                  B : Factor B

              AB : Interaction of Factor A and B

               E: Error

                    a : Number of levels of factor A

                    b : Number of levels of factor B

                    n : Number of replication per cell ( หมายความว่า การเก็บข้อมูลมีการทำซ้ำ หรือ Repeat  กี่ครั้ง )

               

 หาค่า Mean of square ได้จาก

 

ทั้งนี้ Two-Factors ANOVA  สามารถเขียนสรุปในรูป ตาราง ANOVA ได้ดังนี้

Source of Variation Degree of freedom Sum of square Mean square F-Statistic
Factor A a-1 SSA MSA FA =MSA/MSE
Factor B b-1 SSB MSB FB=MSB/MSE
Interaction (a-1)(b-1) SSAB MSAB FAB=MSAB/MSE
Error ab(n-1) SSE MSE .
Total abn-1 SST . .

 

ตัวอย่าง  ในบทที่ผ่านมา ผู้ทำการทดลองต้องการทราบว่า ถ้าเขาบรรทุกน้ำหนักด้วย อัตราการกินน้ำมันในช่วงแต่ละความเร็วจะเปลี่ยนแปลงเป็นอย่างไร เขาจึงกำหนดการทดลองขึ้นมาใหม่ โดยมีปัจจัย เรื่องน้ำหนักบรรทุกเข้ามาเกี่ยวข้อง

                     Factor                         Level                                        Response

                       Speed                         70,90,110 Km/Hr                                          Total Kilometers

                       Weight                         60, 200   Kg

 

เมื่อทำการทดลองเสร็จแล้ว ได้ข้อมูลดังนี้ ( ผู้เขียนมีวัตถุประสงค์จะให้เข้าใจง่าย และคำนวณด้วยมือได้ง่าย จึงใช้ขนาดตัวอย่างเพียง 3 ตัวอย่างต่อ 1 ชุดการทดลอง  ในชีวิตจริงการทดลองใดๆ คงจะใช้ตัวอย่างมากกว่านี้ )

 

  60 KG 200 KG
70 Km/Hr 1 606 582
2 615 576
3 609 588
     
90 Km/Hr 1 640 598
2 633 612
3 649 605
     
110 Km/Hr 1 514 487
2 523 501
3 519 495

 

ขั้นตอนการวิเคราะห์ 

1. ตั้งสมมติฐาน  

       หลักในการตั้งสมมติฐานของ 2 Way ANOVA จะคล้ายกับ กรณี 1 Way ANOVA  เพียงแต่สมมติฐานนั้นเราจะตั้งสำหรับ Factor เดียวเท่านั้น หมายความว่า ในกรณีวิเคราะห์  2 Factors เช่นโจทย์นี้  เราจะต้องตั้งสมมติฐานแยกกันระหว่างปัจจัย  Speed ,  Weight  รวมทั้ง Interaction ด้วย แต่สมมติฐานจะเหมือนกันทุกอย่าง ในความเป็นจริงแล้วเราเขียนสมมติฐานเพียงแค่อย่างเดียว เพียงแต่เมื่อเราได้ผลการวิเคราะห์โดยตาราง ANOVA แล้ว เราจะสรุปทีละปัจจัย รวมทั้ง Interaction ของปัจจัยเหล่านั้นด้วย โดยดูที่ค่า  F-Statistic หรือ  P-Value ของแต่ละตัวแปร

             Ho : ค่าเฉลี่ยกิโลเมตรที่ได้ ไม่แตกต่างกัน    

             Ha : ค่าเฉลี่ยกิโลเมตรที่ได้ แตกต่างกัน อย่างน้อย 1 คู่

          โดยเขียนเป็นภาษา Statistics ได้ดังนี้

                              Ho : m1=m2=m3=m4=m5

                             Ha : At least two m's are different

   

2.  กำหนดระดับนัยสำคัญ (Significant level )  กำหนด  a = 0.05

3. ทำการวิเคราะห์ ในตัวอย่างนี้ผู้เขียนจะใช้โปรแกรม MS Excel  ช่วยในการคำนวณ แต่จะใช้หลักการเหมือนคำนวณด้วยมือ เพียงแต่จะประยุกต์ใช้ Work sheet ของ Excel มาช่วยเท่านั้น 

 

60 KG 200 KG  
70 Km/Hr 606 582  
615 576  
609 588  
Sum 1830 1746 3576
     
90 Km/Hr 640 598  
633 612  
649 605  
Sum 1922 1815 3737
     
110 Km/Hr 514 487  
523 501  
519 495  
Sum 1556 1483 3039
     
Total 5308 5044 10352

 

 

 

 

 

 

 

 

 

 

 

 

 

 

หาค่า F-Critical จากตารางจะได้ ( Denominator คือ Error )

                 F-Critical for factor speed = 3.89  ( f0.05 , 2,12 )

                 F-Critical for factor weight = 4.75  ( f0.05 , 1,12 )

                F-Critical for interaction = 3.89   ( f0.05 , 2,12 )

ทั้งหมดนี้สรุปเป็น ANOVA Table ได้ดังนี้

Source of Variation SS df MS F F crit
Speed 44527.44 2 22263.722 556.593 3.89
Weight 3872 1 3872 96.8 4.75
Interaction 100.333 2 50.166 1.254 3.89
Error 480 12 40    
Total 48979.78 17      

 

4. วิเคราะห์ผลตามตาราง ANOVA

     -  สิ่งที่เราต้องพิจารณาอันดับแรก คือ อัตราส่วนระหว่าง Error กับ Total โดยดูผ่านค่า  SS ( Error ) เทียบกับ  SS ( Total ) 

              จากตาราง ANOVA        ค่า  SS(Error)  = 480

                                                      ค่า SS(Total) = 48979.78 

               ค่า SS(Error) จะมีค่าเพียงน้อยนิด เมื่อเทียบกับ SS(Total) แสดงว่าในการทดลองครั้งนี้มีการควบคุมผลกระทบจากตัวแปรภายนอกอื่นๆทำได้ดีมาก ค่า Variation ที่เห็นส่วนมากจึงเกิดจากการเปลี่ยนค่าของ Factor ในการทดลองเอง  ในทางตรงกันข้าม สมมติว่า SS(Error) มีค่ามากอาจจะซัก 1/5 ขึ้นไปเมื่อเทียบกับ SS(Total) ก็จะแปลว่าการทดลองครั้งนี้มีความผิดพลาดอันเนื่องมาจากผลกระทบจากตัวแปรภายนอกอื่นๆ ที่เราควบคุมไม่ดี Model หรือผลลัพธ์ ที่เราได้จากการวิเคราะห์นั้น ย่อมมีความคลาดเคลื่อนสูง จนอาจจะยอรับไม่ได้ ผู้ทำการทดลองอาจจะต้องทำการทดลองใหม่ และต้องควบคุมผลกระทบอื่นๆให้ดีกว่าเก่า การเปรียบเทียบดังกล่าวถือเป็น Data qualify ซึ่งจะต้องผ่านก่อนจึงจะสรุปผลการทดสอบสมมุติฐานได้ หากเงื่อนไขดังที่กล่าวมาแล้วถูกละเลย และด่วนสรุปผลการทดสอบสมมติฐานเลย ก็จะนำไปสู่การได้ข้อสรุปที่มีข้อผิดพลาดในภายหลัง

      - พิจารณา SS ของ Factor  Speed จะเห็นว่ามีค่ามากกว่า Weight มาก ความหมายก็คือ เมื่อเปลี่ยนแปลงค่าของ  Speed  โดยสนใจ Weight เท่าเดิม ขณะทดลอง จะเกิดผลกระทบต่อ Output (Total KM) มากกว่าการเปลี่ยนแปลงค่า Weight เมื่อ Speed เท่าเดิม

 

5. สรุปผลการทดสอบสมมติฐาน

จากการตั้งสมมติฐานที่ผ่านมา 

              Ho : ค่าเฉลี่ยกิโลเมตรที่ได้ ไม่แตกต่างกัน    

              Ha : ค่าเฉลี่ยกิโลเมตรที่ได้ แตกต่างกัน อย่างน้อย 1 คู่

จากตาราง ANOVA เราสรุปได้ว่า  ทั้ง Speed และ Weight ต่างก็มีผลทำให้ค่าระยะทางรวมที่วิ่งได้ เมื่อใช้น้ำมันเต็มถังแตกต่างกัน เพราะ ค่า  F ที่คำนวณได้มีค่ามากกว่า F-Critical  หมายความว่า การใช้ความเร็วเฉลี่ย มากหรือน้อย ก็ทำให้รถยนต์กินน้ำมันมากหรือน้อยตามไปด้วย เช่นเดียวกัน ถ้ามีการบรรทุกน้ำหนักไปด้วย ก็จะมีส่วนทำให้รถกินน้ำมันมากขึ้นไปอีกได้เหมือนกัน

ในขณะที่ Interaction ระหว่าง Speed กับ Weight กลับไม่มีผลต่อระยะทางรวมที่ได้หรือไม่มีผลทำให้การกินน้ำมันของรถเปลี่ยนแปลงไป ที่เป็นเช่นนี้ก็เพราะทั้ง Speed และ Weight ต่างก็มีผลต่อ ระยะทางรวม ไปในทิศทางเดียวกัน จึงไม่เกิดจุดตัดกัน หรือ Interaction นั่นเอง

 

การวิเคราะห์ Main Effect

เมื่อเราสรุปผลการทดสอบสมมติฐานนั้น จะเห็นว่าเราค่อนข้างจะมองเห็นภาพหรือผลกระทบจากแต่ละ Factor ยาก  การวิเคราะห์ Main Effect จะสามารถทำให้เรามองเห็นภาพดังกล่าวได้ง่ายขึ้น 

เมื่อเราทำการวิเคราะห์ Main effect : Weight   เราก็จะถือว่า Speed ซึ่งเป็นอีก Factor หนึ่งเป็น Random variation ให้เฉลี่ยค่าที่เกิดจากทุก Speed factor ที่แต่ละค่าของ Main Effect : Weight ที่เรากำลังสนใจ ในทางกลับกัน  เมื่อเราทำการวิเคราะห์ Main effect : Speed   เราก็จะถือว่า Weight ซึ่งเป็นอีก Factor หนึ่งเป็น Random variation ให้เฉลี่ยค่าที่เกิดจากทุก Weight factor ที่แต่ละค่าของ Main Effect : Speed นั้น เช่นกัน

Main Effect : Weight  คือ

60 Kg         Effect =  ( 606+615+609+640+633+649+514+523+519 ) / 9  =   589.778 Km

200 Kg        Effect  =   ( 582+576+588+598+612+605+487+501+495 ) / 9  =  560.444 Km

 

Main Effect : Speed  คือ

70 Km / Hr              Effect  =  ( 606 +615 +609+582+576+588) / 6   =  596 Km

90 Km / Hr              Effect  = ( 640+633+649+598+612+605 ) / 6   = 622.833  Km 

110 Km / Hr            Effect  =  ( 514+523+519+487+501+495 ) / 6   = 506.5 Km 

 

ตรงนี้ผู้วิเคราะห์ จะได้อะไร?

คำตอบคือ ทำให้เห็นว่า ผลที่เกิดจากการเปลี่ยนความเร็วรถ มีผล ( Effect ) ต่ออัตราการใช้น้ำมัน มากกว่า การเปลี่ยนแปลงค่าน้ำหนักบรรทุกนั่นเอง  นอกจากนั้น เมื่อเราทำการพล้อต Main effect ก็จะเห็นว่าผลกระทบ ระหว่างปัจจัย Speed กับ Weight จะมีผลต่อ ต่ออัตราการใช้น้ำมัน ในทิศทางเดียวกันคือ ความเร็วเพิ่มขึ้น ก็จะวิ่งได้ระยะทางรวมน้อยลง เช่นเดียวกัน Weight เพิ่มขึ้นก็จะวิ่งได้ระยะทางรวมน้อยลง

เมื่อวิเคราะห์ตัวอย่างนี้ด้วย MS Excel จะได้ดังนี้   ( อ่านวิธีการใช้ MS Excel สำหรับ 2-Way ANOVA ได้ที่นี่ )

 

SUMMARY 60 KG 200 KG Total

70 Km/Hr

     
Count 3 3 6
Sum 1830 1746 3576
Average 610 582 596
Variance 21 36 258
     

90 Km/Hr

     
Count 3 3 6
Sum 1922 1815 3737
Average 640.667 605 622.833
Variance 64.333 49 426.967
     

110 Km/Hr

     
Count 3 3 6
Sum 1556 1483 3039
Average 518.667 494.3333 506.5
Variance 20.333 49.333 205.5
     

Total

     
Count 9 9  
Sum 5308 5044  
Average 589.778 560.444  
Variance 3047.194 2591.278  

 

ตารางส่วนแรกที่ MS Excel แสดงออกมาคือ การวิเคราะห์เชิงตัวเลขชนิดต่างๆ เช่น Main effect , Average  และ Total ซึ่งถ้าดูเทียบกับการวิเคราะห์ด้วยมือ ที่ผ่านมานั้นก็จะสามารถมองเห็นได้ว่า ค่าอะไร คืออะไร ตรงนี้ผู้เขียนคงไม่อธิบายเพิ่มมากกว่านี้

 

  ANOVA TABLE

Source of Variation SS

df

MS F P-value F crit
Sample 44527.44 2 22263.722 556.593 1.47E-12 3.885
Columns 3872 1 3872 96.8 4.27E-07 4.747
Interaction 100.333 2 50.167 1.254 0.320 3.885
Within 480 12 40      
           
Total 48979.78 17        

 

ในส่วน ANOVA TABLE นั้น MS Excel จะแทน Speed ด้วยคำว่า Sample และ Weight ด้วยคำว่า Columns นั่นเพราะเวลาเรานำข้อมูลใส่เราต้องทำตาราง ที่ Weight อยู่ในแนว Column และ Speed เป็นแนว Row ซึ่ง MS Excel จะใช้คำว่า Sample สำหรับข้อมูลในแนว Row เสมอ

 

การ สรุปผลการวิเคราะห์ ANOVA  จาก MS Excel จะมี 2 วิธี คือ

      1. เปรียบเทียบ F   หาก F-Calculate  มากกว่า F-Critical ก็สรุปว่า ปฏิเสธสมมติฐานหลัก ( Ho) 

          จากตาราง Factor Sample (Speed)  มี F-Calculate 556.593 มากกว่า F-Critical 3.885 จึงสรุปว่า การเปลี่ยนความเร็วในการขับ มีผลต่ออัตราการกินน้ำมันของรถยนต์  ในขณะที่ Factor Column(Weight) มี F-Calculate 96.8 มากกว่า F-Critical 4.747 จึงสรุปว่าขนาดน้ำหนักบรรทุกมีผลต่ออัตราการกินน้ำมัน ของรถยนต์เช่นเดียวกัน และ Interaction ของทั้งสอง Factor ไม่มีผลใดๆ เพราะ F-Calculated มีค่าน้อยกว่า F-Critical

       2.  เปรียบเที่ยบ P-Value กับค่า Significant level (a) หาก P-Value น้อยกว่า ก็ให้ปฏิเสธสมมติฐานหลัก (Ho) เช่นเดียวกัน

 

โจทย์ข้อนี้หากวิเคราะห์โดยใช้ โปรแกรม Minitab จะให้ผลดังนี้

 Analysis of Variance for KM

Source      DF         SS           MS          F         P

Speed       2        44527.4      22263.7     556.59    0.000

Weight      1         3872.0       3872.0      96.80    0.000

Interaction 2          100.3         50.2       1.25    0.320

Error       12         480.0         40.0

Total       17       48979.8

 

โปรแกรม Minitab จะให้ผลออกมาเป็น ANOVA Table ซึ่งจะให้ค่า P-Value เป็นเกณฑ์ในการตัดสินใจ การสรุปผลก็เหมือนกับการใช้ MS Excel หรือการคำนวณด้วยมือทุกประการ

การวิเคราะห์ FIT & Resisdual 

การใช้ ANOVA นั้นนอกจากเราจะทำการ Qualify ผลโดยใช้การเปรียบเทียบ Error กับ Total แล้วเรายังจำเป็นต้องวิเคราะห์ให้ลึกลงไปถึงระดับข้อมูลทุกตัว โดยผ่านค่าที่เราเรียกว่า Fit และ Residual หลายท่านอาจจะแปลกใจกับศัพท์ 2 คำนี้ แต่ที่จริงมันก็เหมือนกับคำว่า Mean และ Variation นั่นเอง 

 

ตารางสรุป FIT & Residual ของตัวอย่างข้อนี้

Weight Speed KM FITS RESI
60KG 70KM/Hr 606 610 -4.0000
60KG 70KM/Hr 615 610 5.0000
60KG 70KM/Hr 609 610 -1.0000
60KG 90KM/Hr 640 640.667 -0.66667
60KG 90KM/Hr 633 640.667 -7.66667
60KG 90KM/Hr 649 640.667 8.33333
60KG 110KM/Hr 514 518.667 -4.66667
60KG 110KM/Hr 523 518.667 4.33333
60KG 110KM/Hr 519 518.667 0.33333
200KG 70KM/Hr 582 582 0.0000
200KG 70KM/Hr 576 582 -6.0000
200KG 70KM/Hr 588 582 6.0000
200KG 90KM/Hr 598 605 -7.0000
200KG 90KM/Hr 612 605 7.0000
200KG 90KM/Hr 605 605 0.0000
200KG 110KM/Hr 487 494.333 -7.33333
200KG 110KM/Hr 501 494.333 6.66667
200KG 110KM/Hr 495 494.333 0.66667

 

หลักการหา FIT&Residual เราจะยึด หลักที่ว่า Factor ทั้งสอง มีค่าเดิมเราถือว่า ใช้ FIT ร่วมกัน ส่วน Residual คือผลต่างระหว่างค่า Y ใดๆ กับค่า FIT ของกลุ่มที่ค่า Y นั้นเป็นสมาชิกอยู่  ขอยกตัวอย่างวิธีการหา FIT & Residual ง่ายๆ ดังนี้ 

 Weight : 60 KG และ Speed : 70 KM/Hr 

KM Residual
606 606-610 = -4.0
615 615-610 = 5.0
609 609-610 = -1.0
Average (FIT) 610

 

Weight : 60 KG และ Speed : 90 KM/Hr 

KM Residual
640 640-640.667 = -0.667
633 633-640.667 = -7.667
649 649-640.667 = 8.333

Average (FIT)

640.667

 

เราใช้ทำอะไรได้บ้าง ผู้เขียนจะนำเสนอในรูปแบบของกราฟแสดงความสัมพันธ์ ดังต่อไปนี้

Individual plot of residual : เป็นการนำค่า Residual แต่ละค่ามา Plot เป็นกราฟ ลักษณะของกราฟจะเป็นตัวบ่งบอกว่าข้อมูลที่เราได้ทำการวิเคราะห์นั้น เป็น Randomly data (ข้อมูลที่ได้จากการสุ่มที่ถูกต้องหรือไม่) หากเป็น Randomly เราจะได้กราฟ ที่ไม่สามารถคาดเดาค่าในอนาคตได้ ไม่มีแนวโน้มขึ้น หรือลงอย่างเดียว (เงื่อนไขเหมือนกับ SPC) 

Normality plot of residual: เป็นการพลอตค่า Residual กับค่า Probability หลักการเช่นเดียวกับการทำ Normality test เพื่อทำการ Qualify ข้อมูลที่เรากำลังจะวิเคราะห์โดย ANOVA  หากไม่ผ่านเงื่อนไข Normality test ก็ถือว่าข้อมูลนี้ไม่ Qualified เช่นกัน

 

Plot of residual VS Fit : เพื่อทำการตรวจสอบว่า Variation ของข้อมูลนั้นแตกต่างกันหรือไม่ ถ้าแตกต่างกัน จะเห็นว่าบาง Fit จะมีจุด Residual อยู่ห่างจาก 0 มากกว่าจุดอื่นๆ อย่างผิดปกติ ลักษณะอย่างกราฟข้างบนแสดงให้เห็นลักษณะที่ Variation ไม่แตกต่างกัน ในแต่ละ Fit

 

Plot of residual VS speed: เป็นการพลอต Residual เปรียบเทียบระหว่างค่า ของ Factor จะให้ผลสรุปเช่นเดียวกับ Plot of residual VS Fit  นอกจากนั้นเรายังสามารถพบเห็นความไม่ปกติ บางอย่างตัวอย่างเช่น จากกราฟข้างบน แต่ละค่า Speed จะเห็น Residual มีแนวโน้มเกาะกันเป็นคู่ๆ ซึ่งถ้ารู้สึกผิดปกติมากเกินไปก็แสดงว่าข้อมูลไม่ qualified ได้เช่นกัน

Plot of residual VS weight: เป็นการพลอต Residual เปรียบเทียบระหว่างค่า ของ Factor จะให้ผลสรุปเช่นเดียวกับ Plot of residual VS Fit  นอกจากนั้นเรายังสามารถพบเห็นความไม่ปกติ บางอย่างตัวอย่างเช่น จากกราฟข้างบน แต่ละค่า weight จะเห็น Residual มีแนวโน้มเกาะกันเป็นคู่ๆ ซึ่งถ้ารู้สึกผิดปกติมากเกินไปก็แสดงว่าข้อมูลไม่ qualify ได้เช่นกัน

(หากท่านผู้อ่านท่านใด ต้องการ Excel file ที่ผู้เขียน ใช้ในเรื่องนี้กรุณาติดต่อขอรับได้ทาง E-mail )

 


[ HOME ]             [ CONTENTS ]       

Hosted by www.Geocities.ws

1