การนำเสนอข้อมูลด้วยแผนภูมิ (Graphical Data Presentation )

ในบางครั้งการที่เรามีข้อมูลที่เป็นตัวเลขเป็นจำนวนมากนั้น ทำให้เราไม่สามารถมองเห็นสาระที่สำคัญจากข้อมูลนั้นได้ แต่เมื่อเราแสดงข้อมูลเดียวกันนั้นออกมาในรูปกราฟ จะทำให้เราสามารถเห็นสาระสำคัญของข้อมูลดังกล่าวได้ดีกว่า เราสามารถแยกลักษณะของการแสดงข้อมูลในรูปกราฟได้ตามวัตถุประสงค์ดังต่อไปนี้

กราฟแท่ง  

ใช้อธิบายขนาดของข้อมูล ของแต่ละกลุ่มที่มีอยู่  โดยแนวแกน Y จะเป็นขนาดหรือปริมาณของข้อมูล ส่วนแกน X จะใช้แสดงกลุ่ม หรือชนิดของข้อมูลนั้นๆ

 

 

จากตัวอย่าง เป็นกราฟที่ใช้อธิบายอัตราการเกิดขึ้น ของของเสียใน 5 เดือน สาระที่สำคัญไม่ได้อยู่ที่ว่าแต่ละเดือนมีของเสียเกิดขึ้นเท่าไหร่ แต่อยู่ตรงที่ 3 เดือนที่ผ่านมาแนวโน้มจะเกิดของเสียจากกระบวนการผลิต  เพิ่มขึ้นเรื่อยๆ ผู้ที่มีหน้าที่รับผิดชอบจะต้องหาทางแก้ไข

Box Plot  

ใช้แสดงสาระที่สำคัญของข้อมูลคือ ค่ากลาง ค่าการกระจาย สัดส่วนข้อมูลที่มากหรือน้อยกว่าค่ากลาง ( Symmetry ) รวมทั้งข้อมูลที่อยู่ห่างจากกลุ่มมากๆ (Outlier)

 

 

 

Box plot จะแสดงข้อมูลทั้งหมดออกมา 3 Quartiles โดยมีการจัดเรียงอันดับของข้อมูลแล้ว ข้อมูลที่ตกอยู่ภายใต้ Q1 (Quartile 1) คือข้อมูล 25% แรกจากค่าต่ำขึ้นมา จะแสดงในรูปเส้นตรง หนึ่งเส้น (Whisker)  ข้อมูลที่ตกอยู่ภายใต้ Q2 คือข้อมูลตัวที่มากกว่า 25% จนถึงตัวที่ 75% โดยแสดงออกมาในรูป สี่เหลี่ยมผืนผ้า ภายใน Q3 นี้ จะมีค่าที่ 50% ของข้อมูลอยู่ เขียนแทนด้วยเส้นตรงอยู่ภายในรูปสี่เหลี่ยมผืนผ้า ค่านี้คือค่าค่ากลางของข้อมูลทั้งหมด (Median)  และตรงค่า เฉลี่ย (Mean) จะแทนด้วย เครื่องหมายบวก โดยที่ค่าอาจจะเท่าหรือต่างกับค่า Median ก็ได้  ส่วนค่าที่ตกอยู่ภายใต้ Q3 คือตัวที่มากกว่า 75% ขึ้นไป จะเขียนแทนด้วยเส้นตรง เช่นเดียวกับ Q1 

วิธีหาจุดเริ่มต้นของ Q1  และจุดสุดท้ายของ Q3 จะหามาจากสมการตามที่ปรากฏ อยู่ในรูป ดังนั้น ค่าที่ต่ำกว่า ค่าเริ่มต้นของ Q1 และค่าสุดท้ายของ Q3 จะเรียกว่า Outlier เขียนสัญญลักญ์แทนด้วย * 

ถ้าสังเกตดูเราจะพบว่า เส้นค่ากลางจะแบ่งจำนวนขอ้มูลใน Q2 ออกเป็นสองส่วนเท่าๆกัน ดังนั้นถ้า ค่ากลางนี้ไม่ได้อยู่ตรงกลางรูปสี่เหลี่ยมผืนผ้า นั่นหมายถึงรูปกราฟจะเบ้ ไป หรือความหนาแน่นของข้อมูลจะไม่เท่ากัน   แต่โดยทั่วไปโปรแกรมทางสถิติจะมีคำสั่งให้ทำ Box plot ให้ใช้ 

ตัวอย่าง  มีข้อมูลดังตารางต่อไปนี้ ให้ทำ Box plot

Data

43

47

51

48

52

50

46

49

45

46

51

44

49

46

51

49

45

44

50

48

50

49

50

เมื่อนำข้อมูลมาจัดอันดับ แล้วหาค่า Percentile จะเป็นดังตารางต่อไปนี้

Point

Value

Rank

Percent

5

52

1

100.00%

3

51

2

86.30%

11

51

2

86.30%

15

51

2

86.30%

6

50

5

68.10%

19

50

5

68.10%

21

50

5

68.10%

23

50

5

68.10%

8

49

9

50.00%

13

49

9

50.00%

16

49

9

50.00%

22

49

9

50.00%

4

48

13

40.90%

20

48

13

40.90%

2

47

15

36.30%

7

46

16

22.70%

10

46

16

22.70%

14

46

16

22.70%

9

45

19

13.60%

17

45

19

13.60%

12

44

21

4.50%

18

44

21

4.50%

1

43

23

.00%

เราใช้ค่า Percentile เพื่อห่า Q1 , Q2 , Q3 รวมทั้งค่ากลางของข้อมูลได้  เมื่อนำไปเขียนเป็น Box plot จะได้ดังนี้

 

 

 

 

 

 

 

 

 

 

 

 

 

นอกจากนั้นเรายังสามารถใช้ Box plot เพื่อเปรียบเที่ยบระหว่างข้อมูลสองกลุ่มหรือมากกว่าก็ได้ ดังตัวอย่างต่อไปนี้ เป็นการเก็บข้อมูลเรื่องอุณหภูมิของน้ำหล่อเย็นที่ออกจากเครื่องจักรสามเครื่อง กำลังจะปล่อยลงสู่แหล่งน้ำธรรมชาติ 

 

 

 

 

 

 

 

 

 

 

 

 

 

เราจะพบว่า MACHINE  A ให้ค่าต่ำที่สุด ในขณะที่ C สูงที่สุด แต่ A ก็มีการกระจายมากที่สุดเช่นกัน  นี่เป็นตัวอย่างการนำไปใช้งานและการวิเคราะห์สาระที่ได้จากการใช้ Box plot

Histogram

 เป็นกราฟที่ใช้แสดงการกระจายของข้อมูล ความถี่ในการเกิดเหตุการณ์ที่เราสนใจ โดยแนวแกน x คือค่าหรือสิ่งที่เราสนใจ โดยจะถูกแบ่งออกเป็นช่วงๆ ส่วนแกน Y คือความถี่ในการเกิดค่านั้นๆ   ดังตัวอย่างต่อไปนี้

 

 

การสร้าง Histogram จะมีขั้นตอนดังต่อไปนี้

1. หาจำนวนแท่งกราฟที่จะได้โดยประมาณ  จากสมการ  

            

โดยที่   n  คือจำนวนข้อมูลทั้งหมด โดยที่ Bin หรือแท่งกราฟ ล่างสุดต้องครอบคลุมค่าต่ำสุด และแท่งบนสุดจะต้องครอบคลุมค่าสูงสุดได้ด้วย เช่น ถ้ามีข้อมูลทั้งหมด 80 ข้อมูล กราฟที่ได้ควรจะมีจำนวนแท่ง 8 หรือ 9 แท่ง

2. หาว่า ย่านของค่าในหนึ่งแท่งจะเป็นเท่าไหร่ โดยสมการต่อไปนี้ โดยประมาณ

โดยที่     max  คือค่าสูงสุดของข้อมูล   min คือค่าต่ำสุด  และ bin คือจำนวนแท่ง ที่เราหาใได้ตามข้อ 1

ตัวอย่าง  ค่าสูงสุดของข้อมูลคือ 245 ค่าต่ำสุดคือ 76  ผลต่างคือ 245 - 76 = 169 หน่วยเรากำหนดว่ากราฟจะมี 9 แท่ง ดังนั้น range = 169/9 =18.77 เราเลือกที่ 20 หน่วย โดยที่ค่าต่ำสุดของแท่งแรกจะต้องเปลี่ยนมาเป็น 70 และค่าบนสุดของแท่งสุดท้ายจะเป็น 250 

3. นับจำนวนข้อมูลที่มีค่าตกอยู่ในแต่ละย่าน ( bin ) โดยสามารถทำเป็นตารางความถี่ได้ดังนี้

 

Range

Tolly

Frequency

70 <--> 89

II

2

90 <--> 109

III

3

110 <--> 129

IIIII I

6

130 <--> 149

IIIII IIIII IIII

14

150 <--> 169

IIIII IIIII IIIII IIIII II

22

170 <--> 189

IIIII IIIII IIIII II

17

190 <--> 209

IIIII IIIII

10

210 <--> 229

IIII

4

230 <--> 249

II

2

 

4. นำค่าความถี่ ( Frequency ) ไปทำ Histogram plot จะได้ดังรูปต่อไปนี้

 

 

โดยที่ในแกน X ค่าที่ปรากฏจะเป็นค่ากลางของแต่แท่งกราฟ นั่นเอง แต่สามารถบอกค่าแรกของกลุ่มก็ได้

 เมื่อเราใช้ Histogram แสดงลักษณะการกระจายของข้อมูล ก็เป็นไปได้ว่า Histogram จะมีรูปแบบ ที่ไม่เหมือนกันเสมอไป ขึ้นอยู่กับการกระจายตัวของข้อมูลนั้น  ดังตัวอย่างต่อไปนี้เป็นการเปรียบเทียบให้เห็นลัษณะของ Histogram ที่อาจจะเป็นไปได้ โดยสมมุติว่าข้อมูลที่นำมาทำ Histogram ทั้งสองมาจาก สายการผลิตเดียวกัน เป็นการประกบชิ้นงานสองชิ้นงานเข้าด้วยกัน แล้วหาช่องว่างที่เกิดขึ้น จากเครื่องที่ทำหน้าที่ประกอบ  สองเครื่องโดยหน่วยที่ใช้วัดเป็น หนึ่งส่วนล้านนิ้ว (Micro Inch)  โดยค่ายิ่งต่ำยิ่งดี

 

                             MACHINE  A.                                                                               MACHINE B.

จากรูป Histogram รูปด้านซ้ายมือ จะลาดลงไปทางค่าสูงมากกว่าปกติ ซึ่งเรียกว่ากราฟเบ้ขวา  ในขณะที่กราฟด้านขวามือ จะลาดลงทางค่าต่ำมากกว่า เรียกว่ากราฟเบ้ซ้าย เมื่อเราดู Histogram แล้วก็บอกได้ว่า Process การประกบชิ้นงานของสองเครื่องจักร นี้ แตกต่างกันอย่างชัดเจน MACHINE B.  จำเป็นต้องได้รับการตรวจสอบว่า เพราะเหตุใด การประกบสองชิ้นงานเข้าด้วยกันจึงเกิดช่องว่างระหว่างชิ้นงานมากกว่า

Dot Plot

 เป็นกราฟที่มีคุณสมบัติเช่นเดียวกันกับ Histogram หรือ Box plot โดยใช้จุดแทนตัวข้อมูล หากค่าเป็นค่าเดียวกัน จุดก็จะวางทับกันเป็นชั้นๆขึ้นไป

 

 

ทั้ง Box plot , Histogram และ Dot plot เป็นกราฟที่ใช้แสดง ค่ากลาง ลักษณะการกระจาย ของข้อมูลเหมือนกัน แต่มีข้อเด่นและข้อด้อยในการแสดงข้อมูลได้แตกต่างกัน

Box plot

Histogram

Dot plot

- รูปกราฟจะไม่เปลี่ยนแปลงมากนัก แม้จำนวนข้อมูลจะมากหรือน้อยก็ตาม

- รูปกราฟจะเปลี่ยนแปลง เมื่อจำนวนข้อมูลมากขึ้นหรือน้อยลง จึงไม่เหมาะกับจำนวนข้อมูลน้อย หรือมากเกินไป

- รูปกราฟจะเปลี่ยนแปลงมาก เมื่อจำนวนข้อมูลเปลี่ยนไป แต่ถ้าจำนวนข้อมูลมากๆ การเปลี่ยนแปลงนั้นจะน้อยลง จึงเหมาะกับ จำนวนข้อมูลมากๆ

- ใช้เมื่อข้อมูลมีจำนวนน้อย เช่น 10-30 ข้อมูล ได้ดีกว่า ทั้ง Histogram และ Dot plot

- ใช้เมื่อจำนวนข้อมูลประมาณ 35 ข้อมูลขึ้นไปจนถึง หลายร้อยข้อมูล ซึงถือว่า จำนวนปานกลาง

- ใช้ได้เมื่อมีจำนวนข้อมูลหลักร้อย ขึ้นไปจนถึงหลายพันข้อมูล

 

Pareto Chart  

Vilfredo Pareto ( 1848-1923 )  เป็นนักเศรษฐศาสตร์และสังคมศาสตร์ ที่เชี่ยวชาญในการใช้เทคนิคทางคณิตศาสตร์ มาวิเคราะห์ปัญหาทางเศรษฐศาสตร์ โดยทฤษฏีที่ได้รับการยอมรับอย่างสูงคือ "Circulation of Elites" เขาสำเร็จการศึกษาจาก คณะวิศวกรรมศาสตร์ สาขาโยธา จาก University of Turin ประเทศอิตาลี ขณะกำลังศึกษาอยู่เขาอุทิศเวลาถึง 2 ปี เต็มให้กับความรู้ทางคณิตศาสตร์ซึ่งเป็นพื้นฐานสำคัญที่ทำให้ประสบ ความสำเร็จทางวิชาการในเวลาต่อมา  เขาทำงานเป็นวิศวกร ระหว่างปี 1870- 1893 และใช้เวลาว่างศึกษาวิชาปรัชญาและการปกครอง เขาสร้างชื่อเสียงจาก Law of income distribution ที่ได้จากการนำสูตรทางคณิตศาสตร์มาอธิบายลักษณะการกระจายรายได้ โดยเขาพบว่า การกระจายตัวของรายได้ของผู้คนในอิตาลีไม่เป็นการกระจายแบบสุ่ม (Random) หากแต่การกระจายดังกล่าวเป็นรูปแบบเฉพาะที่ชัดเจนและปรากฎรูปแบบดังกล่าวมาตั้งแต่ในอดีต และพบว่าลักษณะการกระจายดังกล่าวได้ปรากฎอยู่ทั่วไปในทุกๆประเทศทั่วโลก

หลังจากที่ Vilfredo Pareto ค้นพบว่า คนรวยในอิตาลีเพียงไม่กี่คนเป็นเจ้าของทรัพย์สินส่วนใหญ่ในประเทศ แต่คนที่เหลือส่วนใหญ่อีกหลายล้านคนกลับมีทรัพย์สินรวมกันเป็นส่วนน้อยเท่านั้น เช่นเดียวกันครับ รายได้ส่วนใหญ่ของประเทศเกิดจากเจ้าของกิจการเพียงไม่กี่รายเท่านั้น ด้วยเหตุนี้เขาจึงให้นิยามปรากฏการณ์ดังกล่าวว่า "Vital Few Trivial Many"

 

 

เวลาผ่านไปนักสถิติก็พบว่านิยามของ Vifredo มิได้เกิดขึ้นกับเรื่องของรายได้เพียงอย่างเดียว หากแต่พบว่าในปัญหาทั่วๆไป มักมีสาเหตุที่สำคัญเพียงไม่กี่สาเหตุที่ทำให้เกิดปัญหาขึ้น ในขณะที่สาเหตุอื่นๆอีกมากมายไม่ได้ส่งผลกระทบต่อปัญหานั้นๆมานัก ดังนั้นนักสถิติรุ่นต่อมาจึงได้เสนอแผนภาพตัวหนึ่งซึ่งมีแกน Y แทน ค่าความถี่ และ แกน X แทนประเภทของประชากร และเรียกมันว่า Pareto Chart

ข้อกำหนดในการใช้ Pareto chart

1.  กราฟที่ใช้จะเป็นกราฟแท่ง โดยที่แท่งที่สูงที่สุดอยู่ทางซ้ายมือ และ อันดับต่อไปจะเรียงลำดับไปทางขวามือเสมอ

2. แท่งที่อยู่ในกลุ่มสูง ควรมีจำนวนประมาณ 20% ของจำนวนแท่งทั้งหมด โดยมีค่าหรือความถี่รวมกันประมาณ 80% 

3. เมื่อเก็บข้อมูลแล้วให้ทดลองเขียนกราฟทุกครั้ง หากปรากฏว่า แท่งที่อยู่ในกลุ่มซ้ายมือ มีการเปลี่ยนอันดับไปมา ให้เก็บข้อมูลต่อไปเรื่อยๆ จนกว่าจะไม่มีการเปลี่ยนอันดับ และเป็นไปตามข้อกำหนดข้อสอง  นั่นหมายถึงเราสามารถใช้ Pareto chart เพื่อบอกว่า Process ใดๆว่า เสถียร (Stable) หรือยัง ได้อีกด้วย

ตัวอย่างการประยุกต์ใช้ Pareto chart

วิศวกร ได้ทำการเก็บข้อมูลเรื่องลักษณะทางกายภาพของงานเสียที่เกิดจากเครื่องจักร เครื่องหนึ่ง ติดต่อกันเป็นเวลา 10 วัน โดยมีการบันทึกข้อมูลที่พบเก็บไว้ทุกวันเป็นดังตาราง

Scratch

287

Broken

178

Poor painting

60

Light color

32

Burned

19

Size out of specification

14

Thickness

11

Contamination

3

Others

2

 

เมื่อนำข้อมูลมาพล้อตด้วยกราฟแท่ง เราจะได้ Pareto chart ดังนี้

 

 

จากกราฟ จะเห็นว่าอาการของปัญหา สองปัญหาแรกเป็นสาเหตุที่ทำให้เกิดงานเสียรวมกัน 76.7 % ปัญหาที่เหลือเป็นเพียงส่วนน้อยเท่านั้น สาระที่ได้จาก Pareto chart นี้คือ ผู้ที่รับผิดชอบจะต้องดำเนินการเพื่อลดปัญหาสองอย่างนี้ให้ได้เสียก่อน เพราะถือว่ามีความจำเป็นเร่งด่วน เพียงแค่สามารถลดปัญหาทั้งสองลงได้แค่ครึ่งเดียวของแต่ละปัญหา ก็สามารถลดปริมาณงานเสียรวมลงได้กว่า 40% ทีเดียว

ความเข้าใจผิดในการใช้ Pareto chart 

 1. ใช้ Pareto chart อธิบายข้อมูลที่ไม่มีการเปลี่ยนแปลง ดังรูปต่อไปนี้เป็นกราฟที่อธิบายจำนวนพนักงานแต่ละแผนกของบริษัทแห่งหนึ่ง

 

 

จากรูปข้างบนนี้ จำนวนพนักงานแต่ละฝ่ายของบริษัท ไม่เป็นข้อมูลที่เปลี่ยนแปลง หมายความว่า เก็บข้อมูลยังไงตัวเลขนี้ก็จะไม่เปลี่ยนแปลง กราฟที่แสดงนี้จึงเป็นกราฟแท่งธรรมดาเท่านั้น ไม่ถือว่าเป็น Pareto chart

2. ข้อมูลยังไม่สามารถแบ่งแยกกลุ่ม ได้ชัดเจน ดังรูปตัวอย่างต่อไปนี้  

 

สาเหตุเพราะหยุดเก็บข้อมูลเร็วเกินไป  จะต้องดำเนินการเก็บข้อมูลต่อไปเรื่อยๆ     หรือไม่ก็ Process ในการผลิตยังไม่นิ่ง (Unstable) มีการเปลี่ยนแปลงไปมามาก จำเป็นต้องแก้ไขให้นิ่งเสียก่อน โดยการหยุดทำการเปลี่ยนแปลงใดๆในช่วงนี้  (เป็นเพียงข้อเสนอแนะจากประสบการณ์ของผู้เขียนเท่านั้น)

 Time Series Plot

เป็นกราฟที่แสดงค่าในกระบวนการ( Process ) ใดๆ โดยเทียบกับเวลาที่เปลี่ยนแปลงไปเรื่อยๆ  ใช้เพื่อบ่งบอกสถานะของสิ่งที่เราสนใจ เทียบกับเวลา มีประโยชน์ในการดูความเปลี่ยนแปลงของกระบวนการ เช่น กระบวนการผลิต การติดตามอาการของคนไข้ เป็นต้น

 

 

จากกราฟตัวอย่างข้างบนนี้  เป็นการบันทึกค่าแรงดันในท่อส่งก้าซธรรมชาติ จากแหล่งจ่าย เพื่อส่งเข้าสู่เครื่องกำเนิดไฟฟ้ากังหันก้าซ ในโรงผลิตไฟฟ้าแห่งหนึ่ง สาระที่เราควรจะหาจากการใช้ Time series plot คือ เกิดอาการผิดปกติ ณ เวลาใด  จากตัวอย่างกราฟข้างบนนี้ ก่อนบันทึกข้อมูล วิศวกรพบว่าเกิดปัญหาในระบบความร้อนขึ้นบ่อยๆ แต่ยังไม่อาจจะหาสาเหตุได้ จนเมื่อทำการบันทึกข้อมูล แล้วพบว่า เป็นช่วงเวลาเดียวกับที่ช่วงแรงดันในท่อส่งก้าซตกลงผิดปกติใน ชั่วโมงที่ 3,16 และ 28 พอดี แสดงว่า สาเหตน่าจะเป็นเพราะ แรงดันก้าซตกลง แต่เพราะอะไรที่ทำให้แรงดันตกลง ก็สามารถนำข้อมูลจากกราฟนี้ไปสืบสวนหา ว่า ณ ชั่วโมงที่ 3,16 และ 28 มีการทำอะไรกับระบบส่งท่อก้าซ หรือไม่   นี่คือตัวอย่างการนำกราฟ Time series plot ไปใช้ประโยชน์

กราฟในกลุ่ม Time Series Plot มีหลายอย่าง ยกตัวอย่าง เช่น Statistic Process Control  Chart  ( SPC Chart ) ก็เป็นหนึ่งใน Time series plot

 

Scatter Plot

จากที่ผ่านมา เป็นกราฟที่แสดงข้อมูลเพียงหนึ่งตัวแปรเท่านั้น (Univariated data plot)  แต่ในบางครั้งเวลาเราจำเป็นที่จะต้องศึกษาตัวแปรสองตัว พร้อมๆกัน เช่น อาจจะศึกษาความสัมพันธ์ของตัวแปรสองตัว ข้อมูลที่เราได้จากการศึกษาก็จะมีสองข้อมูล (Bivariated data) หากเราจำเป็นที่สร้างกราฟเพื่อดูความสัมพันธ์ เราจะใช้ Scatter plot

Scatter plot เป็นกราฟ ที่นำเอาจุดตัดกันของค่าในแนวแกน X และแกน Y ของทั้งสองข้อมูลมาแสดง 

ตัวอย่าง  วิศวกร ได้บันทึกอัตราส่วนระหว่างปริมาณสารเคลือบผิวและเนื้อโลหะที่สูญหายไป (Ratio) เมื่อทำการเปลี่ยนอุณหภูมิของถังชุบไป  ได้ข้อมูลดังตารางต่อไปนี้

Data

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

Temp

170

172

173

174

174

175

176

177

180

180

180

180

180

181

181

182

182

182

182

184

184

185

186

188

Ratio

0.84

0.91

1.02

1.03

1.07

1.08

1.04

1.18

1.45

1.6

1.61

1.63

1.75

1.84

1.43

1.9

1.81

1.94

2.08

1.79

2.32

3

2.87

3.08

เมื่อนำข้อมูลมาทำ  Scatter plot  จะได้ดังต่อไปนี้

 

 

ในกรณีนี้จะพบว่า Ratio จะแปรเปลี่ยนไปเมื่อ Temp เปลี่ยนไป เราสามารถอธิบายได้ว่า Temp เป็นปัจจัยที่ส่งผลต่อ Ratio   ซึ่ง แน่นอนว่าใน Process นี้อาจจะมีปัจจัยอื่นๆอีกที่ส่งผลต่อ Ratio แต่ตามตัวอย่างนี้เราต้องการศึกษาเฉพาะ Temp.  หากว่าระดับความสัมพันธ์ของ Ratio และ Temp มีสูง ลักษณะการเรียงตัวของจุดตัด จะมีแนวโน้มเป็น เส้นตรงมากขึ้น 

บางครั้งเราสามารถใช้ ปัจจัย(Factor) ที่มีผลต่อ ตัวแปรอีกฝ่ายเป็นตัวคาดการณ์ค่าของตัวแปรดังกล่าวได้ ในตัวอย่างนี้เราใช้ Temp เป็นตัวคาดการณ์ค่า Ratio ได้  เช่น ถ้าปรับ Temp. ให้เป็น 190 C ค่า Ratio จะประมาณ  3.5  เป็นต้น  เราจึกเรียก Temp ว่า Predictor และเรียก ตัวแปรที่ถูกคาดการณ์ดังกล่าว Response.  เราจะให้แนวแกน X เป็น Predictor และให้แนวแกน Y เป็น Response เสมอ   ในกรณีนี้ Ratio ไม่อาจจะใช้เป็น Predictor ได้เลย เพราะโดยธรรมชาติของมัน Temp จะเป็นตัวที่มีผลกระทบ ต่อ Ratio ฝ่ายเดียว โดยที่ Ratio ไม่มีโอกาสเป็นตัวที่มีผลกระทบต่อ Temp ได้เลย

แต่ในบางกรณี ทั้งสองข้อมูลอาจไม่จำเป็นต้องเป็นปัจจัยที่สงผลกระทบต่ออีกฝ่ายหนึ่งก็ได้ ดังตัวอย่างต่อไปนี้

ตัวอย่าง  ผลการวัดค่าอุณหภูมิ ของถังชุบดังตัวอย่างข้างบนนี้ โดยใช้ระบบการวัดที่แตกต่างกัน 2 ระบบพร้อมกัน  ค่าที่ได้จากแต่ละระบบการวัดเป็นดั่งตารางต่อไปนี้ 

Measurement A

47

62

65

70

70

78

95

100

114

118

124

127

140

140

140

150

152

164

198

221

Measurement B

38

62

53

67

84

79

93

106

117

116

127

114

134

139

142

170

149

154

200

215

เมื่อนำข้อมูลมาทำ  Scatter plot  จะได้ดังต่อไปนี้

จะเห็นว่า กรณีตัวอย่างนี้ไม่เหมือนกับตัวอย่างแรก เพราะ Measurement A หรือ B ต่างก็อิสระต่อกัน ไม่ได้เป็น เหตุหรือผล ต่อกันและกัน จึงไม่มี Predictor หรือ Respones นั่นแปลว่า เราสามารถสลับข้อมูลในแนวแกน X หรือ แกน Y ในการทำ Scatter plot  หากระบบการวัดทั้งสองให้ค่าวัดได้ตรงกัน แนวของจุดตัดจะเรียงกันเป็นเส้นตรง และมีค่าความเอียง 45 องศาพอดี  แต่ผลจากการใช้ Scatter plot สามารถชี้ให้เห็นว่า เกิดความแตกต่างกันขึ้น ระหว่างระบบการวัดสองระบบ แล้วจะต้องเลือกใช้ระบบไหนถึงจะถูกต้องที่สุด หรือความแตกต่างดังกล่าว สามารถยอมรับได้หรือไม่  นั่นคือสิ่งที่จะต้องหาคำตอบต่อไป

 

กรณีศึกษาที่น่าคิด

การที่เราเลือกที่จะใช้กราฟประเภทไหนอย่าลืมนึกถึง ความถูกต้อง ใช้ให้ถูกต้อง โปรดดูกรณีเปรียบเทียบดังต่อไปนี้

วิศวกร ได้นำเสนอรายงานเกี่ยวกับเครื่องจักรที่เขาเองรับผิดชอบ  หัวข้อที่กำลังนำเสนอเรื่องแรกคือ ข้อมูลการหยุดทำงานของเครื่องจักร Down time โดยเขาเลือก ที่จะใช้กราฟเส้น ดังรูปตัวอย่างต่อไปนี้

 

 

เป็นการเลือกกราฟที่ผิดชนิดอย่างมาก เพราะเหตุคือ กราฟที่เขาใช้เป็น Time Series Plot ประเภทหนึ่ง ซึ่งจะใช้ได้ก็ต่อเมื่อ แกน X เป็นข้อมูลเวลา และให้ความรู้สึกว่าแต่ละหน่วยในแกน X ต้องมีความสัมพันธ์กัน เช่น เวลา สัมพันธ์กัน คือเวลาทางขวามือจะเกิดขึ้นตามเวลาทางซ้ายมือเสมอ   แต่กรณีนี้ แกน X เป็น หมายเลขประจำตัวเครื่อง  แต่ละหมายเลขเครื่องไม่สัมพันธ์กัน หรืออิสระต่อกัน  ดังนั้นเมื่อเชื่อมโยงแต่ละจุดเข้าด้วยกันเป็นกราฟเส้นต่อเนื่อง จึงไม่มีสาระเลย

 ถ้าข้อมูลข้างบนเปลี่ยนมาใช้กราฟแท่ง จะเป็นแบบนี้

 

 

เพราะกราฟแท่ง ให้ความรู้สึกอิสระ ใน แกน  X  เพราะแต่ข้อมูลในกรณีนี้ ไม่ได้ผูกพันธ์กัน เป็นอิสระต่อกัน  

 


[ HOME ]             [ CONTENTS ]  

Hosted by www.Geocities.ws

1