ประเภทของข้อมูล (Data Type) ãนการที่เราจะศึกษาเกี่ยวกับข้อมูล เราจำเป็นที่จะต้องแยกประเภทของข้อมูลให้ได้ก่อน เพื่อที่จะทำความเข้าใจธรรมชาติของข้อมูลประเภทนั้นๆ และเพื่อให้เราสามารถที่จะเลือกใช้เครื่องมือทางสถิติที่เหมาะสมในการวิเคราะห์หรืออธิบายข้อมูลนั้นๆ เราสามารถแบ่งประเภทของข้อมูลได้ดังต่อไปนÕé ข้อมูลเชิงคุณภาพ (Qualitative or Attribute Data) เป็นข้อมูลที่ไม่สามารถวัดด้วยอุปกรณ์การวัดใดๆ ได้เลย แต่ได้มาจากการนับ การสังเกตุ เราจึงนิยามชนิดของข้อมูลที่ได้ว่าเป็นข้อมูลเชิงคุณภาพ แบ่งได้เป็นสองลักษณะย่อยได้ดังนี้
- สัญชาติ : ไทย 13.4% อเมริกัน 7.9% ญี่ปุ่น 7.3% จีน 5.4% อินเดีย 3.4 % - ÀÒáԨ : ท่องเที่ยว 56.5% ธุรกิจ 34.5% การศึกษา 4.5% - เพศ : ชาย 67.3% หญิง 32.7% จากตัวอย่าง จะเห็นว่า สัญชาติ ÀÒáԨ เพศ เป็นลักษณะของข้อมูลที่เราเก็บจากการศึกษาเป็นข้อมูลขั้นแรก หรือปฐมภูมิ (Primary) ในขณะที่ ไทย อเมริกัน ญี่ปุ่น จีน อินเดีย ท่องเที่ยว ¸ØáԨ การศึกษา ชาย และ หญิง เป็นข้อมูลขั้นทุติยภูมิ (Secondary) ส่วนตัวเลขคือค่าที่ได้จากการศึกษา หรือถ้าเป็นตัวอย่างในงานอุตสาหกรรมดังต่อไปนี้ เป็นผลการศึกษา การทำงานของ Hard disk ที่ผ่านการผลิตแล้วจำนวน 1,000 หน่วย - ผลการทดสอบ¿Ñ§ชั่น (Functional test) : ผ่าน (Pass) 700 unit ไม่ผ่าน (Fail) 300 unit - อาการปัญหา (Defect) : เป็นรอยขีดข่วน (Scratch) 45.5% หักหรืองอ (Bent) 30.5% มีคราบสกปรก (Contamination) 23.0% เช่นเดียวกันกับตัวอย่างแรก ข้อมูลที่เก็บมาได้ เป็นข้อมูลเชิงคุณภาพ ถึงแม้ว่าการเก็บข้อมูลตามตัวอย่างที่สองจะใช้เครื่องมือช่วยก็ตาม เช่น การทดสอบ¿Ñ§ªÑ¹การทำงาน จะใช้เครื่องทดสอบโดยเฉพาะ แต่ลักษณะ ผลการทดสอบ แค่รายงานว่า ผ่าน หรือไม่ผ่าน การทดสอบ เราก็ถือว่าเป็นข้อมูลเชิงคุณภาพอยู่ดี ถ้าÊѧࡵดีๆ เราจะพบว่าข้อมูลบางชนิด แยกย่อยได้มากกว่าสองลักษณะ (Category) เช่น สัญชาติ หรือ อาการของปัญหา แต่บางชนิดแบ่งได้เพียงสองกลุ่ม เช่น เพศ ผลการทดสอบ เป็นต้น
ผลการสำรวจความคิดเห็นต่อนโยบายจัดระเบียบสังคมของรัฐบาล ออกมาเป็นลักษณะดังนี้ - ความเห็น : เห็นด้วย อย่างยิ่ง 55.5% เห็นด้วย 30.% ไม่ออกความคิดเห็น 5% ไม่เห็นด้วย 5% ไม่เห็นด้วยอย่างยิ่ง 4.5% - ระดับการศึกษา : มัธยม 12% อนุปริญญา 23% ปริญญาตรี 40 % ปริญญาโท 20% ปริญญาเอก 5% จะเห็นว่าข้อมูลที่เก็บมานั้น มีอันดับ อย่างชัดเจน นี่คือความแตกต่างของ¢éÍมูล Nominal กับ Ordinal
ข้อมูลเชิงปริมาณ (Quantitative or Variable data) คือข้อมูลที่มีลักษณะเป็นตัวเลข สามารถแบ่งออกได้อีกเป็นสองชนิดย่อย ดังนี้
- จำนวนครั้งที่เครื่องจักรหยุดทำงาน วันนี้ เท่ากับ 12 ครั้ง - พบจุดบกพร่องในงานที่เพิ่งผลิตเสร็จ 9 จุด จากตัวอย่างเราจะเห็นว่า จำนวน หรือตัวเลขจะไม่มีทางที่เป็นทศนิยมได้เลย ถึงแม้ว่าบางครั้งจะนำค่าข้อมูลเหล่านี้หลายค่า มาหาค่าเฉลี่ยได้ค่าที่มีทศนิยมก็ตาม ค่านั้นก็จะไม่มีจริง หรือไม่มีความหมายใดๆ หรือดูค่าจากตัวอย่างต่อไป¹Õéแล้วลองเปรียบà·Õºกับสองตัวอย่างข้างบน - เขาขายสินค้าได้เงิน 1,000.50 บาท ถึงแม้ว่าจำนวนเงินจะมีทศนิยมละเอียดแค่ไหนก็ตาม ค่าในชีวิตจริง หน่วยย่อยของเงินก็มีได้แค่ 0.75 , 0.50 และ 0.25 บาทเท่านั้น
- อุณหภูมิห้อง ขณะนี้ 27.5 องศาเซลเซียส - น้ำหนักของวัสดุชิ้นนี้ 23.45 กรัม จากสองตัวอย่างที่ผ่านมา อุณหภูมิ ต้องวัดโดย เทอร์โมมิเตอร์ หรือระบบการวัดอุณหภูมิ อย่างแน่นอนเพราะเรามิอาจรับรู้ค่าอุณหภูมิได้เอง และค่าน้ำหนัก เราก็ต้องวัดโดยเครื่องชั่งน้ำหนัก หรือระบบอื่นๆ ที่ออกแบบมาให้วัดค่าน้ำหนักได้ นั่นคือลักษณะอย่างแรก ส่วนลักษณะที่สองคือ คุณสมบัติของค่าเหล่านี้ เช่น 27.505 องศาจะสูงกว่า 27.500 องศาแน่นอน แลก่อนจะไปถึงค่า 27.505 ได้อุณหภูมิจะต้องเพิ่มไปเรื่อยๆ ไม่ใช่กระโดดไปค่าใหม่ได้ทันที แต่ในชีวิตจริงที่เราเห็นอุณหภูมิ เปลี่ยนไปที่ 0.005 องศา ก็เพราะว่าความจำกัดของระบบ การวัด และวิธีแสดงผล ของระบบการวัดเท่านั้นเอง
|