ตัวอย่างการประยุกต์ใช้ Simple Linear Regression Analysis ผู้เขียนอยากจะยกตัวอย่างให้เห็นภาพวิธีการนำไปประยุกต์ใช้งาน ซึ่งจริงๆเวลาใช้งาน เรามักจะใช้ Software ช่วยในการคำนวณ ขั้นตอนก็จะรวบรัดมากกว่าที่ได้กล่าวในหัวข้อที่ผ่านมา นั่นเพราะว่าในการนำทฤษฎีอะไรก็ตามไปใช้งานจริงๆ เราก็ไม่จำเป็นต้องแสดงวิธีคิด หรือขั้นตอนอย่างละเอียด แต่นั่นต้องพึงระลึกอยู่เสมอว่า เราต้องมีความเข้าใจในทฤษฎี ซึ่งจะทำให้เราเข้าใจเหตุและผลของสิ่งที่ได้ ตัวอย่าง นักวิจัยการตลาดคนหนึ่งกำลังสำรวจข้อมูล ราคาเช่าต่อเดือนของอาคารชุดประเภทคอนโดมิเนี่ยม ในเขตใกล้เคียงกับถนนศรีนครินทร์ ในช่วงที่อยู่ในเขตกรุงเทพมหานคร โดยการสำรวจได้เก็บตัวอย่าง โดยใช้อัตราค่าเช่าห้องต่อเดือน และขนาดของห้อง เป็นเกณฑ์ โดยได้ข้อมูลมาดังตารางต่อไปนี้ (ตัวเลขสมมติ)
เมื่อเราได้ข้อมูลมาดังในตาราง เราจะเริ่มการพิสูจน์ข้อมูลโดยใช้กราฟ Scatter plot จากกราฟที่ได้พอที่จะบอกได้ว่า พื้นที่กับค่าเช่าต่อเดือนมีความสัมพันธ์กัน จริงๆแล้วในโลกแห่งความเป็นจริง ก็ต้องเป็นเช่นนั้น เพราะหากกราฟไม่ได้บอกว่า พื้นที่กับค่าเช่า ไม่มีความสัมพันธ์กันเลยนั่น จะเป็นเรื่องผิดปกติ แสดงว่าการได้ข้อมูลมาอาจจะผิด ผู้เขียนกำลังต้องการจะสื่อว่าคนที่กำลังจะวิเคราะห์ข้อมูลจำเป็นต้องมี Sense แห่งความเป็นจริง และต้องตรวจสอบหากเห็นความผิดปกติ ซึ่งอาจจะมาจากการบันทึกหรือใส่ข้อมูลผิดพลาด หรือไม่ก็เก็บข้อมูลไม่เป็นไปตามหลักการที่ถูกต้อง เช่น ไปเก็บข้อมูลของหอพักนักศึกษา มารวมกับข้อมูลจากคอนโดมิเนี่ยม หรือไปเก็บจากตัวอย่างแถวๆ ถนนสุขุมวิทบริเวณอโศก มาเทียบกับแถวศรีนครินทร์ ย่านสวนหลวง เพราะปัจจัยดังกล่าวมีผลต่อตัวแปรตาม (ค่าเช่าห้องต่อเดือน) อย่างมาก แม้พื้นที่จะไม่ต่างกันนักก็ตาม ใช้ Software ทำการประมวลผล ในกรณีนี้ผู้เขียนขอใช้ Microsoft Excel เทียบกับ Minitab แล้วทำการสรุปผล เริ่มจาก Microsoft Excel
เมื่อดูข้อมูลจาก 2 ตารางที่ได้จากโปรแกรม Microsoft Excel เราจะได้สมการ Regression ดังนี้ ค่าเช่าต่อเดือน = -2487.47 + 214.52 x พื้นที่ห้อง ทั้งนี้เพราะจากตารางที่ 1 ค่า P-Value ของค่าคงที่ และ สัมประสิทธิ์ของตัวแปรต้น(พื้นที่) มีค่าน้อยกว่า 0.05 ทั้งคู่ (กรณีนี้ใช้ค่าความเชื่อมั่นที่ 95%) ทำให้ไม่สามารถละทิ้งได้ เมื่อดูจากตารางที่ 2 ก็จะเห็นว่า ค่า R2 และ R2 Adjust ก็ผ่านเกณฑ์ทั้งคู่ จึงเชื่อได้ว่า ตัวแปรต้นและตัวแปรตาม ในการทดลองครั้งนี้มีความสัมพันธ์ต่อกัน แน่นอน แต่จะเป็นแบบเชิงเส้นหรือไม่ ต้องวิเคราะห์ต่อไปจาก ANOVA Table
จากตาราง ANOVA ที่ได้ เราจะเห็นว่า Regression มีค่ามากกว่า Residual (Error) ถึง 235.9 เท่า นั่นแสดงว่าสาระส่วนใหญ่ที่ได้หากนำสมการนี้ไปใช้ ก็จะเป็น Regression มากกว่า Error หรือดูจากค่า P-Value ที่ถือได้ว่าเป็น 0 แสดงว่า สมการที่ได้มีความสัมพันธ์กันแบบเชิงเส้น (ปฎิเสธสมมติฐานที่ว่า สมการไม่ได้มีความสัมพันธ์กันแบบเชิงเส้น)
เมื่อเรา Verify ข้อมูล โดยใช้กราฟ 3 ข้อมูล ก็ยืนยันว่าข้อมูลที่เก็บมานั้นผ่านเกณฑ์หรือเงื่อนไขที่สำคัญ ถ้าใช้ โปรแกรม Minitab จะได้ผลการวิเคราะห์ดังนี้ Regression Analysis: Rent versus Area The regression equation is Rent = - 2487 + 215 Area
Predictor Coef SE Coef T P Constant -2487.5 455.8 -5.46 0.000 Area 214.52 13.97 15.36 0.000
S = 296.590 R-Sq = 96.3% R-Sq(adj) = 95.9%
Analysis of Variance Source DF SS MS F P Regression 1 20755127 20755127 235.95 0.000 Residual Error 9 791691 87966 Total 10 21546818
มาถึงตรงนี้การวิเคราะห์ Regression ก็เสร็จสิ้น แล้วเราจะนำอะไรไปใช้ และใช้ได้อย่างไร เราจะนำสมการ Regression ที่ได้ไปใช้ประโยชน์ ยกตัวอย่าง พนักงานรายนี้จะใช้ข้อมูลดังกล่าวนำเสนอผู้บริหาร โดยนำสมการไปใช้คำนวณหาค่าเช่าที่จะกำหนด เพื่อให้ผู้บริหารตัดสินใจว่า ถ้าจะสร้างห้องขนาดเท่าที่ผู้บริหารกำหนดไว้นั้น ควรจะเก็บค่าเข่าเดือนละเท่าใด โดยเขาทำเป็นตารางดังตัวอย่างต่อไปนี้
โดยใช้สมการ ค่าเช่าต่อเดือน = -2487.47 + 214.52 x พื้นที่ห้อง จะเห็นว่า เขาสามารถที่จะประมาณได้ว่า ห้องที่มีขนาดพื้นที่แตกต่างกัน ควรจะจะกำหนดราคาเช่าต่อเดือนเท่าใด ทั้งๆที่ ข้อมูลในตารางนี้เขาไม่ได้เก็บข้อมูลมาก่อน แต่เมื่อเขามีสมการความสัมพันธ์ระหว่าง พื้นที่ห้องกับค่าเช่ารายเดือน เขาก็สามารถที่จะนำไปใช้คาดการณ์ได้
|