7 Analisis Berstatistik
Lanjutan
Korelasi dan regresi merujuk kepada
perhubungan yang wujud diantara dua pemboleh ubah X dan Y, dimana bagi setiap
nilai Xi dibandingkan dengan
setiap nilai Yi. Contohnya; ukuran ketinggian manusia dibandingkan dengan ukuran
berat; tempoh masa belajar pelajar bagi matapelajaran statistiks untuk
menghadapi ujian dengan pencapaian pelajar keatas ujian; tempoh masa pelajar
didapati melelapkan mata dan berkhayal ketika kuliah statistiks sebelum ujian dengan
pencapaian keatas ujian dan sebagainya.
Kenyataan sebegini menunjukkan variasi kepada tema
perhubungan fungsi kuantitatif. Lebih
banyak pembolehubah dinyatakan bagi X , lebih banyak dinyatakan mengenai Y atau
pun lebih tinggi seseorang itu lebih berat seseorang terebut, lebih lama
pelajar tekun belajar lebih baik pencapaian mereka didalam ujian, lebih banyak
pelajar berkhayal didalam kuliah lebih rendah pencapaian dan kebolehan mereka
didalam ujian. Didalam kes pertama kita bercakap mengenai
korelasi positif diantara dua pembolehubah sementara kes kedua (lebih yang ini,
kurang yang itu) kita bercakap mengenai korelasi negatif diantara dua
pembolehubah.
Korelasi dan regresi adalah umpama permukaan depan belakang duit syiling.
Secara logiknya anda boleh memulakan pada permukaan depan atau permukaan
belakang. Ujian inferensi yang
paling mudah boleh digunakan apabila membandingkan purata pencapaian dua
kumpulan dalam satu ukuran adalah ujian t. Contohnya anda mungkin hendak
membandingkan skoran matematik bagi murid lelaki dan perempuan di Tahap 2 atau
samada perbezaan terdapat pada kumpulan program dengan kumpulan kawalan. Apabilan anda ingin
membuat purata perbandingan diantara dua kumpulan yang dinyatakan maka bolehlah
digunakan ujian t yang dinyatakan.
Kebanyakan model statistik inferen
dikenali dengan nama Ujian Model Linear. Ujian model linear termasuklah ujian t, analisis varians (ANOVA), analisis
ko-varians (ANCOVA), analisis regresi dan lain-lain kaedah multivariate seperti
analisis factor, skala pelbagai-dimensi, analisis kelompok, analisis fungsi
dsikriminan dan sebagainya.
Di akhir bab ini, anda seharusnya dapat
:
i)
mengenalpasti teknik berkaitan untuk
menghadapi masalah statistic
ii) boleh
menyelesaikan masalah statistic dengan mengunakan kaedah analisa statistic yang
betul
iii) memahami
beberapa kaedah analisis statistik
iv)
boleh menginterpretasi dan membuat laporan keputusan analisis.
7.1 Analisis Korelasi
Salah satu kegunaan
statistiks adalah untuk membuat perbandingan diantara dua set informasi yang
berlainan yang mungkin berkaitan atau berhubungkait. Persoalan mengenai apa
yang kita sedang kita hadapi ini dalam istilah statistic dipanggil korelasi., iaitu perhubungan diantara
dua nilai berlainan dalam satu set data dengan set data yang lain, dimana
sekiranya nilai bagi set pertama itu meningkat , nilai bagi set kedua juga
mungkin meningkat atau menurun (jika dalam kes korelasi negative)
Kita
ambil contoh didalam satu kelas bahasa. Seorang guru telah pun menyiapkan pemarkahan bagi
ujian yang telah beliau jalankan, beliau sudah pun memberi markah kepada setiap
murid didalam kelas ujian tersebut. Kemudian beliau menjalankan satu
lagi ujian bahasa, kini beliau mempunyai dua set markah ujian yang telah beliau
jalankan bagi setiap murid yang telah mengambil ujian tersebut.
Guru tersebut ingin mengetahui samada murid-murid yang lulus dengan baik pada ujian pertama juga lulus dengan baik pada ujian kedua atau tidak atau samada adakah hubungkait diantara kedua-dua ujian tersebut. Pada kebiasaanya keputusan yang dijangkakan adalah berkaitan rapat. Sudah tentu kita akan menyangka dan beranggapan bahawa murid yang lulus dengan baik pada ujian pertama juga akan lulus dengan baik dalam ujian kedua iaitu korelasi postif dan begitu juga jika murid gagal dalam ujian pertama kita beranggapan mereka juga akan turut gagal dalam ujian kedua. Begitu juga kita akan beranggapan, bahawa, jika anda selalu menjalankan aktiviti senaman anda sudah pasti akan lebih sihat dari yang tidak bersenam.
Tetapi didalam banyak hal, anggapan kita
itu ternyata tidak benar dan tentunya kita akan
berminat untuk mengetahui bukan sahaja terdapat korelasi atau tidak tetapi
ingin mengetahui kekuatan korelasi yang dinyatakan.
Dalam
mengambilkira hubungan korelasi ini, kita mengenalpasti tiga kemungkinan. Dua pembolehubah iaitu dua set data yang kita
bandingkan seperti senaman dan system kardiovaskular mungkin menunjukkan
korelasi positif. Yang bermaksud, apabila nilai data set pertama meningkat,
nilai data set kedua juga turut meningkat.
Ataupun bagi murid-murid yang lulus dengan baik
pada ujian pertama mungkin mendapat skoran yang rendah pada ujian kedua yang
menunjukkan korelasi negative. Atau mungkin tiada langsung korelasi yang
ditunjukkan yang bermaskud kedua-dua set data tersebut tidak ada hubungan atau
hubungkait.
Korelasi seperti
yang kita akan lihat boleh menjadi kuat atau lemah
yang bermaksud hubungan diantara nilai dua set data boleh menjadi signifikan
atau tidak signifikan. Sesuatu korelasi boleh menjadi tepat di mana setiap
perubahan pada satu set nilai menunjukkan perubahan tepat dengan nilai set data
kedua.
Korelasi adalah alat
analisis yang mustahak yang membolehkan kita mengasingkan dan membetulkan
kenyataan mengenai hubungkaitan yang mungkin benar atau tidak
: kadar merokok dengan kadar dijangkiti kanker, kesan jangkitan HIV dengan kadar dihidapi
penyakit AIDS, usia kereta dengan nilai sekarang, ujian IQ dengan kadar
pendapatan bulanan, kebijaksanaan dengan keturunan, usia dengan tahap kemahiran
dan sebagainya. Prinsip korelasi membolehkan kita membuat
penyiasatan samada kenyataan yang dinyatakan difahami dan membolehkan kita
membuat pengukuran terhadap kenyataan yang telah dinyatakan.
Mungkin anda boleh
menyatakan secara logic mengenai perkara dibawah samada terdapat hubungan
korelasi diantara dua set data tersebut samada positif, negative, tepat atau
sifar.
a)
ketinggian
dalam centimeter dengan ketinggian dalam inci;
b)
tahap
pendapatan bulanan dengan tahap perbelanjaan bulanan;
c)
usia
kenderaan dengan nilai semasa;
d)
dua
balingan buah dadu serentak;
e)
hujan
lebat dengan kehadiran kesekolah;
f)
kebolehan
melihat didalam gelap dengan kebolehan memakan;
g)
kadar
menghisap rokok dalam sehari dengan tahap kesihatan;
h)
ketinggian
dengan berat murid-murid di sekolah;
i)
kadar
pengunaan kalori dalam pemakanan dengan berat badan;
j)
umur
dengan kekuatan fizikal warga emas
Korelasi di dalam
statistik bermaksud ,
sesuatu pengukuran kekuatan perhubungan diantara dua pembolehubah. Ia digunakan untuk
meramal nilai satu pembolehubah dengan satu pembolehubah yang lain. Contohnya, satu korelasi boleh dikaitkan dengan jarak lokasi satu
sekolah di satu daerah dengan bekalan kertas ujian yang disimpan di pusat bilik
kebal di daerah tersebut. Ia dinyatakan dalam
skala dari -1.0 to +1.0, bagi menyatakan kekuatan korelasi.
Didalam teori kebarangkalian
dan statistic, korelasi juga dikenali dengan nama
korelasi pekali. Korelasi Pekali adalah pengukuran kekuatan numerik perhubungan
linear diantara dua
pembolehubah rawak. Beberapa kaedah pekali boleh digunakan
dalam situasi berbeza. Yang sering dan kerap digunakan adalah Korelasi
Pearson.
7.1.1 Hubungan Linear dan Pekali Korelasi
Pekali korelasi
linear adalah nombor diantara -1 dan 1 yang mengukur berapa rapatnya garisan
lurus dengan set kumpulan titik berada. Lagi dekat nilai sifar korelasi pekali,
lagi kuranglah titik kumpulan berada di garis lurus ( yang
bermaksud pekali korelasi linear )
Lagi
rapat korelasi pekali kepada nilai 1, lebih banyak titik yang berada
sepanjang garisan lurus kawasan bawah
kiri ke kawasan atas kanan |
Lagi
rapat korelasi pekali kepada nilai -1, lebih banyak titik berada disepanjang
garisan lurus kawasan atas kiri ke kawasan bawah kiri. |
|
Satu cara biasa bagi
membolehkan kita memahami maksud korelasi diantara dua pembolehubah diantara
dua set data adalah dengan melukis gambarajah yang mana setiap data di lukiskan
didalam rajah X-Y . Paksi
X mewakili nilai satu pembolehubah dan paksi Y , satu
pembolehubah yang lain. Setiap skoran yang diperolehi dilukiskan
didalam gambarajah tersebut.
Contoh,
kita boleh membina atau melukis rajah bagi nilai Persekolahan dilukiskan pada
paksi X dan nilai Mengambil Bahagian dalam Politik pada paksi Y. Dengan ini,
kita boleh , memastikan di mana responden berada sebenarnya didalam rajah
tersebut dan kita akan mendapat terdapat 20 titik lokasi didalam rajah
tersebut.
Carta
(menggunakan Excel) menunjukkan hasilan keputusan yang dilakarkan. Perhatikan terdapat 20 titik yang
dilakarkan bagi setiap responden.
Perhatikan
terdapat dua orang yang menghadiri persekolahan selama 16 tahun, Empat
responden berada pada skor 9, dua responden pada skor 2 dan sebagainya. Kita menamakan kaedah ilustrasi ini dengan nama rajah serakan.
7.1.2 Pengiraan
Pekali Korelasi Linear
Andaikan data dibawah untuk membuat
pengiraan pekali korelasi linear
n |
|
x |
|
y |
1 |
|
x1 |
|
y1 |
2 |
|
x2 |
|
y2 |
3 |
|
x3 |
|
y3 |
. |
|
. |
|
. |
. |
|
. |
|
. |
. |
|
. |
|
. |
N |
|
xN |
|
yN |
(i) Langkah pertama ialah
pengiraan purata (<x>
and <y>) bagi nilai x dan y :
<x> = 1/N (x1 + x2 + x3 ...+ xN)
<y> = 1/N (y1 + y2 + y3 ...+ yN)
(ii) Kemudian buat pengiraan
sisihan piawai bagi data x dan y :
(iii) Kirakan kovarian bagi
kedua set data :
(iv) Korelasi koefisen
kemudiannya di definisikan dengan :
Contoh 1:
Kirakan korelasi koefisen
bagi data set x dan y berikut :
n |
|
x |
|
y |
1 |
|
1 |
|
4 |
2 |
|
2 |
|
4 |
3 |
|
3 |
|
3 |
4 |
|
4 |
|
2 |
5 |
|
5 |
|
1 |
Dalam hal ini, pembolehubah x (masa) :
(i) Kirakan
<x> dan <y>, purata x
dan purata y:
<x> = 1/5 (1 + 2 + 3 + 4 + 5) = 3.0
<y> = 1/5 (4 + 4 + 3 + 2 + 1) = 2.8
(ii) Kirakan sisihan piawai
bagi x dan y :
(iii) Kirakan kovarian :
(iv) Kirakan
r, korelasi koefisien:
Pekali Kolerasi
Pearson Spearman
Koelasi merumuskan kekuatan perhubungan diantara dua pembolehubah,
tetapi perlu di ingatkan bahawa korelasi bukanlah kerana disebabkan. Kita memerlukan dua
pembolehubah, X dan Y seperti tinggi dan berat.
Korelasi pekali Pearson
memerlukan keuda-dua pembolehubah di ukur diatas skala sela atau skala nisbah dan pengiraannya
adalah berdasarkan nilai sebenar. Korelasi pekali Spearman memerlukan data
ordinal dan pengiraannya adalah sama dengan cara
pengiraan pekali Pearson dan dijalankan mengikut pangkat atau tahap. Setiap
pembolehubah pangkatkan dengan memberi nilai atau kategori dengan urutan tertentu : nilai terendah diberi pangkat 1, 2 dan
seterusnya. Jika dua nilai data pembolehubah adalah sama ,
nilai tersebut akan diberi pangkat purata yang sama , dan jika ianya
dipangkatkan pada tahap 14 atau 15 , kedua-duanya akan diberi pangkat atau
tahap 14.5.
2.
Pangkatkan
kedua-dua set data dari tinggi ke rendah dan pastikan tiada pangkatan yang sama.
3.
Tolak
pangkat kedua-dua set untuk mendapatkan perbezaaan d.
4.
Gandakan
nilai d.
5.
Tambahkan
nilai kuasa dua d untuk mendapatkan Sigma d2.
6.
Gunakan
rumus Rs =
1-(6Sigma d2/n3-n) dimana n adalah bilangan pangkat yang anda ada.
7.
Jika nilai R ...
... adalah -1, terdapat hubungan korelasi negatif.
... berada diantara -1 dan -0.5, terdapat
korelasi negatif yang kuat
... berada
diantara -0.5 dan 0, terdapat hubungan
korelasi negative yang
lemah
... adalah sifar , tiada korelasi
... berada diantara 0 dan 0.5, terdapat hubungan korelasi
positif yang lemah.
... berada diantara 0.5 dan 1, terdapat hubungan korelasi
positif yang kuat
... adalah 1, terdapat hubungan korelasi positif yang tepat diantara
dua set
data
Jika nilai R adalah
0, nyatakan hipotesis nol adalah
diterima dan jika tidak ditolak
Berikut ini adalah panduan untuk
nilai korelasi tersebut :
+ atau - 0.80 hingga
1.00 korelasi sangat tinggi
0.60
hingga 0.79 korelasi tinggi
0.40
hingga 0.59 korelasi moderat
0.20
hingga 0.39 korelasi rendah
0.01
hingga 0.19 korelasi sangat rendah
Satu hal yang perlu diingat
adalah "korelasi tidak menyatakan hubungan sebab-akibat". Dari contoh di atas, korelasi hanya menyatakan bahwa
ada relasi antara lamanya waktu belajar dengan nilai ujian tinggi, namun bukan
"lamanya waktu belajar menyebabkan nilai ujian tinggi".
Soalan : Gunakan Pekali Korelasi Pangkat Sperman untuk
menentukan samada terdapat hubungan
diantara jarak ke sekolah dengan gred Ilmu Alam yang di perolehi ain.
Jarak dari sekolah (dalam batu) |
r |
Gred Ilmu Alam
Yang
Diperolehi |
r |
d |
d^2 |
3 |
2 |
4 |
4 |
2 |
4 |
7 |
1 |
4 |
4 |
3 |
9 |
2 |
3 |
7 |
1 |
2 |
4 |
2 |
3 |
6 |
2 |
1 |
1 |
1 |
5 |
5 |
3 |
2 |
4 |
|
|
|
|
|
Sigma d2 = 22 |
7.1.3 Kesahan Serentak (Concurrent
Validity)
Kesahan
serentak ( penentuan kriteria hubungan koefisien) di
nilai apabila anda mahukan atau ingin tahu samada ujian yang anda jalankan boleh
digunakan dilain-lain tempat dengan harapan ujian tersebut akan menghasilkan
skoran yang sahih. Ujian yang telah dijalankan dengan tujuan
menghasilkan skoran yang sahih dipanggil pengukuran criteria. Untuk menilai kesahan serentak anda perlu membandingkan keputusan
ujian dengan criteria yang dinyatakan. Ini boleh
dilakukan dengan mengkaitkan skoran ujian (x) dengan ukuran criteria (y).
Korelasi koefisien yang digunakan bergantung kepada jenis
pembolehubah criteria yang dinyatakan. Tiga jenis pengukuran criteria
yang dimaksudkan adalah :
1.
Skoran
dari ujian lain, di mana anda hendaklah menjalankan ujian dengan criteria ujian
kepada kumpulan yang sama kemudian mengkaitkan kedua-dua set data tersebut
2.
Skoran
daripada ahli atau pakar matapelajaran , di mana anda
hendaklah menjalankan ujian keatas kumpulan dan ahli atau pakar tersebut hadir untuk membuat pemerhatian dan memberi
skoran tanpa merujuk kepada pemarkahan ujian yang disediakan. Anda kemudian
menghubungkaitkan skoran ujian dengan skoran yang sedia ada.
3.
Tahap
kemahiran, dimana anda mengunakan criteria luaran untuk menilai ujian. Anda
mentadbirkan ujian tersebut kepada kumpulan mahir dan kemudiannya menjalankan
ujian kepada kumpulan tidak mahir dan hubungkaitkan skoran ujian dengan
korelasi titik biserial.
Nota : Jika pengukuran criteria wujud, mengapa kita tidak
teruskan pentadbiran ujian tersebut ? Kebiasaannya pengukuran criteria
melibatkan kos yang tinggi, mengambil masa yang lama
dan adalah kompleks untuk di jalankan
Prosedur yang
digunakan untuk menentukan kesahan serentak adalah sama
dengan prosedur yang digunakan untuk menentukan kesahan peramal. Bezanya ialah
hasil yang diramal diukur pada masa yang agak sama dengan
ujian kesahan peramal yang dibuat. Contohnya sekiranya sesuatu ujian baru
distrukturkan, skor
yang didapati dalam ujian itu boleh dikaitkan dengan markah yang
diperolehi dalam ujian sebelumnya bagi subjek yang sama, akan dikaitkan dengan
penilaian guru mereka ataupun dikaitkan dengan skor-skor yang didapati melalui
ujian yang serupa yang telah disahkan, yang mungkin lebih mahal dan lebih sukar
ditadbirkan. Dari menunggu beberapa tahun sama ada
sesuatu ujian minat vokasional berupaya meramalkan kejayaan dalam sesuatu
pekerjaan, seorang pengkaji boleh mengaitkan skor yang diperolehi dalam ujian
pelajar-pelajar yang telah berjaya dalam sesuatu pekerjaan dengan skor satu
pekerjaan yang lain untuk menentukan samada ujian berkenaan membezakan dua
kumpulan tersebut. Kesahan serentak menyediakan bukti dengan agak cepat tentang
kegunaan sesuatu ujian, tetapi hakikatnya bahawa ujian yang dimiliki kesahan
serentak tidaklah menjamin yang ia memiliki kesahan
peramal. Walau bagaimana pun kesahan serentak selalunya merupakan
langkah pertama untuk mewujudkan kesahan peramal.
Hakcipta Azizi Publicist 2005-2006