7 Analisis Berstatistik Lanjutan

 

Korelasi dan regresi merujuk kepada perhubungan yang wujud diantara dua pemboleh ubah X dan Y, dimana bagi setiap nilai Xi dibandingkan dengan setiap nilai Yi. Contohnya; ukuran ketinggian manusia dibandingkan dengan ukuran berat; tempoh masa belajar pelajar bagi matapelajaran statistiks untuk menghadapi ujian dengan pencapaian pelajar keatas ujian; tempoh masa pelajar didapati melelapkan mata dan berkhayal ketika kuliah statistiks sebelum ujian dengan pencapaian keatas ujian dan sebagainya.
   

Kenyataan sebegini menunjukkan variasi kepada tema perhubungan fungsi kuantitatif. Lebih banyak pembolehubah dinyatakan bagi X , lebih banyak dinyatakan mengenai Y atau pun lebih tinggi seseorang itu lebih berat seseorang terebut, lebih lama pelajar tekun belajar lebih baik pencapaian mereka didalam ujian, lebih banyak pelajar berkhayal didalam kuliah lebih rendah pencapaian dan kebolehan mereka didalam ujian. Didalam kes pertama kita bercakap mengenai korelasi positif diantara dua pembolehubah sementara kes kedua (lebih yang ini, kurang yang itu) kita bercakap mengenai korelasi negatif diantara dua pembolehubah.

Korelasi dan regresi adalah umpama permukaan depan belakang duit syiling. Secara logiknya anda boleh memulakan pada permukaan depan atau permukaan belakang.
Ujian inferensi yang paling mudah boleh digunakan apabila membandingkan purata pencapaian dua kumpulan dalam satu ukuran adalah ujian t. Contohnya anda mungkin hendak membandingkan skoran matematik bagi murid lelaki dan perempuan di Tahap 2 atau samada perbezaan terdapat pada kumpulan program dengan kumpulan kawalan.
Apabilan anda ingin membuat purata perbandingan diantara dua kumpulan yang dinyatakan maka bolehlah digunakan ujian t yang dinyatakan.

Kebanyakan model statistik inferen dikenali dengan nama Ujian Model Linear. Ujian model linear termasuklah ujian t, analisis varians (ANOVA), analisis ko-varians (ANCOVA), analisis regresi dan lain-lain kaedah multivariate seperti analisis factor, skala pelbagai-dimensi, analisis kelompok, analisis fungsi dsikriminan dan sebagainya.

 

Di akhir bab ini, anda seharusnya dapat :

 

i)     mengenalpasti teknik berkaitan untuk menghadapi masalah statistic

ii)    boleh menyelesaikan masalah statistic dengan mengunakan kaedah analisa statistic yang betul

iii)  memahami beberapa kaedah analisis statistik

iv)   boleh menginterpretasi dan membuat laporan keputusan analisis.

 

7.1 Analisis Korelasi

Salah satu kegunaan statistiks adalah untuk membuat perbandingan diantara dua set informasi yang berlainan yang mungkin berkaitan atau berhubungkait. Persoalan mengenai apa yang kita sedang kita hadapi ini dalam istilah statistic dipanggil korelasi., iaitu perhubungan diantara dua nilai berlainan dalam satu set data dengan set data yang lain, dimana sekiranya nilai bagi set pertama itu meningkat , nilai bagi set kedua juga mungkin meningkat atau menurun (jika dalam kes korelasi negative)

Kita ambil contoh didalam satu kelas bahasa. Seorang guru telah pun menyiapkan pemarkahan bagi ujian yang telah beliau jalankan, beliau sudah pun memberi markah kepada setiap murid didalam kelas ujian tersebut. Kemudian beliau menjalankan satu lagi ujian bahasa, kini beliau mempunyai dua set markah ujian yang telah beliau jalankan bagi setiap murid yang telah mengambil ujian tersebut.

Guru tersebut ingin mengetahui samada murid-murid yang lulus dengan baik pada  ujian pertama juga lulus dengan baik pada ujian kedua atau tidak atau samada adakah hubungkait diantara kedua-dua ujian tersebut. Pada kebiasaanya keputusan yang dijangkakan adalah berkaitan rapat. Sudah tentu kita akan menyangka dan beranggapan bahawa murid yang lulus dengan baik pada ujian pertama juga akan lulus dengan baik dalam ujian kedua iaitu korelasi postif dan begitu juga jika murid gagal dalam ujian pertama kita beranggapan mereka juga akan turut gagal dalam ujian kedua.  Begitu juga kita akan beranggapan, bahawa, jika anda selalu menjalankan aktiviti senaman anda sudah pasti akan lebih sihat dari yang tidak bersenam.

 

Tetapi didalam banyak hal, anggapan kita itu ternyata tidak benar dan tentunya kita akan berminat untuk mengetahui bukan sahaja terdapat korelasi atau tidak tetapi ingin mengetahui kekuatan korelasi yang dinyatakan.

Dalam mengambilkira hubungan korelasi ini, kita mengenalpasti tiga kemungkinan. Dua pembolehubah iaitu dua set data yang kita bandingkan seperti senaman dan system kardiovaskular mungkin menunjukkan korelasi positif. Yang bermaksud, apabila nilai data set pertama meningkat, nilai data set kedua juga turut meningkat.  Ataupun bagi murid-murid yang lulus dengan baik pada ujian pertama mungkin mendapat skoran yang rendah pada ujian kedua yang menunjukkan korelasi negative. Atau mungkin tiada langsung korelasi yang ditunjukkan yang bermaskud kedua-dua set data tersebut tidak ada hubungan atau hubungkait.

Korelasi seperti yang kita akan lihat boleh menjadi kuat atau lemah yang bermaksud hubungan diantara nilai dua set data boleh menjadi signifikan atau tidak signifikan. Sesuatu korelasi boleh menjadi tepat di mana setiap perubahan pada satu set nilai menunjukkan perubahan tepat dengan nilai set data kedua.

Korelasi adalah alat analisis yang mustahak yang membolehkan kita mengasingkan dan membetulkan kenyataan mengenai hubungkaitan yang mungkin benar atau tidak : kadar merokok dengan kadar dijangkiti kanker,  kesan jangkitan HIV dengan kadar dihidapi penyakit AIDS, usia kereta dengan nilai sekarang, ujian IQ dengan kadar pendapatan bulanan, kebijaksanaan dengan keturunan, usia dengan tahap kemahiran dan sebagainya. Prinsip korelasi membolehkan kita membuat penyiasatan samada kenyataan yang dinyatakan difahami dan membolehkan kita membuat pengukuran terhadap kenyataan yang telah dinyatakan.

Mungkin anda boleh menyatakan secara logic mengenai perkara dibawah samada terdapat hubungan korelasi diantara dua set data tersebut samada positif, negative, tepat atau sifar. 

a)      ketinggian dalam centimeter dengan ketinggian dalam inci;

b)      tahap pendapatan bulanan dengan tahap perbelanjaan bulanan;

c)      usia kenderaan dengan nilai semasa;

d)      dua balingan buah dadu serentak;

e)      hujan lebat dengan kehadiran kesekolah;

f)       kebolehan melihat didalam gelap dengan kebolehan memakan;

g)      kadar menghisap rokok dalam sehari dengan tahap kesihatan;

h)      ketinggian dengan berat murid-murid di sekolah;

i)        kadar pengunaan kalori dalam pemakanan dengan berat badan;

j)        umur dengan kekuatan fizikal warga emas

Korelasi di dalam statistik bermaksud  , sesuatu pengukuran kekuatan perhubungan diantara dua pembolehubah.  Ia digunakan untuk meramal nilai satu pembolehubah dengan satu pembolehubah yang lain. Contohnya, satu korelasi boleh dikaitkan dengan jarak lokasi satu sekolah di satu daerah dengan bekalan kertas ujian yang disimpan di pusat bilik kebal di daerah tersebut. Ia dinyatakan dalam skala dari -1.0 to +1.0, bagi menyatakan kekuatan korelasi.

Didalam teori kebarangkalian dan statistic, korelasi juga dikenali dengan nama korelasi pekali. Korelasi Pekali adalah pengukuran kekuatan numerik perhubungan linear diantara  dua pembolehubah rawak. Beberapa kaedah pekali boleh digunakan dalam situasi berbeza. Yang sering dan kerap digunakan adalah  Korelasi Pearson.

7.1.1 Hubungan Linear dan Pekali Korelasi

Pekali korelasi linear adalah nombor diantara -1 dan 1 yang mengukur berapa rapatnya garisan lurus dengan set kumpulan titik berada. Lagi dekat nilai sifar korelasi pekali, lagi kuranglah titik kumpulan berada di garis lurus ( yang bermaksud pekali korelasi linear )

  

Lagi rapat korelasi pekali kepada nilai 1, lebih banyak titik yang berada sepanjang garisan lurus kawasan  bawah kiri ke kawasan atas kanan

Lagi rapat korelasi pekali kepada nilai -1, lebih banyak titik berada disepanjang garisan lurus kawasan atas kiri  ke kawasan bawah kiri.

 

Satu cara biasa  bagi membolehkan kita memahami maksud korelasi diantara dua pembolehubah diantara dua set data adalah dengan melukis gambarajah yang mana setiap data di lukiskan didalam rajah X-Y . Paksi  X mewakili nilai satu pembolehubah dan paksi Y , satu pembolehubah yang lain. Setiap skoran yang diperolehi dilukiskan didalam gambarajah tersebut.

Contoh, kita boleh membina atau melukis rajah bagi nilai Persekolahan dilukiskan pada paksi X dan nilai Mengambil Bahagian dalam Politik pada paksi Y. Dengan ini, kita boleh , memastikan di mana responden berada sebenarnya didalam rajah tersebut dan kita akan mendapat terdapat 20 titik lokasi didalam rajah tersebut.

Carta (menggunakan Excel) menunjukkan hasilan keputusan yang dilakarkan. Perhatikan terdapat 20 titik yang dilakarkan bagi setiap responden.

Perhatikan terdapat dua orang yang menghadiri persekolahan selama 16 tahun, Empat responden berada pada skor 9, dua responden pada skor 2 dan sebagainya. Kita menamakan kaedah ilustrasi ini dengan nama rajah serakan.

Cuba lihat pada bentuk keseluruhan titik pada rajah. Ianya seolah-olah menunjukkan kearah atas kanan. Bentuk ini boleh di anggap atau di katakan, apabila nilai Y menaik, nilai X turut menaik.

7.1.2 Pengiraan Pekali Korelasi Linear

 

            Andaikan data dibawah untuk membuat pengiraan pekali korelasi linear

 

n

 

x

 

y

1

 

x1

 

y1

2

 

x2

 

y2

3

 

x3

 

y3

.

 

.

 

.

.

 

.

 

.

.

 

.

 

.

N

 

xN

 

yN

(i) Langkah pertama ialah pengiraan purata  (<x> and <y>) bagi nilai x dan  y :

<x> = 1/N (x1 + x2 + x3 ...+ xN)

<y> = 1/N (y1 + y2 + y3 ...+ yN)

(ii) Kemudian buat pengiraan sisihan piawai bagi data x dan y :

(iii) Kirakan kovarian bagi kedua set data :

(iv) Korelasi koefisen kemudiannya di definisikan dengan :

Contoh 1:

Kirakan korelasi koefisen bagi data set x dan y berikut :

n

 

x

 

y

1

 

1

 

4

2

 

2

 

4

3

 

3

 

3

4

 

4

 

2

5

 

5

 

1

Dalam hal ini, pembolehubah x  (masa) :

(i) Kirakan  <x> dan <y>, purata x dan purata  y:

<x> = 1/5 (1 + 2 + 3 + 4 + 5) = 3.0

<y> = 1/5 (4 + 4 + 3 + 2 + 1) = 2.8

(ii) Kirakan sisihan piawai bagi x dan y :

(iii) Kirakan kovarian :

(iv) Kirakan  r, korelasi koefisien:

Pekali Kolerasi Pearson Spearman

 

Koelasi merumuskan kekuatan perhubungan diantara dua pembolehubah, tetapi perlu di ingatkan bahawa korelasi bukanlah kerana disebabkan. Kita memerlukan dua pembolehubah, X dan Y seperti tinggi dan berat. Ada beberapa cara korelasi pekali boleh dikira tetapi yang kerapkan digunakan adalah Korelasi Pearson dan Korelasi Pekali Spearman.

 

Korelasi pekali Pearson memerlukan keuda-dua pembolehubah di ukur diatas skala sela  atau skala nisbah dan pengiraannya adalah berdasarkan nilai sebenar. Korelasi pekali Spearman memerlukan data ordinal dan pengiraannya adalah sama dengan cara pengiraan pekali Pearson dan dijalankan mengikut pangkat atau tahap. Setiap pembolehubah pangkatkan dengan memberi nilai atau kategori dengan urutan tertentu : nilai terendah diberi pangkat 1, 2 dan seterusnya. Jika dua nilai data pembolehubah adalah sama , nilai tersebut akan diberi pangkat purata yang sama , dan jika ianya dipangkatkan pada tahap 14 atau 15 , kedua-duanya akan diberi pangkat atau tahap 14.5.

Prosedur Bagi Mengunakan Korelasi Spearman Pangkat

1.       Nyatakan hipotesis nol i.e. Tiada ada hubungan diantara dua set data “

2.       Pangkatkan kedua-dua set data dari tinggi ke rendah dan pastikan tiada pangkatan     yang sama.

3.       Tolak pangkat kedua-dua set untuk mendapatkan perbezaaan d.

4.       Gandakan nilai d.

5.       Tambahkan nilai kuasa dua d untuk mendapatkan  Sigma d2.

6.       Gunakan rumus  Rs = 1-(6Sigma d2/n3-n) dimana  n adalah bilangan pangkat yang anda ada.

7.       Jika nilai R ...
... adalah -1, terdapat hubungan korelasi negatif.
... berada diantara  -1 dan -0.5, terdapat korelasi negatif yang kuat

... berada diantara  -0.5 dan 0, terdapat hubungan korelasi negative yang   

    lemah

... adalah sifar , tiada korelasi

... berada diantara 0 dan 0.5, terdapat hubungan korelasi positif yang lemah.

... berada diantara 0.5 dan 1, terdapat hubungan korelasi positif yang kuat

... adalah 1, terdapat hubungan korelasi positif yang tepat diantara dua set

                   data

Jika nilai R adalah  0, nyatakan hipotesis nol adalah diterima dan jika tidak ditolak

Berikut ini adalah panduan untuk nilai korelasi tersebut :

               + atau - 0.80 hingga 1.00    korelasi sangat tinggi
               0.60 hingga 0.79    korelasi tinggi
               0.40 hingga 0.59    korelasi moderat
               0.20 hingga 0.39    korelasi rendah
               0.01 hingga 0.19    korelasi sangat rendah

Satu hal yang perlu diingat adalah "korelasi tidak menyatakan hubungan sebab-akibat". Dari contoh di atas, korelasi hanya menyatakan bahwa ada relasi antara lamanya waktu belajar dengan nilai ujian tinggi, namun bukan "lamanya waktu belajar menyebabkan nilai ujian tinggi".

Contoh Pengiraan Pekali Korelasi Pangkat Spearman

 

Soalan : Gunakan Pekali Korelasi Pangkat Sperman untuk menentukan  samada terdapat hubungan diantara jarak ke sekolah dengan gred Ilmu Alam yang di perolehi ain.

  1. Hipotesis Nol: Tiada hubungan diantara dua set data

 

Jarak dari sekolah

(dalam batu)

r

Gred Ilmu Alam

Yang Diperolehi

r

d

d^2

3

2

4

4

2

4

7

1

4

4

3

9

2

3

7

1

2

4

2

3

6

2

1

1

1

5

5

3

2

4

 

 

 

 

 

Sigma d2 = 22

  1. R = 1-(6 Sigma d2 / n3-n).
    • Sigma d2 = 22 jadi 6 Sigma d2= 132
    • n = 5 jadi n3-n = 120
  2. R = 1-(132/120)
  3. R = 1- 0.91
  4. R = 0.09
  5. Terdapat hubungan korelasi yang lemah diantara kedua-dua set data. Hipotesis nol adalah ditolak.

 

7.1.3 Kesahan Serentak (Concurrent Validity)

 

Kesahan serentak ( penentuan kriteria hubungan koefisien) di nilai apabila anda mahukan atau ingin tahu samada ujian yang anda jalankan boleh digunakan dilain-lain tempat dengan harapan ujian tersebut akan menghasilkan skoran yang sahih. Ujian yang telah dijalankan dengan tujuan menghasilkan skoran yang sahih dipanggil pengukuran criteria. Untuk menilai kesahan serentak anda perlu membandingkan keputusan ujian dengan criteria yang dinyatakan. Ini boleh dilakukan dengan mengkaitkan skoran ujian (x) dengan ukuran criteria (y). Korelasi koefisien yang digunakan bergantung kepada jenis pembolehubah criteria yang dinyatakan. Tiga jenis pengukuran criteria yang dimaksudkan adalah :

1.       Skoran dari ujian lain, di mana anda hendaklah menjalankan ujian dengan criteria ujian kepada kumpulan yang sama kemudian mengkaitkan kedua-dua set data tersebut

2.       Skoran daripada ahli atau pakar matapelajaran , di mana anda hendaklah menjalankan ujian keatas kumpulan dan ahli atau pakar tersebut  hadir untuk membuat pemerhatian dan memberi skoran tanpa merujuk kepada pemarkahan ujian yang disediakan. Anda kemudian menghubungkaitkan skoran ujian dengan skoran yang sedia ada.

3.       Tahap kemahiran, dimana anda mengunakan criteria luaran untuk menilai ujian. Anda mentadbirkan ujian tersebut kepada kumpulan mahir dan kemudiannya menjalankan ujian kepada kumpulan tidak mahir dan hubungkaitkan skoran ujian dengan korelasi titik biserial.

Nota : Jika pengukuran criteria wujud, mengapa kita tidak teruskan pentadbiran ujian tersebut ? Kebiasaannya pengukuran criteria melibatkan kos yang tinggi, mengambil masa yang lama dan adalah kompleks untuk di jalankan

Prosedur yang digunakan untuk menentukan kesahan serentak adalah sama dengan prosedur yang digunakan untuk menentukan kesahan peramal. Bezanya ialah hasil yang diramal diukur pada masa yang agak sama dengan ujian kesahan peramal yang dibuat. Contohnya sekiranya sesuatu ujian baru distrukturkan, skor  yang didapati dalam ujian itu boleh dikaitkan dengan markah yang diperolehi dalam ujian sebelumnya bagi subjek yang sama, akan dikaitkan dengan penilaian guru mereka ataupun dikaitkan dengan skor-skor yang didapati melalui ujian yang serupa yang telah disahkan, yang mungkin lebih mahal dan lebih sukar ditadbirkan. Dari menunggu beberapa tahun sama ada sesuatu ujian minat vokasional berupaya meramalkan kejayaan dalam sesuatu pekerjaan, seorang pengkaji boleh mengaitkan skor yang diperolehi dalam ujian pelajar-pelajar yang telah berjaya dalam sesuatu pekerjaan dengan skor satu pekerjaan yang lain untuk menentukan samada ujian berkenaan membezakan dua kumpulan tersebut. Kesahan serentak menyediakan bukti dengan agak cepat tentang kegunaan sesuatu ujian, tetapi hakikatnya bahawa ujian yang dimiliki kesahan serentak tidaklah menjamin yang ia memiliki kesahan peramal. Walau bagaimana pun kesahan serentak selalunya merupakan langkah pertama untuk mewujudkan kesahan peramal.

Balik                                     Seterusnya

 Hakcipta Azizi Publicist 2005-2006

1