Minggu, 18 Mei 2014

BAB VIII Analisis Varians


Analisis varians (analysis of variance, ANOVA) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan pengembangan dari masalah Behrens-Fisher, sehingga uji-F juga dipakai dalam pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald Fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji hipotesis (lebih sering dipakai) maupun pendugaan (estimation, khususnya di bidang genetika terapan).

Hipotesis dalam Anova (analysis of variance):

Dalam analysis of variance hanya satu hipotesis yang digunakan yaitu hipotesis dua arah (two tail). artinya hipotesis ini yaitu apakah ada perbedaan rata-rata. kita cuma pengen tahu itu, tidak spesifik yang mana yang berbeda. Nah kalau mau tahu kelompok yang benar-benar terdapat perbedaan rata-rata ada uji lanjutan dilakukan uji lanjutan. kalau tentang itu akan dibahas di lain tempat. Berikut hipotesis dalam Anova.
H0: μ1 = μ2 = μ3 = ... = μn, Tidak ada perbedaan yang nyata antara rata-rata hitung dari n kelompok
H1: μ1 ≠ μ2 ≠ μ3 ≠ ... ≠ μn, Ada perbedaan yang nyata antara rata-rata hitung dari n kelompok

Alasan penggunaan ANOVA
Uji hipotesis dengan ANOVA digunakan, setidaknya karena beberapa alasan berikut:
  1. Memudahkan analisa atas beberapa kelompok sampel yang berbeda dengan resiko kesalahan terkecil.
  2. Mengetahui signifikansi perbedaan rata-rata (μ) antara kelompok sampel yang satu dengan yang lain. Bisa jadi, meskipun secara numeris bedanya besar, namun berdasarkan analisa ANOVA, perbedaan tersebut TIDAK SIGNIFIKAN sehingga perbedaan μ bisa diabaikan. Sebaliknya, bisa jadi secara numeris bedanya kecil, namun berdasarkan analisa ANOVA, perbedaan tersebut SIGNIFIKAN, sehingga minimal ada satu μ yang berbeda dan perbedaan μ antar kelompok sampel tidak boleh diabaikan.
  3. Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk percobaan yang lebih rumit. Selain itu, analisis ini juga masih memiliki keterkaitan dengan analisis regresi. Akibatnya, penggunaannya sangat luas di berbagai bidang, mulai dari eksperimen laboratorium hingga eksperimen periklanan, psikologi, dan kemasyarakatan.

Asumsi-asumsi yang harus dipenuhi dalam analisis varians (anova):

  1. Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor
  2. Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh
  3. Masing-masing contoh saling bebas, yang harus dapat diatur dengan perancangan percobaan yang tepat
  4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah).
Jenis-jenis dari Analisis of Variance (Anova).


Pemilihan tipe ANOVA tergantung dari rancangan percobaan (experiment design) yang kita pilih .
Maksud dari kasus ini yaitu untuk menguji perbedaan rata-rata lebih dari dua sampel dimana dalam melakukan analisis hanya bisa satu arah. Maksud satu arah ini hanya bisa menguji antar kelompok yang satu. Untuk lebih jelasmya kita kasih contoh kasus saja ya.
Contoh kasus Anova satu arah:

Sampel
Penurunan Berat Badan (Kg)
Metode 1
Metode 2
Metode 3
Metode 4
Sampel 1
4
8
7
6
Sampel 2
6
12
3
5
Sampel 3
4
-
-
5

Terdapat 4 metode diet dan 3 golongan usia peserta program diet Berikut data rata-rata penurunan berat peserta keempat metode dalam tiga kelompok umur.

Berdasarkan gambar di atas terlihat bahwa ada empat metode (kolom). Dari empat metode itu dilakukan oleh beberapa orang tapi tiap metode dilakukan oleh orang yang berbeda. pada tabel diatas terlihat data diperoleh dari sampel yang berbeda perlakuan antar kelompok karen itu kita hanya bisa membandingkan antar metode tapi tidak bisa membandingkan antar orang karena setiap tidak melakukan metode yang sama. oleh karena itu dikatakan satu arah saja yaitu metode.
2. Anova dua arah tanpa interaksi anova two way without interaction

Jenis anova yang kedua yaitu anova dua arah tanpa interaksi. Artinya bahwa bisa dilakukan interaksi antara kelompok dan perlakuan. maksdunya bisa membandingkan antar antar kelompok atau kah antar perlakuan. berikut contoh kasus.
Contoh kasus Anova dua arah tanpa interaksi:

Umur
Penurunan Berat Badan (Kg)
Metode 1
Metode 2
Metode 3
Metode 4
< 20 tahun
5
6
2
3
20-40
2
7
5
3
> 40 tahun
7
3
4
3

Terdapat 4 metode diet dan 3 golongan usia peserta program diet Berikut data rata-rata penurunan berat peserta keempat metode dalam tiga kelompok umur.

Berdasarkan gambat tersebut terlihat bahwa setiap metode memiliki perlakuan yang sama sehingga bisa dikatakan ada hubungan dua arah. tapi tidak ada interaksi.
3. Anova dua arah dengan interaksi anova two way with interaction

Sebelum ini dijelaskan anova dua arah tanpa interaksi. dikatakan anova dengan interaksi ketika setiap kolom [perlakuan] dan blok [baris] diulang. Langsung kecontoh aja ya.
Contoh kasus Anova dua arah dengan interaksi:

Umur
Penurunan Berat Badan (Kg)
Metode 1
Metode 2
Metode 3
Metode 4
< 20 tahun
#1
#2
#3
5
4
5
0
2
1
3
4
8
4
2
2
20-40 tahun
#1
#2
#3
5
6
2
4
2
1
2
2
4
5
3
2
> 40 tahun
#1
#2
#3
4
4
5
5
5
0
2
1
2
6
4
4

Terdapat 4 metode diet, 3 kelompok umur dan 3 ulangan. Berikut adalah data ata-rata penurunan berat badan setelah 1 bulan melakukan diet. Ujilah apakah penurunan berat badan sama untuk setiap metode diet, kelompok umur dan interaksi dengan taraf uji 5 %?

Langkah-langkah melakukan uji hipotesis dengan ANOVA

1.     Kumpulkan sampel dan kelompokkan berdasarkan kategori tertentu.
Untuk memudahkan pengelompokkan dan perhitungan, buat tabel data sesuai dengan kategori berisi sampel dan kuadrat dari sampel tersebut. Hitung pula total dari sampel dan kuadrat sampel tiap kelompok. Selain itu, tentukan pula hipotesis nol (H0) dan hipotesis alternatif (H1).
2.     Menentukan tipe anova
apakah masuk tipe satu arah, tipe dua arah tanpa interaksi atau tipe dua arah dengan interaksi. karena akan berpengaruh pada perhitungan. Menentukan tipe seperti pada penejalasan diatas.
3.     Menghitung variabilitas dari seluruh sampel.

Pengukuran total variabilitas atas data dapat dikelompokkan menjadi tiga bagian:
o    Total of sum squares (SSt) – jumlah kuadrat total (jkt).
Merupakan jumlah kuadrat selisih antara skor individual dengan rata-rata totalnya.
o    Sum Square Between(SSb) – jumlah kuadrat kolom (jkk).
Variansi rata-rata kelompok sampel terhadap rata-rata keseluruhannya. Variansi di sini lebih terpengaruh karena adanya perbedaan perlakuan antar kelompok.
o    Sum Square within(SSw) – jumlah kuadrat galat (jkg).
Variansi yang ada dalam masing-masing kelompok. Banyaknya variansi akan tergantung pada banyaknya kelompok, dan variansi di sini tidak terpengaruh / tergantung oleh perbedaan perlakuan antar kelompok.
4.     Menghitung derajat kebebasan (degree of freedom).

Derajat kebebasan atau degree of freedom (dilambangkan dengan v, dof, atau df) dalam ANOVA akan sebanyak variabilitas. Oleh karena itu, ada tiga macam derajat kebebasan yang akan kita hitung:
o    Derajat kebebasan untuk JKT
merupakan derajat kebebasan dari Jumlah kuadrat total (JKT) ini akan kita lambangkan dengan dof JKT
o    Derajat kebebasan untuk JKK
merupakan derajat kebebasan dari Jumlah kuadrat kolom (JKK) ini akan kita lambangkan dengan dof JKK
o    Derajat kebebasan untuk JKG
Merupakan derajat kebebasan dari Jumlah kuadrat galat (JKG) ini akan kita lambangkan dengan dof JKG

Derajat kebebasan juga memiliki sifat hubungan yang sama dengan sifat hubungan variabel, yakni:
dof JKT = dof JKK + dof JKG
5.     Menghitung variance antar kelompok dan variance dalam kelompok.

Variance dalam ANOVA, baik untuk antar kelompok maupun dalam kelompok sering disebut dengan kuadrat tengah atau deviasi rata-rata kuadrat (mean squared deviation) dan dilambangkan dengan MS atau KT. Dengan demikian, maka mean squared deviation masing-masing dapat dicari dengan rumus sebagai berikut:
o    KTK = JKK/dof jkk
o    KTG = JKG/dof jkg
6.     Menghitung F hitung

Menghitung nilai distribusi F (Fhitung) berdasarkan perbandingan variance antar kelompok dan variance dalam kelompok.Fhitung didapatkan dengan rumus di bawah ini:
Fhitung = KTK/KTG
7.     Menghitung F tabel

Selain itu, F berdasarkan tabel (Ftabel) juga dihitung, berdasarkan nilai derajat kebebasan (langkah ke-4) menggunakan tabel distribusi-F. Jangan lupa untuk mencantumkan gambar posisi Fhitung dan Ftabel dalam grafik distribusi-F.
8.     Membandingkan Fhitung dengan Ftabel :
o    Jika Fhitung > Ftabel : tolak H0
o    Jika Fhitung ≤ Ftabel : terima H0
9.     Buat kesimpulan,
sesuai dengan kasus awal yang ditanyakan. Simpulkan, apakah perlakuan (treatment) memiliki efek yang signifikan pada sampel data atau tidak. Jika hasil tidak signifikan, berarti seluruh rata-rata sampel adalah sama. Jika perlakuan menghasilkan efek yang signifikan, setidaknya satu dari rata-rata sampel berbeda dari rata-rata sampel yang lain.
Contoh penghitungan Analysis of variance (Anova) dengan tabel.

Sumber Keragaman (SK)
Jumlah Kuadrat (JK)
Derajat Bebas (db)
Kuadrat Tengah (KT)
F hitung
Kolom (K)
JKK
db JKK
KTK =
JKK / db JKK
F hitung =
KTK / KTG
Galat (G)
JKG
db JKG
KTG =
JKG / db JKG

Total (T)
JKT
db JKT




Sekian sedikit penjelasan umum mengenai gambaran umum mengenai analysis of variance (anova) disini tidak dijelaskan lebih jauh mengenai rumus dari jumlah kuadrat dan derajat bebas karena akan sangat panjang penjelasan ini. makanya nanti akan dibahas masing-masing dengan contoh secara manual tanpa software dan mudah-mudahan juga bisa membuat contoh kasus dengan software.

BAB IX Analisis Regresi dan Analisis Korelasi


A.    Regresi Linear Berganda
  1. Hubungan liniear lebih dari dua variabel
Regresi artinya peramalan penaksiran atau pendugaan pertama kali diperkenalkan pada tahun 1877 oleh Sir Francis Galtoon (1822-1911). Analisis regresi digunakan untuk menentukan bentuk dari hubungan antar variabel. Tujuan utama dalam penggunaan analisis itu adalah untuk meramalkan atau memperkirakan nilai dari suatu variabel dalam hubungannya dengan variabel yang lain. Disamping hubungan linear dua variabel, hubungan linear dari dua variabel bisa juga terjadi misalnya; hubungan antara hasil penjualan dengan harga dan daya beli.
Hubungan linear lebih dari dua variabel bila dinyatakan dalam bentuk persamaan matematis adalah :
Y = a + b1x1 + b2x2 +……………bkxk +
Keterangan :
x, x1, x2……..xk = variabel-variabel
a, b1, b2……..bk = bilangan konstan (konstanta) koefisien variabel
  1. Persamaan regresi linear berganda
Regresi linear berganda adalahregresi dimana variabel terikatnya (Y) dihubungkan  atau dijelaskan lebih dari satu variabel, mungkin dua, tiga dan seterusnya variabel bebas (x, x1, x2……..xn ) namun masih menunjukkan diagram hubungan yang linear.
Penambahan variabel bebas ini diharapkan dapat lebih menjelaskan karakteristik hubungan yang ada walaupun masih saja ada variabel yang terabaikan.
Bentuk umum dari persamaan linear berganda dapat ditulis sebagai berikut:
a.       Bentuk stokastik
= a + b1x1 + b2x2 + b3x3 ……………bkxk + c
b.      Bentuk non stokastik
= a + b1x1 + b2x2 + b3x3……………bkxk 
Keterangan
                                            :  Variabel terikat (nilai duga y)
a, b1, b2 b3……..bk                  :  koefisien regresi
x1, x2 x3……..xk                      :  variabel bebas
e                                             : kesalahan pengganggu
B.     Pendugaan dan Pengujian Koefisien Regresi
  1. Kesalahan baku regresi dan koefisien regresi berganda
Kesalahan baku atau selisih taksir standar regresi adalah nilai menyatakan seberapa jauh menyimpangnya nilai regresi tersebut terhadap nilai sebenarnya. Nilai ini digunakan untuk mengukur tingkat ketepatan suatu pendugaan dalam menduga nilai. Jika nilai ini sama dengan nol maka penduga tersebut memiliki tingkat ketepatan 100%.
Kesalahan baku atau selisih taksir standar regresi berganda dirumuskan
Se =
Keterangan
Se : Kesalahan baku regresi berganda
n : Jumlah pasangan observasi
m : jumlah konstant dalam persamaan regresi berganda.
Untuk koefisien b1 dan b2 kesalahan bakunya dirumuskan
Sb1 =
Sb2 =
  1. Pendugaan interval koefisien regresi berganda (parameter B1 dan B2)
Parameter B1 dan B2 sering juga disebut sebagai koefisien regresi parsial. Pendugaan parameter B1 dan B2 menggunakan distribusi t dengan derajat bebas db = n – m secara umum pendugaan parameter B1 dan B2 adalah :
b1 – ta/2n-m  Sbi £ Bi £ bi + ta/2n-m  Sbi
i = 2,3
  1. Pengujian hipotesis koefisien regresi berganda (parameter B1 dan B2)
Pengujian hipotesis bagi koefisien regresi berganda atau regresi parsial parameter B1 dan B2 dapat dibedakan menjadi 2  bentuk, yaitu pengujian hipotesis serentak dan pengujian hipotesis individual.
Pengujian hipotesis individual yaitu merupakan pengujian hipotesis koefisien regresi berganda dengan hanya satu B (B1 dan B2) yang mempunyai pengaruh Y. pengujian hipotesis serentak merupakan pengujian hipotesis koefisien regresi berganda dengan B1 dan B2 serentak atau bersama-sama mempengaruhi Y.
C.    Peramalan dengan Regresi Linear Berganda
Peramalan terhadap nilai Y dengan menggunakan regresi linear berganda, dapat dilakukan apabila persamaan garis regresinya sudah diestimasi dan nilai variabel bebas x1, x2 sudah diketahui.
Suatu persamaan garis regresi linear berganda dapat dipakai dalam peramalan dengan terlebih dahulu melakukan pengujian hipotesis terhadap koefisien-koefisien regresi parsialnya. Tujuan ialah mengetahui variabel-variabel bebas yang digunakan itu memiliki pengaruh  yang nyata atau tidak terhadap y tersebut. Variabel bebas x1 dan x2 disebut memiliki pengaruh yang nyata apabila dalam pengujian hipotesis koefisien parsialnya H0 : B1 = B2 = 0 ditolak atau H1 : B1 ¹ B2 ¹ 0 diterima, khususnya pada taraf nyata 1%
Kelebihan peramalan y dengan menggunakan regresi linear berganda adalah dapat diketahui besarnya pengaruh secara kuantitatif setiap variabel bebas (x1 atau x2) apabila pengaruh variabelnya dianggap konstan. Misalnya sebuah persamaan regresi berganda
y = a + b1x1 + b2x2
Keterangan :
y                             : Nilai statistik mahasiswa
x1                            : Nilai inteligensi mahasiswa
x2                            : Frekuensi membolos mahasiswa
b1                            : Pengaruh x1 terhadap y jika x2 konstan
b2                            : Pengaruh x2 terhadap y jika x1 konstan
jika a = 17,547; b1 = 0,642; b2 = - 0,284 maka persamaan regresi linear bergandanya menjadi
= 17,547 + 0,624 (75) – 0,284 (4)
Dengan persamaan regresi linear berganda tersebut, nilai y (nilai statistik maha siswa) dapat diramalkan dengan mengetahui nilai x1 (nilai inteligensi mahasiswa) dan x2 (frekuensi membolos mahasiswa) misalkan, nilai x1 = 75 dan x2 = 24 maka ramalan nilai y adalah
                            = 17,547 + 0,624 (75) – 0,284 (4)
                               = 63.211
Penulisan persamaan garis regresi linear berganda biasanya disertai dengan kesalahan baku masing-masing variabel bebas dan koefisien determinasi berganda r2, sebagai ukuran tepat atau tidaknya garis tersebut sehingga pendekatan.


D.    Korelasi Linear Berganda
Korelasi linear berganda merupakan alat ukur mengenai hubungan yang terjadi antara variabel yang terikat. (variabel Y) dan dua atau lebih variabel bebas (x1, x2……xk). Analisis korelasinya menggunakan tiga koefisien korelasi yaitu koefisien determinasi berganda, koefisien korelasi berganda, dan koefisien korelasi parsial.
1.      Korelasi linear berganda dengan dua variabel bebas
a.       Koefisien penentu berganda atau koefisien determinasi berganda
Koefisien determinasi berganda, disimbolkan KPB y.12 atau R2 merupakan ukuran kesusaian garis regresi linear berganda terhadap suatu data. Rumus
KPBy.12 =
b.      Koefisien korelasi berganda
Koefisien korelasi berganda disimbolkan ry12 merupakan ukuran keeratan hubungan antara variabel terikat dan semua variabel bebas. Secara bersama-sama.  Rumus :
Ry.12 =
c.       Koefisien korelasi parsial
Koefisien korelasi parsial merupakan koefisien korelasi antara dua variabel. Jika variabel lainnya konstan, pada hubungan yang melibatkan lebih dari dua variabel.
Ada 3 koefisien korelasi parsial untuk hubungan yang melibatkan 3 variabel yaitu sebagai berikut :
1)      Koefisien korelasi parsial antara y dan x1, apabila x2 konstan dirumuskan
ry.12 =
2)      Koefisien korelasi parsial antara y dan x2, apabila x1 konstan dirumuskan
ry.12 =
3)      Koefisien korelasi parsial antara x1 dan x2 apabila y konstan dirumuskan
R12y  =
2.      Korelasi linear berganda dengan 3 variabel bebas
  1. Koefisien penentu berganda
KPB =
  1. Koefisien korelasi berganda
ry123 =