Tutorial R
Uji beda rata-rata dua sampel independen dilakukan ketika terdapat dua populasi yang ingin diteliti apakah rata-rata antar kedua kelompok tersebut adalah sama atau tidak.
Hipotesis nol dari uji ini yaitu rata-rata antar kedua sampel tidak sama, sedangkan hipotesis alternatifnya bisa satu di antara tiga kemungkinan berikut: rata-rata kedua kelompok tidak sama, rata-rata kelompok pertama lebih besar dari kelompok kedua, atau rata-rata kelompok pertama lebih kecil dari kelompok kedua.
Sebagai contoh, kita akan menggunakan dataset chickwts
pada R. Kita akan membandingkan rata-rata weight
dari dua kelompok dalam variabel feed
. Misalkan yang akan dilakukan pengujian adalah antara kelompok "casein" dan "sunflower" pada variabel feed
.
Hipotesis nol nya yaitu tidak terdapat perbedaan rata-rata berat badan anak ayam jika diberi perlakukan pemberian pakan casein atau sunflower (\( H_0: \mu_1 = \mu_2 \)). Hipotesis alternatifnya adalah bahwa pertumbuhan berat badan anak ayam berdasarkan perlakukan pemberian pakan casein atau sunflower memberikan nilai rata-rata pertumbuhan yang berbeda (\( H_1: \mu_1 \) tidak sama \( \mu_2 \)).
Tingkat signifikansi yang digunakan adalah \( \alpha = 0.05 \).
Karena akan diuji perbedaan dua kelompok dari beberapa kelompok yang ada, maka langkah awal yang dilakukan membuat nama dataset baru (subset). Subset baru yang dibentuk dengan nama chick
berisi data dari datasetchickwts
, tetapi hanya yang feed
nya bernilai "casein" dan "sunflower". Perhatikan sintaks berikut:
## Ekstraksi data chickwts untuk feed casein dan sunflower saja
chick <-chickwts[chickwts$feed %in% c("casein","sunflower"),]
Kemudian karena dalam uji beda rata-rata mensyaratkan bahwa variabel yang diuji mesti berdistribusi normal, maka kita lakukan uji normalitas pada setiap group pakan (sunflower dan casein). Caranya kita harus mengambil (mengekstrak) data weight dari kedua grup tersebut dengan sintaks chick$weight[chick$feed == "sunflower"]
.Perhatikan sintaks berikut.
### uji normalitas untuk variabel weight pada data chick ###
## ekstraksi weight dari grup casein
dtcasein <-chick$weight[chick$feed == "casein"]
shapiro.test(dtcasein)
Output:
Shapiro-Wilk normality test
data: dtcasein
W = 0.91663, p-value = 0.2592
## ekstraksi weight dari grup sunflower
dtsun <- chick$weight[chick$feed == "sunflower"]
shapiro.test(dtsun)
Output:
Shapiro-Wilk normality test
data: dtsun
W = 0.92809, p-value = 0.3603
Perhatikan bahwa kita melakukan uji normalitas dengan uji shapiro wilk melalui fungsi shapiro.test()
yang dilakukan untuk setiap grup pakan (sunflower dan casein). Hipotesis nol dalam uji normalitas adalah data mengikuti distribusi normal.
Berdasarkan output di atas, terdapat dua nilai p-value yakni 0.2592 dan 0.3603. Kedua p-value itu lebih besar dari taraf signifikansi yang digunakan yaitu sebesar 0.05. Dengan demikian, dapat disimpulkan bahwa dengan keyakinan 95% terdapat cukup bukti untuk menyatakan bahwa distribusi data weight
untuk kedua grup pakan (sunflower dan casein) dalam dataset chick
adalah mengikuti distribusi normal.
Selain uji normalitas, kita juga perlu melakukan uji kesamaan varians atau ragam (test of homogeneity). Ragam dari kedua kelompok dapat diasumsikan sama ataupun berbeda dan karena itu akan berpengaruh pada rumus perhitungan dalam uji beda rata-rata. Perhatikan sintaks uji kesamaan varians berikut ini.
## test for equal variance ##
var.test(weight~feed, data = chick)
Output:
F test to compare two variances
data: weight by feed
F = 1.7408, num df = 11, denom df = 11, p-value = 0.3718
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.5011282 6.0469059
sample estimates:
ratio of variances
1.740769
Output:
bartlett.test(weight~feed, data = chick)
Bartlett test of homogeneity of variances
data: weight by feed
Bartlett's K-squared = 0.79813, df = 1, p-value = 0.3717
Uji kesamaan ragam atau varians dapat dilakukan melalui perintah var.test(weight~feed, data=chick)
atau melalui uji bartlett dengan fungsi bartlett.test(weight~feed, data=chick)
.
Menguji asumsi kesamaan ragam/varian menggunakan sintaks var.test(weight~feed, data=chick) atau menggunakan uji bartlett dengan penulisan sintaks bartlett.test(weight~feed, data=chick). Hipotesis awal dalam uji kesamaan ragam adalah varian antara dua kelompok yang diuji adalah sama atau homogen.
Berdasarkan output di atas, p-value pertama yaitu 0.3718 dan p-value kedua yang diperoleh melalui uji bartlett adalah sebesar 0.3717. Kedua p-value itu lebih besar dari 0.05, sehingga dapat dikatakan bahwa dengan keyakinan 95% terdapat cukup bukti untuk menyatakan bahwa ragam/varian di antara dua keompok tersebut adalah sama atau homogen.
Karena uji kesamaan varians memberikan kesimpulan bahwa varians kedua kelompok adalah sama, maka langkah berikutnya adalah melakukan uji beda rata-rata dengan asumsi kedua kelompok mempunyai ragam yang sama. Perhatikan sintaks berikut.
## Unpaired Two Sample t-test ##
## Assume Equal Variance ##
t.test(weight~feed, data = chick, var.equal=TRUE)
Output:
Two Sample t-test
data: weight by feed
t = -0.22851, df = 22, p-value = 0.8214
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-53.73622 43.06955
sample estimates:
mean in group casein mean in group sunflower
323.5833 328.9167
Uji beda rata-rata dilakukan melalui perintah t.test(weight~feed, data = chick, var.equal = TRUE)
, yang berarti data yang diuji adalah variabel weight dengan berdasarkan kelompok feed dari data chick, dengan asumsi kesamaan ragamnya adalah TRUE. Untuk hipotesis alternatif, jika tidak dinyatakan dalam sintaks, maka secara default yang dipakai adalah "two.sided".
Note: Jika asumsi kesamaan ragam kedua kelompok ditolak maka pada sintaks var.equal
kita ganti menjadi FALSE.
Berdasarkan output yang diperoleh di atas, nilai \( t_{hitung} \) adalah -0.22951, dengan derajat bebas 22 dan nilai p-value = 0.8214. Karena nilai p-value lebih besar dari tingkat signifikansi yang digunakan (5%), maka diputuskan gagal tolak Ho dan dapat disimpulkan bahwa terdapat cukup bukti di mana rata-rata penambahan berat badan anak ayam yang diberi dua jenis pakan (casein dan sunflower) adalah sama.
Selang kepercayaan (confidence interval) selisih rata-rata dari kedua kelompok sampel berada di antara -53.73622 dan 43.06955 atau dengan tingkat kepercayaan 95% kita yakin selisih rata-rata weight
pada dua kelompok berkisar antara -53.73622 dan 43.06955. Adapun rata-rata weight
dari data kelompok casein adalah 323.5833, sedangkan rata-rata weight
dari kelompok sunflower adalah 328.9167.
Anda hidup hanya sekali, tetapi jika Anda melakukannya dengan benar, sekali itu cukup.
Mae West