Uji Beda Rata-rata Dua Sampel Independen dalam Pemrograman R

Tutorial R » Pengujian Hipotesis › Uji Beda Rata-rata Dua Sampel Independen dalam Pemrograman R

Uji Beda Rata-rata

Uji Beda Rata-rata Dua Sampel Independen dalam Pemrograman R

Uji beda rata-rata dua sampel independen dilakukan ketika terdapat dua populasi yang ingin diteliti apakah rata-rata antar kedua kelompok tersebut adalah sama atau tidak.

Hipotesis nol dari uji ini yaitu rata-rata antar kedua sampel tidak sama, sedangkan hipotesis alternatifnya bisa satu di antara tiga kemungkinan berikut: rata-rata kedua kelompok tidak sama, rata-rata kelompok pertama lebih besar dari kelompok kedua, atau rata-rata kelompok pertama lebih kecil dari kelompok kedua.

Sebagai contoh, kita akan menggunakan dataset chickwts pada R. Kita akan membandingkan rata-rata weight dari dua kelompok dalam variabel feed. Misalkan yang akan dilakukan pengujian adalah antara kelompok "casein" dan "sunflower" pada variabel feed.

Hipotesis nol nya yaitu tidak terdapat perbedaan rata-rata berat badan anak ayam jika diberi perlakukan pemberian pakan casein atau sunflower ($ H_0: \mu_1 = \mu_2 $). Hipotesis alternatifnya adalah bahwa pertumbuhan berat badan anak ayam berdasarkan perlakukan pemberian pakan casein atau sunflower memberikan nilai rata-rata pertumbuhan yang berbeda ($ H_1: \mu_1 $ tidak sama $ \mu_2 $).

Tingkat signifikansi yang digunakan adalah $ \alpha = 0.05 $.

Karena akan diuji perbedaan dua kelompok dari beberapa kelompok yang ada, maka langkah awal yang dilakukan membuat nama dataset baru (subset). Subset baru yang dibentuk dengan nama chick berisi data dari datasetchickwts, tetapi hanya yang feed nya bernilai "casein" dan "sunflower". Perhatikan sintaks berikut:

                
                  ## Ekstraksi data chickwts untuk feed casein dan sunflower saja
                  chick <-chickwts[chickwts$feed %in% c("casein","sunflower"),]

Kemudian karena dalam uji beda rata-rata mensyaratkan bahwa variabel yang diuji mesti berdistribusi normal, maka kita lakukan uji normalitas pada setiap group pakan (sunflower dan casein). Caranya kita harus mengambil (mengekstrak) data weight dari kedua grup tersebut dengan sintaks chick$weight[chick$feed == "sunflower"].Perhatikan sintaks berikut.

                
                  ### uji normalitas untuk variabel weight pada data chick ###
                  ## ekstraksi weight dari grup casein
                  dtcasein <-chick$weight[chick$feed == "casein"]
                  shapiro.test(dtcasein)
                  
                  Output:
                    Shapiro-Wilk normality test

                  data:  dtcasein
                  W = 0.91663, p-value = 0.2592

                  ## ekstraksi weight dari grup sunflower
                  dtsun <- chick$weight[chick$feed == "sunflower"]
                  shapiro.test(dtsun)
                  
                  Output:
                    Shapiro-Wilk normality test

                  data:  dtsun
                  W = 0.92809, p-value = 0.3603

Perhatikan bahwa kita melakukan uji normalitas dengan uji shapiro wilk melalui fungsi shapiro.test() yang dilakukan untuk setiap grup pakan (sunflower dan casein). Hipotesis nol dalam uji normalitas adalah data mengikuti distribusi normal.

Berdasarkan output di atas, terdapat dua nilai p-value yakni 0.2592 dan 0.3603. Kedua p-value itu lebih besar dari taraf signifikansi yang digunakan yaitu sebesar 0.05. Dengan demikian, dapat disimpulkan bahwa dengan keyakinan 95% terdapat cukup bukti untuk menyatakan bahwa distribusi data weight untuk kedua grup pakan (sunflower dan casein) dalam dataset chick adalah mengikuti distribusi normal.

Selain uji normalitas, kita juga perlu melakukan uji kesamaan varians atau ragam (test of homogeneity). Ragam dari kedua kelompok dapat diasumsikan sama ataupun berbeda dan karena itu akan berpengaruh pada rumus perhitungan dalam uji beda rata-rata. Perhatikan sintaks uji kesamaan varians berikut ini.

                
                  ## test for equal variance ##
                  var.test(weight~feed, data = chick)
                  
                  Output:
                    F test to compare two variances

                  data:  weight by feed
                  F = 1.7408, num df = 11, denom df = 11, p-value = 0.3718
                  alternative hypothesis: true ratio of variances is not equal to 1
                  95 percent confidence interval:
                  0.5011282 6.0469059
                  sample estimates:
                  ratio of variances 
                            1.740769
                            
                  Output:
                  bartlett.test(weight~feed, data = chick)

                    Bartlett test of homogeneity of variances

                  data:  weight by feed
                  Bartlett's K-squared = 0.79813, df = 1, p-value = 0.3717

Uji kesamaan ragam atau varians dapat dilakukan melalui perintah var.test(weight~feed, data=chick) atau melalui uji bartlett dengan fungsi bartlett.test(weight~feed, data=chick).

Menguji asumsi kesamaan ragam/varian menggunakan sintaks var.test(weight~feed, data=chick) atau menggunakan uji bartlett dengan penulisan sintaks bartlett.test(weight~feed, data=chick). Hipotesis awal dalam uji kesamaan ragam adalah varian antara dua kelompok yang diuji adalah sama atau homogen.

Berdasarkan output di atas, p-value pertama yaitu 0.3718 dan p-value kedua yang diperoleh melalui uji bartlett adalah sebesar 0.3717. Kedua p-value itu lebih besar dari 0.05, sehingga dapat dikatakan bahwa dengan keyakinan 95% terdapat cukup bukti untuk menyatakan bahwa ragam/varian di antara dua keompok tersebut adalah sama atau homogen.

Karena uji kesamaan varians memberikan kesimpulan bahwa varians kedua kelompok adalah sama, maka langkah berikutnya adalah melakukan uji beda rata-rata dengan asumsi kedua kelompok mempunyai ragam yang sama. Perhatikan sintaks berikut.

                
                  ## Unpaired Two Sample t-test ##
                  ## Assume Equal Variance ##
                  t.test(weight~feed, data = chick, var.equal=TRUE)
                  
                  Output:
                    Two Sample t-test

                  data:  weight by feed
                  t = -0.22851, df = 22, p-value = 0.8214
                  alternative hypothesis: true difference in means is not equal to 0
                  95 percent confidence interval:
                  -53.73622  43.06955
                  sample estimates:
                    mean in group casein mean in group sunflower 
                                323.5833                328.9167

Uji beda rata-rata dilakukan melalui perintah t.test(weight~feed, data = chick, var.equal = TRUE), yang berarti data yang diuji adalah variabel weight dengan berdasarkan kelompok feed dari data chick, dengan asumsi kesamaan ragamnya adalah TRUE. Untuk hipotesis alternatif, jika tidak dinyatakan dalam sintaks, maka secara default yang dipakai adalah "two.sided".

Note: Jika asumsi kesamaan ragam kedua kelompok ditolak maka pada sintaks var.equal kita ganti menjadi FALSE.

Berdasarkan output yang diperoleh di atas, nilai $ t_{hitung} $ adalah -0.22951, dengan derajat bebas 22 dan nilai p-value = 0.8214. Karena nilai p-value lebih besar dari tingkat signifikansi yang digunakan (5%), maka diputuskan gagal tolak Ho dan dapat disimpulkan bahwa terdapat cukup bukti di mana rata-rata penambahan berat badan anak ayam yang diberi dua jenis pakan (casein dan sunflower) adalah sama.

Selang kepercayaan (confidence interval) selisih rata-rata dari kedua kelompok sampel berada di antara -53.73622 dan 43.06955 atau dengan tingkat kepercayaan 95% kita yakin selisih rata-rata weight pada dua kelompok berkisar antara -53.73622 dan 43.06955. Adapun rata-rata weight dari data kelompok casein adalah 323.5833, sedangkan rata-rata weight dari kelompok sunflower adalah 328.9167.

www.jagostat.com

www.jagostat.com

Website Belajar Matematika & Statistika

Website Belajar Matematika & Statistika

Tutorial R

Tutorial R » Pengujian Hipotesis › Uji Beda Rata-rata Dua Sampel Independen dalam Pemrograman R

Uji Beda Rata-rata