Tutorial R
Sering kali kita harus berhadapan dengan data yang hilang (missing data) saat hendak mengolah data. Dalam pemrograman R, untuk mengecek apakah ada missing values, kita bisa gunakan fungsi is.na()
.
Sering kali kita harus berhadapan dengan data yang hilang (missing data atau missing values) saat hendak mengolah data. Dalam pemrograman R, untuk mendefinisikan missing values digunakan kata kunci (keyword) NA (Not Available).
Selain itu, untuk hasil yang tidak terdefinisi seperti infinity, R menggunakan keyword NaN (Not a Number). Untuk mengecek apakah ada missing values, kita bisa gunakan fungsi is.na()
.
Pada objek matriks atau data.frame, untuk menyeleksi hanya baris yang tidak ada missing values kita gunakan fungsi complete.cases()
.
Perhatikan contoh berikut:
## set x sebagai missing ##
x <- NA
x + 4
[1] NA
log(x)
[1] NA
is.na(x)
[1] TRUE
## Missing dalam sebuah vektor
x <- c(1,2,NA,4)
x
[1] 1 2 NA 4
## Mengecek missing values
is.na(x)
[1] FALSE FALSE TRUE FALSE
## Menghitung jumlah missing
sum(is.na(x))
[1] 1
## Missingness dalam matriks
## Membuat matriks
mat1 <- matrix(c(1:19, NA), 4,5)
mat1
[,1] [,2] [,3] [,4] [,5]
[1,] 1 5 9 13 17
[2,] 2 6 10 14 18
[3,] 3 7 11 15 19
[4,] 4 8 12 16 NA
is.na(mat1)
[,1] [,2] [,3] [,4] [,5]
[1,] FALSE FALSE FALSE FALSE FALSE
[2,] FALSE FALSE FALSE FALSE FALSE
[3,] FALSE FALSE FALSE FALSE FALSE
[4,] FALSE FALSE FALSE FALSE TRUE
complete.cases(mat1)
[1] TRUE TRUE TRUE FALSE
## Memilih baris yang tidak terdapat missingness
mat1[complete.cases(mat1),]
[,1] [,2] [,3] [,4] [,5]
[1,] 1 5 9 13 17
[2,] 2 6 10 14 18
[3,] 3 7 11 15 19
If you live to be a hundred, I want to live to be a hundred minus one day so I never have to live without you.
A.A. Milne