Machine Learning
Sesuai arti harfiahnya, machine learning adalah pembelajaran mesin, di mana mesin dalam hal ini komputer dapat belajar (atau meningkatkan kinerjanya) berdasarkan data.
Outline Artikel:
Oleh Iman Jihad Fadillah · Statistisi
28 Januari 2023
Teman-teman mungkin sering mendengar kata machine learning. Sesuai arti harfiahnya, machine learning adalah pembelajaran mesin, di mana mesin dalam hal ini komputer dapat belajar (atau meningkatkan kinerjanya) berdasarkan data. Machine learning ini berfokus pada program komputer yang secara otomatis belajar dan mengenali pola kompleks dari data, kemudian membuat keputusan yang cerdas berdasarkan data.
Salah satu contoh sederhana adalah komputer yang mampu mengenali tulisan tangan/hasil foto setelah belajar dari serangkaian data tulisan tangan/hasil foto. Contoh lain adalah bagaimana mesin bisa merekomendasikan iklan-iklan di marketplace berdasarkan data riwayat-riwayat pencarian kita sebelumnya.
Konsep belajar secara otomatis pada machine learning membuatnya berbeda dengan pemrograman langsung. Pemrograman membutuhkan perintah (command) sebagai input dalam menjalankan programnya. Namun machine learning tidak memerlukan hal tersebut, machine learning merumuskan dan memutuskan keputusan berdasarkan model yang terbentuk otomatis dari data yang ada. Pada Program, input berupa command/perintah, sementara pada Machine Learning, inputnya berupa Data. Untuk ilustrasinya dapat dilihat pada gambar dibawah ini:
Dalam machine learning, data dibagi menjadi 2 jenis, yaitu Data Training (training data) dan Data Testing (test data). Data Training adalah data yang bertugas dalam pemodelan dan peningkatan kinerja model. Machine learning akan mempelajari pola-pola dari data training sehingga diperoleh kumpulan pola yang akan menjadi model.
Model yang telah diperoleh kemudian akan dicoba pada Data Testing untuk mendapatkan keputusan terkait Data Testing dan melihat tingkat keakuratan dan performa dari metode machine learning yang digunakan. Semakin banyak jumlah dari training data maka pembelajaran dari pola-pola yang didapatkan akan semakin baik dan memberikan akurasi yang semakin baik pula.
Contoh 1:
Suatu perusahaan mengumpulkan contoh atau data tulisan tangan dari 1000 orang. Dari 1000 contoh tulisan tangan yang berhasil dikumpulkan, data tulisan tangan dari 900 orang akan dijadikan sebagai Data Training dan tulisan tangan dari 100 orang lainnya akan digunakan sebagai Data Testing. Machine learning akan mempelajari pola-pola dari tulisan tangan 900 orang tersebut, misalnya bentuk a, b, …, dst itu seperti apa, huruf kapitalnya seperti apa, dan seterusnya. Dari hasil pembelajaran, akan diperoleh pola bagaimana huruf a-z, bagaimana angka 0-9, dan seterusnya sehingga didapatkanlah sebuah model berdasarkan training data.
Selanjutnya, model yang telah diperoleh berdasarkan training data akan dicoba pada Data Testing yakni data tulisan tangan dari 100 orang. Tulisan tangan dari 100 orang ini akan diidentifikasi secara otomatis menggunakan model machine learning yang telah diperoleh. Tingkat keakurasiannya tergantung metode machine learning yang digunakan.
Machine learning adalah disiplin ilmu yang saat ini sedang berkembang pesat. Di era perkembangan teknologi yang sangat pesat pula, data bertebaran di mana-mana, sehingga dengan adanya machine learning, data-data yang bertebaran tersebut dapat menjadi informasi yang lebih berguna dan bermanfaat.
Setelah memahami konsep dari machine learning, selanjutnya adalah mengenali tipe-tipe dari machine learning. Secara umum, terdapat 4 jenis dari machine learning, antara lain Supervised Leaning, Unsupervised Leaning, Semi-Supervised Learning, dan Active Learning.
Pembahasan terkait ke empat tipe machine learning tersebut akan kita jelaskan di sini satu per satu secara umum.
Supervised Learning
Supervised Leaning adalah sinomin dari classification atau klasifikasi. Pembelajaran pada Supervised Learning berasal dari training data yang sudah berlabel. Misalnya data siswa dengan berbagai variabel terkait ujian (nilai ulangan harian, nilai ulangan tengah semester, nilai ulangan akhir semester, nilai sikap) di sekolah yang berlabel lulus atau tidak lulus. Label lulus atau tidak lulus dapat representasikan sebagai “Y” dan berbagai variabel terkait ujian direpresentasikan sebagai “X”. Algoritma kemudian akan menguraikan pola yang ada dalam data dan membuat model baru yang dapat mereproduksi aturan dasar yang sama dengan data baru.
Contoh 2:
Kelas A, yang terdiri dari 30 orang siswa memilki kumpulan nilai nilai ujian (nilai ulangan harian, nilai ulangan tengah semester, nilai ulangan akhir semester, nilai sikap) yang kita buat sebagai training data. Kemudian dari data tersebut terbentuk model dari pola-pola yang teruraikan. Ketika ada 1 siswa lain masuk ke kelas A, maka dengan memasukkan “X” nilai nilai ujian (nilai ulangan harian, nilai ulangan tengah semester, nilai ulangan akhir semester, nilai sikap), siswa lain tersebut dapat secara otomatis diidentifikasi apakah “Y” akan berlabel Lulus/Tidak Lulus
Unsupervised Learning
Unsupervised Learning adalah sinonim dari clustering. Perbedaan dengan Supervised Learning adalah, pada Unsupervised Learning tidak adanya proses Label. Label dibentuk sendiri berdasarkan pengelompokan untuk menemukan kelas-kelas dalam data. Mesin harus mengungkap pola tersembunyi dan membuat label melalui penggunaan algoritma unsupervised learning.
Contoh 3:
Contoh penggunaan dari metode ini adalah pada tulisan tangan. Misalkan terdapat satu set gambar angka tulisan tangan. Dari gambar-gambar yang ada, tidak diberikan label mana angka 0, mana 1, dan seterusnya. Tapi berdasarkan kesamaan pola, mesin akan melabelkan angka-angka tersebut ke dalam cluster data. Misalkan ditemukan ada 10 cluster data. Cluster ini mungkin sesuai dengan 10 digit berbeda dari 0 hingga 9. Namun, karena data tidak diberi label, model yang dipelajari tidak dapat memberitahu arti semantik dari kelompok yang ditemukan.
Semi-supervised Learning
Sesuai namanya, semi-supervised learning merupakan jenis machine learning yang menggunakan contoh data berlabel dan tidak berlabel saat mempelajari suatu model. Dalam satu pendekatan, contoh berlabel digunakan untuk mempelajari model kelas dan contoh tidak berlabel digunakan untuk memperbaiki batasan antar kelas.
Active Learning
Active Learning adalah pendekatan machine learning yang memungkinkan pengguna berperan aktif dalam proses pembelajaran. Pendekatan Active Learning dapat meminta pengguna (misalnya, domain expert) untuk memberi label pada contoh, yang mungkin berasal dari sekumpulan contoh yang tidak berlabel atau disintesis oleh learning program.
Han, J., & Kamber, M. (2012). Data Mining: Concepts and Techniques. Elsevier.
Theobald, Oliver, (2017). Machine Learning for Absolute Beginners.
Editor: Tju Ji Long · Statistisi
What you do today is important because you are exchanging a day of your life for it.
Unknown