Photo by Charles Deluvio on Unsplash
Sebagai seorang ahli data di jaman modern, kemampuan mengolah data dan membuat model sudah seperti kewajiban. Kemajuan teknologi membuat pekerjaan pemrosesan data lebih mudah tetapi dengan kemajuan ini juga muncul banyak istilah baru.
Di era Big Data seperti sekarang, kita sudah sering mendengar istilah Machine Learning ataupun Artificial Intelligence. Seseorang yang tertarik dengan bidang Machine Learning dan mempelajari lebih mendalam akan menemui istilah Supervised Learning dan Unsupervised Learning.
Apakah kalian tahu perbedaan dari Supervised Learning dan Unsupervised Learning? Jika belum, mari kita pelajari lebih lanjut.
Supervised Learning dan Unsupervised Learning
Secara umum, model Machine Learning dapat dibedakan tergantung dari pengunaannya — seperti Supervised dan Unsupervised, mereka adalah istilah yang digunakan untuk memisahkan model dalam fungsi tertentu.
Dengan singkat, kita bisa mengatakan bahwa Supervised Learning adalah machine learning model yang membutuhkan data target sedangkan Unsupervised Learning tidak memerlukan data target. Walau begitu, apakah hanya sampai disitu perbedaanya? sebenarnya, perbedaanya lebih mendalam dari itu. Mari kita ulas satu-satu dibawah.
Konsep Supervised Learning dan Unsupervised Learning
Secara konsep Supervised Learning adalah Machine Learning model yang mempelajari data dengan label atau target dimana evaluasi model tersebut akan berdasarkan target ini. Sebaliknya Unsupervised Learning adalah Machine Learning Model yang mempelajari pola data tanpa adanya target data.
Model
Model-model di Supervised Learning membutuhkan data training berupa input data dan target data yang diinginkan. Model ini dilatih untuk melakukan prediksi berdasarkan pola yang ditemukan dalam menjawab data target.
Sedangkan Unsupervised Learning hanya memerlukan data input tanpa contoh target data. Model ini hanya mencoba menemukan pola dan menemukan insight penting dari data. Seringkali, proses ini disebut juga sebagai data mining.
Training Data
Supervised Learning menggunakan data training untuk membuat machine learning model dan model ini akan digunakan untuk diuji pada data test. Unsupervised Learning tidak menggunakan data training dan hanya tergantung pada data test sehingga kita tidak bisa melakukan evaluasi terhadap model.
Algoritma
Contoh algoritma model dari Supervised Learning adalah algoritma klasifikasi untuk memprediksi fitur kategori (Ya/Tidak, Mau/Tidak Mau, dll.) dan Regresi untuk memprediksi fitur kontinu (harga rumah, harga saham, dll.). Untuk Unsupervised Learning, Clustering untuk melakukan segmentasi data (segmentasi pelanggan, segmentasi risiko, dll.) dan Dimensional Reduction.
Contoh model yang sering diaplikasikan adalah:
Supervised Learning: Linear Regression, Logistic Regression, Random Forest, XGBoost, K-NN, SVM
Unsupervised Learning: K-Means, DBSCAN, PCA, SVD
Evaluasi
Model dari Supervised Learning dievaluasi berdasarkan dari hasil prediksi yang dilatih menggunakan Training Data dan dibandingkan hasilnya dengan prediksi oleh Test data. Sedangkan Unsupervised Learning harus di evaluasi secara subjektif untuk mengetahui apakah prediksi yang dilakukan telah sesuai karena pengukuran evaluasi secara statistik pada unsupervised learning tidak memiliki jawaban yang benar.
Kesimpulan
Supervised Learning dan Unsupervised memiliki perbedaan mendasar yang membedakan mereka. Di artikel ini, saya telah mencoba menjelaskan perbedaan mereka berdasarkan:
Konsep
Model
Training Data
Algoritma
Evaluasi
Semoga membantu!
Comments