MEGA NUR OKTAVIANI
Pada portofolio ini, saya akan mengklasifikasi data menggunakan Machine learning dengan Jupyter Notebook pada Google Colaboratory. Data yang saya gunakan adalah Heart Disease Dataset yang bersumber dari kaggle.com.
Data Classification Using Python on Google Colaboratory
Study Case: Heart Disease-Dataset
Sebelum membahas lebih lanjut, kita harus mengetahui terlebih dahulu apa itu klasifikasi dan apa saja fungsinya. Menurut Kamus Besar Bahasa Indonesia (KBBI) klasifikasi adalah penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Singkatnya, klasifikasi merupakan sesuatu yang dikelompokkan berdasarkan kelas atau ciri-ciri yang sama. Fungsi dan tujuan klasifikasi antara lain:
Itulah gambaran singkat mengenai klasifikasi dan tujuannya. Kemudian, berikut ini akan saya paparkan bagaimana cara mengklasifikasi data menggunakan Jupyter Notebook. Dalam tugas kali ini, saya menggunakan Google Colab. Berikut adalah Langkah-langkahnya:
1. Masuk ke Google Colaboratory. Anda dapat membukanya langsung di google chrome. kemudian, setelah berhasil masuk hubungkan Google Colab dengan Google Drive Anda.
2. Download dataset dari https://www.kaggle.com/datasets/johnsmith88/heart-disease-dataset. Lalu klik tombol download yang ada pada sisi kanan atas.
3. Simpan file hasil download di Google drive Anda. Disini saya menyimpannya di My Drive > dataset
4. Kembali ke aplikasi Google Colab. Lalu import pandas untuk membaca data yang telah Anda download tadi.
5. Jika sudah menampilkan gambar seperti di atas, Anda dapat memfilter data sesuai dengan jenis dan kebutuhan. Contoh disini saya memfilter data pasien penyakit jantung yang umurnya di atas 40 tahun sampai 50 tahun.
6. Untuk Langkah selanjutnya adalah memisahahkan variable x dan y.
Jika data variable x atau y masih berkumpul seperti contoh di atas, maka kita perlu untuk mengacaknya. Karena, data yang berkumpul seperti di atas kurang baik untuk Analisa data. Untuk mengacaknya Anda dapat mengaktifkan library sklearn.
7. Setelah Anda bagi data menjadi data training dan data testing, Langkah berikutnya adalah melakukan klasifikasi mengaktifkan package StandardScaler dari SKlearn dan menuliskan syntax untuk mengubah skala data. Kemudian mengaktifkan package untuk klasifikasi KNN dengan mengimport package KNeighbors dari SKlearn.
Didapatkan nilai precision sebesar 0,86 yang artinya nilai keakuratan hasil prediksi yaitu sebesar 86%. Demikian cara mengklasifikasi data menggunakan machine learning dengan Jupyter Notebook pada Google Colaboratory.