Setelah mengunduh dataset yang diinginkan, lalu masukan dataset yang telah diunduh tersebut ke google drive supaya google colaboratory dapat mengkoneksikan data yang sebelumnya diunduh dari website Kaggle
Buka Google Colaboratory dan ketik program di bawah ini untuk mengkoneksikan Google Colaboratory dengan Google Drive
Setelah Google Colaboratory dengan Google Drive terkoneksi maka selanjutnya adalah mengimport beberapa library yang diperlukan.
Setelah library berhasil dimasukan maka selanjutnya adalah menampilkan dataset yang telah disiapkan dengan program : “df=pd.read_csv('/content/drive/My Drive/Machine Learning/diabetes_data.csv') df”
Jika ingin melihat jumlah baris dan kolom tanpa dataset maka dapat menggunakan perintah dibawah ini
Jika ingin melihat jumlah baris, kolom, nama kolom, tipe data, jumlah data, nilai non-null dan penggunaan memori maka dapat menggunakan perintah dibawah ini.
Setelah itu, masukan variable x dan y dengan perintah dibawah ini.
Setelah itu, membagi dua data menjadi data latih (training data) dan data uji (testing data) menggunakan program dibawah ini.
Setelah itu, masukan modelling ke dalam machine learning
Dikarenakan pada kali ini saya menggunakan metode K-Nearest Neighbor (KNN) dan Decision Tree maka masukan program dibawah ini untuk hasil dari metode KNN Metode KNN menghasilkan nilai akurasi 83%
Masukan program dibawah ini untuk hasil dari metode Decision Tree Metode Decision Tree menghasilkan nilai akurasi 79%
Informasi Course Terkait
Kategori: Data Science / Big Data
Course: Analisa Data Spatial Machine Learning Menggunakan R