Muhammad Iksan Maulana
Overview
Ilmu data alias data science merupakan fokus studi yang berhubungan dengan besarnya volume data menggunakan teknik modern demi menemukan pola-pola tak terlihat, mendapat informasi bermakna, serta membuat keputusan bisnis dengan informasi tersebut.
Algoritma pembelajaran mesin yang kompleks digunakan dalam data science untuk membangun model yang prediktif. Adapun, data yang digunakan untuk analisis bisa berasal dari bermacam sumber dan tampak dalam berbagai format.
penugasan : buatlah klasifikasi data menggunakan machine learning dengan jupyter notbook atau google collaboratory dengan mengambil dataset dari Kaggle.com.
Mengklasifikasikan jenis penyakit jantung atau penyebab penyakit jantung
Memanggil dataset yang akan di eksekusi melalui google Drive
Di data 5 teratas ini ada variabel age, sex, dll jadi variabel variabel ini untuk menentukan targetnya yaitu berupa class, apakah target nya sakit jantung atau tidak , jadi nanti disini target nya berupa nilai 1 dan 0.
Proses filter
Untuk menampilkan data misal data umur, age nya itu di atas 40 dan di bawah 50 tahun jadi kita bisa menggunakan perintah filter
Jadi ini adalah data data penyakit jantung yang umur nya di atas 40 dan di bawah 50. Lalu kita akan memisahkan data parameter dengan target nya , kita bagi 2 target nya itu bisa berisi angka 1 yaitu yang mempunyai penyakit jantung dan 0 itu tidak mempunyai penyakit jantung Jadi dari data di atas dari data age, dan sex , kita bisa memprediksi kira kira berdasarkan atribut atribut ini apakah seseorang itu terkena penyakit jantung atau tidak.
Pemisahan data parameter dan data target nya
Kita buat sebuah variabel x untuk menyimpan data parameter dan y untuk data target kita.
Pada gambar di atas parameter dan atribut target nya sudah terpisah jadi disini adalah data data yang akan kita lakukan klasifikasi berdasarkan target nya apakah parameter ini masuk ke target 1 atau 0
Ini adalah parameter yang di siapkan untuk menampung hasil pembagian data nya data training dan data testing
Klasifikasi model SVM
Training data utama yang awal kita bagi 2, 90% sebagai data training dan 10 % sebagai data testing
Prediksi
Dari model data yang sudah di training, akan dihasilkan sebuah model lalu kita test dari model ini apakah hasil prediksi nya benar atau tidak berdasarkan data test yang sudah kita bagi 2
Akurasi prediksi
Dari sini bisa kita lihat berdasarkan data yang ada nilai akurasinya itu ada sekitar 0,64.... Atau 60 %
Jadi hasil prediksi menggunakan model SVM berdasarkan data test dan data training yang kita gunakan adalah 60%