Riandra Putra Pratama
Data set yang digunakan yaitu dataset Heart Disease yang berasal dari Kaggle. Project ini ditujukan sebagai tugas akhir course Deep Learning dengan Keras Python pada project ini akan melakukan prediksi menggunakan algoritma ANN menggunakan Python dengan dataset tersebut.
Mengimport Library dan Membaca Dataset
Penjelasan:
Import Library
Langkah pertama yang dilakukan adalah mengimport library yang diperlukan untuk melakukan prediksi ini. Karena prediksi menggunakan algoritma ANN maka akan memanggil library tensorflow untuk membangun model deep learning.
Import Dataset
Langkah selanjutnya yaitu mengimport dataset dan menampilkannya menggunakan pandas. Data yang digunakan adalah data heart disease. Terdapat beberapa column dalam dataset yaitu :
Target feature :
feature:
Melihat tipe data dan informasi lebih lengkap dari data
Penjelasan :
Tahapan diatas merupakan tahapan untuk mengecek ukuran data (jumlah baris dan kolom) dan menampilkan informasi secara detail keseluruhan dataframe, seperti no index, nama – nama kolom, tipe data,dll.
Mengidentifikasi Missing Value dan menlihat apakah terdapat duplikasi data
Penjelasan:
Tahapan diatas dilakukan untuk mengecek apakah ada missing value dalam dataframe, ternyata setelah dicek tidak terdapat missing value. Tahapan selanjutnya dilakukan untuk untuk mengecek apakah ada duplikasi data dalam dataframe, ternyata setelah dicek tidak terdapat duplikasi data
Label Encoder
Tahapan diatas merupakan tahapan untuk mengubah kolom yang memiliki value categorical menjadi numerik. Tahapan itu dapat dilakukan encoding dengan menggunakan Library LabelEncoder untuk metransformasi label kata menjadi bentuk numerik.
Melihat deskripsi data
Penjelasan:
Tahapan diatas dilakukan untuk mengecek apakah ada duplikasi data dalam dataframe, ternyata setelah dicek tidak terdapat duplikasi data dan melihat data secara statistik, seperti melihat mean,median,max,min,dll dalam dataframe.
Feature Selection, feature scaling dan Splitting Data
Penjelasan :
Tahapan diatas yaitu menentukan kolom mana yang menjadi target dan kolom mana yang menjadi feature. Kemudian membagi data latih dan data uji sebesar 80% : 20% dan mengecek ukuran data latih dan data uji. Kemudian melakukan tahapan feature scaling agar jarak dari setiap nilai dalam kolom tidak terlalu jauh. Untuk feature scaling sendiri menggunakan StandarScaler.
Membangun model ANN
Penjelasan :
Dikarenakan ANN merupakan fully connected neural network, maka menggunakan class tf.keras.layers.Dense() dengan jumlah neuron sebanyak 6 dan menggunakan activation function “ReLU” dan untuk output menggunakan activation ‘sigmoid’ dimana akan mengeluarkan hasil output 0 atau 1.
Langkah berikutnya adalah model compiling, dimana proses tersebut bertujuan menghubungkan model dengan optimizer (akan melakukan iterative untuk memperbarui weight network) dan memilih loss function.
Prediksi
penjelasan:
Langkah selanjutnya adalah melakukan prediksi terhadap data dan melihat perbandingan antara nilai aktual dan nilai prediksi.
Evaluasi
Penjelasan :
Untuk mengukur kinerja dari model maka digunakan confusion matrix untuk mengetahui nilai akurasi,precision,recall, dan f1-score. Didapatkan hasil seperti diatas.