Heart Failure Prediction using ANN

Riandra Putra Pratama

Sosial Media


0 orang menyukai ini
Suka

Summary

Data set yang digunakan yaitu dataset Heart Disease yang berasal dari Kaggle. Project ini ditujukan sebagai tugas akhir course Deep Learning dengan Keras Python pada project ini akan melakukan prediksi menggunakan algoritma ANN menggunakan Python dengan dataset tersebut.
 

Description

Mengimport Library dan Membaca Dataset


 

Penjelasan:

Import Library

Langkah pertama yang dilakukan adalah mengimport library yang diperlukan untuk melakukan prediksi ini. Karena prediksi menggunakan algoritma ANN maka akan memanggil library tensorflow untuk membangun model deep learning.

Import Dataset

Langkah selanjutnya yaitu mengimport dataset dan menampilkannya menggunakan pandas. Data yang digunakan adalah data heart disease. Terdapat beberapa column dalam dataset yaitu :

Target feature :

  • HeartDisease

feature:

  • Age
  • Sex
  • ChestPainType
  • RestingBP
  • MaxHR
  • FastingBS
  • ExerciseAgina
  • Oldpeak
  • ST_Slope

 

Melihat tipe data dan informasi lebih lengkap dari data



Penjelasan : 

Tahapan diatas merupakan tahapan untuk mengecek ukuran data (jumlah baris dan kolom) dan menampilkan informasi secara detail keseluruhan dataframe, seperti no index, nama – nama kolom, tipe data,dll.

 

Mengidentifikasi Missing Value dan menlihat apakah terdapat duplikasi data

Penjelasan:

Tahapan diatas dilakukan untuk mengecek apakah ada missing value dalam dataframe, ternyata setelah dicek tidak terdapat missing value. Tahapan selanjutnya dilakukan untuk untuk mengecek apakah ada duplikasi data dalam dataframe, ternyata setelah dicek tidak terdapat duplikasi data

Label Encoder


 

Tahapan diatas merupakan tahapan untuk mengubah kolom yang memiliki value categorical menjadi numerik. Tahapan itu dapat dilakukan encoding dengan menggunakan Library LabelEncoder untuk metransformasi label kata menjadi bentuk numerik.

Melihat deskripsi data


Penjelasan:

Tahapan diatas dilakukan untuk mengecek apakah ada duplikasi data dalam dataframe, ternyata setelah dicek tidak terdapat duplikasi data dan melihat data secara statistik, seperti melihat mean,median,max,min,dll dalam dataframe.

Feature Selection, feature scaling dan Splitting Data


Penjelasan :

Tahapan diatas yaitu menentukan kolom mana yang menjadi target dan kolom mana yang menjadi feature. Kemudian membagi data latih dan data uji sebesar 80% : 20% dan mengecek ukuran data latih dan data uji. Kemudian melakukan tahapan feature scaling agar jarak dari setiap nilai dalam kolom tidak terlalu jauh. Untuk feature scaling sendiri menggunakan StandarScaler.


Membangun model ANN

Penjelasan :

Dikarenakan ANN merupakan fully connected neural network, maka menggunakan class tf.keras.layers.Dense() dengan jumlah neuron sebanyak 6 dan menggunakan activation function “ReLU” dan untuk output menggunakan activation ‘sigmoid’ dimana akan mengeluarkan hasil output 0 atau 1.

Langkah berikutnya adalah model compiling, dimana proses tersebut bertujuan menghubungkan model dengan optimizer (akan melakukan iterative untuk memperbarui weight network)  dan memilih loss function.

Prediksi

penjelasan:

Langkah selanjutnya adalah melakukan prediksi terhadap data dan melihat perbandingan antara nilai aktual dan nilai prediksi.

Evaluasi


Penjelasan :

Untuk mengukur kinerja dari model maka digunakan confusion matrix untuk mengetahui nilai akurasi,precision,recall, dan f1-score. Didapatkan hasil seperti diatas.


 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Deep Learning Dengan Keras Python