Khusnul Latifah
Dataset yang digunakan dalam klasifikasi data ini bersumber dari Kaggle dengan judul “Heart Attack Analysis & Prediction Dataset” atau dapat mengakses link https://www.kaggle.com/datasets/rashikrahmanpritom/heart-attack-analysis-prediction-dataset
Komponen yang ada dalam dataset ini yaitu Age, Sex, ca (number of major vessels), cp (chest pain), trtbps (resting blood pressure), chol (cholestoral in mg/dl fetched via BMI sensor), fbs (fasting blood sugar > 120 mg/dl), rest_ecg (resting electrocardiographic results), thalach (maximum heart rate achieved), dan target dimana 0= less chance of heart attack 1= more chance of heart attack
Langkah 1 – Load Dataset
Setelah mendownload dataset dari Kaggle dan mengekstrak file, upload file yang berformat csv ke google colab. Kemudian rename file tersebut dengan nama “data.csv” agar mempermudah dalam memanggil data. Kemudian panggil dataset tersebut dengan formula seperti di atas.
Langkah 2 – Melihat Baris dan Kolom
Dari nilai property shape yang terlihat diatas, memberikan informasi bahwa dataset memiliki 303 baris/record dan 14 kolom
Langkah 3 – Melihat index dalam kolom
Disini terlihat kolom apa saja yang ada dalam dataset tersebut yaitu ada age, sex, cp, trtbps, chol, fbs, restecg, thalachh, exng, oldpeak, slp, caa, thall, dan output.
Langkah 4 – Melihat 5 Baris Teratas
Setelah mengetahui kolom apa saja dalam dataset, kemudian melihat 5 baris pertama atau teratas dari dataset dengan perintah head().
Langkah 5 – Mengkategorikan Data
Disini dilakukan pengkodean data dari nama kolom output, dimana ketika lebih kecil kemungkinan terkena serangan jantung diberi kode 1, sedangkan jika lebih banyak kemungkinan terkena serangan jantung maka diberi kode 0.
Langkah 6 – Statistik Data
Selanjutnya, melihat statistik data dengan perintah df.describe().T. Sehingga bisa melihat count, mean, std, dan min dari data.
Langkah 7 – Visualisasi Data
Pada visualisasi data ini, kolom yang dipilih hanya 7 kolom yaitu 'age', 'sex', 'cp', 'trtbps', 'chol', 'fbs', 'restecg'. Pada bagian kanan terdapat “output”, angka 1 menunjukkan kemungkinan terkena serangan jantung kecil dan angka 0 menunjukkan besar kemungkinan terkena serangan jantung.
Langkah 8 – Visualisasi Data ‘Output’
Melakukan visualisasi data namun hanya pada ‘output’ saja. Dalam gambar terlihat bahwa besar kemungkinan terkena serangan jantung (0) lebih kecil daripada kecil kemungkinan terkena serangan jantung(1). Hal ini bisa dijadikan pembelajaran bahwa serangan jantung bisa menyerang segala usia, jadi penting untuk menjaga kesehatan tubuh dengan olahraga secara teratus, makan makanan yang sehat, tidur cukup, dan lainnya agar dapat terhindar dari penyakit serangan jantung.