M.Rafly Rahman
Dataset "Heart Failure Clinical Records" terdiri dari data kesehatan pasien dengan 13 fitur. Proyek ini bertujuan untuk mengeksplorasi data, menganalisis korelasi antar variabel, dan memvisualisasikan distribusi data untuk memahami faktor-faktor yang berkontribusi terhadap peristiwa kematian (DEATH_EVENT).
Dataset Heart Failure Clinical Records adalah kumpulan data kesehatan pasien yang mencakup 13 fitur penting, seperti usia, tekanan darah tinggi, kadar natrium serum, dan fraksi ejeksi. Proyek ini bertujuan untuk melakukan eksplorasi mendalam terhadap data, menganalisis hubungan antar variabel secara statistik, dan menyajikan visualisasi distribusi data yang informatif. Dengan pendekatan ini, kami berharap dapat mengidentifikasi faktor-faktor utama yang secara signifikan mempengaruhi terjadinya peristiwa kematian (DEATH_EVENT) pada pasien, serta memberikan wawasan yang bermanfaat bagi pengelolaan risiko kesehatan kardiovaskular.
Dataset berisi 299 baris dan 13 kolom, semuanya bertipe numerik. Contoh data dapat divisualisasikan menggunakan format tabel berwarna gradasi merah.
Usia: Rata-rata 60.83, nilai maksimum 95.
Creatinine Phosphokinase: Rata-rata 581.83, maksimum 7861.
Tidak ada nilai yang hilang.
Korelasi antara fitur-fitur seperti serum_creatinine (positif) dan ejection_fraction (negatif) terhadap DEATH_EVENT dapat diidentifikasi dengan visualisasi heatmap.
from scipy.stats import chi2_contingency
,
Korelasi: serum_creatinine dan ejection_fraction memiliki korelasi signifikan terhadap risiko kematian.
Distribusi Data: Pasien yang meninggal cenderung memiliki usia lebih tinggi, level serum_creatinine yang lebih tinggi, dan fraksi ejeksi yang lebih rendah.
Penggunaan Categorical Encoding: Mengoptimalkan tipe data kategorikal membantu analisis lebih efisien.