Izhar Kurniawan
Proyek ini bertujuan untuk mengembangkan model prediksi kematian penumpang kapal Titanic menggunakan algoritma klasifikasi Random Forest. Data penumpang Titanic seperti nama, usia, jenis kelamin, dan kelas kabin akan digunakan sebagai fitur untuk melatih model klasifikasi. Model yang telah dilatih akan digunakan untuk memprediksi apakah seorang penumpang akan selamat atau meninggal dalam bencana kapal Titanic berdasarkan fitur-fitur tersebut. Tujuan akhir proyek ini adalah untuk menghasilkan model klasifikasi yang akurat dalam memprediksi kematian penumpang di dalam kapal Titanic.
Pertama-tama, dataset Titanic dimuat menggunakan library Pandas.
Kemudian, dilakukan beberapa pra-pemrosesan data seperti menghapus data yang hilang dan kolom yang tidak relevan, serta mengubah fitur kategorikal seperti jenis kelamin dan pelabuhan keberangkatan menjadi numerik.
Selanjutnya, dataset dibagi menjadi dua bagian, yaitu fitur dan target. Fitur berisi seluruh kolom pada dataset kecuali kolom "Survived", sedangkan target hanya berisi kolom "Survived".
Dataset juga dibagi menjadi data pelatihan dan pengujian menggunakan fungsi train_test_split dari scikit-learn. Data pelatihan digunakan untuk melatih model klasifikasi, sedangkan data pengujian digunakan untuk menguji akurasi model.
Setelah itu, model klasifikasi Random Forest dibuat menggunakan fungsi RandomForestClassifier dari scikit-learn dengan n_estimators=100 dan max_depth=5. Model tersebut kemudian dilatih menggunakan data pelatihan.
Setelah model dilatih, dilakukan prediksi pada data pengujian menggunakan fungsi predict dari scikit-learn. Akurasi model dihitung menggunakan fungsi score dari scikit-learn.
Dengan menguji akurasi model pada data pengujian, kita dapat mengetahui seberapa baik model klasifikasi Random Forest dalam melakukan prediksi terhadap data yang belum pernah dilihat sebelumnya.