Machine Learning: Titanic Dataset

annisa zalfa salsabila

Sosial Media


1 orang menyukai ini
Suka

Summary

RMS Titanic adalah sebuah kapal penumpang super Britania Raya yang tenggelam di Samudra Atlantik Utara pada tanggal 15 April 1912 setelah menabrak sebuah gunung es pada pelayaran perdananya dari Southampton, Inggris ke New York City. Tenggelamnya Titanic mengakibatkan kematian sebanyak 1.514 orang

Dalam Portofolio ini, Saya akan menganalisa dampak usia, jenis kelamin, kelas tiket pada peluang bertahan hidup para penumpang RMS Titanic. Portofolio ini disusun untuk menyelesaikan Tugas Akhir Course Masterclass Datascience

Description

RMS Titanic adalah sebuah kapal penumpang super Britania Raya yang tenggelam di Samudra Atlantik Utara pada tanggal 15 April 1912 setelah menabrak sebuah gunung es pada pelayaran perdananya dari Southampton, Inggris ke New York City. Tenggelamnya Titanic mengakibatkan kematian sebanyak 1.502 dari 2224 Penumpang dan Awak Kapal.

Dalam Portofolio ini, Saya akan menganalisa dampak usia, jenis kelamin, kelas tiket pada peluang bertahan hidup para penumpang RMS Titanic.

 

Data Dictionary

Variable Notes

 

Data Cleaning

Pertama, saya import library pandas, seaborn, matplotlib and NumPy.

Seaborn dan Matplotlib digunakan untuk Data Visualization dan Pandas digunakan untuk Data Cleaning.

Dari tabel di atas, dapat terlihat bahwa pada kolom “Age”, “Cabin”, dan “Embarked” terdapat missing values. Maka saya menghilangkan kolom yang memiliki missing values terbanyak serta kolom yang tidak saya butuhkan.

 

Data Visualization

Dari data di atas dapat disimpulkan bahwa gender penuumpang RMS Titanic adalah 164,8% Wanita dan 135,2% Laki-laki.

 

Data pada kolom “Survived” menunjukan 0 untuk penumpang yang tidak selamat dan 1 untuk penumpang yang selamat. Berikut merupakan grafik penumpang selamat dan tidak selamat berdasarkan Pclass nya.


Tingkat Penumpang Selamat berdasarkan Gender

Embarkasi

Berdasarkan data di atas, dapat disimpulkan bahwa:

  1. Sejumlah 168 penumpang embarkasi dari Cherbourg
  2. Sejumlah 77 penumpang embarkasi dari Queenstown
  3. Sejumlah 644 penumpang embarkasi dari Southampton

 

 

Kesimpulan

Dari Data yang sudah dijabarkan, dapat disimpulkan bahwa faktor kemungkinan penumpang selamat cukup bervariasi, mulai dari jenis kelamin, embarkasi (keberangkatan), dan kelas tiket.

  1. Gender
    Penumpang Wanita memiliki peluang selamat yang lebih tinggi dibanding dengan penumpang Laki-laki.

     2. Kelas
         Penumpang yang berada di Class 3 memiliki peluang yang lebih rendah untuk selamat jika dibandingkan dengan penumpang di Class 1.

 

referensi:
https://www.kaggle.com/competitions/titanic/data

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Master Class Data Science