Foto User
DATA PREPROCESSING AND VISUALIZATION TITANIC

Wandi Wardiman

Sosial Media


3 orang menyukai ini
Suka

Summary

Kaggle adalah situs untuk berbagi ide, mendapatkan inspirasi, bersaing dengan data scientist lain, mempelajari informasi baru dan trik coding, serta melihat berbagai contoh aplikasi data science di dunia nyata. Ada banyak kumpulan data yang dapat digunakan untuk apa saja yang sederhana seperti penjualan video game, hingga sesuatu yang lebih kompleks dan penting seperti data polusi udara. Data ini nyata dan direferensikan, sehingga Anda dapat melatih dan menguji model Anda pada proyek yang pada akhirnya dapat membantu orang-orang lain.

Kali ini saya akan membahas solusi dan analisa saya untuk salah satu kompetisi pemula terpopuler di Kaggle. yaitu the Titanic survival prediction competition.

Description

Kota Cherbourg (C) mempunyai tingkat Survival probability paling tinggi dan kota Southampton paling rendah

Kita dapat menyimpulkan sebuah hipotesis dimana mayoritas penumpang kelas satu telah berangkat dari lokasi Cherbourg dan karena mereka memiliki probabilitas kelangsungan hidup tertinggi, hal ini mengakibatkan lokasi Cherbourg memiliki probabilitas kelangsungan hidup tertinggi. Alternatifnya, mungkin ada lebih banyak penumpang kelas tiga yang berangkat dari lokasi Southampton dan karena mereka memiliki kemungkinan bertahan hidup yang paling rendah, hal ini menyebabkan lokasi Southampton memiliki kemungkinan bertahan hidup yang paling rendah.

file notebook: https://colab.research.google.com/drive/1tyHCYQhWJRVBDkkCv6N8DU3DhcxfhSFu#scrollTo=JCujJ525XmU_ 

dataset: https://www.kaggle.com/competitions/titanic/ 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science