Javanka Amedeo Cavendish
Tujuan dari analisis ini adalah untuk memahami karakteristik dataset Iris melalui langkah-langkah pra-pemrosesan data dan eksplorasi data (EDA). Analisis ini akan membantu kita dalam mengidentifikasi pola dan hubungan antar fitur yang ada dalam dataset.
Dataset Iris adalah salah satu dataset yang paling dikenal dalam komunitas pembelajaran mesin. Dataset ini terdiri dari 150 sampel bunga iris dengan empat fitur: sepal length, sepal width, petal length, dan petal width, serta satu kolom target yang menunjukkan spesies bunga (setosa, versicolor, dan virginica).
Untuk memulai proyek analisis data dari awal hingga eksplorasi data (EDA), berikut adalah langkah-langkah yang perlu dilakukan. Proses ini akan mencakup pengunduhan dataset terbuka, pra-pemrosesan data, dan analisis data eksplorasi. Saya akan menggunakan Python dengan pustaka seperti pandas, numpy, matplotlib, dan seaborn.
1.Pilih dan Unduh Dataset
Saya mengunduh dataset di Keagle, berikut https://www.kaggle.com/datasets/himanshunakrani/iris-dataset. Setelah diunduh, kemudian buka google colab dan upload.
2. Impor Pustaka yang Dibutuhkan
3. Membaca File Excel
4. Melihat Sekilas Data
5. Pra-pemrosesan Data (Data Cleaning), meliputi
6. Eksplorasi Data (Exploratory Data Analysis - EDA)
Berikut saya sertakan link hasil pengerjaan di google colab https://colab.research.google.com/drive/1vXodEDRDv8gacjXwR7TCrGZCttP_E6fN#scrollTo=Xe6X7l5BvbyK