Machine Learning mengunakan K-Means Clustering

Eka Permatasari

Sosial Media


1 orang menyukai ini
Suka

Summary

K-Means Clustering merupakansalah satu algoritma Machine Learning yang digunakan untuk melakukan clustering berdasarkan mean terdekat. 

Jumlah clusterbiasanya akan ditentukan di awal, barulahseluruh data akan dibagikan ke cluster yang tersedia dengan memperhatikan kedekatan jaraknya. Metode ini termasuk ke dalam bagian dari algoritma Unsupervised Learning, dimana datanya tidak memiliki label sama sekali, sehingga dikelompokkan berdasarkan kemiripan karakteristiknya.

Description

Klasifikasi Dataset Iris dengan Machine Learning pada Pemrograman python

  • Langkah pertama buka google colab, Klik file -> new notebook 

  • Unduh datasetdi Kaggle.com, lalu masukkan file dataset yang sudah di unduh ke google drive, setelah itu Hubungkan google drive dengan google collab

 

  • Import library pandasdan unzip drivenyaagar menghasilkan data csv, dan ekstrak dengan nama iris.csv

  • Panggil dengan library pandas,simpan di df, atau suatu variabel, sehinggakita bisa melihat data iris yang tersusun atas 4/5 parameter

  • Kita gunakan Teknikvisualisasi scatter plot untuk melakukan visualisasi fitur dari sepal_width dan sepal_length, ada berada pada ruang vektor dimana 

 

  • Visualisasi data berdasarkan petal_length dan petal_width 

 

  • Coba kita gunakan visualisasi data jenis pair plot

  • Coba dapatkan data untuk mendapatkan nilai statistik

  • Setelah itu Saya akan mencoba pisahkan antara data dan label
  • Langkah selanjutnya membuat model machine learningdengan algoritma decision tree

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science