Starbucks Tea Classification

Bagja Lazwardi

Sosial Media


0 orang menyukai ini
Suka

Summary

Teh adalah minuman yang mengandung kafeina, sebuah infusi yang dibuat dengan cara menyeduh daun, atau tangkai daun. Teh yang berasal dari tanaman teh dibagi menjadi empat kelompok. Teknik klasifikasi ini dapat pula digunakan untuk melakukan prediksi atas informasi yang belum diketahui sebelumnya. Data Mining yaitu untuk menggolongkan data. ANN dapat digunakan untuk melakukan prediksi atau peramalan. ANN yang digunakan untuk memecahkan berbagai disiplin ilmu seperti bidang komputer, teknik, perdagangan dan lain-lain. Dimana pada kegiatan ini akan mencoba menggunakan ANN untuk proses klasifikasi teh pada data menu Starbucks dimana datanya itu terdiri atas kumpulan informasi kandungan dari setiap menu yang ada. Sehingga diharapkan dapat data pengelompokkan antara mana yang merupakan kategori teh atau bukan teh.

Description

Disini kami akan melakukan proses klasifikasi pada data menu minuman yang ada pada Starbucks apakah pada menu tersebut merupakan masuk dalam kategori “teh” atau bukan. Dimana gambaran datanya sebagai berikut

Berdasarkan info tersebut diketahui ternyata terdalam kolom yang datanya tidak rata pada Caffeine (mg), sehingga akan dilakukan prosess fill missing values sehingga membuat kolom tidak ada NaN. Untuk mulai klasifikasi berapa banyak teh pada menu yang ada, pertama akan dilakukan pembuatan label pada teh sehingga didapatkan sebagai berikut:

Setelah hal tersebut dilakukan maka, akan dilakukan proses endocing features yang akan memfokuskan data untuk klasifikasi dengan membuat kolol Beverage dan Beverage_prep untuk membantu menganalisa dari data kolom calories sampai caffeine sehingga bisa mengklasifikasi mana yang teh atau bukan. Setelah itu melakukan final cleaning untuk membuat data siap untuk di-modelkan.

Berdasarkan proses tersebut maka dari model yang sudah dibuat akan menghasilkan evaluate sebagai berikut:

Sehingga saat dibuat visualnya dengan heatmap akan terbentuk sebagai berikut:

Dari hasil visual tersebut terlihat bahwa pada menu yang ada, yang termasuk ke dalam kategori teh lebih sedikit dari pada kategori selain teh. Sehingga proses klasifikasi dengan menggun akan ANN pada data menu starbuck ini bisa digunakan.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Machine Learning For Beginner