Muhamad Sahrul Syabani
Game adalah sebuah barang atau sesuatu yang pada umumnya digunakan untuk hiburan atau kesenangan, dan kadang-kadang digunakan sebagai alat pendidikan. Industri game juga pada jaman ini sudah mulai berkembang, terutama di indonesia. Banyak developer game yang berlomba - lomba membuat game yang banyak diminati oleh kalangan gamers, apalagi game tersebut bisa masuk kancah E-Sports. Penjualan Game juga meningkat akibat pandemi Covid 19, dikarenakan masyarakat harus tetap berada dirumah saja, Oleh karena itu dibuatkan dataset penjualan video game untuk memudahkan Developer Dan Publisher melihat informasi, Dan portofolio ini juga menggunakan Teknik Klasifikasi dengan Metode K-Means Clustering, supaya memudahkan mengelompokan dataset tersebut.
Industri game merupakan salah satu jenis industri di dunia hiburan yang mengalami perkembangan pesat. Industri game tumbuh dengan cepat seiring dengan berkembangnya inovasi teknologi digital. Game pada pandangan masa lalu dianggap sebagai permainan anak-anak telah dialihkan menjadi aspek rutin kehidupan hampir semua orang, dan terus berkembang sesuai dengan permintaan untuk lebih baru, lebih cepat, dan permainan yang lebih realistis dan menghibur. Semakin banyaknya platform game membuat para developer game semakin susah untuk mencari pasar penjualan gamenya. Maka dari itu diperlukan data yang sesuai untuk mencoba memilih platform yang ramai dan di daerah mana saja yang berdampak ramai nya penjualan video game tersebut
Dataset yang digunakan pada proyek ini berupa sebuah data nama - nama video game yang berisi data penjualan, genre, platform sekaligus tahun rilisnya video game tersebut.
Pada tahap ini akan dilakukan penginputan dataset berupa data video game.
Pada tahap ini akan dilakukan preprocessing terhadap data video game menggunakan metode binning.
Pada tahap ini akan dilakukan pengklasifikasian video game pada tersebut menggunakan metode Naive Bayes dan Regresi Logistik, dimana data kolom dipilih lalu di train untuk dibuat prediksi dan validasi, yang selanjutnya akan muncul akurasi skor nya.
Untuk dataset yang digunakan , berasal dari kaggle https://www.kaggle.com/datasets/gregorut/videogamesales. Dataset tersebut bersifat public yang berisikan data penjualan, genre, platform sekaligus tahun rilisnya video game tersebut. Berdasarkan hasil eksperimen dengan memilih data genre dan nama video game, dilakukan proses klasifikasi dengan menggunakan akurasi skor Multinomial Naive Bayes dan Logistic Regression. Sehingga diperoleh skor berikut.
Accuracy Scores:
Multinomial Naive Bayes: 0.63
Logistic Regression: 0.67
Regresi Logistik mencapai skor akurasi yang lebih tinggi lebih dari 77% dan akan dipilih.
Setelah berhasil melakukan klasifikasi pada data, bagian selanjutnya yang akan dilakukan adalah visualisasi data. Berikut kami lampirkan contoh hasil visualisasi data penjualan video game dengan mengambil data nama game dan genre game.
\
Visualisasi Penjualan Video game bedasarkan Platfrom.