Rifa Adinta Farda
Melakukan analisis sentimen pada review suatu produk menggunakan model Support Vector Machine dan Binary Logistic Regression
Support Vector Machine (SVM) merupakan salah satu metode dalam supervised learning yang digunakan untuk klasifikasi dan regresi. Secara matematis, SVM memiliki konsep yang lebih matang dan jelas dibanding teknik klasifikasi lainnya. SVM digunakan untuk mencari hyperplane terbaik dengan memaksimalkan jarak antar kelas.
Logistic regression adalah jenis analisis statistik yang sering digunakan data analyst untuk pemodelan prediktif. Dalam pendekatan analitik ini, variabel dependennya terbatas atau kategoris. Disini yang kita gunakan lebih tepatnya adalah Binary Logistic Regression.
Langkah - langkah :
Mount data ke gdrive
Install library yang diperlukan
Menampilkan dataset
memilih kolom yang akan digunakan yaitu “Review" dan “Rating”
Pelabelan
melakukan pelabelan pada kolom rating dengan 1 (negatif) jika nilai kurang dari 3, dan 0 (positif)
Preprocessing data
Melakukan Klasifikasi
Didapat akurasi final dengan model Logistic Regression lebih akurat dibanding SVM yaitu sebesar 0,97%, sedangkan SVM sebesar 0,96%.
Link Program : https://colab.research.google.com/drive/1QWHYJlOteDnvIts21WkCDN6v0M8BUwh5?usp=sharing
Link Dataset : https://www.kaggle.com/datasets/nicapotato/womens-ecommerce-clothing-reviews