Product Review Sentiment Analysis using SVM and LR

Rifa Adinta Farda

Sosial Media


5 orang menyukai ini
Suka

Summary

Melakukan analisis sentimen pada review suatu produk menggunakan model Support Vector Machine dan Binary Logistic Regression 

Description

Support Vector Machine (SVM) merupakan salah satu metode dalam supervised learning yang digunakan untuk klasifikasi dan regresi. Secara matematis, SVM memiliki konsep yang lebih matang dan jelas dibanding teknik klasifikasi lainnya. SVM digunakan untuk mencari hyperplane terbaik dengan memaksimalkan jarak antar kelas. 

Logistic regression adalah jenis analisis statistik yang sering digunakan data analyst untuk pemodelan prediktif. Dalam pendekatan analitik ini, variabel dependennya terbatas atau kategoris. Disini yang kita gunakan lebih tepatnya adalah Binary Logistic Regression.

Langkah - langkah :

Mount data ke gdrive

Install library yang diperlukan

Menampilkan dataset

memilih  kolom yang akan digunakan yaitu “Review" dan “Rating”

Pelabelan

melakukan pelabelan pada kolom rating dengan 1 (negatif) jika nilai kurang dari 3, dan 0 (positif)

Preprocessing data

  • install library stopword
  • melakukan case folding untuk lowercase
  • removing number
  • removing punctuation
  • removing whitespace
  • separating sentence dengan split method
  • tokenizing dengan nltk
  • filtering dengan nltk

Melakukan Klasifikasi

Didapat akurasi final dengan model Logistic Regression lebih akurat dibanding SVM yaitu sebesar 0,97%, sedangkan SVM sebesar 0,96%.

Link Program : https://colab.research.google.com/drive/1QWHYJlOteDnvIts21WkCDN6v0M8BUwh5?usp=sharing

Link Dataset : https://www.kaggle.com/datasets/nicapotato/womens-ecommerce-clothing-reviews

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Python Data Science untuk Pemula