SVM vs LSTM : Sentiment Analisys On TV Show Review

Rondi

Sosial Media


3 orang menyukai ini
Suka

Summary

Pada proyek ini akan dilakukan sentimen analisis untuk ulasan sebuah Acara Televisi di indonesia dengan menggunakan algoritma SVM dan LSTM. Dataset yang dipakai pada proyek kali ini bersumber dari kaggle dengan judul "Data Riviews Acara TV". di dalam dataset tersebut memiliki kumpulan data riview dari para netizen mengenai acara tv tersebut, entah itu ulasan yang berbentuk positif, neutral ataupun negatif.

Description

Latar Belakang

Perkembangan teknologi dan informasi yang semakin pesat salah satunya yaitu perkembangan di dunia entertainment. Semakin majunya dunia entertainment acara-acara tv khususnya di indonesia menyajikan acara tv yang baik untuk ditonton dan adapun yang kurang baik ditonton, karena hal tersebut membuat para netizen memberikan komentar nya untuk masing-masing acara tv yang ditayangkan tersebut. Berbagai macam ulasan yang dilontarkan oleh netizen, ada yang berbentuk ulasan positif, neutral dan negatif. Dengan demikian ulasan-ulasan tersebut dapat dimanfaatkan untuk dilakukanya analisis sentiment pada sebuah acara tv. Sentimen-sentimen yang diberikan bisa dijadikan acuan bagi acara-acara tv khususnya indonesia, guna menjadikan bahan evaluasi. Oleh karena itu, pada proyek ini saya akan mencoba melakukan analisis sentiment menggunakan SVM dan LTSM, supaya mengetahui mana yang lebih cocok atau lebih baik.

 

Tujuan

Adapun tujuan dari proyek ini yaitu untuk mendapatkan penilaian dari ulasan para netizen terkait acra-acara tv yang mereka tonton, serta melihat akurasi model dari LSTM dan SVM.

 

Implementasi

Terdapat beberapa tahap yang akan dilakukan, yaitu:

  1. Exploratory Data Analysis
  2. Data Cleaning and Text Preprocessing
  3. Modeling, Train and Test Data
  4. Consulation

 

Exploratory Data Analysis

Install dan Import Library

Connect ke Google dan Akses Dataset

Tampilan 5 Dataset Teratas

 

Visualisasi

Terlihat Perbandingan ulasan diatas, ternyata ulasan positif masih yang paling besar diantara yang lainnya, namun ulasan negatif juga lumayan besar.

 

Data Cleaning and Text Preprocessing

Ada beberapa Text Preprocessing yang saya gunakan, daintaranya yaitu:

  • Lowercase and Removing
  • Tokenizing and Stopword

  • Lematization and Vektorize

  • Wordcloud

 

Modeling, Train and Test Data

Neural Network

LSTM

 

SVM

Rata - Rata 80%

 

Consulation atau Result

Sebelah kiri menggunakan LSTM dan Kanan menggunakan SVM

dengan LSTM mendapatkan Akurasi sekitar 60-71 % dan SVM mendaptkan Akurasi 80%. Tentunya Akurasi tersebut masih bisa di tingkatkan kembali.

 

Kesimpulan

Kesimpulan dari Sentiment Analysis menggunakan dataset Riview Acara TV, yaitu :

Menggunakan algoritma SVM ternyata lebih baik daripada menggunakan LSTM, tetapi ini hanya berlaku pada data tersebut. dan tidak menutup kemungkinan jika menggunakan data lain dan algoritma LSTM ditingkatkan, LSTM akan jauh lebih baik daripada SVM.

 

Source code lengkap bisa kunjungi link dibawah :

https://github.com/rondimarten07/python_svm_lstm

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Dasar Pemrograman Natural Language Programming dengan Python