Rondi
Pada proyek ini akan dilakukan sentimen analisis untuk ulasan sebuah Acara Televisi di indonesia dengan menggunakan algoritma SVM dan LSTM. Dataset yang dipakai pada proyek kali ini bersumber dari kaggle dengan judul "Data Riviews Acara TV". di dalam dataset tersebut memiliki kumpulan data riview dari para netizen mengenai acara tv tersebut, entah itu ulasan yang berbentuk positif, neutral ataupun negatif.
Latar Belakang
Perkembangan teknologi dan informasi yang semakin pesat salah satunya yaitu perkembangan di dunia entertainment. Semakin majunya dunia entertainment acara-acara tv khususnya di indonesia menyajikan acara tv yang baik untuk ditonton dan adapun yang kurang baik ditonton, karena hal tersebut membuat para netizen memberikan komentar nya untuk masing-masing acara tv yang ditayangkan tersebut. Berbagai macam ulasan yang dilontarkan oleh netizen, ada yang berbentuk ulasan positif, neutral dan negatif. Dengan demikian ulasan-ulasan tersebut dapat dimanfaatkan untuk dilakukanya analisis sentiment pada sebuah acara tv. Sentimen-sentimen yang diberikan bisa dijadikan acuan bagi acara-acara tv khususnya indonesia, guna menjadikan bahan evaluasi. Oleh karena itu, pada proyek ini saya akan mencoba melakukan analisis sentiment menggunakan SVM dan LTSM, supaya mengetahui mana yang lebih cocok atau lebih baik.
Tujuan
Adapun tujuan dari proyek ini yaitu untuk mendapatkan penilaian dari ulasan para netizen terkait acra-acara tv yang mereka tonton, serta melihat akurasi model dari LSTM dan SVM.
Implementasi
Terdapat beberapa tahap yang akan dilakukan, yaitu:
Exploratory Data Analysis
Install dan Import Library
Connect ke Google dan Akses Dataset
Tampilan 5 Dataset Teratas
Visualisasi
Terlihat Perbandingan ulasan diatas, ternyata ulasan positif masih yang paling besar diantara yang lainnya, namun ulasan negatif juga lumayan besar.
Data Cleaning and Text Preprocessing
Ada beberapa Text Preprocessing yang saya gunakan, daintaranya yaitu:
Modeling, Train and Test Data
Neural Network
LSTM
SVM
Rata - Rata 80%
Consulation atau Result
Sebelah kiri menggunakan LSTM dan Kanan menggunakan SVM
dengan LSTM mendapatkan Akurasi sekitar 60-71 % dan SVM mendaptkan Akurasi 80%. Tentunya Akurasi tersebut masih bisa di tingkatkan kembali.
Kesimpulan
Kesimpulan dari Sentiment Analysis menggunakan dataset Riview Acara TV, yaitu :
Menggunakan algoritma SVM ternyata lebih baik daripada menggunakan LSTM, tetapi ini hanya berlaku pada data tersebut. dan tidak menutup kemungkinan jika menggunakan data lain dan algoritma LSTM ditingkatkan, LSTM akan jauh lebih baik daripada SVM.
Source code lengkap bisa kunjungi link dibawah :