Muhammad Rizki
Project Kali ini saya membuat model Sentiment Analysis tentang Maskapai Penerbangan Amerika Serikat dengan Menggunakan LSTM
Data Knowledge
Data ini berasal dari Crowdflower's Data for Everyone library.
data ini juga tersedia di GitHub
Pekerjaan analisis sentimen tentang masalah setiap maskapai besar AS. Data Twitter diambil dari Februari 2015 dan kontributor diminta untuk mengklasifikasikan tweet positif, negatif, dan netral terlebih dahulu, diikuti dengan mengkategorikan alasan negatif (seperti "penerbangan terlambat" atau "layanan kasar").
Informasi Data
Langkah - Langkah
1. Data Load
2. EDA (Total count per Airlines, Proportion of Sentiments, Reason for Negative sentiment)
Hasil EDA
American Airlines, US Airways, Southwest Airlines : Ada relatif banyak keluhan tentang masalah layanan pelanggan. United: Masalah layanan pelanggan adalah yang paling umum, tetapi pelanggan di maskapai ini mengalami penundaan penerbangan lebih sering daripada maskapai lain. Masalah kehilangan barang bawaan relatif tinggi. Delta: Layanan pelanggan tidak buruk, tetapi sebagian besar pelanggan mengalami penundaan penerbangan. Virgin America: Terutama tentang layanan pelanggan dan masalah pemesanan penerbangan berikutnya.
3. Text Preprocessing (Regular expression, Tokenization, Checking Stopwords)
4. Text Analysis
Lexicon based approach
Lexicon based approach melibatkan penghitungan orientasi untuk dokumen dari orientasi semantik kata atau frasa dalam dokumen. Pendekatan ini menggunakan kamus kata yang dianotasi dengan orientasi semantik atau polaritas kata.
Di sini kami hanya akan mencoba memverifikasi bahwa leksikon berfungsi dengan baik, mudah-mudahan, untuk mengklasifikasikan sentimen yang telah dialokasikan oleh pelanggan nyata.
Vader
Vader adalah leksikon yang dibuat untuk analisis sentimen data teks di media sosial.
Ini mengembalikan skor polaritas gabungan dari sebuah kalimat setelah menghitung skor negatif, netral, dan positif dari setiap kata dalam sebuah kalimat.
Kita dapat menggunakan Vader dari modul dalam di nltk serta Python API vaderSentiment.
VADER memiliki banyak keunggulan dibandingkan metode analisis sentimen tradisional: sumber
5. Building Model with LSTM
6. Train & Testing