Sentiment Analysis Maskapai Penerbangan Amerika

Muhammad Rizki

Sosial Media


1 orang menyukai ini
Suka

Summary

Project Kali ini saya membuat model Sentiment Analysis tentang Maskapai Penerbangan Amerika Serikat dengan Menggunakan LSTM

Description

Data Knowledge

Data ini berasal dari Crowdflower's Data for Everyone library.

data ini juga tersedia di GitHub

Pekerjaan analisis sentimen tentang masalah setiap maskapai besar AS. Data Twitter diambil dari Februari 2015 dan kontributor diminta untuk mengklasifikasikan tweet positif, negatif, dan netral terlebih dahulu, diikuti dengan mengkategorikan alasan negatif (seperti "penerbangan terlambat" atau "layanan kasar").

Informasi Data

  1. alirline_sentiment : Klasifikasi sentimen. (positif, netral, dan negatif)
  2. negativereason : Alasan dipilih untuk opini negatif
  3. maskapai penerbangan : Nama 6 US Airlines('Delta', 'United', 'Southwest', 'US Airways', 'Virgin America', 'American')
  4. teks : opini pelanggan

Langkah - Langkah

1. Data Load

2. EDA (Total count per Airlines, Proportion of Sentiments, Reason for Negative sentiment)

Hasil EDA

American Airlines, US Airways, Southwest Airlines : Ada relatif banyak keluhan tentang masalah layanan pelanggan. United: Masalah layanan pelanggan adalah yang paling umum, tetapi pelanggan di maskapai ini mengalami penundaan penerbangan lebih sering daripada maskapai lain. Masalah kehilangan barang bawaan relatif tinggi. Delta: Layanan pelanggan tidak buruk, tetapi sebagian besar pelanggan mengalami penundaan penerbangan. Virgin America: Terutama tentang layanan pelanggan dan masalah pemesanan penerbangan berikutnya.

3. Text Preprocessing (Regular expression, Tokenization, Checking Stopwords)

4. Text Analysis

Lexicon based approach
Lexicon based approach melibatkan penghitungan orientasi untuk dokumen dari orientasi semantik kata atau frasa dalam dokumen. Pendekatan ini menggunakan kamus kata yang dianotasi dengan orientasi semantik atau polaritas kata.

Di sini kami hanya akan mencoba memverifikasi bahwa leksikon berfungsi dengan baik, mudah-mudahan, untuk mengklasifikasikan sentimen yang telah dialokasikan oleh pelanggan nyata.

Vader

Vader adalah leksikon yang dibuat untuk analisis sentimen data teks di media sosial.

Ini mengembalikan skor polaritas gabungan dari sebuah kalimat setelah menghitung skor negatif, netral, dan positif dari setiap kata dalam sebuah kalimat.

Kita dapat menggunakan Vader dari modul dalam di nltk serta Python API vaderSentiment.

VADER memiliki banyak keunggulan dibandingkan metode analisis sentimen tradisional: sumber

  1. bekerja sangat baik dengan teks jenis media sosial, tetapi menggeneralisasi dengan mudah ke beberapa domain.
  2. Itu tidak memerlukan data pelatihan apa pun, tetapi terdiri dari kosakata psikologis standar emas yang digeneralisasi, berbasis keseimbangan, dan dikuratori oleh manusia.
  3. Cukup cepat untuk digunakan online dengan data streaming
  4. Pertukaran kecepatan-kinerja tidak serius.

5. Building Model with LSTM

6. Train & Testing

 

 

 

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Natural Languange Processing (NLP) dengan Deep Learning