Sentiment Analysis Jhonny Depp Court

Bastian Armananta

Sosial Media


0 orang menyukai ini
Suka

Summary

Berdasarkan kasus yang terjadi terhadap Jhonny Depp melawan Amber Heard, banyak orang yang bertanya serta akan hal tersebut, banyak hal terjadi dalam dari awal persidangan hingga ditutupnya kasus oleh hakim. Namun apa pendapat masyarakat luas terhadap kasus tersebut? dalam studi kasus ini saya akan menganalisa pendapat masyarakat luas terhadap kasus Jhonny Depp melawan Amber Heard.

Description

Latar Belakang

Sentiment Anaysis adalah sebuah studi kasus dimana kita akan menganalisis pendapat orang terhadap studi kasus tertentu, sehingga kita dapat mengetahui pendapat masyarakat luas apakah memiliki sentimen negatif, netral atau positif.


Dasar Teori

1. Dataset

Dataset yang digunakan adalah crawling dari youtube comment.

2. EDA

Proses EDA pada studi kasus ini adalah dapat menampilkan wordcloud pada masing masing sentiment sehingga kita dapat mengetahui kata apa saja yang paling sering muncul dari masing masing kelas.

3. Preprocessing

Regex, sangat berguna untuk membersihkan data text untuk membuang karakter yang tidak diperlukan.

Lexicon Analysis, metode labeling tidak menggunakan manual berdasarkan opini manusia, melainkan menggunakan 3 lexicon, yaitu TextBlob, SentiWordNet, dan Vader Sentiment.

Tokenizing, metode pengubahan text kedalam bentuk angka, sehingga masing masing angka merepresentasikan kata tertentu.

Text Sequences, penggabungan masing masing angka, sehingga angka yang digabungkan akan menjadi suatu kalimat, dimana masing masing representasi angka terhadap kata dapat ditampilkan dengan word index

Oversampling, studi kasus klasifikasi tidak terlepas dengan kondisi kelas yang tidak berimbang, dalam penelitian ini saya menggunakan metode oversampling untuk menyamakan jumlah kelas, sehingga kondisi imbalanced data dapat tersolve dengan baik.

4. Modelling

Deep Learning menggunakan layer LSTM dan Bidirectional LSTM


5. Evaluation

Evaluation menggunakan Clasification Report.

 

Alat & Bahan

Laptop
Koneksi internet
Google Colab / Kaggle

Hasil

Kesimpulan dari project ini adalah dengan menggunakan model Deep Learning LSTM dan Bidirectional LSTM dapat melakukan klasifikasi dengan baik pada 3 kelas, negatif, netral dan positif. Hal ini dibuktikan dengan nilai akurasi yang tinggi yaitu 90% serta didukung dengan nilai Precision, Recall dan F1 Score yang tinggi, hal ini bisa tercapai dengan adanya pembagian kelas yang seimbang, sehingga model tidak ada kecenderungan dalam memilih kelas yang lebih banyak terutama pada tahap prediksi.

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Deep Learning