Text Classification using Google War News Dataset

Erikson Vri Anugrah Aritonang

Sosial Media


0 orang menyukai ini
Suka

Summary

Visualisasi summary Google War News dataset & Klasifikasi tags summary berita menggunakan algoritma machine learning. Tahapan yang dilakukan yaitu Import dataset & library, Understanding data, Text preprocessing, Modelling, dan Evaluasi.

Description

Dataset dan Library 
Dalam pengolahan text ini menggunakan library yaitu Pandas, numpy, seaborn, NLTK, re, WordCloud untuk dataset diambil dari Kaggle

 

Understanding data
Dimulai dengan cleaning data dari data null, lalu mencari topik pembahsan yang sering muncul dalam dataset menggunakan WordCloud dan memvisualisasikan nya, juga mengganti label menjadi encoding.

Text preprocessing 
Dalam tahapan ini, dilakukan beberapa langkah seperti Label Encoding, Stop Word Removal, dan Text Cleaning

Modelling, dan Evaluasi
Dalam pemodelan, digunakan 3 algoritma yaitu Random Forest, Logistic Regression, dan Decision Tree, dengan akurasi tertinggi yaitu Random Forest sebesar 82%.

source : evin16/AIPorto (github.com)

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Machine Learning For Beginner