Erikson Vri Anugrah Aritonang
Visualisasi summary Google War News dataset & Klasifikasi tags summary berita menggunakan algoritma machine learning. Tahapan yang dilakukan yaitu Import dataset & library, Understanding data, Text preprocessing, Modelling, dan Evaluasi.
Dataset dan Library
Dalam pengolahan text ini menggunakan library yaitu Pandas, numpy, seaborn, NLTK, re, WordCloud untuk dataset diambil dari Kaggle
Understanding data
Dimulai dengan cleaning data dari data null, lalu mencari topik pembahsan yang sering muncul dalam dataset menggunakan WordCloud dan memvisualisasikan nya, juga mengganti label menjadi encoding.
Text preprocessing
Dalam tahapan ini, dilakukan beberapa langkah seperti Label Encoding, Stop Word Removal, dan Text Cleaning
Modelling, dan Evaluasi
Dalam pemodelan, digunakan 3 algoritma yaitu Random Forest, Logistic Regression, dan Decision Tree, dengan akurasi tertinggi yaitu Random Forest sebesar 82%.
source : evin16/AIPorto (github.com)