Grace Yudha Satriawan
Fake News adalah berita dengan content yang dapat mengandung berita yang tidak benar namun dikemas sedemikian rupa sehingga dapat menggiring opini dari pembacanya. Dengan kemudahaan mendapatkan informasi saat ini, muncul juga kemudahaan untuk menyebarkan berita palsu.
Fake News adalah berita dengan content yang dapat mengandung berita yang tidak benar namun dikemas sedemikian rupa sehingga dapat menggiring opini dari pembacanya. Dengan kemudahaan mendapatkan informasi saat ini, muncul juga kemudahaan untuk menyebarkan berita palsu.
Dengan adanya model Fake News Detection, maka public dapat terbantu dalam mengetahui apakah berita yang dibaca merupakan fake news atau tidak. Pada kali ini model yang akan digunakan adalah SVM dengan dataset yang ada pada https://www.kaggle.com/datasets/clmentbisaillon/fake-and-real-news-dataset
dataset ini memiliki 44898 rows dengan 5 column yaitu title, text, subject dan date. Dataset dibagi menjadi dua file yaitu Fake.csv dan True.csv dengan data Fake sebanyak 23481 dan True sebanyak 21417.
untuk menyederhanakan model pada kali ini, column yang akan digunakan model adalah text dan column label yang ditambahkan sesuai dengan asal dataset dari data (fake/true)
Kemudian proses selanjutnya ada lah preprocessing dari text berita tersebut dengan lowercasing, punctuation normalization, digit normalization, stopword removal dan lemmatisasi.
split data menjadi data untuk train dan test untuk training dari model SVM
Setelah itu kita mulai proses vectorisasi dari input text kita, dengan menggunakan metode TF-IDF, dan klasifikasi model dengan SVM
berikut adalah hasil model evaluation dari