Fake News Detection dengan SVM and TF-IDF

Grace Yudha Satriawan

Sosial Media


1 orang menyukai ini
Suka

Summary

Fake News adalah berita dengan content yang dapat mengandung berita yang tidak benar namun dikemas sedemikian rupa sehingga dapat menggiring opini dari pembacanya. Dengan kemudahaan mendapatkan informasi saat ini, muncul juga kemudahaan untuk menyebarkan berita palsu.

Description

Fake News adalah berita dengan content yang dapat mengandung berita yang tidak benar namun dikemas sedemikian rupa sehingga dapat menggiring opini dari pembacanya. Dengan kemudahaan mendapatkan informasi saat ini, muncul juga kemudahaan untuk menyebarkan berita palsu.

Dengan adanya model Fake News Detection, maka public dapat terbantu dalam mengetahui apakah berita yang dibaca merupakan fake news atau tidak. Pada kali ini model yang akan digunakan adalah SVM dengan dataset yang ada pada https://www.kaggle.com/datasets/clmentbisaillon/fake-and-real-news-dataset

dataset ini memiliki 44898 rows dengan 5 column yaitu title, text, subject dan date. Dataset dibagi menjadi dua file yaitu Fake.csv dan True.csv dengan data Fake sebanyak 23481 dan True sebanyak 21417.

untuk menyederhanakan model pada kali ini, column yang akan digunakan model adalah text dan column label yang ditambahkan sesuai dengan asal dataset dari data (fake/true)

Kemudian proses selanjutnya ada lah preprocessing dari text berita tersebut dengan lowercasing, punctuation normalization, digit normalization, stopword removal dan lemmatisasi.

split data menjadi data untuk train dan test untuk training dari model SVM

Setelah itu kita mulai proses vectorisasi dari input text kita, dengan menggunakan metode TF-IDF, dan klasifikasi model dengan SVM

berikut adalah hasil model evaluation dari 

Informasi Course Terkait
  Kategori: Artificial Intelligence
  Course: News Classification dengan Machine Learning