Video Game Sales: A Linear Regression Analysis

muhammad farrel daviaziz

Sosial Media


0 orang menyukai ini
Suka

Summary

Menjelajahi dunia penjualan video game melalui analisis regresi linear untuk memahami tren dan faktor-faktor kunci yang mempengaruhi penjualan global.

Description

Mengimpor library yang diperlukan untuk analisis data seperti Pandas untuk manipulasi data, NumPy untuk operasi numerik, Matplotlib untuk visualisasi, dan modul-modul scikit-learn untuk pemodelan dan evaluasi regresi linear.

Memuat dataset video game sales yang sudah di upload 

df.head(): Menampilkan lima baris pertama dari dataset untuk memahami struktur dan isinya.
df.info(): Menampilkan informasi dataset seperti tipe data dan jumlah nilai yang hilang.

Memilih kolom 'Rank', 'NA_Sales', 'EU_Sales', 'JP_Sales', dan 'Other_Sales' sebagai fitur (X).
Memilih kolom 'Global_Sales' sebagai target (y).

Membagi data menjadi set pelatihan dan pengujian menggunakan train_test_split().
test_size=0.2 mengindikasikan bahwa 20% data akan digunakan sebagai set pengujian.

Inisialisasi model regresi linear menggunakan LinearRegression().
Melatih model menggunakan set pelatihan dengan fit().
Melakukan prediksi pada set pengujian dengan predict().
Evaluasi model menggunakan metrik-metrik seperti Mean Absolute Error, Mean Squared Error, dan Root Mean Squared Error.

Membuat scatter plot untuk membandingkan nilai aktual dan prediksi dari kolom 'Global_Sales'.
Memvisualisasikan seberapa baik model linear memperkirakan nilai target.
Dengan mengikuti langkah-langkah ini, Anda dapat melakukan analisis regresi linear pada dataset vgsales.csv menggunakan Google Colab.

 

 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science