muhammad farrel daviaziz
Menjelajahi dunia penjualan video game melalui analisis regresi linear untuk memahami tren dan faktor-faktor kunci yang mempengaruhi penjualan global.
Mengimpor library yang diperlukan untuk analisis data seperti Pandas untuk manipulasi data, NumPy untuk operasi numerik, Matplotlib untuk visualisasi, dan modul-modul scikit-learn untuk pemodelan dan evaluasi regresi linear.
Memuat dataset video game sales yang sudah di upload
df.head(): Menampilkan lima baris pertama dari dataset untuk memahami struktur dan isinya.
df.info(): Menampilkan informasi dataset seperti tipe data dan jumlah nilai yang hilang.
Memilih kolom 'Rank', 'NA_Sales', 'EU_Sales', 'JP_Sales', dan 'Other_Sales' sebagai fitur (X).
Memilih kolom 'Global_Sales' sebagai target (y).
Membagi data menjadi set pelatihan dan pengujian menggunakan train_test_split().
test_size=0.2 mengindikasikan bahwa 20% data akan digunakan sebagai set pengujian.
Inisialisasi model regresi linear menggunakan LinearRegression().
Melatih model menggunakan set pelatihan dengan fit().
Melakukan prediksi pada set pengujian dengan predict().
Evaluasi model menggunakan metrik-metrik seperti Mean Absolute Error, Mean Squared Error, dan Root Mean Squared Error.
Membuat scatter plot untuk membandingkan nilai aktual dan prediksi dari kolom 'Global_Sales'.
Memvisualisasikan seberapa baik model linear memperkirakan nilai target.
Dengan mengikuti langkah-langkah ini, Anda dapat melakukan analisis regresi linear pada dataset vgsales.csv menggunakan Google Colab.