Uji Korelasi Dan Statistik Deskriptif with R Shiny

Dimas Anugrah Firdlous

Sosial Media


0 orang menyukai ini
Suka

Summary

Pada Portofolio kali ini akan dilakukan sebuah uji korelasi variabel dengan case study dataset automobile yang diambil dari situs kaggle. uji korelasi sendiri merupakan teknik analisis yang digunakan untuk mengetahui ada tidaknya hubungan antar 2 variabel yang diuji selain uji korelasi disini juga dilakukan analisis satitiska deskriptif. pada portofolio kali ini variabel yang diuji adalah engine size vs price, bore vs price, dan highway mpg vs price dengan menggunakan bahasa pemrograman R dan visualisasi menggunakan R shiny. tujuan dari portofolio ini untuk mengetahui nilai korelasi antar variabel tersebut.

Description

Introduction

R-Shiny pada dasarnya merupakan sebuah framework (kerangka kerja) yang ditawarkan oleh RStudio. Dengannya, Anda dapat membuat laporan dan visualisasi data yang efektif sehingga eksplorasi data pun lebih mudah. pada portofolio ini aplikasi yang dibuat terdiri dari 2 menu utama yaitu Data sebagai bagian untuk import data, dan Uji Korelasi sebagai halaman yang menampilkan hasil uji korelasi baik secara matematis maupun visual. dalam aplikasi ini dapat digunakan dataset dengan berbagai pembatas seperti koma, semicolon, tab yang dapat disesuaikan berdasrkan tipe data yang dipunya.

Dataset : https://www.kaggle.com/datasets/toramky/automobile-dataset

*Dataset diupload pada saat GUI berjalan

Preparation

Karena dalam aplikasi GUI yang dibuat hanya dapat melakukan visualisasi, uji korelasi, dan analisis statistika deskriptif maka pada dataset yang digunakan kali ini yaitu automobile proses data preparation dilakukan secara terpisah, proses ini dilakukan agar data yang kita gunakan tidak terdapat data null, noise, dsb. hal ini dilakukan untuk meningkatkan tingkat kepercayaan atau validasi dari data yang kita buat.

Setelah dilakukan data preparation dihasilkan bahwa dalam daset ini tidak terdapat data dengan nilai null namun pada dataset kali ini terdapat mising value dengan value “?” maka pada porotofolio ini teknik untuk menghandle missing value tersebut adalah dengan menghapus nilai “?” dan menggantinya dengan nilai mean setiap kolom.

Statistika Deskriptif

A. Engine Size vs Price

B. Bore Vs Price

C. Highway MPG vs Price

Uji Korelasi dengan R Shiny

A.  Engine Size vs Price

Berdasarkan hasil analisis dan uji korelasi yang dilakukan didapatkan bahwa untuk korelasi engine size dengan price didaptkan nilai korelasi sebesar 0.8721522 Korelasi bernilai positif menunjukan bahwa hubungan kedua variabel mengalami kenaikan secara signifikan serta menandakan hubungan antara kedua variabel tersebut kuat dan sebanding

B. Bore vs Price

nilai korelasi bore dengan price  didapatkan sebesar 0.54256017 Korelasi bernilai positif dan memiliki hubungan yang cukup kuat dan sebanding namun masih dibawah engine size terhadap price

C. Highway MPG vs Price

Highway mpg dengan Price nilai korelasinya didapatkan sebesar -0.704692265. korelasi bernilai negatif itu kebalikannya dimana hubungan variabel mengalami penurunan, serta memiliki hubungan antar variabel kuat namun berbanding terbalik.

 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science Dengan R