Octavia Shinta Tricahyani
Exploratory Data Analysis (EDA) adalah proses eksplorasi data yang bertujuan untuk memahami isi dan komponen penyusun data. Dalam portofolio berikut akan digambarkan mengenai eksplorasi data pada data history harga bitcoin untuk tahun 2020 sampai tahun 2022 (per 5 Mei).
Eksplorasi merupakan langkah untuk memahami data sebelum dilakukan pra proses. Exploratory Data Analysis (EDA) merupakan metode eksplorasi data dengan menggunakan teknik aritmatika sederhana dan teknis grafis dalam meringkas karakteristik utama suatu data. Biasanya, ini akan lebih sering menggunakan metode visualisasi data. Langkah dari melakukan EDA sendiri dimulai dari mengamati kumpulan data hingga identifikasi dan pengaplikasian statistik deskriptif atau inferensial.
Bitcoin merupakan mata uang digital terdesentralisasi yang dapat dibeli, dijual, dan ditukarkan secara langsung, tanpa perantara seperti bank. Bitcoin sendiri dikenalkan ke publik pada tahun 2009 oleh pengemabng anonim atau kelompok pengembang yang menggunakan nama Satoshi Nakamoto. Bitcoin ini dipercaya akan menjadi mata uang dan komoditas universal sehingga membuat harganya akan terus melambung tinggi.
Pada portofolio ini akan ditunjukan hasil dari eksplorasi data terhadap data harga bitcoin mulai tahun 2020 hingga Mei 2022. Exploratory Data Analysis pada dataset tersebut bertujuan untuk mengetahui rangkuman pada data. Rangkuman data tertera antara lain seperti line plot open price, line plot close price, line plot of volume, histogram, dan harga bitcoin dari 2020 sampai 2022 (per 5 Mei).
Untuk melakukan eksplorasi data, maka harus menyiapkan dataset terlebih dahulu. Dalam portofolio ini dataset yang digunakan merupakan dataset history harga BTC-USD yang diambil pada website kaggle.com. Dataset yang diambil merupakan data history harga BTC-USD dari tahun 2020 - 2022 (per 5 Mei). Kemudian untuk atribut dari dataset yang digunakan yaitu tanggal, harga penawaran pembukaan, tertinggi dan terendah hari ini, harga penutupan, dan volume perdagangan.
Setelah dataset sudah siap selanjutnya membaca dataset dan dilakukan data preprocessing. Ini merupakan langkah awal untuk melakukan pengubahan data menjadi format yang lebih mudah dan efektif untuk diproses. Untuk langkah data preprocessing sendiri seperti data cleaning, data transformation, dan data reduction.
Untuk eksplorasi data, yang dilakukan pertama yaitu membuat line chart pada harga pembuka. Dalam hal ini menggunakan line chart dikarenakan line chart lebih mudah dibaca dibanding dengan macam - macam grafik saham lainnya. Untuk line chart pada open price adalah sebagai berikut.
Langkah berikutnya yaitu membuat chart untuk close price. Masih sama dengan sebelumnya, disini saya masih menggunakan tipe grafik line chart. Untuk line chart pada close price adalah sebagai berikut.
Selanjutnya adalah membuat grafik untuk volume. Grafik yang digunakan masih sama, yaitu dengan tipe line chart. Untuk line chart dataset pada bagian volume adalah sebagai berikut.
Untuk penggambaran grafik harga bitcoin, saya menggunakan candlestick. Berikut untuk tampilan grafik harga bitcoin tahun 2020 - 2021
Masih sama dengan grafik sebelumnya, pada bagian ini saya juga menggunakan grafik candlestick untuk melihat harga bitcoin. Berikut untuk tampilan grafik harga bitcoin tahun 2021 - 2022