Desty Rodiah
Menampilkan visualisasi data berdasarkan dataset harga saham samsung. Dataset yang digunakan adalah data public kaggle.com. Visualisasi yang ditampilkan ada 3 grafik yaitu :
By. Desty Rodiah
Deskripsi
Portofolio ini dibuat untuk melihat visualisasi data terhadap perkembangan harga saham samsung. Data digunakan merupakan dataset public dari kaggle.com dengan link sebagai berikut: Samsung Stock Price Dataset(kaggle.com). Dataset ini berisikan tentang perubahan harga saham Samsung Electronics sejak tahun 2000. Data ini mencakup atribut yaitu :
Protofolio ini menampilkan 3 visualisasi data berdasarkan dataset yang digunakan yaitu
Sebelum menampilkan visualisasi data, program diawali dengan import library yang akan digunakan dengan kode sebagai berikut:
Library yang digunakan berupa pandas untuk manipulasi dan analisis data. Library matplotlib digunakan untuk mengubah data mentah menjadi informasi berharga melalui berbagai bentuk grafik dan diagram. Library drive dari google colab digunakan untuk menggunakan data yang tersimpan pada google drive. Library seaborn digunakan untuk menampilkan antarmuka tingkat tinggi untuk menggambar grafik statistik yang menarik dan informatif.
Baca Dataset
Setelah dilakukan import library maka dilakukan pemanggilan data dari google drive dengan menggunakan kode sebagai berikut:
Langkah selanjutnya adalah membaca file dataset yang berekstensi .csv ke kode program, seperti yang terlihat pada gambar berikut:
Untuk menampilkan informasi detail tentang dataframe, seperti jumlah baris data, nama-nama kolom berserta jumlah data dan tipe datanya, dan sebagainya dapat menggunakan kode sebagai berikut :
Untuk menampilkan statistik deskriptif dari data frame atau series. Hal ini mencakup minimum, maksimum, mean (kecenderungan sentral), deviasi standar (dispersi) dari nilai-nilai dalam kolom numerik, dan jumlah semua nilai bukan nol dalam data, digunakan kode sebagai berikut:
Menampilkan matriks korelasi antar atribut dengan heat map
Setelah mengenali dataset yang dilakukan visualisasi terhadap dataset yang ada. Visualiasi data yang tertama adalah menampilkan matriks korelasi antar atribut dengan menggunakan grafik heatmap. Kode yang digunakan seperti berikut ini:
Data date diubah terlebih dahulu menjadi format datetime agar datanya berupa numerik. Lalu di buat korelasi antar atribut dengan menggunakan heatmap. Penggunaan heatmap agar dapat melihat korelasi antar atribut dan membantu menggambil keputusan terhadap korelasi data.
Grafik total volume perdagangan saham per tahun dengan bar chart
Visualisasi yang kedua menampilkan grafik total volume perdagangan saham samsung pertahun. Berdasarkan grafik tersebut dapat dilihat perkembangan jumlah saham yang dibeli dari tahun ke tahun. Penggunaan bar chart dikarenakan agar mempermudah dalam melihat naik turun perkembangan jumlah saham setiap tahunnya. Kode yang digunakan adalah sebagai berikut:
Grafik harga pembukaan dan penutupan saham selama bulan januari 2024 dengan plot
Visualisasi yang ketiga adalah visualisasi harga pembukaan dan penutupan saham selama bulan januari 2024. Berdasarkan grafik tersebut dapat dilihat perbandingan harga saham pada saat pembukaan dan penutupan setiap hari pada bulan januari 2024. grafik line plot digunakan karena dapat dilihat visualisasi naik turun data saham pada hari tertentu. Kode yang digunakan adalah sebagai berikut: