Pemodelan Data MNIST: Tanserflow-Keras

M. Herly Pratama

Sosial Media


1 orang menyukai ini
Suka

Summary

Machine learning menggunakan model algoritma untuk dapat bekerja dengan baik. Algoritma yang digunakan dalam machine learning terbagi menjadi tiga kategori: supervised, unsupervised, dan reinforcement learning. Pemodelan Data MNIST ini menggunakan kategori supervised dengan pendekatan ‘Neural Networks’ dimana prosesnya melibatkan vektor input menjadi vektor output sebagaimana terinspirasi oleh neuron dan konektivitasnya di dalam otak. Model ini memiliki sejumlah lapisan neuron yang terhubung antar input dan output. Dataset yang diguanakan pada pemodelan data ini menggunakan dataset yang disediakan oleh library tensorflow keras yaitu MNIST. Data ini berisi angka dari 0 sampai dengan 9 dengan format png. Tensorflow keras memiliki sejumlah dataset bawaan yang cocok bagi pemula untuk melakukan pembuatan model machine learning. Model yang akan digunakan adalah sequential yang terdiri dari jejeran layer-layer yang merupakan model deep learning atau artificial neural network. Perancangan model dataset mnist menggunakan tiga buah layer yang terdiri atas, input layer (Flaten), hidden layer yang terdiri dari beberapa lapis neuron atau paramete, dan output layer, serta fungsi activation yang digunakan adalah softmax karena data ini termasuk ke dalam multiclass classifications. Compiling model dilakukan setelah melakukan percancangan model, pada proses ini penentuan optimizer, loss, dan metrics dilakukan. Training model dilakukan setelah meng-compile model dimana model yang telah dibuat akan mempelajari hubungan antara train data dengan labelnya. Evaluasi data bertujuan menilai performance model terhadap data yang belum pernah didapat selama training. Dataset yang dievaluasi berbeda dengan dataset yang digunakan pada proses training.
 

Description

LATAR BELAKANG

Data set Fashion-MNIST merupakan open source data yang disediakan untuk penelitian mengenai klasifikasi objek. Data set ini memiliki 10 kategori fashion. Pada penelitian ini akan dilakukan klasifikasi fashion pada data fashion-MNIST menggunakan model convolutional neural network (CNN)
Database MNIST (Modified National Institute of Standards and Technology database[1]) adalah database besar angka tulisan tangan yang biasanya digunakan untuk melatih berbagai sistem pemrosesan gambar.[2][3] Basis data juga banyak digunakan untuk pelatihan dan pengujian di bidang pembelajaran mesin.[4][5] Itu dibuat dengan "mencampur ulang" sampel dari dataset asli NIST.[6] Pencipta merasa bahwa karena dataset pelatihan NIST diambil dari karyawan Biro Sensus Amerika, sedangkan dataset pengujian diambil dari siswa sekolah menengah Amerika, itu tidak cocok untuk eksperimen pembelajaran mesin.[7] Selanjutnya, gambar hitam putih dari NIST dinormalisasi agar sesuai dengan kotak pembatas 28x28 piksel dan anti-alias, yang memperkenalkan tingkat skala abu-abu.

METODE

Tahap Pertama adalaah persiapan dataset. Dataset yang diguanakan pada pemodelan data ini menggunakan dataset yang disediakan oleh library tensorflow keras yaitu MNIST. Data ini berisi angka dari 0 sampai dengan 9 dengan format png. Tensorflow keras memiliki sejumlah dataset bawaan yang cocok bagi pemula untuk melakukan pembuatan model machine learning. Kemudian dataset mnist dinormalisasi, Sebelum dataset diinput kedalam model, penting untuk melakukan normalisasi data. Normalisasi bertujuan untuk memperkecil selisih tiap data sehingga mengurangi keragaman data. Dataset MNIST memiliki ukuran gambar 28x28 pixel dimana 1 pixel adalah setara dengan 1 byte dan 1 byte terdiri dari angka 0 hingga 255 dimana setiap angka mewakili warna yang berbeda. Keuntungan melakukan normalisasi data adalah proses train akan berlangsung lebih cepat dan efisien. Setelah proses Normalisasi, perancangan model akan dilakukan. Model yang akan digunakan adalah sequential yang terdiri dari jejeran layer-layer yang merupakan model deep learning atau artificial neural network. Perancangan model dataset mnist menggunakan tiga buah layer yang terdiri atas, input layer (Flaten), hidden layer yang terdiri dari beberapa lapis neuron atau paramete, dan output layer, serta fungsi activation yang digunakan adalah softmax karena data ini termasuk ke dalam multiclass classifications. Compiling model dilakukan setelah melakukan percancangan model, pada proses ini penentuan optimizer, loss, dan metrics dilakukan. Training model dilakukan setelah meng-compile model dimana model yang telah dibuat akan mempelajari hubungan antara train data dengan labelnya. Evaluasi data bertujuan menilai performance model terhadap data yang belum pernah didapat selama training. Dataset yang dievaluasi berbeda dengan dataset yang digunakan pada proses training.

 

PEMBAHASAN

Persiapan Dataset

Dataset yang digunakan pada pemodelan data ini menggunakan dataset yang disediakan oleh library tensorflow keras yaitu MNIST. Data ini berisi angka dari 0 sampai dengan 9 dengan format png. Tensorflow keras memiliki sejumlah dataset bawaan yang cocok bagi pemula untuk melakukan pembuatan model machine learning

Gambar 1 Dataset MNIST.

 

Normalisasi Dataset

Sebelum dataset diinput kedalam model, penting untuk melakukan normalisasi data. Normalisasi bertujuan untuk memperkecil selisih tiap data sehingga mengurangi keragaman data. Dataset MNIST memiliki ukuran gambar 28x28 pixel dimana 1 pixel adalah setara dengan 1 byte dan 1 byte terdiri dari angka 0 hingga 255 dimana setiap angka mewakili warna yang berbeda. Keuntungan melakukan normalisasi data adalah proses train akan berlangsung lebih cepat dan efisien.

Gambar 2 Code Normalisasi Dataset

 

Perancangan Model

Model yang akan digunakan adalah sequential yang terdiri dari jejeran layer-layer yang merupakan model deep learning atau artificial neural network. Perancangan model dataset mnist menggunakan tiga buah layer yang terdiri atas, input layer (Flaten), hidden layer yang terdiri dari beberapa lapis neuron atau paramete, dan output layer, serta fungsi activation yang digunakan adalah softmax karena data ini termasuk ke dalam multiclass classifications. Compiling model dilakukan setelah melakukan percancangan model, pada proses ini penentuan optimizer, loss, dan metrics dilakukan. Training model dilakukan setelah meng-compile model dimana model yang telah dibuat akan mempelajari hubungan antara train data dengan labelnya. Evaluasi data bertujuan menilai performance model terhadap data yang belum pernah didapat selama training. Dataset yang dievaluasi berbeda dengan dataset yang digunakan pada proses training.

Gambar 3 Proses Train Model.

Informasi Course Terkait
  Kategori: Artificial Intelligence
  Course: Dasar - Dasar Python