Seperti yang telah dibahas sebelumnya, terdapat 3 jenis algoritma machine learning, yaitu Supervised Learning, Unsupervised Learning, dan Reinforecement Learning. Kita telah membahas tentang perbedaan Supervised dan Unsupervised Learning sebelumnya. Sekarang, kita akan membahas tentang apa itu Reinforecement Learning?
Reinforecement Learning cukup berbeda dengan algoritma sebelumnya. Algoritma ini dimaksudkan untuk dapat membuat komputer belajar sendiri dari lingkungan (environment). Jadi komputer akan melakuka pencarian sendiri (self-discovery) melalui interaksi dengan lingkungan.
Mungkin kalian sering menjumpai berbagai dokumentasi yang menyebutkan bahwa reinforecement learning tidak memerlukan data set. Pernyataan ini tidak sepenuhnya benar. Setiap algoritma machine learning memerlukan input untuk dipelajari selama proses training. Namun jenis inputnya bisa berbeda-beda. Selama proses training, komputer dituntun oleh algoritma untuk melakukan kegiatan trial dan error. Mirip seperti anak kecil belajar.
Setiap kali percobaan trial dan error dilakukan akan ada feedback untuk komputer. Feedback dari aksi (action) sebelumnya digunakan sebagai panduan sekaligus peta (guide and mapping) untuk melakukan aksi selanjutnya. Proses berjalan secara mengulang-ulang mengikuti skema berikut :
Algoritma reinforcement learning akan mencoba berbagai opsi dan kemungkinan yang berbeda, melakukan pengamatan (observation) dan evaluasi (evaluation) setiap pencapaian. Reinforcement learning dapat belajar dari pengalaman (experience).
Saat ini, reinforcement learning banyak dimanfaatkan pada berbagai mesin game (permainan) , seperti: Atari, Sega, Nintendo, PS, Xbox, game-game untuk komputer, mobile device, dan sebagainya. Beberapa algoritma yang termasuk kategori reinforcement learning antara lain :
Kiranya dapat dibedakan antara algoritma dan pemrograman. Algoritma berbicara tentang tahapan-tahapan atau langkah-langkah penyelesaian suatu masalah. Sedangkan pemrograman merupakan implementasi dari algoritma ke dalam bentuk baris-baris program.
Sebagian pakar machine learning yang lain membagi algoritma machine learning dengan cara yang berbeda. Perbedaan ini disebabkan perbedaan cara pandang masing-masing orang. Berikut disajikan diagram yang menggambarkan pembagian algoritma machine learning.
Kita juga harus memaklumi bahwa diagram di atas tidak dapat mewakili semua hal. Masih cukup banyak yang belum bisa dijelaskan oleh diagram tersebut. Jika saat ini kamu belum memahami perbedaan ketiga jenis algoritma machine learning maka Anda tidak perlu merasa khawatir. Ketiganya akan dibahas secara lebih detail bab tentang algoritma machine learning.
Reinforecement Learning cukup berbeda dengan algoritma sebelumnya. Algoritma ini dimaksudkan untuk dapat membuat komputer belajar sendiri dari lingkungan (environment). Jadi komputer akan melakuka pencarian sendiri (self-discovery) melalui interaksi dengan lingkungan.
Mungkin kalian sering menjumpai berbagai dokumentasi yang menyebutkan bahwa reinforecement learning tidak memerlukan data set. Pernyataan ini tidak sepenuhnya benar. Setiap algoritma machine learning memerlukan input untuk dipelajari selama proses training. Namun jenis inputnya bisa berbeda-beda. Selama proses training, komputer dituntun oleh algoritma untuk melakukan kegiatan trial dan error. Mirip seperti anak kecil belajar.
Setiap kali percobaan trial dan error dilakukan akan ada feedback untuk komputer. Feedback dari aksi (action) sebelumnya digunakan sebagai panduan sekaligus peta (guide and mapping) untuk melakukan aksi selanjutnya. Proses berjalan secara mengulang-ulang mengikuti skema berikut :
Ilustrasi Reinforcement Learning |
Algoritma reinforcement learning akan mencoba berbagai opsi dan kemungkinan yang berbeda, melakukan pengamatan (observation) dan evaluasi (evaluation) setiap pencapaian. Reinforcement learning dapat belajar dari pengalaman (experience).
Saat ini, reinforcement learning banyak dimanfaatkan pada berbagai mesin game (permainan) , seperti: Atari, Sega, Nintendo, PS, Xbox, game-game untuk komputer, mobile device, dan sebagainya. Beberapa algoritma yang termasuk kategori reinforcement learning antara lain :
- Q-Learning
- State-Action-Reward-State-Action (SARSA)
- Deep Q Network (DQN)
- Deep Deterministic Policy Gradient (DDPG)
- Actor-Critic
- Monte Carlo Tree Search (MCTS)
- Dan sebagainya.
Algoritma Machine Learning (versi IBM) |
Sebagian pakar machine learning yang lain membagi algoritma machine learning dengan cara yang berbeda. Perbedaan ini disebabkan perbedaan cara pandang masing-masing orang. Berikut disajikan diagram yang menggambarkan pembagian algoritma machine learning.
Kita juga harus memaklumi bahwa diagram di atas tidak dapat mewakili semua hal. Masih cukup banyak yang belum bisa dijelaskan oleh diagram tersebut. Jika saat ini kamu belum memahami perbedaan ketiga jenis algoritma machine learning maka Anda tidak perlu merasa khawatir. Ketiganya akan dibahas secara lebih detail bab tentang algoritma machine learning.