List

Pada artikel tentang Data Mining dan Java sudah dijelaskan tentang metode machine learning, yaitu supervised dan unsupervised learning. Pada artikel ini akan dibahas sekilas tentang metode ketiga bernama reinforcement learning (RL). Pada RL agent berkomunikasi dengan lingkungannya tanpa dibantu oleh tutor atau guru untuk pembelajarannya. Tujuan RL adalah menemukan policy di mana memilih sebuah aksi pada suatu step-time yang mengantarkannya untuk mendapatkan reward terbaik dari lingkungannya. Setiap aksi yang agent lakukan, lingkungannya merespon dengan sebuah reward yang menunjukkan efektifitas aksi di setiap step-time. Pada aksi yang dilakukan agent tidak menganut benar atau tidaknya aksi yang dilakukan.

RL adalah sub area machine learning yang menitikberatkan kepada cara sebuah agent mengambil aksi di lingkungannya. Di sini agent melakukan maksimalisasi pemikiran tentang reward untuk jangka panjang. RL diinspirasi dari fenomena biologi dan mengelola pengetahuan melalui eksplorasi aktif terhadap lingkungannya. Pada setiap langkah, RL memilih beberapa aksi yang mungkin dilakukan dan menerima reward dari lingkungan atas aksi spesifik yang dilakukannya. Aksi terbaik yang harus dilakukan di beberapa state tidak pernah diketahui sehingga agent harus mencoba beberapa aksi-aksi dan urutan-urutan aksi yang berbeda serta belajar dari pengalamannnya.

RL biasanya dideskripsikan sebagai Markov Decission Process (MDP) yang terdiri dati sebuah agent, set state yang mungkin S, set aksi-aksi yang mungkin A(S) untuk semua state S, dan sebuah fungsi reward R(s,a) yang menentukan reward yang diberi lingkungan atas aksi yang dilakukan agent. Fungsi policy pi mendeskripsikan bagaimana agent belajar pada beberapa time-step t. Policy optimal didefinisikan sebahai pi*. Fungsi value V(s,a) mendefinisikan reward total yang diharapkan ketika melakukan aksi a pada state s jika untuk mencapai state berikutnya diikuti policy optimal pi*. Inilah fungsi di mana agent harus belajar untuk memperoleh policy ini. Ilustrasi RL ditunjukkan pada Gambar 1 berikut ini.

RL
Gambar 1. Ilustrasi Reinforcement Learning

RL sangat cocok untuk masalah-masalah terdistribusi. RL membutuhkan memori dan komputasi yang medium pada setiap node-nya. RL melakukan mekanisme pemeliharaan beberapa kemungkinan aksi-aksi yang berbeda beserta nilainya. RL memerlukan waktu untuk mencapai konvergen. RL mudah diimplementasikan, fleksibel terhadap perubahan topologi, dan mencapai aksi optimum. Contoh implementasi algoritma RL adalah Q-Learning, Dual RL, TPOT Reinforcement Learning, dan Collaborative RL.

Referensi:

[1] Raghavendra V. Kulkarni, Anna Forster, Ganesh Kumar V. “Computational Intelligence in Wireless Sensor Network : A Survey”.

Leave a Reply

  Posts

1 2 3
April 16th, 2015

Reinforcement Learning

Pada artikel tentang Data Mining dan Java sudah dijelaskan tentang metode machine learning, yaitu supervised dan unsupervised learning. Pada artikel […]

April 10th, 2015

Teknologi Java untuk Platform Pengembangan Agent

Saat ini bahasa komunikasi agent yang banyak digunakan dan dipelajari adalah FIFA (Foundation for Intelligent Physical Agents ) ACL (Agent […]

April 8th, 2015

Pendekatan Service Oriented Architecture pada Aplikasi Web yang Menerapkan Collective Intelligence

Semua aplikasi web umumnya terdiri dari server aplikasi atau web server,  yang melayani permintaan HTTP atau HTTPS yang dikirim dari browser pengguna, […]

April 7th, 2015

Kriptografi dengan Teknologi Java

Saat ini isu penyadapan menjadi isu lama yang muncul kembali. Masih ingat Indonesia dibuat marah dengan aksi yang dilakukan Australia […]

April 4th, 2015

Konsep Organisasi Agent pada Sistem Multiagent

Dalam pengembangan sistem multiagent satu hal penting yang perlu diperhatikan terkait kinerja sistem adalah aspek arsitektur. Pada aspek ini perlu […]

April 2nd, 2015

Hadoop: Big Data Appliance

Information Data Corporation (IDC) menghitung bahwa pada tahun 2010 telah tercipta jumlah data sebesar 1.2 ZettaBytes atau 1.2 Trilion Gigabyte. […]

April 1st, 2015

Menerapkan Collective Intelligence di Aplikasi Web

Aplikasi web terus bertransformasi. Aplikasi web terbaru saat ini memepercayai pengguna, mengundang pengguna untuk berinterkasi, menghubungkan antar pengguna, dan mendapatkan […]

March 27th, 2015

Sistem Multiagent

Agent adalah sistem komputer yang memiliki kapabilitas melakukan aksi yang otonom di lingkungan tertentu untuk mencapai tujuan yang didelegasikan kepadanya. […]

March 25th, 2015

E-Learning 2.0 : Paradigma Baru Pembelajaran On-Line

Selama bertahun-tahun, model learning adalah dengan pembelajaran tatap muka di kelas, dengan pembicaraan satu arah dari pengajar pada siswa. Sebagian […]

March 23rd, 2015

Menggunakan Zachman Framework untuk menerapkan SOA ke dalam Arsitektur Enterprise

Zachman Framework merupakan framework yang dapat digunakan untuk merancang arsitektur enterprise. Framework ini menekankan organisasi tidak hanya mempunyai satu arsitektur, […]