sun
moon
Premium Partner :
  • partner tek.id benq
  • partner tek.id wd
  • partner tek.id asus
  • partner tek.id qnap
  • partner tek.id acer
  • partner tek.id advo
  • partner tek.id praxis
  • partner tek.id oppo
  • partner tek.id synologi
Senin, 28 Des 2020 15:50 WIB

AI ini bisa belajar main gim tanpa diajari

DeepMind berhasil menciptakan AI bernama MuZero yang dapat mempelajari cara bermain gim tanpa harus dibimbing oleh manusia.

AI ini bisa belajar main gim tanpa diajari

Saat ini, AI milik Google telah menguasai beberapa gim baik tradisional maupun modern. Mereka sudah memiliki AlphaGo Zero dan AlphaZero berbasis DeepMind yang dapat bertanding gim serta berhasil mengalahkan para master di bidangnya.

Namun, untuk membuat AI tersebut dapat bermain dan bahkan menang melawan para master, Google harus mengajari AI DeepMind secara intensif. Mereka masih belum dapat mengembangkan AI yang benar-benar dapat menguasai sebuah bidang secara otomatis.

Tapi, belakangan ini AI terbaru DeepMind, MuZero, dikabarkan tidak perlu diajari untuk menguasai sesuatu. MuZero dikabarkan dapat menguasai permainan seperti catur, shogi, dan rangkaian game Atari tanpa harus diajari sama sekali.

Engadget (28/12) melaporkan, para pengembang DeepMind membuat algoritma yang dapat beradaptasi dengan situasi di mana ia tidak mengetahui semua aturan yang mengatur simulasi. Namun demikian algoritma itu dirancang dapat menemukan cara untuk merencanakan kesuksesan. Mereka juga mengatakan proses ini menjadi tantangan yang sangat besar.

Namun, mereka dapat memecahkan teka teki tersebut menggunakan pendekatan yang disebut pencarian lookahead. Dengan metode ini, algoritma akan mempertimbangkan keadaan masa depan untuk merencanakan tindakan selanjutnya.

Cara terbaik untuk memahami hal ini adalah dengan memikirkan bagaimana Anda akan memainkan permainan strategi seperti catur atau Starcraft II. Sebelum bergerak, Anda akan mempertimbangkan bagaimana lawan akan bereaksi dan mencoba membuat rencana yang sesuai.

Dengan cara yang hampir sama, AI yang menggunakan metode lookahead akan mencoba merencanakan beberapa gerakan sebelumnya. Bahkan dengan permainan yang relatif mudah seperti catur, tidak mungkin untuk mempertimbangkan setiap kemungkinan keadaan di masa depan. Jadi sebaliknya AI akan memprioritaskan yang paling mungkin memenangkan pertandingan.  

Masalah dengan pendekatan ini adalah bahwa sebagian besar situasi dunia nyata, dan bahkan beberapa game, tidak memiliki seperangkat aturan sederhana yang mengatur cara pengoperasiannya. 

Beberapa peneliti telah mencoba untuk menyiasati masalah dengan menggunakan pendekatan yang mencoba untuk memodelkan bagaimana permainan atau lingkungan skenario tertentu akan memengaruhi suatu hasil dan kemudian menggunakan pengetahuan itu untuk membuat rencana. 

Kekurangan dari sistem ini adalah bahwa beberapa domain sangat kompleks sehingga pemodelan setiap aspek hampir tidak mungkin dilakukan. Ini terbukti menjadi kasus, misalnya dengan sebagian besar game Atari.      

Di satu sisi, MuZero menggabungkan yang terbaik dari kedua hal tersebut. Alih-alih memodelkan segalanya, mereka hanya mencoba mempertimbangkan faktor-faktor yang penting untuk membuat keputusan.

Seperti yang ditunjukkan DeepMind, ini adalah sesuatu yang dilakukan sebagaimana manusia. Ketika kebanyakan orang melihat keluar jendela dan melihat awan gelap, mereka umumnya tidak terjebak memikirkan hal-hal seperti kondensasi dan tekanan. Mereka malah berpikir tentang bagaimana mereka harus berpakaian agar tetap kering jika pergi ke luar. Dan MuZero melakukan hal serupa. 

Pendekatan yang tampaknya sederhana itu menjadikan MuZero algoritma paling efektif yang dibuat DeepMind hingga saat ini. Dalam pengujian yang mereka lakukan, ditemukan bahwa MuZero sebagus AlphaZero di catur, Go dan shogi, dan lebih baik dari semua algoritma sebelumnya, termasuk Agent57 di game Atari.

Anak perusahaan Google tersebut pun mengatakan bahwa kemampuan pembelajaran MuZero suatu hari nanti dapat membantu mereka mengatasi masalah kompleks di bidang seperti robotika di mana tidak ada aturan langsung.  

Share
×
tekid
back to top