Perangkat Poker | Cara Membangun terkalahkan Robot poker-Bermain

Setiap musim panas, para peneliti komputer-ilmu di balik robot poker-bermain terbaik dunia membawa kreasi mereka bersama-sama untuk sebuah turnamen. Dalam beberapa tahun terakhir, tiga pesaing telah mendominasi: Pertama adalah kelompok dari University of Alberta, yang saat ini memiliki sekitar selusin orang yang bekerja pada program poker. Berikutnya adalah tim dari Carnegie Mellon University dan juara bot mereka “Tartanian.” Dan akhirnya, ada Eric Jackson, seorang peneliti independen yang telah menciptakan sebuah program bernama “Slumbot.”

Turnamen ini terdiri dari beberapa kompetisi yang berbeda, dengan tim menjahit kepribadian bot mereka masing-masing. Beberapa kompetisi yang KO, yang berarti dua bots pergi head-to-head di setiap putaran, dan satu dengan tumpukan terkecil chip di akhir akan dihilangkan. Untuk memenangkan kompetisi ini, bots perlu naluri bertahan hidup yang kuat. Mereka harus menang hanya cukup untuk bisa lolos ke babak-keserakahan berikutnya, karena itu, tidak baik. Pada pertandingan lainnya, namun, bot menang adalah salah satu yang mengumpulkan paling keseluruhan uang tunai. Dalam kompetisi ini, bots perlu memeras sebanyak yang mereka bisa keluar dari lawan mereka; untuk melakukannya, mereka harus terus menyerang dan menemukan cara untuk mengambil keuntungan dari orang lain.

Sebagian besar bots di turnamen telah menghabiskan bertahun-tahun dalam pembangunan, pelatihan selama jutaan jika tidak miliaran permainan. Namun tidak ada pot hadiah besar menunggu pemenang. Pencipta mungkin mendapatkan hak membual, tetapi mereka tidak akan meninggalkan dengan imbalan Vegas berukuran. Jadi apa iming-iming bekerja pada program ini?

Setiap kali komputer memainkan poker, itu memecahkan masalah yang akrab bagi kita semua: bagaimana menangani informasi yang hilang.

Dalam beberapa permainan, seperti catur, informasi ini tidak menjadi masalah. Pemain dapat melihat segala sesuatu. Mereka tahu di mana potongan-potongan dan apa bergerak lawan mereka telah dibuat. Keberuntungan merayap ke dalam permainan bukan karena pemain tidak dapat mengamati peristiwa, tetapi karena mereka tidak dapat memproses semua informasi yang tersedia. Itulah sebabnya selalu ada kesempatan (meskipun satu kecil) yang grandmaster bisa kalah monyet memetik bergerak acak.

Dengan baik permainan-bermain algoritma-dan banyak komputer power-itu mungkin untuk mendapatkan sekitar bahwa masalah pemrosesan informasi. Itulah bagaimana ilmuwan komputer Jonathan Schaeffer dan rekan-rekannya di University of Alberta menemukan strategi yang sempurna untuk catur, dan mengembangkan teori-teori mereka untuk bagaimana komputer mungkin suatu hari memecahkan catur. Itu mungkin bagi mesin untuk mengalahkan lawan-lawan mereka dengan kekerasan murni, berderak melalui setiap set kemungkinan bergerak. Tapi poker berbeda. Tidak peduli bagaimana pemain yang baik, masing-masing memiliki untuk mengatasi kenyataan bahwa kartu lawan ‘yang tersembunyi. Meskipun permainan memiliki aturan dan batasan, selalu ada faktor yang tidak diketahui.
“Poker adalah mikrokosmos yang sempurna dari banyak situasi yang kita hadapi di dunia nyata.”

Masalah yang sama tanaman dalam banyak aspek kehidupan. Negosiasi, lelang, tawar-semua game informasi yang tidak lengkap. “Poker adalah mikrokosmos yang sempurna dari banyak situasi yang kita hadapi di dunia nyata,” kata Schaeffer.

Pada 2015, para peneliti Alberta meluncurkan program bernama poker yang tidak ada duanya mereka Cepheus-di jurnal Science. Makalah ini berjudul “Heads-Up Batas Hold’em Poker Apakah Dipecahkan.”

Cepheus mampu mengembangkan penguasaan atas permainan setelah banyak latihan. Untuk membangun pengalaman, itu bermain lagi dan lagi, pada tingkat sekitar dua ribu game per detik. Seiring waktu, itu menjadi lebih baik di menjelajahi kombinasi besar kemungkinan bergerak, yang berarti ada sedikit link lemah dalam strategi untuk lawan untuk menargetkan. Akhirnya, bot belajar bagaimana untuk menghindari kehilangan dalam jangka panjang, bahkan untuk seorang pemain yang sempurna. Cepheus disempurnakan permainan dengan menggunakan sebuah “penyesalan minimisasi” algoritma: Setelah setiap pertandingan itu akan melihat kembali dan mempertimbangkan apa yang mungkin terjadi seandainya melakukan hal-hal yang berbeda, dan menggunakan informasi ini untuk belajar dari kesalahan.