Induksi Mundur

Apa Induksi Mundur?

Induksi mundur dalam teori permainan adalah proses berulang dari penalaran ke belakang dalam waktu, dari akhir masalah atau situasi, untuk memecahkan bentuk yang luas dan permainan berurutan, dan menyimpulkan urutan tindakan optimal.

Induksi Mundur Dijelaskan

Induksi mundur telah digunakan untuk memecahkan permainan sejak John von Neumann dan Oskar Morgenstern menetapkan teori permainan sebagai subjek akademis ketika mereka menerbitkan buku mereka, Theory of Games and Economic Behavior pada tahun 1944.

Pada setiap tahap permainan, induksi mundur menentukan strategi optimal dari pemain yang membuat langkah terakhir dalam permainan. Kemudian, tindakan optimal dari pemain bergerak berikutnya ke terakhir ditentukan, mengambil tindakan pemain terakhir seperti yang diberikan. Proses ini berlanjut ke belakang sampai tindakan terbaik untuk setiap titik waktu telah ditentukan. Secara efektif, seseorang menentukan ekuilibrium Nash dari setiap subgame dari game aslinya.

Namun, hasil yang disimpulkan dari induksi mundur seringkali gagal untuk memprediksi permainan manusia yang sebenarnya. Studi eksperimental telah menunjukkan bahwa perilaku “rasional” (seperti yang diprediksi oleh teori permainan) jarang ditampilkan dalam kehidupan nyata. Pemain yang tidak rasional mungkin akan mendapatkan bayaran yang lebih tinggi daripada yang diperkirakan oleh induksi mundur, seperti yang diilustrasikan dalam permainan kelabang .

Dalam permainan kelabang, dua pemain secara bergantian mendapatkan kesempatan untuk mengambil bagian yang lebih besar dari pot uang yang meningkat, atau untuk memberikan pot tersebut kepada pemain lain. Pembayaran diatur sedemikian rupa sehingga jika pot diteruskan ke lawan dan lawan mengambil pot di ronde berikutnya, seseorang menerima sedikit lebih sedikit daripada jika dia mengambil pot di ronde ini. Permainan berakhir segera setelah seorang pemain mengambil simpanan, dengan pemain tersebut mendapatkan porsi yang lebih besar dan pemain lain mendapatkan porsi yang lebih kecil.

Contoh Induksi Mundur

Sebagai contoh, asumsikan Pemain A pergi lebih dulu dan harus memutuskan apakah dia harus “mengambil” atau “mengoper” simpanan, yang saat ini berjumlah $ 2. Jika dia mengambil, maka A dan B mendapatkan $ 1 masing-masing, tetapi jika A lolos, keputusan untuk mengambil atau mengoper sekarang harus dibuat oleh Pemain B. Jika B mengambil, dia mendapat $ 3 (yaitu, simpanan sebelumnya $ 2 + $ 1) dan A mendapat $ 0. Tetapi jika B lolos, A sekarang harus memutuskan apakah akan mengambil atau lulus, dan seterusnya. Jika kedua pemain selalu memilih untuk lulus, mereka masing-masing menerima hadiah $ 100 di akhir permainan.

Inti dari permainan ini adalah jika A dan B sama-sama bekerja sama dan terus lolos hingga akhir permainan, mereka mendapatkan pembayaran maksimum masing-masing $ 100. Tetapi jika mereka tidak mempercayai pemain lain dan mengharapkan mereka untuk “mengambil” pada kesempatan pertama, ekuilibrium Nash memprediksi para pemain akan mengambil klaim serendah mungkin ($ 1 dalam kasus ini).

Ekuilibrium Nash dalam permainan ini, di mana tidak ada pemain yang memiliki insentif untuk menyimpang dari strategi yang dipilihnya setelah mempertimbangkan pilihan lawan, menunjukkan bahwa pemain pertama akan mengambil taruhan pada putaran pertama permainan. Namun, pada kenyataannya, relatif sedikit pemain yang melakukannya. Akibatnya, mereka mendapatkan hasil yang lebih tinggi daripada hasil yang diprediksi oleh analisis ekuilibria.

Memecahkan Game Berurutan Menggunakan Induksi Mundur

Di bawah ini adalah permainan berurutan sederhana antara dua pemain. Label dengan Pemain 1 dan Pemain 2 di dalamnya adalah kumpulan informasi untuk pemain satu atau dua, masing-masing. Angka-angka dalam tanda kurung di bagian bawah pohon adalah hasil di setiap poin. Permainan ini juga berurutan, jadi Pemain 1 membuat keputusan pertama (kiri atau kanan) dan Pemain 2 membuat keputusannya setelah Pemain 1 (atas atau bawah).

Induksi mundur, seperti semua teori permainan, menggunakan asumsi rasionalitas dan maksimalisasi, yang berarti bahwa Pemain 2 akan memaksimalkan pembayarannya dalam situasi tertentu. Di setiap kumpulan informasi, kami memiliki dua pilihan, semuanya empat. Dengan menghilangkan pilihan yang tidak akan dipilih oleh Player 2, kita dapat mempersempit pohon kita. Dengan cara ini, kami akan menandai garis dengan warna biru yang memaksimalkan pembayaran pemain pada kumpulan informasi yang diberikan.

Setelah pengurangan ini, Pemain 1 dapat memaksimalkan bayarannya sekarang setelah pilihan Pemain 2 diumumkan. Hasilnya adalah keseimbangan yang ditemukan dengan induksi mundur dari Pemain 1 memilih “benar” dan Pemain 2 memilih “naik.” Di bawah ini adalah solusi untuk game dengan jalur ekuilibrium dicetak tebal.

Misalnya, seseorang dapat dengan mudah membuat game yang mirip dengan yang di atas menggunakan perusahaan sebagai pemain. Game ini dapat menyertakan skenario rilis produk. Jika Perusahaan 1 ingin merilis produk, apa yang mungkin dilakukan Perusahaan 2 sebagai tanggapan? Akankah Perusahaan 2 merilis produk pesaing serupa? Dengan memperkirakan penjualan produk baru ini dalam berbagai skenario, kami dapat menyiapkan permainan untuk memprediksi bagaimana peristiwa dapat terjadi. Di bawah ini adalah contoh bagaimana seseorang dapat memodelkan permainan semacam itu.