Bagaimana Strategi Teori Game Meningkatkan Pengambilan Keputusan

Teori permainan, studi tentang pengambilan keputusan strategis, menyatukan disiplin ilmu yang berbeda seperti matematika, psikologi, dan filsafat. Teori permainan ditemukan oleh John von Neumann dan Oskar Morgenstern pada tahun 1944 dan telah berkembang pesat sejak saat itu. Pentingnya teori permainan bagi analisis modern dan pengambilan keputusan dapat diukur dari fakta bahwa sejak tahun 1970, sebanyak 12 ekonom dan ilmuwan terkemuka telah dianugerahi Penghargaan Nobel dalam Ilmu Ekonomi atas kontribusinya pada teori permainan.

Teori permainan diterapkan di sejumlah bidang, termasuk bisnis, keuangan, ekonomi, ilmu politik, dan psikologi. Memahami strategi teori permainan — yang populer dan beberapa strategi yang relatif kurang dikenal — penting untuk meningkatkan kemampuan penalaran dan pengambilan keputusan seseorang di dunia yang kompleks.

Apa Strategi Teori Game Meningkatkan Pengambilan Keputusan?

Salah satu strategi teori permainan yang paling populer dan mendasar adalah dilema narapidana. Konsep ini mengeksplorasi strategi pengambilan keputusan yang diambil oleh dua individu yang, dengan bertindak untuk kepentingan terbaik individu mereka, berakhir dengan hasil yang lebih buruk daripada jika mereka bekerja sama satu sama lain di tempat pertama.


Dalam dilema narapidana, dua tersangka yang ditangkap karena kejahatan ditahan di ruangan terpisah dan tidak dapat berkomunikasi satu sama lain. Jaksa penuntut memberi tahu Tersangka 1 dan Tersangka 2 secara individu bahwa jika ia mengaku dan bersaksi melawan yang lain, ia dapat dibebaskan, tetapi jika ia tidak bekerja sama dan tersangka lainnya melakukannya, ia akan dihukum tiga tahun penjara. Jika keduanya mengaku, mereka akan mendapatkan hukuman dua tahun, dan jika tidak ada yang mengaku, mereka akan dihukum satu tahun penjara.

Sementara kerja sama adalah strategi terbaik bagi kedua tersangka, ketika dihadapkan pada dilema seperti itu, penelitian menunjukkan bahwa sebagian besar orang yang rasional lebih suka mengaku dan bersaksi melawan orang lain daripada tetap diam dan mengambil kesempatan pihak lain mengaku.

(Untuk bacaan terkait, lihat: Dilema Tahanan dalam Bisnis dan Ekonomi .)

Strategi Teori Game

Dilema narapidana meletakkan dasar bagi strategi teori permainan tingkat lanjut, di antaranya yang populer meliputi:

Pennies yang Cocok

Ini adalah permainan zero-sum yang melibatkan dua pemain (sebut mereka Pemain A dan Pemain B) secara bersamaan menempatkan satu sen di atas meja, dengan pembayaran tergantung pada apakah sen cocok. Jika kedua sen adalah kepala atau ekor, Pemain A menang dan menyimpan sen Pemain B. Jika mereka tidak cocok, Pemain B menang dan menyimpan sen Pemain A.


Jalan buntu

Ini adalah skenario dilema sosial seperti dilema narapidana di mana dua pemain dapat bekerja sama atau membelot (yaitu tidak bekerja sama). Dalam kebuntuan, jika Player A dan Player B sama-sama bekerja sama, mereka masing-masing mendapatkan bayaran 1, dan jika keduanya cacat, mereka masing-masing mendapatkan hadiah 2. Tetapi jika Player A bekerja sama dan Player B cacat, maka A mendapat bayaran dari 0 dan B mendapat pembayaran 3. Dalam diagram pembayaran di bawah, angka pertama di sel (a) sampai (d) mewakili pembayaran Pemain A, dan angka kedua adalah dari Pemain B:

Kebuntuan berbeda dari dilema narapidana dalam hal tindakan yang paling menguntungkan bersama (yaitu, keduanya cacat) juga merupakan strategi yang dominan. Strategi dominan untuk seorang pemain didefinisikan sebagai salah satu yang menghasilkan bayaran tertinggi dari setiap strategi yang tersedia, terlepas dari strategi yang digunakan oleh pemain lain.

Contoh kebuntuan yang sering dikutip adalah dua kekuatan nuklir yang mencoba mencapai kesepakatan untuk melenyapkan persenjataan bom nuklir mereka. Dalam hal ini, kerjasama berarti menaati kesepakatan, sedangkan pembelotan berarti secara diam-diam mengingkari kesepakatan dan mempertahankan persenjataan nuklir. Hasil terbaik untuk kedua negara, sayangnya, adalah mengingkari perjanjian dan mempertahankan opsi nuklir sementara negara lain menghilangkan persenjataannya karena ini akan memberikan keuntungan tersembunyi yang luar biasa dibandingkan yang terakhir jika perang pecah di antara keduanya. Pilihan terbaik kedua adalah membelot atau tidak bekerja sama karena ini mempertahankan status mereka sebagai kekuatan nuklir.

Kompetisi Cournot

Model ini juga secara konseptual mirip dengan dilema tahanan dan dinamai menurut matematikawan Prancis Augustin Cournot, yang memperkenalkannya pada tahun 1838. Penerapan yang paling umum dari model Cournot adalah dalam mendeskripsikan duopoli atau dua produsen utama di pasar.

Misalnya, asumsikan perusahaan A dan B menghasilkan produk yang identik dan dapat menghasilkan jumlah tinggi atau rendah. Jika mereka berdua bekerja sama dan setuju untuk memproduksi pada tingkat yang rendah, maka persediaan yang terbatas akan menghasilkan harga yang tinggi untuk produk di pasar dan keuntungan yang besar bagi kedua perusahaan. Di sisi lain, jika mereka cacat dan berproduksi pada tingkat tinggi, pasar akan kebanjiran dan mengakibatkan harga produk yang rendah dan akibatnya keuntungan yang lebih rendah untuk keduanya. Tetapi jika satu bekerja sama (yaitu memproduksi pada tingkat rendah) dan cacat lainnya (yaitu secara diam-diam memproduksi pada tingkat tinggi), maka yang pertama hanya mencapai titik impas sementara yang terakhir memperoleh keuntungan yang lebih tinggi daripada jika keduanya bekerja sama. 

Matriks pembayaran untuk perusahaan A dan B ditampilkan (angka mewakili keuntungan dalam jutaan dolar). Jadi, jika A bekerja sama dan berproduksi pada tingkat rendah sementara B cacat dan berproduksi pada tingkat tinggi, hasilnya seperti yang ditunjukkan dalam sel (b) —bobot-impas untuk perusahaan A dan keuntungan $ 7 juta untuk perusahaan B.

Koordinasi

Dalam koordinasi, pemain mendapatkan bayaran yang lebih tinggi ketika mereka memilih tindakan yang sama.

Sebagai contoh, pertimbangkan dua raksasa teknologi yang memutuskan antara memperkenalkan teknologi baru yang radikal dalam chip memori yang dapat menghasilkan keuntungan ratusan juta bagi mereka, atau versi revisi dari teknologi lama yang akan menghasilkan jauh lebih sedikit. Jika hanya satu perusahaan yang memutuskan untuk terus menggunakan teknologi baru, tingkat adopsi oleh konsumen akan jauh lebih rendah, dan akibatnya, pendapatannya akan lebih rendah daripada jika kedua perusahaan memutuskan tindakan yang sama. Matriks pembayaran ditunjukkan di bawah ini (angka mewakili keuntungan dalam jutaan dolar).

Jadi, jika kedua perusahaan memutuskan untuk memperkenalkan teknologi baru, mereka akan mendapatkan $ 600 juta masing-masing, sementara memperkenalkan versi revisi dari teknologi lama akan menghasilkan $ 300 juta masing-masing, seperti yang ditunjukkan di sel (d). Tetapi jika Perusahaan A memutuskan sendiri untuk memperkenalkan teknologi baru, itu hanya akan menghasilkan $ 150 juta, meskipun Perusahaan B akan mendapatkan $ 0 (mungkin karena konsumen mungkin tidak bersedia membayar untuk teknologinya yang sekarang sudah usang). Dalam hal ini, masuk akal bagi kedua perusahaan untuk bekerja sama daripada bekerja sendiri. 

Game Lipan 

Ini adalah permainan dengan bentuk yang luas di mana dua pemain secara bergantian mendapatkan kesempatan untuk mengambil bagian yang lebih besar dari simpanan uang yang perlahan meningkat. The Game kelabang adalah berurutan sejak pemain membuat gerakan mereka satu demi satu daripada secara bersamaan; setiap pemain juga mengetahui strategi yang dipilih oleh para pemain yang bermain sebelumnya. Permainan berakhir segera setelah seorang pemain mengambil simpanan, dengan pemain tersebut mendapatkan porsi yang lebih besar dan pemain lain mendapatkan porsi yang lebih kecil.

Sebagai contoh, asumsikan Pemain A pergi lebih dulu dan harus memutuskan apakah dia harus “mengambil” atau “mengoper” simpanan, yang saat ini berjumlah $ 2. Jika dia mengambil, maka A dan B mendapatkan $ 1 masing-masing, tetapi jika A lolos, keputusan untuk mengambil atau mengoper sekarang harus dibuat oleh Pemain B. Jika B mengambil, dia mendapat $ 3 (yaitu simpanan sebelumnya $ 2 + $ 1) dan A mendapat $ 0. Tetapi jika B lolos, A sekarang harus memutuskan apakah akan mengambil atau lulus, dan seterusnya. Jika kedua pemain selalu memilih untuk lulus, mereka masing-masing menerima hadiah $ 100 di akhir permainan.

Inti dari permainan ini adalah jika A dan B sama-sama bekerja sama dan terus lolos hingga akhir permainan, mereka mendapatkan pembayaran maksimum masing-masing $ 100. Tetapi jika mereka tidak mempercayai pemain lain dan mengharapkan mereka untuk “mengambil” pada kesempatan pertama,  ekuilibrium Nash memprediksi para pemain akan mengambil klaim serendah mungkin ($ 1 dalam kasus ini). Studi eksperimental telah menunjukkan, bagaimanapun, perilaku “rasional” ini (seperti yang diprediksi oleh teori permainan) jarang ditampilkan dalam kehidupan nyata. Hal ini tidak mengherankan secara intuitif mengingat kecilnya ukuran pembayaran awal dalam kaitannya dengan pembayaran terakhir. Perilaku serupa oleh subjek eksperimental juga telah ditunjukkan dalam dilema wisatawan.

Dilema Wisatawan 

Permainan jumlah bukan nol ini, di mana kedua pemain berusaha untuk memaksimalkan pembayaran mereka sendiri tanpa mempedulikan yang lain, dirancang oleh ekonom Kaushik Basu pada tahun 1994. Misalnya, dalam dilema perjalanan, sebuah maskapai penerbangan setuju untuk membayar kompensasi kepada dua penumpang untuk kerusakan. ke barang yang identik. Namun, kedua pelancong secara terpisah diminta untuk memperkirakan nilai barang tersebut, dengan minimal $ 2 dan maksimum $ 100. Jika keduanya menuliskan nilai yang sama, maskapai penerbangan akan mengganti masing-masing jumlah tersebut. Tetapi jika nilainya berbeda, maskapai akan membayar mereka dengan nilai yang lebih rendah, dengan bonus $ 2 untuk pelancong yang menuliskan nilai yang lebih rendah ini dan denda $ 2 untuk pelancong yang menuliskan nilai yang lebih tinggi.

Tingkat ekuilibrium Nash, berdasarkan induksi mundur , adalah $ 2 dalam skenario ini. Tetapi seperti dalam permainan kelabang, eksperimen laboratorium secara konsisten menunjukkan sebagian besar peserta, secara naif atau tidak, memilih angka yang jauh lebih tinggi dari $ 2.

Dilema traveler dapat diterapkan untuk menganalisis berbagai situasi kehidupan nyata. Proses induksi mundur, misalnya, dapat membantu menjelaskan bagaimana dua perusahaan yang terlibat dalam persaingan yang kejam dapat terus menurunkan harga produk untuk mendapatkan pangsa pasar , yang dapat mengakibatkan kerugian yang semakin besar dalam prosesnya.

Pertempuran Jenis Kelamin

Ini adalah bentuk lain dari permainan koordinasi yang dijelaskan sebelumnya, tetapi dengan beberapa asimetri hasil. Ini pada dasarnya melibatkan pasangan yang mencoba mengoordinasikan acara malam mereka. Meskipun mereka telah sepakat untuk bertemu baik di pertandingan bola (preferensi pria) atau di sebuah drama (preferensi wanita), mereka telah melupakan apa yang mereka putuskan, dan yang memperparah, masalahnya, tidak dapat berkomunikasi satu sama lain. Kemana mereka harus pergi? Matriks pembayaran ditunjukkan di bawah ini dengan angka-angka dalam sel yang masing-masing mewakili tingkat kenikmatan relatif dari acara tersebut untuk wanita dan pria. Misalnya, sel (a) mewakili hasil (dalam hal tingkat kenikmatan) untuk wanita dan pria dalam permainan (dia lebih menikmatinya daripada pria). Sel (d) adalah hasil jika keduanya berhasil mencapai permainan bola (dia lebih menikmatinya daripada dia). Sel (c) mewakili ketidakpuasan jika keduanya pergi tidak hanya ke lokasi yang salah tetapi juga ke acara yang paling tidak mereka sukai — wanita dalam pertandingan bola dan pria yang bermain.

Game Diktator 

Ini adalah permainan sederhana di mana Pemain A harus memutuskan bagaimana membagi hadiah uang tunai dengan Pemain B, yang tidak memiliki masukan dalam keputusan Pemain A. Meskipun ini bukan strategi teori permainan per se , itu memberikan beberapa wawasan menarik perilaku orang. Eksperimen mengungkapkan sekitar 50% menyimpan semua uang untuk diri mereka sendiri, 5% membaginya secara merata, dan 45% lainnya memberi peserta lain bagian yang lebih kecil. Permainan diktator sangat erat kaitannya dengan permainan ultimatum, dimana Pemain A diberikan sejumlah uang yang sebagian harus diberikan kepada Pemain B, yang dapat menerima atau menolak jumlah yang diberikan. Tangkapannya adalah jika pemain kedua menolak jumlah yang ditawarkan, baik A dan B tidak mendapatkan apa-apa. Permainan diktator dan ultimatum memegang pelajaran penting untuk isu-isu seperti pemberian amal dan filantropi .

Perang Damai 

Ini adalah variasi dari dilema narapidana di mana keputusan “bekerja sama atau cacat” diganti dengan “perdamaian atau perang”. Sebuah analogi bisa jadi dua perusahaan perang harga akan mengurangi hasil secara dramatis (sel d). Namun, jika A terlibat dalam pemotongan harga (perang) tetapi B tidak, A akan mendapatkan hasil yang lebih tinggi sebesar 4 karena mungkin dapat menangkap pangsa pasar yang substansial, dan volume yang lebih tinggi ini akan mengimbangi harga produk yang lebih rendah.

Dilema Sukarela

Dalam dilema relawan, seseorang harus melakukan tugas atau pekerjaan untuk kebaikan bersama. Hasil terburuk yang mungkin terwujud jika tidak ada yang menjadi sukarelawan. Misalnya, pertimbangkan sebuah perusahaan di mana kecurangan akuntansi merajalela tetapi manajemen puncak tidak menyadarinya. Beberapa karyawan junior di departemen akuntansi mengetahui penipuan tersebut tetapi ragu untuk memberi tahu manajemen puncak karena akan mengakibatkan karyawan yang terlibat dalam penipuan tersebut dipecat dan kemungkinan besar akan dituntut.

Dilabeli sebagai whistleblower  mungkin juga memiliki beberapa dampak di kemudian hari. Tetapi jika tidak ada yang menjadi sukarelawan, penipuan skala besar dapat mengakibatkan kebangkrutan perusahaan dan hilangnya pekerjaan semua orang.

Garis bawah

Teori permainan dapat digunakan dengan sangat efektif sebagai alat untuk pengambilan keputusan baik dalam pengaturan ekonomi, bisnis atau pribadi.

(Untuk bacaan terkait, lihat: Game Theory: Beyond the Basics .)