Strategi campuran. Strategi pemain murni

💖 Apakah kamu menyukainya? Bagikan tautannya dengan teman-teman Anda

Jika dalam suatu permainan masing-masing lawannya hanya menggunakan strategi yang sama, maka permainan itu sendiri dalam hal ini dikatakan sedang terjadi V strategi murni , dan digunakan oleh pemain A dan pemainnya DI DALAM sepasang strategi disebut strategi murni .

Definisi. Dalam permainan antagonis, sepasang strategi ( A Saya , DI DALAM j) disebut ekuilibrium atau stabil jika tidak menguntungkan bagi salah satu pemain untuk menyimpang dari strateginya.

Masuk akal untuk menggunakan strategi murni saat menjadi pemain A Dan DI DALAM memiliki informasi tentang tindakan masing-masing dan hasil yang dicapai. Jika kita berasumsi bahwa setidaknya salah satu pihak tidak mengetahui perilaku lawannya, maka gagasan keseimbangan dilanggar dan permainan dimainkan secara tidak sistematis.

Pertimbangkan permainan matriks G(3x4)

Dalam contoh ini, harga permainan yang lebih rendah sama dengan harga yang lebih tinggi: ==9, yaitu. permainan ini memiliki titik pelana.

Ternyata dalam hal ini strategi maximin A 2 dan DI DALAM 2 akan menjadi berkelanjutan sehubungan dengan informasi tentang perilaku musuh.

Memang biarkan pemainnya A mengetahui bahwa musuh menggunakan strategi DI DALAM 2. Tapi meski begitu, pemainnya A akan terus mengikuti strategi tersebut A 2, karena adanya penyimpangan dari strategi A 2 hanya akan mengurangi kemenangan. Begitu pula dengan informasi yang diterima pemain DI DALAM, tidak akan memaksanya mundur dari strateginya DI DALAM 2 .

Beberapa strategi A 2 dan DI DALAM 2 memiliki sifat stabilitas, dan hasil (dalam contoh yang dipertimbangkan sama dengan 9) yang dicapai dengan pasangan strategi ini ternyata menjadi titik pelana dari matriks pembayaran.

Tanda stabilitas (keseimbangan) suatu pasangan strategi adalah kesetaraan harga permainan yang lebih rendah dan lebih tinggi.

Strategi A Saya Dan DI DALAM J(dalam contoh yang sedang dipertimbangkan A 2 , DI DALAM 2), yang memenuhi persamaan harga permainan yang lebih rendah dan lebih tinggi, disebut strategi murni optimal, dan totalitasnya disebut solusi permainan. Dalam hal ini, mereka mengatakan tentang permainan itu sendiri yang diselesaikan dengan strategi murni.

Nilai tersebut disebut harga permainan.

Jika 0, maka permainan menguntungkan bagi pemain A, jika 0 - untuk pemain B; di =0 permainannya adil, mis. sama-sama bermanfaat bagi kedua peserta.

Namun, kehadiran titik pelana dalam permainan bukanlah suatu pengecualian; Mayoritas permainan matriks, tidak memiliki titik pelana, sehingga tidak memiliki strategi murni yang optimal. Namun, ada jenis permainan yang selalu memiliki titik pelana dan oleh karena itu diselesaikan dengan strategi murni. Ini adalah permainan dengan informasi lengkap.

Teorema 2. Setiap permainan dengan informasi lengkap mempunyai titik pelana dan oleh karena itu diselesaikan dengan strategi murni, yaitu. ada sepasang strategi murni optimal yang memberikan hasil stabil yang setara.

Jika permainan seperti itu hanya terdiri dari gerakan pribadi, maka ketika setiap pemain menggunakan strategi murni optimalnya, maka harus berakhir dengan kemenangan, sama dengan harganya pertandingan. Misalnya, permainan catur, sebagai permainan yang informasinya lengkap, selalu berakhir dengan kemenangan bagi Putih, atau selalu menang bagi Hitam, atau selalu seri (hanya saja kita tidak tahu persisnya apa, karena banyaknya kemungkinan strategi dalam permainan catur sangat besar).

Jika matriks permainan mempunyai titik pelana, maka solusinya segera dicari dengan menggunakan prinsip maximin.

Timbul pertanyaan: bagaimana menemukan solusi untuk permainan yang matriks pembayarannya tidak memiliki titik pelana? Penerapan prinsip maximin oleh setiap pemain memastikan bahwa pemain A tidak kalah menangnya, dan pemain A tidak kalah lagi. Mengingat hal tersebut, wajar jika pemain A ingin menambah kemenangannya, dan pemain B ingin mengurangi kekalahan. Pencarian solusi semacam itu mengarah pada kebutuhan untuk menerapkan strategi campuran: mengganti strategi murni dengan frekuensi tertentu.

Definisi. Variabel acak, yang nilainya merupakan strategi murni pemain, disebut nya strategi campuran .

Jadi, tugas strategi campuran seorang pemain adalah menunjukkan probabilitas strategi murninya dipilih.

Kami akan menunjukkan strategi campuran para pemain A Dan DI DALAM masing-masing

S A =||hal 1 , hal 2 , ..., hal m ||,

S B =||q 1 , q 2 , ..., q n ||,

dimana p i adalah probabilitas pemain menggunakan A murni dengan strategi A Saya; ; q j adalah probabilitas pemain B menggunakan strategi murni B j ; .

Dalam kasus khusus ketika semua probabilitas kecuali satu sama dengan nol, dan probabilitas ini sama dengan satu, strategi campuran berubah menjadi strategi murni.

Aplikasi strategi campuran dilakukan, misalnya, dengan cara ini: permainan diulang berkali-kali, tetapi dalam setiap permainan pemain menerapkan berbagai strategi murni dengan frekuensi relatif penerapannya sama dengan P Saya Dan Q J .

Strategi campuran dalam teori permainan adalah model taktik yang dapat diubah dan fleksibel dimana tidak ada pemain yang mengetahui strategi murni mana yang akan dipilih lawan dalam permainan tertentu.

Jika pemain A menerapkan strategi campuran S A =||p 1 , p 2 , ..., p m ||, dan pemain DI DALAM strategi campuran S B =||q 1 , q 2 , ..., q n ||, maka rata-rata hasil ( harapan matematis) pemain A ditentukan oleh relasinya

Wajar saja, kerugian yang diharapkan sang pemain DI DALAM sama dengan nilai yang sama.

Jadi, jika permainan matriks tidak memiliki saddle point, maka pemain harus menggunakan strategi campuran yang optimal yang akan memberikan hasil yang maksimal.

Pertanyaan yang wajar muncul: pertimbangan apa yang harus digunakan ketika memilih strategi campuran? Ternyata prinsip maximin tetap memiliki maknanya dalam kasus ini. Di samping itu, penting Untuk memahami solusi permainan, digunakan teorema dasar teori permainan.

Strategi murni pemain I harus memilih salah satu dari n baris matriks hasil A, dan strategi murni pemain II adalah memilih salah satu kolom dari matriks yang sama.

Strategi pemain murni optimal berbeda dengan strategi campuran dengan adanya unit wajib p i = 1, q i = 1. Contoh: P(1,0), Q(1,0). Di sini p 1 = 1, q 1 = 1.

Masalah 1
Dengan menggunakan matriks pembayaran, temukan strategi murni yang optimal menggunakan prinsip dominasi yang ketat. Sebagai jawabannya, tuliskan vektor P*, Q*.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

Larutan:

Kami menyelesaikan semua masalah menggunakan permainan matriks kalkulator.

Kita berasumsi bahwa pemain I memilih strateginya sedemikian rupa untuk memaksimalkan keuntungannya, dan pemain II memilih strateginya sedemikian rupa untuk meminimalkan keuntungan pemain I.

PemainB1B 2B3B4a = menit(A saya)
Sebuah 13 1 2 5 1
Sebuah 22 0 0 3 0
Sebuah 3-3 -5 -5 -2 -5
Sebuah 40 -2 -2 1 -2
b = maks(B i)3 1 2 5
Kami menemukan jaminan hasil yang ditentukan oleh harga permainan yang lebih rendah a = max(ai) = 1, yang menunjukkan strategi murni maksimum A 1 .
Harga atas permainan b = min(b j) = 1.
Titik pelana (1, 2) menunjukkan solusi dari sepasang alternatif (A1,B2). Harga permainannya adalah 1.
2. Periksa matriks pembayaran untuk baris dominan dan kolom dominan.
Kadang-kadang, berdasarkan pemeriksaan sederhana terhadap matriks permainan, dapat dikatakan bahwa beberapa strategi murni hanya dapat dimasukkan dalam strategi campuran optimal dengan probabilitas nol.
Mereka mengatakan itu saya-itu Strategi Pemain 1 mendominasi dirinya kth strategi jika a ij ≥ a kj untuk semua j E N dan untuk setidaknya satu J a ij > a kj . Dalam hal ini juga dikatakan demikian saya-itu strategi (atau garis) – dominan, k-th– didominasi.
Mereka mengatakan itu j-i Strategi pemain ke-2 mendominasi dirinya lth strategi jika untuk semua orang j E M a ij ≤ a il dan paling sedikit satu i a ij< a il . В этом случае j-th strategi (kolom) disebut dominan, lth– didominasi.
Strategi A 1 mendominasi strategi A 2 (semua elemen baris 1 lebih besar atau sama dengan nilai baris ke-2), oleh karena itu kita mengecualikan baris ke-2 dari matriks. Kemungkinan p 2 = 0.
Strategi A 1 mendominasi strategi A 3 (semua elemen baris 1 lebih besar atau sama dengan nilai baris ke-3), oleh karena itu kita mengecualikan baris ke-3 dari matriks tersebut. Kemungkinan hal 3 = 0.
3 1 2 5
0 -2 -2 1

Dari segi kekalahan pemain B, strategi B 1 mendominasi strategi B 2 (semua elemen kolom 1 lebih besar dari elemen kolom 2), oleh karena itu kami mengecualikan kolom pertama matriks. Kemungkinan q 1 = 0.
Dari segi kekalahan pemain B, strategi B 4 mendominasi strategi B 1 (semua elemen kolom 4 lebih besar dari elemen kolom 1), oleh karena itu kami mengecualikan kolom ke-4 dari matriks. Peluang q 4 = 0.
1 2
-2 -2

Kami telah mengurangi permainan 4 x 4 menjadi permainan 2 x 2.



Solusi permainan ( 2 x n


hal 1 = 1
hal 2 = 0
Harga permainan, y = 1
Sekarang kita dapat menemukan strategi minimax pemain B dengan menulis sistem persamaan yang sesuai
q 1 = 1
q 1 + q 2 = 1
Memecahkan sistem ini, kami menemukan:
q 1 = 1.
Menjawab:
Harga permainan: y = 1, vektor strategi pemain:
Q(1, 0), P(1, 0)

∑a ij q j ≤ v
∑a ij pi ≥ v
M(P 1 ;Q) = (1 1) + (2 0) = 1 = v
M(P 2 ;Q) = (-2 1) + (-2 0) = -2 ≤ v
M(P;Q 1) = (1 1) + (-2 0) = 1 = v
M(P;Q 2) = (2 1) + (-2 0) = 2 ≥ v

Karena baris dan kolom telah dihilangkan dari matriks asli, vektor probabilitas yang ditemukan dapat ditulis sebagai:
P(1,0,0,0)
Q(0,1,0,0)

Masalah 2
Dengan menggunakan matriks pembayaran, temukan harga tertinggi dan terendah dari game tersebut. Jika terdapat titik pelana, tuliskan vektor strategi murni optimal P*, Q*.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

Larutan:
1. Periksa apakah matriks pembayaran mempunyai titik pelana. Jika ya, maka kami menuliskan solusi permainan tersebut dalam strategi murni.
PemainB1B 2B3a = menit(A saya)
Sebuah 1-6 -5 0 -6
Sebuah 2-8 -3 -2 -8
Sebuah 3-3 -2 3 -3
b = maks(B i)-3 -2 3

Kami menemukan jaminan hasil yang ditentukan oleh harga permainan yang lebih rendah a = max(ai) = -3, yang menunjukkan strategi murni maksimum A 3 .
Harga atas permainan b = min(b j) = -3.
Titik pelana (3, 1) menunjukkan solusi dari sepasang alternatif (A3,B1). Biaya permainannya adalah -3.
Jawaban: P(0,0,1), Q(1,0,0)

Masalah 3
Dengan menggunakan matriks pembayaran, carilah vektor strategi optimal P*, Q* dan harga permainan. Pemain mana yang menang?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

Larutan:
1. Periksa apakah matriks pembayaran mempunyai titik pelana. Jika ya, maka kami menuliskan solusi permainan tersebut dalam strategi murni.
Kita berasumsi bahwa pemain I memilih strateginya sedemikian rupa untuk memaksimalkan keuntungannya, dan pemain II memilih strateginya sedemikian rupa untuk meminimalkan keuntungan pemain I.
PemainB1B 2B3B4a = menit(A saya)
Sebuah 1-6 -6 2 4 -6
Sebuah 22 -2 7 -1 -2
b = maks(B i)2 -2 7 4

Kami menemukan jaminan hasil yang ditentukan oleh harga permainan yang lebih rendah a = max(ai) = -2, yang menunjukkan strategi murni maksimum A 2 .
Harga atas permainan b = min(b j) = -2.
Titik pelana (2, 2) menunjukkan solusi dari sepasang alternatif (A2,B2). Biaya permainannya adalah -2.
3. Temukan solusi permainan dalam strategi campuran.
Mari kita selesaikan masalah tersebut menggunakan metode geometri, yang meliputi langkah-langkah berikut:
1.B sistem kartesius koordinat, sebuah segmen diplot sepanjang sumbu absis, yang panjangnya 1. Ujung kiri segmen (titik x = 0) sesuai dengan strategi A 1, ujung kanan - ke strategi A 2 (x = 1). Titik tengah x sesuai dengan probabilitas beberapa strategi campuran S 1 = (p 1 ,p 2).
2. Imbalan dari strategi A 1 diplot pada ordinat kiri. Pada garis yang sejajar dengan ordinat, dari titik 1, kemenangan strategi A 2 diplot.
Solusi permainan ( 2 x n) kita jalankan dari posisi pemain A dengan mengikuti strategi maximin. Tidak ada satu pun pemain yang memiliki strategi dominan atau duplikat.

Strategi optimal maksimal pemain A berhubungan dengan titik N, yang mana kita dapat menulis sistem persamaan berikut:
hal 1 = 0
hal 2 = 1
Harga permainan, y = -2
Sekarang kita dapat mencari strategi minimax pemain B dengan menuliskan sistem persamaan yang sesuai, tidak termasuk strategi B 1,B 3,B 4, yang jelas memberikan kerugian lebih besar kepada pemain B, dan oleh karena itu, q 1 = 0,q 3 = 0,q 4 = 0 .
-2q 2 = -2
q 2 = 1
Memecahkan sistem ini, kami menemukan:
q 2 = 1.
Menjawab:
Harga permainan: y = -2, vektor strategi pemain:
Q(0, 1, 0, 0), P(0, 1)
4. Mari kita periksa kebenaran solusi permainan menggunakan kriteria optimalitas strategi.
∑a ij q j ≤ v
∑a ij pi ≥ v
M(P 1 ;Q) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ v
M(P 2 ;Q) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = v
M(P;Q 1) = (-6 0) + (2 1) = 2 ≥ v
M(P;Q 2) = (-6 0) + (-2 1) = -2 = v
M(P;Q 3) = (2 0) + (7 1) = 7 ≥ v
M(P;Q 4) = (4 0) + (-1 1) = -1 ≥ v
Semua pertidaksamaan dipenuhi sebagai persamaan atau pertidaksamaan tegas, sehingga penyelesaian permainan ditemukan dengan benar.

Masalah 4
Berikan jawaban rinci atas pertanyaan tersebut

Ada strategi murni dan campuran. Strategi murni
pemain pertama (strategi murni
pemain kedua) adalah kemungkinan langkah pemain pertama (kedua), yang dipilihnya dengan probabilitas sama dengan 1.

Jika pemain pertama mempunyai m strategi, dan pemain kedua mempunyai n strategi, maka untuk setiap pasangan strategi pemain pertama dan kedua, strategi murni dapat direpresentasikan sebagai vektor satuan. Misalnya saja untuk sepasang strategi
,
Strategi murni pemain pertama dan kedua akan ditulis sebagai:
,
. Untuk sepasang strategi ,strategi murni dapat ditulis sebagai:

,

.

Dalil: Dalam permainan matriks, harga bersih bawah dari permainan tersebut tidak melebihi harga bersih atas dari permainan tersebut, yaitu.
.

Definisi: Kalau untuk strategi murni ,pemain A dan B masing-masing terdapat persamaan
, lalu sepasang strategi murni ( ,) disebut titik pelana permainan matriks, elemen matriks, yang terletak pada perpotongan baris ke-i dan kolom ke-j adalah elemen pelana dari matriks pembayaran, dan bilangan
- harga murni permainan.

Contoh: Temukan harga bersih bawah dan atas, tentukan keberadaan titik pelana dari permainan matriks

.

Mari kita tentukan harga bersih bawah dan atas permainan: , ,
.

Dalam hal ini, kita mempunyai satu titik pelana (A 1 ; B 2), dan elemen pelananya adalah 5. Elemen ini adalah yang terkecil pada baris ke-1 dan terbesar pada kolom ke-2. Penyimpangan pemain A dari strategi maximin A 1 menyebabkan penurunan kemenangannya, dan penyimpangan pemain B dari strategi minimax B 2 menyebabkan peningkatan kerugiannya. Dengan kata lain, jika permainan matriks memiliki elemen pelana, maka strategi terbaik bagi para pemainnya adalah strategi minimax. Dan strategi murni ini, membentuk titik pelana dan menyorot elemen pelana a 12 =5 dalam matriks permainan, merupakan strategi murni yang optimal Dan pemain A dan B, masing-masing.

Jika permainan matriks tidak memiliki titik pelana, maka penyelesaian permainan menjadi sulit. Dalam permainan ini
. Penggunaan strategi minimax dalam permainan seperti itu mengarah pada fakta bahwa untuk setiap pemain, bayarannya tidak melebihi , dan kekalahan juga tidak kalah pentingnya . Untuk setiap pemain, muncul pertanyaan tentang peningkatan kemenangan (pengurangan kerugian). Solusinya ditemukan dengan menggunakan strategi campuran.

Definisi: Strategi campuran pemain pertama (kedua) adalah vektor
, Di mana
Dan
(
, Di mana
Dan
).

Vektor p(q) berarti probabilitas penggunaan strategi murni ke-i oleh pemain pertama (strategi murni ke-j oleh pemain kedua).

Karena para pemain memilih strategi murni mereka secara acak dan independen satu sama lain, permainannya acak dan jumlah kemenangan (kekalahan) menjadi acak. Kalau begitu nilai rata-rata menang (kalah) – ekspektasi matematis – adalah fungsi dari strategi campuran p, q:

.

Definisi: Fungsi f(р, q) disebut fungsi pembayaran dari permainan matriks
.

Definisi: Strategi
,
disebut optimal jika untuk strategi sewenang-wenang
,
kondisi terpenuhi

Penggunaan strategi campuran yang optimal dalam permainan memberikan pemain pertama imbalan yang tidak kurang dari ketika dia menggunakan strategi lain p; pemain kedua kalah tidak lebih banyak dibandingkan jika dia menggunakan strategi lain q.

Kombinasi strategi optimal dan harga permainan merupakan solusi permainan.

DI DALAM kasus umum V*≠V* - tidak ada titik sadel. Juga tidak ada solusi optimal dalam strategi murni. Namun, jika kita memperluas konsep strategi murni dengan memperkenalkan konsep strategi campuran, maka algoritma dapat diterapkan untuk menemukan solusi optimal untuk masalah permainan yang tidak terdefinisi dengan baik. Dalam situasi seperti ini, diusulkan untuk menggunakan pendekatan statistik (probabilistik) untuk menemukan solusi optimal dari permainan zero-sum. Untuk setiap pemain, bersama dengan serangkaian strategi yang mungkin baginya, vektor probabilitas yang tidak diketahui (frekuensi relatif) yang dengannya strategi tertentu harus diterapkan diperkenalkan.

Mari kita nyatakan vektor probabilitas (frekuensi relatif) pemilihan strategi pemain A sebagai berikut:
P = (p 1, p 2,…, p m),
dimana p i ≥ 0, p 1 + p 2 +…+ p m = 1. Nilai p i disebut probabilitas (frekuensi relatif) penggunaan strategi A i.

Demikian pula, untuk pemain B, vektor probabilitas yang tidak diketahui (frekuensi relatif) diperkenalkan dan berbentuk:
Q = (q 1, q 2,…, qn),
dimana q j ≥ 0, q 1 + q 2 +…+ q n = 1. Nilai q j disebut probabilitas (frekuensi relatif) penggunaan strategi B j. Himpunan (kombinasi) strategi murni A 1, A 2, …A m dan B 1, B 2, …B n dikombinasikan dengan vektor probabilitas untuk memilih masing-masing strategi tersebut disebut strategi campuran.

Teorema utama dalam teori permainan zero-sum terbatas adalah teorema von Neumann: setiap permainan matriks terbatas memiliki setidaknya satu solusi optimal, mungkin di antara strategi campuran.
Dari teorema ini dapat disimpulkan bahwa tidak sepenuhnya permainan tertentu memiliki setidaknya satu solusi optimal dalam strategi campuran. Dalam permainan seperti itu, solusinya adalah sepasang strategi campuran optimal P* dan Q*, sehingga jika salah satu pemain mengikuti strategi optimalnya, maka tidak menguntungkan bagi pemain lain untuk menyimpang dari strategi optimalnya.
Pembayaran rata-rata pemain A ditentukan oleh ekspektasi matematis:

Jika probabilitas (frekuensi relatif) penggunaan suatu strategi berbeda dari nol, maka strategi tersebut disebut aktif.

Strategi P*, Q* disebut campuran yang optimal strategi jika M A (P, Q*) ≤ M A (P*, Q*) ≤ M A (P*, Q) (1)
Dalam hal ini M A (P*, Q*) disebut dengan biaya permainan dan dilambangkan dengan V (V * ≤ V ≤ V *). Pertidaksamaan pertama (1) berarti bahwa penyimpangan pemain A dari strategi campuran optimalnya asalkan pemain B tetap berpegang pada strategi campuran optimalnya, menyebabkan penurunan kemenangan rata-rata pemain A. Pertidaksamaan kedua berarti itu penyimpangan pemain B dari strategi campuran optimalnya asalkan pemain A tetap berpegang pada strategi campuran optimalnya, menyebabkan peningkatan rata-rata kerugian pemain B.

Secara umum, permasalahan seperti itu dapat diselesaikan dengan sukses dengan kalkulator ini.

Contoh.

4 7 2
7 3 2
2 1 8

1. Periksa apakah matriks pembayaran mempunyai titik pelana. Jika ya, maka kami menuliskan solusi permainan tersebut dalam strategi murni.

Kita berasumsi bahwa pemain I memilih strateginya sedemikian rupa untuk memaksimalkan keuntungannya, dan pemain II memilih strateginya sedemikian rupa untuk meminimalkan keuntungan pemain I.

Pemain B1 B 2 B3 a = menit(A saya)
Sebuah 1 4 7 2 2
Sebuah 2 7 3 2 2
Sebuah 3 2 1 8 1
b = maks(B i) 7 7 8

Kami menemukan jaminan hasil yang ditentukan oleh harga permainan yang lebih rendah a = max(ai) = 2, yang menunjukkan strategi murni maksimum A 1 .
Harga atas permainan tersebut adalah b = min(b j) = 7. Yang menunjukkan tidak adanya titik pelana, karena a ≠ b, maka harga permainan tersebut berada pada kisaran 2 ≤ y ≤ 7. Kita cari solusinya untuk permainan dalam strategi campuran. Hal ini dijelaskan oleh fakta bahwa pemain tidak dapat mengumumkan strategi murni mereka kepada musuh: mereka harus menyembunyikan tindakan mereka. Permainan ini dapat diselesaikan dengan membiarkan pemain memilih strategi mereka secara acak(campur strategi murni).

2. Periksa matriks pembayaran untuk baris dominan dan kolom dominan.
DI DALAM matriks pembayaran tidak ada baris dominan dan tidak ada kolom dominan.

3. Temukan solusi permainan dalam strategi campuran.
Mari kita tuliskan sistem persamaannya.
Untuk pemain I
4p 1 +7p 2 +2p 3 = y
7p 1 +3p 2 +p 3 = kamu
2p 1 +2p 2 +8p 3 = y
p 1 +p 2 +p 3 = 1

Untuk Pemain II
4q 1 +7q 2 +2q 3 = kamu
7q 1 +3q 2 +2q 3 = kamu
2q 1 +q 2 +8q 3 = kamu
q 1 + q 2 + q 3 = 1

Memecahkan sistem ini menggunakan metode Gauss, kami menemukan:

kamu = 4 1/34
p 1 = 29/68 (probabilitas menggunakan strategi pertama).
p 2 = 4/17 (probabilitas menggunakan strategi ke-2).
p 3 = 23/68 (probabilitas menggunakan strategi ke-3).

Strategi Campuran Optimal Pemain I : P = (29/68; 4/17; 23/68)
q 1 = 6/17 (probabilitas menggunakan strategi pertama).
q 2 = 9/34 (probabilitas menggunakan strategi ke-2).
q 3 = 13/34 (probabilitas menggunakan strategi ke-3).

Strategi campuran optimal Pemain II: Q = (6/17; 9/34; 13/34)
Harga permainan: y = 4 1/34

Jika dalam suatu permainan masing-masing lawannya menggunakan strategi yang sama, maka permainan tersebut dikatakan dimainkan dengan strategi murni, dan strategi pemain A dan B disebut strategi murni. strategi murni.Dalam permainan zero-sum, sepasang strategi disebut keseimbangan(stabil) jika tidak menguntungkan bagi salah satu pemain untuk mundur dari strategi mereka. Masuk akal untuk menggunakan strategi murni jika para pemain menyadari tindakan lawan. Jika tidak demikian, maka gagasan keseimbangan dilanggar dan permainan dapat dimainkan sebagaimana mestinya. Strategi A1 B1 stabil sehubungan dengan informasi tentang perilaku lawan strategi adalah kesetaraan atas dan harga lebih rendah pertandingan. Dan kasus A1 B1 akan menjadi

ν = α = β. ν > 0, maka pemain A menang jika ν< 0, то в выигрыше игрок В. Если ν = 0, в этом случае игра справедлива для обоих игроков. Не все матричные игры имеют седловые точки.

Teorema: setiap permainan dengan informasi lengkap mempunyai titik pelana dan oleh karena itu diselesaikan dengan strategi murni, yaitu. ada sepasang strategi stabil yang memberikan hasil stabil sebesar ν. Jika matriks tidak memiliki titik pelana, maka biaya permainannya terletak α<ν<β. Это означает, что первый игрок, используя максиминный принцип, обеспечит себе выигрыш не менее, чем α. А второй игрок придерживаясь минимаксного подхода обеспечит себе проигрыш не больше верхней цены игры. Игра будет оптимальна, если оба игрока будут применять смешанные стратегии.Случайная величина, значениями которой являются чистые стратегии, называется смешанной стратегией для этого игрока.

Menentukan strategi campuran berarti menentukan probabilitas penggunaan strategi murni.

SA = || hal 1 , hal 2 …. hal || ,S B = || q1, q2…. qm || , A: ∑ pi = 1 , B: ∑ qi = 1

Permainan ini dapat diulang beberapa kali, tetapi dalam setiap permainan pemain mengikuti strategi campuran, dimana strategi murni mengikuti probabilitas pi dan q j .

Model strategi campuran berbeda dengan model strategi murni. Dalam kasus strategi campuran, taktik para pemain akan lebih fleksibel karena pemain mengetahui terlebih dahulu strategi murni apa yang akan mereka gunakan.

Anggaplah pemain A dan pemain B mempunyai strategi campuran. Perlu ditentukan A: ∑∑ a ij p i q j

Untuk pemain B, perkiraan kerugian sama dengan perkiraan keuntungan pemain A. Kemenangan pemain pertama dan rata-rata kekalahan pemain kedua sama satu sama lain.

18.Metode untuk menyelesaikan permainan berhingga dua orang berorde m*n.

Mari kita asumsikan bahwa semua elemen matriks pembayaran adalah 0≤aij. Kemudian α≤ν≤β. Menurut teorema dasar permainan matriks, setiap permainan matriks memiliki 2 strategi campuran optimal.

SA = (hal 1 , hal 2 , … , hal n)

S B = (hal 1 , hal 2 , … , hal n)

Kami menyelesaikan permainan untuk pemain A, sambil mengasumsikan bahwa pemain B hanya menggunakan strategi murni. Kemudian

a 11 p 1 + a 21 p 2 + … + a m1 p m ≥ ν: B 1

a 12 p 1 + a 22 p 2 + … + a m2 p m ≥ ν: B 2 (1)

a 1n p 1 + a 2n p 2 + … + a mn p m ≥ ν: B n

X 1 = P 1 /ν, X 2 = P 2 /ν … X m = P m /ν

a 11 X 1 … + a m1 p m ≥ 1

a 1n X 1 … + a m1 p m ≥ 1 (2)

p 1 +p 2 +…+p m =1

X 1 +X 2 +…+X m = 1/ν (3)

L(x) = X 1 +X 2 +…+X m -> menit (4)

Mari kita definisikan masalah pemrograman linier.

ν = 1/(X 1 0 +X 2 0 …X m 0) (5)

P1 = X 1 0 *ν pilih

p2 = X 2 0 *ν pilih (6)

min L(x) = ∑x i

∑a ij : 1≤x i (7) (soal langsung)

0≤x saya (saya=1,2..)

a 11 q 1 + a 21 q 2 + … + a m1 q m< ν: A 1

a 21 q 1 + a 22 q 2 + … + a m2 q m< ν: A 2 (8)

a m1 q 1 + a m2 q 2 + … + a mn q m< ν: A m

Y 1 = q 1 /ν, Y 2 = q 2 /ν ... Y m = q m /ν

q 1 +q 2 +…+q n =1

kamu 1 +kamu 2 +…+kamu n =1/ν

L(y)=∑y j -> maks

∑a ij , y i ≤1 (i=1,2…) (9) (masalah ganda)

y 1 0 +y 2 0 …y m 0 = 1/ν pilihan

ν memilih = 1/∑y m 0

Q1 = y 1 0 *ν pilih

q2 = y 2 0 *ν pilih

ν=1/∑x i = 1/∑y i = 1/menit L(x) = 1/ maks L(y) (11)

B1 B 2 B3 saya
Sebuah 1
Sebuah 2
Sebuah 3
j

1) = 1, = 3

2) Tidak ada penyederhanaan.

L(x)=x 1 +x 2 +x 3 => mnt

x 1 +3x 2 +x 3 >= 1

2x 1 +x 2 +x 3 >=1

3x 1 +x 2 +x 3 >=1

x 1 =2/9, x 2 =2/9, x 3 =1/9

=1/(2/9+2/9+1/9)=9/5

hal 1 =x 1 *ν=2/5

SA =(2/5, 2/5, 1/5)

masalah ganda

L(y) = kamu 1 +kamu 2 +kamu 3 => maks

kamu 1 +2kamu 2 +3kamu 3 ≤ 1 kamu 1 =2/9

3y 1 +y 2 +y 3 ≤1 => y 2 =2/9 maks L(y) = 5/9

kamu 1 +3kamu 2 +kamu 3 ≤1 kamu 3 =1/9

=1/(2/9+2/9+1/9)=9/5

q 1 =kamu 2 *ν=(2/9)*(9/5)=2/5

q 2 =(2/9)*(9/5)=2/5

q 3 =(1/9)*(9/5)=1/5

S B =(2/5, 2/5, 1/5)

Masalah mxn direduksi menjadi masalah program linier.

Metode perkiraan untuk menyelesaikan permainan matriks mxn (Brown-Robinson).

Pemain A dan Pemain B bergiliran menggunakan strategi murni. Setiap pemain berusaha meningkatkan kemenangannya dengan menggunakan pendekatan maximin atau minimax. Bukan rata-rata perolehan yang diminimalkan (dimaksimalkan), melainkan akumulasinya. Teorinya menunjukkan bahwa metode seperti itu pasti akan memberi kita kemenangan optimal dan strategi campuran yang optimal.



B1 B 2 B3
Sebuah 1
Sebuah 2
Sebuah 3
3 * 8 * 9 * 36 *
3 * 4 * 12 * 13 *
7 *
1 *
3 *
4 *
6 *
9 *
10 *
12 *
34 *


Beritahu teman