Giới thiệu : Chiến lược hỗn hợp
Chúng ta đã Si là tập hợp các chiến lược của đấu thủ i ,
tổ hợp các chiến lược (s1*, sn*) là cân bằng NASH nếu với mỗi đấu thủ i si* là phản ứng tốtnhất đối với n-1 đấu thủ còn lại.
Theo định nghĩa này sẽ không có cân bằng NASH nào trong trò chơi sau đây
73 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 2156 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Chương 4 Lý thuyết nâng cao: chiến lược hỗn hợp và sự tồn tại cân bằng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG IV
LÝ THUYẾT NÂNG CAO:
CHIẾN LƯỢC HỖN HỢP VÀ SỰ TỒN
TẠI CÂN BẰNG
Giới thiệu : Chiến lược hỗn hợp
Chúng ta đã Si là tập hợp các chiến lược của
đấu thủ i ,
tổ hợp các chiến lược (s1*,sn*) là cân bằng
NASH nếu với mỗi đấu thủ i si* là phản ứng tốt
nhất đối với n-1 đấu thủ còn lại.
Theo định nghĩa này sẽ không có cân bằng
NASH nào trong trò chơi sau đây
Trò chơi đọ xu – không có cân bằng
chiến lược thuần tuý
Đấu thủ 2
Sấp Ngửa
Đấu thủ
1
Sấp -1 , 1 1 , -1
Ngửa 1 , -1 -1 ,1
Nhận xét
Trong trò chơi này tập hợp chiến lược của mỗi
đấu thủ là {ngửa, sấp}
Nhưng nếu người chơi không phải sẽ chơi ngửa
hoặc sấp mà sẽ chơi ngửa với xác suất p và sấp
với xác suất là q=1-p thì ta sẽ có khái niệm về
chiến lược hỗn hợp
Giải thích chiến lược hỗn hợp
Một chiến lược hỗn hợp đối với đấu thủ i là
một phân phối xác suất trên (một số hay tất cả)
các chiến lược trong tập các chiến lược của i
Điều quan trọng hiểu chiến lược hỗn hợp ở đây
là tập hợp các xác suất gắn với chiến lược thuần
sao cho mỗi chiến lược thuần có một xác suất
chơi dương và tổng xác suất ứng với tất cả các
chiến lược thuần phái bằng 1.
Định nghĩa chiến lược hỗn hợp
Định nghĩa:
Một chiến lược hỗn hợp đối với đấu thủ i là
một phân phối xác suất trên (một số hoặc tất cả)
các chiến lược trong si.
Một cách hình thức có thể định nghĩa:
Trong trò chơi dạng chuẩn G. Khi đó một chiến
lược hỗn hợp đối với đấu thủ i là một phân phối
xác suất pi=(pi1,..pik) vơi 0pik1, pi1++pik=1
Thí dụ
Đấu thủ 2
Sấp Ngửa
Đấu thủ
1
Sấp -1 , 1 1 , -1
Ngửa 1 , -1 -1 ,1
Giải thích
Một chiến lược của hỗn hợp của đấu thủ 1 là
một phân phối xác suất trên các chiến lược {sấp
, ngửa} chẳng hạn người chơi 1 sẽ chơi sấp với
xác suất p và ngửa vơi xác suất 1-p.
chiến lược của hỗn hợp của đấu thủ 2 là một
phân phối xác suất trên các chiến lược {sấp ,
ngửa} chẳng hạn người chơi 2 sẽ chơi sấp vớp
xác suất q và ngửa với xác suất 1-q.
Thí dụ 2: Cuộc chiến giữa 2 giới
P
Ca nhạc Đấu
bóng
C Ca nhạc 2 , 1 0 , 0
Đấu bóng 0 , 0 1 ,2
Giải thích
Giả sử p1 là xác suất để C chơi chiến lược ca
nhạc và 1-p1 là xác suất để C chơi chiến lược
đấu bóng
Giả sử q1 là xác suất để P chơi chiến lược ca
nhạc và 1-q1 là xác suất để P chơi chiến lược
đấu bóng
Thí dụ Về bài toán tìm chiến lược hỗn hợp
P
CN TĐ
C CN 2 , 1 0 , 0
TĐ 0 , 0 1 ,2
Giải bài toán cuộc chiến giữa 2 giới
Tập hợp người chơi chỉ có 2 người là C và P.
Tìm chiến lược hỗn hợp:
(1) Chiến lược hỗn hợp của C: giả sử C chơi Ca
nhạc với xác suất p1 và Đấu bóng với xác suất
p2 =1-p1
(2) Chiến lược hỗn hợp của P: Giả sử P chơi ca
nhạc với xác suất q2= 1-q1 và xem đấu bóng với
xác suất q1.
Phân tích để thiết lập bài toán
Lợi ích mà C thu được khi chơi chiến lược Ca
nhạc là : 2q1+0.q2.Lợi ích mà C thu được khi
chơi ĐB là: 0q1+1q2.
Vậy lợi ích kỳ vọng của C khi chơi chiến lược
hỗn hợp p1,p2 sẽ là:
p1[2q1+0.q2]+p2[0q1+1q2]
Tương tự lợi ích kỳ vọng của P sẽ là:
q1[1p1+0.p2]+q2[0p1+2p2]
Thiết lập bài toán và giải
Như vậy bài toán tìm lợi ích kỳ vọng của đấu
thủ hàng sẽ là
Max p1(2q1+0.q2)+p2(0.q1+1.q2)(1)
P1+p2=1 , pi không âm
Max q1(1p1+0.p2)+q2(0.p1+1.p2)(2)
q1+ q2=1 , qi không âm
Cách giải: Thay p1=1-p2 và (1) và q1=1-q2 vào
(2) và giải ta sẽ được chiến lược hỗn hợp cân
bằng Nash
Thiết lập bài toán trong trường hợp tổng quát
Xét trò chơi với 2 đấu thủ1 và 2. Gọi S1, S2 là không
gian chiến lược của đấu thủ 1 và 2 tương ứng.
Gọi J là số chiến lược thuần trong S1, K là số chiến
lược thuần trong S2.Nghĩa là:
S1={s11,., s1J} và S2={s21,., s2K}
Giả sử đấu thủ 1 tin rằng đấu thủ 2 chơi các chiến
lược {s21,., s2K} với xác suất ={p21,., p2K}, thì
thu hoạch kỳ vọng của đấu thủ 1 từ việc chơi chiến
lược thuần túy s1j là:
Thiết lập bài toán trong trường hợp tổng
quát
thì thu hoạch kỳ vọng của đấu thủ 1 từ việc
chơi chiến lược thuần túy s1j là:
thì thu hoạch kỳ vọng của đấu thủ 1 từ việc
chơi chiến lược hỗn hợp là:
(*)
),( 211
1
2 kj
K
k
k ssup
),(),(),( 211
1
21
1
211
1
2
1
1211 kj
K
k
kj
J
j
kj
K
k
k
J
j
j ssuppssuppppv
Thu hoạch kỳ vọng của đấu thủ 2
Thu hoạch kỳ vọng của đấu thủ 2 từ việc chơi chiến
lược thuần túy s2k là:
thì thu hoạch kỳ vọng của đấu thủ 2 từ việc chơi
chiến lược hỗn hợp là:
(**)
),( 212
1
1 kj
J
j
j ssup
),(),(),( 212
1
21
1
212
1
1
1
2212 kj
K
k
kj
J
j
kj
J
j
j
K
k
k ssuppssuppppv
Điều kiện của cân bằng
Khi cho v1(p1,p2) vµ v2(p1,p2) ta cã thÓ ph¸t biÓu l¹i ®ßi
hái cña c©n b»ng Nash r»ng chiÕn lîc hçn hîp cña
mçi ®Êu thñ lµ mét ph¶n øng tèt nhÊt ®èi víi chiÕn lîc
hçn hîp cña ®Êu thñ kia: ®Ó cÆp chiÕn lîc hçn hîp
(p*1,p*2) lµ mét cÊn b»ng Nash, p*1 ph¶i tho¶ m·n
v1(p*1,p*2) v1(p1,p*2)
®èi víi mäi ph©n phèi x¸c suÊt p1 trªn S1, vµ p2 ph¶i
tho¶ m·n
v2(p*1,p*2) v2(p*1,p2)
®èi víi mäi ph©n phèi x¸c suÊt p2 trªn S2.
Định nghĩa : cân bằng NASH chiến lược hỗn hợp
Trong trß ch¬i d¹ng chuÈn hai ®Êu thñ
G = {S1,S2;u1,u2}, c¸c chiÕn lîc hçn hîp
(p*1,p*2) lµ mét c©n b»ng Nash nÕu chiÕn lîc
hçn hîp cña mçi ®Êu thñ lµ mét ph¶n øng tèt
nhÊt ®èi víi chiÕn lîc hçn hîp cña ®Êu thñ kia:
(*) vµ (**) ph¶i ®óng.
Định lý: NASH (1950)
Trong trò chơi dạng chuẩn N đấu thủ
G={S1,,Sn;u1,,un}, nếu n hữu hạn và Si là
hữu hạn đối với mọi i thì tồn tại tít nhất một cân
bằng NASH , có thể gắn với các chiến lược hỗn
hợp
Bài tập thực hành
Tìm chiến lược hỗn hợp cân bằng Nash cho các
bài toán sau:
Trò chơi đọ xu
Tình thế khó xử của hai người tù
Trò chơi trừu tượng
Chương V
Trò chơi tĩnh với thông tin không đầy đủ
Giới thiệu: Chương này bắt đầu nghiên cứu về
các trò chơi với thông tin không đầy đủ, còn gọi
là các trò chơi Bayes.
Hãy nhớ lại rằng trong một trò chơi với thông
tin đầy đủ, các hàm thu hoạch của các đấu thủ
là kiến thức chung.
Trái lại, trong một trò chơi với thông tin không
đầy đủ, ít nhất có một đấu thủ không chắc chắn
về hàm thu hoạch của các đấu thủ khác.
Giới thiệu
Thí dụ: Trò chơi đấu giá bằng phiếu kín: Mỗi người trả
giá biết sự đánh giá của mình đối với hàng hoá bán
đấu giá nhưng không biết sự đánh giá của người trả giá
nào khác; người trả giá bỏ mức giá mình trả trong
những phong bì niêm phong kín để nộp, do vậy có thể
coi là các đấu thủ đi cùng lúc.
Tuy nhiên, hầu hết các trò chơi Bayes thú vị về kinh tế
là trò chơi động. Như ta sẽ thấy , sự tồn tại thông tin
của riêng tự nhiên dẫn tới những mưu toan để giao
thiệp (hoặc đánh lừa) của các bên được thông tin và
mưu toan học hỏi và phản ứng của bên không được
thông tin. Đây vốn là những vấn đề động.
Lý thuyết: Các trò chơi Bayes tĩnh và cân
bằng Nash Bayes
Thí dụ: Cạnh tranh Cournot trong điều kiện thông tin không
đối xứng
Hãy xét mô hình Cournot có hai công ty độc quyền với hàm ngược
của cầu cho bởi P(Q) = a- Q, ở đây Q = q1+q2 là tổng lượng trên thị
trường.
Hàm chi phí của công ty 1 là C1(q1) = cq1. Hàm chi phí của công ty
2 là C2(q2) = cHq2 với xác xuất và C2(q2) = cLq2 với xác xuất 1- ở
đây cL < cH.
Thêm nữa, thông tin là không đối xứng: công ty 2 biết hàm chi phí
của nó và của công ty 1 nhưng công ty 1 biết hàm chi phí của nó và
chỉ biết rằng chi phí biên của công ty 2 là cH với xác xuất và cL
với xác xuất 1-.
Tất cả điều này là kiên thức chung: công ty 1 biết rằng công ty 2 có
thông tin trội hơn, công ty 2 biết rằng công ty 1 biết đièu này, v.v...
Thí dụ: Cạnh tranh Cournot trong điều
kiện thông tin không đối xứng
Nếu chi phí biên cao, công ty 2 có thể muốn chọn một lượng khác
(có lẽ thấp hơn) với trường hợp nếu chi phí biên thấp. Về phần
mình, công ty 1 hẳn sẽ đoán rằng công ty 2 có thể thay đổi lựa chọn
về lượng của nó hợp với chi phí theo cách này.
Cho q*2(cH) và q*2(cL) ký hiệu lựa chọn lượng của công ty 2 như
một hàm của chi phí, và cho q*1 ký hiệu lựa chọn lượng duy nhất
của công ty 1. Nếu chi phí của công ty 2 là cao, nó sẽ chọn q*2(cH)
là nghiệm
max [(a-q*1-q2)- cH]q2
q2
Tương tự, nếu chi phí của công ty 2 là thấp, q*2(cL) là nghiệm
max [(a-q*1-q2)- cL]q2
q2
Thí dụ: Cạnh tranh Cournot trong điều
kiện thông tin không đối xứng
Cuối cùng, công ty 1 biết rằng chi phí của công ty 2 là cao với xác
xuất và sẽ đoán rằng lựa chọn lượng của công ty 2 sẽ là q*2(cH)
hoặc q*2(cL) tuỳ thuộc chi phí của công ty 2. Như vậy công ty 1
chọn q*1 là nghiệm
max [(a-q1-q*2(cH))- c]q1 + (1-) [(a-q1-q2(cL))- c]q1
q1
để cực đại hoá lợi nhuận kỳ vọng.Điều kiện cấp một đối với ba bài
toán tối ưu này là
q*2(cH) = (a-q*1- cH) / 2,
q*2(cL) = (a-q*1- cL) / 2,
và
q* = { [a-q*2(cH)- c] + (1-) [a-q2(cL)- c] }/2
Thí dụ: Cạnh tranh Cournot trong điều
kiện thông tin không đối xứng
Giả sử rằng các điều kiện cấp một này định rõ đặc
điểm của các nghiệm bài các toán trước đây. (Nhớ lại
từ Bài toán 1.6 rằng trong mô hình hai công ty độc
quyền kiểu Cournot với thông tin đầy đủ, nếu chi phí
của các công ty đủ khác nhau thì ở cân bằng, công ty
có chi phí cao không sản xuất gì. Như một bài tập, hãy
tìm một điều kiện đủ để bác bỏ các bài toán tương tự ở
đây.) Các nghiệm đối với ba điều kiện cấp một là
q*1(cH) = (1/3)(a-2 cH +C) +(1-) (CH-CL)/6
q*2(cH) = (1/3)(a-2 cL +C) +(1-) (CH-CL)/6
và q*1 ={(a-2c+ CH +C)+(1-) CL)}/8
Thí dụ: Cạnh tranh Cournot trong điều
kiện thông tin không đối xứng
So sánh q*2(cH), q*2(cL) và q*1 với cân bằng Cournot
trong điều kiện thông tin đầy đủ với chi phí c1 và c2.
Giả sử rằng các giá trị c1 và c2 là các giá trị sao cho các
lượng cân bằng của cả hai công ty là dương, công ty i
sản xuất q*i=(a-2ci +cj)/3 trong trường hợp thông tin
đầy đủ này. Trái lại, trong trường hợp thông tin không
đầy đủ, q*2(cH) lớn hơn (a-2cH +c)/3 và q*2(cL) nhỏ
hơn (a-2cL +c)/3. Điều này xảy ra bởi vì công ty 2
không chỉ thay đổi lượng sản xuất theo chi phí của nó
mà còn phản ứng với thực tế là công ty 1 không thể
làm như vậy.
Thí dụ: Cạnh tranh Cournot trong điều
kiện thông tin không đối xứng
Thí dụ, nếu chi phí của công ty 2 cao thì nó sản xuất ít
đi vì chi phí của nó cao nhưng cũng sản xuất nhiều lên
vì nó biết rằng công ty 1 sẽ sản xuất một lượng làm cực
đại lợi nhuận kỳ vọng của 1 và như vậy nhỏ hơn lượng
1 sẽ sản xuất nếu nó biết chi phí của công ty 2 cao.
(Một đặc điểm có tiềm năng gây lầm lẫn của thí dụ
này là q*1 đúng bằng kỳ vọng của lượng Cournot mà
công ty 1 sẽ sản xuất trong hai trò chơi tương ứng với
thông tin đầy đủ. Điều này điển hình là không đúng;
Thí dụ, hãy xét trường hợp trong đó tổng chi phí của
công ty i là ciqi
2 .)
Kiểu và không gian kiểu
Nhớ lại rằng, biểu diễn dạng chuẩn của trò chơi n đấu thủ với thông tin
đầy đủ là G = {S1 ... Sn;u1 ... un}, ở đây Si là không gian chiến lược của
đấu thủ i và ui(s1,...,sn) là thu hoạch của đấu thủ i khi các đấu thủ chọn
các chiến lược (s1,...,sn).
Tuy nhiên, như đã thảo luận trong một trò chơi đi cùng lúc với thông
tin đầy đủ một chiến lược đối với một đấu thủ đơn giản là một hành
động, do vậy ta có thể viết G = {A1 ... An;u1 ... un}, ở đây Ai là không
gian hành động của đấu thủ i và ui(a1,...,an) là là thu hoạch của đấu thủ i
khi các đấu thủ chọn các hành động (a1,...,an).
Để chuẩn bị cho mô tả của chúng ta về trình tự của trò chơi tĩnh với
thông tin không đầy đủ, ta mô tả trình tự của trò chơi tĩnh với thông tin
đầy đủ như sau: (1) các đấu thủ chọn các hành động cùng lúc (đấu thủ i
chọn ai từ tập khả thi Ai), và rồi (2) nhận được thu hoạch ui(a1,...,an).
Kiểu và không gian kiểu
Bây giờ ta muốn phát triển biểu diễn dạng chuẩn của
trò chơi đi cùng lúc với thông tin không đầy đủ, còn
gọi là trò chơi Bayes tĩnh.
Bước thứ nhất là biểu diễn tư tưởng là mỗi đấu thủ biết
hàm thu hoạch của mình nhưng có thể không chắc chắn
về hàm thu hoạch của các đấu thủ khác.
Cho hàm thu hoạch có thể của đấu thủ i biểu thị bởi
ui(a1,...,an;ti), ở đây ti được gọi là kiểu của đấu thủ i và
thuộc một tập hợp các kiểu có thể (hay không gian
kiểu) Ti.
Mỗi kiểu ti tương ứng với một hàm thu hoạch khác
nhau mà đấu thủ i có thể có.
Kiểu và không gian kiểu
Thí dụ giả sử đấu thủ i có hai hàm thu hoạch có thể.
Ta sẽ nói rằng đấu thủ i có hai kiểu, ti1 và ti2 , rằng không
gian kiểu của đấu thủ i là T={ti1,ti2}, và rằng hai hàm thu
hoạch của đấu thủ i là ui(a1,...,an;ti1) và ui(a1,...,an;ti2).
Ta có thể sử dụng ý tưởng rằng mỗi trong các kiểu của
một đấu thủ tương ứng với một hàm thu hoạch khác nhau
mà đấu thủ có thể có để biểu thị khả năng là đấu thủ đó
có thể có các tập hợp hành động khả thi khác nhau như
sau.
Kiểu và không gian kiểu
Thí dụ, giả sử rằng tập hợp hành động khả
thi của đấu thủ i là {a, b} với xác xuất q và
{a, b, c} với xác xuất 1-q.
Thì ta có thể nói rằng i có hai kiểu (ti1 và
ti2, ở đây xác xuất của ti1 là q) và ta có thể
định nghĩa tập hành động khả thi của i là
{a, b, c} đối với cả hai kiểu nhưng định
nghĩa thu hoạch từ việc chọn thực hiện
hành động c là - đối với kiểu ti1.
Thí dụ
Như một thí dụ cụ thể hơn, xét trò chơi Cournot trong mục trước.
Các hành động của các công ty là những lựa chọn lượng của họ, q1
và q2. Công ty 2 có hai hàm chi phí có thể và do vậy có hai hàm lợi
nhuận hoặc thu hoạch có thể:
2(q1,q2;cL) = [(a- q1- q2)- cL]q2
và
2(q1,q2;cH) = [(a- q1- q2)- cH]q2 .
Công ty 1 chỉ có một hàm thu hoạch có thể:
1(q1,q2;c) = [(a- q1- q2)- c]q1 .
Chúng ta nói rằng không gian kiểu của công ty 2 là T2 = {CL,CH}
và rằng không gian kiểu của công ty 1 là T1 = {C}.
Thí dụ
Khi đã cho định nghĩa về kiểu của một đấu thủ, nói
rằng đấu thủ i biết hàm thu hoạch của mình là tương
đương với nói rằng đấu thủ i biết kiểu của mình.
Cũng như vậy, nói rằng đấu thủ i có thể không chắc
chắn về hàm thu hoạch của các đấu thủ khác là tương
đương với nói rằng đấu thủ i có thể không chắc chắn về
kiểu của các đấu thủ khác,
ký hiệu bởi t-i=(t1,...,ti-1,ti+1,...,tn). Ta sử dụng T-i để biểu
thị tập hợp tất cả các giá trị có thể của t-i, và sử dụng
phân bố xác suất pi(t-i|ti) để biểu thị mức tin tưởng của
đấu thủ i về các kiểu của các đấu thủ khác, t-i, khi đã
cho kiến thức của đấu thủ i về kiểu của mình, ti.
Thí dụ
Trong mọi ứng dụng phân tích (và trong hầu hết tài liệu), các
kiểu của các đấu thủ là độc lập, trong trường hợp đó pi(t-i|ti)
không phụ thuộc vào ti, do đó ta có thể viết mức tin tưởng của
đấu thủ i là pi(t-i).
Tuy nhiên, có những khung cảnh trong đó các kiểu của các đấu
thủ tương quan với nhau, do vậy ta cho phép thể hiện điều đó
trong định nghĩa của ta về trò chơi Bayes tĩnh bằng việc viết
mức tin tưởng của đấu thủ i là pi(t-i|ti).
Kết nối các khái niệm mới về kiểu, và mức tin tưởng với
những yếu tố quan trọng của biểu diễn dạng chuẩn của trò chơi
tĩnh với thông tin đầy đủ cho ta biểu diễn dạng chuẩn của trò
chơi Bayes tĩnh.
Biểu diễn dạng chuẩn của một trò chơi
Bayes tĩnh
Định nghĩa: Biểu diễn dạng chuẩn của một trò chơi
Bayes tĩnh n đấu thủ chỉ rõ các không gian hành động
của các đấu thủ A1,...,An, các không gian kiểu của họ
T1,...,Tn, các mức tin tưởng của họ p1,...,pn, và các hàm
thu hoạch của họ u1,...,un. Kiểu của đấu thủ i, ti , được
biết riêng bởi đấu thủ i, quyết định hàm thu hoạch của
đấu thủ i, ui(a1,...,an;ti), và là một phần tử của tập các
kiểu T i. Mức tin tưởng của đấu thủ i, pi(t-i|ti), mô tả sự
không chắc chắn về các kiểu có thể của n-1 đấu thủ
khác, t-i, khi đã cho kiểu của i, ti. Ta ký hiệu trò chơi
này là G = {A1,...,An; T1,...,Tn; p1,...,pn; u1,...,un}.
Giải thích
Theo cách của Harsanyi (1967), ta sẽ giả sử rằng trình
tự của một trò chơi Bayes tĩnh là như sau:
(1) tạo hoá rút một véc tơ kiểu t = (t1,...,tn), ở đây ti
được rút từ tập hợp các kiểu có thể Ti;
(2) tạo hoá tiết lộ ti cho đấu thủ i nhưng không tiết lộ
cho bất cứ đấu thủ nào khác;
(3) các đấu thủ chọn hành động cùng lúc, đấu thủ i
chọn ai từ tập khả thi Ai; và rồi
(4) các đấu thủ nhận các thu hoạch ui(a1,...,an;ti).
Giải thích
Bằng việc đưa vào các nước đi tưởng tượng đi bởi tạo
hoá trong các bước (1) và (2), ta đã mô tả một trò chơi
với thông tin không đầy đủ như một trò chơi với thông
tin không hoàn hảo, ở đây ta ngụ ý thông tin không
hoàn hảo (như ở Chương 2) nghĩa là đến một nước đi
nào đó trong trò chơi, đấu thủ đến lượt đi không biết
toàn bộ lịch sử của trò chơi đến lúc đó.
Ở đây, vì tạo hoá tiết lộ kiểu của đấu thủ i cho đấu thủ i
nhưng không tiết lộ cho đấu thủ j ở bước (2), đấu thủ j
không biết toàn bộ lịch sử của trò chơi khi các hành
động được chọn ở bước (3).
Giải thích
Có hai điểm hơi có tính kỹ thuật hơn cần được bao
trùm để hoàn thành thảo luận của ta về các biểu
diễn dạng chuẩn của các trò chơi Bayes tĩnh.
Thứ nhất, có những trò chơi trong đó đấu thủ i có
thông tin riêng không chỉ về hàm thu hoạch của
mình mà cả về hàm thu hoạch của các đấu thủ khác.
Thí dụ, trong mô hình Cournot với thông tin đối
xứng từ được thay đổi sao cho các chi phí là kiến
thức chung và đối xứng nhưng một công ty biết
mức cầu và công ty kia không biết.
Giải thích
Vì mức cầu ảnh hưởng lên hàm thu hoạch của cả
hai đấu thủ, kiểu của công ty được thông tin hiện
thân vào hàm thu hoạch của công ty không được
thông tin.
Trong trường hợp n đấu thủ, ta nắm bắt khả năng
này bằng việc cho phép thu hoạch của đấu thủ i
phụ thuộc vào các hành động (a1,...,an) mà còn phụ
thuộc tất cả các kiểu (t1,...,tn). Ta viết thu hoạch
này là ui(a1,...,an;t1,...,tn).
Giải thích
Điểm kỹ thuật thứ hai liên quan đến mức tin
tưởng, pi(t-i|ti). ta sẽ giả sử rằng một kiến thức
chung là ở bước (1) trong trình tự của trò chơi
Bayes tĩnh, tạo hoá rút một véc tơ kiểu
t = (t1,...,tn) theo phân phối xác xuất tiên
nghiệm p(t).
Khi tạo hoá tiết lộ ti cho đấu thủ i, anh hay chị
ta có thể tính mức tin tưởng pi(t-i|ti) theo quy tắc
Bayes:
Giải thích
Thêm nữa, các đấu thủ khác có thể tính các mức tin
tưởng khác mà đấu thủ i có thể có, phụ thuộc và kiểu
của i, cụ thể là pi(t-i|ti) đối với mỗi ti trong Ti.
Như đã nói, ta sẽ thường xuyên giả định rằng các kiểu
của các đấu thủ là độc lập, trong trường hợp đó pi(t-i)
không phụ thuộc vào ti nhưng vẫn được rút ra từ phân
phối tiên nghiệm p(t).
Trong trường hợp này các đấu thủ khác biết mức tin
tưởng của đấu thủ i về kiểu của họ.
Định nghĩa cân bằng chiến lược
Bây giờ ta muốn định nghĩa một khái niệm cân bằng đối với các trò
chơi Bayes tĩnh. Để làm việc đó, trước hết ta phải định nghĩa các
không gian chiến lược của các đấu thủ trong một trò chơi như vậy.
Nhớ lại rằng chiến lược của một đấu thủ là toàn bộ kế hoạch hành
động chỉ ra một hành động khả thi trong mọi tình huống bất ngờ
trong đó đấu thủ đến lượt hành động. Khi đã cho trình tự của trò
chơi Bayes tĩnh trong đó tạo hoá bắt đầu trò chơi bằng việc rút thăm
các kiểu của các đấu thủ, một chiến lược (thuần tuý) đối với đấu thủ
i phải chỉ ra hành động khả thi đối với mỗi trong các kiểu có thể của
đấu thủ i.
Định nghĩa: Trong trò chơi Bayes tĩnh G = {A1,...,An; T1,...,Tn;
p1,...,pn; u1,...,un}, một chiến lược đối với đấu thủ i là một hàm si(ti),
ở đây đối với mỗi kiểu ti trong Ti, si (ti) chỉ ra hành động từ tập khả
thi Ai mà kiểu ti sẽ chọn nếu được rút bởi tạo hoá.
Không gian chiến lược không được cho
trong biểu diễn dạng chuẩn
Không giống như các trò chơi với thông tin đầy đủ,
trong một trò chơi Bayes các không gian chiến lược
không được cho trong biểu diễn dạng chuẩn của trò
chơi.
Thay vì như vậy, trong một trò chơi Bayes tĩnh, các
không gian chiến lược được xây dựng từ các không
gian kiểu và các không gian hành động: tập hợp chiến
lược (thuần tuý) có thể của đấu thủ i, Si, là tập hợp của