NỘI DUNG CƠ BẢN
A. Xét trò chơi với các tính chất sau
Trò chơi được xét trong chương này có tính chất sau:(1) các đấu thủ cùng đồng thời chọn hành động; (2) Sau đó các đấu thủ nhận được thu hoạch phụ thuộc vào tổ hợp các hành động vừa chọn.
Trong các trò chơi tĩnh đi cùng một lúc , ta chú ý đến trò chơi với thông tin đầy đủ
91 trang |
Chia sẻ: thanhtuan.68 | Lượt xem: 995 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Chương 2 Các trò chơi tĩnh với thông tin đầy đủ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG HAI
CÁC TRÒ CHƠI TĨNH VỚI THÔNG
TIN ĐẦY ĐỦ
NỘI DUNG CƠ BẢN
A. Xét trò chơi với các tính chất sau
Trò chơi được xét trong chương này có tính
chất sau:(1) các đấu thủ cùng đồng thời chọn
hành động; (2) Sau đó các đấu thủ nhận được
thu hoạch phụ thuộc vào tổ hợp các hành động
vừa chọn.
Tong các trò chơi tĩnh đi cùng một lúc , ta chú
ý đến trò chơi với thông tin đầy đủ
B. Điểm qua những vấn đề cơ bản
Mô tả một trò chơi
Giải quyết các bài toán cơ bản của lý thuyết trò
chơi
Phát triển công cụ để sử dụng trong phân tích
trò chơi tĩnh với thông tin đầy đủ
Khái niệm chiến lược bị trội ngặt
Cân bằng Nash
LÝ THUYẾT CƠ BẢN
TRÒ CHƠI DẠNG CHUẨN VÀ CÂN BẰNG NASH
Biểu diễn dạng chuẩn của một trò chơi
Định nghĩa: Biểu diễn dạng chuẩn của trò chơi
là chỉ rõ
(1) Các đấu thủ trong trò chơi
(2) Các chiến lược sẵn có đối với mỗi đấu thủ và
(3) Thu hoạch của mỗi đấu thủ nhận được đối với
mỗi tổ hợp chiến lược mà các đấu thủ có thể
chọn
Hình thức biểu diễn dưới dạng chuẩn
Biểu diễn dưới dạng ma trận là hình thức biểu
diễn chủ yếu của trò chơi rời rạc dưới dạng
chuẩn
Phân tích biểu diễn dưới dạng ma trận
(1) Biết được các đấu thủ
(2) Biết các chiến lược sẵn có
(3) Biết được các thu hoạch
Các thí dụ
Tù nhân 2
Không khai khai
Tù nhân 1 Không khai -2 , -2 -10 , -1
Khai -1 , -10 -5 , -5
Định nghĩa hình thức
Ta xét trò chơi có n đấu thủ.
Mỗi đấu thủ có một tập hợp các chiến lược sẵn
có ký hiệu là S. Si là tập hợp các chiến lược sẵn
có của đấu thủ i.
si là một phần tử của Si , nghĩa là si là một chiến
lược của đấu thủ i.
Gọi ui(s1,s2,,sn ) là hàm thu hoạch của đấu thủ
i khi các đấu thủ chọn các chiến lược (s1,s2,
sn).
Định nghĩa: Biểu diễn dạng chuẩn của trò
chơi
§Þnh nghÜa:
BiÓu diÔn d¹ng chuÈn cña mét trß ch¬i n ®Êu
thñ chØ râ c¸c kh«ng gian chiÕn lîc S1,..., Sn
cña c¸c ®Êu thñ vµ c¸c hµm thu ho¹ch u1,...,un
cña hä.
Ta ký hiÖu trß ch¬i nµy lµ G = {S1,..., Sn;
u1,...,un}.
Bài tập thực hành
Biểu diễn dạng chuẩn của trò chơi: “ Cuộc chiến
giữa hai giới”:
P và C đang quyết định chọ tiêu khiển vào buổi tối:
Họ chọ xem di xem ca nhạc hay đấu bóng. Nếu cả
hai cùng xem ca nhạc thì thu hoạch của C là 2 và P là
1.
Nếu cả hai đi xem đấu bóng thì thu hoạch của C là 1
và P là 2. Nếu đi xem các chương trình khác nhau thì
thu hoạch của họ bằng không
PHÉP KHỬ LẶP CÁC CHIẾN LƯỢC BỊ
TRỘI NGẶT
Định nghĩa :
Chiến lược si là một chiến lược trội ngặt đối
với người chơi i nếu nó duy nhất cực đại thu
hoạch của người chơi i đối với bất kỳ chiến
lược nào mà đối thủ của người chơi i có thể
chơi.
Hiểu thế nào định nghĩa này (giải thích)
Thí dụ chiến lược trội ngặt
Tù nhân 2
Không khai khai
Tù nhân 1 Không khai -2 , -2 -10 , -1
Khai -1 , -10 -5 , -5
CHIẾN LƯỢC BỊ TRỘI NGẶT
Định nghĩa trong trò chơi dạng chuẩn có n
đấu thủ , trong đó đấu thủ i có tập hợp các
chiến lược Si.
Chiến lược si của người chơi i bị trội ngặt
bởi si* , nếu mỗi tổ hợp của các chiến lược
của các đấu thủ còn lại , thu hoạch của i do
chọn si kém hơn hẳn khi chọ si*
Hiểu thế nào định nghĩa này
Xét trò chơi ma trận:
(1) Để xem đấu thủ hàng có chiến lược bị trội
ngặt không thì ta so sánh giữa các thu hoạch
ở hai hàng tương ứng
(2) Để xem đấu thủ cột có chiến lược bị trội
ngặt hay không thì ta so sánh các phần tử
của các cột tương ứng.
Định nghĩa hình thức
§Þnh nghÜa: Trong trß ch¬i d¹ng chuÈn G = {S1,..., Sn;
u1,...,un}, cho s’i vµ s”i lµ chiÕn lîc kh¶ thi (cã thÓ thùc
hiÖn) ®èi víi ®Êu thñ i ( nghÜa lµ, s’i vµ s”i lµ phÇn tö cña Si
). ChiÕn lîc s’i lµ bÞ tréi ngÆt bëi chiÕn lîc s”i nÕu víi
mçi tæ hîp kh¶ thi cña c¸c chiÕn lîc cña nh÷ng ®Êu thñ
cßn l¹i, thu ho¹ch cña ®Êu thñ i b»ng viÖc chän chiÕn lîc
s’i kÐm h¬n h¼n khi chän chiÕn lîc s”i:
ui(s1,..., si-1, s’i , si+1,..., sn) < ui(s1,..., si-1, s”i , si+1,..., sn)
®èi víi mäi (s1,..., si-1, si+1,..., sn) cã thÓ ®îc x©y dùng tõ
c¸c kh«ng gian chiÕn lîc S1,..., Si-1, Si+1,..., Sn cña nh÷ng
®Êu thñ cßn l¹i.
Thuật toán
(1) Có thể thực hiện tìm chiến lược bị
trội ngặt của đấu thủ hàng hoặc cột.
Nếu phát hiện chiến lược bị trội ngặt ở
hàng (cột ) thì ta loại hàng (cột) tương
ứng.
(2) Sau khi loại hàng (cột) trò chơi
được thu gọn và quá trình lại lặp lại
trên trò chơi này cho đến khi kết thúc
Thí dụ và phân tích cách giải
Xét trò chơi trừu tượng sau:
Đấu thủ 2
Trước Giữa Phải
Đấu thủ 1 Trên 1 , 0 1 , 2 0,2
Dưới 0 , 3 0 , 2 1,0
Giải thích thuật toán- Đấu thủ 1 nghĩ
§Êu thñ 1 cã hai chiÕn lîc cßn ®Êu thñ 2 cã ba:
S1 = {Lªn, Xuèng} vµ S2 = {Tr¸i, Gi÷a, Ph¶i}.
Víi ®Êu thñ 1, c¶ Lªn hay Xuèng ®Òu kh«ng bÞ
tréi ngÆt: Lªn tèt h¬n Xuèng nÕu ®Êu thñ 2 ch¬i
níc Tr¸i (v× 1>0), nhng Xuèng l¹i tèt h¬n Lªn
nÕu ®Êu thñ 2 ch¬i níc Ph¶i (v× 2>0).
Víi ®Êu thñ 2, dï c¸ch g× th× chiÕn lîc Ph¶i
còng bÞ tréi ngÆt bëi chiÕn kîc Gi÷a (v× 2>1 vµ
1>0), bëi vËy mét ®Êu thñ 2 s¸ng suèt sÏ kh«ng
ch¬i níc Ph¶i.
Giải thích thuật toán
Nh vËy, nÕu ®Êu thñ 1 biÕt ®Êu thñ 2 lµ ngêi
s¸ng suèt th× ®Êu thñ 1 cã thÓ lo¹i chiÕn lîc
Ph¶i ra khái kh«ng gian chiÕn lîc cña ®Êu thñ
2.
§iÒu ®ã cã nghÜa lµ, nÕu ®Êu thñ 1 biÕt ®Êu
thñ 2 lµ ngêi s¸ng suèt th× ®Êu thñ 1 cã thÓ
ch¬i trß ch¬i trong h×nh 1 nh thÓ lµ ch¬i trß
ch¬i trong h×nh 2.
Trò chơi rút gọn
Đấu thủ 2
Tr¸i Giữa
ĐÊu thñ 1 Lªn 1,0 1,2
Xuèng 0,3 0,1
Đấu thủ 2 nghĩ
Trong H×nh 2, ®èi víi ®Êu thñ 1, chiÕn lîc Xuèng b©y giê l¹i
bÞ tréi ngÆt bëi chiÕn lîc Lªn, v× thÕ nÕu ®Êu thñ 1 s¸ng suèt
(vµ ®Êu thñ 1 biÕt ®Êu thñ 2 lµ ngêi s¸ng suèt, do ®ã trß ch¬i
trong h×nh 2 lµ thÝch øng) th× ®Êu thñ 1 sÏ kh«ng ch¬i chiÕn
lîc Xuèng.
Nh vËy, nÕu ®Êu thñ 2 biÕt ®Êu thñ 1 lµ ngêi s¸ng suèt, vµ
®Êu thñ 2 biÕt r»ng ®Êu thñ 1 biÕt ®Êu thñ 2 lµ ngêi s¸ng suèt
(do ®ã ®Êu thñ 2 biÕt r»ng h×nh 2 lµ thÝch øng), th× ®Êu thñ 2
cã thÓ lo¹i bá chiÕn lîc Xuèng ra khái kh«ng gian chiÕn
lîc cña ®Êu thñ 1, cßn l¹i trß ch¬i nh trong h×nh 3.
Trò chơi rút gọn
ĐÊu thñ 2
ĐÊu thñ 1 Tr¸i Giữa
Lªn 1,0 1,2
Kết cục của trò chơi
Nhng víi ®Êu thñ 2 b©y giê, chiÕn lîc
Tr¸i l¹i bÞ tréi hoµn toµn bëi chiÕn lîc
Gi÷a, cßn l¹i (Lªn, Gi÷a) nh lµ kÕt côc
cña trß ch¬i.
Nhược điểm của thuật toán
Mỗi bước đi của thuật toán lại đòi hỏi một
giả địnhvề điều mà các đấu thủ đã biết về sự
sáng suốt của nhau.
Nếu muốn áp dụng quá trình này một số
bước tùy ý thì cần phải giả định kiến thức
chung là : CÁC ĐẤU THỦ LÀ NHỮNG NGƯỜI
SÁNG SUỐT
Quá trình này có thể dẫn đến kết quả dự đoán
mơ hồ
Bài tập
Bài tập 1: Sử dụng thuật toán cân bằng
trội ngặt tìm chiến lược chiến lược cân
bằng của trong bài toán thế nan giải của
tù nhân.
Bài tập 2: Dùng thuật toán phép khử lặp
các chiến lược bị trội ngặt tìm chiến
lược cân bằng của bài toán cuộc chiến
giữa 2 giới
Bài tập
Đấu thủ 2
Trước Giữa Phải
Đấu thủ
1
Tr 2 , 0 3 , 1 0,2
D 0 , 2 2 , 2 4,3
sử dụng thuật toán phép khử lặp để
giải bài toán sau
L2 M2 R2
L1 0,4 4,0 5,3
M1 4,0 0,4 5,3
R1 3,5 3,5 6,6
PHÁT TRIỂN ĐỊNH NGHĨA CÂN BẰNG
NASH
Mét c¸ch ®Ó ph¸t triÓn ®Þnh nghÜa c©n b»ng Nash lµ nÕu lý
thuyÕt trß ch¬i cung cÊp mét nghiÖm duy nhÊt cho mét bµi
to¸n LTTC th× nghiÖm ®ã ph¶i lµ c©n b»ng Nash theo nghÜa
sau ®©y:
Gi¶ sö LTTC ®a ra mét dù ®o¸n duy nhÊt vÒ chiÕn lîc mµ
mçi ®Êu thñ sÏ chän. §iÒu cÇn thiÕt ®Ó dù ®o¸n nµy lµ ®óng lµ
mçi ®Êu thñ s½n lßng chän chiÕn lîc dù ®o¸n bëi lý thuyÕt
nµy. Nh vËy, chiÕn lîc dù ®o¸n cña mçi ®Êu thñ ph¶i lµ
chiÕn lîc ph¶n øng tèt nhÊt cña ®Êu thñ ®ã ®èi víi c¸c chiÕn
lîc dù ®o¸n cña c¸c ®Êu thñ kh¸c. Dù ®o¸n nh vËy cã thÓ
®îc gäi lµ æn ®Þnh chiÕn lîc hay tù tu©n thñ, bëi v× kh«ng
®Êu thñ nµo muèn chÖch khái chiÕn lîc dù ®o¸n cña m×nh.
Chóng ta sÏ gäi dù ®o¸n nh vËy lµ mét c©n b»ng Nash.
Định nghĩa cân bằng Nash
Trong trß ch¬i d¹ng chuÈn n ®Êu thñ G = {S1,..., Sn;
u1,...,un}, c¸c chiÕn lîc (s*1,..., s*n) lµ mét c©n b»ng
Nash nÕu ®èi víi mçi ®Êu thñ i, s*i lµ ph¶n øng tèt nhÊt
cña ®Êu thñ i tríc c¸c chiÕn lîc ®· cho ®èi víi n-1
®Êu thñ cßn l¹i (s*1,..., s*i-1,s*i+1,..., s*n):
ui(s*1,..., s*i-1, s*i , s*i+1,..., s*n) ui (s*1,..., s*i-1, si ,
s*i+1,..., s*n) (NE)
víi mäi chiÕn lîc kh¶ thi si trong Si; nghÜa lµ, si lµ
nghiÖm
maxui(s*1, , s*i-1, si, s*i+1, , s*n).
siSi
Giải thích cân bằng NASH
Ta gi¶ sö r»ng lý thuyÕt trß ch¬i cho ta c¸c chiÕn lîc (s’1,...,
s’n) lµ nghiÖm cña trß ch¬i d¹ng chuÈn G = {S1,..., Sn; u1,...,un}.
Nãi r»ng (s’1,..., s’n) kh«ng ph¶i lµ c©n b»ng Nash cña G còng
t¬ng ®¬ng víi nãi r»ng cã tån t¹i mét ®Êu thñ i mµ s’i kh«ng
ph¶i lµ ph¶n øng tèt nhÊt tríc (s’1,..., s’i-1, s’i+1,..., s’n). NghÜa lµ
cã tån t¹i s”i trong Si sao cho
ui(s’1,..., s’i-1, s’i , s’i+1,..., s’n) < ui(s’1,..., s’i-1, s”i , s’i+1,..., s’n).
Nh vËy, nÕu lý thuyÕt cho ta c¸c chiÕn lîc (s’1,..., s’n) lµ
nghiÖm nhng c¸c chiÕn lîc nµy kh«ng ph¶i lµ mét c©n b»ng
Nash th× Ýt nhÊt mét ®Êu thñ sÏ cã ®éng c¬ chÖch khái dù ®o¸n
lý thuyÕt, do ®ã lý thuyÕt nµy sÏ bÞ bãp mÐo bëi diÔn biÕn thùc
tÕ cña trß ch¬i.
Hiểu thế nào định nghĩa này
Ứng với mỗi tập hợp n-1 chiến lược
của các đấu thủ còn lại thì s*I là
phản ứng tốt nhất
Chiến lược của N-1 đấu thủ còn lại
cũng phải thoả mãn như vậy
Thí dụ
S C R
T 0,4 4,0 5,3
M 4,0 0,4 5,3
B 3,5 3,5 6,6
Quy tắc giải
Để đơn giản ta xét trò chơi 2 đấu thủ: với mỗ
đấu thủ và với mỗi chiến lược ta xác định phản
ứng tốt nhất của đấu thủ còn lại đối với chiến
lược đó.
Quy tắc sau:
(1) Chọ một đấu thủ thí dụ 2 , ta xét các chiến
lược của 1 từ trái sang phải S, C R
Quy tắc giải
- Cố định cột S nghĩa là 2 chơi S thì phản xét
phản ứng của 1: phản ứng tốt nhất của 1 là so
sánh các phần tử của cột 1 thì 4>3 và 4>0 do đó
M của 1 là phản ứng tốt nhất của 1 khi 2 chơi
S- gạch chân 4
Cố định C , cố định R xét tương tự như trên
3. Cố định hàng, cũng xét như vậy .
Cân bằng NASH sẽ là chiến lược ứng với ô có
2 thu hoạch được gạch chân
Kết cục của trò chơi
L C R
T O,4 4,0 5,3
M 4,0 0,4 5,3
B 3,5 3,5 6,6
Các bài tập thực hành
1. Giải bài toán cuộc chiến 2 giới
2. Thế nan giải của tù nhân
3. Các bài tập đã tìm cân bằng trội ngặt
Bài tập tìm cân bằng NASH
Đấu thủ 2
Trước Giữa Phải
Đấu thủ 1 S1 2 , 0 3 , 1 0,2
S2 0 , 2 2 , 2 4,3
Bài tập
Đấu thủ 1
S R
Đấu thủ 2 T a , b e , d
B e , f g ,h
Bài tập
(1) Nếu (T, S) là chiến lược cân bằng
trội ngặt thì quan hệ giữa các thu hoạch
tong bản như thế nào
(2) Nếu (T,S) là cân bằng NASH thì
các quan hệ giữa các thu hoạch trong
bảng như thế nào
Nếu (T,S) là cân bằng trội ngặt thì có
phải là cân bằng NASH không?
Định lý: Quan hệ giữa phép khử lặp và
cân bằng NASH
Trong trò chơi dạng chuẩn n đấu thủ ,
nếu phép khử lặp của các chiến lược bị
trội ngặt loại bỏ tất cả các chiến lược từ
chiến lược (s*1,,s*n) thì những chiến
lược này là cân bằng NASH duy nhất
của trò chơi
Cân bằng NASH mạnh hơn các chiến
lược bị trội ngặt
Trong trò chơi dạng chuẩn n đối thủ
nếu các chiến lược (s*1,,s*n) là
một cân bằng NASH thì chúng
không bị loại bởi phép khử lặp các
chiến lược bị trội ngặt
CHƯƠNG 3
ỨNG DỤNG LÝ THUYẾT TRÒ
CHƠI TĨNH VỚI THÔNG TIN
ĐẦY ĐỦ TRONG VIỆC XÁC
ĐỊNH CHIẾN LƯỢC KINH
DOANH
MỤC ĐÍCH
Nhằm giới thiệu lý thuyết đã trình
bày trong các chương trước vào:
kinh tế và
kinh doanh.
PHÂN LOẠI ỨNG DỤNG THEO CẤU
TRÚC THỊ TRƯỜNG
Các cấu trúc thị trường được xét dưới giác
độ của mô hình kinh điển.
Bốn ứng dụng sử dụng các công cụ phát
triển ở chương trước là:
(1) Mô hình Cournot với hai công ty độc
quyền (1883)
(2) Mô hình Bertrand (1883)
Mô hình phân xử theo đề nghị cuối cùng
Mục đích giải quyết các ứng dụng
Trong mỗi ứng dụng, trước hết ta
chuyển không chính thức của bài toán
sang biểu diễn dạng chuẩn của trò chơi
Tìm cân bằng NASH của các trò chơi
đã kể trêndựa trên biểu diễn dưới dạng
chuẩn của nó.
Mô hình Cournot với 2 công ty độc quyền
Trong một thị trường có 2 công ty ( Công ty
I và II) cung ứng một loại sản phẩm thuần
nhất.
Lượng cung của công ty I và II , ký hiệu q1
và q2 tương ứng
Chi phí của công ty I sản xuất qi là cqi
Tổng cung trên thị trường là Q=q1+q2 và giá
của thị trường về sản phẩm đólà p(Q)
Chuyển bài toán sang dạng chuẩn
Tập hợp đấu thủ là công ty I và công ty
II
Gọi tập hợp các chiến lược của công ty
i là Si thì Si chính là các quyết định
cung của i, nghiã là Si gồm tất cả qi>0
Thu hoạch của công ty i chính là lợi
nhuận cực đại của i.
Cân bằng Nash của bài toán
Để tìm cân bằng Nash , ta phải theo định nghĩa
:Trong trò chơi dạng chuẩn n đấu thủ G . Các
chiến lược (s*1,sn
*) là một cân bằng NASH
nếu đối với mỗi i , s*i là phản ứng tốt nhất của i
đứng trước các chiến lược đã cho của n-1 đấu
thủ còn lại (s*1,s*i-1,s*i-1,s*n) với mọi chiến
lược có thể có của i.
Trong trường hợp này phản ứng tốc nhất là hành
vi cực đại lợi nhuận của mỗi hãng
Lời giải của mô hình
Giả sử hàm cầu ngược thị trường về hai
hàng hoá mà hai công ty này cung cấp
là p(Q). Hàm chi phí của mỗi công ty là
: cqi
Lời giải cân bằng Nash là:
Mở rộng khi có n người chơi thì lời giải
sẽ là
3
** 21
ca
qq
1
** 21
n
ca
qq
Bảng các tham số và lời giải của mô
hình Cournot
4
** 21
ca
qq
1
** 21
n
ca
qq
3
** 21
ca
qq
Tham số Cân bằng Nash
n a c
2 a c
3 a c
n â c
Mô hình Bertrand
Thay cho việc cạnh tranh về lượng các
công ty lựa chọn giá .
Như vậy mô hình này khác với mô hình
trên ở: (1)Không gian chiến lược vì lúc
này công ty i chọn pi không chọn qi;
Hàm thu hoạch (công ty sẽ cực đại lợi
nhuận theo giá); (3) Hành vi trong cân
bằng Nash của mô hình này cũng khác
Chuyển bài toán sang dạng chuẩn
Tập hợp đấu thủ là công ty I và công ty
II
Gọi tập hợp các chiến lược của công ty
i là Si thì Si chính là các quyết định
cung của i, nghiã là Si gồm tất cả pi>0
Thu hoạch của công ty i chính là lợi
nhuận cực đại của i theo giá pi.
Lời giải của mô hình
Giả sử biết hàm cầu thị trường về hai
hàng hoá mà hai công ty i cung cấp là
qi=a-pi+bpj . Hàm chi phí của mỗi công
ty là : cqi
Lời giải cân bằng Nash là:
b
ca
pp
2
** 21
Mô hình phân xử theo đề nghị cuối cùng
Giả thiết: Có sự tranh chấp giữa ban lãnh
đạo công ty và công đoàn
Họ đã ngồi vào bàn đàm phán , các đề
nghị sẽ được đưa ra . Công đoàn đề nghị
tiền lương là wu, công ty đề nghị tiền
lương wf (wf< wu)
Người phân xử sẽ quyết định một trong 2
đề nghị làm phương án giả quyết.
Biết rằng người phân xử có một phương
án giải quyết lý tưởng x và nếu đề nghị
nào gần x hơn thì sẽ được chọn. Biết rằng
X có phân phối chuẩn với hàm mật độ xác
suất F(x). Tìm tiền lương cân bằng.
Mô hình phân xử theo đề nghị cuối cùng
Lời giải của mô hình
Giả sử phương án giải quyết được người phân
sử ưa thích có phân phối cuẩn với giá trị trung
bình là và phương sai là 2 , khi đó các mức
đề nghị cân bằng Nash sẽ là
2
*,
2
*
22
fu ww
CHƯƠNG IV
LÝ THUYẾT NÂNG CAO:
CHIẾN LƯỢC HỖN HỢP VÀ SỰ TỒN
TẠI CÂN BẰNG
Giới thiệu : Chiến lược hỗn hợp
Chúng ta đã Si là tập hợp các chiến lược của
đấu thủ i ,
tổ hợp các chiến lược (s1*,sn*) là cân bằng
NASH nếu với mỗi đấu thủ i si* là phản ứng tốt
nhất đối với n-1 đấu thủ còn lại.
Theo định nghĩa này sẽ không có cân bằng
NASH nào trong trò chơi sau đây
Trò chơi đọ xu – không có cân bằng
chiến lược thuần tuý
Đấu thủ 2
Sấp Ngửa
Đấu thủ
1
Sấp -1 , 1 1 , -1
Ngửa 1 , -1 -1 ,1
Nhận xét
Trong trò chơi này tập hợp chiến lược của mỗi
đấu thủ là {ngửa, sấp}
Nhưng nếu người chơi không phải sẽ chơi ngửa
hoặc sấp mà sẽ chơi ngửa với xác suất p và sấp
với xác suất là q=1-p thì ta sẽ có khái niệm về
chiến lược hỗn hợp
Giải thích chiến lược hỗn hợp
Một chiến lược hỗn hợp đối với đấu thủ i là
một phân phối xác suất trên (một số hay tất cả)
các chiến lược trong tập các chiến lược của i
Điều quan trọng hiểu chiến lược hỗn hợp ở đây
là tập hợp các xác suất gắn với chiến lược thuần
sao cho mỗi chiến lược thuần có một xác suất
chơi dương và tổng xác suất ứng với tất cả các
chiến lược thuần phái bằng 1.
Định nghĩa chiến lược hỗn hợp
Định nghĩa:
Một chiến lược hỗn hợp đối với đấu thủ i là
một phân phối xác suất trên (một số hoặc tất cả)
các chiến lược trong si.
Một cách hình thức có thể định nghĩa:
Trong trò chơi dạng chuẩn G. Khi đó một chiến
lược hỗn hợp đối với đấu thủ i là một phân phối
xác suất pi=(pi1,..pik) vơi 0pik1, pi1++pik=1
Thí dụ
Đấu thủ 2
Sấp Ngửa
Đấu thủ
1
Sấp -1 , 1 1 , -1
Ngửa 1 , -1 -1 ,1
Giải thích
Một chiến lược của hỗn hợp của đấu thủ 1 là
một phân phối xác suất trên các chiến lược {sấp
, ngửa} chẳng hạn người chơi 1 sẽ chơi sấp với
xác suất p và ngửa vơi xác suất 1-p.
chiến lược của hỗn hợp của đấu thủ 2 là một
phân phối xác suất trên các chiến lược {sấp ,
ngửa} chẳng hạn người chơi 2 sẽ chơi sấp vớp
xác suất q và ngửa với xác suất 1-q.
Thí dụ 2: Cuộc chiến giữa 2 giới
P
Ca nhạc Đấu
bóng
C Ca nhạc 2 , 1 0 , 0
Đấu bóng 0 , 0 1 ,2
Giải thích
Giả sử p1 là xác suất để C chơi chiến lược ca
nhạc và 1-p1 là xác suất để C chơi chiến lược
đấu bóng
Giả sử q1 là xác suất để P chơi chiến lược ca
nhạc và 1-q1 là xác suất để P chơi chiến lược
đấu bóng
Thí dụ Về bài toán tìm chiến lược hỗn hợp
P
CN TĐ
C CN 2 , 1 0 , 0
TĐ 0 , 0 1 ,2
Giải bài toán cuộc chiến giữa 2 giới
Tập hợp người chơi chỉ có 2 người là C và P.
Tìm chiến lược hỗn hợp:
(1) Chiến lược hỗn hợp của C: giả sử C chơi Ca
nhạc với xác suất p1 và Đấu bóng với xác suất
p2 =1-p1
(2) Chiến lược hỗn hợp của P: Giả sử P chơi ca
nhạc với xác suất q2= 1-q1 và xem đấu bóng với
xác suất q1.
Phân tích để thiết lập bài toán
Lợi ích mà C thu được khi chơi chiến lược Ca
nhạc là : 2q1+0.q2.Lợi ích mà C thu được khi
chơi ĐB là: 0q1+1q2.
Vậy lợi ích kỳ vọng của C khi chơi chiến lược
hỗn hợp p1,p2 sẽ là:
p1[2q1+0.q2]+p2[0q1+1q2]
Tương tự lợi ích kỳ vọng của P sẽ là:
q1[1p1+0.p2]+q2[0p1+2p2]
Thiết lập bài toán và giải
Như vậy bài toán tìm lợi ích kỳ vọng của đấu
thủ hàng sẽ là
Max p1(2q1+0.q2)+p2(0.q1+1.q2)(1)
P1+p2=1 , pi không âm
Max q1(1p1+0.p2)+q2(0.p1+1.p2)(2)
q1+ q2=1 , qi không âm
Cách giải: Thay p1=1-p2 và (1) và q1=1-q2 vào
(2) và giải ta sẽ được chiến lược hỗn hợp cân
bằng Nash
Thiết lập bài toán trong trường hợp tổng quát
Xét trò chơi với 2 đấu thủ1 và 2. Gọi S1, S2 là không
gian chiến lược của đấu thủ 1 và 2 tương ứng.
Gọi J là số chiến lược thuần trong S1, K là số chiến
lược thuần trong S2.Nghĩa là:
S1={s11,., s1J} và S2={s21,., s2K}
Giả sử đấu thủ 1 tin rằng đấu thủ 2 chơi các chiến
lược {s21,., s2K} với xác suất ={p21,., p2K}, thì
thu hoạch kỳ vọng của đấu thủ 1 từ việc chơi chiến
lược thuần túy s1j là:
Thiết lập bài toán trong trường hợp tổng
quát
thì thu hoạch kỳ vọng của đấu thủ 1 từ việc
chơi chiến lược thuần túy s1j là:
thì thu hoạch kỳ vọng của đấu thủ 1 từ việc
chơi chiến lược hỗn hợp là:
(*)
),( 211
1
2 kj
K
k
k ssup
),(),(),( 211
1
21
1
211
1
2
1
1211 kj
K
k
kj
J
j
kj
K
k
k
J
j
j ssuppssuppppv
Thu hoạch kỳ vọng của đấu thủ 2
Thu hoạch kỳ vọng của đấu thủ 2 từ việc chơi chiến
lược thuần túy s2k là:
thì thu hoạch kỳ vọng của đấu thủ 2 từ việc chơi
chiến lược hỗn hợp là:
(**)
),( 212
1
1 kj
J
j
j ssup
),(),(),( 212
1
21
1
212
1
1
1
2212 kj
K
k
kj
J
j
kj
J
j
j
K
k
k ssuppssuppppv
Điều kiện của cân bằng
Khi cho v1(p1,p2) vµ v2(p1,p2) ta cã thÓ ph¸t biÓu l¹i ®ßi
hái cña c©n b»ng Nash r»ng chiÕn lîc hçn hîp cña
mçi ®Êu thñ lµ mét ph¶n øng tèt nhÊt ®èi víi chiÕn lîc
hçn hîp cña ®Êu thñ kia: ®Ó