Bài giảng Chương 4 Lý thuyết nâng cao: chiến lược hỗn hợp và sự tồn tại cân bằng

Giới thiệu : Chiến lược hỗn hợp  Chúng ta đã Si là tập hợp các chiến lược của đấu thủ i ,  tổ hợp các chiến lược (s1*, sn*) là cân bằng NASH nếu với mỗi đấu thủ i si* là phản ứng tốtnhất đối với n-1 đấu thủ còn lại.  Theo định nghĩa này sẽ không có cân bằng NASH nào trong trò chơi sau đây

pdf73 trang | Chia sẻ: thanhtuan.68 | Lượt xem: 1928 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Chương 4 Lý thuyết nâng cao: chiến lược hỗn hợp và sự tồn tại cân bằng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG IV LÝ THUYẾT NÂNG CAO: CHIẾN LƯỢC HỖN HỢP VÀ SỰ TỒN TẠI CÂN BẰNG Giới thiệu : Chiến lược hỗn hợp  Chúng ta đã Si là tập hợp các chiến lược của đấu thủ i ,  tổ hợp các chiến lược (s1*,sn*) là cân bằng NASH nếu với mỗi đấu thủ i si* là phản ứng tốt nhất đối với n-1 đấu thủ còn lại.  Theo định nghĩa này sẽ không có cân bằng NASH nào trong trò chơi sau đây Trò chơi đọ xu – không có cân bằng chiến lược thuần tuý Đấu thủ 2 Sấp Ngửa Đấu thủ 1 Sấp -1 , 1 1 , -1 Ngửa 1 , -1 -1 ,1 Nhận xét  Trong trò chơi này tập hợp chiến lược của mỗi đấu thủ là {ngửa, sấp}  Nhưng nếu người chơi không phải sẽ chơi ngửa hoặc sấp mà sẽ chơi ngửa với xác suất p và sấp với xác suất là q=1-p thì ta sẽ có khái niệm về chiến lược hỗn hợp Giải thích chiến lược hỗn hợp  Một chiến lược hỗn hợp đối với đấu thủ i là một phân phối xác suất trên (một số hay tất cả) các chiến lược trong tập các chiến lược của i  Điều quan trọng hiểu chiến lược hỗn hợp ở đây là tập hợp các xác suất gắn với chiến lược thuần sao cho mỗi chiến lược thuần có một xác suất chơi dương và tổng xác suất ứng với tất cả các chiến lược thuần phái bằng 1. Định nghĩa chiến lược hỗn hợp  Định nghĩa:  Một chiến lược hỗn hợp đối với đấu thủ i là một phân phối xác suất trên (một số hoặc tất cả) các chiến lược trong si.  Một cách hình thức có thể định nghĩa: Trong trò chơi dạng chuẩn G. Khi đó một chiến lược hỗn hợp đối với đấu thủ i là một phân phối xác suất pi=(pi1,..pik) vơi 0pik1, pi1++pik=1 Thí dụ Đấu thủ 2 Sấp Ngửa Đấu thủ 1 Sấp -1 , 1 1 , -1 Ngửa 1 , -1 -1 ,1 Giải thích  Một chiến lược của hỗn hợp của đấu thủ 1 là một phân phối xác suất trên các chiến lược {sấp , ngửa} chẳng hạn người chơi 1 sẽ chơi sấp với xác suất p và ngửa vơi xác suất 1-p.  chiến lược của hỗn hợp của đấu thủ 2 là một phân phối xác suất trên các chiến lược {sấp , ngửa} chẳng hạn người chơi 2 sẽ chơi sấp vớp xác suất q và ngửa với xác suất 1-q. Thí dụ 2: Cuộc chiến giữa 2 giới P Ca nhạc Đấu bóng C Ca nhạc 2 , 1 0 , 0 Đấu bóng 0 , 0 1 ,2 Giải thích  Giả sử p1 là xác suất để C chơi chiến lược ca nhạc và 1-p1 là xác suất để C chơi chiến lược đấu bóng  Giả sử q1 là xác suất để P chơi chiến lược ca nhạc và 1-q1 là xác suất để P chơi chiến lược đấu bóng Thí dụ Về bài toán tìm chiến lược hỗn hợp P CN TĐ C CN 2 , 1 0 , 0 TĐ 0 , 0 1 ,2 Giải bài toán cuộc chiến giữa 2 giới  Tập hợp người chơi chỉ có 2 người là C và P.  Tìm chiến lược hỗn hợp:  (1) Chiến lược hỗn hợp của C: giả sử C chơi Ca nhạc với xác suất p1 và Đấu bóng với xác suất p2 =1-p1  (2) Chiến lược hỗn hợp của P: Giả sử P chơi ca nhạc với xác suất q2= 1-q1 và xem đấu bóng với xác suất q1. Phân tích để thiết lập bài toán  Lợi ích mà C thu được khi chơi chiến lược Ca nhạc là : 2q1+0.q2.Lợi ích mà C thu được khi chơi ĐB là: 0q1+1q2.  Vậy lợi ích kỳ vọng của C khi chơi chiến lược hỗn hợp p1,p2 sẽ là:  p1[2q1+0.q2]+p2[0q1+1q2]  Tương tự lợi ích kỳ vọng của P sẽ là:  q1[1p1+0.p2]+q2[0p1+2p2] Thiết lập bài toán và giải  Như vậy bài toán tìm lợi ích kỳ vọng của đấu thủ hàng sẽ là  Max p1(2q1+0.q2)+p2(0.q1+1.q2)(1)  P1+p2=1 , pi không âm  Max q1(1p1+0.p2)+q2(0.p1+1.p2)(2)  q1+ q2=1 , qi không âm  Cách giải: Thay p1=1-p2 và (1) và q1=1-q2 vào (2) và giải ta sẽ được chiến lược hỗn hợp cân bằng Nash Thiết lập bài toán trong trường hợp tổng quát  Xét trò chơi với 2 đấu thủ1 và 2. Gọi S1, S2 là không gian chiến lược của đấu thủ 1 và 2 tương ứng.  Gọi J là số chiến lược thuần trong S1, K là số chiến lược thuần trong S2.Nghĩa là:  S1={s11,., s1J} và S2={s21,., s2K}  Giả sử đấu thủ 1 tin rằng đấu thủ 2 chơi các chiến lược {s21,., s2K} với xác suất ={p21,., p2K}, thì thu hoạch kỳ vọng của đấu thủ 1 từ việc chơi chiến lược thuần túy s1j là: Thiết lập bài toán trong trường hợp tổng quát  thì thu hoạch kỳ vọng của đấu thủ 1 từ việc chơi chiến lược thuần túy s1j là:  thì thu hoạch kỳ vọng của đấu thủ 1 từ việc chơi chiến lược hỗn hợp là:  (*) ),( 211 1 2 kj K k k ssup  ),(),(),( 211 1 21 1 211 1 2 1 1211 kj K k kj J j kj K k k J j j ssuppssuppppv    Thu hoạch kỳ vọng của đấu thủ 2  Thu hoạch kỳ vọng của đấu thủ 2 từ việc chơi chiến lược thuần túy s2k là:  thì thu hoạch kỳ vọng của đấu thủ 2 từ việc chơi chiến lược hỗn hợp là:  (**) ),( 212 1 1 kj J j j ssup  ),(),(),( 212 1 21 1 212 1 1 1 2212 kj K k kj J j kj J j j K k k ssuppssuppppv    Điều kiện của cân bằng  Khi cho v1(p1,p2) vµ v2(p1,p2) ta cã thÓ ph¸t biÓu l¹i ®ßi hái cña c©n b»ng Nash r»ng chiÕn l­îc hçn hîp cña mçi ®Êu thñ lµ mét ph¶n øng tèt nhÊt ®èi víi chiÕn l­îc hçn hîp cña ®Êu thñ kia: ®Ó cÆp chiÕn l­îc hçn hîp (p*1,p*2) lµ mét cÊn b»ng Nash, p*1 ph¶i tho¶ m·n  v1(p*1,p*2)  v1(p1,p*2)  ®èi víi mäi ph©n phèi x¸c suÊt p1 trªn S1, vµ p2 ph¶i tho¶ m·n  v2(p*1,p*2)  v2(p*1,p2)  ®èi víi mäi ph©n phèi x¸c suÊt p2 trªn S2. Định nghĩa : cân bằng NASH chiến lược hỗn hợp  Trong trß ch¬i d¹ng chuÈn hai ®Êu thñ  G = {S1,S2;u1,u2}, c¸c chiÕn l­îc hçn hîp (p*1,p*2) lµ mét c©n b»ng Nash nÕu chiÕn l­îc hçn hîp cña mçi ®Êu thñ lµ mét ph¶n øng tèt nhÊt ®èi víi chiÕn l­îc hçn hîp cña ®Êu thñ kia: (*) vµ (**) ph¶i ®óng. Định lý: NASH (1950)  Trong trò chơi dạng chuẩn N đấu thủ G={S1,,Sn;u1,,un}, nếu n hữu hạn và Si là hữu hạn đối với mọi i thì tồn tại tít nhất một cân bằng NASH , có thể gắn với các chiến lược hỗn hợp Bài tập thực hành  Tìm chiến lược hỗn hợp cân bằng Nash cho các bài toán sau:  Trò chơi đọ xu  Tình thế khó xử của hai người tù  Trò chơi trừu tượng Chương V Trò chơi tĩnh với thông tin không đầy đủ  Giới thiệu: Chương này bắt đầu nghiên cứu về các trò chơi với thông tin không đầy đủ, còn gọi là các trò chơi Bayes.  Hãy nhớ lại rằng trong một trò chơi với thông tin đầy đủ, các hàm thu hoạch của các đấu thủ là kiến thức chung.  Trái lại, trong một trò chơi với thông tin không đầy đủ, ít nhất có một đấu thủ không chắc chắn về hàm thu hoạch của các đấu thủ khác. Giới thiệu  Thí dụ: Trò chơi đấu giá bằng phiếu kín: Mỗi người trả giá biết sự đánh giá của mình đối với hàng hoá bán đấu giá nhưng không biết sự đánh giá của người trả giá nào khác; người trả giá bỏ mức giá mình trả trong những phong bì niêm phong kín để nộp, do vậy có thể coi là các đấu thủ đi cùng lúc.  Tuy nhiên, hầu hết các trò chơi Bayes thú vị về kinh tế là trò chơi động. Như ta sẽ thấy , sự tồn tại thông tin của riêng tự nhiên dẫn tới những mưu toan để giao thiệp (hoặc đánh lừa) của các bên được thông tin và mưu toan học hỏi và phản ứng của bên không được thông tin. Đây vốn là những vấn đề động. Lý thuyết: Các trò chơi Bayes tĩnh và cân bằng Nash Bayes  Thí dụ: Cạnh tranh Cournot trong điều kiện thông tin không đối xứng  Hãy xét mô hình Cournot có hai công ty độc quyền với hàm ngược của cầu cho bởi P(Q) = a- Q, ở đây Q = q1+q2 là tổng lượng trên thị trường.  Hàm chi phí của công ty 1 là C1(q1) = cq1. Hàm chi phí của công ty 2 là C2(q2) = cHq2 với xác xuất  và C2(q2) = cLq2 với xác xuất 1- ở đây cL < cH.  Thêm nữa, thông tin là không đối xứng: công ty 2 biết hàm chi phí của nó và của công ty 1 nhưng công ty 1 biết hàm chi phí của nó và chỉ biết rằng chi phí biên của công ty 2 là cH với xác xuất  và cL với xác xuất 1-.  Tất cả điều này là kiên thức chung: công ty 1 biết rằng công ty 2 có thông tin trội hơn, công ty 2 biết rằng công ty 1 biết đièu này, v.v... Thí dụ: Cạnh tranh Cournot trong điều kiện thông tin không đối xứng  Nếu chi phí biên cao, công ty 2 có thể muốn chọn một lượng khác (có lẽ thấp hơn) với trường hợp nếu chi phí biên thấp. Về phần mình, công ty 1 hẳn sẽ đoán rằng công ty 2 có thể thay đổi lựa chọn về lượng của nó hợp với chi phí theo cách này.  Cho q*2(cH) và q*2(cL) ký hiệu lựa chọn lượng của công ty 2 như một hàm của chi phí, và cho q*1 ký hiệu lựa chọn lượng duy nhất của công ty 1. Nếu chi phí của công ty 2 là cao, nó sẽ chọn q*2(cH) là nghiệm  max [(a-q*1-q2)- cH]q2  q2  Tương tự, nếu chi phí của công ty 2 là thấp, q*2(cL) là nghiệm  max [(a-q*1-q2)- cL]q2  q2 Thí dụ: Cạnh tranh Cournot trong điều kiện thông tin không đối xứng  Cuối cùng, công ty 1 biết rằng chi phí của công ty 2 là cao với xác xuất  và sẽ đoán rằng lựa chọn lượng của công ty 2 sẽ là q*2(cH) hoặc q*2(cL) tuỳ thuộc chi phí của công ty 2. Như vậy công ty 1 chọn q*1 là nghiệm  max  [(a-q1-q*2(cH))- c]q1 + (1-) [(a-q1-q2(cL))- c]q1  q1  để cực đại hoá lợi nhuận kỳ vọng.Điều kiện cấp một đối với ba bài toán tối ưu này là  q*2(cH) = (a-q*1- cH) / 2,  q*2(cL) = (a-q*1- cL) / 2,  và  q* = {  [a-q*2(cH)- c] + (1-) [a-q2(cL)- c] }/2 Thí dụ: Cạnh tranh Cournot trong điều kiện thông tin không đối xứng  Giả sử rằng các điều kiện cấp một này định rõ đặc điểm của các nghiệm bài các toán trước đây. (Nhớ lại từ Bài toán 1.6 rằng trong mô hình hai công ty độc quyền kiểu Cournot với thông tin đầy đủ, nếu chi phí của các công ty đủ khác nhau thì ở cân bằng, công ty có chi phí cao không sản xuất gì. Như một bài tập, hãy tìm một điều kiện đủ để bác bỏ các bài toán tương tự ở đây.) Các nghiệm đối với ba điều kiện cấp một là  q*1(cH) = (1/3)(a-2 cH +C) +(1-) (CH-CL)/6  q*2(cH) = (1/3)(a-2 cL +C) +(1-) (CH-CL)/6  và q*1 ={(a-2c+ CH +C)+(1-) CL)}/8 Thí dụ: Cạnh tranh Cournot trong điều kiện thông tin không đối xứng  So sánh q*2(cH), q*2(cL) và q*1 với cân bằng Cournot trong điều kiện thông tin đầy đủ với chi phí c1 và c2. Giả sử rằng các giá trị c1 và c2 là các giá trị sao cho các lượng cân bằng của cả hai công ty là dương, công ty i sản xuất q*i=(a-2ci +cj)/3 trong trường hợp thông tin đầy đủ này. Trái lại, trong trường hợp thông tin không đầy đủ, q*2(cH) lớn hơn (a-2cH +c)/3 và q*2(cL) nhỏ hơn (a-2cL +c)/3. Điều này xảy ra bởi vì công ty 2 không chỉ thay đổi lượng sản xuất theo chi phí của nó mà còn phản ứng với thực tế là công ty 1 không thể làm như vậy. Thí dụ: Cạnh tranh Cournot trong điều kiện thông tin không đối xứng  Thí dụ, nếu chi phí của công ty 2 cao thì nó sản xuất ít đi vì chi phí của nó cao nhưng cũng sản xuất nhiều lên vì nó biết rằng công ty 1 sẽ sản xuất một lượng làm cực đại lợi nhuận kỳ vọng của 1 và như vậy nhỏ hơn lượng 1 sẽ sản xuất nếu nó biết chi phí của công ty 2 cao.  (Một đặc điểm có tiềm năng gây lầm lẫn của thí dụ này là q*1 đúng bằng kỳ vọng của lượng Cournot mà công ty 1 sẽ sản xuất trong hai trò chơi tương ứng với thông tin đầy đủ. Điều này điển hình là không đúng; Thí dụ, hãy xét trường hợp trong đó tổng chi phí của công ty i là ciqi 2 .) Kiểu và không gian kiểu  Nhớ lại rằng, biểu diễn dạng chuẩn của trò chơi n đấu thủ với thông tin đầy đủ là G = {S1 ... Sn;u1 ... un}, ở đây Si là không gian chiến lược của đấu thủ i và ui(s1,...,sn) là thu hoạch của đấu thủ i khi các đấu thủ chọn các chiến lược (s1,...,sn).  Tuy nhiên, như đã thảo luận trong một trò chơi đi cùng lúc với thông tin đầy đủ một chiến lược đối với một đấu thủ đơn giản là một hành động, do vậy ta có thể viết G = {A1 ... An;u1 ... un}, ở đây Ai là không gian hành động của đấu thủ i và ui(a1,...,an) là là thu hoạch của đấu thủ i khi các đấu thủ chọn các hành động (a1,...,an).  Để chuẩn bị cho mô tả của chúng ta về trình tự của trò chơi tĩnh với thông tin không đầy đủ, ta mô tả trình tự của trò chơi tĩnh với thông tin đầy đủ như sau: (1) các đấu thủ chọn các hành động cùng lúc (đấu thủ i chọn ai từ tập khả thi Ai), và rồi (2) nhận được thu hoạch ui(a1,...,an). Kiểu và không gian kiểu  Bây giờ ta muốn phát triển biểu diễn dạng chuẩn của trò chơi đi cùng lúc với thông tin không đầy đủ, còn gọi là trò chơi Bayes tĩnh.  Bước thứ nhất là biểu diễn tư tưởng là mỗi đấu thủ biết hàm thu hoạch của mình nhưng có thể không chắc chắn về hàm thu hoạch của các đấu thủ khác.  Cho hàm thu hoạch có thể của đấu thủ i biểu thị bởi ui(a1,...,an;ti), ở đây ti được gọi là kiểu của đấu thủ i và thuộc một tập hợp các kiểu có thể (hay không gian kiểu) Ti.  Mỗi kiểu ti tương ứng với một hàm thu hoạch khác nhau mà đấu thủ i có thể có. Kiểu và không gian kiểu  Thí dụ giả sử đấu thủ i có hai hàm thu hoạch có thể.  Ta sẽ nói rằng đấu thủ i có hai kiểu, ti1 và ti2 , rằng không gian kiểu của đấu thủ i là T={ti1,ti2}, và rằng hai hàm thu hoạch của đấu thủ i là ui(a1,...,an;ti1) và ui(a1,...,an;ti2).  Ta có thể sử dụng ý tưởng rằng mỗi trong các kiểu của một đấu thủ tương ứng với một hàm thu hoạch khác nhau mà đấu thủ có thể có để biểu thị khả năng là đấu thủ đó có thể có các tập hợp hành động khả thi khác nhau như sau. Kiểu và không gian kiểu  Thí dụ, giả sử rằng tập hợp hành động khả thi của đấu thủ i là {a, b} với xác xuất q và {a, b, c} với xác xuất 1-q.  Thì ta có thể nói rằng i có hai kiểu (ti1 và ti2, ở đây xác xuất của ti1 là q) và ta có thể định nghĩa tập hành động khả thi của i là {a, b, c} đối với cả hai kiểu nhưng định nghĩa thu hoạch từ việc chọn thực hiện hành động c là - đối với kiểu ti1. Thí dụ  Như một thí dụ cụ thể hơn, xét trò chơi Cournot trong mục trước. Các hành động của các công ty là những lựa chọn lượng của họ, q1 và q2. Công ty 2 có hai hàm chi phí có thể và do vậy có hai hàm lợi nhuận hoặc thu hoạch có thể:  2(q1,q2;cL) = [(a- q1- q2)- cL]q2  và  2(q1,q2;cH) = [(a- q1- q2)- cH]q2 .  Công ty 1 chỉ có một hàm thu hoạch có thể:  1(q1,q2;c) = [(a- q1- q2)- c]q1 .  Chúng ta nói rằng không gian kiểu của công ty 2 là T2 = {CL,CH} và rằng không gian kiểu của công ty 1 là T1 = {C}. Thí dụ  Khi đã cho định nghĩa về kiểu của một đấu thủ, nói rằng đấu thủ i biết hàm thu hoạch của mình là tương đương với nói rằng đấu thủ i biết kiểu của mình.  Cũng như vậy, nói rằng đấu thủ i có thể không chắc chắn về hàm thu hoạch của các đấu thủ khác là tương đương với nói rằng đấu thủ i có thể không chắc chắn về kiểu của các đấu thủ khác,  ký hiệu bởi t-i=(t1,...,ti-1,ti+1,...,tn). Ta sử dụng T-i để biểu thị tập hợp tất cả các giá trị có thể của t-i, và sử dụng phân bố xác suất pi(t-i|ti) để biểu thị mức tin tưởng của đấu thủ i về các kiểu của các đấu thủ khác, t-i, khi đã cho kiến thức của đấu thủ i về kiểu của mình, ti. Thí dụ  Trong mọi ứng dụng phân tích (và trong hầu hết tài liệu), các kiểu của các đấu thủ là độc lập, trong trường hợp đó pi(t-i|ti) không phụ thuộc vào ti, do đó ta có thể viết mức tin tưởng của đấu thủ i là pi(t-i).  Tuy nhiên, có những khung cảnh trong đó các kiểu của các đấu thủ tương quan với nhau, do vậy ta cho phép thể hiện điều đó trong định nghĩa của ta về trò chơi Bayes tĩnh bằng việc viết mức tin tưởng của đấu thủ i là pi(t-i|ti).  Kết nối các khái niệm mới về kiểu, và mức tin tưởng với những yếu tố quan trọng của biểu diễn dạng chuẩn của trò chơi tĩnh với thông tin đầy đủ cho ta biểu diễn dạng chuẩn của trò chơi Bayes tĩnh.  Biểu diễn dạng chuẩn của một trò chơi Bayes tĩnh  Định nghĩa: Biểu diễn dạng chuẩn của một trò chơi Bayes tĩnh n đấu thủ chỉ rõ các không gian hành động của các đấu thủ A1,...,An, các không gian kiểu của họ T1,...,Tn, các mức tin tưởng của họ p1,...,pn, và các hàm thu hoạch của họ u1,...,un. Kiểu của đấu thủ i, ti , được biết riêng bởi đấu thủ i, quyết định hàm thu hoạch của đấu thủ i, ui(a1,...,an;ti), và là một phần tử của tập các kiểu T i. Mức tin tưởng của đấu thủ i, pi(t-i|ti), mô tả sự không chắc chắn về các kiểu có thể của n-1 đấu thủ khác, t-i, khi đã cho kiểu của i, ti. Ta ký hiệu trò chơi này là G = {A1,...,An; T1,...,Tn; p1,...,pn; u1,...,un}. Giải thích  Theo cách của Harsanyi (1967), ta sẽ giả sử rằng trình tự của một trò chơi Bayes tĩnh là như sau:  (1) tạo hoá rút một véc tơ kiểu t = (t1,...,tn), ở đây ti được rút từ tập hợp các kiểu có thể Ti;  (2) tạo hoá tiết lộ ti cho đấu thủ i nhưng không tiết lộ cho bất cứ đấu thủ nào khác;  (3) các đấu thủ chọn hành động cùng lúc, đấu thủ i chọn ai từ tập khả thi Ai; và rồi  (4) các đấu thủ nhận các thu hoạch ui(a1,...,an;ti). Giải thích  Bằng việc đưa vào các nước đi tưởng tượng đi bởi tạo hoá trong các bước (1) và (2), ta đã mô tả một trò chơi với thông tin không đầy đủ như một trò chơi với thông tin không hoàn hảo, ở đây ta ngụ ý thông tin không hoàn hảo (như ở Chương 2) nghĩa là đến một nước đi nào đó trong trò chơi, đấu thủ đến lượt đi không biết toàn bộ lịch sử của trò chơi đến lúc đó.  Ở đây, vì tạo hoá tiết lộ kiểu của đấu thủ i cho đấu thủ i nhưng không tiết lộ cho đấu thủ j ở bước (2), đấu thủ j không biết toàn bộ lịch sử của trò chơi khi các hành động được chọn ở bước (3). Giải thích  Có hai điểm hơi có tính kỹ thuật hơn cần được bao trùm để hoàn thành thảo luận của ta về các biểu diễn dạng chuẩn của các trò chơi Bayes tĩnh.  Thứ nhất, có những trò chơi trong đó đấu thủ i có thông tin riêng không chỉ về hàm thu hoạch của mình mà cả về hàm thu hoạch của các đấu thủ khác.  Thí dụ, trong mô hình Cournot với thông tin đối xứng từ được thay đổi sao cho các chi phí là kiến thức chung và đối xứng nhưng một công ty biết mức cầu và công ty kia không biết. Giải thích  Vì mức cầu ảnh hưởng lên hàm thu hoạch của cả hai đấu thủ, kiểu của công ty được thông tin hiện thân vào hàm thu hoạch của công ty không được thông tin.  Trong trường hợp n đấu thủ, ta nắm bắt khả năng này bằng việc cho phép thu hoạch của đấu thủ i phụ thuộc vào các hành động (a1,...,an) mà còn phụ thuộc tất cả các kiểu (t1,...,tn). Ta viết thu hoạch này là ui(a1,...,an;t1,...,tn).  Giải thích  Điểm kỹ thuật thứ hai liên quan đến mức tin tưởng, pi(t-i|ti). ta sẽ giả sử rằng một kiến thức chung là ở bước (1) trong trình tự của trò chơi Bayes tĩnh, tạo hoá rút một véc tơ kiểu  t = (t1,...,tn) theo phân phối xác xuất tiên nghiệm p(t).  Khi tạo hoá tiết lộ ti cho đấu thủ i, anh hay chị ta có thể tính mức tin tưởng pi(t-i|ti) theo quy tắc Bayes: Giải thích  Thêm nữa, các đấu thủ khác có thể tính các mức tin tưởng khác mà đấu thủ i có thể có, phụ thuộc và kiểu của i, cụ thể là pi(t-i|ti) đối với mỗi ti trong Ti.  Như đã nói, ta sẽ thường xuyên giả định rằng các kiểu của các đấu thủ là độc lập, trong trường hợp đó pi(t-i) không phụ thuộc vào ti nhưng vẫn được rút ra từ phân phối tiên nghiệm p(t).  Trong trường hợp này các đấu thủ khác biết mức tin tưởng của đấu thủ i về kiểu của họ. Định nghĩa cân bằng chiến lược  Bây giờ ta muốn định nghĩa một khái niệm cân bằng đối với các trò chơi Bayes tĩnh. Để làm việc đó, trước hết ta phải định nghĩa các không gian chiến lược của các đấu thủ trong một trò chơi như vậy. Nhớ lại rằng chiến lược của một đấu thủ là toàn bộ kế hoạch hành động chỉ ra một hành động khả thi trong mọi tình huống bất ngờ trong đó đấu thủ đến lượt hành động. Khi đã cho trình tự của trò chơi Bayes tĩnh trong đó tạo hoá bắt đầu trò chơi bằng việc rút thăm các kiểu của các đấu thủ, một chiến lược (thuần tuý) đối với đấu thủ i phải chỉ ra hành động khả thi đối với mỗi trong các kiểu có thể của đấu thủ i.  Định nghĩa: Trong trò chơi Bayes tĩnh G = {A1,...,An; T1,...,Tn; p1,...,pn; u1,...,un}, một chiến lược đối với đấu thủ i là một hàm si(ti), ở đây đối với mỗi kiểu ti trong Ti, si (ti) chỉ ra hành động từ tập khả thi Ai mà kiểu ti sẽ chọn nếu được rút bởi tạo hoá. Không gian chiến lược không được cho trong biểu diễn dạng chuẩn  Không giống như các trò chơi với thông tin đầy đủ, trong một trò chơi Bayes các không gian chiến lược không được cho trong biểu diễn dạng chuẩn của trò chơi.  Thay vì như vậy, trong một trò chơi Bayes tĩnh, các không gian chiến lược được xây dựng từ các không gian kiểu và các không gian hành động: tập hợp chiến lược (thuần tuý) có thể của đấu thủ i, Si, là tập hợp của
Tài liệu liên quan