Bài giảng Nền tảng của các mô hình lý thuyết trò chơi - Tài liệu, ebook, giáo trình, hướng dẫn

Loại 1: Ra quyết định trong điều kiện chắc chắn Người ra quyết định: Biết chắc chắn kết quả của một phương án. Loại 2: Ra quyết định trong điều kiện có rủi ro. Người ra quyết định biết xác suất của nhiều kết quả khác nhau. Loại 3: Ra quyết đinh trong điều kiện không chắc chắn Người ra quyết định không biết xác suất của các kết quả

39 trang | Chia sẻ: haohao89 | Lượt xem: 3326 | Lượt tải: 3

Bạn đang xem trước 20 trang tài liệu Bài giảng Nền tảng của các mô hình lý thuyết trò chơi, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Chương 2 Nền tảng của các mô hình lý thuyết trò chơi Mục tiêu Học xong chương này, sinh viên có thể: Liệt kê các bước của quy trình ra quyết định Mô tả các loại của môi trường ra quyết định Sử dụng các giá trị xác suất ra quyết định trong điều kiện có rủi ro. Ra quyết định trong điều kiện không chắc chắn; trong đó có rủi ro nhưng không biết xác suất. Sử dụng máy tính để giải quyết các vấn đề ra quyết định căn bản 30 Tóm tắt chương 3.1 Giới thiệu 3.2 Sáu bước trong lý thuyết quyết định 3.3 Các loại môi trường ra quyết định 3.4 Ra quyết định trong điều kiện có rủi ro 3.5 Ra quyết định trong điều không chắc chắn 3.6 Phân tích biên tế với nhiều phương án thay thế và trạng thái tự nhiên Giới thiệu Lý thuyết quyết định là phương pháp phân tích có hệ thống nhằm để xử lý các vấn đề. Một quyết định tốt là một quyết định dựa trên logic. Sáu bước trong lý thuyết quyết định Xác định vấn đề một cách rõ ràng. Liệt kê đầy đủ các khả năng, phương án có thể lựa chọn để ra quyết định. Xác định các kết quả có thể xảy ra Liệt kê thu nhập, chi phí, lợi nhuận (payoff) cho mỗi kết hợp giữa phương án và kết quả. Chọn một trong các mô hình lý thuyết toán học thích hợp để áp dụng. Ứng dụng mô hình và ra quyết định Bảng quyết định của cty Thompson Lumber Các loại môi trường ra quyết định Loại 1: Ra quyết định trong điều kiện chắc chắn Người ra quyết định: Biết chắc chắn kết quả của một phương án. Loại 2: Ra quyết định trong điều kiện có rủi ro. Người ra quyết định biết xác suất của nhiều kết quả khác nhau. Loại 3: Ra quyết đinh trong điều kiện không chắc chắn Người ra quyết định không biết xác suất của các kết quả Ra quyết định ở Nuclear World Ra quyết định trong điều kiện rủi ro Giá trị tiền tệ kỳ vọng EMV (một phương án) = (Số tiền ứng với trạng thái tự nhiên thứ nhất X xác suất trạng thái tự nhiên thứ nhất) + (Số tiền ứng với trạng thái tự nhiên thứ hai X xác suất trạng thái tự nhiên thứ hai) + … + (số tiền ứng với trạng thái tự nhiên cuối cùng X xác suất của trạng thái này) Bảng quyết định của Cty Thompson Lumber Giá trị kỳ vọng thông tin hoàn hảo (EVPI) EVPI là giá trị căn cứ vào đó người ta chi trả cho việc mua thông tin. EVPI Là giá trị kỳ vọng trong điều kiện thông tin hoàn hảo trừ đi giá trị tối đa của kỳ vọng tiền tệ. Giá trị kỳ vọng thông tin hoàn hảo (EV | PI) Giá trị kỳ vọng thông tin hoàn hảo EVPI = EV|PI – Giá trị tối đa EMV Giá trị kỳ vọng thông tin hoàn hảo Giá trị kỳ vọng thông tin hoàn hảo EVPI = Giá trị kỳ vọng thông tin hoàn hảo - max(EMV) = $200,000*0.50 + 0*0.50 - $40,000 = $60,000 Tổn thất cơ hội kỳ vọng EOL là chi phí của việc không chọn đúng giải pháp tốt nhất EOL = Giá trị hối tiết kỳ vọng Tính EOL Bảng tổn thất cơ hội Bảng tổn thất cơ hội (tt) Bảng tổn thất cơ hội Phân tích độ nhạy EMV(Nhà máy lớn) = $200P - (1-P)$180 EMV(Nhà máy nhỏ) = $100P - $20(1-P) EMV(Do Nothing) = $0P + 0(1-P) Phân tích độ nhạy (tt) Ra quyết định trong điều kiện không chắc chắn Maximax Maximin Khả năng xảy ra như nhau(Laplace) Tiêu chí Herwicz Minimax Ra quyết định trong điều kiện không chắc chắn Maximax - Chọn phương án có kết quả mang lại cao nhất Ra quyết định trong điều kiện không chắc chắn Maximin - chọn giá trị lớn nhất trong các kết quả (outcome) nhỏ nhất của mỗi phương án Ra quyết định trong điều kiện không chắc chắn Xảy ra như nhau - giả sử mọi trạng thái tự nhiên điều có xác xuất xảy ra như nhau. Chọn phương án có kết quả trung bình lớn nhất. Ra quyết định trong điều kiện không chắc chắn Tiêu chí Hurwicz (hay tiêu chí thực tếCR): CR = *(giá trị max) + (1-)*(giá trị min) Ra quyết định trong điều kiện không chắc chắn Minimax - chọn phương án có kết quả nhỏ nhất trong số các phương án có tổn thất cơ hội lớn nhất. Phân tích biên tế P = xác suất của nhu cầu lớn hơn hay bằng nguồn cung. 1-P = xác suất nhu cầu nhỏ hơn nguồn cung. MP = Lợi nhuận biên tế ML = lỗ biên tế Quy tắc quyết định tối ưu: P*MP  (1-P)*ML or Phân tích biên tế - phân phối rời rạc Các bước sử dụng trong phân phối rời rạc: Xác định giá trị P Lập bảng xác suất và thêm cột xác suất lũy tiến Đặt hàng cho đến khi nào xác xuất bán được còn cao hơn giá trị xác suất P. Ví dụ Café du Donut Ví dụ Café du Donut LN biên tế = giá bán - Chi phí = $6 - $4 = $2 Lỗ biên tế = chi phí Vì vậy: Ví dụ Café du Donut Phân tích biên tế Phân phối chuẩn  = Doanh số trung bình  = Độ lệch chuẩn của doanh số MP = Lợi nhuận biên tế ML = Lỗ biên tế Phân tích biên tế phân phối chuẩn Các bước trong sử dụng phân phối chuẩn Xác định giá trị P. Định vị P trong phân phối chuẩn. Ứng với một diện tích dưới đường cung tìm giá trị Z từ bảng phân phối chuẩn. Sử dụng ta có thể tìm ra giá trị X* Ví dụ sạp báo Joe A ML = 4 MP = 6  = nhu cầu trung bình = 50 tờ báo/ngày  = Độ lệch chuẩn của nhu cầu = 10 Ví dụ sạp báo Joe A (tt) Bước 1: Bước 2: Tra bảng phân phối chuẩn cho P = 0.6 (i.e., 1 – 0.4) . Ví dụ sạp báo Joe A(tt) Ví dụ sạp báo Joe B ML = 8 MP = 2  = nhu cầu trung bình = 100 papers per day  = độ lệch chuẩn = 10 Ví dụ sạp báo Joe B (tt) Bước 1: Bước 2: Z = -0.84 cho diện tích 0.80 và hay: Ví dụ sạp báo Joe B (tt)