1. GIỚI THIỆU*
Trong khuôn khổ của lí thuyết trò chơi
xác suất, việc chứng minh các nước đi của
Thực tế (Reality) tuân theo luật mạnh số
lớn (LMSL) trong trường hợp các nước đi
này b chặn là khá dễ dàng. Tuy nhiên, khi
các nước đi của Thực tế không b chặn,
việc chứng minh trở nên phức tạp hơn. Bên
cạnh đó, tương ứng với một số dạng phổ
biến nhất của LMSL trong lí thuyết xác
suất cần phải được nghiên cứu trong lí
thuyết trò chơi xác suất (nếu có).
Bài báo cung cấp một số dạng LMSL
trong trò chơi dự báo không bị chặn
(unbounded forecasting game) đã được giới
thiệu trong chương 4 của [1]. Tiếp theo, khi
hạn chế nước đi của Thực tế trong trò chơi
dự báo không b chặn là các số thực dương,
(*)ThS, Trường ĐH Công nghiệp TP Hồ Chí Minh, Cơ sở
Thanh Hóa.
(**)TS, Khoa Giáo dục đại cương, Trường ĐH Sư phạm
Kĩ thuật Vinh.
chúng tôi đưa ra một giao thức mới, gọi là
trò chơi dự báo không bị chặn một phía
(One-sided unbounded forecasting game).
Sau đó, chúng tôi chứng minh một số kết quả
dạng LMSL đối với giao thức này.
6 trang |
Chia sẻ: thanhle95 | Lượt xem: 420 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Một số dạng luật mạnh số lớn trong lí thuyết trò chơi xác suất, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
TAÏP CHÍ ÑAÏI HOÏC SAØI GOØN Soá 20 - Thaùng 4/2014
61
MỘT SỐ DẠNG LUẬT MẠNH SỐ LỚN
TRONG LÍ THUYẾT TRÒ CHƠI XÁC SUẤT
ĐỖ THẾ SƠN(*)
LÊ HỒNG SƠN(**)
TÓM TẮT
Bài báo cung cấp một số dạng luật mạnh số lớn trong khuôn khổ lí thuyết trò chơi
xác suất của Shafer và Vovk (2001). Các dạng luật mạnh số lớn trong lí thuyết trò chơi
được thiết lập với hàng rào bậc hai có sẵn.
Từ khoá: luật mạnh số lớn, lí thuyết, xác suất, trò chơi xác suất
ABSTRACT
The paper presents some versions of the strong law of large numbers in the
framework of the game-theoretic probability of Shafer and Vovk (2001). Game-theoretic
versions of the strong law of large numbers are established under the availability of the
quadratic hedge.
Keywords: the strong law of large numbers, theory, probability, probability game
1. GIỚI THIỆU*
Trong khuôn khổ của lí thuyết trò chơi
xác suất, việc chứng minh các nước đi của
Thực tế (Reality) tuân theo luật mạnh số
lớn (LMSL) trong trường hợp các nước đi
này b chặn là khá dễ dàng. Tuy nhiên, khi
các nước đi của Thực tế không b chặn,
việc chứng minh trở nên phức tạp hơn. Bên
cạnh đó, tương ứng với một số dạng phổ
biến nhất của LMSL trong lí thuyết xác
suất cần phải được nghiên cứu trong lí
thuyết trò chơi xác suất (nếu có).
Bài báo cung cấp một số dạng LMSL
trong trò chơi dự báo không bị chặn
(unbounded forecasting game) đã được giới
thiệu trong chương 4 của [1]. Tiếp theo, khi
hạn chế nước đi của Thực tế trong trò chơi
dự báo không b chặn là các số thực dương,
(*)ThS, Trường ĐH Công nghiệp TP Hồ Chí Minh, Cơ sở
Thanh Hóa.
(**)TS, Khoa Giáo dục đại cương, Trường ĐH Sư phạm
Kĩ thuật Vinh.
chúng tôi đưa ra một giao thức mới, gọi là
trò chơi dự báo không bị chặn một phía
(One-sided unbounded forecasting game).
Sau đó, chúng tôi chứng minh một số kết quả
dạng LMSL đối với giao thức này.
2. MỘT SỐ KHÁI NIỆM VÀ KẾT QUẢ
SƠ BỘ
Trong mục này, chúng tôi tóm tắt một
số khái niệm cơ bản của trò chơi dự báo
không b chặn. Sau đó, chúng tôi đưa ra hai
kết quả dạng LMSL đối với trò chơi này.
Xét trò chơi hoàn hảo thông tin giữa ba
người: Dự báo (Forecaster), Hoài nghi
(Skeptic) và Thực tế (Reality). Trước khi bắt
đầu trò chơi, Hoài nghi công bố số vốn ban
đầu của mình 0 1K ( 0 0K D trong mục
2 của [2]). Sau đó, ở mỗi vòng 1,2,...n của
trò chơi, người chơi lần lượt công bố các nước
đi (move) của mình theo thứ tự: Dự báo, Hoài
nghi và Thực tế. Tại mỗi vòng, đầu tiên Dự
báo công bố nước đi nm và nv của mình,
62
chúng được hiểu lần lượt như là giá cho nước
đi nx của Thực tế và giá cho bình phương độ
lệch 2( )n nx m . Căn cứ vào các giá mà Dự
báo đưa ra, Hoài nghi sau đó sẽ công bố số
lượng nM và nV mà anh ta đặt cược lần lượt
cho
nx và
2( )n nx m . Cuối cùng, Thực tế
công bố nước đi
nx của mình. Số phải trả
(payoff) cho Hoài nghi tại vòng thứ n là
2( ) [( ) ]n n n n n n nM x m V x m v và số vốn
(capital) của Hoài nghi khi kết thúc vòng thứ
n được cập nhật là:
2
1: ( ) [( ) ]n n n n n n n n nK K M x m V x m v .
Giao thức của trò chơi dự báo không b
chặn được viết như sau
TRÒ CHƠI DỰ BÁO KHÔNG BỊ CHẶN
(UNBOUNDED FORECASTING GAME)
Người chơi: Dự báo, Hoài nghi, Thực tế
Giao thức:
0 1K .
Dự báo công bố nm và 0nv .
Hoài nghi công bố nM và 0nV .
Thực tế công bố nx .
2
1: ( ) [( ) ]n n n n n n n n nK K M x m V x m v .
Nhiệm vụ ràng buộc: Hoài nghi phải
giữ nK không âm.
Thực tế phải giữ nK không tiến đến vô
cùng.
Một chiến lược (strategy) 1{P }n nP
của Hoài nghi xác đ nh nM và nV dựa vào
các nước đi trước của Dự báo và Thực tế,
và nước đi hiện tại của Dự báo
1 1 1 2 2 2 1 1 1( , v , , , v , ,..., , v , , , v )
P
n n n n n n nM M m x m x m x m
1 1 1 2 2 2 1 1 1( , v , , , v , ,..., , v , , , v )
P
n n n n n n nV V m x m x m x m
P
nK là số vốn tích lũy (cumulative) của
Hoài nghi với chiến lược P sau vòng n,
với 0
PK =0 .
Chúng ta gọi một dãy hàm giá tr thực
1 1 1( ,v , ,..., , v , )n n n nS m x m x của các nước đi
1 1 1, v , ,..., , v ,n n nm x m x , n 0 là một quá
trình vốn (capital process) nếu Pn nS K đối
với một chiến lược P nào đó.
Một dãy vô hạn
1 1 1 2 2 2( , v , , , v , ,....)m x m x các nước
đi của Dự báo và Thực tế được gọi là một
đường đi (path). Tập tất cả các đường đi
1 1 1 2 2 2{ ( ,v , , , v , ,....), n 1}m x m x
gọi là không gian mẫu (sample space), tập
con bất kỳ E gọi là một biến cố
(event). Chúng ta nói rằng Hoài nghi có thể
buộc (force) biến cố E nếu tồn tại một
chiến lược P của Hoài nghi sao cho
( ) 1, , n 0PnK (1)
và limsup ( )Pn
n
K
Chú ý rằng Hoài nghi có thể buộc
biến cốE , tức là E xảy ra hầu chắc chắn
(xem [1]).
Một chiến lược P của Hoài nghi thỏa
mãn (1) được gọi là thận trọng (prudent).
Chúng ta cũng gọi hàm thực ( )n nh x m của
hiệu các nước đi nx và nm là một hàng rào
(hedge) nếu 0 (x m )n nh .
Cho hai biến cố ,E F biến cố
63
E F được xác đ nh là cE F E F .
Chúng ta cũng nói rằng một quá trình A là
dự báo được (predictable) nếu với mọi số
nguyên 1n ,
1 1 1 2 2 2
(m , , ,m , , ,...,m , , )
n n n n
A v x v x v x
không phụ thuộc vào
n
x .
Một supermartingale T là một quá
trình có dạng T S B , với S là một quá
trình vốn và B là một quá trình tăng
(
1
( ) ( ), n,
n n
B B ). Một quá trình
0B có thể xem là tăng nên bản thân một
quá trình vốn S là một supermartingale.
Một semimartingale là một quá trình có thể
viết dưới dạng U T A , với T là một
supermartingale và A là một quá trình tăng
dự báo được; quá trình A được gọi là
compensator đối với U .
Bây giờ chúng ta chứng minh đ nh lí
dưới đây:
Định lí 2.1. Trong trò chơi dự báo
không b chặn, Hoài nghi có thể buộc
1 1
1
lim (x m ) 0
n
n
k k
x
n k
v
n n
.
Trước khi chứng minh đ nh lí này,
chúng ta thảo luận về ý nghĩa của đ nh lí và
đặc trưng của giao thức trò chơi dự báo
không b chặn.
Trong giao thức của trò chơi dự báo
không b chặn, chúng ta xét hàng rào
phương sai (còn gọi là hàng rào bậc hai
2(x m ) (x m )n n n nh ). Do đó, giao thức
này được gọi chính xác là trò chơi dự báo
không b chặn với hàng rào bậc hai. Trong
trò chơi này, hàng rào bậc hai được cố đ nh
sẵn đối với Hoài nghi còn các giá của hàng
rào nv sẽ được Dự báo công bố ở mỗi vòng,
trước khi Thực tế công bố nước đi của
mình. Vì vậy, sẽ rất hữu ích nếu chúng ta
thay hàng rào bậc hai bởi hàng rào tổng
quát h còn giá của hàng rào là một hằng số
dương cố đ nh (xem [3]).
Đ nh lí 3.1 của [3] cho thấy rằng
trong trò chơi dự báo không b chặn với
hàng rào đơn 1( ) , 0h x x thì Hoài
nghi có thể buộc 0nx , với
1 2 ... n
n
x x x
x
n
. Mặt khác, Mệnh
đề 2.1 của [3] cũng khẳng đ nh rằng trong
trò chơi dự báo không b chặn với hàng rào
đơn ( ) , r 0rh x x thì Hoài nghi không
thể buộc
1 2
1/
...
0n
r
x x x
n
.
Tuy nhiên, cả đ nh lí và mệnh đề này
đều được phát biểu đối với trò chơi dự báo
không b chặn với hàng rào đơn h , trong
đó giá của hàng rào đơn h là hằng số
dương (tức là: 0, 1nv v n ). Do vậy,
khi xem xét trò chơi dự báo không b chặn
với hàng rào bậc hai, có hai câu hỏi chính
mà chúng ta cần quan tâm là có thể thay n
trong Đ nh lí 3.1 của [3] bằng n hay
không và nếu có thể, thì chúng ta cần phải
thêm điều kiện gì? Đ nh lí 2.1 đã đưa ra
một câu trả lời cho hai câu hỏi trên.
Việc tiếp theo của chúng ta bây giờ là
đưa ra chứng minh cho Đ nh lí 2.1.
Chứng minh. Không mất tính tổng
quát, chúng ta giả sử rằng 0, nm n . Đặt
1
n
k
n
k
x
S
k
, 0 0S ;
1
n
k
n
k
v
A
k
,
1
k
k
v
A
k
.
64
Xét
2
2
1
1 1
2
n n
k k k
n n n k
k k
x x v
U S A S
kk
=
2
1 12
n n n
n n
x x v
U S
nn
=
2
1 ( ).n n n n n nU M x V x v
Trong đó,
1
1
1
2 2 n k
n n
k
x
M S
n n k
và
1
nV
n
. Suy ra, nU là một quá trình vốn,
do đó nU cũng là một supermartingale.
Từ
1
1
n
k n
n n
k
x x
S S
k n
Chúng ta có nS là một quá trình vốn, với
1
nM
n
và 0nV nên nS cũng là một
supermartingale.
Chú ý rằng 2
n n nS U A , do đó nA là
compensator đối với semimartingale 2
nS .
Khi đó từ Bổ đề 4.7 của [1], nếu A
thì nS hội tụ h.c.c, tức là
1 1
n
n k
n k
v x
n k
hội tụ h.c.c, khi
n .
Kết hợp với bổ đề Kronecker, ta được:
1 1
1
lim x 0
n
n
k
x
n k
v
n n
.
Trong các giáo trình về lí thuyết xác suất,
tốc độ hội tụ của LMSL có thể được đánh
giá bằng một dãy số ( )nb tăng dương
( 0 nb ). Tuy nhiên, trong lí thuyết trò
chơi xác suất, dãy số dương tăng trở nên
đặc biệt hơn, như trong Đ nh lí 2.2 dưới
đây.
Định lí 2.2. Gọi 2
1
n
n k
k
B v
, trong trò chơi
dự báo không b chặn, Hoài nghi có thể buộc
1
n
n
v
và 2
1 1
1
lim ( ) 0
n
n
k k
x
n kn n
v
x m
B B
.
Chứng minh. Chú ý rằng, không mất tính
tổng quát, chúng ta giả sử 0, nm n . Xét
quá trình vốn
1
n
k
n
k k
x
S
B
. Compensator
của 2nS là 2
1
n
k
n
k k
v
A
B
. Từ hai bổ đề 4.6
và 4.7 của [1] kết hợp với bổ đề Kronecker,
ta dễ dàng suy ra
1
1
lim 0
n
k
x
kn
x
B
3. TRÒ CHƠI DỰ BÁO KHÔNG BỊ
CHẶN MỘT PHÍA
Với trò chơi dự báo không b chặn ở
mục trước, chúng ta thấy rằng nước đi nx
của Thực tế là một số thực bất kỳ. Trong
mục này, chúng tôi hạn chế nước đi của
Thực tế là các số thực dương và đưa ra giao
thức trò chơi dự báo không bị chặn một phía
với hàng rào bậc hai (One-sided unbounded
forecasting game with quadric hedge). Sau
đó, chúng tôi chứng minh một số kết quả
dạng LMSL đối với giao thức này.
Giao thức trò chơi dự báo không b
65
chặn một phía với hàng rào bậc hai được
viết như sau:
ONE-SIDED UNBOUNDED
FORECASTING (OUF)
Người chơi: Dự báo, Hoài nghi, Thực tế
Giao thức:
0 1K .
Với 1,2,... :n
Dự báo công bố 0nm và 0nv .
Hoài nghi công bố nM và 0nV .
Thực tế công bố 0nx .
2
1: ( ) [( ) ]n n n n n n n n nK K M x m V x m v .
Nhiệm vụ ràng buộc: Hoài nghi phải
giữ
nK không âm.
Thực tế phải giữ nK không tiến đến
vô cùng.
Đ nh lí dưới đây được phát triển dựa
vào Đ nh lí 4.4 của [2] phát biểu cho trò
chơi dự báo không b chặn.
Định lí 3.1. Đặt
1
n
n k
k
B m
, giả sử
rằng g là một hàm số dương tăng trên
[0; ) với ( )g . Trong OUF, Hoài
nghi có thể buộc
1
n
n
m
và 1 1
1
lim ( ) 0.
( ) ( )
n
n
k k
x
n kn n
v
x m
g B g B
Chứng minh. Đặt
1 ( )
n
k k
n
k k
x m
U
g B
, 0 0U ; 1
( )
n
k
n
k k
v
A
g B
,
1 (B )
k
k k
v
A
g
.
Xét
2
2
1
1 1
( )
2 ( )
(B )( )
n n
k k k k k
n n n k
k k kk
x m x m v
T U A U
gg B
=
2
1 1
( )
2 ( )
( )( )
n n n n n
n n
nn
x m x m v
T U
g Bg B
=
2
1 ( ) [( ) ]n n n n n n n nT M x m V x m v .
với
1
1
1
2 2
( ) ( ) ( )
n
n k k
n
kn n k
U x m
M
g B g B g B
và
1
( )
n
n
V
g B
.
Do đó nT là một quá trình vốn, suy ra
nT cũng là một supermartingale. Mặt khác
1
1 ( ) ( )
n
k k n n
n n
k k n
x m x m
U U
g B g B
,
suy ra nU cũng là một quá trình vốn với
1
( )
n
n
M
g B
và 0nV .
Lưu ý rằng 2n n nU T A nên nA là
compensator đối với 2nU . Khi đó, theo Bổ
đề 4.7 của [1], ta có
1 1( ) ( )
n
n k k
n kn k
v x m
g B g B
hội tụ h.c.c, khi n .
66
Kết hợp với bổ đề Kronecker, ta được
1
1
lim ( ) 0
( )
n
k k
x
kn
x m
g B
.
Đ nh lí được chứng minh
Như chúng ta đã biết trong lí thuyết xác
suất, luật mạnh số lớn Kolmogorov đã được
nghiên cứu với các biến ngẫu nhiên độc lập
cùng phân phối. Trong trường hợp đó, kỳ
vọng và phương sai của các biến ngẫu nhiên
đó là những hằng số không phụ thuộc vào n.
Tương ứng với điều đó, trong lí thuyết trò
chơi xác suất, ta xét luật mạnh số lớn với
các nước đi của Thực tế là những hằng số
và thu được hệ quả dưới đây.
Hệ quả 3.2. Trong OUF, giả sử rằng
nm ,
2
nv với mọi n, đặt
1
n
n k
k
S x
.
Khi đó, Hoài nghi có thể buộc
lim n
x
S
n
.
Chứng minh. Trong Đ nh lí 3.1, lấy
hàm 2( )g x x . Khi đó
2 2
2 2 2 2
1 1 1
1
( )
n
n n nn
v
g B n n
,
1 1
1 1
(x m ) (x m )
( )
n n
k k k k
k kn
ng B
.
Do đó
1
1
lim ( ) 0
n
k
x
k
x
n
hay
lim n
x
S
n
.
TÀI LIỆU THAM KHẢO
1. G. Shafer, V. Vovk, Probability and Finance: It's Only a Game! Wiley, 2001.
2. Kenshi Miyabe, Akimichi Takemura, Convergence of random series and the rate of
convergence of the strong law of large numbers in game-theoretic probability,
Stochastic Process. Appl 122 (2012) 1-30.
3. M. Kumon, A. Takemura, K. Takeuchi, Game-theoretic versions of strong law of
large numbers for unbounded variables, Stochastic 79 (5) (2007) 449-468.
* Ngày nhận bài: 6/3/2014. Biên tập xong: 16/5/2014. Duyệt đăng: 22/5/2014