Có nhiều các chu trình thuỷ văn phải đượclàmrõvàđược giải thích theo xác suất
là do sự biến đổi ngẫu nhiên vốn có của nó. cho ví dụ không thể dự báo lưu lượng và
lượng mưa một cách chính xác dựa vào các số liệu trong quá khứ hay tương lai do
không biết nguyên nhân cơ chế hoạt động của chúng. Rất may là phương pháp thống kê
là rất phù hợp để cấu thành và biểu diễn chuỗi sốliệu quan trắc thành một dạng mà có
thể nội suy và ước lượng. Chương này chỉ ra các phương pháp ngẫu nhiên mà trong
thuỷ văn các số liệu có thể được xác định và biểu diễn trong một phuơng phápthống kê
chuẩn.
61 trang |
Chia sẻ: lylyngoc | Lượt xem: 1669 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Chương 3. Phân tích tần suất, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ch−ơng 3. phân tích tần suất
ảnh. Lũ lụt ở sông Trinity cạnh Dayton, Texas nawm 1990
3.1.
lời giới thiệu
Phạm vi nghiên cứu
Có nhiều các chu trình thuỷ văn phải đ−ợc làm rõ và đ−ợc giải thích theo xác suất
là do sự biến đổi ngẫu nhiên vốn có của nó. cho ví dụ không thể dự báo l−u l−ợng và
l−ợng m−a một cách chính xác dựa vào các số liệu trong quá khứ hay t−ơng lai do
không biết nguyên nhân cơ chế hoạt động của chúng. Rất may là ph−ơng pháp thống kê
là rất phù hợp để cấu thành và biểu diễn chuỗi số liệu quan trắc thành một dạng mà có
thể nội suy và −ớc l−ợng. Ch−ơng này chỉ ra các ph−ơng pháp ngẫu nhiên mà trong
thuỷ văn các số liệu có thể đ−ợc xác định và biểu diễn trong một phuơng pháp thống kê
chuẩn.
163
Các biến cố ngẫu nhiên
Một biến cố ngẫu nhiên là một tham số (nh− l−u l−ợng, l−ợng m−a, quá trình l−u
l−ợng) nó có thể đ−ợc dự báo một cách chính xác đó là, một biến cố ngẫu nhiên là kết
quả của một quá trình ngẫu nhiên. Một số biến cố có thể đ−ợc xử lý bằng thống kê một
cách gián đoạn hay liên tục. Phần lớn các số liệu thuỷ văn là liên tục và đ−ợc phân tích
xác suất bằng phân bố xác suất liên tục. Cho ví dụ, giá trị l−u l−ợng trong biểu đồ hình
3.1a có thể bằng bất cứ một giá trị thực nào khi đo đạc bằng dụng cụ đo, đó là các số
liệu liên tục. Tuy nhiên chính bản thân các số liệu lại đ−ợc biểu diễn một cách gián
đoạn là do các quá trình đo đạc. Các số liệu dòng chảy hàng ngày có thể đ−ợc xác định
một cách xác thực nhất bằng l−u l−ợng n−ớc m3/s. Dạng biểu diễn này của số liệu đ−ợc
gọi là dạng gián đoạn - liên tục. Đó là các số liệu liên tục đ−ợc quy thành gián đoạn.
Điều này cũng đ−ợc minh hoạ trong hình 3.1(a), trong đó l−u l−ợng đ−ợc giả thiết dạng
m3/s gần nhất.
Các biến cố ngẫu nhiên gián đoạn có thể chỉ đ−ợc lấy trên một l−u vực nhất định
trong các giá trị rời rạc. Cho ví dụ, tung một đồng xu kết quả là mặt sấp hoặc ngửa sẽ
xuất hiện; tung một con súc sắc các giá trị xuất hiện từ 1 đến 6. Kết quả từ thùng đo
m−a là các giá trị thuỷ văn đơn giản nh− trong hình 3.1(b): nó có thể có hay không có
một đỉnh trong suốt khoảng thời gian.
Hình 3.1. Các số liệu liên tục và gián đoạn a) số liệu liên tục và gián đoạn b)số liệu gián đoạn. Kết
quả biểu đồ lấy từ thùng đo m−a. Mỗi một đơn vị độ cao là 0.01 inch l−ợng m−a.
164
Các số liệu gián đoạn - liên tục có thể đ−ợc xử lý bằng gián đoạn. Thật vậy chúng
đ−ợc gián đoạn hoá bất cứ lúc nào các bảng số liệu đ−ợc sắp xếp trình tự, do các gía trị
này còn đ−ợc cắt bớt. (Ví dụ nh− giá trị gần nhất của 1 ft3/s l−u l−ợng hay 0.1 inch
l−ợng m−a). Tuy nhiên, việc phân tích các yếu tố tần suất này là rất thuận tiện do số
liệu tính toán lớn mà ta có thể xem xét. Cho ví dụ, nếu l−u l−ợng dòng chảy đ−ợc đo đạc
gần đúng nhất (ft3/s) trong khoảng từ 0 đến 5000 ft3/s thì phải tính toán 5000 khoảng
gián đoạn. T−ơng ứng, các điểm liên tục sẽ dễ dàng hơn rất nhiều. Mặc dù các phân bố
tần suất rời rạc thỉnh thoảng đ−ợc áp dụng cho các giá tị liên tục (ví dụ độ lớn l−ợng
m−a của một trận m−a), các ứng dụng chủ yếu của phân bố rời rạc trong thuỷ văn là
một biến cố ngẫu nhiên mà ở dạng số để đáp ứng một số tiêu chuẩn nhất định, ví dụ giá
trị lũ đ−ợc mong đợi để v−ợt quá một độ lớn nhất định, trong thời kỳ nhiều năm.
biểu diễn số liệu
Số liệu gián đoạn - liên tục th−ờng đ−ợc biểu diễn d−ới dạng biểu đồ hình cột hay
một đ−ờng cong. Chiều cao và hình dạng chung của đ−ờng cong là phù hợp với các đặc
tr−ng số liệu và lựa chọn luật phân bố các số liệu một cách hợp lý, ví dụ có những phân
bố nên làm đối xứng hay có những phân bố nên chọn bất đối xứng. Sử dụng l−u l−ợng
dòng chảy, ví dụ, giá trị l−u l−ợng đ−ợc phân chia thành từng lớp một và t−ơng ứng với
nó là một tần suất xuất hiện của lớp đó. Độ lớn của mỗi lớp nên đủ nhỏ làm sao các
thành phần số liệu có thể thấy đ−ợc nh−ng cũng phải đủ lớn để cho các thành phần
không bị lẫn lộn. Giá trị đã sử dụng trong các lớp có thể thay đổi hình ảnh của số liệu
(Benjamin và Cornel, 1970). Giá trị này có thể không thuận tiện cho việc thay đổi nhiều
ch−ơng trình tính toán, vì vậy các kỹ s− có thể so sánh và đ−a ra một vài sự lựa chọn
khác nhau. Với sự trợ giúp của Panofsky và Brier, 1968 đã đ−a ra:
K = 5log10n (3.1)
ở đây K là số khoảng lớp và n là số giá trị. Khoảng lớp không phải là hằng số độ rộng.
Nếu không, thuận lợi cho việc nhóm các số liệu thành một nhóm lớn hơn, khoảng đ−ợc
kết hợp.
Nửa tung độ của đồ thị đ−ợc phân chia bởi toàn bộ số lần quan sát đ−ợc, tần suất
t−ơng ứng (xác suất ) của mỗi một khoảng lớp, nh− vậy tổng tung độ bằng 1.0 tạo nên
sự thay đổi ph−ơng pháp đánh dấu số liệu. Cho đến cách thứ ba là dạng của một phân
bố tần suất luỹ tích, nó cho biết toàn bộ đ−ờng cong phân bố tần suất t−ơng ứng trên
một khoảng nhất định và là xác suất mà một giá trị ở hoành độ là nhỏ hơn hoặc bằng
độ lớn ở mỗi điểm đó. Cả hai tần suất trên đều đ−ợc dùng nhiều trong thuỷ văn và đ−ợc
minh hoạ rõ nét nhất trong một số ví dụ .
Ví dụ 3.1
đồ thị tần suất
Số liệu lũ lớn nhất trong 31 năm đ−ợc ghi lại tại Cypress Creek, gần Horton,
Texas, đ−ợc trình bày trong bảng 3.1. Ph−ơng trình 3.1 cho biết rằng có khoảng t−ơng
ứng 7 hay 8 lớp. ở đây là nó cho phép giới hạn tiêu chuẩn là 2000ft3/s (tiêu chuẩn này
quan trọng hơn những quy tắc đếm tay khác đôí với số khoảng lớp).
Tần suất, tần suất t−ơng ứng, tần suất luỹ tích cũng đ−ợc xác định trong bảng và
165
biểu diễn trong hình 3.2 và 3.3. Ví dụ , trong hình 3.2 xác suất nằm trong khoảng 2000
và 4000 là 0.29. Từ đ−ờng cong xác suất luỹ tích (hình 3.3), xác suất mà l−u l−ợng nhỏ
hơn hoặc bằng 4000 ft3/s là 0.58. Chú ý rằng tổng của tần suất t−ơng ứng là 1.0 đ−ợc
chỉ ra trong bảng 3.1 và tổng tung độ đ−ợc biểu diễn trong hình 3.3.
Bảng 3.1 Bảng tính toán số liệu và tần suất ở Cypress Creek , gần Horton, Texas
Số liệu ch−a
sắp xếp
Số liệu đã
sắp xếp
Số liệu ch−a
sắp xếp
Số liệu đã
sắp xếp
Năm Q(m3/s) Stt Q(m3/s) Năm Q(m3/s) Stt Q(m3/s)
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
9840
5170
1620
235
15600
4740
427
3310
4400
7760
2520
340
5440
3000
3690
10300
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
15600
10300
9840
7760
6560
6260
5440
5230
5170
4740
4710
4400
4300
3980
3690
3460
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
6260
1360
1000
2770
1400
3210
1110
5230
4300
2820
1900
3980
6560
4710
3460
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
3310
3210
3000
2820
2770
2520
1900
1620
1400
1360
1110
1000
427
340
235
Khoảng lớp Giá trị trung bình Tần suất Tần suất t−ơng ứng Tần suất l/t
0 - 2000
2000 - 4000
4000 - 6000
6000 - 8000
8000 - 10000
10000 - 12000
12000 - 14000
14000 - 16000
1000
3000
5000
7000
9000
11000
13000
15000
9
9
7
3
1
1
0
1
0.29
0.29
0.23
0.10
0.03
0.00
0.03
0.03
0.29
0.58
0.81
0.91
0.94
0.97
0.97
1.00
31=∑
166
Một cách gián đoạn hoá các số liệu l−u l−ợng liên tục sẽ đ−ợc quy định là một biến
cố ngẫu nhiên rời rạc cho mỗi một khoảng lớp. Bất kỳ một giá trị nào nằm trong một
lớp sẽ đ−ợc quy định là giá trị rời rạc t−ơng ứng của các lớp đó, thông th−ờng điểm
trung bình hay điểm giữa của mỗi lớp. Trong tr−ờng hợp này điểm giữa sẽ đ−ợc điền
vào hoành độ (hình 3.4). Một giá trị tần suất t−ơng ứng là giá trị tần suất của l−u l−ợng
3000 ft3/s là 0.29 (giá trị t−ơng đ−ơng này đ−ợc lấy dựa vào những hiện t−ợng đã biết
mà một biến cố ngẫu nhiên liên tục có thể có, không cần xác định chính xác bằng giá trị
cụ thể).
Đ−ờng bất đối xứng l−u l−ợng ở Cypress Creek đ−ợc trình bày trong hình 3.2 và
3.4, đó là điểm cuối ở bên phải. Nó sẽ đ−ợc xác định và lấy t−ơng đ−ơng với sự thay đổi
phân bố trong nhiều tr−ờng hợp khác.
Hình 3.2. Biểu đồ tần suất t−ơng ứng cho vùng Cypress Creek, gần Horton, Texas.
Hình 3.3. Biểu đồ tần suất luỹ tích cho vùng Cypress Creek.
167
Hình 3.4. Biểu đồ tần suất rời rạc của vùng Cypress Creek.
Những tần suất này bằng với hàm khối l−ợng xác suất rời rạc (PMF).
3.2.
Các khái niệm xác suất
Tiến hành một thí nghiệm với N kết quả đạt đ−ợc, X1,X2,…Xi,…XN. Các kết quả
này là độc lập, nếu không hai trong số đó có thể xảy ra cùng một lúc. Nó là số lần xuất
hiện các mặt, chúng đặc tr−ng cho toàn bộ kết quả đạt đ−ợc khi tiến hành thí nghiệm.
Xác suất của một biến cố Xi có thể đ−ợc xác định bằng số lần xuất hiện biến cố t−ơng
ứng trong rất nhiều phép thử. Xác suất này có thể đ−ợc xác định bằng P(Xi) = ni/n, ở
đây ni là số lần xuất hiện (xác suất ) của biến cố Xi trong n phép thử. Tuy nhiên ni/n chỉ
là tần suất t−ơng ứng hoặc xác suất xảy ra của biến cố Xi.
Một xác suất rời rạc là một xác suất đơn giản của một biến cố rời rạc. Nếu nh−
một P(Xi) nhất định bằng với xác suất của biến cố ngẫu nhiên Xi, các điều kiện cho phép
tồn tại những xác suất rời rạc của những biến cố này khi xem xét các khoảng đơn giản
của toàn bộ kết quả đạt đ−ợc:
0 < P(Xi) < 1 (3.2)
. (3.3) ∑
=
=
N
i
XiP
1
1)(
Xác suất hợp của hai biến cố độc lập là tổng xác suất của mỗi xác suất biến cố
thành phần:
P(X1∪ X2) = P(X1) + P(X2) (3.4)
Hai biến cố X1 và Y1 đ−ợc gọi là độc lập, nếu việc xảy ra biến cố này không ảnh
168
h−ởng đến sự xuất hiện biến cố kia. Xác suất giao (cả hai cùng xảy ra đ−ợc ký hiệu ∩ )
của hai biến cố độc lập là tích của chúng:
P(X1∩ Y1) = P(X1). P(Y1). (3.5)
Đối với các biến cố phụ thuộc lẫn nhau:
P(X1∪ Y1) = P(X1) + P(Y1) - P(X1∩ Y1). (3.6)
Xác suất điều kiện của X1 khi biến cố Y1 đã xảy ra là:
P(X1/Y1) = P(X1∩ Y1)/ P(Y1) . (3.7)
Nếu biến cố X1 và Y1là độc lập thì kết hợp 2 ph−ơng trình 3.5 và 3.7 trở thành:
P(X1/Y1) = P(X1).P(Y1)/P(Y1) =P(X1). (3.8)
Những khái niệm này th−ờng đ−ợc minh hoạ trong biểu đồ Venn (Hình 3.5) trên
đó diện tích là xác suất, với tổng diện tích t−ong ứng thì xác suất bằng 1.0, hay 100%.
Hình 3.5. Biểu đồ Venn minh hoạ xác suất
Ví dụ 3.2
Các xác suất có điều kiện
Lấy biến cố Y1 là điều kiện mà l−ợng m−a xảy ra trong một ngày nhất định và
biến cố X1 là điều kiện mà chớp quan sát đựơc trong một ngày nhất định. Cho xác suất
của những biến cố này:
P(X1) = 0.3 (xác suất chớp là 30%)
P(Y1) = 0.1 (xác suất m−a là 10% )
P(X1/Y1) = 0.5 (nếu có chớp xuất hiện thì m−a là 50% )
Tính xác suất cả m−a và chớp cùng xảy ra (là xác suất ∩ của X1 và Y1)?
Từ ph−ơng trình 3.7:
P(X1∩ Y1) = P(Y1/X1).P(X1) = 0.15.
Nếu là độc lập với P(Y1/X1) = P(Y1) = 0.03.
Xác suất của các biến cố độc lập cùng xảy ra luôn luôn nếu chúng là phụ thuộc.
169
3.3.
Các biến cố ngẫu nhiên và các luật phân bố xác suất
Các biến cố ngẫu nhiên và biến cố rời rạc
Tính chất của các biến cố ngẫu nhiên có thể đựơc miêu tả bởi quy luật phân bố
xác suất của nó. Mỗi một kết quả đạt đ−ợc trong một phép thử đựoc quy định là số giá
trị phụ thuộc vào hàm khối l−ợng xác suất rời rạc (PMF) hay hàm mật độ xác suất liên
tục (PDF). Trong thuỷ văn, các biến cố ngẫu nhiên rời rạc đ−ợc sử dụng rất rộng rãi để
biểu diễn số tr−ờng hợp xảy ra mà phù hợp vơí một tiêu chuẩn nhất định. Ví dụ, giá trị
lũ v−ợt quá giá trị cụ thể cho tr−ớc, l−ợng m−a xảy ra tại một nơi nhất định, … Các ví
dụ trong ch−ơng này đều thuộc loại này. Nh− một quy tắc, các biến cố ngẫu nhiên rời
rạc đ−ợc liên kết chỉ với các tham số mà có thể chỉ là các số nguyên. Tuy nhiên có thể
nhóm các biến cố ngẫu nhiên liên tục thành các số nguyên gần đúng nhất hay các giá
trị nguyên bỏ dấu phẩy. Cho ví dụ, l−ợng m−a 2.18 inch thay là l−ợng m−a 218 inch.
Đôi khi biến đổi để xử lý một biến cố liên tục thành dạng rời rạc, nh− l−u l−ợng
rời rạc trong hình 3.4. Hãy chú ý P(x1) có nghĩa là xác suất mà biến cố ngẫu nhiên rời
rạc X lấy từ giá trị x1. Biểu diễn lại l−u l−ợng x "rời rạc ", chúng ta có thể lấy xác suất
t−ơng ứng trong hình 3.4:
P(1000) = 0.29, P(9000) = 0.03
P(3000) = 0.29, P(11000) = 0.03
P(5000) = 0.23, P(13000) = 0.0
P(7000) = 0.10, P(15000) = 0.03
∑
≤≤
=≤≤
bxa
xPbxaP )()( (3.9)
Chú ý rằng các giá trị này phù hợp với xác suất tuyệt đối của ph−ơng trình 3.2 và
3.3. Hơn nữa các xác suất là rời rạc.
Hàm phân bố luỹ tích (CDF) đ−ợc xác định là:
Từ các giá trị trong bảng trên, F(7000) = 29+29 + 23 +10 =91%.
∑
≤
=≤=
XXi
XiPxXPxF )()()( (3.10)
Các biến cố ngẫu nhiên liên tục th−ờng đ−ợc sử dụng để biểu diễn các yếu tố
thuỷ văn nh− l−u l−ợng, thể tích, độ sâu, và thời gian. Các giá trị này không phải
chuyển về dạng nguyên, mặc dù các biến cố liên tục có thể nhóm thành dạng nguyên.
Cho một biến cố ngẫu nhiên liên tục, phần diện tích d−ới hàm mật độ phân bố xác suất
f(x) nh− sau (xem hình 3.6):
P(x1< x < x2) = (3.11) ∫ 21 )(xx dxxf
và phần diện tích d−ới PDF bằng 1.0:
(3.12) ∫ ∞∞− = 0.1)( dxxf
170
Bản thân CDF không phải là một xác suất và có thứ nguyên nghịch đảo với thứ
nguyên của X, ví dụ nh− ft3/s-1 . Tuy nhiên, không giống với các nhà tính toán, nó
không tuân theo các đơn vị th−ờng dùng của PDF. Trong thực tế, các giá trị của PDF
rất ít khi dùng đến. Mặt khác nó là hàm mật độ luỹ tích (CDF) và rất quan trọng vì nó
là xác suất CDF, liên tục đ−ợc xác định giống với các thành phần rời rạc của nó:
Hình 3.6 .Hàm mật độ xác suất liên tục
∫ )1(xF ∞−=≤≤−∞= 1 )()1( X dxxfxxP (3.13)
giá trị nằm trong khoảng: các
0.1)(0 ≤≤ Xf
(3.14)
và
)1()()( xlFxFxxxP 221 −=≤≤ (3.15)
DF và CDF đ−ợc lấy t−ơng ứng với ph−ơng trình (3.13) nghịch đảo :
P
)()( xf
dx
xdF = .
Biểu đồ trong hình 3.2 có thể đ−ợc biểu diễn bằng PDF liên tục nếu các tần suất
t−ơng ứng đ−ợc tạo ra từ các khoảng lớp nhỏ hơn x. Phần diện tích d−ới biểu đồ là 1.0.
Cho ví dụ , nếu tung độ của biểu đồ tần suất t−ơng ứng trong hình 3.2 có khoảng chia là
2000 ft3/s, t−ơng ứng với một PDF. Nó minh hoạ cho những PDF có thể có hình dạng cố
định và dạng giá trị đơn, chúng không cần giống hình dạng đ−òng cong trơn. Biểu đồ
này có phân bố hỗn hợp, trong đó các xác suất rời rạc biểu diễn xác suất mà một biến cố
lấy một giá trị rời rạc cụ thể, trong khi một PDF liên tục cho biết đỉnh của các giá trị
với m
khó khăn bởi vì ng−ời
ta th−ờng bắt ch−ớc hình dạng của biểu đồ tần suất (hình 3.2) các PDF phần lớn sử
ột diện tích bằng 1,0 ngoại trừ các hàm xác suất rời rạc. Để ví dụ, một phân bố
hỗn hợp đựoc biểu diễn trong hình 3.7 trong đó xác suất là 0.15 tại l−u l−ợng bằng 0.0.
Chọn một phân bố liên tục PDF để biểu diễn các số liệu là
171
dụng các biến cố thuỷ văn sẽ đựoc trình bày trong phần sau đây.
Hình 3.7. c (PMF)
cho F)
(độ lớn diện tích = 0.85) đối với xác suất có giá trị lớn hơn 0.
Các
ham số phân bố. Chính bản thân
các m
Cho một phân bố rời rạc, moment gốc bậc N có hể đ−ợc xác định nh− sau.
xPxà (3.17)
Và đối với các phân bố liên tục nh− sau:
N
rị trung vị, trung bình hay giá trị kỳ vọng, đ−ợc tính
ằng E() đối với kỳ vọng nh− sau:
(3.19)
à
là một tham số vị trí vì
nó ch
Luật phân bố tần suất rời rạc. Sử dụng các hàm phân bố xác suất rời rạ
xác suất có giá trị = 0 và các hàm mật độ xác suất liên tục (PD
moment của một phân bố
Khái niệm moment là một thuật ngữ cơ học. Một PMF hoặc PDF là một dạng
hàm trong đó các moment có quan hệ với các tham số của nó. Tuy nhiên, nếu các
moment có thể tìm đ−ợc thì cũng có thể tìm thấy các t
oment cũng cho biết hình dạng của các phân bố.
t
∑= )(' iNiN
∫ ∞−= dxxfxN )('à (3.18)
Moment gốc bậc một là giá t
∞
b
rạc) rời PMF (cho ∑∞
∞−
=≡ )()( ii xpxxE à
v
)tục nliê PDF (cho ∫ ∞−=≡ )()( ii xfxxE à (3.20)
Trung vị là một giá trị đ−ợc lấy ở giữa hay cũng đựoc gọi
∞
o biết vị trí trục quay x số lớn của phân bố đ−ợc thiết lập.
Thông th−ờng luật phân bố của một biến cố sẽ đ−ợc tìm và thông tin về các biến
cố quan hệ sẽ đ−ợc cung cấp. Để ví dụ, phân bố của l−u l−ợng dòng chảy có thể đ−ợc
biết và cho biết thông tin về trạm đó, đó là một hàm của l−u l−ợng. Giá trị kỳ vọng của
172
h guyên àm g(x) đối với biến cố ngẫu nhiên x có thể đ−ợc xác định theo công thức căn n
của x.
ii xfxg (3.21)
khi x là biến cố ngẫu nhiên rời rạc, và
= dxxfxgx )()()] (3.22)
hi x là biến cố ngẫu nhiên liên tục.
ỳ vọng là một hàm tuyến tính, nếu
E(a) = a (3.23)
và
.25)
Các moment gốc bậc cao hơn của luật phân bố th
tế, các moment trung tâm của giá trị trung bình đ−ợc xác định theo PMF rời rạc là:
(3.26)
và đối với PDF liên tục:
iá trị
rung bình của x đ−ợc đ−a lên mũ N, trong đó moment trung
trung tâm bậc hai đ−ợc gọi là ph−ong sai và đóng vai trò rất qu
dxxfxxE i )()(])[(
22 àà (3.28)
cho các biến cố ngẫu nhiên liên tục
bình bậc hai, nó biểu diễn độ lớn hay
hoảng rộng của phân b − ộ h uẩn
∑∞
∞−
= )()()) (( xgE
∫ ∞−∞ gE ([
k
K a, b là hằng số.
E(bx) = bE(x) (3.24)
E(a + bx) = a + bE(x) (3
−òng không sử dụng. Trong thực
)()( i
N
iN xpx àà −= ∑∞
∞−
∫∞∞− −= dxxfx N )()( ààN (3.27)
Những moment này th−ờng là các giá trị kỳ vọng của khoảng lệch khỏi g
t tâm bậc nhất bằng 0.
Moment an trọng.
∑∞
∞−
−=− =≡xVar )( 2σ
∫∞∞− −=−=≡ dxxfxxExVar )()(])[()( 222 ààσ (3.29)
Ph−ơng sai là độ lệch khỏi giá trị trung
σ ,k ố . Một đơn vị t ơng đ−ơng là đ lệc ch nó đơn giản là
ai bậc hai. Từ công thứ : ph−ơng s c của kỳ vọng
Var(x) = E[(x - à ) ] = E[x - 2xà à 22 2 + ]
= E[x2] - E[2à à 2x]+E[ ]
= E[x2] - 2à à à 2 +à 22 E[x]+ = E[x ]2 - 2 ]
à=E[x ]- 2 2
E[x =
Ph−ơng sai không phải là mộ
Var(bx) = b2Var(x) (3.32)
2]-[E(x)]2 (3.30)
t biến đổi tuyến tính. Ta có các quan hệ sau:
Var(a) = 0 (3.31)
Var(a+bx) = b2Var(x) (3.33)
ở đây a,b là các hằng số
173
Các moment bậc cao hơn có thể đ−ợc xác
trong thuỷ văn là bất đối xứng, nó là moment trung tâm bậc 3 và đ−ợc đơn giản hoá
bằng
định nếu cần thiết, nh−ng th−ờng dùng
độ lệch trung bình mũ 3.
3
à≡g
3σ
Độ lệch phải hay lệch trái giá trị trung bình là tham số hình dạng và đ−ợc biểu
diễn tong hình 3.8. Nếu nh− phân bố là đối xứn
(3.34)
g thì hệ số bất đối xứng bằng 0.
Đôi khi nó đ−ợc sử dụng để làm đơn giản h
số ph−ơng sai đ−ợc xác định theo tỷ lệ độ lệch khỏi giá trị trung bình, hay nó có thể
đ−ợc sử dụng cho mục đích tính CV.
oá việc tính toán mức độ phân bố. Hệ
àσ /=CV (3.35)
Hình 3.8. ảnh h−ởng của hệ số bất đối xứng đối với hàm mật độ xác suất (PDF)
ị, và đỉnh (của Haan 1977, Hình 3.3)
ông của phân bố. Giá trị này
của x
ân bố sẽ đ−ợc xác định cho mỗi một phân bố khi
xem xét. Các mối quan hệ cho biết một ph−ơng pháp đơn giản của việc xác định các
ã biết. Với mục đích đó việc xác định các
mome
và các vị trí t−ơng ứng của giá trị số đông, trung v
Một giá trị tính tại gi−ã đ−ờng cong là trung vị xm, nó không phải là moment
nh−ng đúng hơn giá trị của x mà CDF bằng 0.5:
F(xm) = 0.5 (3.36)
Các tham số khác không phải là moment nh− số đ
ở PDF (hoặc PMF) là một điểm cực đại. Các quan hệ giữa giá trị trung bình,
trung vị và số đông cũng đ−ợc minh hoạ trong hình 3.8. Các phân bố chủ yếu là một
ph−ơng thức (phân bố hỗn hợp của hình 3.7 là nhị thức).
Các moment và các tham số đ−ợc trình bày trong phần này để xem xét quy luật
phân bố xác suất và có thể lấy để phân tích. Các dạng hàm nh− PMF hay PDF có thể
đ−ợc thay thành dạng tổng hay dạng tích phân và các moment đã xác định từ các thành
phần của các tham số trong phân bố. Nó không đ−ợc minh hoạ ở đây do mối quan hệ
giữa các moment và các tham số ph
tham số phân bố nếu nh− các moment đ
nt phải đ−ợc lấy từ các số liệu.
Ước l−ợng moment từ các số liệu
Cho các gía trị tham số của phân bố, nó là một chuỗi x1, x2,…, xn của các biến
ngẫu nhiên phụ thuộc vào việc cho PMF hay PDF. Các chuỗi có độ dài xác định sẽ xây
dựng một cách phổ biến toàn bộ các biến cố ngẫu nhiên dựa vào PDF hay PMF đã cho
với các tham số nhấ