1. Phân biệt khái niệm xác suất và tần suất
2. Khái niệm về đại lượng ngẫu nhiên, mẫu, tổng thể, nguyên tắc chọn
mẫu
3. Khái niệm phân bố tần suất đại lượng ngẫu nhiên rời rạc, mật độ tần
suất (liên tục), đường tần suất kinh nghiệm, lý luận, các hàm phân bố
PIII và K-M
4. Các công thức tính tần suất kinh nghiệm.
5. Các tham số thống kê và ảnh hưởng của tham số thống kê đến đường
tần suất, ứng dụng.
6. Các phương pháp vẽ đường tần suất
7. Khái niệm về tương quan thống kê, đường hồi quy , cách xác định, hệ số
tương quan
68 trang |
Chia sẻ: lylyngoc | Lượt xem: 5279 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương 3: Thống kê xác suất ứng dụng
trong tính toán thủy văn
THUỶ VĂN CÔNG TRÌNH
Khoa Thuỷ văn – Tài nguyên nước
Bộ môn Thuỷ văn – Tài nguyên nước
1
3.1 Khái niệm về xác suất và tần suất
1. Các khái niệm cơ bản
Phép thử: Thực hiện một thử nghiệm và quan sát kết quả thực
hiện đối với một hiện tượng ngẫu nhiên nào đó trong cùng
một điều kiện nhất định.
Kết quả của một phép thử ngẫu nhiên gọi là biến cố ngẫu
nhiên, hoặc nói ngắn gọn là biến cố / biến cố cơ bản. Tập hợp
các biến cố có thể xẩy ra trong một phép thử gọi là không gian
biến cô ́.
2
3.1 Khái niệm về xác suất và tần suất
Phân loại biến cố
Biến cố chắc chắn: là biến cố nhất định phải xuất hiện trong
một phép thử.
Biến cố không thể có: là biến cố không thể xuất hiện trong
một phép thử.
Biến cố độc lập: là biến cố mà sự xuất hiện của nó không phụ
thuộc vào sự xuất hiện của các biến cố khác
Biến cố phụ thuộc: là biến cố mà sự xuất hiện của nó phụ
thuộc vào sự xuất hiện của biến cố khác
3
3.1 Khái niệm về xác suất và tần suất
Phân loại biến cố
Biến cố tổng: biến cố C được gọi là biến cố tổng của hai biến cố A
và B nếu hoặc A xuất hiện, hoặc B xuất hiện, hoặc cả A và B cùng
xuất hiện đều dẫn đến sự xuất hiện của C.
Biến cố tích: Biến cố C được gọi là biến cố tích của hai biến cố A
và B khi va ̀ chỉ khi ca ̉ 2 biến cố A và B đồng thời xuất hiện tạo nên.
4
A
B
A
B
C=A+B
C=A.B
3.1 Khái niệm về xác suất và tần suất
Xác suất
Định nghĩa cổ điển: Xác suất xuất hiện của một biến cố
A nào đó bằng tỷ số giữa số biến cố cơ bản thuận lợi
cho A xuất hiện trên tổng các biến cố cơ bản của không
gian biến cố.
Công thức tính xác suất của biến cố A theo định nghĩa cô ̉
điển:
n là tổng số các biến cố cơ bản của không gian biến cố đang xét;
m là số biến cố cơ bản thuận lợi cho biến cố A xuất hiện.
5
n
m
AP )(
3.1 Khái niệm về xác suất và tần suất
Định nghĩa theo thống kê: Xác suất xuất hiện của một
biến cố A nào đó là tần số xuất hiện của biến cố đó khi
số lần thực hiện phép thử tăng lên vô hạn.
Công thức tính xác suất theo định nghĩa thông kê:
n là số lần thực hiện phép thử
m là số lần xuất hiện biến cố A
6
n
m
AP
n
lim)(
3.2 Đại lượng ngẫu nhiên và luật phân bố
xác suất của đại lượng ngẫu nhiên
1. Khái niệm đại lượng ngẫu nhiên
Đại lượng ngẫu nhiên (ĐLNN) là một đại lượng mà trong một phép thử
nó nhận một giá trị có thể trong tập giá trị hay trong một khoảng trên trục
số với xác suất tương ứng của nó.
Ký hiệu X = {x1, x2, x3, …, xn}
Phân loại:
o Đại lượng ngẫu nhiên rời rạc: Nếu nó nhận một số giá trị hữu hạn trong
khoảng xác định của nó.
o Đại lượng ngẫu nhiên liên tục: Nếu nó nhận bất kỳ giá trị trong khoảng
xác định của nó
7
2. Luật phân bố xác suất của ĐLNN và Hàm phân bố xác suất
8
Giá trị có thể của ĐLNN X1 X2 X3 X… Xn
Xác suất (P) P1 P2 P3 P… Pn
x
xxXxP
xf
x
lim
0
)(
2. Luật phân bố xác suất của ĐLNN và Hàm phân bố xác suất
9
x
dxxf )(
Ví dụ:
10
Hàm mật độ xác suất chuẩn có dạng:
2
)(
2
2
exp
2
1
)(
x
xf
mx
x
3. Tính chất và đồ thị của hàm PPXS
11
PPXS dạng F(x) = P(X≤ x) PPXS dạng F(x) = P(X ≥ x)
1. Giá trị F(x) ≥0 nhận giá trị trong
khoảng [0,1]
- F(-∞) = P(x≤-∞) = 0;
F(+∞) = P(x≤+∞) = 1
- Với (-∞ ≤ x ≤ +∞) ta có (0 ≤ F(x) ≤ 1)
1. Giá trị F(x) ≥0 nhận giá trị trong
khoảng [0,1]
- F(-∞) = P(x≥-∞) = 1;
F(+∞) = P(x≥+∞) = 0
- Với (-∞ ≤ x ≤ +∞) ta có (0 ≤ F(x) ≤ 1)
2. F(x) là hàm đồng biến không giảm
trên toàn trục số x2≥ x1 thì F(x2) ≥ F(
x1). Đồ thị luân đi lên
2. F(x) là hàm nghịch biến không tăng
trên toàn trục số x2≥ x1 thì F(x2) ≤ F(
x1). Đồ thị luân đi xuống
3. F(x) = P(X≤ x) liên tục trái tại mỗi
điểm xo bất kỳ trên trục số
lim F(x) = F(xo)
3. F(x) = P(X≤ x) liên tục trái tại mỗi
điểm xo bất kỳ trên trục số
lim F(x) = F(xo)
oo
xx
oo
xx
4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN)
12
1: Kỳ vọng toán của ĐNN là mô men gốc bậc nhất của hàm
mật độ xác suất ký hiệu mx = M[X] biểu thị mức độ tập trung
của ĐLNN
- Với ĐLNN liên tục mx =
- Với ĐLNN rời rạc mx
nếu xác suất p(xi) phân bố đều thì p(xi) = và kỳ vọng
toán sẽ là:
x
dxxfx )(.
n
i
ii
xpx
1
)(
n
1
4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN)
13
3. Hệ số thiên lệch
Đồ thị hàm mật độ có thể đối xứng(như phân bố chuẩn)
hoặc không đối xứng quanh trục tung có gốc là kỳ vọng
tính đối xứng được đánh giá momen bậc ba:
+ Đối với ĐLNN liên tục
+Đối với ĐLNN rời rạc
Hệ số thiên lệch ký hiệu Cs
dxxfmx
x
)()(
3
3
)()(
3
1
3 ix
n
i
i
xpmx
3
3
x
s
C
4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN)
14
2. Phương sai và khoảng lệch quân phương biểu thị mức độ phân tán của
ĐLNN
- Phương sai ký hiệu Dx =M[ (x – mx)
2 ] là kỳ vọng của kỳ vọng toán.
+ Đối với ĐLNN liên tục
+ Đối với ĐLNN rời rạc
- Khoảng lệch quân phương
- Hệ số phân tán: là đặc trưng không thứ nguyên biểu thị độ phân tán của
ĐLNN so với kỳ vọng ký hiệu Cv
dxxfmx
xxD )()(
2
)()(
2
1
ic
n
i
ix
xpmxD
xx
D
x
x
v
m
C
4. Các đặc trưng biểu thị của đại lựơng ngẫu nhiên (ĐLNN)
15
3. Hệ số thiên lệch
Đồ thị hàm mật độ có thể đối xứng(như phân bố chuẩn)
hoặc không đối xứng quanh trục tung có gốc là kỳ vọng
tính đối xứng được đánh giá momen bậc ba:
+ Đối với ĐLNN liên tục
+Đối với ĐLNN rời rạc
Hệ số thiên lệch ký hiệu Cs
3.3 Khái niệm về mẫu và tổng thể,
phương pháp chọn mẫu
Tổng thể Số lượng các giá trị có thể mà ĐLNN có
thể nhận được là lớn vô cùng. Tập hợp tất cả các
giá trị mà ĐLNN X có thể nhận được gọi là tổng
thể. Ký hiệu: N
Mẫu Trong nghiên cứu không thể nào NC hết tất
cả các giá trị của tổng thể mà chỉ NC trên một tập
giá trị với số lượng rất nhỏ. Tập hợp hữu hạn các
số liệu thu thập được của tổng thể gọi là mẫu.
Ký hiệu: n
16
3.3 Khái niệm về mẫu và tổng thể,
phương pháp chọn mẫu
Các yêu cầu của mẫu trong thống kê:
o Tính đại biểu: mẫu được chọn có những tính chất của
tổng thể. Muốn vậy, dung lượng mẫu phải đủ lớn đảm
bảo sai số lấy mẫu; mẫu phải bao gồm các giá trị số đặc
trưng lớn, nhỏ và trung bình
o Tính độc lập: các số liệu của mẫu không phụ thuộc lẫn
nhau
o Tính đồng nhất: cùng loại, cùng nguyên nhân hình
thành hoặc cùng điều kiện xuất hiện
17
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
Khái niệm
Trong thống kê toán thường chỉ thu được hữu hạn các gía
trị của ĐLNN (mẫu có dung lượng n) tức là thu được các
giá trị rời rạc từ tổng thể mặc dù ĐLNN có thể là liên tục.
Do vậy có thể dùng các công thức định nghĩa của ĐLNN
rời rạc để tính toán. Các hiện tượng thủy văn là ĐLNN liên
tục, các giá trị thu được rời rạc vì vậy trong thủy văn qui
ước cách gọi riêng: Xác suất gọi là Tần suất và theo đó có
Hàm mật độ xác suất-Hàm mật độ tần suất; Hàm PPXS-
Hàm tần suất tích lũy
18
19
Hàm phân bố xác suất của đại lượng ngẫu nhiên
dùng trong Thủy văn
Hàm phân bố xác suất F(x) là xác suất để cho
đại lượng ngẫu nhiên X nhận các giá trị lớn hơn
hoặc bằng một giá trị x, trong đó x là biến số nhận
các giá trị có thể trên miền xác định của nó.
F(x) = P(X x)
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
20
0
1
F
(x
)
x
Đồ thị hàm tan suat tich luy
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
21
Tính chất hàm phân bố xác suất:
Luôn dương và nhận giá trị trong khoảng [0,1]
F(-)=1
F()=0
Là hàm nghịch biến và không tăng trên toàn trục số
x2x1 thì F(x2)F(x1)
Liên tục bên phải tại mỗi điểm x0
0
0
lim
0
xFxF
xx
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
22
Công thức:
Tính chất:
1.
2. Hàm f(x) luôn dương và biến đổi từ 0 đến 1
3.
dxxfxF
x
x
xxXxP
xf
x
lim
0
)(
1
dxxf
Hàm mật độ xác suất
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
23
x
f(x)
Đồ thị hàm mật độ xác suất dạng quả chuông
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
Đặc điểm của đồ thị hàm mật độ xác suất
Hoàn toàn nằm trên trục hoành
Hình dạng đồ thị hàm mật độ tần suất có dạng hình quả
chuông
Hàm mật độ xác suất nhận trục 0x làm tiệm cận ngang
Có một giá trị cực đại
24
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
Hàm tần suất luỹ tích/Hàm phân bố xác suất
Trong thống kê toán học, thường chỉ thu được mẫu có
dung lượng n (rời rạc).
Mẫu n đó được coi là đại lượng ngẫu nhiên rời rạc.
F(xi) = P(X xi)
Được gọi là hàm tần suất luỹ tích.
Đồ thị của nó thường được gọi là “đường tần suất”
25
3.4 Hàm tần suất luỹ tích và hàm mật độ
tần suất
26
Là xác suất để cho đại lượng ngẫu nhiên X nhận các
giá trị nằm trong khoảng từ x đến x-∆x
Công thức: p(xi) = P(xi) - P(xi - x)
(Giống như hàm mật độ xác suất).
Hàm mật độ tần suất/Hàm mật độ xác suất
3.4 Hàm tần suất luỹ tích và hàm mật độ tần
suất
27 xi-1 xi x xi x
1 1
F(x) P
f(x)
p(xi)
F(xi)
MẪU
(Vẽ theo số liệu của mẫu)
TỔNG THỂ
Hàm mật độ xác suất Hàm mật độ tần suất
Hàm phân phối xác suất
Hàm tần suất luỹ tích
Sự khác nhau giữa
tần suất và xác suất?
28
3.5 Ước lượng các tham số thống kê
29
1. Tham số biểu thị xu thế tập trung
- Số đông (Xđ): là trị số có xác suất xuất hiện lớn
nhất(tương ứng với giá trị cực đại của hàm mật độ tần suất).
-Trị số trung bình: là ước lượng không chệch của kỳ
vọng toán của đại lượng ngẫu nhiên(n là dung lượng mẫu)
hoặc
n
i
ii
xpxx
1
)(
n
i
i
x
n
x
1
1
3.5 Ước lượng các tham số thống kê
30
2. Tham số biểu thị xu hướng phân tán
- Khoảng lệch quân phươngx:
- Hệ số phân tán Cv:
n
i
ix
xx
n 1
2
)(
1
1
x
x
kk
nx
C
i
i
n
i
x
v
;)1(
1
1
1
2
3.5 Ước lượng các tham số thống kê
31
3. Tham số biểu thị tính đối xứng:
Hệ số thiên lệch Cs
x
x
k
Cn
k
Cxn
xx
C
i
i
v
n
i
v
n
i
s
;
)3(
)1(
))(3(
)(
3
1
3
3
1
3
3.5 Ước lượng các tham số thống kê
32
Đường quá trình mưa năm trạm A
0
500
1000
1500
2000
2500
1970 1975 1980 1985 1990 1995 2000 2005
Mưa năm
Trung bình 1970 - 2002
Trung bình 1985 - 1991
X0 của trạm A???
3.5 Ước lượng các tham số thống kê
33
Đối với trị số bình quân
Đối với hệ số phân tán
Đối với hệ số thiên lệch
n
x
x
n
C
v
x
100
%
Sai số tuyệt đối Sai số tương đối
2
1
2
v
v
Cv
C
n
C
%1
2
100
%
2
vCv
C
n
42 561
6
vvCs
CC
n
42 561
6100
%
vv
s
Cs
CC
nC
3.6 Tần suất kinh nghiệm và đường TSKN
34
Khái niệm: Tần xuất kinh nghiệm là xác suất để cho đại
lượng ngẫu nhiên X nhận giá trị lớn hơn hoặc bằng x
được ước lượng từ mẫu (chuỗi số liệu thực đo).
n
m
xXP
i
)(
3.6 Tần suất kinh nghiệm và đường TSKN
35
Các công thức kinh nghiệm tính tần xuất thường dùng
trong thuỷ văn:
Dạng tổng quát:
Công thức Hazen (a=0,5):
Công thức Chegôđaép (a=0,3):
Công thức Weibull (a=0):
an
am
xXP
i
21
)(
%100
5,0
)(
n
m
xXP
i
%100
4,0
3,0
)(
n
m
xXP
i
%100
1
)(
n
m
xXP
i
3.6 Tần suất kinh nghiệm và đường TSKN
36
Đường tần suất là đường quan hệ giữa tần suất luỹ tích và giá trị
của biến ngẫu nhiên
- Đường tần suất kinh nghiệm: là băng điểm điểm biểu diễn tần suất
xuất hiện của đại lượng ngẫu nhiên nhận giá trị X ≥ xi , Tần xuất được
tính theo các công thức kinh nghiệm
- Đường tần suất lý luận:Đường cong trơn phù hợp với đường tần
xuất kinh nghiệm gọi là đường tần suất lý luận. Đường tần suất lý
luận là đồ thị hàm phân phối xác suất.
3.6 Tần suất kinh nghiệm và đường TSKN
37
Cách vẽ đường tần suất kinh nghiệm:
1. Sắp xếp chuỗi số liệu từ lớn đến nhỏ (đánh số thứ tự)
2. Tính tần suất theo 1 trong 3 công thức kinh nghiệm với
m là số thứ tự, n là số số liệu thống kê.
3. Chấm các điểm P ~ xi (điểm kinh nghiệm)
3.6 Tần suất kinh nghiệm và đường TSKN
38
Cách vẽ đường tần suất kinh nghiệm:
Thứ tự Q (m3/s) P = m/(n+1) (%)
1 2160 3,23
2 2100 6,45
3 1920 9,68
… … …
30 1260 96,77
3.6 Tần suất kinh nghiệm và đường TSKN
39
Cách vẽ đường tần suất kinh nghiệm:
1000
1200
1400
1600
1800
2000
2200
2400
0 10 20 30 40 50 60 70 80 90 100
P (%)
Q
(
m
3
/s
)
3.6 Tần suất kinh nghiệm và đường TSKN
40
Giấy tần suất (Giấy Hazen):
FFC 2008 © Nghiem Tien Lam
90
140
190
240
290
340
390
440
490
540
590
640
690
0.01 0.1 1 10 20 30 40 50 60 70 80 90 99 99.9 99.99
ĐƯỜNG TẦN SUẤT DÒNG CHẢY NĂM - TRẠM BẢN ĐÔN
L
ư
u
l
ư
ợ
n
g
,
Q
(m
³/
s
)
Tần suất, P(%)
Số liệu Qnăm trạm Bản Đôn
TB=265.89, Cv=0.27, Cs=0.72
TB=265.89, Cv=0.27, Cs=0.72
© FFC 2008
3.7 Đường Tần suất lý luận
41
Đường tần suất kinh nghiệm chỉ phản ánh được quy luật
phân bố xác suất của hiện tượng thuỷ văn trong phạm vi
các giá trị thực nghiệm.
Đường tần suất lý luận là đồ thị một hàm phân bố xác
suất toán học mô tả phân bố xác suất của đại lượng ngẫu
nhiên nhằm ngoại suy các giá trị nằm ngoài các giá trị
thực nghiệm.
3.7 Đường Tần suất lý luận
42
Luật phân bố xác suất Pearson III
Hàm mật độ có dạng:
y0
xđ x
a d
y
Trong đó
• y0: là giá trị lớn nhất của hàm tương ứng với số đông xđ
; ;
Giá trị hàm có bảng tra sẵn
d
x
d
a
e
a
x
yy
1
0
v
s
C
C
e
y
2
)(
)1(
0
2
4
s
C
)(
43
• d: bán kính lệch (khoảng cách giữa trị số bình quân và
số đông)
• a: khoảng cách từ vị trí số đông đến giá trị nhỏ nhất
•Đồ thị của hàm phân phối Pearson III được gọi là đường
tần suất lý luận Pearson III (P-III)
x
CC
d
sv
2
.
dx
C
C
a
s
v
2
3.7 Đường Tần suất lý luận
44
Luật phân bố xác suất Pearson III
Đặc điểm:
• Một đầu bị chặn tại x0, một đầu nhận trục hoành làm tiệm cận, có
1 số đông. x0 là giá trị nhỏ nhất:
• Có 3 đặc trưng là tham số xtb, Cv, Cs.
• Phân phối lệch phụ thuộc vào bán kính lệch d
•d>0: lệch dương (đỉnh của hàm mật độ nằm bên trái trị số
bình quân)
•d<0: lệch âm (đỉnh của hàm mật độ nằm bên phải trị số
bình quân)
•d=0: đỉnh của hàm mật độ trùng với vị trí số bình quân
• Điều kiện ứng dụng:
0
k-1
2Cv
Cs2Cv
x
x
k
0
0
x
C
C
xx
s
v
2
0
3.7 Đường Tần suất lý luận
45
Hàm phân bố xác suất Pearson III
Hàm PPXS Pearson III F(X≥ x) được xác định bằng cách lấy tích
phân hàm mật độ. Việc tích phân trực tiếp hàm mật độ rất khó .
Trong thực hành tiến hành lập bảng tính (Xp ῀ P) theo công thức
Với p tra bảng Fôxtơ – Rưpkin (phụ lục 1) phụ thuộc Cs và P.
xCx
vpp
).1.(
3.7 Đường Tần suất lý luận
46
Cs = 0,3; P = 1%
1% = 2,54
Bảng Fôxtơ – Rưpkin
Lưu ý: Khi Cs0)
3.7 Đường Tần suất lý luận
Bảng tính đường tần suất lý luận
47
P(%) 0.0
1
0.1 1 5 .. 50 .. 75 80 90 99 99.9
(Cs,P)
Kp=.Cv+1
xp=Kp.x
3.7 Đường Tần suất lý luận
48
Luật phân bố xác suất Kritxki - Menken
Điều kiện xây dựng:
1. Dùng 3 tham số giống như P-III
2. Chỉ có 1 số đông
3. Giá trị của đại lượng ngẫu nhiên có thể thay đổi từ 0 ≤ x ≤+
Lấy dạng hàm P-III với Cs = 2Cv làm cơ sở, xây dựng hàm mật độ
Với a, b: hằng số
b
a
x
ex
b
xf b
b
1
1
)(
)(
2
2
x Cv
1x
σ
α
3.7 Đường Tần suất lý luận
49
Luật phân bố xác suất Kritxki - Menken
Điều kiện xây dựng:
1. Dùng 3 tham số giống như P-III
2. Chỉ có 1 số đông
3. Giá trị của đại lượng ngẫu nhiên có thể thay đổi từ 0 ≤ x ≤+
Lấy dạng hàm P-III với Cs = 2Cv làm cơ sở, xây dựng hàm mật độ
Với a, b: hằng số
b
a
x
ex
b
xf b
b
1
1
)(
)(
2
2
x Cv
1x
σ
α
Cách xác định: với Kp tra bảng phụ lục 4. XKX pp .
Phân biệt P-III với K-M?
50
2 hàm phân bố đều có dạng hình quả chuông có một số
đông và đều dùng 3 đặc trưng thống kê: Xtb, Cv, Cs.
Khi Cs = 2Cv đường tần suất trùng nhau
2 hàm đều có tiệm cận với trục hoành khi x +, đầu
kia bị chặn tại x0. Với P-III, x0 có thể âm hoặc dương.
Với K-M, x0 = 0.
3.7 Ảnh hưởng của tham số thống kê
51
1. Hệ số trung bình Xtb
3.8 Ảnh hưởng của tham số thống kê
52
2. Hệ số phân tán Cv
3.8 Ảnh hưởng của tham số thống kê
53
3. Hệ số thiên lệch Cs
3.9 Phương pháp vẽ đường tần suất lý luận
54
1. Phương pháp đường thích hợp
• Xác định các đặc trưng thống kê: Xtb, Cv, Cs
• Vẽ đường tần suất kinh nghiệm
• Lựa chọn đường phân bố xác suất (P-III hoặc K-M)
• Xây dựng đường tần suất lý luận
• Kiểm tra sự phù hợp giữa 2 đường kinh nghiệm và lý luận
• Nếu chưa phù hợp thì giả thiết lại các đặc trưng thống kê
3.9 Phương pháp vẽ đường tần suất lý luận
55
2. Phương pháp 3 điểm
• Vẽ đường tần suất kinh nghiệm
• Lựa chọn 3 điểm trên đường TSKN (x1,p1);(x2,p2);(x3,p3)
Nên chọn 3 điểm đã có sẵn bảng tra (X1%, X50%, X99%),
(X3%, X50%, X97%), (X5%, X50%, X95%), (X10%, X50%, X90%)
• Tính hệ số lệch S:
• Tra quan hệ S = f(Cs) được Cs
• Tra 2 và 13 theo Cs, tính
• Tính Xtb=X50%-50%
• Tính Cv = /Xtb
• Có 3 tham số Xtb, Cv, Cs vẽ đường tần suất lý luận
31
231
31
231
22
xx
xxx
S
31
31
xx
3.10 Phân tích tương quan tuyến tính
56
1. Khái niệm chung. Khi NC các hiện tương thủy văn thường
gặp trường hợp tài liệu có được quá ngắn. Phân tích các đặc
trưng Thủy văn thấy chúng có mối quan hệ:
1) Quan hệ hàm số: Hai chuỗi X, Y có quan hệ hàm số Y = f(X).
Mỗi một giá trị X, xác định được giá trị Y.
0
5
10
15
20
25
0 1 2 3 4 5 6 7 8
X
Y
3.10 Phân tích tương quan tuyến tính
57
0
2
4
6
8
10
12
14
16
0 2 4 6 8 10 12
X
Y
Không có quan hệ
0
500
1000
1500
2000
2500
3000
900 1100 1300 1500 1700 1900 2100
X
Y
6150
6200
6250
6300
6350
6400
9400 9450 9500 9550 9600 9650 9700 9750 9800
Qb (m3/s)
Q(m3/s)
2) Không có quan hệ: Không tìm
được mối liên hệ nào giữa X và Y
3) Quan hệ tương quan: Tập hợp
nhiều số liệu thì quan hệ giữa X
và Y có tính quy luật và tạo thành
một xu thế nào đó.
3.10 Phân tích tương quan tuyến tính
58
Đường hồi quy:
Giả sử có hai đại lượng X và Y có quan hệ thống kê với nhau, trong đó
Y là biến phụ thuộc còn X là biến độc lập. Giả sử tiến hành n lần thí
nghiệm hoặc quan trắc, sẽ nhận được n cặp số liệu như sau:
(x1, y1); (x2, y2); .... ; (xi, yi); .....; (xn yn)
Yêu cầu thiết lập quan hệ tương quan tuyến tính giữa biến phụ thuộc Y
theo biến độc lập X theo dạng tương quan thẳng (tương quan tuyến
tính).
3.10 Phân tích tương quan tuyến tính
59
0
1
2
3
4
5
6
7
8
9
10
0 2 4 6 8 10
X
Y
Hµm mËt ®é x¸c suÊt
xbby
10
1
y
Tương ứng với giá trị xi là giá trị trung bình của các đại lượng y (trị số bình
quân có điều kiện).
Đường phối hợp tốt nhất biểu thị quan hệ giữa xi và trị số bình quân có điều
kiện là đường thẳng hồi quy.
Phương trình của đường thẳng hồi quy: y = b0 + b1x là phương trình hồi quy
tuyến tính
3.10 Phân tích tương quan tuyến tính
60
a. Xác định phương trình hồi quy tuyến tính bằng giải tích
Khoảng lệch giữa điểm thực đo (xi, yi) với đường thẳng hồi quy là:
yi - y = yi – (b0+b1xi