Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn

1. Phân biệt khái niệm xác suất và tần suất 2. Khái niệm về đại lượng ngẫu nhiên, mẫu, tổng thể, nguyên tắc chọn mẫu 3. Khái niệm phân bố tần suất đại lượng ngẫu nhiên rời rạc, mật độ tần suất (liên tục), đường tần suất kinh nghiệm, lý luận, các hàm phân bố PIII và K-M 4. Các công thức tính tần suất kinh nghiệm. 5. Các tham số thống kê và ảnh hưởng của tham số thống kê đến đường tần suất, ứng dụng. 6. Các phương pháp vẽ đường tần suất 7. Khái niệm về tương quan thống kê, đường hồi quy , cách xác định, hệ số tương quan

pdf68 trang | Chia sẻ: lylyngoc | Lượt xem: 5239 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn THUỶ VĂN CÔNG TRÌNH Khoa Thuỷ văn – Tài nguyên nước Bộ môn Thuỷ văn – Tài nguyên nước 1 3.1 Khái niệm về xác suất và tần suất 1. Các khái niệm cơ bản  Phép thử: Thực hiện một thử nghiệm và quan sát kết quả thực hiện đối với một hiện tượng ngẫu nhiên nào đó trong cùng một điều kiện nhất định.  Kết quả của một phép thử ngẫu nhiên gọi là biến cố ngẫu nhiên, hoặc nói ngắn gọn là biến cố / biến cố cơ bản. Tập hợp các biến cố có thể xẩy ra trong một phép thử gọi là không gian biến cô ́. 2 3.1 Khái niệm về xác suất và tần suất Phân loại biến cố  Biến cố chắc chắn: là biến cố nhất định phải xuất hiện trong một phép thử.  Biến cố không thể có: là biến cố không thể xuất hiện trong một phép thử.  Biến cố độc lập: là biến cố mà sự xuất hiện của nó không phụ thuộc vào sự xuất hiện của các biến cố khác  Biến cố phụ thuộc: là biến cố mà sự xuất hiện của nó phụ thuộc vào sự xuất hiện của biến cố khác 3 3.1 Khái niệm về xác suất và tần suất Phân loại biến cố  Biến cố tổng: biến cố C được gọi là biến cố tổng của hai biến cố A và B nếu hoặc A xuất hiện, hoặc B xuất hiện, hoặc cả A và B cùng xuất hiện đều dẫn đến sự xuất hiện của C.  Biến cố tích: Biến cố C được gọi là biến cố tích của hai biến cố A và B khi va ̀ chỉ khi ca ̉ 2 biến cố A và B đồng thời xuất hiện tạo nên. 4 A B A B C=A+B C=A.B 3.1 Khái niệm về xác suất và tần suất Xác suất Định nghĩa cổ điển: Xác suất xuất hiện của một biến cố A nào đó bằng tỷ số giữa số biến cố cơ bản thuận lợi cho A xuất hiện trên tổng các biến cố cơ bản của không gian biến cố. Công thức tính xác suất của biến cố A theo định nghĩa cô ̉ điển: n là tổng số các biến cố cơ bản của không gian biến cố đang xét; m là số biến cố cơ bản thuận lợi cho biến cố A xuất hiện. 5 n m AP )( 3.1 Khái niệm về xác suất và tần suất Định nghĩa theo thống kê: Xác suất xuất hiện của một biến cố A nào đó là tần số xuất hiện của biến cố đó khi số lần thực hiện phép thử tăng lên vô hạn. Công thức tính xác suất theo định nghĩa thông kê: n là số lần thực hiện phép thử m là số lần xuất hiện biến cố A 6 n m AP n lim)(   3.2 Đại lượng ngẫu nhiên và luật phân bố xác suất của đại lượng ngẫu nhiên 1. Khái niệm đại lượng ngẫu nhiên  Đại lượng ngẫu nhiên (ĐLNN) là một đại lượng mà trong một phép thử nó nhận một giá trị có thể trong tập giá trị hay trong một khoảng trên trục số với xác suất tương ứng của nó. Ký hiệu X = {x1, x2, x3, …, xn} Phân loại: o Đại lượng ngẫu nhiên rời rạc: Nếu nó nhận một số giá trị hữu hạn trong khoảng xác định của nó. o Đại lượng ngẫu nhiên liên tục: Nếu nó nhận bất kỳ giá trị trong khoảng xác định của nó 7 2. Luật phân bố xác suất của ĐLNN và Hàm phân bố xác suất 8  Giá trị có thể của ĐLNN X1 X2 X3 X… Xn Xác suất (P) P1 P2 P3 P… Pn   x xxXxP xf x     lim 0 )( 2. Luật phân bố xác suất của ĐLNN và Hàm phân bố xác suất 9    x dxxf )( Ví dụ: 10  Hàm mật độ xác suất chuẩn có dạng:   2 )( 2 2 exp 2 1 )( x xf mx x   3. Tính chất và đồ thị của hàm PPXS 11 PPXS dạng F(x) = P(X≤ x) PPXS dạng F(x) = P(X ≥ x) 1. Giá trị F(x) ≥0 nhận giá trị trong khoảng [0,1] - F(-∞) = P(x≤-∞) = 0; F(+∞) = P(x≤+∞) = 1 - Với (-∞ ≤ x ≤ +∞) ta có (0 ≤ F(x) ≤ 1) 1. Giá trị F(x) ≥0 nhận giá trị trong khoảng [0,1] - F(-∞) = P(x≥-∞) = 1; F(+∞) = P(x≥+∞) = 0 - Với (-∞ ≤ x ≤ +∞) ta có (0 ≤ F(x) ≤ 1) 2. F(x) là hàm đồng biến không giảm trên toàn trục số x2≥ x1 thì F(x2) ≥ F( x1). Đồ thị luân đi lên 2. F(x) là hàm nghịch biến không tăng trên toàn trục số x2≥ x1 thì F(x2) ≤ F( x1). Đồ thị luân đi xuống 3. F(x) = P(X≤ x) liên tục trái tại mỗi điểm xo bất kỳ trên trục số lim F(x) = F(xo) 3. F(x) = P(X≤ x) liên tục trái tại mỗi điểm xo bất kỳ trên trục số lim F(x) = F(xo) oo xx   oo xx   4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN) 12 1: Kỳ vọng toán của ĐNN là mô men gốc bậc nhất của hàm mật độ xác suất ký hiệu mx = M[X] biểu thị mức độ tập trung của ĐLNN - Với ĐLNN liên tục mx = - Với ĐLNN rời rạc mx nếu xác suất p(xi) phân bố đều thì p(xi) = và kỳ vọng toán sẽ là:   x dxxfx )(.    n i ii xpx 1 )( n 1 4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN) 13 3. Hệ số thiên lệch Đồ thị hàm mật độ có thể đối xứng(như phân bố chuẩn) hoặc không đối xứng quanh trục tung có gốc là kỳ vọng tính đối xứng được đánh giá momen bậc ba: + Đối với ĐLNN liên tục +Đối với ĐLNN rời rạc Hệ số thiên lệch ký hiệu Cs dxxfmx x )()( 3 3     )()( 3 1 3 ix n i i xpmx     3 3 x s C    4. Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN) 14 2. Phương sai và khoảng lệch quân phương biểu thị mức độ phân tán của ĐLNN - Phương sai ký hiệu Dx =M[ (x – mx) 2 ] là kỳ vọng của kỳ vọng toán. + Đối với ĐLNN liên tục + Đối với ĐLNN rời rạc - Khoảng lệch quân phương - Hệ số phân tán: là đặc trưng không thứ nguyên biểu thị độ phân tán của ĐLNN so với kỳ vọng ký hiệu Cv dxxfmx xxD )()( 2     )()( 2 1 ic n i ix xpmxD    xx D x x v m C   4. Các đặc trưng biểu thị của đại lựơng ngẫu nhiên (ĐLNN) 15 3. Hệ số thiên lệch Đồ thị hàm mật độ có thể đối xứng(như phân bố chuẩn) hoặc không đối xứng quanh trục tung có gốc là kỳ vọng tính đối xứng được đánh giá momen bậc ba: + Đối với ĐLNN liên tục +Đối với ĐLNN rời rạc Hệ số thiên lệch ký hiệu Cs 3.3 Khái niệm về mẫu và tổng thể, phương pháp chọn mẫu  Tổng thể Số lượng các giá trị có thể mà ĐLNN có thể nhận được là lớn vô cùng. Tập hợp tất cả các giá trị mà ĐLNN X có thể nhận được gọi là tổng thể. Ký hiệu: N  Mẫu Trong nghiên cứu không thể nào NC hết tất cả các giá trị của tổng thể mà chỉ NC trên một tập giá trị với số lượng rất nhỏ. Tập hợp hữu hạn các số liệu thu thập được của tổng thể gọi là mẫu. Ký hiệu: n 16 3.3 Khái niệm về mẫu và tổng thể, phương pháp chọn mẫu  Các yêu cầu của mẫu trong thống kê: o Tính đại biểu: mẫu được chọn có những tính chất của tổng thể. Muốn vậy, dung lượng mẫu phải đủ lớn đảm bảo sai số lấy mẫu; mẫu phải bao gồm các giá trị số đặc trưng lớn, nhỏ và trung bình o Tính độc lập: các số liệu của mẫu không phụ thuộc lẫn nhau o Tính đồng nhất: cùng loại, cùng nguyên nhân hình thành hoặc cùng điều kiện xuất hiện 17 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất  Khái niệm Trong thống kê toán thường chỉ thu được hữu hạn các gía trị của ĐLNN (mẫu có dung lượng n) tức là thu được các giá trị rời rạc từ tổng thể mặc dù ĐLNN có thể là liên tục. Do vậy có thể dùng các công thức định nghĩa của ĐLNN rời rạc để tính toán. Các hiện tượng thủy văn là ĐLNN liên tục, các giá trị thu được rời rạc vì vậy trong thủy văn qui ước cách gọi riêng: Xác suất gọi là Tần suất và theo đó có Hàm mật độ xác suất-Hàm mật độ tần suất; Hàm PPXS- Hàm tần suất tích lũy 18 19  Hàm phân bố xác suất của đại lượng ngẫu nhiên dùng trong Thủy văn Hàm phân bố xác suất F(x) là xác suất để cho đại lượng ngẫu nhiên X nhận các giá trị lớn hơn hoặc bằng một giá trị x, trong đó x là biến số nhận các giá trị có thể trên miền xác định của nó. F(x) = P(X  x) 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất 20 0 1 F (x ) x Đồ thị hàm tan suat tich luy 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất 21 Tính chất hàm phân bố xác suất: Luôn dương và nhận giá trị trong khoảng [0,1]  F(-)=1  F()=0 Là hàm nghịch biến và không tăng trên toàn trục số  x2x1 thì F(x2)F(x1) Liên tục bên phải tại mỗi điểm x0     0 0 lim 0 xFxF xx   3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất 22  Công thức:  Tính chất:  1.  2. Hàm f(x) luôn dương và biến đổi từ 0 đến 1  3.    dxxfxF x      x xxXxP xf x     lim 0 )(   1   dxxf Hàm mật độ xác suất 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất 23 x f(x) Đồ thị hàm mật độ xác suất dạng quả chuông 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất Đặc điểm của đồ thị hàm mật độ xác suất Hoàn toàn nằm trên trục hoành Hình dạng đồ thị hàm mật độ tần suất có dạng hình quả chuông Hàm mật độ xác suất nhận trục 0x làm tiệm cận ngang Có một giá trị cực đại 24 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất  Hàm tần suất luỹ tích/Hàm phân bố xác suất Trong thống kê toán học, thường chỉ thu được mẫu có dung lượng n (rời rạc). Mẫu n đó được coi là đại lượng ngẫu nhiên rời rạc. F(xi) = P(X  xi) Được gọi là hàm tần suất luỹ tích. Đồ thị của nó thường được gọi là “đường tần suất” 25 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất 26 Là xác suất để cho đại lượng ngẫu nhiên X nhận các giá trị nằm trong khoảng từ x đến x-∆x  Công thức: p(xi) = P(xi) - P(xi - x) (Giống như hàm mật độ xác suất). Hàm mật độ tần suất/Hàm mật độ xác suất 3.4 Hàm tần suất luỹ tích và hàm mật độ tần suất 27 xi-1 xi x xi x 1 1 F(x) P f(x) p(xi) F(xi) MẪU (Vẽ theo số liệu của mẫu) TỔNG THỂ Hàm mật độ xác suất Hàm mật độ tần suất Hàm phân phối xác suất Hàm tần suất luỹ tích Sự khác nhau giữa tần suất và xác suất? 28 3.5 Ước lượng các tham số thống kê 29 1. Tham số biểu thị xu thế tập trung - Số đông (Xđ): là trị số có xác suất xuất hiện lớn nhất(tương ứng với giá trị cực đại của hàm mật độ tần suất). -Trị số trung bình: là ước lượng không chệch của kỳ vọng toán của đại lượng ngẫu nhiên(n là dung lượng mẫu) hoặc    n i ii xpxx 1 )(    n i i x n x 1 1 3.5 Ước lượng các tham số thống kê 30 2. Tham số biểu thị xu hướng phân tán - Khoảng lệch quân phươngx: - Hệ số phân tán Cv:      n i ix xx n 1 2 )( 1 1  x x kk nx C i i n i x v     ;)1( 1 1 1 2 3.5 Ước lượng các tham số thống kê 31 3. Tham số biểu thị tính đối xứng: Hệ số thiên lệch Cs x x k Cn k Cxn xx C i i v n i v n i s         ; )3( )1( ))(3( )( 3 1 3 3 1 3 3.5 Ước lượng các tham số thống kê 32 Đường quá trình mưa năm trạm A 0 500 1000 1500 2000 2500 1970 1975 1980 1985 1990 1995 2000 2005 Mưa năm Trung bình 1970 - 2002 Trung bình 1985 - 1991 X0 của trạm A??? 3.5 Ước lượng các tham số thống kê 33  Đối với trị số bình quân  Đối với hệ số phân tán  Đối với hệ số thiên lệch n x x      n C v x 100 %  Sai số tuyệt đối Sai số tương đối 2 1 2 v v Cv C n C     %1 2 100 % 2 vCv C n   42 561 6 vvCs CC n     42 561 6100 % vv s Cs CC nC  3.6 Tần suất kinh nghiệm và đường TSKN 34 Khái niệm: Tần xuất kinh nghiệm là xác suất để cho đại lượng ngẫu nhiên X nhận giá trị lớn hơn hoặc bằng x được ước lượng từ mẫu (chuỗi số liệu thực đo). n m xXP i  )( 3.6 Tần suất kinh nghiệm và đường TSKN 35 Các công thức kinh nghiệm tính tần xuất thường dùng trong thuỷ văn: Dạng tổng quát: Công thức Hazen (a=0,5): Công thức Chegôđaép (a=0,3): Công thức Weibull (a=0): an am xXP i 21 )(    %100 5,0 )( n m xXP i   %100 4,0 3,0 )(    n m xXP i %100 1 )(   n m xXP i 3.6 Tần suất kinh nghiệm và đường TSKN 36  Đường tần suất là đường quan hệ giữa tần suất luỹ tích và giá trị của biến ngẫu nhiên - Đường tần suất kinh nghiệm: là băng điểm điểm biểu diễn tần suất xuất hiện của đại lượng ngẫu nhiên nhận giá trị X ≥ xi , Tần xuất được tính theo các công thức kinh nghiệm - Đường tần suất lý luận:Đường cong trơn phù hợp với đường tần xuất kinh nghiệm gọi là đường tần suất lý luận. Đường tần suất lý luận là đồ thị hàm phân phối xác suất. 3.6 Tần suất kinh nghiệm và đường TSKN 37 Cách vẽ đường tần suất kinh nghiệm: 1. Sắp xếp chuỗi số liệu từ lớn đến nhỏ (đánh số thứ tự) 2. Tính tần suất theo 1 trong 3 công thức kinh nghiệm với m là số thứ tự, n là số số liệu thống kê. 3. Chấm các điểm P ~ xi (điểm kinh nghiệm) 3.6 Tần suất kinh nghiệm và đường TSKN 38 Cách vẽ đường tần suất kinh nghiệm: Thứ tự Q (m3/s) P = m/(n+1) (%) 1 2160 3,23 2 2100 6,45 3 1920 9,68 … … … 30 1260 96,77 3.6 Tần suất kinh nghiệm và đường TSKN 39 Cách vẽ đường tần suất kinh nghiệm: 1000 1200 1400 1600 1800 2000 2200 2400 0 10 20 30 40 50 60 70 80 90 100 P (%) Q ( m 3 /s ) 3.6 Tần suất kinh nghiệm và đường TSKN 40 Giấy tần suất (Giấy Hazen): FFC 2008 © Nghiem Tien Lam 90 140 190 240 290 340 390 440 490 540 590 640 690 0.01 0.1 1 10 20 30 40 50 60 70 80 90 99 99.9 99.99 ĐƯỜNG TẦN SUẤT DÒNG CHẢY NĂM - TRẠM BẢN ĐÔN L ư u l ư ợ n g , Q (m ³/ s ) Tần suất, P(%) Số liệu Qnăm trạm Bản Đôn TB=265.89, Cv=0.27, Cs=0.72 TB=265.89, Cv=0.27, Cs=0.72 © FFC 2008 3.7 Đường Tần suất lý luận 41 Đường tần suất kinh nghiệm chỉ phản ánh được quy luật phân bố xác suất của hiện tượng thuỷ văn trong phạm vi các giá trị thực nghiệm. Đường tần suất lý luận là đồ thị một hàm phân bố xác suất toán học mô tả phân bố xác suất của đại lượng ngẫu nhiên nhằm ngoại suy các giá trị nằm ngoài các giá trị thực nghiệm. 3.7 Đường Tần suất lý luận 42 Luật phân bố xác suất Pearson III Hàm mật độ có dạng: y0 xđ x a d y Trong đó • y0: là giá trị lớn nhất của hàm tương ứng với số đông xđ ; ; Giá trị hàm có bảng tra sẵn d x d a e a x yy          1 0 v s C C e y 2 )( )1( 0         2 4 s C  )( 43 • d: bán kính lệch (khoảng cách giữa trị số bình quân và số đông) • a: khoảng cách từ vị trí số đông đến giá trị nhỏ nhất •Đồ thị của hàm phân phối Pearson III được gọi là đường tần suất lý luận Pearson III (P-III) x CC d sv  2 . dx C C a s v  2 3.7 Đường Tần suất lý luận 44 Luật phân bố xác suất Pearson III Đặc điểm: • Một đầu bị chặn tại x0, một đầu nhận trục hoành làm tiệm cận, có 1 số đông. x0 là giá trị nhỏ nhất: • Có 3 đặc trưng là tham số xtb, Cv, Cs. • Phân phối lệch phụ thuộc vào bán kính lệch d •d>0: lệch dương (đỉnh của hàm mật độ nằm bên trái trị số bình quân) •d<0: lệch âm (đỉnh của hàm mật độ nằm bên phải trị số bình quân) •d=0: đỉnh của hàm mật độ trùng với vị trí số bình quân • Điều kiện ứng dụng: 0 k-1 2Cv Cs2Cv  x x k 0 0  x C C xx s v  2 0 3.7 Đường Tần suất lý luận 45 Hàm phân bố xác suất Pearson III Hàm PPXS Pearson III F(X≥ x) được xác định bằng cách lấy tích phân hàm mật độ. Việc tích phân trực tiếp hàm mật độ rất khó . Trong thực hành tiến hành lập bảng tính (Xp ῀ P) theo công thức Với p tra bảng Fôxtơ – Rưpkin (phụ lục 1) phụ thuộc Cs và P. xCx vpp ).1.(  3.7 Đường Tần suất lý luận 46 Cs = 0,3; P = 1% 1% = 2,54 Bảng Fôxtơ – Rưpkin Lưu ý: Khi Cs0) 3.7 Đường Tần suất lý luận Bảng tính đường tần suất lý luận 47 P(%) 0.0 1 0.1 1 5 .. 50 .. 75 80 90 99 99.9 (Cs,P) Kp=.Cv+1 xp=Kp.x 3.7 Đường Tần suất lý luận 48 Luật phân bố xác suất Kritxki - Menken Điều kiện xây dựng: 1. Dùng 3 tham số giống như P-III 2. Chỉ có 1 số đông 3. Giá trị của đại lượng ngẫu nhiên có thể thay đổi từ 0 ≤ x ≤+ Lấy dạng hàm P-III với Cs = 2Cv làm cơ sở, xây dựng hàm mật độ Với a, b: hằng số b a x ex b xf b b 1 1 )( )(                 2 2 x Cv 1x           σ α 3.7 Đường Tần suất lý luận 49 Luật phân bố xác suất Kritxki - Menken Điều kiện xây dựng: 1. Dùng 3 tham số giống như P-III 2. Chỉ có 1 số đông 3. Giá trị của đại lượng ngẫu nhiên có thể thay đổi từ 0 ≤ x ≤+ Lấy dạng hàm P-III với Cs = 2Cv làm cơ sở, xây dựng hàm mật độ Với a, b: hằng số b a x ex b xf b b 1 1 )( )(                 2 2 x Cv 1x           σ α Cách xác định: với Kp tra bảng phụ lục 4. XKX pp . Phân biệt P-III với K-M? 50  2 hàm phân bố đều có dạng hình quả chuông có một số đông và đều dùng 3 đặc trưng thống kê: Xtb, Cv, Cs.  Khi Cs = 2Cv đường tần suất trùng nhau  2 hàm đều có tiệm cận với trục hoành khi x  +, đầu kia bị chặn tại x0. Với P-III, x0 có thể âm hoặc dương. Với K-M, x0 = 0. 3.7 Ảnh hưởng của tham số thống kê 51 1. Hệ số trung bình Xtb 3.8 Ảnh hưởng của tham số thống kê 52 2. Hệ số phân tán Cv 3.8 Ảnh hưởng của tham số thống kê 53 3. Hệ số thiên lệch Cs 3.9 Phương pháp vẽ đường tần suất lý luận 54 1. Phương pháp đường thích hợp • Xác định các đặc trưng thống kê: Xtb, Cv, Cs • Vẽ đường tần suất kinh nghiệm • Lựa chọn đường phân bố xác suất (P-III hoặc K-M) • Xây dựng đường tần suất lý luận • Kiểm tra sự phù hợp giữa 2 đường kinh nghiệm và lý luận • Nếu chưa phù hợp thì giả thiết lại các đặc trưng thống kê 3.9 Phương pháp vẽ đường tần suất lý luận 55 2. Phương pháp 3 điểm • Vẽ đường tần suất kinh nghiệm • Lựa chọn 3 điểm trên đường TSKN (x1,p1);(x2,p2);(x3,p3) Nên chọn 3 điểm đã có sẵn bảng tra (X1%, X50%, X99%), (X3%, X50%, X97%), (X5%, X50%, X95%), (X10%, X50%, X90%) • Tính hệ số lệch S: • Tra quan hệ S = f(Cs) được Cs • Tra 2 và 13 theo Cs, tính • Tính Xtb=X50%-50% • Tính Cv = /Xtb • Có 3 tham số Xtb, Cv, Cs vẽ đường tần suất lý luận 31 231 31 231 22         xx xxx S 31 31      xx 3.10 Phân tích tương quan tuyến tính 56 1. Khái niệm chung. Khi NC các hiện tương thủy văn thường gặp trường hợp tài liệu có được quá ngắn. Phân tích các đặc trưng Thủy văn thấy chúng có mối quan hệ: 1) Quan hệ hàm số: Hai chuỗi X, Y có quan hệ hàm số Y = f(X). Mỗi một giá trị X, xác định được giá trị Y. 0 5 10 15 20 25 0 1 2 3 4 5 6 7 8 X Y 3.10 Phân tích tương quan tuyến tính 57 0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 X Y Không có quan hệ 0 500 1000 1500 2000 2500 3000 900 1100 1300 1500 1700 1900 2100 X Y 6150 6200 6250 6300 6350 6400 9400 9450 9500 9550 9600 9650 9700 9750 9800 Qb (m3/s) Q(m3/s) 2) Không có quan hệ: Không tìm được mối liên hệ nào giữa X và Y 3) Quan hệ tương quan: Tập hợp nhiều số liệu thì quan hệ giữa X và Y có tính quy luật và tạo thành một xu thế nào đó. 3.10 Phân tích tương quan tuyến tính 58 Đường hồi quy: Giả sử có hai đại lượng X và Y có quan hệ thống kê với nhau, trong đó Y là biến phụ thuộc còn X là biến độc lập. Giả sử tiến hành n lần thí nghiệm hoặc quan trắc, sẽ nhận được n cặp số liệu như sau: (x1, y1); (x2, y2); .... ; (xi, yi); .....; (xn yn) Yêu cầu thiết lập quan hệ tương quan tuyến tính giữa biến phụ thuộc Y theo biến độc lập X theo dạng tương quan thẳng (tương quan tuyến tính). 3.10 Phân tích tương quan tuyến tính 59 0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 X Y Hµm mËt ®é x¸c suÊt xbby 10   1 y  Tương ứng với giá trị xi là giá trị trung bình của các đại lượng y (trị số bình quân có điều kiện). Đường phối hợp tốt nhất biểu thị quan hệ giữa xi và trị số bình quân có điều kiện là đường thẳng hồi quy. Phương trình của đường thẳng hồi quy: y = b0 + b1x là phương trình hồi quy tuyến tính 3.10 Phân tích tương quan tuyến tính 60 a. Xác định phương trình hồi quy tuyến tính bằng giải tích Khoảng lệch giữa điểm thực đo (xi, yi) với đường thẳng hồi quy là: yi - y = yi – (b0+b1xi