Chương 3. Phân tích tần suất

Có nhiều các chu trình thuỷ văn phải đượclàmrõvàđược giải thích theo xác suất là do sự biến đổi ngẫu nhiên vốn có của nó. cho ví dụ không thể dự báo lưu lượng và lượng mưa một cách chính xác dựa vào các số liệu trong quá khứ hay tương lai do không biết nguyên nhân cơ chế hoạt động của chúng. Rất may là phương pháp thống kê là rất phù hợp để cấu thành và biểu diễn chuỗi sốliệu quan trắc thành một dạng mà có thể nội suy và ước lượng. Chương này chỉ ra các phương pháp ngẫu nhiên mà trong thuỷ văn các số liệu có thể được xác định và biểu diễn trong một phuơng phápthống kê chuẩn.

pdf61 trang | Chia sẻ: lylyngoc | Lượt xem: 1561 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Chương 3. Phân tích tần suất, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ch−ơng 3. phân tích tần suất ảnh. Lũ lụt ở sông Trinity cạnh Dayton, Texas nawm 1990 3.1. lời giới thiệu Phạm vi nghiên cứu Có nhiều các chu trình thuỷ văn phải đ−ợc làm rõ và đ−ợc giải thích theo xác suất là do sự biến đổi ngẫu nhiên vốn có của nó. cho ví dụ không thể dự báo l−u l−ợng và l−ợng m−a một cách chính xác dựa vào các số liệu trong quá khứ hay t−ơng lai do không biết nguyên nhân cơ chế hoạt động của chúng. Rất may là ph−ơng pháp thống kê là rất phù hợp để cấu thành và biểu diễn chuỗi số liệu quan trắc thành một dạng mà có thể nội suy và −ớc l−ợng. Ch−ơng này chỉ ra các ph−ơng pháp ngẫu nhiên mà trong thuỷ văn các số liệu có thể đ−ợc xác định và biểu diễn trong một phuơng pháp thống kê chuẩn. 163 Các biến cố ngẫu nhiên Một biến cố ngẫu nhiên là một tham số (nh− l−u l−ợng, l−ợng m−a, quá trình l−u l−ợng) nó có thể đ−ợc dự báo một cách chính xác đó là, một biến cố ngẫu nhiên là kết quả của một quá trình ngẫu nhiên. Một số biến cố có thể đ−ợc xử lý bằng thống kê một cách gián đoạn hay liên tục. Phần lớn các số liệu thuỷ văn là liên tục và đ−ợc phân tích xác suất bằng phân bố xác suất liên tục. Cho ví dụ, giá trị l−u l−ợng trong biểu đồ hình 3.1a có thể bằng bất cứ một giá trị thực nào khi đo đạc bằng dụng cụ đo, đó là các số liệu liên tục. Tuy nhiên chính bản thân các số liệu lại đ−ợc biểu diễn một cách gián đoạn là do các quá trình đo đạc. Các số liệu dòng chảy hàng ngày có thể đ−ợc xác định một cách xác thực nhất bằng l−u l−ợng n−ớc m3/s. Dạng biểu diễn này của số liệu đ−ợc gọi là dạng gián đoạn - liên tục. Đó là các số liệu liên tục đ−ợc quy thành gián đoạn. Điều này cũng đ−ợc minh hoạ trong hình 3.1(a), trong đó l−u l−ợng đ−ợc giả thiết dạng m3/s gần nhất. Các biến cố ngẫu nhiên gián đoạn có thể chỉ đ−ợc lấy trên một l−u vực nhất định trong các giá trị rời rạc. Cho ví dụ, tung một đồng xu kết quả là mặt sấp hoặc ngửa sẽ xuất hiện; tung một con súc sắc các giá trị xuất hiện từ 1 đến 6. Kết quả từ thùng đo m−a là các giá trị thuỷ văn đơn giản nh− trong hình 3.1(b): nó có thể có hay không có một đỉnh trong suốt khoảng thời gian. Hình 3.1. Các số liệu liên tục và gián đoạn a) số liệu liên tục và gián đoạn b)số liệu gián đoạn. Kết quả biểu đồ lấy từ thùng đo m−a. Mỗi một đơn vị độ cao là 0.01 inch l−ợng m−a. 164 Các số liệu gián đoạn - liên tục có thể đ−ợc xử lý bằng gián đoạn. Thật vậy chúng đ−ợc gián đoạn hoá bất cứ lúc nào các bảng số liệu đ−ợc sắp xếp trình tự, do các gía trị này còn đ−ợc cắt bớt. (Ví dụ nh− giá trị gần nhất của 1 ft3/s l−u l−ợng hay 0.1 inch l−ợng m−a). Tuy nhiên, việc phân tích các yếu tố tần suất này là rất thuận tiện do số liệu tính toán lớn mà ta có thể xem xét. Cho ví dụ, nếu l−u l−ợng dòng chảy đ−ợc đo đạc gần đúng nhất (ft3/s) trong khoảng từ 0 đến 5000 ft3/s thì phải tính toán 5000 khoảng gián đoạn. T−ơng ứng, các điểm liên tục sẽ dễ dàng hơn rất nhiều. Mặc dù các phân bố tần suất rời rạc thỉnh thoảng đ−ợc áp dụng cho các giá tị liên tục (ví dụ độ lớn l−ợng m−a của một trận m−a), các ứng dụng chủ yếu của phân bố rời rạc trong thuỷ văn là một biến cố ngẫu nhiên mà ở dạng số để đáp ứng một số tiêu chuẩn nhất định, ví dụ giá trị lũ đ−ợc mong đợi để v−ợt quá một độ lớn nhất định, trong thời kỳ nhiều năm. biểu diễn số liệu Số liệu gián đoạn - liên tục th−ờng đ−ợc biểu diễn d−ới dạng biểu đồ hình cột hay một đ−ờng cong. Chiều cao và hình dạng chung của đ−ờng cong là phù hợp với các đặc tr−ng số liệu và lựa chọn luật phân bố các số liệu một cách hợp lý, ví dụ có những phân bố nên làm đối xứng hay có những phân bố nên chọn bất đối xứng. Sử dụng l−u l−ợng dòng chảy, ví dụ, giá trị l−u l−ợng đ−ợc phân chia thành từng lớp một và t−ơng ứng với nó là một tần suất xuất hiện của lớp đó. Độ lớn của mỗi lớp nên đủ nhỏ làm sao các thành phần số liệu có thể thấy đ−ợc nh−ng cũng phải đủ lớn để cho các thành phần không bị lẫn lộn. Giá trị đã sử dụng trong các lớp có thể thay đổi hình ảnh của số liệu (Benjamin và Cornel, 1970). Giá trị này có thể không thuận tiện cho việc thay đổi nhiều ch−ơng trình tính toán, vì vậy các kỹ s− có thể so sánh và đ−a ra một vài sự lựa chọn khác nhau. Với sự trợ giúp của Panofsky và Brier, 1968 đã đ−a ra: K = 5log10n (3.1) ở đây K là số khoảng lớp và n là số giá trị. Khoảng lớp không phải là hằng số độ rộng. Nếu không, thuận lợi cho việc nhóm các số liệu thành một nhóm lớn hơn, khoảng đ−ợc kết hợp. Nửa tung độ của đồ thị đ−ợc phân chia bởi toàn bộ số lần quan sát đ−ợc, tần suất t−ơng ứng (xác suất ) của mỗi một khoảng lớp, nh− vậy tổng tung độ bằng 1.0 tạo nên sự thay đổi ph−ơng pháp đánh dấu số liệu. Cho đến cách thứ ba là dạng của một phân bố tần suất luỹ tích, nó cho biết toàn bộ đ−ờng cong phân bố tần suất t−ơng ứng trên một khoảng nhất định và là xác suất mà một giá trị ở hoành độ là nhỏ hơn hoặc bằng độ lớn ở mỗi điểm đó. Cả hai tần suất trên đều đ−ợc dùng nhiều trong thuỷ văn và đ−ợc minh hoạ rõ nét nhất trong một số ví dụ . Ví dụ 3.1 đồ thị tần suất Số liệu lũ lớn nhất trong 31 năm đ−ợc ghi lại tại Cypress Creek, gần Horton, Texas, đ−ợc trình bày trong bảng 3.1. Ph−ơng trình 3.1 cho biết rằng có khoảng t−ơng ứng 7 hay 8 lớp. ở đây là nó cho phép giới hạn tiêu chuẩn là 2000ft3/s (tiêu chuẩn này quan trọng hơn những quy tắc đếm tay khác đôí với số khoảng lớp). Tần suất, tần suất t−ơng ứng, tần suất luỹ tích cũng đ−ợc xác định trong bảng và 165 biểu diễn trong hình 3.2 và 3.3. Ví dụ , trong hình 3.2 xác suất nằm trong khoảng 2000 và 4000 là 0.29. Từ đ−ờng cong xác suất luỹ tích (hình 3.3), xác suất mà l−u l−ợng nhỏ hơn hoặc bằng 4000 ft3/s là 0.58. Chú ý rằng tổng của tần suất t−ơng ứng là 1.0 đ−ợc chỉ ra trong bảng 3.1 và tổng tung độ đ−ợc biểu diễn trong hình 3.3. Bảng 3.1 Bảng tính toán số liệu và tần suất ở Cypress Creek , gần Horton, Texas Số liệu ch−a sắp xếp Số liệu đã sắp xếp Số liệu ch−a sắp xếp Số liệu đã sắp xếp Năm Q(m3/s) Stt Q(m3/s) Năm Q(m3/s) Stt Q(m3/s) 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 9840 5170 1620 235 15600 4740 427 3310 4400 7760 2520 340 5440 3000 3690 10300 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 15600 10300 9840 7760 6560 6260 5440 5230 5170 4740 4710 4400 4300 3980 3690 3460 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 6260 1360 1000 2770 1400 3210 1110 5230 4300 2820 1900 3980 6560 4710 3460 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 3310 3210 3000 2820 2770 2520 1900 1620 1400 1360 1110 1000 427 340 235 Khoảng lớp Giá trị trung bình Tần suất Tần suất t−ơng ứng Tần suất l/t 0 - 2000 2000 - 4000 4000 - 6000 6000 - 8000 8000 - 10000 10000 - 12000 12000 - 14000 14000 - 16000 1000 3000 5000 7000 9000 11000 13000 15000 9 9 7 3 1 1 0 1 0.29 0.29 0.23 0.10 0.03 0.00 0.03 0.03 0.29 0.58 0.81 0.91 0.94 0.97 0.97 1.00 31=∑ 166 Một cách gián đoạn hoá các số liệu l−u l−ợng liên tục sẽ đ−ợc quy định là một biến cố ngẫu nhiên rời rạc cho mỗi một khoảng lớp. Bất kỳ một giá trị nào nằm trong một lớp sẽ đ−ợc quy định là giá trị rời rạc t−ơng ứng của các lớp đó, thông th−ờng điểm trung bình hay điểm giữa của mỗi lớp. Trong tr−ờng hợp này điểm giữa sẽ đ−ợc điền vào hoành độ (hình 3.4). Một giá trị tần suất t−ơng ứng là giá trị tần suất của l−u l−ợng 3000 ft3/s là 0.29 (giá trị t−ơng đ−ơng này đ−ợc lấy dựa vào những hiện t−ợng đã biết mà một biến cố ngẫu nhiên liên tục có thể có, không cần xác định chính xác bằng giá trị cụ thể). Đ−ờng bất đối xứng l−u l−ợng ở Cypress Creek đ−ợc trình bày trong hình 3.2 và 3.4, đó là điểm cuối ở bên phải. Nó sẽ đ−ợc xác định và lấy t−ơng đ−ơng với sự thay đổi phân bố trong nhiều tr−ờng hợp khác. Hình 3.2. Biểu đồ tần suất t−ơng ứng cho vùng Cypress Creek, gần Horton, Texas. Hình 3.3. Biểu đồ tần suất luỹ tích cho vùng Cypress Creek. 167 Hình 3.4. Biểu đồ tần suất rời rạc của vùng Cypress Creek. Những tần suất này bằng với hàm khối l−ợng xác suất rời rạc (PMF). 3.2. Các khái niệm xác suất Tiến hành một thí nghiệm với N kết quả đạt đ−ợc, X1,X2,…Xi,…XN. Các kết quả này là độc lập, nếu không hai trong số đó có thể xảy ra cùng một lúc. Nó là số lần xuất hiện các mặt, chúng đặc tr−ng cho toàn bộ kết quả đạt đ−ợc khi tiến hành thí nghiệm. Xác suất của một biến cố Xi có thể đ−ợc xác định bằng số lần xuất hiện biến cố t−ơng ứng trong rất nhiều phép thử. Xác suất này có thể đ−ợc xác định bằng P(Xi) = ni/n, ở đây ni là số lần xuất hiện (xác suất ) của biến cố Xi trong n phép thử. Tuy nhiên ni/n chỉ là tần suất t−ơng ứng hoặc xác suất xảy ra của biến cố Xi. Một xác suất rời rạc là một xác suất đơn giản của một biến cố rời rạc. Nếu nh− một P(Xi) nhất định bằng với xác suất của biến cố ngẫu nhiên Xi, các điều kiện cho phép tồn tại những xác suất rời rạc của những biến cố này khi xem xét các khoảng đơn giản của toàn bộ kết quả đạt đ−ợc: 0 < P(Xi) < 1 (3.2) . (3.3) ∑ = = N i XiP 1 1)( Xác suất hợp của hai biến cố độc lập là tổng xác suất của mỗi xác suất biến cố thành phần: P(X1∪ X2) = P(X1) + P(X2) (3.4) Hai biến cố X1 và Y1 đ−ợc gọi là độc lập, nếu việc xảy ra biến cố này không ảnh 168 h−ởng đến sự xuất hiện biến cố kia. Xác suất giao (cả hai cùng xảy ra đ−ợc ký hiệu ∩ ) của hai biến cố độc lập là tích của chúng: P(X1∩ Y1) = P(X1). P(Y1). (3.5) Đối với các biến cố phụ thuộc lẫn nhau: P(X1∪ Y1) = P(X1) + P(Y1) - P(X1∩ Y1). (3.6) Xác suất điều kiện của X1 khi biến cố Y1 đã xảy ra là: P(X1/Y1) = P(X1∩ Y1)/ P(Y1) . (3.7) Nếu biến cố X1 và Y1là độc lập thì kết hợp 2 ph−ơng trình 3.5 và 3.7 trở thành: P(X1/Y1) = P(X1).P(Y1)/P(Y1) =P(X1). (3.8) Những khái niệm này th−ờng đ−ợc minh hoạ trong biểu đồ Venn (Hình 3.5) trên đó diện tích là xác suất, với tổng diện tích t−ong ứng thì xác suất bằng 1.0, hay 100%. Hình 3.5. Biểu đồ Venn minh hoạ xác suất Ví dụ 3.2 Các xác suất có điều kiện Lấy biến cố Y1 là điều kiện mà l−ợng m−a xảy ra trong một ngày nhất định và biến cố X1 là điều kiện mà chớp quan sát đựơc trong một ngày nhất định. Cho xác suất của những biến cố này: P(X1) = 0.3 (xác suất chớp là 30%) P(Y1) = 0.1 (xác suất m−a là 10% ) P(X1/Y1) = 0.5 (nếu có chớp xuất hiện thì m−a là 50% ) Tính xác suất cả m−a và chớp cùng xảy ra (là xác suất ∩ của X1 và Y1)? Từ ph−ơng trình 3.7: P(X1∩ Y1) = P(Y1/X1).P(X1) = 0.15. Nếu là độc lập với P(Y1/X1) = P(Y1) = 0.03. Xác suất của các biến cố độc lập cùng xảy ra luôn luôn nếu chúng là phụ thuộc. 169 3.3. Các biến cố ngẫu nhiên và các luật phân bố xác suất Các biến cố ngẫu nhiên và biến cố rời rạc Tính chất của các biến cố ngẫu nhiên có thể đựơc miêu tả bởi quy luật phân bố xác suất của nó. Mỗi một kết quả đạt đ−ợc trong một phép thử đựoc quy định là số giá trị phụ thuộc vào hàm khối l−ợng xác suất rời rạc (PMF) hay hàm mật độ xác suất liên tục (PDF). Trong thuỷ văn, các biến cố ngẫu nhiên rời rạc đ−ợc sử dụng rất rộng rãi để biểu diễn số tr−ờng hợp xảy ra mà phù hợp vơí một tiêu chuẩn nhất định. Ví dụ, giá trị lũ v−ợt quá giá trị cụ thể cho tr−ớc, l−ợng m−a xảy ra tại một nơi nhất định, … Các ví dụ trong ch−ơng này đều thuộc loại này. Nh− một quy tắc, các biến cố ngẫu nhiên rời rạc đ−ợc liên kết chỉ với các tham số mà có thể chỉ là các số nguyên. Tuy nhiên có thể nhóm các biến cố ngẫu nhiên liên tục thành các số nguyên gần đúng nhất hay các giá trị nguyên bỏ dấu phẩy. Cho ví dụ, l−ợng m−a 2.18 inch thay là l−ợng m−a 218 inch. Đôi khi biến đổi để xử lý một biến cố liên tục thành dạng rời rạc, nh− l−u l−ợng rời rạc trong hình 3.4. Hãy chú ý P(x1) có nghĩa là xác suất mà biến cố ngẫu nhiên rời rạc X lấy từ giá trị x1. Biểu diễn lại l−u l−ợng x "rời rạc ", chúng ta có thể lấy xác suất t−ơng ứng trong hình 3.4: P(1000) = 0.29, P(9000) = 0.03 P(3000) = 0.29, P(11000) = 0.03 P(5000) = 0.23, P(13000) = 0.0 P(7000) = 0.10, P(15000) = 0.03 ∑ ≤≤ =≤≤ bxa xPbxaP )()( (3.9) Chú ý rằng các giá trị này phù hợp với xác suất tuyệt đối của ph−ơng trình 3.2 và 3.3. Hơn nữa các xác suất là rời rạc. Hàm phân bố luỹ tích (CDF) đ−ợc xác định là: Từ các giá trị trong bảng trên, F(7000) = 29+29 + 23 +10 =91%. ∑ ≤ =≤= XXi XiPxXPxF )()()( (3.10) Các biến cố ngẫu nhiên liên tục th−ờng đ−ợc sử dụng để biểu diễn các yếu tố thuỷ văn nh− l−u l−ợng, thể tích, độ sâu, và thời gian. Các giá trị này không phải chuyển về dạng nguyên, mặc dù các biến cố liên tục có thể nhóm thành dạng nguyên. Cho một biến cố ngẫu nhiên liên tục, phần diện tích d−ới hàm mật độ phân bố xác suất f(x) nh− sau (xem hình 3.6): P(x1< x < x2) = (3.11) ∫ 21 )(xx dxxf và phần diện tích d−ới PDF bằng 1.0: (3.12) ∫ ∞∞− = 0.1)( dxxf 170 Bản thân CDF không phải là một xác suất và có thứ nguyên nghịch đảo với thứ nguyên của X, ví dụ nh− ft3/s-1 . Tuy nhiên, không giống với các nhà tính toán, nó không tuân theo các đơn vị th−ờng dùng của PDF. Trong thực tế, các giá trị của PDF rất ít khi dùng đến. Mặt khác nó là hàm mật độ luỹ tích (CDF) và rất quan trọng vì nó là xác suất CDF, liên tục đ−ợc xác định giống với các thành phần rời rạc của nó: Hình 3.6 .Hàm mật độ xác suất liên tục ∫ )1(xF ∞−=≤≤−∞= 1 )()1( X dxxfxxP (3.13) giá trị nằm trong khoảng: các 0.1)(0 ≤≤ Xf (3.14) và )1()()( xlFxFxxxP 221 −=≤≤ (3.15) DF và CDF đ−ợc lấy t−ơng ứng với ph−ơng trình (3.13) nghịch đảo : P )()( xf dx xdF = . Biểu đồ trong hình 3.2 có thể đ−ợc biểu diễn bằng PDF liên tục nếu các tần suất t−ơng ứng đ−ợc tạo ra từ các khoảng lớp nhỏ hơn x. Phần diện tích d−ới biểu đồ là 1.0. Cho ví dụ , nếu tung độ của biểu đồ tần suất t−ơng ứng trong hình 3.2 có khoảng chia là 2000 ft3/s, t−ơng ứng với một PDF. Nó minh hoạ cho những PDF có thể có hình dạng cố định và dạng giá trị đơn, chúng không cần giống hình dạng đ−òng cong trơn. Biểu đồ này có phân bố hỗn hợp, trong đó các xác suất rời rạc biểu diễn xác suất mà một biến cố lấy một giá trị rời rạc cụ thể, trong khi một PDF liên tục cho biết đỉnh của các giá trị với m khó khăn bởi vì ng−ời ta th−ờng bắt ch−ớc hình dạng của biểu đồ tần suất (hình 3.2) các PDF phần lớn sử ột diện tích bằng 1,0 ngoại trừ các hàm xác suất rời rạc. Để ví dụ, một phân bố hỗn hợp đựoc biểu diễn trong hình 3.7 trong đó xác suất là 0.15 tại l−u l−ợng bằng 0.0. Chọn một phân bố liên tục PDF để biểu diễn các số liệu là 171 dụng các biến cố thuỷ văn sẽ đựoc trình bày trong phần sau đây. Hình 3.7. c (PMF) cho F) (độ lớn diện tích = 0.85) đối với xác suất có giá trị lớn hơn 0. Các ham số phân bố. Chính bản thân các m Cho một phân bố rời rạc, moment gốc bậc N có hể đ−ợc xác định nh− sau. xPxà (3.17) Và đối với các phân bố liên tục nh− sau: N rị trung vị, trung bình hay giá trị kỳ vọng, đ−ợc tính ằng E() đối với kỳ vọng nh− sau: (3.19) à là một tham số vị trí vì nó ch Luật phân bố tần suất rời rạc. Sử dụng các hàm phân bố xác suất rời rạ xác suất có giá trị = 0 và các hàm mật độ xác suất liên tục (PD moment của một phân bố Khái niệm moment là một thuật ngữ cơ học. Một PMF hoặc PDF là một dạng hàm trong đó các moment có quan hệ với các tham số của nó. Tuy nhiên, nếu các moment có thể tìm đ−ợc thì cũng có thể tìm thấy các t oment cũng cho biết hình dạng của các phân bố. t ∑= )(' iNiN ∫ ∞−= dxxfxN )('à (3.18) Moment gốc bậc một là giá t ∞ b rạc) rời PMF (cho ∑∞ ∞− =≡ )()( ii xpxxE à v )tục nliê PDF (cho ∫ ∞−=≡ )()( ii xfxxE à (3.20) Trung vị là một giá trị đ−ợc lấy ở giữa hay cũng đựoc gọi ∞ o biết vị trí trục quay x số lớn của phân bố đ−ợc thiết lập. Thông th−ờng luật phân bố của một biến cố sẽ đ−ợc tìm và thông tin về các biến cố quan hệ sẽ đ−ợc cung cấp. Để ví dụ, phân bố của l−u l−ợng dòng chảy có thể đ−ợc biết và cho biết thông tin về trạm đó, đó là một hàm của l−u l−ợng. Giá trị kỳ vọng của 172 h guyên àm g(x) đối với biến cố ngẫu nhiên x có thể đ−ợc xác định theo công thức căn n của x. ii xfxg (3.21) khi x là biến cố ngẫu nhiên rời rạc, và = dxxfxgx )()()] (3.22) hi x là biến cố ngẫu nhiên liên tục. ỳ vọng là một hàm tuyến tính, nếu E(a) = a (3.23) và .25) Các moment gốc bậc cao hơn của luật phân bố th tế, các moment trung tâm của giá trị trung bình đ−ợc xác định theo PMF rời rạc là: (3.26) và đối với PDF liên tục: iá trị rung bình của x đ−ợc đ−a lên mũ N, trong đó moment trung trung tâm bậc hai đ−ợc gọi là ph−ong sai và đóng vai trò rất qu dxxfxxE i )()(])[( 22 àà (3.28) cho các biến cố ngẫu nhiên liên tục bình bậc hai, nó biểu diễn độ lớn hay hoảng rộng của phân b − ộ h uẩn ∑∞ ∞− = )()()) (( xgE ∫ ∞−∞ gE ([ k K a, b là hằng số. E(bx) = bE(x) (3.24) E(a + bx) = a + bE(x) (3 −òng không sử dụng. Trong thực )()( i N iN xpx àà −= ∑∞ ∞− ∫∞∞− −= dxxfx N )()( ààN (3.27) Những moment này th−ờng là các giá trị kỳ vọng của khoảng lệch khỏi g t tâm bậc nhất bằng 0. Moment an trọng. ∑∞ ∞− −=− =≡xVar )( 2σ ∫∞∞− −=−=≡ dxxfxxExVar )()(])[()( 222 ààσ (3.29) Ph−ơng sai là độ lệch khỏi giá trị trung σ ,k ố . Một đơn vị t ơng đ−ơng là đ lệc ch nó đơn giản là ai bậc hai. Từ công thứ : ph−ơng s c của kỳ vọng Var(x) = E[(x - à ) ] = E[x - 2xà à 22 2 + ] = E[x2] - E[2à à 2x]+E[ ] = E[x2] - 2à à à 2 +à 22 E[x]+ = E[x ]2 - 2 ] à=E[x ]- 2 2 E[x = Ph−ơng sai không phải là mộ Var(bx) = b2Var(x) (3.32) 2]-[E(x)]2 (3.30) t biến đổi tuyến tính. Ta có các quan hệ sau: Var(a) = 0 (3.31) Var(a+bx) = b2Var(x) (3.33) ở đây a,b là các hằng số 173 Các moment bậc cao hơn có thể đ−ợc xác trong thuỷ văn là bất đối xứng, nó là moment trung tâm bậc 3 và đ−ợc đơn giản hoá bằng định nếu cần thiết, nh−ng th−ờng dùng độ lệch trung bình mũ 3. 3 à≡g 3σ Độ lệch phải hay lệch trái giá trị trung bình là tham số hình dạng và đ−ợc biểu diễn tong hình 3.8. Nếu nh− phân bố là đối xứn (3.34) g thì hệ số bất đối xứng bằng 0. Đôi khi nó đ−ợc sử dụng để làm đơn giản h số ph−ơng sai đ−ợc xác định theo tỷ lệ độ lệch khỏi giá trị trung bình, hay nó có thể đ−ợc sử dụng cho mục đích tính CV. oá việc tính toán mức độ phân bố. Hệ àσ /=CV (3.35) Hình 3.8. ảnh h−ởng của hệ số bất đối xứng đối với hàm mật độ xác suất (PDF) ị, và đỉnh (của Haan 1977, Hình 3.3) ông của phân bố. Giá trị này của x ân bố sẽ đ−ợc xác định cho mỗi một phân bố khi xem xét. Các mối quan hệ cho biết một ph−ơng pháp đơn giản của việc xác định các ã biết. Với mục đích đó việc xác định các mome và các vị trí t−ơng ứng của giá trị số đông, trung v Một giá trị tính tại gi−ã đ−ờng cong là trung vị xm, nó không phải là moment nh−ng đúng hơn giá trị của x mà CDF bằng 0.5: F(xm) = 0.5 (3.36) Các tham số khác không phải là moment nh− số đ ở PDF (hoặc PMF) là một điểm cực đại. Các quan hệ giữa giá trị trung bình, trung vị và số đông cũng đ−ợc minh hoạ trong hình 3.8. Các phân bố chủ yếu là một ph−ơng thức (phân bố hỗn hợp của hình 3.7 là nhị thức). Các moment và các tham số đ−ợc trình bày trong phần này để xem xét quy luật phân bố xác suất và có thể lấy để phân tích. Các dạng hàm nh− PMF hay PDF có thể đ−ợc thay thành dạng tổng hay dạng tích phân và các moment đã xác định từ các thành phần của các tham số trong phân bố. Nó không đ−ợc minh hoạ ở đây do mối quan hệ giữa các moment và các tham số ph tham số phân bố nếu nh− các moment đ nt phải đ−ợc lấy từ các số liệu. Ước l−ợng moment từ các số liệu Cho các gía trị tham số của phân bố, nó là một chuỗi x1, x2,…, xn của các biến ngẫu nhiên phụ thuộc vào việc cho PMF hay PDF. Các chuỗi có độ dài xác định sẽ xây dựng một cách phổ biến toàn bộ các biến cố ngẫu nhiên dựa vào PDF hay PMF đã cho với các tham số nhấ
Tài liệu liên quan