Bài giảng Nguyên lý cơ bản của thống kê

Với biến rời rạc Khi thống kê, ta đo biến cố nhiều lần và thu các kết quả rất khác nhau, mỗi kết quả thường có tần xuất lập lại khác nhau TD: khi gieo xúc xắc 100 lần có 25 lần xuất hiện mặt (6), 20 xuất hiện mặt (5), 10 xuất hiện mặt (4) , 17 xuất hiện mặt (3), 10 xuất hiện mặt (2), còn lại là số lần xuất hiện mặt (1) Các giá trị P = 25/100, 20/100… là biểu diễn phân bố xác suất của các lần gieo tương ứng các kết quả xuất hiện mặt ( x = 6, x = 5, x = 4…)

ppt52 trang | Chia sẻ: haohao89 | Lượt xem: 4650 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Nguyên lý cơ bản của thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
NGUYÊN LÝ CƠ BẢN CỦA THỐNG KÊ Principles of Statistics KE CHƯƠNG 0: KHÁI NiỆM XÁC SUẤT (PROBABILITIES) 0.1- BiẾN NGẨU NHIÊN (Random Variables) Biến ngẩu nhiên (ký hiệu x) là biến mà các giá trị nó nhận được là các số thực được cho từ một hiện tượng ngẩu nhiên nào đó. Ví dụ: Số photon (x) phát ra từ đèn laser trong một giây Năng lượng tia gamma phóng xạ Tọa độ của một electron (1D) 0.2- Phân Loại * Phân ra 2 loại: biến rời rạc và liên tục (discrete and continuous). * Biến rời rạc (discrete random variable):Biến chỉ nhận một số các giá trị phân biệt (VD: số bước sóng của quang phổ nguyên tử H2 ) * Biến liên tục (continuous random variable) nhận vô số các giá trị liên tục khác nhau. Như các giá trị của bước sóng ánh sáng tự nhiên đến từ Mặt Trời (0,76  0,38 m). Bài tập 0.1 Phân loại các biến sau đây: Điện tích của một vật, các bước sóng của ánh sáng mặt trời, bước sóng của tia gamma bức xạ từ phản ứng hạt nhân, quang electron, spin của electron, mômen từ của electron…. Q, quang electron, spin của electron là rời rạc 0.3- Phân bố (Distribution) Trong một biến cố (một lần đếm) của HTNN thì kết quả có thể chia ra nhiều nhóm (phân bố) khác nhau TD buồng khí có số nguyên tử (NT) bên trong là x = 50 chia 2 nhóm H2 có 20 NT (40%) và N2 có 30 NT (60%). Hình sau mô tả phân bố những elctron có E (Kev) khác nhau bị bức ra từ hiệu ứng quang điện Động năng (KeV): Phần lớn các phương pháp mô tả biến đơn là biểu diễn tần suất phân bố (a frequency distribution) theo hai cách là tỉ lệ % và biểu đồ Bài tập 0.2 Tính tỉ lệ và vẽ biểu đồ số bi: đỏ, cam, vàng, đen và trắng trên bàn. Đỏ :4/26 VÀNG 1/26 CAM 1/26 TRẮNG 8/26 ĐEN 12/26 0.4- Phân bố xác suất (PROBABILITY DISTRIBUTION) Với biến rời rạc Khi thống kê, ta đo biến cố nhiều lần và thu các kết quả rất khác nhau, mỗi kết quả thường có tần xuất lập lại khác nhau TD: khi gieo xúc xắc 100 lần có 25 lần xuất hiện mặt (6), 20 xuất hiện mặt (5), 10 xuất hiện mặt (4) , 17 xuất hiện mặt (3), 10 xuất hiện mặt (2), còn lại là số lần xuất hiện mặt (1) Các giá trị P = 25/100, 20/100… là biểu diễn phân bố xác suất của các lần gieo tương ứng các kết quả xuất hiện mặt ( x = 6, x = 5, x = 4…) Phân bố (xác suất) (PROBABILITY DISTRIBUTION) Hàm p(x) được gọi là hàm phân bố xác suất Giá trị p(x) thỏa : 0 và [2] 3- Tính Variance V = (- [2]) 4- Nếu có một tinh thể nano với 64 nguyên tố K nói trên, thì khối lượng nhỏ nhất có thể có của tinh thể nano là bao nhiêu 0-7 Biến Liên tục Continuous random variable Biến nhận mọi giá trị khả hữu liên tục. Thí dụ vận tốc chuyển động nhiệt của một hạt electron trong kim loại có giá trị dương và liên tục đến c = 3.108 m/v. Với biến liên tục, người ta xác định mật độ xác suất thông qua một khoảng của biến số TD: [-pi, pi ] Không xác định tại từng giá trị x riêng biệt. Nó được tính bởi vùng diện tích giới hạn ở dưới đường cong 0-8 Hàm phân bố liên tục (Continous distribution function) Là một hàm, P(X), được minh họa bởi đồ thị p(x) Thỏa mản hai tính chất : 1: Không âm (p(x) > 0 for all x) thống kê (STATISTICS) 2: Tồng diện tích = 1 chuẩn hóa (NORMALIZATON). Đường cong thỏa 2 tính chất trên là đường cong mất độ Bài tập 0.10 Kháo sát phân bố Gauss Tìm xác suất trong khoảng sau: 1 -  - 2 : 2,5% 2 - 2  - : 3 -   : 4    + : 5  +    + 2: 6  + 2 +  :2,5% 0-9 Phân bố đồng nhất The Uniform Distribution Là phân bố liên tục nhưng xác suất là như nhau cho mọi giá trị của x trong khoảng xác định [a,b] 0-10 Thiết lập công thức Gọi P(x) là mật độ xác suất thì Xác suất tìm x (từ x’ đến x’+dx): Xác suất tìm x (từ a to b): Điều kiện chuẩn hóa: Trị trung bình của hàm f(x) Độ lệch chuẩn Variance Cũng là Variance V = (- [2]) (Khác trường hợp biến rời rạc) Trong trường hợp biến liên tục ta không chia cho (n-1) như biến rời rạc Nhưng hàm phân bố phải được chuẩn hóa Bài tập 0.11 Liên quan Cơ lượng tử (quantum mechanics) Hàm sóng của electron trong hố thế vuông – Thế U: Giải PT Schrodinger ta có hàm phân bố: 1- vẽ P(x) (với n=2, x [0, a=2nm]) 2- Kiểm tra điều kiện chuẩn hóa 3- Tính xác suất tìm x trong đoạn [(a/4), (3a/4)] 4- Tương tự cho trường hợp n=3 Bài tập 0.12. Liên quan Cơ lượng tử Năng lượng hạt có giá trị Tính năng lượng trung bình của 30 hạt trong hố thế với phân bố như sau: P(En=1) =1/3; P(En=2) =1/2; P(En=1 ) =1/6 0.12 Phân bố chính tắc Normal distribution Phân bố có dạng hàm phân bố hình quả chuông. Còn được gọi là phân bố chính tắc- Gauss (như chùm ánh sáng đèn pin) Đặc điểm Tần suất lớn tập trung ở giữa, càng đi ra ngoài trung tâm xác suất càng nhỏ. Nghĩa là xác suất chỉ hội tụ ở vùng trung tâm, càng ra xa càng giảm nhanh. Tính chất Tính đối xứng (Symmetric): qua giá trị trung tâm Bài tập 0.13 So sánh các phân bố chính tắc Tìm sự khác nhau của các đồ thị đồng dạng Phân bố Gauss 0.14- Phân bố chính tắc chuẩn the standard normal distribution Có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1.0 Vùng tần suất lớn trong khoảng -3 and +3 Nếu biết phân bố chính tắc chuẩn  có thể tính được các hàm phân bố chính tắc khác Bài Tập 0.14: Vẽ đồ thị hàm phân bố Sử dụng số liệu từ file data-1.dat Lập trình matlab để vẽ hàm phân bố Từ hàm phân bố tính xác suất tìm hạt trong khoảng [-2 , +2] Tính độ lệch cấp và độ lệch chuẩn 0.15. Trị kỳ vọng (Expectation value) & Trị trung bình của hàm f(x)- RR Trị kỳ vọng của hàm f(x) bất kỳ, theo một biến ngẫu nhiên x, khi biết hàm phân bố theo tọa độ p(x) là: Trường hợp biến là rời rạc ta gọi đó là trị trung bình: Trường hợp biến là liên tục, ta gọi đó là trị kỳ vọng: Bài tập 0.15 Cho hàm phân bố (density function) của xác suất hạt theo tọa độ là p(x): p(x)=a. exp{-ax2}, với a = hằng số. Tính trị kỳ vọng của hàm lực tác dụng đàn hồi f(x) là hàm phụ thuộc x có dạng: f(x)= -2x2 + 1. Tức là xác định Lưu ý : Gaussian integral Tích phân Gauss Gaussian integral 0.16- Momen của mật độ xác suất (Moments of the PDF) Đó là các giá trị trung bình hay kỳ vọng (expectation values) cho hàm lũy thừa bậc n của biến x (random variable). Momen thứ n được tính bởi: Biến rời rạc Biến liên tục Bài tập 0.16 Cho hàm phân bố theo tọa độ: p(x)=a. exp{-ax2}, với a=const. Tính momen thứ nhì và thứ ba ; của hàm phân bố PDF 0.17- Tính đa nghiệm Multiple solutions Thông thường người ta cho hàm phân bố theo biến x (tọa độ) là P(x); và yêu cầu chuyển về hàm phân bố theo một biến khác của x. Ví dụ Tính phân bố xác suất P’ theo biến lực đàn hồi f (-kx). Ta có thể chọn được nhiều hàm phân bố khác nhau theo các biến khác f từ biến lúc đầu {Probability of P’(f(x))}. Tổng quát : có khả năng tìm ra các biến F khác nhau (là hàm của tọa độ x) có mật độ xác suất là PF và được tính bởi: (trường hợp rời rạc) Bài tập 0.17 Chuyển hàm phân bố: Cho hàm mật độ phân bố hạt theo tọa độ là p(x)= ln(x), và hàm thế năng F(x)=(1/x). Tính xác suất tìm hạt có thế năng P’(F) trong khoảng: [F, F + dF] 0.18- Thay hàm xác suất dùng biến đổi Fourier (Fourier transform FT) Hàm đặc tính (the characteristic function). Với biến liên tục, ta định nghĩa nó bằng phép biến đổi Fourier của hàm mật độ p(x) trong không gian số sóng (k: wave number). Ta gọi đó là hàm mật độ trong không gian k Hàm mật độ có thể khôi phục (recovered) từ hàm đặc tính qua phép biến đổi Fourier ngược (inverse Fourier transform) Bài tập 0.18 cho hàm phân bố theo không gian (1D): p(x)=a. exp{-ax2}, với a=const. Tính hàm đặc tính trong không gian K (số sóng) 0.19- Momen và biến đổi Fourier Moments and FT relation Moment của hàm phân bố có được bằng cách khai triển (expanding) p(k) quanh điểm x0 bằng hàm mũ k theo công thức: Moment của hàm phân bố quanh điểm bất kỳ x0 được tạo ra bằng cách khai triển Bài tập 0.19 Cho hàm phân bố tọa độ p(x)=a.sin(x), với a=const, x [0,+] tính P(k) Khai triển P(k) ở dạng moment bậc 3 của hàm phân bố 0.20- Logarithm của hàm đặc tính Logarithm của hàm đặc tính là biến đổi fourier của hàm phân bố theo tọa độ được định nghĩa là: Quan hệ của Logarithm của hàm đặc tính và moment được xác định qua biểu thức: 0.21- Trung bình, phương sai… Mean, variance, skewness and curtosis Đó là bốn logarith đầu tiên của hàm phân bố và được tính qua các moment như sau: Bài tập 0.20 Cho hàm phân bố: p(x)=a.sin(x), với a=const, x [0,+] tính Mean, variance, skewness, curtosis 0.22- Hàm phân bố Gauss (Gaussian distribution) Hàm chuẩn hóa theo biến liên tục tọa độ x, Hàm đặc tính của hàm Gaussian có dạng: Logarithm của biến đổi Fourier Bài tập 0.21 Vẽ hàm phân bố Gauss với =1,  =2 Dùng công thức chứng minh: Trao đổi và củng cố Các vấn đề chưa thông suốt ??