Thống kê sinh học

Dấu hiệu quan sát Trong Lâm nghiệp khi nghiên cứu một vấn đề nào đó về mặt định lượng người ta đều phải quan sát, thu thập số liệu, hoặc làm một số thí nghiệm có liên quan và sau cùng thu thập những kết quả.

pdf66 trang | Chia sẻ: tranhoai21 | Lượt xem: 1594 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Thống kê sinh học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
THỐNG KÊ SINH HỌC GVGD: Th.S. Cao Thị Thu Hiền Generated by Foxit PDF Creator © Foxit Software For evaluation only. +Chương 1 THỐNG KÊ MÔ TẢ Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.1. Dấu hiệu quan sát Trong Lâm nghiệp khi nghiên cứu một vấn đề nào đó về mặt định lượng người ta đều phải quan sát, thu thập số liệu, hoặc làm một số thí nghiệm có liên quan và sau cùng thu thập những kết quả. Ví dụ 1: muốn nghiên cứu tốc độ sinh trưởng của loài Bạch đàn bằng một biện pháp kỹ thuật nào đó thì người ta tiến hành hai thí nghiệm: Generated by Foxit PDF Creator © Foxit Software For evaluation only. một trồng theo biện pháp kỹ thuật mới và một đối chứng. Sau một thời gian thu thập kết quả về sinh trưởng đường kính, chiều cao của cả hai thí nghiệm để so sánh và đánh giá kết quả. Ví dụ 2: Để nghiên cứu ảnh hưởng của độ ẩm đối với sự nảy mầm của hạt Keo, người ta đem gieo loại hạt giống này trên những lô đất có độ ẩm khác nhau (những điều kiện khác như nhau) Generated by Foxit PDF Creator © Foxit Software For evaluation only. Từ tỷ lệ hạt nảy mầm và không nảy mầm của các lô hạt thí nghiệm có thể giúp ta so sánh kết quả và từ đó rút ra kết luận xem ở độ ẩm nào cho độ nảy mầm cao hơn. Như vậy qua hai ví dụ trên cho thấy để đạt mục đích nghiên cứu cần phải tiến hành làm một số thí nghiệm và sau cùng quan sát hoặc đo đếm những kết quả đã đạt được. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Trong “Thống kế sinh học” người ta gọi chung những đại lượng hoặc những tính chất nào đó cần phải quan sát hoặc đo đếm là dấu hiệu quan sát. Như vậy, ở ví dụ 1 thì dấu hiệu quan sát là chiều cao hoặc đường kính, ở ví dụ 2 thì dấu hiệu quan sát là chất lượng nảy mầm của hạt giống. Kí hiệu dấu hiệu quan sát về lượng bằng chữ X (hoặc Y, Z) Generated by Foxit PDF Creator © Foxit Software For evaluation only. * Các loại dấu hiệu quan sát: Có 2 loại là dấu hiệu về lượng và dấu hiệu về chất. Dấu hiệu quan sát về lượng (đại lượng, biến định lượng): Là đại lượng có thể điều tra, đo đếm một cách chính xác bằng các dụng cụ điều tra (cân, đong, đo, đếm). Generated by Foxit PDF Creator © Foxit Software For evaluation only. Dấu hiệu quan sát về lượng lại được chia ra làm 2 loại là đại lượng liên tục và đại lượng đứt quãng. Đại lượng liên tục là những đại lượng có thể lấy giá trị bất kỳ trong khoảng xác định. Ví dụ như đường kính, chiều cao, hình số, Đại lượng đứt quãng là những đại lượng chỉ lấy giá trị là những số tròn, nguyên dương, đếm được. Ví dụ: Số sâu/lá, số cành/cây, số lá/cành, Generated by Foxit PDF Creator © Foxit Software For evaluation only. Dấu hiệu quan sát về chất (biến định tính) phân biệt với nhau là đặc điểm hoặc tính chất nào đó. Dấu hiệu quan sát về chất cũng được chia làm 2 loại là có thứ bậc và không có thứ bậc. Ví dụ: Số hạt này mầm và số hạt không nảy mầm hay số sản phẩm được sản xuất ra từ 1 cỗ máy có màu sắc khác nhau, . Được gọi là không có thứ bậc. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Ví dụ: vị trí chân đồi, sườn đồi, đỉnh đồi là có thứ bậc Câu hỏi: Có thể chuyển đại lượng đứt quãng thành đại lượng liên tục không? + Có thể chuyển dấu hiệu quan sát về chất thành dấu hiệu quan sát về lượng được không? Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.2. Tổng thể và mẫu 1.2.1. Tổng thể Tổng thể là một tập hợp hữu hạn hoặc vô hạn các phần tử (gọi là dung lượng tổng thể) có cùng một số tính chất chung nào đó. Ví dụ 1: Tập hợp các cây rừng trong một khu rừng rộng lớn Ví dụ 2: Số sinh viên của trường Đại học LN Dung lượng tổng thể ký hiệu là N Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.2.2. Mẫu Mẫu được rút ra từ tổng thể, là hình ảnh của tổng thể, dung lượng mẫu luôn luôn hữu hạn. Dung lượng mẫu ký hiệu là n 1.3. Một số phương pháp rút mẫu 1.3.1. Rút mẫu ngẫu nhiên Có 2 cách: Phương pháp rút thăm và dùng bảng số ngẫu nhiên. Generated by Foxit PDF Creator © Foxit Software For evaluation only. * Phương pháp rút thăm: Ở phương pháp này, các phần tử của tổng thể được đánh số thứ tự từ 1 đến hết (1, 2, 3, , N) rồi dùng các thăm cũng được đánh số tương tự (1, 2, 3,, N). Phần tử được quan sát, đo đếm là phần tử có số hiệu trùng với số hiệu của thăm được bốc ngẫu nhiên. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Ưu điểm: Khách quan, dễ thực hiện, đảm bảo hoàn toàn ngẫu nhiên Nhược điểm: Các phần tử ở mẫu có thể không phân bố đều trong tổng thể, rất khó thực hiện khi số phần tử của tổng thể là quá lớn. * Dùng bảng số ngẫu nhiên Là 1 bảng gồm các dãy số nguyên gồm hay nhiều chữ số được thiết lập một cách ngẫu nhiên từ 10 số: 0, 1, 2, 3, , 9. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Để thiết lập một mẫu ngẫu nhiên bằng bảng số ngẫu nhiên, phải đánh số các phần tử của tổng thể từ 1 đến hết, rồi dùng bảng số ngẫu nhiên để chọn các phần tử. Ví dụ: Muốn dùng bảng số ngẫu nhiên để lấy 1 mẫu gồm 10 phần tử từ 1 tổng thể 100 phần tử. Trước hết đem các phần tử của tổng thể đánh dấu từ 1 đến 100. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Ta dùng bảng số ngẫu nhiên đọc trên bảng 1 dãy các con số có 2 chữ số và làm tiếp tục như vậy cho đến khi có được 10 số. Mẫu của ta là những phần tử tương ứng với các số đó. Ưu điểm: Mẫu ngẫu nhiên khách quan, đảm bảo độ tin cậy cao, có thể tính sai số rút mẫu bằng các tiêu thức thống kê. Nhược điểm: Phương pháp này ít được dùng trong lâm nghiệp vì những tổng thể lâm nghiệp có số lượng Generated by Foxit PDF Creator © Foxit Software For evaluation only. phần tử quá lớn rất khó khăn trong việc đánh số các phần tử của nó. 1.3.2. Rút mẫu hệ thống Đây là phương pháp thường được dùng trong lâm nghiệp, người ta đưa ra những quy tắc cách đều theo không gian hoặc thời gian, từ đó định ra những phần tử cho chúng ta chọn mẫu. Ví dụ: tiến hành đo cây: Cứ 5 ngày người ta đo 1 lần về D, H (phương pháp này được gọi là cách đều theo thời gian). Generated by Foxit PDF Creator © Foxit Software For evaluation only. Ở phương pháp này, trên diện tích rừng người ta kẻ nhiều đường thẳng song song cách đều và trên đo đặt những ô cách đều có diện tích như nhau để tiến hành quan sát các đại lượng như đường kính, chiều cao ... Ví dụ như hình vẽ sau: Generated by Foxit PDF Creator © Foxit Software For evaluation only. Ưu điểm: Các phần tử ở mẫu rải đều, trong tổng thể tính đại diện của mẫu cao. Nhược điểm: Tính hệ thống sẽ bị vi phạm nếu gặp các chướng ngại vật khi mở tuyến và đặt ô quan sát. 1.3.3. Chọn mẫu điển hình Trong một khu rừng người ta chọn hẳn cả một giải rừng mang tính chất điển hình cho đại lượng quan sát để thu thập số liệu. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Ưu điểm: Đơn giản, dễ thực hiện Nhược điểm: Ít khách quan, độ chính xác phụ thuộc vào kinh nghiệm của điều tra viên. Phương pháp này không tính được sai số chọn mẫu. 1.4. Mô tả đại lượng quan sát bằng bảng tần số Trong nhiều trường hợp nghiên cứu về rừng người ta cần tìm hiểu những quy luật phân bố tần số hoặc tần suất tồn tại một cách khách quan. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Chẳng hạn muốn xây dựng được những phương pháp đo tính trữ sản lượng cho một khu rừng nào đó, việc tìm hiểu những quy luật kết cấu của cây rừng như quy luật phân bố số cây theo chiều cao (N/HVN) hoặc theo đường kính (N/D1.3) là rất cần thiết. Ở những điều kiện xác định nào đó những quy luật này có thể biểu thị bằng một dạng toán học khá chính xác đủ phục cho những mục đích thực tiễn. Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.4.1. Định nghĩa phân bố lý thuyết Những quy luật phân bố tồn tại một cách khách quan trong tổng thể và có thể biểu thị một cách gần đúng bằng một biểu thức toán học gọi là quy luật phân bố lý thuyết. 1.4.2. Định nghĩa phân bố thực nghiệm Phân bố giá trị của các phần tử quan sát được ở một mẫu thí nghiệm và từ đó có thể khái quát hóa thành những dạng lý thuyết, người ta gọi là phân bố thực nghiệm. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Xây dựng được phân bố thực nghiệm để từ đó có thể khái quát hoá thành những phân bố lý thuyết là một trong những nhiệm vụ rất cơ bản của người làm thồng kê. Song làm thế nào để có thể phát hiện được những quy luật khách quan trên cơ sở những tài liệu quan sát. Để giải quyết vấn đề này điều cơ bản là các số liệu quan sát được phải đem sắp xếp lại theo một quy tắc nào đó. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Ví dụ sắp xếp các giá trị quan sát theo thứ tự từ nhỏ đến lớn và thống kê số những phần tử có cùng một giá trị (đối với đại lượng đứt quãng) hoặc thống kê những phần tử có những giá trị chứa trong những khoảng xác định (đối với đại lượng liên tục). Cách làm như vậy gọi là phân tổ tài liệu quan sát. Việc phân tổ tài liệu quan sát ngoài ý nghĩa trên còn giúp cho việc Generated by Foxit PDF Creator © Foxit Software For evaluation only. * Chú ý khi chỉnh lý tài liệu quan sát 1) Nếu tài liệu không nhiều quá 30 thì không nên phân tổ vì phân tổ sẽ làm giảm độ chính xác của tài liệu. 2) Đối với đại lượng liên tục số tổ chia cũng không nên nhiều quá. Nhiều quá không thể hiện được quy luật. Ít quá quy luật sẽ bị phá hoại. Theo Brooks và Carruther số tổ có thể tính theo công thức: Generated by Foxit PDF Creator © Foxit Software For evaluation only. Số tổ: m = 5.lg(n) Cự li tổ: 3) Những trị số nào trùng giới hạn trên hoặc giới hạn dưới của tổ thì có thể bỏ ở tổ trên hoặc tổ dưới nhưng phải có sự nhất quán trong cả quá trình phân tổ. Ví dụ: Bảng 1.3 (trang 8) m xx k minmax   Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.4.3. Lập phân bố thực nghiệm a)Đối với đại lượng đứt quãng B1: Xắp xếp các trị số quan sát theo thứ tự từ bé đến lớn. B2: Lập bảng phân bố tần số và tần xuất thực nghiệm. Thống kê các phần tử có cùng giá trị theo kiểu kiểm phiếu bầu cử. B3: Tính tần số và tần xuất thực nghiệm. B4: Vẽ biểu đồ. Generated by Foxit PDF Creator © Foxit Software For evaluation only. b) Đại lượng liên tục B1: Chia tổ, ghép nhóm theo công thức kinh nghiệm: Số tổ được chia m = 5.lg(n) Với n là dung lượng mẫu Cự li tổ: xmax: Giá trị lớn nhất của dãy trị số quan sát. xmin: Giá trị bé nhất của dãy trị số quan sát. k: Khoảng cách giữa các tổ (cự li tổ). m xx k minmax·   Generated by Foxit PDF Creator © Foxit Software For evaluation only. B2: Lập bảng phân bố tần suất và tần số. Thống kê các phần tử có cùng giá trị theo kiểu bầu cử (kiểm phiếu bầu cử). B3: Tính fi và tần số luỹ tích F (cộng dồn). B4: Vẽ biểu đồ: Đa giác tần số, hình chữ nhật, luỹ tích. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Quy trình lập bảng tần số bằng Excel như sau: QT1.1 (E) 1. Tools/Data analysis/Histogram 2. Khai báo dãy số liệu quan sát chưa qua phân tổ vào Input range 3. Khai báo dãy số liệu được chia theo tổ (để ở một cột) vào Bin range 4. Đánh dấu vào các mục cần thiết như Cumulative Percentage, Chart output 5. Chọn một cell bất kỳ để xuát kết quả 6. Ok Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.4. Mô tả đại lượng quan sát bằng biểu đồ Có 3 loại biểu đồ thường dùng: biểu đồ đa giác tần số, biểu đồ chữ nhật và biểu đồ lũy tích 1.4.1. Biểu đồ đa giác tần số Dùng để biểu thị phân bố tần số của những đại lượng đứt quãng, trục hoành biểu thị các giá trị quan sát (giá trị giữa cỡ) và trục tung biểu thị tần số (hoặc tần suất) tương ứng. Ví dụ: Vẽ biểu đồ cho ví dụ 1.3 (trang 8) Generated by Foxit PDF Creator © Foxit Software For evaluation only. Đối với đại lượng liên tục nếu muốn biểu thị bằng biểu đồ đa giác thì trục hoành biểu thị bằng trị số giữa tổ. 1.4.2. Biểu đồ chữ nhật Biểu đồ này để biểu thị quy luật phân bố thực nghiệm của đại lượng liên tục. Trong biểu đồ này đáy của mỗi hình chữ nhật biểu thị trị số giữa tổ và chiều cao hình chữ nhật biểu thị tần số (hoặc tần suất) tương ứng. Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.4.3. Biểu đồ lũy tích Trục hoành biểu thị giá trị giữa cỡ, trục tung biểu thị tần số tương ứng. 1.5. Các đặc trưng mẫu 1.5.1. Đặc trưng vị trí Có 4 chỉ tiêu thống kê: Số trung bình mẫu, số trung bình toàn phương, trung vị mẫu, mode. Generated by Foxit PDF Creator © Foxit Software For evaluation only. a) Số trung bình mẫu: Giả sử có 1 dãy các trị số quan sát x1, x2, x3,., xn thì trị số: được gọi là số trung bình mẫu Trong trường hợp chỉnh lý tài liệu quan sát thì số trung bình mẫu được tính theo công thức sau: x      n i in x n xxxx n x 1 321 . 1 .... 1    m i ii xf n x 1 .. 1 Generated by Foxit PDF Creator © Foxit Software For evaluation only. b) Số trung bình toàn phương: Cho một dãy các trị số z1, z2, z3, zn thì trị số được tính theo công thức: Gọi là số trung bình toàn phương Trong lâm nghiệp người ta đã vận dụng số trung bình này để tính đường kính thân cây trung bình về tiết diện ngang ở độ cao 1.3m. z z    n i iz n z 1 2 . 1 Generated by Foxit PDF Creator © Foxit Software For evaluation only. Ví dụ: Đường kính ngang ngực của 5 cây được cho như sau: d1 = 10,5 cm d2 = 11,0 cm d3 = 9,8 cm d4 = 10,8 cm d1 = 8,8 cm Ta tính tiết diện ngang g cho các cây theo công thức sau: 2 . 4 ii dg   Generated by Foxit PDF Creator © Foxit Software For evaluation only.    n i id n d 1 22 . 1 . 44  2 . 4 ii dg      n i id n d 1 22 . 1    n i ig d n d 1 2 . 1 Generated by Foxit PDF Creator © Foxit Software For evaluation only. c) Trung vị mẫu Trị số tương ứng với phần tử thứ i thoả mãn điều kiện: số phần tử có giá trị lớn hơn và nhỏ hơn bằng nhau khi dãy quan sát được sắp xếp theo thứ tự từ nhỏ đến lớn thì được gọi là trung vị mẫu. Khi các trị số quan sát sắp xếp theo thứ tự từ nhỏ đến lớn. Nếu số lần quan sát n là lẻ (n = 2p + 1) thì tương ứng với phần tử thứ p + 1. x x x Generated by Foxit PDF Creator © Foxit Software For evaluation only. Trong trường hợp đại lượng quan sát đứt quãng mà n chẵn thì số trung vị mẫu không tồn tại mà chỉ tồn tại khoảng trung vị. Trường hợp đại lượng liên tục đã qua phân tổ thì số trung vị được xác định theo công thức: Trong đó: xi là trị số giới hạn dưới của tổ chứa xi+1 là trị số giới hạn trên của tổ chứa                i ii i n xx Ni n xx 1. 2 x x Generated by Foxit PDF Creator © Foxit Software For evaluation only. ni là tần số của tổ chứa Ni là tần số luỹ tích đến giới hạn trên của tổ chứa d) Mode Mốt là trị số ứng với tần số cao nhất x x Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.5.2. Đặc trưng biến động: Có 4 chỉ tiêu thống kê là phương sai mẫu, sai tiêu chuẩn mẫu, hệ số biến động, phạm vi biến động. a) Phương sai và sai tiêu chuẩn mẫu + Sai tiêu chuẩn (độ lệch chuẩn) là số bình quân toàn phương về độ lệch giữa các giá trị quan sát với số trung bình của nó, công thức hiệu đính được viết như sau:       n i i xx n S 1 2 1 1 Generated by Foxit PDF Creator © Foxit Software For evaluation only. Trường hợp mẫu nhỏ n < 30, tài liệu chưa qua chỉnh lý: Với Qx là tổng biến động 1  n Qx S            n i n i i i n x xQx 1 2 12 Generated by Foxit PDF Creator © Foxit Software For evaluation only. Trường hợp mẫu lớn , tài liệu đã qua chỉnh lý: Ý nghĩa: Sai tiêu chuẩn cho biết mức độ phân hoá giữa các trị số quan sát so với trị số trung bình.           n fix fixQx i i 2 2 1  n Qx S Generated by Foxit PDF Creator © Foxit Software For evaluation only. + Phương sai: Là bình phương của sai tiêu chuẩn b) Hệ số biến động S% Hệ số biến động là chỉ tiêu biểu thị mức độ biến động bình quân tương đối của dãy trị số quan sát. 100.% x S S  Generated by Foxit PDF Creator © Foxit Software For evaluation only. c) Phạm vi biến động Phạm vi biến động là khoảng chênh lệch giữa trị số quan sát lớn nhất và trị số quan sát bé nhất. R = xmax - xmin 1.5.3. Các đặc trưng hình dạng Có 2 chỉ tiêu thống kê: Độ lệch, độ nhọn a) Độ lệch Sk Để biểu thị cho mức độ chênh lệch của đỉnh đường cong so với số trung bình người ta Generated by Foxit PDF Creator © Foxit Software For evaluation only. dùng chỉ tiêu thống kê là độ lệch phân bố. Khi SK = 0, phân bố đối xứng Khi SK > 0, đỉnh đường cong thực nghiệm lệch trái so với số trung bình. Khi SK < 0, đỉnh đường cong thực nghiệm lệch phải so với số trung bình.   3 3 .Sn xx S i k    Generated by Foxit PDF Creator © Foxit Software For evaluation only. b) Độ nhọn Để đặc trưng cho mức độ tập trung hay phân tán của các trị số quan sát xung quanh trị số trung bình, người ta dùng chỉ tiêu thống kê là độ nhọn. Khi EX = 0, phân bố thực nghiệm tiệm cận phân bố chuẩn. Khi EX > 0, phân bố thực nghiệm nhọn so với phân bố chuẩn.   3 . 4 4     Sn xx E i x Generated by Foxit PDF Creator © Foxit Software For evaluation only. Khi EX < 0, phân bố thực nghiệm bẹt so với phân bố chuẩn. 1.5.4. Các đặc trưng sai số rút mẫu a) Sai số của số trung bình mẫu b) Hệ số chính xác Nói lên sai số tương đối của số trung bình n S S x  n S P % %  Generated by Foxit PDF Creator © Foxit Software For evaluation only. 1.6. Tính trung bình và độ lệch chuẩn của những mẫu quan sát về chất Giả sử 1 tổng thể nào đó có N phần tử chia làm 2 loại, trong đó có M phần tử mang đặc điểm A, N - M phần tử mang đặc điểm khác A, người ta gọi tỷ số: P = M/N là thành số tổng thể của những phần tử mang đặc điểm A. Tỷ số Q = (N – M)/N = 1 – P được gọi là thành số tổng thể của những phần tử mang đặc điểm khác A. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Từ tổng thể rút ngẫu nhiên 1 mẫu với dung lượng đủ lớn n ≥ 30, trong đó có m phần tử mang đặc điểm A, n - m phần tử mang đặc điểm khác A, thì tỷ số: p = m/n được gọi là thành số mẫu của những phần tử mang đặc điểm A. Tỷ số q = (n – m)/n = 1 – p được gọi là thành số mẫu của những phần tử mang đặc điểm khác A. Generated by Foxit PDF Creator © Foxit Software For evaluation only. Bây giờ nếu gán cho phần tử mang đặc điểm A giá trị là 1 và phần tử mang đặc điểm khác A giá trị 0 thì ta có bảng phân bố tần số thực nghiệm sau: X Số quan sát n1 Tần suất 1 m 0 n-m n 1,00 n m p  p n mn q    1 Generated by Foxit PDF Creator © Foxit Software For evaluation only. Số trung bình của mẫu quan sát về chất: Độ lệch chuẩn của mẫu quan sát về chất: n m n mmn xf n x i ii      2 1 .1).(01     2 1 2` 1 i ii xxf n S n n m m n m mn S 22 ~ )1()0)((   Generated by Foxit PDF Creator © Foxit Software For evaluation only. nmn n m S   . ~ Generated by Foxit PDF Creator © Foxit Software For evaluation only. Chương 2 Phương pháp ước lượng các tham số của tổng thể Generated by Foxit PDF Creator © Foxit Software For evaluation only. 2.1. Đặt vấn đề Các tham số của tổng thể thường là không biết được nhưng lại là đối tượng nghiên cứu của ta. Phương pháp nghiên cứu cơ bản là dựa vào quan sát ở mẫu để suy luận các tham số tổng thể. 2 phương pháp cơ bản để suy luận là phương pháp ước lượng thống kê và phương pháp kiểm định các giả thuyết thống kê. Generated by Foxit PDF Creator © Foxit Software For evalua