Tin học ứng dụng trong công nghệ sinh học thực phẩm

Giúp sinh viên độc lập trong nghiên cứu khoa học, có khả năng xử lý số liệu thường gặp trong điều tra, nghiên cứu trong công nghệ sinh học thực phẩm Trang bị cho sinh viên kỹ năng sử dụng phần mềm tin học trong việc giải quyết xử lý, trình bày số liệu và giải quyết một số bài toán trong công nghệ

ppt297 trang | Chia sẻ: ttlbattu | Lượt xem: 4704 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Tin học ứng dụng trong công nghệ sinh học thực phẩm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TIN HỌC ỨNG DỤNG TRONG CNSHTP Mục tiêu Giúp sinh viên độc lập trong nghiên cứu khoa học, có khả năng xử lý số liệu thường gặp trong điều tra, nghiên cứu trong công nghệ sinh học thực phẩm Trang bị cho sinh viên kỹ năng sử dụng phần mềm tin học trong việc giải quyết xử lý, trình bày số liệu và giải quyết một số bài toán trong công nghệ Tài liệu tham khảo Nguyễn Ngọc Kiểng, Thống kê học trong nghiên cứu khoa học, NXB Giáo dục, 1996. Lê Đức Ngọc, Xử lý số liệu và kế hoạch hóa thực nghiệm, Khoa Hóa, ĐHQGHN, 2001. Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB Đại học Quốc gia, 2004 Phan Hiếu Hiền, Phương pháp bố trí nghiệm và xử lý số liệu, NXB Nông nghiệp, 2001 Noäi dung Tin học ứng dụng trong CNSHTP Mô tả đại lượng thống kê bằng phần mềm tin học Mô tả dữ kiện thí nghiệm bằng phần mềm tin học Bố trí thí nghiệm nghiên cứu thực phẩm Xử lý số liệu thí nghiệm kiểu hoàn toàn ngẫu nhiên bằng phần mềm Statgraphics Noäi dung Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm đa yếu tố bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm hồi quy và tương quan tuyến tính bằng phần mềm Statgraphics Giải một số bài toán công nghệ bằng phần mềm EXCEL 1. Tin học ứng dụng trong CNSHTP Tin học ứng dụng trong nghiên cứu thực phẩm Phần mềm ứng dụng trong bảng tính Phần mềm ứng dụng trong xử lý thống kê Phần mềm ứng dụng trong biểu diễn công thức hóa học 1.1 Tin học ứng dụng trong nghiên cứu thực phẩm Trong mọi ngành khoa học thực nghiệm: thực tế thí nghiệm kết quả bằng số Kết quả bằng số: là giá trị của một biến ngẫu nhiên phụ thuộc vào nhiều yếu tố ước lượng được qui luật phụ thuộc (nghiên cứu trên một tập hợp mẫu với độ tin cậy nào đó) Xử lý số liệu dữ liệu thô - tính toán, sắp xếp - dữ liệu tinh làm cơ sở cho việc diễn giải, phân tích thống kê 1.2 Phần mềm ứng dụng trong bảng tính Phần mềm bảng tính EXCEL Tạo biểu bảng số liệu Biễu diễn số liệu dưới dạng biểu đồ Xử lý thống kê số liệu nghiên cứu Bảng phân phối tần số Sắp xếp, trình bày dữ liệu một cách có hệ thống Phân chia dữ liệu thành từng nhóm khác nhau Căn cứ để hình thành biểu đồ phân phối tần số Sơ đồ tổng quát của bảng phân phối tần số Sơ đồ tổng quát của bảng phân phối tần số Sơ đồ tổng quát của bảng phân phối tần số Biểu đồ trong thống kê Biểu diễn toàn bộ số liệu Thể hiện nét đặc trưng của tập hợp số liệu Biểu diễn mối quan hệ giữa tính trạng nghiên cứu và chỉ tiêu theo dõi Biểu đồ phân phối tần số Biểu đồ cột Trình bày số quan sát lớn Có thể trình bày tần số tương đối, tần số tích lũy, tần số tương đối tích lũy Biểu đồ phân phối tần số Biểu đồ phân phối tần số Biểu đồ tần số tích lũy Biểu đồ tần số tương đối tích lũy Biểu đồ hộp Khảo sát sơ lược dữ liệu Tổng quát về phân phối của mẫu/ tổng thể thể hiện ví trí tập trung, phân tán, bất thường Biểu đồ hộp Biểu đồ hộp Khối hộp ‘box’ kéo dài từ giá trị phân vị ¼ đến giá trị phân vị ¾ , khoảng 50% giá trị nẳm trong ‘box’ Đường thẳng đứng ở vị trí trung bị mẫu, chia dãy số liệu thành 2 phần bằng nhau, nếu mẫu phân bố đối xứng thì đường này nằm gần trung tâm của khối hộp Biểu đồ hộp Dấu + ở vị trí trung bình của mẫu Sự khác biệt đáng kể giữa trung bình và trung vị cho thấy có một vài số liệu có khả năng gây ra sai số làm phân bố của mẫu bị lệch Đoạn thẳng hai đầu gọi là ‘whisker’ nối từ giá trị cực tiểu đến điểm phân vị ¼ và từ điểm phân vị ¾ đến giá trị cực đại Biểu đồ điểm 1.3 Phần mềm ứng dụng trong xử lý thống kê Phần mềm xử lý thống kê Statgraphics Thao tác cơ bản trong phần mềm Xử lý thống kê số liệu nghiên cứu Thao tác sao chép kết quả xử lý vào phần mềm văn bản WORD 1.4 Phần mềm ứng dụng trong biểu diễn công thức hóa học Phần mềm ChemWindow Thao tác cơ bản trong phần mềm 2. Mô tả đại lượng thống kê bằng phần mềm tin học Phân tích thống kê Đại lượng đo lường xu hướng trung bình Đại lượng đo lường sự biến thiên Xác định các đại lượng thống kê bằng phần mềm tin học 2.1 Phân tích thống kê Các con số tóm lược thông tin định lượng Phương pháp tính toán để giúp chúng ta tóm lược hoặc khái quát hoá thông tin Kỹ thuật giúp quyết định vấn đề như phân tích phương sai, tương quan hồi qui, trắc nghiệm, … Hạn chế của thống kê Sử dụng thống kê phải biết rành về lĩnh vực chuyên môn của người nghiên cứu Thống kê chỉ là phương tiện, công cụ Thống kê trình bày những số liệu hoặc hiện tượng rời rạc một cách hệ thống hơn, chứ không nói được bản chất của sự việc Thống kê không thay thế được cho suy nghĩ và kết luận của người nghiên cứu Thống kê mô tả Là một trong những bước đầu tiên để phân tích vấn đề và thực hiện một quyết định. Gồm các tính toán cơ bản mang tính chất mô tả như trung bình, phương sai, độ lệch chuẩn, … nhằm tổng kết về kết quả của thí nghiệm. Thống kê mô tả Phương pháp tóm lược thông tin để làm cho chúng trở nên dễ hiểu tức giảm một số lớn các số liệu phức tạp thành một số nhỏ hơn gồm các giá trị tóm tắt Mô tả mối quan hệ giữa các biến số Thống kê suy diễn Khái quát hoá thông tin của một mẫu cho toàn dân số của mẫu tức là chỉ đo đếm trên một tiểu tập hợp rồi suy luận cho toàn bộ với một độ tin cậy nào đó Cung cấp kỹ thuật để kiểm tra trên một mẫu và sử dụng thông tin này để suy rộng ra các đặc tính của toàn bộ dân số 2.2 Đại lượng đo lường xu hướng trung bình Mốt (mode) Trung vị (median) Trung bình cộng (average) Trung bình nhân (geometric mean) Mode: (Mo) Là giá trị xuất hiện nhiều nhất trong một biến số Ví dụ: Phân phối xác suất: 5, 6, 7, 7, 8, 8, 8, 9, 10 có mode là 8 Dùng để đo độ tập trung Không phụ thuộc vào giá trị ở 2 đầu của dãy số Mode: (Mo) Biến số đơn thức là biến số khi gần như mọi trường hợp đều tập trung về một giá trị Biến số nhị thức là biến số khi gần như có hai hay nhiều trường hợp nhất và gần như tương đương nhau Số trung vị: (Me) số nằm ở chính giữa khi dãy số xếp từ nhỏ - lớn Là giá trị chia đôi tổng số các giá trị của biến số thành 2 phần bằng nhau cho kết quả nhanh về ước lượng trung bình. Trung bình cộng Cộng các giá trị của các trường hợp và chia cho tổng trường hợp Trường hợp dị biệt có thể làm trung bình mất đi tính đại diện Tổng các độ lệch giữa các giá trị với trung bình luôn bằng 0 Tổng các độ lệch bình phương có giá trị nhỏ nhất Trung bình cộng Đại diện cho cả một tập hợp lớn số liệu Nêu lên đặc điểm chung nhất của hiện tượng Dùng để so sánh các hiện tượng không có cùng qui mô Trung bình cộng số học Trung bình có trọng số Là trường hợp đặc biệt của trung bình số học khi gía trị của biến xuất hiện nhiều lần Trung bình của dữ liệu phân nhóm có khoảng cách mi là trị số giữa của nhóm i fi tần số của nhóm i Trung bình nhân (trung bình hình học) GM Căn bậc n cho n giá trị Thay cho trung bình cộng trong trường hợp dãy số liệu có phân phối lệch (giá trị đột biến) Phần tư vị (quartile) Xếp dữ kiện từ nhỏ đến lớn, chia dãy n dữ kiện làm 4 phần Phần tư vị dưới (low quartile): lấy giá trị của đơn vị ở vị trí ¼ (25%) dãy dữ kiện. Phần tư vị trên (upper quartile): lấy giá trị của đơn vị ở vị trí ¾ (75%) dãy dữ kiện. 2.3 Đại lượng đo lường sự biến thiên Phương sai Độ lệch chuẩn Hệ số biến dị Độ lệch Độ nhọn Phương sai (variance) Phương sai là trung bình của các độ lệch bình phương giữa các giá trị so với giá trị trung bình. Phương sai Tính giá trị trung bình Trừ giá trị trung bình cho từng giá trị (hiệu số) Bình phương từng hiệu số Cộng các hiệu số được bình phương Lấy tổng của các hiệu số bình phương chia tổng giá trị Ý nghĩa của phương sai Nếu các giá trị được phân phối một cách dàn trãi trên diện rộng và cách xa trung bình thì độ lệch sẽ lớn và phương sai sẽ rất lớn Nếu các giá trị quần tụ gần giá trị trung bình thì độ lệch sẽ nhỏ và phương sai sẽ nhỏ. Độ lệch chuẩn (standard deviation) Biểu thị mức độ phân tán (cùng bản chất của tính trạng) Độ lệch càng lớn mức độ phân tán càng cao, tính đại diện trung bình càng nhỏ Độ lệch chuẩn Là căn bậc hai của phương sai Mô tả biến thiên Mô tả biến thiên chính là đo lường sự khác biệt của các giá trị với một giá trị chuẩn nào đó tức là điểm trung bình Mô tả biến thiên Mô tả biến thiên Mô tả biến thiên Mô tả biến thiên Thông thường làm tròn giá trị của độ lệch chuẩn và phương sai ở chữ số thập phân thứ 2 Biến thiên càng lớn thì độ lệch chuẩn và phương sai càng lớn Khi viết báo cáo kết quả phân tích thống kê, thường dùng độ lệch chuẩn Hệ số biến dị So sánh mức độ phân tán của các tính trạng có bản chất khác nhau Độ lệch (skewness) Là tiêu chuẩn đánh giá tính đối xứng của số liệu Độ lệch = 0 (đối xứng) Độ lệch > 0 (các giá trị có xu hướng tập trung về phía bên phải của đồ thị) Độ lệch 0 (phân bố có đồ thị nhọn hơn phân bố chuẩn) Độ nhọn 3,29 kết luận có khác biệt ở 95% Xử lý số liệu thí nghiệm kiểu hoàn toàn ngẫu nhiên bằng phần mềm Statgraphics Nhập dữ liệu Chọn lệnh xử lý Đọc kết quả Chép kết quả vào WORD Kiểu thí nghiệm khối ngẫu nhiên đầy đủ (RCBD - Randomzied complete block design) Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics 6. Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics điều kiện ngoại cảnh không được kiểm soát Điều kiện ngoại cảnh tác động làm sai số của thí nghiệm tăng lên 6.1 Kiểu thí nghiệm khối ngẫu nhiên đầy đủ ĐVTN của NT hiện diện trong cùng khối Đơn vị thí nghiệm trong khối chịu ảnh hưởng như nhau Các NT bố trí ngẫu nhiên vào các ĐVTN Làm giảm sai số ngẫu nhiên giữa các khối Tạo cơ hội đồng đều hơn khi so sánh các nghiệm thức Phải bố trí làm sao giảm được ảnh hưởng của yếu tố ngoại cảnh: Các đơn vị thí nghiệm phải được giữ cùng 1 điều kiện Nếu có thay đổi phải thay đổi trên toàn khối Lưu ý: Mỗi NT hiện diện 1 lần trong mỗi khối Mỗi khối có đầy đủ tất cả các nghiệm thức Dễ dàng tính kết quả. Chính xác hơn kiểu hoàn toàn ngẫu nhiên. Không bị hạn chế ở số nghiệm thức hay số khối. Thuận lợi: Khi có nhiều biến thiên giữa các đơn vị thí nghiệm trong một khối sẽ có sai số thí nghiệm lớn Bất lợi: Phân tích phương sai So sánh trung bình giữa các nghiệm thức Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics 6.2 Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics Nhập dữ liệu Chọn lệnh xử lý Đọc kết quả Chép kết quả vào WORD Kiểu thí nghiệm bình phương Latin (LSD - Latin Squared design) Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics 7. Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics Các vật liệu trên đơn vị thí nghiệm không đồng nhất Thí nghiệm có tác động của hai yếu tố ngoại cảnh. Số lần lặp lại bằng số nghiệm thức Số đơn vị thí nghiệm bằng số nghiệm thức bình phương. 7.1 Kiểu thí nghiệm bình phương Latin Đơn vị thí nghiệm được xếp theo hình vuông có hàng và cột Mỗi hàng và mỗi cột đều có đủ các nghiệm thức Mỗi nghiệm thức xuất hiên 1 lần trong mỗi hàng và cột 7.1 Kiểu thí nghiệm bình phương Latin Phân tích phương sai So sánh trung bình giữa các nghiệm thức Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics 7.2 Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics Nhập dữ liệu Chọn lệnh xử lý Đọc kết quả Chép kết quả vào WORD 8. Xử lý số liệu thí nghiệm đa yếu tố bằng phần mềm Statgraphics Trường hợp cần nghiên cứu ảnh hưởng của nhiều yếu tố đến kết quả Trong thí nghiệm nhiều tố, không chỉ biết ảnh hưởng của từng yếu tố mà còn có tác dụng tương hỗ của giữa các yếu tố Tương tác là tác dụng có thêm vì ảnh hưởng đồng thời của 1 hoặc nhiều yếu tố Phaân tích phöông sai ña bieán Phân tích phương sai cho đa biến độc lập (nhiều yếu tố-multifactor analysis of variance ) cho phép xem xét cùng một lúc tác động của nhiều biến độc lập và tác động của sự kết hợp giữa các biến này với biến phụ thuộc Xử lý số liệu thí nghiệm 2 yếu tố bằng phần mềm Statgraphics Nhập dữ liệu Chọn lệnh xử lý Đọc kết quả Chép kết quả vào WORD 9. Xử lý số liệu thí nghiệm hồi quy và tương quan tuyến tính bằng phần mềm Statgraphics Khái niệm hồi quy và tương quan Hồi quy và tương quan tuyến tính đơn biến Hồi quy và tương quan tuyến tính đa biến Xử lý số liệu thí nghiệm hồi quy và tương quan tuyến tính bằng phần mềm Statgraphics 9.1 Khái niệm hồi quy và tương quan Phân tích hồi qui Đồ thị phân tán Phân tích tương quan Trong nhiều trường hợp có hai hoặc nhiều biến số có quan hệ thì việc tìm mô hình và giải thích mối quan hệ này là quan trọng, sẽ giúp cho việc dự đoán, tối ưu hoặc kiểm soát quá trình Phaân tích hoài qui giả sử biến phụ thuộc y có quan hệ với n biến độc lập, thì mối quan hệ được biểu diễn bởi một mô hình toán học gọi là phương trình hồi qui: y = f(x1, x2, …xn) Phaân tích hoài qui Thông thường việc phân tích ANOVA của một thí nghiệm giúp xác định yếu tố nào là quan trọng, sau đó hồi qui giúp xây dựng mô hình định lượng giữa yếu tố phụ thuộc với các yếu tố quan trọng đó Phaân tích hoài qui Đồ thị phân tán giúp nhìn thấy rõ mối quan hệ giữa 2 biến Ñoà thò phaân taùn Ñoà thò phaân taùn Quan hệ dương là mối quan hệ mà trong đó các giá trị lớn nhất của một biến nào đó gắn kết với những giá trị lớn nhất của biến còn lại. Quan hệ âm là mối quan hệ mà trong đó các giá trị lớn nhất của một biến nào đó gắn kết với những giá trị nhỏ nhất của biến còn lại. Ñoà thò phaân taùn Quan hệ tương quan cong là những mối quan hệ mà trong đó các trường hợp mang những giá trị lớn và nhỏ trong biến độc lập cũng có những giá trị tương ứng trong biến phụ thuộc Ñoà thò phaân taùn Mức độ của mối quan hệ được đo lường bởi độ tập trung của các điểm dữ kiện trên đường thẳng hồi qui trong đồ thị phân tán Phaân tích töông quan Nếu các trường hợp tập trung gần đường hồi qui sẽ có mối quan hệ mạnh mẽ Nếu các trường hợp phân tán xa đường hồi qui sẽ có mối quan hệ yếu Phaân tích töông quan Sự không thích hợp giữa dữ kiện và mục đích Sự khái quát kết quả quá giới hạn Sử dụng số liệu từ các lần lặp lại riêng lẻ thay vì sử dụng trung bình của các lần lặp lại Lạm dụng phân tích tương quan sự diễn đạt kết quả của tương quan hồi quy phụ thuộc rất lớn vào kiểu dữ kiện đang sử dụng Sự không thích hợp giữa dữ kiện và mục đích áp dụng hàm hồi quy ngoài phạm vi dữ kiện đã được sử dụng của biến số là một trong những lạm dụng thường xảy ra. Sự khái quát kết quả quá giới hạn sử dụng kết quả phân tích hồi quy tương quan như là một phương pháp thay thế cho việc đo đếm thu thập số liệu, thay vì đo đếm số liệu lại dùng hồi quy tương quan để suy diễn số liệu cho một yếu tố nào đó trong nghiên cứu Sự khái quát kết quả quá giới hạn khi phân tích tương quan hồi quy cho dữ liệu từ các thí nghiệm lặp lại các nghiệm thức có 2 cách sử dụng dữ kiện: sử dụng dữ kiện từ các nghiệm thức riêng lẻ sử dụng dữ kiện từ trung bình của các lần lặp lại trong mỗi nghiệm thức. Sử dụng số liệu từ các lần lặp lại riêng lẻ thay vì sử dụng trung bình của các lần lặp lại nên dùng dữ kiện từ trung bình của các lần lặp lại trong mỗi nghiệm thức vì biến thiên giữa các lần lặp lại không nên tham gia vào đánh giá tương quan đang nghiên cứu. Sử dụng số liệu từ các lần lặp lại riêng lẻ thay vì sử dụng trung bình của các lần lặp lại Số liệu giả Ngộ nhận giữa nguyên nhân và hậu quả Phân biệt các nhóm biến số trong phân tích hồi qui và tương quan Kiểu sai lệch khi diễn đạt kết quả của hồi quy đơn giản số liệu mà phân bố của nó trong phạm vi của biến độc lập hơi bất thường. dữ kiện chỉ tập trung ở hai cực còn khoảng giữa không có, trong trường hợp này xác lập hồi quy đơn thường có kết quả với hệ số tương quan cao. Số liệu giả hệ số tương quan r có ý nghĩa tức là hiện diện một mối quan hệ nhân quả giữa hai biến số. khi phân tích tương quan có thể định lượng mức độ kết hợp giữa hai đặc tính cũng không thể và không nên đưa ra lý do cho sự kết hợp đó. Ngộ nhận giữa nguyên nhân và hậu quả 9.2 Hồi quy và tương quan tuyến tính đơn biến Hồi qui và đường thẳng bình phương nhỏ nhất Đường thẳng hồi qui Mô hình hồi qui Hàm hồi qui Biến phụ thuộc Đường thẳng cực tiểu hoá tổng các độ lệch bình phương giữa đường thẳng với các điểm số thuộc biến phụ thuộc Hoài qui vaø ñöôøng thaúng bình phöông nhoû nhaát Đường thẳng hồi qui dự đoán một cách chính xác điểm số trong biến phụ thuộc của một trường hợp nào đó khi biết được điểm số trong biến độc lập của trường hợp đó Một đường thẳng mô tả mối quan hệ nào đó gọi là hồi qui tuyến tính Ñöôøng thaúng hoài qui Haøm soá moâ taû quan heä giöõa y vôùi x vaø sai soá € ñöôïc goïi laø moâ hình hoài quy. Moâ hình hoài quy tuyeán tính ñôn coù daïng: y = ß1x + ß0 + € Trong moâ hình hoài quy tuyeán tính ñôn, ß1 vaø ß0 laø caùc tham soá cuûa moâ hình, € laø bieán ngaãu nhieân bieåu thò sai soá cuûa moâ hình Moâ hình hoài qui Moät trong nhöõng giaû ñònh laø trò soá kyø voïng cuûa € baèng zero, nghóa laø E(€) = 0. Moâ hình hoài qui Haøm soá moâ taû giaù trò trung bình cuûa y coù quan heä vôùi x ñöôïc goïi laø haøm hoài quy. Haøm hoài quy ñoái vôùi hoài quy tuyeán tính ñôn coù daïng: E(y)= ß1x + ß0 Haøm hoài qui Ñoà thò cuûa haøm hoài quy tuyeán tính ñôn laø moät ñöôøng thaúng, trong ñoù ß0 laø ñieåm chaën cuûa ñöôøng hoài quy, ß1 laø ñoä doác cuûa ñöôøng hoài quy. Khi bieát caùc tham soá ß1 vaø ß0 coù theå söû duøng haøm hoài qui ñeå tính giaù trò trung bình y ñoái vôùi giaù trò x nhaát ñònh. Haøm hoài qui Nhöng trong thöïc teá chöa bieát caùc tham soá ß1 vaø ß0, do ñoù chuùng ta phaûi öôùc löôïng caùc tham soá naøy töø caùc quan saùt maãu. Haøm hoài qui Caùc thoáng keâ maãu b1 vaø b0 ñöôïc xem nhö laø caùc öôùc löôïng töông öùng cuûa ß1 vaø ß0 khi thay theá b1 vaø b0 töông öùng cho ß1 vaø ß0 chuùng ta nhaän ñöôïc haøm hoài quy öôùc löôïng coù daïng: y’ = b1x + b0 Haøm hoài qui Vôùi: b0 laø ñieåm chaën vaø b1 laø ñoä doác cuûa ñöôøng hoài quy öôùc löôïng, y’ laø giaù trò öôùc löôïng (kyø voïng) cuûa y töông öùng vôùi moät giaù trò x nhaát ñònh. Haøm hoài qui Caùc tham soá b1 vaø b0 ñöôïc tính theo phöông phaùp bình phöông nhoû nhaát. Phöông phaùp bình phöông nhoû nhaát söû duïng caùc soá lieäu cuûa maãu ñeå tính caùc tham soá b1 vaø b0 cuûa haøm hoài quy öôùc löôïng. Haøm hoài qui Baûn chaát cuûa phöông phaùp naøy laø laøm nhoû nhaát toång bình phöông caùc sai leäch giöõa giaù trò cuûa bieán yi vaø giaù trò öôùc löôïng cuûa bieán yi’ Haøm hoài qui Ñeå toång caùc (yi-yi’)2 nhoû nhaát thì b1 vaø b0 ñöôïc tính theo coâng thöùc: Tính các thông số của đường thẳng hồi quy n = toång soá quan saùt. xi = giaù trò cuûa bieán ñoäc laäp töông öùng vôùi quan saùt i. yi = giaù trò cuûa bieán phuï thuoäc töông öùng vôùi quan saùt i. xtb = giaù trò trung bình cuûa bieán ñoäc laäp. ytb = giaù trò trung bình bieán phuï thuoäc Tính các thông số của đường thẳng hồi quy Heä soá xaùc ñònh laø soá ño möùc ñoä phuø hôïp cuûa haøm hoài quy öôùc löôïng Hieäu soá (yi-yi’) goïi laø sai leäch cuûa quan saùt i. Tính hệ số xác định r2 Toång bình phöông caùc sai leäch hoaëc sai soá (kí hieäu SSE) laø moät ñaïi löôïng ñöôïc toái thieåu hoaù phöông phaùp bình phöông nhoû nhaát Tính hệ số xác định r2 Giaù trò SSE ño ñaïc sai soá khi söû duïng haøm hoài quy öôùc löôïng ñeå öôùc löôïng caùc giaù trò cuûa bieán phuï thuoäc yi ôû maãu. Tính hệ số xác định r2 Neáu söû duïng giaù trò ytb cuûa maãu ñeå öôùc löôïng yi thì sai soá öôùc löôïng laø: yi – ytb Ñaïi löôïng ñöôïc goïi laø toång bình phöông toaøn boä: Tính hệ số xác định r2 SST ño ñaïc söï phaân boá cuûa caùc yi xung quanh ytb SSE ño ñaïc söï phaân boá cuûa caùc yi xung quanh y’ Tính hệ số xác định r2 Ñeå ño ñaïc giaù trò y’ treân ñöôøng hoài quy öôùc löôïng caùch xa ytb bao nhieâu, thì duøng ñaïi löôïng toång bình phöông do hoài quy: Tính hệ số xác định r2 Giöõa SST, SSE vaø SSR coù moái quan heä: SST=SSR+SSE Tính hệ số xác định r2 Neáu taát caû caùc ñieåm quan saùt yi ñeàu naèm treân ñöôøng y’ thì haøm hoài quy öôùc löôïng phuø hôïp hoaøn toaøn. Ñieàu naøy coù nghóa yi - yi’ = 0 hay SSE = 0, vaø vì SST = SSE + SSR neân ñeå haøm hoài quy öôùc löôïng phuø hôïp hoaøn toaøn thì SSR/SST = 1 Tính hệ số xác định r2 Nhö vaäy, möùc phuø hôïp cuûa haøm hoài quy öôùc löôïng phuï thuoäc vaøo SSE lôùn hay nhoû. Tyû soá SSR/SST ñöôïc goïi laø heä soá xaùc
Tài liệu liên quan