Câu 1 (20 điểm):
Hãy nêu định nghĩa của kỳ vọng, phương sai, độ lệch chuẩn của một biến ngẫu nhiên. Hãy chứng minh những tính chất sau đây của kỳ vọng và phương sai, trong đó X là một biến ngẫu nhiên và a, b là những hằng số.
(a) E[a] = a (b) E[bX] = bE[X]
(c) E[a + bX] = a + bE[X] (d) VAR[a] = 0
(e) VAR[bX] = b2VAR[X] (f) VAR[a + bX] = b2VAR[X]
(g) VAR[X] = E[X2] - (E[X])2
8 trang |
Chia sẻ: tranhoai21 | Lượt xem: 1846 | Lượt tải: 3
Bạn đang xem nội dung tài liệu Ôn tập thống kê và hồi Quy Đơn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC HOA SEN
KINH TẾ LƯỢNG
ĐÁP ÁN Bài tập SỐ 1
ÔN TẬP THỐNG KÊ và HỒI QUY ĐƠN
Người soạn: GV. Phạm Văn Minh
Câu 1 (20 điểm):
Hãy nêu định nghĩa của kỳ vọng, phương sai, độ lệch chuẩn của một biến ngẫu nhiên. Hãy chứng minh những tính chất sau đây của kỳ vọng và phương sai, trong đó X là một biến ngẫu nhiên và a, b là những hằng số.
(a) E[a] = a (b) E[bX] = bE[X]
(c) E[a + bX] = a + bE[X] (d) VAR[a] = 0
(e) VAR[bX] = b2VAR[X] (f) VAR[a + bX] = b2VAR[X]
(g) VAR[X] = E[X2] - (E[X])2
Giải:
E[a] = a
E[bX] = bE[X]
E[a + bX] = a + bE[X]
VAR[a] = 0
Dựa vào tính chất của toán tử kỳ vọng E[X]: E[a] = a (ở câu a)
VAR[bX] = b2VAR[X]
VAR[a + bX] = b2VAR[X]
VAR[X] = E[X2] - (E[X])2
Để đơn giản hóa ký hiệu, ta đặt m = E[X]
Câu 2 (20 điểm):
Có một giả thuyết cho rằng điểm trung bình của một sinh viên có thể được giải thích bởi thu nhập trung bình hàng năm của Cha Mẹ. Để kiểm chứng giả thuyết này, một sinh viên Kinh tế Khóa 34 đã tiến hành thu thập dữ liệu từ một mẫu gồm 8 sinh viên của Trường Đại Học Hoa Sen và được kết quả như sau:
STT
Điểm trung bình (ĐTB)
Thu nhập trung bình hàng năm (TN – tr.đồng)
1
10.00
105
2
7.50
75
3
8.75
45
4
5.00
45
5
7.50
60
6
8.75
90
7
6.25
30
8
6.25
60
Giải:
(a) Hãy tính các trị thống kê tổng hợp cho biến thu nhập trung bình hàng năm và biến điểm trung bình. Điền các kết quả vào bảng sau:
Trị thống kê Tổng hợp
HÀM EXCEL
Biến ĐTB
Biến TN
Số lần Quan sát
=COUNT( )
8
8
Trung bình
=AVERAGE( )
7.5
63.75
Trung vị
=MEDIAN( )
7.5
60
Yếu vị (mode)
=MODE( )
6.25; 7.5; 8.75
45; 60
Giá trị lớn nhất
=MAX( )
10
105
Giá trị nhỏ nhất
=MIN( )
5
30
Phương sai (*)
=VAR( )
2.679
626.786
Độ Lệch chuẩn
=STDEV( )
1.637
25.036
Hệ số biến thiên
= STDEV( )/ AVERAGE( )
0.218
0.393
Đồng Phương sai
=(n/(n-1))*COVAR() = 29.464
Hệ số biến thiên: được định nghĩa là tỷ số σ/μ, trong đó tử số là độ lệch chuẩn và mẫu số là trị trung bình. Đó là một đại lượng của sự phân tán của phân phối tương đối so với trị trung bình của phân phối.
Đồng Phương sai: Trong lý thuyết xác suất và thống kê, đồng phương sai (hay hiệp phương sai) là độ đo sự biến thiên cùng nhau của hai biến ngẫu nhiên (phân biệt với phương sai - đo mức độ biến thiên của một biến).
Nếu 2 biến có xu hướng thay đổi cùng nhau (nghĩa là, khi một biến có giá trị cao hơn giá trị kỳ vọng thì biến kia có xu hướng cũng cao hơn giá trị kỳ vọng), thì hiệp phương sai giữa hai biến này có giá trị dương. Mặt khác, nếu một biến nằm trên giá trị kì vọng còn biến kia có xu hướng nằm dưới giá trị kì vọng, thì hiệp phương sai của hai biến này có giá trị âm.
Lưu ý: trong Excel có đến 4 hàm để tính Phương sai. Đó là VAR, VARA, VARP, VARPA. Nhưng để tính phương sai cho mẫu, ta sử dụng công thức VAR( ), tương tự như vậy công thức (n/(n-1))*COVAR sẽ tính đồng phương sai của hai biến trên mẫu.
Hoặc sử dụng Data Analysis/ Descriptive Statistics:
Ta có bảng sau:
ĐIỂM TRUNG BÌNH
THU NHẬP
Mean
7.5
Mean
63.75
Standard Error
0.578638
Standard Error
8.851452665
Median
7.5
Median
60
Mode
7.5
Mode
45
Standard Deviation
1.636634
Standard Deviation
25.03568881
Sample Variance
2.678571
Sample Variance
626.7857143
Kurtosis
-0.7
Kurtosis
-0.596449704
Skewness
-6.3E-17
Skewness
0.46088053
Range
5
Range
75
Minimum
5
Minimum
30
Maximum
10
Maximum
105
Sum
60
Sum
510
Count
8
Count
8
(b) Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến thu nhập trung bình hàng năm và trục tung cho biến điểm trung bình. Nhận xét một cách ngắn gọn về đồ thị của dữ liệu.
Tính toán các hệ số hồi quy b1 và b2 trong mô hình hồi quy sau: ĐTB = b1 + b2*TN bằng Excel.
Đồ thị phân tán:
Nhận xét: Dựa vào đồ thị trên, ta thấy dường như giữa điểm trung bình của một sinh viên có mối tương quan tuyến tính đồng biến với thu nhập trung bình hàng năm của Cha Mẹ.
Các bạn có thể “click đúp” trực tiếp vào bảng trên để xem cách tính toán mà không cần phải mở Excel. Cụ thể hơn, b1 và b2 được tính bằng các công thức như sau:
(c) Theo Anh/Chị, giả thuyết cho rằng điểm trung bình của một sinh viên có thể được giải thích bởi thu nhập trung bình hàng năm của Cha Mẹ là đúng hay không đúng. Giải thích ngắn gọn câu trả lời của Anh/Chị.
Câu này chưa cần làm.
Câu 3 (20 điểm):
Thu thập dữ liệu về thu nhập (R), chi tiêu cho ăn uống (C1) và các chi tiêu khác (C2), bình quân 1 tuần của 10 hộ gia đình ở một vùng, nhà nghiên cứu được kết quả sau (đơn vị ngàn VNĐ/ tuần):
Hộ gia đình i
1
2
3
4
5
6
7
8
9
10
Ri
800
1000
1200
1400
1600
1800
2000
2200
2400
2600
C1i
320
310
340
310
450
420
480
520
600
520
C2i
380
340
560
640
660
730
740
880
950
980
Gọi tổng chi tiêu bình quân 1 tuần của hộ gia đình là C (C = C1 + C2). Hãy tính giá trị kỳ vọng và phương sai của tổng chi tiêu C cho tập dữ liệu trên.
Dùng hàm AVERAGE, VAR trong EXCEL ta được:
Ta thấy E(C) = E(C1) + E(C2); Var(C) = Var(C1) + Var(C2) +2Cov(C1,C2)
(Các bạn chỉ cần tìm ra Kỳ vọng và phương sai của C, chữ đậm màu đỏ ở bảng trên, “click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
Gọi số tiền tích lũy bình quân 1 tuần của hộ gia đình là P (P = R – C). Hãy tính giá trị kỳ vọng và phương sai của số tiền tích lũy bình quân 1 tuần cho tập dữ liệu trên.
Ta có bảng số liệu sau:
Tương tự, ta dùng hàm AVERAGE, VAR trong EXCEL:
Ta thấy E(P) = E(R) + E(C); Var(P) = Var(R) + Var(C) - 2Cov(R,C)
(Các bạn chỉ cần tìm ra Kỳ vọng và phương sai của P, chữ đậm màu đỏ ở bảng trên, “click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
Câu 4 (20 điểm):
Có một giả thuyết cho rằng tổng chi tiêu của một hộ gia đình phụ thuộc vào thu nhập của hộ gia đình đó. Để kiểm chứng giả thuyết này, nhà nghiên cứu đã dùng dữ liệu về thu nhập (R), tổng chi tiêu (C) bình quân 1 tuần của hộ gia đình trong Câu 3:
Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến R và trục tung cho biến C. Nhận xét một cách ngắn gọn về đồ thị của dữ liệu.
Theo đồ thị ta thấy hình như giữa C và R có mối quan hệ đồng biến, và giữa C & R có quan hệ tuyến tính khá chặt.
Hãy tìm khoảng tin cậy 95% của thu nhập (R) bình quân 1 tuần của hộ gia đình.
Câu này chưa cần làm.
Câu 5 (20 điểm):
Tìm hiểu về nhu cầu sử dụng điện thoại, ông Bình đã sử dụng bộ dữ liệu của Singapore giai đoạn 1960-1981 với 2 biến sau:
TEL: Số lượng máy điện thoại trên 1000 người.
GDP: Tổng sản phẩm quốc nội theo đầu người, tại mức giá cơ cấu tính theo đô la Singapore năm 1968.
Năm
TEL
GDP
Năm (tt)
TEL
GDP
1960
36
1299
1971
90
2723
1961
37
1365
1972
102
3033
1962
38
1409
1973
114
3317
1963
41
1549
1974
126
3487
1964
42
1416
1975
141
3575
1965
45
1473
1976
163
3784
1966
48
1589
1977
196
4025
1967
54
1757
1978
223
4286
1968
59
1974
1979
262
4628
1969
67
2204
1980
291
5038
1970
78
2462
1981
317
5472
Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến GDP và trục tung cho biến TEL. Bằng trực quan, Anh/ chị hãy nhận xét ngắn gọn về mối quan hệ giữa 02 chỉ số trên dựa trên đồ thị này.
Đồ thị cho thấy: khi GDP tăng thì TEL tăng, và ngược lại. Nói cách khác, GDP và TEL có quan hệ thuận chiều (đồng biến). Đồ thị cũng cho thấy quan hệ GDP và TEL xấp xỉ tuyến tính.
Hãy tính các trị thống kê tổng hợp cho biến GDP và TEL (trung bình, phương sai, độ lệch chuẩn, đồng phương sai).
(“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
Sử dụng lệnh CORREL trong EXCEL, hãy xác định hệ số tương quan tuyến tính giữa TEL và GDP. Giải thích ý nghĩa của hệ số tương quan.
(“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
Hệ số tương quan dương cho thấy hai biến TEL và GDP có quan hệ tỷ lệ thuận. |r| rất gần 1 (≥ 0.8) cho thấy hai biến này có tương quan tuyến tính chặt.
HẾT
Để nắm vững cách làm, các bạn xem cụ thể trong Excel kèm theo đáp án này.
Hoặc nhấn đúp vào biểu tượng sau