Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên trường Đại học Sư phạm Hà Nội

Tóm tắt. Hiện nay, hệ thống gợi ý (Recommender System - RS) đã và đang từng bước trở thành một lĩnh vực nghiên cứu quan trọng và được ứng dụng khá thành công trong thực tiễn, giúp người dùng đối phó với vấn đề quá tải thông tin. Trong một số nghiên cứu gần đây, hệ thống RS đã bắt đầu được quan tâm ứng dụng vào lĩnh vực giáo dục. Trong bài viết này, chúng tôi đề xuất xây dựng một hệ thống gợi ý nhằm giúp các sinh viên Trường Đại học Sư phạm Hà Nội (HNUE) lựa chọn môn học tự chọn sao cho phù hợp khả năng của mình, giúp các em lập kế hoạch học tập tốt hơn. Chúng tôi áp dụng phương pháp Biased Matrix Factorization (BMF) để dự đoán kết quả học tập cho sinh viên dựa trên cơ sở dữ liệu điểm thu thập được từ hệ thống quản lí kết quả học tập trong trường Đại học Sư phạm Hà Nội. Dựa trên kết quả thực nghiệm từ dữ liệu của khoa Công nghệ thông tin và khoa Toán-tin, chúng tôi thấy rằng phương pháp BMF mà chúng tôi lựa chọn luôn cho độ lỗi thấp nhất so với hai phương pháp khác là Global Average (GA) và Matrix Factorization (MF). Bên cạnh đó, chúng tôi cũng đánh giá và thấy rằng giá trị của của nhân tố tiềm ẩn K cũng ảnh hưởng đến kết quả của dự đoán của thuật toán. Cuối cùng, hệ thống của chúng tôi có thể tư vấn môn học tùy chọn cho mỗi sinh viên trong đầu mỗi học kì.

pdf11 trang | Chia sẻ: thanhle95 | Lượt xem: 71 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên trường Đại học Sư phạm Hà Nội, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
JOURNAL OF SCIENCE OF HNUE DOI: 10.18173/2354-1075.2015-0068 Educational Sci., 2015, Vol. 60, No. 7A, pp. 204-214 This paper is available online at HỆ THỐNG GỢI Ý LỰA CHỌNMÔN HỌC TỰ CHỌN CHO SINH VIÊN TRƯỜNG ĐẠI HỌC SƯ PHẠMHÀ NỘI Lê Thị Đào1, Lê Thị Tú Kiên2 1Khoa Khoa học Tự nhiên, Trường Sĩ quan Lục quân 1; 2Khoa Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội Tóm tắt. Hiện nay, hệ thống gợi ý (Recommender System - RS) đã và đang từng bước trở thành một lĩnh vực nghiên cứu quan trọng và được ứng dụng khá thành công trong thực tiễn, giúp người dùng đối phó với vấn đề quá tải thông tin. Trong một số nghiên cứu gần đây, hệ thống RS đã bắt đầu được quan tâm ứng dụng vào lĩnh vực giáo dục. Trong bài viết này, chúng tôi đề xuất xây dựng một hệ thống gợi ý nhằm giúp các sinh viên Trường Đại học Sư phạm Hà Nội (HNUE) lựa chọn môn học tự chọn sao cho phù hợp khả năng của mình, giúp các em lập kế hoạch học tập tốt hơn. Chúng tôi áp dụng phương pháp Biased Matrix Factorization (BMF) để dự đoán kết quả học tập cho sinh viên dựa trên cơ sở dữ liệu điểm thu thập được từ hệ thống quản lí kết quả học tập trong trường Đại học Sư phạm Hà Nội. Dựa trên kết quả thực nghiệm từ dữ liệu của khoa Công nghệ thông tin và khoa Toán-tin, chúng tôi thấy rằng phương pháp BMF mà chúng tôi lựa chọn luôn cho độ lỗi thấp nhất so với hai phương pháp khác là Global Average (GA) và Matrix Factorization (MF). Bên cạnh đó, chúng tôi cũng đánh giá và thấy rằng giá trị của của nhân tố tiềm ẩn K cũng ảnh hưởng đến kết quả của dự đoán của thuật toán. Cuối cùng, hệ thống của chúng tôi có thể tư vấn môn học tùy chọn cho mỗi sinh viên trong đầu mỗi học kì. Từ khóa: Hệ thống gợi ý, Phân rã ma trận, Dự đoán kết quả học tập, Lựa chọn môn học tự chọn, Học máy. 1. Mở đầu Cơ sở dữ liệu điểm số của sinh viên hiện nay được lưu trữ tại các trường đại học cao đẳng là rất lớn. Tuy nhiên nguồn thông tin to lớn này thường chỉ được sử dụng để quản lí và tổng hợp đánh giá kết quả học tập của sinh viên một cách đơn giản mà chưa được khai thác triệt để nhằm mang lại những thông tin hữu ích phục vụ cho sinh viên. Hiện nay với hình thức đào tạo theo tín chỉ thì việc lựa chọn môn học không phù hợp là một trong những nguyên nhân khiến số lượng sinh viên bị cảnh cáo và buộc thôi học có chiều hướng gia tăng. Vì vậy một vấn đề được đặt ra là cần phải có các hệ thống làm sao có thể dự đoán được năng lực của từng sinh viên hoặc đơn giản hơn là dự đoán được điểm số của sinh viên để từ đó đưa ra những định hướng, gợi ý giúp sinh viên có được sự lựa chọn môn học phù hợp và học tập tốt hơn. Ngày nhận bài: 7/7/2015. Ngày nhận đăng: 15/11/2015. Liên hệ: Lê Thị Đào, e-mail: ledaolq5982@gmail.com. 204 Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên Trường Đại học Sư phạm Hà Nội Một số nghiên cứu trước đây đã giải quyết vấn đề về dự đoán kết quả học tập theo hướng tiếp cận luật kết hợp. Một số nghiên cứu khác lại tập trung phân tích các kĩ thuật khai phá dữ liệu dựa trên bài toán dự đoán kết quả học tập của sinh viên [4,6]. Nhưng nói chung, những nghiên cứu này thường chỉ đánh giá quy luật chung về năng lực học tập cho sinh viên chứ chưa dự đoán cho từng sinh viên cụ thể. Hệ thống gợi ý hiện đang được ứng dụng rộng rãi trong nhiều lĩnh vực. Gần đây, một số hướng tiếp cận Recommender System như Lọc cộng tác, K-Nearest-Neighbor (KNN), Matrix Factorization [1,2,3] được ứng dụng vào lĩnh vực giáo dục để giải quyết bài toán dự đoán năng lực học tập cho từng sinh viên. Tuy nhiên, những nghiên cứu này tập trung vào đánh giá, so sánh độ chính xác giữa các giải thuật mà chưa áp dụng vào phân thích và giải quyết bài toán cụ thể. Trường Đại học Sư Phạm Hà Nội (ĐHSPHN) là một trong 19 trường đại học trọng điểm trong hệ thống giáo dục Việt Nam. Hiện nay, trường có tổng số 23 khoa với quy mô đào tạo hơn 12000 sinh viên đại học chính quy. Năm 2009 trường ĐHSPHN bắt đầu áp dụng hình thức đào tạo tín chỉ cho sinh viên chính quy hệ đại học để thay thế cho hình thức đào tạo liên chế trước đó. Với hình thức đào tạo tín chỉ, mỗi sinh viên có thể tự lập kế hoạch học tập sao cho phù hợp với khả năng và thời gian của riêng mình. Tuy nhiên, vì không có kinh nghiệm nên nhiều khi sinh viên lựa chọn một số môn học không phù hợp với năng lực của mình dẫn đến kết quả học tập kém và bị dừng học. Trong nghiên cứu này, chúng tôi đề xuất xây dựng một hệ thống gợi ý nhằm tư vấn lựa chọn môn học tự chọn cho sinh viên của trường ĐHSPHN. Dựa trên những nghiên cứu trước đó, chúng tôi lựa chọn phương pháp Bias Matrix Factorization để dự đoán kết quả học tập của sinh viên và từ đó đưa ra những gợi ý lựa chọn môn học tự chọn để hỗ trợ cho các em. 2. Nội dung nghiên cứu 2.1. Bài toán gợi ý môn học tự chọn Hiện nay hầu hết các trường đại học đang đào tạo theo hình thức tín chỉ. Trong mỗi học kì, sinh viên phải học một số môn học bắt buộc và một số môn học tự chọn. Ví dụ, một trường đại học có khoảng 10.000 đến 40.000 sinh viên, mỗi sinh viên ở mỗi học kì phải lựa chọn khoảng 8 môn học trong 19 môn học tự chọn. Đa số các sinh viên phân vân không biết lựa chọn môn học nào là phù hợp với khả năng của mình. Khi đó, hệ thống RS sẽ trợ giúp sinh viên giải quyết vấn đề này. Đầu tiên, hệ thống RS khai thác thông tin điểm số của sinh viên để từ đó đưa ra được kết quả dự đoán cho sinh viên theo từng học kì, trước khi sinh viên tham gia lập kế hoạch học tập ở đầu mỗi học kì. Từ những kết quả dự đoán, hệ thống sẽ cung cấp những gợi ý nên chọn môn học nào trong những môn tự chọn áp dụng đúng cho từng chương trình đào tạo. Ví dụ, có năm sinh viên sv1, sv2, sv3, sv4 và sv5 học các môn môn1, môn 2, môn 3, môn 4, môn 5 được trình bày trong một ma trận như Hình 1, mỗi ô trong ma trận chứa số điểm của sinh viên học môn học tương ứng, sinh viên nào chưa học môn nào thì ô đó sẽ được điền giá trị bằng dấu chấm hỏi “ ? ”. Trong năm môn học có ba môn học tự chọn là môn 3, môn 4, môn 5. Sinh viên cần chọn hai môn trong ba môn học tự chọn sao cho phù hợp nhất với mình nhất (có khả năng đạt điểm cao). Như vậy, hệ thống RS cần gợi ý cho sinh viên sv5 là nên học hai môn nào trong ba môn môn 3, môn 4, môn 5. Để gợi ý lựa chọn môn học cho sinh viên, hệ thống RS cần dự đoán các dấu “?” trong ma 205 Lê Thị Đào, Lê Thị Tú Kiên Hình1. Dữ liệu điểm với ba môn cần dự đoán của sinh viên sv5 trận bằng các con số có giá trị từ 0 đến 4, Hình 2. Sau đó, dựa trên những ràng buộc về tổng số tín chỉ hay số môn học tự chọn mà sinh viên cần học trong một học kì, hệ thống RS sẽ đưa đưa ra gợi ý lựa chọn môn học cho sinh viên. Trở lại ví dụ trên, hệ thống cần gợi ý hai môn học tự chọn cho sinh viên sv5 là hai môn môn 3 và môn 4. Vì hai môn học này có số điểm dự đoán cao hơn môn 5 (3 và 4 > 2). Hình 2. Bảng điểm sau khi dự đoán và hướng gợi ý Như vậy, bài toán gợi ý lựa môn học bao gồm hai pha. Pha thứ nhất là dự đoán kết quả học tập và pha thứ hai là gợi ý môn học tùy chọn dựa vào kết quả dự đoán của pha thứ nhất và các ràng buộc khác. Để thực hiện pha thứ nhất, chúng tôi sử dụng giải thuật MatrixFactorization kết hợp một lượng giá trị lệch (Bias Matrix Factorization) [1,5]. Trong phần tiếp, theo chúng tôi sẽ bày chi tiết giải thuật này. 2.2. Giải thuật Bias Matrix Factorization 2.2.1. Giải thuật Matrix Factorization (MF) Giải thuật phân rã ma trận Matrix Factorization là phương pháp phân rã ma trận X ∈ ℜ|U |×|I| thành hai ma trận con có kích thước nhỏ hơn W và H [1] sao cho có thể xây dựng lại ma trận X từ hai ma trận con này nghĩa là X ≈WHT , được minh họa như Hình 3. Trong đó, W ∈ ℜ|U | ×K là một ma trận mà mỗi dòng là một véc tơ bao gồm K nhân tố tiềm ẩn mô tả người dùng u và H ∈ ℜ|I|×K là một ma trận mà mỗi dòng là một véc tơ bao gồm K nhân tố tiềm ẩn (latent factors) mô tả cho item i, thông thường K <<,K << HT là ma trận chuyển vị của ma trận H. wuk, wik là các phần tử, wu, hi lần lượt là véc tơ tương ứng của W và H. Để dự đoán năng lực r của sinh viên u cho học môn học thứ i ta sử dụng có công thức sau: 206 Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên Trường Đại học Sư phạm Hà Nội Hình 3. Mô hình phân rã ma trận X thành hai ma trận W và H rˆui =Wuh T i = K∑ k=1 Wukhik (2.1) Quá trình tìm hai ma trận con W và H chính là quá trình đi tối ưu hóa hàm: OMF =(u,i,r)∈Dtrain ∑ e2ui (2.2) Với e2ui = (rui − rˆui) = (rui − K∑ k=1 wi) (2.3) Quá trình tìm hàm tối ưu trên sẽ được thực hiện bằng giải thuật gradient trong học máy. Sau khi tìm được 2 ma trận W và H, quá trình dự đoán được thực hiện. Hình 4 mô tả một ví dụ cụ thể cho quá trình này. Giả sử từ ma trận dữ liệu điểm 5x5 ban đầu và với giá trị của tham số K = 2, chúng ta tìm được các giá trị tối ưu của 2 ma trận W và H như Hình 4. Để dự đoán năng lực của sinh viên sv3 với học môn 4 (với ô bằng 3), chúng ta áp dụng công thức (2.1) và thu được: rˆui = wuh T i = ∑K k=1wukhik = 2.1 ∗ 0.6 + 1.2 = 3.06 Hình 4. Dự đoán năng lực (điểm) cho sinh viên 3 học môn 4 Áp dụng quá trình dự đoán như trên, chúng tôi sẽ dự đoán được tất cả điểm số của tất cả sinh viên cho những môn học tự chọn mà sinh viên chưa học. Đây chính là quá trình thay thế các 207 Lê Thị Đào, Lê Thị Tú Kiên dấu chấm hỏi “?” bằng các con số cụ thể trong miền giá trị [0,4]. Các điểm dự đoán này được lưu trữ lại để sử dụng cho pha thứ hai, pha gợi ý lựa chọn môn học. 2.2.2. Giải thuật Bias Matrix Factorization (BMF) Do một số nguyên nhân ảnh hưởng của môn học như yêu cầu cao thấp, khó dễ khác nhau (item effect), hoặc do một số ảnh hưởng của sinh viên như sinh viên giỏi, thông minh, lười biếng khác nhau (user effect) dẫn đến sự dự đoán bị sai lệch. Để giải quyết vấn đề này, chúng tôi sử dụng giải thuật Biased Matrix Factorization được cải tiến từ giải thuật Matrix Factorization. Khác với công thức dự đoán của giải thuật MF, công thức dự đoán của giải thuật BMFcộng thêm 3 tham số µ, bu, bi vào công thức (2.1). Như vậy, để dự đoán được năng lực r của sinh viên u cho môn học i được biểu diễn với công thức sau: rˆui = µ+ bu + bi + K∑ k=1 wukhik (2.4) Với giá trị µ là giá trị trung bình toàn cục là năng lực trung bình của tất cả các sinh viên trên tất cả các môn học với tập dữ liệu huấn luyện: µ = ∑ (u, i, r) ∈ Dtrainr |Dtrain| (2.5) Giá trị bu là độ lệch của sinh viên (là giá trị lệch trung bình của năng lực một sinh viên so với giá trị trung bình toàn cục): bu = ∑ (u, i′, r) ∈ Dtrain|u′ = u(r − µ) |{(u′, i, r) ∈ Dtrain}|u′ = u (2.6) Giá trị bi là độ lệch của môn học (là giá trị lệch trung bình của yêu cầu môn học so với giá trị trung bình toàn cục): bi = ∑ (u, i, r) ∈ Dtrain|i = i(r − µ) |{(u, i′, r) ∈ Dtrain}|i′ = i (2.7) Bây giờ, quá trình tìm hai ma trận W và H sẽ là qúa trình tối ưu hóa hàm: OBMF = ∑ (u,i,r)∈Dtrain ( rui − µ− bu − bi − K∑ k=1 wukhik )2 + λ ( ‖W‖2F + ‖H‖2F + b2u + b2i ) (2.8) 2.3. Dữ liệu Từ cơ sở dữ liệu quản lí chương trình đào tạo theo hệ thống tín chỉ của trường Đại học Sư phạm Hà Nội, chúng tôi trích lọc ra ba nhóm dữ liệu như sau: Sinh viên, môn học và điểm số (User, Item, Ratings). Nhóm môn học (item) bao gồm những thông tin về kế hoạch học tập theo từng học kì, mã môn học, tên môn học, môn học tiên quyết, nhóm môn học bắt buộc, nhóm môn 208 Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên Trường Đại học Sư phạm Hà Nội tự chọn,. . . ) cùng với những ràng buộc khác. Nhóm sinh viên (user) bao gồm thông tin mã sinh viên, năm học, ngành học, khóa học. Nhóm điểm số (ratings) bao gồm điểm học tập các môn đã học của sinh viên (điểm số ở thang điểm 4). Do thời gian có hạn nên hiện tại chúng tôi mới chỉ thu thập được dữ liệu của khoa Công nghệ thông tin và khoa Toán - Tin. Bộ dữ liệu bao gồm 1000 sinh viên (1000 user) và 77 môn học (77 item) của 2 ngành học và 77000 điểm chi tiết (77000 ratings). 2.4. Kết quả thực nghiệm 2.4.1. So sánh BMF với các thuật toán khác Chúng tôi tiến hành đánh giá hiệu quả của giải thuật BMF với hai giải thuật Matrix Factorization và Global Average (GA) trên bộ dữ liệu chúng tôi thu thập được nhằm khẳng định lại đánh giá của một số nghiên cứu trước đó [1,5]. Giải thuật Global Average là phương pháp trung bình toàn cục Global Average. Giải thuật toán đơn giản nhất để dự đoán là sử dụng phương pháp trung bình toàn cục. Phương pháp này tính trung bình tất cả các sinh viên đánh giá trên tất cả môn học, sau đó lấy giá trị trung bình này làm giá trị dự đoán cho tập kiểm tra. Giá trị trung bình được tính theo công thức sau: µ = ∑ (u, i, r) ∈ Dtrain |Dtrain| (2.9) Để đưa ra độ lỗi - Root Mean Squared Error (RMSE) cho các giải thuật chúng tôi áp dụng công thức đo độ lỗi sau: RMSE = √ 1 |Dtest| ∑ u,i,r∈Dtest ( rui − ⌢rui )2 (2.10) Trong đó, Dtest ⊆ U × I × ℜ, là tập dữ liệu kiểm thử; u là sinh viên (user); i là môn học (item); rui là giá trị thực; ⌢ rui là giá trị dự đoán của sinh viên u trên môn học i. Phương pháp Matrix Factorization có độ lỗi RMSE là 0,633445 (Hình 5) với giá trị của các tham số mặc định là: Num_factors=10 regularization=0.015 learn_rate=0.01 Phương pháp Biased Matrix Factorization có độ lỗi RMSE là 0,6095795 (Hình 6) với giá trị của các tham số mặc định là: num_factors=10 bias_reg=0.01 reg_u=0.015 reg_i=0.015 frequency_regularization=False 209 Lê Thị Đào, Lê Thị Tú Kiên Hình 5. Độ lỗi của phương pháp Matrix Factorization learn_rate=0.01 bias_learn_rate=1 learn_rate_decay=1 num_iter=30 bold_driver=False loss=RMSE max_threads=1 Hình 6. Độ lỗi của phương pháp Biased Matrix Factorization Phương pháp Global Average có độ lỗi RMSE là 0,9577132 (Hình 7). Tập hợp lại các kết quả thực nghiệm trên vào biểu đồ như trong Hình 8. chúng tôi thấy rằng phương pháp BMF cho độ lỗi thấp nhất. Tiếp đến là phương pháp MF và cuối cùng là phương pháp GA. 2.4.2. Khảo sát sự phụ thuộc của thuật toán BMF đối với tham số nhân tố tiềm ẩn K Để đánh giá tầm ảnh hưởng của tham số K với hiệu quả của thuật toán BMF, chúng tôi tiến hành tính RMSE của thuật toán BMF với các giá trị tham số K khác nhau. Biểu đồ trong Hình 9 cho thấy rằng khi giá trị của K tăng lên thì thì độ chính xác của thuật toán BMF cũng tăng lên (sai 210 Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên Trường Đại học Sư phạm Hà Nội Hình 7. Độ lỗi của phương pháp Global Average Hình 8. Biểu đồ độ lỗi RMSE của ba giải thuật MF, BMF và GA số lỗi giảm đi). Hình 9. Biểu đồ độ lỗi RMSE của BMF với các giá trị khác nhau của nhân tố tiềm ẩn K 211 Lê Thị Đào, Lê Thị Tú Kiên 2.4.3. Gợi ý môn học tự chọn cho sinh viên Để đưa ra gợi ý môn học tự chọn, chương trình được tổ chức thành 2 pha: Pha thứ nhất: Huấn luyện sau đó đưa ra kết quả dự đoán cho các môn học Hình 10. Giao diện huấn luyện Ví dụ: Trong Hình 10. - CSDL: Nhập bảng dữ liệu. - Chọn bảng: U6162BASE / DL huấn luyện / ok. - Chọn bảng: U6162TEST/ DL kiểm tra / ok. - Kích chọn vào Dự đoán khi đó đưa ra độ lỗi RMSE: 0.6333509. Pha thứ hai: Dự đoán và gợi ý lựa chọn môn học Ví dụ: Trong Hình 11, chúng ta cần nhập: - Nhập vào mã sinh viên: 635102003. - Nhập kì: 5 - Khi đó hệ thống đưa ra: + Họ và tên: Đặng Vũ Băng Châu; Khóa 63; Học kì 5. + Mã môn học, tên môn học, số TC, tổng số tiết, điều kiện tiên quyết, loại HP trong kì 5. + Trong học kì 5 có 3 môn tự chọn là COMP 331, COMP 332, COMP 333 và điểm dự đoán của 3 môn lần lượt là 2.7; 3.4; 2.2. + Hệ thống sẽ đưa ra gợi ý, tư vấn môn học tự chọn cho sinh viên này dựa vào điểm dự đoán. Như vậy dựa vào kết quả dự đoán này hệ thống gợi ý cho sinh viên có thể chọn môn COMP 332. 212 Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên Trường Đại học Sư phạm Hà Nội Hình 11. Giao diện tư vấn 3. Kết luận Hệ thống gợi ý đang là hướng tiếp cận mới để khai thác nguồn dữ liệu dồi dào và sẵn có của ngành giáo dục nhằm quay lại hỗ trợ các nhà quản lí và người học. Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên trường ĐHSPHN sẽ góp phần trợ giúp các sinh viên định hướng kế hoạch học tập để đạt kết quả tốt hơn. Trong thời gian tới chúng tôi sẽ tiếp tục thu thập dữ liệu của tất cả các khoa trong trường ĐHSPHN để đưa vào hệ thống. Chúng tôi cũng tiếp tục tiến hành khảo sát thêm các ràng buộc để làm sao cho hệ thống gợi ý càng gần sát hơn với thực tế chương trình quản lí đào tạo của trường. Cuối cùng, chúng tôi hy vọng có thể tích hợp hệ thống gợi ý này như một tính năng mới trong hệ thống đăng kí môn học của trường ĐHSPHN nhằm hỗ trợ sinh viên lựa chọn các môn học tùy chọn ở đầu mỗi học kì. TÀI LIỆU THAM KHẢO [1] Yehuda Koren, Robert Bell and Chris Volinsky, 2009. Matrix Factorization Techniques for Recommender Systems. Published by the IEEE Computer Society, pp. 42 - 49. [2] Nguyen Thai-Nghe, Lucas Drumond, Tomásˇ Horváth, Artus Krohn-Grimberghe, Alexandros Nanopoulos, and Lars Schmidt-Thieme, 2012. Factorization Techniques for Predicting Student Performance 2012. Book chapter in Educational Recommender Systems and Technologies: Practices and Challenges (ERSAT 2012). Santos, O. C. and Boticario, J. G. (Eds). SBN13: 9781613504895, ISBN10: 1613504896, IGI Global Publisher, pp. 129-153. [3] Nguyen Thai-Nghe, Lucas Drumond, Tomásˇ Horváth, Alexandros Nanopoulos, and Lars Schmidt-Thieme.Matrix and Tensor Factorization for Predicting Student Performance 2011, 213 Lê Thị Đào, Lê Thị Tú Kiên in Proceedings of the 3rd International Conference on Computer Supported Education (CSEDU 2011. SciTePress 2011. ISBN: 978-989-8425-49-2. ), pp. 69 - 78. [4] Nguyen Thai-Nghe, Paul Janecek, Peter Haddawy, 2007. An analysis of techniques for predicting student GPA 2007. Kỉ yếu hội thảo quốc gia lần thứ XVI: Một số vấn đề chọc lọc của CNTT&TT, Nxb Khoa học kỹ thuật, tr. 19-31. [5] Huỳnh Lý Thanh Nhàn, Nguyễn Thái Nghe, 2013. Hệ thống dự đoán kết quả học tập và gợi ý lựa chọn môn học. Kỉ yếu hội thảo quốc gia lần thứ XVI: Một số vấn đề chọc lọc của CNTT&TT, Nxb Khoa học kỹ thuật, tr. 110-118. [6] Nguyễn Thị Thanh Thủy, Trần Quốc Vinh, 2012. Ứng dụng khai phá dữ liệu xây dựng công cụ dự đoán kết quả học tập của sinh viên. Hội nghị sinh viên nghiên cứu Khoa học lần thứ 8, Đại học Đà Nẵng. ABSTRACT A recommender system that chooses electives for Hanoi National University of Education students Nowadays, the Recommender System (RS) has become an important area of research and it has been successfully been put into practice, helping users avoid information overload. In recent research, RS has been applied in education. This paper proposes building a suggestion system that will help students of the Hanoi National University of Education (HNUE) better able to select classes and devise a study plan. We used the Biased Matrix Factorization (BMF) method to predict student learning outcome based on data obtained from the learning outcome management system of the Hanoi National University of Education. According to the Faculty of Information and Technology and the Department of Mathematics and Informatics of HNUE, the experimental results show that BFM is the better than two other methods, Global Average (GA) and Matrix Factorization (MF). In addition, the value of the K factor influences the algorithm prediction. Our system can recommend subjects for each student at the beginning of every semester. Keywords: Recommender System, Matrix Factorization, Predicting Student Performance, Choosing Electives, Machine Learning. 214
Tài liệu liên quan