Deep Learning: Ứng dụng cho dự báo lưu lượng nước đến hồ chứa Hòa Bình

TÓM TẮT—Việc dự báo lưu lượng nước về hồ Hoà Bình có vai trò rất quan trọng cho công tác vận hành công trình thủy lợi, thủy điện mục với tiêu phòng lũ cho đồng bằng sông Hồng, góp phần phòng tránh hạn hán và ổn định năng lượng điện cho cả nước. Trong bài báo này, chúng tôi ứng dụng phương pháp Deep learning dự báo lượng nước về hồ Hòa Bình trước 10 ngày. Kết quả thực nghiệm cho thấy mô hình dự báo tìm được có chất lượng dự báo vượt trội so với các phương pháp học máy khác như máy véctơ hỗ trợ, rừng ngẫu nhiên, LASSO, cây quyết định, k láng giềng gần nhất; hệ số xác định bội R2 của phương pháp Deep learning đạt tới 92%. Nghiên cứu này cũng mở ra hướng ứng dụng mới cho các bài toán dự báo chuỗi thời gian khi dùng Deep learning, phương pháp này giúp cải thiện độ chính xác của mô hình và có thể ứng dụng rộng rãi trong các lĩnh vực kinh tế, xã hội tại Việt Nam.

7 trang | Chia sẻ: thanhle95 | Lượt xem: 595 | Lượt tải: 1

Bạn đang xem nội dung tài liệu Deep Learning: Ứng dụng cho dự báo lưu lượng nước đến hồ chứa Hòa Bình, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR'9)”; Cần Thơ, ngày 4-5/8/2016 DOI: 10.15625/vap.2016.00015 Hình 1. Mô hình dự báo sử dụng ANN. DEEP LEARNING: ỨNG DỤNG CHO DỰ BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒ CHỨA HÒA BÌNH Trương Xuân Nam1, Nguyễn Thanh Tùng1 1 Khoa Công nghệ thông tin, Trường Đại học Thủy lợi {namtx, tungnt}@tlu.edu.vn TÓM TẮT—Việc dự báo lưu lượng nước về hồ Hoà Bình có vai trò rất quan trọng cho công tác vận hành công trình thủy lợi, thủy điện mục với tiêu phòng lũ cho đồng bằng sông Hồng, góp phần phòng tránh hạn hán và ổn định năng lượng điện cho cả nước. Trong bài báo này, chúng tôi ứng dụng phương pháp Deep learning dự báo lượng nước về hồ Hòa Bình trước 10 ngày. Kết quả thực nghiệm cho thấy mô hình dự báo tìm được có chất lượng dự báo vượt trội so với các phương pháp học máy khác như máy véctơ hỗ trợ, rừng ngẫu nhiên, LASSO, cây quyết định, k láng giềng gần nhất; hệ số xác định bội R2 của phương pháp Deep learning đạt tới 92%. Nghiên cứu này cũng mở ra hướng ứng dụng mới cho các bài toán dự báo chuỗi thời gian khi dùng Deep learning, phương pháp này giúp cải thiện độ chính xác của mô hình và có thể ứng dụng rộng rãi trong các lĩnh vực kinh tế, xã hội tại Việt Nam. Từ khóa— Deep learning, mạng nơron, máy véctơ hỗ trợ, rừng ngẫu nhiên, LASSO, khai phá dữ liệu, học máy. I. ĐẶT VẤN ĐỀ Hồ chứa Hòa Bình là hồ chứa lớn nhất Việt Nam nằm trên dòng sông Đà, cách Hà Nội khoảng 70km, hệ thống thủy điện của hồ Hòa Bình được đưa vào vận hành từ năm 1990 giữ vai trò quan trọng trong kiểm soát lũ, hạn hán và cung cấp điện cho đồng bằng châu thổ sông Hồng. Dung tích hồ là 9.6*109 m3 với khả năng xả lớn nhất đạt 2,400 m3/s. Điều tiết nước trong mùa lũ luôn là bài toán quan trọng trong vận hành hồ chứa, việc dự báo chính xác lưu lượng nước đổ về hồ chứa trước một khoảng thời gian chủ động luôn là thách thức lớn đối với nhà quản lý trong công tác vận hành tổ hợp công trình tại thủy điện Hòa Bình. Dự báo chính xác lưu lượng là yêu cầu chủ yếu trong việc xây dựng thành công một hệ thống quản lý và giảm nhẹ ảnh hưởng của lũ, an toàn hồ đập trong một lưu vực sông. Các phương pháp học máy tiếp cận bài toán dự báo lưu lượng nước đổ về hồ chứa đã được nghiên cứu và đạt được nhiều kết quả khả quan [17, 18, 19]. Mạng nơron (neural) nhân tạo (ANN) được chứng minh bằng thực nghiệm cho thấy là một trong các phương pháp hiệu quả nhất và được dùng nhiều trong tính toán dự báo dạng chuỗi thời gian đối với bài toán thuộc dạng này [18, 20-24]. Trong những năm gần đây, phương pháp Deep learning (Học sâu) dựa trên nền tảng mạng nơron nhân tạo đang phát triển rất nhanh và thu hút đông đảo cộng đồng nghiên cứu tham gia. Trong nghiên cứu này, phương pháp Deep learning được nghiên cứu để phân tích, dự báo trung hạn lưu lượng nước đổ về hồ Hòa Bình trước 10 ngày, từ đó trợ giúp công tác hỗ trợ ra quyết định trong điều hành hồ chứa; phương pháp Deep learning cũng có thể mở rộng với các bài toán dự báo lưu lượng tại các hồ chứa khác của Việt Nam phục vụ phòng, tránh và giảm nhẹ thiên tai. Bài toán dự báo lượng nước đổ về hồ Hòa Bình thường dựa trên vào các dữ liệu quan sát được trong quá khứ và các yếu tố tác động đến lưu lượng nước đổ về hồ. Dự báo lưu lượng nước sẽ chịu tác động của nhiều yếu tố ảnh hưởng đến kết quả dự báo như mưa, dòng chảy, địa hình, thảm phủ thực vật, độ ẩm, khí hậu và các tác động của con người trên lưu vực, Trong những yếu tố đó thì mưa đóng vai trò quan trọng nhất, còn các yếu tố về địa chất, thổ nhưỡng, thảm phủ thực vật ít thay đổi, nghiên cứu này chưa xét đến yếu tố khí hậu và tác động của con người làm thay đổi lưu vực. Chúng tôi tập trung nghiên cứu vào xây dựng mô hình Deep learning cải thiện chất lượng bài toán dự báo lưu lượng nước đến hồ Hòa Bình dựa trên số liệu mưa quan trắc được và các quan sát lưu lượng nước về hồ trong quá khứ. Các số liệu quan trắc về lượng mưa là những yếu tố quan trọng ảnh hưởng trực tiếp đến chất lượng dự báo. Hình 1 mô tả quá trình thu thập số liệu quan trắc theo chuỗi thời gian, thông thường ta xét trong 1 khoảng thời gian cố định (cửa sổ trượt) có dữ liệu quan sát phản ánh đủ những kịch bản dự báo. Những dữ liệu này được gọi chung là tập dữ liệu huấn luyện hay dữ liệu để học mô hình dự báo. Ta ký hiệu tập dữ liệu đầu vào này là *( ) ( ) ( ), trong đó N là số lượng mẫu quan sát được trong quá khứ, tập biến đầu vào (predictors) là các số liệu quan trắc về lượng mưa và biến đích (response feature) lưu giá trị quan sát của lưu lượng nước đổ về hồ Hòa Bình. Xét mô hình dự báo tổng quát để ước lượng lưu lượng nước (m3/s) về hồ dưới dạng sau: ( ) (1) Trương Xuân Nam, Nguyễn Thanh Tùng 119 Hình 2. Cấu trúc một neural nhân tạo Trong đó là lỗi của mô hình. Trong biểu thức (1), ta có các biến ngẫu nhiên với M biến đầu vào và một biến đầu ra . Mục tiêu của bài toán dự báo lưu lượng nước đổ về hồ Hòa Bình trong nghiên cứu này là dùng phương pháp Deep learning tìm hàm phi tuyến fD: X  Q để cực tiểu hóa lỗi dự báo Err (fD) = EX,Y {L(Q, fD(X))}, trong đó L(Q, fD(X))} = (Q – fD(X)) 2 là hàm mất mát (loss function), hàm fD(X) xây dựng được từ dữ liệu quan sát . Các yêu cầu phục vụ điều hành hồ chứa thường có 4 dạng dự báo: Thời gian dự báo ngắn hạn (trước 1-2 ngày), trung hạn (5-10 ngày), dài hạn (1 tháng) và siêu dài hạn (1 mùa). Dự báo ngắn hạn đòi hỏi độ chính xác cao và cấp thiết cho việc ra quyết định điều hành. Trong bài báo này, chúng tôi sử dụng phương pháp Deep learning, một trong những phương pháp phát triển rất nhanh trong thời gian gần đây và thu hút nhiều nghiên cứu trên thế giới, ứng dụng cho bài toán dự báo lưu lượng nước đổ về hồ Hòa Bình trước 10 ngày. Kết quả thực nghiệm cho thấy phương pháp Deep learning mang lại kết quả tốt hơn so với một số phương pháp học máy nổi tiếng khác như Máy véctơ hỗ trợ, rừng ngẫu nhiên, cây quyết định, k láng giềng gần nhất, LASSO khi so sánh về lỗi dự báo và độ chính xác của mô hình. Ngoài ra, việc cài đặt phân tán Deep learning giúp cải thiện tốc độ tính toán và xử lý được dữ liệu huấn luyện có dung lượng lớn. Nghiên cứu này cũng mở ra hướng ứng dụng mới cho các bài toán dự báo, giúp cải thiện độ chính xác và thời gian tính toán khi áp dụng trong lĩnh vực tài nguyên nước nói riêng và trong lĩnh vực kinh tế ở Việt Nam nói chung. II. DEEP LEARNING Deep learning là một tập các thuật toán học máy với ý tưởng xây dựng mô hình dữ liệu có mức độ trừu tượng cao dựa trên các dữ liệu có mức độ trừu tượng hóa thấp hơn, bằng cách phân lớp dữ liệu và các biến đổi phi tuyến [3]. Deep Neural network (DNN) là mô hình deep learning dựa trên mạng nơron nhân tạo với số lớp ẩn lớn; DNN cũng là mô hình được sử dụng với bài toán dự báo lưu lượng nước đến hồ Hòa Bình. Phần II này trình bày các khái niệm và thành phần cơ bản được sử dụng trong mô hình được đề xuất – mạng nơron sâu truyền thẳng với 3 lớp ẩn được kết nối đầy đủ. Do đặc điểm của mô hình là mạng truyền thẳng với số nút tương đối lớn, kết nối đầy đủ nhưng tập dữ liệu huấn luyện tương đối nhỏ; một số điều chỉnh dựa trên [1] được thử nghiệm để tránh tình trạng quá khớp. A. Nơron nhân tạo Cấu trúc của nơron nhân tạo mô phỏng hoạt động của tế bào thần kinh trong tự nhiên được minh họa trong Hình 2; trong đó các tín hiệu kích hoạt (x0, x1,) được gửi tới nơron và được điều chỉnh nhân bởi các trọng số kết nối (w0, w1,). Tổng các tín hiệu này tiếp tục được điều chỉnh bởi hệ số thành kiến b (bias) – thể hiện ngưỡng lọc nội tại của tế bào. Cuối cùng, tín hiệu đầu ra của nơron được biến đổi bởi hàm kích hoạt (activation function) [5]. Có nhiều lựa chọn cho các hàm kích hoạt khác nhau, tùy vào mục đích thiết kế và loại dữ liệu đầu ra mong muốn. Mô hình đề xuất trong bài báo này sử dụng hàm kích hoạt hyperbolic tangent f(x) = tanh(x) cho tất cả các nơron; hàm hyperbolic tangent và các biến thể của nó là hàm kích hoạt phù hợp với xử lý dữ liệu dạng số và là hàm kích hoạt phổ biến sử dụng cho các mô hình deep learning [4]. B. Mạng truyền thẳng kết nối đầy đủ Các nơron kết nối với nhau tạo thành mạng nơron, có rất nhiều kiến trúc mạng khác nhau đã được thử nghiệm và sử dụng trong thực tế. Ở kiến trúc mạng nhiều lớp truyền thẳng, các nơron đươc chia thành các nhóm hay các lớp (layer), các lớp được sắp xếp theo thứ tự tuyến tính. Các nơron trong cùng một lớp không được kết nối với nhau. Một nơron thuộc lớp trước kết nối tới các nơron thuộc lớp liền sau. Như vậy tín hiệu được truyền từ lớp đầu vào đến lớp đầu ra theo một hướng. Việc các nơron giữa hai lớp liên tiếp được kết nối như thế nào tùy thuộc vào bài toán cụ thể và topo mạng nơron thường được lựa chọn dựa trên góc nhìn chủ quan của mô hình được đề xuất cho bài toán đó. Trong bài toán dự báo lưu lượng nước đến hồ chứa Hòa Bình, do chưa thể biết tham số nào là quan trọng với kết quả đầu ra, mô hình đề xuất sử dụng kết nối đầy đủ: nơron thuộc lớp trước kết nối với tất cả các nơron thuộc lớp kế tiếp. Việc lựa chọn đặc trưng và tham số sẽ do thuật toán học quyết định, dựa vào việc đánh giá trọng số kết nối. Hình 3 minh họa nơron lớp thứ i là Lli được kết nối đầy đủ với tất cả các nơron thuộc lớp trước và sau nó. Như vậy giữa hai lớp mạng nơron Ll-1 và Ll chúng ta sử dụng một ma trận trọng số kí hiệu là W (l-1) có kích cỡ |L(l-1)| x |Ll|, tương tự như vậy, ma trận trọng số Wl có kích cỡ |Ll| x |L(l+1)| lưu trữ các trọng số kết nối giữa các nơron thuộc lớp Ll và Ll+1. 120 DEEP LEARNING: ỨNG DỤNG CHO DỰ BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒ CHỨA HÒA BÌNH Hình 3. Kết nối đầy đủ của một neural nhân tạo C. Thuật toán lan truyền tới (feed forward) Thuật toán này sử dụng để tính toán kết quả đầu ra của mạng nơron với đầu vào là véctơ x(0), W = {W(0), W(1),, W (L-1)} là tập hợp các ma trận trọng số, W(i) là ma trận trọng số của các kết nối giữa các nơron thuộc lớp i và lớp i+1. function FeedForward(x(0) R|L0|) for l = 1 to L do z(l) ← W(l−1) · x(l−1) x(l) ← f(z(l)) end for return x(L), Loss(z(L)) end function D. Hàm mất mát (loss function) Tổng của các độ sai lệch giữa dữ liệu ra của mạng nơron h(xd; W), và dữ liệu ra cần đạt được, g(xd), thể hiện độ tốt của tập tham số hiện tại. Nếu tập huấn luyện là cố định, tổng này về bản chất là một hàm số chỉ phụ thuộc vào tập tham số W được định nghĩa: ( ) ∑ ( ( ) ( )) với D là tập huấn luyện, dist là một hàm tính độ chênh lệch giữa hai điểm dữ liệu ra [2]. Trong quá trình huấn luyện, giá trị của hàm mất mát càng nhỏ thì đầu ra của mạng nơron càng gần với đích huấn luyện. Như vậy ở góc nhìn này việc huấn luyện mạng nơron về bản chất là việc điều chỉnh tham số W để cực tiểu hóa hàm số Loss(W) [6]. E. Thuật toán huấn luyện bằng lan truyền ngược lỗi (back-propagation) Thuật toán lan truyền ngược lỗi dựa trên ý tưởng rất đơn giản: khi đầu ra của mạng nơron không được như mong muốn, chúng ta sẽ điều chỉnh giá trị các tham số của mạng nơron. Do mạng là phân lớp và truyền thẳng, quá trình điều chỉnh sẽ đi theo chiều ngược lại, điều chỉnh từ lớp đầu ra, các lớp ẩn, cho đến lớp đầu tiên (đây là xuất xứ của tên gọi “lan truyền ngược”) [6]. function BACKPROP(x(0) R|L0| , {W(l)}) Dùng thuật toán FeedForward với x(0) để tính các giá trị z(1),,z(L), x(1),, x(L) và hàm mất mát Loss(z(L)) δ(L) ← ∂/∂z(L) Loss for l = L − 1 to 0 do ∂/∂z(l) Loss ← f’(z(l)) ◦ (W(l)T · δ(l+1)) ∂/∂W(l) Loss ← δ(l+1) · x(l)T end for return {∂/∂W(0) Loss, · · · , ∂/∂W(L−1) Loss } end function Các vấn đề về thuật toán được trình bày chi tiết trong [6]; đối với việc tính toán tham số điều chỉnh W, mô hình đề xuất sử dụng thuật toán SGD (Stochastic Gradient Descent), chi tiết xin xem trong [7]; thuật toán nhanh hơn so với phương pháp GD (Gradient Descent) thông thường, ngoài ra cho phép huấn luyện mạng ngay cả khi không có toàn bộ tập dữ liệu huấn luyện ngay từ đầu. F. Khả năng xấp xỉ của mạng nơron và hiện tượng quá khớp (overfitting) Mạng nơron đã được chứng minh có khả năng xấp xỉ vạn năng [8] với số lớp không quá lớn (4 lớp). Tuy nhiên nghiên cứu không chỉ ra được việc huấn luyện xấp xỉ như thế nào và khả năng tổng quát hóa (dự báo) của mạng. Ngoài ra, không có phương pháp nào ước lượng số nơron cần có trên mỗi lớp và topo kết nối giữa các lớp với nhau. Khả năng xấp xỉ và mô hình hóa rất mạnh của mạng nơron không phải luôn luôn có lợi; nó dẫn đến việc mạng nơron rất dễ bị hiện tượng quá khớp (overfitting). Hiện tượng này xảy ra khi quá trình huấn luyện mạng nơron dẫn đến việc mạng đã lựa chọn xấp xỉ một hàm phức tạp quá mức cần thiết, hàm này mô phỏng hoàn hảo các tình huống huấn luyện, nhưng do cấu trúc phức tạp, hàm lại không có tính tổng quát hóa cao hoặc rất thiếu ổn định, hệ quả là mạng dự đoán không chính xác với các mẫu không có trong tập huấn luyện. Các phương pháp khắc phục hiện tượng quá khớp được trình bày trong [1], với bài toán dự báo lượng nước đổ về hồ Hòa Bình, l1-norm [12] được lựa chọn sử dụng, lý do lựa chọn vì huấn luyện với l1 cho tập tham số thưa giúp tăng tốc độ tính toán và giảm yêu cầu về bộ nhớ [1]. G. Deep learning Trương Xuân Nam, Nguyễn Thanh Tùng 121 Hình 4. Mô hình học sâu trong nhận dạng mặt người Hình 5. Cấu trúc DNN 3 lớp ẩn cho bài toán dự báo lượng nước đổ về hồ Hòa Bình Mạng nơron được chứng minh khả năng xấp xỉ vạn năng chỉ với không quá 4 lớp, nhưng chưa có phương pháp nào cụ thể ước lượng số nơron cần thiết trên mỗi lớp. Các mô hình học sâu có kiến trúc tương tự mạng nơron nhưng dựa trên cách tiếp cận khác, với ý tưởng cơ bản là dữ liệu tại mỗi lớp sẽ có mức độ trừu tượng hóa (khái quát) cao hơn bằng cách tổ hợp các dữ liệu có mức trừu tượng hóa thấp ở lớp trước [3]. Hình 4 biểu diễn một mô hình học sâu tiêu biểu [9] sử dụng trong nhận dạng mặt người, trong đó dữ liệu đầu vào của mạng có thể là dữ liệu ở dạng thô nhất là các điểm ảnh RGB (thậm chí không cần qua tiền xử lý). Các đặc trưng được tổ hợp và tạo thành các chi tiết nhỏ ở lớp ẩn đầu tiên, sau đó tiếp tục được tái tạo và tổ hợp mức chi tiết lớn ở lớp ẩn thứ hai và cuối cùng các hình ảnh đặc trưng của toàn bộ khuôn mặt ở lớp ẩn thứ 3. Lớp đầu ra cho ra đánh giá xác suất khuôn mặt thuộc phân lớp nào (người nào). Một mô hình học sâu thường có 3 nhiệm vụ được kết hợp trong một kiến trúc mạng duy nhất: - Các lớp đặc trưng (features): có nhiệm vụ chuyển đổi các đặc trưng thành dạng dữ liệu phù hợp để xử lý, chẳng hạn như các tầng tích chập (convolution), mẫu (subsampling), pooling, - Các lớp mô hình (modeling): sử dụng các thuật toán học để khái quát hóa dữ liệu, chẳng hạn nơron network, restricted BM, DBN, autoencoder, - Các lớp giải mã (decoding): dựa trên dữ liệu khái quát biến đổi thành đầu ra (markov random field hoặc những công cụ tương tự). Các mạng học sâu đều có cấu trúc xác định trước, như vậy bài toán tập huấn vẫn là việc xác định giá trị các tham số trên mạng. Hiện chưa có phương pháp tập huấn nào cho phép điều chỉnh cấu trúc mạng hiệu quả [3]. H. Cấu trúc DNN thử nghiệm cho bài toán dự báo lượng nước đổ về hồ Hòa Bình Bài toán dự báo lượng nước đổ về hồ Hòa Bình đã được thử nghiệm với nhiều mô hình dự báo như ANN (Artificial Neuron Network), SVR (Support Vector Regression), RF (random forest), LASSO [14]. Trong bài báo này, cấu trúc DNN đơn giản được đề xuất với mục đích kiểm chứng chất lượng dự báo của phương pháp deep learning so với các phương pháp đã có, kết quả thực nghiệm cho thấy chất lượng dự báo chính xác hơn so với các phương pháp trên, trong các nghiên cứu tương lai chúng tôi sẽ tiếp tục cải tiến mô hình và tiến hành thử nghiệm thực tế (đưa mô hình vào chạy thực sự với hệ thống vận hành đã có). Mô hình thử nghiệm: - Lớp đầu vào: dữ liệu quan sát đầu vào không qua chuẩn hóa, dạng chuỗi số liệu với cửa sổ trượt là 8 gồm cả dữ liệu về lượng mưa và lưu lượng nước đổ về hồ (xem chi tiết hơn trong phần III.A), không có thông tin về mốc thời gian (giả thiết là quãng thời gian là đều nhau). Vector dữ liệu đầu vào được lựa chọn có cấu trúc tương tự với các phương pháp đối sánh khác để đảm bảo sự khách quan và dễ dàng khi so sánh các kết quả tính toán cuối cùng. - Các lớp đặc trưng bị loại bỏ do dữ liệu đầu vào khá đơn giản. Việc loại bỏ này cũng kiểm tra khả năng mô hình hóa dữ liệu trực tiếp từ số liệu thô của các lớp modeling. Việc DNN có kết quả tốt chưa khẳng định được việc loại bỏ các tầng features là đúng đắn, đó có thể là chủ đề của một bài báo khác. - Các lớp ẩn: 3 lớp ẩn mỗi lớp 500 nút và kết nối đầy đủ, X là véctơ dữ liệu đầu vào và Q là biến đầu ra. - Đầu ra: 1 đầu ra duy nhất Q là dự báo trung hạn (10 ngày), thiết kế ban đầu được dự kiến đầu ra là véctơ Q có | | gồm dự báo ngắn hạn (2 ngày), trung hạn (10 ngày), dài hạn (30 ngày) và toàn mùa, do mục tiêu chỉ có tính đánh giá mô hình và cần rút ngắn thời gian tập huấn mạng nên có điều chỉnh lại với một đầu ra trung hạn duy nhất. 122 DEEP LEARNING: ỨNG DỤNG CHO DỰ BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒ CHỨA HÒA BÌNH - Thuật toán huấn luyện: lan truyền ngược lỗi với luật sửa lỗi hạ dốc ngẫu nhiên (stochastic gradient descent). - Xử lý quá khớp: sử dụng phương pháp bình thường hóa tham số (regularization) norm-1 [12]. III. KẾT QUẢ THỰC NGHIỆM A. Mô tả dữ liệu và thiết kế kịch bản dự báo Dữ liệu dùng trong thực nghiệm được thu thập tại trạm Tạ Bú trên sông Đà từ năm 1964 đến năm 2002, đây là trạm đo lưu lượng gần hồ Hòa Bình nhất. Bộ số liệu này được đo trong mùa cạn (từ tháng 12 năm trước đến tháng 5 năm sau). Chúng tôi chia dữ liệu làm 2 tập, tập dữ liệu huấn luyện (training set) gồm 510 bản ghi đo được từ cuối năm 1964 đến đầu năm 1998, phần dữ liệu còn lại gồm 60 bản ghi dùng làm tập kiểm thử để đánh giá hiệu năng của phương pháp Deep learning. Để mô hình hóa bài toán dự báo lưu lượng nước đổ về hồ Hòa Bình trước 10 ngày, chúng tôi đặt Q(t+10) là biến đầu ra của mô hình dự báo. Các số liệu quan trắc mưa, lưu lượng Q đo đạc được của ngày hiện tại và những ngày trước đó đều được xem xét và đưa vào mô hình. Việc lựa chọn các tiêu chí cần kinh nghiệm chuyên gia và thử nghiệm các kịch bản để lựa chọn, trong nghiên cứu này chúng tôi sử dụng kịch bản tốt nhất được trình bày trong nghiên cứu của Chen và đồng nghiệp [10]. Mối quan hệ giữa biến đầu vào và biến đầu ra của mô hình dự báo được xây dựng như sau: ( ) ( ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )) (2) trong đó ( ) ( ) ( ) là lưu lượng nước về hồ ở thời điểm hiện tại, thời điểm trước đó 10 và 20 ngày tương ứng. Lượng mưa quan trắc ở thời điểm hiện tại, thời điểm trước đó 10 và 20 ngày được lưu trữ tương ứng trong các biến ( ) ( ) và ( ). Hai biến ( ) và ( ) chỉ số liệu mưa quan trắc và lưu lượng nước về hồ của ngày hiện tại. Lý do chọn các yếu tố này để xây dựng mô hình dự báo vì trong nghiên cứu thủy văn, lượng mưa tại lưu vực luôn ảnh hưởng nhiều đến lượng nước chảy về hồ chứa. Hàm quan hệ ( ) được xây dựng từ dữ liệu sử dụng phương pháp Deep learning. Lưu lượng Q được đo theo m3/s và số liệu mưa quan trắc được đo theo đơn vị mm. B. Phương pháp đánh giá Chúng tôi dùng căn bình phương sai số (Root mean squared error-RMSE) và hệ số xác định bội (coefficient of determination) R 2 để đánh giá tính hiệu quả của các mô hình dự báo dựa trên phương pháp học máy: √ ∑ ( ̂ ) và (3) ∑ ( ̂ ) ∑ ( ̅ ) (4) Trong đó: Qi, ̂ và ̅ chỉ giá trị lưu lượng đo đạc được, giá trị dự đoán và giá trị trung bình của mẫu thứ i tương ứng. Mô hình dự báo cho kết quả tốt là mô hình đạt được sai số RMSE nhỏ và R2 lớn. Hệ số xác định bội R2 cao là một dấu hiệu cho thấy mối liên hệ giữa các yếu tố đầu vào và biến lưu lượng Q chặt chẽ. Giá trị R2 càng cao cho thấy mô hình sử dụng để dự báo có khả năng giải thích càng tốt các thay đổi của lưu lượng nước đổ về hồ giữa các yếu tố mưa quan trắc và lưu lượng đo được trong quá khứ. C. Kết quả d