DỮ LIỆU MỞ LÀ GÌ VÀ MANG LẠI NHỮNG GÌ?
Dữ liệu mở (Open Data) là dữ liệu được cấp phép theo giấy phép
mở, cho phép chúng ta tự do 3 việc sau đây: sử dụng & sử dụng lại,
phân phối & phân phối lại (có thể tùy biến & pha trộn) [1].
Dữ liệu mở chỉ yêu cầu nhiều nhất 2 việc: Ghi công & chia sẻ
tương tự.
Lưu ý tránh các sai lầm phổ biến:
- Cần hiểu dữ liệu mở là dữ liệu có bản quyền, tránh nghĩ rằng
miễn phí là không có bản quyền.
- Việc tự do sử dụng bao gồm yếu tố miễn phí nhưng không chỉ là
miễn phí vì một số dữ liệu được sử dụng miễn phí nhưng không phải là
dữ liệu mở.
- Dữ liệu mở ở đây không đề cập đến các dữ liệu của cá nhân & các
dữ liệu liên quan đến bí mật quốc gia. Các dữ liệu này không nằm trong
phạm vi khi nói đến dữ liệu mở.
7 trang |
Chia sẻ: thanhle95 | Lượt xem: 106 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Dữ liệu mở và ứng dụng thực tế các hệ thống mở trong giáo dục và của chính phủ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
DỮ LIỆU MỞ VÀ ỨNG DỤNG THỰC TẾ CÁC HỆ THỐNG MỞ
TRONG GIÁO DỤC VÀ CỦA CHÍNH PHỦ.
Nguyễn Thế Hùng1
Kinh nghiệm xây dựng, triển khai và vận hành kho bài giảng, kho
học liệu mở e-learning của Bộ Giáo Dục & ví dụ về DauThau.INFO
phần mềm khai thác dữ liệu thầu giúp minh bạch hóa hoạt động đấu
thầu của nhà nước [14].
DỮ LIỆU MỞ LÀ GÌ VÀ MANG LẠI NHỮNG GÌ?
Dữ liệu mở (Open Data) là dữ liệu được cấp phép theo giấy phép
mở, cho phép chúng ta tự do 3 việc sau đây: sử dụng & sử dụng lại,
phân phối & phân phối lại (có thể tùy biến & pha trộn) [1].
Dữ liệu mở chỉ yêu cầu nhiều nhất 2 việc: Ghi công & chia sẻ
tương tự.
Lưu ý tránh các sai lầm phổ biến:
- Cần hiểu dữ liệu mở là dữ liệu có bản quyền, tránh nghĩ rằng
miễn phí là không có bản quyền.
- Việc tự do sử dụng bao gồm yếu tố miễn phí nhưng không chỉ là
miễn phí vì một số dữ liệu được sử dụng miễn phí nhưng không phải là
dữ liệu mở.
- Dữ liệu mở ở đây không đề cập đến các dữ liệu của cá nhân & các
dữ liệu liên quan đến bí mật quốc gia. Các dữ liệu này không nằm trong
phạm vi khi nói đến dữ liệu mở.
1 Công ty Cổ phần Phát triển Nguồn mở Việt Nam.
463PHẦN 4. THỰC TRẠNG VÀ KINH NGHIỆM TRIỂN KHAI TÀI NGUYÊN GIÁO DỤC MỞ
DỮ LIỆU MỞ CỦA CHÍNH PHỦ
Dữ liệu mở của chính phủ là dữ liệu được các chính phủ cấp phép
mở! Hình dưới đây sẽ minh họa điều này:
Ảnh: Phân loại dữ liệu và dữ liệu mở trong chính phủ [8]
Giá trị của Open Data là gì? Tại sao chính phủ nên mở dữ liệu?
Để biết giá trị của Open Data, có thể tóm gọn bằng câu trả lời
phỏng vấn của của giáo sư Hồ Tú Bảo [9] và cũng là trích dẫn trong báo
cáo của World Bank (Ngân hàng Thế giới) [4] về Open Data: “Dữ liệu
mở chính là động lực để các doanh nghiệp SMEs cũng như start-ups
tham gia vào nền kinh tế số của Việt Nam”.
Chính phủ nên mở dữ liệu của mình thành dữ liệu mở vì đây là
nguồn dữ liệu lớn và chất lượng, có nhiều giá trị có thể giúp thúc đẩy sự
phát triển của doanh nghiệp và xã hội [2] [3] [5] [6]
Có dữ liệu nhưng mở không dễ!
Năm ngoái, có dịp làm việc các cơ quan quản lý nhà nước để khảo
sát và đánh giá về hiện trạng dữ liệu mở (hồi đó VFOSSA giao nhiệm vụ
làm thành viên trong đoàn khảo sát của Viện Công nghiệp phần mềm và
nội dung số (Bộ TT&TT) về Dữ liệu mở trong khối cơ quan nhà nước
dưới tư cách là chuyên gia tư vấn), vì vậy mà được làm việc với một số
trung tâm CNTT ở các bộ. Có một vấn đề nổi cộm khi đoàn khảo sát đưa
đề xuất về việc mở dữ liệu thì đều nhận được các câu trả lời chung là:
464 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ
- Các cơ quan quản lý nhiều khi muốn mở nhưng không biết mở như
thế nào vì không có hướng dẫn về quyền hạn và nghĩa vụ của việc này.
- Vấn đề thứ 2 là vấn đề của chính dữ liệu: chất lượng dữ liệu, bản
quyền dữ liệu & việc loại bỏ dữ liệu riêng tư/ cá nhân nằm trong đó.
Một số đơn vị đã “thí điểm mở” bằng việc cấp phép cho một số
doanh nghiệp start-up truy cập dữ liệu nhưng sau đó phải dừng lại vì
các nguyên nhân liên quan đến việc không có khả năng loại bỏ dữ liệu
riêng tư trong đó.
Có dữ liệu có thể mở nhưng... có muốn mở hay không?
Lại có chỗ dữ liệu sẵn sàng trở thành dữ liệu mở, ví dụ các thông
tin bị bắt buộc phải công khai theo điều 10 và 17 của Luật tiếp cận
thông tin, các dữ liệu này của chính phủ chỉ cần bổ sung thêm giấy phép
là ngay lập tức trở thành dữ liệu mở. Tuy nhiên các cơ quan quản lý
chúng muốn cấp giấy phép mở cho chúng hay không lại là chuyện khác.
Cá nhân tôi đã từng góp ý một cơ quan sở hữu các dữ liệu này để
cấp phép mở cho chúng với khẳng định rằng đơn vị này sẽ trả thành cơ
quan đầu tiên ở Việt Nam cấp phép mở cho dữ liệu của chính phủ theo
đúng xu thế mà Văn phòng chính phủ (VPCP) và WorldBank đang vận
động [4] nhưng không nhận được câu trả lời từ đơn vị này.
Cạnh tranh khai thác dữ liệu của chính phủ không lành mạnh do dữ liệu chưa được mở
Dữ liệu đáng ra phải mở nhưng thiếu giấy phép nên chỉ có số ít
doanh nghiệp dám khai thác, thậm chí một số dữ liệu thiếu công khai
nên xuất hiện hiện tượng doanh nghiệp bắt tay với một vài chân trong
nhằm khai thác ngầm dữ liệu của chính phủ. Điều này khiến doanh
nghiệp cạnh tranh với nhau không lành mạnh, không tạo ra lợi ích cho
xã hội từ việc khai thác dữ liệu.
Còn nhớ dữ liệu điểm thi đại học vài năm trước bị o bế, một số
doanh nghiệp nhanh nhạy kinh doanh dịch vụ bắt tay với một vài cá
nhân để copy ra ngoài kinh doanh. Đột nhiên năm 2015 việc bắt tay
không trót lọt, chính những doanh nghiệp này bị quy tội lừa đảo và bị
phạt tiền [7].
465PHẦN 4. THỰC TRẠNG VÀ KINH NGHIỆM TRIỂN KHAI TÀI NGUYÊN GIÁO DỤC MỞ
Một số cơ quan nhà nước còn giữ độc quyền dữ liệu để tự kinh
doanh các dịch vụ dựa trên dữ liệu của chính phủ. Nguy cơ hiện hữu là
các đơn vị này sẽ tìm cách giữ nó “độc quyền tự nhiên” nhằm tạo lợi
thế kinh doanh.
Năm ngoái, khi chúng tôi triển khai Phần mềm khai thác thông tin
thầu (DauThau.INFO) ngay lập tức nhận được cảnh báo về việc sẽ bị
gây khó dễ. Quả thực, chỉ vài tháng sau đã bị thanh tra kiểm tra. Rất
may là công ty trước giờ chẳng có gì ngoài việc làm ăn chỉn chu, sổ
sách cẩn thận, tuân thủ pháp luật cho nên kết quả thanh tra đủ các mảng
kinh doanh sau 10 ngày chỉ có 1 kết luận duy nhất là mọi thứ trong sạch,
đúng quy định.
Tất nhiên, để có được chữ “đúng quy định pháp luật” thì bản thân
việc hiểu biết về bản quyền, về dữ liệu, về pháp luật có liên quan thì
khỏi phải nói, đó là cả một rừng các viện dẫn. Chỉ riêng về các căn cứ
thì DauThau.INFO đã có cả mớ trang tài liệu như Điều khoản sử dụng,
Chính sách bảo mật, Cam kết dịch vụ, Tuyên bố bản quyền... thực ra
cuối cùng cũng chỉ để bảo vệ chính mình và khẳng định việc khai thác
các dữ liệu này là đúng pháp luật.
Hy vọng cho một tương lai của dữ liệu mở từ chính phủ
Với sự cổ vũ mạnh mẽ từ tất cả các cấp, các phong trào như: chính
phủ điện tử, chính phủ số, start-up, quốc gia khởi nghiệp... đã góp phần
thúc đẩy dữ liệu mở được quan tâm. Đầu năm nay, văn phòng chính phủ
cùng với Ngân hàng Thế giới (World Bank) đã tổ chức một số hội thảo
về dữ liệu mở [4] và ra những báo cáo đầy khả quan về mảng này.
Quá trình khảo sát với các cơ quan nhà nước cũng cho thấy nhiều
cơ quan quản lý nhà nước hiện cũng khá cởi mở với việc mở dữ liệu.
Một thế hệ lãnh đạo trẻ, có hiểu biết đang dần thay đổi nhận thức về
việc phải mở dữ liệu. Chỉ còn chờ một cơ chế làm sao để việc mở dữ
liệu là mặc định từ phía chính phủ. Ví dụ đưa ra các quy định chỉ rõ dữ
liệu nào buộc phải cấp phép mở (giống như luật tiếp cận thông tin).
Khi dữ liệu được mở, một thế hệ doanh nghiệp đổi mới sáng tạo sẽ
được ra đời để khai thác dữ liệu này. Khi dữ liệu này được khai thác, nó
466 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ
sẽ tạo ra nhiều lợi ích cho người dân, chính phủ và chính doanh nghiệp.
Nói cho cùng, lúc này doanh nghiệp sẽ trở thành cánh tay nối dài của
chính phủ trong việc giúp khai thác dữ liệu để phục vụ nhân dân. Đây
là một cách huy động nguồn lực doanh nghiệp một cách thông minh để
“xã hội hóa” các dịch vụ từ dữ liệu mà nhà nước chưa thể làm để phục
vụ nhân dân.
Dữ liệu mở của chính phủ sẽ là nguồn nhiên liệu cho công cuộc
thúc đẩy việc sản sinh ra các start-up đổi mới sáng tạo tại Việt Nam.
Việc này nhanh hay chậm, vẫn do chính phủ quyết định!
DỮ LIỆU MỞ TRONG GIÁO DỤC
Hiện trạng buồn ở Việt Nam
Việt Nam chưa có nhiều kho tài nguyên giáo dục mở, hiểu biết về
bản quyền tài nguyên số và tài nguyên giáo dục mở còn hạn chế khiến
cho việc xây dựng các kho tài nguyên giáo dục mở ở Việt Nam không
khả thi với các hình thức sử dụng nguồn lực cộng đồng.
Kho tài nguyên giáo dục mở đầu tiên là VOER được sinh ra từ dự
án của chương trình Tài nguyên Giáo dục Mở Việt Nam (hỗ trợ bởi Quỹ
Việt Nam, The Vietnam Foundation - VNF). Tuy nhiên kho này kể từ
sau khi dự án hoàn thành thì tài nguyên không được đóng góp thêm bao
nhiêu [10] mặc dù hệ thống vẫn hoạt động tốt và chức năng đóng góp hoạt
động bình thường. Một loạt các dự án sau đó cũng rơi vào tình trạng
tương tự.
Giải pháp nào cho việc này?
Nhận định việc sử dụng nguồn lực cộng đồng tình nguyện ở Việt
Nam là chưa khả thi trong bối cảnh hiện tại, năm 2016, chúng tôi đã
thử nghiệm mô hình mới là tư vấn để hướng các cuộc thi phong trào trở
thành nơi để phổ cập về bản quyền nội dung số, sản phẩm nộp dự thi
chính là tài nguyên giáo dục mở. Cuộc thi đầu tiên được tư vấn là Cuộc
thi quốc gia Thiết kế bài giảng e-Learning lần thứ 4 [11], song song đó là
việc hỗ trợ xây dựng kho học liệu mở để khai thác các tài nguyên này
[12]. Kết quả là với 800 bài lọt vòng chung khảo với hai nhóm chủ đề là
467PHẦN 4. THỰC TRẠNG VÀ KINH NGHIỆM TRIỂN KHAI TÀI NGUYÊN GIÁO DỤC MỞ
dư địa chí và chủ đề theo môn học, Bộ GD&ĐT đã có một kho bài giảng
chất lượng tốt, trải dài ở tất cả các môn học từ các giáo viên trên toàn
quốc. Tất cả các bài giảng cho kho học liệu mở được cấp theo đúng giấy
phép mở CC-BY [13]. Bài giảng có thể cho người truy cập học trực tuyến
miễn phí không cần đăng nhập và tải về để học (cần đăng ký tài khoản
và đăng nhập để tải về).
Tuy nhiên, kho học liệu hiện mới chỉ dừng ở phạm vi cuộc thi,
chưa cho phép đóng góp theo hướng mở, việc này có trong định hướng
nhưng vẫn phụ thuộc vào kế hoạch của Bộ GD&ĐT. Chúng tôi nhận
thức rằng: Chừng nào giáo dục mở và tài nguyên giáo dục mở chưa phải
là quốc sách của Việt Nam hay chính sách của Bộ GD&ĐT thì khi đó
việc thay đổi căn bản và toàn diện một cách nhanh chóng vẫn là điều
khó. Dẫu vậy, hành trình vạn dặm đều cần bước chân đầu tiên, chúng
ta hãy bắt đầu từ cái nhỏ và sử dụng tất cả những gì có thể làm để khởi
đầu, sử dụng bất kỳ công nghệ nào, bất kỳ hình thức nào để thúc đẩy tài
nguyên giáo dục mở, khi nhận thức thay đổi, xã hội sẽ tiến lên.
CHÚ THÍCH:
[1] Open Data:
[2] Tạp chí Tia Sáng - Hiểu đúng về chính phủ mở (28/12/2018):
com.vn/-dien-dan/Hieu-dung-ve-chinh-phu-Mo-14077
[3] Báo Đầu Tư - Dữ liệu mở sẽ là chìa khóa cho khu vực kinh tế tư nhân
(02/05/2019): https://baodautu.vn/du-lieu-mo-se-la-chia-khoa-cho-khu-
vuc-kinh-te-tu-nhan-d99590.html
[4] “Báo cáo đánh giá Mức độ sẵn sàng về Chính phủ số và Dữ liệu Mở
tại Việt Nam” do VPCP và World Bank VN thực hiện (Tháng
2/2019):
ChinhphuSovaDulieuMo_VN_FINAL.pdf
[5] Báo cáo tổng quan về dữ liệu mở của Viện CNPM&NDS (13/10/2017):
[6] Báo cáo một số vấn đề về sự cần thiết ban hành các qui định, chính sách về
dữ liệu mở của Viện CNPM&NDS (01/11/2017):
vn/?mdocs-file=1197
468 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ
[7] Goldsoft và INET bị phạt 140 triệu đồng vì quảng cáo “lừa đảo” về
dịch vụ tra cứu điểm thi:
bi-phat-140-trieu-dong-vi-quang-cao-lua-dao-ve-dich-vu-tra-cuu-diem-
thi-20150731173115726.chn
[8] Università Ca’ Foscari Venezia, Open data: uno strumento per la lotta alla
corruzione nelle ubbliche Amministrazioni (Dữ liệu mở: một công cụ cho
cuộc chiến chống tham nhũng trong chính quyền hành chính), 2016/2017:
[9] Forbesvietnam - Bao giờ Việt Nam có dữ liệu mở? (03/11/2018): https://
forbesvietnam.com.vn/tin-cap-nhat/bao-gio-viet-nam-co-du-lieu-
mo-4713.html
[10] Lịch sử đóng góp trên Kho Tài nguyên Giáo dục Mở Việt Nam: https://
voer.edu.vn/browse
[11] Cuộc thi quốc gia Thiết kế bài giảng e-Learning hướng tới tài nguyên giáo
dục mở: https://ictnews.vn/cntt/cuoc-thi-quoc-gia-thiet-ke-bai-giang-e-
learning-huong-toi-tai-nguyen-giao-duc-mo-139695.ict
[12] Kho bài giảng e-Learning của Bộ giáo dục: https://elearning.moet.edu.vn
[13] Giấy phép CC-BY: https://creativecommons.org/licenses/by/3.0/vn/
[14] Kinh nghiệm xây dựng, triển khai và vận hành kho bài giảng, kho học
liệu mở e-learning của Bộ Giáo Dục & ví dụ về DauThau.INFO phần
mềm khai thác dữ liệu thầu giúp minh bạch hóa hoạt động đấu thầu của
nhà nước:
duc-va-chinh-phu-37.html.