Ứng dụng dữ liệu mở liên kết trong việc nâng cao chất lượng các nguồn tài nguyên giáo dục mở

Tóm tắt: Tài nguyên giáo dục mở (Open Educational Resources - OER) đã trở thành một phần quan trọng trong giáo dục hiện đại. Trong xu hướng sử dụng OER ngày càng tăng, việc xây dựng và nâng cao chất lượng của các OER nổi bật lên như là một trong những nhu cầu quan trọng và có ý nghĩa thực tiễn cao. OER được xây dựng dựa trên cơ chế chia sẻ và mở rộng mạng lưới kết nối của các cộng đồng tri thức khắp nơi trên thế giới. Nguồn dữ liệu mở mà họ tạo ra sẽ ngày càng đa dạng và phong phú hơn, đòi hỏi có một giải pháp liên kết hiệu quả nhằm phát huy giá trị và chất lượng của các OER này. Sử dụng dữ liệu mở liên kết (Linked Open Data - LOD) sẽ trở thành một lựa chọn tốt. Bài viết trình bày khái quát và tầm quan trọng của LOD, các hướng ứng dụng LOD trong việc xây dựng và nâng cao chất lượng của các OER phục vụ cho các mục tiêu giáo dục và phổ biến tri thức trên quy mô toàn cầu.

pdf17 trang | Chia sẻ: thanhle95 | Lượt xem: 46 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Ứng dụng dữ liệu mở liên kết trong việc nâng cao chất lượng các nguồn tài nguyên giáo dục mở, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ Nguyễn Danh Minh Trí1* Tóm tắt: Tài nguyên giáo dục mở (Open Educational Resources - OER) đã trở thành một phần quan trọng trong giáo dục hiện đại. Trong xu hướng sử dụng OER ngày càng tăng, việc xây dựng và nâng cao chất lượng của các OER nổi bật lên như là một trong những nhu cầu quan trọng và có ý nghĩa thực tiễn cao. OER được xây dựng dựa trên cơ chế chia sẻ và mở rộng mạng lưới kết nối của các cộng đồng tri thức khắp nơi trên thế giới. Nguồn dữ liệu mở mà họ tạo ra sẽ ngày càng đa dạng và phong phú hơn, đòi hỏi có một giải pháp liên kết hiệu quả nhằm phát huy giá trị và chất lượng của các OER này. Sử dụng dữ liệu mở liên kết (Linked Open Data - LOD) sẽ trở thành một lựa chọn tốt. Bài viết trình bày khái quát và tầm quan trọng của LOD, các hướng ứng dụng LOD trong việc xây dựng và nâng cao chất lượng của các OER phục vụ cho các mục tiêu giáo dục và phổ biến tri thức trên quy mô toàn cầu. Từ khóa: Linked Open Data; Open Educational Resources; Dữ liệu mở liên kết; Tài nguyên giáo dục mở. 1. DẪN NHẬP Dữ liệu mở là các tập dữ liệu được thu thập và chia sẻ theo một giấy phép mở cho bất kỳ ai cũng có thể sử dụng được. Với tính chất mở, dữ liệu mở luôn ở trạng thái sẵn sàng cung cấp cho người dùng trên môi trường trực tuyến. Dữ liệu mở thường được liên kết với nhau * Thạc sĩ, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia Tp. Hồ Chí Minh. 406 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM nên còn được gọi là dữ liệu mở liên kết. Tận dụng ưu thế về tính mở và liên kết, chúng ta có thể xây dựng các nguồn dữ liệu mở phong phú, từ đó bổ sung và nâng cao chất lượng của các kho dữ liệu. Ứng dụng các nguồn dữ liệu mở liên kết nhằm xây dựng và nâng cao chất lượng các nguồn tài nguyên giáo dục mở là một hướng đi phù hợp với nhiều cơ hội phát triển cũng như thách thức mới. 2. KHÁI QUÁT VỀ DỮ LIỆU MỞ LIÊN KẾT VÀ TÀI NGUYÊN GIÁO DỤC MỞ 2.1. Dữ liệu mở liên kết (Linked Open Data – LOD) Dữ liệu mở mang tính chất tương tự như các loại dữ liệu khác [19]. Dữ liệu mở có thể là các tập dữ liệu được thu thập của chính phủ (như data.gov, data.gov.uk), dữ liệu từ các nghiên cứu và tạp chí khoa học (open access journals), dữ liệu văn bản hoặc dữ liệu đa phương tiện được cộng đồng đóng góp (như wikipedia, wikihow...). Đặc điểm chung của tất cả những nguồn dữ liệu đó là chúng đều được liên kết với nhau và được xây dựng dựa trên các đóng góp của cộng đồng người dùng thông qua giấy phép chia sẻ tương tự. Theo đó, dữ liệu mở là các dữ liệu điện tử hoặc dữ liệu số phải được tự do sẵn có cho mọi người sử dụng và tái xuất bản theo ý muốn mà không bị hạn chế bởi bản quyền, bằng sáng chế hoặc các cơ chế kiểm soát khác [13][42]. Các tính năng chính của dữ liệu mở bao gồm [34]:  Tính sẵn sàng và sự truy cập: dữ liệu mở phải sẵn sàng một cách tổng thể và không nhiều hơn chi phí tái sinh hợp lý, được tải về qua Internet. Dữ liệu đó cũng phải là sẵn sàng ở dạng thuận tiện và có khả năng tùy biến được.  Tính tái sử dụng và phân phối lại: dữ liệu mở phải được cung cấp theo các điều khoản cho phép sử dụng lại và phân phối lại, bao gồm cả việc trộn lẫn với các tập hợp dữ liệu khác.  Tính cộng đồng: đề cập đến sự tham gia toàn cầu của người dùng. Mọi người phải có khả năng sử dụng, sử dụng lại và phân phối lại. Không có sự phân biệt giữa các lĩnh vực của đời sống hoặc giữa con người hoặc các nhóm người. 407 ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ Theo xu thế phát triển mới, các nguồn dữ liệu mở sẽ không ngừng được phát sinh và hòa vào dòng chảy dữ liệu lớn đa dạng cả về quy mô và chất lượng. Rất nhiều hệ thống khác nhau sẽ tham gia vào quá trình lưu trữ và phân phối dữ liệu mở [26]. Điều này đã tạo ra dòng chảy dữ liệu mở đang gia tăng một cách nhanh chóng trên toàn cầu. Về cơ bản, dữ liệu mở không cần phải liên kết với nhau. Tuy nhiên, dữ liệu mở sẽ phát huy tối đa lợi thế và giá trị của nó khi được liên kết với những nguồn dữ liệu khác, nhất là trong việc xây dựng các nguồn tài nguyên giáo dục hay những kho tri thức mở trực tuyến. Do vậy, dữ liệu liên kết đã dần trở nên khá phổ biến. Dữ liệu liên kết (Linked Data – LD) là tập hợp dữ liệu có ý nghĩa được xác định rõ ràng, được xây dựng dựa trên các nguyên tắc thiết kế để chia sẻ các dữ liệu được kết nối với nhau trên môi trường Web mà máy có thể đọc được [2][27][36][41]. Các liên kết này tồn tại thông qua kết nối mạng và đều có ứng dụng hỗ trợ máy có thể đọc và xử lý tự động [40]. Nhờ có dữ liệu liên kết mà rất nhiều nội dung trên Web đã được xây dựng một cách phong phú, đa dạng tạo điều kiện cho Web ngữ nghĩa phát triển mạnh mẽ. Dữ liệu được lưu trữ trong các hệ thống hiện nay có khối lượng rất lớn và đa dạng [22], trong đó dữ liệu mở liên kết chiếm một vai trò khá quan trọng. Dữ liệu mở liên kết (Linked Open Data – LOD) là sự pha trộn của dữ liệu liên kết và dữ liệu mở. Do vậy, có thể nói LOD là tập các dữ liệu vừa được liên kết với nhau và được xây dựng dựa trên các nguồn dữ liệu mở. Để có được những nguồn LOD chất lượng sẽ cần có sự đầu tư bài bản và khả năng truy cập hiệu quả về mặt công nghệ, nhất là truy cập mở. Xây dựng chính sách truy cập mở là điều kiện cần thiết để phát triển các nguồn OER chất lượng [10]. Sự phát triển nhanh chóng của công nghệ Web, đặc biệt là công nghệ Web ngữ nghĩa (Semantic Web - SW) đã và đang thay đổi cách thức lưu trữ và phổ biến thông tin, trong số đó có LOD [18][35]. LOD sẽ tạo nên các kết nối dữ liệu có cấu trúc trên SW, từ đó hỗ trợ quá trình xuất bản thông tin được nhanh chóng và hiệu quả. LOD có nhiều lợi ích và được ứng dụng rộng rãi trên thực tế. Một ví dụ phổ biến của LOD là cơ sở dữ liệu Dbpedia. Dbpedia là một dự 408 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM án tận dụng nguồn lực cộng đồng để trích xuất thông tin có cấu trúc từ Wikipedia và làm cho các thông tin này sẵn sàng trên Web để cung cấp cho các ứng dụng khác. LOD trong Dbpedia rất đa dạng và sẽ còn nhiều cơ hội phát triển hơn nữa trong tương lai. 2.2. Tài nguyên giáo dục mở (Open Educational Resources - OER) Trên thế giới đã có rất nhiều nguồn OER được xây dựng dựa trên nền tảng dữ liệu mở [1] và phần lớn chúng được đóng góp bởi các cộng đồng tri thức thông qua môi trường Web [7][28]. OER là các nội dung kỹ thuật số với mục đích giáo dục, được cung cấp sẵn sàng để nhà nghiên cứu, giáo viên và người học có thể sử dụng lại một cách tự do [29]. Theo đó, có thể hiểu OER là các tài nguyên giảng dạy, học tập và nghiên cứu nằm trong miền công cộng hoặc đã được phát hành theo giấy phép mở cho phép người khác sử dụng miễn phí và tái sử dụng lại các nguồn tài nguyên này. Xu hướng sử dụng OER đang ngày càng tăng lên một cách nhanh chóng trên thế giới. Ứng dụng OER để cải thiện chất lượng quá trình dạy và học đã được khuyến khích bởi các tổ chức lớn, ví dụ như UNESCO trong tuyên bố năm 2012 [7][16], Ủy ban châu Âu và các sáng kiến chính phủ mở [4][5]. OER có một tầm ảnh hưởng lớn trong giáo dục, đặc biệt là giáo dục mở. Trong đó, tính mở của các nguồn dữ liệu có ảnh hưởng lớn đến chất lượng đào tạo [20][21]. Tính mở của các OER không chỉ tác động đến việc dạy và học, mà nó còn ảnh hưởng đến quá trình nghiên cứu và chính sách của các tổ chức giáo dục. Các nhà cung cấp OER có thể là các trường đại học, tổ chức học thuật và nghiên cứu, các sáng kiến của chính phủ và cộng đồng giáo dục, nơi xuất bản các tài nguyên giáo dục theo giấy phép mở trên phạm vi công cộng thông qua môi trường Web. OER cung cấp tri thức dưới dạng các thành phần nội dung kỹ thuật số đa dạng đến nhiều đối tượng học tập (Learning Object – LO) nhằm mục đích giáo dục. LO được định nghĩa là bất kỳ thực thể nào, tồn tại dưới dạng kỹ thuật số hoặc không phải kỹ thuật số có thể được dùng và tái sử dụng cho việc học tập, đào tạo và huấn luyện. Theo đó, 409 ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ OER có thể được xem như là một dạng LO. LO được thu thập và tổ chức lưu trữ trong Kho lưu trữ Đối tượng Học tập (Learning Object Repositories). Kho này lưu trữ cả LO và siêu dữ liệu (Metadata) của chúng. Siêu dữ liệu nhằm mục đích mô tả LO một cách thống nhất và ổn định, thông qua một số chức năng mô tả quan trọng. OER có thể được phân loại theo 2 tiêu chí: một là theo loại tài nguyên được cung cấp bởi các trang Web OER và hai là vị trí của kho lưu trữ tài nguyên. Theo tiêu chí thứ nhất thì OER bao gồm 4 loại là: học liệu mở (Open Courseware – OCW), sáng kiến nội dung sáng tạo (Content Creation Initiatives), Subject-Specific OCW OER và các Web- site/ kho lưu trữ OER. Theo tiêu chí thứ hai, có 3 loại OER gồm: các trang Web OER truy cập nội dung được lưu trữ trong kho lưu trữ cục bộ (loại A), các trang Web OER cung cấp quyền truy cập vào nội dung được lưu trữ trên các kho lưu trữ bên ngoài, chủ yếu thông qua siêu dữ liệu không đồng nhất (loại B), và các trang Web OER cung cấp quyền truy cập vào kho lưu trữ cục bộ cũng như các kho lưu trữ bên ngoài, đây là những trang Web lai (loại C) [29]. Việc xây dựng các nguồn OER chất lượng đòi hỏi thời gian và tầm nhìn chiến lược lâu dài. OER cần phải được xây dựng và lưu trữ sao cho tối ưu và hiệu quả nhất. Hơn nữa, hệ thống cần hỗ trợ việc tìm kiếm, định vị tài nguyên một cách hợp lý và dễ dàng truy cập khi cần thiết. Một số thách thức đang tồn tại bao gồm: khả năng tương tác giữa các kho lưu trữ OER thuộc loại riêng biệt vẫn còn rất yếu, siêu dữ liệu (Metadata) không được tiêu chuẩn hóa trong các kho lưu trữ và vấn đề gán sai nhãn tài nguyên vẫn còn xảy ra. Vẫn cần nhiều thời gian để khắc phục dần các nhược điểm còn tồn tại trong các kho lưu trữ OER nhằm nâng cao chất lượng các nguồn tài nguyên này. 2.3. Giới thiệu một số nguồn OER phổ biến 2.3.1. Wikipedia Wikipedia là một Website cung cấp thông tin dưới dạng bách khoa toàn thư mở. Các nội dung được lưu trữ trên Wikipedia rất phong phú và đa dạng, là các nguồn OER bao trùm hầu hết lĩnh vực trong đời 410 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM sống con người. Bài viết và nội dung trên Wikipedia thường được phát hành theo giấy phép sáng tạo chung (Creative Commons-CC) với các yêu cầu Ghi công-Chia sẻ tương tự nghĩa là bất kỳ ai cũng có quyền tham gia chỉnh sửa và đóng góp cho các nội dung trên Website này [38]. Điều này vừa là lợi thế khi tận dụng được nguồn lực cộng đồng để xây dựng nội dung [39], nhưng cũng vừa là khuyết điểm vì khả năng kiểm duyệt còn hạn chế trong khi một khối lượng nội dung không phù hợp vẫn còn tồn tại trong hệ thống và cần được chỉnh sửa. 2.3.2. WikiHow WikiHow là một trang Web chia sẻ cách thức làm mọi việc rất phổ biến, giúp người dùng có thể tìm ra giải pháp cho những vấn đề gặp phải trong cuộc sống một cách dễ dàng và nhanh chóng [24][37]. Cũng như Wikipedia, phần lớn bài viết trên WikiHow đều được chia sẻ theo giấy phép CC và cho phép người dùng có thể tham gia chỉnh sửa và đóng góp. WikiHow có thể được xem như một công cụ hiệu quả trong việc xây dựng các nguồn OER [24]. Mặc dù WikiHow tiếng Việt chưa được phổ biến, cộng đồng người dùng ở Việt Nam vẫn đang có nhiều nỗ lực nhằm xây dựng và khuyến khích sự phát triển của Website hữu ích này. Tính đến năm 2018, WikiHow đã có sẵn trong 18 ngôn ngữ với hơn 200.000 bài báo hướng dẫn cách thức bằng tiếng Anh, hơn 3.000 bài viết bằng tiếng Việt [24] và vẫn đang còn tiếp tục phát triển nhiều hơn. 2.3.3. VOER Chương trình Tài nguyên Giáo dục Mở Việt Nam (Vietnam Open Educational Resources – VOER) được hỗ trợ bởi Quỹ Việt Nam (the Vietnam Foundation) với mục tiêu xây dựng kho tài nguyên giáo dục mở cho người Việt sử dụng và truy nhập miễn phí nguồn tài liệu hữu ích phục vụ giảng dạy, học tập và nghiên cứu, cũng như phục vụ cho toàn xã hội [32]. VOER xây dựng các nguồn tài nguyên dựa trên cơ chế huy động đóng góp từ cộng đồng người dùng là các giảng viên trong các trường đại học, các viện nghiên cứu... [20][25]. Người dùng có thể đóng góp nội dung dưới dạng các module nhỏ [23], từ đó thì các nguồn OER sẽ được liên kết lại để có một kho tri thức đồ sộ, phủ kín các lĩnh 411 ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ vực và sẵn sàng cho việc tạo ra các tài liệu phục vụ cho việc học tập, giảng dạy và nghiên cứu một cách hiệu quả. 2.3.4. Hệ tri thức Việt số hóa [9] Hệ tri thức Việt số hóa (itrithuc.vn) là một hệ thống tổng hợp các tài liệu được số hóa và lưu trữ nhằm phổ biến tri thức cho toàn xã hội. Đây là một trong những nguồn lực chiến lược quốc gia quan trọng. Hệ thống đã thu hút một lượng lớn người dùng tham gia với vai trò vừa khai thác, vừa đóng góp để làm giàu các nguồn OER và kho tri thức mở của Việt Nam. Hệ tri thức Việt số hóa được tổng hợp từ hai nguồn chính: nguồn tri thức cơ bản có sẵn được xây dựng từ nhiều chuyên gia giáo dục đến từ các lĩnh vực như chính trị, kỹ thuật, khoa học, công nghệ... và nguồn tri thức cộng đồng được thu thập và liên tục cập nhật gồm các tri thức khoa học thường thức trong đời sống xã hội như: chăm sóc sức khỏe, y tế, phòng chống dịch bệnh, trồng trọt, chăn nuôi. 3. ỨNG DỤNG LOD TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN OER Như đã trình bày ở mục 1.1, Web ngữ nghĩa (SW) là Web của dữ liệu [3][6][43]. SW cung cấp một khung tiêu chuẩn chung cho phép tích hợp một lượng lớn dữ liệu ngữ nghĩa vào môi trường Web. Tuy nhiên, để xây dựng được SW thì chúng ta cần có một lượng lớn dữ liệu có liên quan đến từ nhiều nguồn khác nhau, đặc biệt là LOD. Lượng dữ liệu này cần được lưu trữ ở định dạng chuẩn để có thể truy cập và quản lý bằng các công cụ của SW. Có nhiều phương án nhằm nâng cao chất lượng các nguồn OER. Một trong những hướng đi phổ biến trong xây dựng các nguồn OER là sử dụng LOD để liên kết các nguồn dữ liệu mở đã và đang được thu thập [14]. LOD mô tả phương pháp xuất bản dữ liệu để máy có thể đọc được và cho phép dữ liệu từ các nguồn khác nhau được kết nối và truy vấn thông qua việc sử dụng các công nghệ được liên kết như SPARQL và RDF [2][11][29][31][33]. Kế hoạch 5 Sao (5 Stars scheme) triển khai LOD dần dần theo giấy phép sẽ góp phần xây dựng các nguồn dữ liệu mở, giúp cho các nguồn thông tin trở nên công khai và phù hợp để sử dụng với LOD. Từ đó có thể nâng cao khả năng truy cập, tái sử dụng và phối lại các nguồn OER thông qua công nghệ LOD. 412 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM Tim Berners-Lee, người phát minh World Wide Web, đã nêu lên một hướng đi mới thông qua việc thiết kế LOD vào năm 2006 [31]. Ông cũng đồng thời cung cấp các chỉ dẫn về việc sử dụng các công nghệ Web được chuẩn hóa để thiết lập các liên kết ở cấp độ dữ liệu giữa các nguồn dữ liệu khác nhau. Trên cơ sở đó, chúng ta sẽ tận dụng khả năng liên kết ngữ nghĩa và các nguồn lực cộng đồng để làm phong phú thêm các nguồn OER đang được lưu trữ trong những hệ thống hiện tại. 3.1. Các nguyên tắc xây dựng nguồn LOD Để xây dựng được Web của LOD, cần có các điều kiện tiên quyết như: dữ liệu có thể được tham chiếu trên Web, và người dùng có thể cung cấp các đường liên kết Web tới dữ liệu này từ bên trong dữ liệu của riêng họ [8]. Tim Berners-Lee đã đề xuất bốn nguyên tắc của LOD nhằm xuất bản dữ liệu trên Web dưới dạng LOD [2][11][29][31][33]:  Sử dụng URI làm tên cho mọi thứ. Mã nhận diện tài nguyên thống nhất (Uniform Resource Identifier – URI), còn gọi là mã nhận diện mở, là nhận diện duy nhất cho tất cả mọi thứ được kết nối sao cho chúng ta có thể phân biệt được giữa các thứ đó, tích hợp chúng mà không bị lẫn lộn với nhau. URI là một hệ thống nhận dạng toàn cầu duy nhất [6][11][12][17] được sử dụng để đặt tên duy nhất cho bất kỳ thứ gì – từ những nội dung kỹ thuật số có sẵn trên Web đến các đối tượng trong thế giới thực và các khái niệm trừu tượng.  Sử dụng các URI HTTP để người dùng có thể tra cứu những tên đó. Giao thức HTTP cung cấp một cơ chế đơn giản để truy xuất tài nguyên, khi các nguồn dữ liệu mở có thể được xác định bởi URI kết hợp với giao thức này. Điều này sẽ làm cho các nguồn dữ liệu trở nên dễ tìm hơn. Kết quả của quá trình này sẽ cho phép chúng ta xuất bản bất kỳ loại dữ liệu nào và thêm nó vào không gian dữ liệu toàn cầu.  Khi ai đó tra cứu URI, chúng ta cần cung cấp thông tin hữu ích sử dụng các tiêu chuẩn RDF và SPARQL [15][30]. Khung Mô tả Tài nguyên (Resource Description Framework – RDF) là mô hình tiêu chuẩn, một định dạng biểu diễn dựa trên đồ thị cho việc xuất bản và trao đổi dữ liệu trên Web được tổ chức W3C phát triển. RDF là tiêu chuẩn được sử dụng 413 ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ trong cơ sở dữ liệu đồ thị ngữ nghĩa, còn được tham chiếu tới như là bộ 3 RDF (RDF triplestore). Không giống như cơ sở dữ liệu quan hệ, bộ ba này là một công nghệ được phát triển để lưu trữ dữ liệu được kết nối với nhau và có khả năng hỗ trợ việc suy ra các dữ kiện mới từ những dữ liệu hiện có. Bên cạnh đó, SPARQL là ngôn ngữ truy vấn được W3C chuẩn hóa để lấy và thao tác dữ liệu được lưu trữ ở định dạng RDF. Như vậy, nó cho phép chúng ta có thể tìm kiếm trên Web dữ liệu (SW hoặc bất kỳ cơ sở dữ liệu nào) và tìm ra các mối liên kết hữu dụng. Từ đó có được khả năng làm giàu các nguồn dữ liệu hiện có của mình.  Bao gồm các liên kết đến các URI khác để người dùng có thể khám phá được nhiều thứ hơn. Tương tự với Web siêu văn bản, các liên kết đến các URI khác làm cho dữ liệu được kết nối với nhau và cho phép chúng ta tìm thấy những thứ đang cần. Bằng cách liên kết thông tin mới với các tài nguyên hiện có, chúng ta sẽ tối đa hóa việc tái sử dụng và liên kết lẫn nhau giữa các dữ liệu hiện có và tạo ra một mạng lưới liên kết phong phú có ý nghĩa có thể xử lý bằng các hệ thống máy tính. Hình 1. Mối liên hệ của bốn nguyên tắc thiết kế dữ liệu liên kết đề xuất bởi Tim Berners-Lee vào năm 2006 [27] Sau khi có được Web của LOD, bước tiếp theo chúng ta sẽ ứng dụng mô hình 5 Sao nhằm phát triển đa dạng các nguồn dữ liệu mở. Từ đó sẽ có nền tảng tốt để ứng dụng LOD nâng cao chất lượng các nguồn OER. 414 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 3.2. Triển khai mô hình 5 Sao cho LOD và cấp phép cho dữ liệu mở Tim Berners-Lee đã đề xuất một kế hoạch triển khai 5 Sao áp dụng cho LOD. Phương pháp này mô tả cách thông tin có thể được công khai nhằm xây dựng các nguồn LOD trong đó dữ liệu sẽ được kết nối và làm phong phú thêm mối quan hệ với các tập dữ liệu khác. Việc triển khai kế hoạch 5 Sao không cung cấp các khía cạnh kỹ thuật mà nhằm mục tiêu khuyến khích các chủ sở hữu dữ liệu tuân thủ các nguyên tắc của LOD. Bảng 1 [29] cho thấy các ngôi sao và mô tả tương ứng của chúng về mức độ tuân thủ. Bảng 1. Kế hoạch triển khai 5 Sao của dữ liệu mở Kế hoạch triển khai 5 Sao chỉ dành cho dữ liệu mở, vì vậy tính mở của nguồn dữ liệu đóng vai trò rất quan trọng. Tính mở của dữ liệu đề cập đến khả năng truy cập, sử dụng, sửa đổi và chia sẻ dữ liệu tự do theo một giấy phép mở. Theo đó, giấy phép CC đã trở nên khá phổ biến vì nó đảm bảo các đặc điểm của “Mở” theo định nghĩa ở trên và các nguồn dữ liệu mở chỉ nên có một trong các giấy phép được thể hiện trong Bảng 2. Bảng 2. Giấy phép Creative Commons (CC) [29] 415 ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ CC cung cấp siêu dữ liệu để máy có thể đọc được và thể hiện lên các trang tài liệu, cho phép phần mềm hiểu rằng chúng ta đã áp dụng giấy phép cho tài nguyên và có thể lấy lại một số siêu dữ liệu được mã hóa trong RDF.
Tài liệu liên quan