Tóm tắt: Tài nguyên giáo dục mở (Open Educational Resources
- OER) đã trở thành một phần quan trọng trong giáo dục hiện
đại. Trong xu hướng sử dụng OER ngày càng tăng, việc xây dựng
và nâng cao chất lượng của các OER nổi bật lên như là một trong
những nhu cầu quan trọng và có ý nghĩa thực tiễn cao. OER được
xây dựng dựa trên cơ chế chia sẻ và mở rộng mạng lưới kết nối của
các cộng đồng tri thức khắp nơi trên thế giới. Nguồn dữ liệu mở mà
họ tạo ra sẽ ngày càng đa dạng và phong phú hơn, đòi hỏi có một
giải pháp liên kết hiệu quả nhằm phát huy giá trị và chất lượng của
các OER này. Sử dụng dữ liệu mở liên kết (Linked Open Data - LOD)
sẽ trở thành một lựa chọn tốt. Bài viết trình bày khái quát và tầm
quan trọng của LOD, các hướng ứng dụng LOD trong việc xây dựng
và nâng cao chất lượng của các OER phục vụ cho các mục tiêu giáo
dục và phổ biến tri thức trên quy mô toàn cầu.
17 trang |
Chia sẻ: thanhle95 | Lượt xem: 46 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Ứng dụng dữ liệu mở liên kết trong việc nâng cao chất lượng các nguồn tài nguyên giáo dục mở, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO
CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ
Nguyễn Danh Minh Trí1*
Tóm tắt: Tài nguyên giáo dục mở (Open Educational Resources
- OER) đã trở thành một phần quan trọng trong giáo dục hiện
đại. Trong xu hướng sử dụng OER ngày càng tăng, việc xây dựng
và nâng cao chất lượng của các OER nổi bật lên như là một trong
những nhu cầu quan trọng và có ý nghĩa thực tiễn cao. OER được
xây dựng dựa trên cơ chế chia sẻ và mở rộng mạng lưới kết nối của
các cộng đồng tri thức khắp nơi trên thế giới. Nguồn dữ liệu mở mà
họ tạo ra sẽ ngày càng đa dạng và phong phú hơn, đòi hỏi có một
giải pháp liên kết hiệu quả nhằm phát huy giá trị và chất lượng của
các OER này. Sử dụng dữ liệu mở liên kết (Linked Open Data - LOD)
sẽ trở thành một lựa chọn tốt. Bài viết trình bày khái quát và tầm
quan trọng của LOD, các hướng ứng dụng LOD trong việc xây dựng
và nâng cao chất lượng của các OER phục vụ cho các mục tiêu giáo
dục và phổ biến tri thức trên quy mô toàn cầu.
Từ khóa: Linked Open Data; Open Educational Resources;
Dữ liệu mở liên kết; Tài nguyên giáo dục mở.
1. DẪN NHẬP
Dữ liệu mở là các tập dữ liệu được thu thập và chia sẻ theo một
giấy phép mở cho bất kỳ ai cũng có thể sử dụng được. Với tính chất
mở, dữ liệu mở luôn ở trạng thái sẵn sàng cung cấp cho người dùng
trên môi trường trực tuyến. Dữ liệu mở thường được liên kết với nhau
* Thạc sĩ, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia Tp. Hồ
Chí Minh.
406
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
nên còn được gọi là dữ liệu mở liên kết. Tận dụng ưu thế về tính mở và
liên kết, chúng ta có thể xây dựng các nguồn dữ liệu mở phong phú, từ
đó bổ sung và nâng cao chất lượng của các kho dữ liệu. Ứng dụng các
nguồn dữ liệu mở liên kết nhằm xây dựng và nâng cao chất lượng các
nguồn tài nguyên giáo dục mở là một hướng đi phù hợp với nhiều cơ
hội phát triển cũng như thách thức mới.
2. KHÁI QUÁT VỀ DỮ LIỆU MỞ LIÊN KẾT VÀ TÀI NGUYÊN GIÁO DỤC MỞ
2.1. Dữ liệu mở liên kết (Linked Open Data – LOD)
Dữ liệu mở mang tính chất tương tự như các loại dữ liệu khác [19].
Dữ liệu mở có thể là các tập dữ liệu được thu thập của chính phủ (như
data.gov, data.gov.uk), dữ liệu từ các nghiên cứu và tạp chí khoa
học (open access journals), dữ liệu văn bản hoặc dữ liệu đa phương
tiện được cộng đồng đóng góp (như wikipedia, wikihow...). Đặc điểm
chung của tất cả những nguồn dữ liệu đó là chúng đều được liên kết
với nhau và được xây dựng dựa trên các đóng góp của cộng đồng
người dùng thông qua giấy phép chia sẻ tương tự. Theo đó, dữ liệu mở
là các dữ liệu điện tử hoặc dữ liệu số phải được tự do sẵn có cho mọi
người sử dụng và tái xuất bản theo ý muốn mà không bị hạn chế bởi
bản quyền, bằng sáng chế hoặc các cơ chế kiểm soát khác [13][42]. Các
tính năng chính của dữ liệu mở bao gồm [34]:
Tính sẵn sàng và sự truy cập: dữ liệu mở phải sẵn sàng một cách
tổng thể và không nhiều hơn chi phí tái sinh hợp lý, được tải về qua
Internet. Dữ liệu đó cũng phải là sẵn sàng ở dạng thuận tiện và có khả
năng tùy biến được.
Tính tái sử dụng và phân phối lại: dữ liệu mở phải được cung cấp
theo các điều khoản cho phép sử dụng lại và phân phối lại, bao gồm cả
việc trộn lẫn với các tập hợp dữ liệu khác.
Tính cộng đồng: đề cập đến sự tham gia toàn cầu của người
dùng. Mọi người phải có khả năng sử dụng, sử dụng lại và phân phối
lại. Không có sự phân biệt giữa các lĩnh vực của đời sống hoặc giữa con
người hoặc các nhóm người.
407
ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ
Theo xu thế phát triển mới, các nguồn dữ liệu mở sẽ không ngừng
được phát sinh và hòa vào dòng chảy dữ liệu lớn đa dạng cả về quy mô
và chất lượng. Rất nhiều hệ thống khác nhau sẽ tham gia vào quá trình
lưu trữ và phân phối dữ liệu mở [26]. Điều này đã tạo ra dòng chảy dữ
liệu mở đang gia tăng một cách nhanh chóng trên toàn cầu. Về cơ bản,
dữ liệu mở không cần phải liên kết với nhau. Tuy nhiên, dữ liệu mở
sẽ phát huy tối đa lợi thế và giá trị của nó khi được liên kết với những
nguồn dữ liệu khác, nhất là trong việc xây dựng các nguồn tài nguyên
giáo dục hay những kho tri thức mở trực tuyến. Do vậy, dữ liệu liên kết
đã dần trở nên khá phổ biến.
Dữ liệu liên kết (Linked Data – LD) là tập hợp dữ liệu có ý nghĩa
được xác định rõ ràng, được xây dựng dựa trên các nguyên tắc thiết kế
để chia sẻ các dữ liệu được kết nối với nhau trên môi trường Web mà
máy có thể đọc được [2][27][36][41]. Các liên kết này tồn tại thông qua
kết nối mạng và đều có ứng dụng hỗ trợ máy có thể đọc và xử lý tự
động [40]. Nhờ có dữ liệu liên kết mà rất nhiều nội dung trên Web đã
được xây dựng một cách phong phú, đa dạng tạo điều kiện cho Web
ngữ nghĩa phát triển mạnh mẽ.
Dữ liệu được lưu trữ trong các hệ thống hiện nay có khối lượng rất
lớn và đa dạng [22], trong đó dữ liệu mở liên kết chiếm một vai trò khá
quan trọng. Dữ liệu mở liên kết (Linked Open Data – LOD) là sự pha trộn
của dữ liệu liên kết và dữ liệu mở. Do vậy, có thể nói LOD là tập các dữ
liệu vừa được liên kết với nhau và được xây dựng dựa trên các nguồn dữ
liệu mở. Để có được những nguồn LOD chất lượng sẽ cần có sự đầu tư
bài bản và khả năng truy cập hiệu quả về mặt công nghệ, nhất là truy cập
mở. Xây dựng chính sách truy cập mở là điều kiện cần thiết để phát triển
các nguồn OER chất lượng [10]. Sự phát triển nhanh chóng của công nghệ
Web, đặc biệt là công nghệ Web ngữ nghĩa (Semantic Web - SW) đã và
đang thay đổi cách thức lưu trữ và phổ biến thông tin, trong số đó có LOD
[18][35]. LOD sẽ tạo nên các kết nối dữ liệu có cấu trúc trên SW, từ đó hỗ
trợ quá trình xuất bản thông tin được nhanh chóng và hiệu quả.
LOD có nhiều lợi ích và được ứng dụng rộng rãi trên thực tế. Một
ví dụ phổ biến của LOD là cơ sở dữ liệu Dbpedia. Dbpedia là một dự
408
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
án tận dụng nguồn lực cộng đồng để trích xuất thông tin có cấu trúc
từ Wikipedia và làm cho các thông tin này sẵn sàng trên Web để cung
cấp cho các ứng dụng khác. LOD trong Dbpedia rất đa dạng và sẽ còn
nhiều cơ hội phát triển hơn nữa trong tương lai.
2.2. Tài nguyên giáo dục mở (Open Educational Resources - OER)
Trên thế giới đã có rất nhiều nguồn OER được xây dựng dựa trên
nền tảng dữ liệu mở [1] và phần lớn chúng được đóng góp bởi các cộng
đồng tri thức thông qua môi trường Web [7][28]. OER là các nội dung
kỹ thuật số với mục đích giáo dục, được cung cấp sẵn sàng để nhà
nghiên cứu, giáo viên và người học có thể sử dụng lại một cách tự do
[29]. Theo đó, có thể hiểu OER là các tài nguyên giảng dạy, học tập và
nghiên cứu nằm trong miền công cộng hoặc đã được phát hành theo
giấy phép mở cho phép người khác sử dụng miễn phí và tái sử dụng
lại các nguồn tài nguyên này. Xu hướng sử dụng OER đang ngày càng
tăng lên một cách nhanh chóng trên thế giới. Ứng dụng OER để cải
thiện chất lượng quá trình dạy và học đã được khuyến khích bởi các tổ
chức lớn, ví dụ như UNESCO trong tuyên bố năm 2012 [7][16], Ủy ban
châu Âu và các sáng kiến chính phủ mở [4][5].
OER có một tầm ảnh hưởng lớn trong giáo dục, đặc biệt là giáo
dục mở. Trong đó, tính mở của các nguồn dữ liệu có ảnh hưởng lớn
đến chất lượng đào tạo [20][21]. Tính mở của các OER không chỉ tác
động đến việc dạy và học, mà nó còn ảnh hưởng đến quá trình nghiên
cứu và chính sách của các tổ chức giáo dục. Các nhà cung cấp OER có
thể là các trường đại học, tổ chức học thuật và nghiên cứu, các sáng
kiến của chính phủ và cộng đồng giáo dục, nơi xuất bản các tài nguyên
giáo dục theo giấy phép mở trên phạm vi công cộng thông qua môi
trường Web.
OER cung cấp tri thức dưới dạng các thành phần nội dung kỹ
thuật số đa dạng đến nhiều đối tượng học tập (Learning Object – LO)
nhằm mục đích giáo dục. LO được định nghĩa là bất kỳ thực thể nào,
tồn tại dưới dạng kỹ thuật số hoặc không phải kỹ thuật số có thể được
dùng và tái sử dụng cho việc học tập, đào tạo và huấn luyện. Theo đó,
409
ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ
OER có thể được xem như là một dạng LO. LO được thu thập và tổ
chức lưu trữ trong Kho lưu trữ Đối tượng Học tập (Learning Object
Repositories). Kho này lưu trữ cả LO và siêu dữ liệu (Metadata) của
chúng. Siêu dữ liệu nhằm mục đích mô tả LO một cách thống nhất và
ổn định, thông qua một số chức năng mô tả quan trọng.
OER có thể được phân loại theo 2 tiêu chí: một là theo loại tài
nguyên được cung cấp bởi các trang Web OER và hai là vị trí của kho
lưu trữ tài nguyên. Theo tiêu chí thứ nhất thì OER bao gồm 4 loại là:
học liệu mở (Open Courseware – OCW), sáng kiến nội dung sáng tạo
(Content Creation Initiatives), Subject-Specific OCW OER và các Web-
site/ kho lưu trữ OER. Theo tiêu chí thứ hai, có 3 loại OER gồm: các
trang Web OER truy cập nội dung được lưu trữ trong kho lưu trữ cục
bộ (loại A), các trang Web OER cung cấp quyền truy cập vào nội dung
được lưu trữ trên các kho lưu trữ bên ngoài, chủ yếu thông qua siêu dữ
liệu không đồng nhất (loại B), và các trang Web OER cung cấp quyền
truy cập vào kho lưu trữ cục bộ cũng như các kho lưu trữ bên ngoài,
đây là những trang Web lai (loại C) [29].
Việc xây dựng các nguồn OER chất lượng đòi hỏi thời gian và tầm
nhìn chiến lược lâu dài. OER cần phải được xây dựng và lưu trữ sao
cho tối ưu và hiệu quả nhất. Hơn nữa, hệ thống cần hỗ trợ việc tìm
kiếm, định vị tài nguyên một cách hợp lý và dễ dàng truy cập khi cần
thiết. Một số thách thức đang tồn tại bao gồm: khả năng tương tác giữa
các kho lưu trữ OER thuộc loại riêng biệt vẫn còn rất yếu, siêu dữ liệu
(Metadata) không được tiêu chuẩn hóa trong các kho lưu trữ và vấn
đề gán sai nhãn tài nguyên vẫn còn xảy ra. Vẫn cần nhiều thời gian để
khắc phục dần các nhược điểm còn tồn tại trong các kho lưu trữ OER
nhằm nâng cao chất lượng các nguồn tài nguyên này.
2.3. Giới thiệu một số nguồn OER phổ biến
2.3.1. Wikipedia
Wikipedia là một Website cung cấp thông tin dưới dạng bách khoa
toàn thư mở. Các nội dung được lưu trữ trên Wikipedia rất phong phú
và đa dạng, là các nguồn OER bao trùm hầu hết lĩnh vực trong đời
410
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
sống con người. Bài viết và nội dung trên Wikipedia thường được phát
hành theo giấy phép sáng tạo chung (Creative Commons-CC) với các
yêu cầu Ghi công-Chia sẻ tương tự nghĩa là bất kỳ ai cũng có quyền
tham gia chỉnh sửa và đóng góp cho các nội dung trên Website này
[38]. Điều này vừa là lợi thế khi tận dụng được nguồn lực cộng đồng
để xây dựng nội dung [39], nhưng cũng vừa là khuyết điểm vì khả năng
kiểm duyệt còn hạn chế trong khi một khối lượng nội dung không phù
hợp vẫn còn tồn tại trong hệ thống và cần được chỉnh sửa.
2.3.2. WikiHow
WikiHow là một trang Web chia sẻ cách thức làm mọi việc rất phổ
biến, giúp người dùng có thể tìm ra giải pháp cho những vấn đề gặp
phải trong cuộc sống một cách dễ dàng và nhanh chóng [24][37]. Cũng
như Wikipedia, phần lớn bài viết trên WikiHow đều được chia sẻ theo
giấy phép CC và cho phép người dùng có thể tham gia chỉnh sửa và
đóng góp. WikiHow có thể được xem như một công cụ hiệu quả trong
việc xây dựng các nguồn OER [24]. Mặc dù WikiHow tiếng Việt chưa
được phổ biến, cộng đồng người dùng ở Việt Nam vẫn đang có nhiều
nỗ lực nhằm xây dựng và khuyến khích sự phát triển của Website hữu
ích này. Tính đến năm 2018, WikiHow đã có sẵn trong 18 ngôn ngữ với
hơn 200.000 bài báo hướng dẫn cách thức bằng tiếng Anh, hơn 3.000 bài
viết bằng tiếng Việt [24] và vẫn đang còn tiếp tục phát triển nhiều hơn.
2.3.3. VOER
Chương trình Tài nguyên Giáo dục Mở Việt Nam (Vietnam Open
Educational Resources – VOER) được hỗ trợ bởi Quỹ Việt Nam (the
Vietnam Foundation) với mục tiêu xây dựng kho tài nguyên giáo dục
mở cho người Việt sử dụng và truy nhập miễn phí nguồn tài liệu hữu
ích phục vụ giảng dạy, học tập và nghiên cứu, cũng như phục vụ cho
toàn xã hội [32]. VOER xây dựng các nguồn tài nguyên dựa trên cơ chế
huy động đóng góp từ cộng đồng người dùng là các giảng viên trong
các trường đại học, các viện nghiên cứu... [20][25]. Người dùng có thể
đóng góp nội dung dưới dạng các module nhỏ [23], từ đó thì các nguồn
OER sẽ được liên kết lại để có một kho tri thức đồ sộ, phủ kín các lĩnh
411
ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ
vực và sẵn sàng cho việc tạo ra các tài liệu phục vụ cho việc học tập,
giảng dạy và nghiên cứu một cách hiệu quả.
2.3.4. Hệ tri thức Việt số hóa [9]
Hệ tri thức Việt số hóa (itrithuc.vn) là một hệ thống tổng hợp các tài
liệu được số hóa và lưu trữ nhằm phổ biến tri thức cho toàn xã hội. Đây
là một trong những nguồn lực chiến lược quốc gia quan trọng. Hệ thống đã
thu hút một lượng lớn người dùng tham gia với vai trò vừa khai thác,
vừa đóng góp để làm giàu các nguồn OER và kho tri thức mở của Việt
Nam. Hệ tri thức Việt số hóa được tổng hợp từ hai nguồn chính: nguồn
tri thức cơ bản có sẵn được xây dựng từ nhiều chuyên gia giáo dục đến
từ các lĩnh vực như chính trị, kỹ thuật, khoa học, công nghệ... và nguồn
tri thức cộng đồng được thu thập và liên tục cập nhật gồm các tri thức
khoa học thường thức trong đời sống xã hội như: chăm sóc sức khỏe, y
tế, phòng chống dịch bệnh, trồng trọt, chăn nuôi.
3. ỨNG DỤNG LOD TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN OER
Như đã trình bày ở mục 1.1, Web ngữ nghĩa (SW) là Web của dữ
liệu [3][6][43]. SW cung cấp một khung tiêu chuẩn chung cho phép tích
hợp một lượng lớn dữ liệu ngữ nghĩa vào môi trường Web. Tuy nhiên,
để xây dựng được SW thì chúng ta cần có một lượng lớn dữ liệu có liên
quan đến từ nhiều nguồn khác nhau, đặc biệt là LOD. Lượng dữ liệu
này cần được lưu trữ ở định dạng chuẩn để có thể truy cập và quản lý
bằng các công cụ của SW.
Có nhiều phương án nhằm nâng cao chất lượng các nguồn OER.
Một trong những hướng đi phổ biến trong xây dựng các nguồn OER là
sử dụng LOD để liên kết các nguồn dữ liệu mở đã và đang được thu
thập [14]. LOD mô tả phương pháp xuất bản dữ liệu để máy có thể đọc được và
cho phép dữ liệu từ các nguồn khác nhau được kết nối và truy vấn thông qua việc
sử dụng các công nghệ được liên kết như SPARQL và RDF [2][11][29][31][33].
Kế hoạch 5 Sao (5 Stars scheme) triển khai LOD dần dần theo giấy phép
sẽ góp phần xây dựng các nguồn dữ liệu mở, giúp cho các nguồn thông
tin trở nên công khai và phù hợp để sử dụng với LOD. Từ đó có thể nâng
cao khả năng truy cập, tái sử dụng và phối lại các nguồn OER thông qua
công nghệ LOD.
412
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
Tim Berners-Lee, người phát minh World Wide Web, đã nêu lên
một hướng đi mới thông qua việc thiết kế LOD vào năm 2006 [31]. Ông
cũng đồng thời cung cấp các chỉ dẫn về việc sử dụng các công nghệ
Web được chuẩn hóa để thiết lập các liên kết ở cấp độ dữ liệu giữa các
nguồn dữ liệu khác nhau. Trên cơ sở đó, chúng ta sẽ tận dụng khả năng
liên kết ngữ nghĩa và các nguồn lực cộng đồng để làm phong phú thêm
các nguồn OER đang được lưu trữ trong những hệ thống hiện tại.
3.1. Các nguyên tắc xây dựng nguồn LOD
Để xây dựng được Web của LOD, cần có các điều kiện tiên quyết
như: dữ liệu có thể được tham chiếu trên Web, và người dùng có thể
cung cấp các đường liên kết Web tới dữ liệu này từ bên trong dữ liệu
của riêng họ [8]. Tim Berners-Lee đã đề xuất bốn nguyên tắc của LOD
nhằm xuất bản dữ liệu trên Web dưới dạng LOD [2][11][29][31][33]:
Sử dụng URI làm tên cho mọi thứ. Mã nhận diện tài nguyên
thống nhất (Uniform Resource Identifier – URI), còn gọi là mã nhận
diện mở, là nhận diện duy nhất cho tất cả mọi thứ được kết nối sao
cho chúng ta có thể phân biệt được giữa các thứ đó, tích hợp chúng
mà không bị lẫn lộn với nhau. URI là một hệ thống nhận dạng toàn
cầu duy nhất [6][11][12][17] được sử dụng để đặt tên duy nhất cho bất
kỳ thứ gì – từ những nội dung kỹ thuật số có sẵn trên Web đến các đối
tượng trong thế giới thực và các khái niệm trừu tượng.
Sử dụng các URI HTTP để người dùng có thể tra cứu những
tên đó. Giao thức HTTP cung cấp một cơ chế đơn giản để truy xuất tài
nguyên, khi các nguồn dữ liệu mở có thể được xác định bởi URI kết
hợp với giao thức này. Điều này sẽ làm cho các nguồn dữ liệu trở nên
dễ tìm hơn. Kết quả của quá trình này sẽ cho phép chúng ta xuất bản
bất kỳ loại dữ liệu nào và thêm nó vào không gian dữ liệu toàn cầu.
Khi ai đó tra cứu URI, chúng ta cần cung cấp thông tin hữu ích sử
dụng các tiêu chuẩn RDF và SPARQL [15][30]. Khung Mô tả Tài nguyên
(Resource Description Framework – RDF) là mô hình tiêu chuẩn, một
định dạng biểu diễn dựa trên đồ thị cho việc xuất bản và trao đổi dữ liệu
trên Web được tổ chức W3C phát triển. RDF là tiêu chuẩn được sử dụng
413
ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ
trong cơ sở dữ liệu đồ thị ngữ nghĩa, còn được tham chiếu tới như là bộ
3 RDF (RDF triplestore). Không giống như cơ sở dữ liệu quan hệ, bộ ba
này là một công nghệ được phát triển để lưu trữ dữ liệu được kết nối với
nhau và có khả năng hỗ trợ việc suy ra các dữ kiện mới từ những dữ liệu
hiện có. Bên cạnh đó, SPARQL là ngôn ngữ truy vấn được W3C chuẩn
hóa để lấy và thao tác dữ liệu được lưu trữ ở định dạng RDF. Như vậy, nó
cho phép chúng ta có thể tìm kiếm trên Web dữ liệu (SW hoặc bất kỳ cơ
sở dữ liệu nào) và tìm ra các mối liên kết hữu dụng. Từ đó có được khả
năng làm giàu các nguồn dữ liệu hiện có của mình.
Bao gồm các liên kết đến các URI khác để người dùng có thể
khám phá được nhiều thứ hơn. Tương tự với Web siêu văn bản, các liên
kết đến các URI khác làm cho dữ liệu được kết nối với nhau và cho phép
chúng ta tìm thấy những thứ đang cần. Bằng cách liên kết thông tin mới
với các tài nguyên hiện có, chúng ta sẽ tối đa hóa việc tái sử dụng và liên
kết lẫn nhau giữa các dữ liệu hiện có và tạo ra một mạng lưới liên kết
phong phú có ý nghĩa có thể xử lý bằng các hệ thống máy tính.
Hình 1. Mối liên hệ của bốn nguyên tắc thiết kế dữ liệu liên kết
đề xuất bởi Tim Berners-Lee vào năm 2006 [27]
Sau khi có được Web của LOD, bước tiếp theo chúng ta sẽ ứng
dụng mô hình 5 Sao nhằm phát triển đa dạng các nguồn dữ liệu mở.
Từ đó sẽ có nền tảng tốt để ứng dụng LOD nâng cao chất lượng các
nguồn OER.
414
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
3.2. Triển khai mô hình 5 Sao cho LOD và cấp phép cho dữ liệu mở
Tim Berners-Lee đã đề xuất một kế hoạch triển khai 5 Sao áp dụng
cho LOD. Phương pháp này mô tả cách thông tin có thể được công khai
nhằm xây dựng các nguồn LOD trong đó dữ liệu sẽ được kết nối và
làm phong phú thêm mối quan hệ với các tập dữ liệu khác. Việc triển
khai kế hoạch 5 Sao không cung cấp các khía cạnh kỹ thuật mà nhằm
mục tiêu khuyến khích các chủ sở hữu dữ liệu tuân thủ các nguyên tắc
của LOD. Bảng 1 [29] cho thấy các ngôi sao và mô tả tương ứng của
chúng về mức độ tuân thủ.
Bảng 1. Kế hoạch triển khai 5 Sao của dữ liệu mở
Kế hoạch triển khai 5 Sao chỉ dành cho dữ liệu mở, vì vậy tính mở
của nguồn dữ liệu đóng vai trò rất quan trọng. Tính mở của dữ liệu đề
cập đến khả năng truy cập, sử dụng, sửa đổi và chia sẻ dữ liệu tự do theo
một giấy phép mở. Theo đó, giấy phép CC đã trở nên khá phổ biến vì nó
đảm bảo các đặc điểm của “Mở” theo định nghĩa ở trên và các nguồn dữ
liệu mở chỉ nên có một trong các giấy phép được thể hiện trong Bảng 2.
Bảng 2. Giấy phép Creative Commons (CC) [29]
415
ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ
CC cung cấp siêu dữ liệu để máy có thể đọc được và thể hiện lên
các trang tài liệu, cho phép phần mềm hiểu rằng chúng ta đã áp dụng
giấy phép cho tài nguyên và có thể lấy lại một số siêu dữ liệu được mã
hóa trong RDF.