Tóm tắt:Bài viết phân tích bối cảnh bùng nổ dữ liệu lớn; vai trò, nhiệm
vụ và đặc điểm của 03 mô hình Trung tâm Dữ liệu – Trung tâm Thông
tin – Trung tâm Tri thức để thích ứng với bối cảnh này. Các tác giả đã
đi sâu phân tích các thách thức đối với thư viện số Việt Nam, đề xuất
chuyển đổi các thư viện số Việt Nam theo mô hình Trung tâm Tri thức
số. Đây là cơ sở để kiến tạo nên mô hình kết hợp Trung tâm Tri thức
– Thư viện để ứng phó bối cảnh bùng nổ dữ liệu lớn.
15 trang |
Chia sẻ: thanhle95 | Lượt xem: 35 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Trung tâm tri thức - Thư viện: Chuyển đổi thư viện số thành trung tâm tri thức số để ứng phó bùng nổ dữ liệu lớn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
TRUNG TÂM TRI THỨC - THƯ VIỆN:...
CHUYỂN ĐỔI THƯ VIỆN SỐ THÀNH TRUNG TÂM TRI THỨC SỐ
ĐỂ ỨNG PHÓ BÙNG NỔ DỮ LIỆU LỚN
Nguyễn Hoàng Sơn1* - Hoàng Minh Bắc2**
- Đỗ Diệp Anh3***- Trịnh Khánh Vân4****
Tóm tắt: Bài viết phân tích bối cảnh bùng nổ dữ liệu lớn; vai trò, nhiệm
vụ và đặc điểm của 03 mô hình Trung tâm Dữ liệu – Trung tâm Thông
tin – Trung tâm Tri thức để thích ứng với bối cảnh này. Các tác giả đã
đi sâu phân tích các thách thức đối với thư viện số Việt Nam, đề xuất
chuyển đổi các thư viện số Việt Nam theo mô hình Trung tâm Tri thức
số. Đây là cơ sở để kiến tạo nên mô hình kết hợp Trung tâm Tri thức
– Thư viện để ứng phó bối cảnh bùng nổ dữ liệu lớn.
Từ khóa: Trung tâm Tri thức – Thư viện; Trung tâm Dữ liệu; Trung
tâm Thông tin; Trung tâm Tri thức số; Dữ liệu lớn; Thư viện số.
1. SỰ BÙNG NỔ DỮ LIỆU LỚN
Hiện nay, dữ liệu lớn kết hợp với trí tuệ nhân tạo trên nền tảng
kết nối vạn vật đang tác động mạnh tới xã hội số, kinh tế số, chính trị
số, văn hóa số, giáo dục số làm thay đổi hành vi, cuộc sống của mỗi
cá nhân, mỗi tổ chức, mỗi quốc gia và trên phạm vi toàn cầu. Dữ liệu
∗ Tiến sĩ chuyên ngành Quản trị Thông tin – Tri thức, Đại học Công nghệ Sydney,
Australia; Giám đốc Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội
– Phó Chủ tịch Hội Thư viện Việt Nam.
∗∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
∗∗∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
**** Thạc sĩ, Khoa Thông tin – Thư viện, Trường Đại học Khoa học Xã hội & Nhân văn,
Đại học Quốc gia Hà Nội.
15
TRUNG TÂM TRI THỨC - THƯ VIỆN:...
TRUNG TÂM TRI THỨC - THƯ VIỆN:...
CHUYỂN ĐỔI THƯ VIỆN SỐ THÀNH TRUNG TÂM TRI THỨC SỐ
ĐỂ ỨNG PHÓ BÙNG NỔ DỮ LIỆU LỚN
Nguyễn Hoàng Sơn1* - Hoàng Minh Bắc2**
- Đỗ Diệp Anh3***- Trịnh Khánh Vân4****
Tóm tắt: Bài viết phân tích bối cảnh bùng nổ dữ liệu lớn; vai trò, nhiệm
vụ và đặc điểm của 03 mô hình Trung tâm Dữ liệu – Trung tâm Thông
tin – Trung tâm Tri thức để thích ứng với bối cảnh này. Các tác giả đã
đi sâu phân tích các thách thức đối với thư viện số Việt Nam, đề xuất
chuyển đổi các thư viện số Việt Nam theo mô hình Trung tâm Tri thức
số. Đây là cơ sở để kiến tạo nên mô hình kết hợp Trung tâm Tri thức
– Thư viện để ứng phó bối cảnh bùng nổ dữ liệu lớn.
Từ khóa: Trung tâm Tri thức – Thư viện; Trung tâm Dữ liệu; Trung
tâm Thông tin; Trung tâm Tri thức số; Dữ liệu lớn; Thư viện số.
1. SỰ BÙNG NỔ DỮ LIỆU LỚN
Hiện nay, dữ liệu lớn kết hợp với trí tuệ nhân tạo trên nền tảng
kết nối vạn vật đang tác động mạnh tới xã hội số, kinh tế số, chính trị
số, văn hóa số, giáo dục số làm thay đổi hành vi, cuộc sống của mỗi
cá nhân, mỗi tổ chức, mỗi quốc gia và trên phạm vi toàn cầu. Dữ liệu
∗ Tiến sĩ chuyên ngành Quản trị Thông tin – Tri thức, Đại học Công nghệ Sydney,
Australia; Giám đốc Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội
– Phó Chủ tịch Hội Thư viện Việt Nam.
∗∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
∗∗∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
**** Thạc sĩ, Khoa Thông tin – Thư viện, Trường Đại học Khoa học Xã hội & Nhân văn,
Đại học Quốc gia Hà Nội.
lớn, dữ liệu đám mây ngày càng bùng nổ khi được sản sinh qua các nền
tảng xã hội: Facebook, Twitter, Instagram, Youtube; Hệ thống dữ liệu
lớn của: Google, Microsoft, Amazon, Alibaba; Từ các cảm biến; Từ
hàng tỷ điện thoại thông minh trong tay người dùng toàn cầu; Từ các
hệ thống trí tuệ nhân tạo thu thập, phân tích, tổ chức, sản sinh, phân
phối dữ liệu cho người dùng đầu cuối liên tục theo thời gian thực trên
phạm vi toàn cầu; Từ các trung tâm dữ liệu đang thu thập và lưu trữ
hàng Petabyte (PB) dữ liệu; Từ các tổ chức số như: chính phủ số, doanh
nghiệp số, văn phòng số, đại học số, thư viện số Mỗi cá nhân hay tổ
chức hiện nay đang phát triển song song “Thế giới thực” và “Thế giới
số” và sống linh hoạt, thích ứng, phát triển trong cuộc cách mạng 4.0.
Thách thức lớn nhất cho mỗi cá nhân hay tổ chức hiện nay là không
phải là có thu thập được đủ dữ liệu hay không mà vấn đề là dữ liệu đang
được thu thập và quản lý theo những cách khác nhau ở các bộ phận
khác nhau trong tổ chức, ở các nền tảng dữ liệu khác nhau, ở các kênh
truyền thông khác nhau, ở các định dạng khác nhau Dữ liệu đang
biết về con người nhiều hơn con người biết về dữ liệu. Dung lượng dữ
liệu được dự báo sẽ tăng gấp đôi sau mỗi 2 năm trong thập niên tới. Tuy
nhiên, chỉ có 0,5% trong tổng số dữ liệu được phân tích và sử dụng [6]
Chính vì vậy, thu thập, tổng hợp, phân tích dữ liệu lớn để cung
cấp cho người dùng đầu cuối (cá nhân, tổ chức) để hỗ trợ quá trình ra
quyết định đang trở thành một ngành nghề chủ đạo trong nền công
nghiệp dữ liệu lớn có giá trị hàng tỉ đô.
Vì dữ liệu lớn thực sự là rất lớn, sản sinh liên tục trong thời gian
thực, tạo ra các dấu vết số thông qua tương tác, giao dịch ở các nền tảng
khác nhau, các kênh khác nhau, đa dạng dữ liệu, đa dạng cấu trúc
Do vậy, bản chất thực sự của cá nhân hay tổ chức khi sử dụng dữ liệu
đó là muốn dữ liệu đó trở thành thông tin có ý nghĩa, có nội dung hay
chính là tri thức (bao gồm thông tin có ý nghĩa được kết nối, liên kết,
tổng hợp, hệ thống hóa; là sự nhận thức, hiểu biết có hệ thống, chân lý,
quy luật về sự vật và hiện tượng trong cuộc sống) để hỗ trợ cho quá
trình ra quyết định như: học tập, kinh doanh, quản lý, điều hành
Do vậy, song song với việc xây dựng và phát triển các trung tâm (hay
công ty) phân tích dữ liệu thì mô hình “Trung tâm Tri thức số” là đòi
hỏi khách quan của xã hội số, của quốc gia số để thu thập, tổ chức, tổng
16
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
hợp, phân tích “Dữ liệu số” và chế biến, tạo thành “Tri thức số” phân
phối, cung cấp cho người dùng. Đây là một đòi hỏi khách quan và cấp
thiết cho một xã hội số, một quốc gia số.
Cùng với mô hình Trung tâm Tri thức, mô hình Trung tâm Dữ liệu và
Trung tâm Thông tin cũng là các mô hình phổ biến, hình thành và phát
triển trong bối cảnh bùng nổ dữ liệu lớn. Cả 3 mô hình này đều đóng vai
trò cực kỳ quan trọng trong việc thu thập, lưu trữ, phân tích, tổng hợp, tổ
chức và phân phối, cung cấp dữ liệu – thông tin – tri thức cho các cá nhân,
tổ chức trong xã hội số, quốc gia số và trên phạm vi toàn cầu.
2. TRUNG TÂM DỮ LIỆU – TRUNG TÂM THÔNG TIN – TRUNG TÂM TRI THỨC
Song song với Dữ liệu, Thông tin và Tri thức thì cũng có 3 mô hình
phát triển tương ứng là: Trung tâm Dữ liệu (TTDL), Trung tâm Thông
tin (TTTT) và Trung tâm Tri thức (TT Tri thức). TT Tri thức mặc dù có
nhiều điểm tương đồng với TTDL hay TTTT, nhưng về cơ bản 3 Trung
tâm này có nhiều điểm khác biệt như sau:
2.1. Trung tâm Dữ liệu (Data Center/Hub)
Dữ liệu (Data) bao gồm các số liệu; tín hiệu; màu sắc; âm thanh,
là dữ liệu thô mà con người chưa hiểu được vì chưa có ý nghĩa, chưa có
nội dung, chưa có bối cảnh cụ thể liên quan đến dữ liệu[5]
Hình 1: Dữ liệu (hình tròn rỗng), chưa có ý nghĩa, chưa có nội dung,
chưa có bối cảnh cụ thể [1]
Với mục đích yếu thu thập - lưu trữ - tổ chức - phân phối – quản trị
dữ liệu, TTDL là một tòa nhà, không gian dành riêng trong tòa nhà hoặc
một nhóm các tòa nhà được sử dụng để chứa các hệ thống máy tính và
17
TRUNG TÂM TRI THỨC - THƯ VIỆN:...
các thành phần liên quan, chẳng hạn như hệ thống viễn thông và hệ
thống lưu trữ. Do hoạt động CNTT rất quan trọng đối với hoạt động
kinh doanh, nên nó thường bao gồm các thành phần dự phòng hoặc cơ
sở hạ tầng để cung cấp điện, kết nối truyền dữ liệu, kiểm soát môi trường
(ví dụ như điều hòa không khí, chữa cháy) và các thiết bị bảo mật khác
nhau. Một TTDL lớn là một hoạt động quy mô công nghiệp sử dụng
nhiều điện ngang với một thị trấn nhỏ. Ở đây, tập trung nhiều thành
phần tài nguyên mật độ cao (hardware, software) làm chức năng lưu
trữ, xử lý toàn bộ dữ liệu hệ thống với khả năng sẵn sàng và độ ổn định
cao. Các TTDL lớn thiết kế đảm bảo: Tính module hóa cao, Khả năng mở
rộng dễ dàng, Triển khai các giải pháp mới tối ưu về nguồn và làm mát,
Khả năng hỗ trợ hợp nhất Server và thiết bị lưu trữ mật độ cao[8]
Hiện nay không chỉ ở Việt Nam mà trên toàn thế giới đang diễn
ra công cuộc chuyển đổi số (Digital Transformation), nhu cầu đưa hệ
thống, ứng dụng lên đám mây (Cloud) ngày càng lớn. Do vậy, chúng
ta cần có những TTDL lớn, tiêu chuẩn cao, đảm bảo an toàn về hệ
thống, an toàn về dữ liệu, đủ năng lực cạnh tranh với các “ông lớn”
như Microsoft, Google, Amazon. Rất nhiều tổ chức, doanh nghiệp
Việt đang chuyển đổi ứng dụng lên cloud. Tuy nhiên, phần lớn doanh
nghiệp đang đưa lên các dịch vụ cloud nước ngoài như Amazon,
Microsoft, Google, Alibaba...
Hình 2. Trung tâm Dữ liệu bao gồm hệ thống máy chủ lưu trữ dữ liệu [8]
18
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
2.2. Trung tâm Thông tin (Information Center/Hub)
Dựa trên nền tảng của những dữ liệu thô mà con người chưa hiểu
được vì không có ý nghĩa (số liệu thô; tín hiệu; màu sắc; âm thanh) và
được liên kết, tổ chức, cấu trúc theo một chỉnh thể và đặt trong một bối
cảnh cụ thể, các dữ liệu này trở thành Thông tin (Information) có ý nghĩa,
có nội dung (trả lời các câu hỏi như: Ai?, Cái gì?, Ở đâu?, Khi nào?) [5].
Hình 3: Thông tin (hình tròn có mầu) bao gồm các dữ liệu có ý nghĩa,
có nội dung, có bối cảnh cụ thể [1]
TTTT khác với TTDL, là nơi thu thập - lưu trữ - tổ chức – phân phối –
quản trị thông tin bao gồm các dữ liệu có ý nghĩa, có nội dung và bối cảnh
cụ thể để trả lời các câu hỏi: Ai (Who); Cái gì (What); Ở đâu (Where); Khi
nào (When) Các TTTT có mặt ở tất cả các lĩnh vực trong đời sống xã hội
như: TTTT pháp luật; TTTT kinh tế; TTTT y tế; TTTT du lịch; TTTT thời
tiết; TTTT bất động sản; TTTT giáo dục – du học; TTTT thư viện
Với mục đích chuyển đổi các dữ liệu không có ý nghĩa, không có
nội dung cụ thể trở thành các dữ liệu có ý nghĩa, có nội dung, có bối
cảnh cụ thể dưới dạng các thông tin, thông báo, chỉ dẫn, báo cáo, giới
thiệu thì các TTTT phải thu thập, xử lý, phân tích, tổng hợp, tổ chức,
hệ thống hóa các loại hình dữ liệu khác nhau, đa dạng khổ mẫu (dữ
liệu truyền thống dạng in ấn, dữ liệu số, dữ liệu đa phương tiện)
theo các chủ đề, vấn đề hay nhóm vấn đề, lĩnh vực cụ thể để cung cấp
cho người sử dụng thông tin (khách hàng) hiểu được, biết được, thông
tỏ các vấn đề họ cần giải đáp, lấp đầy Khoảng trống Thông tin (Gap of
Information) xuất hiện trong bộ não của người sử dụng (khách hàng)
19
TRUNG TÂM TRI THỨC - THƯ VIỆN:...
trong nảy sinh trong quá trình họ làm việc, sinh hoạt, vui chơi, giải
trí.Ví dụ: Các thông tin về du lịch (chuyến bay, khách sạn, địa điểm
vui chơi) cho khách du lịch; Các thông tin y tế, chỉ dẫn khám bệnh,
chẩn đoán, cung cấp thuốc men, điều trị cho bệnh nhân; Các thông tin
về nhà đất, bất động sản cho các nhà đầu tư.
Hình 4. Trung tâm Thông tin cung cấp thông tin, giải đáp các câu hỏi [2]
2.3. Trung tâm Tri thức (Knowledge Center/Hub)
Khác với dữ liệu và thông tin, Tri thức (Knowledge) là sự hiểu
biết dựa trên những trải nghiệm, được học tập trong quá khứ. Chính
những thông tin có ý nghĩa này được kết nối, liên kết, tổng hợp, có hệ
thống và đã tạo nên tri thức, là sự nhận thức - hiểu biết có hệ thống
– chân lý – quy luật về sự vật và hiện tượng trong cuộc sống. Tri thức
đem lại sự hiểu biết để trả lời câu hỏi như: "Như thế nào?". Ở mức độ
cao hơn tri thức, sự Hiểu biết sâu sắc (Insight), Trí khôn (Widsom) (trả
lời câu hỏi Tại sao?) là sự hiểu biết một cách sâu sắc, bao quát tổng
thể, nắm bắt quy luật, nguyên tắc vận hành, xu hướng phát triển để
áp dụng sự hiểu biết này cho việc ra quyết định tạo ra sự thay đổi, tác
động vào thực tế (bản thân, xã hội hay tự nhiên) một cách có chủ đích,
theo ý muốn của cá nhân (hay một tập thể). Khác với tri thức phản ánh
20
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
những trải nghiệm và hiểu biết trong quá khứ, sự hiểu biết sâu sắc - trí
khôn là sự phát triển tri thức để đưa ra những quyết định đúng đắn, có
chủ đích trong tương lai và để trả lời cho các câu hỏi: Tại sao? Thế nào?
Dữ liệu, thông tin thường có đặc điểm dễ nhận biết (Hiện) trong khi
đó tri thức, sự hiểu biết sâu sắc, trí khôn lại rất khó nhận biết (Ẩn) [5].
Hình 5: Tri thức (các hình tròn kết nối nhau); Hiểu biết sâu sắc (các hình
tròn màu vàng), Trí khôn (Các hình tròn màu vàng kết nối nhau)[1]
Tri thức thường có 02 dạng như sau:
• Tri thức Ẩn (Tacit Knowledge): Kinh nghiệm, Trí khôn, Chất
xám có trong mỗi người. Vì đặc tính Ẩn như vậy, nên chúng ta rất
khó nhận biết được nó, rất khó cụ thể hóa ra thành lời nói, viết ra thành
văn bản nên không thể dễ dàng nắm bắt được [5].
• Tri thức Hiện (Explicit Knowledge): là những Tri thức Ẩn đã
được trình bày ra, được nói ra, được viết ra, được cụ thể hóa bằng văn
bản mà chúng ta hoàn toàn hiểu được ý nghĩa của nó. Điển hình
nhất, Tri thức Hiện được trình bày ở trong những tài liệu khoa học,
sách, báo, tạp chí phổ biến kiến thức, văn hóa, tri thức mọi mặt từ tự
nhiên đến xã hội, mọi sự vật và hiện tượng [5].
Vì tri thức khác biệt với dữ liệu và thông tin như vậy, cho nên TT
Tri thức cũng có điểm khác biệt so với TTDL và TTTT. Cụ thể TT Tri thức
có nhiệm vụ như sau: thu thập - lưu trữ - tổ chức - phân phối – quản
trị tri thức. Đã từ lâu, mô hình TT Tri thức gắn liền với các hệ thống thư
viện như : TV quốc gia, TV đại học, TV chuyên ngànhhay các bộ phận
(phòng, ban, đơn vị, nhóm) trong các doanh nghiệp có nhiệm vụ quản
trị tri thức, quản trị thông tin hay quản trị dữ liệu của công ty hay doanh
21
TRUNG TÂM TRI THỨC - THƯ VIỆN:...
nghiệp đó. Nếu các thư viện có nhiệm vụ chủ yếu là quản trị Tri thức
Nổi (sách, báo, tạp chí, cơ sở dữ liệu điện tử, tài liệu phát minh sáng chế,
kết quả nghiên cứu khoa học, luận án, luận văn) để phục vụ nhu cầu
đọc, tiếp nhận tri thức cho học tập, giảng dạy, nghiên cứu, sáng tạo, sản
xuất, giải trí thì các doanh nghiệp (hay công ty) lại thiên về quản trị Tri
thức Ẩn như: quản trị nhân sự, quản trị chất xám của nguồn nhân lực mà
công ty sở hữu, săn đầu người (Head Hunter) với mục đích quản trị
hiệu quả tài sản trí tuệ, chất xám, vốn con ngườiđể đạt ưu thế về cạnh
tranh về nguồn nhân lực so với nguồn vốn tài chính, bất động sản, công
nghệ của công ty hay doanh nghiệp đó.
2.4. Bảng phân biệt 3 mô hình TTDL – TTTT – TT Tri Thức
TRUNG TÂM DỮ LIỆU
(DATA CENTER)
TRUNG TÂM THÔNG TIN
(INFORMATION
CENTER)
TRUNG TÂM TRI THỨC
(KNOWLEDGE CENTER)
Nhiệm
vụ
Thu thập - lưu trữ - tổ
chức - phân phối –
quản trị dữ liệu
Thu thập - lưu trữ - tổ
chức – phân phối – quản
trị thông tin
Thu thập - lưu trữ - tổ chức -
phân phối – quản trị tri thức
Đặc
điểm
Dữ liệu (Data) bao gồm
các số liệu; tín hiệu; màu
sắc; âm thanh, là dữ
liệu thô mà con người
chưa hiểu được vì chưa
có ý nghĩa, chưa có nội
dung, chưa có bối cảnh
cụ thể liên quan đến dữ
liệu
Thông tin (Information)
có ý nghĩa, có nội dung
(trả lời các câu hỏi như:
Ai? Cái gì? Ở đâu? Khi
nào?).
Tri thức (Knowledge) là sự hiểu
biết dựa trên những trải nghiệm,
được học tập trong quá khứ, là
những thông tin có ý nghĩa này
được kết nối, liên kết, tổng hợp,
có hệ thống và đã tạo nên tri
thức, là sự nhận thức - hiểu biết
có hệ thống – chân lý – quy luật
về sự vật và hiện tượng trong
cuộc sống, trả lời cho các câu hỏi:
Tại sao? Thế nào?
Biểu
hiện
TTDL của Microsoft,
Google, Amazon, VNPT,
FPT, VDC
TTTT pháp luật; TTTT kinh
tế; TTTT y tế; TTTT du lịch;
TTTT thời tiết; TTTT bất
động sản; TTTT giáo dục
– du học; TTTT thư viện
TV Quốc gia, TV đại học, TV
chuyên ngành; Phòng, Ban,
Đơn vị, Nhóm trong các
doanh nghiệp có nhiệm vụ
quản trị tri thức
Nghề
nghiệp
Giám đốc dữ liệu (CDO);
Chuyên gia dữ liệu
Giám đốc thông tin (CIO);
Chuyên gia thông tin
Giám đốc tri thức (CKO); Chuyên
gia tri thức
22
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
3. CÁC THÁCH THỨC ĐỐI VỚI THƯ VIỆN SỐ VIỆT NAM TRONG BỐI CẢNH BÙNG NỔ
DỮ LIỆU LỚN
Hệ thống thư viện số (TVS) Việt Nam theo nghĩa hẹp là hệ thống TVS
quốc gia, TVS đại học, TVS công cộng, TVS chuyên ngành Còn theo
nghĩa rộng, TVS còn là các kho dữ liệu, CSDL máy tính ở các tổ chức như
chính phủ số, doanh nghiệp số, đại học số, văn phòng số thuộc mọi lĩnh
vực xã hội; là những dữ liệu – thông tin – tri thức được thu thập, tổ chức,
phân tích, tổng hợp và cung cấp cho người dùng qua hệ thống mạng
Các kho dữ liệu hay CSDL có thể nằm trong máy tính, thiết bị di động kết
nối mạng, nền tảng đám mây, mạng xã hội, trong hệ thống dữ liệu lớn
phân tán trên phạm vi toàn cầu Hơn 20 năm qua, hệ thống TVS Việt
Nam đã có bước phát triển mạnh từ phát triển phần cứng, phần mềm, tự
động hóa chu trình thư viện, số hóa tài liệu, chuyển đổi số làm nền tảng
để phát triển xã hội số, học tập số, nghiên cứu số, quản lý số, vận hành số
các hoạt động kinh tế, chính trị, giáo dục, giải trí
Tuy nhiên, mặc dù có những bước phát triển mạnh mẽ, các TVS Việt
Nam hiện nay đang phải ứng phó với sự bùng nổ dữ liệu lớn, TVS hiện
nay không chỉ tổ chức và quản trị dữ liệu số, thông tin số, tri thức số có
trong kho lưu trữ số của mình mà còn phải kết nối, khám phá, thu thập,
tổ chức, và quản trị các loại hình tài nguyên số khác nằm ngoài thư viện,
có trong hệ thống dữ liệu lớn đám mây trên phạm vi toàn cầu. Do vậy,
TVS Việt Nam đã và đang gặp phải hàng loạt các thách thức sau:
1. Thách thức phát triển các tài nguyên số để quản trị hiệu quả
như: chính sách – phương pháp – công nghệ số hóa; xử lý các tài
nguyên đa phương tiện – phi cấu trúc; tích hợp và kết nối dữ liệu đa
nền tảng; kết nối và khai thác các tài nguyên dữ liệu lớn[4]
2. Thách thức về phát hiện và tổ chức tài nguyên số: Phát triển
các siêu dữ liệu; Cấu trúc tài liệu số từ dạng phi cấu trúc; Phân loại các
loại hình tài nguyên số: văn bản, hình ảnh, âm thanh, video; Thu
thập, định chỉ số Index, sắp xếp, tìm kiếm tài nguyên số; Liên thông dữ
liệu và nền tảng; Biên dịch dữ liệu; Phân loại mang tính cá nhân; Định
danh số; Phân tích dữ liệu – thông tin – tri thức[4]
23
TRUNG TÂM TRI THỨC - THƯ VIỆN:...
3. Thách thức về tìm kiếm, truy cập, khai thác tài nguyên số: Tìm
kiếm các kho dữ liệu phân tán; Tìm kiếm dữ liệu lớn; Tìm kiếm đa ngôn
ngữ; Tìm kiếm đa phương tiện: văn bản, hình ảnh, âm thanh, giọng nói;
Ứng dụng trí tuệ nhân tạo trong công cụ tìm kiếm; Truy cập phân tán;
Chiết xuất và phân tích dữ liệu; Định chỉ số tự động; Xử lý đa ngôn ngữ
- đa văn hóa trong tìm kiếm; Khai thác tài nguyên đa ngôn ngữ[4]
4. Thách thức trong tương tác người – máy /trí tuệ nhân tạo: tương
tác người – máy tính – dữ liệu; Sử dụng các dữ liệu đa phương tiện; Nhu
cầu sử dụng dữ liệu – thông tin – tri thức; Đánh giá người dùng tin; Cá
nhân hóa không gian số; Mô hình hóa người sử dụng[4]
5. Thách thức về Hạ tầng – Kiến trúc dữ liệu/thông tin – Quản trị
tri thức: Hạ tầng kiến trúc dữ liệu; Kiến trúc nền tảng; An ninh mạng;
Quản lý truy cập; Chia sẻ và quản trị dữ liệu – thông tin – tri thức; Lưu
trữ đám mây; Lưu trữ và truy cập mở; Hệ thống tổ chức tri thức; Hệ
thống và công cụ mở[4]
6. Thách thức lưu trữ số: Lưu trữ dữ liệu/ dữ liệu lớn/ dữ liệu đám
mây; Backup dữ liệu; Lựa chọn cách thức lưu trữ dữ liệu; Bảo quản số
di sản văn hóa; Lưu trữ Web; Phương pháp/ Kỹ thuật/ Nền tảng/ Pháp
lý lưu trữ; Thuật toán/ Mã hóa dữ liệu lưu trữ[4]
7. Thách thức phát triển dịch vụ số: Dịch vụ số liên thông/ đa nền
tảng; Dịch vụ số cho tổ chức/ cá nhân; Dịch vụ đa phương tiện; Dịch
vụ đám mây/ dữ liệu lớn; Dịch vụ phân tích/tổng hợp dữ liệu; Dịch vụ
chuyển đổi dữ liệu thành thông tin – tri thức; Dịch vụ đóng gói sản
phẩm cho người dùng[4]
8. Thách thức sử dụng mạng xã hội: Web 1.0: Web 1 chiều; Web
2.0: Mạng xã hội; Web 3.0: Web ngữ nghĩa; Web 4.0: Web tri thức/ Kết
nối vạn vật; Tìm kiếm dữ liệu xã hội;