Trung tâm tri thức - Thư viện: Chuyển đổi thư viện số thành trung tâm tri thức số để ứng phó bùng nổ dữ liệu lớn

Tóm tắt:Bài viết phân tích bối cảnh bùng nổ dữ liệu lớn; vai trò, nhiệm vụ và đặc điểm của 03 mô hình Trung tâm Dữ liệu – Trung tâm Thông tin – Trung tâm Tri thức để thích ứng với bối cảnh này. Các tác giả đã đi sâu phân tích các thách thức đối với thư viện số Việt Nam, đề xuất chuyển đổi các thư viện số Việt Nam theo mô hình Trung tâm Tri thức số. Đây là cơ sở để kiến tạo nên mô hình kết hợp Trung tâm Tri thức – Thư viện để ứng phó bối cảnh bùng nổ dữ liệu lớn.

pdf15 trang | Chia sẻ: thanhle95 | Lượt xem: 35 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Trung tâm tri thức - Thư viện: Chuyển đổi thư viện số thành trung tâm tri thức số để ứng phó bùng nổ dữ liệu lớn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
TRUNG TÂM TRI THỨC - THƯ VIỆN:... CHUYỂN ĐỔI THƯ VIỆN SỐ THÀNH TRUNG TÂM TRI THỨC SỐ ĐỂ ỨNG PHÓ BÙNG NỔ DỮ LIỆU LỚN Nguyễn Hoàng Sơn1* - Hoàng Minh Bắc2** - Đỗ Diệp Anh3***- Trịnh Khánh Vân4**** Tóm tắt: Bài viết phân tích bối cảnh bùng nổ dữ liệu lớn; vai trò, nhiệm vụ và đặc điểm của 03 mô hình Trung tâm Dữ liệu – Trung tâm Thông tin – Trung tâm Tri thức để thích ứng với bối cảnh này. Các tác giả đã đi sâu phân tích các thách thức đối với thư viện số Việt Nam, đề xuất chuyển đổi các thư viện số Việt Nam theo mô hình Trung tâm Tri thức số. Đây là cơ sở để kiến tạo nên mô hình kết hợp Trung tâm Tri thức – Thư viện để ứng phó bối cảnh bùng nổ dữ liệu lớn. Từ khóa: Trung tâm Tri thức – Thư viện; Trung tâm Dữ liệu; Trung tâm Thông tin; Trung tâm Tri thức số; Dữ liệu lớn; Thư viện số. 1. SỰ BÙNG NỔ DỮ LIỆU LỚN Hiện nay, dữ liệu lớn kết hợp với trí tuệ nhân tạo trên nền tảng kết nối vạn vật đang tác động mạnh tới xã hội số, kinh tế số, chính trị số, văn hóa số, giáo dục số làm thay đổi hành vi, cuộc sống của mỗi cá nhân, mỗi tổ chức, mỗi quốc gia và trên phạm vi toàn cầu. Dữ liệu ∗ Tiến sĩ chuyên ngành Quản trị Thông tin – Tri thức, Đại học Công nghệ Sydney, Australia; Giám đốc Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội – Phó Chủ tịch Hội Thư viện Việt Nam. ∗∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội. ∗∗∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội. **** Thạc sĩ, Khoa Thông tin – Thư viện, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia Hà Nội. 15 TRUNG TÂM TRI THỨC - THƯ VIỆN:... TRUNG TÂM TRI THỨC - THƯ VIỆN:... CHUYỂN ĐỔI THƯ VIỆN SỐ THÀNH TRUNG TÂM TRI THỨC SỐ ĐỂ ỨNG PHÓ BÙNG NỔ DỮ LIỆU LỚN Nguyễn Hoàng Sơn1* - Hoàng Minh Bắc2** - Đỗ Diệp Anh3***- Trịnh Khánh Vân4**** Tóm tắt: Bài viết phân tích bối cảnh bùng nổ dữ liệu lớn; vai trò, nhiệm vụ và đặc điểm của 03 mô hình Trung tâm Dữ liệu – Trung tâm Thông tin – Trung tâm Tri thức để thích ứng với bối cảnh này. Các tác giả đã đi sâu phân tích các thách thức đối với thư viện số Việt Nam, đề xuất chuyển đổi các thư viện số Việt Nam theo mô hình Trung tâm Tri thức số. Đây là cơ sở để kiến tạo nên mô hình kết hợp Trung tâm Tri thức – Thư viện để ứng phó bối cảnh bùng nổ dữ liệu lớn. Từ khóa: Trung tâm Tri thức – Thư viện; Trung tâm Dữ liệu; Trung tâm Thông tin; Trung tâm Tri thức số; Dữ liệu lớn; Thư viện số. 1. SỰ BÙNG NỔ DỮ LIỆU LỚN Hiện nay, dữ liệu lớn kết hợp với trí tuệ nhân tạo trên nền tảng kết nối vạn vật đang tác động mạnh tới xã hội số, kinh tế số, chính trị số, văn hóa số, giáo dục số làm thay đổi hành vi, cuộc sống của mỗi cá nhân, mỗi tổ chức, mỗi quốc gia và trên phạm vi toàn cầu. Dữ liệu ∗ Tiến sĩ chuyên ngành Quản trị Thông tin – Tri thức, Đại học Công nghệ Sydney, Australia; Giám đốc Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội – Phó Chủ tịch Hội Thư viện Việt Nam. ∗∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội. ∗∗∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội. **** Thạc sĩ, Khoa Thông tin – Thư viện, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia Hà Nội. lớn, dữ liệu đám mây ngày càng bùng nổ khi được sản sinh qua các nền tảng xã hội: Facebook, Twitter, Instagram, Youtube; Hệ thống dữ liệu lớn của: Google, Microsoft, Amazon, Alibaba; Từ các cảm biến; Từ hàng tỷ điện thoại thông minh trong tay người dùng toàn cầu; Từ các hệ thống trí tuệ nhân tạo thu thập, phân tích, tổ chức, sản sinh, phân phối dữ liệu cho người dùng đầu cuối liên tục theo thời gian thực trên phạm vi toàn cầu; Từ các trung tâm dữ liệu đang thu thập và lưu trữ hàng Petabyte (PB) dữ liệu; Từ các tổ chức số như: chính phủ số, doanh nghiệp số, văn phòng số, đại học số, thư viện số Mỗi cá nhân hay tổ chức hiện nay đang phát triển song song “Thế giới thực” và “Thế giới số” và sống linh hoạt, thích ứng, phát triển trong cuộc cách mạng 4.0. Thách thức lớn nhất cho mỗi cá nhân hay tổ chức hiện nay là không phải là có thu thập được đủ dữ liệu hay không mà vấn đề là dữ liệu đang được thu thập và quản lý theo những cách khác nhau ở các bộ phận khác nhau trong tổ chức, ở các nền tảng dữ liệu khác nhau, ở các kênh truyền thông khác nhau, ở các định dạng khác nhau Dữ liệu đang biết về con người nhiều hơn con người biết về dữ liệu. Dung lượng dữ liệu được dự báo sẽ tăng gấp đôi sau mỗi 2 năm trong thập niên tới. Tuy nhiên, chỉ có 0,5% trong tổng số dữ liệu được phân tích và sử dụng [6] Chính vì vậy, thu thập, tổng hợp, phân tích dữ liệu lớn để cung cấp cho người dùng đầu cuối (cá nhân, tổ chức) để hỗ trợ quá trình ra quyết định đang trở thành một ngành nghề chủ đạo trong nền công nghiệp dữ liệu lớn có giá trị hàng tỉ đô. Vì dữ liệu lớn thực sự là rất lớn, sản sinh liên tục trong thời gian thực, tạo ra các dấu vết số thông qua tương tác, giao dịch ở các nền tảng khác nhau, các kênh khác nhau, đa dạng dữ liệu, đa dạng cấu trúc Do vậy, bản chất thực sự của cá nhân hay tổ chức khi sử dụng dữ liệu đó là muốn dữ liệu đó trở thành thông tin có ý nghĩa, có nội dung hay chính là tri thức (bao gồm thông tin có ý nghĩa được kết nối, liên kết, tổng hợp, hệ thống hóa; là sự nhận thức, hiểu biết có hệ thống, chân lý, quy luật về sự vật và hiện tượng trong cuộc sống) để hỗ trợ cho quá trình ra quyết định như: học tập, kinh doanh, quản lý, điều hành Do vậy, song song với việc xây dựng và phát triển các trung tâm (hay công ty) phân tích dữ liệu thì mô hình “Trung tâm Tri thức số” là đòi hỏi khách quan của xã hội số, của quốc gia số để thu thập, tổ chức, tổng 16 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM hợp, phân tích “Dữ liệu số” và chế biến, tạo thành “Tri thức số” phân phối, cung cấp cho người dùng. Đây là một đòi hỏi khách quan và cấp thiết cho một xã hội số, một quốc gia số. Cùng với mô hình Trung tâm Tri thức, mô hình Trung tâm Dữ liệu và Trung tâm Thông tin cũng là các mô hình phổ biến, hình thành và phát triển trong bối cảnh bùng nổ dữ liệu lớn. Cả 3 mô hình này đều đóng vai trò cực kỳ quan trọng trong việc thu thập, lưu trữ, phân tích, tổng hợp, tổ chức và phân phối, cung cấp dữ liệu – thông tin – tri thức cho các cá nhân, tổ chức trong xã hội số, quốc gia số và trên phạm vi toàn cầu. 2. TRUNG TÂM DỮ LIỆU – TRUNG TÂM THÔNG TIN – TRUNG TÂM TRI THỨC Song song với Dữ liệu, Thông tin và Tri thức thì cũng có 3 mô hình phát triển tương ứng là: Trung tâm Dữ liệu (TTDL), Trung tâm Thông tin (TTTT) và Trung tâm Tri thức (TT Tri thức). TT Tri thức mặc dù có nhiều điểm tương đồng với TTDL hay TTTT, nhưng về cơ bản 3 Trung tâm này có nhiều điểm khác biệt như sau: 2.1. Trung tâm Dữ liệu (Data Center/Hub) Dữ liệu (Data) bao gồm các số liệu; tín hiệu; màu sắc; âm thanh, là dữ liệu thô mà con người chưa hiểu được vì chưa có ý nghĩa, chưa có nội dung, chưa có bối cảnh cụ thể liên quan đến dữ liệu[5] Hình 1: Dữ liệu (hình tròn rỗng), chưa có ý nghĩa, chưa có nội dung, chưa có bối cảnh cụ thể [1] Với mục đích yếu thu thập - lưu trữ - tổ chức - phân phối – quản trị dữ liệu, TTDL là một tòa nhà, không gian dành riêng trong tòa nhà hoặc một nhóm các tòa nhà được sử dụng để chứa các hệ thống máy tính và 17 TRUNG TÂM TRI THỨC - THƯ VIỆN:... các thành phần liên quan, chẳng hạn như hệ thống viễn thông và hệ thống lưu trữ. Do hoạt động CNTT rất quan trọng đối với hoạt động kinh doanh, nên nó thường bao gồm các thành phần dự phòng hoặc cơ sở hạ tầng để cung cấp điện, kết nối truyền dữ liệu, kiểm soát môi trường (ví dụ như điều hòa không khí, chữa cháy) và các thiết bị bảo mật khác nhau. Một TTDL lớn là một hoạt động quy mô công nghiệp sử dụng nhiều điện ngang với một thị trấn nhỏ. Ở đây, tập trung nhiều thành phần tài nguyên mật độ cao (hardware, software) làm chức năng lưu trữ, xử lý toàn bộ dữ liệu hệ thống với khả năng sẵn sàng và độ ổn định cao. Các TTDL lớn thiết kế đảm bảo: Tính module hóa cao, Khả năng mở rộng dễ dàng, Triển khai các giải pháp mới tối ưu về nguồn và làm mát, Khả năng hỗ trợ hợp nhất Server và thiết bị lưu trữ mật độ cao[8] Hiện nay không chỉ ở Việt Nam mà trên toàn thế giới đang diễn ra công cuộc chuyển đổi số (Digital Transformation), nhu cầu đưa hệ thống, ứng dụng lên đám mây (Cloud) ngày càng lớn. Do vậy, chúng ta cần có những TTDL lớn, tiêu chuẩn cao, đảm bảo an toàn về hệ thống, an toàn về dữ liệu, đủ năng lực cạnh tranh với các “ông lớn” như Microsoft, Google, Amazon. Rất nhiều tổ chức, doanh nghiệp Việt đang chuyển đổi ứng dụng lên cloud. Tuy nhiên, phần lớn doanh nghiệp đang đưa lên các dịch vụ cloud nước ngoài như Amazon, Microsoft, Google, Alibaba... Hình 2. Trung tâm Dữ liệu bao gồm hệ thống máy chủ lưu trữ dữ liệu [8] 18 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 2.2. Trung tâm Thông tin (Information Center/Hub) Dựa trên nền tảng của những dữ liệu thô mà con người chưa hiểu được vì không có ý nghĩa (số liệu thô; tín hiệu; màu sắc; âm thanh) và được liên kết, tổ chức, cấu trúc theo một chỉnh thể và đặt trong một bối cảnh cụ thể, các dữ liệu này trở thành Thông tin (Information) có ý nghĩa, có nội dung (trả lời các câu hỏi như: Ai?, Cái gì?, Ở đâu?, Khi nào?) [5]. Hình 3: Thông tin (hình tròn có mầu) bao gồm các dữ liệu có ý nghĩa, có nội dung, có bối cảnh cụ thể [1] TTTT khác với TTDL, là nơi thu thập - lưu trữ - tổ chức – phân phối – quản trị thông tin bao gồm các dữ liệu có ý nghĩa, có nội dung và bối cảnh cụ thể để trả lời các câu hỏi: Ai (Who); Cái gì (What); Ở đâu (Where); Khi nào (When) Các TTTT có mặt ở tất cả các lĩnh vực trong đời sống xã hội như: TTTT pháp luật; TTTT kinh tế; TTTT y tế; TTTT du lịch; TTTT thời tiết; TTTT bất động sản; TTTT giáo dục – du học; TTTT thư viện Với mục đích chuyển đổi các dữ liệu không có ý nghĩa, không có nội dung cụ thể trở thành các dữ liệu có ý nghĩa, có nội dung, có bối cảnh cụ thể dưới dạng các thông tin, thông báo, chỉ dẫn, báo cáo, giới thiệu thì các TTTT phải thu thập, xử lý, phân tích, tổng hợp, tổ chức, hệ thống hóa các loại hình dữ liệu khác nhau, đa dạng khổ mẫu (dữ liệu truyền thống dạng in ấn, dữ liệu số, dữ liệu đa phương tiện) theo các chủ đề, vấn đề hay nhóm vấn đề, lĩnh vực cụ thể để cung cấp cho người sử dụng thông tin (khách hàng) hiểu được, biết được, thông tỏ các vấn đề họ cần giải đáp, lấp đầy Khoảng trống Thông tin (Gap of Information) xuất hiện trong bộ não của người sử dụng (khách hàng) 19 TRUNG TÂM TRI THỨC - THƯ VIỆN:... trong nảy sinh trong quá trình họ làm việc, sinh hoạt, vui chơi, giải trí.Ví dụ: Các thông tin về du lịch (chuyến bay, khách sạn, địa điểm vui chơi) cho khách du lịch; Các thông tin y tế, chỉ dẫn khám bệnh, chẩn đoán, cung cấp thuốc men, điều trị cho bệnh nhân; Các thông tin về nhà đất, bất động sản cho các nhà đầu tư. Hình 4. Trung tâm Thông tin cung cấp thông tin, giải đáp các câu hỏi [2] 2.3. Trung tâm Tri thức (Knowledge Center/Hub) Khác với dữ liệu và thông tin, Tri thức (Knowledge) là sự hiểu biết dựa trên những trải nghiệm, được học tập trong quá khứ. Chính những thông tin có ý nghĩa này được kết nối, liên kết, tổng hợp, có hệ thống và đã tạo nên tri thức, là sự nhận thức - hiểu biết có hệ thống – chân lý – quy luật về sự vật và hiện tượng trong cuộc sống. Tri thức đem lại sự hiểu biết để trả lời câu hỏi như: "Như thế nào?". Ở mức độ cao hơn tri thức, sự Hiểu biết sâu sắc (Insight), Trí khôn (Widsom) (trả lời câu hỏi Tại sao?) là sự hiểu biết một cách sâu sắc, bao quát tổng thể, nắm bắt quy luật, nguyên tắc vận hành, xu hướng phát triển để áp dụng sự hiểu biết này cho việc ra quyết định tạo ra sự thay đổi, tác động vào thực tế (bản thân, xã hội hay tự nhiên) một cách có chủ đích, theo ý muốn của cá nhân (hay một tập thể). Khác với tri thức phản ánh 20 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM những trải nghiệm và hiểu biết trong quá khứ, sự hiểu biết sâu sắc - trí khôn là sự phát triển tri thức để đưa ra những quyết định đúng đắn, có chủ đích trong tương lai và để trả lời cho các câu hỏi: Tại sao? Thế nào? Dữ liệu, thông tin thường có đặc điểm dễ nhận biết (Hiện) trong khi đó tri thức, sự hiểu biết sâu sắc, trí khôn lại rất khó nhận biết (Ẩn) [5]. Hình 5: Tri thức (các hình tròn kết nối nhau); Hiểu biết sâu sắc (các hình tròn màu vàng), Trí khôn (Các hình tròn màu vàng kết nối nhau)[1] Tri thức thường có 02 dạng như sau: • Tri thức Ẩn (Tacit Knowledge): Kinh nghiệm, Trí khôn, Chất xám có trong mỗi người. Vì đặc tính Ẩn như vậy, nên chúng ta rất khó nhận biết được nó, rất khó cụ thể hóa ra thành lời nói, viết ra thành văn bản nên không thể dễ dàng nắm bắt được [5]. • Tri thức Hiện (Explicit Knowledge): là những Tri thức Ẩn đã được trình bày ra, được nói ra, được viết ra, được cụ thể hóa bằng văn bản mà chúng ta hoàn toàn hiểu được ý nghĩa của nó. Điển hình nhất, Tri thức Hiện được trình bày ở trong những tài liệu khoa học, sách, báo, tạp chí phổ biến kiến thức, văn hóa, tri thức mọi mặt từ tự nhiên đến xã hội, mọi sự vật và hiện tượng [5]. Vì tri thức khác biệt với dữ liệu và thông tin như vậy, cho nên TT Tri thức cũng có điểm khác biệt so với TTDL và TTTT. Cụ thể TT Tri thức có nhiệm vụ như sau: thu thập - lưu trữ - tổ chức - phân phối – quản trị tri thức. Đã từ lâu, mô hình TT Tri thức gắn liền với các hệ thống thư viện như : TV quốc gia, TV đại học, TV chuyên ngànhhay các bộ phận (phòng, ban, đơn vị, nhóm) trong các doanh nghiệp có nhiệm vụ quản trị tri thức, quản trị thông tin hay quản trị dữ liệu của công ty hay doanh 21 TRUNG TÂM TRI THỨC - THƯ VIỆN:... nghiệp đó. Nếu các thư viện có nhiệm vụ chủ yếu là quản trị Tri thức Nổi (sách, báo, tạp chí, cơ sở dữ liệu điện tử, tài liệu phát minh sáng chế, kết quả nghiên cứu khoa học, luận án, luận văn) để phục vụ nhu cầu đọc, tiếp nhận tri thức cho học tập, giảng dạy, nghiên cứu, sáng tạo, sản xuất, giải trí thì các doanh nghiệp (hay công ty) lại thiên về quản trị Tri thức Ẩn như: quản trị nhân sự, quản trị chất xám của nguồn nhân lực mà công ty sở hữu, săn đầu người (Head Hunter) với mục đích quản trị hiệu quả tài sản trí tuệ, chất xám, vốn con ngườiđể đạt ưu thế về cạnh tranh về nguồn nhân lực so với nguồn vốn tài chính, bất động sản, công nghệ của công ty hay doanh nghiệp đó. 2.4. Bảng phân biệt 3 mô hình TTDL – TTTT – TT Tri Thức TRUNG TÂM DỮ LIỆU (DATA CENTER) TRUNG TÂM THÔNG TIN (INFORMATION CENTER) TRUNG TÂM TRI THỨC (KNOWLEDGE CENTER) Nhiệm vụ Thu thập - lưu trữ - tổ chức - phân phối – quản trị dữ liệu Thu thập - lưu trữ - tổ chức – phân phối – quản trị thông tin Thu thập - lưu trữ - tổ chức - phân phối – quản trị tri thức Đặc điểm Dữ liệu (Data) bao gồm các số liệu; tín hiệu; màu sắc; âm thanh, là dữ liệu thô mà con người chưa hiểu được vì chưa có ý nghĩa, chưa có nội dung, chưa có bối cảnh cụ thể liên quan đến dữ liệu Thông tin (Information) có ý nghĩa, có nội dung (trả lời các câu hỏi như: Ai? Cái gì? Ở đâu? Khi nào?). Tri thức (Knowledge) là sự hiểu biết dựa trên những trải nghiệm, được học tập trong quá khứ, là những thông tin có ý nghĩa này được kết nối, liên kết, tổng hợp, có hệ thống và đã tạo nên tri thức, là sự nhận thức - hiểu biết có hệ thống – chân lý – quy luật về sự vật và hiện tượng trong cuộc sống, trả lời cho các câu hỏi: Tại sao? Thế nào? Biểu hiện TTDL của Microsoft, Google, Amazon, VNPT, FPT, VDC TTTT pháp luật; TTTT kinh tế; TTTT y tế; TTTT du lịch; TTTT thời tiết; TTTT bất động sản; TTTT giáo dục – du học; TTTT thư viện TV Quốc gia, TV đại học, TV chuyên ngành; Phòng, Ban, Đơn vị, Nhóm trong các doanh nghiệp có nhiệm vụ quản trị tri thức Nghề nghiệp Giám đốc dữ liệu (CDO); Chuyên gia dữ liệu Giám đốc thông tin (CIO); Chuyên gia thông tin Giám đốc tri thức (CKO); Chuyên gia tri thức 22 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 3. CÁC THÁCH THỨC ĐỐI VỚI THƯ VIỆN SỐ VIỆT NAM TRONG BỐI CẢNH BÙNG NỔ DỮ LIỆU LỚN Hệ thống thư viện số (TVS) Việt Nam theo nghĩa hẹp là hệ thống TVS quốc gia, TVS đại học, TVS công cộng, TVS chuyên ngành Còn theo nghĩa rộng, TVS còn là các kho dữ liệu, CSDL máy tính ở các tổ chức như chính phủ số, doanh nghiệp số, đại học số, văn phòng số thuộc mọi lĩnh vực xã hội; là những dữ liệu – thông tin – tri thức được thu thập, tổ chức, phân tích, tổng hợp và cung cấp cho người dùng qua hệ thống mạng Các kho dữ liệu hay CSDL có thể nằm trong máy tính, thiết bị di động kết nối mạng, nền tảng đám mây, mạng xã hội, trong hệ thống dữ liệu lớn phân tán trên phạm vi toàn cầu Hơn 20 năm qua, hệ thống TVS Việt Nam đã có bước phát triển mạnh từ phát triển phần cứng, phần mềm, tự động hóa chu trình thư viện, số hóa tài liệu, chuyển đổi số làm nền tảng để phát triển xã hội số, học tập số, nghiên cứu số, quản lý số, vận hành số các hoạt động kinh tế, chính trị, giáo dục, giải trí Tuy nhiên, mặc dù có những bước phát triển mạnh mẽ, các TVS Việt Nam hiện nay đang phải ứng phó với sự bùng nổ dữ liệu lớn, TVS hiện nay không chỉ tổ chức và quản trị dữ liệu số, thông tin số, tri thức số có trong kho lưu trữ số của mình mà còn phải kết nối, khám phá, thu thập, tổ chức, và quản trị các loại hình tài nguyên số khác nằm ngoài thư viện, có trong hệ thống dữ liệu lớn đám mây trên phạm vi toàn cầu. Do vậy, TVS Việt Nam đã và đang gặp phải hàng loạt các thách thức sau: 1. Thách thức phát triển các tài nguyên số để quản trị hiệu quả như: chính sách – phương pháp – công nghệ số hóa; xử lý các tài nguyên đa phương tiện – phi cấu trúc; tích hợp và kết nối dữ liệu đa nền tảng; kết nối và khai thác các tài nguyên dữ liệu lớn[4] 2. Thách thức về phát hiện và tổ chức tài nguyên số: Phát triển các siêu dữ liệu; Cấu trúc tài liệu số từ dạng phi cấu trúc; Phân loại các loại hình tài nguyên số: văn bản, hình ảnh, âm thanh, video; Thu thập, định chỉ số Index, sắp xếp, tìm kiếm tài nguyên số; Liên thông dữ liệu và nền tảng; Biên dịch dữ liệu; Phân loại mang tính cá nhân; Định danh số; Phân tích dữ liệu – thông tin – tri thức[4] 23 TRUNG TÂM TRI THỨC - THƯ VIỆN:... 3. Thách thức về tìm kiếm, truy cập, khai thác tài nguyên số: Tìm kiếm các kho dữ liệu phân tán; Tìm kiếm dữ liệu lớn; Tìm kiếm đa ngôn ngữ; Tìm kiếm đa phương tiện: văn bản, hình ảnh, âm thanh, giọng nói; Ứng dụng trí tuệ nhân tạo trong công cụ tìm kiếm; Truy cập phân tán; Chiết xuất và phân tích dữ liệu; Định chỉ số tự động; Xử lý đa ngôn ngữ - đa văn hóa trong tìm kiếm; Khai thác tài nguyên đa ngôn ngữ[4] 4. Thách thức trong tương tác người – máy /trí tuệ nhân tạo: tương tác người – máy tính – dữ liệu; Sử dụng các dữ liệu đa phương tiện; Nhu cầu sử dụng dữ liệu – thông tin – tri thức; Đánh giá người dùng tin; Cá nhân hóa không gian số; Mô hình hóa người sử dụng[4] 5. Thách thức về Hạ tầng – Kiến trúc dữ liệu/thông tin – Quản trị tri thức: Hạ tầng kiến trúc dữ liệu; Kiến trúc nền tảng; An ninh mạng; Quản lý truy cập; Chia sẻ và quản trị dữ liệu – thông tin – tri thức; Lưu trữ đám mây; Lưu trữ và truy cập mở; Hệ thống tổ chức tri thức; Hệ thống và công cụ mở[4] 6. Thách thức lưu trữ số: Lưu trữ dữ liệu/ dữ liệu lớn/ dữ liệu đám mây; Backup dữ liệu; Lựa chọn cách thức lưu trữ dữ liệu; Bảo quản số di sản văn hóa; Lưu trữ Web; Phương pháp/ Kỹ thuật/ Nền tảng/ Pháp lý lưu trữ; Thuật toán/ Mã hóa dữ liệu lưu trữ[4] 7. Thách thức phát triển dịch vụ số: Dịch vụ số liên thông/ đa nền tảng; Dịch vụ số cho tổ chức/ cá nhân; Dịch vụ đa phương tiện; Dịch vụ đám mây/ dữ liệu lớn; Dịch vụ phân tích/tổng hợp dữ liệu; Dịch vụ chuyển đổi dữ liệu thành thông tin – tri thức; Dịch vụ đóng gói sản phẩm cho người dùng[4] 8. Thách thức sử dụng mạng xã hội: Web 1.0: Web 1 chiều; Web 2.0: Mạng xã hội; Web 3.0: Web ngữ nghĩa; Web 4.0: Web tri thức/ Kết nối vạn vật; Tìm kiếm dữ liệu xã hội;
Tài liệu liên quan