Tóm tắt: Sự phát triển nhanh chóng của công nghệ dữ liệu lớn, trí
tuệ nhân tạo và vạn vật kết nối đã đem đến nhiều thay đổi trong
cách thức tiếp cận nguồn tin và phục vụ thông tin tại các thư viện.
Tăng cường khả năng nhận biết nhu cầu tin của người dùng tin
thông qua việc phân tích HVTT trong môi trường dữ liệu lớn là vô
cùng quan trọng để cải tiến chất lượng phục vụ thông tin tại các
thư viện. Vì vậy, bài viết giới thiệu định nghĩa về hành vi thông tin,
giải thích sự cần thiết và vai trò của phân tích hành vi thông tin của
người dùng tin trong môi trường dữ liệu lớn. Trên cơ sở đó, bài viết
đề xuất kế hoạch phân tích hành vi thông tin của người dùng tin
trong môi trường dữ liệu lớn tại các thư viện ở Việt Nam.
15 trang |
Chia sẻ: thanhle95 | Lượt xem: 250 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Vai trò của việc phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN
CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
Bùi Thị Thanh Diệu1*
Tóm tắt: Sự phát triển nhanh chóng của công nghệ dữ liệu lớn, trí
tuệ nhân tạo và vạn vật kết nối đã đem đến nhiều thay đổi trong
cách thức tiếp cận nguồn tin và phục vụ thông tin tại các thư viện.
Tăng cường khả năng nhận biết nhu cầu tin của người dùng tin
thông qua việc phân tích HVTT trong môi trường dữ liệu lớn là vô
cùng quan trọng để cải tiến chất lượng phục vụ thông tin tại các
thư viện. Vì vậy, bài viết giới thiệu định nghĩa về hành vi thông tin,
giải thích sự cần thiết và vai trò của phân tích hành vi thông tin của
người dùng tin trong môi trường dữ liệu lớn. Trên cơ sở đó, bài viết
đề xuất kế hoạch phân tích hành vi thông tin của người dùng tin
trong môi trường dữ liệu lớn tại các thư viện ở Việt Nam.
Từ khóa: Hành vi thông tin; Phân tích hành vi thông tin; Dữ liệu
lớn; Người dùng tin; Nhu cầu tin; Thông tin – thư viện.
MỞ ĐẦU
Trong những năm gần đây, sự phát triển của công nghệ thông tin,
sự kết nối của mạng viễn thông toàn cầu và công nghệ lưu trữ điện
toán đám mây đã thúc đẩy nhanh quá trình sản xuất dữ liệu lớn dẫn
tới khối lượng dữ liệu, đặc biệt là dữ liệu điện tử tại các thư viện không
ngừng gia tăng. Theo đó, dữ liệu hành vi thông tin (HVTT) có cấu
trúc và phi cấu trúc cũng tăng trưởng không ngừng khiến lý thuyết về
HVTT và nghiên cứu phân tích HVTT trở nên đặc biệt quan trọng. Vì
thế phân tích HVTT của người dùng tin thông qua dữ liệu lớn đang là
∗ Tiến sĩ, Trường Đại học Khánh Hòa.
490
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
bài toán đầy thách thức cho các thư viện trong bối cảnh xã hội thông
tin. Thông qua việc phân tích những dữ liệu HVTT, thư viện có thể
phân tích, khai thác sâu về nhu cầu, ý định và tâm lý của người dùng
tiềm năng, đồng thời đưa ra những sản phẩm, dịch vụ thông tin dự
kiến có giá trị, cung cấp “đúng” và “trúng” nhu cầu tin của người dùng
tin. Rõ ràng phân tích HVTT trong môi trường dữ liệu lớn đóng một
vai trò quan trọng, định hướng sự phát triển của các thư viện trong
tương lai. Chính vì vậy, bài viết này xem xét vai trò của việc phân tích
HVTT của người dùng tin trong môi trường dữ liệu lớn một cách hệ
thống và đề xuất xây dựng kế hoạch chiến lược phân tích HVTT trong
các thư viện ở Việt Nam.
1. HIỂU VỀ PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG
DỮ LIỆU LỚN CỦA THỜI ĐẠI CHUYỂN ĐỔI SỐ
1.1. Khái niệm "hành vi thông tin"
"Hành vi thông tin" là thuật ngữ dùng để mô tả cách thức con
người tương tác với thông tin, từ cách con người tìm kiếm, khai thác,
chọn lọc, sử dụng, chia sẻ và tái tạo thông tin. HVTT là toàn bộ hành
vi con người liên quan đến thông tin, bao gồm hành vi thụ động và vô
ý như ngẫu nhiên gặp thông tin, cũng như hành vi có mục đích mà
không liên quan đến tìm kiếm, như chủ động tránh thông tin [1]. Như
vậy, HVTT là một thuật ngữ với nghĩa rộng bao trùm các khía cạnh
khác nhau của hành vi con người liên quan đến thông tin. Có thể hiểu
HVTT đề cập đến một loạt hoạt động của người dùng tin như: nhấp,
tìm kiếm, duyệt, sao chép, lưu trữ, nhận xét, phản hồi, trong khi
truy cập trang Web hoặc sử dụng dịch vụ tìm kiếm thông tin tại thư
viện, thậm chí bao gồm đánh giá liên quan, đánh giá người tham gia
và tương tác với bạn bè trong các trang Web của các tổ chức bên ngoài.
Nghiên cứu HVTT bắt nguồn từ những nghiên cứu ban đầu về
hành vi người tiêu dùng. Đó là một ngành khoa học liên ngành và
mới nổi, được phát triển vào những năm 1960. Các nguồn thông tin
chính để nghiên cứu đến từ kinh tế học, tâm lý học, xã hội học, nhân
chủng học và trí tuệ nhân tạo. Đồng thời, các công cụ được sử dụng để
491
VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
nghiên cứu hành vi của người dùng đã phát triển và ngày nay cơ sở
dữ liệu được đưa vào nghiên cứu hành vi của người tiêu dùng. Dữ liệu
nghiên cứu hành vi người tiêu dùng chủ yếu đến từ thông tin nhật ký
người dùng, thông tin chủ thể người dùng và thông tin môi trường bên
ngoài. Trong quá trình phát triển, nhiều mô hình nghiên cứu về hành
vi người tiêu dùng đã được phát triển, đầu tiên là để phân tích và sau
đó là để dự đoán hành vi của người tiêu dùng. Kết quả là, khái niệm
“dữ liệu lớn” (big data) được phát triển và bằng cách áp dụng nó hiện
nay, các công ty đang cố gắng hiểu và dự đoán hành vi của người tiêu
dùng của họ.
Cùng với các nghiên cứu về hành vi của người tiêu dùng thì
nghiên cứu HVTT trong môi trường thư viện được bắt đầu từ rất sớm
với những công trình nghiên cứu về “tìm kiếm và thu thập thông tin”
hoặc về “nhu cầu tin và sử dụng thông tin”. Dần dần thuật ngữ nghiên
cứu việc “tìm tin” hay “hành vi tìm tin” được sử dụng để chỉ tất cả các
nghiên cứu về sự tương tác của con người với thông tin. Tuy nhiên, sau
đó một số nhà nghiên cứu nhận thấy rằng thuật ngữ “hành vi tìm tin”
chỉ đề cập những nỗ lực tìm kiếm thông tin và không bao gồm những
cách tương tác khác giữa con người với thông tin. Đến những năm
1990, thuật ngữ “hành vi thông tin” bắt đầu được sử dụng rộng rãi để
thay thế cho thuật ngữ “hành vi tìm tin” và trở thành thuật ngữ thông
dụng nhất hiện nay [7].
1.2. Dữ liệu lớn và mối quan hệ giữa phân tích hành vi thông tin của người dùng tin
với dữ liệu lớn
Theo định nghĩa Tổ chức Tư vấn công nghệ Gartner, “dữ liệu lớn”
(big data) là tài sản thông tin mà những thông tin này có khối lượng dữ
liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có công nghệ mới
để xử lý hiệu quả nhằm đưa ra được những quyết định hiệu quả, khám
phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hoá được quá trình
xử lý dữ liệu. Như vậy, ba khía cạnh quan trọng của dữ liệu lớn đó là:
- Khối lượng (volume): Dữ liệu có khối lượng lớn có thể lên đến
hàng ngàn tỉ Gigabyte hoặc thậm chí lớn hơn.
492
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
- Tốc độ xử lý (velocity): Dữ liệu đảm bảo xử lý các thao tác như
truy xuất, cập nhật, chỉnh sửa, chia sẻ, với tốc độ nhanh.
- Sự đa dạng (variety): Dữ liệu không cần tuân theo một cấu trúc
và có thể lưu trữ nhiều định dạng khác nhau như văn bản, hình ảnh,
Sự khác biệt của dữ liệu truyền thống với dữ liệu lớn thể hiện rõ
qua ba khía cạnh có thể được hình ảnh hoá như sau (xem hình 1):
Hình 1. Sự khác biệt giữa dữ liệu lớn và dữ liệu truyền thống
Có thể thấy dữ liệu lớn là thuật ngữ chỉ tập hợp các tập dữ liệu lớn
và phức tạp đến mức khó xử lý bằng các công cụ và kỹ thuật khai thác
dữ liệu thông thường. Gần đây, tầm quan trọng của việc phân tích dữ
liệu lớn đã thu hút sự chú ý của các nhà khoa học vì nó mang lại cho
các doanh nghiệp/tổ chức những thông tin hữu ích và cái nhìn sâu sắc
hơn về cả dữ liệu có cấu trúc và không có cấu trúc, có thể dẫn đến việc
ra quyết định sáng suốt hơn. Mục tiêu chung của phân tích dữ liệu lớn
là trích xuất thông tin hữu ích từ một tập dữ liệu khổng lồ và chuyển
nó thành một cấu trúc dễ hiểu để sử dụng thêm. Các quy trình chính
của dữ liệu lớn bao gồm thu thập, quản lý, lưu trữ, tìm kiếm, chia sẻ,
chuyển giao, phân tích và trực quan hóa.
493
VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
Trong bối cảnh kinh doanh, phân tích dữ liệu lớn là quá trình kiểm
tra các tập hợp “dữ liệu lớn” để phát hiện ra các mẫu ẩn, mối tương
quan chưa biết, xu hướng thị trường, sở thích của khách hàng và các
thông tin kinh doanh hữu ích khác. Trong môi trường thư viện, phân
tích HVTT của người dùng tin tại các thư viện thông qua dữ liệu lớn
đã và đang giúp các thư viện xây dựng chế độ xem thông tin người
dùng và tìm ra các quy tắc về HVTT của người dùng từ dữ liệu hành
vi lớn của người dùng tin. Nó giúp thư viện hiểu rõ hơn về sở thích
của người dùng tin, phát triển giá trị của người dùng và cuối cùng là
mang lại nhiều hiệu quả cao cho hoạt động cung cấp thông tin của thư
viện. Một ví dụ điển hình cho tính hiệu quả của việc phân tích HVTT
của người dùng tin trong môi trường dữ liệu lớn là thành công của
hệ thống bán lẻ Amazon. Lý do mà Amazon có thể giành được lợi thế
trong ngành sách là nó khai thác và phân tích rất sâu thông tin về hành
vi của người dùng. Phân tích HVTT của người dùng giúp Amazon tìm
hiểu thêm về sở thích của người dùng và cung cấp nhiều dịch vụ được
nhắm mục tiêu hơn. Chính điều này đã tạo nên sự tin tưởng của khách
hàng đối với các sản phẩm, dịch vụ mà Amazon cung cấp, dẫn đến sự
quay lại và trung thành của khách hàng gia tăng [4].
2. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN
TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
HVTT của người dùng tin đang thay đổi khi nhu cầu tin của người
dùng tin tại các thư viện ngày càng chuyên sâu và hướng đến sản phẩm
và dịch vụ thư viện có giá trị cao hơn. Phân tích HVTT của người dùng
tin tại các thư viện thông qua dữ liệu lớn giúp thư viện có thể hiểu rõ
hơn sở thích của người dùng thông qua việc theo dõi và tìm hiểu hành
vi của người dùng và sau đó họ có thể hình thành các giải pháp tương
ứng để phân phối tốc độ dòng chảy thông tin hợp lý hơn và cung cấp
nội dung phù hợp hơn. Hơn nữa, yêu cầu của người dùng tin đối với
chất lượng dịch vụ của thư viện ngày càng cao, vì vậy cần phải phân
tích đặc điểm của nhóm người dùng và các sở thích khác nhau của
người dùng tin. Do đó, việc phân tích và nghiên cứu HVTT trong môi
trường dữ liệu lớn tại các thư viện ngày càng trở nên quan trọng hơn.
494
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
2.1. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện
tự động điều chỉnh chế độ dịch vụ và hỗ trợ ra quyết định
Trong môi trường dữ liệu lớn, bằng cách phân tích dữ liệu lịch sử
về thói quen sử dụng thông tin của người dùng tin, sở thích, mối quan
hệ xã hội, nền tảng kỷ luật và thời gian hoạt động trực tuyến, thư
viện có thể khám phá được các sở thích tin, yêu cầu tin của người dùng
tin và mô tả các khía cạnh khác nhau của nhu cầu của người dùng tin,
từ đó thư viện có thể điều chỉnh và tối ưu hóa chế độ phục vụ thông tin
một cách linh hoạt và kịp thời. Đồng thời, dựa theo đặc điểm cá nhân,
lòng trung thành và nhu cầu cá nhân, thư viện có thể phân chia người
dùng tin thành các nhóm người dùng khác nhau, trên cơ sở đó có thể
đề xuất chính xác nội dung thông tin dựa trên HVTT của người dùng
mục tiêu. Hơn nữa, các thư viện thường triển khai một không gian ảo
cá nhân như “thư viện của tôi” (my library) để lưu trữ những thay đổi
động này của dữ liệu HVTT của người dùng tin, nó có thể cung cấp cơ
sở ra quyết định cho mô hình dịch vụ thông tin của thư viện. Ngoài
ra, đối với việc sử dụng và biến động đột ngột của các tài nguyên khác
nhau (tài nguyên phần cứng và phần mềm, tài nguyên kỹ thuật số, tài
nguyên dịch vụ và tài nguyên tri thức,) chẳng hạn như các cuộc tấn
công mạng, vi rút, lọc rác và các rào cản yêu cầu dịch vụ thông tin,
với kết quả phân tích HVTT của người dùng thông qua dữ liệu lớn, thư
viện có thể đưa ra các chiến lược đối phó hợp lý mà không bị chậm trễ.
2.2. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện
tránh sự gián đoạn của người dùng và gia tăng lợi thế cạnh tranh
Trong môi trường dữ liệu lớn thường lưu trữ lại các dấu vết HVTT
của người dùng vô cùng đa dạng. Việc phân tích các dấu vết HVTT này
từ nguồn dữ liệu lớn về thói quen tìm kiếm, sử dụng, khai thác, chia sẻ
thông tin, giúp các thư viện có thể dự đoán được tại từng nhóm đối
tượng người dùng tin khác nhau, sản phẩm, dịch vụ thư viện nào sẽ
có nhu cầu cao trong thời gian tới, chuẩn bị thông tin, tài liệu ngay từ
khi người dùng còn chưa có ý định sử dụng và tạo thế chủ động cho
mình trong các chiến dịch cạnh tranh với các tổ chức cung cấp thông
tin bên ngoài.
495
VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
Hiện nay thư viện đang đối mặt với một loạt các vấn đề lớn như:
câu hỏi về giá trị thông tin, chất lượng dịch vụ thư viện, các rào cản kỹ
thuật và nhân viên không thích ứng được với những thách thức trong
thời đại chuyển đổi số. Điều này làm ảnh hưởng nghiêm trọng đến
sự phát triển của thư viện, dần dần làm suy yếu giá trị tồn tại của thư
viện, khiến người sử dụng mất dần đi niềm tin vào các giá trị thông
tin, tri thức mà thư viện cung cấp [5]. Chính vì vậy, trong thời đại dữ
liệu lớn, thư viện cần tập trung phân tích và khai thác dữ liệu người
dùng, nắm vững thời gian thực về phân phối thông tin tới người dùng,
ý định của người dùng, nhu cầu kinh doanh, khả năng đáp ứng thông
tin và chất lượng dịch vụ thông tin, Hơn nữa, thư viện nên tận dụng
công nghệ dữ liệu lớn để phân tích tổn thất và giá trị của người dùng,
tìm ra nguyên nhân thực sự của việc mất người dùng tin và đưa ra các
biện pháp khắc phục khả thi, tránh mất đi sự tin cậy và trung thành
người dùng trong quá trình chuyển giao các giá trị thông tin, tri thức
của thư viện.
2.3. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện
xác định danh tính và giám sát hành vi của người dùng theo thời gian thực
Giám sát HVTT của người dùng tin là một loại giám sát đối với
hành vi truy cập nguồn, duyệt, truy cập trở lại và sử dụng các trang
Web khác của người dùng, để có được các dữ liệu cơ bản khác nhau về
lưu lượng truy cập trang Web. Sau khi phân tích hành vi của cá nhân
người dùng, thư viện có thể xác định chính xác tính toàn vẹn và bảo
mật của hành vi đọc của độc giả, đồng thời phát hiện kịp thời hành vi
lừa dối, phá hoại và tấn công của người dùng bất hợp pháp trong quá
trình đọc, đảm bảo an toàn cho tài nguyên cơ sở hạ tầng của thư viện,
hệ thống dịch vụ và quy trình dịch vụ [6]. Ví dụ, thông qua dữ liệu lớn,
thư viện phân tích hành vi trực tuyến hàng ngày của người dùng, từ
đó có thể xác định và theo dõi lưu lượng truy cập bất thường trong thời
gian thực. Sau đó, mô hình người dùng bình thường được tổng hợp,
và các cuộc tấn công nguy hiểm, truy cập bất thường và hành vi tải
xuống bất hợp pháp được lọc hoặc chặn. Ngoài ra, thư viện có thể theo
dõi hành vi của người dùng theo thời gian thực thông qua dữ liệu lớn,
496
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
đồng thời khám phá và theo dõi các mối quan tâm của người dùng tin
từ đó cung cấp giới thiệu về các chủ đề liên quan mới nhất và các dòng
thông tin cập nhật cho người dùng, giúp họ có được hướng nghiên cứu
mới nhất và công nghệ tiên tiến nhất của các ngành liên quan một cách
nhanh chóng và hiệu quả (xem hình 2)[9].
Hình 2: Cải thiện trải nghiệm của người tiêu dùng
(Cá nhân hóa thời gian thực sử dụng dữ liệu lớn)
Ngoài ra, bằng cách cung cấp dữ liệu thời gian thực, dữ liệu lớn có
thể được sử dụng để cải thiện thời gian phản hồi của người dùng tin
cuối cùng và sẽ làm tăng sự hài lòng của khách hàng, giành được lòng
trung thành của khách hàng và nhận được mức độ quay lại của người
dùng tin cao hơn.
2.4. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện
xây dựng kế hoạch tiếp thị thông tin hiệu quả
Hiện nay, yếu tố quan trọng nhất để thu hút người dùng tin tìm
đến các Website và dịch vụ thông tin của thư viện là thư phải thường
xuyên có những nguồn tài nguyên thông tin mới, đa dạng và phù hợp
với nhu cầu sử dụng của người dùng. Bên cạnh đó, thư viện cũng phải
luôn xây dựng những kế hoạch truyền thông cho các sản phẩm dịch
vụ thông tin thư viện của mình để người dùng tin biết đến và sử dụng.
Thông thường, người dùng tin thích những nguồn tin đáng tin cậy và
dễ dàng truy cập sử dụng một cách miễn phí. Vì vậy, thư viện sẽ phân
tích HVTT của người dùng tin thông qua nguồn dữ liệu lớn để có thể
497
VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
phân tích, so sánh các số liệu trong quá khứ, so sánh với các trang cung
cấp thông tin bên ngoài để đưa đến cho người dùng sự trải nghiệm
tuyệt vời ngay từ lần đầu. Trên cơ sở đó, thư viện có thể xây dựng các
chính sách ưu đãi, lên kế hoạch quảng cáo hiệu quả với từng nhóm đối
tượng người dùng. Đây chính là yếu tố quan trọng quyết định tới sự
trung thành của người sử dụng các sản phẩm và dịch vụ thư viện trong
bối cảnh tràn ngập các nguồn tin trong xã hội thông tin hiện nay.
Với những vai trò quan trọng như trên, việc phân tích HVTT
của người dùng tin trong môi trường dữ liệu lớn tại các thư viện cần
được xây dựng thành các quy trình, ứng dụng các phương pháp,
công nghệ giúp thư viện nắm bắt, trích xuất những kiến thức, thông
tin hữu ích tiềm ẩn trong nguồn dữ liệu về HVTT. Mục đích chính
của phân tích HVTT là tạo ra cái nhìn chi tiết và chính xác về người
dùng tin, từ đó thư viện có thể đề xuất ra các sản phẩm, dịch vụ
thông tin phù hợp, các quyết định chính xác về nội dung thông tin,
các chiến lược tiếp thị hiệu quả để thu hút người dùng tin và “giữ
chân” họ lâu dài trước sự cạnh tranh của các tổ chức cung cấp thông
tin bên ngoài thị trường.
3. ĐỀ XUẤT XÂY DỰNG KẾ HOẠCH PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI
DÙNG TIN TẠI CÁC THƯ VIỆN Ở VIỆT NAM
Phân tích HVTT của người dùng tin là tâm điểm của cuộc cách
mạng dữ liệu lớn. Xây dựng kế hoạch phân tích HVTT của người dùng
tin tại các thư viện cần được tiến hành qua các quy trình sau:
(1) Quy trình thu thập và lưu trữ HVTT của người dùng tin trong
môi trường dữ liệu lớn.
(2) Quy trình phân tích, trích xuất HVTT của người dùng tin từ dữ
liệu lớn tiến tới phân khúc người dùng tin.
(3) Quy trình xây dựng chiến dịch marketing và sản phẩm mục
tiêu hướng tới từng đối tượng người dùng tin thông qua phân tích
HVTT trong môi trường dữ liệu lớn.
Có thể hiểu cụ thể các quy trình đó như sau:
498
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
3.1. Quy trình thu thập và lưu trữ HVTT của người dùng tin
Trước khi phân tích HVTT của người dùng tin, trước tiên thư viện
phải thu thập tất cả dữ liệu do người dùng tạo ra trong quá trình sử
dụng thư viện và các dữ liệu liên quan khác có thể suy ra nhu cầu của
người dùng đối với thư viện. Mục đích chính là để dự đoán những gì
sẽ xảy ra trong tương lai hoặc nhu cầu tiềm năng của người dùng bằng
cách biết những gì người dùng đã làm trong quá khứ. Sau đó, dữ liệu
thu thập được phân loại hợp lý, định nghĩa hành vi và đối sánh nhân
tạo được sử dụng để xây dựng cơ sở dữ liệu lưu trữ dữ liệu HVTT
người dùng lớn với chức năng lưu trữ hàng loạt, quản lý và truy xuất
hiệu quả. Trong thời đại dữ liệu lớn, phạm vi thu thập dữ liệu HVTT
của người dùng tin thường là các gói dữ liệu mạng khổng lồ được tạo
bởi tất cả người dùng trong vùng phủ sóng của nền tảng, tệp nhật ký
được tạo bởi máy chủ, thông tin chính của người dùng và thông tin
môi trường bên ngoài. Thường có hai cách thu thập dữ liệu:
- Truy cập vào các tệp nhật ký máy chủ. Tệp nhật ký máy chủ thư viện
có thể ghi lại tất cả các yêu cầu được máy chủ Web thu nhận: địa chỉ IP
của khách hàng, thời gian đăng nhập, thời gian cư trú, trang truy cập,
loại trình duyệt của người dùng,
- Việc thu được nhận thức về hành vi của người dùng tin. Nhận thức
hành vi của người dùng liên quan đến sự tương tác giữa con người với
con người, con người và công nghệ tương tác với nhau trên nhiều khía
cạnh, những yếu tố này ảnh hưởng đến nhu cầu dịch vụ và nhận thức
hành vi của người dùng. Nó có thể được chia thành bốn cấp độ: nhận
thức về tư thế cơ thể cá nhân, hành động và hành vi cảm xúc khác; nhận
thức về hành vi của quỹ đạo trong một chiều thời gian và chiều không
gian nhất định để định vị chính xác không gian - thời gian; nhận thức
về hành vi học tập, nghiên cứu khoa học, công việc và cuộc sống trong
không gian vật chất và không gian ảo nhất định; nhận thức hành vi xã
hội của mạng kết h