Vai trò của việc phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn

Tóm tắt: Sự phát triển nhanh chóng của công nghệ dữ liệu lớn, trí tuệ nhân tạo và vạn vật kết nối đã đem đến nhiều thay đổi trong cách thức tiếp cận nguồn tin và phục vụ thông tin tại các thư viện. Tăng cường khả năng nhận biết nhu cầu tin của người dùng tin thông qua việc phân tích HVTT trong môi trường dữ liệu lớn là vô cùng quan trọng để cải tiến chất lượng phục vụ thông tin tại các thư viện. Vì vậy, bài viết giới thiệu định nghĩa về hành vi thông tin, giải thích sự cần thiết và vai trò của phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn. Trên cơ sở đó, bài viết đề xuất kế hoạch phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn tại các thư viện ở Việt Nam.

pdf15 trang | Chia sẻ: thanhle95 | Lượt xem: 49 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Vai trò của việc phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN Bùi Thị Thanh Diệu1* Tóm tắt: Sự phát triển nhanh chóng của công nghệ dữ liệu lớn, trí tuệ nhân tạo và vạn vật kết nối đã đem đến nhiều thay đổi trong cách thức tiếp cận nguồn tin và phục vụ thông tin tại các thư viện. Tăng cường khả năng nhận biết nhu cầu tin của người dùng tin thông qua việc phân tích HVTT trong môi trường dữ liệu lớn là vô cùng quan trọng để cải tiến chất lượng phục vụ thông tin tại các thư viện. Vì vậy, bài viết giới thiệu định nghĩa về hành vi thông tin, giải thích sự cần thiết và vai trò của phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn. Trên cơ sở đó, bài viết đề xuất kế hoạch phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn tại các thư viện ở Việt Nam. Từ khóa: Hành vi thông tin; Phân tích hành vi thông tin; Dữ liệu lớn; Người dùng tin; Nhu cầu tin; Thông tin – thư viện. MỞ ĐẦU Trong những năm gần đây, sự phát triển của công nghệ thông tin, sự kết nối của mạng viễn thông toàn cầu và công nghệ lưu trữ điện toán đám mây đã thúc đẩy nhanh quá trình sản xuất dữ liệu lớn dẫn tới khối lượng dữ liệu, đặc biệt là dữ liệu điện tử tại các thư viện không ngừng gia tăng. Theo đó, dữ liệu hành vi thông tin (HVTT) có cấu trúc và phi cấu trúc cũng tăng trưởng không ngừng khiến lý thuyết về HVTT và nghiên cứu phân tích HVTT trở nên đặc biệt quan trọng. Vì thế phân tích HVTT của người dùng tin thông qua dữ liệu lớn đang là ∗ Tiến sĩ, Trường Đại học Khánh Hòa. 490 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM bài toán đầy thách thức cho các thư viện trong bối cảnh xã hội thông tin. Thông qua việc phân tích những dữ liệu HVTT, thư viện có thể phân tích, khai thác sâu về nhu cầu, ý định và tâm lý của người dùng tiềm năng, đồng thời đưa ra những sản phẩm, dịch vụ thông tin dự kiến có giá trị, cung cấp “đúng” và “trúng” nhu cầu tin của người dùng tin. Rõ ràng phân tích HVTT trong môi trường dữ liệu lớn đóng một vai trò quan trọng, định hướng sự phát triển của các thư viện trong tương lai. Chính vì vậy, bài viết này xem xét vai trò của việc phân tích HVTT của người dùng tin trong môi trường dữ liệu lớn một cách hệ thống và đề xuất xây dựng kế hoạch chiến lược phân tích HVTT trong các thư viện ở Việt Nam. 1. HIỂU VỀ PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN CỦA THỜI ĐẠI CHUYỂN ĐỔI SỐ 1.1. Khái niệm "hành vi thông tin" "Hành vi thông tin" là thuật ngữ dùng để mô tả cách thức con người tương tác với thông tin, từ cách con người tìm kiếm, khai thác, chọn lọc, sử dụng, chia sẻ và tái tạo thông tin. HVTT là toàn bộ hành vi con người liên quan đến thông tin, bao gồm hành vi thụ động và vô ý như ngẫu nhiên gặp thông tin, cũng như hành vi có mục đích mà không liên quan đến tìm kiếm, như chủ động tránh thông tin [1]. Như vậy, HVTT là một thuật ngữ với nghĩa rộng bao trùm các khía cạnh khác nhau của hành vi con người liên quan đến thông tin. Có thể hiểu HVTT đề cập đến một loạt hoạt động của người dùng tin như: nhấp, tìm kiếm, duyệt, sao chép, lưu trữ, nhận xét, phản hồi, trong khi truy cập trang Web hoặc sử dụng dịch vụ tìm kiếm thông tin tại thư viện, thậm chí bao gồm đánh giá liên quan, đánh giá người tham gia và tương tác với bạn bè trong các trang Web của các tổ chức bên ngoài. Nghiên cứu HVTT bắt nguồn từ những nghiên cứu ban đầu về hành vi người tiêu dùng. Đó là một ngành khoa học liên ngành và mới nổi, được phát triển vào những năm 1960. Các nguồn thông tin chính để nghiên cứu đến từ kinh tế học, tâm lý học, xã hội học, nhân chủng học và trí tuệ nhân tạo. Đồng thời, các công cụ được sử dụng để 491 VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN nghiên cứu hành vi của người dùng đã phát triển và ngày nay cơ sở dữ liệu được đưa vào nghiên cứu hành vi của người tiêu dùng. Dữ liệu nghiên cứu hành vi người tiêu dùng chủ yếu đến từ thông tin nhật ký người dùng, thông tin chủ thể người dùng và thông tin môi trường bên ngoài. Trong quá trình phát triển, nhiều mô hình nghiên cứu về hành vi người tiêu dùng đã được phát triển, đầu tiên là để phân tích và sau đó là để dự đoán hành vi của người tiêu dùng. Kết quả là, khái niệm “dữ liệu lớn” (big data) được phát triển và bằng cách áp dụng nó hiện nay, các công ty đang cố gắng hiểu và dự đoán hành vi của người tiêu dùng của họ. Cùng với các nghiên cứu về hành vi của người tiêu dùng thì nghiên cứu HVTT trong môi trường thư viện được bắt đầu từ rất sớm với những công trình nghiên cứu về “tìm kiếm và thu thập thông tin” hoặc về “nhu cầu tin và sử dụng thông tin”. Dần dần thuật ngữ nghiên cứu việc “tìm tin” hay “hành vi tìm tin” được sử dụng để chỉ tất cả các nghiên cứu về sự tương tác của con người với thông tin. Tuy nhiên, sau đó một số nhà nghiên cứu nhận thấy rằng thuật ngữ “hành vi tìm tin” chỉ đề cập những nỗ lực tìm kiếm thông tin và không bao gồm những cách tương tác khác giữa con người với thông tin. Đến những năm 1990, thuật ngữ “hành vi thông tin” bắt đầu được sử dụng rộng rãi để thay thế cho thuật ngữ “hành vi tìm tin” và trở thành thuật ngữ thông dụng nhất hiện nay [7]. 1.2. Dữ liệu lớn và mối quan hệ giữa phân tích hành vi thông tin của người dùng tin với dữ liệu lớn Theo định nghĩa Tổ chức Tư vấn công nghệ Gartner, “dữ liệu lớn” (big data) là tài sản thông tin mà những thông tin này có khối lượng dữ liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có công nghệ mới để xử lý hiệu quả nhằm đưa ra được những quyết định hiệu quả, khám phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hoá được quá trình xử lý dữ liệu. Như vậy, ba khía cạnh quan trọng của dữ liệu lớn đó là: - Khối lượng (volume): Dữ liệu có khối lượng lớn có thể lên đến hàng ngàn tỉ Gigabyte hoặc thậm chí lớn hơn. 492 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM - Tốc độ xử lý (velocity): Dữ liệu đảm bảo xử lý các thao tác như truy xuất, cập nhật, chỉnh sửa, chia sẻ, với tốc độ nhanh. - Sự đa dạng (variety): Dữ liệu không cần tuân theo một cấu trúc và có thể lưu trữ nhiều định dạng khác nhau như văn bản, hình ảnh, Sự khác biệt của dữ liệu truyền thống với dữ liệu lớn thể hiện rõ qua ba khía cạnh có thể được hình ảnh hoá như sau (xem hình 1): Hình 1. Sự khác biệt giữa dữ liệu lớn và dữ liệu truyền thống Có thể thấy dữ liệu lớn là thuật ngữ chỉ tập hợp các tập dữ liệu lớn và phức tạp đến mức khó xử lý bằng các công cụ và kỹ thuật khai thác dữ liệu thông thường. Gần đây, tầm quan trọng của việc phân tích dữ liệu lớn đã thu hút sự chú ý của các nhà khoa học vì nó mang lại cho các doanh nghiệp/tổ chức những thông tin hữu ích và cái nhìn sâu sắc hơn về cả dữ liệu có cấu trúc và không có cấu trúc, có thể dẫn đến việc ra quyết định sáng suốt hơn. Mục tiêu chung của phân tích dữ liệu lớn là trích xuất thông tin hữu ích từ một tập dữ liệu khổng lồ và chuyển nó thành một cấu trúc dễ hiểu để sử dụng thêm. Các quy trình chính của dữ liệu lớn bao gồm thu thập, quản lý, lưu trữ, tìm kiếm, chia sẻ, chuyển giao, phân tích và trực quan hóa. 493 VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN Trong bối cảnh kinh doanh, phân tích dữ liệu lớn là quá trình kiểm tra các tập hợp “dữ liệu lớn” để phát hiện ra các mẫu ẩn, mối tương quan chưa biết, xu hướng thị trường, sở thích của khách hàng và các thông tin kinh doanh hữu ích khác. Trong môi trường thư viện, phân tích HVTT của người dùng tin tại các thư viện thông qua dữ liệu lớn đã và đang giúp các thư viện xây dựng chế độ xem thông tin người dùng và tìm ra các quy tắc về HVTT của người dùng từ dữ liệu hành vi lớn của người dùng tin. Nó giúp thư viện hiểu rõ hơn về sở thích của người dùng tin, phát triển giá trị của người dùng và cuối cùng là mang lại nhiều hiệu quả cao cho hoạt động cung cấp thông tin của thư viện. Một ví dụ điển hình cho tính hiệu quả của việc phân tích HVTT của người dùng tin trong môi trường dữ liệu lớn là thành công của hệ thống bán lẻ Amazon. Lý do mà Amazon có thể giành được lợi thế trong ngành sách là nó khai thác và phân tích rất sâu thông tin về hành vi của người dùng. Phân tích HVTT của người dùng giúp Amazon tìm hiểu thêm về sở thích của người dùng và cung cấp nhiều dịch vụ được nhắm mục tiêu hơn. Chính điều này đã tạo nên sự tin tưởng của khách hàng đối với các sản phẩm, dịch vụ mà Amazon cung cấp, dẫn đến sự quay lại và trung thành của khách hàng gia tăng [4]. 2. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN HVTT của người dùng tin đang thay đổi khi nhu cầu tin của người dùng tin tại các thư viện ngày càng chuyên sâu và hướng đến sản phẩm và dịch vụ thư viện có giá trị cao hơn. Phân tích HVTT của người dùng tin tại các thư viện thông qua dữ liệu lớn giúp thư viện có thể hiểu rõ hơn sở thích của người dùng thông qua việc theo dõi và tìm hiểu hành vi của người dùng và sau đó họ có thể hình thành các giải pháp tương ứng để phân phối tốc độ dòng chảy thông tin hợp lý hơn và cung cấp nội dung phù hợp hơn. Hơn nữa, yêu cầu của người dùng tin đối với chất lượng dịch vụ của thư viện ngày càng cao, vì vậy cần phải phân tích đặc điểm của nhóm người dùng và các sở thích khác nhau của người dùng tin. Do đó, việc phân tích và nghiên cứu HVTT trong môi trường dữ liệu lớn tại các thư viện ngày càng trở nên quan trọng hơn. 494 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 2.1. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện tự động điều chỉnh chế độ dịch vụ và hỗ trợ ra quyết định Trong môi trường dữ liệu lớn, bằng cách phân tích dữ liệu lịch sử về thói quen sử dụng thông tin của người dùng tin, sở thích, mối quan hệ xã hội, nền tảng kỷ luật và thời gian hoạt động trực tuyến, thư viện có thể khám phá được các sở thích tin, yêu cầu tin của người dùng tin và mô tả các khía cạnh khác nhau của nhu cầu của người dùng tin, từ đó thư viện có thể điều chỉnh và tối ưu hóa chế độ phục vụ thông tin một cách linh hoạt và kịp thời. Đồng thời, dựa theo đặc điểm cá nhân, lòng trung thành và nhu cầu cá nhân, thư viện có thể phân chia người dùng tin thành các nhóm người dùng khác nhau, trên cơ sở đó có thể đề xuất chính xác nội dung thông tin dựa trên HVTT của người dùng mục tiêu. Hơn nữa, các thư viện thường triển khai một không gian ảo cá nhân như “thư viện của tôi” (my library) để lưu trữ những thay đổi động này của dữ liệu HVTT của người dùng tin, nó có thể cung cấp cơ sở ra quyết định cho mô hình dịch vụ thông tin của thư viện. Ngoài ra, đối với việc sử dụng và biến động đột ngột của các tài nguyên khác nhau (tài nguyên phần cứng và phần mềm, tài nguyên kỹ thuật số, tài nguyên dịch vụ và tài nguyên tri thức,) chẳng hạn như các cuộc tấn công mạng, vi rút, lọc rác và các rào cản yêu cầu dịch vụ thông tin, với kết quả phân tích HVTT của người dùng thông qua dữ liệu lớn, thư viện có thể đưa ra các chiến lược đối phó hợp lý mà không bị chậm trễ. 2.2. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện tránh sự gián đoạn của người dùng và gia tăng lợi thế cạnh tranh Trong môi trường dữ liệu lớn thường lưu trữ lại các dấu vết HVTT của người dùng vô cùng đa dạng. Việc phân tích các dấu vết HVTT này từ nguồn dữ liệu lớn về thói quen tìm kiếm, sử dụng, khai thác, chia sẻ thông tin, giúp các thư viện có thể dự đoán được tại từng nhóm đối tượng người dùng tin khác nhau, sản phẩm, dịch vụ thư viện nào sẽ có nhu cầu cao trong thời gian tới, chuẩn bị thông tin, tài liệu ngay từ khi người dùng còn chưa có ý định sử dụng và tạo thế chủ động cho mình trong các chiến dịch cạnh tranh với các tổ chức cung cấp thông tin bên ngoài. 495 VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN Hiện nay thư viện đang đối mặt với một loạt các vấn đề lớn như: câu hỏi về giá trị thông tin, chất lượng dịch vụ thư viện, các rào cản kỹ thuật và nhân viên không thích ứng được với những thách thức trong thời đại chuyển đổi số. Điều này làm ảnh hưởng nghiêm trọng đến sự phát triển của thư viện, dần dần làm suy yếu giá trị tồn tại của thư viện, khiến người sử dụng mất dần đi niềm tin vào các giá trị thông tin, tri thức mà thư viện cung cấp [5]. Chính vì vậy, trong thời đại dữ liệu lớn, thư viện cần tập trung phân tích và khai thác dữ liệu người dùng, nắm vững thời gian thực về phân phối thông tin tới người dùng, ý định của người dùng, nhu cầu kinh doanh, khả năng đáp ứng thông tin và chất lượng dịch vụ thông tin, Hơn nữa, thư viện nên tận dụng công nghệ dữ liệu lớn để phân tích tổn thất và giá trị của người dùng, tìm ra nguyên nhân thực sự của việc mất người dùng tin và đưa ra các biện pháp khắc phục khả thi, tránh mất đi sự tin cậy và trung thành người dùng trong quá trình chuyển giao các giá trị thông tin, tri thức của thư viện. 2.3. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện xác định danh tính và giám sát hành vi của người dùng theo thời gian thực Giám sát HVTT của người dùng tin là một loại giám sát đối với hành vi truy cập nguồn, duyệt, truy cập trở lại và sử dụng các trang Web khác của người dùng, để có được các dữ liệu cơ bản khác nhau về lưu lượng truy cập trang Web. Sau khi phân tích hành vi của cá nhân người dùng, thư viện có thể xác định chính xác tính toàn vẹn và bảo mật của hành vi đọc của độc giả, đồng thời phát hiện kịp thời hành vi lừa dối, phá hoại và tấn công của người dùng bất hợp pháp trong quá trình đọc, đảm bảo an toàn cho tài nguyên cơ sở hạ tầng của thư viện, hệ thống dịch vụ và quy trình dịch vụ [6]. Ví dụ, thông qua dữ liệu lớn, thư viện phân tích hành vi trực tuyến hàng ngày của người dùng, từ đó có thể xác định và theo dõi lưu lượng truy cập bất thường trong thời gian thực. Sau đó, mô hình người dùng bình thường được tổng hợp, và các cuộc tấn công nguy hiểm, truy cập bất thường và hành vi tải xuống bất hợp pháp được lọc hoặc chặn. Ngoài ra, thư viện có thể theo dõi hành vi của người dùng theo thời gian thực thông qua dữ liệu lớn, 496 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM đồng thời khám phá và theo dõi các mối quan tâm của người dùng tin từ đó cung cấp giới thiệu về các chủ đề liên quan mới nhất và các dòng thông tin cập nhật cho người dùng, giúp họ có được hướng nghiên cứu mới nhất và công nghệ tiên tiến nhất của các ngành liên quan một cách nhanh chóng và hiệu quả (xem hình 2)[9]. Hình 2: Cải thiện trải nghiệm của người tiêu dùng (Cá nhân hóa thời gian thực sử dụng dữ liệu lớn) Ngoài ra, bằng cách cung cấp dữ liệu thời gian thực, dữ liệu lớn có thể được sử dụng để cải thiện thời gian phản hồi của người dùng tin cuối cùng và sẽ làm tăng sự hài lòng của khách hàng, giành được lòng trung thành của khách hàng và nhận được mức độ quay lại của người dùng tin cao hơn. 2.4. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện xây dựng kế hoạch tiếp thị thông tin hiệu quả Hiện nay, yếu tố quan trọng nhất để thu hút người dùng tin tìm đến các Website và dịch vụ thông tin của thư viện là thư phải thường xuyên có những nguồn tài nguyên thông tin mới, đa dạng và phù hợp với nhu cầu sử dụng của người dùng. Bên cạnh đó, thư viện cũng phải luôn xây dựng những kế hoạch truyền thông cho các sản phẩm dịch vụ thông tin thư viện của mình để người dùng tin biết đến và sử dụng. Thông thường, người dùng tin thích những nguồn tin đáng tin cậy và dễ dàng truy cập sử dụng một cách miễn phí. Vì vậy, thư viện sẽ phân tích HVTT của người dùng tin thông qua nguồn dữ liệu lớn để có thể 497 VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN phân tích, so sánh các số liệu trong quá khứ, so sánh với các trang cung cấp thông tin bên ngoài để đưa đến cho người dùng sự trải nghiệm tuyệt vời ngay từ lần đầu. Trên cơ sở đó, thư viện có thể xây dựng các chính sách ưu đãi, lên kế hoạch quảng cáo hiệu quả với từng nhóm đối tượng người dùng. Đây chính là yếu tố quan trọng quyết định tới sự trung thành của người sử dụng các sản phẩm và dịch vụ thư viện trong bối cảnh tràn ngập các nguồn tin trong xã hội thông tin hiện nay. Với những vai trò quan trọng như trên, việc phân tích HVTT của người dùng tin trong môi trường dữ liệu lớn tại các thư viện cần được xây dựng thành các quy trình, ứng dụng các phương pháp, công nghệ giúp thư viện nắm bắt, trích xuất những kiến thức, thông tin hữu ích tiềm ẩn trong nguồn dữ liệu về HVTT. Mục đích chính của phân tích HVTT là tạo ra cái nhìn chi tiết và chính xác về người dùng tin, từ đó thư viện có thể đề xuất ra các sản phẩm, dịch vụ thông tin phù hợp, các quyết định chính xác về nội dung thông tin, các chiến lược tiếp thị hiệu quả để thu hút người dùng tin và “giữ chân” họ lâu dài trước sự cạnh tranh của các tổ chức cung cấp thông tin bên ngoài thị trường. 3. ĐỀ XUẤT XÂY DỰNG KẾ HOẠCH PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TẠI CÁC THƯ VIỆN Ở VIỆT NAM Phân tích HVTT của người dùng tin là tâm điểm của cuộc cách mạng dữ liệu lớn. Xây dựng kế hoạch phân tích HVTT của người dùng tin tại các thư viện cần được tiến hành qua các quy trình sau: (1) Quy trình thu thập và lưu trữ HVTT của người dùng tin trong môi trường dữ liệu lớn. (2) Quy trình phân tích, trích xuất HVTT của người dùng tin từ dữ liệu lớn tiến tới phân khúc người dùng tin. (3) Quy trình xây dựng chiến dịch marketing và sản phẩm mục tiêu hướng tới từng đối tượng người dùng tin thông qua phân tích HVTT trong môi trường dữ liệu lớn. Có thể hiểu cụ thể các quy trình đó như sau: 498 PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 3.1. Quy trình thu thập và lưu trữ HVTT của người dùng tin Trước khi phân tích HVTT của người dùng tin, trước tiên thư viện phải thu thập tất cả dữ liệu do người dùng tạo ra trong quá trình sử dụng thư viện và các dữ liệu liên quan khác có thể suy ra nhu cầu của người dùng đối với thư viện. Mục đích chính là để dự đoán những gì sẽ xảy ra trong tương lai hoặc nhu cầu tiềm năng của người dùng bằng cách biết những gì người dùng đã làm trong quá khứ. Sau đó, dữ liệu thu thập được phân loại hợp lý, định nghĩa hành vi và đối sánh nhân tạo được sử dụng để xây dựng cơ sở dữ liệu lưu trữ dữ liệu HVTT người dùng lớn với chức năng lưu trữ hàng loạt, quản lý và truy xuất hiệu quả. Trong thời đại dữ liệu lớn, phạm vi thu thập dữ liệu HVTT của người dùng tin thường là các gói dữ liệu mạng khổng lồ được tạo bởi tất cả người dùng trong vùng phủ sóng của nền tảng, tệp nhật ký được tạo bởi máy chủ, thông tin chính của người dùng và thông tin môi trường bên ngoài. Thường có hai cách thu thập dữ liệu: - Truy cập vào các tệp nhật ký máy chủ. Tệp nhật ký máy chủ thư viện có thể ghi lại tất cả các yêu cầu được máy chủ Web thu nhận: địa chỉ IP của khách hàng, thời gian đăng nhập, thời gian cư trú, trang truy cập, loại trình duyệt của người dùng, - Việc thu được nhận thức về hành vi của người dùng tin. Nhận thức hành vi của người dùng liên quan đến sự tương tác giữa con người với con người, con người và công nghệ tương tác với nhau trên nhiều khía cạnh, những yếu tố này ảnh hưởng đến nhu cầu dịch vụ và nhận thức hành vi của người dùng. Nó có thể được chia thành bốn cấp độ: nhận thức về tư thế cơ thể cá nhân, hành động và hành vi cảm xúc khác; nhận thức về hành vi của quỹ đạo trong một chiều thời gian và chiều không gian nhất định để định vị chính xác không gian - thời gian; nhận thức về hành vi học tập, nghiên cứu khoa học, công việc và cuộc sống trong không gian vật chất và không gian ảo nhất định; nhận thức hành vi xã hội của mạng kết h