Khóa luận Đánh giá năng lực nghiên cứu của cá nhân, tổ chức dựa trên phân tích, tính toán các chỉ số khoa học

Khoa học hiện nay đang phát triển rất mạnh, cùng với đó là số lượng bài báo khoa học ngày càng tăng lên. Việc quản lý và khai thác các bài báo khoa học này một cách hiệu quả là một nhu cầu tất yếu cho sự phát triển bền vững của khoa học với tinh thần “đứng trên vai những người khổng lồ”. Hiện nay trên thế giới đã có nhiều hệ thống được xây dựng để thực hiện việc này, chức năng chính của chúng là lưu trữ và tìm kiếm các bài báo phù hợp với các tiêu chí nhất định. Ở đề tài này chúng tôi khảo sát các hệ thống có sẵn này ở khía cạnh nội dung, tính năng, cùng với các giải thuật tìm kiếm, xếp hạng của chúng, sau đó xây dựng mô hình ứng dụng các chỉ số xếp hạng trong việc đánh giá các cá nhân, tổ chức và bước đầu tiến hành thử nghiệm trên các cá nhân, tổ chức làm việc trong lĩnh vực công nghệ thông tin ở Tp. Hồ Chí Minh. Từ đó đề xuất xây dựng một hệ thống thư viện điện tử thực tế có các đặc trưng cần thiết để ứng dụng các chỉ số này phục vụ người dùng ở Việt Nam.

pdf167 trang | Chia sẻ: nhungnt | Lượt xem: 2208 | Lượt tải: 4download
Bạn đang xem trước 20 trang tài liệu Khóa luận Đánh giá năng lực nghiên cứu của cá nhân, tổ chức dựa trên phân tích, tính toán các chỉ số khoa học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA HỆ THỐNG THÔNG TIN ------------ KHOÁ LUẬN TỐT NGHIỆP Đề tài: ĐÁNH GIÁ NĂNG LỰC NGHIÊN CỨU CỦA CÁ NHÂN, TỔ CHỨC DỰA TRÊN PHÂN TÍCH, TÍNH TOÁN CÁC CHỈ SỐ KHOA HỌC Giảng viên hướng dẫn: TH.S HUỲNH NGỌC TÍN Cơ quan công tác: ĐẠI HỌC CÔNG NGHỆ THÔNG TIN T.S LƯƠNG PHÚC HIỆP Cơ quan công tác: ĐẠI HỌC ARKANSAS, HOA KỲ Sinh viên thực hiện: TRẦN HƯNG NGHIỆP MSSV: 07520245 Lớp: HTTT02 Khóa: 2007 – 2012 Tp. HCM, tháng 12 năm 2011 ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA HỆ THỐNG THÔNG TIN ------------ KHOÁ LUẬN TỐT NGHIỆP Đề tài: ĐÁNH GIÁ NĂNG LỰC NGHIÊN CỨU CỦA CÁ NHÂN, TỔ CHỨC DỰA TRÊN PHÂN TÍCH, TÍNH TOÁN CÁC CHỈ SỐ KHOA HỌC Giảng viên hướng dẫn: TH.S HUỲNH NGỌC TÍN Cơ quan công tác: ĐẠI HỌC CÔNG NGHỆ THÔNG TIN T.S LƯƠNG PHÚC HIỆP Cơ quan công tác: ĐẠI HỌC ARKANSAS, HOA KỲ Sinh viên thực hiện: TRẦN HƯNG NGHIỆP MSSV: 07520245 Lớp: HTTT02 Khóa: 2007 – 2012 Tp. HCM, tháng 12 năm 2011 MỞ ĐẦU Khoa học hiện nay đang phát triển rất mạnh, cùng với đó là số lượng bài báo khoa học ngày càng tăng lên. Việc quản lý và khai thác các bài báo khoa học này một cách hiệu quả là một nhu cầu tất yếu cho sự phát triển bền vững của khoa học với tinh thần “đứng trên vai những người khổng lồ”. Hiện nay trên thế giới đã có nhiều hệ thống được xây dựng để thực hiện việc này, chức năng chính của chúng là lưu trữ và tìm kiếm các bài báo phù hợp với các tiêu chí nhất định. Ở đề tài này chúng tôi khảo sát các hệ thống có sẵn này ở khía cạnh nội dung, tính năng, cùng với các giải thuật tìm kiếm, xếp hạng của chúng, sau đó xây dựng mô hình ứng dụng các chỉ số xếp hạng trong việc đánh giá các cá nhân, tổ chức và bước đầu tiến hành thử nghiệm trên các cá nhân, tổ chức làm việc trong lĩnh vực công nghệ thông tin ở Tp. Hồ Chí Minh. Từ đó đề xuất xây dựng một hệ thống thư viện điện tử thực tế có các đặc trưng cần thiết để ứng dụng các chỉ số này phục vụ người dùng ở Việt Nam. LỜI CẢM ƠN Lời đầu tiên em xin gửi lòng biết ơn chân thành đến thầy Huỳnh Ngọc Tín và thầy đồng hướng dẫn Lương Phúc Hiệp. Hai thầy đã tận tình hướng dẫn, góp ý, động viên em rất nhiều trong quá trình làm luận văn. Qua đó, em đã thật sự học hỏi được rất nhiều và trưởng thành hơn trong tư duy và nhận thức. Em xin gửi lời cảm ơn tất cả các thầy cô đã giảng dạy, truyền đạt kiến thức và những kinh nghiệm quý báu cho em suốt những năm học vừa qua. Em cảm ơn khoa Hệ thống Thông tin trường Đại học Công nghệ Thông tin đã tạo điều kiện cho em thực hiện đề tài này. Em cũng xin cảm ơn các bạn đã nhiệt tình giúp đỡ em trong suốt quá trình thực hiện đề tài này. Cuối cùng, em xin gửi lời cảm ơn đến gia đình đã tạo mọi điều kiện thuận lợi về vật chất và tinh thần, giúp em hoàn thành luận văn một cách tốt nhất. Mặc dù em đã cố gắng để hoàn thành tốt đề tài, nhưng chắc chắn không tránh khỏi những thiếu sót, em rất mong được sự tận tình chỉ bảo của quý thầy cô. Tp. Hồ Chí Minh, tháng 12 năm 2011 Sinh viên thực hiện Trần Hưng Nghiệp NHẬN XÉT (Của giảng viên hướng dẫn) ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... NHẬN XÉT (Của giảng viên phản biện) ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... NHẬN XÉT (Của hội đồng) ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... ........................................................................................................... MỤC LỤC MỞ ĐẦU ......................................................................................................i LỜI CẢM ƠN ............................................................................................... ii MỤC LỤC .................................................................................................... vi DANH MỤC CÁC BẢNG ............................................................................ix DANH MỤC CÁC BIỂU ĐỒ ......................................................................xi DANH MỤC CÁC HÌNH .......................................................................... xii DANH MỤC CÁC SƠ ĐỒ ......................................................................... xiv Chương 1: TỔNG QUAN VỀ ĐỀ TÀI ......................................................... 1 1.1 Đánh giá hiện trạng ............................................................................... 1 1.2 Phát biểu bài toán .................................................................................. 2 1.3 Mục tiêu đề tài ....................................................................................... 3 1.4 Cấu trúc báo cáo .................................................................................... 3 Chương 2: CÁC NGHIÊN CỨU VÀ ỨNG DỤNG LIÊN QUAN............... 4 2.1 Giới thiệu ................................................................................................ 4 2.2 Web crawler ........................................................................................... 4 2.3 Các phương pháp xếp hạng phổ biến .................................................. 5 2.3.1 Giới thiệu ......................................................................................... 5 2.3.2 PageRank ......................................................................................... 6 2.3.3 PopRank ........................................................................................ 13 2.4 Các chỉ số xếp hạng phổ biến ............................................................. 19 2.4.1 Giới thiệu ....................................................................................... 19 2.4.2 Các chỉ số phân tích tài liệu chuẩn (Standard bibliometric indicators) 19 2.4.3 H-type indexes ............................................................................... 22 2.4.4 A-type indexes ............................................................................... 29 2.5 Các hệ thống liên quan ........................................................................ 33 2.5.1 Giới thiệu ....................................................................................... 33 2.5.2 IEEEXplore ................................................................................... 33 2.5.3 Association for Computing Machinery (ACM) ............................ 36 2.5.4 SpringerLink .................................................................................. 40 2.5.5 Microsoft Academic Search (MAS) .............................................. 43 2.5.6 Google Scholar .............................................................................. 49 2.5.7 CiteSeerX ...................................................................................... 52 Chương 3: CÁCH TIẾP CẬN CỦA ĐỀ TÀI ............................................. 56 3.1 Mở đầu .................................................................................................. 56 3.2 Thảo luận về các chỉ số xếp hạng ....................................................... 56 3.3 Thảo luận về các phương pháp xếp hạng .......................................... 57 3.4 Phân tích cải tiến các hệ thống thư viện điện tử ............................... 58 3.5 Cách tiếp cận của đề tài ...................................................................... 60 Chương 4: HIỆN THỰC HỆ THỐNG ...................................................... 62 4.1 Mở đầu .................................................................................................. 62 4.2 Chương trình thu thập dữ liệu ........................................................... 62 4.2.1 Khảo sát hiện trạng ........................................................................ 62 4.2.2 Phân tích thiết kế ........................................................................... 63 4.2.3 Cài đặt ............................................................................................ 82 4.2.4 Kết quả........................................................................................... 86 4.3 Chương trình tính toán các chỉ số xếp hạng ..................................... 87 4.3.1 Khảo sát hiện trạng ........................................................................ 87 4.3.2 Phân tích thiết kế ........................................................................... 87 4.3.3 Cài đặt ............................................................................................ 96 4.3.4 Kết quả........................................................................................... 97 4.4 Hệ thống thư viện điện tử ................................................................. 102 4.4.1 Khảo sát hiện trạng ...................................................................... 102 4.4.2 Phân tích thiết kế ......................................................................... 102 4.4.3 Cài đặt .......................................................................................... 104 4.4.4 Kết quả......................................................................................... 107 Chương 5: THỰC NGHIỆM VÀ ĐÁNH GIÁ ......................................... 110 5.1 Mở đầu ................................................................................................ 110 5.2 Thu thập danh sách giảng viên ........................................................ 110 5.3 Chuẩn hóa dữ liệu giảng viên và nhập liệu ..................................... 113 5.4 Chương trình thu thập dữ liệu chỉ mục .......................................... 114 5.4.1 Khảo sát hiện trạng ...................................................................... 114 5.4.2 Phân tích thiết kế ......................................................................... 115 5.4.3 Cài đặt .......................................................................................... 122 5.4.4 Kết quả......................................................................................... 124 5.5 Kiểm tra dữ liệu ................................................................................. 125 5.6 Tính toán các chỉ số xếp hạng ........................................................... 127 5.6.1 Mở đầu ......................................................................................... 127 5.6.2 Phân tích thiết kế ......................................................................... 127 5.6.3 Cài đặt .......................................................................................... 131 5.7 Đánh giá kết quả ................................................................................ 131 5.7.1 Kết quả tính toán ......................................................................... 131 5.7.2 Nhận xét và đề xuất một số cải tiến ............................................ 143 Chương 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .............................. 146 6.1 Kết quả đạt được ............................................................................... 146 6.2 Hạn chế và hướng phát triển ............................................................ 146 6.2.1 Hạn chế ........................................................................................ 146 6.2.2 Hướng phát triển .......................................................................... 147 DANH MỤC TÀI LIỆU THAM KHẢO .................................................. 148 DANH MỤC CÁC BẢNG Bảng 2.1 – Thông tin chi tiết IEEEXplore. ..................................................... 34 Bảng 2.2 – Thông tin chi tiết ACM. ................................................................ 36 Bảng 2.3 – Thông tin chi tiết về SpringerLink. ............................................... 40 Bảng 2.4 – Thông tin chi tiết về MAS. ............................................................ 43 Bảng 2.5 – Thông tin chi tiết về Google Scholar. ........................................... 50 Bảng 2.6 – Thông tin chi tiết về CiteSeerX. .................................................... 53 Bảng 3.1 – So sánh các hệ thống thư viện điện tử. ......................................... 58 Bảng 4.1 – Các mẫu url được dùng trong crawler........................................... 66 Bảng 4.2 – Các mẫu dùng trong phân tích html để lấy dữ liệu. ...................... 67 Bảng 4.3 – Mã giả thuật giải của crawler cho trang MAS. ............................. 70 Bảng 4.4 – Mô tả các bảng trong cơ sở dữ liệu của crawler. .......................... 74 Bảng 4.5 – Kết quả thu thập dữ liệu đến ngày 27 tháng 01 năm 2012. .......... 86 Bảng 4.6 – Các chỉ số được cài đặt cho các loại đối tượng. ............................ 87 Bảng 4.7 – Mô tả chi tiết các bảng lưu dữ liệu tính toán các chỉ số. ............... 91 Bảng 4.8 – Dữ liệu mẫu 1 dùng để tính toán các chỉ số đánh giá. .................. 97 Bảng 4.9 – Dữ liệu mẫu 2 dùng để tính toán các chỉ số đánh giá. .................. 98 Bảng 4.10 – Cấu hình phần cứng 1 ................................................................. 98 Bảng 4.11 – Cấu hình phần cứng 2 ...................................................