TỔNG QUAN VỀ THƯ VIỆN SỐ DL
MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL
CHỈ MỤC TÀI LIỆU
TÌM KIẾM THÔNG TIN
CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐ
THỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE
131 trang |
Chia sẻ: tranhoai21 | Lượt xem: 1522 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng thư viện số - Chương 5: Các chuẩn sử dụng trong dl, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
*BÀI GIẢNG THƯ VIỆN SỐCHƯƠNG 5: CÁC CHUẨN SỬ DỤNG TRONG DL TS. ĐỖ QUANG VINHHÀ NỘI - 2013 *NỘI DUNGTỔNG QUAN VỀ THƯ VIỆN SỐ DLMÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DLCHỈ MỤC TÀI LIỆUTÌM KIẾM THÔNG TINCÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐTHỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE*CÁC CHUẨN SỬ DỤNG TRONG DL5.1. Chuẩn trình bày ASCII, Unicode, SGML, HTML, XML, GIF, JPG, TIF, PNPASCIIAmerican Standard Code for Information ExchangeTiêu chuẩn Việt Nam: TCVN 5712-1993Văn bản chỉ có ký tự, không có lệnh trình bày (plain text file). Văn bản bằng ký tự ASCII không có khả năng trình bày các công thức toán học và hoá học.Thường phải được nhập thủ công vào CSDL*Ưu điểm: + Tìm kiếm được theo toàn văn+ Tìm kiếm nhanh+ Dữ liệu có kích thước tệp nhỏ, dễ truyền trên mạngNhược điểm:+ Hình thức đơn giản+ Không bảo toàn được nguyên dạng của trang.+ Không hỗ trợ đa ngôn ngữ (255 ký tự)*UNICODE Dùng cho văn bảnTiêu chuẩn Việt Nam: TCVN 6909-2001Hỗ trợ đa ngôn ngữ: 16 triệu mã ký tựVẫn còn ít chương trình hỗ trợ UNICODE* NGÔN NGỮ ĐÁNH DẤUTài liệu sốNgày càng nhiềuChuẩn đa dạng:Chuẩn độc quyền: DOC của MS; PDF của AdobeChuẩn mở: SGMLChuẩn độc quyềnPhụ thuộc phần mềmPhụ thuộc sự phát triển của công tyĐòi hỏi bản quyền Sự phát triển tài liệu số dẫn đến nhu cầu về chuẩn mở*Sự phát triển của tài liệu số đã đặt ra yêu cầu mới: chuẩn dữ liệu không độc quyềnCó tính mởKhông phụ thuộc phần mềm, nền tảng máy tính (Platform independent) Ngôn ngữ đánh dấu (Markup Language)Sử dụng các cặp thẻ đánh dấu: bao gồm thẻ mở và thẻ đóng: và Hiện nay: SGML, HTML và XML*Ngôn ngữ đánh dấu tổng quát chuẩn SGML Standard Generalized Markup LanguageSGML là cách thức trình bày tài liệu số bằng các mã đánh dấuLà tiêu chuẩn ISO 8879 (Information processing--Text and office systems - Standard Generalized Markup Language)Là một chuẩn không độc quyền để soạn thảo tài liệu số có cấu trúcSử dụng các nhãn (thẻ) để đánh dấu và gán ý nghĩa cho dữ liệu. Thí dụ: Đây là nhan đề tài liệuCó thể tự phát triển khổ mẫu riêng, chỉ cần tuân thủ nguyên tắc.*Cấu trúc tài liệu SGML Gồm 3 phầnPhần 1: Phần thông báo (Statement)Phần 2: Định nghĩa phần tử tài liệuDTD - Document Type DefinitionThông báo mô hình logic của tài liệu (có các kiểu yếu tố nào, thẻ mô tả là gì,...)Phần 3: Nội dung tài liệuĐịnh nghĩa phần tử dữ liệu (DTD) DTD Document Type DefinitionDTD xác định các khối thông tin hợp lệ của một tài liệu SGMLDTD xác định cấu trúc của tài liệu thông qua một danh mục các yếu tố và thuộc tính* Ví dụ DTD ]> Tove Jani Reminder Don't forget me this weekend Nội dung của văn bảnTài liệu là NoteCó 4 yếu tố: to, from, heading, bodyNhững yếu tố này đều dạng dữ liệu Character (ký tự)*#PCDATACDATA: cho biết đây là dữ liệu dạng ký tự (character data), sử dụng trong ngôn ngữ đánh dấu SGML and XML.Dùng để phân biệt với dữ liệu không phải ký tự dùng cho các chức năng cấu trúc đặc thù*Ngôn ngữ SGML mạnh cho xây dựng tài liệu có cấu trúcPhức tạp, phát triển ứng dụng tốn kémPhải có trình duyệt riêng để đọcĐiều quan trọng để ứng dụng SGML là xây dựng DTDVí dụ về ứng dụng: TEI – Text Encoding Initiative*HTML HyperText Mark-up LanguageLà một ứng dụng của SGML dùng cho tài liệu WEBĐơn giản hoá SGMLThẻ HTML là một kiểu DTD nhưng được chấp nhận bởi cộng đồng sử dụng WebCác thẻ HTML được thống nhất toàn cầu (W3C – WWW Consortium)*Ưu nhược điểm của HTMLƯu điểmĐơn giảnCó định hướng đến trình bàyĐược đọc bằng những trình duyệt (Browser)Được các công ty hỗ trợ phát triển trình duyệt: Internet Explorer, Netscape Navigator, Mosaic,...Nhược điểmPhải chờ thông qua cho thẻ mớiSố thẻ hạn chế* Cấu trúc của tài liệu HTML Nhan đề trang Web Dữ liệu hiển thị ...... Dữ liệu không hiển thịDữ liệu hiển thịtrên màn hình*Thẻ trợ giúp mô tả tài liệu HTML Thẻ trợ giúp mô tả (còn gọi là thẻ siêu dữ liệu) nằm trong phần của tài liệuHai loại thẻ chính:........... Ví dụ: Thẻ HTML phải được quy định thống nhất trên toàn mạng*Ví dụ đánh dấu HTMLGiống lúa lai Trung Quốc và kỹ thuật gieo trồng......*Ngôn ngữ đánh dấu mở rộng XML XML eXtensible Markup LanguageLà một dạng của SGML và được World Wide Web Consortium (W3C) đề xuấtĐơn giản hơn SGMLLinh hoạt hơn HTMLHiện được coi là một dạng ngôn ngữ được coi là chủ đạo trong tạo lập các tài nguyên điện tử *Đặc điểm của XML XML là ngôn ngữ đánh dấu tương tự HTML Được thiết kế để chứa/trao đổi dữ liệu nhưng không để trình bày dữ liệu Các thẻ XML không được xác định trước. Người dùng tự xác định các thẻ của mìnhXML được thiết kế để tự mô tả (self-descriptive)Tổ chức 3WC gọi XML là: "một cú pháp thông dụng cho việc biểu thị cấu trúc trong dữ liệu" *Sự khác biệt giữa XML và HTMLXML không thay thế HTMLXML và HTML được thiết kế cho 2 mục đích khác nhau:XML dùng để chứa và chuyển tải dữ liệu. XML định hướng dữ liệuHTML được thiết kế để trình bày dữ liệuXML không xử lý thông tin; chỉ chứa các thẻ và dữ liệu. Phải có phần mềm để xử lý.XML là tệp văn bản không mã hóaNgười dùng tự quy định thẻ cho tài liệu (thí dụ and ). Không có thẻ XML mặc định*XML được sử dụng để tạo ra nhiều ngôn ngữ mới cho InternetXHTML: phiên bản mới nhất của HTML RDF and OWL for describing resources and ontology RDF = Resource Description Format OWL = Ontology Web Language Cấu trúc tài liệu XML Tương tự như SGMLGồm 3 phầnPhần 1: Phần thông báoPhần 2: Định nghĩa phần tử tài liệu DTD - Document Type Definition Thông báo mô hình logic của tài liệu (có các kiểu yếu tố nào, thẻ mô tả là gì,...)Phần 3: Nội dung tài liệu*Ví dụ về tài liệu XML Chào các bạn hoặc Tove Jani Reminder Don't forget me this weekend!*Định nghĩa phần tử dữ liệu XML DTD Mục tiêu của DTD là xác định cấu trúc của một tài liệu XMLThông báo các yếu tố hợp lệ trong tài liệu]>*Giải thích thí dụ XML DTD!DOCTYPE note:xác định yếu tố gốc của tài liệu là note.!ELEMENT noteXác định yếu tố Gốc có 4 thành phần "to,from,heading,body"!ELEMENT to: Xác định yếu tố to là dạng dữ liệu ký tự "#PCDATA".!ELEMENT from:Xác định yếu tố From là dạng dữ liệu ký tự "#PCDATA".!ELEMENT heading:Xác định yếu tố Heading là dạng dữ liệu ký tự "#PCDATA".!ELEMENT body:Xác định yếu tố body là dạng dữ liệu ký tự "#PCDATA".*Tại sao cần DTD Dùng để tự xác định các thành phần của tài liệu XML. Với DTD, những nhóm người sử dụng khác có thể hiểu và xử lý được tài liệu XML và trao đổi được DLDùng làm chuẩn để kiểm định tài liệu XML, kiểm định dữ liệuCác khối chính của XML Yếu tố: Elements Thuộc tính: Attributes Ký hiệu đặc biệt: Entities PCDATA CDATA*Ký hiệu đặc biệt - EntitiesMột số ký tự có nghĩa với XML được định nghĩa sẵn trong XMLThực thể Ký tự < & & " “ ' ’Tài liệu XML có cấu trúc hình cây ..... *Cú pháp XML Mọi yếu tố XML phải có thẻ đóng (Closing Tag)Thẻ XML phân biện chữ hoa-chữ thường (Case Sensitive)Thẻ khác với .Thẻ mở và thẻ đóng phải có cùng kiểu viết hoa/viết thườngYếu tố XML phải được lồng ghép chính xácTài liệu XML phải có một yếu tố gốc (Root Element)Tài liệu XML phải chứa 1 yếu tố làm cao nhất cho mọi yếu tố khácCác giá trị thuộc tính XML phải được đặt trong ngoặc képToveJani*Yếu tố và thuộc tính Sử dụng thuộc tính Anna SmithSử dụng yếu tố female Anna Smith*Thẩm định XML XML ValidationKhái niệm Định dạng đúng "Well formed"XML có cú pháp đúng được gọi là "Well Formed" XML.Khái niệm Hợp lệ "Valid XML"XML được thẩm định so với DTD là XML "Valid" (Hợp lệ)Định dạng đúng (Well Formed XML)Có cú pháp đúngCó yếu tố gốc (root element) Mọi yếu tố phải có thẻ đóngThẻ XML phân biệt chữ hoa/thườngYếu tố được lồng ghép chính xácGiá trị thuộc tính thẻ XML phải được đặt trong dấu ngoặc kép *MARC và XML MARC – là ứng dụng cụ thể của ISO 2709 (tiêu chuẩn trao đổi dữ liệu thư mục)Cụ thể hoá các nhãn trường (3 chữ số)XML – tiêu chuẩn ISO 8879 (SGML): – để sử dụng được phải phát triển các DTDKhông phải XML thay thế MARC mà một sơ đồ siêu dữ liệu nào đó sử dụng XML sẽ được chấp nhận dùng chung cho thư viện*Ví dụ về lược đồ XML đơn giản *Một số loại siêu dữ liệu ứng dụng với XML MARC với XML: MARCXML METS - Metadata Encoding and Transformation StandardsMODS – Metadata Object Description Schema Dublin Core Metadata ElementTEI – Text Encoding InitiativesEAD – Encoded Archival DescriptionOAI – Open Archive Initiative*Mô hình truy vấn dữ liệu có hỗ trợ XMLNSD truy vấnKết quả trả về cho NSD*Dữ liệu ẢnhTệp TIFFTệp JPEGTệp GIFTệp PNGTệp ảnh TIFF TIFF - Tagged Image File FormatPhần mở rộng: *.TIFLà tệp đồ hoạ do Công ty Aldus và Microsoft phát triển để lưu trữ ảnh. Được chương trình máy quét sử dụngMức độ nén thấp*Tệp ảnh GIF GIF: Graphic Interchange FormatPhần mở rộng tên tệp: *.GIF Mầu sắc có thể đạt đến 256 màu (8 bit)Chuẩn riêng, là sở hữu trí tuệ của Công ty CompuserveThường dùng cho biểu đồ, biểu tượng (icons)Tệp ảnh PNG Portable Network GraphicPhần mở rộng: *.PNGlà định đạng được phát triển năm 1995 và là sở hữu của Công ty CompuservePNG được dự kiến sử dụng thay cho định dạng GIF.*Tệp ảnh JPEG Joint Photographic Experts GroupPhần mở rộng tên tệp: *.JPEG, *.JPGMầu sắc đẹp, đạt đến 24 bit, 16 triệu mầuChuẩn mở*5.2. Chuẩn biên mục tự động 5.2.1. Khổ mẫu MARCUNIMARCCCFMARC XML 5.2.2 Siêu dữ liệu Metadata TEI – Text Encoding InitiativeEAD – Encoded Archival DescriptionOAI – Open Archive InitiativeDublin Core*5.2.1. Khổ mẫu MARC, UNIMARC, CCF ISO 2709 chỉ đưa ra cấu trúc tổng quátKhông quy định cụ thể nhãn của trường (có thể là ký tự, là số)Không quy định mã trường con.Các nước và một số tổ chức quốc tế áp dụng ISO 2709 để đưa ra những khổ mẫu chuẩnMột số khổ mẫu nổi tiếng:USMARC MARC21UNIMARCCCF = Common Communication Format*a. Khổ mẫu MARC Machine Readable CataloguingTừ năm 1964, do Thư viện Quốc hội Mỹ xây dựngNhiều hệ thống thư viện trên thế giới áp dụng => trở thành chuẩn De factoTheo MARC => UKMARC, CANMARC, AUSMARC, SINGMARC, THAIMARCMARC trở thành thuật ngữ chung,MARC của Mỹ được gọi là USMARC*MARC21 TVQH Mỹ và TVQG Canada phối hợp phát triển MARC 21. Hai nhóm chịu trách nhiệm chính về MARC 21:Uỷ ban Thông tin thư mục đọc máy MARBI (Machine Readable Bibliographic Information Committee), của ALAUỷ ban Tư vấn về MARC: gồm các đại diện của các thư viện quốc gia, các tổ chức thư mục, các nhóm cung cấp dịch vụ sản phẩm (bán hàng)*Năm 1997, TVQH Mỹ ban hành tài liệu "MARC 21 - Những đặc tả cho cấu trúc biểu ghi, bộ mã kỹ tự, và phương tiện trao đổi" (MARC 21 - Specifications for Record Structure, Character sets, and Exchange Media)Mục đích của MARC21Khổ mẫu MARC 21 là chuẩn để trình bày và trao đổi thông tin thư mục và những thông tin liên quan dưới dạng máy tính đọc được (machine-readable).Được sử dụng để làm khổ mẫu biên mục cho các nước*Cấu trúc 3 thành phần: cấu trúc biểu ghi (record structure);định danh nội dung (content designation);nội dung dữ liệu.Cấu trúc biểu ghi MARC 21 là một triển khai ứng dụng của chuẩn Mỹ ANSI Z39.2 (Information Exchange Format)Chuẩn ANSI39.2 tương đồng với chuẩn ISO 2709*Biểu ghi MARC21 là tập hợp các mã và định danh nội dung được quy định thống nhất để mã hoá các biểu ghi trao đổi máy tính đọc được.Mọi thông tin lưu trữ trong biểu ghi MARC được lưu dưới dạng ký tự. Biểu ghi trao đổi được mã hoá theo ký tự trong Bảng mã ASCII mở rộng (extended ASCII).Sử dụng khổ mẫu Là khổ mẫu trao đổi; không áp đặt những chuẩn lưu trữ dữ liệu bên trong hệ thống và chuẩn trình bày dữ liệu (display format) của từng hệ thống riêng biệt. Khổ mẫu MARC 21 cố gắng tạo ra sự tương hợp với một số khổ quốc gia (như UKMARC) và quốc tế (như UNIMARC).*Cấu trúc biểu ghi Đầu biểu ghi (Leader): 24 ký tựDanh mục (Directory): danh mục về các trường có trong biểu ghi. Kết thúc bằng dấu kết thú trườngCác trường dữ liệu (gồm hai nhóm là trường kiểm soát và trường dữ liệu):Mã kết thúc trườngMã kết thúc biểu ghi.* Cấu trúc tổng quátLEADERDIRECTORYKTTTrường KS1KTTTrường KS2KTTTrường BĐ1KTTTrường BĐ....KTTTrường BĐnKTTKTBGKTT = Mã Kết thúc trườngKTBG = Mã kết thúc biểu ghi*Đầu biểu ghi (LEADER) 24 ký tựĐộ dài biểu ghi 00-04 Trạng thái biểu ghi 05 Loại biểu ghi 06 Cấp thư mục 07 Thông tin tự xác định 08 Bộ Mã ký tự 09 Số lượng chỉ thị 10 Độ dài mã trường con 11 Địa chỉ dữ liệu 12-16 Thông tin áp dụng 17-19 ánh xạ mục 20-23*vị trí 06 - Loại biểu ghi Chứa 1 ký tự ASCIIa - Văn bản (bao gồm cả tài liệu in, vi phim, vi phiếu, điện tử đọc được ở dạng chữ chữ viết). c - Bản nhạc in d - Bản nhạc viết tay, bản thảo âm nhạc e -Tư liệu bản đồ in f - Tư liệu bản đồ vẽ tay g - Tư liệu chiếu hình hay video (phim, hình ảnh động, phim cuộn, phim máy chiếu (slide), giấy chiếu trong, băng hoặc đĩa ghi hình,.. *i - Băng hoặc đĩa ghi âm không phải nhạc (như ghi âm bài phát biểu, tiếng nói,..) j - Băng hoặc đĩa ghi âm là nhạc k - Tư liệu đồ hoạ hai chiều (ảnh, bản vễ thiết kế,...) l - Tư liệu điện tử, tư liệu trên nguồn điện tử m - Tư liệu đa phương tiện (multimedia) o - Bộ tư liệu (kit), chứa tập hợp chứa nhiều thành phần trên các dạng khác nhau p - Tư liệu hỗn hợp ....*Sơ đồ mục Thông tin ghi vào Vị trí Giá trịĐộ dài của độ dài trường 20 4Vị trí ký tự bắt đầu 21 5 Thông tin tự xác định 22 0Dự trữ (không xác định) 23 0Như vậy, nội dung sơ đồ mục có giá trị 4500.*Danh mục Danh mục bao gồm nhiều mục (entries) về các trường trong biểu ghi MARC 21Mỗi mục này trong vùng danh mục của biểu ghi bao gồm một tập hợp 3 thành phần như sau:Nhãn trườngĐộ dài của trườngVị trí bắt đầu của trường.Vùng danh mục bắt đầu ở vị trí 24 của mỗi biểu ghi và kết thúc bằng một mã kết thúc trường. Mỗi mục có độ dài cố định là 12 ký tự. Thông tin Vị trí Nhãn trường (3 ký tự) 00-02 Độ dài trường (4 ký tự) 03-06 Vị trí ký tự bắt đầu (5 ký tự) 07-11*Các trường dữ liệu Các trường dữ liệu được đưa ra ngay sau phần Danh mục. Các trường này chia thành 2 nhóm:Trường kiểm soát không có chỉ thị; Trường dữ liệu có chỉ thị (có độ dài biến động)Chỉ chứa Dữ liệu và mã kết thức trường mà không có nhãn trườngCấu trúc TRường có chỉ thị Bao gồm 4 phần: Các chỉ thị; Các mã trường con (gồm 2 thành phần: dấu phân cách và ký tự trường con);Dữ liệu thực của trường con đó;Mã kết thúc trường (KTT)* Cấu trúc tổng quát của trường Chỉ_thị_1 Chỉ_thị_2 Dấu_phân_cách Ký_tự_trường_con_1 Dữ_liệu_trường_con_1....... Dấu_phân_cách Ký_tự_trường_con_n dữ_liệu_trường_con_n.... KTT*Các trường dữ liệu Nhãn trường MARC 21 là số có 3 chữ số (001, 010, 245,....đến 999)Các trường mà MARC 21 quy định sử dụng chia thành các khối:0XX. Khối trường kiểm soát, số và mã1XX. Khối trường về tiêu đề chính2XX. Khối trường Nhan đề và thông tin liên quan đến nhan đề*Khối trường 4XX. Khối trường về tùng thư5XX. Khối trường phụ chú6XX. Khối trường điểm truy cập chủ đề7XX. Khối trường Tiêu đề bổ sung8XX. Khối trường tiêu đề tùng thư bổ sung9XX. Khối trường thông tin cục bộ*Hướng dẫn MARC21 Phiên bản đầy đủ (update 1): hơn 210 trườngPhiên bản tóm tắt (Concise Version): trên WebPhiên bản MARC Lite: trên Web và trên giấy)*Nguyên tắc phát triển trường cục bộ MARC21 có thể áp dụng cho các nước hoặc thư việnCác nước hoặc thư viện có thể thêm vào các trường đặc thù (LOCAL FIELDS)Những trường này không dùng trao đổiCập nhật vào các nhóm trường sau:Khối 9XX: trường cục bộNhóm trường X9X của từng khối.*Số trường*UNIMARC 1977, IFLA phát triển UNIMARC (UNIversal Marc format)Tổ chức duy trì phát triển UNIMARRC:Uỷ ban thường trực UNIMARC của IFLA (Permanent UNIMARC Committee (PUC)), Ban thư ký của Uỷ ban này là: Chương trình Kiểm soát thư mục toàn cầu và MARC cốt lõi quốc tế của IFLA (IFLA Universal Bibliographic Control and International MARC Core Programme (UBCIM)UNIMARC không được thay đổi để bao quát biên mục không tuân thủ ISBD hoặc mâu thuẫn với chuẩn nàyPhiên bản mới nhất: 1994 (trên Website IFLA)*Mục đích và phạm vi của Unimarc Mục đích:Mục đích chính: hỗ trợ trao đổi thông tin thư mục quốc tế dưới dạng máy tính đọc được giữa các cơ quan biên mục quốc giaUNIMARC sử dụng là mô hình để phát triển các khổ mẫu thư mục đọc máy mớiPhạm vi:xác định các định danh nội dung (nhãn trường, chỉ thị và mã trường con) cho các biểu ghi thư mục máy tính đọc đượcXác định cấu trúc lôgic và vật lý của biểu ghiSử dụng cho: chuyên khảo, xuất bản phẩm nhiều kỳ, tài liệu bản đồ, âm nhạc, ghi âm, đồ hoạ, tài liệu chiếu hình, sách hiếm, nguồn tin điện tử*Cấu trúc UNIMARC Không khác biệt về nguyên tắc với MARC 21ứng dụng tiêu chuẩn ISO 2709 về cấu trúc biểu ghi trao đổi thông tinChỉ khác nhau về quy định nhãn trường, trường conĐặc trưng của UNIMARC Tuân thủ nguyên tắc mô tả của ISBDKhông chú trọng đến tiêu đề mô tả mà chỉ chú trọng điểm truy cậpCó sự liên kết giữ các trường (Linking Fields)Cách sắp xếp trường không theo trình tự xuất hiện trên phiếu thư mục (MARC - theo trình tự xuất hiện trên phiếu thư mục)*Các trường của UNIMARC Chia thành các khối sau:1. 0XX- Khối nhận dạng (Identification block) - 7 trường2. 1XX- Khối thông tin mã hoá (Coded Information block) - 9 trường3. 2XX - Khối thông tin mô tả (Descriptive Block) - 8 trường4. 3XX - Khối phụ chú (Notes)5. 4XX - Khối trường liên kết (Linking Entry block): 29 trường6. 5XX- Khối Nhan đề liên quan (Related title block): 16 trường7. 6XX - Khối phân tích chủ đề (Subject analysis block): 12 trường8. 7XX - Khối trách nhiệm trí tuệ (Intellectial responsibility block) - 9 trường9. 8XX - Khối trường sử dụng quốc tế10. 9XX - Khối trường quốc gia*Các trường bắt buộc có trong biểu ghi unimarc 001* Mã số biểu ghi (RECORD IDENTIFIER)100* Dữ liệu xử lý chung (GENERAL PROCESSING DATA)101 Ngôn ngữ (LANGUAGE OF THE WORK (when applicable))120 Dữ liệu mã hoá - Tài liệu bản đồ CODED DATA FIELD: CARTOGRAPHIC MATERIALS GENERAL (Chỉ đối với tài liệu bản đồ)123 Dữ liệu mã hoá Tỷ lệ và toạ độ bản đồ (chỉ đối với tài liệu bản đò)200* Nhan đề và thông tin trách nhiệm (TITLE AND STATEMENT OF RESPONSIBILITY (Trường con A)206 Vùng dữ liệu toán học của bản đồ (CARTOGRAPHIC MATERIALS MATHEMATICAL DATA) 801* Nguồn tin gốcNhững trường có dấu (*) ohải có mặt trong tất cả các biểu ghi*c. CCF - Common Communication FormatDo UNESCO phát triển năm 1984.Đơn giản hơnCó hai khổ mẫu:Cho dữ liệu thư mục - CCF/BCho dữ kiện - CCF/F*Mục đích của CCF Cho phép trao đổi biểu ghi giữa các cơ quan thông tin, kể cả thư việnCho phép sử dụng một bộ phần mềm để xử lý biểu ghi nhận được từ các tổ chức khác nhau không phụ cthuộc vào các quy định riêng cảu từng tổ chứcSử dụng làm cơ sở để có thể phát triển CSDL riêng cho từng cơ quan*Đặc điểm sử dụng CCF Chỉ có một tập hợp tối thiểu trươngf bắt buộc có để đảm bảo cung cấp thông tin về tài liệu thư mụcCung cấp cấp một số yếu tố bắt buộc và lựa chọn một cách mềm dẻo để thích hợp với các thực tiễn biên mục khác nhauCho phép cơ quan sử dung CCF có thể đưa vào những yếu tố chưa chuẩn hoáĐưa thêm thông tin liên kết (linking) để có thể liên kết một nhóm biểu ghi mà không băt buộc cơ quan biên mục phải thực hiện những xử lý phức tạp*Các trường của CCF Khoảng 73 trườngKhông chia thành các khốiCó một số trường bắt buộcNhững trường còn lại là tuỳ chọnNguyên tắc của CCF Cấu trúc biểu ghi tuân thủ ISO 2709Biểu ghi cốt lõi chỉ chứa một số không nhiều trường bắt buộc.Có nhiều trường bổ sung để hỗ trợ các trường bắt buộcSử dụng kỹ thuật chuẩn đề tạo sự liên kết giữa các biểu ghi*MARC XML Yêu cầu thiết kế 1. Đơn giản và linh hoạt2. Chuyển đổi không mất dữ liệu giữa MARC21 sang XML3. Chuyển đổi được từ XML sang MARC4. Trình bày được dữ liệu5. Chỉnh sửa dữ liệu theo MARC6. Chuyển đổi dữ liệu7. Duyệt dữ liệu MARC (Validation of MARC data)8. Có khả năng mở rộng* Kiến trúc MARC XMLChuyển đổi được MARC 21 (2709) sang/từ các khổ mẫu MARC 21 (XML) và XML khác*5.2.2 Siêu dữ liệu Metadata Hiện nay có một số sơ đồ siêu dữ liệu đang được sử dụngTEI – Text Encoding InitiativeEAD – Encoded Archival DescriptionOAI – Open Archive InitiativeDublin Core*Sáng kiến Mã hoá văn bản (TEI) TEI Text Encoding Initiative ắt đầu từ năm 1987Năm 1994: Hướng dẫn TEI với hơn 1400 trang.Mỗi đoạn văn bản TEI được bắt đầu bằng một tiêu đề TEI (TEI Header)TEI Headers Là các Phần tử xác định cấu trúc tài liệu (DTD hay Document Type Definition) của SGMLlà tập hợp các nhãn và các quy tắc của SGML và cú pháp mô tả cấu trúc của tài liệu và các thành phần của tài liệugiúp cho các chương trình xử lý tự động nhận biết đâu là các yếu tố của văn bản, cách thức trình bày, v.v...TEI tương hợp với tiêu chuẩn SG