Bài giảng Tin sinh học - ThS. Phan Trọng Nhật

Internet là mạng máy tính toàn cầu để liên kết các tổ chức, trung tâm, viện nghiên cứu, trường học. Để máy tính hoạt động hiệu quả thì chúng phải cùng chia sẻ một phương tiện truyền thông được gọi chung là TCP/IP.

ppt140 trang | Chia sẻ: lylyngoc | Lượt xem: 1742 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Tin sinh học - ThS. Phan Trọng Nhật, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bé GI¸O DôC Vµ §µo t¹o tr­êng ®¹i häc n«ng nghiÖp hµ néi Bµi gi¶ng Tin sinh häC ThS. Phan Träng NhËt Bé m«n C«ng nghÖ sinh häc CHƯƠNG I: GIỚI THIỆU VỀ INTERNET VÀ SỰ RA ĐỜI CỦA TIN SINH HỌC 1.1. Giới thiệu về Internet Khái niệm Internet là mạng máy tính toàn cầu để liên kết các tổ chức, trung tâm, viện nghiên cứu, trường học.... Để máy tính hoạt động hiệu quả thì chúng phải cùng chia sẻ một phương tiện truyền thông được gọi chung là TCP/IP. Các máy tính giao tiếp với nhau bằng cách nào? TCP/IP (Transmission Control Protocol/ Internet Protocol) gọi là giao thức truyền dữ liệu/ giao thức Internet. Giao thức này cho phép các máy tính trên mạng trao đổi dữ liệu với nhau một cách thống nhất, tương tự như một ngôn ngữ quốc tế được mọi người cùng sử dụng để có thể hiểu nhau. Mỗi máy tính trên internet được đặt một tên duy nhất đó là địa chỉ IP Ví dụ: IP: 203.162.8.82 hay IP: http:// www.hau1.edu.vn 1.1.1. Lịch sử ra đời của Internet Năm 1969: Mạng ARPANET được ra đời dưới sự tài trợ của cơ quan quản lý các dự án nghiên cứu phát triển ARPA (American Research Projects Agency) thuộc Bộ Quốc phòng Mỹ (US Department of Defence). Khởi điểm là 4 nút mạng đặt tại 4 trường đại học của Mỹ: Đại học California Los Angeles (UCLA) Học viện nghiên cứu Standford (SRI) Đại học California Santa Barbara (UCSB) Đại học Utah Đó là mạng liên khu vực (WAN: Wide Area Network) đầu tiên được xây dựng, đánh dấu sự ra đời của internet ngày nay. Trung tâm nghiên cứu Xeroc Corporation Palo Alto phát triển chuẩn kết nối Ethernet. Những năm 1980, giao thức TCP/IP trên Ethernet trở thành giao thức thông dụng trên mạng cục bộ. Năm 1983, Bộ Quốc phòng Mỹ đã tách ARPANET làm hai mạng con: MILNET: dành cho các hoạt động quân sự. ARPANET mới: dành cho các hoạt động phi quân sự, trường đại học, viện nghiên cứu. Năm 1986, Tổ chức quỹ khoa học quốc gia NSF (National Science Foudation) thành lập mạng NSFNET. Nhiều doanh nghiệp chuyển từ ARPANET sang NSFNET. Năm 1990, ARPANET ngừng hoạt động sau gần 20 năm. Năm 1995, NSFNET thu lại thành một mạng nghiên cứu còn Internet thì vẫn tiếp tục phát triển. Năm 1991, WWW (World Wide Web) ra đời đặt nền móng cho việc chuyển tải thông tin đa phương tiện (multimedia) thông qua các siêu liên kết (hyperlink) rất tiện dụng cho việc khai thác internet. Tổ chức W3C (World Wide Web Consorticum) ra đời: nghiên cứu các chuẩn chung cho Web. Cuối năm 1992, xuất hiện nhà cung cấp thông tin thương mại đầu tiên là Delphi. Tháng 6/1993: có khoảng 130 website. Năm 1994: có khoảng 3.000 website. Hiện nay: Vài trăm triệu website. Không có bất kỳ cá nhân hay tổ chức nào có toàn quyền kiểm soát internet mà mỗi nhà quản trị chỉ quản lý phần mạng của tổ chức mình. Để internet hoạt động theo một chiều hướng thống nhất thì hiệp hội internet và W3C có nhiệm vụ phát triển các giao thức truyền thông tin chung trên internet và theo dõi các chuẩn về web. Số lượng máy chủ: Năm 1981: khoảng 200 máy Năm 1985: khoảng 2000 máy Nay: > 9.000.000 máy Internet trở thành mạng lớn nhất thế giới: mạng của các mạng và xuất hiện trong mọi lĩnh vực: Chính trị, quân sự, thương mại, nghiên cứu, giáo dục, văn hoá, xã hội... 1.1.2. Sự hình thành Internet ở Việt Nam Năm 1993 mạng VARENET (Vietnam Academic Research Education Network) được thành lập, tạo tiền đề cho việc hình thành mạng lưới internet Việt Nam. VARENET ra đời từ Chương trình hợp tác nghiên cứu khoa học, triển khai công nghệ mạng tại Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ Việt Nam với sự hợp tác khoa học của Đại học Quốc gia Australia (ANU). Máy chủ của mạng VARENET đặt tại ANU. Năm 1993: VARENET chỉ có một chức năng duy nhất là phục vụ thư điện tử (E-mail) cho các văn phòng đại diện nước ngoài, các Cty liên doanh hay 100% vốn nước ngoài do tính chất mới và chi phí tài chính cao tại Việt Nam. Ngày 19 – 11 - 1997, khi Chính phủ Việt Nam quyết định chính thức kết nối internet thì tên miền (.vn) được phía Australia bàn giao cho Tổng cục Bưu điện Việt Nam. Sự hình thành của hàng loạt các nhà cung cấp dịch vụ internet sau đó đã làm mờ nhạt vai trò của VARENET. Sau VARENET, mạng diện rộng thứ hai là VINANET (Vietnam Network) ra đời ở Việt Nam của Trung tâm Thông tin Thương mại thuộc Bộ Thương mại. VINANET cung cấp thông tin giá cả thị trường trong nước và quốc tế, địa chỉ doanh nghiệp, văn bản tư pháp.... Tốc độ truy cập thời kỳ này là 2,4kbps qua đường dây điện thoại. Năm 1997, hàng loạt các nhà cung cấp dịch vụ internet (ISP) và các nhà cung cấp thông tin lên internet (ICP) như: VNN, FPT, Saigonnet, Netnam và CINET. VNN (Vietnam Network) là mạng máy tính của Công ty Điện toán và truyền số liệu VDC (Vietnam Datacommunication Company) thuộc Tổng công ty Bưu chính viễn thông Việt Nam, hình thành năm 1997. FPT (Company for Financing and Promoting Technology) là Công ty Tài chính và Kỹ thuật Quảng cáo, thành lập năm 1997. Saigonnet thuộc Công ty Cổ phần Bưu chính viễn thông Sài gòn SPT (Saigon Post and Telecommunication Service Corporation), thành lập năm 1997. Netnam thuộc Viện Công nghệ thông tin, thành lập năm 1998. CINET (Culture and Information Net) thuộc Bộ Văn hoá và Thông tin, thành lập năm 1997. Trong số các ISP kể trên, VNN dẫn đầu danh sách với ưu thế vừa là IAP (cung cấp cổng truy cập internet) vừa là cung cấp dịch vụ internet ISP (Internet Service Provider) và ICP (cung cấp nội dung trên internet). 1.2. Kết cấu mạng Internet 1.2.1. Các kiểu mạng: Mạng cục bộ LAN (Local Area Network) Mạng vùng trung tâm MAN (Metropolitan Area Network) Mạng diện rộng WAN (Wide Area Network) Mạng cục bộ LAN: là mạng nhỏ nhất, trong vòng vài km, ngoại trừ trường hợp máy tính đơn kết nối trực tiếp với internet, tất cả các máy tính có nối mạng đều nối vào mạng LAN. Mạng LAN được dùng cho một toà nhà, trường học, thư viện, bệnh viện… Một đặc điểm của mạng LAN là khi một máy tính truyền dữ liệu thì tất cả các máy tính trong mạng đều có thể nhận dữ liệu đó, đặc tính này gọi là broadcasting. Máy tính trong mạng LAN sử dụng kỹ thuật gọi là Carrier Sense Multiple Access/ Collision Detect (CSMA/CD) nghĩa là không gửi khi máy tính khác đang gửi và kiểm tra những gì gửi đi có xung đột với các máy tính khác. Công nghệ LAN mới nhất hiện nay là mạng không dây sử dụng tia hồng ngoại hay sóng radio thay cho cáp để truyền tín hiệu mạng. Tốc độ truyền từ 1 đến 11 Mbps, nó thích hợp cho những người di chuyển thường xuyên hay những nơi mà không thể đặt dây cáp. Mạng vùng trung tâm MAN Khác với mạng LAN là dùng chung một thiết bị truyền trong mạng nên cho phép nhiều máy tính kết nối vào cùng một sợi dây, mạng MAN sử dụng các kết nối điểm đến điểm (point to point) với chỉ một máy tính tại cuối mỗi liên kết. Các máy tính tại cuối mỗi liên kết của MAN cũng có thể kết nối với các mạng LAN, MAN và WAN. Mạng diện rộng WAN Phạm vi của mạng có thể là một quốc gia hay thậm chí cả lục địa. Cũng giống như đa số MAN, mạng WAN dùng các kết nối vật lý điểm đến điểm nhưng dùng cáp xoắn. Công nghệ WAN thường có nguồn gốc từ các hệ thống xây dựng để phục vụ cho các công ty điện thoại. 1.2.2. Kết nối Internet Kết nối vật lý: kết nối các thiết bị phần cứng như modem, dây cáp để thực hiện việc nối từ một máy tính đến mạng internet thông qua các nhà cung cấp mạng. Sau khi kết nối vật lý, việc kết nối internet có thể thực hiện theo hai cách: Kết nối trực tiếp: cần có modem tốc độ cao nối với cổng V35 của thiết bị định tuyến (Router) để kết nối trực tiếp vào internet thông qua kênh thuê bao riêng. Các loại dịch vụ kết nối do các nhà cung cấp dịch vụ internet bao gồm: Đường truyền thường trực (Leased Line) Đường dây thuê bao số bất đối xứng ADSL (Asymetrical Digital Subcribe Line) Kết nối gián tiếp: chỉ cần một modem và một đường dây điện thoại để quay số vào mạng. Dịch vụ này có: Quay số kết nối qua mạng điện thoại Dial-Up Mạng số tích hợp đa dịch vụ (Intergrated Service Digital Network) So với kết nối internet gián tiếp, kết nối internet trực tiếp có nhiều ưu điểm như: băng thông rộng, tốc độ cao và ổn định, hoạt động liên tục (online 24/24). Đương nhiên chi phí cho việc kết nối trực cũng tốn kém hơn nhiều so với loại gián tiếp. Sau khi đã lựa chọn cách kết nối internet thì chúng ta quan tâm đến dịch vụ nào cho phép chúng ta lướt trên internet. Có 2 nhóm chính là: Các dịch vụ trực tuyến (online service) như America Online (AOL) và CompuServe thường cung cấp một lượng lớn các dịch vụ Intergrative Digital bao gồm Information retrieval, thư điện tử (e-mail), bảng tin (bulletin board) và “chat room’’ nhờ đó người sử dụng trực tuyến đồng thời có thể quan tâm đến một vài lĩnh vực cùng một lúc. Các nhà cung cấp dịch vụ internet ISP (Internet Service Provider) bao gồm việc cấp tài khoản truy cập internet cho người sử dụng đồng thời cung cấp các dịch vụ internet. 1.3. Một số nét khái quát về WWW (World Wide Web) và trình duyệt Web 1.3.1. WWW và nguyên lý hoạt động WWW là gì? : WW là dịch vụ cung cấp thông tin trên hệ thống mạng Internet/Intranet. Các thông tin này được lưu trữ dưới dạng tập tin siêu văn bản (hypertext) và được truy xuất bởi trình duyệt web (Web Browser). Siêu văn bản là các tư liệu chứa văn bản, hình ảnh tĩnh, hình ảnh động, âm thanh, video… được liên kết với nhau qua các siêu liên kết (hyperlink). Thông qua các siêu liên kết, người dùng có thể nhanh chóng tham khảo các tư liệu liên quan một cách dễ dàng. Để truy xuất các thông tin trên Web Server, các khách hàng sử dụng web (Web Client) phải sử dụng chương trình có chức năng duyệt các thông tin dạng siêu văn bản gọi là trình duyệt web. Có nhiều loại trình duyệt web như: Internet Explorer, Netscape Navigator, Opera, Neoplanet… Trong số đó, 2 trình duyệt được sử dụng phổ biến là Internet Explorer và Netscape Navigator. 1.3.2. Vài nét cơ bản của trình duyệt Web Tiềm năng của Internet chỉ thực sự phát huy được khi có các trình duyệt web ra đời. Chúng cho phép truy cập tới nguồn thông tin ở các vị trí khác nhau. Các Browser là các trạm công tác có khả năng xử lý hoặc yêu cầu lấy thông tin hoặc các chương trình ứng dụng từ máy chủ của mạng. Trong đó trang chủ là điểm trung gian giữa browser và server. Hiện nay có một số Web browser đang dùng phổ biến là Lynx cho hệ điều hành Unix hoặc VMS; Mosaic cho các máy Apple Mac, X-Windows; Internet Explorer và Netscape Navigator cho các máy Windows. Ưu điểm: Sử dụng dễ dàng, không cần phải hiểu biết nhiều về tin học – máy tính. Người sử dụng không cần biết vị trí chính xác của trang văn bản, hình ảnh… trên mạng internet, mà chỉ cần chọn nó bằng cách nhấp chuột vào các liên kết để có được nội dung muốn tìm. Các nguyên tắc duyệt Web: Xác định rõ thông tin muốn tìm trên web. Xác định được những Web site nào thích hợp cho việc truy tìm thông tin. Có thể mở nhiều của sổ cho mỗi website trong việc tìm kiếm bằng cách chọn File/New Windows hoặc tổ hợp phím Ctrl + N. Muốn mở một liên kết trong một cửa sổ mới, nhấp phải chuột và chọn Open link in new windows. Chức năng của trình duyệt: Cho phép xem trang web. Lưu lại những địa chỉ URL của trang web. Sử dụng dịch vụ FPT bằng trình duyệt web (Web FPT) Sử dụng các chương trình E-mail trên web (Webmail) Các trình duyệt đều sử dụng đĩa cứng để tạm ghi các địa chỉ trang web (gọi là cache) mà người sử dụng vừa lướt qua, có thể điều chỉnh tuỳ theo nhu cầu của mỗi người. Các chức năng hỗ trợ khác bao gồm: Ngăn chặn những trang web mang nội dung xấu, phản động và có thể thay đổi phông chữ, kích thước. 1.4. Các dịch vụ, tài nguyên và đạo đức trên Internet 1.4.1. Các dịch vụ: E-mail (Electronic mail): Thư điện tử WWW: Mạng thông tin toàn cầu thể hiện thông tin dạng siêu văn bản. FTP (File Transfer Protocol): Giao thức truyền tập tin trên mạng. Chat: Hội thoại trực tiếp trên Internet VoIP (Voice over Internet Protocol): Kỹ thuật chuyển tải giọng nói qua giao thức Internet hay còn gọi là điện thoại Internet. Video Conference: Hội nghị truyền hình. WAI (Wireless Application Protocol): Giao thức sử dụng công nghệ không dây. 1.4.2. Luật lệ, đạo đức và các quy định hoạt động của Internet Không được truy cập (Access) bất hợp pháp vào những hệ thống đòi hỏi phải có Username và Password. Không phá hoại và gây rối loạn hệ thống lưu thông trên Internet (gieo rắc, phát tán virus). Không lãng phí nguồn tài nguyên (không download những tập tin quá lớn mà chẳng để làm gì, đặc biệt trong giờ cao điểm. Không xoá tập tin của người khác. Không xâm phạm, phát tán những thông tin có tính chất riêng tư của người khác. 1.5. Sự ra đời và vai trò của tin sinh học 1.5.1. Buổi bình minh của trình tự Trình tự Protein Trình tự axit nucleic 1.5.2. Sự ra đời của tin sinh học Do sự xuất hiện của các thông tin về cấu trúc, chức năng và trình tự của protein, DNA từ đó dẫn tới nhu cầu quản lý, so sánh và dự đoán cấu trúc và chức năng của sinh vật và sự phát triển của các ngành khoa học khác đặc biệt là công nghệ thông tin, máy tính. Do nhu cầu đó mà Tin sinh học đã được ra đời. 1.5.3. Khái niệm Tin sinh học Là một môn khoa học phân tích các cơ sở dữ liệu sinh học nhờ sự hỗ trợ của máy tính và các công cụ thống kê. Các ngành học của Tin sinh học bao gồm: Tin sinh học genome Tin sinh học protein Tin sinh học tiến hoá Tin sinh học nông nghiệp Tin sinh học y học Phát triển các công cụ và cơ sở nền 1.5.4. Vai trò và xu hướng phát triển của Tin sinh học a/ Vai trò của Tin sinh học: Tập hợp, lưu trữ, sắp xếp, truy xuất và chia sẻ cơ sở dữ liệu. Hỗ trợ cho việc tìm kiếm, phân tích, xử lý và dự đoán các kết quả nghiên cứu. Hỗ trợ trong các nghiên cứu về cấu trúc không gian phân tử. Hỗ trợ trong nghiên cứu đa dạng và tiến hoá của sinh vật b/ Xu hướng phát triển của Tin sinh học Những lĩnh vực của Tin sinh học đang được tập trung nghiên cứu: Quản lý cơ sở dữ liệu Phân tích, biên dịch dữ liệu Phát triển các thuật toán Các cấu trúc cơ sở dữ liệu Thiết kế các giao diện và hiển thị c/ Địa chỉ có thể tìm hiểu thêm những tài liệu về Tin sinh học: Các tạp chí về Bioinformatics Các công cụ tìm kiếm (Google, Yahoo…) Các hội nghị, hội thảo Các thư viện CHƯƠNG 2 TÌM KIẾM THÔNG TIN TRÊN INTERNET 2.1. Khái niệm về thông tin 1. Thông tin là gì? Thông tin là các dữ liệu và tri thức được sử dụng trong thực tiễn để giải quyết một số vấn đề hoặc một nhiệm vụ nào đó. 2. Các thuộc tính của thông tin Giá trị của thông tin phụ thuộc vào: Chất lượng của thông tin Trình độ của người sử dụng Thông tin có chất lượng khi nó có những tính chất sau: Chính xác và đáng tin cậy Kịp thời Đặc trưng và định hướng cho người dùng thi cụ thể Khái niệm chung về tìm tin: Tìm tin là một thuật ngữ chung để chỉ công việc tìm tài liệu hay nguồn của tài liệu, cũng như thông tin về dữ liệu và sự kiện mà tài liệu đó cung cấp. 2.2. Các công cụ tìm kiếm thông tin Biểu thức tìm tin: Biểu thức tìm tin là một tập hợp các từ khóa được liên kết với nhau bằng các toán tử logic. Các loại toán tử logic thường sử dụng khi tìm tin: Phép nối đồng thời hai từ khóa hay và (and, +): Ví dụ: “Cây lúa” + “hoa màu” hoặc “Cây lúa” & “Hoa màu”. Phép lựa chọn hay hoặc: Ví dụ: “Cây lúa” or “Hoa màu”. Phép loại trừ: Ví dụ: “Cây lúa” – “Hoa màu”. Phép phủ định (Not, !): Ví dụ: Internet &! Computer. Sử dụng các dấu ngoặc: Ví dụ: (PCR or RAPD) and not (AFLP or SSR). Các toán tử gần đúng: NEAR (gần như), ADJ (gần như) , SAME (đại loại giống như), FBY (theo sau bởi). Những lưu ý về việc chọn lựa từ khóa Tốt nhất chỉ nên dùng danh từ làm từ khóa. Trong khi tìm kiếm các tài liệu tiếng nước ngoài không nên sử dụng các mạo từ, giới từ. Sắp xếp các từ khóa quan trọng trước theo thứ tự ưu tiên. Nên sử dụng ít nhất là hai từ khoá (thường là 3) và kết hợp các từ khóa thành những cụm từ. Tránh sử dụng các từ thường sử dụng (tần suất lặp lại rất nhiều ở hầu hết các tài liệu). Để tìm thông tin cụ thể tốt nhất hay chọn những từ khóa mà có thể sẽ là tiêu đề cho tài liệu hoặc tên trang Web. 2.3. Cách tìm kiếm thông tin Nguyên tắc chung Mở nhiều cửa sổ trình duyệt (Web browser) trong khi khai thác thông tin để tăng tốc độ tìm tin (Ctrl + N). Không nên mở trực tiếp một hyperlink ngay trên trang web chính mà mở riêng thông tin đó trên một trang Web mới (Open in new windows). Các cách tìm tin a/ Tìm tin theo thư mục chủ đề: Thư mục chủ đề là một tập hợp các tài liệu có liên quan đến thông tin mà chúng ta cần tìm kiếm. Các ưu điểm và hạn chế của thư mục chủ đề: Chứa các thông tin cụ thể, chính xác và ít xuất hiện trong các kết quả tìm kiếm. Khi nào nên sử dụng các thư mục chủ đề: Khi muốn xem thông tin nào sẵn có trên trang Web trong một lĩnh vực, phạm vi cụ thể liên quan đến vấn đề mình quan tâm trong thời gian ngắn. Các thư mục chủ đề tiêu biểu: Yahoo! ( Excite ( LookSmart ( Magellan ( Open Directory Project ( Snap ( b/ Tìm tin theo từ khóa: Để tìm thông tin theo từ khoá ngoài việc xác định từ khóa và biểu thức tìm tin chúng ta cần phải lựa chọn một công cụ để tìm kiếm tin hay còn gọi là các search engine. Việc tìm kiếm nhờ các search engine có rất nhiều lợi thế vì: Thứ nhất thông tin tìm được sẽ cụ thể và chi tiết hơn. Thứ hai có rất nhiều tiêu chuẩn để lọc thông tin như: tìm thông tin theo thời gian, ngôn ngữ, định dạng file... c/ Tìm tin theo các trường Tìm kiếm theo tiêu đề: Title: “từ khóa”, kết quả sẽ cho ra tất cả các trang Web có tên như từ khóa đã chọn. Nhanh hơn rất nhiều so với tìm kiếm từ khóa trong toàn bộ tài liệu. Tìm kiếm theo tên miền: Tên miền gồm 3 chữ viết tắt của một lĩnh vực mà trang web đó chứa thông tin liên quan. Vi dụ: www.hau1.edu.vn khi đó domain là: edu Tìm kiếm các hình ảnh: image: bones.gif Ngoài ra còn có nhiều trường tìm kiếm khác như: object, text, sound, pictures, date, anchor, applet và language. 2.4. Cách chọn và đánh giá độ tin cậy của thông tin 2.4.1. Cách chọn thông tin 2.4.2. Đánh giá độ tin cậy của thông tin CHƯƠNG 3: CƠ SỞ DỮ LIỆU SINH HỌC VÀ CÁC NGÂN HÀNG CƠ SỞ DỮ LIỆU 3.1. Khái quát chung về cơ sở dữ liệu sinh học Cơ sở dữ liệu sinh học (CSDL) trong chương này chủ yếu đề cập đến các thông tin về trình tự axit nucleic (ADN, ARN), trình tự axit amin của các phân tử protein, thông tin về cấu trúc và giải phẫu của một số genom, mô hình cấu trúc không gian của các đại phân tử. Các thông tin này được sắp xếp và lưu trữ bởi một hệ thống các máy chủ rất mạnh của 3 ngân hàng gen lớn nhất thế giới là NCBI, EMBL và DDBJ. 3.2. Phân tích dữ liệu ADN và Protein Các thông tin về dữ liệu ADN, protein: chủ yếu là trình tự nucleotit và trình tự axit amin Ngân hàng gen cũng có thể được coi như một thư viện sách, trong đó mỗi cuốn sách chính là một trình tự nucleotit ADN hoặc axit amin của protein và chúng đều được đánh số. Bằng cách này hay cách khác chúng ta có thể tìm được trình tự cần quan tâm. Tuy nhiên, vấn đề ở đây không phải là tìm bằng cách nào mà chúng ta phải hiểu được cuốn sách đó viết về cái gì và sử dụng nó như thế nào? a/ Dữ liệu ADN và Protein là gi? Dữ liệu về trình tự nucleotit trong ADN và trình tự axit amin trong protein là những thông tin sinh học ở mức độ phân tử. Đối với ADN đó là số lượng, thành phần và trật tự sẵp xếp của các nucleotit, ribonucleotit trên một phân tử ADN, mRNA. Các thông tin về ADN thường được chỉ rõ chúng mã hóa cho sản phẩm gen gì? có mặt ở đối tượng sinh vật nào? phân bố ở đâu. Ngoài ra các thông tin này còn liên quan đến vấn đề nghiên cứu gì và của tác giả nào? Đối với Protein, đó là số lượng và trật tự sắp xếp của các axit amin trong một phân tử protein. Các thông tin này cũng bao gồm đặc tính và vai trò của protein vị trí có mặt trong tế bào, mô, cơ quan, tác giả công bố… thậm chí còn đưa ra những giả thiết về cấu trúc của phân tử. b/ Genomic và Proteomic Genomic: Là tất cả những dữ liệu về thông tin di truyền của một loài sinh vật nhất định. Tức là hướng tiếp cận từ ADN. Proteomic: Là tất cả các sản phẩm gen (protein) của một tế bào, mô hoặc cơ quan của một sinh vật nào đó trong một giai đoạn sinh lý nhất định. Xét ở phạm vi hẹp, có thể nói đó là tập hợp sản phẩm dịch mã của tất cả các mRNA có mặt trong tế bào sinh vật tại thời điểm nghiên cứu. Tức là hướng tiếp cận từ protein. Luận thuyết trung tâm c/ Sử dụng các dữ liệu ADN và Protein để làm gì? Đối với trình tự nucleotit: So sánh một đoạn ADN bất kỳ với các dữ liệu trong ngân hàng gen có thể chúng ta xác định