Kiểm tra sự khác biệt trong các trình tự tiến hóa

Các bác sĩ tiến hành phẫu thuật mắt và lấy ra 1 con ấu trùng trong cơ thể từ vết thương đó (ảnh dưới)  Mang đi giải mã trình tự  BOLD = The Barcode of Life Database  Được thiết kế để hỗ trợ sự phát triển và ứng dụng của các CSDL Barcode DNA.  Nền tảng CSDL bao gồm 3 phần chính: 1 cổng nhập liệu CSDL, 1 hệ thống máy chủ CSDL barcode và khu vực chọn lọc CSDL  BOLD được mở rộng miễn phí cho bất kỳ nhà nghiên cứu nào đam mê trong lĩnh vực DNA Barcoding

pdf14 trang | Chia sẻ: lylyngoc | Lượt xem: 1751 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Kiểm tra sự khác biệt trong các trình tự tiến hóa, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Thực hành Tin sinh học ThS. Nguyễn Thành Luân 1 KIỂM TRA SỰ KHÁC BIỆT TRONG CÁC TRÌNH TỰ TIẾN HÓA Bài thực hành Tin sinh học số 3 GV: ThS. Nguyễn Thành Luân luannt@cntp.edu.vn CÁC QUY ĐỊNH CHUNG TRONG THỜI GIAN THỰC HÀNH THỜI GIAN THỰC HÀNH VỚI MÁY KHÔNG LÀM BẤT KỲ CÔNG VIỆC RIÊNG NÀO VỚI MÁY TỰ LÀM VIỆC, THỜI GIAN KIỂM TRA THEO NHÓM HOẶC CÁ NHÂN Thực hành Tin sinh học ThS. Nguyễn Thành Luân 2 CÀI ĐẶT PHẦN MỀM BioEdit MEGA4 MỞ FILE THỰC HÀNH SỐ 03  Gen thực hành 03.rar VẤN ĐỀ - TRIỆU CHỨNG SINH HỌC Một bệnh nhân được báo cáo tại 1 bệnh viện với sự phát triển khác thường ở mắt (ảnh). Thực hành Tin sinh học ThS. Nguyễn Thành Luân 3 VẤN ĐỀ SINH HỌC Các bác sĩ tiến hành phẫu thuật mắt và lấy ra 1 con ấu trùng trong cơ thể từ vết thương đó (ảnh dưới)  Mang đi giải mã trình tự GIỚI THIỆU CSDL BOLDSYSTEMS BOLD = The Barcode of Life Database Được thiết kế để hỗ trợ sự phát triển và ứng dụng của các CSDL Barcode DNA. Nền tảng CSDL bao gồm 3 phần chính: 1 cổng nhập liệu CSDL, 1 hệ thống máy chủ CSDL barcode và khu vực chọn lọc CSDL BOLD được mở rộng miễn phí cho bất kỳ nhà nghiên cứu nào đam mê trong lĩnh vực DNA Barcoding Thực hành Tin sinh học ThS. Nguyễn Thành Luân 4 Giới thiệu Barcode Of Life Database (BOLD)  Chứa trên 800,000 trình tự barcode (2010)  Được đóng góp bởi nhiều nhà khoa học và nghiên cứu viên trên toàn thế giới.  DNA được tách chiết từ cơ thể SV, phóng đại gen COI sau đó giải mã trình tự gen.  Trình tự sau đó được đưa vào BOLD kết hợp với tên loài phù hợp với mã barcode đã được giải mã. THAO TÁC THỰC HÀNH  Để xác định loài chưa biết tên đó, vào trang web (  Click vào mục “Identification”  Dán đoạn trình tự GEN THỰC HÀNH SỐ 03 vào mục textbox của Animal Identification (COI). Click vào mục “Submit”. Sau đó, chờ cho việc phân tích hoàn tất, bạn sẽ được dẫn đến 1 trang mới với danh sách các loài, phân loại của loài đó và tỷ lệ tương đồng với những loài khác. Thực hành Tin sinh học ThS. Nguyễn Thành Luân 5 Giao diện BOLDSYSTEMS Di chuyển xuống dưới và Dán trình tự ở dạng .fasta  SUBMIT Nguồn: Ratnasingham, S. & Hebert, P. D. N. (2007). BOLD: The Barcode of Life Data System (www.barcodinglife.org). Molecular Ecology Notes 7, 355- 364. DOI: 10.1111/j.1471-8286.2006.01678. TRẢ LỜI CÂU HỎI Tên loài nào tương đồng nhất với loài được giải trình tự? Loài nào được phân loại và chi tiết loài được phân loại? Có phải loài phân loại này thuộc nhóm ký sinh trùng gây bệnh ở người hay không? (dùng Google search hay theo tênS) Thực hành Tin sinh học ThS. Nguyễn Thành Luân 6 CSDL INSECT/SPIDERS 01.com/article.cfm/ screwworm_parasi tic_fly KẾT LUẬN CỦA BÁC SỸ Trong trường hợp này, việc tìm hiểu thông tin cực kỳ quan trọng cho việc quyết định phương pháp điều trị cho bệnh nhân. Loài đặc biệt này chỉ có thể ký sinh trên 1 người trong giai đoạn ấu trùng. Vì vậy, không có cơ hội nào cho bất cứ ấu trùng nào còn sót lại để dẫn đến sự tàn phá cơ thể bệnh nhân. Tuy nhiên, những ký sinh trùng khác như giun móc, giun sán không nằm trong trường hợp này. Thực hành Tin sinh học ThS. Nguyễn Thành Luân 7 Xây dựng và dẫn xuất 1 đoạn genome nhỏ  Mục đích bài tập: – Thực hiện việc xây dựng 1 chương trình genome từ dữ liệu của 1 đoạn genome ti thể. – Đoạn gen ti thể của 1 loài giun tròn với mỗi phân mảnh trình tự khoảng 500 –800 nucleotide. – Những đoạn trình tự chứa những đoạn lặp lại – Nhiệm vụ của bạn là phân mảnh lại các đoạn này với nhau và lập nên 1 trình tự genome hoàn chỉnh – Sau đó, dẫn xuất genome đó, tìm kiếm các gen trên đoạn genome đó, chính xác nơi nào nó bắt đầu, nơi nào nó kết thúc. Nhiệm vụ của bạn là xác định vị trí của 6 nhóm gen liên kết protein (protein coding gene) và 5 gen tRNA Xây dựng và dẫn xuất 1 đoạn genome nhỏ Đoạn gen này được giải mã trình tự bằng phương pháp Walking và các báo cáo khoa học muốn được công nhận phải có đầy đủ 2 sợi (Double strands) của chuỗi DNA đã được giải mã. Điều này cho thấy 1 hướng nghiên cứu dựa trên mỗi đoạn trình tự riêng lẻ như mỗi sợi của chuỗi DNA phải bổ sung 1 cách chính xác Thực hành Tin sinh học ThS. Nguyễn Thành Luân 8 THAO TÁC THỰC HÀNH  Mở file mt_fwd_frags.abi trong FILE THUC HANH 03 bằng BioEdit  File này chứa 17 đoạn trình tự với độ dài khoảng 500-800 nucleotide  Để tìm thấy nơi nào đoạn trình tự bị lặp lại với 1 đoạnh trình tự khác trong CSDL, chúng ta sử dụng chương trình CONTIG ASSEMBLY trong BioEdit  Chương trình này sẽ nói cho bạn nơi nào những trình tự bị trùng lắp và có thể gắn kết những mảnh DNA liên kề đơn lẻ với nhau.  Chọn „Accessory Application‟ ở Menu, và chọn „CAP ContigAssembly Program‟  Click vào “Run Application” Giao diện BioEdit Thực hành Tin sinh học ThS. Nguyễn Thành Luân 9 THAO TÁC THỰC HÀNH  Kết quả phân tích trình tự hoàn tất khi có chữ “SHOW” xuất hiện  Để xem kết quả của việc phân tích, đóng cửa sổ này.  Bạn sẽ thấy được 1 đoạn trình tự khoảng hơn 8000 base pair và kéo sang phải sẽ thấy các đoạn trùng lắp trên DNA  Đoạn trình tự kết nối với nhau sẽ được chỉ với đoạn trình tự cuối cùng nằm phía dưới ký hiệu là Contig-0. Đây là đoạn trình tự giải mã xuôi (Forward sequence)  Để SAVE đoạn trình tự này, xóa tất cá các trình tự nhỏ khác bằng phím CTRL + DEL, chỉ lưu lại 1 đoạn CONTIG-0.  Sau đó chọn File ở Menu, Save As tên file là CONTIG_FWD.FAS THAO TÁC THỰC HÀNH  Lặp lại quá trình trên nhưng chọn file là mt_rev_frags.abi cho đoạn gen phiên mã ngược. Save đoạn gen giải mã là CONTIG_REV.FAS  Để xem 2 sợi DNA từ 2 đoạn trình tự có chính xác kết hợp bổ sung với nhau hay không, mở file CONTIG_FWD.FAS vào mục FILE ở Menu, chọn Import  Sequence Alignment  Import file CONTIG_REV.FAS  Chúng có vẻ không bổ sung kết hợp cho nhau vì chúng kết hợp từ những đoạn gen từ 2 sợi khác nhau nên để thấy chúng kết hợp bổ sung nhau, bạn phải xem 1 đoạn từ phải sang trái hay dùng kỹ thuật phiên mã ngược 1 trong 2 sợi của chuỗi DNA Thực hành Tin sinh học ThS. Nguyễn Thành Luân 10 THAO TÁC THỰC HÀNH  Click vào 1 trong 2 đoạn trình tự để highlight nó  Vào mục Sequence ở Menu  chọn „Nucleic Acid‟  chọn „Reverse Complement‟. Nó sẽ hiện ra 1 bằng chứng 2 đoạn gen trình tự phải được kết hợp chính xác với nhau. Để kiểm tra lại lần cuối 1 cách nhanh chóng, click vào biểu tượng dưới đây: HOÀN THÀNH CÂU 2 (5’) Tiếp theo, bạn sẽ phải lập bản đồ vị trí gen trên đoạn genome vừa phân loại được. Copy đoạn genome vừa giải mã được vào file Gen thực hành 03.doc  Vào ORFinder theo link in để thấy các đoạn đọc mở (Open Reading Frames) trong đoạn trình tự của bạn Thực hành Tin sinh học ThS. Nguyễn Thành Luân 11 ORF Finder Dán đoạn trình tự của bạn vào textbox và chọn “Invertebrate Mitochondrial” ở mục Genetic Code (vì chúng ta biết đây là loài động vật không xương sống (giun tròn) Click vào OrfFind  Sau khi quá trình phân tích hoàn tất, bạn sẽ thấy 1 kết quả như hình: Ý nghĩa biểu diễn trong ORF  Mỗi thanh trong khung đọc mở miêu tả 1 trong 6 khung đọc khác nhau. – 3 thanh đầu mô tả khung đọc mở cho 3 đoạn gen phiên mã xuôi (Forward reading frames), – 3 thanh cuối mô tả 3 đoạn gen phiên mã ngược (Reverse reading frames). – Chúng ta cần xác định 6 gen mã hóa protein (protein coding gene) nên chúng ta tìm hiểu đoạn đọc mở dài nhất biểu hiện bằng đoạn đọc có màu xanh dài nhất  Click vào đoạn đọc mở đơn lẻ màu xanh (Single ORF). Nó sẽ chuyển từ màu xanh sang hồng khi bạn click vào.  Ví dụ: Click vào biểu tượng khung đọc mở bên trái, thanh đầu tiên dài nhất, đoạn dịch mã sẽ biểu hiện trình tự với aa khởi đầu là Methionine và kết thúc với 1 codon kết thúc (TAG) Thực hành Tin sinh học ThS. Nguyễn Thành Luân 12 TRẢ LỜI CÂU HỎI (5’) Hãy trả lời câu hỏi vào Bảng 1 Hướng dẫn (Hints) Để xác định mỗi đoạn ORF, bạn sẽ cần phải thực hiện tìm kiếm “BLASTP SEARCH” Highlight đoạn trình tự mới kiếm được, click vào nút biểu tượng “BLAST”  thấy được Protein ID (Đây là gen mã hóa protein)  Click vào thanh „View Report‟. Sau khi BLAST search hoàn tất, bạn sẽ thấy 1 bảng biểu thị tất cả những gen về ti thể liên quan đến đoạn đọc mở trên. Nếu có, bạn đã thành công trong việc xác định khung đọc mở và thêm vào bảng báo cáo của bạn như trên Thực hành Tin sinh học ThS. Nguyễn Thành Luân 13 Tìm kiếm các đoạn tRNA Bạn mong muốn tìm kiếm 5 đoạn gen tRNA trong trình tự genome ti thể của bạn. Copy đoạn genome trình tự của bạn  vào tRNAScantheo link: Dán đoạn trình tự của bạn vào textbox  chỉnh ở phần „Source‟ sang Nematode Mito, và đặt ở mục „Genetic Code for tRNA Isotype Prediction‟ thành „Invertebrate Mito‟. Ghi rõ ở mục „Cove Score Cutoff‟ là 15. Tìm kiếm tRNA – Kết quả Click vào nút Run tRNAScan. Chờ quá trình phân tích dữ liệu hoàn tất, bạn sẽ thấy 1 danh sách các gen tRNA với vị trí chúng được đánh dấu và cove score (điểm vòng). Điểm vòng là 1 sự chỉ thị các phân mảnh trình tự được phân loại có thể gắn vào trong 1 cấu trúc tRNA vòng xoay đặc biệt 1 cách đặc hiệu hay không. Thực hành Tin sinh học ThS. Nguyễn Thành Luân 14 Tìm kiếm tRNA (5’) Tìm kiếm 5 gen tRNA và điền vào bảng tRNA gene Vị trí nucleotide Tên gene 1 2 3 4 5 KẾT THÚC BÀI THỰC HÀNH Chuẩn bị kiểm tra tại lớp 5% Làm thêm các bài tập trong giáo trình thực hành Mang theo USB 3G cho thực hành môn học
Tài liệu liên quan