Các bác sĩ tiến hành phẫu thuật mắt và lấy
ra 1 con ấu trùng trong cơ thể từ vết thương
đó (ảnh dưới) Mang đi giải mã trình tự
BOLD = The Barcode of Life Database
Được thiết kế để hỗ trợ sự phát triển và ứng
dụng của các CSDL Barcode DNA.
Nền tảng CSDL bao gồm 3 phần chính: 1 cổng
nhập liệu CSDL, 1 hệ thống máy chủ CSDL
barcode và khu vực chọn lọc CSDL
BOLD được mở rộng miễn phí cho bất kỳ nhà
nghiên cứu nào đam mê trong lĩnh vực DNA
Barcoding
14 trang |
Chia sẻ: lylyngoc | Lượt xem: 1736 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Kiểm tra sự khác biệt trong các trình tự tiến hóa, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 1
KIỂM TRA SỰ KHÁC BIỆT TRONG CÁC
TRÌNH TỰ TIẾN HÓA
Bài thực hành Tin sinh học số 3
GV: ThS. Nguyễn Thành Luân
luannt@cntp.edu.vn
CÁC QUY ĐỊNH CHUNG TRONG THỜI
GIAN THỰC HÀNH
THỜI GIAN THỰC HÀNH VỚI MÁY
KHÔNG LÀM BẤT KỲ CÔNG VIỆC RIÊNG NÀO VỚI MÁY
TỰ LÀM VIỆC, THỜI GIAN KIỂM TRA THEO NHÓM HOẶC CÁ
NHÂN
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 2
CÀI ĐẶT PHẦN MỀM
BioEdit
MEGA4
MỞ FILE THỰC HÀNH SỐ 03 Gen thực
hành 03.rar
VẤN ĐỀ - TRIỆU CHỨNG
SINH HỌC
Một bệnh nhân được báo cáo tại 1 bệnh viện
với sự phát triển khác thường ở mắt (ảnh).
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 3
VẤN ĐỀ SINH HỌC
Các bác sĩ tiến hành phẫu thuật mắt và lấy
ra 1 con ấu trùng trong cơ thể từ vết thương
đó (ảnh dưới) Mang đi giải mã trình tự
GIỚI THIỆU CSDL
BOLDSYSTEMS
BOLD = The Barcode of Life Database
Được thiết kế để hỗ trợ sự phát triển và ứng
dụng của các CSDL Barcode DNA.
Nền tảng CSDL bao gồm 3 phần chính: 1 cổng
nhập liệu CSDL, 1 hệ thống máy chủ CSDL
barcode và khu vực chọn lọc CSDL
BOLD được mở rộng miễn phí cho bất kỳ nhà
nghiên cứu nào đam mê trong lĩnh vực DNA
Barcoding
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 4
Giới thiệu Barcode Of Life Database
(BOLD)
Chứa trên 800,000 trình tự barcode (2010)
Được đóng góp bởi nhiều nhà khoa học và
nghiên cứu viên trên toàn thế giới.
DNA được tách chiết từ cơ thể SV, phóng đại
gen COI sau đó giải mã trình tự gen.
Trình tự sau đó được đưa vào BOLD kết hợp
với tên loài phù hợp với mã barcode đã được
giải mã.
THAO TÁC THỰC HÀNH
Để xác định loài chưa biết tên đó, vào trang web
( Click vào mục
“Identification”
Dán đoạn trình tự GEN THỰC HÀNH SỐ 03 vào
mục textbox của Animal Identification (COI).
Click vào mục “Submit”. Sau đó, chờ cho việc phân
tích hoàn tất, bạn sẽ được dẫn đến 1 trang mới với
danh sách các loài, phân loại của loài đó và tỷ lệ
tương đồng với những loài khác.
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 5
Giao diện BOLDSYSTEMS
Di chuyển
xuống
dưới và
Dán trình
tự ở dạng
.fasta
SUBMIT
Nguồn: Ratnasingham, S. & Hebert, P. D. N. (2007). BOLD: The Barcode of
Life Data System (www.barcodinglife.org). Molecular Ecology Notes 7, 355-
364. DOI: 10.1111/j.1471-8286.2006.01678.
TRẢ LỜI CÂU HỎI
Tên loài nào tương đồng nhất với loài được giải
trình tự?
Loài nào được phân loại và chi tiết loài được phân
loại?
Có phải loài phân loại này thuộc nhóm ký sinh
trùng gây bệnh ở người hay không? (dùng Google
search hay theo tênS)
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 6
CSDL INSECT/SPIDERS
01.com/article.cfm/
screwworm_parasi
tic_fly
KẾT LUẬN CỦA BÁC SỸ
Trong trường hợp này, việc tìm hiểu thông tin cực
kỳ quan trọng cho việc quyết định phương pháp
điều trị cho bệnh nhân. Loài đặc biệt này chỉ có thể
ký sinh trên 1 người trong giai đoạn ấu trùng.
Vì vậy, không có cơ hội nào cho bất cứ ấu trùng
nào còn sót lại để dẫn đến sự tàn phá cơ thể bệnh
nhân. Tuy nhiên, những ký sinh trùng khác như
giun móc, giun sán không nằm trong trường hợp
này.
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 7
Xây dựng và dẫn xuất 1
đoạn genome nhỏ
Mục đích bài tập:
– Thực hiện việc xây dựng 1 chương trình genome từ dữ liệu của
1 đoạn genome ti thể.
– Đoạn gen ti thể của 1 loài giun tròn với mỗi phân mảnh trình tự
khoảng 500 –800 nucleotide.
– Những đoạn trình tự chứa những đoạn lặp lại
– Nhiệm vụ của bạn là phân mảnh lại các đoạn này với nhau và
lập nên 1 trình tự genome hoàn chỉnh
– Sau đó, dẫn xuất genome đó, tìm kiếm các gen trên đoạn
genome đó, chính xác nơi nào nó bắt đầu, nơi nào nó kết thúc.
Nhiệm vụ của bạn là xác định vị trí của 6 nhóm gen liên kết
protein (protein coding gene) và 5 gen tRNA
Xây dựng và dẫn xuất 1
đoạn genome nhỏ
Đoạn gen này được giải mã trình tự bằng phương
pháp Walking và các báo cáo khoa học muốn
được công nhận phải có đầy đủ 2 sợi (Double
strands) của chuỗi DNA đã được giải mã.
Điều này cho thấy 1 hướng nghiên cứu dựa trên
mỗi đoạn trình tự riêng lẻ như mỗi sợi của chuỗi
DNA phải bổ sung 1 cách chính xác
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 8
THAO TÁC THỰC HÀNH
Mở file mt_fwd_frags.abi trong FILE THUC HANH 03 bằng
BioEdit
File này chứa 17 đoạn trình tự với độ dài khoảng 500-800 nucleotide
Để tìm thấy nơi nào đoạn trình tự bị lặp lại với 1 đoạnh trình tự khác
trong CSDL, chúng ta sử dụng chương trình CONTIG ASSEMBLY
trong BioEdit
Chương trình này sẽ nói cho bạn nơi nào những trình tự bị trùng lắp và
có thể gắn kết những mảnh DNA liên kề đơn lẻ với nhau.
Chọn „Accessory Application‟ ở Menu, và chọn „CAP
ContigAssembly Program‟
Click vào “Run Application”
Giao diện BioEdit
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 9
THAO TÁC THỰC HÀNH
Kết quả phân tích trình tự hoàn tất khi có chữ “SHOW” xuất hiện
Để xem kết quả của việc phân tích, đóng cửa sổ này.
Bạn sẽ thấy được 1 đoạn trình tự khoảng hơn 8000 base pair và
kéo sang phải sẽ thấy các đoạn trùng lắp trên DNA
Đoạn trình tự kết nối với nhau sẽ được chỉ với đoạn trình tự cuối
cùng nằm phía dưới ký hiệu là Contig-0. Đây là đoạn trình tự giải
mã xuôi (Forward sequence)
Để SAVE đoạn trình tự này, xóa tất cá các trình tự nhỏ khác bằng
phím CTRL + DEL, chỉ lưu lại 1 đoạn CONTIG-0.
Sau đó chọn File ở Menu, Save As tên file là
CONTIG_FWD.FAS
THAO TÁC THỰC HÀNH
Lặp lại quá trình trên nhưng chọn file là mt_rev_frags.abi cho
đoạn gen phiên mã ngược. Save đoạn gen giải mã là
CONTIG_REV.FAS
Để xem 2 sợi DNA từ 2 đoạn trình tự có chính xác kết hợp bổ sung
với nhau hay không, mở file CONTIG_FWD.FAS vào mục FILE ở
Menu, chọn Import Sequence Alignment Import file
CONTIG_REV.FAS
Chúng có vẻ không bổ sung kết hợp cho nhau vì chúng kết hợp từ
những đoạn gen từ 2 sợi khác nhau nên để thấy chúng kết hợp bổ
sung nhau, bạn phải xem 1 đoạn từ phải sang trái hay dùng kỹ thuật
phiên mã ngược 1 trong 2 sợi của chuỗi DNA
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 10
THAO TÁC THỰC HÀNH
Click vào 1 trong 2 đoạn trình tự để highlight
nó Vào mục Sequence ở Menu chọn
„Nucleic Acid‟ chọn „Reverse
Complement‟.
Nó sẽ hiện ra 1 bằng chứng 2 đoạn gen trình
tự phải được kết hợp chính xác với nhau. Để
kiểm tra lại lần cuối 1 cách nhanh chóng, click
vào biểu tượng dưới đây:
HOÀN THÀNH CÂU 2 (5’)
Tiếp theo, bạn sẽ phải lập bản đồ vị trí gen
trên đoạn genome vừa phân loại được. Copy
đoạn genome vừa giải mã được vào file Gen
thực hành 03.doc
Vào ORFinder theo link
in để thấy các đoạn đọc mở (Open Reading
Frames) trong đoạn trình tự của bạn
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 11
ORF Finder
Dán đoạn trình tự của bạn vào textbox và
chọn “Invertebrate Mitochondrial” ở mục
Genetic Code (vì chúng ta biết đây là loài
động vật không xương sống (giun tròn)
Click vào OrfFind Sau khi quá trình phân
tích hoàn tất, bạn sẽ thấy 1 kết quả như hình:
Ý nghĩa biểu diễn trong ORF
Mỗi thanh trong khung đọc mở miêu tả 1 trong 6 khung đọc
khác nhau.
– 3 thanh đầu mô tả khung đọc mở cho 3 đoạn gen phiên mã xuôi
(Forward reading frames),
– 3 thanh cuối mô tả 3 đoạn gen phiên mã ngược (Reverse reading
frames).
– Chúng ta cần xác định 6 gen mã hóa protein (protein coding gene) nên
chúng ta tìm hiểu đoạn đọc mở dài nhất biểu hiện bằng đoạn đọc có
màu xanh dài nhất
Click vào đoạn đọc mở đơn lẻ màu xanh (Single ORF). Nó sẽ
chuyển từ màu xanh sang hồng khi bạn click vào.
Ví dụ: Click vào biểu tượng khung đọc mở bên trái, thanh
đầu tiên dài nhất, đoạn dịch mã sẽ biểu hiện trình tự với
aa khởi đầu là Methionine và kết thúc với 1 codon kết
thúc (TAG)
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 12
TRẢ LỜI CÂU HỎI (5’)
Hãy trả lời câu hỏi vào Bảng 1
Hướng dẫn (Hints)
Để xác định mỗi đoạn ORF, bạn sẽ cần phải thực
hiện tìm kiếm “BLASTP SEARCH”
Highlight đoạn trình tự mới kiếm được, click vào
nút biểu tượng “BLAST” thấy được Protein ID
(Đây là gen mã hóa protein) Click vào thanh
„View Report‟.
Sau khi BLAST search hoàn tất, bạn sẽ thấy 1 bảng
biểu thị tất cả những gen về ti thể liên quan đến
đoạn đọc mở trên. Nếu có, bạn đã thành công trong
việc xác định khung đọc mở và thêm vào bảng báo
cáo của bạn như trên
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 13
Tìm kiếm các đoạn tRNA
Bạn mong muốn tìm kiếm 5 đoạn gen tRNA trong
trình tự genome ti thể của bạn.
Copy đoạn genome trình tự của bạn vào
tRNAScantheo link:
Dán đoạn trình tự của bạn vào textbox chỉnh ở
phần „Source‟ sang Nematode Mito, và đặt ở mục
„Genetic Code for tRNA Isotype Prediction‟ thành
„Invertebrate Mito‟.
Ghi rõ ở mục „Cove Score Cutoff‟ là 15.
Tìm kiếm tRNA – Kết quả
Click vào nút Run tRNAScan.
Chờ quá trình phân tích dữ liệu hoàn tất, bạn
sẽ thấy 1 danh sách các gen tRNA với vị trí
chúng được đánh dấu và cove score (điểm
vòng).
Điểm vòng là 1 sự chỉ thị các phân mảnh trình
tự được phân loại có thể gắn vào trong 1 cấu
trúc tRNA vòng xoay đặc biệt 1 cách đặc hiệu
hay không.
Thực hành Tin sinh học
ThS. Nguyễn Thành Luân 14
Tìm kiếm tRNA (5’)
Tìm kiếm 5 gen tRNA và điền vào bảng
tRNA gene Vị trí nucleotide Tên gene
1
2
3
4
5
KẾT THÚC BÀI THỰC HÀNH
Chuẩn bị kiểm tra tại lớp 5%
Làm thêm các bài tập trong giáo trình thực
hành
Mang theo USB 3G cho thực hành môn học