Tìm kiếm trình tự sinh học và đăng ký trình tự trên cơ sở dữ liệu

Có khả tìm kiếm được những trình tự sinh học như DNA, RNA, Protein. Đăng ký những trình tự đã nghiên cứu được lên Cơ sở dữ liệu sinh học bằng phần mềm Sequin.

ppt46 trang | Chia sẻ: lylyngoc | Lượt xem: 3203 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Tìm kiếm trình tự sinh học và đăng ký trình tự trên cơ sở dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TÌM KIẾM TRÌNH TỰ SINH HỌC VÀ ĐĂNG KÝ TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU Mục tiêu của bài học Có khả tìm kiếm được những trình tự sinh học như DNA, RNA, Protein. Đăng ký những trình tự đã nghiên cứu được lên Cơ sở dữ liệu sinh học bằng phần mềm Sequin. Tìm kiếm trình tự sinh học * Nguyên tắc trong giải trình tự Phương pháp Sanger: là phương pháp dựa trên sự tổng hợp gián đoạn DNA. Dựa theo phương pháp này chúng ta có thể xác định được trình tự nucleotide của DNA hay RNA (ATGC…TTT) * Tìm kiếm trình tự sinh học Nhiễm sắc thể, DNA, Gene, Nucleotide Giới thiệu môn học * Gửi trình tự lên Genebank của NCBI Trình tự đã giải Giới thiệu môn học * Đưa vào cơ sở dữ liệu sinh học: -NCBI - Các cơ sở dữ liệu khác Sequin Nguyên tắc tìm kiếm trình tự sau khi đã giải trình tự 1.Tìm bằng từ khóa: 2.Công cụ tìm kiếm -Mã số truy cập -Tên (gene hay Protein) -GI -Độ dài trình tự -Trọng lượng phân tử -Tên tác giả giải trình tự 3. Lọc trình tự * Tìm kiếm trình tự sinh học Kết quả cần tìm Tìm kiếm trình tự sinh học * Tìm kiếm trình tự sinh học qua NCBI Click Tìm kiếm trình tự sinh học * Tìm kiếm trình tự DNA Tìm kiếm trình tự qua mã số truy cập Tìm kiếm trình tự sinh học * Mã số truy cập của một trình tự là mã số do các nhà quản trị CSDLSH đặt cho một trình tự, thường có dạng : 8 ký tự : 2 chữ và 6 số ví dụ như AY690640 6 ký tự : 1 chữ và 5 số ví dụ như U20068 TÌM KIẾM TRÌNH TỰ SINH HỌC QUA MÃ SỐ TRUY CẬP Tìm kiếm trình tự sinh học * Kết quả tìm trình tự DNA qua mã số truy cập Giới thiệu môn học * Tìm kiếm trình tự sinh học * Tìm kiếm trình tự qua tên gene Tìm kiếm trình tự sinh học * Cách lấy trình tự theo định dang FASTA Giới thiệu môn học * Định dạng FASTA FASTA là một giải thuật bắt cặp trình tự được David J. Lipman và William R. Pearson miêu tả lần đầu tiên vào năm 1985 (Rapid and sensitive protein similarity searches). Nhiều phần mềm tin sinh học cần dữ liệu trình tự gene hoặc protein theo kiểu định dạng FASTA như ví dụ minh hoạ dưới đây: >tên trình tự gattctcacttggtctgctgcaaggacgcggaccattaaaactgttcatggcccttgtggcgttctcgtttcctaacaatcccaccaacagcagggatactaaaaagatggggaacgatcaaaaaatcaaaagctatcaatgtcttgagagggttcaggaaagagattggaaggatgctgaacatcttgaacaggagacgcaggacagcaggcgtgattgttatgttgattccacagcgatggcgttccatttaaccacacgcaatgg Tìm kiếm trình tự sinh học * Một số mã số truy cập của RefSeq database 1. mRNAs and Proteins NM_123456 Curated mRNA NP_123456 Curated Protein NR_123456 Curated non-coding RNA XM_123456 Predicted mRNA XP_123456 Predicted Protein XR_123456 Predicted non-coding RNA 2. Chromosome NC_123455 Microbial replicons, organelle genomes, human chromosomes 4. Assemblies NT_123456 Contig Tìm kiếm trình tự sinh học * Ví dụ 1: NM_123456 Curated mRNA Tìm kiếm trình s sinh học * NM_123456 V í dụ 2: NC_12345 Giới thiệu môn học * Kết quả tìm kiếm bộ gene Giới thiệu môn học * Thẻ giới hạn phạm vi tìm kiếm DNA [ALL] : Tất cả các trường tìm kiếm [ACCN]: Mã số truy cập của trình tự - Accession number [GI] : Số gi [AUTH] : Tên tác giả giải trình tự- author name [PDAT] : Ngày trình tự được chỉnh sửa hay ngày trình tự được cập nhật (update) – publication date [ORGN] : Sinh vật chứa trình tự đó - organism [TITL] :Định nghĩa trình tự trong mẫu tin – title [SLEN] :Chiều dài của trình tự - Sequence length [GENE] : Tên gene   Tìm kiếm trình tự môn học * BÀI TẬP Chúng ta thực tập tìm kiếm trình tự gen có tên là ST GENE và lấy đoạn nucleotide theo định dạng FASTA. Câu hỏi 1: Kết quả có bao nhiêu mục tìm thấy ? Trả lời 1: Câu hỏi 2: Trình tự DNA này dài bao nhiêu ? Nó mã hoá cho protein gì? Công trình này được đăng tải bởi tạp chí nào? Tác giả là ai? Trả lời 2: Giới thiệu môn học * Tìm kiếm trình tự protein Tìm kiếm trình tự sinh học * Tìm kiếm trình tự qua tên sinh vật Giới thiệu môn học * Định dạng trình tự dạng FASTA Giới thiệu môn học * Thẻ giới hạn phạm vi tìm kiếm trình tự protein [ALL] : Tất cả các trường tìm kiếm [ACCN] : Mã số truy cập của trình tự - Accession number [GI] : Số gi [AUTH] :Tên tác giả giải trình tự- author name [PDAT] : Ngày trình tự được chỉnh sửa hay ngày trình tự được cập nhật (update) – publication date [ORGN] : Sinh vật chứa trình tự đó - organism [TITL] : Định nghĩa trình tự trong mẫu tin – title [SLEN] : Chiều dài của trình tự - Sequence length [PROT] : Tên protein – Protein name [MOLWT] : Trọng lượng phân tử protein Giới thiệu môn học * Bài tập Chúng ta thực tập tìm kiếm trình tự protein là độc tố bền nhiệt có tên là ST (ST toxin). Câu hỏi: Có bao nhiêu mục bài liên quan đến trình tự protein yêu cầu được tìm thấy Trình tự protein ST toxin chủ yếu liên quan đến loài nào ? Đặc điểm của protein này? Trả lời: Cách mã hóa dùng trong trình tự amino acid Giới thiệu môn học * Tìm kiếm trình tự sinh học * Phần mềm Sequin Tìm kiếm trình tự sinh học * Giới thiệu môn học * Các download phần mềm sequin trong NCBI Giới thiệu môn học * Cách đăng ký trình tự đã được giải mã qua phần mềm sequin Giới thiệu môn học * Chọn Genebank (NCBI) Bước 1: Điền thông tin Giới thiệu môn học * Tìm kiếm trình tự sinh học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * Giới thiệu môn học * BÀI TẬP Tìm kiếm trình tự gene mà bạn muốn, sau đó đăng ký lên trên gene bank bằng sequin Tìm kiếm trình tự sinh học * ĐỪNG NGỦ TRONG LỚP Giới thiệu môn học * Giới thiệu môn học *
Tài liệu liên quan