PCR và giải trình tự

DNA là cơ sở hóa học của gen. Phân tử DNA là một chuỗi xoắn kép của hai mạch đơn được cấu tạo từ 4 loại nucleotide khác nhau nhờ các base của chúng, đó là: A (adenine), C (cytosine), G (guanine) và T (thymine). Các nucleotide này nối kết liên tiếp với nhau theo một thứ tự xác định. Giải trình tự của gen tức là phát hiện được thứ tự sắp xếp của 4 loại nucleotide này trên phân tử DNA.

pdf34 trang | Chia sẻ: haohao89 | Lượt xem: 2368 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu PCR và giải trình tự, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
81 PCR và giải trình tự Giải trình tự là gì? DNA là cơ sở hóa học của gen. Phân tử DNA là một chuỗi xoắn kép của hai mạch đơn được cấu tạo từ 4 loại nucleotide khác nhau nhờ các base của chúng, đó là: A (adenine), C (cytosine), G (guanine) và T (thymine). Các nucleotide này nối kết liên tiếp với nhau theo một thứ tự xác định. Giải trình tự của gen tức là phát hiện được thứ tự sắp xếp của 4 loại nucleotide này trên phân tử DNA. Các phương pháp giải trình tự gene 1. Phương pháp hóa học giải trình tự DNA Vào năm 1977, Maxam và Gilbert đã phát minh được một phương pháp hóa học để có thể giải trình tự một đoạn DNA. Nguyên tắc của phương pháp này là: (1) Trước hết là phải đánh dấu một đầu của đoạn DNA cần phải giải trình tự bằng một gốc phospho đồng vị phóng xạ (32P); (2) Xử lý các đoạn DNA đã đánh dấu này với chất hóa học có thể làm biến đổi đặc hiệu một hoặc hai loại base của nucleotide trên đoạn DNA. Ví dụ, dimethylsulphate để biến đổi Guanine bằng các thêm một gốc methyl ở vị trí nitrogen thứ 7 (N7), hydrazine làm biến đổi Thymine và Cytosine, hydrazine và NaCl để làm biến đổi Cytosine, acid để làm biến đổi Guanine và Adenine, NaOH để làm biến đổi Adenine và Cytosine với Adenine ưu tiên hơn Cytosine. Như vậy trong giai đoạn này, phải dùng ít nhất 4 ống nghiệm và trong mỗi ống nghiệm, DNA được xử lý với một lượng rất giới hạn của một trong các chất hóa học nêu trên để mỗi ống nghiệm chỉ có chứa các đoạn DNA mà trên mỗi đoạn DNA này chỉ có một vị trí nucleotide đặc hiệu với chất hóa học là bị biến đổi; (3) Các nucleotide bị biến đổi này sẽ bị lấy ra khỏi mạch khung đường-phosphate (sugar-phosphate backbone) của đoạn DNA và nhờ đó tách ra được các đoạn mạch đơn có một đầu đánh dấu 32P và một đầu bị mất phân tử base vì phân tử này đã bị lấy ra khỏi mạch khung (hình 37). (4) Thực hiện điện di mẫu DNA đã xử lý trong 4 ống nghiệm này trên 4 hàng của một gel polyacrylamide biến tính để các mạch đơn trong mẫu di chuyển trong gel không bị biến đổi trong quá trình điện di. Nhờ đó, sau khi hoàn tất điện di, các mạch đơn sẽ bị dừng tại các vị trí khác nhau, tùy thuộc vào mạch đơn này dài ngắn khác nhau, theo hàng dọc suốt chiều dài của gel. Áp gel đã điện di này trên một phim nhạy tia X, các vị trí dừng 82 lại của các mạch đơn trên gel điện di sẽ tạo thành các vạch trên phim vì các vị trí này đều bị đánh dấu phóng xạ do các mạch đơn đều có một đầu được đánh dấu bằng 32P. Từ các vạch trên phim xạ ký tự ghi này (autoradiography), có thể đọc được trình tự của các nucleotide của đoạn DNA (hình 38). Phương pháp hóa học xác định trình tự DNA của Maxam và Gilbert trên thực tế không phải dễ thực hiện vì cần phải xác định khá nhiều thông số tối ưu cho thí nghiệm, trong đó khó nhất là phải xác định được nồng độ giới hạn nhất của các chất hóa học sao cho khi xử lý mẫu DNA thì trên mỗi đoạn DNA chỉ có một base bị biến đổi để ứng với mỗi vị trí của base bị biến đổi thì sẽ có một mạch đơn có đầu đánh dấu 32P được tách ra. Chính vì sự phức tạp này, phương pháp Maxam Gilbert hiện nay ít được sử dụng, mà thay vào đó các nhà khoa học dùng phương pháp enzyme với nhiều ưu điểm vượt trội hơn. Mạch đơn DNA 32P A p G p C p T p T p T p G p A p G p G p A p C p G p A.. 32P 32P 32P 32P 32P Các mạch DNA đơn có đầu bị đánh dấu 32P Hình 37: Các mạch đơn có một đầu đánh dấu với 32P và một đầu base Guanine bị lấy khỏi mạch khung do bị biến đổi. Các mạch đơn này có chiều dài ngắn khác nhau tùy thuộc vào vị trí của Guanidine trên đoạn DNA. Hình 38: Hình xạ ký tự ghi trên phim nhạy tia X một gel polyacrylamide sau khi đã điện di. Các vạch là vị trí các mạch đơn bị dừng lại sau điện di. Các vị trí này gần hay xa khởi điểm là tuỳ kích thước của mạch đơn dài hay ngắn khác nhau. Từ các vạch này, đọc trình tự của đoạn DNA trong mẫu. C T+G G A>C 3’ 5’ G C C C A C T T C A G A A G A A A A A G G 83 2. Phương pháp enzyme giải trình tự DNA Phương pháp enzyme được Sanger và các cộng sự phát minh cũng vào năm 1977, và ngày hôm nay phương pháp này càng ngày càng được hoàn thiện và thực hiện dễ dàng tại các phòng thí nghiệm. Nguyên tắc chung của phương pháp này có thể tóm tắt như sau: thêm d*NTP, DNA polymerase, ddATP GGAATGC CCTTACG CATACGTGG mồi GGAATGC CCTTACG CATACGTGG CGTAAGG*C*CdA CGTAAGG*C*C*A*C*G*TdA CGTAAGGdC CGTAAGG*CdC CGTAAGG*C*C*AdC CGTAAGG*C*C*A*CdG CGTAAGG*C*C*A*C*G*T*A *TdG CGTAAGG*C*C*A*C*GdT CGTAAGG*C*C*A*C*G*T*AdT CGTAAGG*C*C*A*C*G*T*A *TdG CGTAAGG*C*C*A*C*G*T*AdT CGTAAGG*C*C*A*C*G*TdA CGTAAGG*C*C*A*C*GdT CGTAAGG*C*C*A*CdG CGTAAGG*C*C*AdC CGTAAGG*C*CdA CGTAAGG*CdC CGTAAGGdC điện di trên gel Chiều điện di thêm d*NTP, DNA polymerase, ddCTP thêm d*NTP, DNA polymerase, ddGTP thêm d*NTP, DNA polymerase, ddTTP Hình 39: Phương pháp Enzyme giải trình tự DNA. Đoạn DNA được chèn vào một vector tại một vị trí biết rõ trình tự, nhờ đó có thể tổng hợp được các mạch đơn có một đầu là mồi, một đầu là các nucleotide tận. Trong hình các nucleotide đánh dấu * là các nucleotide được dánh dấu 35S, nhờ vậy các mạch đơn được đánh dấu. 84 Trước hết chèn các đoạn DNA cần phải xác định trình tự vào một vector là phage hay plasmid tại một vị trí mà trình tự chuỗi của vị trí này đã được xác định rõ. Chuyển thể tức là đưa các vector mang đoạn chèn DNA này vào tế bào vi khuẩn để nhân bản các vector này thành nhiều bản sao, sau đó tách chiết và tinh khiết các vector từ vi khuẩn để thành các vector tự do. Dùng các đoạn mồi bổ sung một cách đặc hiệu với trình tự của vector tại vị trí chèn đoạn DNA. Thêm vào ống phản ứng men DNA polymerase và 4 loại nucleotide tự do (gọi là dNTP: deoxynucleotide triphosphate) và một lượng rất giới hạn các nucleotide tận (terminator, là ddNTP: dideoxynucleotide triphosphate, cũng như dNTP, có 4 loại ddNTP tương ứng với 4 base A, T, C và G). Phản ứng được thực hiện trong 4 ống, và mỗi ống cho một loại ddNTP khác nhau. Bắt đầu từ đoạn mồi, men DNA polymerase sẽ kéo các dNTP vào để tổng hợp mạch đơn bổ sung với mạch DNA chèn trên vector, và sự tổng hợp mạch đơn sẽ bị dừng lại tại vị trí mà ddNTP được kéo vào thay vì dNTP. Lý do sự tổng hợp bị dừng lại là vì ddNTP có cấu trúc hóa học bị mất đi gốc OH tại vị trí carbon thứ 3 của đường deoxyribose, mà gốc OH tại vị trí này chính là nơi để dNTP kế tiếp được gắn vào. Nhờ vậy trong ống phản ứng có các mạch đơn DNA có các chiều dài khác nhau tương ứng với các vị trí trình tự các nucleotide trên đoạn DNA gốc (hình 39). Để giải trình tự, người ta dùng phương pháp điện di trên gel polyacrylamide biến tính. Với phương pháp đánh dấu mồi hay các dNTP bằng đồng vị phóng xạ 32P hay 35S thì sau khi điện di, cũng giống như phương pháp của Maxam và Gilbert, người ta phát hiện các vạch điện di bằng kỹ thuật xạ ký tự ghi, và từ các vạch này giải được trình tự của đoạn DNA (hình 40). T 3’ C G C A G T C C T A G C T T A G C G G 5’ A C G T Hình 40: Hình xạ ký tự ghi một kết quả giải trình tự DNA trên gel polyacrylamide. Từ kết quả này, đọc được trình tự DNA 85 3. Giải trình tự bằng máy tự động (automated sequencer) Các phòng thí nghiệm hiện nay đều dùng phản ứng giải trình tự bằng phương pháp enzyme, nhưng khi làm giải trình tự thì thường dùng các máy tự động chứ không dùng kỹ thuật xạ ký tự ghi như trước đây. Để thực hiện được giải trình tự bằng máy tự động thì các mạch DNA đơn sản sinh trong ống phản ứng giải trình tự phải được đánh dấu huỳnh quang để các vạch điện di của các mạch đơn này phát sáng khi đi qua một chùm tia sáng laser. Cấu tạo của một máy tự động giải trình tự gồm hai phần chính yếu, đó là: phần điện di với gel polyacrylamide và phần phát hiện các vạch điện di. Phần điện Hình 41: Sơ đồ khối một máy tự động giải trình tư dùng bản gel polyacrylamide. Máy gồm hai phần: phần điện di gel polyacrylamide, phần phát hiện các vạch điện di. Các vạch điện di được các con mắt cảm quang phát hiện khi đi qua chùm tia laser và phát sáng lên. Tín hiệu được mắt cảm quang truyền về máy tính để hiển thị thành các đỉnh cường độ sáng A G C T T A C G G A C T A A T G C Màu 1 Màu 2 Màu 3 Màu 4 Tia LASER Máy tính Th i gian Mắt cảm quang 86 di polyacrylamide có thể là một bản gel hay là một ống mao quản chứa gel. Phần phát hiện vạch điện di là những con mắt cảm quang và một chùm tia laser đi qua trước nó. Nguyên tắc hoạt động của máy là trong suốt quá trình điện di, mỗi khi có một vạch điện di đi qua chùm tia laser thì vạch điện di sẽ phát sáng lên và sự phát sáng này sẽ được con mắt cảm quang ghi nhận và lưu lại thành một đỉnh cường độ sáng trong biểu đồ. Từ biểu đồ của các đỉnh cường độ sáng này, máy sẽ so dòng của các đỉnh tương ứng với các màu để cuối cùng phân tích thành trình tự của đoạn DNA (hình 41). Với các máy thế hệ mới sau này, người ta có thể dùng 4 màu huỳnh quang khác nhau để đánh dấu 4 loại ddNTP, nhờ vậy phản ứng giải trình tự có thể thực hiện được chỉ trong một ống nghiệm và khi giải trình tự chỉ cần điện di trên một hàng mà không cần phải trên 4 hàng khác nhau như trước đây (hình 42). Nếu dùng diện di mao quản thì tùy thuộc vào số mao quản có thể chạy một lần mà người làm thí nghiệm có thể có số mẫu cho mỗi lần chạy nhiều hay ít. Hình 43 là sơ đồ khối minh họa cho một giải trình tự 8 mao quản (CEQ8000, hay CEQ8800). Tùy thuộc vào qui mô của phòng thí nghiệm cùng với số mẫu giải trình tự mà phòng thí nghiệm có thể trang bị giải trình tự ít hay nhiều mao quản. Ví dụ với ABI thì có nhiều loại: chỉ 1 mao quản, 4 mao quản, 16 mao quản, 48 mao quản, rồi 96 mao quản. Phòng thí nghiệm R&D của công ty Nam Khoa trước đây nhu cầu giải trình tự không nhiều nên chỉ trang bị CEQ8000 có 8 mao quản (hình 44). Nhưng nay GGAATGC CCTTACGCATACGTGG CGTAAGGCCdA CGTAAGGCdC CGTAAGGCCACdG CGTAAGGCCACGTdA CGTAAGGdC CGTAAGGCCACGTA TdG CGTAAGGCCAdC CGTAAGGCCACGdT CGTAAGGCCACGTAdT *CGTAAGGCCACGTA TdG *CGTAAGGCCACGTAdT *CGTAAGGCCACGTdA *CGTAAGGCCACGdT *CGTAAGGCCACdG *CGTAAGGCCAdC *CGTAAGGCCdA *CGTAAGGCdC *CGTAAGGdC thêm dNTP, DNA polymerase, ddATP, ddTTP, ddGTP, ddCTP Chiều điện di Hình 42: Với các ddNTP đánh dấu hùynh quang khác nhau, các đọan trình tự tận cùng ở đầu 5’ sẽ được đánh dấu bằng 4 màu hùynh quang khác nhau tương ứng với nuleotide tận là A, hay T, hay C hay G. Chính nhờ vậy không cần phải thực hiện phản ứng giải trình tự trong 4 ống phản ứng. 87 do nhu cầu nghiên cứu và dịch vụ ngày càng nhiều nên đã trang bị thêm ABI 3130XL có đến 16 mao quản (hình 44). Các thế hệ máy về sau ngày càng có những chương trình đi kèm để chẳng những có thể hiển thị tự động các ký tự hoá học của trình tự DNA mà còn giúp các nhà nghiên cứu có thể: (1) Phát hiện các chi tiết cần thiết trên trình tự như mã khởi đầu, mã kết thúc, vùng đọc mở (ORF: Open Reading Frame), trình tự đặc hiệu cho các enzyme cắt giới hạn (restriction enzyme), các dấu ấn di truyền...mà các chi tiết này rất cần thiết để lập bản đồ gen...(2) Phiên dịch trình tự trong vùng đọc mở (tức là vùng trình tự có ý nghĩa) thành trình tự acid amin của một protein, nhờ đó có thể xác định, phỏng đoán, hay làm cơ sở ban đầu để hiểu được chức năng của gen...(3) Tự động so sánh trình tự DNA trong thí nghiệm hay một trình tự DNA nạp vào máy, hay có thể trình tự acid amin của protein, với các trình tự khác đã có trong ngân hàng dữ liệu để phát hiện được sự tương đồng với trình tự đã biết, nhờ đó làm cơ sở để xác định gen và chức năng gen... Hình 44: Máy giải trình tự CEQ8000 có 8 mao quản của Beckman Coulter và ABI 3130XL có 16 mao quản của Applied Biosystem được trang bị tại phòng thí nghiệm R&D của công ty Nam Khoa Cực [-] C ự c [+ ] Laser Cảm quang Điện thế cao Mao quản C ự c [+ ] C ự c [+ ] Hình 43: Sơ đồ khối một máy diện di mao quản dùng giải trình tự DNA 88 PCR là công cụ giúp hoàn thiện và mở rộng phổ áp dụng kỹ thuật giải trình tự PCR đã đóng góp rất nhiều vào công nghệ giải trình tự làm cho công nghệ giải trình tự ngày càng dễ dàng hơn và thuận tiện hơn. Không chỉ vậy PCR còn làm cho giải trình tự có nhiều ứng dụng hơn không chỉ trong nghiên cứu mà cả trong chẩn đoán nữa. Trước khi có PCR thì người ta chỉ có thể giải trình tự các đoạn gene được cô lập và chèn vào plasmid vì chỉ có như vậy thì mới có thể nhân bản được đoạn gene muốn giải trình tự thành nhiều bản sao với số lượng đủ để chạy được phản ứng giải trình tự. Ngoài ra, enzyme polymerase cũng là loại enzyme không chịu nhiệt nên phản ứng giải trình tự chỉ thực hiện ở 37oC, do vậy mà vấn đề tối ưu các thành phần của phản ứng rất là khó đồng thời hiệu quả của phản ứng giải trình tự cũng không cao. Từ khi có sự ra đời của kỹ thuật PCR thì kỹ thuật giải trình tự cũng có những tiến bộ rất vượt bực. Chỉ cần dùng PCR là có thể nhân bản đoạn gene muốn giải trình tự thành hàng tỷ bản sao hoàn toàn giống hệt nhau và sản phẩm khuếch đại này có thể đưa vào giải trình tự trực tiếp mà không cần phải chèn vào một plasmid giải trình tự nữa. Sự phát minh ra kỹ thuật nhân bản DNA trong ống nghiệm bằng PCR cũng giúp cho việc cải tiến phản ứng giải trình tự kém hiệu quả trước đây trở nên hiệu quả hơn nhờ áp dụng enzyme polymerase giải trình tự bền với nhiệt độ để phản ứng giải trình tự được thực hiện qua các chu kỳ nhiệt giống hệt PCR, mà ngày nay chúng ta gọi là phản ứng chu kỳ nhiệt giải trình tự. Với phản ứng chu kỳ nhiệt giải trình tự thì hiệu quả phản ứng tốt hơn rất nhiều, đồng thời tối ưu hóa các thành phần của phản ứng cũng dễ dàng hơn rất nhiều. Có thể nói chính sự ra đời và hoàn thiện kỹ thuật PCR đã giúp tăng tốc kỹ thuật giải trình tự không những trong vấn đề hoàn thiện nó, mà cả trong vấn đề phạm vi áp dụng. Giải trình tự bộ gene người 1. Làm thế nào giải trình tự bộ gene người Giải trình tự bộ gen người tức là giải trình tự toàn bộ thứ tự sắp xếp các nucleotide A, T, C, và G của DNA trong 23 cặp nhiễm sắc thể tế bào người. Dự án giải trình tự bộ gen người được Tiến Sĩ James Watson, cha đẻ của phát hiện cấu trúc DNA, đề ra từ giữa thập niên 1980. Đến tháng 10 năm 1990, dự án được ra đời với kinh phí 3 tỷ Mỹ kim do HGP (Human Genome Project) của Viện Quốc Gia Y Tế Hoa Kỳ lãnh đạo cùng với sự tham gia của nhiều trung tâm nghiên cứu bộ gen người của nhiều quốc gia 89 trên thế giới. Do tiên đoán giá trị kinh tế mang lại từ việc giải mã thành công bộ gen người sẽ rất lớn, nên đã có một số công ty sinh học chuyên về bộ gen người đã được hình thành. Sự nhập cuộc của các công ty tư nhân này đã tạo nên một bầu không khí thi đua cho việc khai phá bí mật về bộ gen của loài người chúng ta, càng gần đến những ngày đến đích càng cực kỳ ngoạn mục. Trong cuộc chạy đua này, nhờ đã áp dụng một phương pháp cực kỳ độc đáo kết hợp giữa công nghệ PCR, công nghệ giải trình tự DNA với công nghệ tin học, nên chỉ với kinh phí khoảng 200 triệu mỹ kim, Tiến Sĩ Crag Venter của Celera Genomics trở thành người dẫn đầu thành công nhất trong việc giải trình tự được gần như hoàn toàn bộ gen người. Cái khó khăn của việc giải trình tự bộ gene người là không thể nào tách từng đại phân tử DNA của từng nhiễm sắc thể rồi đem giải trình tự đại phân tử DNA nguyên vẹn này. Các nhà khoa học của HGP cũng như các trung tâm khác trên thế giới nghiên cứu về bộ gen người thường cắt các đại phân tử DNA của nhiễm sắc thể một cách định hướng theo bản đồ di truyền, rồi đem giải trình tự các đoạn cắt DNA này, và cuối cùng tìm cách ghép nối chúng lại với nhau cho đúng vị trí của chúng trên đại phân tử DNA. Phương pháp này đòi hỏi phải tốn nhiều thời gian và công sức vì có nhiều khi các đoạn cắt DNA quá lớn, rất khó giải trình tự cũng như khó cho kết quả giải trình tự chính xác. Do đó, với mỗi một đoạn DNA các nhà khoa học phải thực hiện giải trình tự ít nhất là 7 lần để đảm bảo độ lặp lại. Chính vì vậy, với cách tiếp cận này, nhiều vị trí trên các đại phân tử DNA vẫn không thể giải trình tự được mà từ đó các nhà khoa học của HGP có thể hoàn tất việc xếp đúng vị trí các đoạn DNA đã giải trình tự trên đại phân tử DNA của nhiễm sắc thể. Tiến sĩ Crag Venter đã thực hiện một phương pháp giải trình tự bộ gen người một cách hoàn toàn khác hẳn (hình 45). Trước hết ông cho tách chiết toàn bộ DNA nhiễm sắc thể tế bào người rồi phá bung một cách không định hướng các đại phân tử DNA thành các mảnh DNA nhỏ hơn. Đem giải trình tự tất cả các mảnh DNA nhỏ này. Cuối cùng dùng những máy điện toán cực mạnh mà ông đã hợp tác với công ty ABI chế tạo ra, dò tìm các đầu trùng lặp của các mảnh DNA nhỏ này để lắp nối vào đúng các vị trí của chúng trên đại phân tử DNA của nhiễm sắc thể. Chính nhờ áp dụng chiến lược giải trình tự này mà Celera Genomics đã giải trình tự rất nhanh các mảnh DNA, chỉ cần lặp lại cho mỗi mảnh DNA có 5 lần, và đã xếp đúng gần như hầu hết vị trí của các mảnh 90 DNA đã giải trình tự trên đại phân tử DNA của nhiễm sắc thể. Hơn thế nữa, TS. Crag Venter cũng tuyên bố công ty đã triển khai một kỹ thuật mới có thể làm cho phương pháp giải trình tự bộ gen của công ty, vốn dĩ đã là phương pháp nhanh nhất rồi, trở thành nhanh hơn nữa. Cuối năm 2000, Celera Genomics đã hoàn thành việc giải trình tự bộ gen của chuột với 2.3 tỷ “ký tự hóa học” trong đó có rất nhiều tương đồng với bộ gen người, nhờ vậy sẽ giúp các nhà khoa học dễ dàng hơn trong việc truy tìm các chức năng của các gen. 2. Kết quả giải trình tự bộ gene người Sau gần 10 năm nghiên cứu thực hiện với những năm càng về sau càng sôi động không khí thi đua do sự nhập cuộc của các công ty tư nhân, ngày 26 tháng 6 năm 2000, tại Tòa Bạch Ốc với sự hiện diện của Tổng Thống Hoa Kỳ Bill Clinton, hai khoa học gia Mỹ là Tiến Sĩ Crag Venter đại diện cho Celera Genomic và Tiến Sĩ Francis Collins đại diện cho HGP (HGP: Human Genome Project) của NIH (NIH: National Institute of Health) công bố một cách long trọng là chương trình giải trình tự bộ gen người đã hoàn tất. Đây chính là một thời khắc lịch sử cực kỳ quan trọng và đáng nhớ của nhân loại, đánh dấu ngày nhân loại đã có trong tay một bản đồ sinh học cần thiết để bước vào kỷ nguyên mới với nhiều hứa hẹn các thành tựu vĩ c a g g c a t t t c c a g c g g c g g c g g a g c a g c g a g c g g c g g c c a g c a g t g a g g a g a c a g c c c a g c a g t g a g g a g a c a g c c g a g c g g c g g g g c g g c g g a g c a g c a g g c a t t t c c a g c c g a g c g g c g g c g g a g c a g g c a t t t c c a g c a g t g a g g a g a c a g c t g t a c ccgtcaaccggagtta acgttct DNA từ mhiễm sắc thể được phá bung thành nhiều mãnh nhỏ Các mãnh DNA nhỏ được giải trình tự Các mãnh DNA nhỏ được chương trình phân tích tự động tìm các đầu trùng lặp, nhờ đó tái hiện được trình tự của đại phân tử DNA Hình 45: Phương pháp giải trình tự bộ gen người của công ty Celera Genomics: trước hết tách chiết toàn bộ DNA của nhiễm sắc thể tế bào người, sau đó phá tung DNA thành các mảnh nhỏ, giải trình tự tất cả các mảnh nhỏ này, cuối cùng nhờ chương trình vi tính cực mạnh để nối kết các đoạn DAN nhỏ này lại với nhau bằng cách dò tìm các đầu trùng lặp nhờ vậy tái hiện được mạch DNA nguyên thủy 91 đại về sinh y học trong tương lai. Dù thành công của các nhà khoa học giải trình tự được 3.1 tỷ các “ký tự hóa học” làm nên bộ gen người đã được ví như sự kiện lịch sử con người bước lên mặt trăng (ngày 26 tháng 7 năm 1969, từ khoang đổ bộ phi thuyền Apollo, Neil Armstrong bước xuống đi dạo trên mặt trăng và đánh dấu thời điểm con người thực hiện được hoàn toàn ước mơ đã từng ao ước bấy lâu: khắc dấu chân mình trên bề mặt chị Hằng), nhưng đây chưa phải là thời điểm mà con người đã toại nguyện được ước mơ hiểu biết tường tận được bộ gen