Đề tài Ứng dụng mô hình nơron - mờ trong việc phát hiện tế bào cổ tử cung giai đoạn tiền ung thư

Ung thưlà một nhóm các bệnh gồm hơn 100 căn bệnh khác nhau, trong đó các bệnh này đều ảnh hưởng đến đơn vịcơbản nhất của cơthểsống, đó là tếbào. Ung thư xuất hiện khi việc phân chia tếbào trởnên bất thường, không thểkiểm soát được từ đó sẽdẫn đến tửvong nhanh chóng. Tại hội thảo quốc tế“Ung thưphụnữvà trẻem” tổ chức tại Hà Nội ngày 6 và 7 tháng 11 năm 2003, qua thống kê, mỗi năm Việt Nam có 100000 đến 150000 người mắc bệnh ung thư được phát hiện, trong đó sốngười tử vong lên đến 70000 người. Các nghiên cứu đã chứng minh rằng nhiều loại bệnh ung thưcó thểngăn chặn nếu được phát hiện và điều trịsớm, chẳng hạn nhưung thưvú, ung thưcổtửcung, ung thưda, ung thưtuyến tiền liệt,… Khi các bệnh này được phát hiện sớm và điều trịthích hợp, 95% bệnh nhân có thểsống thêm ít nhất 5 năm.

pdf87 trang | Chia sẻ: nhungnt | Lượt xem: 1973 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Đề tài Ứng dụng mô hình nơron - mờ trong việc phát hiện tế bào cổ tử cung giai đoạn tiền ung thư, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Luận văn ứng dụng mô hình nơron - mờ trong việc phát hiện tế bào cổ tử cung giai đoạn tiền ung thư KH OA C NT T – Đ H KH TN Trang 1 LỜI CẢM ƠN Đầu tiên, em xin chân thành cám ơn Ban giám hiệu, các thầy cô trường Đại học Khoa Học Tự Nhiên cùng các thầy cô Khoa Công Nghệ Thông Tin đã tận tình truyền đạt những kiến thức quí báu cho chúng em trong suốt bốn năm học qua. Tiếp đến, em xin gởi lời cám ơn chân thành nhất đến Tiến sĩ Lê Hoài Bắc. Thầy đã cho em một định hướng đúng đắn cho đề tài của mình và luôn tận tình theo dõi quá trình thực hiện đề tài cũng như giúp đỡ kịp thời khi cần thiết. Em cũng xin chân thành cám ơn bác sĩ Trần Hòa, trưởng khoa Giải phẫu bệnh (Bệnh viện C, Đà Nẵng) và Thạc sĩ Bác sĩ Nguyễn Thị Tuyết Mai (Bệnh viện Đa khoa, Đà Nẵng) đã tận tình chỉ dẫn những kiến thức chuyên ngành cần thiết và tạo điều kiện cho em tiếp cận thực tế. Cuối cùng, em xin gởi tất cả tình cảm thân thương nhất đến gia đình, thầy cô và bạn bè; những người luôn ủng hộ em về mọi mặt. TP. Hồ Chí Minh, ngày 1 tháng 7 năm 2004 Võ Thị Thuỷ Tú KH OA C NT T – Đ H KH TN Trang 2 LỜI NÓI ĐẦU Ung thư là một nhóm các bệnh gồm hơn 100 căn bệnh khác nhau, trong đó các bệnh này đều ảnh hưởng đến đơn vị cơ bản nhất của cơ thể sống, đó là tế bào. Ung thư xuất hiện khi việc phân chia tế bào trở nên bất thường, không thể kiểm soát được từ đó sẽ dẫn đến tử vong nhanh chóng. Tại hội thảo quốc tế “Ung thư phụ nữ và trẻ em” tổ chức tại Hà Nội ngày 6 và 7 tháng 11 năm 2003, qua thống kê, mỗi năm Việt Nam có 100000 đến 150000 người mắc bệnh ung thư được phát hiện, trong đó số người tử vong lên đến 70000 người. Các nghiên cứu đã chứng minh rằng nhiều loại bệnh ung thư có thể ngăn chặn nếu được phát hiện và điều trị sớm, chẳng hạn như ung thư vú, ung thư cổ tử cung, ung thư da, ung thư tuyến tiền liệt,… Khi các bệnh này được phát hiện sớm và điều trị thích hợp, 95% bệnh nhân có thể sống thêm ít nhất 5 năm. Ung thư cổ tử cung là loại ung thư phụ khoa nguy hiểm thứ hai sau ung thư vú, chiếm khoảng 18% các trường hợp ung thư ở hệ cơ quan sinh dục nữ. Bệnh là nguyên nhân gây tử vong do ung thư cao nhất cho phụ nữ ở các nước đang phát triển. Đó là do những nước này chưa thực hiện chương trình khám sàng lọc nhằm phát hiện sớm ung thư. Việc chẩn đoán và điều trị cho từng bệnh nhân bị chi phối bởi tiến triển bệnh tại thời điểm chẩn đoán. Quá trình điều trị sẽ trở nên đơn giản, hiệu quả, với chi phí thấp nếu bệnh được phát hiện trong giai đoạn tiền ung thư, ngược lại nếu không điều trị kịp thời thì bệnh sẽ không chữa được. Vì vậy, phát hiện sớm ung thư cổ tử cung rất quan trọng, liên quan đến lợi ích người bệnh và hiệu quả điều trị. Để làm được điều này, các bác sĩ giải phẫu bệnh sẽ khám sàng lọc cho tất cả các bệnh nhân ở độ tuổi có thể mắc bệnh. Năm 1943, bác sĩ George Papanicolaou đã giới thiệu một phương pháp đơn giản, hiệu quả, thích hợp cho việc chẩn đoán tế bào cổ tử cung trong giai đoạn tiền ung thư; đó chính là xét nghiệm Pap. Xét nghiệm này thỉnh thoảng vẫn cho kết quả không chính xác do nhiều nguyên nhân khách quan và chủ quan. Nhiều phụ nữ sau khi được KH OA C NT T – Đ H KH TN Trang 3 khám sàng lọc vẫn chết do bệnh này. Một trong những nguyên nhân chính là do các tế bào ung thư phát triển rất phức tạp, nên tỷ lệ chẩn đoán âm tính giả và dương tính giả rất cao. Tỷ lệ chẩn đoán sai có thể giảm xuống bằng cách kiểm tra lại toàn bộ các mẫu đã khám sàng lọc. Giải pháp này không khả thi vì tốn nhiều thời gian và công sức mà hiệu quả lại không cao. Do đó, một hệ thống nhận dạng tự động tế bào tiền ung thư là rất cần thiết và rất hữu ích. Bên cạnh đó, việc xác định các hệ thống tự động đang là một công cụ ứng dụng rất quan trọng trong nhiều lĩnh vực của xã hội. Trong đó, mô hình nơron – mờ dần dần được thiết lập không chỉ trong lĩnh vực nghiên cứu mà còn trong lĩnh vực ứng dụng. Cả mạng nơron và hệ thống mờ đều được phát triển dựa trên qui trình lập luận của con người. Ở hệ thống mờ, các mối liên hệ được mô tả rõ ràng bằng các luật nếu – thì nhưng lại thiếu khả năng tự điều chỉnh (khả năng “học”). Còn ở mạng nơron, các mối liên hệ thể hiện không rõ ràng mà chỉ có thể thiết lập được những mô hình liên quan nhân quả, tuy nhiên dữ liệu lại được mã hóa vào mạng thành các tham số có khả năng “học”. Như vậy, các hệ thống tích hợp mạng nơron và logic mờ sẽ kết hợp được khả năng ngữ nghĩa của hệ thống mờ và khả năng “học” của mạng nơron để tạo ra được một mô hình suy luận hiệu quả nhất. Với tính chất phức tạp của hệ thống phân lớp tế bào cổ tử cung, một hệ thống nơron - mờ có thể khắc phục được một số lỗi thường gặp trong chẩn đoán, mà bác sĩ hay mắc phải. Mô hình nơron – mờ kiểu ANFIS (hệ suy luận mờ loại Sugeno dựa trên mạng thích nghi) được dùng để thực hiện phân lớp tế bào là bình thường hay bất thường. Báo cáo sẽ gồm 5 phần chính và 3 phần phụ: • Chương 1: Tổng quan Giới thiệu sơ lược về đề tài và các kiến thức cơ bản liên quan đến đề tài. KH OA C NT T – Đ H KH TN Trang 4 • Chương 2: Hệ thống suy luận mờ dựa trên mạng thích nghi Trình bày về lý thuyết mô hình ANFIS: cấu trúc ANFIS và thuật toán học. • Chương 3: Trích chọn đặc trưng Nêu phương pháp tạo dữ liệu cho hệ thống phân loại tế bào và cách tính các đặc trưng được trích ra từ ảnh tế bào. • Chương 4: Phân lớp tế bào cổ tử cung sử dụng mô hình ANFIS Mô tả cách thức mà mô hình ANFIS thực hiện phân lớp tế bào cổ tử cung trên một số hệ thống luật mờ: luật chuyên gia, luật chuyên gia biến đổi và luật trích dẫn từ hệ thống. • Chương 5: Tổng kết Giới thiệu chương trình và đánh giá mức độ thực hiện của hệ thống, cũng như một số ưu, khuyết điểm và định hướng. KH OA C NT T – Đ H KH TN Trang 5 MỤC LỤC LỜI CẢM ƠN.................................................................................................................1 LỜI NÓI ĐẦU ................................................................................................................2 MỤC LỤC.......................................................................................................................5 DANH MỤC HÌNH ẢNH..............................................................................................6 DANH MỤC BẢNG BIỂU ............................................................................................7 BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT ....................................................................8 Chương 1: TỔNG QUAN..............................................................................................9 1.1. Giới thiệu sơ lược đề tài ........................................................................................9 1.2. Mục đích của đề tài .............................................................................................10 1.3. Mẫu xét nghiệm Pap............................................................................................11 1.4. Một số nguyên nhân dẫn đến chẩn đoán sai........................................................16 1.5. Một số hệ thống phân lớp tế bào tự động và bán tự động...................................17 1.6. Phát biểu vấn đề ..................................................................................................19 1.7. Các tiêu chuẩn đánh giá mức độ thực hiện hệ thống ..........................................20 Chương 2: HỆ SUY LUẬN MỜ DỰA TRÊN MẠNG THÍCH NGHI ...................22 2.1. Giới thiệu sơ lược về mô hình nơron - mờ..........................................................22 2.2. Hệ thống suy luận mờ .........................................................................................23 2.3. Mạng thích nghi ..................................................................................................27 2.4. Hệ thống suy luận mờ dựa trên mạng thích nghi ................................................33 Chương 3: TRÍCH CHỌN ĐẶC TRƯNG.................................................................37 3.1. Giới thiệu sơ lược về trích đặc trưng ..................................................................37 3.2. Dữ liệu nhập của hệ thống ..................................................................................37 3.3. Dữ liệu xuất của hệ thống ...................................................................................39 3.4. Trích chọn đặc trưng ...........................................................................................40 3.5. Các đặc trưng rút trích.........................................................................................46 Chương 4: PHÂN LOẠI TẾ BÀO CỔ TỬ CUNG SỬ DỤNG MÔ HÌNH ANFIS48 4.1. Cấu trúc ANFIS trong phân loại tế bào cổ tử cung.............................................48 4.2. Các hệ thống luật mờ trong phân loại tế bào ......................................................54 Chương 5: TỔNG KẾT ...............................................................................................59 5.1. Chương trình .......................................................................................................59 5.2. Mức độ thực hiện chương trình...........................................................................66 5.3. Đánh giá đề tài ....................................................................................................75 5.4. Hướng phát triển cho đề tài.................................................................................75 PHỤ LỤC......................................................................................................................76 PHỤ LỤC A: MỘT SỐ KIẾN THỨC Y KHOA CƠ BẢN ......................................76 PHỤ LỤC B: PHÂN ĐOẠN ẢNH............................................................................80 PHỤ LỤC C: PHƯƠNG PHÁP LỌC KALMAN .....................................................82 TÀI LIỆU THAM KHẢO ...........................................................................................84 KH OA C NT T – Đ H KH TN Trang 6 DANH MỤC HÌNH ẢNH Hình 1-1: Cấu trúc mô tế bào ở cổ tử cung....................................................................12 Hình 1-2: Phân lớp trong mô tế bào gai .........................................................................13 Hình 1-3: (a) tế bào gai cận đáy, (b) tế bào gai trung gian, (c) tế bào gai bề mặt, ........14 Hình 1-4: Phân lớp trong mô tế bào trụ .........................................................................14 Hình 1-5: Sơ đồ các bước thực hiện chẩn đoán .............................................................19 Hình 2-1: Hệ thống suy luận mờ ....................................................................................25 Hình 2-2: Các luật mờ và các hệ thống suy luận ...........................................................27 Hình 2-3: Mạng thích nghi.............................................................................................27 Hình 2-4: (a) Suy luận mờ loại 3, (b) cấu trúc ANFIS tương ứng.................................34 Hình 3-1: Ảnh đã phân đoạn ..........................................................................................40 Hình 3-2: Ảnh đã gán nhãn ............................................................................................40 Hình 3-3: Các phép tính diện tích ..................................................................................41 Hình 3-4: Vị trí đường kính nhỏ nhất và lớn nhất .........................................................42 Hình 3-5: Tâm của trọng lực đối với nhân và bào tương...............................................44 Hình 3-6: Đường tròn cực tiểu cho nhân .......................................................................46 Hình 4-1: Ý nghĩa các tham số trong hàm dạng chuông................................................49 Hình 4-2: Cấu trúc ANFIS với 2 dữ liệu vào và 4 luật ..................................................50 KH OA C NT T – Đ H KH TN Trang 7 DANH MỤC BẢNG BIỂU Bảng 1-1: Thống kê kích thước tế bào...........................................................................16 Bảng 2-1: Hai quá trình trong thuật toán học lai............................................................36 Bảng 3-1 : Danh sách các đặc trưng trích chọn vào cơ sở dữ liệu.................................47 Bảng 4-1: Ví dụ luật mờ phân loại tế bào ......................................................................48 Bảng 4-2: Luật chuyên gia .............................................................................................54 Bảng 4-3: Luật chuyên gia biến đổi ...............................................................................55 Bảng 5-1: Luật chuyên gia số hóa..................................................................................66 Bảng 5-2: Mức độ thực hiện luật chuyên gia.................................................................67 Bảng 5-3: Mức độ kiểm nghiệm của luật chuyên gia ....................................................67 Bảng 5-4: Luật chuyên gia biến đổi số hóa....................................................................68 Bảng 5-5: Mức độ thực hiện luật chuyển gia biến đổi...................................................68 Bảng 5-6: Mức độ kiểm nghiệm của luật chuyên gia biến đổi ......................................69 Bảng 5-7: Luật trích từ hệ thống với 2 dữ liệu xuất.......................................................70 Bảng 5-8: Luật trích từ hệ thống với 7 dữ liệu xuất.......................................................72 Bảng 5-9: Mức độ thực hiện mạng của luật trích từ hệ thống .......................................72 Bảng 5-10: Mức độ kiểm nghiệm của luật trích từ hệ thống .........................................73 KH OA C NT T – Đ H KH TN Trang 8 BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT ANFIS Adaptive – Network – Based Fuzzy Inference System RMSE Root Mean Square Error FN False Negative FP False Positive PP Positive Predictive NP Negative Predictive LSE Least squares estimate FDA the Food and Drug Administration KH OA C NT T – Đ H KH TN Trang 9 Chương 1: TỔNG QUAN Để có thể hiểu rõ về đề tài này, chương đầu tiên xin được trình bày về một số kiến thức cơ bản liên quan đến ung thư cổ tử cung và một số công việc đã thực hiện được trong lĩnh vực khám sàng lọc tự động. Tất cả những thông tin này phần nào nói lên được những khó khăn, những tồn tại của các hệ thống chẩn đoán tự động, bán tự động hoặc thủ công (do bác sĩ thực hiện), để từ đó nêu bật được sự cần thiết phải xuất hiện một hệ thống mới. 1.1.Giới thiệu sơ lược đề tài Ung thư cổ tử cung là loại bệnh nguy hiểm, chiếm tỉ lệ cao thứ hai sau ung thư vú. Ở Úc, hơn một nghìn trường hợp ung thư cổ tử cung được chẩn đoán hằng năm, và khoảng 350 phụ nữ chết vì bệnh này (Viện Sức khoẻ Úc, 1991). Độ tuổi trung bình người bệnh là 52,2 và thường tập trung vào hai độ tuổi 35-39 và 60-64. Thống kê tại Mĩ cho thấy, ở phụ nữ da trắng, 54% bệnh nhân ung thư cổ tử cung khi được chẩn đoán bệnh còn ở giai đoạn khu trú (tiền ung thư), 31% có tổn thương trong vùng (ung thư) và 8% có di căn xa (ung thư giai đoạn cuối); ở phụ nữ Mỹ gốc Phi, tỉ lệ này tương ứng là 40%, 40% và 12%; Tỉ lệ mắc ung thư cổ tử cung theo độ tuổi cao nhất là ở những phụ nữ gốc Việt sống ở Mỹ (43/100.000). Trong vòng 45 năm qua, tần xuất mắc ung thư cổ tử cung giảm từ 45/100.000 xuống còn 8/100.000. Khi tần xuất mắc bệnh xâm lấn (ung thư) giảm xuống thì tần xuất mắc bệnh tiền xâm lấn (tiền ung thư) lại tăng đáng kể. Tỉ lệ sống 5 năm của bệnh nhân ung thư cổ tử cung mọi giai đoạn là 71% cho phụ nữ da trắng và 57% cho phụ nữ Mỹ gốc Phi. Tỉ lệ sống phụ thuộc vào giai đoạn của bệnh; khi bệnh còn khu trú tỷ lệ sống 5 năm là 92%, con số này giảm xuống 10% khi bệnh đã di căn. Vì vậy, phát hiện ung thư cổ tử cung giai đoạn tiền ung thư là một biện pháp hữu hiệu chăm sóc sức khỏe phụ nữ. KH OA C NT T – Đ H KH TN Trang 10 Năm 1943, Georges Papanicolaou đã đưa ra phương pháp chẩn đoán các tế bào cổ tử cung giai đoạn tiền ung thư. Phương pháp này dựa vào mẫu xét nghiệm Pap để có thể xác định các tế bào cổ tử cung tiền ung thư, nhằm đem lại hiệu quả điều trị cao cho người bệnh. Chương trình tầm soát tế bào học British Columbia ở Canada (www.chrcrm.org) đã chỉ ra rằng tỷ lệ tử vong và tình trạng bệnh tật giảm đi đáng kể khi đưa việc khám sàng lọc Pap vào khu dân cư tại British Columbia. Do đó mà hiện nay, phương pháp này được sử dụng phổ biến trên toàn thế giới không chỉ vì hiệu quả của nó, mà còn vì giá thành của nó rẻ. Tại Đan Mạch, mặc dù có chương trình khám sàng lọc trên diện rộng, nhưng mỗi năm lại có hơn 500 ca mới được phát hiện, trong đó có khoảng 5% chẩn đoán âm tính giả (không tìm ra bệnh). Cách hiệu quả nhất để khắc phục vấn đề này là thực hiện tầm soát lại toàn bộ mẫu xét nghiệm bằng phương pháp thủ công. Tuy nhiên, điều này khó có thể thực hiện được vì vấn đề chi phí và số lượng bác sĩ giải phẫu bệnh. Vì vậy, việc khảo sát tự động bằng máy tính là một biến đổi lớn. Một số hệ thống chẩn đoán ung thư cổ tử cung tự động và bán tự động cũng đã hoàn thành, nhưng chi phí cho chúng lại đắt hơn chi phí đào tạo bác sĩ chuyên khoa. Do đó mà khoa Giải phẫu bệnh của trường đại học Herlev kết hợp với công ty thương mại DIMAC đã thực hiện cơ sở dữ liệu gồm các ảnh tế bào cổ tử cung cùng kết quả phân lớp loại tế bào chính xác để có thể phát triển các ứng dụng công nghệ thông tin trong lĩnh vực này. Đề tài này sử dụng toàn bộ dữ liệu lấy từ đây. Hệ thống suy luận mờ sẽ sử dụng bộ dữ liệu này để thực hiện phân lớp tế bào cổ tử cung. 1.2.Mục đích của đề tài Đề tài được thực hiện với một số mục đích sau: ¾ Phát hiện những tế bào cổ tử cung có thay đổi bất thường, và xác định mức độ thay đổi của chúng (nhẹ, vừa, nặng), những thay đổi này còn gọi là loạn sản và chúng cũng chính là nguyên nhân gây ra ung thư cổ tử cung sau này. KH OA C NT T – Đ H KH TN Trang 11 ¾ Giảm tỷ lệ chẩn đoán âm tính giả và dương tính giả ¾ Giúp các sinh viên y khoa dễ dàng tiếp cận với việc chẩn đoán tế bào học, giảm thiểu được chi phí đào tạo, huấn luyện bác sĩ ¾ Giúp các bác sĩ giải phẫu bệnh kiểm tra lại các mẫu xét nghiệm đã chẩn đoán; và nếu được thử nghiệm nhiều thì chương trình có thể thực hiện sàng lọc bước đầu, loại bỏ những mẫu xét nghiệm không nghi vấn và các bác sĩ chỉ cần kiểm tra lại các mẫu có những thay đổi bất thường. 1.3.Mẫu xét nghiệm Pap Xét nghiệm Pap là một phương pháp y khoa dùng để xác định ung thư cổ tử cung trong giai đoạn tiến triển sớm. Nó có ý nghĩa rất lớn trong vấn đề y tế cộng đồng vì thực hiện đơn giản và chi phí rẻ. 1.3.1.Mục đích thực hiện xét nghiệm Pap Mục đích của việc khám sàng lọc bằng mẫu xét nghiệm Pap là nhằm chẩn đoán các thay đổi “ác tính” trong tế bào ở giai đoạn tiền ung thư trước khi chúng tiến triển thành ung thư. 1.3.2.Cách thực hiện mẫu xét nghiệm Pap Dùng chổi y khoa hoặc que gỗ lấy mẫu xét nghiệm từ cổ tử cung, quét lên một miếng thủy tinh mỏng, hình chữ nhật để thu được một mẫu Pap. Mẫu này sau đó sẽ được nhuộm theo phương pháp Papanicolaou. Bằng cách này, đặc điểm của những tế bào khác nhau sẽ có màu khác nhau, dễ phân biệt dưới kính hiển vi. Sau đó, các bác sĩ giải phẫu bệnh sẽ khảo sát trực tiếp trên kính hiển vi. Việc này làm tốn nhiều thời gian mà tỷ lệ lỗi lại rất cao khi mà mỗi mẫu như vậy có thể chứa đến 300000 tế bào. KH OA C NT T – Đ H KH TN Trang 12 1.3.3.Các tế bào trong mẫu xét nghiệm Pap 1.3.3.1.Cấu trúc cổ tử cung Cổ tử cung được trải bởi các mô tế bào gai và mô tế bào trụ, trong đó mỗi mô gồm nhiều loại tế bào khác nhau. Mô tế bào gai được tìm thấy ở phần dưới của cổ tử cung, trái lại mô tế bào trụ được tì