Bài giảng Xử lý ảnh - Chương 18: Nhận dạng mẫu - Phân đoạn ảnh

18.1. GIỚI THIỆU Từ trước đến nay, trong cuốn sách này, chúng ta đã xem xét những phương pháp chủ yếu để cải thiện ảnh hiển thị. Trong chương 16, tham vọng chúng ta là đạt được một ảnh gần giống hơn so với ảnh ban đầu, ảnh không suy biến. Trong chương này và hai chương tiếp theo, chúng ta sẽ đưa ra một vài hướng phân tích nội dung của một ảnh. Nghĩa là chúng ta cố gắng tìm ra những gì có trong ảnh. Chúng ta sẽ xem xét hai cách tiếp cận, nhận dạng mẫu thống kê và mạng nơ ron, mỗi một phương pháp đều có thể áp dụng vào ảnh số. Các cuốn sách đã viết nhiều về cả hai phương pháp này, giúp độc giả những người mong muốn tiếp tục tìm hiểu với những giới thiệu về lĩnh vực này rất nhiều. Trong 3 chương về nhận dạng mẫu này, chúng ta sẽ đưa ra một tập các chủ đề về lĩnh vực này. Trong thực tế, chúng ta nghiên cứu nhận dạng mẫu thống kê, được thực hiện bằng các kỹ thuật xử lý ảnh số. Việc này trước hết bao gồm việc định vị và cô lập các đối tượng trong một ảnh và sau đó nhận biết (phân loại) những đối tượng đó sử dụng kỹ thuật dựa trên lý thuyết quyết định thống kê. Chúng ta cũng xem qua việc sử dụng mạng nơ ron nhân tạo cho việc nhận dạng mẫu.

30 trang | Chia sẻ: thanhle95 | Lượt xem: 337 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Bài giảng Xử lý ảnh - Chương 18: Nhận dạng mẫu - Phân đoạn ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

350 Ch¬ng 18 NHẬN DẠNG MẪU: PHÂN ĐOẠN ẢNH 18.1. GIỚI THIỆU Từ trước đến nay, trong cuốn sách này, chúng ta đã xem xét những phương pháp chủ yếu để cải thiện ảnh hiển thị. Trong chương 16, tham vọng chúng ta là đạt được một ảnh gần giống hơn so với ảnh ban đầu, ảnh không suy biến. Trong chương này và hai chương tiếp theo, chúng ta sẽ đưa ra một vài hướng phân tích nội dung của một ảnh. Nghĩa là chúng ta cố gắng tìm ra những gì có trong ảnh. Chúng ta sẽ xem xét hai cách tiếp cận, nhận dạng mẫu thống kê và mạng nơ ron, mỗi một phương pháp đều có thể áp dụng vào ảnh số. Các cuốn sách đã viết nhiều về cả hai phương pháp này, giúp độc giả những người mong muốn tiếp tục tìm hiểu với những giới thiệu về lĩnh vực này rất nhiều. Trong 3 chương về nhận dạng mẫu này, chúng ta sẽ đưa ra một tập các chủ đề về lĩnh vực này. Trong thực tế, chúng ta nghiên cứu nhận dạng mẫu thống kê, được thực hiện bằng các kỹ thuật xử lý ảnh số. Việc này trước hết bao gồm việc định vị và cô lập các đối tượng trong một ảnh và sau đó nhận biết (phân loại) những đối tượng đó sử dụng kỹ thuật dựa trên lý thuyết quyết định thống kê. Chúng ta cũng xem qua việc sử dụng mạng nơ ron nhân tạo cho việc nhận dạng mẫu. 18.1.1. Nhận dạng mẫu thống kê Chi nhánh thị giác máy của lĩnh vực trí tuệ nhân tạo được nghiên cứu bằng cách phát triển các thuật giải phân tích nội dung ảnh. Một sự đa dạng của những phương pháp tiếp với mục đích hiểu ảnh đã được dùng, nhưng việc hiểu nó là nền tảng cho sự nhận thức toàn bộ quá trình nhận dạng mẫu, tuy nhiên nó có thể được thực hiện. Nhận dạng mẫu thống kê giả thiết rằng ảnh có thể chứa một hay nhiều đối tượng và mỗi đối tượng đó thuộc một trong các kiểu, các loại hay các lớp mẫu đã định nghĩa trước đây. Trong khi có thể thực hiện nhận dạng mẫu bằng nhiều cách, chúng ta chỉ quan tâm tới việc thực hiện nó bằng các kỹ thuật xử lý ảnh số. Cho một ảnh số có chứa một vài đối tượng, quá trình nhận dạng mẫu gồm có 3 pha chính. (Xem Hình 18-1) Pha đầu tiên được gọi là phân đoạn ảnh hay cô lập đối tượng, trong đó mỗi đối tượng được tìm ra và ảnh của nó tách ra khỏi cảnh còn lại. Pha thứ hai gọi là trích chọn đặc trưng. Đây là pha mà các đối tượng được đo lường. Một số đo là giá trị của một tính chất nào đó có thể xác định số lượng của một đối tượng. Một đặc trưng là một hàm của một hay nhiều số đo, được tính toán sao cho nó có thể nó xác định được một tính chất quan trọng nào đấy của đối tượng. Quá trình trích chọn đặc trưng tạo ra một tập các đặc trưng, cùng nhận được, bao gồm vec tơ đặc trưng. Điều này đã làm giảm khối lượng thông tin (so với ảnh ban đầu) biểu diễn mọi tin tức mà các quyết định thống kê phải dựa vào đó. Thật là hữu ích để nhận thức hoá một không gian n chiều mà trong đó mọi vec tơ đặc trưng n phần tử có thể có đều tập trung vào. Vì thế, một đối tượng riêng biệt bất kỳ đều tương ứng với một điểm trong không gian đặc trưng. Pha thứ ba trong nhận dạng mẫu là phân loại, đầu ra của nó chỉ đơn thuần là một quyết định về lớp các đối tượng. Mỗi đối tượng được coi như thuộc một loại cụ thể, và sự nhận dạng được thực hiện như một quá trình phân loại. Từng đối tượng được 351 ấn định vào một trong nhiều nhóm (lớp) đã thiết lập trước đó biểu diễn cho tất cả các loại đối tượng có thể có trong ảnh. Một lỗi không phân loại nhầm sẽ xảy ra nếu đối tượng bị ấn định vào một lớp không thích hợp. Khả năng để xảy ra điều này là tỉ số lỗi phân loại nhầm. Sự phân loại chỉ dựa vào vec tơ đặc trưng. Trong hai chương tiếp theo, chúng ta sẽ xem xét kỹ thuật phân loại xuất phát từ các phạm trù trong lý thuyết quyết định thống kê và mạng nơ ron. HÌNH 18-1 Hình 18-1 Ba pha nhận dạng mẫu 18.1.2. Ví dụ về nhận dạng mẫu Các khái niệm cơ bản về nhận dạng mẫu thống kê có thể được minh hoạ tốt nhất bằng một ví dụ. Giả sử chúng ta muốn thực hiện một hệ thống sắp xếp trái cây đổ xuống trên một băng truyền. Việc sắp xếp thực sự có thể bị ảnh hưởng bởi các phần có thể di chuyển từ trên xuống và làm chệch hướng đi của các loại trái cây khác nhau ra khỏi băng truyền và rơi vào trong các hộp chuyên chở thích hợp, như minh hoạ trong hình 18-2. Hãy giả sử rằng đó là các quả là các trái anh đào, các quả táo, chanh và các quả nho. Những gì chúng ta cần là một hệ thống xử lý ảnh mà có thể quan sát các quả đang đến gần, phân ra từng loại và thả phần đã phân loại thích hợp đúng lúc vào hộp đựng trái cây tương ứng. HÌNH 18-2 Hình 18-2 Hệ thống sắp xếp trái cây Chúng ta có thể cài đặt một camera truyền hình số trên băng truyền và thực hiện quyết định phân loại bằng một máy tính. Với ví dụ này, hãy xác định hai tham số cho từng mẫu trái cây: đờng kính và màu sắc của nó. Chương trình máy tính sẽ xử lý 352 từng ảnh số hoá và tính đường kính trái cây theo đơn vị milimet và một tham số biểu thị màu sắc. Giả sử chúng ta sử dụng một camera TV màu và chương trình tính độ sáng của từng đối tượng theo các kênh đỏ, lục và lam. (Xem chương 21) Sau đó có thể nhận được một đặc trưng (ví dụ tỷ lệ độ sáng đỏ-lục) nhận các giá trị thấp cho quả màu vàng và các giá trị cao cho quả màu đỏ. Chúng ta có thể gọi tham số này là độ đo sắc đỏ. Hình 18-3 cho thấy không gian hai đặc trưng chiều định nghĩa bằng hai tham số, đường kính và sắc đỏ, và các nhóm được đưa ra tương ứng với mỗi một trong bốn lớp quả. Bằng cách đặt các đường quyết định xấp xỉ trong không gian đặc trưng, chúng ta có thể phân chia nó ra thành mỗi vùng thuộc một lớp và thiết lập một quy tắc phân loại. Khi một quả nào đó đến gần camera TV, nó sẽ được xác định, và các đặc trưng xác định một điểm trong không gian hai chiều. Tuỳ thuộc vào nơi mà điểm này nằm trong không gian, mà trái cây được ấn định vào một trong bốn lớp. Ngay khi quyết định phân loại được thực hiện, cơ chế bỏ vào phần mà sau đó sẽ được làm lệch hướng đi để đẩy quả vào trong thùng chứa thích hợp. HÌNH 18-3 Hình 18-3 Không gian đặc trưng Trong khi hệ thống tiền xử lý không được sử dụng rộng rãi trong ngành công nghiệp đóng gói trái cây, nhưng nó đáp ứng được việc minh hoạ nhận dạng mẫu thống kê. Vai trò của thống kê trong thiết kế và hoạt động của hệ thống sẽ trở nên rõ ràng hơn ở hai chương tiếp theo. Bây giờ đủ điều kiện để nói rằng mỗi lớp quả tạo ra một PDF trong không gian đặc trưng. Các dòng quyết định có thể được xác định, từ tác động qua lại giữa các PDF đó, theo cách để tránh hay có ít ra là tối thiểu hoá, các lỗi phân loại nhầm. 18.1.3. Thiết kế hệ thống nhận biết mẫu Thiết kế một hệ thống nhận biết mẫu thường được thực hiện theo năm bước liệt kê trong bảng 18.1: thiết kế bộ định đối tượng, chọn lựa đặc trưng, thiết kế bộ phân loại và thực hiện việc đánh giá. Bộ định vị đối tượng là thuật toán tách ảnh của đối tượng riêng biệt trong một ảnh phức hợp. Việc phân tách các đối tượng được gọi là phân đoạn ảnh hay phân đoạn cảnh, sẽ được trình bày trong chương này. Chọn lựa đặc trưng có tác dụng quyết định thuộc tính của đối tượng (kích thức, hình dạng,). điểm khác biệt nhất giữa các lớp đối tượng cần phải tính toán. Thiết kế bộ phân loại bao gồm việc thiết lập một cơ sở toán học cho thủ tục phân loại. Các tham số có thể điều chỉnh (ngưỡng quyết định) của chính bộ phân loại bắt buộc phải có trong công đoạn huấn luyện bộ lọc. 353 Cuối cùng, nó thường cần được thiết lập các tỷ lệ lỗi phân loại khi hệ thống hoạt động. Đây là bước thực hiện việc đánh giá. 18.2. QUÁ TRÌNH PHÂN ĐOẠN ẢNH Chúng ta có thể định nghĩa quá trình phân đoạn ảnh như là việc phân chia một ảnh số thành các vùng rời nhau (không chờm lên nhau). Đối với mục đích của chúng ta, một vùng là một tập liên thông của các điểm ảnh-tức là, một tập trong đó tất cả các điểm ảnh gần kề hay sát nhau. Định nghĩa chuẩn của tính liên thông như sau: giữa hai điểm ảnh bất kỳ trong một tập liên thông, tồn tại một đường liên thông trong phạm vi tập, ở đó một đường liên thông là một đường luôn luôn di chuyển giữa các điểm ảnh lân cận. Do đó, trong một tập liên thông, bạn có thể tìm thấy một đường liên thông giữa hai điểm ảnh bất kỳ trong tập. BẢNG 18-1 THIẾT KẾ HỆ THỐNG NHẬN DẠNG MẪU Bước Hàm 1. Thiết kế bộ định vị đối tượng Chọn thuật giải phân đoạn ảnh để phân tách các đối tượng riêng biệt trong ảnh. 2. Lựa chọn đặc trưng Quyết định các tính chất đối tượng mà có thể phân biệt các loại đối tượng tốt nhất và làm thế nào để đo lường chúng. 3. Thiết kế bộ phân loại Thiết lập cơ sở toán học cho thuật giải phân loại, và lựa chọn kiểu cấu trúc của bộ phân loại để sử dụng. 4. Huấn luyện bộ phân loại Cố định các tham số điều chỉnh khác nhau (các đường biên quyết định,) trong bộ phân loại cho phù hợp với đối tượng được phân loại. 5. Đánh giá hiệu suất Đánh giá tỷ số các lỗi phân loại nhầm có thể nhận được khác nhau. Có hai quy tắc liên thông, và một trong số đó có thể chấp nhận. Nếu chỉ các điểm lân cận bên (trên, dưới, trái, phải) được coi là thuộc liên kết, thì đây là liên thông 4 và các đối tượng là liên kết 4. Vì thế, mỗi điểm ảnh chỉ có 4 lân cận để có thể liên kết. Thêm vào đó, nếu các điểm ảnh lân cận chéo (lân cận 450) cũng được tính đến trong liên kết thì chúng ta có liên thông 8, và các đối tượng là liên kết 8. Mỗi điểm ảnh có 8 lân cận để có thể liên kết. Cũng có thể sử dụng quy tắc liên thông kia, miễn là thích hợp. Thông thường liên thông 8 mang lại kết quả được coi là gần với trực giác của con người hơn cả. Khi một người quan sát một cảnh, quá trình xử lý đặt trong hệ thống thị giác sẽ phân đoạn cảnh đó cho người đó. Việc này được thực hiện hiệu quả đến nỗi ta trông nó không như một cảnh phức tạp, nhưng đúng hơn là người ta coi điều đó như là tập hợp cáca đối tượng. Tuy nhiên, bằng xử lý số, chúng ta phải tách các đối tượng trong một ảnh bằng cách phân chia ảnh thành tập các điểm ảnh, mỗi tập là ảnh của một đối tượng. Trong khi công việc phân đoạn ảnh hầu như không có bản sao trong kinh nghiệm nhìn nhận của con người, thì đây là một công việc không tầm thường trong phân tích ảnh số. Phân đoạn ảnh có thể tiếp cận từ ba lý thuyết phối cảnh khác nhau. Trong trường hợp chúng ta tiếp cận vùng, ta ấn định mỗi điểm ảnh cho một đối tượng hay vùng cụ thể. Trong phương pháp tiếp cận đường biên, ta chỉ thử định vị các đường biên đã có giữa các vùng. Trong phương pháp tiếp cận đỉnh, ta có thể tìm cách nhận biết các điểm biên và sau đó liên kết chúng với nhau tạo thành đường biên cần có. Tất cả ba cách tiếp cận đều hữu dụng trong việc nhìn nhận vấn đề. 354 Trong chương này, chúng ta xem xét một vài kỹ thuật phân tách các đối tượng trong một ảnh số. Mỗi lần phân tách, các đối tượng có thể được đo lường và phân loại. Các kỹ thuật cho những hoạt động này được chỉ ra trong hai chương tiếp theo. 18.3. PHÂN ĐOẠN ẢNH BẰNG PHÂN NGƯỠNG Phân ngưỡng là một kỹ thuật phổ biến để tiếp cận vùng, hữu ích đối với những cảnh có chứa những đối tượng đồng màu trên nền tương phản. Mục đích là để đơn giản trong tính toán và luôn xác định được những vùng có các đường biên đóng và liên thông. Khi sử dụng qui tắc phân ngưỡng để phân vùng ảnh, người ta ấn định tất cả những điểm ảnh nằm bên trên mức xám ngưỡng thuộc về đối tượng. Còn tất cả những điểm ảnh không nằm trên mức xám ngưỡng sẽ nằm ngoài đối tượng. Đường bao là tập tất cả những điểm nằm bên trong và mỗi điểm có ít nhất một điểm lân cận nằm ngoài đối tượng. Phân ngưỡng sẽ được thực hiện hoàn hảo nếu đối tượng được xét có mức xám bên trong đồng nhất và nằm trên nền có mức xám đồng nhất khác. Nếu một vài tính chất (ngoài mức xám, tính kết cấu chẳng hạn) của các đối tượng khác nền của chúng, thì đầu tiên người ta có thể chuyển đổi tính chất đó thành mức xám. Sau đó tiến hành phân ngưỡng mức xám để có thể phân vùng ảnh. 18.3.1. Phân ngưỡng tổng thể Trong quá trình xác định đường biên bằng phân ngưỡng đơn giản nhất, giá trị mức xám ngưỡng là hằng số được sử dụng trong toàn bộ ảnh. Nếu mức xám nền là hằng số hợp lý và nếu các đối tượng đều có độ tương phản xấp xỉ bằng nhau, thì một ngưỡng tổng thể cố định thường được dùng để qui định mức xám ngưỡng hợp lý được chọn. 18.3.2. Phân ngưỡng thích nghi Trong nhiều trường hợp mức xám nền không phải là hằng số và độ tương phản của các đối tượng trong ảnh hoàn toàn khác nhau, thường xảy ra trường hợp một ngưỡng áp dụng thích hợp cho một vùng ảnh này nhưng lại không thích hợp cho những vùng khác. Trong những trường hợp đó, thuận tiện nhất là sử dụng mức xám ngưỡng là một hàm biến thiên chậm theo vị trí trong ảnh. Hình 18-4 cho thấy ảnh hiển vi của các nhiễm sắc thể từ một tế bào máu người. Trong ảnh này, mức xám nền thay đổi do sự chiếu sáng không đồng đều và độ tương phản thay đổi từ nhiễm sắc thể này sang nhiễm sắc thể khác. Trong hình 18-4a, một mức xám ngưỡng không đổi được sử dụng cho toàn bộ ảnh để phân tách các nhiễm sắc thể. Mỗi nhiễm sắc thể được bao bởi một đường và một dãy số. Trong hình 18- 4b, ngưỡng được thay đổi từ nhiễm sắc thể này sang nhiễm sắc thể khác tương xứng với nền cục bộ và độ tương phản của nhiễm sắc thể. Điều này đã tạo ra một vài sai số phân đoạn-trong đó nhiều nhiễm sắc thể bị dính vào nhau hay các nhiễm sắc thể riêng biệt bị phá vỡ. Một nghiên cứu tương tự cho thấy rằng độ chính xác của phép đo diện tích các nhiễm sắc thể đã được cải tiến bằng phân ngưỡng thích nghi. Trong hình 18-4b, ngưỡng đối với mỗi nhiễm sắc thể được đặt xấp xỉ mức trung bình giữa mức xám trung bình của đối tượng và mức xám nền cục bộ. 18.3.3. Lựa chọn ngưỡng tối ưu Trừ phi đối tượng trong ảnh có các mặt cực kỳ dốc đứng, còn thì giá trị chính xác của mức xám ngưỡng có thể có tác động đáng kể lên vị trí đường biên và toàn bộ kích thước đối tượng được trích chọn. Nghĩa là các số đo kích thước liên tiếp-khu vực riêng biệt-nhạy cảm với mức xám ngưỡng. Vì lý do đó mà chúng ta cần sự tối ưu hay ít ra cũng là phương pháp thiết lập ngưỡng. 355 HÌNH 18-4 Hình 18-4 Phân ngưỡng tổng thể và thích nghi 18.3.3.1. Kỹ thuật lược đồ mức xám Một ảnh chứa một đối tượng trên nền tương phản có lược đồ mức xám nhị thức (bimodal) (hình 18-5). Hai đỉnh tương ứng với số lượng tương đối lớn các điểm trong và ngoài đối tượng. Vùng lõm giữa các đỉnh tương ứng với các điểm tương đối ít xuất hiện xung quanh biên của đối tượng. Trong các trường hợp như thế này, lược đồ mức xám thường được dùng để thiết lập mức xám ngưỡng. Diện tích một đối tượng xác định bởi mức xám ngưỡng T là    T dDDHA )( (18.1) Lưu ý rằng việc tăng ngưỡng T thêm một lượng T chỉ hơi làm giảm diện tích nếu ngưỡng tương ứng với vùng lõm trong lược đồ mức xám. Bởi vậy, việc lấy ngưỡng tại vùng lõm của lược đồ sẽ tối thiểu hoá tính nhậy cảm của phép đo vùng với các sai số nhỏ trong sự chọn ngưỡng. Hình 18-5 Lược đồ mức xám nhị thức Nếu ảnh hay vùng trong ảnh chứa đối tượng bị nhiễu và không lớn lắm thì chính lược đồ mức xám sẽ bị nhiễu. Nhiễu sẽ làm mờ đi vị trí của vùng lõm, trừ phi vùng lõm rõ nét một cách khác thường. Điều này có thể khắc phục trong một phạm vi nào đó bằng cách làm trơn lược đồ mức xám, bằng cách sử dụng tích chập hay bằng một thủ tục điều chỉnh đường cong. Nếu hai đỉng có kích thước không giống nhau, thì việc làm trơn có xu hướng dịch chuyển vị trí rất ít. Tuy nhiên, dễ dàng định vị các đỉnh và tương đối ổn định khi làm trơn. Một phương pháp có khả năng tin cậy hơn để đặt ngưỡng tại một vị trí cố định nào đó liên quan tới hai đỉnh-có lẽ là điểm giữa. hai đỉnh thể hiện phương thức (xuất hiện nhiều nhất) các mức xám của các điểm bên trong và bên ngoài đối tượng. Nói chung, các tham số này có thể được đánh giá chính xác hơn mức xám thường ít xuất hiện nhất-tức là vùng lõm trong lược đồ.    T dDDHA )( A )(DH bD 0DTTT  D 356 Người ta có thể tạo thành một lược đồ mức xám chỉ có những điểm có độ lớn gradient tương đối cao, ví dụ 10% cao nhất. Việc này ước lượng số lượng lớn điểm ảnh bên trong và bên ngoài dtvà có thể làm cho vùng lõm trên lược đồ dễ truy cập hơn. Người ta cũng có thể chia lược đồ theo gradient trung bình của những điểm ảnh tại mỗi mức xám để tăng cường vùng lõm hơn nữa hay lấy mức xám trung bình của những điểm ảnh có gradient cao để xác phân ngưỡng. Bộ lọc Laplace là một toán tử đạo hàm bậc hai hai chiều. Lọc Laplace theo sau làm trơn và phân ngưỡng tại mc bằng 0 hay cao hơn một chút có xu hướng phân vùng đối tượng tại các chéo 0 của đạo hàm bậc hai, tương ứng với những điểm uốn trên các biên của đối tượng. Lược đồ hai chiều của mức xám và gradient cũng có thể được dùng để thiết lập tiêu chuẩn phân đoạn. 18.3.3.2. Phân ngưỡng thích nghi Kỹ thuật phân vùng thích nghi trong hình 18-4b được thực hiện bằng kỹ thuật hai bước. Trước khi qua bước thứ nhất, ảnh được chia làm nhiều khu vực 100  100 điểm ảnh. Từ lược đồ mức xám của mỗi khu vực, một ngưỡng được xác định giữa đỉnh nền và đỉnh dữ liệu. Các khu vực chứa các lược đồ đơn thức đều bị bỏ qua. Trong bước thứ nhất, các đường biên của đối tượng đã định nghĩa sử dụng ngưỡng mức xám là một hằng số trong phạm vi khu vực, nhưng khác các khu vực còn lại. Các đối tượng định nghĩa như vậy không được trích chọn từ ảnh, nhưng mức xám bên trong trung bình của mỗi đối tượng được tính đến. Trong bước thứ hai, mỗi đối tượng được lập ngưỡng của chính nó nằm giữa mức mức xám bên trong và mức xám của nền của khu vực chính. Xem xét trong hình 18- 4 cho thấy rằng số các chi tiết nhỏ giảm từ bảy xuống còn hai, trong khi số các tan rã giảm từ một tới không. 18.3.4. Phân tích các điểm Trong nhiều trường hợp quan trọng, đây là điều cần thiết để tìm ra các đối tượng có hình dạng gần như tròn. Việc phát triển dưới đây chủ yếu tập trung vào các đối tượng hình tròn. Hạn chế của chúng ta đối với các đối tượng hình tròn cho phép ta tiếp tục lựa chọn ngưỡng tối ưu hơn là những ngỡng khác. Các khái niệm đã trình bày dù sao cũng hữu ích đối với nhiều trường hợp tổng quát hơn. 18.3.4.1. Định nghĩa Giả sử một ảnh B(x,y) chứa một điểm đơn. Theo định nghĩa, ảnh này chứa một điểm (x0,y0) có mức xám cực đại. Nếu chúng ta thiết lập toạ độ cực có tâm là (x0,y0), sao cho ảnh được cho bởi Bp(r,), thì     ,, 21 rBrB pp  nếu r2 > r1 (2) với mọi . Chúng ta gọi B(x,y) là điểm đơn điệu nếu dấu đẳng thức không xảy ra trong biểu thức (2). Nghĩa là mức xám hoàn toàn giảm theo một đường kéo dài ra theo hướng bất kỳ từ tâm (x0,y0). Đối với các điểm đơn điệu, không có một đỉnh bằng phẳng, và (x0,y0) là duy nhất. Một trường hợp đặc biệt quan trọng có thể xảy ra nếu tất cả các đường viền của một điểm đơn điệu là những đường tròn tâm (x0,y0). Chúng ta gọi trường hợp đặc biệt đó là điểm đường tròn đồng tâm (concentric circular spot-CCS). Với ý nghĩa gần đúng, điều này thường miêu tả ảnh không nhiễu của các vì sao trong kính thiên văn, các tế bào nào đó trong kính hiển vi và rất nhiều loại ảnh quan trọng khác. Nhiễu thường làm cho các ảnh thực sai khác với các định nghĩa của chúng, nhưng dù sao lý thuyết cũng có thể chứng tỏ tính hữu ích. Đối một CCS, hàm Bp(r,) độc lập đối với , ta gọi nó là hàm chiếu điểm. Đường cong này có ích cho chọn lựa ngưỡng. Ví dụ, chúng ta có thể xác định điểm uốn và 357 chọn ngưỡng mức xám để đặt đường biên tại điểm có độ dốc lớn nhất. Đây là sự gầm đúng mà mắt người có thể phân biệt được đường biên khi xem một ảnh chứa cạnh trơn, và đó là sự khá ổn định dưới tác động của việc làm trơn và thêm nhiễu. Đường bao này có thể đánh giá không đúng mức kích thước thật sự của các đối tượng. Các điểm duy nhất khác thuộc hình chiếu, ví dụ như độ lớn cực đại của đạo hàm bậc hai cũng có thể được sử dụng. Nếu chúng ta phân ngưỡng một điểm đơn điệu tại một mức xám T, chúng ta định nghĩa một đối tượng có một diện tích và chu vi xác định. Khi chúng ta thay đổi T trong bộ dải mức xám, chúng ta tạo ra hàm diện tích ngưỡng A(T) và hàm chu vi ngưỡng p(T). Cả hai hàm này