Bài giảng môn Xử lý ảnh số - Chương 6: Phân đoạn ảnh (phần 1)
1. Giới thiệu bài toán phân đoạn 2. Các phương pháp phân đoạn gray-level thresholding edge-based region-based Probabilistic: xác suất
Bạn đang xem trước 20 trang tài liệu Bài giảng môn Xử lý ảnh số - Chương 6: Phân đoạn ảnh (phần 1), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương 6:
PHÂN ĐOẠN ẢNH
(P1)
Võ Quang Hoàng Khang
TPHCM - 2016
1. Giới thiệu bài toán phân đoạn
2. Các phương pháp phân đoạn
gray-level thresholding
edge-based
region-based
Probabilistic: xác suất
Mục đích chính của phân đoạn ảnh.
Áp dụng được kỹ thuật phân đoạn ảnh dựa trên
ngưỡng*
Giải thích được kỹ thuật phân đoạn ảnh dựa trên cạnh.
Giải thích được kỹ thuật phân đoạn ảnh dựa trên vùng.
Áp dụng được phương pháp region growing*
Áp dụng được phương phápWatershed*
Giải thích được kỹ thuật phân đoạn ảnh dựa trên
matching.
3
Phân đoạn nhằm chia ảnh thành các vùng hoặc
đối tượng có thể xử lý được.
Nếu phân đoạn tốt, các contours của đối tượng sẽ
xuất hiện và có thể trích để sử dụng.
Có thể xác định hình dáng đối tượng.
Dựa trên màu sắc, texture, có thể xác định rõ đối
tượng.
Phân đoạn ảnh được sử dụng nhiều trong tìm
kiếm tương tự (similarity searches)
Phân đoạn ảnh là bài toán khó trong xử lý ảnh.
Vẫn là một chủ đề quan trọng trong các hội
thảo/hội nghị liên quan đến thị giác máy tính, xử lý
ảnh.
Phân đoạn cho phép trích xuất các đối tượng trong
ảnh.
Các thuật toán phân đoạn dựa trên các tính chất cơ
bản: màu sắc, giá trị xám, hay texture: discontinuity
và similarity .
Phân chia ảnh dựa trên sự thay đổi độ sáng đột
ngột, nhằm phát hiện biên trong ảnh. Tuy nhiên,
không luôn xác định được biên để tạo vùng.
Phân chia ảnh thành các vùng tương tự theo tiêu
chuẩn xác định (mức xám, texture, color,).
Dựa trên sự tương tự giữa các pixel kề nhau nhằm
xây dựng các đối tượng.
Kiểu phân đoạn phụ thuộc vào ứng dụng
Có nhiều thuật giải phân đoạn
Phân đoạn dựa trên đường viền vùng (edge detection)
Phân đoạn dựa trên clustering (hoặc grouping)
Phân đoạn dựa trên phân hoạch (partition) đồ thị
Ứng dụng: finding people, summarizing video,
annotation figures, background subtraction,
finding buildings/rivers in trong ảnh vệ tinh.
Edges dựa trên KHÁC NHAU (DIFFERENCES hay
DISCONTINUITY) giữa các pixel kề nhau.
Regions dựa trên sự TƯƠNG TỰ (SIMILARITIES)
giữa các pixel kề nhau.
Phân đoạn bằng mắt
thường
Old man và các thứ
khác ???
Hai người và con
chó ???
Input: ảnh xám
Output: ảnh nhị phân
Mục đích: tách được foreground và background.
Thực hiện bằng cách chọn ngưỡng T, và tạo ảnh
ouput theo công thức:
Tyxfif
Tyxfif
yxg
),( 0
),( 1
),(
Imagine a poker playing robot that needs to visually
interpret the cards in its hand
Original Image Thresholded Image
Nếu chọn ngưỡng sai kết quả có thể là thảm họa ???
Threshold Too Low Threshold Too High
g i, j
1 for f i, j T
0 for f i, j T
g i, j
1 for f i, j T
0 for f i, j T
g i, j
f i, j for f i, j T
0 for f i, j T
Phương pháp này chỉ làm việc tốt với ảnh có bi-model
histogram, ít nhiễu.
Có thể dùng nhiều ngưỡng Ti (xem xét sau)
ngưỡng T
Các tiêu chuẩn lựa chọn ngưỡng T:
Xác suất lỗi cực tiểu
Giá cực tiểu
Phương sai trong nhóm cực tiểu
Kiểm tra bằng mắt
Ngưỡng toàn cục T được xác định như sau:
1. Chọn ngưỡng ban đầu T
Ví dụ: chọn trung bình mức xám của tất cả pixel
2. Phân đoạn với ngưỡng T sẽ tạo ra 2 nhóm: G1 gồm các
pixels với mức xám >T và G2 gồm các pixel với mức
xám ≤ T
3. Tính mức xám trung bình của các pixel của G1 là μ1 và
G2 là μ2
4. Tính ngưỡng mới:
5. Lặp lại bước 2 - 4 cho đến khi sự thay đổi của T mới
so với T ở lần trước đó nhỏ hơn giá trị cho trước
2
21 T
Một ngưỡng làm việc hiệu quả trên ảnh có bimodal
histogram
Với các ảnh có biểu đồ cần nhiều hơn 1 ngưỡng
Ví dụ: trích xuất nước
trong chai
Suy nghĩ về biểu đồ
Histogram cho loại
ảnh này?
Điều gì sẽ xảy ra nếu sử dụng một ngưỡng duy
nhất
Bài tập: Tìm hiểu kỹ thuật phân đoạn Otsu