19.1. GIỚI THIỆU
Trong chương 18, chúng ta đã giới thiệu về nhận dạng mẫu và đã đề cập đến sự
tách và trích các đối tượng từ một cảnh phức tạp. Trong chương này, chúng ta sẽ chỉ
ra những vấn đề về đo lường các đối tượng, để có thể nhận biết chúng thông qua các
số đo của chúng. Vấn đề này đã tốn rất nhiều giấy mực và ở đây chúng ta chỉ có thể
giới thiệu các khái niệm cơ bản mà thôi. Để nghiên cứu chi tiết hơn, độc giả nên
tham khảo tài liệu về phân tích ảnh. (Phụ lục 2)
19.2. ĐO LƯỜNG KÍCH THƯỚC
Trong phần này, chúng ta sẽ xem xét một vài đặc tính hữu dụng phản ảnh kích
thước một đối tượng. Những đặc tính này đã trở nên phổ biến vì chúng quan trọng
trong các bài toán nhận dạng mẫu khác nhau và chúng rất thích hợp cho phân tích
ảnh số.
Thứ nhất nó rất thuận tiện để tính giới hạn không gian dưới dạng các điểm ảnh và
giới hạn quang trắc (photometric) dưới dạng mức xám. Sau đó, chiều dài diện tích có
thể được xác định bằng cách nhân chúng với khoảng cách điểm ảnh hay diện tích
một điểm ảnh thích hợp. Đường cong xác định quang trắc của bộ số hoá có tác dụng
như một phương tiện chuyển đổi mức xám thành đơn vị quang trắc. Thường thì đây
là một biểu thức tuyến tính đơn giản. Các phép toán điểm bất kỳ (chương 6) được
thực hiện trên ảnh cũng phải được sáng tỏ trong sự xác định quang trắc.
21 trang |
Chia sẻ: thanhle95 | Lượt xem: 855 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Xử lý ảnh - Chương 19: Nhận dạng mẫu - Kích thước đối tượng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
380
Ch¬ng 19
NHẬN DẠNG MẪU:
KÍCH THƯỚC ĐỐI TƯỢNG
19.1. GIỚI THIỆU
Trong chương 18, chúng ta đã giới thiệu về nhận dạng mẫu và đã đề cập đến sự
tách và trích các đối tượng từ một cảnh phức tạp. Trong chương này, chúng ta sẽ chỉ
ra những vấn đề về đo lường các đối tượng, để có thể nhận biết chúng thông qua các
số đo của chúng. Vấn đề này đã tốn rất nhiều giấy mực và ở đây chúng ta chỉ có thể
giới thiệu các khái niệm cơ bản mà thôi. Để nghiên cứu chi tiết hơn, độc giả nên
tham khảo tài liệu về phân tích ảnh. (Phụ lục 2)
19.2. ĐO LƯỜNG KÍCH THƯỚC
Trong phần này, chúng ta sẽ xem xét một vài đặc tính hữu dụng phản ảnh kích
thước một đối tượng. Những đặc tính này đã trở nên phổ biến vì chúng quan trọng
trong các bài toán nhận dạng mẫu khác nhau và chúng rất thích hợp cho phân tích
ảnh số.
Thứ nhất nó rất thuận tiện để tính giới hạn không gian dưới dạng các điểm ảnh và
giới hạn quang trắc (photometric) dưới dạng mức xám. Sau đó, chiều dài diện tích có
thể được xác định bằng cách nhân chúng với khoảng cách điểm ảnh hay diện tích
một điểm ảnh thích hợp. Đường cong xác định quang trắc của bộ số hoá có tác dụng
như một phương tiện chuyển đổi mức xám thành đơn vị quang trắc. Thường thì đây
là một biểu thức tuyến tính đơn giản. Các phép toán điểm bất kỳ (chương 6) được
thực hiện trên ảnh cũng phải được sáng tỏ trong sự xác định quang trắc.
19.2.1. Diện tích và chu vi
Diện tích của một đối tượng nói chung là một phép đo kích thước đối tượng thích
hợp. Tuỳ thuộc vào đường bao của đối tượng mà một phép đo diện tích thường
không để ý đến những thay đổi mức xám bên trong. Chu vi của một đối tượng rất
hữu dụng trong việc phân biệt hình dạng đơn giản và phức tạp giữa các đối tượng.
Một đối tượng có hình dạng đơn giản sử dụng chu vi nhỏ hơn để bao quanh diện tích
của nó. Các phép đo diện tích và chu vi được tính toán dễ dàng trong suốt quá trình
trích một đối tượng từ một ảnh phân đoạn.
Định nghĩa đường bao. Trước khi chúng ta có thể chỉ rõ một thuật giải để đo
lường diện tích hay chu vi một đối tượng, chúng ta phải thiết lập một định nghĩa về
đường bao đối tượng. Đặc biệt, chúng ta phải đảm bảo rằng chúng ta sẽ không đo
lường chu vi một đa giác này và diện tích của đa giác khác. Vấn đề cần phải giải
quyết là, các điểm ảnh bao quanh hoàn toàn hay chỉ bao quanh từng phần của đối
tượng? Nói cách khác, đường bao thực sự của một đối tượng nối liền tâm các điểm
ảnh hay bao quanh các biên bên ngoài của chúng?
Diện tích tổng số điểm ảnh. Phép đo diện tích đơn giản nhất là đếm số lượng
điểm ảnh bên trong (và kể cả) đường bao. Chu vi tương ứng với định nghĩa này là
381
khoảng cách xung quanh phía ngoài tất cả các điểm ảnh. Bình thường, phép đo
khoảng cách này bao gồm một lượng lớn các chỗ rẽ ngoặt 900, do đó tạo ra một giá
trị chu vi quá mức.
Chu vi đa giác. Có lẽ một phương pháp tiếp cận thích hợp hơn để đo chu vi một
đối tượng là thiết lập đường bao đối tượng đa giác có đỉnh nằm tại tâm của từng điểm
ảnh bao quanh. Chu vi là tổng của các đoạn bên (p = 1) và các đoạn chéo
( 2p ). Tổng này có thể được tích luỹ trong khi trích đối tượng bằng cách mã
hoá phân doạn dòng (Xem phần 18.8.3) hay đi qua vòng quanh đường bao trong khi
xây dựng mã chuỗi (Xem phần 18.8.2). chu vi của một đối tượng là
oe NNp 2 (1)
trong đó Ne là số các đoạn chẵn và No là số các đoạn lẻ trong chuỗi mã đường bao
khi sử dụng quy ước của hình 18-30. Chu vi cũng được tính đơn giản từ các tệp phân
đoạn đối tượng bằng tổng khoảng cách tâm đến tâm các điểm ảnh liên tiếp nhau trên
đường bao.
Diện tích đa giác. Diện tích đa giác được định nghĩa theo tam điểm ảnh là tổng
số điểm ảnh trừ đimột nửa lượng điểm ảnh đường bao cộng thêm một; tức là
1
2
b
o
N
NA (2)
trong đó No và Nb là số lượng các điểm ảnh tương ứng thuộc đối tượng (bao gồm
cả các điểm ảnh bao) và trên đường bao. Chỗ đúng này của diện tích tổng số điểm
ảnh thừa nhận, tính trung bình, một nửa điểm ảnh bao nằm trong, một nửa ngoài đối
tượng. Hơn thế nữa, khi một đường cong kín quay bị ngang, một giá trị nữa của điểm
ảnh thuộc vùng nằm bên ngoài, là do độ lồi thực của đối tượng. Người ta có thể hiệu
chỉnh phép đo diện tích gần đúng xuất phát từ tổng số điểm ảnh bằng cách trừ đi một
nửa chu vi.
19.2.1.1. Tính diện tích và chu vi
Có một phương pháp đơn giản để tính diện tích và chu vi một đa giác theo một
đường đi của đa giác. Hình 19-1 minh hoạ trường hợp diện tích đa giác là tổng của
diện tích tất cả các tam giác do các đường nối các đỉnh với điểm (x0, y0) tuỳ ý tạo ra.
Không mất tính tổng quát, chúng ta có thể chọn điểm (x0, y0) là gốc hệ toạ độ của
ảnh.
Hình 19-2 giúp chúng ta có được một biểu thức diện tích một tam giác có một
đỉnh nằm tại gốc toạ độ. Các đường ngang và dọc chia khu vực thành những hình
chữ nhật. Một số hình nhận có đường chéo là các cạnh của tam giác. Vì thế, nửa diện
tích của mối hình chữ nhật như vậy nằm ngoài tam giác. Nhìn vào hình, ta có thể viết
2112221112 2
1
2
1
2
1 yyxxyxyxyxdA (3)
382
HÌNH 19-1
Hình 19-1 Tính diện tích đa giác
HÌNH 19-2
Hình 19-2 Tính diện tích tam giác
Khai triển và nhóm các số hạn, biểu thức này được đơn giản hoá thành
12212
1 yxyxdA (4)
Và diện tích tổng cộng trở thành
bN
i
iiii yxyxA
1
112
1 (5)
Trong đó Nb là số lượng các điểm biên.
Lưu ý rằng, nếu gốc toạ độ nằm ngoài đối tượng thì một tam giác đặc biệt nào đó
bao gồm cả một số vùng không thuộc đa giác. Cũng cần lưu ý rằng diện tích của mọt
tam giác đặc biệt có thể dương hay âm, tuỳ thuộc vào chiều đi của đường bao. Khi
một vòng kín bao quanh đường bao được tạo ra, tất cả những vùng nằm ngoài đối
tượng đều bị loại trừ ra.
Một tiếp cận đơn giản hơn cũng mang lại kết quả như vậy chính là nhờ định lý
Green. Định lý này xuất phát từ phép tính tích phân và phát biểu rằng diện tích được
bao bởi một đường cong kín trong mặt phẳng x, y được cho bởi tích phân kín
ydxxdyA 2
1 (6)
Trong đó tích phân được lấy theo đường cong kín. đối với các đoạn rời, biểu thức
(6) trở thành
383
bN
i
iiiiii xxyyyxA
1
112
1 (7)
Biểu thức này có dạng của biểu thức (5).
Chu vi tương ứng là tổng chiều dài các cạnh của đa giác. Nếu tất cả các điểm biên
của đa giác được coi như là các đỉnh, thì chu vi sẽ là tổng tất cả các số đo bên và
chéo.
19.2.1.2. Làm trơn đường bao
Thường thường, số đo chu vi cao một cách giả tạo vì nhiễu và vì các điểm biên bị
lưới lấy mẫu hình chữ nhật hạn chế. Làm trơn đường bao bằng xử lý ảnh nhị phân
(Phần 18.7) có thể giảm nhiễu, nhưng không thể làm giảm bớt những đường bọc
quanh mẫu.
Tuy nhiên, làm trơn đường bao có thể được xây dựng thêm thành phép đo diện
tích và chu vi bằng cách chỉ sử dụng một tập con các điểm ảnh bao như các đỉnh.
Đặc biệt trong các vùng có độ cong ít, ta có thể bỏ qua các điểm ảnh bao. Tuy nhiên,
có quá nhiều vùng như vậy có thể làm mất đi hình dạng thật sự của đối tượng và làm
giảm độ chính xác của phép đo.
Làm trơn đường bao cũng có thể bị tác động bởi việc biểu diễn đường bao theo
tham số. Nếu đối tượng có dạng lồi thì đường bao có thể được biểu diễn trong toạ độ
cực xung quanh một điểm nào đó trong đối tượng (hình 19-3a). Trong trường hợp
này, đường bao được chỉ rõ bằng một hàm dạng (). Yêu cầu duy nhất là chỉ có
một giá trị với mọi .
HÌNH 19-3
Hình 19-3 Biểu diễn đường bao tham số: (a) hàm đường bao cực; (b) hàm đường
bao phức
Nếu hình dạng phức tạp đến nỗi không tồn tại một điểm nào như vậy, thì đường
bao có thể được biểu diễn bởi một hàm đường bao phức tổng quát hơn
iii jyxpB (8)
Trong đó pi là quãng đường dọc theo đường bao từ một điểm tuỳ ý đến điểm biên
thứ i và i = 1, , Nb là chỉ số của các điểm biên (hình 19-3b).
Trong cả hai trường hợp, hàm đường bao tham số đều tuần hoàn. Trong một chu
kỳ, nó có thể được lọc thông thấp trong miền tần số bằng (1) một biến đổi Fourier,
(2) bằng cách nhân với một hàm truyền đạt thông thấp không pha (chẵn hoặc lẻ) và
(3) bằng một biến đổi Fourier ngược.
384
Các điểm thuộc hàm đường bao đã làm trơn không bị lưới lấy mẫu hạn chế nữa.
có thể sử dụng tất cả hoặc một tập con các điểm nói trên như các đỉnh trong các phép
tính diện tích và chu vi. Ngoài ra, ta phải sử dụng các đỉnh đã chọn trên đường bao
để đảo ngược độ cong.
19.2.2. Mật độ trung bình và mật độ tích hợp
IOD (Integrated Optical Density) là tổng mức xám của tất cả các điểm ảnh trong
đối tượng. Nó phản ánh “khối lượng” hay “trọng lượng” đối tượng và về mặt số
lượng, nó bằng diện tích nhân với mức xám bên trong đối tượng. Sự tính toán IOD
đã được trình bày trong chương 5. mật độ trung bình đơn thuần chỉ là IOD chia cho
diện tích.
19.2.3. Chiều dài và chiều rộng
Đây là phương pháp dễd dàng để tính phạm vi chiều ngang và chiều dọc một đối
tượng trích ra từ một ảnh. Chỉ cần chỉ số hàng nhỏ nhất và lớn nhất, cũng như chỉ số
cột nhỏ nhất và lớn nhất cho phép tính này. Tuy nhiên, đối với những đối tượng có
hướng ngẫu nhiên, thì chiều ngang và chiều dọc không thể là các chiều để xem xét.
Trong trường hợp này, cần phải định vị trục chính của đối tượng và đo lường chiều
dài và chiều rộng liên quan đến nó.
Có nhiều cách thiết lập trục chính cho một đối tượng một khi đã biết được đường
bao của nó. Ta có thể tính đường thẳng (hay cong) đúng nhất thông qua các điểm
trên đối tượng. Trục chính cũng có thể được tính từ các mô men, như đề cập ở phần
tiếp theo. Cách thứ ba sử dụng hình chữ nhật bao quanh tối thiểu (Minimum Enclose
Rectangle-MER) bọc lấy đối tượng.
Với kỹ thuật MER, đường bao của đối tượng được quay 900 theo nhiều bước, mỗi
bước 30 một. Sau mỗi phép quay tăng dần, MER nằm ngang sẽ phù hợp với đường
bao. Về phương diện tính toán, điều này chỉ đơn giản là giữ lại vết các giá trị x và y
của các điểm trên đường bao đã quay nhỏ nhất và lớn nhất. Kỹ thuật này đặc biệt có
lợi cho các đối tượng hình chữ nhật, nhưng nó cũng sinh ra các kết quả vừa ý đối với
các hình dạng tổng quát hơn.
19.3. PHÂN TÍCH HÌNH DẠNG
Thường thường, có thể phân biệt các đối tượng trong một lớp với các đối tượng
khác bằng hình dạng của chúng. Các đặc trưng hình dạng có thể sử dụng độc lập với,
hay kết hợp với các số đo kích thước. Trong phần này, chúng ta sẽ xem xét một vài
tham số hình dạng thường dùng.
19.3.1. Tính hình chữ nhật
Một số đo phản ảnh tính hình chữ nhật của một đối tượng là hệ số khít hình chữ
nhật
R
o
A
AR (9)
Trong đó Ao là diện tích đối tượng và AR là diện tích MER của đối tượng. R thể
hiện mức độ đầy một đối tượng điền vào MER của nó. Nó có giá trị cực đại là 1.0
đối với các đối tượng hình chữ nhật, nhận giá trị /4 đối với đối tượng hình tròn và
càng nhỏ hơn đối với các đối tượng cong, mảnh. Hệ số khít hình chữ nhật nằm giữa 0
và 1.
385
Một đặc tíh hình dạng có liên quan khác là tỷ lệ co
L
WA (10)
Là tỷ lệ giữa chiều rộng và chiều dài của MER. Đặc tính này có thể phân biệt các
đối tượng mảnh với các đối tượng hình vuông hay hình tròn.
19.3.2. Tính tròn
Một nhóm các đặc tính hình dạng được gọi là các tiêu chuẩn tính tròn bởi vì
chúng được tối thiểu hoá theo dạng hình tròn. Độ lớn của chúng có xu hướng phản
ánh sự phức tạp của đường bao đang được đánh giá. Tiêu chuẩn tính tròn được dùng
phổ biến nhất là
A
PC
2
(11)
Là tỷ lệ giữa bình phương chu vi và diện tích. Đặc tính này nhận giá trị nhỏ nhất
là 4 đối với dạng hình tròn. Các dạng phức tạp hơn nhận các giá trị cao hơn. Số đo
tính tròn C có liên quan đến khái niệm chủ quan về sự phức tạp của đường bao.
Một phép số đo tính tròn liên quan là năng lượng đường bao (boundary energy).
Giả sử một đối tượng có chu vi là P và chúng ta xác định quãng đường vòng quanh
đường bao từ điểm xuất phát nào đó với biến p. Tại một điểm bất kỳ, đường bao có
một bán kính cong tức thời r(p). Đó là bán kính của đường tròn tiếp xúc đường bao
tại điểm đó (hình 14-9). Hàm độ cong tại p là
pr
pK 1 (12)
Hàm K(p) tuần hoàn với chu kỳ P. Ta có thể tính năng lượng trung bình trên một
đơn vị chiều dài của đường bao như sau
P
dppK
P
E
0
21 (13)
đối với vùng cố định, đường tròn có năng lượng đường bao nhỏ nhất là
22
0
12
RP
E (14)
trong đó R là bán kính đường tròn. Do đó, độ cong và năng lượng đường bao
được tính dễ dàng từ chuỗi mã. Young đã chứng minh rằng năng lượng đường bao
phản ánh khái niệm về sự phức tạp theo cảm giác tốt hơn tiêu chuẩn tính tròn của
biểu thức (11).
Tiêu chuẩn tính tròn thứ ba thực hiện công dụng của khoảng cách trung bình từ
một điểm bên trong đến đường bao đối tượng. Khoảng cách này là
N
i
ixN
d
1
1 (15)
Trong đó xi là khoảng cách từ điểm ảnh thứ i đến điểm biên gần nhất trong một
đối tượng có N điểm. Tiêu chuẩn hình dạng là
386
N
i
xLi
N
d
Ag
1
3
2 (16)
Tổng trong mẫu số của biểu thức (16) là IOD của ảnh đã biến đổi khoảng cách.
Phép biến đổi khoảng cách đã được trình bày trong phần 18.7.5. Giá trị mức xám của
một điểm ảnh trong một ảnh biến đổi khoảng cách phản ánh khoảng cách từ điểm
ảnh đó đến đường bao gần nhất. Hình 19-5 trình bày một ảnh nhị phân và biến đổi
khoảng cách của nó.
HÌNH 19-5
Hình 19-5 Biến đổi khoảng cách
Đối với các hình tròn và các đa giác cân đối, biểu thức (16) cho cùng một giá trị
như biểu thức (11); tuy nhiên, khả năng phân biệt của biểu thức (16) có thể tốt hơn
đối với các hình dạng phức tạp hơn.
19.3.3. Mô men bất biến
Các mô men của một hàm thường được dùng trong lý thuyết xác suất. Tuy nhiên,
một vài tính chất khác xuất phát từ các mô men cũng có thể áp dụng để phân tích
hình dạng.
Định nghĩa. Tập các mô men của một hàm đường bao f(x, y) hai biến được định
nghĩa bởi
dxdyyxfyxM kjjk , (17)
Trong đó j và k nhận các giá trị không âm bất kỳ. Mô men của các PDF được sử
dụng rộng rãi trong lý thuyết xác suất.
Khi j và k nhận các giá trị không âm, chúng sinh ra một tập vô hạn các mô men.
Hơn nữa, tập này có khả năng xác định hàm f(x, y) một cách đầy đủ. Nói cách khác,
tập {Mjk}là duy nhất đối với hàm f(x, y) và chỉ hàm f(x, y) có tập mô men riêng biệt
đó mà thôi.
Với mục đích miêu tả hình dạng, giả sử f(x, y) nhận giá trị 1 trong đối tượng và
giá trị 0 ngoài đối tượng. Hàm hình chiếu này chỉ phản ánh hình dạng đối tượng và
bỏ qua chi tiết mức xám bên trong. Mỗi hình dạng duy nhất tương ứng với một hình
chiếu duy nhất và, hơn thế nữa, với một tập mô men duy nhất.
Tham số j + k gọi là bậc của mô men. Chỉ có duy nhất một mô men bậc 0,
387
dxdyyxfM ,00 (18)
Và rõ ràng đây là diện tích của đối tượng. Có hai mô men bậc nhất và cứ như vậy,
có nhiều mô men bậc cao hơn. Ta có thể khiến cho tất cả các mô men bậc nhất và
bậc cao hơn bất biến mà không ảnh hưởng đến kích thước đối tượng bằng cách chia
chúng cho M00.
19.3.3.1. Mô men trung tâm
Các toạ độ trọng tâm của đối tượng là
00
01
00
10
M
My
M
Mx (19)
Cái gọi là mô men trung tâm được tính bằng cách sử dụng trọng tâm như ban đầu
dxdyyxfyyxxM
kj
jk , (20)
Các mô men trung tâm không thay đổi vị trí.
19.3.3.2. Trục chính
Góc quay làm cho mô men trung tâm bậc hai 11 triệt tiêu có thể thu được từ
0220
1122tan
(21)
Các trục toạ độ x’, y’ nằm lệch một góc so với các trục x, y gọi là trục chính của
đối tượng. Vấn đề nhập nhằng 900 trong biểu thức (21) có thể được giải quyết nếu
chúng ta chỉ rõ rằng
0 302020 (22)
Nếu quay đối tượng đi một góc trước khi tính mô men, hay nếu các mô men
được tính liên quan đến các trục x’, y’ thì các mô men là bất biến quay.
19.3.3.3. Mô men bất biến
Các mô men trung tâm đã tính liên quan đến trục chính không thay đổi dưới các
phép phóng đại, tính tiến và quay đối tượng. Chỉ các mô men bậc ba và cao hơn là
quan trọng sau phép đơn giản hoá như trên. Độ lớn của các mo men này phản ánh
hình dạng đối tượng và có thể sử dụng trong nhận dạng mẫu. Các mô men bất biến
và các phép kết hợp mô men bất biến đã được ứng dụng để nhận dạng chữ viết và
phân tích nhiễm sắc thể.
Trong khi các mô men bất biến có một vài tính chất mà các đặc trưng hình dạng
cần phải có, thì trong một trường hợp đặc biệt nào đó có thể có tất cả hoặc một vài
tính chất đó. Tính duy nhất của hình dạng đối tượng được trải rông ra trên một tập vô
hạn các mô men. Vì thế, để phân biệt những hình dạng giống nhau có thể đòi hỏi một
tập lớn các đặc trưng. Bộ phân loại có thứ nguyên cao có thể trở nên rất nhạy cảm
với nhiễu và những thay đổi bên trong lớp. Trong một vài trường hợp, một vài mô
men có bậc tương đối thấp có thể phân biệt các đặc tính hình dạng của đối tượng.
Một thử nghiệm sẽ cho thấy rằng các đặc trưng hình dạng của các mô men bất biến là
chắc chắn và sáng suốt.
388
Ảnh mức xám. Nếu ta đặt f(x, y) là ảnh mức xám của một đối tượng, chứ không
phải là hàm hình chiếu nhị phân, chúng ta có thể tính tính mô men bất biến như trước
đây. Mô men bậc 0 [biểu thức (18)] trở thành mật độ quang học tích hợp, thay vì là
diện tích. Tuy nhiên, phát triển trước đây sẽ được áp dụng theo một kiểu tương tự.
Với các ảnh mức xám, mô men bất biến phản ánh không chỉ hình dạng đối tượng, mà
còn mật độ phân bố bên trong đó. Giống như trên, nó phải được chứng tỏ, cho từng
bài toán nhận dạng đối tượng, rằng một lượng mô men bất biến nhỏ vừa phải có thể
phân biệt chính xác các đối tượng khác nhau.
19.3.4. Miêu tả hình dạng
Đôi khi nó được dùng để miêu tả hình dạng một đối tượng theo cách chi tiết hơn
khi đưa ra bằng một tham số đơn nhưng đầy đủ hơn đẻ phản ánh bản thân ảnh đối
tượng. Một miêu tả hình dạng là sự biểu diễn đầy đủ hình dạng một đối tượng.
19.3.4.1. Chuỗi mã vi phân
Một miêu tả hình dạng là một chuỗi mã đường bao đã đề cập trong chương trước.
Hình 19-6 cho thấy một đối tượng đơn giản với chuối mã đường bao của nó và đạo
hàm chuỗi mã đường bao. Chuỗi mã đường bao cho biết độ cong của đường bao,
tính lồi và tính lõm xuất hiện như các đỉnh nhọn, trong khi chuỗi mã đường bao đưa
góc tiếp tuyến với đường bao như hàm quãng đường xung quanh đối tượng. Có thể
phân tích cả hai hàm hơn nữa để thu được số đo hình dạng.
Những hình dạng đa giác có một độ lồi dễ nhận biết nhờ đỉnh và vì thế có thể
phân ra khỏi chuỗi mã vi phân. Ví dụ, một số đo mang tính chất tam giác có thể là
biên độ hàm điều hoà thứ ba của một khai triển chuỗi Fourier của chuỗi mã vi phân.
Sau đó ta có thể phân biệt các tam giác và các hình vuông nhờ sử dụng tỷ số biên độ
hàm điều hoà thứ ba và thứ tư. Làm trơn chuỗi mã đường bao thường được thực hiện
trước phép vi phân.
HÌNH 19-6
Hình 19-6 Chuỗi mã và đạo hàm của nó
19.3.4.2. Miêu tả Fourier
Chúng ta đã nghiên cứu ba hàm tuần hoàn khác nhau, chúng miêu tả đầy đủ hình
dạng một đối tượng: chuỗi mã đường bao, hàm đường bao cực (hình 19-3a) và hàm
đường bao phức (hình 19-3b). Vì hàm nào cũng tuần hoàn nên biến đổi Fourier một
chu kỳ của một hàm nào đó là biểu diễn luân phiên hình dạng đối tượng kết hợp lại.
389
Cũng vì nó tuần hoàn nên mỗi hàm đường bao có một phổ (lấy mẫu) rời rạc.
Cường độ xung trong phổ tương ứng với các hệ số khai triển chuỗi Fourier của hàm
(tuần hoàn). Trong nhiều trường hợp, ta có thể lọc thông thấp phổ hàm đường bao
mà không phá hỏng hình dạng đặc trưng của đối tượng. Nghĩa là chỉ có biên độ và
pha của xung tần số thấp trong phổ (chẳng hạn các hệ số Fourier bậc thấp) mới cần
để mô tả đặc điểm đối tượng. Các giá trị này sẽ đại diện cho miêu tả hình dạng.
19.3.4.3. Biến đổi trục trung vị
Một kỹ thuật làm giảm dữ liệu mà vẫn giữ nguyên thông tin hình dạng là biến đổi
trục trung vị (Medial Axis Transform) đã đề cập trong chương trước. Một điểm bên
trong đối tượng thuộc đường trung vị nếu và chỉ nếu nó là t