Tóm tắt: Thư viện số hiện nay là một khái niệm phổ biến và là xu
hướng tất yếu trong hoạt động của các mô hình thư viện ngày nay.
Số hóa tài liệu cũng vì vậy là mắt xích không thể thiếu trong quá
trình tiến tới thư viện số tương lai. Bài viết này đề cập đến việc ứng
dụng kỹ thuật Morphing trong biểu diễn bề mặt trên cơ sở đó kết
hợp với các kỹ thuật nắn chỉnh khác để có thể tái tạo được hình ảnh
3 chiều sau quá trình thu nhận như chính gốc của nó. Kỹ thuật được
thử nghiệm cho việc nắn chỉnh bìa sách trong quá trình số hóa tài
liệu tại Trung tâm Thông tin thư viện, Đại học Quốc gia Hà Nội.
12 trang |
Chia sẻ: thanhle95 | Lượt xem: 54 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Kỹ thuật nâng cao chất lượng hình ảnh bìa sách trong số hóa tài liệu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH BÌA SÁCH
TRONG SỐ HÓA TÀI LIỆU
Đỗ Năng Toàn*1- Phạm Thành Quang**2- Nguyễn Thị Ngọc Lan***3
Tóm tắt: Thư viện số hiện nay là một khái niệm phổ biến và là xu
hướng tất yếu trong hoạt động của các mô hình thư viện ngày nay.
Số hóa tài liệu cũng vì vậy là mắt xích không thể thiếu trong quá
trình tiến tới thư viện số tương lai. Bài viết này đề cập đến việc ứng
dụng kỹ thuật Morphing trong biểu diễn bề mặt trên cơ sở đó kết
hợp với các kỹ thuật nắn chỉnh khác để có thể tái tạo được hình ảnh
3 chiều sau quá trình thu nhận như chính gốc của nó. Kỹ thuật được
thử nghiệm cho việc nắn chỉnh bìa sách trong quá trình số hóa tài
liệu tại Trung tâm Thông tin thư viện, Đại học Quốc gia Hà Nội.
Từ khóa: Thư viện số; Tài nguyên số; Số hóa tài liệu; Kỹ thuật
Morphing
1. GIỚI THIỆU
Sự ra đời và phát triển của Internet có tác động đến mọi mặt của
xã hội đặc biệt là lĩnh vực số hóa tài liệu. Đó cũng là một trong những
nhiệm vụ cốt lõi của Trung tâm Thông tin – Thư viện trong việc phục
vụ truyền tải tài liệu số đến toàn thể cán bộ, giảng viên, học viên, sinh
viên,... Để làm được điều đó Trung tâm phải đưa hình ảnh chân thực
nhất, dễ hình dung nhất đến với người dùng tin. Tuy nhiên, hình ảnh
3 chiều thu nhận bằng các thiết bị thu nhận ảnh thường bị biến dạng so
với thực tế. Vì vậy, một nhu cầu đặt ra là làm sao tái tạo lại được hình
∗ Phó Giáo sư, Tiến sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
∗∗ Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
∗∗∗ Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
828
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
ảnh thực từ ảnh thu nhận được. Trong ví dụ minh hoạ hình 1 chỉ ra ảnh
thu nhận và ảnh mong muốn.
a) Ảnh thu nhận b) Ảnh mong muốn
Hình 1: Ảnh thu nhận và ảnh mong muốn
Bài viết này đề cập đến việc sử dụng các điểm điều khiển và kỹ
thuật Morphing trong biểu diễn bề mặt. Trên cơ sở đó kết hợp với các
kỹ thuật nắn chỉnh khác để có thể tái tạo được hình ảnh 3 chiều sau
quá trình thu nhận như chính gốc của nó. Phần còn lại của báo cáo có
cấu trúc như sau: Phần 2 trình bày cơ sở lý thuyết của thuật toán. Phần
3 trình bày thuật toán nắn chỉnh hình học dựa vào các điểm điều khiển
và kỹ thuật nắn chỉnh bề mặt dựa vào kỹ thuật Morphing. Phần 4 là kết
quả thực nghiệm của thuật toán và cuối cùng là kết luận về kỹ thuật
nắn chỉnh đề xuất.
2. CƠ SỞ LÝ THUYẾT CỦA THUẬT TOÁN
2.1. Nắn chỉnh cấu trúc khung hình học của đối tượng
Việc nắn chỉnh cấu trúc khung hình học của đối tượng được thực
hiện nhờ vào phương pháp bình phương tối thiểu như sau:
Giả sử có n điểm điều khiển. Các điểm điều khiển trên ảnh gốc
tương ứng là P(x1,y1),..., P(xnyn) và trên ảnh đích tương ứng là Q(u1,v1),...,
Q(un,vn). Phương pháp bình phương tối thiểu là phương pháp xây
dựng một ánh xạ F(x,y)->(u,v) sao cho:
( ) minF P Qi i
2
"-/ với i=1,....,n
Điều này tương đương với đạo hàm bậc nhất của ( )F P Qi i
2-/
829
KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH BÌA SÁCH TRONG SỐ HÓA TÀI LIỆU
Nếu F là hàm bậc nhất thì ta có:
( , )F x y
v x y
u x y
3 4 5
0 1 2
b b b
b b b
=
= + +
= + +(
Các hệ số b được tính toán như sau:
Ta đặt:
( )
( )( )
,
( )
( )( )
,
x n
x
y n
y
p
y y
x x y y
p
x x
x x y y
i
i
n
i
i
n
i
i
n
i i
i
n
i
i
n
i i
i
n
1 1
1
2
1
1
2
1
= =
=
-
-
=
-
-
= =
=
-
=
=
-
=
6 6@ @
/ /
/
/
/
/
Ta có:
( )
( )( )
( ) ( )( )
( )( ) ( )( )
( )
( ) ( )( )
( )( ) ( )( )
q
X X
X X u X
y y q x x y y
y y u x q x x y y
n u x x x y
x x p x x y y
x x v y p y y v y
1
1
i
i
n
i i i
i
n
i
i
n
i i
i
n
i i i
i
n
i i
i
n
i i
i
n
i
i
n
i i
i
n
i i i
i
n
i i
i
n
0 1
2
1
1
1
2
1 1
1 1
2 0
1
1
3
2
1 1
1 1
b b
b
b b b
b
= -
-
- -
=
- - - -
- - - - -
= - + - -
=
- - - -
- - - - -
=
=
= =
= =
=
= =
= =
6
6
6
6
6
6
6
@
@
@
@
@
@
@
/
/
/ /
/ /
/
/ /
/ /
830
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
Ảnh thu nhận Khung mẫu
Hình 2: Chọn các điểm điều khiển để nắn chỉnh cấu trúc khung
Sau khi đã xác định được các hệ số ib hàm F(x,y) hoàn toàn xác
định. Ta sử dụng hàm biến đổi tìm được này để thực hiện việc nắn
chỉnh khung của ảnh thu nhận.
2.2. Kỹ thuật Morphing trong biểu diễn bề mặt
Ảnh thu được sau phép nắn chỉnh khung có hình dáng khung
theo mong muốn nhưng các bề mặt của đối tượng sau phép biến đổi
này thường bị méo mó, để khắc phục ta sử dụng kỹ thuật Morphing.
2.2.1 Kỹ thuật Morphing là gì?
Kỹ thuật Morphing là kỹ thuật nội suy nhằm hiệu chỉnh bề mặt trên
cơ sở các điểm điều khiển. Với mỗi điểm M trên bề mặt đối tượng gốc
sẽ được ánh xạ sang ảnh đích bằng cách xác định n điểm điều khiển có
ảnh hưởng đến M nhiều nhất và điểm M thuộc đa giác tạo bởi n điểm
đó. Sau đó sử dụng các phép nội suy để xác định vị trí M’ của M ở ảnh
đích. Thông thường người ta hay dùng n = 3 hoặc n = 4. Nếu n = 3 ta
sử dụng phép nội suy Affine, nếu n = 4 ta sử dụng phép nội suy Bilinear.
M -> M’
Hình 3. Cách ánh xạ của kỹ thuật Morphing với n=3
831
KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH BÌA SÁCH TRONG SỐ HÓA TÀI LIỆU
2.2.2. Các phép nội suy
a. Phép nội suy Affine
Đây là phép nội suy hai tam giác trong hệ toạ độ Euclide. Giả sử
chúng ta có hai tam giác và muốn nội suy hai tam giác này cho nhau.
Một cách đơn giản nhất là sử dụng kỹ thuật ánh xạ dựa trên hệ toạ độ
Barycentric được minh hoạ như sau:
Hình 4. Phép nội suy Affine
Trước tiên chúng ta định nghĩa một ánh xạ T cho các đỉnh của tam
giác: T(A)=D, T(B)=E,T(C)=F. Với các điểm còn lại chúng ta sẽ ánh xạ
chúng theo toạ độ Barycentric (α1, α2, α3) nghĩa là:
P= α1*A+α2*B+α3*C
Trong đó: αi ≥ 0 và α1+ α2+ α3 =1
Một điểm Q là ánh xạ của P qua T được tính toán như sau:
Q = T(P) = T(α1*A+α2*B+α3*C)
= α1* T (A) +α2*T(B) +α3*T(C)
=α1*D+α2*E+α3*F
Như vậy, để sử dụng phép nội suy Affine thì ta phải chuyển từ
hệ tọa độ Euclide sang hệ tọa độ Barycentric. Cách chuyển được thực
hiện như sau:
Với mỗi điểm M(xm,ym) nằm trong tam giác ABC thì chúng ta
đều có thể biểu diễn toạ độ của nó theo toạ độ các đỉnh của tam giác
như sau:
832
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
Giải hệ phương trình này ta được một nghiệm duy nhất:
b. Phép nội suy Bilinear
Đây là kỹ thuật xác định một hàm biến đổi từ một hình vuông kích
thước [0,1]x[0,1] tới một tứ giác trong không gian (tứ giác này không
nhất thiết phải đồng phẳng). Nếu chúng ta giả sử toạ độ của khối hình
vuông là u và v thì phép biến đổi B được thực hiện như sau:
Phép biến đổi được thực hiện tương đương với hai việc. Việc thứ
nhất là nội suy trên các cạnh AD và BC thu được điểm P và Q.
P=(1-v)A +vD
Q=(1-v)B +vC
Việc tiếp theo là nội suy trên đoạn PQ sử dụng thông số u:
B(u,v)=(1-u)P +uQ
Hình 5: Phép nội suy Bilinear
Hình 5: Phép nội suy Bilinear
833
KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH BÌA SÁCH TRONG SỐ HÓA TÀI LIỆU
3. THUẬT TOÁN NẮN CHỈNH DỰA TRÊN CÁC ĐIỂM ĐIỀU KHIỂN VÀ KỸ THUẬT
MORPHING
Trong mục này chúng tôi sẽ trình bày thuật toán nắn chỉnh hình học
đối tượng 3 chiều dựa trên việc nắn chỉnh cấu trúc khung đối tượng và kỹ
thuật Morphing để biểu diễn bề mặt. Đối tượng thu được sau bước nắn
chỉnh cấu trúc khung sẽ có hình dáng thỏa mãn một đối tượng không bị
biến dạng. Tiếp theo sử dụng kỹ thuật Morphing để hiệu chỉnh bề mặt và
cuối cùng là kỹ thuật xóa nhiễu để nâng cao ảnh kết quả.
3.1. Thuật toán nắn chỉnh khung đối tượng
Thuật toán nắn chỉnh khung đối tượng gồm các bước cơ bản sau:
Bước 1: Lựa chọn các điểm điều khiển
Thực tế việc lựa chọn các điểm điều khiển sao cho bảo toàn hình
dạng của đối tượng. Vì vậy, các điểm điều khiển được chọn phải nằm
trên các đường mà tạo nên khung đối tượng. Số lượng các điểm điều
khiển cần chọn phụ thuộc vào độ biến dạng của khung. Nếu độ biến
dạng nhỏ thì số điểm điều khiển phải chọn ít và ngược lại. Mặt khác,
việc chọn các điểm điều khiển là chỉ ra đường cong biến dạng trên
khung đối tượng. Chính vì thế nếu số lượng điểm điều khiển tăng lên
thì càng biểu diễn được gần chính xác đường cong đó. Và do đó nắn
chỉnh cấu trúc khung đối tượng sẽ chính xác hơn.
Bước 2: Tìm hàm nắn chỉnh.
Với các điểm điều khiển đã xác định, ta tìm hàm nắn chỉnh F từ
phương pháp bình phương tối thiểu đã trình bày ở trên. Khi đó, mỗi Pi
sẽ được ánh xạ sang P’i = F(Pi) mà không phải là Qi ta đã chọn.
Ảnh thu nhận Khung mẫu
Hình 6. Điểm điều khiển đích thay đổi khi đã xác định được hàm F
834
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
*Nhận xét: Trong thực tế, các đối tượng cùng chủng loại thường
có cấu trúc hình dạng giống nhau. Vì thế khung mẫu và các điểm điều
khiển trên khung mẫu có thể lưu lại làm mẫu (template) sử dụng cho
các trường hợp sau này. Khi đó, nếu các đối tượng đầu vào có cùng
khung mẫu, ta chỉ việc kích chọn khung mẫu đã có sẵn trong chương
trình một lần cho tất cả các đối tượng và thực hiện nắn chỉnh hàng loạt.
Vì thế sử dụng template sẽ tăng tốc độ nắn chỉnh và giảm thời gian
chọn các điểm điều khiển.
3.2. Thuật toán biểu diễn bề mặt dựa trên kỹ thuật Morphing
Công việc tiếp theo sau khi hiệu chỉnh khung đối tượng là hiệu chỉnh
bề mặt. Ở đây ta sử dụng thuật toán biểu diễn bề mặt dựa trên kỹ thuật
Morphing. Với mỗi vùng ảnh nhận được do chọn các điểm điều khiển để
xác định khung đối tượng ở phần 3.1, thực hiện hiệu chỉnh từng phần một
cách riêng biệt. Ứng với mỗi phần, tiếp tục chọn thêm một số điểm điều
khiển nếu thấy cần thiết. Sau đó thực hiện các bước sau:
Bước 1: Ứng với mỗi điểm ảnh M thuộc vùng ảnh đó thực hiện
công việc sau:
• Tìm 3 điểm điều khiển:
Việc tìm 3 điểm này dựa theo một nguyên tắc trong vật lý là: Lực
hút giữa hai vật tỉ lệ nghịch với khoảng cách giữa chúng. Dẫn đến
trong một số các điểm lân cận của điểm M, điểm nào gần M nhất thì
ảnh hưởng của nó tới M sẽ là lớn nhất. Trên cơ sở đó chúng ta tìm
3 điểm thỏa mãn:
+ Tổng khoảng cách từ 3 điểm này tới M là nhỏ nhất.
+ M thuộc tam giác tạo bởi 3 điểm này.
Gọi 3 điểm vừa tìm được là A, B, C và 3 điểm này tương ứng với
3 điểm A’, B’, C’ ở ảnh đích.
• Tìm M’ thuộc tam giác A’ B’C’ tương ứng với điểm M trong tam
giác ABC dựa vào phép nội suy tam giác ABC thành tam giác A’ B’C’.
• Gán giá trị mầu của M cho M’.
835
KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH BÌA SÁCH TRONG SỐ HÓA TÀI LIỆU
Ảnh kết quả cho đến giai đoạn này được thể hiện trong ví dụ dưới đây:
Hình 7: Ảnh kết quả sau bước thực hiện kỹ thuật Morphing
Hình 7: Ảnh kết quả sau bước thực hiện kỹ thuật Morphing
Bước 2: Nâng cao chất lượng ảnh
Như vậy, ứng với mỗi điểm của ảnh gốc sẽ tìm được vị trí tương
ứng của nó bên ảnh đích. Sau khi điều này được thực hiện với tất cả các
điểm cần xét ở ảnh gốc thì ảnh đích thu được về cơ bản đã được nắn
chỉnh nhưng có nhiều điểm trong ảnh đích chưa có điểm nào từ ảnh
gốc ánh xạ sang nên các điểm đó vẫn mang mầu nền (xem hình trên 7).
Những điểm ở ảnh đích mà không có điểm ảnh ở ảnh gốc ánh xạ sang
gọi là những lỗ hổng. Vì thế phải sử dụng các kỹ thuật lấp lỗ hổng để
làm trơn ảnh. Khi đó, quá trình tái tạo một đối tượng 3 chiều hoàn tất
và cho kết quả như hình dưới.
Hình 8: Ảnh kết quả của quá trình nắn chỉnh
836
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
3.3. Thuật toán nắn chỉnh hình học đối tượng 3 chiều
Thuật toán nắn chỉnh hình học đối tượng 3 chiều dựa vào các điểm
điều khiển và kỹ thuật Morphing biểu diễn bề mặt CorrectOBJECT
thực hiện thông qua 2 pha chính:
Pha 1: Nắn chỉnh cấu trúc khung hình học của đối tượng.
Bước 1: Lựa chọn các điểm điều khiển.
Bước 2: Tìm hàm nắn chỉnh.
Pha 2: Biểu diễn bề mặt dựa trên kỹ thuật Morphing.
Bước 1: Nội suy từng điểm ảnh trên từng mặt.
Bước 2: Nâng cao chất lượng ảnh.
*Mệnh đề 3.1: Thuật toán CorrectOBJECT là dừng và cho kết
quả đúng.
Chứng minh:
- Tính dừng: Pha 1 không có vòng lặp nên sẽ dừng.
Pha 2 có bước 1 được thực hiện với từng điểm ảnh, vì số lượng
điểm ảnh của một đối tượng là hữu hạn nên thuật toán sẽ kết thúc khi
duyệt hết các điểm ảnh.
- Tính đúng đắn: Thuật toán nắn chỉnh này dựa trên cơ sở cấu tạo
vật lý của một đối tượng 3 chiều nói chung bao gồm “khung” và “bề
mặt”. Vì thế muốn nắn chỉnh đối tượng phải thực hiện từng giai đoạn
đối với từng bộ phận của đối tượng. Thuật toán nắn chỉnh đề xuất ở
đây đã tuân thủ đúng quy tắc này. Cụ thể: pha 1 có tác dụng nắn chỉnh
cấu trúc khung, pha 2 có tác dụng hiệu chỉnh lại bề mặt. Vì thế thuật
toán đã xử lý được vấn đề tái tạo đối tượng 3 chiều đã đề ra.
4. ỨNG DỤNG
Chúng tôi đã cài đặt thử nghiệm thuật toán đề xuất cho các đối
tượng là sách của Trung tâm Thông tin – Thư viện.
Trong hình 9a) thể hiện ảnh thu nhận, 9b) là mẫu, 9c) ảnh thu
được sau bước nắn chỉnh cấu trúc hình học, 9d) là ảnh sau bước sử
dụng kỹ thuật Morphing, 9e) ảnh sau khi nâng cao chất lượng.
837
KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH BÌA SÁCH TRONG SỐ HÓA TÀI LIỆU
Kết quả thực nghiệm cho thấy chương trình đã xử lý khá tốt đối
với các đối tượng sách với yêu cầu đầu ra có kích thước như nhau để
giới thiệu tới bạn đọc.
a)
b)
c)
d)
e)
Hình 9: Ảnh thu nhận và kết quả qua các bước
Hình 9: Ảnh thu nhận và kết quả qua các bước
838
PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
5. KẾT LUẬN
Ảnh thu nhận trong máy tính thường bị biến dạng bởi các thiết
bị điện tử và quang học, đặc biệt là đối với ảnh 3 chiều. Bài viết này
đề xuất việc hiệu chỉnh đối tượng 3 chiều sau quá trình thu nhận bởi
2 pha: Nắn chỉnh cấu trúc hình học của đối tượng và biểu diễn bề mặt
dựa trên kỹ thuật Morphing. Để nâng cao chất lượng, báo cáo cũng đề
cập đến việc sử dụng các kỹ thuật xóa nhiễu đặc biệt là các lỗ hổng sau
quá trình áp dụng thuật toán.
Thuật toán CorrectOBJECT được đề xuất cài đặt thử nghiệm tại
Trung tâm Thông tin – Thư viện và đã áp dụng khá tốt đối với một
hình ảnh sách cần được hiệu chỉnh để giới thiệu đến toàn thể bạn đọc
Đại học Quốc gia Hà Nội. Hi vọng với bước tiến mới này, những hình
ảnh chân thực nhất về tài liệu số trong môi trường tri thức số tương lai
sẽ được phục vụ một cách tốt nhất cho người dùng tin hiện nay.
TÀI LIỆU THAM KHẢO
1. H. Johan, Y.Koiso, T. Nishita (2000), “Morphing using Curve and Shape
Interpolation Techniques”, Dept of Information Science Technical Report,
p.53-62, University of Tokyo, 2000
2. N. Fish, R. Zhang, L. Perry (2020), “Image Morphing With Perceptual
Constraints and STN Alignment”, Major Revision From Eurographics
Conference, 2020
3. Alexander Tereshin, Valery Adzhiev, Oleg Fryazinov (2020), “Automatically
Controlled Morphing of 2D Shapes with Textures”, SIAM Journal on
Imaging Sciences, 2020, Vol. 13, No. 1 : pp. 78-107
4. Beena Biswas, Dr. Vaibhav Sharma, (2020), “A Case Study on Image
Morphing Through Data Hiding Technique”, International Journal of
Engineering and Computer Science, 2020 | Page No.: 24925-24933
5. G.Wolberg (1998),”Image Morphing: A survey”, Visual Computer, p.360-
372, 1998
6. Lương Mạnh Bá, Nguyễn Thanh Thuỷ, Nhập môn xử lý ảnh. NXB
KH&KT, 1999
7. Đặng Văn Đức, Hệ thống thông tin địa lý. NXB KH&KT, 2001.