Nhận diện vùng da mặt bằng phương pháp kết hợp một số thuật toán dựa trên tính bất biến của màu

Tóm tắt: Nhận dạng khuôn mặt là một lĩnh vực nghiên cứu thú vị. Đã có rất nhiều thành tựu đạt được ở lĩnh vực này trong vài thập kỉ gần đây. Tuy nhiên, các kết quả đạt được vẫn chưa thực sự đáp ứng được yêu cầu trong thực tế. Các kết quả trước đây đạt được là khá ấn tượng trong việc nhận dạng ở thời gian thực với tỉ lệ nhận dạng cao nhưng bị ảnh hưởng nhiều trong các trường hợp thay đổi ánh sáng. Ở trường hợp này, hệ thống vẫn có thể nhận diện tốt vùng khuôn mặt nhưng cũng cho nhiều kết quả sai. Nghiên cứu của chúng tôi khắc phục nhược điểm nói trên thông qua cơ chế thị giác và nhận dạng tính bất biến của màu của con người. Từ quan sát các thuật toán tính bất biến của màu khác nhau cho kết quả khác nhau, chúng tôi đi tới việc sử dụng kết hợp các thuật toán này để nhận diện được vùng da chính xác gần như tuyệt đối trong mọi ảnh thử nghiệm. Thuật toán này cho kết quả nhận dạng tốt và ít lỗi hơn.

6 trang | Chia sẻ: thanhle95 | Lượt xem: 914 | Lượt tải: 1

Bạn đang xem nội dung tài liệu Nhận diện vùng da mặt bằng phương pháp kết hợp một số thuật toán dựa trên tính bất biến của màu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

JOURNAL OF SCIENCE OF HNUE DOI: 10.18173/2354-1059.2015-0008 Natural Sci. 2015, Vol. 60, No. 4, pp. 56-61 This paper is available online at Ngày nhận bài: 15/4/2015. Ngày nhận đăng: 20/5/2015. Tác giả liên lạc: Lê Hồng Quân, địa chỉ e-mail: [email protected] 56 NHẬN DIỆN VÙNG DA MẶT BẰNG PHƯƠNG PHÁP KẾT HỢP MỘT SỐ THUẬT TOÁN DỰA TRÊN TÍNH BẤT BIẾN CỦA MÀU Lê Hồng Quân1 và Lê Hà Xuân2 1Phòng Tạp chí & Thông tin Khoa học công nghệ, Trường Đại học Sư phạm Hà Nội 2Trường Đại học Bochum, Cộng hòa liên bang Đức Tóm tắt: Nhận dạng khuôn mặt là một lĩnh vực nghiên cứu thú vị. Đã có rất nhiều thành tựu đạt được ở lĩnh vực này trong vài thập kỉ gần đây. Tuy nhiên, các kết quả đạt được vẫn chưa thực sự đáp ứng được yêu cầu trong thực tế. Các kết quả trước đây đạt được là khá ấn tượng trong việc nhận dạng ở thời gian thực với tỉ lệ nhận dạng cao nhưng bị ảnh hưởng nhiều trong các trường hợp thay đổi ánh sáng. Ở trường hợp này, hệ thống vẫn có thể nhận diện tốt vùng khuôn mặt nhưng cũng cho nhiều kết quả sai. Nghiên cứu của chúng tôi khắc phục nhược điểm nói trên thông qua cơ chế thị giác và nhận dạng tính bất biến của màu của con người. Từ quan sát các thuật toán tính bất biến của màu khác nhau cho kết quả khác nhau, chúng tôi đi tới việc sử dụng kết hợp các thuật toán này để nhận diện được vùng da chính xác gần như tuyệt đối trong mọi ảnh thử nghiệm. Thuật toán này cho kết quả nhận dạng tốt và ít lỗi hơn. Từ khóa: Màu cố định, nhận dạng khuôn mặt, màu da, thời gian thực. 1. Mở đầu Phương thức tiếp cận của chúng tôi dựa trên cơ chế sinh học của thị giác người, nhận dạng khuôn mặt và các đối tượng khác dấu hiệu đầu tiên là màu sắc. Hầu hết các thuật toán xử lí dữ liệu trên ảnh đen trắng mà bỏ qua các thông tin màu sắc. Các ưu thế của cách tiếp cận này là đơn giản hóa đầu vào, hỗ trợ ứng dụng thời gian thực, đơn giản hóa các vùng màu sắc không rõ ràng. Tuy nhiên chúng cũng bỏ qua lượng lớn các thông tin hữu ích và kết quả có thể làm giảm độ chính xác. Thay vào đó, cách tiếp cận sử dụng tính bất biến của màu có thể giải quyết được vấn đề màu sắc khi ánh sáng thay đổi. Đã có một số tài liệu nghiên cứu về nhận dạng khuôn mặt nhưng còn hạn chế trong các trường hợp thay đổi cường độ ánh sáng [1]. Chúng tôi sử dụng hệ màu YcrCb trong [2] để phân mảng màu da trong trạng thái xử lí lọc phân ngưỡng (thresholding) và xử lí ảnh nhị phân. Định biên phân tách các vùng da cùng màu bằng thuật toán của F. Chang et al. [3] và thuật toán Ada-boost của Viola – Jones [2]. Kết quả phân mảng màu da thu được ở đây bị ảnh hưởng rất lớn và xấu đi đáng kể khi có sự thay đổi của cường độ ánh sáng. Thuật toán tính bất biến của màu nhằm mục đích giải quyết vấn đề này. 2. Nội dung nghiên cứu 2.1. Cơ sở lí thuyết 2.1.1. Phân mảng màu da Phân mảng màu da được sử dụng nhiều trong bước tiền sử lí ở các tác vụ của thị giác máy tính. Nhiều phương pháp nhận diện khuôn mặt đã được nghiên cứu, phát triển [4]. Hều hết các thuật toán này đều hoạt động tốt trong trường hợp ánh sáng được kiểm soát tốt và không ảnh hưởng tới màu của Nhận dạng khuôn mặt bằng phương pháp kết hợp một số thuật toán dựa trên tính bất biến của màu 57 camera. Nếu không, kết quả không thể xác định được các vùng da hay thậm chí mất các điểm da quan trọng dẫn tới quá trình xử lí sai. Như đã nói ở trên, sử dụng tính bất biến của màu có thể giải quyết vấn đề này nhưng vẫn chưa thực sự đủ hiệu quả. Đã có một vài nỗ lực sử dụng tính bất biến của màu để phân mảng màu da được tin cậy hơn, [5] là một trong những phương pháp thành công nhất. Tuy nhiên vẫn chưa có sự xác nhận chắc chắn khi thay đổi ánh sáng trong những môi trường khác nhau. Đây là động cơ để chúng tôi tiếp tục nghiên cứu cải thiện hiệu quả của thuật toán tính bất biến của màu trong phân mảng màu da và nhận dạng khuôn mặt. 2.2.2. Khoa học thị giác và tính bất biến của màu Khoa học thị giác về màu sắc và tính bất biến của màu đã được nghiên cứu trong vài thập kỉ gần đây. Hiện tại, chúng ta đã có một số phương thức biểu diễn phổ biến trong lĩnh vực này. Một trong những biểu diễn phổ biến nhất ở [6] coi tín hiệu màu c, là kết quả của sự phản xạ nguồn sáng lên bề mặt. Vì thế c cũng có thể được coi là kết quả phân bố năng lượng từ nguồn sáng lên bề mặt phản xạ. Quá trình này được mô hình hóa bởi công thức: c(λ) = E(λ)* S(λ) (1) Trong hệ thống thị giác máy tính, thông tin màu sắc trên bề mặt được bắt bởi các cảm biến, thu nhận tất cả các bước sóng trong dải quang phổ nhìn thấy được. Sau khi nhận được hệ ảnh từ k-cảm biến, tín hiệu màu được biểu diễn là kết quả của cảm biến k-chiều: kP ( )E( )S( )d , k R,G,B      (2) Trong đó, Pk = kết quả cảm biến = = ảnh màu. Khi E(λ) = 1, p biểu diễn màu trên bề mặt. Khi S(λ) =1, p biểu diễn độ sáng của màu. Ta có thể ước lượng ( )  khi sử dụng cảm biến biên độ hẹp. Để đơn giản ta gọi: Pk = S(λK) E(λK) k = {R,G,B} (3) Dựa vào mô hình trên, mục đích của thuật toán tính bất biến của màu là tìm giá trị của E(λ) để xác định giá trị màu PK. * Tính bất biến của màu ở người Nhiều thí nghiệm tâm lí thị giác đã được thực hiện ở lĩnh vực tính bất biến của màu ở người, tuy chưa thể làm sáng tỏ hết cơ chế phức tạp này nhưng đã có một số kết quả nhất định. Một số kết quả [7] đã phát hiện các quy tắc tính bất biến của màu như sau: (i) Tính bất biến của màu thu được bằng chính lượng lượng tử ánh sáng thu được trên toàn bộ vùng quan sát. (ii) Thay đổi toàn cục trên lượng lượng tử dẫn tới sự thay đổi nhỏ về hình thái (màu sắc). (iii) Thay đổi cục bộ trên lượng lượng tử ánh sáng thu được dẫn tới sự thay đổi lớn về hình thái. (iv) Trong một vùng quan sát phức tạp: - Các “điểm trắng” biểu diễn các thay đổi toàn cục nhỏ; - Các điểm còn lại biểu diễn các thay đổi cục bộ lớn; - Màu sắc là sự thể hiện chuẩn hóa của mỗi vùng sóng riêng biệt (Lí thuyết Retinex). Có thể thấy kết luận (ii), (iii), (iv) không chỉ đúng với Retinex mà cũng đúng khi sử dụng thuật toán Gray World assumption khi có sự thay đổi cục bộ. Gray World assumption là thuật toán khá phổ biến, nó cân bằng giá trị trung bình của các kênh Red (R), Green (G) và Blue (B). Thuật toán này được sử dụng rộng rãi bởi tính hiệu quả của nó, trừ một số trường hợp mà một loại màu sắc nhất định chiếm phần lớn hình ảnh (ví dụ như các ảnh có bầu trời xanh hoặc nguồn sáng nhân tạo trong nhà). Với các tình huống này, các thuật toán Retinex cho kết quả khá tốt. Hướng tiếp cận này khẳng định sự liên quan giữa cảm nhận “điểm trắng” và sự phản hồi cực đại của các tế bào cảm sáng hình nón (cones). Từ những nhận xét này, chúng tôi tận dụng các ưu điểm của các cách tiếp cận khác nhau để giải quyết được hạn chế của các thuật toán màu cố định. Một tập hợp các thuật toán này sẽ được sử dụng để tái tạo (gần như chính xác) màu sắc của ảnh trước khi thực hiện phân vùng màu da. Lê Hồng Quân và Lê Hà Xuân 58 * Định thức chuẩn Minkowski cho thuật toán tính bất biến của màu Ở bài báo của J. Weijer và Th. Gevers [8], chuẩn Minkowski rất hữu dụng để mô hình hóa thuật toán tính bất biến của màu, có thể viết dưới dạng: 1 p p X,Y K K I (x,y) E N           (4) Trong đó, N là số điểm ảnh (pixel) trong một ảnh I. Với khung định mức này, tác giả ở [8] đã trình bày một số thuật toán tính bất biến của màu. Trong đó thuật toán Shade of Gray trực tiếp sử dụng công thức này, cho kết quả tốt nhất khi p = 6. * Max - RGB Thuật toán Max – RGB dựa trên giả định rằng giá trị tín hiệu lớn nhất trên mỗi kênh màu là tín hiệu phản hồi từ một bề mặt trắng. Vì vậy công thức sau sẽ biểu diễn mức sáng của ảnh: EK = max(x,y)(IK(X,Y)) (5) Đây là trường hợp đặc biệt của Retinex, khi độ sáng trong ảnh là đồng đều, cũng là trường hợp đặc biệt của chuẩn Minkowski khi p = ∞. * Gray - World Tương đương với 4 ở trường hợp p = 1, thuật toán Gray – World [9] giả định màu trung bình trên bề mặt là xám. Khi đó mức xám sẽ chính là kết quả tạo bởi hiệu ứng của nguồn sáng: K X,Y KE I (X,Y) / N  (6) Đây chỉ là một trường hợp đặc biệt, ta có thể mở rộng hơn nữa, ví dụ giả định màu trung bình trên bề mặt là xanh. * Gray - Edge Hypothesis Thuật toán Gray – Edge Hypothesis được đề xuất bởi J. Weijer và Th. Gevers [8] giả định rằng “độ lệch giá trị phản xạ trung bình trong một cảnh không phụ thuộc vào màu sắc”: K X,Y KE f I (X,Y) / N   (7) trong đó, f  là bộ lọc Gaussian, sử dụng để làm mịn cục bộ. * Thống kê ảnh tự nhiên Ở [6], NIS lựa chọn trước một tập các thuật toán tính bất biến của màu, sau đó áp dụng chúng trên một ảnh cụ thể. Các kết quả được chọn và kết hợp dựa trên các tính chất quan trọng nhất của ảnh màu. Tham số Weibull được sử dụng để trích xuất một số tính chất của ảnh trong hệ màu. Tham số Weibull được cho là có tính tương quan cao giữa các phương pháp tính bất biến của màu và các phương pháp dựa trên tính chất ảnh. Bộ phân loại MoG – classifier được sử dụng để “huấn luyện” dữ liệu, đánh trọng số cho các tham số Weibull và các tính chất của ảnh (số cạnh, họa tiết và SNR). Hay nói cách khác, thám số Weibull và MoG – classifier được dùng để xác định các vùng của khung cảnh (có thể gồm nhiều loại như rừng, núi, cánh đồng, ), từ đó lựa chọn một hay một số thuật toán thích hợp nhất. Dựa vào đó ta có thể quyết định dùng thuật toán tính bất biến của màu nào hay kết hợp chúng thế nào cho từng ảnh cụ thể. 2.2. Kết hợp các thuật toán tính bất biến của màu trong phân ngưỡng Từ quan sát mỗi thuật toán tính bất biến của màu khác nhau cho kết khác nhau và ảnh hưởng tới kết quả phân mảng màu da, chúng tôi đã kết hợp một vài phương pháp tính bất biến của màu để làm một bộ lọc cho phân mảng da. Các thuật toán được lựa chọn đưa vào kết hợp ở đây gồm có: Max – RGB, Gray – World, Shade of Gray, NIS và Original. Áp dụng năm thuật toán này để làm một bước tiền sử lí, sau đó được đưa vào phân đoạn xác định vùng da. Các kết quả thu được (ví dụ trong Hình 2a) sẽ được qua một bộ sử lí kết Nhận dạng khuôn mặt bằng phương pháp kết hợp một số thuật toán dựa trên tính bất biến của màu 59 hợp phân ngưỡng (Thresholding) để thu được kết quả cuối cùng (Hình 2b). Quá trình này được mô tả như trong sơ đồ ở Hình 1. Hình 1. Kết hợp các thuật toán tính bất biến của màu 2.3. Đánh giá kết quả Kết quả thu được từ kết hợp năm thuật toán tính bất biến của màu trên là tốt bất ngờ. Chúng tôi đã phân loại màu da chính xác tuyệt đối với gần như mọi ảnh. Chạy phép kiểm tra thử nghiệm nhanh trong [10] cho ra kết quả 96,36% các điểm màu da đã được phân loại, tốt hơn nhiều so với các thuật toán trước đây. (a) (b) Hình 2. Kết quả phân mảng màu da Max - RGB Gray – World Shade of Gray NIS Original Phân m ảng m àu da Y C rC b Phân ngưỡng Lê Hồng Quân và Lê Hà Xuân 60 Chúng tôi đã chạy thử nghiệm với LFW [10], bao gồm 13233 ảnh, sưu tập từ New Photograph. Mỗi ảnh có độ lớn 250 x 250 pixel, khuôn mặt được đặt ở giữa. Đây là những hình ảnh thực tế, không được sắp đặt trước nên điều kiện ánh sáng là hoàn toàn ngẫu nhiên. Kết quả trả về thể hiện như trong Hình 3. Hình 3. Kết quả chạy thử nghiệm 3. Kết luận Qua nghiên cứu kết hợp một số thuật toán dựa trên tính bất biến của màu, chúng tôi thu được kết quả là các thuật toán có thể bù đắp cho nhau gần như tuyệt đối trong khi đó sử dụng một thuật toán đơn lẻ không thể cho kết quả tốt tương đương, dù là với các thuật toán phức tạp sử dụng phân tích cảnh (như NIS). Điều này cho thấy sẽ có thuật toán tính bất biến của màu tốt hơn (có phân tích cảnh) để sử dụng trong ứng dụng thực tế. Ngoài ra, màu da cũng là một gợi ý thú vị cho việc ước lượng độ sáng. Đây cũng là hướng nghiên cứu tiếp theo của chúng tôi. TÀI LIỆU THAM KHẢO [1] Paul Viola, Michael Jones, 2001. Rapid Object Detection using a Boosted Cascade of Simple Features. Computer Vision and Pattern Recognition, CVPR. Proceedings of the 2001 IEEE Computer Society Conference on (Volume 1). [2] S. L. Phung, A. Bouzerdoum, and D. Chai, 2005. Skin segmentation using color pixel classification: Analysis and comparison. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 27, No. 1, pp. 148-154. [3] Fu Chang, Chun-Jen Chen, and Chi Chen Liu, 2004. A linear-time component labeling algorithm using contour tracing technique. Computer Vision and Image Understanding, 2004 - Elsevie, Volume 93, Issue 2, February, pp. 206-220. [4] P. Kakumanu, S. Makrogiannis, N. Bourbakis, 2007. A survey of skin-color modeling and detection methods. Pattern Recognition, 40, pp. 1106-1122. Nhận dạng khuôn mặt bằng phương pháp kết hợp một số thuật toán dựa trên tính bất biến của màu 61 [5] Rein-Lien Hsu. 2002. Face Detection in Color images. IEEE Transactions on Pattern Analysis and Machine Intelligence. [6] Lilong Shi, 2009. Novel color constancy algorithms for digital color imagery. PhD dissertation, Simon Fraser University. [7] J. J. McCann 1992. Rules for colour constancy Ophthal. Physiol. Opt., Vol. 12, April. [8] Arjan Gijsenij, Theo Gevers, 2007. Color constancy using natural image statistics. The IEEEConf. on Computer Vision and Pattern Recognition. [9] G. Buchsbaum, 1980. A spatial processor model for object colour perception. Journal of the Franklin Institute Volume 310, Issue 1, pp. 1-26. [10] S Gary B. Huang, Manu Ramesh, Tamara Berg, and Erik Learned-Miller, 2007. Labeled Faces in the Wild: A Database for Studying Face Recognition in Unconstrained Environments. University of Massachusetts, Amherst, Technical Report 07-49, October, 2007. ABSTRACT Face detection by the fusion of color constancy algorithms Face detection is an interesting field of research and there has been much progress during the last few decades in face detection. However, the current results are not adequate for real world application. For example, the prominent work of Viola-Jones successfully detecting faces in real-time but if the lighting changed, the accuracy of detection was not adequate. This system work well in terms of finding the real face region, but also produces many false positive results. We embarked on this study in order to solve this issue being inspired by human vision and a color constancy mechanism. Based on the observation that different color constancy algorithms deliver different results in image restoration, we used a fusion of them to migrate an almost perfect skin region in every test image. This technique results in better detection with fewer false positives. Keywords: Color constancy, face detection, skin color, real-time.