Trong thời đại kỷ nguyên số, thông tin số được sử dụng rộng rãi trong môi trường
mở: tài nguyên được phân phối cho nhiều người sử dụng, thì nhu cầu được bảo vệ bản
quyền sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đề quan trọng và được nhiều
cơ sở nghiên cứu quan tâm. Thủy vân số hay nhúng thủy vân được đánh giá mang lại
nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc, kiểm soát truy cập
đối với dữ liệu đa phương tiện.
Không giống như các hệ mật mã được sử dụng cho truyền thống và không ngăn
cấm được người dùng sử dụng trái phép những dữ liệu, các phương pháp thủy vân hứa
hẹn một giải pháp cho vấn đề bảo vệ bản quyền đối với sản phẩm số khi mà sản phẩm đó
được sử dụng trong môi trường mở và không cần đến việc mã hóa. Tạo thủy vân là một
phương pháp nhúng một lượng thông tin nào đó vào trong dữ liệu đa phương tiện cần
được bảo vệ sở hữu và không để lại ảnh hưởng đến chất lượng của sản phẩm. Thủy vân
phải tồn tại bền vững với sản phẩm số và không thể loại bỏ bằng bất kì những tấn công có
chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm.
Trong phạm vi khóa luận này, tôi xin đưa ra một số phương pháp thủy vân số mà
tôi nghiên cứu cho dữ liệu ảnh như BMP (bitmap), JPG (JPEG),…,và cách xử lý ảnh màu,
cách nén ảnh chuẩn JPEG… Và tôi cũng xây dựng được một ứng dụng cho việc xác định
bản quyền tác giả trên dữ liệu ảnh sử dụng phương pháp DCT đề cập trong khóa luận.
Đồng thời nội dụng khóa luận đề cập tới một số thử nghiệm đánh giá hiệu quả của ứng
dụng đã xây dựng được.
53 trang |
Chia sẻ: nhungnt | Lượt xem: 2474 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Nghiên cứu phương pháp định danh bản quyền tác giả trên dữ liệu ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
Lê Ngọc Việt
NGHIÊN CỨU PHƢƠNG PHÁP ĐỊNH DANH BẢN
QUYỀN TÁC GIẢ TRÊN DỮ LIỆU ẢNH
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
HÀ NỘI - 2010
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
Lê Ngọc Việt
NGHIÊN CỨU PHƢƠNG PHÁP ĐỊNH DANH BẢN
QUYỀN TÁC GIẢ TRÊN DỮ LIỆU ẢNH
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hƣớng dẫn: ThS. Nguyễn Thị Hậu
HÀ NỘI - 2010
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- i -
Lời cám ơn
Trước hết tôi xin gửi lời cám ơn đến toàn thể các thầy cô giáo trường Đại học công
nghệ Đại học Quốc gia Hà Nội đã giúp đỡ và chỉ bảo tôi trong suốt quá trình học tập ở
trường. Đặc biệt tôi xin gửi lời cám ơn sâu sắc đến cô Nguyễn Thị Hậu đã chỉ bảo hướng
dẫn tôi từ bước chọn đề tài, đến nghiên cứu và tạo điều kiện tốt nhất cho tôi trong quá
trình làm khóa luận.
Đồng thời tôi cũng xin cảm ơn những người bạn đã luôn bên cạnh, chia sẻ giúp đỡ
và động viên tôi trong suốt quá trình nghiên cứu và học tập.
Cuối cùng, tôi xin bày tỏ niềm biết ơn vô hạn tới bố mẹ, chị tôi, và những người
bạn thân luôn bên cạnh, động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp.
Hà Nội, 17/05/2010
Sinh viên: Lê Ngọc Việt
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- ii -
Tóm tắt nội dung
Trong thời đại kỷ nguyên số, thông tin số được sử dụng rộng rãi trong môi trường
mở: tài nguyên được phân phối cho nhiều người sử dụng, thì nhu cầu được bảo vệ bản
quyền sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đề quan trọng và được nhiều
cơ sở nghiên cứu quan tâm. Thủy vân số hay nhúng thủy vân được đánh giá mang lại
nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc, kiểm soát truy cập
đối với dữ liệu đa phương tiện.
Không giống như các hệ mật mã được sử dụng cho truyền thống và không ngăn
cấm được người dùng sử dụng trái phép những dữ liệu, các phương pháp thủy vân hứa
hẹn một giải pháp cho vấn đề bảo vệ bản quyền đối với sản phẩm số khi mà sản phẩm đó
được sử dụng trong môi trường mở và không cần đến việc mã hóa. Tạo thủy vân là một
phương pháp nhúng một lượng thông tin nào đó vào trong dữ liệu đa phương tiện cần
được bảo vệ sở hữu và không để lại ảnh hưởng đến chất lượng của sản phẩm. Thủy vân
phải tồn tại bền vững với sản phẩm số và không thể loại bỏ bằng bất kì những tấn công có
chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm.
Trong phạm vi khóa luận này, tôi xin đưa ra một số phương pháp thủy vân số mà
tôi nghiên cứu cho dữ liệu ảnh như BMP (bitmap), JPG (JPEG),…,và cách xử lý ảnh màu,
cách nén ảnh chuẩn JPEG… Và tôi cũng xây dựng được một ứng dụng cho việc xác định
bản quyền tác giả trên dữ liệu ảnh sử dụng phương pháp DCT đề cập trong khóa luận.
Đồng thời nội dụng khóa luận đề cập tới một số thử nghiệm đánh giá hiệu quả của ứng
dụng đã xây dựng được.
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- iii -
Mục lục
Lời cám ơn ......................................................................................................................... i
Tóm tắt nội dung ................................................................................................................ ii
Bảng các kí hiệu và chữ viết tắt .......................................................................................... iv
Mục lục các hình vẽ ........................................................................................................... v
Mở đầu .............................................................................................................................. 7
Chương 1: Giới thiệu về ẩn – giấu tin .................................................................................. 8
1.1. Khái niệm về ẩn - giấu tin. ........................................................................................... 8
1.2. Phân loại kỹ thuật giấu tin: ........................................................................................... 8
1.3. Mô hình giấu tin cơ bản: ............................................................................................. 10
1.4. Tính chất của ẩn giấu tin trong ảnh. ............................................................................ 12
Chương 2: Kỹ thuật thủy vân số ........................................................................................ 14
2.1. Khái niệm về thủy vân số. ........................................................................................... 14
2.2. Phân loại thủy vân số. ................................................................................................. 15
2.3. Mô hình thủy vân số: .................................................................................................. 16
2.4. Các khuynh hƣớng tiếp cận của kỹ thuât thủy vân số. .................................................. 18
2.5. Một số ứng dụng......................................................................................................... 26
2.6. Yêu cầu về chất lƣợng ảnh của thủy vân số: ...................................................................... 26
Chương 3: Phát triển ứng dụng. ....................................................................................... 28
3.1. Các chức năng chính: ................................................................................................. 28
3.2. Hƣớng giải quyết bài toán ........................................................................................... 28
3.3. Giới thiệu về các module:............................................................................................ 34
3.4. Giao diện chƣơng trình ............................................................................................... 38
3.5. Môi trƣờng lập trình. ................................................................................................. 41
Chương 4: Thực nghiệm đánh giá..................................................................................... 43
4.1. Cài đặt: ...................................................................................................................... 43
4.2. Chất lƣợng ảnh. ......................................................................................................... 43
4.3. Độ bền vững của thông tin. ......................................................................................... 46
4.4. Một số hạn chế của hệ thống: ...................................................................................... 48
Kết luận ........................................................................................................................... 49
Các thuật ngữ tiếng anh ................................................................................................... 50
Tài liệu tham khảo ........................................................................................................... 51
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- iv -
Bảng các kí hiệu và chữ viết tắt
Kí hiệu Diễn giải
LSB Least Significant Bit
DFT Discrete Fourier Transform
IDFT Inverse Discrete Fourier Transform
DCT Discrete Cosine Transform
IDCT Inverse Discrete Cosine Transform
DWT Discrete Wavelet Transform
IDWT Inverse Discrete Wavelet Transform
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- v -
Mục lục các hình vẽ
Hình 1.1: Sơ đồ phân loại kỹ thuật giấu tin ............................................................... 8
Hình 1.2: Lược đồ chung cho quá trình giấu tin ........................................................ 11
Hình 1.3: Lược đồ chung cho quá trình giải mã ........................................................ 12
Hình 2.1: Ví dụ về thủy vân số .................................................................................. 14
Hình 2.2: Sơ đồ phân loại các loại thủy vân số. ......................................................... 15
Hình 2.3: Mô hình thủy vân số .................................................................................. 16
Hình 2.4: Mô hình nhúng thủy vân số ....................................................................... 17
Hình 2.5: Mô hình tách thủy vân số .......................................................................... 17
Hình 2.6 Sơ đồ phân chia 3 miền tần số của phép biến đổi DCT ............................... 22
Hình 2.7: ảnh jpeg ..................................................................................................... 22
Hình 2.8 Sơ đồ miền tần số của ảnh .......................................................................... 22
Hình 2.9: Mô hình DWT trên miền màu đỏ (Red) của khối ảnh RGB mxn .............. 23
Hình 2.10: Mô hình IDWT của ảnh RGB .................................................................. 24
Hình 2.11: Mô hình nhúng thủy vân số trên miền DWT ............................................ 25
Hình 3.1 Mô hình nhúng thủy vân trên miền DCT .................................................... 29
Hình 3.2: Mô hình tách thủy vân. .............................................................................. 30
Hình 3.3 Các bước của quá trình mã hóa biến đổi DCT đối với một khối .................. 31
Hình 3.4: Ma trận lượng tử ....................................................................................... 32
Hính 3.5:Mô hính tương tác module thủy vân hiện ................................................... 34
Hình 3.6:Mô hình tương tác module nhúng thủy vân ẩn ............................................ 35
Hình 3.7: Mô hình tương tác module tách thủy vân ẩn .............................................. 36
Hình 3.8: Giao diện chính của ứng dụng ................................................................... 37
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- vi -
Hình 3.9: Giao diện thủy vân hiện ............................................................................. 38
Hình 3.10: Mô tả thành phần của .NET Framework .................................................. 41
Hình 4.1: Ảnh gốc trước khi thủy vân hiện ............................................................... 42
Hình 4.2: Ảnh sau khi thủy vân ................................................................................. 43
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- 7 -
Mở đầu
Trong thời đại bùng nổ thông tin với sự phát triển nhanh chóng của khoa học kỹ
thuật trên nhiều lĩnh vực đặc biệt là trong lĩnh vực đa phương tiện (multimedia) hỗ trợ đắc
lực cho sự sản xuẩt, quản lý và phân phối các sản phẩm đa phương tiện như: hình ảnh, âm
thanh… và khiến chúng trở lên rất dễ dàng. Đặc biệt với sự phát triển mạnh mẽ của
Internet đã làm cho quá trình phân phối các sản phầm này trở nên rất nhanh chóng. Và
chính điều này đã đặt ra vấn đề là làm sao bảo vệ bản quyền sở hữu đối vơi các sản phẩm
đa phương tiện này.
Một trong những phương pháp được dùng rất sớm để bảo vệ quyền sở hữu đối với
các sản phẩm đa phương tiện là dùng phương pháp mã hóa. Các sản phẩm được mã hóa
và gửi cho người dùng. Người dùng chỉ đọc được các sẩn phẩm này khi mà nhận được
khóa để giải mã đi kèm. Phương pháp mã hóa này chỉ hiệu quả trong việc truyền dữ liệu
đa phương tiện nhưng không hiệu quả trong việc bảo vệ bản quyền sở hữu vì người dùng
sau khi giải mã thì sẽ nhân bản và phân phối lại sản phẩm đó.
Chính điểu đó mà chúng ta cần phải xây dựng một phương pháp tốt hơn để giải
quyết vấn đề này. Và thủy vân số là một trong những giải pháp được đưa ra để giải quyết
vấn đề về bản quyến sở hữu. Trong phạm vi khóa luận đã đi vào nghiên cứu các phương
pháp để giải quyết vấn đề đó. Mục tiêu của khóa luận là không chỉ nghiên cứu các
phương pháp xác thực bản quyền tác giả trên dữ liệu ảnh sử dụng thủy vân số mà còn xây
dựng một hệ thống thực nghiệm sử dụng một trong nhưng kỹ thuật thủy vân được nghiên
cứu trong khóa luận.
Ngoài phần Mở đầu và Kết luận, kết cấu của khóa luận bao gồm các chương sau:
Chƣơng 1: Giới thiệu về ẩn giấu tin. Nêu ra các khái niệm cơ bản nhất về
ẩn giấu tin và ứng dụng trong thực tế.
Chƣơng 2: Giới thiệu về thủy vân số. Nghiên cứu phân tích một số thuật
toán thủy vân số hiện nay đang được phổ biến. Tìm hiểu ưu nhược điểm của
từng thuật toán.
Chƣơng 3: Hướng giải quyết và đề xuất mô hình bài toán. Miêu tả chi tiết
thuật toán sử dụng và môi trường phát triển ứng dụng
Chƣơng 4: Kết quả thực nghiệm và đánh giá. Đưa ra kết quả đã làm được
và đánh giá kết quả.
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- 8 -
Chƣơng 1: Giới thiệu về ẩn – giấu tin
1.1. Khái niệm về ẩn - giấu tin.
Hiện nay có rất nhiều cách định nghĩa khác nhau về ẩn giấu tin như:
Theo tác giả Trịnh Nhật Tiến thì: Ẩn giấu tin (steganography) được hiểu là
nhúng mẩu tin mật vào một vật mang tin khác, sao cho khó phát hiện ra mẩu
tin đó, mặt khác nhận biết được vật mang tin đã được giấu một tin mật.[1]
Theo một số tác giả khác: Ẩn giấu tin là một kỹ thuật nhúng (giấu) một lượng
thông tin số nào đó vào trong một đối tượng dữ liệu số khác (giấu thông tin
chỉ mang tính quy ước không phải là một hành động cụ thể).[2]
Như vậy. Ẩn giấu tin là một kỹ thuật nhúng các mẩu tin vào một đối tượng mang tin
sao cho khó có thể phát hiện ra tin mật đó.
1.2. Phân loại kỹ thuật giấu tin:
Phân loại theo khuynh hƣớng:
Hình 1.1: Sơ đồ phân loại kỹ thuật giấu tin
Trong kỹ thuật giấu tin nhằm mục đích an toàn và bảo mật thông tin ở hai
khía cạnh:
Bảo mật dữ liệu đem giấu.
Bảo mật cho chính đối tượng được dùng để giấu tin.
Từ hai khía cạnh trên dần dần hình thành hai khuynh hướng chủ yếu của giấu tin là:
1. Giấu tin (Steganography) là kỹ thuật nhúng tin mật vào môi trường giấu
tin.
Theo khuynh hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu
được càng nhiều càng tốt và quan trọng là người khác khó phát hiện được một đối tượng
có bị giấu tin bên trong hay không bằng kỹ thuật thông thường.
Infomation
hiding
Giấu thông tin
Steganography
Giấu tin mật
Watermarking
Thuỷ vân số
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- 9 -
2. Thủy vân số (kỹ thuật đánh dấu số) là kỹ thuật nhúng dấu ấn số vào một tài
liệu hoặc sản phẩm, nhằm chứng thực nguồn gốc hay chủ sở hữu.
So sánh giữa giấu tin và thủy vân số[1]:
Giấu tin Thủy vân số
- Mục đích là bảo vệ thông tin
được giấu.
- Giấu được càng nhiều thông
tin càng tốt, ứng dụng trong truyền
dữ liệu thông tin mật.
- Thông tin được giấu phải ẩn,
không cho người khác thấy được
bằng mắt thường.
- Chỉ tiêu quan trọng nhất là
dung lượng của tin được giấu.
- Mục đích là bảo vệ môi trường
giấu tin.
- Chỉ cần thông tin đủ để đặc
trưng cho bản quyền của chủ sở hữu.
- Thông tin giấu có thể ẩn (thủy
vân ẩn) hoặc hiện (thủy vân hiện).
- Chỉ tiêu quan trọng nhất là tính
bền vững của tin được giấu.
Phân loại theo môi trƣờng giấu tin:
a. Giấu tin trong Audio
Kỹ thuật giấu thông tin trong audio phụ thuộc vào hệ thống thính giác của con
người (HAS – Human Auditory System). HAS cảm nhận được tín hiệu ở dải tần rộng và
công suất thay đổi lớn, nhưng lại kém trong việc phát hiện sự khác biệt nhỏ giữa dải tần
và công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu được các âm
thanh nhỏ thấp một cách dễ dàng. Kênh truyền tin cũng là một vấn đề. Kênh truyền hay
băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu. Giấu thông tin
trong audio yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin.
b. Giấu tin trong video
Giấu tin trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều
ứng dụng như điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản quyền tác
giả. Ta có thể lấy một ví dụ là hệ thống chương trình trả tiền xem theo video clip của các
thuật toán trước đây thường cho phép giấu ảnh vào trong video, nhưng gần đây kỹ thuật
cho phép giấu cả âm thanh và ảnh vào trong video.
c. Giấu tin trong ảnh
Giấu thông tin trong ảnh hiện nay chiếm tỷ lệ lớn nhất trong các chương trình ứng
dụng, các phần mềm, và hệ thống giấu tin trong đa phương tiện bởi lượng thông tin trao
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- 10 -
đổi được trao đổi bằng ảnh là rất lớn. Hơn nữa giấu thông tin trong ảnh cũng đóng vai trò
hết sức quan trọng đối với hầu hết các ứng dụng bảo vệ an toàn thông tin như: nhận thực
thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập,
giấu thông tin mật… Chính vì thế mà vấn đề này đã nhận được sự quan tâm rất lớn của
các cá nhân, tổ chức, trường đại học, và các viện nghiên cứu trên thế giới.
Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và
chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa. Ngày nay, khi ảnh
số đã được sử dụng rất phổ biến, thì giấu thông tin trong ảnh đã đem lại rất nhiều những
lợi ích quan trọng trên nhiều lĩnh vực của đời sống xã hội.
Ví dụ như đối với các nước phát triển, chữ kí tay đã được số hoá và lưu trữ sử dụng
như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó được dùng để nhận thực
trong các thẻ tín dụng của người tiêu dùng. Phần mềm MS Word của MicroSoft cũng cho
phép người dùng lưu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn
bản để đảm bảo tính an toàn của thông tin. Tài liệu sau đó được truyền trực tiếp qua máy
fax hoặc lưu truyền trên mạng. Theo đó, việc nhận thực chữ kí, xác thực thông tin đã trở
thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hay xuyên tạc thông tin
bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức nào. Thêm
vào đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật như những thông tin
về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các thông tin này được số
hoá và lưu trữ trong hệ thống máy tính hay trên mạng, chúng rất dễ bị lấy cắp và bị thay
đổi bởi các phần mềm chuyên dụng.
1.3. Mô hình giấu tin cơ bản:
Giấu thông tin vào phương tiện chứa và tách lấy thông tin là hai quá trình trái ngược
nhau.
a. Giấu thông tin vào phương tiện chứa
Qui trình giấu thông tin vào phương tiện chứa được mô tả qua sơ đồ khối hình 1.2
trong đó:
- Thông tin cần giấu tuỳ theo mục đích của người sử dụng, nó có thể là thông
điệp (với các tin bí mật) hay các logo, hình ảnh bản quyền.
- Phương tiện chứa: các file ảnh, text, audio… là môi trường để nhúng tin
- Bộ nhúng thông tin: là những chương trình thực hiện việc giấu tin
- Đầu ra: là các phương tiện chứa đã có tin giấu trong đó
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- 11 -
Hình 1.2: Lược đồ chung cho quá trình giấu tin[1][2][7]
b. Tách thông tin:
Tách thông tin từ các phương tiện chứa diễn ra theo quy trình ngược lại với đầu ra là
các thông tin đã được giấu vào phương tiện chứa. Phương tiện chứa sau khi tách lấy thông
tin có thể được sử dụng, quản lý theo những yêu cầu khác nhau.
Thông tin giấu
Môi trường
chứa(audio, ảnh,
video) Môi trường chứa
đã được giấu tin
Khóa giấu tin
Bộ
nhúng
thông tin
Phân
phối
Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh
- 12 -
Hình 1.3: Lược đồ chung cho quá trình giải mã[1][2][7]
Hình vẽ 1.3 chỉ ra các công việc giải mã thông tin đã giấu. Sau khi nhận được đối
tượng phương tiện chứa có giấu thông tin, quá trình giải mã được thực hiện thông qua
một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khoá của quá trình nhúng. Kết
quả thu được gồm phương tiện chứa gốc và thông tin đã giấu. Bước tiếp theo thông tin đã
giấu sẽ được xử lý kiểm định so sánh với thông tin ban đầu.
1.4. Tính chất của ẩn giấu tin trong ảnh.
Có nhiều phương pháp ẩn giấu tin trong ảnh đã được nghiêm cứu. Để đánh giá chất
lượng của một phương pháp ẩn giấu tin, người ta dựa vào một số chỉ tiêu sau:[1][7]
a. Bảo đảm tính vô hình.