Đề tài: Nén audio số

1:KHÁI NIỆM CƠ SỞ VỀ NÉN AUDIO 2:NÉN TÍN HIỆU AUDIO THEO TIÊU CHUẨN MPEG 3:TIÊU CHUẨN AC-3 TRONG HỆ THỐNG DTV

pptx39 trang | Chia sẻ: nyanko | Lượt xem: 1465 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Đề tài: Nén audio số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
KỸ THUẬT TRUYỀN HÌNH SỐĐỀ TÀI: NÉN AUDIO SỐ Sinh viên : Trần Văn LuânMã sv : 0441050079Lớp : ĐH CNKT Điện tử 1– K4 1:KHÁI NIỆM CƠ SỞ VỀ NÉN AUDIO 2:NÉN TÍN HIỆU AUDIO THEO TIÊU CHUẨN MPEG3:TIÊU CHUẨN AC-3 TRONG HỆ THỐNG DTVAUDIO SỐ VÀ CÁC TIÊU CHUẨN NÉN AUDIO SỐ1: MỞ ĐẦU:-Nén tín hiệu audio dựa trên các đặc tính sinh lý âm thanh cũng như giới hạn về thính giác của con người nhầm loại bỏ những thành phần thông tin dư thừa trong các tín hiệu audio.-Hệ thống thính giác của con người hoạt động như 1 bộ phân tích phổ và phần phổ của âm thanh nghe được độc lập sau khi qua bộ lọc thông giải gọi là các giải băng chuẩn.KHÁI NIỆM CƠ SỞ VỀ NÉN AUDIOCó 2 kỹ thuật mã hóa-Mã hóa dự đoán trước trong miền thời gian: Sử dụng việc mã hóa khác nhau với các thành phần khác nhau của các mẫu liên tiếp mà có thể khôi phục được. Sử dụng việc giảm tốc độ dòng bit để mã hóa và truyền dẫn các thông tin tín hiệu video. -Mã hóa chuyển đổi trong miền tần số:Sử dụng các khối block của các mẫu audio ra từ bộ PCM đều để truyền từ miền time sang miên tần số những dải băng khác nhau.2:Kỹ thuật nén audio-Nó cho phép khôi phục lại dòng bit những thông tin nguyên thủy sau bộ giải nén mà ko gây tổn hao.-Nó loại bỏ độ dư thừa thống kê,những thông tin tồn tại trong tín hiệu audio có thể dự báo trước từ những mẫu trước đó.***Những kỹ thuật mã dự đoán trước rong miền thời gian bao gồm:-Thuật toán visai:-Các mã entropy-Các thông số quá tải khối dữ liệuNÉN KHÔNG TỔN HAOTín hiệu vào tương tự 12bit trọng sốBộ chuyển đổi A/D 16bitBộ nhớ đệm trễThang độ sốMô hình HASTính toán thang độBộ ghépHệ thống mã hóa điểm quá tải khối dữ liệu audio-Sử dụng công nghệ mã hóa tri giác.-Được kết hợp từ các kỹ thuật+Kỹ thuật “masking -che”+Chặn mức tạp âm lượng tử cho từng âm độ của tín hiệu âm thanh.+Mã hóa nối.NÉN CÓ TỔN HAONÉN TÍN HIỆU AUDIO THEO TIÊU CHUẨN MPEG-Dùng cho mã hóa ảnh động và tín hiệu audio kèm theo cho lưu trữ với tốc độ khoảng 1,5M bit/sCHUẨN MPEG-1Chuyển đổi từ miền thời gian sang miền tần sốMã hóa nốiBit chỉ định+lượng tử hóa+mã hóaBộ đệm khung số liệuMô hình tâm sinh lí ngheCấu trúc cơ sở của bộ mã hóa MPEGCấu trúc cơ sở của bộ giải mã MPEG tín hiệu audioKhung không đóng góiTái tạoChuyển đổi từ miền tần số sang miền timeDòng bit mã hóaCác mẫu audioPCM @32/441/48khzSố liệu phụ1:Audio được chuyển về miền tần số và toàn bộ dải phổ của nó được chia thành 32 băng con thông qua bộ lọc băng con.-lọc băng con:-Băng chuyển đổi-Lọc băng ghép2:Với mỗi băng con người ta xác định mức biên độ tín hiệu và mức nhiễu bằng”Mô hình tâm sinh lý nghe-Psychoacoustic model”3: Mỗi băng con đó được lượng tử hóa thông qua lượng tử các thành phần nghe thấy trong mỗi băng.Thuật toán nén tín hiệu Audio MPEG bao gồm3 bước-Mức I: dùng trong các thiết bị dân dụng-Mức II: dùng trong các thiết bị chuyên dụng và Multimedia-Mức III: dùng trong các hệ thống mã hóa tiếng nói 64kb/s và thấp hơn, dùng cho mã hóa chất lượng cao cho tín hiệu âm nhạcMức I tạo ra từ các thuật toán cơ bản. Mức II và mức III là sự kết hợp của các mức I. 3 mức riêng biệt dùng trong MPEGMức IMức IIMức IIITốc độ dòng số liệu từ 32 đến 448 Kbit/s-tín hiệu vào chia thành các khug bao gồm 384 mẫu trên 1 kênh.-Chu kì khung là 8 ms cho kênh 48Khz-32 băng thông con có độ rộng bằng nhau tạo ra từ các khối block gồm 12 mẫu(32*12=384 mẫu)-Hệ số tỉ lệ 6bit trên một băng -Phân phối bit theo phương thức thích ứng trước-mẫu băng con được lượng tử hóa bằng cách tính toán phân bố các bit-Sử dụng cho các kênh đơn giản hay đa kênh-stereo -Tốc độ dòng số liệu từ 32 đến 384 Kbit/s-tín hiệu vào chia thành các khug bao gồm 1152 mẫu trên 1 kênh.-Chu kì khung là 24ms cho kênh 48Khz-32 băng thông con có độ rộng bằng nhau tạo ra từ các khối block gồm 36 mẫu(32*12=384 mẫu)-Hệ số tỉ lệ 6bit trên một băng -Phân phối bit theo phương thức thích ứng trước-mẫu băng con được lượng tử hóa bằng cách tính toán phân bố các bit--có nhiều ứng dug rộng rãi trong chuyển đổi –ROM,DVB,DBS,multimedia-Tốc độ dòng số liệu từ 32 đến 320Kbit/s-tín hiệu vào chia thành các khug bao gồm 1152 mẫu trên 1 kênh.-Chu kì khung là 824ms cho kênh 48Khz-32 băng thông con có độ rộng bằng nhau được chia thành 18 MDCT-Hệ số tỉ lệ được sử dụng để làm giảm các bước lượng tử và tạp âm lượng tử.-Sử dụng cho các kênh đơn giản hay đa kênh-stereo -Sử dụng trong các ứng dụng cần tốc độ bit thấp như mạng IDSN,đường truyền vệ tinh và âm thanh chất lượng cao qua mạng internet.GR0GR1GR2GR11Cấu trúc khung mức I audio MPEG013132 mẫuSync wordSystem word12 bit20bitBít12121421122112Ý nghĩaTừ đồng bộID(MPEG=1)Mức(Layer)Chống lỗiChỉ số tốc độ bitTần số lấy mẫuBit đệmBit riêngModelModel mở rộngBản quyềnGốc hay sao chụpMức nhấnCRC=cyclic redundancy check=Bit kiểm tra độ dư thừa tuần hoàn.HeaderCRCBit allocationScale factors samplesAncillary dataĐịnh dạng dòng bit số liệu audio mức I, mức II,mức IIIheaderCRCBit allocationSCFSIScale factors samplesAncillary dataheaderCRCSide information Bit reservoirAncillarydata(32) (0;16 ) (128-256) (0-384) (384) (32) (0;16) (128-256) (0-60) (0-1080) (1152)(32) (0;16) (128-256) (0-384) (384) Layer ILayer IILayer III- tiêu chuẩn MPEG là đa năng cho phép hoạt động đạt chất lượng cao, tốc độ truyền số liệu nhanh và thiết bị phức tạp.-Chất lượng audio có thể thay đổi trong một phạm vi rộng tùy thuộc vào dòng bit từ thấp đến cao. Tốc độ 32 đến 1066kbit/s.CHUẨN MPEG-2headerCRCBit allocationSCFSIScale factorsSub-band samplesMC headerMC CRCMC allocationMC SCFSIMC predictorMC sub-band samplesLo/Ro Basic stereoMunti-channel(MC) audio data informationMulti-lingualcommentaryAncillaryData 1Ancillary Data 2Định dạng dòng bit số liệu audio chuẩn MPEG-2 mở rộng của chuẩn MPEG-1Các chuẩn nén tín hiệu audio theo tiêu chuẩn MPEGMPEG 2T/số thấpMCMPEG 1Lớp IILớp IILớp IIILớp IILớp IILớp IIILớp IILớp IILớp IIIMono và stereo32 44,1 48Khz18 22.05 24Khz32 44.1 48KhzMono và stereo5 kênhAudio MPEG-2 là sự mở rộng của Audio MPEG-1 để đáp ứng các yêu cầu của các ứng dụng như:Dải chất lượng audio trải rộng từ tốc độ bit thấp đến cao: 32kp/s, 1066kp/s.Mỗi frame của dòng bít audio mpeg-2 được chia làm 2 phần: Tương hợp với MPEG-1 Phần mở rộngMã hóa được tới 6 kênh audio kể cả 1 kênh LFE để hỗ trợ âm thanh surroud: left, right, center, L surroud, R surroud và LFE (tần thấp) Hỗ trợ các tốc độ lấy mẫu phân nửa: 16KHZ, 22.05KHZ, 24KHZCác đặc tính mở rộng này đều được áp dụng cho mỗi Layer Ngoài ra trong nén audio người ta còn dùng một số chuẩn nén khác như AC-3 có chất lượng cao hơn, truyền được nhiều đường tiếng hơn. Tuy vậy các thiết bị giải mã đang được sử dụng hiện nay chủ yếu là MPEG-2 Layer II. Do vậy việc phát sóng truyền hình số đối với kênh audio là MPEG-2 Layer II. Tốc độ đối với mỗi kênh stereo lên chọn từ 182 – 192 Kb/s.Dòng bit MPEG-1 có thể mở rộng thành dòng MPEG-2 một cách dễ dàngTừ dòng MPEG, mỗi bộ giải mã MPEG-1 có thể tách các tín hiệu Mono hoặc các tín hiệu stereo và các tín hiệu MPEG-2 còn lạiTrong hệ thống MPEG có thể truyền đồng thời nhiều thông tin phụMPEG-1 được dùng rộng rãi với kỹ thuật chuyên dụng Chuẩn MPEG cho phép sử dụng phát thanh số trên mặt đất và qua vệ tinh DAB và DBVcho truyền hình vệ tinh,truyền hình cap và phát sóng vệ tinh trên mặt đất.Ưu điểm của chuẩn MPEG I: Nén audio bằng tiêu chuẩn AC-3TIÊU CHUẨN AC-3 TRONG HỆ THỐNG DTVBộ 3 mã hóa AC-3Thiết bị truyền dẫnTráiGiữaPhảiSurround tráiSurround phảiHiệu ứng Tần thấpDòng bit mã hóa 384kb/sTín hiệu Điều chếTruyền dẫnTín hiệu audio vàoAC-3Thiết bị thuBộ mã hóa AC-3TráiGiữaPhảiSurround tráiSurround phảiHiệu ứng Tần thấpDòng bit mã hóa384kb/sTín hiệuĐiều chếThu tín hiệuTín hiệu audio ra Bộ nén audio có 3 ứng dụng điển hình sauPhát sóng quảng mặt đất tín hiệu audioPhân phối tín hiệu audio qua cáp kim loại hoặc cáp sợi quangLưu trữ tín hiệu audio bằng từ tính, quang, chất bán dẫn hay bằng các phương tiện lưu trữ khác. Bộ mã hóa tín hiệu audio theo tiêu chuẩn AC-3Mã hóaBộ lọc băng phân tíchBộ mã hóa hình bao phổBộ chỉ địnhLượng tử hóa phần định trịĐịnh dạng khung AC-3Dòng bit mã hóa AC-3Thông tin về bit chỉ địnhHình bao phổ đã mã hóaPhần định trị đã lượng tửPhần định trịCác mẫu PCM Chức năng:mỗi khung được gắn 1 tiêu đề, bao gồm các thông tin(tốc độ bit, tốc độ mẫu,số kênh mã hóa audio,các số liệu khác ) đòi hỏi việc đồng bộ từ mã hóa giải mã dòng bit.các mã phát hiện lỗi chèn vào cho phép bộ giải mã kiểm tra lại các khung số liệu bên thu các lỗi tự do.Khả năng phân tích phổ của bộ lọc băng phân tích có thể thay đổi rất linh động nhằn nâng cao đặc tính của quá trình biến đổi từ miền thời gian sang miền tần số của mỗi khối audio.Mà HÓAHình bao phổ tín hiệu có thể được mã hóa với độ phân tích thời gian/tần số là 1 biến số.Có thể thực hiện được các bit chỉ số phức tạp hơn và các thông số của trọng âm của các bit chỉ định thông thường có thể được sửa đổi nhằm đưa ra 1 bit chỉ định tối ưu hơn.Các kênh có thể ghép lại tại những tần số cao nhằm đạt được độ lợi mã cao có hiệu quả với cả các dòng bit tốc độ thấp.Giải mãĐồng bộ khung phát hiện lỗi và giải định dạng khung AC-3Bit chỉ địnhGiải lượng tử hóa phần định trịGiải mã hình bao phổBộ lọc băng tổng hợpDòng bit mã hóa AC-3Hình bao phổ đã mã hóaThông tin về bit chỉ địnhSố mũPhần định trị đã lương tửPhần định trịCác mẫu PCM Gồm 3 hoạt động cơ bản:+ Phạm vi hoạt động thứ nhất: TH audio biểu diễn trong miền thời gian được thay đổi trong miền tần số + Thu được các hệ số trong miền tần số và sau đó đem mã hóa Các hệ số tần số đã lượng tử hóa thô được định dạng thành dòng cơ sở audio+ Đơn vị cơ bản của bộ mã hóa audio là khung đồng bộ AC-3, gồm 1536 mẫu audio: - Mỗi khung đồng bộ của t/h audio là 1 thực thể đầy đủ độc lập của bộ mã hóa - Dòng bit cơ sở bao gồm các thông tin cần thiết cho phép bộ giải mã lấy ra và giải lượng tử hóa các hệ số tần số trong dòng bit cơ sở khôi phục lại các hệ số tần số. -Bộ lọc băng tổng hợp làm việc ngược lại với bộ lọc băng phân tích nó biến đổi các hệ số tần số khôi phục được thành t/h trong miền thời gian.CÁC HOẠT ĐỘNG CHI TIẾT CỦA TIÊU CHUẨN AC-3Bô lọc băng phân tíchBit chỉ địnhLượng tử hóaBit chỉ địnhGiải lượng tử hóaBộ lọc băng tổng hợpKênh truyềnTín hiệu audio nguồnKhôi phục tín hiệu audioHệ số tần sôKhôi phục hệ sốTần sốTổng quan hệ thống nén audio chuẩn AC-3a)Cửa sổ chức năng-Nhân vector của 512 khối điểm với 512 điểm của cửa sổ chức năng-Cửa sổ chức năng có giá trị 1,0 trong vùng trung tâm. Mũi nhọn gần như có giá trị bằng 0 tại phần cuối.-Hình dạng được xác định trong sự gia công “overlap/add” tại bộ giải mã kết quả khôi phục tự do lại các khối tạo raBỘ LỌC BĂNG CHUYỂN ĐỔI-Tín hiệu qua bộ biến đổi TDAC là 512 điểm từ miền time và tín hiệu ra là 256 hệ số trong miền tần số.-Sau q/trình này vẫn còn những giá trị còn lại từ miền time nó làm nảh hưởng tới chất lượng âm thanh, ảnh hưởng tín hiệu audio.Nó có thể được giảm bớt khi thay đổi độ dài từ quá trình thực hiện việc biến đổi.b)Xóa dấu vết trong miền time bằng quá trình biến đổi Các hệ số tần số nhận được từ quá trình chuyển đổi=> 1 ký hiệu điểm nhị phân thay đổi. Giá trị này nhỏ hơn 1.0Mã hóa số mũ.-Một phần của quá trình xử lí được áp dụng cho các số mũ nhằm giảm tổng số liệu cần thiết để mã hóa chúng.+Các số mũ của 6 khối trong 1 khung đồng bộ AC-3 đơn lẻ được khảo sát sự khác nhau từ các khối đến khối.+Để tạo thuận lợi trong thực tế các số mã được mã hóa khác nhau trong miền tần số. Số mũ đầu tiên được mã hóa hoàn toàn và có sự khác nhau giữa số mũ hiện tại và số mũ tiếp theo.BIỂU DIỄN DÒNG SỐ LIỆU AUDIO Mà HÓA+Cuối cùng tại nơi phổ khá bằng phẳng hoặc 1 tập hợp số mũ chỉ bao trùm 1 hay 2 khối,các số mũ khác nhau có thể được phân chia qua 2 hay 4 hệ số tần số.Hiệu quả là: 0.39bit/số mũ(mẫu). Các số mũ được mã hóa chỉ với những tần số cần thiết cho tri giác của toàn bộ đặc tuyến tần số.b)Phần định trị-Mỗi phần định trị dã chuẩn hóa được lượng tử hóa với sự chính xác từ 0 đến 16bit.-Mục đích của nén tín hiệu audio là làm tăng cực đại làm tăng chất lượng audio tại tốc độ bit quy định ,chỉ định thuận lợi của các bit giá trị riêng được yêu cầu. -Thuật toán bit chỉ định được xem như là 1 bộ thích ứng ngược.-Tín hiệu và qua tâm thủ tục chỉ định là các giá trị số mũ đã giải mã cho ta hình ảnh của phổ tín hiệu. Đường cong che lấp và sự phân phối bit.Bit chỉ định Một dòng bit audio từ bộ mã hóa AC-3 được tạo ra từ một chuỗi các khung đồng bộ.Mỗi khung đồng bộ gồm 6 khối audio đã mã hóa, mỗi khối trình bày bởi 256 mẫu audio mớiDòng bit cơ sở và cú phápAB 0AB 1AB 2AB 3AB 4AB 5AUXCRCSI BSISI BSIKhung đồng bộVị trí lí tưởng để nối các dòng bít audio đã mã hóa là tại đường gianh giới của khung đông bộThực hiện tại gianh giới khung đồng bộ thì giải mã audio không bị gián đoạn, ngược lại thực hiện ngẫu nhiên thì giải mã sẽ bị gián đoạn.a)Sự nối và chènPhần cuối của mỗi khung đồng bộ AC-3 đều có mã sửa lỗi CRC 16 bit.Dùng mã này xác định có hay không một khung audio bị thiệt hại hay chưa đầy đủ.Dùng các cờ dự phòng lỗi trong hệ thống truyền tải phát hiện lỗi bộ giải mã che đậy lỗi (hoặc tín hiệu câm)b) Mã phát hiện lỗiĐạt được tốc độ dòng số liệu từ 32 đến 640 Kbit/sChu kỳ khung là 32 ms cho kênh 48KHZ (384*4*20,83 us =24 ms)Số băng con la 256/128Hệ số tỉ lệ là 4,5 bit trên một băng (dải động âm thanh là 144dB)Phân phối bit theo phương thức thích ứng trướcChế độ mono cho mã hóa kênh 5,1Mở rộng trong các ứng dụng của người sử dụngTiêu chuẩn nén audio MPEG ứng dụng rộng rãi trong thực tế như HDTV, CATV, DVBKhả năng trộn tín hiệu theo yêu cầu của ng nghe âm thanh stereo hay monoMức âm lượng ổn định khi chuyển kênh, đa kênh và stereoKhả năng điều khiển dải động âm thanhCác đặc tính của AC-3
Tài liệu liên quan