Bài giảng Kiến trúc máy tính - Bài 5: Tổ chức bộ nhớ - Phần Bộ nhớ đệm nhanh

Nguyên tắc chung  Cache có tốc độ nhanh hơn bộ nhớ chính, chứa dữ liệu và lệnh thường dùng đến.  Cache được đặt giữa CPU và bộ nhớ chính nhằm tăng tốc độ truy nhập bộ nhớ của CPU  Cache có thể được đặt trên chip của CPU (vận hành bằng bộ điều khiển cache) Ví dụ về thao tác của cache  CPU yêu cầu nội dung của ngăn nhớ  CPU kiểm tra trên cache với dữ liệu này  Nếu có, CPU nhận dữ liệu từ cache (nhanh) (cache hit)  Nếu không có (cache miss), đọc block nhớ chứa dữ liệu từ bộ nhớ chính vào cache (lâu) (cache penalty).  Tiếp đó chuyển dữ liệu từ cache vào CPU

pdf11 trang | Chia sẻ: thanhle95 | Lượt xem: 480 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Bài giảng Kiến trúc máy tính - Bài 5: Tổ chức bộ nhớ - Phần Bộ nhớ đệm nhanh, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
15/11/2017 1 Bài 5 Tổ chức bộ nhớ Phần BỘ NHỚ ĐỆM NHANH (CACHE MEMORY) (tham khảo trang 66 – KTMT Cần Thơ) Ý tưởng thiết kế cache  Xác suất truy cập dữ liệu trong bộ nhớ trong Một chương trình mất 90% thời gian thi hành lệnh của nó để thi hành 10% số lệnh của chương trình.  Cache thiết kế dựa trên 2 nguyên tắc:  Nguyên tắc về thời gian: cho biết các ô nhớ được hệ thống xử lý thâm nhập có khả năng sẽ được thâm nhập trong tương lai gần.  Nguyên tắc về không gian: cho biết, bộ xử lý thâm nhập vào một ô nhớ thì có nhiều khả năng thâm nhập vào ô nhớ có địa chỉ kế 15/11/2017 2 Nguyên tắc chung  Cache có tốc độ nhanh hơn bộ nhớ chính, chứa dữ liệu và lệnh thường dùng đến.  Cache được đặt giữa CPU và bộ nhớ chính nhằm tăng tốc độ truy nhập bộ nhớ của CPU  Cache có thể được đặt trên chip của CPU (vận hành bằng bộ điều khiển cache) Chuyển từng từ Chuyển từng khối CPU Cache Bộ nhớ Ví dụ về thao tác của cache  CPU yêu cầu nội dung của ngăn nhớ  CPU kiểm tra trên cache với dữ liệu này  Nếu có, CPU nhận dữ liệu từ cache (nhanh) (cache hit)  Nếu không có (cache miss), đọc block nhớ chứa dữ liệu từ bộ nhớ chính vào cache (lâu) (cache penalty).  Tiếp đó chuyển dữ liệu từ cache vào CPU 15/11/2017 3 Cấu trúc chung của cache / bộ nhớ chính  Bộ nhớ chia thành các Block cache chia làm các Line có kích thước bằng nhau Vận hành  Một số Block của bộ nhớ chính được nạp vào các Line của cache.  Nội dung Tag (thẻ nhớ) cho biết block nào của bộ nhớ chính hiện đang được chứa ở line đó.  Khi CPU truy nhập (đọc/ghi) một từ nhớ, có 2 khả năng xảy ra:  Từ nhớ đó có trong cache (cache hit)  Từ nhớ đó không có trong cache (cache miss) 15/11/2017 4 Các vấn đề khi vận hành Vì số line của cache ít hơn số block của bộ nhớ chính, cần có một thuật giải ánh xạ thông tin trong bộ nhớ chính vào cache.  Câu hỏi 1: Phải để một khối bộ nhớ vào chỗ nào của cache (sắp xếp khối)?  Câu hỏi 2: Làm sao để tìm một khối khi nó hiện diện trong cache (nhận diện khối)?  Câu hỏi 3: Khối nào phải được thay thế trong trường hợp thất bại cache (thay thế khối)?  Câu hỏi 4: Việc gì xảy ra khi ghi vào bộ nhớ (chiến thuật ghi)? Các PP ánh xạ địa chỉ a) Ánh xạ trực tiếp (Direct mapping)  Mỗi block của bộ nhớ chính chỉ có thể được nạp vào 1 line duy nhất của cache.  Quy ước nạp: (với m là số line, đánh số: 0 đến m-1 B0 → L0 B1 → L1 ...... Bm-1 → Lm-1 Bm → L0 Bm+1 → L1  Vì thế: L0 : B0, Bm, B2m ... L1 : B1, Bm+1, B2m+1 .. Kết luận: Bj chỉ có thể được nạp vào Li với i = j mod m 15/11/2017 5 Ví dụ 1(a)  Bộ nhớ trong có 32 khối, cache có 8 khối, mỗi khối gồm 32 byte, khối thứ 12 của bộ nhớ trong được đưa vào cache. Bộ nhớ có kích thước 1 KB  Thao tách trên bit của Phép tính mod cho 2n: (8 = 23)  Tối đa 32 khối: 5 bit  12 giá trị nhị phân: 0 1 1 0 0  12 mod 8 = 4, 3 bit cuối 1 0 0  12 / 8 = 1, 2 bit đầu 0 1 giá trị (01) được lưu trong Tag để phân biệt Block nào đang nằm trong Line Ví dụ: để phân biệt 4, 12, 20, 28 4 / 8 = 0 (00) 12 / 8 = 1 (01) 20 / 8 = 2 (10) 28 / 8 = 3 (11) 15/11/2017 6 (cơ chế) Địa chỉ CPU phát ra có N bit, được chia thành 3 trường:  Trường Byte (có n1 bit) để xác định byte nhớ trong Line (Block) 2n1 = kích thước 1 Line  Trường Line (có n2 bit) để xác định Line trong Cache 2n2 = số Line trong Cache Dung lượng Cache = 2n1 x 2n2 = 2n1+n2  Trường Tag (có n3 bit): số bit còn lại n3 = N - (n1 + n2) > 0 vì 2N >> 2n1+n2 15/11/2017 7 Ví dụ 1(b)  Trường Byte: Địa chỉ từ (byte) nhớ: 5 bit  Trường Line: 3 bit  Trường Tag: 2 bit Ví dụ: truy cập từ nhớ có địa chỉ (10 bit) 195h 0 1/1 0 0/1 0 1 0 1 b) Ánh xạ liên kết toàn phần (Fully Associative Mapping)  Mỗi Block có thể được nạp vào bất kỳ Line nào của cache.  Địa chỉ bộ nhớ do CPU phát ra được chia thành 2 phần: Tag và Byte.  Để kiểm tra xem một Block có trong cache hay không, phải đồng thời kiểm tra tất cả Tag của các Line trong cache.  Cần các mạch phức tạp để kiểm tra. 15/11/2017 8 c) Ánh xạ liên kết tập hợp (Set Associative Mapping)  Là phương pháp dung hòa của 2 phương pháp trên  Chia cache thành các tập: S0, S1, S2 ...  Mỗi Set có một số Line (2, 4, 8, 16 Line) Vd mỗi Set có 2 line  Mỗi block được nạp vào 1 line nào đó trong Set nhất định:  B0 → S0 B1 → S1 ...... Bk-1 → Sk-1 Bk → S0  Địa chỉ do CPU phát ra có 3 trường: Tag, Set, Byte Ví dụ 2  Hệ thống có:  bộ nhớ chính = 256 MB  Cache = 128 KB  Line = 16 Byte  Xác định số bit của các trường địa chỉ khi  Ánh xạ trực tiếp  Ánh xạ liên kết tập hợp 4 Line/Set 15/11/2017 9 1) 2N = 256 x 220 = 228 ⇒ N = 28 bit  Tính cho trường Byte: Kích thước line = 16 = 24 Byte ⇒ n1 = 4 bit  Tính cho trường Line: Số line trong Cache: 128 x 210 / 16 = 213 ⇒ n2 = 13 bit  Tính cho trường Tag: n3 = N - (n1 + n2) = 28 - (4 + 13) = 11 bit 2)  Trường Byte: n1 = 4 bit  Trường Set: Số Set = Số line / 4 = 213 / 4 = 211 ⇒ n2 = 11 bit  Trường Tag: n3 = N - (n1 + n2) = 28 - (4 + 11) = 13 bit 3. Các thuật giải thay thế block trong cache  Khi CPU truy nhập một thông tin mà không có trong cache (cache miss) thì nạp block chứa thông tin đó vào trong cache để thay thế block cũ trong cache.  Ánh xạ trực tiếp chỉ có 1 cách nạp không cần thuật giải để nạp.  Hai phương pháp ánh xạ liên kết cần có thuật giải để lựa chọn thay thế. 15/11/2017 10  Các thuật giải thay thế block trong cache 1. Random: thay block một cách ngẫu nhiên. 2. FIFO (First In, First Out): thay thế block đã tồn tại lâu nhất trong toàn cache đối với ánh xạ liên kết toàn phần, trong set đối với ánh xạ liên kết tập hợp. 3. LFU (Least Frequently Used): thay block có số lần truy nhập ít nhất. 4. LRU (Least Recently Used): thay block có khoảng thời gian dài nhất không được truy nhập được đánh giá là hiệu quả nhất. 4. Phương pháp ghi dữ liệu khi cache hit (để đồng bộ dữ liệu giữa cache và bộ nhớ)  Ghi xuyên qua (Write through)  ghi cả cache và bộ nhớ chính  tốc độ chậm  Ghi trả sau (Write back)  chỉ ghi ra cache  tốc độ nhanh  khi block trong cache bị thay thế cần phải ghi trả cả block về bộ nhớ chính 15/11/2017 11 Các mức cache  Việc dùng cache trong có thể làm cho sự cách biệt giữa kích thước và thời gian thâm nhập giữa cache trong và bộ nhớ trong càng lớn.  Người ta đưa vào nhiều mức cache:  Cache mức một (L1 cache): thường là cache trong (on-chip cache; nằm bên trong CPU)  Cache mức hai (L2 cache) thường là cache ngoài (off-chip cache; cache này nằm bên ngoài CPU).  Ngoài ra, trong một số hệ thống còn có tổ chức cache mức ba (L3 cache), đây là mức cache trung gian giữa cache L2 và một thẻ bộ nhớ.
Tài liệu liên quan