5.1.1. Các thuật toán sắp xếp (1/2)
Thế nào là sắp xếp?
Đưa một dãy các đối tượng về dạng thứ bậc nào đó.
Giải thuật sắp xếp dựa trên sự so sánh nào đó.
Việc sắp xếp chỉ dựa trên phép toán so sánh.
Các phép toán cơ bản của sắp xếp.
So sánh.
Tráo đổi giữa các phần tử.
5.1.1. Các thuật toán sắp xếp (1/2)
Quy ước.
Phương pháp sắp xếp của chương này là sắp xếp
trong.
Các giải thuật có thể thay thế cho nhau được.
Mỗi mảng có một số phần tử.
Thành phần để xem xét trong sắp xếp có thể so
sánh được.
N là số phần tử cần sắp xếp
31 trang |
Chia sẻ: thanhle95 | Lượt xem: 598 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Cấu trúc dữ liệu và giải thuật - Bài 5: Phương pháp sắp xếp đơn giản - Ngô Hữu Phước, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Lecturer: PhD. Ngo Huu Phuc
Tel: 0438 326 077
Mob: 098 5696 580
Email: ngohuuphuc76@gmail.com
Cấu trúc dữ liệu và giải thuật
Bài 5. Phương pháp sắp xếp đơn giản
Ngo Huu Phuc, Le Quy Don Technical University1
Bài 5: Các phương pháp sắp xếp đơn giản
Nội dung:
6.1. Khái niệm và vai trò của sắp xếp (13)
6.2. Sắp xếp chèn (6)
6.3. Sắp xếp chọn (4)
6.4. Sắp xếp nổi bọt (4)
Tham khảo:
1. Lecture 16 Introduction to Sorting.htm
2. Data Structures and Algorithms Sorting.htm
3. Tham khảo bài giảng của TS Nguyễn Nam Hồng
Ngo Huu Phuc, Le Quy Don Technical University2
5.1. Khái niệm và vai trò của sắp xếp
5.1.1. Các thuật toán sắp xếp.
5.1.2. Vai trò của sắp xếp.
5.1.3. Các vấn đề của sắp xếp.
5.1.4. Một số ứng dụng của sắp xếp.
5.1.5. Ý tưởng sắp xếp và phương pháp thực hiện.
5.1.6. Phân tích hiệu quả của giải thuật sắp xếp.
Ngo Huu Phuc, Le Quy Don Technical University3
5.1.1. Các thuật toán sắp xếp (1/2)
Thế nào là sắp xếp?
Đưa một dãy các đối tượng về dạng thứ bậc nào đó.
Giải thuật sắp xếp dựa trên sự so sánh nào đó.
Việc sắp xếp chỉ dựa trên phép toán so sánh.
Các phép toán cơ bản của sắp xếp.
So sánh.
Tráo đổi giữa các phần tử.
Ngo Huu Phuc, Le Quy Don Technical University4
5.1.1. Các thuật toán sắp xếp (1/2)
Quy ước.
Phương pháp sắp xếp của chương này là sắp xếp
trong.
Các giải thuật có thể thay thế cho nhau được.
Mỗi mảng có một số phần tử.
Thành phần để xem xét trong sắp xếp có thể so
sánh được.
N là số phần tử cần sắp xếp.
Ngo Huu Phuc, Le Quy Don Technical University5
5.1.2. Vai trò của sắp xếp (1/2)
Nếu các đối tượng trong một mảng nào đó đã được sắp
theo trật tự nào đó, có thể truy xuất thông tin nhanh chóng
và chính xác.
Việc xây dựng giải thuật cho phép sắp xếp từng phần tử
của mảng sẽ mất nhiều thời gian, độ phức tạp của giải
thuật cỡ O(n2).
≈ 50,000,000,000,000 bước cho việc sắp một mảng có 10,000,000
phần tử
⇒ 500,000 giây = 58 ngày, với máy tính có thể thực hiện 100 triệu
phép tính toán/giây.
Với giải thuật sắp xếp cho cả mảng, độ phức tạp của giải
thuật cỡ O(nlogn).
≈ 250,000,000 bước cho việc sắp một mảng có 10,000,000 phần tử
⇒ 2.5 giây, với máy tính có thể thực hiện 100 triệu phép tính
toán/giây.
Ngo Huu Phuc, Le Quy Don Technical University6
5.1.2. Vai trò của sắp xếp (2/2)
Như vậy, sắp xếp là giải thuật cơ bản.
Thông thường, 25% khả năng của CPU dành
cho việc sắp xếp.
Sắp xếp là bước cơ bản cho một số giải thuật
khác, ví dụ: tìm kiếm nhị phân.
Có nhiều cách tiếp cận đến giải thuật sắp xếp,
từ đó, có nhiều giải thuật săp xếp khác nhau.
Ngo Huu Phuc, Le Quy Don Technical University7
5.1.3. Các vấn đề của sắp xếp
Sắp xếp theo trật tự tăng hay giảm?
Với cùng một giải thuật sắp xếp, có thể dùng cho cả sắp
theo trật tăng hay giảm, bằng việc thay đổi phép so sánh:
=.
Các khóa của giải thuật sắp xếp?
Có thể dùng nhiều khóa cho cùng một giải thuật sắp xếp.
Cần lưu ý đến ý tưởng của bài toán.
Với các dữ liệu không phải là số thì sao?
Với chuỗi, sử dụng phép so sánh chuỗi, từ điển, hay quy
tắc nào đó.
Ví dụ: Sắp chuỗi Brown-Williams, Brown America, Brown,
John?
Ngo Huu Phuc, Le Quy Don Technical University8
5.1.4. Một số ứng dụng của sắp xếp (1/2)
Với kết quả của quá trình sắp xếp, một số vấn đề
có thể được thực hiện dễ dàng.
Nói chung, nếu có quá trình sắp xếp sẽ tăng tốc
cho tìm kiếm trong ứng dụng cụ thể.
Ví dụ, nếu có một mảng đã sắp, có thể dễ dàng
tìm được phần tử lớn thứ k trong mảng, với thời
gian hằng số.
Ngo Huu Phuc, Le Quy Don Technical University9
5.1.4. Một số ứng dụng của sắp xếp (2/2)
Một số ứng dụng có dùng sắp xếp.
Các từ trong từ điển đã được sắp xếp.
Thông thường, các Files trong thư mục được sắp
theo một trật tự nào đó.
Trong thư viện, các quyển sách được sắp theo
một trật tự nào đó.
Các khóa học của một trường đại học được sắp
theo khoa, theo mã của khóa học.
Các sự kiện được sắp theo thời gian.
Ngo Huu Phuc, Le Quy Don Technical University10
5.1.5. Ý tưởng sắp xếp và phương pháp
thực hiện (1/2)
Có nhiều ý tưởng cho giải thuật sắp xếp:
Chèn - Insertion: đặt các phần tử vào một vị trí thích hợp
của một dãy các phần tử đã sắp.
Tráo đổi - Exchange: với mỗi cặp các phần tử, tráo đổi
chúng về đúng thứ tự, thực hiện cho đến khi không còn cặp
nào chưa đưa về đúng thứ tự.
Chọn - Selection: chọn phần tử lớn nhất (nhỏ nhất) trong
danh sách, đưa về đúng vị trí.
Phân loại - Distribution: chia nhỏ thành nhiều mảnh dựa
trên tiêu chí nào đó, sau đó sắp từng mảnh.
Hợp - Merging: có thể nối 2 dãy đã sắp xếp thành 1 dãy
được sắp xếp.
Ngo Huu Phuc, Le Quy Don Technical University11
5.1.5. Ý tưởng sắp xếp và phương pháp
thực hiện (2/2)
Phương pháp sắp xếp:
Sắp xếp chọn:
Tìm phần tử lớn nhất (nhỏ nhất) trong số các phần tử chưa
xét và đặt chúng vào đúng vị trí.
Thực hiện cho đến khi các phần tử đều được xét.
Sắp xếp chèn:
Với mỗi phần tử, chèn chúng vào mảng con đã sắp đúng trật
tự.
Thực hiện tương tự cho các phần tử còn lại.
So sánh và tráo đổi – Sắp xếp nổi bọt:
Tìm 2 phần tử trong dãy không đúng trật tự, tráo đổi vị trí của
chúng.
Giữ lại danh sách đã hiệu chỉnh.
Ngo Huu Phuc, Le Quy Don Technical University12
5.1.6. Phân tích hiệu quả của giải thuật
sắp xếp (1/2)
Sự hiệu quả:
Với trường hợp tồi nhất của giải thuật, độ phức tạp là
thế nào?
Trong trường hợp trung bình có tốt hơn trường hợp tồi
nhất không?
Yêu cầu của dữ liệu là gì?
Có thể truy xuất ngẫu nhiên được không?
Có cần thêm thao tác nào không ngoài “so sánh” và
“tráo đổi”?
Không gian bộ nhớ sử dụng:
Thuật toán có cần thêm không gian phụ nào nào không?
Ngo Huu Phuc, Le Quy Don Technical University13
5.1.6. Phân tích hiệu quả của giải thuật
sắp xếp (2/2)
Tính ổn định:
Thuật toán có tính ổn định không?
Sự hiệu quả, nếu dãy đã gần sắp:
Thuật toán có hiệu quả hơn nếu như dãy đã cho
gần được sắp? (nhiều phần tử đã đúng thứ tự,
chỉ có một số chưa đúng thứ tự)
Ngo Huu Phuc, Le Quy Don Technical University14
5.2. Sắp xếp chèn (1/6)
Ví dụ minh họa:
Xem xét người chơi bài (sắp theo chiều giảm dần)
Quân bài thứ nhất được sắp.
Với các quân bài còn lại:
Tìm từ cuối dãy cho đến khi tìm thấy quân bài lớn hơn quân bài
mới,
Di chuyển các quân bài nhỏ về sau một bậc.
Chèn quân bài mới vào vị trí đó.
Ngo Huu Phuc, Le Quy Don Technical University15
Q
2
9
A
K
10
J
2
2
9
5.2. Sắp xếp chèn (2/6)
Đây là phương pháp sắp hiệu quả nếu có ít phần tử cần
sắp.
Mã lệnh cho phương pháp khá đơn giản.
Cách thức làm việc của Sắp xếp chèn.
Sử dụng biến để chia tập thành 2 vùng: vùng đẵ sắp và vùng chưa
sắp.
Vùng đã sắp bắt đầu từ phần tử đầu tiên của dãy.
Lấy phần tử đầu tiên của vùng chưa sắp và chèn vào vùng đã sắp.
Như vậy, vùng đã sắp sẽ có thêm một phần tử.
Thực hiện tương tư cho đến khi vùng chưa sắp không còn phần tử
nào.
Ngo Huu Phuc, Le Quy Don Technical University16
5.2. Sắp xếp chèn (3/6)
Ngo Huu Phuc, Le Quy Don Technical University17
8 5 2 6 9 4 6
Chuỗi đã sắp Phần tử sẽ
được chèn
5 8 2 6 9 4 6
Giá trị 5 nhỏ hơn 8, 5 sẽ thay thế cho 8, dãy đã sắp sẽ có kích thước
tăng lên 1 (có 2 phần tử đã được sắp.
Giả sử: Sắp xếp dãy
các số nguyên theo
phương pháp chèn.
Hoạt động của
Insertion Sort
5.2. Sắp xếp chèn (4/6)
#include
#include
#define MAX 100
void inputdata(int* list,int n);
void printlist(int* list,int n);
void insertionsort(int* list, int n);
void main() {
int list[MAX], n;
printf("Nhap so phan tu cua mang, toi da =
100\n");
scanf("%d",&n);
inputdata(list,n);
printf("Mang da nhap:\n");
printlist(list,n);
insertionsort(list,n);
printf("Mang da sap xep:\n");
printlist(list,n);
getch(); }
Ngo Huu Phuc, Le Quy Don Technical University18
void inputdata(int* list,int n)
{
int i;
printf("Nhap cac phan tu cua mang\n");
for(i=0;i<n;i++)
scanf("%d",&list[i]);
fflush(stdin);
}
void printlist(int* list,int n)
{
int i;
printf("Cac phan tu cua mang: \n");
for(i=0;i<n;i++)
printf("%d\t",list[i]);
printf("\n");
}
5.2. Sắp xếp chèn (5/6)
Ngo Huu Phuc, Le Quy Don Technical University19
void insertionsort(int *list, int n)
{
int pos,i,x;
for(i=1;i<n;i++)
{
x=list[i];
pos=i-1;
while((pos>=0) && (list[pos]>x))
{
list[pos+1]=list[pos];
pos--;
}
list[pos+1]=x;
}
}
5.2. Sắp xếp chèn (6/6)
Phân tích sắp xếp chèn:
Trường hợp tồi nhất:
Với dữ liệu dạng nào cho kết quả tồi nhất?
Dữ liệu được sắp theo chiều ngược lại.
Độ phức tạp trong trường hợp này?
O(N2) – phép so sánh: N2, phép tráo đổi: N2
Trường hợp tốt nhất:
Với dữ liệu dạng nào cho kết quả tốt nhất?
Dữ liệu đã được sắp.
Độ phức tạp trong trường hợp này?
O(N) – phép so sánh: N, phép tráo đổi: none
Trường hợp trung bình:
Với dữ liệu dạng nào cho kết quả trung bình?
Dữ liệu dạng ngẫu nhiên.
Độ phức tạp trung bình?
O(N2) – phép so sánh: N2, phép tráo đổi: N2
Ngo Huu Phuc, Le Quy Don Technical University20
5.3. Sắp xếp chọn (1/5)
Phương pháp sắp xếp chọn - Selection Sort
Đây cũng là phương pháp sắp xếp đơn giản.
Tại mỗi bước, chọn phần tử lớn nhất (nhỏ nhất) trong số
phần tử chưa sắp và đưa về đúng vị trí.
Ý tưởng: (với sắp xếp tăng dần)
Bước 1: Tìm phần tử nhỏ nhất trong dãy và đưa nó về vị
trí đầu tiên của dãy.
Bước 2: Tìm phần tử nhỏ thứ hai và đưa nó về vị trí thứ 2
trong dãy.
Bước tiếp: Lặp lại quá trình trên cho đến khi tất các phần
tử đã sắp đúng thứ tự.
Ngo Huu Phuc, Le Quy Don Technical University21
5.3. Sắp xếp chọn (2/5)
Ngo Huu Phuc, Le Quy Don Technical University22
6 4 92 3
2 4 96 3
2 4 96 3
Tìm được phần tử có giá trị 2,
nhỏ nhất trong dãy.
Tráo đổi nó với phần tử đầu tiên
của dãy, phần tử có giá trị 6.
Tìm phần tử nhỏ nhất trong số
những phần tử chưa sắp, phần tử
có giá trị 3 và trao đổi nó với
phần tử đứng thứ 2 trong dãy, có
giá trị 4.
Giả sử, cho 5 phần tử như sau, chưa sắp. Sắp lại dãy số trên theo
phương pháp sắp xếp chọn.
Hoạt động của Selection Sort
cách trực tiếp.
5.2. Sắp xếp chọn (3/5)
#include "stdio.h"
#include "conio.h"
#define MAX 100
void swap(int *x,int *y);
void selectionsort(int list[], int n);
void inputdata(int list[],int n);
void printlist(int list[],int n);
void main() {
int list[MAX], n;
printf("Nhap so phan tu cua mang\n");
scanf("%d",&n);
inputdata(list,n);
printf("Mang da nhap:\n");
printlist(list,n);
selectionsort(list,n);
printf("Mang da sap xep:\n");
printlist(list,n);
getch(); }
Ngo Huu Phuc, Le Quy Don Technical University23
void inputdata(int list[],int n)
{
int i;
printf("Nhap cac phan tu cua mang\n");
for(i=0;i<n;i++)
scanf("%d",&list[i]);
fflush(stdin);
}
void printlist(int list[],int n)
{
int i;
printf("Cac phan tu cua mang: \n");
for(i=0;i<n;i++)
printf("%d\t",list[i]);
printf("\n");
}
5.2. Sắp xếp chọn (4/5)
Ngo Huu Phuc, Le Quy Don Technical University24
void swap(int *x,int *y) {
int temp;
temp = *x;
*x = *y;
*y = temp; }
void selectionsort(int list[], int n) {
int i,j,minpos;
for(i=0;i<(n-1);i++)
{
minpos=i;
for(j=i+1;j<n;j++)
if (list[j]<list[minpos])
minpos=j;
if(minpos!=i)
swap(&list[minpos],&list[i]);
}
}
5.3. Sắp xếp chọn (5/5)
Phân tích hiệu quả của sắp xếp chọn:
Độ phức tạp:
Trong trường hợp tồi nhất: O(n2)
Trung bình, độ phức tạp cũng là O(n2).
Thuật toán thích hợp với sắp xếp dãy, với mỗi phần tử
trong dãy có kích thước lớn, vì đòi hỏi ít phép tráo đổi.
Với dữ liệu đã gần được sắp, thuật toán không cho
thấy chúng tốt hơn.
Ngo Huu Phuc, Le Quy Don Technical University25
5.4. Sắp xếp nổi bọt - Bubble Sort (1/5)
Sắp xếp nổi bọt là kỹ thuật sắp xếp đơn giản, trong kỹ
thuật này tổ chức các phần tử của mảng thành các
cặp liền kề.
Với các cặp liền kề, thứ i và thứ i+1, đổi chỗ các phần
tử này nếu chúng không đúng trật tự sắp xếp. Sau mỗi
lần thực hiện việc đổi chỗ, ta thu được 1 phần tử đã ở
đúng vị trí.
Thực hiện lặp lại quá trình trên cho n-1 phần tử còn lại.
Thuật toán dừng khi không còn cặp nào sai vị trí.
Ngo Huu Phuc, Le Quy Don Technical University26
5.4. Sắp xếp nổi bọt (2/5)
Ngo Huu Phuc, Le Quy Don Technical University27
3 2 2 2
2 3 3 3
4 4 4 1
1 1 1 4
5 5 5 5
2 2 2
3 3 1
1 1 3
4 4 4
5 5 5
2 1
1 2
3 3
4 4
5 5
1
2
3
4
5
5.2. Sắp xếp nổi bọt (3/5)
#include
#include
#define MAX 100
void inputdata(int list[],int n);
void printlist(int list[],int n);
void swap(int *x,int *y);
void bubblesort(int list[], int n);
void main() {
int list[MAX], n;
printf("Nhap so phan tu cua mang\n");
scanf("%d",&n);
inputdata(list,n);
printf("Mang da nhap:\n");
printlist(list,n);
bubblesort(list,n);
printf("Mang da sap xep:\n");
printlist(list,n);
getch(); }
Ngo Huu Phuc, Le Quy Don Technical University28
void inputdata(int list[],int n)
{
int i;
printf("Nhap cac phan tu cua mang\n");
for(i=0;i<n;i++)
scanf("%d",&list[i]);
fflush(stdin);
}
void printlist(int list[],int n)
{
int i;
printf("Cac phan tu cua mang: \n");
for(i=0;i<n;i++)
printf("%d\t",list[i]);
printf("\n");
}
5.2. Sắp xếp nổi bọt (4/5)
Ngo Huu Phuc, Le Quy Don Technical University29
void swap(int *x,int *y) {
int temp;
temp = *x;
*x = *y;
*y = temp;
}
void bubblesort(int list[], int n)
{
int i,j;
for(i=0;i<(n-1);i++)
for(j=n-1;j>i;j--)
if(list[j]<list[j-1])
swap(&list[j],&list[j-1]);
}
5.4. Sắp xếp nổi bọt (5/5)
Phân tích hiệu quả của thuật toán sắp xếp nổi bọt:
Độ phức tạp:
Trong trường hợp tồi nhất: O(n2)
Trong trường hợp trung bình: O(n2)
Đối với dữ liệu:
Dữ liệu cho phép truy cập ngẫu nhiên.
Cần có phép toán so sánh và tráo đổi.
Đối với dữ liệu đã gần được sắp:
Số phép tráo đổi có thể ít, nhưng số phép so sánh nhiều. Tổng quát,
không tốt hơn so với dữ liệu random.
Ngo Huu Phuc, Le Quy Don Technical University30
Nhận xét
Trong bài 5, giới thiệu một số thuật toán sắp xếp đơn giản.
Sắp xếp chèn,
Sắp xếp chọn,
Sắp xếp nổi bọt.
Các giải thuật này được thực hiện với dữ liệu cho phép truy
cập ngẫu nhiên (sắp xếp trong).
Độ phức tạp trong trường hợp trung bình là O(n2).
Trong bài 6, giới thiệu một số giải thuật sắp xếp cho hiệu
quả cao hơn.
Ngo Huu Phuc, Le Quy Don Technical University31