Bài giảng Xử lí đa chiều: Phân tích thành phần chính

Các phần tử của E gọi là các vector, còn các yếu tốcủa R gọi là các vô hướng, tức là các số thực. 2. Tổ hợp tuyến tính Vector z ∈E gọi là tổ hợp tuyến tính của các vector x1, x2, , xm ∈E, nếu có các vô hướng (các số) α1, α2, , αm ∈R không ng không tất cả, sao cho:

pdf88 trang | Chia sẻ: haohao89 | Lượt xem: 3440 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Xử lí đa chiều: Phân tích thành phần chính, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Phân tích thành phần chính - Principal Component Analysis - PCA  ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA TOÁN – TIN HỌC Giảng viên : Phạm Thế Bảo Nguyễn Thái Bình 0511002 Lê Thuận Giang 0511003 Phạm Hải Triều 0511041 Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  SƠ LƯỢC VỀ ĐẠI SỐ TUYẾN TÍNH §1. KHÔNG GIAN TUYẾN TÍNH 1. Định nghĩa không gian tuyến tính thực Cho E là tập không trống và R là tập các số thực. E là không gian vector thực nếu: a. Trong E thõa mãn một phép cộng với các tính chất: ∀x và y ∈ E: x + y ∈ E x + y = y + x (1.1.1) ∀x, y và z ∈ E: x + (y + z) = (x + y) +z (1.1.2) Tồn tại một phần tử 0 sao cho x + 0 = x (0 gọi là gốc) (1.1.3) ∀x ∈ E: ∃ (-x) ∈ E sao cho x + ( -x) = 0 (1.1.4) b. Ta xác định một phép nhân khi đưa vào các phần tử của R và E thỏa mãn các tính chất: ∀λ ∈ R và ∀x ∈ E, λ.x ∈ E (1.1.5) Nếu λ, μ ∈ R và x, y ∈ E thì: (λ + μ)x = λ x + μx (1.1.6) λ (x + y) = λx + λy (1.1.7) λ (μx) = (λ μ)x (1.1.8) Nếu λ = 1 thì 1.x = x (1.1.9) Các phần tử của E gọi là các vector, còn các yếu tố của R gọi là các vô hướng, tức là các số thực. 2. Tổ hợp tuyến tính Vector z ∈ E gọi là tổ hợp tuyến tính của các vector x1, x2, …, xm ∈ E, nếu có các vô hướng (các số) α1, α2,…, αm ∈ R không ng không tất cả, sao cho: bằ z ൌ ෍α୨x୨ ୫ ୨ୀଵ (1.1.10) Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  3. Vector độc lập tuyến tính Các vector x1, x2, …, xm gọi là độc ập tuyến tính, nếu: l ෍α୨x୨ ୫ ୨ୀଵ ൌ 0 (1.1.10)’ khi và chỉ khi α1 = α2 = … = αm = 0, và gọi là phụ thuộc tuyến tính nếu (1.1.10)’ xảy ra với ít nhất một αj ≠ 0. 1. Cơ sở của không gian. p vector độc lập tuyến tính e1, e2, …, ep ∈ E là hệ cơ sở của E nếu mọi vector x ∈ E đều là tổ hợp tuyến tính của hệ đó, tức là đều có thể biểu diễn dưới dạng: x ൌ ෍a୨e୨ ୮ ୨ୀଵ (1.1.11) trong đó: {a1, a2, …, ap} ∈ R Nếu đặt chẳng hạn: e1 = (1,0,0,…,0) e2 = (0,1,0,…,0) ………………. ep = (0,0,0,…,1) thì viết được: x = (a1, a2, …, ap), và khi đó x được gọi là vector dòng. Nếu viết: Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  x ൌ ቎ aଵ aଶ ڭ a୮ ቏ thì x là vector cột trong không gian đã cho. Rõ ràng rằng với phần tử 0 (vector 0) thì aj = 0 với mọi j = 1, 2,…, p, tức là: 0 = (0, 0,…, 0) Không gian E có p vector cơ sở như thế không gian tuyến tính p chiều, ký hiệu là Rp. Nếu ký hiệu số chiều của không gian E là dimE thì ta có dimRP = p. Không gian RP có thể có nhiều cơ sở, nhưng mọi cơ sở của nó đều gồm có p vector. Các số thực (các vô hướng) a1, a2,…, ap gọi là các tọa độ của x trên hệ cơ sở e1, e2, …, ep. Ta chỉ xét các không gian có số chiều hữu hạn (p < ∞). Ví dụ 1. Thống kê công thức bón phân N, P, K cho lúa và năng suất lúa tương ứng trên 9 mảnh ruộng tại một vùng thuộc đồng bằng sông Hồng được bảng sau: Mảnh ruộng N (kg/ha) P (kg/ha) K (kg/ha) NS (tấn/ha) 4,10 42 90 100 1 4,20 45 85 120 2 4,00 40 95 110 3 4,15 45 95 105 4 4,05 50 90 115 5 4,10 40 100 110 6 4,15 45 80 120 7 4,10 40 90 110 8 4,20 50 100 100 9 Ta có một không gian 4 chiều và 9 điểm thực nghiệm tức là có 9 vector thực nghiệm trong không gian đó. Nếu đặt: e1 = (1, 0, 0, 0), số 1 biểu thị 1kg N/ha, Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  e1 = (0, 1, 0, 0), số 1 biểu thị 1kg P/ha, e1 = (0, 0, 1, 0), số 1 biểu thị 1kg K/ha, e1 = (0, 0, 0, 1), số 1 biểu thị 1tấn thóc/ha thì mỗi công thức bón phân và năng suất tương ứng được thể hiện bằng một vector x là tổ hợp tuyến tính của hệ cơ sở e1, e2, e3, e4. Chẳng hạn, với công thức thứ nhất: x1 = 100e1 + 90e2 + 42e3 + 4,1e4 Với công thức thứ 2: x2 = 120e1 + 85e2 + 45e3 + 4,2e4 ………………………………. Mỗi vector x୧ ൌ ∑ x୧୨e୨ ୮ ୨ୀଵ trong không gian p chiều có điểm ngọn là (xi1,xi2,…,xip). Chẳng hạn có thể viết: x1 = (100; 90; 42; 4,1) 2. Không gian con. Cho tập con F ⊂ Rp, F ≠ Ø. Tập F được gọi là không gian con của RP hay siêu phẳng, nếu với mọi vector x, y ∈ F và mọi λ, μ ∈ R thì: x = λx + μy ∈ F. Tất nhiên dimF ≤ dỉmp. Ví dụ 2. Trong bảng hình 3, nếu chỉ quan tâm đến quan hệ giữa đạm (N) và năng suất, ta được một không gian hai chiều. Đó là không gian con của không gian bốn chiều đã nêu trên. Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  Hệ cơ sở của không gian con này là: e1 = (1, 0) e4 = (0, 1) mà ta có thể biểu diễn bằng mặt phẳng như trên hình 3. trong đó, với mảnh 1: x1 = 100e1 + 4,1e4. với mảnh 2: x2 = 120e1 + 4,2e4 với mảnh 3: x3 = 110e1 + 4,0e4. Ví dụ 3: Dễ dàng thấy rằng hai vector x1 và x2 trong ví dụ một độc lập tuyến tính với nhau. Do đó, chúng có thể lập thành một siêu phẳng trong không gian 4 chiều. Không gian con (siêu phẳng) hai chiều này chứa mọi vector có dạng x = (100λ + 120μ)e1 + (90λ + 85μ)e2 + (42λ + 45μ)e3 + (4,1λ + 4,2μ)e4 với λ và μ là những số thực bất kỳ. Tất nhiên, để phù hợp với thực tế sản xuất nông nghiệp, ta cần giới hạn giá trị của λ và μ, chẳng hạn so với bảng số liệu: 100 ≤ 100λ + 120μ ≤ 120 80 ≤ 90λ + 85μ ≤ 100 40 ≤ 42λ + 45μ ≤ 50 4,0 ≤ 4,1λ + 4,2μ ≤ 4,2 Không gian con có các tính chất sau: 1. Nếu F1 và F2 là hai không gian con của Rp, thì F1 ∩ F2 cũng là không gian con của Rp. 2. Cho F là không gian con của Rp, và cho t là một vector bất kỳ ∈ Rp. Gọi: F* = {y ∈ Rp: y = x + t, x ∈ F} (1.1.13) thì F* là siêu phẳng (không gian con) afin song song với F. Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  3. Tổng trực tiếp của các không gian con Cho F1, F2, …, Fk là k không gian con của Rp. Nếu F1, F2, …, Fk tạo thành một phân hoạch trong Rp, tức là: ራF୧ ൌ R୮ ୩ ୧ୀଵ (1.1.14) Fi ∩ Fj = Ø với mọi i ≠ j; i, j = 1, 2,…, k (1.1.15) thì với mỗi vector x ∈ Rp đều tồn tại một và chỉ một hệ vector x1, x2, …, xk, trong đó xj ∈ Fj (j = 1, ݇തതതതത) sao cho: x ൌ ෍x୨ ୮ ୨ୀଵ Trong trường hợp đó không gian Rp gọi là tổng trực tiếp của các Fj; j = 1, kതതതതത; và ký hiệu là: Rp = F1 ⊕ F2 ⊕ … ⊕ Fk. (1.1.16) Nếu k = 2 thì Rp = F1 ⊕ F2; F1 và F2 gọi là các phần bù (đối lập) của nhau. Ví dụ 4. Trong bảng 3.1, nếu gọi F1 là không gian con 3 chiều, mà mỗi vector phần tử của nó là một công thức phân bón, và F2 là không gian con một chiều mà mỗi phần tử của nó là một mức năng suất thì F1 là phần bù của F2. §2. MA TRẬN 1. Định nghĩa ma trận Ma trận là một bảng số gồm n dòng và p cột, n và p có thể bất kì và hữu hạn. Ký hiệu ma trận bằng các chữ hoa A, B, X, … Đôi khi để chỉ rõ số dòng và cột của ma trận, ta ký hiệu An,p (n dòng và p cột). Như vậy, Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều A୬,୮ ൦ aଵଵ aଵଶ aଶଵ aଶଶ ڮ aଵ୮ aଶ୮ ڭ ڰ ڭ a୬ଵ a୬ଶ ڮ a୬୮ ൪ (1.2.1) trong đó aij là phần tử nằ t j cm ở dòng i, cộ ủa A. Cũng có thể viết: A ൌ ൫a୧୨൯; i ൌ 1, nതതതതതതതതതത; j ൌ 1, pതതതതതതതതതത hoặc ୬୮ A ൌ ฮa୧୨ฮ hoặc ୮ A ൌ ൣa୧୨൧୬ hoặc A ൌ ൫a୧୨൯୬୮ Nếu n ≠ p, thì ma trận là ma trận chữ nhật Nếu n = p, ta có ma trận vuông cấp p, App Cho ma trận A. Một ma trận gồm mọi phần tử nằm trong r dòng và r cột bất kỳ (r<p) của A gọi là ma trận con cấp r của A. Ví dụ 1: Trong ví dụ 1 §1 ta có một ma trận 9 dòng 4 cột (ma trận chữ nhật). Nếu cho tương ứng với mỗi cột một vector (gọi là vector – biến) thì ta được 4 vector 9 chiều ∈ R9, còn nếu cho tương ứng mỗi dòng một vector (gọi là vector - cá thể) thì ta được một không gian 4 chiều, ký hiệu R4. Như vậy, mỗi vector – cá thể (vector dòng) ở đây tương ứng với một mảnh ruộng, trên đó có các giá trị của N, P, K và NS; còn mỗi vector – biến (vector cột) tương ứng với một biến lượng, mà mỗi phần tử của vector là một trị của biến lượng đó. 2. Cộng ma trận: Cho hai ma trận A ൌ ൣa୧୨൧ B୬,୮ ൌ ൣb୧୨൧୬୮ ୬,୮ ୬୮ Phân tích thành phần chính - Principal Component Analysis - PCA  (Có cùng số dòng và số cột) Tổng của hai ma trận A và B, ký hiệu là: C ൌ A ൅ B (1.2.2) ൌ ൣc୧୨൧୬୮ là ma trận n dòng p cột mà: cij = aij + bij với mọi i ൌ 1, nതതതതത, jൌ 1, pതതതതത Ma trận tổng là ma trận mà mỗi phần tử của nó bằng tổng của các phần tử tương ứng trong các ma trận thành phần. ቀ2 1 0 1 3 4 ቁ ൅ ቀെ1 2 1 1 2 4 ቁ ൌ ቀ1 3 1 2 5 8 ቁ Ví dụ 2: 3. Nhân ma trận với một vô hướng Cho ma trận A và một số khác k. khi đó: Ak=kA=(kaij) (1.2.3) Nếu ma trận A được nhân với số k thì tức là nhân mọi phần tử của nó với số k đó 3 ቀ 2 0 1 െ1 3 െ4 ቁ ൌ ቀ 6 0 3 െ3 9 െ12 ቁ Ví dụ 3: 4. Nhân hai ma trận Cho hai ma trận A ,p và Bp,q (s ộ của An,p b g số a B ) tức là: n ố c t ằn dòng củ p,q A ൌ ൦ aଵଵ aଵଶ aଶଵ aଶଶ ڮ aଵ୮ aଶ୮ ڭ ڰ ڭ a୬ଵ a୬ଶ ڮ a୬୮ ൪ , B ൌ ۏ ێ ێ ۍbଵଵ bଵଶ bଶଵ bଶଶ ڮ bଵ୯ bଶ୯ ڭ ڰ ڭ b୮ଵ b୮ଶ ڮ b୮,୯ے ۑ ۑ ې Khi đó ma trận tích: Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều C ൌ AB ൌ ൦ cଵଵ cଵଶ cଶଵ cଶଶ ڮ cଵ୯ cଶ୯ ڭ ڰ ڭ c୬ଵ c୬ଶ ڮ c୬୯ ൪ là ma trận n dòng và q cột mà phầ tử ở dòng i, cột j là: n c୧୨෍a୧୩b୩୨ ୮ ୩ୀଵ i ൌ 1, nതതതതത; j ൌ 1, qതതതതത (1.2.4) Ví dụ 4: A ൌ ቀ 2 െ1 3 െ1 4 2 ቁ , B ൌ ൭ 2 1 3 1 3 െ1 1 2 4 ൱ khi đó: c11 = 2.2 – 1.1 + 3.1 = 6 c12 = 2.1 -1.3 + 3.2 = 5 c13 = 2.3 + (-1)(-1) + 3.4 = 19 c21 = -1.2 + 4.1 + 2.1 = 4 c22 = -1.1 + 4.3 + 2.2 = 15 c23 = -1.3 + 4.(-1) + 2.4 = 1 Vậy: C ൌ AB ൌ ቀ6 5 19 4 15 1 ቁ Chú ý: Phép nhân ma trận nói chung không có tính giao hoán, tức là: AB ≠ BA Ví dụ 5: Cho hai ma trận A và B như trong ví dụ 3 thì không tồn tại tích BA, vì số cột của B không bằng số dòng của A. Phân tích thành phần chính - Principal Component Analysis - PCA  A ൌ ቀ 2 1 െ1 3 ቁ ; B ൌ ቀ4 െ2 3 1 ቁ Ví dụ 6: Cho AB ൌ ቀ11 െ3 5 5 ቁ và BA ൌ ቀ10 െ2 5 6 ቁ thì 5. Ma trận chuyển vị, vết và ma trận con phụ Cho ma trận An,p n dòng và p cột bất kỳ. Ma trận chuyển vị của An,p ký hiệu ATp,n là ma trận trong đó dòng i ሺi א 1, nതതതതതሻ của An,p trờ thành cột i ሺi ൌ 1, nതതതതതሻ của ATp,n. Nói cách khác, nếu: A ൌ ൦ aଵଵ aଵଶ aଶଵ aଶଶ ڮ aଵ୮ aଶ୮ ڭ ڰ ڭ a୬ଵ a୬ଶ ڮ a୬୮ ൪ thì AT ൌ ൦ aଵଵ aଵଶ aଶଵ aଶଶ ڮ a୬ଵ a୬ଶ ڭ ڰ ڭ aଵ୮ aଶ୮ ڮ a୬୮ ൪ x ൌ ൦ xଵ xଶ ڭ x୬ ൪ Tương tự, nếu: là vector cột trong Rn thì vector dòng: xT = (x1, x2,…, xn) là vector chuyển vị của x, và tất nhiên xT ∈ Rn. Chú ý 1: Mọi tính chất đúng cho ma trận An,p (cho vector x) đều đúng cho ma trận chuyển vị ATp,n (cho vector xT) của nó. Do đó, từ đây trong toàn bộ trình bày, nếu không có gì đặc biệt, ta ký hiệu x, y,… là những vector cột và xT, yT,… là những vector dòng chuyển vị của x, y,… Chú ý 2: cho A là ma trận p dòng, n cột và B là ma trận n dòng, q cột thì tích AB là ma trận p dòng, q cột, đồng thời tích AB có tính chất sau: (AB)T = BTAT (1.2.5) Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  Cho ma trận vuông Ap,p. Gọi vết của A, ký hiệu là Tr(A), là tổng các phần tử trên đường chéo chính của A. Nói ch k ác, n : cá h ếu A ൌ ൦ aଵଵ aଵଶ aଶଵ aଶଶ ڮ aଵ୮ aଶ୮ ڭ ڰ ڭ a୮ଵ ڮ a୮୮ ൪ thì TrA ൌ ∑ a୧୧ ୮ ୧ୀଵ a୮ଶ Nếu A = AT (tức là aịj = aij; i, j ൌ 1, pതതതതത) thì ma trận A gọi là đối xứng. Gọi aij là phần tử ở dòng i, cột j của ma trận vuông Ap,p. Ta gọi ma trận con phụ của aij, ký hiệu Aij, là ma trận thu được bằng cách bỏ dòng i và cột j của ma trận A. 6. Hạng của ma trận Hạng của ma trận Anp là số lớn nhất những vector cột độc lập tuyến tính của ma trận đó. Ký hiệu hạng của A là rankA. Chứng minh được rằng nếu rankA = r thì ma trận A cũng có nhiều nhất là r dòng độc lập tuyến tính, và dĩ nhiên là rankA ≤ min(n,p) 7. Định thức Cho ma trận Ap,p vuông cấp p. Định thức của A, ký hiệu là |A|, là một vô hướng tức là một phần tử của R được tính theo cong thức sau: |A| ൌ෍ሺെ1ሻ୧ା୨ ୮ ୧ୀଵ a୧୨หA୧୨ห (1.2.6) Nói cách khác, định thức của A bằng một tổng, trong đó mỗi số hạng là một tích của một phần tử aij của dòng i và định thức của ma trận con phụ với nó, tích này lấy dấu cộng hay trừ tùy thuộc vào tổng (i + j) là chẵn hay lẽ. Tổng được lấy theo một cột j (hoặc một dòng i) nào đó của A. Ngoài xa, còn những định nghĩa tổng quát hơn về định thức Định thức của ma trận vuông A cấp p cũng gọi là định thức cấp p Định thức của ma trận con của A cũng gọi là định thức con Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  A ൌ ቂ aଵଵ aଵଶ aଶଵ aଶଶ ቃ Với ma trận cấp 2 |A| ൌ ቚ aଵଵ aଵଶ aଶଵ aଶଶ ቚ ൌ aଵଵaଶଶ െ aଵଶaଶଵ thì A ൌ ൥ aଵଵ aଵଶ aଵଷ aଶଵ aଶଶ aଶଷ aଷଵ aଷଶ aଷଷ ൩ với ma trận cấp 3: thì A ൌ อ aଵଵ aଵଶ aଵଷ aଶଵ aଶଶ aଶଷ ଷ ଷଶ ଷ อ a ଵ a aଷ ൌ aଵଵaଶଶaଷଷ ൅ aଵଶaଶଷaଷଵ ൅ aଵଷaଶଵaଷଶ െ aଵଷaଶଶaଷଵ െ aଵଶaଶଵaଷଷ െ aଵଵaଷଶ Các tính chất sau đây giúp cho việc tính định thức dễ dàng: 1. Định thức của ma trận không thay đổi qua phép chuyển vị Nói cách khác: |Ap,p| = |ATp,p| Từ tính chất này suy ra rằng mỗi điều đúng cho dòng (các tính chất sẽ nêu ở dưới) đều đúng cho cột, và ngược lại 2. Thừa số chung của các phần tử của một dòng (cột) bất kỳ có thể đưa ra ngoài dấu định thứ Nói c ch k c, c. á há ተ ተ aଵଵ aଵଶ ڮ ڮ ڮ ڮ ka୧ଵ ka୧ଶ ڮ aଵ୮ ڮ ka୧୮ ڮ ڮ ڮ a୮ଵ a୮ଶ ڮ ڮ a୮ ተ ተ ൌ k ൈ ተ ተ aଵଵ aଵଶ ڮ ڮ ڮ ڮ a୧ଵ a୧ଶ ڮ aଵ୮ ڮ a୧୮ ڮ ڮ ڮ a୮ଵ a୮ଶ ڮ ڮ a୮୮ ተ ተ ୮ 3. Nếu tại một dòng i bất kỳ ሺi א 1, pതതതതതሻ, mà Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  a୧୨ ൌ a୧୨ ሺଵሻ ൅ a୧୨ ሺଶሻ với m i j=1, 2, …, p, thì: ọ ተ ተ aଵଵ aଵଶ ڮ ڮ ڮ ڮ a୧ଵ a୧ଶ ڮ aଵ୮ ڮ a୧୮ ڮ ڮ ڮ a୮ଵ a୮ଶ ڮ ڮ a୮୮ ተ ተ ൌ ተ ተ aଵଵ aଵଶ ڮ ڮ ڮ ڮ a୧ଵ ሺଵሻ a୧ଶ ሺଶሻ ڮ aଵ୮ ڮ a୧୮ ሺଵሻ ڮ ڮ ڮ a୮ଵ a୮ଶ ڮ ڮ a୮୮ ተ ተ ተ ተ aଵଵ aଵଶ ڮ ڮ ڮ ڮ a୧ଵ ሺଶሻ a୧ଶ ሺଶሻ ڮ aଵ୮ ڮ a୧୮ ሺଶሻ ڮ ڮ ڮ a୮ଵ a୮ଶ ڮ ڮ a୮୮ ተ ተ 4. |A| = 0 nếu trong đó: - Hoặc có một dòng gồm toàn số không. - Hoặc có một số dòng phụ thuộc tuyến tính (trường hợp đặc biệt nếu có hai dòng tỉ lệ với nhau; trường hợp hai dòng bằng nhau là trường hợp riêng của tỉ lệ) Từ trường hợp đặc biệt này ta có hệ quả: ෍ሺെ1ሻ୧ା୨ ୮ ୨ୀଵ a୧୨หA୩୨ห ൌ 0 với mọi k ≠ i; k, i א 1, pതതതതത. Hệ quả: Nếu rankA = r (r ≤ p) thì trong A tồn tại ít nhất một định thức con cấp r khác không, và ngược lại. Nói cách khác hạng của A chính là cấp cao nhất của định thức con khác 0 của A. 5. Định thức không thay đổi nếu cộng vào dòng i một dòng k bất kỳ nhân với một số. Nói cách khác: ተ ተ aଵଵ … a୧ଵ aଵଶ … … … a୧ଶ … aଵ୮ … a୧୮ … a୩ଵ … … a୩ଶ … … a୩୮… a୮ଵ … … a୮ଶ … … a୮୮ ተ ተ ൌ ተ ተ aଵଵ … a୧ଵ ൅ la୩ଵ aଵଶ … … … a୧ଶ ൅ la୩ଶ … aଵ୮ … a୧୮ ൅ la୩୮ … a୩ଵ … … a୩ଶ … … a୩୮… a୮ଵ … … a୮ଶ … … a୮୮ ተ ተ Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  Nhờ tính chất đó, có thể biến đổi sao cho trong dòng i của định thức mọi phần tử đều bằng không, trừ một phần tử k c ij ≠ 0. Khi đó: há không, giả sử a |A| ൌ ሺെ1ሻ୧ା୨a୧୨หA୧୨ห tức là việc tính định thức A cấp p đưa về việc tính định thức cấp (p - 1). Ta hạ cấp dần như vậy cho đến khi chỉ còn định thức cấp 3 hoặc định thức cấp 2. 6. Định thức của tích các ma trận bằng tích các định thức của các ma trận đó, tức là: |AB| ൌ |A||B| (1.2.7) Tất nhiên công thức (1.2.7) chỉ đúng khi A và B đều là các ma trận vuông cùng cấp Ví dụ 7: Tính định thức ma trận A ൌ ቎ െ2 5 1 െ9 െ1 3 13 7 3 െ1 2 18 5 െ5 െ7 െ10 ቏ Ta có: |A| ൌ ቮ െ2 5 1 െ9 െ1 3 13 7 3 െ1 2 18 5 െ5 െ7 െ10 ቮ Biến đổi định thức trên, bằng cách: Giữ nguyên dòng hai trong định thức Nhân dòng 2 với 2 rồi cộng vào dòng 1, được dòng 1 mới, nhân dòng 2 với -3 rồi cộng vào dòng 3 cũ, được dòng 3 mới, và nhân dòng 2 với -2 rồi cộng vào dòng 4 cũ, được dòng 4 mới củ ịnh thức. K được:a đ ết quả ቮ െ2 5 1 െ9 െ1 3 13 7 3 െ1 2 18 5 െ5 െ7 െ10 ቮ ൌ ቮ 0 െ13 1 െ9 25 17 13 7 0 26 0 36 െ34 െ26 െ33 െ24 ቮ Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Pr ipa mpinc l Co onent Analysis - PCA  Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều ൌ ሺെ1ሻଶାଵ อ െ13 25 17 26 െ34 െ26 36 െ33 െ24 อ ൌ െ อ െ13 25 17 0 16 8 36 െ33 െ24 อ ൌ െ1032 Ví dụ 8: Cho A ൌ ቂ2 െ1 4 3 ቃ , B ൌ ቂ1 െ2 3 2 ቃ Tính |AB| Theo tính chất 6 của định thức thì |AB| = |A|.|B| Một mặt, ta có |A| = 6+4 = 10, |B| =2 + 6 = 8. Do đó |AB| = 80 Mặt khác ta có: |AB| ൌ |A||B| ൌ ቂ2.1 െ 1.3 െ2.2 െ 1.2 4.1 ൅ 3.3 െ2.4 ൅ 3.2 ቃ ൌ ቂെ1 െ6 13 െ2 ቃ Do đó |AB| = 2 + 6.13 = 80 Đó là kết quả nhận được khi nhân hai định thức bằng hai cách khác nhau. Ma trận vuông A gọi là không suy biến nếu định thức của nó khác không, |A| ≠ 0. 8. Ma trận đơn vị Ma trận vuông cấp k gọi là ma trận đơn vị cấp k, nếu các phần tử trên đường chéo chính của nó (tức là các aii, ׊i ൌ 1, kതതതതത) đều bằng 1, còn mọi phần tử khác đều bằng 0. Ký hiệu ma trận đơn vị cấp k là Ikk (hay đơn giả n là I) thì: I ൌ ቌ 1 0 0 1 ڮ 0 0 ڭ ڰ ڭ 0 0 ڮ 1 ቍ (1.2.8) 9. Ma trận nghịch đảo Phân tích thành phần chính - Principal Component Analysis - PCA  Cho ma trận A vuông cấp k. Nếu tồn tại một ma trận B vuông cấp k, sao cho AB=I, thì B gọi là ma trận nghịch đảo của A Ký hiệu ma trận nghịch đảo của A là A-1 thì ta có: AA-1 = A-1A = I Nhận xét: 1. Chỉ có các ma trận vuông mới có nghịch đảo. 2. Cần và đủ để ma trận vuông A cấp k có ma trận nghịch đảo A-1 là A không suy biến, tức là |A| ≠ 0 3. Khác với phép nhân ma trận thông thường (không giao hoán hay AB≠BA), phép nhân ma trận vuông bất kỳ A với nghịch đảo của nó luôn giao hoán (xem (1.2.9)) Cách tìm ma trận nghịch đảo Giả sử A = [aij]pp Đặt A-1 = [aij-1]pp. Để tìm A-1 t chỉ việc nh các aij-1 sao cho: a xác đị ෍a୧୨a୨୩ ିଵ ୮ ୨ୀଵ ቄ1 với i ൌ k 0 với i ് k (1.2.10) Theo định nghĩa của định thức và hệ quả tính chất 4 của nó, để (1.2.10) thỏa mãn, chỉ việc cho: a୧୨ ିଵ ൌ ሺെ1ሻ୧ା୨หA୧୨ห/|A| (1.2.11) trong đó Aij là ma trận con phụ của aij, và |A| là định thức của A Ví dụ 9: Tìm ma trận nghịch đảo của A ൌ ൥ 1 0 െ1 2 3 2 െ1 1 2 ൩ ta có |A| = (6 – 0 – 2) – (3 – 0 + 2) = -1 Nguyễn Thái Bình – Lê Thuận Giang – Phạm Hải Triều Phân tích thành phần chính - Principal Component Analysis - PCA  Ng Lê Thuận Giang – Phạm Hải Triều uyễn Thái Bình – Aଵଵ ൌ ቚ 3 2 െ 2 ൌ 4 1 2 ቚ ൌ 6 Aଵଶ ൌ ቚ 2 2 െ1 2 ቚ ൌ 6 ൅ 2 ൌ 6 A13 = 2 + 3 = 5, A21 = 0 + 1 = 1, A22 = 2 – 1 = 1, A23 = 1 - 0 = 1, A31 = 0 + 3 = 3, A32 = 2 + 2 = 4, A33 = 3 Như vậy: Aିଵ ൌ ൥ െ4 1 െ3 6 െ1 4 െ5 1 െ3 ൩ Dễ thấy rằng: AAିଵ ൌ AିଵA ൌ ൥ 1 0 0 0 1 0 0 0 1 ൩ Cũng có thể tìm A-1 bằng cách lập một bảng mà bên trái là ma trận A và bên phải là ma trận đơn vị cùng cấp. Biến đổi theo dòng và chỉ theo dòng sao cho bên trái trở thành ma trận đơn vị, khi đó bên phải sẽ là A-1 Ví dụ 10: Tìm nghịch đảo của ma trận g A đã viết ở trên, ta lập bản ൥ 1 0 െ1 2 3 2 െ1 1 2 อ 1 0 0 0 1 0 0 0 1 ൩ giữ nguyên dòng 1 Nhân dòng 1 với -2 rồi cộng vào dòng 2, được dòng 2 mới, cộng dòng 1 vào dòng 3 được dòng 3 mới, kết quả ta được: ൥ 1 0 െ1 0 3 4 0 0 1 อ 1 0 0 െ2 1 0 1 0 1 ൩ Phân tích thành phần chính - Principal Component Analysis - PCA  N i huậguyễn Thá Bình – Lê T n Giang – Phạm Hải Triều Giữ nguyên dòng 1. chia dòng 2 (nhân dòng 2 với ଵ ଷ ) cho 3 được dòng 2 mới. Nhân dòng 2 mới với (-1) rồi cộn n ới, kg với dò g 3 m ết quả là: ൥ 1