Thế giới ngày càng trở nên bất ổn hơn, những bất ổn trong giá cả hàng hoá và
các biến số tài chính thay đổi theo những chiều hướng khó có thể dự báo trước được.
Trước khi ban quản trị có thể đưa ra bất kỳ một quyết định nào về phòng ngừa rủi ro,
trước tiên họ cần phải nhận diện được tất cả các rủi ro mà công ty có thể gặp phải. Hầu
hết các tổ chức tài chính đều phải đối mặt với những rủi ro kinh doanh, là rủi ro thuộc
về bản chất của các hoạt động kinh doanh. Trên thế giới đã có nhiều nghiên cứu về vấn
đề này và đã có một số mô hình cũng như phần mềm hỗ trợ việc đánh giá, dự báo rủi
ro tài chính. Tuy nhiên ở Việt nam, các tổ chức tài chính cũng như các công ty doanh
nghiệp chưa chú ý nhiều tới rủi ro tài chính. Một số doanh nghiệp có thể tự đánh giá,
dự báo rủi ro hoặc đi thuê chuyên gia cố vấn tài chính. Cách làm này tương đối thủ
công và tốn kém về mặt nhân lực cũng như kinh phí.
Trong các lĩnh vực nghiên cứu của khoa học máy tính thì khai phá dữ liệu là
lĩnh vực đang phát triển mạnh mẽ và có nhiều ứng dụng thực tiễn. Khai phá dữ liệu kết
hợp giữa học máy, công nghệ cơ sở dữ liệu và các chuyên ngành khác để tìm ra tri
thức từ những cơ sở dữ liệu rất lớn. Từ những tri thức này, ta có thể sử dụng để xây
dựng mô hình để đánh giá, dự báo.
Mục tiêu của luận văn là tìm hiểu về rủi ro tài chính và xây dựng mô hình nhằm
đánh giá, dự báo rủi ro tài chính. Tuy nhiên, vấn đề rủi ro tài chính là tương đối lớn và
rộng nên phạm vi của luận văn chỉ dừng lại ở việc xây dựng mô hình đánh giá, dự báo
rủi ro trong lĩnh vực đầu tư, kinh doanh chứng khoán. Luận văn tập trung vào việc tìm
hiểu một số mô hình học máy tiên tiến và phân tích kỹ thuật trong lĩnh vực chứng
khoán. Phân tích kỹ thuật là một khoa học rất mới, nó đang phát triển mạnh mẽ và có
những kết quả khả quan. Trong luận văn, tôi đã thực hiện việc kết hợp phương pháp
học máy sử dụng mạng nơron nhân tạo, phân tích kỹ thuật, hệ suy diễn mờ và ứng
dụng xây dựng mô hình đánh giá, hỗ trợ quyết định mua hoặc bán một mã cổ phiếu cụ
thể nào đó. Tôi đã hoàn thành phần mềm thử nghiệm và tiến hành thực nghiệm trên bộ
dữ liệu thực tế thu thập từ các sàn giao dịch chứng khoán trong và ngoài nước. Trong
luận văn này, tôi đã tìm hiểu, kết hợp và tìm cách ứng dụng phương pháp khai phá dữ
liệu nhằm phân tích và đánh giá rủi ro trong lĩnh vực tài chính. Các kết quả thực
nghiệm của phần mềm tuy chưa thực sự cao nhưng cũng đủ để cung cấp thông tin và
định hướng ban đầu cho các nghiên cứu tiếp theo của chúng tôi.
82 trang |
Chia sẻ: longpd | Lượt xem: 2252 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu và ứng dụng một số mô hình học máy trong việc hỗ trợ đánh giá rủi ro tài chính, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
i
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-------***-------
HÀ VĂN SANG
NGHIÊN CỨU VÀ ỨNG DỤNG MỘT SỐ MÔ HÌNH HỌC MÁY
TRONG VIỆC HỖ TRỢ ĐÁNH GIÁ RỦI RO TÀI CHÍNH
Ngành: Công nghệ Thông tin
Chuyên ngành: Hệ thống Thông tin
Mã số: 60.48.05
LUẬN VĂN THẠC S
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. NGUYỄN HÀ NAM
HÀ NỘI – 2009
ii
LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả đạt được trong luận văn này là do tôi nghiên
cứu, tổng hợp và thực hiện. Toàn bộ những điều được trình bày trong luận văn là của
cá nhân hoặc được tham khảo và tổng hợp từ các nguồn tài liệu khác nhau. Tất cả các
tài liệu tham khảo, tổng hợp đều được trích dẫn với nguồn gốc rõ ràng.
Tôi xin chịu hoàn toàn trách nhiệm về lời cam đoan của mình. Nếu có gì sai
trái, tôi xin chịu mọi hình thức kỷ luật theo qui đinh.
Hà Nội, tháng 5 năm 2008
Học viên
Hà Văn Sang
iii
LỜI CẢM ƠN
Tôi muốn bày tỏ lòng biết ơn sâu sắc tới những người đã giúp đỡ tôi trong quá
trình làm luận văn, đặc biệt tôi xin cám ơn TS Nguyễn Hà Nam, với lòng kiên trì, thầy
đã chỉ bảo tôi chi tiết và cho tôi những lời nhận xét quí báu trong từng bước làm luận
văn. Đồng thời tôi cũng xin gửi lời cảm ơn tới các thầy cô giáo khoa Công nghệ thông
tin – Trường Đại học Công nghệ - Đại học Quốc gia Hà nội đã truyền đạt các kiến
thức cho tôi trong suốt thời gian học tập và nghiên cứu vừa qua.
Tôi cũng xin chân thành cảm ơn cơ quan, bạn bè, đồng nghiệp, gia đình và
những người thân đã cùng chia sẻ, giúp đỡ, động viên, tạo mọi điều kiện thuận lợi để
tôi hoàn thành nhiệm vụ học tập và cuốn luận văn này.
Hà nội, tháng 5 năm 2009
Học viên
Hà Văn Sang
iv
MỤC LỤC
LỜI CAM ĐOAN ................................................................................................................... i
LỜI CẢM ƠN....................................................................................................................... iii
MỤC LỤC............................................................................................................................ iv
DANH MỤC CÁC KÝ HIỆU, TỪ VIẾT TẮT...................................................................... vi
DANH MỤC HÌNH VẼ....................................................................................................... vii
DANH MỤC BẢNG BIỂU.................................................................................................viii
MỞ ĐẦU............................................................................................................................... 1
1. Đặt vấn đề ...................................................................................................................... 1
2. Mục tiêu của nghiên cứu ................................................................................................ 2
3. Cấu trúc của luận văn ..................................................................................................... 2
Chương 1 - MỘT SỐ KIẾN THỨC CƠ BẢN VỀ TÀI CHÍNH.............................................. 3
1.1. Một số khái niệm tài chính .......................................................................................... 3
1.1.1 Phân tích tài chính ................................................................................................. 3
1.1.2 Báo cáo tài chính ................................................................................................... 4
1.1.3 Phương pháp phân tích tài chính ............................................................................ 5
1.1.4 Dự báo tình hình tài chính...................................................................................... 6
1.2. Rủi ro tài chính............................................................................................................ 7
1.2.1 Khái niệm.............................................................................................................. 7
1.2.2 Nguồn gốc của rủi ro tài chính ............................................................................... 7
1.2.3 Quy trình quản trị rủi ro tài chính........................................................................... 8
1.2.3 Quản trị rủi ro trong đầu tư chứng khoán ............................................................. 10
1.3 Phân tích kỹ thuật trong dự báo thị trường chứng khoán. ............................................ 11
1.3.1 Khái niệm............................................................................................................ 11
1.3.2 Ứng dụng của phân tích kỹ thuật.......................................................................... 12
1.3.3 Các công cụ cơ bản sử dụng trong Phân tích kỹ thuật........................................... 12
1.3.4 Các chỉ dẫn kỹ thuật cơ bản ................................................................................. 14
Chương 2 - TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU ......................................................... 16
2.1 Giới thiệu về khai phá dữ liệu (Data Mining).............................................................. 16
2.2 Phân lớp ..................................................................................................................... 18
2.2.1 Giới thiệu về phân lớp ......................................................................................... 18
2.2.2 Các phương pháp phân lớp .................................................................................. 20
2.3 Mạng Nơron............................................................................................................... 24
2.4 Hệ mờ (Fuzzy System) ............................................................................................... 28
2.4.1 Định nghĩa tập mờ ............................................................................................... 29
2.4.2 Phép suy diễn mờ ................................................................................................ 30
2.4.3 Phép hợp mờ ....................................................................................................... 32
2.4.4 Giải mờ ............................................................................................................... 34
2.4.5 Hệ suy diễn mờ.................................................................................................... 36
Chương 3 - MÔ HÌNH PHÂN TÍCH RỦI RO TÀI CHÍNH ................................................. 38
v
2.1 Sơ lược về mô hình .................................................................................................... 38
2.2 Phân lớp dữ liệu - Thiết kế mạng nơron ...................................................................... 39
2.2.1 Chọn loại dữ liệu đầu vào .................................................................................... 39
2.2.2 Thu thập dữ liệu .................................................................................................. 39
2.2.3 Tiền xử lý dữ liệu ................................................................................................ 40
2.2.4 Phân hoạch dữ liệu .............................................................................................. 41
2.2.5 Thiết kế và huấn luyện mạng Nơron .................................................................... 41
2.2.6 Phân tích dữ liệu.................................................................................................. 41
2.3 Xây dựng tập luật từ phân tích kỹ thuật ...................................................................... 42
2.3.1 Phân kỳ và hội tụ của đường trung bình di động .................................................. 42
2.3.2 Chỉ số kênh giá hàng hoá - The Commodity Channel Index (CCI) ....................... 43
2.3.3 Chỉ số cường độ tương đối - Relative Strength Index (RSI) ................................. 43
2.3.4 Dải băng Bollinger .............................................................................................. 44
2.4 Kết hợp phân tích kỹ thuật với logic mờ và mạng nơron ............................................. 44
2.4.1 Mô đun chỉ số kỹ thuật ........................................................................................ 45
2.4.2 Mô đun hội tụ ...................................................................................................... 46
2.4.3 Mô đun hệ suy diễn mờ (FIS) .............................................................................. 46
2.4.4 Luật cơ sở............................................................................................................ 47
Chương 4 - THỰC NGHIỆM VÀ ĐÁNH GIÁ .................................................................... 49
4.1 Dữ liệu dùng trong thực nghiệm ................................................................................. 49
4.2 Thiết lập tham số cho thực nghiệm ............................................................................. 50
4.2.1 Các tham số của mạng nơron ............................................................................... 50
4.2.2 Các tham số của hệ hỗ trợ quyết định................................................................... 51
4.3 Kết quả mẫu ............................................................................................................... 54
4.3.1 Kết quả việc đánh giá và dự báo trong tương lai .................................................. 54
4.3.2 Kết quả việc hỗ trợ quyết định ............................................................................. 58
4.4 Đánh giá và phân tích ................................................................................................. 59
4.5 Kết luận...................................................................................................................... 63
KẾT LUẬN ......................................................................................................................... 64
TÀI LIỆU THAM KHẢO.................................................................................................... 65
PHỤ LỤC............................................................................................................................ 66
Phụ lục A – Giới thiệu về phần mềm FRPredictor ............................................................ 66
Phụ lục B – Cấu trúc các bảng cơ sở dữ liệu tài chính....................................................... 69
Phụ lục B – Dữ liệu dùng trong thực nghiệm.................................................................... 72
vi
DANH MỤC CÁC KÝ HIỆU, TỪ VIẾT TẮT
Từ viết tắt Tiếng Anh Tiếng Việt
BB Bollinger Band Dải bolinger
CCI The Commodity Channel Index Chỉ số kênh giá hàng hoá
CK Chứng khoán
CNTT Công nghệ thông tin
CP Cổ phiếu
CSDL Database Cơ sở dữ liệu
DN Doanh nghiệp
MA Moving Average Đường trung bình động
MACD MovingAverage
Convergence/Divergence
Phân kỳ và hội tụ của đường trung
bình động
MISO Multi Input Single Output Nhiều đầu vào – Một đầu ra
MLP Multi Layer Perceptron Mạng truyền thẳng nhiều lớp
PTTK Phân tích kỹ thuật
RSI Relative Strength Index Chỉ số cường độ tương đối
TTCK Thị trường chứng khoán
vi
DANH MỤC HÌNH VẼ
Hình 1-1 Biểu đồ dạng đường ............................................................................................. 12
Hình 1-2 Biểu đồ dạng then chắn ........................................................................................ 13
Hình 1-3 Biểu đồ dạng cây nến ........................................................................................... 13
Hình 2-1 Mô hình phân lớp tiêu chuẩn ................................................................................ 19
Hình 2-2 Mô hình một nơron perceptron ............................................................................. 24
Hình 2-3 Mô hình mạng perceptron 3 lớp(MLP) ................................................................. 26
Hình 2-4 Các dạng hàm thuộc ............................................................................................. 30
Hình 2-5 Giải mờ bằng phương pháp cực đại ...................................................................... 35
Hình 2-6 Giải mờ bằng phương pháp điểm trọng tâm.......................................................... 35
Hình 2-7 Hệ suy diễn mờ .................................................................................................... 36
Hình 3-1 Mô hình đề xuất ................................................................................................... 38
Hình 3-2 Mồ hình thực thể liên kết...................................................................................... 40
Hình 3-3 Hệ suy diễn mờ .................................................................................................... 45
Hình 3-4 Miền giá trị của đầu ra.......................................................................................... 47
Hình 4-1 Kết quả huấn luyện và kiểm tra ............................................................................ 55
Hình 4-2 Kết quả thực hiện phân tích .................................................................................. 57
Hình 4-3 Dự đoán Sp500..................................................................................................... 58
Hình 4-4 Hỗ trợ quyết định cho công ty IBM ...................................................................... 58
Hình 4-5 Tỷ lệ chính xác..................................................................................................... 61
Hình 4-6 Tỷ lệ chính xác theo quý ...................................................................................... 61
Hình 4-7 So sánh tỷ lệ chính xác ......................................................................................... 62
vi
DANH MỤC BẢNG BIỂU
Bảng 2-1 Ma trận hỗn hợp trong phân lớp ............................................................................ 20
Bảng 3-1 Miền giá trị của các tham số.................................................................................. 46
Bảng 4-1 Thiết lập tham số mạng......................................................................................... 51
Bảng 4-2 Các chỉ số kỹ thuật và luật mờ tương ứng ............................................................. 52
Bảng 4-3 Kết hợp Hạng, các chỉ số và luật mờ tương ứng .................................................... 53
Bảng 4-4 Mẫu dữ liệu huấn luyện ........................................................................................ 54
Bảng 4-5 Dữ liệu phân tích .................................................................................................. 56
Bảng 4-6 Kết quả phân tích và dự báo.................................................................................. 57
Bảng 4-7 Hỗ trợ quyết định cho các công ty......................................................................... 59
Bảng 4-8 Kết quả so sánh giữa quyết định từ MACD, mô hình và thực tế ............................ 60
Bảng 4-9 So sánh việc ba chỉ số với hệ thống....................................................................... 62
1
MỞ ĐẦU
1. Đặt vấn đề
Thế giới ngày càng trở nên bất ổn hơn, những bất ổn trong giá cả hàng hoá và
các biến số tài chính thay đổi theo những chiều hướng khó có thể dự báo trước được.
Trước khi ban quản trị có thể đưa ra bất kỳ một quyết định nào về phòng ngừa rủi ro,
trước tiên họ cần phải nhận diện được tất cả các rủi ro mà công ty có thể gặp phải. Hầu
hết các tổ chức tài chính đều phải đối mặt với những rủi ro kinh doanh, là rủi ro thuộc
về bản chất của các hoạt động kinh doanh. Trên thế giới đã có nhiều nghiên cứu về vấn
đề này và đã có một số mô hình cũng như phần mềm hỗ trợ việc đánh giá, dự báo rủi
ro tài chính. Tuy nhiên ở Việt nam, các tổ chức tài chính cũng như các công ty doanh
nghiệp chưa chú ý nhiều tới rủi ro tài chính. Một số doanh nghiệp có thể tự đánh giá,
dự báo rủi ro hoặc đi thuê chuyên gia cố vấn tài chính. Cách làm này tương đối thủ
công và tốn kém về mặt nhân lực cũng như kinh phí.
Trong các lĩnh vực nghiên cứu của khoa học máy tính thì khai phá dữ liệu là
lĩnh vực đang phát triển mạnh mẽ và có nhiều ứng dụng thực tiễn. Khai phá dữ liệu kết
hợp giữa học máy, công nghệ cơ sở dữ liệu và các chuyên ngành khác để tìm ra tri
thức từ những cơ sở dữ liệu rất lớn. Từ những tri thức này, ta có thể sử dụng để xây
dựng mô hình để đánh giá, dự báo.
Mục tiêu của luận văn là tìm hiểu về rủi ro tài chính và xây dựng mô hình nhằm
đánh giá, dự báo rủi ro tài chính. Tuy nhiên, vấn đề rủi ro tài chính là tương đối lớn và
rộng nên phạm vi của luận văn chỉ dừng lại ở việc xây dựng mô hình đánh giá, dự báo
rủi ro trong lĩnh vực đầu tư, kinh doanh chứng khoán. Luận văn tập trung vào việc tìm
hiểu một số mô hình học máy tiên tiến và phân tích kỹ thuật trong lĩnh vực chứng
khoán. Phân tích kỹ thuật là một khoa học rất mới, nó đang phát triển mạnh mẽ và có
những kết quả khả quan. Trong luận văn, tôi đã thực hiện việc kết hợp phương pháp
học máy sử dụng mạng nơron nhân tạo, phân tích kỹ thuật, hệ suy diễn mờ và ứng
dụng xây dựng mô hình đánh giá, hỗ trợ quyết định mua hoặc bán một mã cổ phiếu cụ
thể nào đó. Tôi đã hoàn thành phần mềm thử nghiệm và tiến hành thực nghiệm trên bộ
dữ liệu thực tế thu thập từ các sàn giao dịch chứng khoán trong và ngoài nước. Trong
luận văn này, tôi đã tìm hiểu, kết hợp và tìm cách ứng dụng phương pháp khai phá dữ
liệu nhằm phân tích và đánh giá rủi ro trong lĩnh vực tài chính. Các kết quả thực
nghiệm của phần mềm tuy chưa thực sự cao nhưng cũng đủ để cung cấp thông tin và
định hướng ban đầu cho các nghiên cứu tiếp theo của chúng tôi.
2
2. Mục tiêu của nghiên cứu
Nghiên cứu của luận văn hướng tới các mục tiêu sau:
- Giúp đỡ ban quản trị doanh nghiệp đánh giá rủi ro trong lĩnh vực tài chính
- Giúp người kinh doanh và đầu tư chứng khoán trong việc dự báo, đưa ra quyết
định mua bán chứng khoán.
3. Cấu trúc của luận văn
Luận văn được chia thành 6 phần với các nội dung như sau:
Chương I trình bày các nội dung lý thuyết về lĩnh vực tài chính. Các khái niệm
liên quan tới tài chính, rủi ro tài chính, chứng khoán, phân tích dự báo trong đầu tư
chứng khoán đã được giới thiệu ngắn gọn nhằm mang lại những kiến thức căn bản
trong lĩnh vực tài chính.
Chương II giới thiệu về khai phá dữ liệu, sau đó chúng tôi giới thiệu chi tiết về
vấn đề phân lớp, mạng nơron, logic mờ. Các kỹ thuật được trình bày trong chương này
sẽ là cơ sở lý thuyết cho phương pháp giải quyết của chúng tôi ở các chương tiếp theo.
Chương III tập trung vào xây dựng mô hình nhằm giải quyết bài toán đã đặt ra.
Trong chương này chúng tôi đưa ra phương pháp sử dụng logic mờ, mạng nơ ron và
phân tích kỹ thuật nhằm xây dựng hệ hỗ trợ ra quyết định cho bài toán dự báo dự đoán
rủi ro tài chính.
Chương IV mô tả và phân tích những kết quả mà chúng tôi đã tiến hành thực
nghiệm. Mô hình được huấn luyện bởi dữ liệu giao dịch chứng khoán trong quá khứ,
sau đó mô hình sẽ được sử dụng để dự đoán độ rủi ro của doanh nghiệp tương ứng
nhằm kiểm chứng khả năng dự đoán của mô hình. Đồng thời các kết quả này cũng
được so sánh với các mô hình khác nhằm tìm ra điểm mạnh, yếu của mô hình so với
các mô hình đã được xây dựng.
Phần kết luận tổng kết những kết quả đạt được của luận văn và hướng nghiên
cứu tiếp theo.
Phần phụ lục giới thiệu về phần mềm dự báo rủi ro và hỗ trợ quyết định, đồng
thời hướng dẫn cách thức cơ bản sử dụng phần mềm.
3
Chương 1 - MỘT SỐ KIẾN THỨC CƠ BẢN VỀ TÀI
CHÍNH
Chương này cung cấp các kiến thức cơ sở về lĩnh vực tài chính. Đầu tiên sẽ là
các khái niệm chính về tài chính, rủi ro tài chính, các phương pháp dự báo, đánh giá
rủi ro. Mục tiếp theo sẽ giới thiệu về phân tích kỹ thuật trong việc đầu tư, kinh doanh
chứng khoán.
1.1. Một số khái niệm