Hướng dẫn mô tả thông tin từ vựng trong từ điển dùng cho máy tính

2.2. Từ ghép (compound word); Đặc điểm: - Từ ghép được cấu tạo theo phương thức phối hợp ngữ nghĩa giữa các tiếng được dùng làm yếu tố cấu tạo. - Từ ghép gồm chủ yếu những từ có hai tiếng, cũng có thể là từ nhiều tiếng, mỗi tiếng đều có nghĩa rõ rệt và có thể hoạt động như một từ đơn. - Căn cứ vào phương thức phối hợp ngữ nghĩa lại có thể phân biệt thành từ ghép song song (từ ghép đẳng lập) và từ ghép chính phụ. - Từ ghép song song có sự phối hợp ngữ nghĩa giữa hai tiếng theo quan hệ bình đẳng, song song, không có tiếng chính, tiếng phụ (ví dụ: nhà cửa, ruộng vườn, quần áo, núi sông), và thường mang ý nghĩa khái quát. Trật tự trước sau giữa hai tiếng có thể thay đổi (ví dụ: nhà cửa - cửa nhà, chờ mong – mong chờ, chèo chống – chống chèo). - Từ ghép chính phụ có sự phối hợp ngữ nghĩa giữa hai tiếng theo quan hệ không bình đẳng. Đó là sự phối hợp giữa một tiếng chính có ý nghĩa khái quát và một tiếng phụ có ý nghĩa hạn định (ví dụ: xe đạp, tàu hoả, nhà ga, nhà thương, nhà rông, rượu chanh, bánh mì, cơm chay). - Những từ hai tiếng có cấu tạo theo phương thức lặp lại hoàn toàn (giống từ láy), nhưng có nghĩa ngữ pháp chỉ “số nhiều đều đặn” thì được xếp vào loại từ ghép. Ví dụ: ai ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối, v.v. Ghi chú: Trong phạm vi đề tài này, chúng tôi không phân biệt hai loại từ ghép song song và từ ghép chính phụ. Danh sách: nhà cửa, cửa nhà, ruộng vườn, quần áo, núi sông, chờ mong, mong chờ, chèo chống, chống chèo, xe đạp, tàu hoả, nhà ga, nhà thương, nhà rông, rượu chanh, bánh mì, cơm chay, ai ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối

pdf25 trang | Chia sẻ: thanhle95 | Lượt xem: 448 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Hướng dẫn mô tả thông tin từ vựng trong từ điển dùng cho máy tính, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
HƯỚNG DẪN MÔ TẢ THÔNG TIN TỪ VỰNG TRONG TỪ ĐIỂN DÙNG CHO MÁY TÍNH SP 7.2 – Đề tài KC.01.01.05/06-10 Vũ Xuân Lương1, Nguyễn Thị Minh Huyền2, Hồ Tú Bảo3 Mục lục A. THÔNG TIN HÌNH THÁI – MORPHOLOGICAL.................................................. 5 I. THÔNG TIN CẤU TẠO TỪ .................................................................................. 5 1. Tiêu chí xác định................................................................................................. 5 2. Thực hành gán nhãn thông tin cấu tạo từ............................................................ 5 2.1. Từ đơn : simple word................................................................................... 5 2.2. Từ ghép (compound word); ......................................................................... 6 2.3. Từ láy (reduplicative word). ........................................................................ 6 B. THÔNG TIN CÚ PHÁP – SYNTACTIC.................................................................. 8 I. THÔNG TIN TỪ LOẠI .......................................................................................... 8 1. Tiêu chí xác định từ loại ..................................................................................... 8 2. Thực hành gán nhãn thông tin cú pháp............................................................... 8 2.1. Danh từ (Nouns - N) .................................................................................... 8 2.1.1. Danh từ riêng : Proper Noun................................................................. 8 2.1.2. Danh từ đơn thể : Concrete Noun ......................................................... 8 2.1.3. Danh từ tổng hợp : Collective Noun..................................................... 9 2.1.4. Danh từ trừu tượng : Abstract Noun..................................................... 9 2.1.5. Danh từ loại thể : Classify Noun ........................................................ 10 2.1.6. Danh từ đơn vị : Unit Noun ................................................................ 10 2.2. Động từ (Verbs – V) .................................................................................. 11 2.2.1. Nội động từ (intransitive verb) ........................................................... 11 2.2.2. Ngoại động từ (transitive verb),.......................................................... 11 2.2.3. Động từ trạng thái (state verb)............................................................ 11 1 Trung tâm Từ điển học (Vietlex). 2 Đại học Khoa học Tự nhiên – Đại học Quốc gia Hà Nội. 3 JAIST. 2.2.4. Trợ động từ (auxiliary verb) ............................................................... 12 2.3. Tính từ (Adjective – A).............................................................................. 12 2.3.1. Tính từ chỉ tính chất............................................................................ 12 2.3.2. Tính từ quan hệ ................................................................................... 13 2.3.3. Tính từ tượng thanh : Onomatopoetic Adjective............................ 13 2.3.4. Tính từ tượng hình : Pictographic Adjective ...................................... 13 2.4. Đại từ (Pronoun – P) .................................................................................. 14 2.4.1. Đại từ xưng hô .................................................................................... 14 2.4.2. Đại từ chỉ định .................................................................................... 14 2.4.3. Đại từ nghi vấn.................................................................................... 14 2.5. Số từ (Numeral – M).................................................................................. 14 2.5.1. Số đếm ................................................................................................ 14 2.5.1. Số thứ tự.............................................................................................. 14 2.6. Lượng từ (Numeral – M) ........................................................................... 14 2.7. Phụ từ (Adverb – R)................................................................................... 14 2.8. Giới từ (Preposition – O) ........................................................................... 15 2.9. Liên từ (Conjunction – C).......................................................................... 15 2.10. Trợ từ (Introductory word – I) ................................................................. 15 2.11. Cảm từ (Emotivity word – E) .................................................................. 15 C. THÔNG TIN NGỮ NGHĨA - SEMANTIC............................................................. 16 I. LOGICAL CONSTRAINT: .......................................................................... 16 1. Tiêu chí xác định............................................................................................... 16 2. Thực hành gán nhãn thông tin ngữ nghĩa ......................................................... 16 2.1. Con người : People ................................................................................ 16 2.1.1. Người : Person ................................................................................ 16 2.1.2. Tổ chức : Organization ................................................................... 16 2.1.3. Nhân vật siêu nhiên : Supernatural Being ...................................... 16 2.2. Động vật : Animal.................................................................................. 17 2.2.1. Thú : Animal ................................................................................... 17 2.2.2. Chim : Bird ..................................................................................... 17 2.2.3. Cá : Fish .......................................................................................... 17 2.2.4. Lưỡng cư : Amphibian.................................................................... 17 2.2.5. Bò sát : Reptile................................................................................ 17 2.2.6. Sâu : Worm ..................................................................................... 18 2.1.2.7. Côn trùng : Insect......................................................................... 18 2.1.2.8. Động vật thân mềm : Shellfish .................................................... 18 2.1.2.9. Động vật giáp xác : ...................................................................... 18 2.1.2.10. động vật hư cấu : Fictional Animal ........................................... 19 2.3. Vi sinh vật : Microorganism .................................................................. 19 2.4. Thực vật : Plant...................................................................................... 19 2.4.1. cây thân gỗ : Tree............................................................................ 19 2.4.2. cây bụi : Bush ................................................................................. 19 2.4.3. cây thân leo : Vine .......................................................................... 19 2.4.4. cây thân cỏ : Herb ........................................................................... 19 2.5. Thức ăn : Food ....................................................................................... 19 2.6. Vật dụng : Artifact ................................................................................. 19 2.7. Vật hư cấu : Fictional Object ................................................................ 19 2.8. Bộ phận : Part ........................................................................................ 19 2.9. Chất liệu : Substance.............................................................................. 20 2.10. Tự nhiên : Natural Object .................................................................... 20 2.11. Vị trí : Location.................................................................................... 20 2.12. Lĩnh vực tri thức : Field Of Knowledge .............................................. 20 2.13. Trạng thái : State ............................................................................. 20 2.14. Hoạt động : Action.............................................................................. 20 2.15. Quan hệ : Relation .............................................................................. 20 2.16. Tình thái :............................................................................................ 20 2.17. Thuộc tính: Attribute .......................................................................... 20 2.18. Giá trị : Value ...................................................................................... 20 2.19. Đơn vị : Unit ........................................................................................ 20 II. SEMANTIC CONSTAINT:......................................................................... 20 1. Tiêu chí xác định............................................................................................... 20 2. Thực hành gán nhãn thông tin Semantic constraint.......................................... 21 2.1. Subject : chủ thể..................................................................................... 21 2.2. Object : khách thể .................................. Error! Bookmark not defined. 2.2.1. Direct object (Dob) : bổ ngữ trực tiếp ............................................ 21 2.2.2. Indirect object (iob) : bổ ngữ gián tiếp ........................................... 22 2.2.3. Object (Obj) : bổ ngữ tự do............................................................. 23 2.3. Location (Loc) : vị trí, địa điểm............................................................. 24 A. THÔNG TIN HÌNH THÁI – MORPHOLOGICAL I. THÔNG TIN CẤU TẠO TỪ 1. Tiêu chí xác định Trong phạm vi của đề tài, cấu tạo của từ được xét về những mặt sau đây: a) Căn cứ vào mặt ý nghĩa và khả năng hoạt động để phân biệt từ đơn với từ phức. b) Từ đơn là từ chỉ chứa một tiếng, tiếng ấy phải có nghĩa và có khả năng hoạt động độc lập. Chúng nằm trong vốn từ cơ bản của tiếng Việt, và phần lớn trong số đó là từ gốc (hiểu theo nghĩa là những từ có khả năng được dùng để cấu tạo hàng loạt từ phức). c) Từ phức là từ gồm hai tiếng trở lên kết hợp chặt chẽ với nhau, và có ý nghĩa cho sẵn mà không thể nào xác định được một cách rõ ràng bằng việc suy ra từ ý nghĩa của mỗi tiếng. d) Muốn nhận ra một từ phức thì phải tìm ra trong nó ít nhất một tiếng có nghĩa. e) Trong loại từ phức, căn cứ vào phương thức cấu tạo để phân biệt từ ghép với từ láy hoặc dạng láy. 2. Thực hành gán nhãn thông tin cấu tạo từ 2.1. Từ đơn : simple word Đặc điểm: - Gồm những từ có một tiếng vừa có nghĩa, vừa hoạt động độc lập. - Những từ có nhiều tiếng (bao gồm cả từ vay mượn đã được Việt hoá, hoặc có hình thức phiên âm gần giống với tiếng Việt), nhưng nếu mỗi tiếng trong đó tự nó không có ý nghĩa (phải cả khối gồm nhiều tiếng gộp lại mới có ý nghĩa) thì cũng được xếp vào loại từ đơn. Ví dụ: bồ nông, bồ hóng, bù nhìn, mạt chược, ca la thầu, ba lô, béc giê, cà phê, căng tin, xi măng, xích lô, blốc, crếp, v.v. - Những từ có nhiều tiếng có hình thức cấu tạo giống như từ láy nhưng nếu chia các tiếng đó ra mà mỗi tiếng không có một ý nghĩa nào hết cũng được xếp vào loại từ đơn. Ví dụ: ba ba, chuồn chuồn, cào cào, châu chấu, đu đủ, su su, thuồng luồng, v.v. Danh sách: trâu, bò, lợn, gà, sách, đèn, bàn, ghế, ông, bà, cha, mẹ, núi, sông, cây, hoa, máy, xe, con, cục, cái, ăn, học, ngủ, đi, đứng, khóc, cười, đẹp, xấu, tốt, đã, sẽ, đang, bồ nông, bồ hóng, bù nhìn, mạt chược, ba ba, chuồn chuồn, ca la thầu, ba lô, béc giê, cà phê, căng tin, xi măng, xích lô, blốc, crếp, v.v... 2.2. Từ ghép (compound word); Đặc điểm: - Từ ghép được cấu tạo theo phương thức phối hợp ngữ nghĩa giữa các tiếng được dùng làm yếu tố cấu tạo. - Từ ghép gồm chủ yếu những từ có hai tiếng, cũng có thể là từ nhiều tiếng, mỗi tiếng đều có nghĩa rõ rệt và có thể hoạt động như một từ đơn. - Căn cứ vào phương thức phối hợp ngữ nghĩa lại có thể phân biệt thành từ ghép song song (từ ghép đẳng lập) và từ ghép chính phụ. - Từ ghép song song có sự phối hợp ngữ nghĩa giữa hai tiếng theo quan hệ bình đẳng, song song, không có tiếng chính, tiếng phụ (ví dụ: nhà cửa, ruộng vườn, quần áo, núi sông), và thường mang ý nghĩa khái quát. Trật tự trước sau giữa hai tiếng có thể thay đổi (ví dụ: nhà cửa - cửa nhà, chờ mong – mong chờ, chèo chống – chống chèo). - Từ ghép chính phụ có sự phối hợp ngữ nghĩa giữa hai tiếng theo quan hệ không bình đẳng. Đó là sự phối hợp giữa một tiếng chính có ý nghĩa khái quát và một tiếng phụ có ý nghĩa hạn định (ví dụ: xe đạp, tàu hoả, nhà ga, nhà thương, nhà rông, rượu chanh, bánh mì, cơm chay). - Những từ hai tiếng có cấu tạo theo phương thức lặp lại hoàn toàn (giống từ láy), nhưng có nghĩa ngữ pháp chỉ “số nhiều đều đặn” thì được xếp vào loại từ ghép. Ví dụ: ai ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối, v.v. Ghi chú: Trong phạm vi đề tài này, chúng tôi không phân biệt hai loại từ ghép song song và từ ghép chính phụ. Danh sách: nhà cửa, cửa nhà, ruộng vườn, quần áo, núi sông, chờ mong, mong chờ, chèo chống, chống chèo, xe đạp, tàu hoả, nhà ga, nhà thương, nhà rông, rượu chanh, bánh mì, cơm chay, ai ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối 2.3. Từ láy (reduplicative word). Đặc điểm: - Từ láy được cấu tạo theo phương thức láy, đó là phương thức lặp lại có tính chất hoà phối ngữ âm toàn bộ tiếng gốc hay lặp lại một bộ phận nào đó của tiếng gốc bằng một tiếng khác gọi là tiếng láy (âm tiết láy). - Từ láy gồm chủ yếu là những từ có hai tiếng (có một số ít là từ ba hoặc bốn tiếng), trong đó có thể chỉ có một tiếng có nghĩa, hoặc có thể có nhiều tiếng có nghĩa. Ví dụ: long lanh (long có nghĩa), long tong (tong có nghĩa), xanh xanh (cả hai tiếng đều có nghĩa), (căn phòng trông) tối tối (cả hai tiếng đều có nghĩa), v.v. - Căn cứ vào phương thức phối hợp ngữ âm có thể phân biệt 2 kiểu từ láy: láy bộ phận (chúm chím, bập bềnh, lênh khênh, ...) và láy toàn bộ (lăm lăm, đùng đùng, oang oang, ...). Để có được tính chất hoà phối ngữ âm, việc láy không đơn thuần là sự lặp lại tiếng gốc ban đầu, mà thường kèm theo một sự biến đổi nhất định về mặt âm thanh (đo đỏ, lành lạnh, nho nhỏ, vành vạnh, ...). - Căn cứ vào số lần lặp lại của hình thức ngữ âm có thể phân biệt 3 kiểu từ láy: láy đôi (gọn gàng, vững vàng, chắc chắn, ...), láy ba (dửng dừng dưng, sạch sành sanh, tẻo tèo toe, ...), và láy tư (đủng đa đủng đỉnh, long la long lanh, nhí nha nhí nhảnh). - Chú ý phân biệt giữa từ láy và dạng láy, chẳng hạn đủng đỉnh, long lanh, nhí nhảnh... (từ láy) và đủng đa đủng đỉnh, loang la long lanh, nhí nha nhí nhảnh... (dạng láy). - Chú ý phân biệt giữa từ ghép và dạng láy; chẳng hạn đỏ hoét (từ ghép) và đỏ hoen hoét (dạng láy), đỏ hỏn (từ ghép) và đỏ hon hỏn (dạng láy), xanh lè (từ ghép) và xanh lè lè (dạng láy), xanh lét (từ ghép) và xanh len lét (dạng láy), v.v. - Chú ý phân biệt giữa từ láy và dạng lặp trong từ ghép. Chẳng hạn, tối tối với nghĩa “tối nào cũng vậy” là dạng lặp (từ ghép); còn tối tối (hay tôi tối) với nghĩa “lúc gần tối, chưa tối hẳn” (Có tiếng chim gì mổ nhau kêu quang quác trong chiếc lồng kẽm chỗ tối tối) là từ láy. - Chú ý phân biệt giữa từ láy và từ đơn. Chẳng hạn các tổ hợp ba ba, cào cào, châu chấu, chuồn chuồn, (quả) đu đủ, (quả) su su, thuồng luồng về hình thức ngữ âm có cấu tạo giống như từ láy, nhưng khi xét riêng mỗi yếu tố trong từng tổ hợp thì chúng đều không mang một ý nghĩa nào hết, vì lẽ đó chúng được xếp vào danh sách các từ đơn. Ghi chú: Trong phạm vi đề tài này, chúng tôi không phân biệt các kiểu từ láy, và đồng thời xếp chung cả dạng láy vào loại từ láy, Danh sách: ào ào, bập bềnh, bập bà bập bềnh, bập bùng, chí chát, chí cha chí chát, chông chênh, đỏ hon hỏn, lênh khênh, long bong, long tong, ma mảnh, mơn mởn, B. THÔNG TIN CÚ PHÁP – SYNTACTIC I. THÔNG TIN TỪ LOẠI 1. Tiêu chí xác định từ loại 1.1. Tiêu chí về ý nghĩa khái quát: ý nghĩa khái quát được hiểu là ý nghĩa được nhận biết thông qua ý nghĩa hay cách sử dụng của một loạt từ nhất định (ý nghĩa ngữ pháp), chứ không phải thông qua ý nghĩa hay cách sử dụng của từng từ cụ thể (ý nghĩa từ vựng). Chẳng hạn: ý nghĩa về sự vật được xếp thành loại danh từ; ý nghĩa về hành động và trạng thái được xếp thành loại động từ; ý nghĩa về tính chất được xếp thành loại tính từ, v.v. 1.2. Tiêu chí về khả năng kết hợp: - Từ có khả năng làm đầu tố trong trong cụm từ chính phụ; - Từ có tham gia vào cụm từ chính phụ nhưng không làm đầu tố; - Từ không tham gia vào cụm từ chính phụ, nhưng có thể có quan hệ với cụm từ chính phụ trong trường hợp cụ thể. 1.3. Tiêu chí về chức năng cú pháp: - Chức năng của từ là đóng vai trò gì trong thành phần câu. Dùng chức năng của từ để góp phần làm cho việc phân định từ loại được rõ ràng. - Có thể nhận ra được chức năng của từ trong hoạt động ngôn ngữ, chẳng hạn chức năng chủ ngữ đối với danh từ, vị ngữ đối với động từ, v.v. 2. Thực hành gán nhãn thông tin cú pháp 2.1. Danh từ (Nouns - N) 2.1.1. Danh từ riêng : Proper Noun Đặc điểm: - Không kết hợp được với số từ, đại từ chỉ định, trừ danh từ chỉ tên người trong những trường hợp đặc biệt. Vd: trong lớp này có hai Tuấn; thêm một Thứ nữa là vừa bảy. Danh sách: Nguyễn Du, Việt Nam, Hải Phòng, Trường Đại học Bách khoa, Mộc tinh, ... 2.1.2. Danh từ đơn thể : Concrete Noun Đặc điểm: - Chỉ những vật thể mà ta có thể dùng cảm quan thông thường để phân biệt được một cách cụ thể. - Chỉ những vật thể tưởng tượng gắn với đời sống tâm linh của con người. - Đứng sau danh từ chỉ loại hoặc sau số từ + danh từ chỉ loại. - Đứng trước đại từ chỉ định (này, kia, ấy, nọ). Danh sách: bàn, ghế, sách, vở, dao, thuyền, xe đạp, xe lửa, tàu thuỷ, cầu, đường, nhà ga, cửa sổ, gà, ngựa, giáo viên, học sinh, bác sĩ, thần, thánh, tiên, bụt, ma, quỷ, sông, hồ, núi, âm phủ, thiên đàng, niết bàn,... 2.1.3. Danh từ tổng hợp : Collective Noun Đặc điểm: - Chỉ những vật khác nhau về loại nhưng thường đi kèm với nhau thành một tập hợp hoàn chỉnh. - Không đứng sau số từ + danh từ chỉ loại, trừ một vài trường hợp đặc biệt. - Không đứng sau số từ. - Không đứng sau danh từ chỉ loại. - Không đứng trước đại từ chỉ định (này, kia, ấy, nọ). Danh sách: nhà cửa, gà qué, thầy trò, đồ đạc, cây cối, chim muông, quần áo, trong ngoài, trên dưới, quan quân, binh lính, binh mã, người ngựa, nhân dân, quân đội, uỷ ban, ban chấp hành, sư đoàn, tỉnh thành, thành phố, nông thôn, thủ đô, ... 2.1.4. Danh từ trừu tượng : Abstract Noun Đặc điểm: - Chỉ những khái niệm được khái quát hoá trong tư duy. - Không đứng sau số từ, danh từ chỉ loại, trừ những trường hợp đặc biệt; chẳng hạn: một nền dân chủ, nỗi tâm tư, cái tình yêu, cái tật, cái thói. Danh sách: chính sách, chủ trương, tư tưởng, tâm tư, tình cảm, chính trị, lí luận, kinh tế, kế hoạch, nghề nghiệp, nghiệp vụ, phán đoán, định luật, định lí, bệnh tật, tật, thói, vùng, miền, trong, trên, ngoài, dưới, ... 2.1.5. Danh từ loại thể : Classify Noun Đặc điểm: - Chỉ từng cá thể, từng đơn vị sự vật, hiện tượng xác định. - Chỉ tập hợp những vật cùng loại. - Không đảm nhiệm vai trò định danh. - Đứng trước và làm phụ tố cho những danh từ đơn thể đảm nhiệm vai trò chính tố. - Thường đứng sau số từ. - Trong chu cảnh cụ thể, có thể thay thế cho danh từ đơn thể để đảm nhiệm vai trò chính tố, chẳng hạn: trong chuồng nuôi hai con ngựa, (một) con thì béo, (một) con thì gầy. Danh sách: con, cây, cục, cái, chiếc, tấm, phiến, tờ, tập, tệp, mẩu, mảnh, miếng, cuốn, qu