Mỗi tiểu loại từ tuân theo những luật cú pháp riêng nên có những công thức liên kết riêng. Tuy nhiên việc chia thành các tiểu loại cũng chưa đủ để xây dựng các công thức liên kết vì chính các từ trong cùng một tiểu loại cũng có thể có cách thức liên kết khác nhau.
Luận án đã xây dựng từ điển dựa theo phân loại trong [16] (mức tiểu tiểu loại).
Chi tiết về các liên kết điển hình được trình bày trong phụ lục.
2.1.2. Xây dựng liên kết cho danh từ
Danh từ là loại từ xuất hiện với tần suất lớn nhất trong các câu. Trong [2] đã nêu một số đặc điểm liên quan đến việc kết nối các từ khi phân chia danh từ thành các tiểu loại:
Danh từ biệt loại và không biệt loại
- Danh từ biệt loại là danh từ chỉ người, danh từ chỉ đồ đạc, danh từ chỉ động thực vật, danh từ chỉ một số khái niệm trừu tượng. Danh từ loại này có kết hợp với đơn vị tự nhiên (“cái”,”con”, “bức”…).
- Danh từ không biệt loại chỉ chất liệu kết hợp với danh từ chỉ đơn vị quy ước như ”tấn”, “cân”…
Danh từ đếm được và không đếm được
- Danh từ trực tiếp đếm được: một số danh từ cụ thể , danh từ chỉ đơn vị tiền tệ, hành chính, tổ chức… (ví dụ: “ba đồng”, “hai cơ quan”).
- Danh từ không trực tiếp đếm được: Không có liên hệ trực tiếp với số từ mà qua đơn vị tự nhiên, ví dụ danh từ chỉ động vật, thực vật… (ví dụ: “ba bông hồng”, “bốn con mèo”)
Danh từ chỉ xuất được và danh từ không chỉ xuất được
- Danh từ chỉ xuất được kết hợp được với từ “cái”, ví dụ từ “xã”- “cái xã này”
- Danh từ không chỉ xuất được kết hợp với từ “cái” phải thông qua đơn vị khác, ví dụ “sinh viên”, phải nói “cái anh sinh viên này”.
Để xây dựng bộ từ điển tiếng Việt, [16] đã có cách phân loại thích hợp với xử lý tự động nên luận án đã theo cách làm của [16]. Theo đó, các tiểu loại danh từ được phân chia thành các nhóm nhỏ hơn, mỗi loại này có thể có những mối liên kết riêng thể hiện những hiện tượng đã được nêu trong [2]. Từ điển của luận án được xây dựng theo phân loại này có thêm những ngoại lệ: một số mục được nhập lại thành một, đồng thời thêm một số mục khác. Chi tiết về liên kết của từng loại từ được trình bày trong phần phụ lục.
2.1.2.1. Liên kết của danh từ đóng vai trò chủ ngữ, bổ ngữ
Vai trò quan trọng nhất của danh từ là làm chủ ngữ. Về vị ngữ, trong tiếng Việt các loại vị ngữ thường gặp nhất là động từ (đặc biệt động từ quan hệ “là”) và tính từ . Như vậy, chắc chắn các kết nối SV+, SA+, DT_LA+ có ở tất cả các loại danh từ, trừ danh chỉ loại và một số nhóm danh từ chỉ đơn vị. Danh từ cũng là đối tượng trực tiếp và gián tiếp của hành động nên nói chung các loại danh từ có kết nối O- (bổ ngữ trực tiếp) và IO- (bổ ngữ gián tiếp) với động từ, LA_DT- với động từ quan hệ “là” Chi tiết về các công thức liên kết xem trong phần phụ lục.
2.1.2.2. Xây dựng liên kết dựa trên cấu trúc danh ngữ
Xem xét cấu trúc của danh ngữ, có thể tìm ra được các mối liên hệ mà trong đó danh từ đóng vai trò trung tâm. Nguyễn Chí Hòa [8] cho rằng chỉ có một danh từ là trung tâm của danh ngữ, tuy nhiên Nguyễn Tài Cẩn [2] lại chọn phương án hai từ trung tâm. Dù sao, điều đó cũng không ảnh hưởng đến số lượng các mối liên hệ. Ở trường hợp đầy đủ nhất, một danh ngữ có thể có cấu trúc như hình 2.1. dưới đây (theo [8]):
-3 | -2 | -1 | Trung tâm | 1 | 2 | 3 | 4 | 5 |
Có thể bạn quan tâm!
- Mô hình văn phạm liên kết tiếng Việt - 6
- Các Định Nghĩa Hình Thức Về Văn Phạm Liên Kết
- Mô hình văn phạm liên kết tiếng Việt - 8
- Mô hình văn phạm liên kết tiếng Việt - 10
- Xây Dựng Liên Kết Dựa Trên Cấu Trúc Động Ngữ
- Xây Dựng Liên Kết Dựa Trên Cấu Trúc Tính Ngữ
Xem toàn bộ 305 trang tài liệu này.
Hình 2.1. Cấu trúc danh ngữ với đầy đủ các thành tố
Trên sơ đồ cấu trúc đó, xét hai loại: thành tố phụ đứng trước và thành tố phụ đứng sau danh từ.
a. Thành tố phụ đứng trước danh từ
- Vị trí trước thứ nhất (đánh số -3) được dành cho thành tố phụ có tác dụng bổ sung cho danh từ trung tâm ý nghĩa về số lượng, về toàn bộ một sự vật, cụ thể gồm các loại từ sau:
– Đại từ chỉ lượng, ví dụ “tất thảy”, “tất cả”, “toàn bộ”, “toàn”, “một số”.
– Danh từ trừu tượng mang ý nghĩa toàn bộ: “toàn thể”.
- Vị trí trước thứ hai (-2) dành cho các danh từ chỉ lượng (từ chỉ số ít, số nhiều, số từ số lượng) như :
– Định từ chỉ số nhiều: “những”, “các”,”mọi”,”vài”, “mấy”, định từ chỉ số ít “mỗi”, “từng”…
– Số từ số lượng: bằng chữ: “một”, “hai”…, bằng số: 1269
- Vị trí trước thứ ba (-1): đây chính là vị trí mà [2] xếp vào thành phần trung tâm, dành cho:
– Các danh từ chỉ loại: Danh từ chỉ loại “con”, “cái”, “cuốn”… được phân chia vào loại liên kết với 6 tiểu tiểu loại của danh từ cụ thể .
– Các danh từ chỉ đơn vị: [16] chia danh từ chỉ đơn vị thành 4 loại đơn vị đo lường và hai loại khác: hành chính tổ chức và tần suất.
Sau đây là mô tả dạng kết nối cho vị trí trước danh từ:
- Kết nối cho thành phần phụ thứ ba (-1)
Thành phần phụ thứ ba có thể là danh từ chỉ loại hoặc danh từ chỉ đơn vị. Chỉ khi danh từ trung tâm là danh từ riêng hoặc danh từ cụ thể mới xuất hiện thành phần phụ thứ ba. Xét hai trường hợp cho hai loại danh từ ở vị trí thành phần phụ thứ ba:
Danh từ chỉ loại: Danh từ chỉ loại lại gồm nhiều tập hợp, mỗi tập hợp chỉ đi với một số danh từ. Ví dụ “cuốn”, “chiếc” chỉ đi với đồ vật, “chú”, “thằng” chỉ đi với danh từ chỉ người. Để đảm bảo tính chính xác của phân tích liên kết, luận án đưa ra các loại kết nối khác nhau cho từng loại danh từ có thể kết hợp danh từ chỉ loại.
Danh từ riêng chỉ tên người có kết nối NcN1- tới các danh từ chỉ loại liên quan đến người như: “cô”, “chú”, “đứa”…
Ví dụ: Các cụm từ “bà Clinton”, “chú Cuội” chứa liên kết NcN1 giữa danh từ chỉ loại và tên riêng.
Danh từ riêng chỉ tên tác phẩm có kết nối NcN4- tới các danh từ chỉ loại về vật.
Ví dụ: Cụm từ “quyển Kinh Thánh” có chứa liên kết NcN4 giữa từ “quyển” và từ “Kinh Thánh”.
Danh từ cụ thể: Tùy loại danh từ mà xác định các kiểu liên kết khác nhau với danh từ chỉ loại, ví dụ “thằng”, “đứa” đi với danh từ chỉ người, trong khi “tia” lại đi với danh từ chỉ hiện tượng. Việc chia thành 6 loại liên kết đảm bảo thể hiện chính xác cách dùng tiếng Việt:
- Người: NcNt1-
- Động vật: NcNt2
- Thực vât: NcNt3-
- Đồ dùng, vật dụng : NcNt4-
- Hiện tượng: NcNt5-
- Khái niệm: NcNt6-
Một số danh từ không phải chỉ loại nhưng được dùng như danh từ chỉ loại cũng có những kết nối như trên, ví dụ “nàng”, “đức”…
Danh từ chỉ đơn vị: Danh từ chỉ đơn vị thường đi kèm số từ. Trong [16] đã phân chia danh từ chỉ đơn vị thành 6 tiểu loại nhưng chỉ có 4 tiểu loại: đo lường khoa học chính xác, đo lường dân gian, thời gian , tiền tệlà luôn đi kèm số từ ở bên trái và danh từ ở bên phải, ví dụ “2 kg thóc”.
Công thức liên kết cho loại danh từ chỉ đơn vị này được xây dựng như sau:
- Thêm cho danh từ kết nối NuNt-.
- Thêm cho danh từ chỉ đơn vị công thức McNu- & {NuNt+}. Công thức này đòi hỏi dạng của cụm từ là , chẳng hạn “hai mét vải” hoặc “hai mét”.
- Thêm cho số từ liên kết McNu+.
Hai tiểu loại danh từ chỉ đơn vị khác là đơn vị hành chính, tổ chức (“phường”, “xã”….) và đơn vị tần suất (“lần”, “phiên”, “mẻ”…) không xuất hiện ở vị trí thành phần phụ thứ ba.
- Kết nối cho thành phần phụ thứ hai (-2)