4.2. Khác biệt ngôn ngữ Việt – Anh Có nhiều điểm khác biệt về hình thái từ giữa hai ngôn ngữ Việt – Anh. Tuy nhiên không phải mọi sự khác biệt có thể xử lý trong hệ dịch máy. Với mô hình văn phạm liên kết, có thể xây dựng tập ...
CHƯƠNG 4 HỆ THỐNG DỊCH MÁY SỬ DỤNG DẠNG TUYỂN CÓ CHÚ GIẢI 4.1. Tổng quan về dịch máy 4.1.1.Tình hình phát triển dịch máy ở Việt Nam Dịch máy là lĩnh vực đang rất được quan tâm của CNTT do nhu cầu chuyển ngữ một số lượng lớn ...
3.3.2. Khử nhập nhằng liên hợp Nhập nhằng liên hợp là hiện tượng nhập nhằng liên quan đến các cụm từ có vai trò tương đương trong câu. Như đã nêu trong [70], từ “và” đóng một vai trò đặc biệt khi phân tích một câu trên mô hình ...
3.3.1.2. Giải thuật huấn luyện Như đã trình bày ở chương 1 với văn phạm phi ngữ cảnh, các xác suất đóng vai trò tham số ban đầu có thể được sinh ngẫu nhiên, sau đó được cập nhật lại mỗi khi có một câu mới được phân tích và ...
Luận án chưa thử nghiệm trên câu phức là dạng câu có từ hai cụm chủ vị trở lên nhưng có một cụm bao các cụm còn lại, ví dụ “cái áo hôm qua cậu mua rất đẹp” có hai cụm chủ vị “ cậu mua ” “ cái áo đẹp ” , cụm “ cái ...
Hình 3.16 dưới đây thể hiện cấu trúc lưu trữ phân tích liên kết của câu “ Tôi mua một bông hoa ”. 1, 2…5 là số thứ tự của từ. Mỗi từ có một danh sách liên kết các kết nối với các từ nằm bên phải nó. Thông tin về mỗi kết ...
Tìm quan hệ diễn ngôn với những đơn vị không xuất hiện dấu hiệu diễn ngôn Với những đơn vị không xuất hiện dấu hiệu diễn ngôn, dựa trên đặc điểm của tiếng Việt, luận án dùng giải thuật tìm các từ cùng xuất hiện được ...
Tính trên toàn văn bản (bao gồm cả mức câu, đoạn, mục), bộ phân tích diễn ngôn cho độ chính xác là 63%. Ở mức câu, độ chính xác đạt được xấp xỉ 80%. Xuất phát từ đặc điểm của câu ghép tiếng Việt là hầu hết các giới hạn ...
Một số câu có thể không phân tích được đầy đủ, một phần của nó cũng được phân tích. Ví dụ trong hình 3.8. là phân tích cho câu “Mỗi một mùa trắng tay đều khó nuốt trôi”. Câu này là câu bị động nhưng ẩn từ. Những liên ...
Hàm COUNT nhận các đầu vào là hai từ L và R và một cặp hai con trỏ tới các danh sách kết nối: l trỏ đến một kết nối thuộc danh sách bên phải của một dạng tuyển của L và r trỏ đến một kết nối thuộc danh sách bên trái của một ...
Luận án xây dựng bộ từ điển văn phạm liên kết gồm trên 40.000 mục từ dựa trên giải thuật mở rộng của [113] với cách đánh giá tính phân biệt được dựa trên các thông tin trong từ điển tiếng Việt. 2.2.1. Giải thuật mở rộng từ ...
Phụ tố chỉ số lượng : liên quan đến đo lường, tính toán hay tiêu chuẩn đo lường tính toán do danh từ đảm nhiệm. Liên kết được xác lập giữa tính từ và danh từ chỉ đơn vị đo: ApNt. Ví dụ, liên kết trong cụm từ “ sâu hai ngàn ...
Trang 168, Trang 169, Trang 170, Trang 171, Trang 172, Trang 173, Trang 174, Trang 175, Trang 176, Trang 177,