Luật dịch cụm từ Dịch cụm từ sang đại từ xưng hô tiếng Anh Cách xưng hô trong tiếng Việt rất phức tạp. Ngay cả các bộ từ điển cũng có những quan điểm khác nhau về từ loại của những cụm từ có tính chất xưng hô. Ví dụ “ ...
4.3. Hệ thống dịch máy sử dụng dạng tuyển có chú giải Khi dịch máy với cấu trúc hai ngôn ngữ nguồn – đích khác nhau, những vấn đề sau luôn luôn được đặt ra: Tìm nghĩa chính xác của từ – giải quyết nhập nhằng nghĩa từ và từ ...
4.2. Khác biệt ngôn ngữ Việt – Anh Có nhiều điểm khác biệt về hình thái từ giữa hai ngôn ngữ Việt – Anh. Tuy nhiên không phải mọi sự khác biệt có thể xử lý trong hệ dịch máy. Với mô hình văn phạm liên kết, có thể xây dựng tập ...
CHƯƠNG 4 HỆ THỐNG DỊCH MÁY SỬ DỤNG DẠNG TUYỂN CÓ CHÚ GIẢI 4.1. Tổng quan về dịch máy 4.1.1.Tình hình phát triển dịch máy ở Việt Nam Dịch máy là lĩnh vực đang rất được quan tâm của CNTT do nhu cầu chuyển ngữ một số lượng lớn ...
3.3.2. Khử nhập nhằng liên hợp Nhập nhằng liên hợp là hiện tượng nhập nhằng liên quan đến các cụm từ có vai trò tương đương trong câu. Như đã nêu trong [70], từ “và” đóng một vai trò đặc biệt khi phân tích một câu trên mô hình ...
3.3.1.2. Giải thuật huấn luyện Như đã trình bày ở chương 1 với văn phạm phi ngữ cảnh, các xác suất đóng vai trò tham số ban đầu có thể được sinh ngẫu nhiên, sau đó được cập nhật lại mỗi khi có một câu mới được phân tích và ...
Luận án chưa thử nghiệm trên câu phức là dạng câu có từ hai cụm chủ vị trở lên nhưng có một cụm bao các cụm còn lại, ví dụ “cái áo hôm qua cậu mua rất đẹp” có hai cụm chủ vị “ cậu mua ” “ cái áo đẹp ” , cụm “ cái ...
Hình 3.16 dưới đây thể hiện cấu trúc lưu trữ phân tích liên kết của câu “ Tôi mua một bông hoa ”. 1, 2…5 là số thứ tự của từ. Mỗi từ có một danh sách liên kết các kết nối với các từ nằm bên phải nó. Thông tin về mỗi kết ...
Tìm quan hệ diễn ngôn với những đơn vị không xuất hiện dấu hiệu diễn ngôn Với những đơn vị không xuất hiện dấu hiệu diễn ngôn, dựa trên đặc điểm của tiếng Việt, luận án dùng giải thuật tìm các từ cùng xuất hiện được ...
Tính trên toàn văn bản (bao gồm cả mức câu, đoạn, mục), bộ phân tích diễn ngôn cho độ chính xác là 63%. Ở mức câu, độ chính xác đạt được xấp xỉ 80%. Xuất phát từ đặc điểm của câu ghép tiếng Việt là hầu hết các giới hạn ...
Một số câu có thể không phân tích được đầy đủ, một phần của nó cũng được phân tích. Ví dụ trong hình 3.8. là phân tích cho câu “Mỗi một mùa trắng tay đều khó nuốt trôi”. Câu này là câu bị động nhưng ẩn từ. Những liên ...
Hàm COUNT nhận các đầu vào là hai từ L và R và một cặp hai con trỏ tới các danh sách kết nối: l trỏ đến một kết nối thuộc danh sách bên phải của một dạng tuyển của L và r trỏ đến một kết nối thuộc danh sách bên trái của một ...
Trang 3406, Trang 3407, Trang 3408, Trang 3409, Trang 3410, Trang 3411, Trang 3412, Trang 3413, Trang 3414, Trang 3415,