Mô hình văn phạm liên kết tiếng Việt - 21
Nội dung:
3.3.1.2. Giải thuật huấn luyện
Như đã trình bày ở chương 1 với văn phạm phi ngữ cảnh, các xác suất đóng vai trò tham số ban đầu có thể được sinh ngẫu nhiên, sau đó được cập nhật lại mỗi khi có một câu mới được phân tích và thêm vào bộ ngữ liệu. Giải thuật huấn luyện do [79] đưa ra nhằm tính lại giá trị tham số sau khi đã xử lý câu đưa vào. Cũng như văn phạm phi ngữ cảnh, giải thuật này dựa vào hai tham số là xác suất trong và xác suất ngoài.
Xác suất trong PrI ( L, R, l, r ) là xác suất mà các từ từ L đến R có thể liên kết với nhau sao cho các kết nối l và r được thỏa mãn.
Xác suất ngoài Pro ( L, R, l, r ) là xác suất mà các từ ngoài phạm vi từ L đến R có thể liên kết với nhau sao cho các yêu cầu kết nối ngoài l và r được thỏa mãn.
Xác suất trong được tính một cách đệ quy theo các quan hệ:
Theo giải thuật phân tích cú pháp ở hình 3.4, rõ ràng PI ( wi , wi+1, NIL, NIL ) = 1 với 0 ≤ i ≤ n-1.
Ví dụ, Với văn phạm liên kết và câu “Tôi mua một bông hoa” được nói ở trên,
PrI ( 1, 4, NIL, NcNt3 ) = Pr (3, (McN)(NcNt3),→ | 1, 4, NIL, NcNt3 ) ×
PrI ( 1, 3, NIL, McN ) × PrI ( 3, 4, NIL, NIL )
Có thể bạn quan tâm!
-
Mô hình văn phạm liên kết tiếng Việt - 18
-
Mô hình văn phạm liên kết tiếng Việt - 19
-
Mô hình văn phạm liên kết tiếng Việt - 20
-
Mô hình văn phạm liên kết tiếng Việt - 22
-
Mô hình văn phạm liên kết tiếng Việt - 23
-
Mô hình văn phạm liên kết tiếng Việt - 24
Xem toàn bộ: Mô hình văn phạm liên kết tiếng Việt (36 trang)
với giá trị các xác suất được cho trong (3.1) :
PrI ( 1, 3, NIL, McN) = Pr (2, ( )(McN), → | 1, 3, NIL, McN) ×
PrI (1, 2, NIL,NIL) × PrI (2, 3, NIL, NIL)
= 0.06 × 1 × 1 = 0.06
Pr ( 3, (McN)(NcNt3),→ | 1, 4, NIL, NcNt3 ) = 0.05
do vậy, PrI ( mua, hoa, NIL, NcNt3) = 0.05 × 0.06 = 0.003 (3.5)
Xác suất ngoài PrO được tính một cách đệ quy: ban đầu, với mỗi d ∈ D(W0) có left[d] = NIL, đặt
Xác suất được cộng dồn cho 4 trường hợp có thể xảy ra tại bước trước (khi ấy R và L còn đóng vai trò của W):
Hình 3.22. Mô tả cách tính xác suất Pr0 ⊲left(L, W, l ⊳, ⊲ left[D])
Theo [79], Các số đếm được tính trong các công thức từ (3.6) đến (3.9) dưới đây :
Giá trị count(L, R, l, r) được tính trong giải thuật phân tích:
với δ là hàm nhận giá trị 1 nếu l = NIL, 0 nếu ngược lại, match nhận giá trị 1 nếu hai kết nối khớp nhau, 0 nếu ngược lại. Chú ý match(c,NIL) = match(NIL,c) = 0.
Giá trị Pr (S) được nêu trong các công thức trên được tính theo công thức sau:
Các giá trị Count (L, R, l, r), Count(W, l, r) và Count(d, l, r) được tính trực tiếp theo các kết nối và dạng tuyển xuất hiện trong bộ ngữ liệu.
Bài viết tương tự
- Kinh doanh các dịch vụ liên quan đến rác thải mô hình tại Nhật Bản và bài học kinh nghiệm đối với Việt Nam
- Phân tách cụm danh từ cơ sở tiếng việt sử dụng mô hình crfs
- Tình hình song ngữ khmer-việt tại đồng bằng sông cửu long – một số vấn đề lý thuyết và thực tiễn
- Luận cứ khoa học về xác định mô hình quản lý rủi ro tín dụng tại hệ thống ngân hàng thương mại Việt Nam
- KHẢO SÁT NHANH CÁC LOẠI HÌNH CHỨNG KHOÁN PHÁI SINH VÀ SẢN PHẨM GIAO DỊCH MỚI TRÊN THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM
Gửi tin nhắn
Danh mục
Bài viết tương tự
-
Ảnh hưởng của văn hoá phương Đông đến hành vi tiêu dùng hàng thực phẩm của người Việt Nam
-
Dịch vụ phân phối và những vấn đề đặt ra trong việc thực hiện cam kết của Việt Nam khi gia nhập WTO
-
Mô hình chiến lược" Đại dương xanh" và thực tế áp dụng đối với các doanh nghiệp Việt Nam
-
Kinh nghiệm phát triển mô hình Keiretsu ở Nhật Bản, Chaebol ở Hàn Quốc và định hướng cho các tập đoàn kinh tế của Việt Nam
-
Mô hình bán lẻ chuyên biệt và triển vọng phát triển tại Việt Nam
-
Mô hình cửa hàng tiện lợi tại Việt Nam: Thực trạng và giải pháp
-
Mô hình kinh doanh Báo mạng tại Việt Nam: thực trạng và giải pháp
Bài viết mới
- Tác động của chất lượng website đến cảm nhận chất lượng sản phẩm và chất lượng mối quan hệ với khách hàng
- Ảnh hưởng Tam giáo trong tư tưởng đạo đức Lê Thánh Tông
- Phân tích hiệu quả đầu tư dự án khu biệt thự Trung tâm Hội nghị Quốc gia
- Giải pháp phát triển dịch vụ tại Ngân hàng Công thương Việt Nam, chi nhánh Tiên Sơn - Bắc Ninh
- Quản lý hoạt động giáo dục sức khỏe sinh sản cho học sinh trường trung học cơ sở Nguyễn Hiền, thành phố Nha Trang, tỉnh Khánh Hòa trong giai đoạn hiện nay
- Quản lý hoạt động của tổ chuyên môn trường trung học phổ thông Trung Văn, quận Nam Từ Liêm – Hà Nội trong bối cảnh đổi mới giáo dục
- Giáo dục pháp luật cho học viên các trường sĩ quan quân đội ở Việt Nam hiện nay
- Phòng ngừa rủi ro tỷ giá hối đoái ở ngân hàng phát triển nhà đồng bằng sông Cửu Long chi nhánh Hà Nội
- Quản lý hoạt động liên kết đào tạo tại trường Cao đẳng nghề dân tộc nội trú Bắc Kạn
Tin nhắn