Trained PhoBERT để tạo ra các véc tơ chỉ mục của các token của câu, sau đó các véc tơ chỉ mục này được đưa vào mô hình pre-trained PhoBERT để thu được các véc tơ mã hóa từ của các câu. Cuối cùng, các véc tơ mã hóa từ của mỗi câu ...
Thông tin (IR - Information Retrieval) để đo lường mức độ tương đồng giữa truy vấn người dùng Q và các câu trong văn bản. MMR được tính theo công thức: MMR arg max Sim D , Q 1 max Sim D , D ...
Trong mỗi bước huấn luyện, mô hình Skip-Gram chỉ nhận một từ đầu vào nhưng có nhiều đầu ra cho một từ đầu vào. Các thử nghiệm thực tế cho thấy mô hình Skip-Gram hoạt động tốt hơn đối với những từ ít gặp, còn mô hình CBoW ...
Hình 2.10. Mô hình mạng chuỗi sang chuỗi [92] Trong mô hình seq2seq, bộ mã hóa đọc vào một câu là một chuỗi véc tơ x ( x 1 , x 2 ,. x T ) . Với mỗi từ x t (với t 1, T ), mạng RNN mã hóa sẽ xử lý trả ra một véc tơ h t mang thông tin về ...
2.1.2. Mạng nơ ron tích chập 2.1.2.1. Giới thiệu mạng nơ ron tích chập Mạng nơ ron tích chập (CNN - Convolutional Neural Network) [81,82,83,84] là một trong những mô hình học sâu phổ biến hiện nay giúp chúng ta xây dựng được những ứng dụng ...
1.4. Các phương pháp tóm tắt văn bản hướng trích rút cơ sở 1.4.1. PageRank PageRank [15] là thuật toán được sử dụng trong công cụ tìm kiếm của Google (Google Search). Về bản chất PageRank là phân bố xác suất, được sử dụng để biểu ...
Văn bản tóm tắt A total of 47 bodies have been exhumed from two mass graves. Iraqis find mass graves inside presidential palace compound in Tikrit . ISIS claimed to have executed 1,700 Iraqi soldiers captured outside Camp Speicher . Bảng 1.1. Ví dụ minh họa một văn bản tóm tắt ...
Trên phân tích cú pháp văn bản đầu vào để xây dựng một tập gồm tất cả các cây phụ thuộc cú pháp. Trong khi đó, hệ thống dựa trên luật [37] yêu cầu xác định các luật để phát hiện các khái niệm quan trọng trong văn bản đầu ...
Bảng 3.13. Giá trị các siêu tham số và thời gian huấn luyện các mô hình xây dựng . 76 Bảng 3.14. Kết quả thử nghiệm của các mô hình xây dựng 77 Bảng 3.15. Một mẫu tóm tắt trên bộ dữ liệu CNN 77 Bảng 3.16. Một mẫu tóm tắt trên bộ ...
Lời Cam Đoan Tôi Tên Là Lưu Minh Tuấn, Xin Cam Đoan Đây Là Công Trình Nghiên Cứu Của Bản Thân Nghiên Cứu Sinh Trong Thời Gian Học Tập Và Nghiên Cứu Dưới Sự Hướng Dẫn Của Người Hướng Dẫn Khoa Học. Các Kết Quả Nghiên Cứu Trình Bày ...
108. Joel Samaha (2011), Criminal Procedure , 8 th Edition, Wadsworth Publishing. 109. Statute of the Special Court For Sierra Leone, http://www.rscsl.org/Documents/ scsl-statute.pdf 110. Statute of the Special Tribunal for Lebanon, http://www.stl-tsl.org/en/documents/ ...
DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt 1. A. Ia Vư-sin-xky (1967), Lý luận về chứng cứ tư pháp trong pháp luật Xô Viết , bản dịch tiếng Việt, Phòng tuyên truyền tập san, Toà án nhân dân tối cao. 2. Phạm Văn An (2012), “Những khó khăn, ...
Trang 6210, Trang 6211, Trang 6212, Trang 6213, Trang 6214, Trang 6215, Trang 6216, Trang 6217, Trang 6218, Trang 6219,