BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC THÀNH PHỐ HỒ CHÍ MINH
NGUYỄN XUÂN DƯƠNG
HỆ THỐNG TRÍCH XUẤT TỰ ĐỘNG THÔNG TIN TỪ ẢNH CĂN CƯỚC CÔNG DÂN
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
MÃ SỐ: 60480201
TP. HỒ CHÍ MINH THÁNG 9 NĂM 2019
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC THÀNH PHỐ HỒ CHÍ MINH
NGUYỄN XUÂN DƯƠNG
HỆ THỐNG TRÍCH XUẤT TỰ ĐỘNG THÔNG TIN TỪ ẢNH CĂN CƯỚC CÔNG DÂN
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
MÃ SỐ: 60480201
HƯỚNG DẪN KHOA HỌC: PGS .TS PHẠM THẾ BẢO
2
TP. HỒ CHÍ MINH THÁNG 9 NĂM 2019
LỜI CAM ĐOAN.
Tôi Nguyễn Xuân Dương tác giả của luận văn “Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân”. Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, dưới sự hướng dẫn nghiên cứu khoa học của PGS. TS Phạm Thế Bảo.
Các thông tin sử dụng trong luận văn, các trích dẫn tôi có ghi đầy đủ, rõ ràng trong các tài liệu tham khảo.
Các số liệu, kết quả thực nghiệm nêu trong luận văn là trung thực và chưa từng được ai công bố trong thời gian gần đây.
Học viên đã bảo vệ thành công luận văn ngày 04 /06/2019, tại Hội đồng đánh giá luận văn thạc sĩ thành lập theo Quyết định số 116 /QĐ-ĐNT ngày 29/05/2019 của Hiệu trưởng Trường ĐH Ngoại ngữ-Tin học TP HCM, với sự tham gia của:
Chủ tịch hội đồng: PGS.TS Trần Văn Lăng Phản biện 1: TS Nguyễn Đức Cường
Phản biện 2: PGS.TS Nguyễn Thanh Bình
Có thể tìm hiểu Luận văn tại Thư viện Trường ĐH Ngoại ngữ-Tin học TP HCM, hoặc trên cổng thông tin điện tử, website của đơn vị quản lý sau đại học của Trường.
Tôi xin hoàn toàn chịu trách nhiệm với cam kết trên.
Tác giả luận văn
Nguyễn Xuân Dương
LỜI CẢM ƠN
Trước tiên tôi xin tỏ lòng tri ân, gởi lời cảm ơn sâu sắc đến PGS. TS Phạm Thế Bảo đã tận tình hướng dẫn, giúp đỡ tôi trong suốt thời gian học tập, nghiên cứu tài liệu, hướng dẫn thực nghiệm để tôi hoàn thành công trình nghiên cứu.
Tôi xin cảm ơn các thầy cô giáo Khoa Công Nghệ Thông Tin, ban sau đại học trường Đại học Ngoại Ngữ Tin học TP Hồ Chí Minh đã trang bị cho tôi những kiến thức cần thiết và bổ ích, tạo mọi điều kiện giúp đỡ, hướng dẫn tôi trong trong thời gian học tập, nghiên cứu và làm luận văn tốt nghiệp.
Do thời gian có hạn và kiến thức còn hạn chế nên luận văn không tránh khỏi những sai sót, tôi mong nhận được sự đóng góp bổ sung của quý thầy cô giáo và các bạn để công trình nghiên cứu của tôi sớm ứng dụng vào thực tế.
Cuối cùng tôi xin chân thành cảm ơn tất cả các bạn đồng nghiệp đã đóng góp ý kiến và hỗ trợ tôi trong quá trình thực hiện thành luận văn này.
TP Hồ Chí Minh, tháng 9 năm 2019
Nguyễn Xuân Dương
DANH MỤC CÁC TỪ VIẾT TẮT
Anh ngữ | Việt ngữ Căn cước công dân Chứng minh nhân dân Đặc điểm Ủy ban nhân dân | |
ANN | Artificial Neural Network | Mạng nơron nhân tạo |
ML | Machine Learning | Học máy |
AI | Artificial Intelligence | Trí tuệ nhân tạo |
RRN | Recurrent Neural Network | Mạng nơron tái phát |
DL | Deep Learning | Máy học chuyên sâu |
DNN OCR MLP RGB NTSC | Deep Neural Network Optical Character Recognition Multi Layer Perceptron Red Green Blue National Teltevision System Committee | Mạng Nơ ron chuyên sâu Nhận dạng ký tự Mạng truyền thẳng nhiều lớp Mô hình màu đỏ xanh lục Hệ tiêu chuẩn video tương tự |
Có thể bạn quan tâm!
- Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân - 2
- Bài Toán Trích Xuất Thông Tin Tự Động Từ Thẻ Cccd
- So Sánh Miền Tầng Số Trước Và Sau Khi Lọc Băng Thông Thấp
Xem toàn bộ 96 trang tài liệu này.
DANH MỤC CÁC HÌNH ẢNH VÀ BẢNG BIỂU
Hình 1.1. Mẫu “Căn cước công dân” 17
Hình 2.1. So sánh miền tầng số trước và sau khi lọc băng thông thấp 25
Hình 2.2. Tầng số trước và sau khi sử dụng lọc băng thông cao 26
Hình 2.3. Mô hình mạng nơron 36
Hình 2.4. Đơn vị xử lý 37
Hình 2.5. Hàm đồng nhất 38
Hình 2.6. Hàm bước nhị phân 39
Hình 2.7. Hàm Sigmoid 39
Hình 2.8. Hàm simoid lưỡng cực 40
Hình 2.9. Mạng nơron truyền thẳng nhiều lớp 41
Hình 2.10. Mạng nơron hồi quy nhiều lớp 42
Hình 2.11. Học có giám sát 43
Hình 2.12. Mạng nơron MPL tổng quát 47
Hình 3.1. Tiền xử lý ảnh mặt trước CCCD 50
Hình 3.2. Vùng thông tin cần tách ở mặt trước CCCD 53
Hình 3.3. Xác định vị trí thông tin mặt trước thẻ CCCD 56
Hình 3.4. Các vùng thông tin cần tách ở mặt sau 61
Hình 3.5. Tiền xử lý mặt sau CCCD 62
Hình 3.6. Xác định vùng thông tin mặt sau 63
Hình 3.7. Quá trình tách ký tự 66
Hình 3.8. Quá trình tìm giới hạn kí tự 67
Hình 3.9. Quá trình chia lưới kí tự 67
Hình 3.10. Quá trình ánh xạ từ ma trận điểm sang ma trận giá trị 68
Hình 4.1. Ảnh mặt trước CCCD bị nhòe 71
Hình 4.2. Ảnh mặt sau CCCD bị nhòe 72
Hình 4.3. Giao diện chương trình thực nghiệm 74
Hình 4.4. Trường hợp tách bị lỗi 78
Hình 4.5. Thẻ mặt sau CCCD chụp không đúng chuẩn 79
Sơ đồ 1.1. Sơ đồ xử lý hệ thống xử lý 22
Bảng 3.1 Đặc trưng các trường thông tin ở mặt trước CCCD 61
Bảng 4.1. Cấu hình máy tính 73
Bảng 4.2. Kết quả trích vùng của ảnh CCCD 75
Bảng 4.3. Kết quả thực nghiệm trên tập dữ liệu A1 76
Bảng 4.4. Kết quả thực nghiệm trên tập dữ liệu A2 77
DANH MỤC CÁC THUẬT TOÁN
Thuật toán 2.1. Lọc băng thông thấp Gauss 24
Thuật toán 2.2. Lọc băng thông cao Gauss 26
Thuật toán 2.3. Xoay ảnh 28
Thuật toán 2.4. Xác định góc nghiêng dựa vào biến đổi Hough 29
Thuật toán 2.5. Nhị phân hóa ảnh 30
Thuật toán 2.6. Phương pháp phân ngưỡng Niblack 32
Thuật toán 2.7. Phương pháp phân ngưỡng Otsu 33
Thuật toán 2.8. Học có giám sát 44
Thuật toán 2.9. Thuận toán lan truyền ngược 45
Thuật toán 2.10. Xây dựng mạng nơ ron 47
Thuật toán 3.1. Nhị phân hóa ảnh CCCD 50
Thuật toán 3.2. Hiệu chỉnh độ nghiêng của ảnh tài liệu 51
Thuật toán 3.3. Phân đoạn vùng Số CCCD 54
Thuật toán 3.4. Xác định các vùng có thể là Trường Số CCCD 54
Thuật toán 3.5. Tìm và tách trường Số CCCD 55
Thuật toán 3.6. Tách các trường thông tin mặt trước thẻ CCCD 57
Thuật toán 3.7. Tách các ký tự thuộc mỗi dòng 58
Thuật toán 3.8. Xoá phần tiêu đề 60
Thuật toán 3.9. Tách thông tin mặt sau 64
Thuật toán 3.10. Tách dòng 65
Thuật toán 3.11. Tách kí tự 65
Thuật toán 3.12. Tìm giới hạn kí tự 66
Thuật toán 3.13. Ánh xạ vào ma trận 67
Thuật toán 3.14. Chuyển ma trận điểm ảnh sang ma trận giá trị 68
Thuật toán 3.15. Huấn luyện mạng nơ ron 68
Thuật toán 3.16. Nhận dạng ảnh kí tự 69