Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân - 1


BỘ GIÁO DỤC VÀ ĐÀO TẠO


TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC THÀNH PHỐ HỒ CHÍ MINH


NGUYỄN XUÂN DƯƠNG


HỆ THỐNG TRÍCH XUẤT TỰ ĐỘNG THÔNG TIN TỪ ẢNH CĂN CƯỚC CÔNG DÂN


LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN

MÃ SỐ: 60480201


TP. HỒ CHÍ MINH THÁNG 9 NĂM 2019


BỘ GIÁO DỤC VÀ ĐÀO TẠO


TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC THÀNH PHỐ HỒ CHÍ MINH


NGUYỄN XUÂN DƯƠNG


HỆ THỐNG TRÍCH XUẤT TỰ ĐỘNG THÔNG TIN TỪ ẢNH CĂN CƯỚC CÔNG DÂN


LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN

MÃ SỐ: 60480201


HƯỚNG DẪN KHOA HỌC: PGS .TS PHẠM THẾ BẢO


2

TP. HỒ CHÍ MINH THÁNG 9 NĂM 2019

LỜI CAM ĐOAN.


Tôi Nguyễn Xuân Dương tác giả của luận văn “Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân”. Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, dưới sự hướng dẫn nghiên cứu khoa học của PGS. TS Phạm Thế Bảo.

Các thông tin sử dụng trong luận văn, các trích dẫn tôi có ghi đầy đủ, rõ ràng trong các tài liệu tham khảo.

Các số liệu, kết quả thực nghiệm nêu trong luận văn là trung thực và chưa từng được ai công bố trong thời gian gần đây.

Học viên đã bảo vệ thành công luận văn ngày 04 /06/2019, tại Hội đồng đánh giá luận văn thạc sĩ thành lập theo Quyết định số 116 /QĐ-ĐNT ngày 29/05/2019 của Hiệu trưởng Trường ĐH Ngoại ngữ-Tin học TP HCM, với sự tham gia của:

Chủ tịch hội đồng: PGS.TS Trần Văn Lăng Phản biện 1: TS Nguyễn Đức Cường

Phản biện 2: PGS.TS Nguyễn Thanh Bình

Có thể tìm hiểu Luận văn tại Thư viện Trường ĐH Ngoại ngữ-Tin học TP HCM, hoặc trên cổng thông tin điện tử, website của đơn vị quản lý sau đại học của Trường.

Tôi xin hoàn toàn chịu trách nhiệm với cam kết trên.

Tác giả luận văn


Nguyễn Xuân Dương

LỜI CẢM ƠN


Trước tiên tôi xin tỏ lòng tri ân, gởi lời cảm ơn sâu sắc đến PGS. TS Phạm Thế Bảo đã tận tình hướng dẫn, giúp đỡ tôi trong suốt thời gian học tập, nghiên cứu tài liệu, hướng dẫn thực nghiệm để tôi hoàn thành công trình nghiên cứu.

Tôi xin cảm ơn các thầy cô giáo Khoa Công Nghệ Thông Tin, ban sau đại học trường Đại học Ngoại Ngữ Tin học TP Hồ Chí Minh đã trang bị cho tôi những kiến thức cần thiết và bổ ích, tạo mọi điều kiện giúp đỡ, hướng dẫn tôi trong trong thời gian học tập, nghiên cứu và làm luận văn tốt nghiệp.

Do thời gian có hạn và kiến thức còn hạn chế nên luận văn không tránh khỏi những sai sót, tôi mong nhận được sự đóng góp bổ sung của quý thầy cô giáo và các bạn để công trình nghiên cứu của tôi sớm ứng dụng vào thực tế.

Cuối cùng tôi xin chân thành cảm ơn tất cả các bạn đồng nghiệp đã đóng góp ý kiến và hỗ trợ tôi trong quá trình thực hiện thành luận văn này.


TP Hồ Chí Minh, tháng 9 năm 2019


Nguyễn Xuân Dương

DANH MỤC CÁC TỪ VIẾT TẮT


Từ viết tắt CCCD CMND ĐĐ

UBND

Anh ngữ

Việt ngữ

Căn cước công dân Chứng minh nhân dân Đặc điểm

Ủy ban nhân dân

ANN

Artificial Neural Network

Mạng nơron nhân tạo

ML

Machine Learning

Học máy

AI

Artificial Intelligence

Trí tuệ nhân tạo

RRN

Recurrent Neural Network

Mạng nơron tái phát

DL

Deep Learning

Máy học chuyên sâu

DNN OCR MLP RGB NTSC

Deep Neural Network


Optical Character Recognition Multi Layer Perceptron

Red Green Blue

National Teltevision System Committee

Mạng Nơ ron chuyên sâu Nhận dạng ký tự

Mạng truyền thẳng nhiều lớp


Mô hình màu đỏ xanh lục

Hệ tiêu chuẩn video tương tự

Có thể bạn quan tâm!

Xem toàn bộ 96 trang tài liệu này.

Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân - 1

DANH MỤC CÁC HÌNH ẢNH VÀ BẢNG BIỂU

Hình 1.1. Mẫu “Căn cước công dân” 17

Hình 2.1. So sánh miền tầng số trước và sau khi lọc băng thông thấp 25

Hình 2.2. Tầng số trước và sau khi sử dụng lọc băng thông cao 26

Hình 2.3. Mô hình mạng nơron 36

Hình 2.4. Đơn vị xử lý 37

Hình 2.5. Hàm đồng nhất 38

Hình 2.6. Hàm bước nhị phân 39

Hình 2.7. Hàm Sigmoid 39

Hình 2.8. Hàm simoid lưỡng cực 40

Hình 2.9. Mạng nơron truyền thẳng nhiều lớp 41

Hình 2.10. Mạng nơron hồi quy nhiều lớp 42

Hình 2.11. Học có giám sát 43

Hình 2.12. Mạng nơron MPL tổng quát 47

Hình 3.1. Tiền xử lý ảnh mặt trước CCCD 50

Hình 3.2. Vùng thông tin cần tách ở mặt trước CCCD 53

Hình 3.3. Xác định vị trí thông tin mặt trước thẻ CCCD 56

Hình 3.4. Các vùng thông tin cần tách ở mặt sau 61

Hình 3.5. Tiền xử lý mặt sau CCCD 62

Hình 3.6. Xác định vùng thông tin mặt sau 63

Hình 3.7. Quá trình tách ký tự 66

Hình 3.8. Quá trình tìm giới hạn kí tự 67

Hình 3.9. Quá trình chia lưới kí tự 67

Hình 3.10. Quá trình ánh xạ từ ma trận điểm sang ma trận giá trị 68

Hình 4.1. Ảnh mặt trước CCCD bị nhòe 71

Hình 4.2. Ảnh mặt sau CCCD bị nhòe 72

Hình 4.3. Giao diện chương trình thực nghiệm 74

Hình 4.4. Trường hợp tách bị lỗi 78

Hình 4.5. Thẻ mặt sau CCCD chụp không đúng chuẩn 79

Sơ đồ 1.1. Sơ đồ xử lý hệ thống xử lý 22

Bảng 3.1 Đặc trưng các trường thông tin ở mặt trước CCCD 61

Bảng 4.1. Cấu hình máy tính 73

Bảng 4.2. Kết quả trích vùng của ảnh CCCD 75

Bảng 4.3. Kết quả thực nghiệm trên tập dữ liệu A1 76

Bảng 4.4. Kết quả thực nghiệm trên tập dữ liệu A2 77

DANH MỤC CÁC THUẬT TOÁN

Thuật toán 2.1. Lọc băng thông thấp Gauss 24

Thuật toán 2.2. Lọc băng thông cao Gauss 26

Thuật toán 2.3. Xoay ảnh 28

Thuật toán 2.4. Xác định góc nghiêng dựa vào biến đổi Hough 29

Thuật toán 2.5. Nhị phân hóa ảnh 30

Thuật toán 2.6. Phương pháp phân ngưỡng Niblack 32

Thuật toán 2.7. Phương pháp phân ngưỡng Otsu 33

Thuật toán 2.8. Học có giám sát 44

Thuật toán 2.9. Thuận toán lan truyền ngược 45

Thuật toán 2.10. Xây dựng mạng nơ ron 47

Thuật toán 3.1. Nhị phân hóa ảnh CCCD 50

Thuật toán 3.2. Hiệu chỉnh độ nghiêng của ảnh tài liệu 51

Thuật toán 3.3. Phân đoạn vùng Số CCCD 54

Thuật toán 3.4. Xác định các vùng có thể là Trường Số CCCD 54

Thuật toán 3.5. Tìm và tách trường Số CCCD 55

Thuật toán 3.6. Tách các trường thông tin mặt trước thẻ CCCD 57

Thuật toán 3.7. Tách các ký tự thuộc mỗi dòng 58

Thuật toán 3.8. Xoá phần tiêu đề 60

Thuật toán 3.9. Tách thông tin mặt sau 64

Thuật toán 3.10. Tách dòng 65

Thuật toán 3.11. Tách kí tự 65

Thuật toán 3.12. Tìm giới hạn kí tự 66

Thuật toán 3.13. Ánh xạ vào ma trận 67

Thuật toán 3.14. Chuyển ma trận điểm ảnh sang ma trận giá trị 68

Thuật toán 3.15. Huấn luyện mạng nơ ron 68

Thuật toán 3.16. Nhận dạng ảnh kí tự 69

..... Xem trang tiếp theo?
⇦ Trang trước - Trang tiếp theo ⇨

Ngày đăng: 10/02/2023