Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân - 10

4.2. Môi trường thực nghiệm

Sau khi xây dựng bộ dữ liệu chúng tôi tiến hành cài đặt các thuật toán đã xây dựng ở chương 3. Các thuật toán được cài đặt bằng ngôn ngữ lập trình Python 3a 2016, trên máy có cấu hình như bảng 4.1.

Bảng 4.1. Cấu hình máy tính


Thành phần

Cấu hình

Loại máy tính

Lenovo

Hệ điều hành

Windows 10.

Kiến trúc

Hệ điều hành 64-bit.

Vi xử lý

Intel core I3

RAM

4 GB RAM.

Ổ cứng

256GB

Graphics adapter

Card đồ họa hỗ trợ xử lý ảnh 128-bit

Có thể bạn quan tâm!

Xem toàn bộ 96 trang tài liệu này.


Chúng tôi xây dựng một ứng dụng để thử nghiệm trên tập dữ liệu A (gồm 100 ảnh CCCD) chụp đầy đủ mặt trước CCCD và mặt sau CCCD. Mỗi dữ liệu chúng tôi thử nghiệm 10 lần. Giao diện chương trình thực nghiệm như hình 4.3.

Hình 4 3 Giao diện chương trình thực nghiệm Để chương trình đạt kết quả 1

Hình 4.3. Giao diện chương trình thực nghiệm

Để chương trình đạt kết quả tốt chúng tôi yêu cầu dữ liệu đầu vào được định dạng.

+ Kích thước ảnh dài 85,6mm dài 53,89mm độ phân dãy màu 1024 dpi

+ Ảnh chụp là ảnh màu chụp thẳng, rõ, đầy đủ dữ liệu, không quá mờ, không cong, vênh, móp, méo.

Tập tin đầu vào ảnh thẻ CCCD chụp hoặc quét trên máy hai mặt, mặt trước và mặt sau.

Dữ liệu xuất ra tập tin ảnh và tập tin văn bản.

+ Tập tin ảnh gồm: Ảnh chân dung, ngón trỏ phải, ngón trỏ trái

+ Tập tin văn bản gồm có: số CCCD, Họ và tên, ngày tháng năm sinh, giới tính, quốc tịch, quê quán, nơi thường trú, đặc điểm nhân dạng của người được cấp thẻ ngày, tháng, năm cấp thẻ CCCD, ngày hết hạn.

4.3. Thời gian thực nghiệm

Chương trình thực nghiệm 100 ảnh CCCD, mỗi ảnh CCCD thực nghiệm 10 lần. Thời gian trung bình xử lý xong hai mặt trước và sau một ảnh CCCD là 575mms/ảnh. Thời gian trung bình xử lý ảnh mặt trước thẻ CCCD là 325mms/ảnh, thời gian trung bình xử lý ảnh mặt sau thẻ CCCD là 250mms/ảnh.Tốc độ thời gian xử lý nhanh hay chậm của chương trình phụ thuộc vào cấu hình máy tính và định dạng hình ảnh ban đẩu.

4.4. Kết quả thực nghiệm

Kết quả thực nghiệm chương trình trên tập dữ liệu A 100 ảnh CCCD cho kết quả nhận diện vùng ảnh như bảng 4.2.

Bảng 4.2. Kết quả trích vùng của ảnh CCCD


STT

Vùng dữ liệu

Số vùng ảnh trích được

Số vùng ảnh không trích được

Tỉ lệ

1

Ảnh chân dung

100

0

100%

2

Số CCCD

100

0

100%

3

Họ và Tên

100

0

100%

4

Ngày sinh

100

0

100%

5

Giới tính

100

0

100%

6

Quốc tịch

100

0

100%

7

Quê quán

100

0

100%

8

Nơi cư trú

100

0

100%

9

Thời hạn sử dụng

100

0

100%

10

Đặc điểm nhận dạng

100

0

100%

11

Ngón trỏ phải

100

0

100%

12

Ngón trỏ trái

100

0

100%

13

Ngày cấp thẻ

100

0

100%

Trung bình 100%

4.4.1. Kết quả trên tập dữ liệu A1

Trong tập dữ liệu A1 (74 ảnh) chuẩn, chụp, hoặc quét đúng kích thước, dữ liệu trong các ảnh đầy đủ. Tất cả các vùng dữ liệu trên tập A1 kết quả đều đạt 100%, kết quả thực nghiệm như bảng 4.3.

Bảng 4.3. Kết quả thực nghiệm trên tập dữ liệu A1


STT

Tên vùng

Kết quả vùng ảnh

đúng

Kết quả vùng ảnh

sai

Kết quả nhận dạng dữ liệu

đúng

Kết quả nhận dạng

dữ liệu sai

1

Số CCCD

100%

0

100%

0

2

Họ và Tên

100%

0

100%

0

3

Ngày sinh

100%

0

100%

0

4

Giới tính

100%

0

100%

0

5

Quốc tịch

100%

0

100%

0

6

Quê quán

100%

0

100%

0

7

Nơi cư trú

100%

0

100%

0

8

Thời hạn S/D

100%

0

100%

0

9

ĐĐnhận dạng

100%

0

100%

0

10

Ngày cấp thẻ

100%

0

100%

0

4.4.2. Kết quả trên tập dữ liệu A2

Tập dữ liệu A2 có 26 ảnh khi chụp bị mờ (5 ảnh), số ảnh bị nhòe (18 ảnh), số ảnh bị cong vênh (1 ảnh) , số ảnh bị biến dạng (2 ảnh). Kết quả thực nghiệm trích xuất trong tin như bảng 4.4.

Trong tập dữ liệu A2 chúng tôi nhận thấy trong 26 ảnh CCCD chụp không đúng chuẩn như đã phân tích có kết quả nhận đượcnhư sau:

Dữ liệu ảnh CCCD chụp bằng máy ảnh 5 ảnh đúng 100%, dữ liệu ảnh CCCD chụp bằng điện thoại di động 5 ảnh đúng 100%, dữ liệu ảnh CCCD bằng máy quét 16 ảnh đúng 100%, dữ liệu ảnh CCCD là nam 21 ảnh đúng 100%, dữ liệu

ảnh CCCD là nữ 5 ảnh đúng 100%. Kết quả nhận diện vùng ảnh đạt 100% có 10/10 vùng nhận diện đúng. Kết quả nhận dạng dữ liệu đúng 9/10 đạt 100% chỉ có 1 vủng nhận diện bị sai một kí tự duy nhất, đó là vùng đặt điểm nhận dạng do ảnh chụp bị quá mờ, chữ viết bị dính liền như hình 4.4.

Bảng 4.4. Kết quả thực nghiệm trên tập dữ liệu A2


STT

Tên vùng

Kết quả vùng ảnh

Kết quả vùng ảnh sai

Kết quả nhận dạng dữ liệu đúng

Kết quả nhận dạng dữ liệu sai

1

Số CCCD

100%

0

100%

0

2

Họ và Tên

100%

0

100%

0

3

Ngày sinh

100%

0

100%

0

4

Giới tính

100%

0

100%

0

5

Quốc tịch

100%

0

100%

0

6

Quê quán

100%

0

100%

0

7

Nơi cư trú

100%

0

100%

0

8

Thời hạn SD

100%

0

100%

0

9

ĐĐ nhận dạng

100%

0

99,8%

0,2%

10

Ngày cấp thẻ

100%

0

100%

0


Kết quả xử lý dữ liệu tính trung bình trên tập A 100 ảnh CCCD gồm có kết quả trung tập ảnh A1 và kết quả trung bình tập ảnh A2 là TB=(A1 + A2)/2. Dữ liệu đạt kết quả chính xác trên 99,9%.

4.5. Đánh giá

4.5.1. Ưu điểm

Phương pháp đề xuất trong luận văn có độ chính xác trên 99,9%. Trong đó, các trường chính xác 100% là trường số CCCD, Họ và tên, ngày tháng năm sinh, giới tính, quốc tịch, quê quán, nơi thường trú, ngày, tháng, năm cấp thẻ CCCD, ngày hết hạn. Trường đặc điểm nhận dạng có độ chính xác thấp nhất

(trên 99,8%) bởi vì trường này thường bị mờ, lem mực, do chữ nhỏ một số ký tự không rõ ràng.

Thời gian xử lý rất nhanh, thời gian trung bình xử lý hai mặt trước và mặt sau là 575mms/ ảnh CCCD.

4.5.2. Khuyết điểm

Trong 100 ảnh thực nghiệm chỉ có 2 ảnh bị sai ở trường đặc điểm nhận dạng, và chỉ sai một ký tự duy nhất chữ cm (om) như (hình 4.4) và (4.5). Lỗi này không phải do hệ thống chương trình mà do lỗi in thẻ CCCD, ảnh chụp không đúng chuẩn, bị lem mực chữ viết dích liền mắt thường chúng ta không phân biệt được kí tự rõ ràng giữa chữ c và chữ o.

Chương trình chưa tích hợp kiểm tra lỗi chính tả cho do in thẻ CCCD.


Hình 4 4 Trường hợp tách bị lỗi Hình 4 5 Thẻ mặt sau CCCD chụp không đúng 2

Hình 4.4. Trường hợp tách bị lỗi

Hình 4 5 Thẻ mặt sau CCCD chụp không đúng chuẩn 4 6 Hướng phát triển Đề 3


Hình 4.5. Thẻ mặt sau CCCD chụp không đúng chuẩn


4.6. Hướng phát triển

- Đề tài này hướng phát triển và ứng dụng vào thực tế rất cao sau khi được hoàn thiện.

- Để tài áp dụng trong thực tiễn nhiều lĩnh vực có liên quan đến thẻ CCCD, có nhiều lợi ít, tiện lợi trong cải cách thủ tục hành chính, giảm giấy tờ, giảm thời gian, công sức, tiền bạc, hiệu quả công việc nâng cao, đặc biệt là áp dụng cho chính phủ điện tử trong tương lai.

- Các lĩnh vực có thể áp dụng như: sân bay, nhà ga, khách sạn, ngân hàng, bảo hiểm, bệnh viện, văn phòng công an, văn phòng UBND các cấp, văn phòng các sở ban ngành …vv

Tiếp tục nghiên cứu hoàn thiện chương trình để có thể áp dụng vào thực tế. Mở rộng các tính năng của chương trình (như thêm phần nhận dạng, kiểm lỗi chính tả) để thành một chương trình hoàn chỉnh. Khái quát hoá thuật toán để có thể xử lý được ảnh thẻ bất kỳ như bằng lái xe, thẻ đoàn viên, thè công đoàn , thẻ thành viên, siêu thị, câu lạc bộ, hộ chiếu và đề tài còn hướng nghiên cứu mở rộng ứng dụng trên các thiết bị điện thoại di động, ...vv.

4.7. Kết luận

Trong quá trình nghiên cứu và thực hiện luận văn, tôi nhận đã đạt được một số kết quả chính sau:

Nắm bắt được các bước chính trong một hệ thống xử lý ảnh, hiểu được các khái niệm cơ bản trong xử lý ảnh. Thấy được vai trò quan trọng của xử lý ảnh đối với một hệ nhận dạng, đó là bước tiền xử lý nhằm nâng cao chất lượng của nhận dạng.

Tìm hiểu xây dựng được một số thuật toán xử lý ảnh hay được dùng trong bước tiền xử lý của một hệ thống nhận dạng hoàn chỉnh. Đó là các phương pháp nhị phân ảnh, căn chỉnh độ nghiêng của trang văn bản, máy học chuyên sâu, mạng nơnron. Trên cở sở hiểu biết đó có thể vận dụng được vào các bài toán khác.

Tìm hiểu và tổng quát hoá các phương pháp phân tích ảnh tài liệu, cũng như nắm được các ưu nhược điểm của từng phương pháp. Từ đó đưa ra được các giải pháp cho bài toán đặt ra trong luận văn, áp dụng thành công các kiến thức tìm hiểu được vào cài đặt thử nghiệm chương trình phân tích ảnh CCCD. Kết quả của chương trình đạt được là tốt (99.9%) và có thể áp dụng vào thực tế. Đây là bài toán khó, hiện nay chưa có giải pháp nào khác được đưa gia để giải quyết bài toán này. Đó là đóng góp lớn nhất của luận văn.

Tuy nhiên, do thời gian làm luận văn hạn chế, trong khi khối lượng công việc lớn nên còn nhiều vấn đề tồn tại chưa được giải quyết:

+Chương trình mới dừng lại ở bước thử nghiệm, chưa phải là một chương trình hoàn chỉnh, đầy đủ các tính năng

+Thuật toán mới chỉ dừng lại ở việc phân tích ảnh CCCD, chưa khái quá hoá cho các ảnh thẻ bất kỳ.

Chúng tôi rất mong được sự đánh giá góp ý của quý Thầy cô, giúp tôi hoàn thành luận văn này, để tôi sớm đưa kết quả ứng dụng vào thực tế.

Xem tất cả 96 trang.

Ngày đăng: 10/02/2023
Trang chủ Tài liệu miễn phí