BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NGOẠI NGỮ-TIN HỌC THÀNH PHỐ HỒ CHÍ MINH
LÊ THÁI TÚ TIỀN
HỆ THỐNG ĐIỂM DANH HỌC SINH THÔNG QUA NHẬN DẠNG ĐẦU HỌC SINH
KẾT HỢP THEO VẾT CHUYỂN ĐỘNG TRONG VIDEO
LUẬN VĂN THẠC SĨ
Ngành: CÔNG NGHỆ THÔNG TIN
Mã số: 60480201
NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS. PHẠM THẾ BẢO
TP. HỒ CHÍ MINH – THÁNG 6 NĂM 2019
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của bản thân được hướng dẫn bởi PGS.TS. Phạm Thế Bảo. Các số liệu, kết quả trình bày trong luận văn này là trung thực. Những tư liệu được sử dụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ.
Học viên
Lê Thái Tú Tiền
Học viên đã bảo vệ thành công luận văn ngày 04/6/2019, tại Hội đồng đánh giá luận văn thạc sĩ thành lập theo Quyết định số 115/QĐ-ĐNT ngày 20/5/2019 của Hiệu trưởng Trường ĐH Ngoại ngữ-Tin học TP.HCM, với sự tham gia của:
Chủ tịch Hội đồng: PGS.TS. Trần Văn Lăng ĐH Lạc Hồng (Đồng Nai) Phản biện 1: TS. Nguyễn Đức Cường ĐH Ngoại ngữ-Tin học TP.HCM Phản biện 2: PGS.TS. Nguyễn Thanh Bình ĐH Bách Khoa (ĐHQG TP.HCM) Ủy viên: PGS.TS. Lê Hoàng Thái ĐH KHTN (ĐHQG TP.HCM) Thư ký: Tiến sĩ Trần Minh Thái ĐH Ngoại ngữ-Tin học TP.HCM
DANH MỤC CÁC CHỮ VIẾT TẮT
TỪ VIẾT TẮT | TỪ ĐẦY ĐỦ | NGHĨA | |
1 | ANN | Artificial Neural Network | Mạng nơ-ron nhân tạo |
2 | CNN | Convolutional Neural Network | Mạng nơ-ron tích chập |
3 | FCNN | Full Convolution Neural Network | Mạng nơ-ron tích chập đầy đủ |
4 | HOG | Histogram of orientation gradients | Lược đồ định hướng của các gradient |
5 | LCT | Long-term correlation tracking | Theo vết tương quan dài hạn |
6 | MOSSE | Minimum output sum of squared error | Bình phương sai số tổng đầu ra nhỏ nhất |
7 | MLP | Multilayer Perceptron | Mạng thần kinh nhân tạo truyền thẳng nhiều lớp |
8 | R-CNN | Region proposals + CNN | CNN khu vực |
9 | SVM | Support vector machine | Máy vectơ hỗ trợ |
10 | YOLO | You only look once | Bạn chỉ nhìn một lần |
Có thể bạn quan tâm!
- Hệ thống điểm danh học sinh thông qua nhận dạng đầu học sinh kết hợp theo vết chuyển động trong video - 2
- Mô Tả Phát Hiện Và Theo Vết Đối Tượng Chuyển Động
- Ma Trận Trong Cửa Sổ Trượt: (A) Ảnh Ban Đầu; (B) Ma Trận Chuyển Đổi
Xem toàn bộ 97 trang tài liệu này.
DANH MỤC CÁC HÌNH VẼ
TÊN | NỘI DUNG | TRANG | |
1 | Hình 1.1 | Mô hình phân cấp phát hiện vùng đầu theo thời gian thực | 15 |
2 | Hình 1.2 | So sánh các kết quả của entropy của 2 giai đoạn | 16 |
3 | Hình 2.1 | Cấu trúc của mạng thần kinh nhân tạo | 24 |
4 | Hình 2.2 | Ma trận trong cửa sổ trượt | 26 |
5 | Hình 2.3 | Cấu trúc các lớp của CNN | 28 |
6 | Hình 2.4 | Trường tiếp nhận cục bộ | 30 |
7 | Hình 2.5 | Nơ-ron trong lớp ẩn 1 | 30 |
8 | Hình 2.6 | Nơ-ron trong lớp ẩn 2 | 31 |
9 | Hình 2.7 | Một sơ đồ đặc trưng | 31 |
10 | Hình 2.8 | Lớp tổng hợp trong CNN | 33 |
11 | Hình 2.9 | Sự kết hợp giữa các lớp tích chập và max-pooling | 33 |
12 | Hình 2.10 | Các lớp tạo thành một CNN cho ra 10 giá trị | 34 |
13 | Hình 2.11 | Giai đoạn phân vùng ảnh | 37 |
14 | Hình 2.12 | Giai đoạn xác định đối tượng | 38 |
15 | Hình 2.13 | Chín hình dạng mẫu của một đối tượng | 40 |
16 | Hình 3.1 | Mô hình bài toán điểm danh học sinh dùng camera | 51 |
17 | Hình 4.1 | Danh sách các video quay các lớp học | 68 |
18 | Hình 4.2 | Danh sách các frame hình được chọn huấn luyện từ 30 video | 69 |
19 | Hình 4.3 | Đối tượng bị vật thể che khuất tại lớp TĐC34A | 79 |
20 | Hình 4.4 | Phát hiện sai đối tượng lớp TKT33-3N | 79 |
TÊN | NỘI DUNG | TRANG | |
21 | Hình 4.5 | Hình frame thứ 76 của lớp TCB33-3N | 80 |
22 | Hình 4.6 | Hình frame thứ 91 của lớp TCB33-3N | 81 |
23 | Hình 4.7 | Hình frame thứ 99 của video M06 (lớp TCB33- 3N) | 81 |
24 | Hình 4.8 | Hình frame thứ 27 lớp TNT34 | 82 |
25 | Hình 4.9 | Hình frame thứ 45 của lớp TNT34 | 82 |
26 | Hình 4.10 | Hình frame thứ 99 của video M42 (lớp TNT34) | 83 |
27 | Hình 4.11 | Hình frame thứ 27 của lớp TTP34 | 83 |
28 | Hình 4.12 | Hình frame thứ 99 của lớp TTP34 | 84 |
DANH MỤC CÁC BẢNG BIỂU, SƠ ĐỒ
TÊN | NỘI DUNG | TRANG | |
1 | Sơ đồ 1.1 | Sơ đồ mô tả phát hiện đối tượng chuyển động | 16 |
2 | Bảng 4.1 | Danh sách 45 video dùng làm dữ liệu | 61 – 63 |
3 | Bảng 4.2 | Danh sách 45 video phân nhóm theo buổi | 63 |
4 | Bảng 4.3 | Danh sách 45 video phân nhóm theo phòng | 64 |
5 | Bảng 4.4 | Danh sách 45 video phân nhóm theo tầng | 64 |
6 | Bảng 4.5 | Danh sách 45 video phân nhóm theo ánh sáng | 64 |
7 | Bảng 4.6 | Độ chính xác của bài toán điểm danh phân nhóm theo buổi | 67 |
8 | Biểu đồ 4.1 | Độ chính xác của bài toán điểm danh phân nhóm theo buổi | 68 |
9 | Bảng 4.7 | Độ chính xác của bài toán điểm danh phân nhóm theo phòng | 68 |
10 | Biểu đồ 4.2 | Độ chính xác của bài toán điểm danh phân nhóm theo phòng | 69 |
11 | Bảng 4.8 | Độ chính xác của bài toán điểm danh phân nhóm theo tầng | 70 |
12 | Biểu đồ 4.3 | Độ chính xác của bài toán điểm danh phân nhóm theo tầng | 70 |
13 | Bảng 4.9 | Độ chính xác của bài toán điểm danh phân nhóm theo ánh sáng | 71 |
14 | Biểu đồ 4.4 | Độ chính xác của bài toán điểm danh phân nhóm theo ánh sáng | 71 |
15 | Bảng 4.10 | Độ chính xác của bài toán điểm danh phân nhóm theo lớp học | 72 |
16 | Biểu đồ 4.5 | Độ chính xác của bài toán điểm danh phân nhóm theo lớp học | 73 |
MỤC LỤC
LỜI CAM ĐOAN 2
DANH MỤC CÁC CHỮ VIẾT TẮT 4
DANH MỤC CÁC HÌNH VẼ 5
DANH MỤC CÁC BẢNG BIỂU, SƠ ĐỒ 7
MỤC LỤC 8
LỜI CẢM ƠN 10
TỔNG QUAN 11
Đặt vấn đề 11
Giới thiệu bài toán 13
Các hướng tiếp cận 14
1.3.1 Xác định vị trí vùng đầu trong ảnh 14
1.3.2 Theo vết chuyển động của đối tượng 18
Đề xuất hướng giải quyết 21
CƠ SỞ LÝ THUYẾT 23
Mạng nơ-ron nhân tạo 23
Mạng nơ-ron tích chập 26
2.2.1 Tổng quan 26
2.2.2 Mô hình của CNN 27
2.2.3 Xây dựng CNN cho phân loại ảnh 29
Phát hiện đối tượng 34
2.3.1 Tổng quan 34
2.3.2 Phương pháp phát hiện đối tượng 36
Theo vết chuyển động dựa trên tương quan 42
2.4.1 Giới thiệu 42
2.4.2 Những vấn đề liên quan đến thuật toán 44
2.4.3 Thuật toán theo vết đối tượng dựa trên đặc trưng tương quan 47