TRANG THÔNG TIN VỀ LUẬN VĂN THẠC SĨ
1. Họ tên học viên: NGUYỄN VĂN PHÚC Nam/ Nữ: Nam
2. Ngày tháng năm sinh: 30 tháng 4 năm 1990 Nơi sinh: Campuchia
3. Ngành học: Công nghệ Thông tin Mã số: 60480201
4. Ngày nhập học: 2016
5. Các thay đổi trong quá trình đào tạo: (nếu có)
6. Tên đề tài luận văn (chính thức bảo vệ):
7. 6.1. Tên Tiếng Việt: “Ứng dụng học sâu trong phân loại trái cây”
6.2. Tên Tiếng Anh: “Apply Deep Learning to Classify Fruit”
Cán bộ hướng dẫn (họ tên, học hàm, học vị): TS. VŨ THANH HIỀN
8. Tóm tắt các kết quả của luận văn:
“Tóm tắt các kết quả của luận văn: Đã tìm hiểu cơ sở lý thuyết của mạng neuron và đặc biệt là mô hình mạng neuron tích chập để giải quyết bài toán phân loại 60 loại trái cây trên cơ sở dữ liệu Fruit. Qua quá trình thực nghiệm, chúng tôi đã xác định kiến trúc cũng như bộ tham số phù hợp để giải quyết bài toán với độ chính xác cao”
9. Khả năng ứng dụng thực tiễn (nếu có)
10. Những hướng nghiên cứu tiếp theo (nếu có)
11. Các công trình đã công bố có liên quan đến luận văn:
HỌC VIÊN (ký tên, họ và tên) Nguyễn Văn Phúc |
Có thể bạn quan tâm!
- Ứng dụng học sâu trong phân loại trái cây - 1
- Một Số Khái Niệm Cơ Bản Trong Xử Lý Ảnh
- Kiến Trúc Tổng Quát Của Một Ann
- Mô Hình Mạng Perceptron Đa Tầng
Xem toàn bộ 76 trang tài liệu này.
LỜI MỞ ĐẦU
Ngày nay công nghệ thông tin là ngành chủ lực quan trọng góp phần thúc đẩy sự phát triển mọi mặt của con người. Một trụ cột của thời đại công nghiệp 4.0 là sự phát triển mạnh của Trí tuệ nhân tạo (Artificial Intelligence - AI). AI có mặt ở tất cả các ứng dụng thông minh như nhận dạng giọng nói của Apple, dịch tự động, search engine của Google, xe lái tự động của Tesla, … có thể nói AI đang là một trong những công nghệ được quan tâm đầu tư nghiên cứu và phát triển nhất thời điểm hiện nay.
Ở nước ta hiện nay đã bắt đầu áp dụng Trí tuệ nhân tạo vào nghiên cứu và kinh doanh đã cho ra những kết quả rất đáng kể. Trong lương lai nước ta sẽ áp dụng và đưa công nghệ thông tin vào tất cả các lĩnh vực nhằm phát triển mạnh mẽ hơn để có thể thay thế những thủ tục thủ công mà con người bấy lâu nay vẫn còn phụ thuộc… Khi nền công nghiệp 4.0 được đưa vào áp dụng thì máy móc sẽ giúp cho con người hoàn thành tốt công việc và thực hiện nhanh hơn, chính xác hơn và công sức tối ưu nhất, tương lai máy móc sẽ thay thế con người làm việc trên mọi mặt, do đó, những chuyên gia hay bất cứ ai nghiên cứu về lĩnh vực này luôn muốn tìm hiểu và nghiên cứu sâu về sự thay đổi mạnh mẽ của công nghiệp 4.0 và sự phát triển mạnh của Trí tuệ nhân tạo.
Bây giờ, Trí tuệ nhân tạo đang góp phần thay đổi sâu sắc nhiều khía cạnh của cuộc sống, dần trở thành một yếu tố quan trọng trong hoạt động muôn màu muôn vẻ của nhân loại. Nhiều bức tranh về tương lai xán lạn do trí tuệ nhân tạo mang tới cho loài người đã được khắc họa. Riêng về mặt kinh tế cho thấy trí tuệ nhân tạo trở thành cơ hội thương mại lớn nhất ngày nay trong nền kinh tế toàn cầu đang thay đổi nhanh chóng với phần đóng góp của nó, Chính vì lý do đó, nhiều nước trên thế giới đã và đang tiến hành xây dựng chiến lược phát triển trí tuệ nhân tạo quốc gia của họ.
MỤC LỤC
CHƯƠNG 1. TỔNG QUAN 2
1.1 ĐẶT VẤN ĐỀ 2
1.2 GIỚI THIỆU TRÍ TUỆ NHÂN TẠO VÀ HỌC MÁY 4
1.3 TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ 6
1.3.1 GIỚI THIỆU 6
1.3.2 MỘT SỐ KHÁI NIỆM CƠ BẢN TRONG XỬ LÝ ẢNH 7
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT 10
2.1 GIỚI THIỆU VỀ DEEP LEARNING 10
2.2 MỘT SỐ ỨNG DỤNG CỦA DEEP LEARNING 14
2.3 GIỚI THIỆU MẠNG NEURON 17
2.4 MẠNG NEURON TÍCH CHẬP 18
2.4.1 ĐỊNH NGHĨA MẠNG NEURON TÍCH CHẬP 19
2.4.2 CONVOLUTION (TÍCH CHẬP) 19
2.4.3 MÔ HÌNH MẠNG NƠ-RON TÍCH CHẬP 20
2.4.4 XÂY DỰNG MẠNG NƠ-RON TÍCH CHẬP 22
2.5 MỘT SỐ KIẾN TRÚC CONVOLUTIONAL NEURAL NETWORK THÔNG DỤNG 34
2.5.1 KIẾN TRÚC ALEXNET [17] 34
2.5.2 KIẾN TRÚC VGG 16 [17] 35
2.5.3 KIẾN TRÚC INCEPTION/GOOGLENET [18] 35
CHƯƠNG 3. PHÂN LOẠI ẢNH TRÁI CÂY 37
3.1 PHÁT BIỂU BÀI TOÁN 37
3.2 CƠ SỞ DỮ LIỆU TRÁI CÂY 38
3.3 CẤU TRÚC THƯ MỤC CƠ SỞ DỮ LIỆU ẢNH TRÁI CÂY 41
3.4 DỮ LIỆU MẪU 41
3.5 PHƯƠNG PHÁP ĐỀ XUẤT 45
B. HÀM LOSS 48
C. PHƯƠNG PHÁP HUẤN LUYỆN 48
CHƯƠNG 4. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49
4.1 THỰC NGHIỆM VÀ KẾT QUẢ 49
4.2 KẾT LUẬN VÀ PHƯỚNG PHÁT TRIỂN 55
4.3 HƯỚNG PHÁT TRIỂN TIẾP THEO 56
TÀI LIỆU THAM KHẢO 57
1.1 Đặt vấn đề
CHƯƠNG 1. TỔNG QUAN
- Cơ sở hình thành đề tài:
Trong luận văn này trình bày khái quát về xử lý ảnh, các phương pháp trích chọn đặc trưng. Mạng neuron tích chập và sử dụng trong bài toán phân loại đối tượng.
Hiện nay, với sự phát triển của công nghiệp 4.0, công nghệ thông tin nói chung và sự phát triển trong lĩnh vực Trí tuệ nhân tạo, các hệ thống phát hiện và nhận dạng và ngày càng có nhiều ứng dụng trong thực tế như vấn đề an ninh, các hệ thống bảo mật, nhận dạng người trên các bằng lái xe, hộ chiếu, nhận dạng người trong các hệ thống tương tác người-máy, nhận dạng đối tượng, nhận dạng vân tay, nhận dạng màu sắc, trong lĩnh vực giải trí...
Đặc biệt khi cách mạng công nghiệp 4.0 ra đời thì công nghệ ngày càng được phát triển cao hơn, các công nghệ tối tân sẽ dần dẫn được đưa vào xử dụng nhằm phục vụ cho con người. Nhu cầu tăng lên trong ứng dụng Trí tuệ nhân tạo, đã giúp các nhà khoa học có thêm nhiều phương pháp mới để phát triển các dự án nghiên cứu. Mặc dù ban đầu thực hiện gặp nhiều khó khăn do mới tiếp xúc công nghệ hoặc đang áp dụng lý thuyết vào thực tế nhưng những kết quả đạt được trong thời gian đầu cũng xem như một kết quả khả quan tạo động lực cho các công trình sau này. việc nhận dạng đối tượng không thể chính xác được như các phương pháp nhận dạng khác như nhận dạng vân tay, nhận dạng mặt người…nhưng đề tài này nó vẫn nhận được sự quan tâm lớn của các nhà nghiên cứu trong lĩnh vực thị giác máy tính. Lý do chủ yếu
2
là trên thực tế, nhận dạng đối tượng vẫn là cách truyền thống để con người nhận dạng và phát hiện ra đối tượng.
Có rất nhiều mô hình tính toán mô phỏng bộ não của người được nghiên cứu trong đó có mạng neuron. Đề tài này cũng một phần áp dụng mạng neuron vào khả năng giải quyết hàng loạt các bài toán như tính toán tối ưu, nhận dạng đối tượng, điều khiển và được ứng dụng trong nhiều lĩnh vực của bài toán phát hiện và nhận dạng.
Một mạng neuron nhân tạo bao gồm một tập các đơn vị xử lý cơ bản, gọi là neuron, chúng truyền thông tin bằng cách gửi các tín hiệu cho nhau qua các kênh kết nối có trọng số. Mỗi neuron thực hiện một công việc tương đối đơn giản: nhận tín hiệu từ các neuron lân cận hoặc từ nguồn bên ngoài, tính toán tín hiệu ra rồi truyền sang cho các neuron khác. Ngoài việc xử lý này, nhiệm vụ thứ hai của neuron là điều chỉnh lại các trọng số. Hệ thống sẽ được thực hiện song song vì nhiều neuron có thể thực hiện tính toán ở cùng thời điểm. Xuất phát trong hoàn cảnh đó tôi đã quyết định lựa chọn đề tài: “Nhận dạng ảnh xác định đối tượng của ảnh khi sử dụng mạng Neuron” là một việc làm không chỉ có ý nghĩa khoa học và còn mang đậm tính thực tiễn nhất khi thực tế đang đặt ra những yêu cầu đòi hỏi.
- Mục tiêu nghiên cứu:
Tìm hiểu bài toán phân loại dữ liệu nói chung và bài toán phân loại dữ ảnh trái cây nói riêng.
Nghiên cứu mô hình mạng neuron đa tầng, các thuật toán lan truyền tiến, lan truyền ngược để sử dụng và huấn luyện mạng neuron.
Nghiên cứu một số kiến trúc mạng neuron hiện đại giải quyết bài toán phân loại dữ liệu ảnh
Tiến hành xây dựng kiến trúc của mô hình, tiến hành thực nghiệm mô hình, và đánh giá kết quả thực nghiệm của mô hình để giải quyết bài toán phân loại ảnh trái cây
1.2 Giới thiệu trí tuệ nhân tạo và học máy
Trí tuệ nhân tạo là một hướng nghiên cứu của lĩnh vực Công nghệ thông tin và Khoa học máy tính nhằm phát triển các hệ thống thông minh nhằm giải quyết các bài toán trong thực tế giống như hoạt động của bộ não người. Trí tuệ nhân tạo được bắt đầu nghiên cứu từ những năm 50 của thế kỷ 20 và trong khoảng 30 năm trở lại đây đã được cộng đồng các nhà khoa học quan tâm mạnh mẽ. Rất nhiều các hội thảo lớn về lĩnh vực này được tổ chức hàng năm trên thế giới. Các ứng dụng tiêu biểu của trí tuệ nhân tạo vào đời sống xã hội bào gồm: người máy, robot, xử lý ngôn ngữ tự nhiên, nhận dạng, phát hiện dị thường, an ninh quốc phòng, tin sinh học, khoa học vũ trụ và trái đất,...
Trong khuôn khổ luận văn Thạc sỹ của mình, qua việc được trang bị các môn học lỹ thuyết như thuật toán, xử lý ảnh, trí tuệ nhân tạo,... tôi đã lựa chọn đề tài Nghiên cứu một số phương pháp cơ bản về nhận dạng và phát hiện một số loại trái cây thông dụng trong ảnh màu. Chủ đề phân lớp dữ liệu là một nhánh quan trọng trong lĩnh vực học máy (machine learning) của trí tuệ nhân tạo, có thể kể các ứng dụng của học máy trong thực tế như người máy, robot, nhận dạng mặt người, nhận dạng tiếng nói và chữ viết,...
+ Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu
Nghiên cứu mạng neuron đa tầng và mạng neuron tích chập
Nghiên cứu bài toán phân lớp ảnh trái cây
Tìm hiểu xây dựng kiến trúc và thực nghiệm mô hình mạng neuron tích chập để giải quyết bài toán phân lớp ảnh trái cây
- Phạm vi nghiên cứu
- Lý thuyết: Nghiên cứu lý thuyết về xử lý ảnh, Học máy, Deep Learning, Mạng neuron tích chập.
- Thực nghiệm: Lập trình trên phần mềm Python cho chương trình phân loại một số loại trái cây thông dụng trong ảnh.
+ Phương pháp nghiên cứu
- Thu thập, phân tích các tài liệu và thông tin liên quan đến đề tài từ đó đưa ra cái nhìn tổng quan, các khó khăn gặp phải, các ràng buộc của bài toán...
- Tiến hành phân tích, xây dựng giải pháp phát hiện gồm có : Tiền xử lý, trích chọn đặc trưng, huấn luyện mô hình dữ liệu, hậu xử lý.
- Xây dựng và kiểm thử việc đánh giá hiệu quả phương pháp mạng neuron tích chập để phân loại đối tượng bằng ngôn ngữ Python.
+ Cấu trúc của luận văn
Cấu trúc của luận văn Nghiên cứu và ứng dụng mạng Neuron tích chập vào thực nghiệm trên nhiều tầng khác nhau để tìm ra kết quả tốt nhất cho bài toán và chương trình bao gồm những cấu trúc như sau:
Chương 1: Tổng quan về
Chương 2: Lý thuyết về Deep Learning và Mạng neuron tích chập.
Chương 3: Chương này sẽ đi sâu vào việc cài đặt ứng dụng cụ thể cho bài toán phát hiện và phân loại một số loại trái cây thông dụng bằng phương pháp Deep Learning trong mô hình mạng neuron tích chập.
Chương 4: Kết quả và hướng phát triển
Kết luận: Tóm tắt các vấn đề được tìm hiểu trong luận văn và các vấn đề liên quan trong luận văn.
1.3 Tổng quan về xử lý ảnh số
1.3.1 Giới thiệu
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người và máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận.