- Các bước cơ bản trong một hệ thống xử lý ảnh:
+ Khối thu nhận ảnh: có nhiệm vụ tiếp nhận ảnh đầu vào.
+ Khối tiền xử lý: có nhiệm vụ xử lý nâng cao chất lượng ảnh như giảm nhiễu, phân vùng, tìm biên v.v..
+ Khối trich chọn đặc điểm: có nhiệm vụ trích chọn các đặc trưng quan trọng của các bức ảnh đã được tiền xử lý để sử dụng trong hệ quyết định
+ Khối hậu xử lý: có nhiệm vụ xử lý các đặc điểm đã trích chọn, có thể lược bỏ hoặc biến đổi các đặc điểm này để phù hợp với các kỹ thuật cụ thể sử dụng trong hệ quyết định
Có thể bạn quan tâm!
- Ứng dụng học sâu trong phân loại trái cây - 1
- Ứng dụng học sâu trong phân loại trái cây - 2
- Kiến Trúc Tổng Quát Của Một Ann
- Mô Hình Mạng Perceptron Đa Tầng
- Một Số Kiến Trúc Convolutional Neural Network Thông Dụng
Xem toàn bộ 76 trang tài liệu này.
+ Khối hệ quyết định và lưu trữ: có nhiệm vụ đưa ra quyết định (phân loại) dựa trên dự liệu đã học lưu trong khối lưu trữ
+ Khối kết luận: đưa ra kết luận dựa vào quyết định của khối quyết định
1.3.2 Một số khái niệm cơ bản trong xử lý ảnh
+ Ảnh và điểm ảnh:
Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại một vị trí nào đó của đối tượng trong không gian và ảnh được xem như là một tập hợp các điểm ảnh.
+ Mức xám, màu:
Là số các giá trị có thể có của các điểm ảnh của ảnh
+ Nắn chỉnh biến dạng:
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.
+ Khử nhiễu:
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh mà chúng ta cần loại bỏ:
Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân có thể khắc phục bằng các
phép lọc
+ Chỉnh số mức xám:
Chỉnh số mức xám là nhằm khắc phục tính không đồng đều của hệ thống xử lý ảnh, thông thường có 2 hướng tiếp cận:
Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một bó. Trường hợp giảm xuống 2 mức xám thì chính là chuyển về ảnh đen trắng. Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
Phân tích ảnh: Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu
ảnh. Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v..
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..)
+ Nén ảnh:
Nén ảnh là kỹ thuật nhằm giảm thiểu không gian lưu trữ. Có hai hướng tiếp cận
chính là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng không phục hồi được ảnh gốc, ngược lại nén có bảo toàn cho phép khôi phục hoàn toàn ảnh gốc. Nén ảnh nói chung có 4 cách tiếp cận cơ bản:
Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy tỉ lệ nén tương đối cao. *.JPG chính là tiếp cận theo kỹ thuật nén này.
Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh. Tính chất Fractal của ảnh thể hiện sự lặp lại của các chi tiết tại nhiều vị trí khác nhau với kích thước và hướng khác nhau. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT
2.1 Giới thiệu về Deep Learning
Deep Learning là một phương pháp của Học máy. Nó cho phép huấn luyện một tập dữ liệu có thể dự đoán được các đầu ra dựa vào một tập các đầu vào. Cả hai phương pháp có giám sát và không giám sát đều có thể sử dụng để huấn luyện. Sẽ huấn luyện nó bằng phương pháp học có giám sát.
Nói rộng ra, deep learning là một tên gọi dễ hiểu hơn của mạng neuron nhân tạo. Từ "deep" trong deep learning đề cập đến độ sâu của mạng lưới. Một mạng neuron nhân tạo cũng có thể rất cạn. Mạng neuron được lấy cảm hứng từ cấu trúc của vỏ não. Mức cơ bản được gọi là perceptron, biểu diễn toán học của một neural sinh học. Giống như vỏ não, có thể có nhiều lớp perceptron kết nối với nhau.
Lớp đầu tiên là lớp input (đầu vào). Mỗi nút trong lớp này lấy một đầu vào, và sau đó chuyển output (đầu ra) của nó làm đầu vào cho mỗi nút trong lớp tiếp theo. Nói chung không có kết nối giữa các nút trong cùng một lớp và lớp cuối cùng tạo nên kết quả đầu ra. gọi phần giữa là lớp ẩn. Những neuron này không có kết nối với bên ngoài (ví dụ như đầu vào hoặc đầu ra) và chỉ được kích hoạt bởi các nút trong lớp trước.
Điều mà nhiều người không nhận ra là tất cả các công nghệ này, về mặt bản chất đều xuất phát từ cùng một nguồn gốc. Chúng được phát triển từ “deep learning”, một nhánh đặc biệt trong trí tuệ nhân tạo (AI). Nhiều nhà khoa học vẫn thích gọi nó theo tên nguyên gốc là deep neural network (mạng neuron sâu).
Trên thực tế, chẳng kỹ sư nào có thể lập trình cho máy tính thực hiện được những tính năng đề cập ở trên. Thay vào đó, họ tạo ra một thuật toán giúp máy tính
có khả năng tự học rồi cho nó tiếp xúc với hàng terabyte các dữ liệu liên quan – chẳng hạn như vài trăm ngàn bức ảnh các loại chó, hay những băng ghi giọng nói kéo dài hàng năm trời.
Sự tiếp xúc liên tục này sẽ dần dần “huấn luyện” máy tính và khiến nó tự nhận diện được những hình ảnh, giọng nói được yêu cầu. Cũng giống như cách một đứa trẻ học hỏi về thế giới xung quanh, sau một thời gian dài được xem những hình ảnh mặc định là chó hay nghe cách người ta phát âm từ gì đó, máy tính sẽ “nhìn” được đâu là chó và “nghe” được người ta đang nói gì.
Người ta có thể tự hỏi tại sao việc học sâu chỉ mới được công nhận là một công nghệ quan trọng mặc dù các thí nghiệm đầu tiên với mạng thần kinh nhân tạo được tiến hành vào những năm 1950. Học tập sâu đã được sử dụng thành công trong các ứng dụng thương mại từ những năm 1990, nhưng thường được coi là nghệ thuật hơn là một công nghệ và thứ mà chỉ có một chuyên gia mới có thể sử dụng, cho đến gần đây. Đúng là một số kỹ năng là cần thiết để có được hiệu suất tốt từ một thuật toán học tập sâu. May mắn thay, số lượng kỹ năng cần thiết giảm khi lượng dữ liệu đào tạo tăng lên. Các thuật toán học tập đạt được hiệu suất của con người trên các nhiệm vụ phức tạp ngày, Ngày càng có nhiều hoạt động diễn ra trên máy tính, ngày càng nhiều những tính toán được ghi lại. Khi các công nghệ ngày càng phát triển, việc tập trung những bản ghi này và sắp xếp chúng trở nên dễ dàng hơn vào một tập dữ liệu thích hợp cho các ứng dụng học máy. Và khi một thời điểm bùng nổ Dữ liệu lớn (Big Data) đã khiến cho việc học máy trở nên dễ dàng hơn nhiều vì gánh nặng chính của ước lượng thống kê - tổng quát hóa dữ liệu mới sau khi quan sát chỉ một lượng nhỏ dữ liệu - đã được làm sáng tỏ một cách đáng kể, và nguyên tắc cơ bản là thuật toán
học được giám sát sẽ đạt được hiệu suất chấp nhận được với khoảng 5.000 ví dụ được gắn nhãn cho mỗi danh mục và sẽ khớp hoặc vượt quá hiệu suất của con người khi được đào tạo với tập dữ liệu chứa ít nhất 10 triệu ví dụ được gắn nhãn. Làm việc thành công với các tập dữ liệu nhỏ hơn đây là một lĩnh vực nghiên cứu quan trọng, tập trung đặc biệt vào cách có thể tận dụng số lượng lớn các ví dụ không dán nhãn, với việc học không giám sát hoặc bán giám sát.
Deep Learning Là Gì?
Deep Learning là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếp thu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ nghĩa của các loại dữ liệu.
Deep Learning được ứng dụng trong nhận diện hình ảnh, nhận diện giọng nói, xử lý ngôn ngữ tự nhiên.
Điểm đặc biệt của Deep Learning là tính chính xác dựa vào lượng dữ liệu, lượng dữ liệu có thể có kích thước khổng lồ mà không bị hạn chế.
Để hiểu được Deep Learning là gì, trước hết chúng ta cần phải hiểu được mối quan hệ giữa Deep Learning và machine learning, mạng neuron, và trí tuệ nhân tạo.
Cách tốt nhất để hiểu về mối quan hệ này là mường tượng chúng thành những vòng tròn đồng tâm:
Hình 2.1 Minh hoạ sơ đồ Deep Learning
https://blog.algorithmia.com/ai-why-deep-learning-matters
Ở vòng ngoài cùng, bạn có trí thông minh nhân tạo (sử dụng máy tính và lập luận). Bên trong lớp này là machine learning. Với mạng neuron nhân tạo và deep learning tại trung tâm. Nói rộng ra, deep learning là một tên gọi dễ hiểu hơn của mạng neuron nhân tạo. Từ "deep" trong deep learning đề cập đến độ sâu của mạng lưới. Một mạng neuron nhân tạo cũng có thể rất cạn.
Mạng neuron được lấy cảm hứng từ cấu trúc của vỏ não. Mức cơ bản được gọi là perceptron, biểu diễn toán học của một neuron sinh học. Giống như vỏ não, có thể có nhiều lớp perceptron kết nối với nhau.
Lớp đầu tiên là lớp input (đầu vào). Mỗi nút trong lớp này lấy một đầu vào, và sau đó chuyển output (đầu ra) của nó làm đầu vào cho mỗi nút trong lớp tiếp theo. Nói chung không có kết nối giữa các nút trong cùng một lớp và lớp cuối cùng tạo nên kết quả đầu ra.
Chúng ta gọi phần giữa là lớp ẩn. Những neuron này không có kết nối với bên ngoài (ví dụ như đầu vào hoặc đầu ra) và chỉ được kích hoạt bởi các nút trong lớp trước.
Hình 2.2 Minh hoạ các lớp trong Deep Learning
https://github.com/rcassani/mlp-example
Deep learning là kỹ thuật học tập trong mạng neuron sử dụng nhiều lớp trừu tượng để giải quyết các vấn đề nhận dạng khuôn mẫu. Machine learning được coi là một nhánh hoặc phương pháp tiếp cận trí tuệ nhân tạo, trong khi deep learning là một loại machine learning chuyên biệt.
Machine learning liên quan đến trí thông minh máy tính mà chưa biết câu trả lời trước. Thay vào đó, chương trình sẽ đi ngược lại dữ liệu bài giảng (training data), xác minh sự thành công của những nỗ lực đó, và sửa đổi phương pháp tiếp cận sao cho phù hợp.
Machine learning điển hình yêu cầu một nền tảng kiến thức chuyên nghiệp, bao gồm công nghệ phần mềm và khoa học máy tính đến các phương pháp thống kê và đại số tuyến tính.
2.2 Một số ứng dụng của Deep Learning
Máy tính từ lâu đã có các kỹ thuật để nhận ra các đặc điểm bên trong của hình