Một Số Khái Niệm Cơ Bản Trong Xử Lý Ảnh

- Các bước cơ bản trong một hệ thống xử lý ảnh:

+ Khối thu nhận ảnh: có nhiệm vụ tiếp nhận ảnh đầu vào.

+ Khối tiền xử lý: có nhiệm vụ xử lý nâng cao chất lượng ảnh như giảm nhiễu, phân vùng, tìm biên v.v..

+ Khối trich chọn đặc điểm: có nhiệm vụ trích chọn các đặc trưng quan trọng của các bức ảnh đã được tiền xử lý để sử dụng trong hệ quyết định

+ Khối hậu xử lý: có nhiệm vụ xử lý các đặc điểm đã trích chọn, có thể lược bỏ hoặc biến đổi các đặc điểm này để phù hợp với các kỹ thuật cụ thể sử dụng trong hệ quyết định

Có thể bạn quan tâm!

Xem toàn bộ 76 trang tài liệu này.

+ Khối hệ quyết định và lưu trữ: có nhiệm vụ đưa ra quyết định (phân loại) dựa trên dự liệu đã học lưu trong khối lưu trữ

+ Khối kết luận: đưa ra kết luận dựa vào quyết định của khối quyết định

1.3.2 Một số khái niệm cơ bản trong xử lý ảnh

+ Ảnh và điểm ảnh:

Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại một vị trí nào đó của đối tượng trong không gian và ảnh được xem như là một tập hợp các điểm ảnh.

+ Mức xám, màu:

Là số các giá trị có thể có của các điểm ảnh của ảnh

+ Nắn chỉnh biến dạng:

Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.

+ Khử nhiễu:

Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh mà chúng ta cần loại bỏ:

Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân có thể khắc phục bằng các

phép lọc

+ Chỉnh số mức xám:

Chỉnh số mức xám là nhằm khắc phục tính không đồng đều của hệ thống xử lý ảnh, thông thường có 2 hướng tiếp cận:

Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một bó. Trường hợp giảm xuống 2 mức xám thì chính là chuyển về ảnh đen trắng. Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.

Phân tích ảnh: Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu

ảnh. Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:

Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v..

Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..)

+ Nén ảnh:

Nén ảnh là kỹ thuật nhằm giảm thiểu không gian lưu trữ. Có hai hướng tiếp cận

chính là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng không phục hồi được ảnh gốc, ngược lại nén có bảo toàn cho phép khôi phục hoàn toàn ảnh gốc. Nén ảnh nói chung có 4 cách tiếp cận cơ bản:

Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF

Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX

Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy tỉ lệ nén tương đối cao. *.JPG chính là tiếp cận theo kỹ thuật nén này.

Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh. Tính chất Fractal của ảnh thể hiện sự lặp lại của các chi tiết tại nhiều vị trí khác nhau với kích thước và hướng khác nhau. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.

CHƯƠNG 2. CƠ SỞ LÝ THUYẾT

2.1 Giới thiệu về Deep Learning

Deep Learning là một phương pháp của Học máy. Nó cho phép huấn luyện một tập dữ liệu có thể dự đoán được các đầu ra dựa vào một tập các đầu vào. Cả hai phương pháp có giám sát và không giám sát đều có thể sử dụng để huấn luyện. Sẽ huấn luyện nó bằng phương pháp học có giám sát.

Nói rộng ra, deep learning là một tên gọi dễ hiểu hơn của mạng neuron nhân tạo. Từ "deep" trong deep learning đề cập đến độ sâu của mạng lưới. Một mạng neuron nhân tạo cũng có thể rất cạn. Mạng neuron được lấy cảm hứng từ cấu trúc của vỏ não. Mức cơ bản được gọi là perceptron, biểu diễn toán học của một neural sinh học. Giống như vỏ não, có thể có nhiều lớp perceptron kết nối với nhau.

Lớp đầu tiên là lớp input (đầu vào). Mỗi nút trong lớp này lấy một đầu vào, và sau đó chuyển output (đầu ra) của nó làm đầu vào cho mỗi nút trong lớp tiếp theo. Nói chung không có kết nối giữa các nút trong cùng một lớp và lớp cuối cùng tạo nên kết quả đầu ra. gọi phần giữa là lớp ẩn. Những neuron này không có kết nối với bên ngoài (ví dụ như đầu vào hoặc đầu ra) và chỉ được kích hoạt bởi các nút trong lớp trước.

Điều mà nhiều người không nhận ra là tất cả các công nghệ này, về mặt bản chất đều xuất phát từ cùng một nguồn gốc. Chúng được phát triển từ “deep learning”, một nhánh đặc biệt trong trí tuệ nhân tạo (AI). Nhiều nhà khoa học vẫn thích gọi nó theo tên nguyên gốc là deep neural network (mạng neuron sâu).

Trên thực tế, chẳng kỹ sư nào có thể lập trình cho máy tính thực hiện được những tính năng đề cập ở trên. Thay vào đó, họ tạo ra một thuật toán giúp máy tính

có khả năng tự học rồi cho nó tiếp xúc với hàng terabyte các dữ liệu liên quan – chẳng hạn như vài trăm ngàn bức ảnh các loại chó, hay những băng ghi giọng nói kéo dài hàng năm trời.

Sự tiếp xúc liên tục này sẽ dần dần “huấn luyện” máy tính và khiến nó tự nhận diện được những hình ảnh, giọng nói được yêu cầu. Cũng giống như cách một đứa trẻ học hỏi về thế giới xung quanh, sau một thời gian dài được xem những hình ảnh mặc định là chó hay nghe cách người ta phát âm từ gì đó, máy tính sẽ “nhìn” được đâu là chó và “nghe” được người ta đang nói gì.

Người ta có thể tự hỏi tại sao việc học sâu chỉ mới được công nhận là một công nghệ quan trọng mặc dù các thí nghiệm đầu tiên với mạng thần kinh nhân tạo được tiến hành vào những năm 1950. Học tập sâu đã được sử dụng thành công trong các ứng dụng thương mại từ những năm 1990, nhưng thường được coi là nghệ thuật hơn là một công nghệ và thứ mà chỉ có một chuyên gia mới có thể sử dụng, cho đến gần đây. Đúng là một số kỹ năng là cần thiết để có được hiệu suất tốt từ một thuật toán học tập sâu. May mắn thay, số lượng kỹ năng cần thiết giảm khi lượng dữ liệu đào tạo tăng lên. Các thuật toán học tập đạt được hiệu suất của con người trên các nhiệm vụ phức tạp ngày, Ngày càng có nhiều hoạt động diễn ra trên máy tính, ngày càng nhiều những tính toán được ghi lại. Khi các công nghệ ngày càng phát triển, việc tập trung những bản ghi này và sắp xếp chúng trở nên dễ dàng hơn vào một tập dữ liệu thích hợp cho các ứng dụng học máy. Và khi một thời điểm bùng nổ Dữ liệu lớn (Big Data) đã khiến cho việc học máy trở nên dễ dàng hơn nhiều vì gánh nặng chính của ước lượng thống kê - tổng quát hóa dữ liệu mới sau khi quan sát chỉ một lượng nhỏ dữ liệu - đã được làm sáng tỏ một cách đáng kể, và nguyên tắc cơ bản là thuật toán

học được giám sát sẽ đạt được hiệu suất chấp nhận được với khoảng 5.000 ví dụ được gắn nhãn cho mỗi danh mục và sẽ khớp hoặc vượt quá hiệu suất của con người khi được đào tạo với tập dữ liệu chứa ít nhất 10 triệu ví dụ được gắn nhãn. Làm việc thành công với các tập dữ liệu nhỏ hơn đây là một lĩnh vực nghiên cứu quan trọng, tập trung đặc biệt vào cách có thể tận dụng số lượng lớn các ví dụ không dán nhãn, với việc học không giám sát hoặc bán giám sát.

Deep Learning Là Gì?

Deep Learning là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếp thu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ nghĩa của các loại dữ liệu.

Deep Learning được ứng dụng trong nhận diện hình ảnh, nhận diện giọng nói, xử lý ngôn ngữ tự nhiên.

Điểm đặc biệt của Deep Learning là tính chính xác dựa vào lượng dữ liệu, lượng dữ liệu có thể có kích thước khổng lồ mà không bị hạn chế.

Để hiểu được Deep Learning là gì, trước hết chúng ta cần phải hiểu được mối quan hệ giữa Deep Learning và machine learning, mạng neuron, và trí tuệ nhân tạo.

Cách tốt nhất để hiểu về mối quan hệ này là mường tượng chúng thành những vòng tròn đồng tâm:

Hình 2.1 Minh hoạ sơ đồ Deep Learning

https://blog.algorithmia.com/ai-why-deep-learning-matters

Ở vòng ngoài cùng, bạn có trí thông minh nhân tạo (sử dụng máy tính và lập luận). Bên trong lớp này là machine learning. Với mạng neuron nhân tạo và deep learning tại trung tâm. Nói rộng ra, deep learning là một tên gọi dễ hiểu hơn của mạng neuron nhân tạo. Từ "deep" trong deep learning đề cập đến độ sâu của mạng lưới. Một mạng neuron nhân tạo cũng có thể rất cạn.

Mạng neuron được lấy cảm hứng từ cấu trúc của vỏ não. Mức cơ bản được gọi là perceptron, biểu diễn toán học của một neuron sinh học. Giống như vỏ não, có thể có nhiều lớp perceptron kết nối với nhau.

Chúng ta gọi phần giữa là lớp ẩn. Những neuron này không có kết nối với bên ngoài (ví dụ như đầu vào hoặc đầu ra) và chỉ được kích hoạt bởi các nút trong lớp trước.

Hình 2.2 Minh hoạ các lớp trong Deep Learning

https://github.com/rcassani/mlp-example

Deep learning là kỹ thuật học tập trong mạng neuron sử dụng nhiều lớp trừu tượng để giải quyết các vấn đề nhận dạng khuôn mẫu. Machine learning được coi là một nhánh hoặc phương pháp tiếp cận trí tuệ nhân tạo, trong khi deep learning là một loại machine learning chuyên biệt.

Machine learning liên quan đến trí thông minh máy tính mà chưa biết câu trả lời trước. Thay vào đó, chương trình sẽ đi ngược lại dữ liệu bài giảng (training data), xác minh sự thành công của những nỗ lực đó, và sửa đổi phương pháp tiếp cận sao cho phù hợp.

Machine learning điển hình yêu cầu một nền tảng kiến thức chuyên nghiệp, bao gồm công nghệ phần mềm và khoa học máy tính đến các phương pháp thống kê và đại số tuyến tính.

2.2 Một số ứng dụng của Deep Learning

Máy tính từ lâu đã có các kỹ thuật để nhận ra các đặc điểm bên trong của hình

Gửi bình luận