Biểu diễn văn bản – text
Nén văn bản để lưu trữ và truyền văn bản một cách hiệu quả
trong máy, và giữa các máy khác nhau trên mạng
3 phương pháp mã hóa văn bản hay dùng
keyword encoding
run-length encoding
Huffman encoding
Biểu diễn văn bản – text
keyword encoding – mã hóa từ khóa
Là phương pháp mã hóa từ khóa
Mã hóa những từ thường xuyên xuất hiện bằng một ký tự đặc biệt
Biểu diễn văn bản – text
Văn bản ban đầu: 349 ký tự (kể cả các dấu)
The human body is composed of many independent systems, such as the circulatory system, the respiratory system, and the reproductive system. Not only must all systems work independently, they must interact and cooperate as well. Overall health is a function of the
well-being of separate systems, as well as how these separate systems
work in concert.
Văn bản sau mã hóa: 314 ký tự
The human body is composed of many independent systems, such
^ ~ circulatory system, ~ respiratory system, + ~ reproductive system. Not only & each system work independently, they & interact + cooperate ^ %. Overall health is a function of ~ %-being of separate systems, ^ % ^ how # separate systems work in concert.
Tỉ lệ nén : 314/349 = 0.9
Biểu diễn văn bản – text
run-length encoding – mã hóa loạt dài
Sử dụng trong trường hợp một ký tự được lặp đi lặp lại liên tiếp nhiều lần, VD trong chuỗi ADN, hoặc luồng dữ liệu lớn.
Thay thế chuỗi ký tự lặp lại bằng ký tự cờ + ký tự được lặp và
theo sau là số lần lặp
Ví dụ : AAAAAA được mã hóa là *A6
*n5*x9ccc*h6 some other text *k8eee
Là mã hóa của
nnnnnxxxxxxxxxccchhhhhh some other text kkkkkkkkeee Tỉ lệ mã hóa 35/51=0.68
Biểu diễn văn bản – text
Huffman Encoding – mã hóa Huffman
Mã hóa dựa trên tần suất xuất hiện của ký tự(hoặc từ) trong văn bản. Ký tự (hoặc từ) nào xuất hiện thường xuyên thì được mã hóa bằng chuỗi mã ngắn và ngược lại.
Huffman Code | Character |
111 | B |
110 | D |
101 | E |
100 | R |
01 | L |
00 | O |
Có thể bạn quan tâm!
- Tin học đại cương - Nguyễn Duy Hiệp - 9
- Tin học đại cương - Nguyễn Duy Hiệp - 10
- Tin học đại cương - Nguyễn Duy Hiệp - 11
- Biểu Diễn Hình Ảnh Và Đồ Họa(Image & Graphic)
- Tin học đại cương - Nguyễn Duy Hiệp - 14
- Tin học đại cương - Nguyễn Duy Hiệp - 15
Xem toàn bộ 250 trang tài liệu này.
Ví dụ: mã hóa cho DOORBELL ta được chuỗi mà hóa nhị phân là 11000001001111010101
Nếu dùng từ mã độ dài
cố định(VD 8bit) để mã hóa cho ký tự thì cần 8*8=64 bit
Tỉ lệ nén : 20/64=0.31
1.4.6 Biểu diễn âm thanh (audio)
•Biểu diễn âm thanh
•Các chuẩn nén âm thanh
Biểu diễn âm thanh
Âm thanh trong tự nhiên là do sóng trong không khí tác động
tới màng nhĩ
Biểu diễn âm thanh
Dàn âm thanh gửi tín hiệu điện tới loa để tạo ra âm thanh.
Tín hiệu điện là tín hiệu tương tự (là các dao động điện).
Loa sẽ chuyển dao động này thành dao động của không khí, tạo ra âm thanh.
Biểu diễn âm thanh trên máy, ta phải rời rạc hóa nó thành các phần mà ta có thể biểu diễn được.