Tin học đại cương - Nguyễn Duy Hiệp - 12

Biểu diễn văn bản – text


 Nén văn bản để lưu trữ và truyền văn bản một cách hiệu quả

trong máy, và giữa các máy khác nhau trên mạng


 3 phương pháp mã hóa văn bản hay dùng

 keyword encoding

 run-length encoding

 Huffman encoding

Biểu diễn văn bản – text


 keyword encoding – mã hóa từ khóa

 Là phương pháp mã hóa từ khóa

 Mã hóa những từ thường xuyên xuất hiện bằng một ký tự đặc biệt

Biểu diễn văn bản – text


Văn bản ban đầu: 349 ký tự (kể cả các dấu)

The human body is composed of many independent systems, such as the circulatory system, the respiratory system, and the reproductive system. Not only must all systems work independently, they must interact and cooperate as well. Overall health is a function of the

well-being of separate systems, as well as how these separate systems

work in concert.


Văn bản sau mã hóa: 314 ký tự

The human body is composed of many independent systems, such

^ ~ circulatory system, ~ respiratory system, + ~ reproductive system. Not only & each system work independently, they & interact + cooperate ^ %. Overall health is a function of ~ %-being of separate systems, ^ % ^ how # separate systems work in concert.


Tỉ lệ nén : 314/349 = 0.9

Biểu diễn văn bản – text


 run-length encoding – mã hóa loạt dài

 Sử dụng trong trường hợp một ký tự được lặp đi lặp lại liên tiếp nhiều lần, VD trong chuỗi ADN, hoặc luồng dữ liệu lớn.

 Thay thế chuỗi ký tự lặp lại bằng ký tự cờ + ký tự được lặp và

theo sau là số lần lặp

Ví dụ : AAAAAA được mã hóa là *A6

*n5*x9ccc*h6 some other text *k8eee

Là mã hóa của

nnnnnxxxxxxxxxccchhhhhh some other text kkkkkkkkeee Tỉ lệ mã hóa 35/51=0.68

Biểu diễn văn bản – text

 Huffman Encoding – mã hóa Huffman

 Mã hóa dựa trên tần suất xuất hiện của ký tự(hoặc từ) trong văn bản. Ký tự (hoặc từ) nào xuất hiện thường xuyên thì được mã hóa bằng chuỗi mã ngắn và ngược lại.

Huffman Code

Character

111

B

110

D

101

E

100

R

01

L

00

O

Có thể bạn quan tâm!

Xem toàn bộ 250 trang tài liệu này.

Tin học đại cương - Nguyễn Duy Hiệp - 12

 Ví dụ: mã hóa cho DOORBELL ta được chuỗi mà hóa nhị phân là 11000001001111010101

 Nếu dùng từ mã độ dài

cố định(VD 8bit) để mã hóa cho ký tự thì cần 8*8=64 bit


Tỉ lệ nén : 20/64=0.31



1.4.6 Biểu diễn âm thanh (audio)

•Biểu diễn âm thanh

•Các chuẩn nén âm thanh

Biểu diễn âm thanh


Âm thanh trong tự nhiên là do sóng trong không khí tác động

tới màng nhĩ

Biểu diễn âm thanh


 Dàn âm thanh gửi tín hiệu điện tới loa để tạo ra âm thanh.

 Tín hiệu điện là tín hiệu tương tự (là các dao động điện).

 Loa sẽ chuyển dao động này thành dao động của không khí, tạo ra âm thanh.


 Biểu diễn âm thanh trên máy, ta phải rời rạc hóa nó thành các phần mà ta có thể biểu diễn được.

Ngày đăng: 16/05/2024