Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói - 1

LỜI CẢM ƠN

Trước tiên em xin gửi lời cảm ơn chân thành đến trường Cao Đẳng CNTT Hữu Nghị Việt Hàn đã tạo điều kiện thuận lợi cho em được ngồi học trong lớp học Tin Học Viễn Thông Khóa 4 của trường, em gửi lời cảm ơn chân thành đến quý thầy cô bộ môn thuộc khoa công nghệ thông tin ứng dụng đã nhiệt tình giảng dạy, cung cấp kiến thức và giúp đỡ động viên để em có thể hoàn thành được đồ án này. Đặc biệt gửi lời cảm ơn chân thành tới cô Phan Thị Lan Anh đã hướng dẫn tận tình cho em trong suốt thời gian làm đồ án.

Xin cảm ơn những người thân trong gia đình tôi, cảm ơn những người bạn thân thiết đã giúp đỡ tôi trong những lúc khó khăn nhất.


Sinh viên thực hiện:


Lương Văn Phượng

MỤC LỤC

LỜI CẢM ƠN i

MỤC LỤC ii

DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH v

DANH MỤC BẢNG BIỂU vii

DANH MỤC HÌNH ẢNH viii

MỞ ĐẦU 1

CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 2

1.1 Giới thiệu chương 2

1.2 Nâng cao chất lượng tiếng nói là gì ? 2

1.3 Tín hiệu, hệ thống và xử lý tín hiệu 3

1.3.1 Tín hiệu 3

1.3.2 Nguồn tín hiệu 4

1.3.3 Hệ thống và xử lý tín hiệu 4

1.3.4 Phân loại tín hiệu 5

1.4 Lý thuyết về nhiễu 5

1.4.1 Nguồn nhiễu 5

1.4.2 Nhiễu và mức tín hiệu tiếng nói trong các môi trường khác nhau 7

1.5 Tín hiệu rời rạc theo thời gian 8

1.5.1 Tín hiệu bước nhảy đơn vị 8

1.5.2 Tín hiệu xung đơn vị 9

1.5.3 Tín hiệu hàm mũ 9

1.5.4 Tín hiệu hàm sin rời rạc 9

1.6 Phép biến đổi Fourier của tín hiệu rời rạc DTFT 9

1.6.1 Sự hội tụ của phép biến đổi Fourier 10

1.6.2 Quan hệ giữa biến đổi Z và biến đổi Fourier 10

1.6.3 Phép biến đổi Fourier ngược 10

1.6.4 Các tính chất của phép biến đổi Fourier 11

1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc 12

1.6.6 Phổ biên độ và phổ pha 12

1.7 Các thuật toán sử dụng nâng cao chất lượng tiếng nói 13

1.7.1 Trừ phổ 13

1.7.2 Mô hình thống kê 13

1.8 Tín hiệu tiếng nói 13

1.9 Cơ chế tạo tiếng nói 15

1.9.1 Bộ máy phát âm của con người 15

1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói 16

1.9.3 Phân loại âm 16

1.9.4 Thuộc tính âm học của tiếng nói 16

1.10 Kết luận chương 17

CHƯƠNG 2 : ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 18

2.1 Giới thiệu chương 18

2.2 Phương pháp đánh giá chủ quan 18

2.2.1 Các phương pháp đánh giá tuyệt đối 18

2.2.2 Các phương pháp đánh giá tương đối 19

2.2.2.1 Đánh giá bằng phương pháp so sánh các mẫu tín hiệu 19

2.2.2.2 Phương pháp đánh giá theo sự suy giảm chất lượng 20

2.3 Phương pháp đánh giá khách quan 20

2.4 Kết luận chương 21

CHƯƠNG 3: THUẬT TOÁN SPECTRAL–SUBTRACTION 22

3.1 Giới thiệu chương 22

3.2 Thuật toán Spectral Subtraction 22

3.2.1 Giới thiệu chung 22

3.2.2 Nguyên tắc cơ bản của thuật toán 22

3.2.3 Spectral subtraction đối với phổ biên độ 23

3.2.4 Spectral subtraction đối với phổ công suất 24

3.3 Sơ đồ khối của thuật toán Spectral Subtraction 25

3.3.1 Phân tích tín hiệu theo từng frame 26

3.3.2 Overlap và Adding 26

3.3.3 Hàm xử lý giảm nhiễu 27

3.3.4 Ước lượng và cập nhật nhiễu 28

3.3.4.1 Voice activity detection 28

3.3.4.2 Quá trình ước lượng và cập nhật nhiễu 29

3.4 Kết luận chương 29

CHƯƠNG 4: MÔ PHỎNG BẰNG MATLAP 30

4.1 Giới thiệu chương 30

4.2 Giới thiệu chung về phần mềm Matlab 30

4.2.1 Khái niệm về Matlab 30

4.2.2 Các tính năng chính 30

4.3 Quy trình thực hiện và đánh giá thuật toán 31

4.4 Lưu đồ thuật toán Spectral Subtraction 32

4.5 Thực hiện và đánh giá thuật toán 33

4.6 Kết luận chương 36

4.7 Matlap Code của thuận toán giảm nhiễu 36

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 43

TÀI LIỆU THAM KHẢO ix

PHỤ LỤC x

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN xi

DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH

Từ viết

tắt

Tiếng Anh

Nghĩa tiếng Việt

ACR

Absolute Categories Rating

Đánh giá theo giá trị tuyệt đối

CCR

Comparison Category Rating

Đánh giá bằng cách so sánh

DCR

Degradation Category Rating

Đánh giá suy giảm chất lượng

DFT

Discrete Fourier Transform

Phép biến đổi Fourier rời rạc

DTFT

Discrete- Time Fourier Transform

Phép biến đổi Fourier của tín hiệu rời

rạc.

FFT

Fast Fourier Transform

Phép biến đổi Fourier nhanh

IDTFT

Inverse Discrete Fourier

Transform

Phép biến đổi ngược Fourier rời rạc

ITU-T

International Telecommunications

Union Telecommunication

Hiệp hội tiêu chuẩn viễn thông

quốc tế

IS

IS Itakura_Saito


LLR

Log Likehook Raito


LPC

LPC Linear Prediction Coefficients

Hệ số dự đoán tuyến tính

LTI

Linear Time-Invariant

Hệ thống bất biến và biến thiên

theo thời gian

MMSE

Minium Mean-Squared Error

Tối thiểu hoá sai lệch trung bình bình

phương

MOS

Mean Opinion Scores

Đánh giá theo quan điểm người nghe

OE

Objective Evaluation

Đánh giá khách quan

PC

Personal Computer

Máy tính cá nhân

ROC

Region of Convergence

Miền hội tụ

SE

Subjective Evaluation

Đánh giá chủ quan

SNR

Signal Noise Ratio

Tỉ số tín hiệu trên nhiễu

SPL

Sound Pressure Level

Mức áp suất của âm thanh

SVD

Singular Value Decomposition

Phép phân tích giá trị đơn

SS

Spectral Subtraction

Thuật toán giảm nhiễu tín hiệu

Có thể bạn quan tâm!

Xem toàn bộ 58 trang tài liệu này.

Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói - 1


tiếng nói bằng phương pháp trừ

phổ

VAD

Voice Activity Detection

Thăm dò sự hoạt động của tiếng nói

SMB

Statistical Model Based

Thuật toán giảm nhiễu tín hiệu tiếng

nói dựa trên nguyên lý thống kê

WSS

Weighted Spectral Slope

Đo theo trọng số của phổ


Frame

Khung tín hiệu.


Overlap và Addin

Xếp chồng và cộng


Hamming

Cửa sổ Hammingg


Speech Enhancement

Nâng cao chất lượng tiếng nói


Bảng 2.1.Thang điểm đánh giá chất lượng tiếng nói theo MOS 19

Bảng 2.2. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR 19

Bảng 2.3. Thang đánh giá DCR 20

Hình 1.1 Tín hiệu tiếng nói 4

Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe. 6

Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên tàu. 6

Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng. 7

Hình 1.5 Mức nhiễu và tiếng nói (được đo bằng SPL dB) trong các môi trường khác nhau. 8

Hình 1.6 Mẫu tiếng nói “eee” được lấy mẫu với tần số lấy mẫu 8kHz 13

Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn nguyên âm “er” trong từ “her”. 14

Hình 1.8 Mặt cắt dọc của cơ quan tạo tiếng nói. 15

Hình 1.9 Mô hình kỹ thuật tạo tiếng nói. 16

Hình 1.10 Bảng phân loại âm vị trong tiếng Anh của người Mỹ 16

Hình 3.2 Phân tích tín hiệu thành các frame. 26

Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường. 31

Hình 4.2 Lưu đồ thuật toán SS 32

Hình 4.3 Dạng sóng và phổ của tín hiệu sạch 33

Hình 4.4 Dạng sóng và phổ của tín hiệu bị nhiễu với SNR = 15dB 33

Hình 4.5 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ biên độ 34

Hình 4.6 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ công suất. 34

Hình 4.7 Dạng sóng và phổ của tín hiệu sạch 34

Hình 4.8 Dạng sóng và phổ của tín hiệu bị nhiễu với SNR = 5dB 35

Hình 4.9 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ biên độ 35

Hình 4.10 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ công suất. 35

..... Xem trang tiếp theo?
⇦ Trang trước - Trang tiếp theo ⇨

Ngày đăng: 23/05/2023