Áp dụng thuật toán Wiener Filtering nâng cao chất lượng tiếng nói - 1

LỜI CẢM ƠN

Sau hơn một tháng nghiên cứu em đã hoàn thành đồ án tốt nghiệp của mình. Tập đồ án này là kết quả của ba năm học tập trường Cao đẳng CNTT Hữu Nghị Việt – Hàn. Em xin gửi lời cảm ơn chân thành nhất đến tất cả các thầy giáo, cô giáo trong khoa CNTT Ứng Dụng, những người đã tận tâm, nhiệt tình giảng dạy trong suốt ba năm qua để em có được những kiến thức cơ bản về ngành học cũng như giúp em hoàn thiện được đồ án tốt nghiệp này.

Qua đây em xin gửi lời cảm ơn đến cô Phan Thị Lan Anh người đã tận tình hướng dẫn em trong suốt thời gian thực hiện đồ án.

Trong quá trình làm đồ án, mặc dù đã cố gắng hết mình xong khả năng hiểu biết của bản thân còn hạn chế và không tránh khỏi thiếu sót. Rất mong sự góp ý của quý thầy cô và các bạn để đồ án này được hoàn chỉnh hơn.

Xin chân thành cảm ơn!

Đà Nẵng, tháng 6 năm 2013 Sinh viên thực hiện


Võ Công Điễn

MỤC LỤC

LỜI CẢM ƠN i

MỤC LỤC ii

DANH MỤC CÁC HÌNH VẼ vi

DANH MỤC BẢNG BIỂU vii

DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH viii

MỞ ĐẦU 1

CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 2

1.1 GIỚI THIỆU CHƯƠNG 2

1.2 NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI LÀ GÌ ? 2

1.3 LÝ THUYẾT VỀ TÍN HIỆU VÀ NHIỄU 3

1.3.1 Tín hiệu 3

1.3.2 Nguồn tín hiệu 4

1.3.3 Hệ thống và xử lý tín hiệu 4

1.3.4 Phân loại tín hiệu 5

1.4 LÝ THUYẾT VỀ NHIỄU 5

1.4.1 Nguồn nhiễu 5

1.4.2 Nhiễu và mức tín hiệu tiếng nói trong các môi trường khác nhau 7

1.5 TÍN HIỆU RỜI RẠC THEO THỜI GIAN 8

1.5.1 Tín hiệu bước nhảy đơn vị 8

1.5.2 Tín hiệu xung đơn vị 8

1.5.3 Tín hiệu hàm mũ 9

1.5.4 Tín hiệu hàm sin rời rạc 9

1.6 PHÉP BIẾN ĐỔI FOURIER CỦA TÍN HIỆU RỜI RẠC DTFT 9

1.6.1 Sự hội tụ của phép biến đổi Fourier 9

1.6.2 Quan hệ giữa biến đổi Z và biến đổi Fourier 10

1.6.3 Phép biến đổi Fourier ngược 10

1.6.4 Các tính chất của phép biến đổi Fourier 11

1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc 11

1.6.6 Phổ tín hiệu và phổ pha 12

1.7 CÁC THUẬT TOÁN SỬ DỤNG NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI

.......................................................................................................................12

1.7.1 Trừ phổ 12

1.7.2 Mô hình thống kê 13

1.8 TÍN HIỆU TIẾNG NÓI 13

1.9 CƠ CHẾ TẠO TIẾNG NÓI 14

1.9.1 Bộ máy phát âm của con người 14

1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói 14

1.9.3 Phân loại âm 15

1.9.4 Thuộc tính âm học của tiếng nói 15

1.10 KẾT LUẬN CHƯƠNG 15

CHƯƠNG 2: ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 16

2.1 GIỚI THIỆU CHƯƠNG 16

2.2 PHƯƠNG PHÁP ĐÁNH GIÁ CHỦ QUAN 16

2.2.1 Các phương pháp đánh giá tuyệt đối 17

2.2.2 Các phương pháp đánh giá tương đối 17

2.2.2.1 Đánh giá bằng phương pháp so sánh các mẫu tín hiệu 17

2.2.2.2 Phương pháp đánh giá theo sự suy giảm chất lượng 18

2.3 PHƯƠNG PHÁP ĐÁNH GIÁ KHÁCH QUAN 18

2.3.1 Đo tỷ số tín hiệu trên nhiễu trên từng khung 18

2.3.2 Đánh giá mô phỏng theo cảm nhận nghe của con người 20

2.3.2.1 Phương pháp đo Weighted Spectral Slope 20

2.3.2.2 Phương pháp đo Bark Distortion 21

2.3.2.3 Phương pháp đánh giá cảm nhận chất lượng thoại PESQ 22

2.4 KẾT LUẬN CHƯƠNG 22

CHƯƠNG 3: THUẬT TOÁN WIENER FILTERING 23

3.1 GIỚI THIỆU CHƯƠNG 23

3.2 SƠ ĐỒ KHỐI CỦA WIENER FILTERING 23

3.3 THUẬT TOÁN WIENER FILTERING 23

3.3.1 Giới thiệu chung 23

3.3.2 Nguyên lý cơ bản của Wiener Filtering 23

3.4 OVERLAP VÀ ADDING TRONG QUÁ TRÌNH XỬ LÝ TÍN HIỆU TIẾNG NÓI 25

3.4.1 Phân tích tín hiệu theo từng frame 25

3.4.2 Overlap và Adding 26

3.5 ƯỚC LƯỢNG VÀ CẬP NHẬT NHIỄU 27

3.5.1 Voice activity detection 28

3.5.2 Quá trình ước lượng và cập nhật nhiễu 28

3.6 KẾT LUẬN CHƯƠNG 28

CHƯƠNG 4: MÔ PHỎNG BẰNG PHẦN MỀM MATLAB 30

4.1 GIỚI THIỆU CHƯƠNG 30

4.2 QUY TRÌNH THỰC HIỆN VÀ ĐÁNH GIÁ THUẬT TOÁN 30

4.3 LƯU ĐỒ THUẬT TOÁN WIENER FILTERING 32

4.4 CHƯƠNG TRÌNH MÔ PHỎNG 33

4.5 CHƯƠNG TRÌNH CHẠY MÔ PHỎNG 39

4.6 THỰC HIỆN THUẬT TOÁN VÀ ĐÁNH GIÁ 39

4.6.1 Thực hiện xử lý các file âm thanh bị nhiễu với SNR =5dB 39

4.6.1.1 Nhiễu do tiếng ồn với SNR = 5dB 39

4.6.1.2 Nhiễu do người nói xung quanh với SNR =5dB 40

4.6.1.3 Nhiễu do tiếng xe hơi với SNR =5dB 41

4.6.2 Thực hiện xử lý các file âm thanh bị nhiễu với SNR =15dB 43

4.6.2.1 Nhiễu do người nói xung quanh với SNR =15dB 43

4.6.2.2 Nhiễu do tiếng xe hơi với SNR =15dB 44

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 47

TÀI LIỆU THAM KHẢO x

PHỤ LỤC xi

NHÂN XÉT CỦA CÁN BỘ HƯỚNG DẪN xii

Hình 1.1 Tín hiệu tiếng nói. 4

Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe. 6

Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên tàu. 6

Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng. 7

Hình 1.5 Mức nhiễu và tiếng nói (được đo bằng SPL dB) trong các môi trường khác nhau. 8

Hình 1.6 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn nguyên âm “er” trong từ “her”. 13

Hình 1.7 Mặt cắt dọc của cơ quan tạo tiếng nói. 14

Hình 1.8 Mô hình kỹ thuật tạo tiếng nói. 14

Hình 1.9 Bảng phân loại âm vị trong tiếng Anh của người Mỹ 15

Hình 3.1 Sơ đồ khối cho hai thuật toán SS và WF 23

Hình 3.2 Sơ đồ khối của thuật toán Wiener Filtering. 25

Hình 3.3 Phân tích tín hiệu thành các frame. 26

Hình 3.4 quá trình thực hiện overlap và adding. 27

Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường 30

Hình 4.2 Lưu đồ thuật toán WF 32

Hình 4.3 dạng sóng của tín hiệu sạch 39

Hình 4.4 Dạng sóng của tín hiệu bị nhiễu với SNR = 5dB 39

Hình 4.5 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 5dB 40

Hình 4.6 dạng sóng của tín hiệu sạch 40

Hình 4.7 Dạng sóng của tín hiệu bị nhiễu do người nói xung quanh với SNR = 5dB .41

Hình 4.8 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 5dB 41

Hình 4.9 dạng sóng của tín hiệu sạch 42

Hình 4.10 Dạng sóng của tín hiệu bị nhiễu do tiếng xe hơi với SNR = 5dB. 42

Hình 4.11 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 5dB. 43

Hình 4.12 dạng sóng của tín hiệu sạch 43

Hình 4.13 Dạng sóng của tín hiệu bị nhiễu do người nói xung quanh với SNR = 15dB.

.......................................................................................................................................44

Hình 4.14 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 15dB. 44

Hình 4.15 dạng sóng của tín hiệu sạch 45

Hình 4.16 Dạng sóng của tín hiệu bị nhiễu do tiếng xe hơi với SNR = 15dB. 45

Hình 4.17 Dạng sóng của tín hiệu sau khi xử lý nhiễu bằng WF với SNR = 15dB. 46

Bảng 2.1.Thang điểm đánh giá chất lượng tiếng nói theo MOS 17

Bảng 2.2. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR 17

Bảng 2.3. Thang đánh giá DCR 18

TIẾNG ANH



Từ viết

tắt

Tiếng Anh

Nghĩa tiếng Việt

SNR

Signal Noise Ratio

Tỉ số tín hiệu trên nhiễu

PC

Personal Computer

Máy tính cá nhân

SPL

Sound Pressure Level

Mức áp suất của âm thanh

MMSE

Minium Mean-Squared Error

Tối thiểu hoá sai lệch trung

bình bình phương

SVD

Singular Value Decomposition

Phép phân tích giá trị đơn

DFT

Discrete Fourier Transform

Phép biến đổi Fourier rời rạc

FFT

Fast Fourier Transform

Phép biến đổi Fourier nhanh

DTFT

Discrete-Time Fourier Transform

Phép biến đổi Fourier của tín hiệu rời rạc.

ZT

Z Transform

Phép biến đổi Z

ROC

Region of Convergence

Miền hội tụ

IDTFT

Inverse Discrete Fourier

Transform

Phép biến đổi ngược Fourier

rời rạc

LTI

Linear Time-Invariant

Hệ thống tuyến tính và bất

biến theo thời gian

ITU-T

InternationalTelecommunications

Union-Telecommunication

Hiệp hội tiêu chuẩn viễn

thông quốc tế

ACR

Absolute Categories Rating

Đánh giá theo giá trị tuyệt đối

MOS

Mean Opinion Scores

Đánh giá theo quan điểm

người nghe

CCR

Comparison Category Rating

Đánh giá bằng cách so sánh

DCR

Degradation Category Rating

Đánh giá suy giảm chất lượng

SE

Subjective Evaluation

Đánh giá chủ quan

OE

Objective Evaluation

Đánh giá khách quan

WSS

Weighted Spectral Slope

Đo theo trọng số của phổ

Có thể bạn quan tâm!

Xem toàn bộ 69 trang tài liệu này.

Áp dụng thuật toán Wiener Filtering nâng cao chất lượng tiếng nói - 1

Linear Prediction Coefficients

Hệ số dự đoán tuyến tính

VAD

Voice Activity Detection

Thăm dò sự hoạt động của

tiếng nói


SS


Spectral Subtraction

Thuật toán giảm nhiễu tín hiệu tiếng nói bằng phương

pháp trừ phổ.


WF


Wiener Filter

Thuật toán giảm nhiễu tín hiệu tiếng nói bằng cách sử

dụng bộ lọc Wiener.

Xem tất cả 69 trang.

Ngày đăng: 11/02/2023
Trang chủ Tài liệu miễn phí