LỜI CẢM ƠN
Trước tiên em xin gửi lời cảm ơn chân thành đến trường Cao Đẳng CNTT Hữu Nghị Việt Hàn đã tạo điều kiện thuận lợi cho em được ngồi học trong lớp học Tin Học Viễn Thông Khóa 4 của trường, em gửi lời cảm ơn chân thành đến quý thầy cô bộ môn thuộc khoa công nghệ thông tin ứng dụng đã nhiệt tình giảng dạy, cung cấp kiến thức và giúp đỡ động viên để em có thể hoàn thành được đồ án này. Đặc biệt gửi lời cảm ơn chân thành tới cô Phan Thị Lan Anh đã hướng dẫn tận tình cho em trong suốt thời gian làm đồ án.
Xin cảm ơn những người thân trong gia đình tôi, cảm ơn những người bạn thân thiết đã giúp đỡ tôi trong những lúc khó khăn nhất.
Sinh viên thực hiện:
Lương Văn Phượng
MỤC LỤC
LỜI CẢM ƠN i
MỤC LỤC ii
DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH v
DANH MỤC BẢNG BIỂU vii
DANH MỤC HÌNH ẢNH viii
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 2
1.1 Giới thiệu chương 2
1.2 Nâng cao chất lượng tiếng nói là gì ? 2
1.3 Tín hiệu, hệ thống và xử lý tín hiệu 3
1.3.1 Tín hiệu 3
1.3.2 Nguồn tín hiệu 4
1.3.3 Hệ thống và xử lý tín hiệu 4
1.3.4 Phân loại tín hiệu 5
1.4 Lý thuyết về nhiễu 5
1.4.1 Nguồn nhiễu 5
1.4.2 Nhiễu và mức tín hiệu tiếng nói trong các môi trường khác nhau 7
1.5 Tín hiệu rời rạc theo thời gian 8
1.5.1 Tín hiệu bước nhảy đơn vị 8
1.5.2 Tín hiệu xung đơn vị 9
1.5.3 Tín hiệu hàm mũ 9
1.5.4 Tín hiệu hàm sin rời rạc 9
1.6 Phép biến đổi Fourier của tín hiệu rời rạc DTFT 9
1.6.1 Sự hội tụ của phép biến đổi Fourier 10
1.6.2 Quan hệ giữa biến đổi Z và biến đổi Fourier 10
1.6.3 Phép biến đổi Fourier ngược 10
1.6.4 Các tính chất của phép biến đổi Fourier 11
1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc 12
1.6.6 Phổ biên độ và phổ pha 12
1.7 Các thuật toán sử dụng nâng cao chất lượng tiếng nói 13
1.7.1 Trừ phổ 13
1.7.2 Mô hình thống kê 13
1.8 Tín hiệu tiếng nói 13
1.9 Cơ chế tạo tiếng nói 15
1.9.1 Bộ máy phát âm của con người 15
1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói 16
1.9.3 Phân loại âm 16
1.9.4 Thuộc tính âm học của tiếng nói 16
1.10 Kết luận chương 17
CHƯƠNG 2 : ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 18
2.1 Giới thiệu chương 18
2.2 Phương pháp đánh giá chủ quan 18
2.2.1 Các phương pháp đánh giá tuyệt đối 18
2.2.2 Các phương pháp đánh giá tương đối 19
2.2.2.1 Đánh giá bằng phương pháp so sánh các mẫu tín hiệu 19
2.2.2.2 Phương pháp đánh giá theo sự suy giảm chất lượng 20
2.3 Phương pháp đánh giá khách quan 20
2.4 Kết luận chương 21
CHƯƠNG 3: THUẬT TOÁN SPECTRAL–SUBTRACTION 22
3.1 Giới thiệu chương 22
3.2 Thuật toán Spectral Subtraction 22
3.2.1 Giới thiệu chung 22
3.2.2 Nguyên tắc cơ bản của thuật toán 22
3.2.3 Spectral subtraction đối với phổ biên độ 23
3.2.4 Spectral subtraction đối với phổ công suất 24
3.3 Sơ đồ khối của thuật toán Spectral Subtraction 25
3.3.1 Phân tích tín hiệu theo từng frame 26
3.3.2 Overlap và Adding 26
3.3.3 Hàm xử lý giảm nhiễu 27
3.3.4 Ước lượng và cập nhật nhiễu 28
3.3.4.1 Voice activity detection 28
3.3.4.2 Quá trình ước lượng và cập nhật nhiễu 29
3.4 Kết luận chương 29
CHƯƠNG 4: MÔ PHỎNG BẰNG MATLAP 30
4.1 Giới thiệu chương 30
4.2 Giới thiệu chung về phần mềm Matlab 30
4.2.1 Khái niệm về Matlab 30
4.2.2 Các tính năng chính 30
4.3 Quy trình thực hiện và đánh giá thuật toán 31
4.4 Lưu đồ thuật toán Spectral Subtraction 32
4.5 Thực hiện và đánh giá thuật toán 33
4.6 Kết luận chương 36
4.7 Matlap Code của thuận toán giảm nhiễu 36
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 43
TÀI LIỆU THAM KHẢO ix
PHỤ LỤC x
NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN xi
DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH
Tiếng Anh | Nghĩa tiếng Việt | |
ACR | Absolute Categories Rating | Đánh giá theo giá trị tuyệt đối |
CCR | Comparison Category Rating | Đánh giá bằng cách so sánh |
DCR | Degradation Category Rating | Đánh giá suy giảm chất lượng |
DFT | Discrete Fourier Transform | Phép biến đổi Fourier rời rạc |
DTFT | Discrete- Time Fourier Transform | Phép biến đổi Fourier của tín hiệu rời rạc. |
FFT | Fast Fourier Transform | Phép biến đổi Fourier nhanh |
IDTFT | Inverse Discrete Fourier Transform | Phép biến đổi ngược Fourier rời rạc |
ITU-T | International Telecommunications Union Telecommunication | Hiệp hội tiêu chuẩn viễn thông quốc tế |
IS | IS Itakura_Saito | |
LLR | Log Likehook Raito | |
LPC | LPC Linear Prediction Coefficients | Hệ số dự đoán tuyến tính |
LTI | Linear Time-Invariant | Hệ thống bất biến và biến thiên theo thời gian |
MMSE | Minium Mean-Squared Error | Tối thiểu hoá sai lệch trung bình bình phương |
MOS | Mean Opinion Scores | Đánh giá theo quan điểm người nghe |
OE | Objective Evaluation | Đánh giá khách quan |
PC | Personal Computer | Máy tính cá nhân |
ROC | Region of Convergence | Miền hội tụ |
SE | Subjective Evaluation | Đánh giá chủ quan |
SNR | Signal Noise Ratio | Tỉ số tín hiệu trên nhiễu |
SPL | Sound Pressure Level | Mức áp suất của âm thanh |
SVD | Singular Value Decomposition | Phép phân tích giá trị đơn |
SS | Spectral Subtraction | Thuật toán giảm nhiễu tín hiệu |
Có thể bạn quan tâm!
- Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói - 2
- Phép Biến Đổi Fourier Của Tín Hiệu Rời Rạc Dtft
- Thang Điểm Đánh Giá Chất Lượng Tiếng Nói Theo Mos .
- Sơ Đồ Thực Hiện Và Đánh Giá Thuật Toán Tăng Cường.
- Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói - 6
- Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói - 7
Xem toàn bộ 58 trang tài liệu này.
tiếng nói bằng phương pháp trừ phổ | ||
VAD | Voice Activity Detection | Thăm dò sự hoạt động của tiếng nói |
SMB | Statistical Model Based | Thuật toán giảm nhiễu tín hiệu tiếng nói dựa trên nguyên lý thống kê |
WSS | Weighted Spectral Slope | Đo theo trọng số của phổ |
Frame | Khung tín hiệu. | |
Overlap và Addin | Xếp chồng và cộng | |
Hamming | Cửa sổ Hammingg | |
Speech Enhancement | Nâng cao chất lượng tiếng nói |
Bảng 2.1.Thang điểm đánh giá chất lượng tiếng nói theo MOS 19
Bảng 2.2. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR 19
Bảng 2.3. Thang đánh giá DCR 20
Hình 1.1 Tín hiệu tiếng nói 4
Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe. 6
Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên tàu. 6
Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng. 7
Hình 1.5 Mức nhiễu và tiếng nói (được đo bằng SPL dB) trong các môi trường khác nhau. 8
Hình 1.6 Mẫu tiếng nói “eee” được lấy mẫu với tần số lấy mẫu 8kHz 13
Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn nguyên âm “er” trong từ “her”. 14
Hình 1.8 Mặt cắt dọc của cơ quan tạo tiếng nói. 15
Hình 1.9 Mô hình kỹ thuật tạo tiếng nói. 16
Hình 1.10 Bảng phân loại âm vị trong tiếng Anh của người Mỹ 16
Hình 3.2 Phân tích tín hiệu thành các frame. 26
Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường. 31
Hình 4.2 Lưu đồ thuật toán SS 32
Hình 4.3 Dạng sóng và phổ của tín hiệu sạch 33
Hình 4.4 Dạng sóng và phổ của tín hiệu bị nhiễu với SNR = 15dB 33
Hình 4.5 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ biên độ 34
Hình 4.6 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ công suất. 34
Hình 4.7 Dạng sóng và phổ của tín hiệu sạch 34
Hình 4.8 Dạng sóng và phổ của tín hiệu bị nhiễu với SNR = 5dB 35
Hình 4.9 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ biên độ 35
Hình 4.10 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ công suất. 35